“特朗普被逮捕了?。?!”
“消息”首先在 Twitter 傳開,熱度蹭蹭地竄升?!笆甲髻刚摺?Eliot Higgins 馬上出來澄清:“別誤會(huì)了,照片是我用 Midjourney 生成的,為此還花錢買了 V5 版本?!?/p>
(資料圖片)
特朗普被捕了丨來自 Twitter @Eliot Higgins
但來不及了,這一系列照片(因?yàn)镠iggins還連載了“入獄”后續(xù))在 Instagram、TikTok 上“瘋傳”,全民狂歡的勁頭就像一起經(jīng)歷真實(shí)的政治事件——川普“入獄”、“越獄”、“出獄”、“再就業(yè)”等等層出不窮。
特朗普的獄中生活丨來自 Twitter@Eliot Higgins
由 AI 生成的內(nèi)容“謊騙”過人眼,起初人們還挺興奮,但問題是,這種興奮在最近發(fā)生得過于頻繁,它開始轉(zhuǎn)變?yōu)橐环N惶恐。
圖像之外,還有文字——包括 Science、Nature 等在內(nèi)的學(xué)術(shù)期刊對(duì)于 ChatGPT 的使用明令限制,不許將其列為論文合著者;一些高校甚至中學(xué)老師開始頻繁抱怨,學(xué)生用 AI 生成的作業(yè)越來越多,也越來越難以甄別。
那么,在目前這個(gè)階段,我們還剩下哪些辦法能識(shí)別出“AI 出品”呢?
讓 AI 指認(rèn) AI:26%,我說的是準(zhǔn)確率
如果你也一瞬間將“川普入獄圖”信以為真,或根本讀不出一篇中規(guī)中矩的新聞稿究竟是否出自人類之手,別懊惱!這確實(shí)不太容易。
幾年前 Deepfake 換臉圖片中,還常會(huì)因?yàn)槟槻繄D像疊加不好,出現(xiàn)“雙下巴”等醒目的錯(cuò)亂。然而今天 Midjourney 連結(jié)構(gòu)最難把握的手都能畫好了。
Deepfake 臉部重合問題丨源自 Medium 作者Jonathan Hui
就連 AI 自己,對(duì)于什么內(nèi)容是自己生成的,也不太確信。OpenAI 做了一個(gè)分類模型(ai text classifier)檢測器(detector)(https://platform.openai.com/ai-text-classifier),在英文文本的評(píng)估中,正確識(shí)別了 26% 的 AI 生成文本,錯(cuò)誤地將 9% 的人類文本標(biāo)記為 AI 文本。
起初我對(duì)此結(jié)果存疑。直到我讓 Bing 以“春”、“夏”、”秋”、“冬”為話題分別寫四首詩,并交給 OpenAI 的檢測器來判斷。不幸的是,它給出的結(jié)果,分別是“文本非常不可能是 AI 寫的”,“不可能是 AI 寫的”,“不可能是 AI 寫的”,“不可能是 AI 寫的”——正確率為零。
OpenAI自己的 AI 識(shí)別工具,以及市面上另一家 originality.ai 做的檢測器本質(zhì)上都是“語言模型”——就跟 ChatGPT 一樣。
OpenAI 識(shí)別局限丨源自 OpenAI
Originality.ai (基于 Transformer )搭建了全新架構(gòu),在此之上訓(xùn)練一個(gè)預(yù)訓(xùn)練語言模型。然后用建立在數(shù)百萬個(gè)樣本上的訓(xùn)練集對(duì)模型進(jìn)行微調(diào)。輸入一旦超過模型既定的閾值,就界定該內(nèi)容是被 AI 生成的。
為了提升準(zhǔn)確性,這類工具在生成訓(xùn)練數(shù)據(jù)中,要盡可能生成多樣化的數(shù)據(jù)(用不同生成方式,和用多個(gè)生成模型),以便模型更好地知道 AI 生成的文本類型。
利用現(xiàn)有的人類創(chuàng)作的文本數(shù)據(jù)對(duì)模型進(jìn)行微調(diào),使 AI 生成的文本更加自然(也就是更像“人話”),以便模型能學(xué)到,即便 AI 生成的文本越來越有“迷惑性”,但跟人類之間那個(gè)微妙的邊界仍然存在——這聽起來更像 AI 假“識(shí)別”之名行模仿之事。
但至少目前,跨沒跨過那個(gè)“邊界”總有一些標(biāo)準(zhǔn)。GPTZero (也是一款 AI “殺手”,https://gptzero.me/)在辨別一段輸入是不是由 AI 生成的,它借助兩個(gè)文本屬性,困惑性(perplexity)、突發(fā)性(burstiness)。
“困惑性”是指一段文本的復(fù)雜性和隨機(jī)性。模型接受生成的文本數(shù)據(jù)集訓(xùn)練,所以機(jī)器下一個(gè)詞接什么,下一句話說什么,可預(yù)測性更高。然而人類遣詞造句的隨機(jī)性就高了,說出的話更加讓機(jī)器意想不到。
“突發(fā)性”則指句子之間的變化程度。人類寫作,有更多的句子結(jié)構(gòu)變化,長、短句,復(fù)雜、簡潔句交替使用。機(jī)器生成的句子往往更加統(tǒng)一。
但模型的漏洞很容易鉆。AI 生成的內(nèi)容與日俱增,對(duì)一份全然不同于,且從未在訓(xùn)練集中出現(xiàn)的內(nèi)容,AI 極有可能預(yù)測錯(cuò)誤;短文本對(duì)于模型來說簡直是災(zāi)難,因?yàn)槲谋驹蕉蹋尸F(xiàn)的變化可能性越少,OpenAI 要求輸入的文本至少有 1000 個(gè)字符。
那么 AI “鑒”畫的成績有好點(diǎn)嗎?
很遺憾,也沒有。
一位開發(fā)者 Matthew Maybe 在開發(fā)者社區(qū)上傳了自己的 image detector。(https://huggingface.co/spaces/umm-maybe/AI-image-detector)
實(shí)際上,他就是訓(xùn)練了一個(gè)圖片二分類模型。訓(xùn)練數(shù)據(jù)全部來自 Reddit,真實(shí)圖片來自 r/art 等版塊,AI 圖片來自 r/midjourney 等版塊,并“手動(dòng)”為這些圖片打了標(biāo)簽。
后來經(jīng)朋友提醒,還將真實(shí)圖片上傳日期限制在 2019 年之前,避免有 AI 生成圖片的混入。
使用評(píng)價(jià)褒貶不一,Reddit 用戶說,說不好是不是靠猜的。因?yàn)樗脩粲?xùn)練的數(shù)據(jù)樣本太少,只有幾千個(gè)。另外他“故意”不去解決,由計(jì)算機(jī)處理過(可能指 PS 等軟件),而非 AI 生圖所造成的判斷結(jié)果“假陽性”問題。
“與其做一個(gè)完美模型,我更想對(duì)藝術(shù)家負(fù)責(zé)。”以至于,模型在判斷是不是“真”圖上,給出結(jié)果也有保守“傾向”。
研究者們認(rèn)為,即便一張圖片肉眼看起來“完美”,由于生成過程會(huì)留下痕跡,讓它仍能被識(shí)別出來是AI畫的。這些生成痕跡,與攝像頭拍攝留下的“標(biāo)識(shí)”不同。而且每個(gè)生成算法留下各自獨(dú)特痕跡,以便溯源。
過往在基于 GANs(生成式對(duì)抗網(wǎng)絡(luò))的 deepfakes “換臉術(shù)”中,通過找生成痕跡的檢測方法被證明是有效的。
于是上述研究者們想,類似方法能否用于這段時(shí)間發(fā)展起來的 AI 生圖所基于的擴(kuò)散模型上。他們發(fā)現(xiàn),擴(kuò)散模型留下的痕跡,普遍不如 GANs 明顯。例如 Stable Diffusion 的痕跡雖弱,但尚可用來檢測,DALL-E 2 幾乎不可見。
生成痕跡在 DALL-E2 中幾乎不可見丨源自參考文獻(xiàn)[7]
基于模型之間的差距,以及對(duì)現(xiàn)有 detectors 做了效果評(píng)估之后,他們得出結(jié)論,現(xiàn)有 detectors 最大問題是“通用性”。
引入一個(gè)擴(kuò)散模型生成的圖片用以訓(xùn)練,可以幫助檢測出類似模型生成的圖片,但對(duì)其他的檢測效果就不好。一個(gè)模型是為 GANs 訓(xùn)練的,它很難檢測出基于擴(kuò)散模型的生成圖片。
以及當(dāng)圖片因?yàn)樵谏缃幻襟w上經(jīng)常被壓縮、裁剪,從而質(zhì)量有所下降,detectors 識(shí)別起來就有困難。
先是信不過AI,然后就是人類的相互猜忌
但今天的 AI 畫圖,不見得找不出一點(diǎn)錯(cuò)。有的時(shí)候畫面缺少 3D 建模;在陰影和反射畫面中不對(duì)稱。肉眼挑錯(cuò)的方法雖不是長久之計(jì),但至少是目前最可行的辦法。
比如在特朗普被捕的這些照片中。打眼一看畫面主體好像沒問題,但仔細(xì)一看,畫面人物越多,“詭異”的事情越多。
比如“多腿”特朗普;
圖片來源 Twitter @Eliot Higgins
特朗普膚色不自然,面部呈現(xiàn)一種“蠟質(zhì)”的不真實(shí);以及找不到主人的手;
圖片來源Twitter @Eliot Higgins
警察的帽子和徽章都模糊處理,細(xì)看甚至不盡相同;
圖片來源Twitter @Eliot Higgins
當(dāng) AI 表現(xiàn)人物表情,往往以一種比較夸張的方式呈現(xiàn)。(有的時(shí)候就連微笑所帶來的皮膚褶皺都畫得非常明顯);
圖片來源Twitter @Eliot Higgins
以及 AI 似乎還沒學(xué)會(huì)“眼神追蹤”,一群追趕特朗普的人,他們看向的方向都不相同。
圖片來源Twitter @Eliot Higgins
而在普通人眼中認(rèn)為完美的 AI 藝術(shù),也在經(jīng)驗(yàn)老道的藝術(shù)家那里形成了一套“經(jīng)驗(yàn)主義”。
一名 3D 角色藝術(shù)家(Dan Eder)說,“如果想試圖辨認(rèn)一張 AI 生成圖像,應(yīng)該考慮作品的整體設(shè)計(jì)。假設(shè) AI 畫了一張“幻想戰(zhàn)士盔甲”,乍一看,很漂亮,細(xì)節(jié)也很豐富,但很多時(shí)候這背后沒有“邏輯”。邏輯是指,當(dāng)一位人類藝術(shù)家為角色創(chuàng)作盔甲,他得考慮到,這件盔甲的功能性,肢體位置,要能展開多少?!?/p>
另一位藝術(shù)家則說,AI 生成的圖像缺乏“意向性”(指人類的每一個(gè)覺知都是指向外部事物),AI 沒什么經(jīng)驗(yàn)基礎(chǔ),能理解人、樹、手……是什么?!八羞@些都是剛被扔進(jìn)畫面里的,為了讓你的提示詞和數(shù)據(jù)點(diǎn)對(duì)應(yīng)起來。這是它能呈現(xiàn)的最接近的東西,但不知道為什么?!?/p>
即便藝術(shù)家們聲稱:AI 做圖缺少一種清晰的視覺敘事。但這種說法也被認(rèn)為是一種“事后諸葛亮”。
去年年底,一位數(shù)字藝術(shù)家 Ben Moran 發(fā)推,抱怨自己的作品被 r/Art 版塊審核員“禁了”,原因是違法了“no AI art”規(guī)則。這幅“戰(zhàn)區(qū)繆斯”(a muse in warzone)風(fēng)格的確類似很多 AI 生成藝術(shù)(在當(dāng)時(shí))——文藝復(fù)興繪畫風(fēng)格,穿著戰(zhàn)士服的女性。
Moran 自證丨圖片來源Ben Moran
Moran 說,“不信,我交出 PSD 文件?!睂徍藛T卻說,“不必!如果你是一個(gè)‘正經(jīng)兒’藝術(shù)家,你得畫些其他風(fēng)格??谡f無憑,因?yàn)椴粫?huì)有人再相信,AI 沒‘替’你畫畫?!?/p>
AI 學(xué)習(xí)網(wǎng)絡(luò)上大量畫作,從而形成自己“傾向性”的風(fēng)格,這本不是人類的錯(cuò)。AI 生成內(nèi)容逼近肉眼可辨的真實(shí),連內(nèi)容創(chuàng)作“金字塔”尖的藝術(shù)家們也需要自證。諷刺的是像上述例子,為了自證,人類需要主動(dòng)“避開” AI 所“擅長”的東西了。
參考文獻(xiàn)
[1]https://12ft.io/proxy?q=https%3A%2F%2Fwww.wired.com%2Fstory%2Fhow-to-tell-fake-ai-images-donald-trump-arrest%2F
[2]https://www.inquirer.com/politics/nation/ai-trump-arrest-photos-fake-20230322.html
[3]https://originality.ai/how-does-ai-content-detection-work/
[4]https://originality.ai/huggingface-ai-content-detection-review/
[5]https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text
[6]https://www.npr.org/2023/01/09/1147549845/gptzero-ai-chatgpt-edward-tian-plagiarism
[7]https://arxiv.org/pdf/2211.00680.pdf
[8] https://medium.com/@matthewmaybe/can-an-ai-learn-to-identify-ai-art-545d9d6af226
關(guān)鍵詞:
- 環(huán)球看熱訊:AI 畫得太逼真,以至于連 AI 自己都認(rèn)不出來了
- 熱文:綜述:洪都拉斯官員和民眾看好洪中關(guān)系發(fā)展前景
- 博鰲時(shí)間:大咖眼中的中國式現(xiàn)代化
- 天天關(guān)注:新加坡經(jīng)濟(jì)學(xué)家:中國經(jīng)濟(jì)的“火車頭”讓東盟復(fù)蘇更穩(wěn)更快
- 世界實(shí)時(shí):全球連線|我在中國學(xué)中醫(yī)
- 世界今日?qǐng)?bào)丨【英雄之光】江蘇鎮(zhèn)江:73年望鄉(xiāng)路,一場跨時(shí)空的“相見”
- 環(huán)球消息!還有200萬輛車沒賣掉!3個(gè)月后就沒法賣了?車企疾呼:請(qǐng)?jiān)俳o點(diǎn)時(shí)間
- 世界快資訊:銀保監(jiān)會(huì):引導(dǎo)人身保險(xiǎn)業(yè)為積極應(yīng)對(duì)人口老齡化國家戰(zhàn)略貢獻(xiàn)行業(yè)力量
- 世界今日?qǐng)?bào)丨油價(jià)“二連降” 今年來最大降幅!加一箱油少花13元
- 校企合作, 小熊電器X青島科技大學(xué)大學(xué)生創(chuàng)意傳播大賽頒獎(jiǎng)圓滿舉行
- “剛好一起”小熊電器17周年慶傳遞品牌溫度
- 青創(chuàng)成功舉辦2023年第二屆“知識(shí)就是生產(chǎn)力”演講大賽
- 明冠新材:股東上海博強(qiáng)增持公司股份計(jì)劃完成 累計(jì)增持約27萬股
- 每日視訊:長榮股份:公司獲得政府補(bǔ)助1000萬元
- 豐華股份:董優(yōu)群累計(jì)質(zhì)押股數(shù)約為322萬股
- 環(huán)球速遞!精達(dá)股份:公司子公司恒豐特導(dǎo)有部分產(chǎn)品應(yīng)用于5g通信
- 全球今頭條!復(fù)星醫(yī)藥:FCN-338片開展聯(lián)合阿扎胞苷或化療治療髓系惡性血液疾病臨床試驗(yàn)獲批
- 世界最新:青島旅游價(jià)格(青島三日游多少錢)
- 全球觀察:暴走鞋在哪買(溫州兒童暴走鞋專賣店在哪)
- 柯達(dá)Z990怎么樣?柯達(dá)z990評(píng)測
- 低碳菜單引領(lǐng)寧波餐飲消費(fèi)新風(fēng)尚 試點(diǎn)將持續(xù)至今
- 深圳坪山打造餐飲服務(wù)食品安全示范高地 嚴(yán)守食品
- 黑龍江哈爾濱推出“沙盒”監(jiān)管新模式 激發(fā)市場活
- 第三季度全國消協(xié)受理投訴數(shù)量同比增10.02% 食品
- 北京懷柔對(duì)機(jī)動(dòng)車檢測機(jī)構(gòu)開展監(jiān)督抽查 規(guī)范機(jī)動(dòng)
- 天津北辰扎實(shí)做好價(jià)格監(jiān)管工作 維護(hù)安全有序市場
- 北京石景山開展冬季供暖前特種設(shè)備安全專項(xiàng)檢查
- 陜西延安:開展兒童化妝品專項(xiàng)檢查 規(guī)范化妝品市
- 北京海淀開展商品條碼專項(xiàng)監(jiān)督檢查 努力打造穩(wěn)定
- 金華推進(jìn)網(wǎng)絡(luò)直播營銷治理顯成效 培育放心消費(fèi)直
- 1 環(huán)球看熱訊:AI 畫得太逼真,以至于連 AI 自己都
- 2 熱文:綜述:洪都拉斯官員和民眾看好洪中關(guān)系發(fā)展前
- 3 博鰲時(shí)間:大咖眼中的中國式現(xiàn)代化
- 4 天天關(guān)注:新加坡經(jīng)濟(jì)學(xué)家:中國經(jīng)濟(jì)的“火車頭”讓
- 5 世界實(shí)時(shí):全球連線|我在中國學(xué)中醫(yī)
- 6 世界今日?qǐng)?bào)丨【英雄之光】江蘇鎮(zhèn)江:73年望鄉(xiāng)路,一
- 7 環(huán)球消息!還有200萬輛車沒賣掉!3個(gè)月后就沒法賣了
- 8 世界快資訊:銀保監(jiān)會(huì):引導(dǎo)人身保險(xiǎn)業(yè)為積極應(yīng)對(duì)人
- 9 世界今日?qǐng)?bào)丨油價(jià)“二連降” 今年來最大降幅!加一
- 10 校企合作, 小熊電器X青島科技大學(xué)大學(xué)生創(chuàng)意傳播