- +1
谷歌要為AI生成的內容打標記,因為AI也拿AI沒有辦法
擺出兩張照片,讓你分辨其中哪一張是 AI 生成的;給你兩分鐘時間,讓你判斷網線另一頭同你聊天的是 AI 還是人類。無論答對還是答錯,抉擇時的搖擺說明了一切:AI 突進,但你還沒有做好準備。
一張由 Midjourney 5.1 版本生成,另一張則是真照片。
抖音 5 月 9 日發布關于人工智能生成內容的平臺規范暨行業倡議。其中提到,發布者應對人工智能生成內容進行顯著標識,幫助其他用戶區分虛擬與現實,特別是易混淆場景。若發布者利用生成式 AI 技術創作、發布侵權內容,造謠傳謠,一經發現,平臺將嚴格處罰。
“如果用戶在平臺上發布的人工智能生成的假視頻、假消息造成了不良的影響,第一責任人肯定是用戶。”上海大邦律師事務所高級合伙人游云庭接受澎湃新聞記者采訪時表示:“平臺現在是觸發式監管,比如說瀏覽量在 500 次以下的,哪怕有問題,他也不擔責。但是瀏覽量到了一定程度,比如說上了熱搜,平臺是需要進行人工審核的。這個時候平臺就要承擔責任了。”
游云庭補充道:“監管的操作第一線肯定是平臺。”
同時,各國政府都在考慮加大對 AI 的監管力度。4 月 27 日,歐盟達成《人工智能法(The AI Act)》協議,為世界上第一部綜合性人工智能法律鋪平道路。
科技公司擔起責任,用技術制衡 AI 濫用。5 月 11 日,谷歌在 Google I/O 大會上公布了它的 AI 生成圖像識別工具,你可以通過上傳來源不明的圖片、執行反向圖片搜索,了解到這張圖片被谷歌初次收錄的時間、最早出現的網站。如果一張帶有新聞機構水印的圖片首次出現在搞笑網站,那它很有可能是偽造的。
谷歌還宣布,它自己的生成式 AI 工具將在每張圖片中包含元數據、嵌入水印,以表明這是 AI 生成的圖像,而不是真實照片。谷歌的博客文章寫道,Midjourney、Shutterstock 和其他公司將在 “未來幾個月”推出這種標記。
AI 野蠻生長的時代,科技是最快的解法。
科技解法一:AI 生成內容識別器
在線課程供應商 Study.com 向 1000 名 18 歲以上的學生發起調查,結果表明超過 89%的學生使用 ChatGPT 來完成家庭作業。如果靠人力一條條地去分辨 AI 生成的痕跡,實在太過勞心勞力。
所以,最直接的想法是,不如讓 AI 來辨別內容是否由 AI 生成。2 月 1 日,OpenAI 團隊推出“AI 生成內容識別器”,旨在識別文本是由電腦自動生成還是人類撰寫,其本質上是一個區別真實內容和 AI 生成內容的分類器。不過,OpenAI 在博客中指出,此識別器對 AI 撰寫內容的檢出成功率僅為 26%。
科技網站 TechCrunch 曾在 2 月份用類似 ChatGPT 的聊天機器人 Claude 生成了 7 段不同風格的文字,來測試幾個比較流行的 AI 文本檢測器的“偵查能力”。結果,沒有 AI 檢測器能夠通關。
然而,隨著 AI 的能力越來越強,繞過 AI 檢測器也變得越來越容易。
拿上述表現最佳的 GPTZero 來說,澎湃新聞記者用 GPT-4 生成的一段 250 字的小說,被其判定為“有可能完全出自人類之手”。
GPT-4 生成的文字被 GPTZero 判定為“有可能完全出自人類之手”
科技解法二:數字水印
數字水印指,AI 生成時,以用戶肉眼不可察的方式,在內容中插入一些信息,打上“此文章(此圖)由 AI 生成”的隱秘水印。
AI 生成內容識別器失敗之后,OpenAI 開始考慮在生成的文本中加入數字水印。OpenAI 對齊團隊(Alignment Team,主要負責提高系統安全性)負責人 Jan Leike 對《紐約時報》透露,OpenAI 正在探索的水印方法類似于馬里蘭大學研究人員最近發表的一篇論文中描述的方法。
然而這種新方法的局限之處在于,水印只有從一開始就嵌入到大語言模型才有效。若要廣泛運用,人工智能領域的公司必須就水印的實施標準達成共識。
OpenAI 的 CEO,Sam Altman 接受《StrictlyVC》采訪時表示,不存在一個完美的 AI 生成文字識別工具。“人們總會弄清楚他們要修改多少文字,還會出現修改輸出文本的其他工具。”
通過嵌入“元數據”,圖像可以強硬地把“AI”寫在作者欄。但 AI 生成文字還在等一個可行的解法。
開頭的兩張圖里,左邊是真照片,右邊是AI生成的,你猜到了嗎?
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司