- +1
大模型為深度偽造帶來土壤,業界呼吁跨學科聯合攻堅鑒偽技術
·鑒偽技術開發需要跨學科合作,當前的鑒偽技術以軟件算法為主,未來將走向軟硬一體。
大模型興起為深度偽造帶來土壤,業界呼吁跨學科聯合攻堅鑒偽技術。
在大模型時代,人工智能合成語音與真實語音之間的界限變得越發模糊,提升與之匹配的識別技術迫在眉睫。7月23日,主題為語音深度鑒偽識別的第九屆信也科技杯全球人工智能算法大賽總決賽在上海舉行,大賽鼓勵參賽者運用深度學習和人工智能對抗技術,開發出能夠準確識別虛假語音的模型。
深度偽造是一種利用深度學習和人工智能技術生成高度逼真的虛假內容的方法。大模型的興起為深度偽造帶來了土壤,只需輸入提示詞,AI系統就會輸出圖片、視頻、音頻,真假難辨。
以虛假語音為例,大模型能夠生成多種虛假語音,這些虛假語音更真實、擬人,對話流暢,為虛假語音識別帶來更大的挑戰。“在一些高價值場景里,往往會發生AI生成語音欺詐。但是,目前語音鑒偽技術的發展卻滯后于語音合成技術。”信也科技副總裁、大數據及AI負責人陳磊表示。
在決賽中,選手運用不同算法模型和訓練思路識別虛假語音,包括運用基于大模型的識別技術、基于傳統端到端的識別技術等。端到端的識別技術參數量較小,聚焦更垂直的問題;大模型的參數量較大,對數據要求較高,泛化能力強,對由大模型生成的假語音數據的識別率有明顯提升。
信也科技算法科學家呂強介紹,初賽的語音數據集主要由傳統端到端TTS(文字轉語音)生成的假語音組成,識別難度較低,復賽數據集首次加入了基于最新大模型生成的假語音、翻錄假語音以及由真假語言拼接而成的樣本,覆蓋英語、法語、西班牙語等五種以上語言,比賽難度增加。“復賽加入由大模型生成的假語音后比賽難度變大,也能說明最新大模型‘以假亂真’的能力變強了,這要求相應的深度偽造識別技術必須跟上腳步。”
“我們特意在比賽中加入了一些新場景數據,比如翻錄假語音,也就是對生成的真語音經過多次錄音再生成的數據,我們認為這是假語音。”呂強表示,針對這一場景,大賽利用真假語音切片、混合,構建對抗性數據,避免人工聽語音、打標簽干擾比賽,“只要有一個切片是假語音,那么整條都是假語音,這更接近真實場景,但識別挑戰大。如果能解決翻錄問題和真假對抗,將具有學術價值。”呂強也表示,文本、視頻等多模態信息有助于語音鑒偽,大模型和多模態將是語音鑒偽的重要發展方向。
偽造技術與鑒偽技術“競賽”,兩者的發展呈螺旋式上升。陳磊表示,語音大模型的研究要把應用問題抽象提煉成學術問題,在解決學術問題后經過工程化,解決具體業務場景的真實需求。鑒偽技術開發需要跨學科合作,當前的鑒偽技術以軟件算法為主,未來將走向軟硬一體,借助硬件溯源聲音采集,從硬件層面起到假語音風險防控作用。
“鑒偽沒有終點,只要生成式道路還沒有走到頭,鑒偽就會一直往下走。”陳磊表示,賽后信也科技將開源數據,用于更廣泛的學術研究,將選手的材料脫敏后共享學習。同時在業務場景中吸收前沿模型思想,構建AIGC鑒偽平臺。他認為生成式AI要符合治理規則,人工智能治理需要監管層的頂層設計進行規范和引導,同時呼吁生態共建,以產業界共創防范系統性風險。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2024 上海東方報業有限公司