- +1
斯坦福團隊抄襲中國大模型,媒體:新賽道上中國不必妄自菲薄
近日,美國斯坦福大學AI團隊主導的Llama3-V開源模型被證實套殼抄襲國內清華大學與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5。斯坦福團隊的兩位作者就這一學術不端行為正式道歉,并撤下了模型。
短短幾天內,這場風波塵埃落定,與中國團隊給出的證據之確鑿不無關系。上個月底,斯坦福團隊在網絡上宣傳只需500美元就可訓練出一個超越GPT-4V的SOTA多模態大模型。但很快就有人發現,該團隊的Llama3-V模型使用的模型結構和代碼與國內團隊發布的MiniCPM-Llama3-V2.5極為相似。
緊接著,國內團隊發現,Llama3-V可以識別出“清華簡”戰國古文字,“不僅對得一模一樣、連錯得都一模一樣”。而這一古文字數據為研究團隊花費數月從“清華簡”上逐字掃描并人工標注得來,并未對外公開?!皩嶅N”之下,斯坦福團隊的抄襲也就無從分辯了。
誠如專家所言,盡管這次以一種令人遺憾的方式揭示了中國AI研發的較高水平,但也說明,現如今中國創業公司的大模型產品開始受到國際的廣泛關注與認可。人工智能為千行萬業的跨越式發展帶來機遇,中國同樣在追趕這一風口。截至去年底,中國有至少130家公司研究大模型產品,其中100億級參數規模以上的大模型超過10個,10億級參數規模以上的大模型已近80個,大模型數量位居世界第一梯隊。
對于中美在大模型領域的差距,有業內人士表示,一年前,中國大模型與OpenAI、Google啟動大模型研發的時間點比起來,有7到10年的差距;但如今,中美之間的差距約為6個月。曾經,一提及美國科技創新,很多人都是仰望心態。而新賽道上的表現證明,我們正在將差距不斷縮小,完全不必妄自菲薄。
從長遠來看,如今的大模型已從原來的純語言模態逐步走向多模態的探索。相關研究正處于起步階段,技術成熟度還不高,這為中國的發展提供了新的契機。就短板來說,我國在人工智能算力、算法上尚存一定差距。從加快全國一體化算力網建設,到構建算力產業鏈,再到加強行業算力建設布局,需要相關部門加速推進。
另一方面,我們占據了應用場景、人口規模和產業集群等優勢,為人工智能技術的應用提供了廣闊的場景和超大規模內需市場。在應用實踐中錘煉、迭代和改進的技術,反過來又會促進應用更加深化,從而形成技術進步與應用推廣相互推進的良性循環。我們要充分發揮自身制度優勢,保持獨立自主的精氣神,更加自信地勇闖“無人區”,更加主動地擁抱世界,在部分技術不占先發優勢的情況下,加快腳步、站穩腳跟。
“人工智能是引領這一輪科技革命和產業變革的戰略性技術,具有溢出帶動性很強的‘頭雁’效應?!蔽覀兗纫熬o張”起來,以時不我待的緊迫感去搶抓機遇,保持第一梯隊的位置;也要“放松”下來,以更加自信的姿態,有條不紊、踏踏實實地走好自己的路。時間,永遠不會辜負智慧與汗水。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司