斯坦福團隊抄襲中國大模型，媒體：新賽道上中國不必妄自菲薄

夏天/@北京日報

2024-06-05 16:48

近日，美國斯坦福大學AI團隊主導的Llama3-V開源模型被證實套殼抄襲國內清華大學與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5。斯坦福團隊的兩位作者就這一學術不端行為正式道歉，并撤下了模型。

短短幾天內，這場風波塵埃落定，與中國團隊給出的證據之確鑿不無關系。上個月底，斯坦福團隊在網絡上宣傳只需500美元就可訓練出一個超越GPT-4V的SOTA多模態大模型。但很快就有人發現，該團隊的Llama3-V模型使用的模型結構和代碼與國內團隊發布的MiniCPM-Llama3-V2.5極為相似。

緊接著，國內團隊發現，Llama3-V可以識別出“清華簡”戰國古文字，“不僅對得一模一樣、連錯得都一模一樣”。而這一古文字數據為研究團隊花費數月從“清華簡”上逐字掃描并人工標注得來，并未對外公開?！皩嶅N”之下，斯坦福團隊的抄襲也就無從分辯了。

誠如專家所言，盡管這次以一種令人遺憾的方式揭示了中國AI研發的較高水平，但也說明，現如今中國創業公司的大模型產品開始受到國際的廣泛關注與認可。人工智能為千行萬業的跨越式發展帶來機遇，中國同樣在追趕這一風口。截至去年底，中國有至少130家公司研究大模型產品，其中100億級參數規模以上的大模型超過10個，10億級參數規模以上的大模型已近80個，大模型數量位居世界第一梯隊。

對于中美在大模型領域的差距，有業內人士表示，一年前，中國大模型與OpenAI、Google啟動大模型研發的時間點比起來，有7到10年的差距；但如今，中美之間的差距約為6個月。曾經，一提及美國科技創新，很多人都是仰望心態。而新賽道上的表現證明，我們正在將差距不斷縮小，完全不必妄自菲薄。

從長遠來看，如今的大模型已從原來的純語言模態逐步走向多模態的探索。相關研究正處于起步階段，技術成熟度還不高，這為中國的發展提供了新的契機。就短板來說，我國在人工智能算力、算法上尚存一定差距。從加快全國一體化算力網建設，到構建算力產業鏈，再到加強行業算力建設布局，需要相關部門加速推進。

另一方面，我們占據了應用場景、人口規模和產業集群等優勢，為人工智能技術的應用提供了廣闊的場景和超大規模內需市場。在應用實踐中錘煉、迭代和改進的技術，反過來又會促進應用更加深化，從而形成技術進步與應用推廣相互推進的良性循環。我們要充分發揮自身制度優勢，保持獨立自主的精氣神，更加自信地勇闖“無人區”，更加主動地擁抱世界，在部分技術不占先發優勢的情況下，加快腳步、站穩腳跟。

“人工智能是引領這一輪科技革命和產業變革的戰略性技術，具有溢出帶動性很強的‘頭雁’效應?！蔽覀兗纫熬o張”起來，以時不我待的緊迫感去搶抓機遇，保持第一梯隊的位置；也要“放松”下來，以更加自信的姿態，有條不紊、踏踏實實地走好自己的路。時間，永遠不會辜負智慧與汗水。

責任編輯：王建亮

圖片編輯：朱偉輝

澎湃新聞報料：021-962866

澎湃新聞，未經授權不得轉載

我要舉報

#大模型 #人工智能 #新賽道