- +1
上海交通大學(xué)教授沈?yàn)椋盒F舐?lián)合,打造大模型的中國式創(chuàng)新路徑丨數(shù)據(jù)猿專訪

2024 年,被視為大模型商業(yè)化落地元年。在這個(gè)充滿機(jī)遇與挑戰(zhàn)的時(shí)刻,“百模大戰(zhàn)” 后的產(chǎn)業(yè)格局正發(fā)生著深刻的變化。
隨著大模型市場容量及規(guī)模的持續(xù)增長,根據(jù)《2024-2028年中國大模型市場發(fā)展分析與投資戰(zhàn)略規(guī)劃報(bào)告》的預(yù)測,預(yù)計(jì)到 2028 年將達(dá)到 1179 億元的龐大規(guī)模。回首過去,中國大模型產(chǎn)業(yè)市場規(guī)模從2020年的15億元人民幣迅速攀升至2022年的70億元人民幣,年均復(fù)合增長率高達(dá)116.02%。這一驚人的發(fā)展速度,彰顯了大模型在中國的巨大潛力。
然而,在這個(gè)快速發(fā)展的過程中,我們也不得不面對國內(nèi)外的競爭與差距,以及大模型自身的局限性。同時(shí),人才培養(yǎng)成為了大模型發(fā)展的關(guān)鍵所在。為了能夠清楚的了解到問題所在,數(shù)據(jù)猿與上海交通大學(xué)教授沈?yàn)樽隽嗽敿?xì)溝通。
大模型并非無所不能
大模型在多個(gè)領(lǐng)域取得顯著成就,尤其在自然語言處理上表現(xiàn)卓越,能準(zhǔn)確理解并回答各種問題,提升智能客服效率和質(zhì)量。在文本生成上,大模型能創(chuàng)作多樣文本,助力新聞和內(nèi)容創(chuàng)作。在機(jī)器翻譯方面,它促進(jìn)了跨語言交流。此外,大模型還能輔助醫(yī)療、金融等領(lǐng)域的數(shù)據(jù)分析和決策。
從近期這些大模型廠商公布的財(cái)報(bào)來看,均有所得。
百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏透露,百度智能云2024年第二季度營收達(dá)51億元,同比增長14%,并持續(xù)實(shí)現(xiàn)盈利(非公認(rèn)會(huì)計(jì)準(zhǔn)則)。同時(shí),AI貢獻(xiàn)的收入占比進(jìn)一步提升至9%,高于上一季度的6.9%。
科大訊飛財(cái)報(bào)數(shù)據(jù)顯示,在大模型落地推廣力度加快發(fā)展下,科大訊飛2024年上半年實(shí)現(xiàn)營業(yè)收入93.25億元,同比增長18.91%。商湯的生成式 AI業(yè)務(wù)也成為其上半年財(cái)報(bào)的亮點(diǎn),上半年該業(yè)務(wù)延續(xù) 2023 年高速增長態(tài)勢,貢獻(xiàn)營收超 6 成。
然而,盡管大模型在應(yīng)用層做出了如此多的努力,我們必須認(rèn)識到,大模型并不是萬能的。沈?yàn)槿缡钦f。
沈?yàn)橐杂?jì)算機(jī)視覺與大模型結(jié)合的目前近況為例,解釋了大模型的局限性。雖然大模型在自然語言處理方面取得了巨大的成功,但在計(jì)算機(jī)視覺領(lǐng)域,大模型的應(yīng)用還存在一些問題。
例如,大模型在圖像識別、目標(biāo)檢測等任務(wù)中的準(zhǔn)確率還有待提高。此外,大模型在處理大規(guī)模圖像數(shù)據(jù)時(shí),計(jì)算量非常大,需要消耗大量的計(jì)算資源。因此,計(jì)算機(jī)視覺與大模型的結(jié)合還需要進(jìn)一步的研究和探索。
其次在醫(yī)學(xué)領(lǐng)域,尤其是處理疑難雜癥時(shí),依賴大型人工智能模型可能并不理想,因?yàn)檫@些病癥往往缺乏足夠的訓(xùn)練數(shù)據(jù)。然而,在一些數(shù)據(jù)量較大的領(lǐng)域,比如通過胸部X光片來識別肺部疾病,人工智能的應(yīng)用則顯得更為可行。盡管如此,即使是在這些領(lǐng)域,大型模型的準(zhǔn)確率可能也只能達(dá)到70%左右,這對于醫(yī)學(xué)診斷來說還是遠(yuǎn)遠(yuǎn)不夠的。
在醫(yī)學(xué)診斷中,準(zhǔn)確性至關(guān)重要。理想情況下,人工智能應(yīng)該能夠以極高的準(zhǔn)確率篩選出那些確實(shí)沒有疾病的個(gè)體,從而減少醫(yī)生需要復(fù)查的病例數(shù)量。同時(shí),它也應(yīng)該能夠識別出那些可能存在問題,需要進(jìn)一步檢查的病例。這樣,醫(yī)生就可以將精力集中在那些真正需要仔細(xì)診斷的病例上,從而提高整體的醫(yī)療效率和質(zhì)量。
就此來看,大模型雖然在自然語言處理等領(lǐng)域取得了巨大的成功,但在其他領(lǐng)域的應(yīng)用還存在一些問題。大模型并非無所不能,我們需要客觀地認(rèn)識大模型的局限性,在應(yīng)用大模型時(shí),要結(jié)合實(shí)際情況,充分發(fā)揮大模型的優(yōu)勢,同時(shí)避免其局限性帶來的風(fēng)險(xiǎn)。
國內(nèi)應(yīng)該有更好的創(chuàng)新土壤
從全球范圍來看,國外大模型的發(fā)展起步較早,且在技術(shù)實(shí)力和創(chuàng)新能力方面具有較強(qiáng)的優(yōu)勢。
以 OpenAI的GPT系列為例,GPT-4憑借其卓越的語言理解、生成和推理能力,在各類測試中均保持領(lǐng)先地位,始終處于行業(yè)的領(lǐng)跑位置,為大模型的發(fā)展樹立了標(biāo)桿。
此外,像Google的Bard、Meta的LLaMA等也在不斷發(fā)力,推動(dòng)大模型技術(shù)的進(jìn)步。國外大模型在基礎(chǔ)模型能力提升方面持續(xù)投入,不斷探索更先進(jìn)的算法和架構(gòu),致力于提高模型的性能和智能化水平。同時(shí),國外在大模型的開源生態(tài)方面也發(fā)展得較為成熟,如 Llama模型塑造了龐大的開源模型家族,吸引了眾多開發(fā)者參與,形成了豐富的應(yīng)用生態(tài)。
在2023至2024年間,大模型技術(shù)經(jīng)歷了顯著的發(fā)展和進(jìn)步,這一時(shí)期被視為AI技術(shù)的一個(gè)全新發(fā)展階段。大模型技術(shù)在通用性和實(shí)用性上取得了顯著進(jìn)展,為多個(gè)行業(yè)提供了強(qiáng)大的技術(shù)支撐。高質(zhì)量數(shù)據(jù)集和深度學(xué)習(xí)框架的不斷優(yōu)化是推動(dòng)這一技術(shù)迅速發(fā)展的關(guān)鍵因素。
國內(nèi)大模型的發(fā)展勢頭同樣迅猛。在過去的一年中,國內(nèi)大模型進(jìn)入加速成長期,取得了實(shí)質(zhì)性突破。百度的文心一言、訊飛的星火、智譜ChatGLM、商湯的“日日新 SenseNova” 等大模型不斷涌現(xiàn),整體表現(xiàn)逼近 GPT-4 ,部分模型的中文能力甚至與 GPT-4 相差無幾。
然而,從產(chǎn)業(yè)發(fā)展過程的角度來看,國內(nèi)在技術(shù)創(chuàng)新性上多次落后。我國在技術(shù)上一直處于跟隨狀態(tài),與國外相比,在創(chuàng)新方面存在一定的差距。雖然近年來我國在人工智能領(lǐng)域取得了顯著的進(jìn)步,但在大模型的核心技術(shù)方面,如算法的創(chuàng)新性、模型的架構(gòu)設(shè)計(jì)等方面,仍然落后于國外的先進(jìn)水平。國外的科技巨頭們在大模型的研發(fā)上投入了大量的資源,擁有強(qiáng)大的技術(shù)實(shí)力和創(chuàng)新能力。例如,OpenAI的GPT系列模型在自然語言處理領(lǐng)域取得了巨大的成功,引領(lǐng)了全球大模型的發(fā)展潮流。
不過,在應(yīng)用層面,國內(nèi)與國外相比有一定的優(yōu)勢。國內(nèi)大模型在應(yīng)用落地方面積極探索,在數(shù)字人、人形機(jī)器人等領(lǐng)域以及金融、醫(yī)療、法律等多個(gè)行業(yè)開展了豐富的實(shí)踐。例如,在金融領(lǐng)域利用大模型進(jìn)行風(fēng)險(xiǎn)評估和智能客服。
針對國內(nèi)與國外的差距,沈?yàn)楸硎荆罹嗖⒎求w現(xiàn)在這一特定應(yīng)用上,而是應(yīng)該思考為何我們總是處于追趕狀態(tài)。為何別人總能推出極具創(chuàng)新的東西,而我們往往在別人創(chuàng)新之后才發(fā)現(xiàn),進(jìn)而去追趕。
國內(nèi)與國外在大模型產(chǎn)品上的差距在慢慢縮小,并且國內(nèi)在應(yīng)用層面做的很好,但是如果想要實(shí)現(xiàn)領(lǐng)先性,應(yīng)該在創(chuàng)新方面多下功夫。實(shí)際上,很多專家包括眾多院士都曾提到過,我們應(yīng)該營造更好的創(chuàng)新土壤,而不是一直做追趕者。沈?yàn)檠a(bǔ)充道。
有武器也需要足夠的火力支持
當(dāng)然,關(guān)注大模型發(fā)展并非只是企業(yè)的事情,學(xué)校也是重要的補(bǔ)充,畢竟人才才是最關(guān)鍵所在。學(xué)校與企業(yè)之間的聯(lián)動(dòng)能夠?yàn)榇竽P偷陌l(fā)展提供重要的支持。
在這個(gè)充滿挑戰(zhàn)與機(jī)遇的征程中,學(xué)校與企業(yè)的合作顯得尤為重要。
沈?yàn)楸硎荆皩W(xué)校,作為知識的殿堂和人才的搖籃,擁有著豐富的 “武器” 和 “兵源”。這里匯聚了眾多頂尖的學(xué)者和充滿創(chuàng)造力的學(xué)生,他們在理論研究方面有著深厚的積淀。學(xué)校的科研團(tuán)隊(duì)能夠深入探索大模型的基礎(chǔ)理論,從算法設(shè)計(jì)到模型架構(gòu),不斷尋求創(chuàng)新突破。學(xué)生們則以飽滿的熱情和求知欲,積極參與到大模型的研究中,為項(xiàng)目注入新的活力。他們就像一支裝備精良的軍隊(duì),擁有著先進(jìn)的知識武器和充足的兵源儲(chǔ)備。”
“然而,在大模型的創(chuàng)新研究中,僅僅依靠學(xué)校的力量是不夠的。企業(yè)作為市場的主體,擁有著學(xué)校所缺乏的 ‘火力支持’。其中,算力方面企業(yè)的優(yōu)勢尤為明顯。大模型的訓(xùn)練需要龐大的計(jì)算資源,企業(yè)可以憑借其強(qiáng)大的資金實(shí)力和技術(shù)能力,提供高性能的計(jì)算設(shè)備和穩(wěn)定的算力支持。這就如同在戰(zhàn)場上,企業(yè)為學(xué)校的研究團(tuán)隊(duì)提供了強(qiáng)大的火力保障,使得他們能夠更加高效地進(jìn)行模型訓(xùn)練和優(yōu)化。”沈?yàn)檠a(bǔ)充道。
總之,校企合作在大模型創(chuàng)新研究中扮演著關(guān)鍵角色,它促進(jìn)了資源共享、人才培養(yǎng)和行業(yè)發(fā)展。學(xué)校提供科研成果,企業(yè)則提供算力和市場經(jīng)驗(yàn),共同加速技術(shù)轉(zhuǎn)化。學(xué)生通過參與企業(yè)項(xiàng)目提升實(shí)踐能力,企業(yè)也能從學(xué)校選拔人才。合作還推動(dòng)了行業(yè)技術(shù)難題的解決,引領(lǐng)人工智能發(fā)展。
實(shí)際合作形式多樣,包括建立聯(lián)合實(shí)驗(yàn)室、企業(yè)贊助科研項(xiàng)目、邀請企業(yè)專家講學(xué)等。例如,谷歌與斯坦福大學(xué)在自然語言處理大模型研究上合作,斯坦福提供理論和算法支持,谷歌提供算力和數(shù)據(jù)資源。微軟與劍橋大學(xué)共同提升大模型性能,劍橋提供機(jī)器學(xué)習(xí)理論,微軟提供技術(shù)平臺。Meta與卡內(nèi)基梅隆大學(xué)在社交網(wǎng)絡(luò)內(nèi)容理解和推薦系統(tǒng)大模型研發(fā)上合作,卡內(nèi)基梅隆提供專業(yè)知識,Meta提供數(shù)據(jù)和計(jì)算資源。
這種合作模式是大模型時(shí)代創(chuàng)新發(fā)展的必然選擇,有助于學(xué)校和企業(yè)共同攻克技術(shù)難題,培養(yǎng)AI人才,推動(dòng)行業(yè)進(jìn)步,確保在智能時(shí)代中保持領(lǐng)先地位。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2025 上海东方报业有限公司