- +1
從小模型到大模型,專用智能走向通用智能有哪些技術路線?
·面向未來的通用人工智能,有兩條發展路線,一是延續大模型路線,二是探索強化學習、知識計算、符號推理、類腦計算及其他新型路徑。
·未來的創新將不再是某一個環節的簡單創新,大模型創新涉及芯片、互聯、框架、數據、模型、評測、部署等環節,可多環節協同、體系化創新,實現全鏈條優化,彌補單環節劣勢。
上海人工智能實驗室主任助理、領軍科學家喬宇。
“我們正處于專用智能時代到通用智能時代的關鍵階段。”3月22日,在2024年上海市產業技術創新大會上,上海人工智能實驗室主任助理、領軍科學家喬宇表示,面向未來的通用人工智能,有兩條發展路線,一是延續大模型路線,用更大的算力擴大模型規模,拓寬能力邊界,向產業滲透;二是探索強化學習、知識計算、符號推理、類腦計算及其他新型路徑。這兩條技術路選并非孤立和互相替代的,而是要通過探索新的技術路線解決大模型現有路線中的固有問題。
喬宇表示,2010年左右的深度學習方法驅動了一輪人工智能浪潮。最初十年,人工智能行業針對不同任務開發專用小模型。“那時候大部分研發由應用問題驅動,針對不同問題收集數據、訓練模型,所以是分散式、多團隊的研發。”
到2020年左右,Transformer+大數據+自監督學習的大模型路線使得智能涌現,一個模型可以應對多種任務。在大模型時代,OpenAI找到了“大工程+大創新”的道路,工業化集中研發才得以產生ChatGPT、GPT-4。
面向未來的通用人工智能,他認為有兩條發展路線。
一是延續大模型路線,用更大的算力擴大模型規模,拓寬能力邊界,向產業滲透,模型也從語言大模型向多模態大模型、具身大模型的方向發展。多模態大模型是現在的競爭熱點,未來的大模型要能和物理世界交流,完成更復雜的任務,所以具身大模型是重要發展方向。
但單純擴大規模,存在幻覺、效率、可信、安全等瓶頸,“現在讓一個大模型做一個奧數題和計算2+2這樣簡單的算術題,需要的運算量、運算次數是一樣的。所以,我們能否把大模型做得更安全、更高效,更好解決現在存在的一些瓶頸?”
這就涉及到了第二條新技術路線的探索,要探索強化學習、知識計算、符號推理、類腦計算及其他新型路徑。喬宇表示,基于知識、符號、推理的方法,可解釋性和安全性非常強,把這些方法結合起來形成更強大的功能,是未來AI發展的重要趨勢之一。
這兩條技術路選并非孤立和互相替代的,喬宇認為,要通過探索新的技術路線解決大模型現有路線中的固有問題。與此同時,未來的創新將不再是某一個環節的簡單創新,大模型創新涉及芯片、互聯、框架、數據、模型、評測、部署等多個環節,可多環節協同、體系化創新,實現全鏈條優化,彌補單環節劣勢。“大工程+創新鏈+產業鏈”,這種融合式的創新、與知名高校合作,是未來更重要的趨勢。
當前,中國大模型發展面臨技術和生態的雙重挑戰。上海擁有金融、城市、制造等豐富的B端場景,他建議聯合領軍企業研發垂類模型,加快構建開源生態反饋機制,打造大模型倫理安全評測體系,促進健康發展和規范應用。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司