- +1
開源大模型是趨勢:上海書生大模型等四項目在北京作最新發布
12月18日,以“新紀天工 開物煥彩——致敬開源的力量”為主題的重大科技成就發布會開源專場在國家科技傳播中心舉辦。
國家科技傳播中心由中國科協科學技術傳播中心建設和運行維護。
中國算力網開源開放試驗場、星辰語義大模型平臺、書生大模型、“香山”開源高性能RISC-V處理器核等四項成就進行了最新發布。2024年開源創新榜單同步揭曉。
鵬城實驗室高效能云計算所所長余躍表示,開源已成為推動技術創新和普及的關鍵力量。算力作為新質生產力的代表,正逐漸成為衡量國力和生產力的重要標準。在此背景下,鵬城實驗室、新一代人工智能產業技術創新戰略聯盟聯合發布了中國算力網開源開放試驗場。試驗場可調度總算力超過5E Flops(FLOPS即每秒執行的浮點運算次數,1E FLOPS=百億億 FLOPS),面向全社會提供大規模普惠算力資源,惠及國內外AI開源開發者17萬人。2025 年,試驗場計劃提供超過100萬卡時的普惠算力,加載超過500T的公共數據集用于預訓練和微調,并舉辦更多活動,以促進國內產、學、研、用的開發者生態繁榮。
星辰語義大模型實現了國內首個萬億參數大模型的完整訓練。中國電信集團CTO、首席科學家李學龍在為該模型平臺做推介時表示,該模型已完成從1B模型到萬億參數模型全尺寸開源,目前下載量達40多萬次,有效推動智能政務、智能助理等多領域的智能化升級。
書生大模型由上海人工智能實驗室發布。其中,書生·浦語 2.5 具備一百萬詞元(Tokens)的超長文本窗口及開源模型中領先的推理能力,并支持自主規劃和在線信息整合。多模態大模型書生萬象InternVL2.5支持圖像、視頻、文本、語音、三維、醫療多種模態。
上海人工智能實驗室主任、首席科學家周伯文在為項目做推介時表示,未來書生系列大模型將持續迭代模型并開源,實驗室將保持開放,攜手產學研,成為技術發展的連接器、放大器和加速器。
上海人工智能實驗室青年科學家陳愷在發布中表示,書生大模型不僅服務于學術研究,也應用于產業界,如智能體開發、數字化平臺建設等,助力國計民生。此外,上海人工智能實驗室還通過實戰營和挑戰賽等形式培養人才,推動大模型技術的發展。
“香山”開源高性能RISC-V處理器核由北京開源芯片研究院發布。中國工程院院士、“科創中國”開源創新聯合體榮譽理事長倪光南在為項目做推介時表示,“香山”開源高性能RISC-V處理器核的源代碼通過以GitHub、GitLink等國內外開源托管平臺,獲得約5000個Stars、670個fork,成為國際開源社區性能最強、最活躍的RISC-V處理器核。目前,“香山”開源高性能RISC-V處理器核已完成三次流片,為芯片產業創新發展做出了卓越貢獻。
在圓桌對話環節,中國計算機學會開源發展委員會副主任、LVS創始人章文嵩表示,大模型訓練本質上是數據工程管理,而數據獲取正變得日益困難。閉源大模型公司將會遇到數據來源問題,因為數據作為每個企業的重要資產,可能很多企業不愿意為閉源大模型公司貢獻數據。相比之下,開源模型由于非營利性質,更容易獲得社區和企業的數據支持。
余躍認為,開源大模型代表了一種必然的趨勢。在人工智能時代,開源的意義超越了代碼本身。
楊麗蘊表示,由于開源模型領域尚處于起步階段,業界尚未形成統一標準,因此厘清AI開源模型的邊界及確定哪些內容應當公開,仍需產業界共同探討。
謝志鋒表示,如何利用好國內平臺和服務是開發者抓住大模型發展機遇的關鍵。隨著更多相關平臺在國內涌現,開發者將擁有更多機會參與大模型和AI應用的創新中。
2024年開源創新榜單由中國科協科學技術傳播中心、中國計算機學會、中國通信學會、中國科學院軟件研究所共同主辦,中國開發者社區承辦,共評審出10個年度開源項目、10個年度開源社區、10個年度開源應用場景與10大年度開源事件。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2024 上海東方報業有限公司