百家乐官网 (中国)有限公司官网

澎湃Logo
下載客戶端

登錄

  • +1

算力突圍:中國式AI云的技術底牌|甲子光年

2025-04-15 17:16
來源:澎湃新聞·澎湃號·湃客
字號

原創 田思奇 甲子光年

沖破英偉達的算力封鎖。

作者|田思奇

編輯|栗子

2025年春天,AI正悄然換擋。

從訓練到推理,行業正聚焦于更加理性、務實、但競爭也更為激烈的效率較量。

這場轉變背后是擁有160年歷史,最近又被頻繁提起的經濟學悖論——杰文斯悖論(Jevons Paradox)。這個悖論認為:當某項資源使用效率提高后,其總消耗量非但不會減少,反而會因為需求暴增而迅速上升。

換句話說,AI推理變得越便宜、越高效,人們就越無法停止對它的依賴。AI算力,也正在因為“效率提升”而迎來新一輪需求井噴。

一個更直接的較量是,整個AI算力行業,向著突圍英偉達的封鎖邁出了重要的一步。

4月10日,華為云計算CEO張平安在華為云生態大會2025上公布了AI基礎設施架構突破性新進展——發布基于新型高速總線架構的CloudMatrix 384超節點,將目光鎖定一個關鍵命題——誰會在AI推理時代,成為更穩健的算力底座?

1.訓練退場,算力需求重構

2023年底,DeepSeek-MoE模型橫空出世,許多AI公司的核心工程資源都從模型訓練轉向推理優化。這一變化背后,正是杰文斯悖論在AI行業的再現。

「甲子光年」認為,這種變化不僅是一種經濟現象,更是一種技術范式的根本切換。過去衡量AI進展的核心指標是參數規模和訓練成本——誰能訓練出萬億參數大模型,誰就站在金字塔塔尖;但在推理時代,這種衡量邏輯正在被重新定義:真正能落地、可用、可控、可持續運行的AI系統,才是企業需要的“生產力工具”。

這一變化也重新定義了AI巨頭的技術路線。

作為全球GPU市場的主導者,英偉達依然牢牢掌控著AI核心資源的分配權。在2025年3月的GTC大會,彰顯出它試圖以更極致的硬件堆疊與生態封閉性,延續自己的領先優勢。

本次大會上,英偉達發布了代號Blackwell Ultra GB300的新一代AI芯片。該芯片配備288GB HBM3e高帶寬內存,以及機架級液冷設計,FP4算力達15PetaFLOPS。此外,英偉達宣布計劃于2027年發布Rubin Ultra NVL576架構,專為未來超大規模模型設計。

同時,英偉達推出首款開源推理軟件Dynamo。在由GB200NVL72機架組成的大型集群上運行DeepSeek-R1模型時,Dynamo的智能推理優化可將每個GPU生成的token數量提高30倍以上。

黃仁勛解釋稱,推理就是生成token,這對企業至關重要。生成這些token的AI工廠必須以極高的效率和性能建造。隨著最新一代推理模型能夠思考和解決日益復雜的問題,對token的需求只會增長。

憑借這些優勢,黃仁勛在現場不斷強調 “AI工廠” 這一概念,力圖將英偉達打造成為全球 AI 產業的核心樞紐。

圖片來源:英偉達

然而,這種近乎壟斷的發展態勢,已經引發對英偉達競爭邊界的質疑?!讣鬃庸饽辍乖贕TC大會現場注意到,有媒體向黃仁勛提問:“英偉達正在轉變為一站式 AI 解決方案提供商,你們正在進入部分客戶的領域,如果在某些方面成為他們的競爭對手,他們會如何反應?”

雖然黃仁勛強調,英偉達是全球唯一一家與所有AI公司合作的AI公司,但他們的目標很明確:將整個AI產業鏈進一步“固化”在英偉達的CUDA體系和GPU硬件生態之內。

「甲子光年」總結發現,英偉達所謂的AI產業主導權,主要體現在三個方面:

硬件堆疊:通過持續推出超高性能AI芯片,如Blackwell Ultra和即將發布的Rubin Ultra NVL576,英偉達在AI硬件領域保持領先地位。

軟件生態控制:CUDA生態系統已成為全球AI計算的核心基礎設施,擁有超過600萬開發者,遠超其他平臺。

全流程整合:通過“AI工廠”架構,英偉達將訓練、推理、微調、部署全流程整合在其硬件平臺內,形成技術鎖定效應。

這種模式的優點顯而易見:性能極致、生態完備、開發便捷。然而,它雖然為AI領域的技術發展提供了強大動力,卻也帶來了許多無法忽視的隱性成本。

首先,英偉達的硬件產品以其超高性能和精密工藝,吸引了大量高端客戶,但高昂的硬件成本和對功耗、散熱的嚴苛要求,使得許多中小型企業及部分發展中國家在AI基礎設施建設上面臨較大壓力。

尤其在推理時代,算力需求增長使得對硬件設備的依賴加劇,但是因為價格昂貴、技術復雜,許多企業部署AI應用時不得不承擔極高的成本。這既限制了AI技術普及,也在一定程度上抬高了行業技術壁壘,加劇了英偉達與其他廠商之間的差距。

CUDA生態和“AI工廠”架構形成“端到端的控制”,使得客戶從模型開發到生產部署均依賴英偉達體系。黃仁勛更直言,“AI工廠的最佳性能直接決定了客戶收益的百分比”,將算力供給與商業回報深度綁定。

因此,行業自然會萌生一個疑問:能否從架構原理開始,建立一套不依賴封閉生態、同時又能支撐大規模AI推理的新體系,從而突破英偉達的算力封鎖?

而這或許,將引發一場更深遠的產業變革。

2.中國破局的關鍵詞:超節點

中國面臨的現實則更加復雜。

隨著全球科技競爭日趨白熱化,以英偉達為代表的國際科技巨頭憑借先發優勢,不斷構筑并加高技術壁壘。在AI硬件領域,尤其是高端GPU方面,中國在很大程度上仍然依賴外部技術供應。

這一現狀意味著,若單純沿襲英偉達的技術路徑,中國AI產業的發展將面臨諸多掣肘:過度依賴單一GPU供應商,不僅會導致成本居高不下,更存在系統安全隱患,一旦外部供應受阻,產業發展將陷入被動困境。

而華為云最新公布的CloudMatrix 384超節點已經正式在蕪湖數據中心規模上線,截止目前,這是國內唯一正式商用的大規模超節點集群,可為千行萬業提供澎湃、穩定、高質量的算力支持,這一舉措也正在推動中國AI產業突破算力封鎖困境。

不夸張地說,對于中國算力產業而言,這一次華為云CloudMatrix 384超節點,可以算得上是世界級的創新突破。

不同于單點技術突破,系統級架構創新突破的難點在于對復雜技術與資源的整合與協同,而這一架構創新也更匹配全面智能時代的企業創新需求,也正在引領中國 AI產業生態的全面突圍。

華為云構建昇騰AI云服務的根基,是全棧自主創新的算力底座。

這一底座整合了算力、自研AI框架MindSpore、開發平臺ModelArts以及彈性云服務,各組件緊密配合,軟硬協同優化,將AI算力以標準化服務的形式輸出。

企業借助華為云,可便捷獲取即開即用的AI算力,無需自行搭建復雜的本地集群,極大降低了AI應用的門檻和部署成本。

支撐這一服務體系的核心技術,便是華為云自研的CloudMatrix架構。在傳統通用云服務架構逐漸逼近資源調度極限的背景下,CloudMatrix架構創新性地重構了算力的組織邏輯。其核心理念是從“堆芯片”走向“拼架構”,通過 “一切可池化”“一切皆對等”“一切可組合” 的方式,實現了業界領先的性能和可靠性。

這一舉措打破了以往硬件單元相互孤立的局面,實現了資源的按需靈活組合與動態調度,使得算力資源能夠根據不同的業務需求進行高效配置,顯著提升了資源的利用效率。

作為CloudMatrix架構中的基礎計算單元,超節點(SuperPoD)是這一架構落地的物理實現形式。

圖片來源:網絡

在單節點規模方面,超節點打破常規限制,利用新型高速總線將原本獨立的單節點8卡昇騰服務器緊密互聯,構建成強大的單一超級云服務器。這一創舉使得算力規模實現了質的飛躍,提升幅度高達50倍,達300Pflops,相比業界同類產品領先優勢明顯,性能提升67%。

與DeepSeek現有的MOE結構相比,超節點也展現出獨特的優勢。

DeepSeek的MOE結構是一個由眾多 “專家” 組成的團隊,每個 “專家” 擅長處理特定任務,在傳統8卡英偉達服務器上通過增加 “專家” 模塊來提升性能,類似于醫院增加不同??圃\室與專家以接待更多患者。但這種方式在實際應用中,部署過程極為復雜,如同搭建大型醫院需考慮科室布局、設備安置及人員調配等諸多復雜因素,任何環節出錯都可能影響系統運行效率。

而超節點采用全新架構設計,無需像DeepSeek那樣增加 “專家” 模塊,而是通過自身獨特架構實現計算資源的高效整合與調度。它就像從建筑設計之初便充分考慮各功能區域協同運作的現代化綜合醫療中心,各個科室間信息流通與資源共享順暢,無需額外復雜布局就能輕松應對大量不同類型任務需求,尤其是在推理大模型應用中優勢明顯。

CloudMatrix 384超節點集具備“高密”、“高速”、“高效”的優勢,通過架構的全面創新,已在算力、互聯帶寬、內存帶寬方面實現全面領先。

在有效算力提升上,超節點借助超高帶寬Scale - Up新型高速總線網絡,實現了從 “傳統以太網” 到 “共享總線網絡” 的重大跨越,資源互聯帶寬提升10倍以上。超節點的內存(HBM)帶寬達到1229TB/s,為業界的2.13倍。

硬件性能的大幅躍升,使得AI訓練過程中的數據傳輸更為高效,模型能夠快速獲取所需數據進行運算,有效降低了訓練出錯概率。在斷點恢復方面,超節點表現突出,斷點恢復時間僅為10秒,而行業平均水平長達13分鐘。

可靠性上,基于CloudMatrix架構,昇騰AI云服務可助力大模型訓練作業穩定運行40天,遠高于行業平均的2.8天。同時,昇騰AI云服務具備秒級故障監控能力,可實時監測系統運行狀況,一旦檢測到故障,能在10分鐘內自動恢復訓練作業,而業界平均恢復時間為60分鐘。

軟件層面,昇騰云充分發揮自身深厚的技術積累和研發優勢,持續優化CloudMatrix架構。通過不斷調整架構設計,使其與持續升級的昇騰芯片深度適配,實現了軟件與硬件的高度協同,極大提升了算力資源的管理與調度效率,進而優化了整體性能。這種軟硬件深度融合的創新模式,使昇騰云在AI硬件領域逐步構建起獨特的競爭優勢,有力推動了中國AI產業的自主創新發展。

「甲子光年」認為,在AI領域,真正提升AI效率的并非僅依賴某顆芯片的絕對性能,而是芯片、框架、調度器之間的協同效率。盡管在GPU通用性和高精度計算方面,英偉達仍處于行業領先,但昇騰云通過系統性工程創新,構建了差異化競爭優勢。

在昇騰云體系中,底層算力、MindSpore框架以及基于CloudMatrix架構的調度器緊密協作。MindSpore框架針對昇騰芯片深度優化,充分發揮芯片計算能力,實現了高效模型訓練和推理;CloudMatrix架構下的調度器則依據不同應用需求,智能調度算力資源,確保資源合理分配與高效利用。

在特定AI場景,如邊緣推理中,昇騰云通過軟硬件協同優化,展現出卓越的性能優勢。邊緣推理場景對設備本地數據處理速度、實時性和能耗控制要求極高。昇騰云針對這些特性,對模型進行針對性優化,減少數據傳輸延遲,降低能耗,有效滿足了邊緣推理場景的嚴苛需求。

此外,昇騰云重視單位功耗優化,持續在低功耗條件下提供高效推理服務,幫助廣大企業在控制成本的同時,充分享受AI技術帶來的紅利。

這種精準定位市場需求的優化策略,使昇騰云在激烈的市場競爭中找準切入點,成功塑造差異化競爭優勢,為中國AI產業在復雜嚴峻的國際競爭環境中,開拓出一條獨具特色的創新發展道路。

3.推理時代的價值驗證

如果說“訓練時代”的關鍵詞是“突破極限”,那么“推理時代”的核心則是“產業落地”。

從算法迭代、模型構建到真實場景部署,AI的演進正從實驗室走向實際應用。誰能率先完成從模型研發到應用上線的閉環,誰就能在這輪技術遷移中取得先發優勢。

在這樣的市場環境中,如何構建“用得起、用得好”的AI云服務,成為國產平臺的核心命題。AI技術的普惠性是基礎,但要真正實現AI的廣泛落地,還需要在行業應用層面深入發力,解決實際需求的多樣化與復雜性。

在這場轉變中,昇騰AI云服務扮演著連接算法能力與行業需求的關鍵角色。依托自研芯片、框架與平臺,昇騰云打造出覆蓋全鏈路的自主技術體系,為各行業的智能化建設提供了基礎支撐。

這一過程絕非單兵作戰。昇騰云已攜手科大訊飛、奇瑞、新浪微博等頭部企業,構建了涵蓋模型開發與場景落地的生態閉環。

除了華為的盤古大模型,昇騰AI云服務還持續適配第三方模型,截至目前已適配行業主流160多個大模型,協助客戶開發,訓練,托管和應用模型。昇騰AI云服務上線以來,面向政府、金融、零售、互聯網、交通、制造等行業已經服務六百多家的創新先鋒企業。

此外,與硅基流動和DeepSeek的合作,也被認為是國產模型與國產算力結合的代表案例。DeepSeek模型滿血版現已上線昇騰AI云服務,并基于昇騰AI云服務的全棧優化適配。

該服務在保證單用戶20TPS水平前提下,單卡Decode吞吐突破1920Tokens/s,比肩英偉達H100的部署性能。同時經過主流測試集驗證及大規模線上盲測,在昇騰算力部署DeepSeek-R1的模型精度與DeepSeek官方保持一致。

華為云計算CEO張平安 圖片來源:網絡

同時,張平安在華為云生態大會現場介紹,在全球,華為云開服節點已經覆蓋了全球33個地理區域,96個可用區,在中國也完成了貴安、烏蘭察布、蕪湖三大云核心樞紐布局,這也是目前全球最大規模、最新技術、最高規格的數據中心與算力中心,通過這些布局,華為云實現了國內30ms,海外50ms時延圈,構建全球存算一張網。

換言之,昇騰云的目標是:構建一個像電網一樣普惠的AI基礎設施。

然而,從 “用得上” 到 “用得精”,AI落地難點在轉移?!讣鬃庸饽辍褂^察到,不同行業高度異構與定制化,通用大模型難以覆蓋復雜場景,“場景適配能力”正成為模型部署成敗的關鍵因素。

昇騰云基于芯片、框架、工具鏈與云平臺協同,為行業場景提供定制服務,實現模型快速適配、上線,形成與客戶的穩定綁定,構成重要的護城河。

在全球科技博弈下,昇騰云亦擺脫外部生態依賴,保障數據、供應鏈安全,為國內企業提供安全可信的基礎設施。

面對激烈的市場競爭和復雜的行業需求,昇騰云的目標和策略已經明確:

不求短期性能超越和簡單替代,而在于通過系統性創新,專注長期可用性與工程落地能力;不止追求技術自主,更關注實際產業需求的契合;最終構建支撐行業智能化應用規模化落地的AI“第二選擇”。

畢竟,推理時代的競爭,不只是算力之爭,更是穩健性、適配力與技術獨立性的綜合比拼。

而這些,正是昇騰云正在交付的答案。

(封面圖由AI生成)

END.

原標題:《算力突圍:中國式AI云的技術底牌|甲子光年》

閱讀原文

    本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            百家乐官网棋| 澳门百家乐官网真人娱乐城 | 威尼斯人娱乐城免费注册| 联合百家乐官网的玩法技巧和规则| 博彩导航网| 百家乐投注技巧建议| 百家乐官网游戏程序下载| 大发888贴吧| 百家乐视频游戏账号| 百家乐官网最佳打| 百家乐官网视频游戏金币| 百家乐百博亚洲| 百家乐官网鸿泰棋牌| 死海太阳城酒店| 最好的百家乐娱乐场| 尊龙百家乐官网赌场娱乐网规则| 赌场百家乐网站| 百家乐官网有免费玩| 大发888 代充| 百家乐五湖四海娱乐平台| 百家乐是赌博吗| 海立方百家乐官网的玩法技巧和规则 | 百家乐官网平台那家好| 盈丰国际博彩网| 全讯网77| 百家乐牌九| 布加迪百家乐官网的玩法技巧和规则 | 娱乐城开户送现金| 百家乐必赢| A8百家乐游戏| 百家乐官网平台注册| 百家乐官网金海岸软件| 威尼斯人娱乐城 色情| 巴黎人百家乐的玩法技巧和规则| 免费玩百家乐官网的玩法技巧和规则| 百家乐官网买闲打法| 百家乐官网真人百家乐官网皇冠开户| 百家乐官网代理博彩正网| 贵族国际娱乐城| 中阳县| 大发888娱乐网|