- +1
拾象李廣密:對DeepSeek和智能下半場的幾條判斷
·DeepSeek很讓人興奮,但還不能稱作范式級創新,更準確的表述是將之前OpenAI o1半遮半掩的范式開源,將整個生態推向很高滲透率,推進整個行業進入了新范式。

DeepSeek 視覺中國 資料圖
從2024年第三季度開始我們就一直在講AI的下半場,雖然OpenAI o1提出了強化學習(RL)敘事,但因為各種原因沒有破圈,DeepSeek R1解了RL的謎題,推進整個行業進入了新范式,真正進入智能下半場。
市場上關于DeepSeek是什么、為什么的討論已經很多了,接下來更有價值討論是AI競賽要怎么繼續?把過去半個月的思考總結了一下,希望成為探索下半場的路徑圖,每隔一段時間來復盤。

拾象科技創始人兼CEO李廣密。
Insight 01:DeepSeek 超越 OpenAI 了嗎?
DeepSeek超越了Meta Llama毫無疑問,但相比OpenAI、Anthropic和Google這些第一梯隊還有距離,比如Gemini 2.0 Flash成本比DeepSeek更低,能力也很強,且全模態,外界低估了Gemini 2.0為代表的第一梯隊的能力,只是沒有開源而獲得這么炸裂轟動性的效果。
DeepSeek很讓人興奮,但還不能稱作范式級創新,更準確的表述是將之前OpenAI o1半遮半掩的范式開源,將整個生態推向很高滲透率。
從第一性原理角度,在Transformer這一代架構下超越第一梯隊模型廠商是有難度的,同樣路徑下很難實現彎道超車可能,今天更期待有人能探索出下一代的智能架構和范式。
Insight 02:DeepSeek 開啟新范式了嗎?
就像前面說的,嚴格意義上說,DeepSeek 沒有發明新范式。但DeepSeek的重要意義在于幫助RL和test time compute這個新范式真正出圈。如果說OpenAI最初發布的o1是給行業出了一個謎語,DeepSeek就是第一個公開解謎的人。
DeepSeek發布R1和R1-zero之前,行業只有少部分人在實踐RL和reasoning model,但DeepSeek給大家指明了路線圖,讓行業相信這樣做真的能提升智能,這對提升信心,吸引更多人轉向新范式的研究有巨大的幫助。
有人才進入,才有算法創新,有開源緊追才有更多計算資源投入。在DeepSeek之后,原本計劃不再發新模型的OpenAI接連發出o3mini,并計劃繼續發布o3,還考慮開源模型。Anthropic和Google也會加快RL的研究。行業對新范式的推進因為DeepSeek加快。
另外,reasoning model的提升會進一步幫助Agent落地,AI researcher現在都因此對agent的研究和探索更有信心,因此也可以說DeepSeek開源reasoning model推進了行業向Agent的進一步探索。所以 DeepSeek雖然沒有發明新范式,但推進整個行業進入了新范式。
Insight 03:Anthropic的技術路線和R1有什么不同?
從Dario(Anthropic創始人)的訪談可以看出,Anthropic對R-1/reasoning model的理解,與O系列有些分歧,Dario覺得基礎模型與推理模型應該是個連續光譜,而非OpenAI這種獨立的模型系列。如果只做 O系列會很快遇到天花板。
我一直想為什么Sonnet 3.5的coding、reasoning 和 agentic能力一下子提升這么強,但4o一直沒追上?他們在基礎模型預訓練階段就做了大量RL工作,核心還是把基礎模型的能力提上去,不然只靠RL提升推理模型可能很容易把收益吃光。
Insight 04:DeepSeek的轟動有必然,也有偶然
兩位OpenAI的早期研究員寫的《為什么偉大不能被計劃》一書用來形容DeepSeek也很合適。
技術角度上,DeepSeek有下面幾個亮點:
? 開源:這點很重要,OpenAI從GPT-3開始轉為閉源公司后,第一梯隊三巨頭就不再公開技術細節,拱手讓出了一個空白的開源生態位,但Meta和Mistral并沒有接穩這個位置,DeepSeek這次堪稱奇襲,在開源這塊大賽道一馬平川。
如果把轟動性打100分,智能提升貢獻30分,開源貢獻70分,之前LLaMA也開源但沒有這么轟動的效果,說明LLaMa智能水平不夠。
? 便宜:“Your margin is my opportunity” (你的利潤就是我的機會)這句話的含金量還在上升。
? 聯網+公開CoT(思維鏈):對于用戶,這兩個點分別都能帶來很好的用戶體驗,DeepSeek把兩張牌同時出了,可以說是王炸,給到C端用戶的體驗和其他Chatbot完全不一樣。尤其是CoT透明,把模型思考過程公開了,透明能讓用戶對AI更信任,促進了破圈。不過,按理說Perplexity也是沖擊很大的,但DeepSee 服務端不穩定,Perplexity團隊快速反應上線了R-1反而承接了很大DeepSeek R-1溢出的用戶。
? RL泛化:雖然RL是OpenAI o1最先提出來的,但因為各種運營一直半遮半掩,滲透率并不高,DeepSeek R-1很大意義推動了reasoning model范式的進程,生態接受度大幅提升。
DeepSeek在技術上的探索投入是被這個智能成果值得更多人關注、討論的確定性因素,但DeepSeek R1 推出的時間點又讓這場轟動帶有偶發性:
? 過去美國一直講自己在基礎技術研究上大幅領先,但DeepSeek原生于中國國內,這本身也是一個亮點,這個過程中,又有很多美國科技大佬開始去宣揚DeepSeek挑戰了美國科技霸主的地位的論調,DeepSeek屬于被動卷進輿論戰;
? DeepSeek R1發布之前,美國5000億美元的“星際之門”事件剛剛開始發酵,這種巨量投入和DeepSeek團隊智能產出效率對比太鮮明了,很難不引發關注、討論;
? DeepSeek讓英偉達股價大跌又進一步讓輿論發酵,他們肯定也想不到自己成為了2025開年美股第一只黑天鵝;
? 春節是產品的練兵場,移動互聯網時代很多超級App都是在春節大爆發的,AI時代也不例外。DeepSeek R1恰好在春節前發布,大眾驚喜的是它的文字創作能力,而不是訓練時候強調的編程和數學能力,文創更容易被大眾用戶有體感,也更容易迅速傳播。
Insight 05:誰受傷?誰受益?
可以把這個賽場上的玩家分成三類:ToC(消費者)、To Developer(開發者)以及 To 企事業單位:
1. ToC:Chatbot 肯定受沖擊最大,心智和品牌關注度被DeepSeek搶走了,ChatGPT也不例外;
2. 在開發者環節的影響很有限,我們看到有用戶用完之后說評論r1不好用不如sonnet,Cursor官方也說 Sonnet還是表現更好,用戶高比例都選擇Sonnet,并沒有大幅遷移;
3. 第三個維度,To Enterprise和To Government的生意在于信任和需求理解,大型組織做決策的利益考慮很復雜,不會像C端用戶那么容易遷移。
再換個角度,從閉源、開源和算力的視角想這個問題:短期大家會覺得閉源的OpenAI/Anthropic/Google 更受沖擊:
? 技術神秘感被開源了,AI營銷里面最重要的神秘感的溢價被打破;
? 更現實的因素,市場認為這幾家閉源公司的潛在客戶和市場規模被搶走了一些,GPU投入的回本周期變長;
? 作為領頭羊的OpenAI在其中屬于最“吃虧”的那個,之前想捂著技術不開源,半遮半掩,希望多賺技術溢價的美夢無法實現了。
但中長期看,GPU資源充裕的公司還是受益的,一方面是第二梯隊的Meta可以快速跟進新方法,Capex更加高效,Meta可能是很大受益者,另一方面是智能提升還需要更多探索,DeepSeek開源把大家水平拉齊,進入全新探索又需要10倍甚至更大量級的GPU投入。
從第一性原理來想,對于AI智能產業來說,無論是發展智能還是應用智能,從物理本質上就必然要消耗海量算力,這是基礎定律決定的,不是技術優化能完全規避的。
所以,無論是探索智能,還是應用智能,即便短期有質疑,中長期的算力需求也會爆炸,這也解釋了為什么馬斯克從第一性原理出發,xAI堅持擴建集群,xAI和“星際之門”背后的深層邏輯也許是一樣的。Amazon 等云廠商都宣布了要增加資本支出。
我們就假設全球的AI research人才水平和認知都拉齊,有更多GPU就可以做更多實驗探索?最后可能還是回到算力的競爭。
DeepSeek光腳不怕穿鞋,沒有商業化訴求,專注AGI智能技術探索,開源這個動作對推動AGI進程推動意義很大,加劇了競爭,推動了開放性,頗有鯰魚效應。
Insight 06:蒸餾能超越SOTA嗎?
有個細節點不確定,如果DeepSeek從預訓練階段就大量使用蒸餾的CoT數據,那做到今天效果不算驚艷,還是在第一梯隊巨頭的肩膀上獲得的基礎智能,然后再開源出來;但如果預訓練階段沒有大量用蒸餾數據,DeepSeek從0做預訓練做到今天的效果,那就堪稱驚艷了。
另外,蒸餾能否在基礎模型超越SOTA(效果最好的模型),應該是不太可能的。但DeepSeek R-1非常強,猜測是獎勵模型做的非常好,如果R-1 Zero這條路徑靠譜,是有機會超越SOTA。
Insight 07:No Moat !
Google之前對OpenAI的一個評價:No Moat!(沒有護城河)這句話放在這里也很應景。
DeepSeek這一波Chatbot用戶又出現了大量遷移現象,給了市場一個很重要的啟發:智能技術進步非常陡峭,階段性產品很難形成絕對壁壘。不管是 ChatGPT/Sonnet/Perplexity 剛形成了心智和口碑,還是 Cursor、Windsurf 這類開發者工具,一旦有了更智能的產品,用戶對“上一代”智能的產品毫無忠誠度,今天不管是模型層還是應用層都很難構建護城河。
DeepSeek這次也驗證了一件事:模型即應用,DeepSeek在產品形式上沒任何創新,核心就是智能+開源,我也不禁思考:在AI時代,任何產品和商業模式的創新都比不上智能的創新嗎?
Insight 08:DeepSeek 應該承接這波 Chatbot 流量并做大嗎?
從Chatbot 爆火到今天,通過DeepSeek團隊的反應可以明顯感覺出來,DeepSeek還沒想好怎么用這波流量。而要不要接住、并積極運營這批流量這個問題的本質是,偉大的商業公司和偉大的研究機構能共存在一個組織嗎?
這件事非常考驗精力和資源分配、組織能力和戰略選擇,如果是字節、Meta這類大公司,他們的第一反應應該都要接下來,也有一定組織基礎可以接下來,但DeepSeek作為一個研究團隊組織,承接這波巨量流量的壓力必然很大。
但同時也要想這一波Chatbot會是階段性流量嗎?Chatbot是不是在未來智能探索的主線下?似乎感覺每個智能階段都有對應的產品形態,而 Chatbot只是解鎖的其中一個早期形態。
對于DeepSeek來說,從未來3-5年視角看,如果今天不去承接Chatbot流量,會不會是一種錯過?萬一哪天跑出規模效應?如果AGI最終實現了,又會是什么載體來承接?
Insight 09:下一個智能突破的Aha moment從哪來?
一方面,第一梯隊的下一代模型很關鍵,但今天我們又處在Transformer的極限邊界上,第一梯隊能否拿出代際提升的模型也不確定。OpenAI、Anthropic和Google作為回應發出來好30%-50%的模型可能都不夠挽回局勢,因為他們資源多了10-30倍。
另一方面, Agent落地比較關鍵,因為Agent需要做長距離多步驟推理,如果模型好5%-10%,領先的效果就會被放大很多倍,所以OpenAI、Anthropic和Google一方面要做Agent產品落地,全棧集成模型+Agent產品,就像 Windows+Office,二是也要秀出來更強大的模型,比如O3完整版、Sonnet 4/3.5 opus為代表的下一代模型。
在技術不確定性下,最寶貴的是天才AI研究員,任何想要探索AGI的組織都要投入資源到更激進的范式,尤其是在今天預訓練階段已經被拉齊的背景下,要有好的人才+充裕資源,探索下一個智能涌現的Aha moment。
Insight 10:DeepSeek 這一波讓我對中國AI人才更有信心,非常鼓舞
最后,希望技術無國界。
(本文首發于微信公眾號海外獨角獸,海外獨角獸為拾象旗下開源研究平臺)





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2025 上海东方报业有限公司