- +1
智庫動態|中美人工智能產業差距2015年后顯著加大
人工智能在大國角力中占據越來越重要的位置,甚至人工智能的強弱,意味著尖端軍事技術的強弱,因此中美人工智能實際水平格外引人注目。2019年3月20日,長江商學院在北京發布了《中國人工智能指數報告》,其中一些關鍵數據令人深思,譬如論文的引用量,以及人工智能創新公司的活躍度,中國都呈現出令人擔憂的趨勢。
《中國人工智能指數報告》由長江商學院人工智能與制度研究中心主任許成鋼和武漢大學大數據與云計算實驗室主任崔曉暉團隊共同研究制作。該報告從學術、產業、開源軟件包使用等方面進行中美對比,以此度量中國的人工智能在最近十幾年里的發展及影響。
論文質量的差距巨大
從1995年至今,在Scopus數據庫中(本文論文相關數據皆源于此數據庫),可以被檢索到的標注關鍵字為 Artificial Intelligence的全部中、美人工智能論文數量。
近些年在描述中國人工智能進步巨大的一個證據是,中國人工智能論文的發表量,在快速接近美國。這一趨勢在2016之后尤其明顯。但在最具原創性最具影響力的極高引用率和高引用率的論文方面,中國與美國的差距相當顯著。最刺眼的是,中國人工智能論文數量大幅增加的同時,零引用的論文也在大幅領先于美國。而論文的千次、百次級別的引用,中國又大幅落后于美國。
圖1 中美人工智能期刊論文年度發表量對比
圖2 中美千級期刊論文引用總數量對比分析
圖3 中美人工智能期刊論文被引用總數
中美學者每年在期刊發表的所有人工智能論文的被引用總數。由圖可見,美國學者發表的期刊論文被引用數始終明顯高于中國學者發表的論文。但是在2010年之后,中美之間的差距迅速下降,呈收斂趨勢。
圖4 中美百千級期刊論文引用總數量對比分析
中美兩國學者發表的千級以及百千級期刊論文的總量以及被引用數。由于最具有影響力的論文被大量引用需要時間,我們只報告在2013年前發表的期刊論文中被引用次數達到或超過1000次和500-999次的論文的數量以及被引用總頻次。美國在千級期刊論文發表數量及總引用量方面均遠高于中國。中國學者在2004年,2005年和2007年各出現了一篇千級期刊論文,而同一時期美國學者發表了12篇千級引用量的期刊論文。在百千級期刊論文發表方面,美國仍然優勢明顯,但是兩者之間的差距自2008年開始收窄,并于2010年基本趨于一致。總體上,中國學者在2004年,2005年以及2013年各發表了兩篇百千級期刊論文;并于1997年,2006年,2008年以及2010年各發表了一篇百千級期刊論文。
圖5 中美百級期刊論文引用總數量對比分析
百級引用量期刊論文和十級應用兩期刊論文的發表數量以及被引用頻次上,中國和美國在2010年前始終保持很大差距,但是在2010年之后兩國差距逐步縮小。另外值得注意的是,在個級引用量以及無引用量的期刊論文方面,兩國差距不是很顯著,尤其是從發表數量上看,自2011年起中國開始小幅領先美國。
圖6 中美零級期刊論文發表總數量對比分析
在零級會議論文(從未被引用的論文)方面,從2007年之后,中國作者的會議論文總數大幅度超過了美國。我們統計的所有會議論文都是在同行評議的專業期刊發表的會議論文,即會議論文的學術標準有同行評審制度的保證。我們推斷,零級會議論文的主體是應用性的。可能因應用范圍狹窄,這些論文沒有被引用。相比之下,最高影響力的會議論文都在普遍方法論方面具有開創性。由此,我們概括,在影響最大的基礎方法論方面,美國持續領先中國。在中間水平的研究方面,中國與美國的差距在縮小。而在具體應用的方面,中國發表的會議論文數量則超過了美國。
產業差距拉大
中國活躍的人工智能初創公司數字在2012年之前多于美國,但是在2012年以后被美國超越。如圖所示,中國的人工智能創業公司在2012年之前多于美國,但是在2012年以后美國不僅超過中國,且大幅度加速增長。中國人工智能創業公司在2015年以后呈大幅下降趨勢;相反,美國方面在2012年之后在人工智能領域活躍的創業公司數量呈現快速上升的趨勢。尤其是在2016年之后,中美兩國在產業領域的差距進一步加大。2016年之后,美國的人工智能初創公司數量快速上升,在2018年超過600家。在產業領域,中國活躍的人工智能初創公司于2016年超過400家,達到頂峰,然后開始下降,在2018年降至不到200家。(以上趨勢由本報告補充騰訊2017年發表的《中美兩國人工智能產業發展全面解讀》而得出。圖7顯示風險投資支持的、中美在人工智能領域活躍的創業公司總數的統計。數據來源為投資界網站)
人工智能產業需要長期研發投入,短期很難獲得收益。中美兩國活躍的創業公司的數量的對比,似乎表明中國在人工智能領域產業的投入后勁不足。這點在騰訊報告中也有提及。我們在這個方面的報告,只是對騰訊報告的補充。
圖7 中美人工智能領域創業公司數量對比
Figure 52. Number of startup companies in AI: China vs. US
開源人工智能軟件包是人工智能研究,尤其是人工智能應用研究方面的重要基礎。國際上多數開源AI軟件包都由開發者存放在GitHub軟件庫中,供從事AI應用方面的研究者使用。本節對比中美人工智能研究者在GitHub軟件庫中,關注(stare)不同AI軟件包的數字,以此作為使用開源AI軟件包使用的指數。
2017年以前美國開發者關注人工智能軟件包數量要高于中國,2017年以后中國開始超過美國。
圖8 中美AI研究者的AI軟件包關注總數對比
Number of AI software packages starred by Chinese and US researchers
對比中美應用AI研究者使用開源AI軟件包的總體情況。我們對比他們對所有開源AI軟件包的關注總數。中國應用AI研究者關注開源AI軟件包的數字,在2015年之后經歷了快速增長,到2017年中以后,超過了美國。這可能意味著中國研究者在利用中美開發的開源軟件包做AI應用研究規模超過了美國。
圖9 中美AI研究者關注中美開發的開源AI軟件包的對比
Developers of AI software packages starred by Chinese and US researchers
上圖將中美兩國AI研究者關注的開源AI軟件包的開發機構按照國別對比。如圖所示,絕大多數中國AI研究者使用的開源AI軟件包,都是美國機構開發的,其中使用最多的是Google開發的Tensorflow。整體上,中、美AI研究者關注的美國機構開發的開源AI軟件包的數字,相當于他們關注的中國機構開放的軟件包的數字的二十幾倍。這表明中國研究者在基本算法方面,對美國開源軟件包的依賴。
另外,通過人才行業分布對比可知,中國在智能交通、自動駕駛,智能、精準營銷,硬件、GPU、智能芯片需求比例要多于美國,而中美兩國在算法、機器學習的需求量上要遠高于其他領域。
許成鋼進一步指出,在人工智能的基本算法、芯片、傳感器等方面,中國落后于世界上多數發達國家,除美國外,英國、德國、日本、以色列等國家都領先于中國。美國的AI產業布局非常完善,基礎層、技術層和應用層都有涉及,尤其是在算法、芯片和數據等核心領域,具有強大優勢,各層級企業數量全面領先中國。中國AI產業在基礎元器件、基礎工藝等方面差距尤其大。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司