- +1
月之暗面楊植麟:提升深度推理能力是AI產(chǎn)品的下一個(gè)重點(diǎn)
“如果說(shuō)長(zhǎng)文本是月之暗面登月的第一步,那么提升模型深度推理能力則是第二步。”11月16日,正值月之暗面Kimi Chat向全社會(huì)開(kāi)放服務(wù)一周年之際,月之暗面創(chuàng)始人楊植麟接受了包括澎湃科技在內(nèi)的媒體采訪。他認(rèn)為AI產(chǎn)品包括AI技術(shù)接下來(lái)發(fā)展的重要能力應(yīng)是更加深度的推理能力,能夠把現(xiàn)在只是短鏈路的簡(jiǎn)單問(wèn)答,變成更長(zhǎng)鏈路的組合式的任務(wù)操作。
據(jù)介紹,月之暗面在未來(lái)一兩周內(nèi)將上線新一代數(shù)學(xué)推理模型k0-math,對(duì)標(biāo)OpenAI o1系列可公開(kāi)使用的兩個(gè)模型:o1-mini和o1-preview。目前,在中考、高考、考研以及包含入門競(jìng)賽題的MATH等4個(gè)數(shù)學(xué)基準(zhǔn)測(cè)試中,k0-math初代模型成績(jī)超過(guò)了OpenAI o1系列的o1-mini和o1-preview模型。在兩個(gè)難度更大的競(jìng)賽級(jí)別的數(shù)學(xué)題庫(kù)OMNI-MATH和AIME基準(zhǔn)測(cè)試中,k0-math初代模型的表現(xiàn)分別達(dá)到了o1-mini最高成績(jī)的90%和83%。
楊植麟表示,數(shù)學(xué)產(chǎn)品是最適合讓AI鍛煉思考能力的場(chǎng)景,數(shù)學(xué)模型在教育產(chǎn)品上也有非常大的價(jià)值。
自從兩年前ChatGPT發(fā)布后,通過(guò)增加更多數(shù)據(jù)和計(jì)算能力來(lái)“擴(kuò)大”當(dāng)前模型,便能持續(xù)改進(jìn)模型的能力,即所謂的Scaling law(尺度定律)幾乎成為業(yè)內(nèi)共識(shí)。但日前OpenAI原首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)公開(kāi)表示,擴(kuò)大預(yù)訓(xùn)練的結(jié)果已經(jīng)達(dá)到了平臺(tái)期,“2010年代是規(guī)模擴(kuò)大的時(shí)代,現(xiàn)在人們又回到了奇跡和發(fā)現(xiàn)的時(shí)代。每個(gè)人都在尋找下一個(gè)東西。”
在楊植麟看來(lái),AI的發(fā)展就像在蕩秋千,在兩種狀態(tài)之間來(lái)回切換,“一種是算法、數(shù)據(jù)準(zhǔn)備好了,但算力不夠。”他認(rèn)為,從Transformer架構(gòu)誕生到GPT4的出現(xiàn),更多的矛盾在于如何擴(kuò)大規(guī)模(Scale),在算法和數(shù)據(jù)上不存在本質(zhì)問(wèn)題。但是到了今天,規(guī)模已經(jīng)到達(dá)了一定的程度,會(huì)發(fā)現(xiàn)再加更多的算力,也不一定能解決問(wèn)題,其中核心問(wèn)題是沒(méi)有高質(zhì)量的數(shù)據(jù)。這時(shí)要做的事便是改變算法,突破瓶頸。現(xiàn)在這是他所在的公司乃至整個(gè)行業(yè)都面臨的共同問(wèn)題。“好的算法能夠釋放Scaling的潛力,讓模型持續(xù)變得更好。”他認(rèn)為,強(qiáng)化學(xué)習(xí)是接下來(lái)很重要的一個(gè)趨勢(shì)。
但楊植麟也認(rèn)為當(dāng)下預(yù)訓(xùn)練還有空間,“半代到一代的模型,這個(gè)空間明年會(huì)釋放出來(lái),明年我覺(jué)得領(lǐng)先的模型會(huì)把預(yù)訓(xùn)練做到極致,但接下來(lái)最重點(diǎn)的東西會(huì)在強(qiáng)化學(xué)習(xí)上,但它還是Scale,只是用不同的方式去Scale。”
針對(duì)近期國(guó)內(nèi)開(kāi)始出現(xiàn)了一些AI創(chuàng)業(yè)公司被收購(gòu)、人才回流大廠的現(xiàn)象,楊植麟表示,這是一個(gè)必然的規(guī)律,說(shuō)明行業(yè)發(fā)展到了新的階段,“一開(kāi)始很多公司在做,現(xiàn)在只有少數(shù)公司在做,接下來(lái)可能大家做的東西也會(huì)逐漸不一樣,我覺(jué)得這是一個(gè)可能必然的規(guī)律。”
楊植麟還透露,從今年上半年開(kāi)始,月之暗面開(kāi)始縮減業(yè)務(wù),聚焦Kimi,“我們一開(kāi)始確實(shí)也嘗試過(guò)幾個(gè)產(chǎn)品一起做,但到后來(lái)發(fā)現(xiàn)還是要聚焦,把一個(gè)產(chǎn)品做到極致是最重要的,砍業(yè)務(wù)本質(zhì)上也是為了控制人數(shù),不希望人數(shù)增長(zhǎng)太快,我們始終保持卡和人的比例是最高的,團(tuán)隊(duì)擴(kuò)大對(duì)于創(chuàng)新也有致命的傷害。”當(dāng)下,月之暗面最核心的任務(wù)就是提升用戶留存率。
月之暗面成立于2023年4月,法定代表人楊植麟畢業(yè)于清華大學(xué)。據(jù)了解,該公司打造的對(duì)話式AI助手產(chǎn)品Kimi上線一年以來(lái),每月用戶量達(dá)到了3600萬(wàn)人。
- 澎湃新聞微博
- 澎湃新聞公眾號(hào)
- 澎湃新聞抖音號(hào)
- IP SHANGHAI
- SIXTH TONE
- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2024 上海東方報(bào)業(yè)有限公司