- +1
Kimi探索版首發體驗:秒搜310個網頁,槍口瞄準了百度?
作為國內最知名的 AI 智能助手之一,Kimi 早就成了包括小雷在內很多人的「心頭好」。但在此之上,月之暗面今天(10 月 11 日)又推出了 Kimi 探索版,按照官方的介紹:
Kimi 探索版可以自主海量搜索解決復雜問題。
事實上,之前就有爆料指出 Kimi 團隊在國慶期間瘋狂趕進度,就是為了即將上線一個「很牛的功能」。根據透露,這個功能可以回答簡單搜索無法解決的問題,甚至可以自我反思。
現在來看,那個「很牛的功能」就是剛剛發布的 Kimi 探索版。不僅如此,現在我們還知道,Kimi 探索版可以「模擬人類的推理思考過程,多級分解復雜問題,執行深度搜索,并即時反思改進結果,」在一定程度上具備了 AI 自主搜索能力。
圖/ Kimi
經常關注大模型的朋友,可能很快就會想到 OpenAI 在上月發布的 o1 模型,都是模擬和學習人類的推理思考過程,并且拆解復雜問題、反思和改進結果。但實際上,Kimi 探索版的體驗又如何?
Kimi 探索版突破:會拆解任務了
正所謂「不看廣告看療效」,盡管官方表示 Kimi 探索版能夠提供更全面和準確的答案,幫助用戶更高效地完成分析調研等復雜任務,但 Kimi 探索版到底好不好用,還是只有用了才知道。
按照官方提供的信息,Kimi 探索版已逐步分批上線 Web 端,內測過程中用戶每天能用 5 次,移動端 APP 則將在后續上線該功能。不過有幸,小雷的 Kimi 已經推送到了這個最新功能,可以在首頁輸入框下方直接開打。
圖/雷科技
打開「探索版」后,就會彈出提醒告訴我,「Kimi 會拆解復雜問題,做更深入的搜索。」比如 CS 本科學生可能非常關心的專碩申請情況,可以讓 Kimi 探索版「分析一下 2024 年 QS 排名前 10 的高校計算機專業碩士申請情況」。
先不論生成的回答,首先我們能看到一個非常明顯的變化,Kimi 探索版把任務大體拆解成了兩步:一是搜索 2024 年 QS 排名前 10 的高校;二是分別搜索了解各家高校計算機專業的碩士申請情況。
圖/雷科技
Kimi 探索版就像一個有條理的分析師一樣,基于大模型的能力識別用戶的真實提問意圖,并把復雜的問題分解為多個層次化的子問題和多個匹配的搜索關鍵詞,然后分步驟執行。
不只是簡單的「給你結果」,而是幫你「分析問題、找出答案」。
如果是常規的 AI 智能助手或 AI 搜索,面對類似的復雜問題,通常也只是將問題提煉成一組關鍵詞進行搜索。如果能夠搜索到現成的文章和數據,或許可以給出有價值的回答;但如果沒有,AI 給出的答案可能表面上看著豐富,但實際信息密度很低,準確性也很難保證。
所以很多時候,很多問題,我們還是只能回到傳統的搜索引擎,一步一步找。
與之相對的是,Kimi 探索版的多級分解與策略規劃功能,通過模擬人類的思考過程,一定程度正在改變這種局面。在給出的回答中,不僅準確給出了 QS 前 10 的高校名單,還有比較明確的申請要求。
圖/雷科技
10 個網頁不夠用,那就搜索500 個
眾所周知,數據對于 AI 輸出結果有著很強的影響,這既體現在模型訓練的過程中,但同時也體現在模型推理的過程中。
事實上,包括 Kimi 在內,不管是支持聯網搜索的 AI 智能助手,還是獨立的 AI 搜索引擎,RAG(檢索增強生成)技術都是事實上的標配。通過 RAG,大模型能夠利用強大的搜索算法查詢網頁等外部數據,同時通過整合數據增強了大模型的上下文,可以生成更精確、更翔實且更具吸引力的回答。
然而,RAG 能夠讓 AI 獲取更多數據來提升回答質量,卻不能解決數據獲取數量和質量的問題。
而 Kimi 探索版最讓人驚艷的一個升級,恰恰就是面對大規模數據的檢索能力。按照官方提供的數據,在標準版的基礎上,Kimi 探索版的「大腦容量」劇增,支持 10 倍的搜索量,「一次搜索即可精讀超過 500 個頁面。」
小雷體驗過程中也看到了這項升級帶來的巨大潛力。
在提出問題后,Kimi 探索版會把問題拆解為不同的子任務后,每執行一個子任務,都會單獨搜索和閱讀相關資料。比如「專碩申請」拆解成 11 個任務單獨搜索,同時閱讀了 48 個網頁。
但當我請 Kimi 探索版「總結全球主要科研機構對量子計算的最新進展,包括英文、中文、法語和德語的權威論文和研究,并分析其中的趨勢」,Kimi 探索版最終拆分成了 25 個任務進行執行,并閱讀了 310 個網頁。
圖/雷科技
相比之下,其他 AI 智能助手或者 AI 搜索,往往依賴單一關鍵字的簡單查詢,一次搜索僅處理幾個頁面的信息,給出的結果不夠全面,很多時候需要用戶自己再去做篩選和判斷,更不用說要面對巨大工作量的任務。
又比如官方測試過的實例,讓 Kimi 探索版在 2024 年《財富》中國科技 50 強公司找出總部位于北京的公司,也遍覽了 276 個網頁。
圖/ Kimi
這些問題的解答,都需要建立在龐大數據檢索量的前提上。不同的是,過去我們依賴已有答案或者手動一個個搜索,但現在 Kimi 探索版就可以實現自主地海量搜索。
至于 Kimi 探索版的自我反思,可能是更多面向開放式的問題,實際有限的測試中很少出現,還沒有太深的體會。不過也看出,Kimi 探索版可能會在回答問題,重新閱讀回答進行補充。
Kimi 探索版只是探索,但方向是真對了
小到查找優質高校專業的申請信息,大到了解全球量子計算的科研前沿,當小雷從 Kimi 探索版得到回答的那一刻,多少還是有些難以置信。并不是這些問題因為對人類來說太難,而是在可靠回答之上,超越想象的速度,或者說效率。
很多人都知道,作為全球最大的搜索引擎公司,谷歌的使命是「整合全球信息,供大眾使用,讓人人受益」。但傳統搜索引擎可以整合,卻無法化繁為簡,讓我在海量的信息快速、便捷地找到想要的信息。
與此同時,Kimi 探索版通過理解問題、分拆任務執行,大幅提高檢索能力以及自我反思,在一定程度上解決了生成式 AI 的部分難題。具體到回答結果上,Kimi 探索版也確實帶來了不小的驚喜。
圖/雷科技
當然也存在一些問題,比如大模型的「幻覺」,回答中字節跳動的研發支出實際是引用 2022 年的數據。
又比如在理解用戶意圖上,AI 還是很長的路要走。當我詢問 Kimi 探索版 2024 年 QS 排名前 100 中國高校計算機專業的專碩申請情況,但實際卻給出了 QS 排名 100 開外甚至不在排名內的高校情況。
此外,目前內測的 Kimi 探索版,在推理能力可能還是要弱于 o1-preview,至少面對一個模糊提問的時候,Kimi 探索版并沒有給出有用的信息,o1-preview 卻能根據信息推理出是 Ben Thompson 提出的「聚合理論」(Aggregation Theory)。
圖/雷科技
當然,我們可能還是需要更長時間、更多提問才能發現 Kimi 探索版的真正能力。但不論如何,我都相信 OpenAI o1 和 Kimi 探索版找到了一條通往 AGI(通用人工智能)的正確方向。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2024 上海東方報業有限公司