百家乐官网 (中国)有限公司官网

澎湃Logo
下載客戶端

登錄

  • +1

MIT最新研究:多個AI協作有助提高大模型推理能力和準確性

澎湃新聞記者 邵文
2023-09-20 07:19
來源:澎湃新聞
? 未來2% >
字號

·麻省理工學院計算機科學與人工智能實驗室(CSAIL)研究團隊發現,多個語言模型協同工作勝過單一模型,多個AI協作有助于提高大型語言模型的推理能力和事實準確性。

·每個語言模型都生成對給定問題的回答,然后整合來自其他代理的反饋,以更新自己的回應。最終,多個模型的解決方案通過投票達成一致的最終輸出。這一過程有點像小組討論。

一種新穎的方法允許多種語言模型進行協作,經過多輪辯論,最終得出統一且精確的響應。
圖片來源:Alex Shipps/MIT CSAIL,來自Midjourney

當地時間9月18日,麻省理工學院計算機科學與人工智能實驗室(CSAIL)的團隊在其官網更新了一項研究:發現多個語言模型協同工作勝過單一模型,多個AI協作有助于提高大型語言模型的推理能力和事實準確性。

俗話說“三個臭皮匠,頂個諸葛亮”。簡單而言,這項研究利用多個AI系統互相協作,以協商、辯論的方式以達成對給定問題的最佳答案。這種方法提高了大語言模型對事實數據的依從性和改進決策的能力。

大型語言模型(LLM)長期存在的問題之一是,其生成的回答不一致,可能有不準確和錯誤的推理。而新方法允許每個智能體(agent)積極評估其他智能體的回答,并利用這些集體反饋來完善自己的回答。

這一過程包括多輪的回應生成和批判,每個語言模型都生成對給定問題的回答,然后整合來自其他代理的反饋,以更新自己的回應。最終,多個模型的解決方案通過投票達成一致的最終輸出。這一過程有點像小組討論,個體一起努力達成一致和合理的結論。

這一技術的一個顯著優點在于,它可以無縫應用于現有的“黑匣子”模型(指難以知曉其內部運行過程),因為這個方法基于生成出的文本,而無需明晰其內部工作原理。CSAIL團隊表示,這種簡化可以幫助研究人員和開發者改進各種語言模型輸出的一致性和事實準確性。

“我們不僅僅依賴于單一的AI模型來提供答案,相反,我們讓眾多的AI模型參與,每個模型都帶來獨特的見解以解決問題。盡管它們的初始回應可能顯得簡單或包含錯誤,但這些模型可以通過審查其同行提供的回應來改進和提高自己的回答。”麻省理工學院電氣工程和計算機科學博士生、CSAIL附屬成員以及論文的首席作者之一Yilun Du說道。

根據Yilun Du的個人主頁,他目前正在攻讀博士,此前已獲得麻省理工學院學士學位,曾在ChatGPT的開發機構OpenAI擔任研究員,在Facebook人工智能研究所(FAIR)和Google Deepmind擔任實習生和訪問研究員,并在國際生物奧林匹克競賽中獲得金牌。有趣的是,他曾在TED發表題為《為什么機器人需要夢想》的演講。

“當這些AI模型參與對話和思考時,它們更能夠識別和糾正問題,增強解決問題的能力,并更好地驗證其回應的準確性?;旧?,我們正在創造一種迫使它們深入問題核心的環境。這與單一的孤立的AI模型形成對比,后者經常復制互聯網上找到的內容。然而,我們的方法積極刺激了AI模型制定更準確和全面解決方案的能力?!盰ilun Du說。

此項研究涉及數學問題的解決,包括小學和初高中的數學問題,并通過多智能體辯論顯著提高了性能。該方法還可以幫助解決經常困擾大語言模型的“幻覺”問題。通過設計這樣的環境,智能體之間可以批判對方的回應,更有動力避免隨機生成信息并優先考慮事實準確性。

除了應用于語言模型,該方法還可以用于整合具有專門能力的不同模型。通過建立一個多智能體相互交互和辯論的去中心化系統,它們可以潛在地在語音、視頻或文本等各種模式下提高問題解決能力。不過研究人員表示,當處理非常長的上下文時,現有的語言模型可能面臨挑戰,批判能力可能表現得不如預期。

此外,多智能體辯論形式尚未包括有助于智能集體決策的更復雜形式的討論。據研究團隊透露,這正將是未來探索的關鍵領域。推進這項技術可能需要更深入地了解人類辯論和討論背后的計算基礎,并使用這些模型來增強或補充現有的大語言模型。

Yilun Du認為,隨著研究人員繼續完善和探索這種方法,人們可以更接近一個未來,在這個未來,語言模型不僅模仿人類語言,還表現出更系統化和可靠的思維,開創語言理解和應用的新時代。

“利用審議過程來改善模型的整體輸出非常有道理,這是從思維鏈的提示中邁出的一大步?!奔永D醽喆髮W伯克利分校電氣工程與計算機科學系副教授、未參與該項工作的安卡·德拉甘說,“我對接下來的發展感到興奮。當人們看到辯論時,他們是否能更好地判斷大語言模型的答案?人們是否通過自己與大語言模型辯論來得出更好的答案?是否可以使用類似的思想來幫助用戶審查大語言模型給出的答案,以得出更好的答案?”

    責任編輯:鄭潔
    校對:劉威
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            葡京百家乐注码| 百家乐游戏网址| 凤凰娱乐开户| 百家乐网站东方果博| 百家乐平玩法官方网址| 首席百家乐官网的玩法技巧和规则| 驻马店市| 大发888游戏是真的么| 百家乐电话投注多少| 宝马会百家乐官网娱乐城| 盈丰| 涂山百家乐的玩法技巧和规则| 百家乐官网五铺的缆是什么意思| 百家乐官网赢钱公式冯耕| 大发888游戏平台dafa888 gw| 百家乐网页游戏网址| 网络百家乐官网大转轮| 大发888 备用6222.com| 百家乐是怎样算牌| 百家乐扑克桌布| 優博百家乐官网客服| 威尼斯人娱乐城佣金| 伯爵百家乐娱乐网| 太阳城百家乐如何看路| 属马做生意坐向| 新锦江百家乐官网娱乐场| 百家乐官网游戏机博彩正网 | 太阳城百家乐怎样开户| KK百家乐官网娱乐城 | 博盈百家乐官网游戏| 网络百家乐| 日博| 永利博百家乐官网的玩法技巧和规则 | 大发888有赢钱的吗| 新澳博百家乐娱乐城| 大发888娱乐城都有啥扑克牌游戏| 百家乐高手技巧| 现金百家乐| 大都会百家乐官网的玩法技巧和规则| 百家乐官网赌场方法| 澳门百家乐官网玩法与游戏规则|