- +1
人工智能已經(jīng)能制作游戲,游戲AI,也在走出游戲
對于游戲AI,有兩極化的認(rèn)知。
一種是智能,即在某款游戲中擊敗人類頂級選手近乎輕而易舉。
另一種則是智障,即在游戲中扮演NPC進(jìn)行互動時(shí),往往變成尬聊。
關(guān)于游戲AI的最終幻想應(yīng)該是啥樣,自然不僅僅是能否輕松擊敗人類,而是如2021年那部電影《失控玩家》里所演繹的那樣,游戲里的NPC出現(xiàn)了智慧,以至于萌生出了游戲版的“莊周夢蝶”感覺。
事實(shí)上,互聯(lián)網(wǎng)大廠一直都在夢想這樣的顛覆,以至于用在了一年一度的愚人節(jié)玩笑(往往也是自己遠(yuǎn)景戰(zhàn)略的一個(gè)揶揄)。
例如2019年愚人節(jié),英偉達(dá)開玩笑的發(fā)布了一款名為GeForce RTX R.O.N.的AI智能游戲助手,號稱精通十八門語言,能夠生成全息圖像,生成游戲3D圖形,分析游戲數(shù)據(jù),制定戰(zhàn)術(shù),甚至可以幫你和玩家對罵……
而這真的只是個(gè)玩笑嗎?
一年后,英偉達(dá)給出了答案。
在經(jīng)典游戲《吃豆人》誕生40周年之際,英偉達(dá)宣布使用5萬局游戲訓(xùn)練出的人工智能模型重建了這個(gè)游戲——不用寫代碼、不用構(gòu)建游戲引擎渲染圖像,僅僅通過神經(jīng)網(wǎng)絡(luò)“看”原版《吃豆人》的運(yùn)行狀況,自行理解游戲規(guī)則,最終完成了游戲制作。
這個(gè)游戲真的好嗎?
也許是和英偉達(dá)本身是視覺處理領(lǐng)域的國際大佬這個(gè)定位相關(guān),其創(chuàng)建的人工智能的學(xué)習(xí)方式,也不同于遺忘的AI靠吞噬大數(shù)據(jù)進(jìn)行深度學(xué)習(xí),反而選擇了用“看”的方式,不斷的在各種《吃豆人》的游戲視頻里學(xué)習(xí)并推斷其游戲規(guī)則,最終達(dá)成“復(fù)刻”一個(gè)游戲的模仿效果。
話說這款游戲,“算”起來相當(dāng)智能,但“玩”起來就非常智障了,恰好一肩挑起了兩極化的認(rèn)知。
秘密同樣是英偉達(dá)自己揭開的:
由于短時(shí)間生成大量游戲視頻不大現(xiàn)實(shí),因此團(tuán)隊(duì)使用計(jì)算機(jī)來玩《吃豆人》生成畫面。
但是,用于模擬玩游戲的AI在游戲中太出色了,讓看視頻的AI被誤導(dǎo),難以理解游戲中“死亡”的概念,所以最初產(chǎn)生的《吃豆人》,游戲中幾乎都不會輸。
當(dāng)然,后續(xù)發(fā)現(xiàn)問題并改進(jìn)后,這款《吃豆人》的復(fù)刻,也就算是向AI的最原初誕生,完美致敬了。
學(xué)習(xí)、改進(jìn)、再學(xué)習(xí),成為了游戲AI和自己在其他領(lǐng)域里AI們共同完善自身智能的必由之路。
但游戲AI還可以做到更多,例如和《失控玩家》一樣從游戲走到現(xiàn)實(shí)中來。
真當(dāng)互聯(lián)網(wǎng)大廠和游戲公司們做能擊敗人類頂級玩家的AI,只是一種展示技術(shù)的無聊事嗎?
答案是否定的,不然真的是有錢沒地方燒。
馬化騰就在2021年世界人工智能大會中說,要用游戲AI去激發(fā)青年人對通用AI的研究興趣。
事實(shí)上,互聯(lián)網(wǎng)科技領(lǐng)域正是如此去做的,用游戲AI做一款屬于自己的游戲,實(shí)現(xiàn)自己少年時(shí)的游戲夢。
例如Facebook開發(fā)的可以和玩家團(tuán)隊(duì)協(xié)作玩紙牌游戲《Hanabi》的AI,其開發(fā)者就說:“我們對《Hanabi》感興趣的原因并非游戲,而是關(guān)于如何將這些功能構(gòu)建到AI系統(tǒng)中,例如自動駕駛汽車或AI客服,它們需要實(shí)際了解其他人通過行為與之交互時(shí)的心理狀態(tài)。”
至于索尼為《GT賽車》開發(fā)的AI駕駛者,則可以更進(jìn)一步:
不僅需要在高速多變的條件下,考慮剎車、路線、速度、方向等因素,瞬間決定方向盤的打法和加速方式等多個(gè)決定;同時(shí)也要學(xué)習(xí)駕駛的“禮儀”,在合乎公平競爭原則下減少非必要碰撞,以及作為慢車時(shí)進(jìn)行讓車。
這個(gè)背后,你能想象的空間就更為巨大了。
在實(shí)際的場景測試?yán)铮詣玉{駛公司很難創(chuàng)造或者遇到極限場景,比如暴雨+冰雹的復(fù)雜路況,或高速公路上闖入的動物及行人等突發(fā)事件,這往往會造成測試數(shù)據(jù)的局限。
然而在游戲世界,利用AI技術(shù)的測試數(shù)據(jù)獲取成本就相對較低,例如無限撞車、持續(xù)過彎,都可以通過AI在短時(shí)多次測試中得到一個(gè)相對可行的解決路徑。
于是,AI成為虛擬風(fēng)洞里的“運(yùn)動員”,在跳出游戲的更多場景里發(fā)揮作用的價(jià)值,也就不再只是戰(zhàn)勝人類這個(gè)小目標(biāo)了。
刊載于《人民郵電報(bào)》2022年4月8日《樂游記》專欄330期
作者 張書樂,人民網(wǎng)、人民郵電報(bào)專欄作者,中經(jīng)傳媒智庫專家,資深產(chǎn)業(yè)評論人
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。
- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2024 上海東方報(bào)業(yè)有限公司