更新時(shí)間:2025-04-02來(lái)源:網(wǎng)絡(luò)
AI 挑戰(zhàn)寶可夢(mèng)
上個(gè)月,一家美國(guó)的人工智能公司在其平臺(tái)上運(yùn)用了最新的模型3.7,參與了《寶可夢(mèng)·紅》這款游戲。經(jīng)過(guò)對(duì)多款游戲的測(cè)試,研究團(tuán)隊(duì)覺(jué)得《寶可夢(mèng)》是檢驗(yàn)3.7性能的一個(gè)不錯(cuò)的方式。在游戲中,我們觀察到了3.7的思考過(guò)程,它成功奪得了三個(gè)道館徽章,這初步展示了人工智能在游戲領(lǐng)域的應(yīng)用潛力。
馬力歐成新測(cè)試熱點(diǎn)
今天,一個(gè)研究團(tuán)隊(duì)指出,《超級(jí)馬力歐兄弟》這款游戲非常適合用作AI測(cè)試平臺(tái)。就在上周五,加州大學(xué)圣地亞哥分校的Hao AI Lab專門(mén)為這款游戲設(shè)計(jì)了一套帶有特定框架的測(cè)試方案。他們向AI輸入了基本的操作指令和游戲畫(huà)面,AI通過(guò)編寫(xiě)代碼來(lái)操控游戲角色。結(jié)果顯示,3.7版本的AI表現(xiàn)最為出色。
不同游戲測(cè)試難度對(duì)比
《寶可夢(mèng)》讓人深思,它運(yùn)用的是回合制戰(zhàn)斗模式。相較之下,《超級(jí)馬力歐兄弟》更看重“時(shí)間”這一關(guān)鍵點(diǎn)。在推理層面,《超級(jí)馬力歐兄弟》的難度更高,一旦決策出現(xiàn)錯(cuò)誤,就可能錯(cuò)過(guò)安全區(qū)域,甚至直接導(dǎo)致失敗。這顯示了不同游戲?qū)θ斯ぶ悄艿奶魬?zhàn)各有其特點(diǎn)。
游戲測(cè)試 AI 的歷史
游戲長(zhǎng)久以來(lái)都是檢驗(yàn)人工智能水平的重要手段。2019年,一場(chǎng)Five技能的競(jìng)賽吸引了廣泛關(guān)注,F(xiàn)ive在比賽中擊敗了經(jīng)驗(yàn)豐富的Dota 2戰(zhàn)隊(duì),在線上更是戰(zhàn)勝了99.4%的玩家。然而,研究者們很快轉(zhuǎn)變了研究方向,不再將游戲作為評(píng)價(jià)依據(jù),而是轉(zhuǎn)向了自然語(yǔ)言處理等新領(lǐng)域的研究。
游戲測(cè)試 AI 的爭(zhēng)議
人工智能在游戲開(kāi)發(fā)中的應(yīng)用令人鼓舞,對(duì)商業(yè)領(lǐng)域也有益處,但據(jù)某機(jī)構(gòu)前首席AI科學(xué)家所言,這類AI除了在游戲界有所應(yīng)用外,并未給世界帶來(lái)真正的價(jià)值。游戲構(gòu)建的虛擬環(huán)境既抽象又簡(jiǎn)單,與真實(shí)世界有很大不同。如果不能適應(yīng)環(huán)境變化,它們?cè)趹?yīng)對(duì)時(shí)代挑戰(zhàn)時(shí)將難以發(fā)揮作用。
AI 評(píng)測(cè)的危機(jī)
GPT-4.5問(wèn)世之后,研究者發(fā)現(xiàn)AI評(píng)估領(lǐng)域面臨了難題,對(duì)哪些AI指標(biāo)應(yīng)當(dāng)關(guān)注感到迷茫。盡管大家普遍認(rèn)為GPT-4.5獨(dú)特且富有情感,但對(duì)其“品味”進(jìn)行評(píng)價(jià)卻十分困難,這已經(jīng)成為AI研究領(lǐng)域需要關(guān)注的問(wèn)題之一。
大家普遍好奇,AI是否能在玩游戲的進(jìn)程中,掌握那些在現(xiàn)實(shí)生活同樣適用的技能?
相關(guān)資訊
其他推薦