智械危機?《火箭聯(lián)盟》排位出現(xiàn)AI作弊機器人
- 來源:PCgamer
- 作者:3DM編譯
- 編輯:爆裂真菌
近日有玩家在 Reddit 論壇上聲稱在《火箭聯(lián)盟》排位比賽中遇到了作弊者。在游戲社區(qū)中,指控他人作弊并不罕見,但是許多時候往往是玩家有技術差距導致的誤會。不過在看了帖子中的視頻后,許多人指出這確實不是普通玩家能夠進行的操作,而是一個“機器人”。
證據(jù)視頻:
這個被發(fā)現(xiàn)的作弊玩家和舉報人在同一個隊伍中,視頻是作弊玩家的視角。雖然《火箭聯(lián)盟》中有非常多的高手,但是他的操作并不像那些高端玩家,利用滯空技巧將球送進球門,而是完美的避開了對手的進攻進行運球。
事實上,這種作弊方式確有其事,而且在游戲中越來越常見:許多人已經開始在線上堆棧中使用經過機器學習訓練的《火箭聯(lián)盟》機器人。
促進此類機器人訓練的 API,RLGym 的創(chuàng)作者表示,他們知道自己的項目可能會被作弊者利用,但這并不是他們的本意。實際上,目前有一個并不利用該技術來作弊的《火箭聯(lián)盟》機器人開發(fā)和競賽社區(qū),以另一個名為 RLBot 的 API 為核心,創(chuàng)建和使用自定義機器人在離線游戲或本地錦標賽中互相對抗。
RLGym 改變了游戲規(guī)則,允許機器人開發(fā)者使用游戲作為強化學習算法的環(huán)境。其核心想法是,與其手動編寫機器人的行為腳本,不如告訴系統(tǒng)需要的結果:例如,讓球接近對手的球門。隨后通過運行數(shù)小時的《火箭聯(lián)盟》模擬比賽,讓機器人在此期間逐漸學習以達到預期結果。
事實上該過程并沒有這么簡單。RLGym 的一位開發(fā)者 Aech 表示:“設計獎勵機制本身就是一門藝術?!鄙现?,Aech 在論壇上就作弊問題進行了問答。他表示,在《火箭聯(lián)盟》中用于作弊的機器學習機器人 Nexto“非常難以制作”,因此不可能出現(xiàn)大量變體。不過,現(xiàn)在作弊者已經越來越多,Aech 此前就曾預測將有人訓練比 Nexto 更厲害的機器人。
機器人本身并不是新技術,根據(jù) Aech 的說法,最新消息是有人使用了“他們自己的工具來對游戲進行改動,這些工具不像 RLGym 或 RLBot 那樣在線上游戲中有著限制?!边@也是為什么 Nexto 出現(xiàn)在了排位比賽中的原因。
在接受 PC Gamer 采訪時,Aech 表示:“RLGym 非常幸運能夠找到一個超級熱情和包容的社區(qū),我們不會讓這些作弊者停滯我們的腳步?!?
“我們正在采取措施保證我們的機器人未來不會被濫用,我們已經等不及想要想打架展示一些我們一直在開發(fā)的激動人心的項目?!?
目前,如果玩家和機器人匹配到一起,除了舉報和盡力以外,沒有別的辦法。不過據(jù)稱,因為訓練中的一些缺陷,機器人在開球時并不是很強。
Aech 總結道:“我們現(xiàn)在已經看到了幾個機器學習項目出現(xiàn)的一個相當奇怪的現(xiàn)象,那就是機器人通常會在訓練的早期學習如何的更好開球,但隨著在比賽匯總其余部分不斷進步,他們似乎都會失去開球的能力?!?
玩家點評 (0人參與,0條評論)
熱門評論
全部評論