AI成為賽車電玩冠軍-科學人雜誌
資訊科學

AI成為賽車電玩冠軍

2022-06-01 布希維克(Sophie Bushwick)
超擬真遊戲中,AI學會與人類玩家一同飆速賽道並獲勝。
屢創佳績:人工智慧(AI)在電玩遊戲中能夠與人類玩家順利互動,或許可應用於真實世界。此圖為賽車的實際照片。(影像來源:Jon Feingersh/Getty Images)

要沿著最快的「賽車路線」猛然過彎而不失控,賽車手必須以精準時序煞車、操控方向盤並加速。這個過程取決於摩擦力的極限,而摩擦力受已知物理定律支配,自動駕駛車經由程式設定之後,可以利用這些定律讓車輛盡可能快速行駛;但是當自動駕駛車必須與其他車輛共同行駛車道時,難度就變高了。現在有研究團隊以虛擬方式克服了這項挑戰,他們訓練人工智慧(AI)程式在超擬真的賽車遊戲「跑車浪漫旅競速」(Gran Turismo Sport)中勝過人類玩家。這項結果能為自動駕駛車的設計提供洞見。

AI已經在一些電玩上打敗人類玩家,例如「星海爭霸II」(Starcraft II)和「刀塔2」(Dota 2)。但論文共同作者、美國索尼(Sony)人工智慧部門主管沃曼(Peter Wurman)表示,AI在「跑車浪漫旅」系列遊戲上展現的成果大不相同,該成果發表於今年2月的《自然》。他解釋:「在多數遊戲中,環境會定義規則,保護玩家免於彼此傷害。在賽車遊戲中,車輛彼此非常靠近,AI代理程式(agent)必須學會並採用一套非常細膩的禮儀。為了獲勝,AI必須尊重對手,但也要守住自己的行駛路線,確保領先。」

為了教程式這些訣竅,索尼AI部門的研究團隊使用了一套名為深度增強學習的技術。他們會在AI做出特定表現時給予「獎勵」,例如行駛在賽道上、持續操控車輛以及尊重賽道禮儀(包括避免碰撞),並讓程式自行嘗試達成這些目標。這套名為GT Sophy的AI程式有好幾個版本,每個都學會在特定賽道上駕駛特定車輛。接著研究團隊召募「跑車浪漫旅」的人類玩家冠軍與這幾個版本進行對抗賽。

第一次測試於去年7月舉行,人類玩家在車隊總成績拿到最高分。第二回合在同年10月舉辦,AI有了突破:單圈時間最快,且在個人賽與團隊賽上打敗了人類玩家;除此之外有個AI版本贏了每一場比賽。人類玩家似乎可以從容面對自己的失敗,有些人樂於與AI鬥智。索尼AI的策略與夥伴關係部門主管馬可斯(Erica Kato Marcus)說:「聽說有些玩家也從GT Sophy的車輛操控中學到新技巧。」

2020年國際汽車聯盟(FIA)認證「跑車浪漫旅」錦標賽的世界決賽選手瓊斯(Emily Jones),參與了和GT Sophy的對抗賽,她說:「AI所走的路線很微妙,我或許能做到一次,但那真的非常困難,我絕不會在比賽中嘗試。」雖然瓊斯認為與AI競賽讓她有無力感,但印象深刻。「如同許多運動,賽車的重點是盡可能跑出完美單圈,但你永遠做不到。看到GT Sophy跑出完美單圈,覺得很誇張,你沒辦法比它更快。」

索尼團隊正在進一步開發這套AI,包括讓其中一個版本可以在遊戲中任何賽道駕駛任何車輛。他們也希望能與「跑車浪漫旅」的開發人員合作,把比較沒那麼厲害的版本整合進未來的更新版。

飆速賽車:「跑車浪漫旅競速」的畫面。(影像來源:Sony Interactive Entertainment)

因為「跑車浪漫旅」提供了現實世界特定車輛與賽道的真實近似值(以及支配它們的獨特物理參數),這項研究或許能有電玩遊戲以外的應用。AI研究公司OpenAI的軟體工程師陳(Brooke Chan)說:「我想其中一個有趣環節(也是與「刀塔」截然不同之處),是玩家處於遵守物理定律的環境。」陳是OpenAI Five研究的團隊成員,該研究的AI在「刀塔2」中打敗了人類玩家。未參與GT Sophy研究的陳評論,在「跑車浪漫旅」上訓練AI,就是學著深入了解現實世界。

史丹佛大學機械工程師格德斯(J. Christian Gerdes)沒有參與這項研究,他評論:「『跑車浪漫旅』是非常棒的模擬器,雖然在一些方面仍是電玩遊戲,但忠實呈現行駛不同車輛與賽道時的諸多差異。有關AI能在競賽中與人類並駕齊驅的論文中,我覺得這項研究是最擬真的。」但遊戲情境與真實路況還是差很多。

未參與這項研究的加州大學柏克萊分校車輛自動化研究人員沙拉多夫(Steven Shladover)評論:「現實世界會遭遇自行車騎士、行人、動物、卡車掉落的物品、惡劣天氣和車輛故障等狀況。但在電玩世界中,上述狀況都不會發生。」

格德斯則表示,GT Sophy可能規劃了最快的路線,同時能與通常難以捉摸的人類玩家順利互動,它的成果可為人類和自動化系統共同合作的領域提供示範。除了自動駕駛,這項成果在未來或許有助於一些互動,例如機器人輔助的手術,或家務機器人。格德斯補充道,GT Sophy的成果也顛覆一些自動駕駛車如何經由程式設定的假設。很多自動駕駛車是根據程式內建的物理學來達到行駛的最佳化(例如在不打滑情況下迅速過彎),但GT Sophy透過AI的訓練來優化。

格德斯說:「自駕車開發人員要注意的是,現在有資料點顯示該重新審視某些先入為主的觀念,其中有些能以物理學解決,而AI或許也能發揮作用。」


# 關鍵字:資訊科學科學人新聞AI
更多文章
活動推薦更多
追蹤科學人