人工智慧下出罕見妙手-科學人雜誌
網路不打烊

人工智慧下出罕見妙手

2016-05-01 葉平
從蒙地卡羅樹搜尋演算法到深度神經網路,層層剖析AlphaGo如何在圍棋比賽中出奇制勝。
今年3月DeepMind公司的AlphaGo圍棋程式和多次世界冠軍南韓職業棋士李世&#20077九段的五局大戰,牽動了全球圍棋界和科技界的神經,筆者接觸電腦圍棋超過20年,自然不會錯過每局比賽的現場直播。2016年3月12日無疑會在科技史上留名,這一天AlphaGo取得第三勝,確定擊敗李世&#20077。五戰結束後,AlphaGo以4:1的成績獲勝。許多職業棋士說,AlphaGo下得很像人,如果只看棋譜,看不出AlphaGo持黑還持白。或許我們可以說AlphaGo在圍棋上通過了涂林測試,值得冠上人工智慧之名。AlphaGo的致勝關鍵AlphaGo的大架構仍然是MCTS,成功的關鍵是引進策略網路與估值網路兩個深度神經網路,大大提高MCTS的效能:策略網路減少需要考慮的落點,估值網路減少需要模擬的手數,結合起來,就能在更短的時間找到更佳的著手。而DeepMind團隊用了三個階段,來訓練這兩種網路。第一階段是模仿,術語是監督式學習。DeepMind團隊用KGS圍棋伺服器上的3000萬盤棋來訓練策略網路,讓它在給定一個盤面時算出下一手人類會下在各個著點的機率。假設某個角落的定石...

登入會員以閱讀更多精彩內容

# 關鍵字:網路不打烊AI人工智慧AlphaGo
更多文章
活動推薦更多
追蹤科學人