AlphaGo:不懂圍棋的棋王-科學人雜誌
網路不打烊

AlphaGo:不懂圍棋的棋王

2016-04-01 林守德
「廣、準、深」的機器棋王養成之路。
近日來「人工智慧」再度成為炙手可熱的議題,主要因為網路巨擘Google發展出來的程式AlphaGo,在圍棋比賽中以4:1打敗了實力九段的南韓棋王李世。要知道AlphaGo為什麼可以贏過人類,首先得剖析它下棋的方式:與人類棋手類似,一個優秀的電腦弈棋程式需要具備「廣、準、深」三大要素。「廣度」意思是多方思考許多不同棋步的可能性,而非局限於少數棋步;「準度」是指對於每一步的優劣勢都能夠判斷得很精準;「深度」則意指能夠預估後續的很多步,模擬對手的選擇以及自己相對應的下一步、下下步等。那麼,AlphaGo是如何訓練出「廣、準、深」三大要素呢?它的訓練模式跟一般人類棋手截然不同。大致來說可分為三個階段,我各稱為「天下棋手為我師」、「超越過去的自己」、「機率算盡太聰明」。在廣度方面,AlphaGo爬梳了KGS圍棋伺服器資料庫裡許多圍棋高手走過的共約3000萬棋步,學習他們面對各種盤面時會走的「下一步」。在這個階段,電腦會碰到很嚴峻的挑戰:它所看到的3000萬棋步,相對於250150的總盤面數是微乎其微的,如何利用相對如此少的資料學到「廣度」,一直是電腦弈棋領域裡非常難解的問題。所幸近年來人工智慧學...

登入會員以閱讀更多精彩內容

更多文章
活動推薦更多
追蹤科學人