最強AlphaGo Zero誕生自學3天100比0秒殺AlphaGo

2017-10-20 14:52:00

來源：中國臺灣網

字號

　　中國臺灣網10月20日訊　據臺灣“東森新聞雲”報道，今(2017)年5月，DeepMind公司創造的AlphaGo與圍棋世界冠軍柯潔在中國烏鎮對弈，以壓倒性的3:0勝出，人工智慧發展震驚全球。

　　不可思議的是，時隔不到半年，Google旗下AI實驗室帶來更強大的AlphaGo　Zero，它完全不需要倚靠人類的知識和指導，從零開始自我訓練只需3天就100:0打敗舊版。

　　在過去，強大的人工智慧依靠人類事前輸入大量資料，幫助它學習、訓練技能，Alpha　Go成為圍棋大師前自然也不例外。近日，DeepMind公司在《自然》(Nature)科學期刊上發表一篇學術論文《不需要人類知識就稱霸圍棋》(Mastering　the　game　of　Go　without　human　knowledge)，展示了強化版的程式AlphaGo　Zero，證明在全球最困難的棋藝競技中，人工智慧可以在沒有任何人類知識的基礎上，純粹靠自我學習成為制霸王者。

　　AlphaGo　Zero代表從零開始，DeepMind開發團隊只輸入了基本的圍棋規則，剩下的時間它會自行下棋，記錄下每次的勝負決策、不斷學習,自己成為自己的老師，加上沒有人類的經驗和成規束縛，讓人工智慧突破舊有的知識限制，發展出新的弈棋策略，快速達到登峰造極新境界。

　　AlphaGo　Zero誕生後，只花了3天時間就贏了去年打敗李世乭的AlphaGo版本，局數勝負是毫無懸念的100:0。21天之後，AlphaGo　Zero再度進化，能力超越了今年打敗世界冠軍柯潔的AlphaGo　Master版本；40天後，它完成了2900萬次的對戰學習，與過去最強的AlphaGo對弈，它的勝率來到90%，成為至今最優秀的版本，也是歷史上最強的“圍棋棋手”。

　　DeepMind指出，不使用任何人類知識，AlphaGo　Zero使用的是新的“強化學習”方法，通過神經網路和演算法結合，持續自我對弈練習幾百萬、幾千萬場，每次的更新都能增強、調整係統，用以預測下一步落子的方向和遊戲輸贏走勢。幾天時間內，AlphaGo　Zero就從一塊純潔的白板，在上頭不斷揮灑、創造知識，很快勝過了人類累積千年的圍棋智慧。(中國臺灣網　孫伊靜)

[責任編輯：孫伊靜]

地方站點

中國臺灣網移動版

最強AlphaGo Zero誕生自學3天100比0秒殺AlphaGo

相關新聞

地方站點

中國臺灣網移動版

最強AlphaGo Zero誕生 自學3天100比0秒殺AlphaGo

相關新聞

最強AlphaGo Zero誕生自學3天100比0秒殺AlphaGo