海量資源，盡在掌握

當前位置：首頁 > 百科知識 > 工控 > 正文

AlphaGo 又名：機器人AlphaGo

由谷歌DeepMind實驗室研究的圍棋軟件AlphaGo。

以往的下棋電腦程序都是運用傳統的智能運算方法，即對所有可能的落子位置建立搜索樹，但這種方法在對付圍棋時就失靈了。

“深度思維”公司開發的A lphaG o電腦程序另辟蹊徑，它將更為先進的搜索樹運算法跟神經系統運行模式結合起來。

這種類似神經系統的運算方法將圍棋棋盤描述為一個“輸入端”，然后運用包含數百萬類神經系統連接的12個不同層面的網絡系統對其進行處理。

其中一種“神經網絡系統”叫做“策略網絡”，它會選擇下一步如何走；另一種“神經網絡系統”叫做“價值網絡”，它會預測誰將勝出。

谷歌公司說：“我們用人類職業棋手的3000萬步下法來訓練‘神經網絡系統’，直到它能以57%的準確率預測職業棋手的下一步走法。”

據悉，此前的圍棋程序預測準確率只能達到44%。

“深度思維”公司的目標可不是僅僅模仿人類，而是要擊敗頂尖圍棋高手。

為了達到這一目標，A lphaG o電腦程序能夠“自動學習”以發展出新的下法。A lphaG o電腦程序的“神經網絡系統”運用一種被稱為“強化學習法”的反復試錯法，進行了數千次訓練，不斷調整。

谷歌公司稱，這需要強大的計算能力。

在進行人機大戰之前，“深度思維”公司拿A lphaG o電腦程序跟其他圍棋程序進行比賽，如著名的圍棋程序“瘋狂石頭”和“禪”，A lphaG o電腦程序每次都能勝出。

內容來自百科網

開通會員，享受整站包年服務

相關詞條

国产呦精品一区二区三区网站|久久www免费人咸|精品无码人妻一区二区|久99久热只有精品国产15|中文字幕亚洲无线码