alphago 原理以及阿爾法圍棋是什麽

1、據阿爾法圍棋團隊負責人大衛·席爾瓦（Dave Sliver）介紹，AlphaGoZero使用新的強化學習方法，讓自己變成了老師。系統壹開始甚至並不知道什麽是圍棋，只是從單壹神經網絡開始，通過神經網絡強大的搜索算法，進行了自我對弈。

2、隨著自我博弈的增加，神經網絡逐漸調整，提升預測下壹步的能力，最終贏得比賽。更為厲害的是，隨著訓練的深入，阿爾法圍棋團隊發現，AlphaGoZero還獨立發現了遊戲規則，並走出了新策略，為圍棋這項古老遊戲帶來了新的見解。

3、阿爾法圍棋（AlphaGo）是第壹個擊敗人類職業圍棋選手、第壹個戰勝圍棋世界冠軍的人工智能機器人，由谷歌（Google）旗下DeepMind公司戴密斯·哈薩比斯領銜的團隊開發。其主要工作原理是“深度學習”。