谷歌人工智能AlphaGo首次战胜人类围棋高手

[2016-01-28 10:24:29] 来源：财新网编辑：老米点击量：

评论 点击收藏

导读：计算机程序击败人类围棋专业高手，原本被认为是人工智能10年后才能达到的成就。AlphaGo将在2016年3月迎战世界冠军李世乭。

谷歌开发程序AlphaGo首次战胜人类围棋高手

　　之所以出现这种情况，是因为比之于计算国际象棋，计算围棋要复杂得多。围棋最大有3^361 种局面，大致的体量是10^170。而国际象棋最大只有2^155种局面，体量大致是10^47。围棋一盘大约要下150步，每一步有250种可选的下法，那么一盘围棋需要计算250^150种情况，大致是10^360。这是一个过于庞大的数字，传统蛮力搜索在围棋这里并不可行。

　　因此，AlphaGo战胜人类围棋高手尤为难得。开发者大卫·斯尔弗(David Silver)，黄世杰(Aja Huang) 和戴密斯·哈萨比斯(Demis Hassabis)运用深层卷积神经网络来缩小传统蒙特卡洛树搜索的广度和深度，以挑选最佳招数。“Alpha Go”的核心也正是两种不同的深层神经网络：策略网络(policy network)和价值网络(value network)。利用“价值网络”去计算局面，根据局势对路线进行取舍;用“策略网络”选择下子，减少不必要的棋步，在配合中选出有希望的好棋步，抛弃明显差棋，从而将计算量控制在计算机可以完成的范围内。

　　此外，开发者们还用两种方式同步训练AlphaGo，一是用许多专业棋局进行训练的监督式学习(supervised learning)，然后让“Alpha Go”和自己对弈，这种方法称为强化式学习(reinforcement learning)。在这种不断的学习，反思和练习下，在同其他围棋程序进行的总计495局的较量中取得只输一局的辉煌战绩。它的对手也包括Crazy Stone、Zen和Pachi三个先进的计算机围棋程序。

　　在自然发表的论文中，AlphaGo与樊麾对战五局，均取得了胜利。樊麾出生于中国，后入籍法国，曾获欧洲围棋冠军，目前是法国国家围棋队总教练。

查看更多:谷歌 AlphaGo 战胜人类围棋高手

分享到微信

更多

热点专题

更多

谷歌人工智能AlphaGo首次战胜人类围棋高手

相关文章

热点专题

为您推荐