AD
首页 > 头条 > 正文

谷歌人工智能AlphaGo首次战胜人类围棋高手

[2016-01-28 10:24:29] 来源:财新网 编辑:老米 点击量:
评论 点击收藏
导读:计算机程序击败人类围棋专业高手,原本被认为是人工智能10年后才能达到的成就。AlphaGo将在2016年3月迎战世界冠军李世乭。

谷歌开发程序AlphaGo首次战胜人类围棋高手

  之所以出现这种情况,是因为比之于计算国际象棋,计算围棋要复杂得多。围棋最大有3^361 种局面,大致的体量是10^170。而国际象棋最大只有2^155种局面,体量大致是10^47。围棋一盘大约要下150步,每一步有250种可选的下法,那么一盘围棋需要计算250^150种情况,大致是10^360。这是一个过于庞大的数字,传统蛮力搜索在围棋这里并不可行。

  因此,AlphaGo战胜人类围棋高手尤为难得。开发者大卫·斯尔弗(David Silver), 黄世杰(Aja Huang) 和 戴密斯·哈萨比斯(Demis Hassabis)运用深层卷积神经网络来缩小传统蒙特卡洛树搜索的广度和深度,以挑选最佳招数。“Alpha Go”的核心也正是两种不同的深层神经网络:策略网络(policy network)和价值网络(value network)。利用“价值网络”去计算局面,根据局势对路线进行取舍;用“策略网络”选择下子,减少不必要的棋步,在配合中选出有希望的好棋步,抛弃明显差棋,从而将计算量控制在计算机可以完成的范围内。

  此外,开发者们还用两种方式同步训练AlphaGo,一是用许多专业棋局进行训练的监督式学习(supervised learning),然后让“Alpha Go”和自己对弈,这种方法称为强化式学习(reinforcement learning)。在这种不断的学习,反思和练习下,在同其他围棋程序进行的总计495局的较量中取得只输一局的辉煌战绩。它的对手也包括Crazy Stone、Zen和Pachi三个先进的计算机围棋程序。

  在自然发表的论文中,AlphaGo与樊麾对战五局,均取得了胜利。樊麾出生于中国,后入籍法国,曾获欧洲围棋冠军,目前是法国国家围棋队总教练。

为您推荐