今天中午12点,谷歌AlphaGo人工智能与围棋世界冠军李世石的人机大战将在韩国首尔举行第一场比赛。
第一部分:人工对决描述
AlphaGO在1月28日挑战了三度欧洲围棋冠军樊麾,在这番棋赛中以5:0击败樊麾。这是软件首次在全尺寸棋盘对职业棋手的比赛中取得这样的成绩。2月22日,继宣布AlphaGo实现突破性研究-计算机程序首次击败专业棋手之后, Google DeepMind公布了即将与过去十年最佳围棋手李世石之间的终极挑战的详细情况。回顾人机对决的历史:1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。而机器学习中的深度学习也成为目前人工智能领域中最热门的科目。
今天3月9日是AlphaGO与李世石的首场对决,Deep Mind公司youtube频道和韩国棋院围棋TV将对本次比赛进行全程直播报道。
第二部分:AlphaGo与李世石人机对战
AlphaGo
1. 介绍
AlphaGo是一套为了围棋优化的设计周密的深度学习引擎,使用了神经网路加上MCTS (Monte Carlo tree search),并且用上了巨大的谷歌云计算资源,结合CPU+GPU,加上从高手棋谱和自我学习的功能。这套系统比以前的围棋系统提高了接近1000分的Elo,从业余5段提升到可以击败职业2段的水平,超越了前人对围棋领域的预测,更达到了人工智能领域的重大里程碑。
2.特点
1)“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。
2)两个大脑。
AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。AlphaGo是通过两个不同神经网络“大脑”合作来改进下棋。第一大脑: 落子选择器 (Move Picker):AlphaGo的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。AlphaGo的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是论文中提到的“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。
3)蒙特卡洛树搜索算法。
蒙特卡罗方法是一种计算方法。原理是通过大量随机样本,去了解一个系统,进而得到所要计算的值。通过蒙特卡洛增加阅读:阅读跟大多数围棋AI一样,通过蒙特卡洛树搜索(MCTS)算法来完成。但AlphaGo 比其他AI都要聪明,能够更加智能的猜测哪个变种去探测,需要多深去探测。
了解了AlphaGo,来看看他背后的人。
1)斯•哈萨比斯
美国麻省理工《科技评论》杂志日前撰文,介绍了创业公司DeepMind创始人戴密斯•哈萨比斯(Demis Hassabis)如何利用他所掌握的先进人工智能技术,帮助谷歌展开一场全新的人工智能革命。
斯•哈萨比斯,39岁,Alpha Go背后最关键的人物。看上去瘦小、低调,履历却相当惊人——4岁学国际象棋,5岁参加全国比赛,13岁拿到国际象棋大师的头衔, 16岁考入剑桥大学攻击计算机系,17岁开发价值数百万美元的电子游戏《主题公园》、然后他决定在伦敦大学攻读神经学博士学位,专攻记忆与想像力,35岁创办人工智能公司deepmind,去年被谷歌以4亿美元收购……
2)发表在顶级期刊《Nature》的论文光看作者就20个,明显是下了血本,前两位都是计算机围棋界的大牛,一作David Silver是计算机围棋和强化学习的顶级专家,整个博士论文就是做的围棋; 二作Aja Huang以前写过多年围棋软件,自己又是AGA 6D的水平。
3. 战绩
1)谷歌DeepMind开发的人工智能围棋程序AlphaGo以5:0的压倒性优势击败了欧洲围棋冠军、专业二段棋手。
2)研究者也让AlphaGo 和其他的围棋AI进行了较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和Pachi三个先进的AI,胜率分别是77%,86%和99%。
李世石
1.介绍
李世石,1983年3月2日生于韩国全罗南道。围棋职业九段,拿过十几个世界冠军,当世最伟大的围棋手之一。1995年入段,1998年二段,1999年三段,2003年因获LG杯冠军直接升为六段,2003年4月获得韩国最大棋战KT杯亚军,升为七段,2003年7月获第16届富士通杯冠军后直接升为九段。2006、2007、2008韩国围棋大奖——最优秀棋手大奖(MVP)。
2.特点
李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下完成逆转。
3.战绩
李世石是韩国围棋九段选手,也是近10年来获得世界冠军最多的棋手。在几年来的国际比赛上,李世石可以说是战绩显赫,来看看他近些年来获得的奖项:富士通杯:第15届、16届和18届冠军、三星杯:第9届、12届、13届、17届冠军、LG杯:第7届、第12届冠军、春兰杯:第8届冠军、丰田杯:第2界和第3届冠军。
第三部分:比赛详情
比赛将于北京时间中午12点在首尔四季酒店举行,具体日程如下:
1. 3月9日 (星期三):首场比赛
2. 3月10日(星期四):第二场比赛
3. 3月12日(星期六):第三场比赛
4. 3月13日(星期日):第四场比赛
5. 3月15日(星期二):第五场比赛
比赛将采用贴7.5目的中国规则(比赛结束时,后走棋的棋手贴目)。每位棋手各有两个小时布局时间,3次60秒的读秒,每场比赛预计需要大约4-5个小时。
战胜欧洲围棋冠军樊麾的AlphaGO是不是又升级了呢?对战围棋九段李世石,到底谁会赢呢?
最终谁赢
分场次投票谁赢:
首场比赛
第二场比赛
第三场比赛
第四场比赛
第五场比赛