东大专家预测:“阿尔法围棋”至少还能赢3场

11.03.2016  12:17

  9日,人工智能“阿尔法围棋”(AlphaGo)挑战韩国李世石九段的比赛,在首尔打响。围棋一直被看作是人类最后的智力竞技高地,究竟是人类战胜人工智能,还是人工智能打败人类?

  五盘棋比赛中的第一局下午1时在首尔四季酒店举行,经过4个半小时的对弈,“阿尔法围棋”以186手,执白中盘战胜李世石。“‘阿尔法围棋’,比想象中厉害。”李世石说。

  综合新华社现代快报记者俞月花

  李世石首局投子认输

  对局中,虽然“阿尔法围棋”下了两三手的怪棋,但一直保持序盘的优势。

  李世石黑棋第7手是试探性的一招,但“阿尔法围棋”应手正确,布局阶段占优。接着“阿尔法围棋”掌握了局面的主导权。

  到186手时,黑棋已贴不出目来,李世石投子认输。

  “它比想象中厉害

  李世石赛后说:“我对‘阿尔法围棋’的表现感到吃惊。事实上我一直认为不会输掉。但‘阿尔法围棋’下得那么完美,真没想到。我认为因为序盘布局的失败,黑棋一直处境艰难。

  李世石说:“我对阵‘阿尔法围棋’时,有两个方面很吃惊:第一个是序盘布局能力比想象中厉害;第二个是它会下胜负手。今天的比赛是双方都很难的一场对决,但它算法能力比较强,实战中它下了人类想不到的一手,让我大吃一惊。

  柯洁:它赢不了我

  中国围棋新一代代表人物柯洁昨天发微博表示,“就算‘阿尔法围棋’战胜了李世石,但它赢不了我。”柯洁表示,自己未来愿意和它约战。

  人机大战

  人工智能“阿尔法围棋”挑战世界围棋冠军李世石,比赛共分五场。详细赛程和规则如下:

  赛程

  对战分为5场,分别是:3月9日、3月10日、3月12日、3月13日和3月15日。五盘对局,取得三局或三局以上者为胜。若比赛出现3:0或3:1已经分出胜负后,也将下满5局。

  规则

  本次比赛采用中国规则,黑贴3又3/4子(黑贴7目半)。每位棋手各有两个小时布局时间,3次60秒的读秒,每场比赛预计需要4-5个小时。

  奖励

  谷歌设置了100万美元的基础奖金,李世石还可获得15万美元出场费;此外每胜一局还有2万美元胜局奖金。如果五盘全胜,胜局奖金为10万美元。如果李世石五战全胜获得优胜,最多可以获得125万美元。若“阿尔法围棋”获胜,奖金将全部捐献给联合国儿童基金和STEM教育及围棋相关公益团体。

  对阵双方什么来历?

  李世石

  九段,韩国棋手,世界围棋领域代表性人物之一。他属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,集中力量击垮对手。落子“稳、准、狠”,经常能在劣势下完成逆转。

  “阿尔法围棋

  “阿尔法围棋”,美国谷歌公司旗下人工智能公司“深度思维”开发的智能软件。它可以运行在不同的硬件平台上。其“单机”版本用到48个中央处理器,还有一个分布式运算的版本,可同时用到多台计算机的1202个CPU,大大提升计算能力。“阿尔法围棋”以5比0战胜欧洲围棋冠军、前中国职业棋手樊麾,成为第一个击败人类职业棋手的电脑程序。除了超强的计算能力,“阿尔法围棋”最大的特点是学习能力较强。在战胜樊麾之前,“阿尔法围棋”已进行了超过3000万局的自我训练,不断提升棋力。

  “阿尔法围棋”会自己学习,下棋能想到下面5步

  昨天中午12点,机器人传感与控制技术研究所所长、东南大学仪器科学与工程学院院长宋爱国准时坐在电脑前,观看世界人机围棋大战。答案揭晓后,宋爱国说,这在智能机器人领域具有里程碑的意义。“这个机器人搏杀能力很强,但经验不足。不过已经预示了智能机器人领域又上了一个新台阶。”宋爱国预测,机器人至少还能赢3场!

  为什么能赢?

  它模拟人类大脑自己学习

  它是怎么做到的呢?宋爱国说,他看了机器人和李世石的前半场对战,“我发现这个机器人特别喜欢搏杀,虽然它看起来布局方面还有些欠缺。这只能说明它经验还不足,如果未来再加强练习,经验上也会跟上来。”他说,这个机器人显然已经达到了职业围棋手的水准。

  宋爱国介绍说,围棋比赛的过程从数学上来说,是求最优解。“因为围棋上面总共有361个点。解的空间非常巨大,各种可能性很多。机器人能完胜李世石,说明它的智能化目前上了一个层次。

  “当然不只是科学家将计算机需要记忆的围棋相关知识编程传输给计算机,计算机通过记忆就能下围棋,而是它已经可以做到模拟人类大脑,用多层神经网络进行深度学习。”宋爱国说,原来计算机神经网络是三层,到2010年时,神经网络的深度学习实现突破。“因为人的大脑学习推理能力特别强。而用计算机模拟人类大脑,通过多层神经网络,一层层提出顾虑,提取特征,直到最后把本质特征提取出来。计算机借此找到围棋的本质规律,从而自我学习。”他说,科学家不仅是把李世石以往的围棋方法编程输入计算机,肯定还有其他围棋知识。“机器人甚至还可以通过自我对战来学习。

  所以,在比赛中,当李世石出棋后,机器人能根据自己所学,快速计算找到最优解。“即便李世石的招数它从来没见过,机器人也会通过分析推理,给出自己的答案。甚至这一步走完,接着下面的5步对方大概怎么应对,我怎么走,我的优劣程度是怎样,它都可以计算出来。

  相当于人类多大年龄?

  综合评判不如5岁孩子

  这么聪明的机器人,相当于人类多大年龄?宋爱国说,综合评判不如5岁孩子。“尽管在下围棋方面,它已经是个职业高手,但是在其他方面,它的能力很差。”他说,机器人只是根据人类给它的编程,熟悉了围棋这个环境,这只是单个任务。而人类生活的日常环境却是多任务的,要面对各种各样的情况。“因为多任务更加复杂。下围棋时,机器人只需要通过摄像头作为眼睛来操作,而人的感知遍布全身,包括眼睛耳朵鼻子,机器人的触觉传感器却很少。人的皮肤能够感知到压力、冷热、抚摸等,而机器人就没有。

  机器人与人的智能还有很大距离。“主要差距是在未知的变化的环境,未知的任务,它的决策能力还是非常弱的。”宋爱国说,目前机器人的综合智能水平可能不如5岁孩子。“你带一个5岁小孩到一个陌生地方,给他1块钱,让他打一瓶酱油回来。这个5岁孩子就会去找,然后把酱油打回来。但是对于现在的机器人,它可能出去了就回不来了。

  为什么是围棋?

  棋类智力对战游戏,历来是计算机“智能”水平的试金石之一。计算能力、判断能力、思考甚至学习能力,都可在胜负分明的棋盘上得以检验。随着人工智能技术进步,人类在棋盘上的阵地近年来不断“失守”。

  1997年,美国IBM公司超级计算机“深蓝”依仗强大的计算能力,战胜当时世界排名第一的国际象棋大师卡斯帕罗夫。

  2006年,中国超算“浪潮天梭”同时对战5位中国象棋特级大师,最终以总比分险胜,取胜关键被认为是不知疲倦的稳定性和超强计算能力。

  围棋被视为人机对决的“最后一块棋盘”。由于棋盘上变化繁复,“千古不同局”,计算机也无法仅通过“蛮力”穷举来取胜。也因此,许多专家认为,电脑要想攻陷人类智慧的这一堡垒,至少再过10年。但去年10月,“阿尔法围棋”横扫欧洲围棋冠军樊麾。

  对这次比赛的意义,德国人工智能研究中心的安德烈亚斯·登格尔说,从人工智能的角度看,“阿尔法围棋”胜出,将是证明深度学习技术潜力的有力证据。