“这是一场新鲜而陌生的比赛,是全新的挑战。我很难保证5比0全胜,毕竟我的对手从来不会失误。”昨日的赛前发布会上,李世石虽然一改此前的自信满满,但依旧认为“目前还是人类比人工智能强”。
去年10月,欧洲围棋冠军樊麾曾输给AlphaGo,但不少围棋高手研究对战棋谱后,都指其有“放水”嫌疑。对此,作为AlphaGo的设计者,谷歌人工智能公司DeepMind的CEO杰米斯·哈萨比斯在发布会上表示:“大家看到的AlphaGo并不是它能力的全部,它这一刻仍在凭借着其人工智能技术,对棋谱进行学习。相信AlphaGo能在比赛时展示不同的一面。”
曾历任韩国科学技术院人工智能院士、现就职于韩国顶尖民营研究所HandySoftware的李承镐(音译)博士在接受《第一财经日报》记者专访时表示,无论这场对决孰胜孰负,最终的赢家都将是人类自己。
围棋界:人肯定赢
对于人机大战结果的预测,中韩围棋界都站在人类一边。
3月7日晚,棋圣聂卫平向包括《第一财经日报》在内的媒体表示,人工智能缺乏判断力,与人类棋手对弈很难取胜。
“很多职业棋手,包括最顶尖的职业选手,(对于局势的)看法会有很多分歧,比如李世石认为形势可以,而柯洁可能认为不行。对于围棋的判断,是计算机的大难题,我不相信现在有电脑能突破这个,所以人和电脑下,百分之一百是人赢。”聂卫平表示。
聂卫平的依据在于,围棋变化可以归结为361的阶乘,本身就是一个无限大的数,其中还包含打二还一、打三还一、打结、倒扑等各种技法,可以说是变化无穷。
“李世石最近的状态非常好。”同一天,中国围棋选手柯洁表示。言下之意,目前的人工智能还不足以挑战现役一流围棋棋手。
此前,柯洁曾多次击败李世石,并在不久前收到了来自国内异构智能公司围棋AI“异构神机”的挑战。但他并未应战。
韩国女棋手尹英敏(音译)也站在李世石这边。被誉为“韩国围棋推广第一人”的她昨日向本报记者表示:“按照双方水平来看,李世石九段不仅会胜出,而且会以压倒性的优势胜出,如果李世石输掉一场都会被认为是重大失误。”
“但我们需要注意到,本次比赛的赛制设计对于AlphaGo比较有利。”尹英敏补充道。
据了解,此次人机交手将大战5盘,日程分别是9日、10日、12日、13日和15日,比赛在韩国时间下午1时(北京时间12时)开始。尹英敏认为:“在这种匆忙日程下,人类的疲劳度将会上升,但计算机却不会疲劳。”
其次,双方各有2小时的布局时间及3次60秒的读秒(棋手将限时用完后的倒计时时间)。每场比赛预计需要4~5个小时。“充裕的时间为计算器的运算提供了有利条件。”尹英敏表示,AlphaGo的另一个优势是,而本次对局使用的是中国围棋竞赛规则(比赛结束时,后走棋的棋手贴目),是AlphaGo平时“训练”使用的规则,而李世石则更熟悉韩式规则。除此之外,中国有句俗话叫“知己知彼,百战不殆”,如今AlphaGo对于李世石肯定已经非常“了解”,而李世石却对AlphaGo一无所知,这对于李世石来说也是劣势之一。
但尹英敏同时表示,AlphaGo的优势能否左右战局,依旧取决于李世石当天的身体及精神状态。
IT界观点不一
作为人工智能界的专家,李承镐的观点与韩国近六成民众一致:李世石会获得压倒性的优势。他认为,即便是机器人有其独有的优势,依然无法对于状态良好的李世石产生巨大威胁。他笑称:“毕竟很少会有顶级的专业选手,连续好几场出现致命失误,除非他不愿意继续对决下去。”
创新工场CEO、谷歌前全球副总裁兼大中华区总裁李开复也在知乎上表示,AlphaGo这次要打败李世石比较悬,但是1~2年之内必然完胜人类。
李开复指出,樊麾只是职业二段,而李世石是职业九段,差别是巨大的,“就比如说一个人乒乓球打败了非洲冠军,并不代表他就可以成功挑战中国冠军。”
与上述观点不同,搜狗CEO王小川认为,人工智能将会完胜。他提出了自己的两个断言:AlphaGo将会完胜李世石;除了围棋,人工智能在其他博弈类的封闭游戏里也会横扫人类。“我认为谷歌的那套深度学习的方法加上搜索空间的方法,大体上可以覆盖人的思考,而且它可能做得更好。”王小川表示。
AlphaGo的研究者戴维·席尔瓦表示,AlphaGo系统的关键是,将围棋巨大无比的搜索空间压缩到可控的范围之内。为了达到这一目的,AlphaGo系统将最先进的蒙特卡洛树状搜索技术与两个深层神经网络相结合,每个深层神经网络均包含许多层,每层又包含数以百万计的神经元一样的连接。
在AlphaGo两种不同的神经网络中,“策略网络”的作用是预测下一步,并用来将搜索范围缩小至最有可能触发的那些步骤;另一个神经网络“价值网络”则是用来减少搜索树的深度,每走一步估算一次获胜方,而不是搜索所有结束棋局的途径。
上述方法使得AlphaGo的搜索方式相比之前的方法更人性化。例如,深蓝采用强力方法搜索的棋子位置要比AlphaGo多数千倍。而AlphaGo则相反,它通过想象下完剩余棋局来对下一步进行预判,如此多次反复。在上述模拟游戏中,策略网络提出下一步的智能建议,而价值网络则对走过的每个位置进行评估。
具体而言,谷歌首先采用围棋专业棋手的3000万步下法对“价值网络”进行训练,直到该网络对人类下法预测准确率达到57%(AlphaGo之前的纪录是44%)。
但AlphaGo的目标是击败水平最高的人类棋手,而不仅仅是模仿他们。为了做到这一点,AlphaGo学会自己发现新策略,通过自身两个神经网络之间成千上万的对弈,采用被称为强化学习的试错法逐步进行改善。这种方法提高了“策略网络”的效率,以至于最原始的“神经网络”可以击败最尖端、构建有巨大无比的搜索树的围棋软件。
“在与樊麾二段比赛后,我们对AlphaGo进行了多次更新。请大家关注AlphaGo以什么样的方式与最优秀的棋手李世石对弈。”哈萨比斯昨日预计,“再过大约5年时间,AI将全面超越最顶尖人类棋手。”
最终赢家仍是人类
无论是AlphaGo还是李世石赢得比赛,这都不是人工智能的最终目的。
李承镐一再向本报记者强调:“人工智能开发的最终方向,还是要取决于人类,并且服务于人类的。毕竟人工智能也是由人类制作而成的,这是人工智能技术发展的基础和终极目的,我们不能忘记这个目的。”
“另外,通过人工智能技术,能够促进IoT(物联网)等新技术的开发,从而更有利于人类的发展与福祉。”李承镐认为,近年来暂时停滞的科技发展,将因人工智能技术,焕发“全新的春天”。
谷歌董事长埃里克·施密特也在赛前发布会上表示:“我们开发人工智能机器人的最终目的在于为人类提供福祉,为未解难题提供新的解决方法;而其中,围棋只是我们选择增强人工智能机器人的实力的方法之一。无论这场对决孰胜孰负,最终的赢家都将是人类自己,因为人工智能的发展,最终的受益者将是人类自己。”
事实上,目前谷歌、百度都已经通过人工智能技术在语音识别、图片识别、无人驾驶等方面展开应用。
“当湖十局,不止求胜,在棋局之外,我们探求的新境界是人类智慧与机器智能的配合,因而围棋智能仅仅是人工智能的副产品,而人工智能的终极目标是让我们拥有更加便捷的生活。”异构智能CEO吴韧说。