1996年,电脑深蓝与卡斯帕罗夫展开激战。2016年,人工智能与人类的博弈由国际象棋转向了围棋。
不久之后,韩国首尔四季酒店对弈的黑白两方,是围棋高手李世石与人工智能“阿尔法围棋”。
韩国著名围棋九段棋手李世石与谷歌人工智能“阿尔法围棋”(alphago)的5盘对决将于3月9日、10日、12日、13日和15日在首尔举行。比赛用时为每方两小时,一分钟读秒3次,比赛采用中国围棋规则。这场对决的胜者将获得100万美元奖金,如果阿尔法围棋获胜,奖金将捐给联合国儿童基金会和stem教育以及围棋相关公益团体。
关于围棋,王安石曾经有诗云:“莫将戏事扰真情,且可随缘道我赢。战罢两奁分白黑,一枰何处有亏成。”
下棋的胜负,王安石看的很淡,所以才有“战罢两奁分白黑,一枰何处有亏成”之说。但是“阿尔法围棋”与李世石对弈,似乎并没有那么恬淡。我想将王荆公的诗反过来,这样说:“战罢两奁分白黑,一枰处处有亏成”。
因为,人工智能与人类在围棋上的博弈,意义很大。不是没有“亏成”,而是处处有“亏成”。
关于这次对弈,笔者一直在思索这样几个问题。相信,这几个问题也是很多普通人关心的问题。这些问题是:第一,人工智能在围棋方面探索的原理是什么;
第二,此次人工智能与围棋高手的对抗与当年的深蓝有何区别;第三,如果人工智能赢了,有什么意义;第四,如果人工智能输了,李世石赢了,能代表什么;第五,不论输赢的话,人工智能在围棋方面的探索,对人工智能的发展有何意义;第六,在我的心目中,围棋代表着哲学,人工智能在围棋方面的造诣,是否意味着人工智能已经具备了哲学方面的思考能力;第七,人工智能与围棋高手对抗,是不是意味着机器人威胁论又进了一步?第八,前面几个问题,是我从非专业角度思考的,从专业的角度,那些人工智能企业、科学家不知如何看待这个事件。
针对这几个问题,笔者以idonews专栏签约作者的身份,向北京图灵机器人联合创始人、技术负责人韦克礼先生请教,请他回答了这几个问题。
以下,是韦克礼先生的回答。
第一,人工智能在围棋方面探索的原理。
人工智能在棋类的研究基本方法本质都是把棋子可能的走法构建成搜索树,计算能得到最优值的落子选择。目前这种方法在其他很多棋类(中国象棋、国际象棋等)中都能战胜人类的顶尖选手,但在围棋上还是一个挑战。19路围棋的复杂度是10^170,国际象棋的才是10^47,策略变化也更复杂,要计算出初始盘面的最优值(蛮力做法),即使按照现在硬件的计算能力也难以达到。
由于计算围棋盘面最优值的时间随着该盘面到终盘之间的步数呈指数级增长,而围棋程序的运算时间有限,理论上无法得到最优值,从而引入了蒙特卡洛树搜索方法。蒙特卡洛是一类随机方法,特点是在随机采样上计算得到近似结果,采样越多,得到结果的越接近最优解;即在有限的采样中,必须要给出一个解的条件下,蒙特卡洛方法能给出一个靠近最优解的结果。所以在比赛时间受限的情况下,利用蒙特卡洛树搜索仍然可以给出一个“好的选择”。
alphago(阿尔法围棋,笔者注)基于蒙特卡洛树搜索,在选择策略中加入更多的围棋方法的专家知识,使系统的水平不断提高;同时alphago充分利用深度学习和大数据的优势,并与改进的搜索树算法结合,通过自我对局的结果训练使棋力一直在进步。
第二,此次人工智能与围棋高手的对抗与当年深蓝有何区别。
1、挑战的难度不同,围棋复杂度10^170,国际象棋10^47,围棋困难很多。2、神经网络的能力的再次体现,随着硬件计算能力的提高,神经网络在图像、机器翻译等领域的应用已经得到了很好的效果,alphago的深度神经网络包含数百万的神经元,12个不同的网络层,训练后预测对手下步棋的正确率达到了57%(之前记录44%)。3、自我强化学习,除了学习已有的历史棋谱,alphago还通过自我对局,可以无限量增长的对局来评价每步棋子的落子策略,而深蓝是依赖于人工定义的目标函数,相比而言,alphago的自我学习更接近于人类。
第三,如果人工智能赢了,有什么意义。
如果人工智能获胜,更多的应该还是依靠计算能力和稳定性发挥来取胜,说明机器的计算智能又有了进一步的进步。
第四,如果人工智能输了,李世石赢了,能代表什么。
如果人工智能输了,主要原因应该还是训练量不够,相信给人工智能一定的时间进行训练,总有一天会超过人类的,而且这个时间不会超过几年。
第五,不论输赢的话,人工智能在围棋方面的探索,对人工智能的发展有何意义。
无论是否输赢(即使这次不赢,在很短的时间内也会战胜人类顶尖选手),这都可能成为人工智能的一个里程碑。当1997年深蓝战胜了国际象棋冠军的时候,围棋计算机同一般的业余选手都还有不小的距离,因为其复杂性,很多人认为电脑围棋想要战胜人类,至少要等四十年。然而随着ai的发展,在部分领域计算机已经能达到甚至超过人类,如机器在图像识别方面的能力已经超过了人眼识别。而在围棋这样更具深度与挑战的领域,能做到如此重大的突破,相信在其他之前认为只有人类能够完成的领域,例如无人驾驶、智能对话等领域,在不久的将来,人工智能也能逐渐取代人类。
第六,在我的心目中,围棋代表着哲学。人工智能在围棋方面的造诣,是否意味着人工智能已经具备了哲学方面的思考能力。
人工智能的棋艺我更觉得是一种计算能力,因此还谈不上哲学方面的思考能力。
第七,人工智能与围棋高手对抗,是不是意味着机器人威胁论又进了一步?
去年我们组织了一个中关村ai相关的讨论会,其中有一个话题就是关于机器人威胁论的。当时在场大都是偏工程领域的,所以大家达成非常一致的结论是现在业界中的产品更多体现的是ia(智能增强),还没有达到消费者希望的ai(人工智能)的地步,而这个ai的发展的时间也还很长,因此机器人威胁论离我们还很远。对于人工智能与围棋高手对抗,我个人感觉更多还是体现在计算智能的进步,还未达到所期望的认知智能,因为alphago
的进步依赖于海量的自我对局数目,这当然是它的长处,但也恰好说明它并未真正掌握人类的学习能力,因此暂时也谈不上威胁了。
第八,从专业的角度,你们怎么看这个事件。
不论结果如何,这次的事件都可能会成为人工智能的一个里程碑之一。但是alphago
和一切神经网络一样,本质上还只是个大黑盒,我们能观察到它表现出的巨大能力,但对它究竟是如何“思考”的这件事依然所知甚少。在工程上,这是个伟大的胜利。但在科学上,人类所具有的思维、意识等等能力还需要人工智能去进行进一步的挖掘。
在感谢图灵机器人,感谢韦克礼先生解答我困惑的同时,我又想起了纪晓岚关于围棋的两句诗:“局中局外两沉吟,犹是人间胜负心。”我想,这次李世石与阿尔法围棋的对弈,已经不简单是胜负之心了,而是我前面所说的:“战罢两奁分白黑,一枰处处有亏成”。
作者:姜伯静|来源:idonews专栏