腾讯科技讯 3月14日,据国外媒体报道,谷歌(微博)旗下人工智能公司DeepMind的AlphaGo程序击败韩国围棋冠军李世石(Lee Se-dol),成为近年来人工智能领域少有的里程碑事件。但是AlphaGo至今还只是个程序,甚至不是谷歌的主要项目。但DeepMind创始人杰米斯·哈萨比斯(Demis Hassabis)不久前曾说过,DeepMind想要解决“智慧问题”,而他对如何实现这个目标有很多想法。
哈萨比斯本人拥有不同寻常的经历,但对实现“解决智慧问题”的目标似乎非常有用。这位国际象棋神童曾五次获得脑力奥林匹克运动会(Mind Sports Olympiad)全能脑力王(Pentamind)称号,年轻时即在英国电脑游戏开发商Bullfrog和Lionhead中声名鹊起,曾帮助研发人工智能游戏《主题公园》、《黑或白》等,此后组建了自己的工作室Elixir。在2000年中期,哈萨比斯离开游戏行业,并获得神经系统科学博士学位,2010年创建了DeepMind。
AlphaGo首次战胜李世石后,哈萨比斯接受了美国科技媒体网站The Verge记者萨姆·拜福德(Sam Byford)专访,除了探讨AlphaGo,他还畅谈了视频游戏、下一代智能手机助手、DeepMind在谷歌承担的角色、机器人以及人工智能如何帮助科学研究等话题。文章摘要如下:
1.AlphaGo成为人工智能研究领域的“圣杯”
拜福德:对于那些不怎么了解人工智能或AlphaGo的人,你如何描述昨天发生的“文化共鸣”现象?
哈萨比斯:AlphaGo已经达到完美信息游戏的巅峰,围棋远比国际象棋复杂得多,所以它始终是人工智能研究面临的“圣杯”或“巨大挑战”,特别是自“深蓝”以来。众所周知,尽管我们进行了很多努力,但距离目标依然很遥远。10年前,蒙特卡洛树搜索研究是一大创新,但我认为AlphaGo引入了直觉方面的神经网络,这才是区分最顶级棋手的关键。
拜福德:当你看到AlphaGo下棋时,你会为其特定动作感到惊讶吗?
哈萨比斯:我会,我们都感到非常震惊。我认为李世石也是如此,这从他的面部表情就可看出来。比如当AlphaGo将棋子下入左侧,深入李世石的领地后,我想那是个出人意料的举动。
拜福德:因为这代表侵略性?
哈萨比斯:的确,代表着侵略性和无畏。此外,AlphaGo也在以李世石擅长的策略发动反击。李世石向来以创造性攻击战闻名,而我们也正期望如此。游戏开始时,李世石开始在整个棋盘上布局,对于传统电脑为其程序来说,它们在这方面始终存在短板。它们善于局部计算,但是当放眼全局时,它们的表现就会很糟糕。
拜福德:最初举行次类比赛的重要原因是评估AlphaGo的能力,你从它与李世石的首场对战中有什么感悟吗?
哈萨比斯:我猜我们应该继续沿着当前方向研究,这并未出乎我们的预料。我们曾告诉人们,我们认为比赛胜负难料。我认为任何事都可能发生,我知道李世石可能会采取不同的战略。因此我认为接下来的比赛更值得期待。
刚刚谈及了AlphaGo对于人工智能研究的重要意义,现在我回答你的第一个问题:AlphaGo与深蓝的差异。深蓝是“手工研发”的程序,程序员筛选国际象棋大师的信息,将其转化为具体规则和启发,而我们为AlphaGo植入了学习能力,它可以通过练习和学习积累更多经验,这与人类更为相似。
2.最终将被用于解决现实世界大问题
拜福德:如果AlphaGo继续以同样方式获胜,接下来要做什么,将来是否继续人工智能PK人类的游戏?
哈萨比斯:我认为对于完美信息游戏来说,围棋就是巅峰。当然,可能还有其他顶级围棋大师与之对战,有些游戏也非常困难,多名玩家参战也将产生更大挑战,因为那将不再是完美信息游戏。此外还有各种各样的视频游戏,人类的表现也远超过计算机,比如韩国游戏《星际争霸》。在非完美信息世界中,战略游戏要求更高水平的策略能力,这被称为“永远不可能感知到整个世界”。在围棋游戏中,你可以在棋盘上一目了然地看到全局,对于计算机来说相对容易。
拜福德:你对亲手打赢《星际争霸》游戏感兴趣吗?
哈萨比斯:或许。在一定程度上,我们只对那些有助于我们研究计划的东西感兴趣。DeepMind的目标不仅仅是获得游戏胜利,还要从中获得乐趣和启发。但从个人角度来说,我喜欢玩游戏,我也曾开发过电脑游戏。可是从某种程度上说,它们又都是试验台,即尝试编写算法并对其进行测试的平台。最终,我们希望能将技术应用于解决现实世界的难题。