澎湃新闻记者 徐明徽
在人工智能领域,谷歌和Facebook正在进行着一场比赛,而用人工智能战胜职业围棋选手,被视为这场比赛的第一局。
1月28日,《自然》杂志以封面论文形式宣布Google DeepMind公司的人工智能程序 AlphaGo以5:0的比分战胜欧洲围棋冠军樊麾。
谷歌先胜一局。
“人工智能”概念自诞生起一直争议不断,但人类依旧在发展人工智能的道路上寻求不断地突破,在各种棋类游戏中战胜人类被视为人工智能“智商”的测试方式。
1997年人工智能第一次打败人类国际象棋选手,2006年后再无人类战胜过最顶尖的人工智能国际象棋选手。
而围棋成为了科技大拿们攻坚的下一个城堡——它是典型的人工智能命题,极其困难而充满着吸引力。
1990年代开始,就出现了如“手谈”(中国陈志行教授开发)、“Gun Go”(开源软件组织GNU开发)为代表的计算机围棋程序,但这批程序的棋力尚不及人类业余选手初段。
21世纪,以“蒙特卡洛树搜索”为全新思路的新程序开始在9×9的“小棋盘”实现突破,其中以法国的“MoGo”和“CrazyStone”为代表,棋力基本达到人类职业选手水平。
随着新程序的思路不断改进,“CrazyStone”和日本的“Zen”在真正的围棋比赛上已经能在人类职业棋手让子的前提下赢得盘面。
近年来,随着Google与Facebook这样具有强大研发实力的科技大公司的加入,计算机围棋界更加风起云涌。经过《自然》杂志的介绍,公众已经熟知“AlphaGo”。相比Google此时的风光,也在开发人工智能以战胜人类棋手的Facebook心里可不是好滋味。
这两家顶尖科技公司早已展开了一场破解围棋的人工智能竞赛,Facebook开发的人工智能Darkforest(黑暗森林)在今年1月的KGS锦标赛获得了第三名。1月28日下午,Facebook人工智能实验室负责人Yann LeCun表示:“Darkforest被AlphaGo吊打了。”
开发围棋人工智能的瓶颈在哪?你可能小时候看过一个宰相向国王求赏的故事:印度寒舍王要奖赏象棋发明人西萨·班·达依尔,西萨看似胃口不大,对国王请求在棋盘的第一个小格内放一粒麦子,第二个小格放二粒,第三格放四粒,以此类推下去直到放满64个格子。国王没有意识到指数级增长的威力而欣然答允,然而事后才发现整个国库的米都倒干净了仍然无法填满整个棋盘。西萨的结局是被国王杀掉了。
可以想见,指数级增长可算是大规模计算第一大“拦路虎”了。围棋有3的361次方种局面,而可观测到的宇宙,原子数量才10的80次方。
卡耐基梅隆大学机器人系博士、Facebook人工智能组研究员田渊栋曾说过:“围棋难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆,同时状态空间大,也没有全局的结构。这两点加起来,迫使目前计算机只能用穷举法并且因此进展缓慢。”
谷歌“AlphaGo”的核心是两种不同的深度神经网络——“策略网络”(policy network)和 “价值网络”(value network)。“策略网络”负责减少搜索的宽度,“价值网络”负责减少搜索的深度,它们合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在程序可以完成的范围里,重点分析那些有戏的棋着,本质上和人类棋手所做的一样。
Facebook的团队也在几个月前开始独立研究围棋人工智能项目,田渊栋开发的程序“Darkforest”,同样是将卷积神经网络和蒙特卡洛树搜索进行了有机结合。
Yann LeCun在自己的Facebook上发文介绍,第一版的“Darkforest”完全是基于卷积神经网络,通过有监督模式的训练让它来模仿人类选手。研究小组将大量的比赛棋盘格局输入到卷积神经网络中,以此来训练它预测人类选手的下一步走法。
它的输入是一个带有注释的完整的19×19围棋棋盘,而神经网络输出的是一个代表着人类专业棋手每一步走法概率分布的棋盘地图。这充分利用了卷积神经网络的模式识别能力,而这种能力在图像中的物体识别、人脸识别和语音识别方面的成功早就得到了证明。
2015年11月,田渊栋在International Conference on Learning Representations(ICLR,机器学习领域的著名期刊和会议)上提交了论文,称“Darkforest”已达到了围棋五段的水平。
与Facebook公开发表研究进展不同,Google的研究工作显然更加保密。
2015年12月初,Google DeepMind负责人Hassabis在接受对外采访时,就围棋算法问题表示自己还不能谈论此事,“但几个月后,会给公众一个大惊喜。”此时,Google已经将“AlphaGo”的研究论文投稿至《自然》杂志。
就在《自然》刊出“AlphaGo”论文的前一天,2016年1月27日,Facebook对去年11月刊发的论文进行了更新。新论文描述了“Darkforest”的最新版本“Darkforest3”,该程序已经在KGS服务器上运营了一个多月,并取得了成人组第五的排名。这个排名意味着它已经成为全美国最好的前100名选手之一,也步入了世界最顶尖围棋人工智能之列。
1月28日,《自然》刊出Google DeepMind “AlphaGo”的论文。而Yann LeCun在Facebook上写道:“AlphaGo的水平比Darkforest高出了6-7个等级。”
从围棋算法上来看,田渊栋在知乎上介绍,“AlphaGo”的策略网络和“Darkforest”采取的办法是一样的“谷歌的做法充分利用了大数据+深度学习的优势,而几乎完全没有用到围棋的领域知识,若是以后棋力再往上走,我也不会惊讶。”
“Darkforest”败给“AlphaGo”,也因为Facebook对其的资源投入无法与Google相比。田渊栋表示,Google发表在《自然》上的文章署名作者就有20位,明显下了血本,第一位David Silver是计算机围棋和强化学习的顶级专家,第二作者作者Aja Huang也写过多年围棋软件。而研发“AlphaGo”的小组成员只有田渊栋本人和另一位同事。此外Google可以投入的计算资源也绝非2、3人的小团队可以比拟的。
Yann LeCun和扎克伯格还是对“Darkforest表示了高度赞扬,Yann LeCun表示:“这个项目是由我们一个小团队仅花了几个月时间开发出来的,没有投入任何围棋专家资源(除了比赛录像数据库),这是对机器学习威力的一次伟大证明。”
在Facebook的个人主页上,Yann LeCun还微妙地表示,Facebook对研究的态度一直是“尽早发布,时常发布”,研究团队彼此尽早交换研究成果,能够更快促进科学进步。
对于业界热捧“AlphaGo”的态度,也有不同声音出现。《人工智能学家》主编刘锋博士1月28日在科学网发言,认为从科学实验的统计学角度来看,要求实验对象必须达到一定数量,进行多次独立实验,才能相对确保结果的稳定性和可靠性。“谷歌在这篇论文中出现了奇怪的现象。对其他围棋程序选取了众多测试对象,并进行了495次实验,但对人类测试者,却只选取了一位职业围棋二段选手,而不是测试多位不同等级的围棋选手。”
刘峰认为,“AlphaGo”也应该像“Darkforest”一样,放到互联网平台接受大众挑战。“我们并不恶意推测谷歌使用强大影响力影响参与测试的围棋选手,让他(他们)没有全力应对,但这一点也的确是可能的实验漏洞之一。”
刘峰的疑惑并非毫无道理,不少棋友认为,这场比赛不足以体现樊麾的真实水平。微信公众号《喆理围棋》的棋手李喆六段就该疑问与樊麾进行了询问,樊麾对此回答:“电脑是没有心理负担的,而人有。”
今年3月,“AlphaGo”将于世界冠军李世石对战,这无疑会是一场世界瞩目的战役。不论“AlphaGo”是否能再次战胜人类顶级职业选手,但它已经让我们认识到:人工智能的神经网络运用能力远超过早前的预期,势必将对人类未来的生活产生深远的影响。
人工智能已经不再是科幻小说中的内容,如今我们大多数人生活中已经开始在使用它们。语音搜索、可穿戴设备、无人驾驶技术等都采取了人工智能的基本形式,神经网络最终能够缩小机器和人类之间的差距,未来人们能够教会人工智能更多的东西。
扎克伯格的2016年个人目标就是创建一个人工智能助手。“类似《钢铁侠》中的人工智能助手贾维斯。我开始准备了解现有的技术,并将教会人工智能助手理解我的语音,让它学会控制家中的一切,比如音乐、灯光、温度等。我还计划教会助手识别朋友们的面孔,当朋友们按门铃时,它会让他们进入。”扎克伯格在其Facebook个人主页写道。
Google对于人工智能的探索比Facebook迈的步子更大一些。目前,Google的自动驾驶汽车已经完成了总计70万英里的高速公路无人驾驶巡航里程。去年7月,Google推出了100辆原型车来执行小规模的市区道路测试,这是自动驾驶行业首次进行的规模化城市道路测试。
此外在图形识别和语言识别上,Google也取得了重大进展,提高了系统对语音信息的存储和处理能力,并能够使用上下文、物理定位及其他方式对谈话者的真正含义进行预测,就像人在谈话时大脑所做的一样。
要想在与Google的“军备之战”中不落后风,Facebook新年还需加码了。而在中国,以BAT(百度Baidu、阿里巴巴Alibaba、腾讯Tencent)为代表的互联网巨头,他们着急吗?