传媒中国
adall1 adall2
当前位置:传媒中国 > 科技传媒

欲破除人工智能恐慌,先了解下阿尔法狗是怎样炼成的!

栏目:科技     编辑:竹隐    时间:2017-01-27 13:54        阅读量:19233   

“Aja学长(黄士杰)说他们每天都喂程序吃许多职业棋士的棋谱,那时我模糊觉得,只需程序吃的棋谱够多,必定能比人类还要强。”

“它就像一台永念头,在拥有宏大计算能力的谷歌云端一直地练习,永一直歇。这意味着它极也许每秒、每天都在提高。”

假如说,产生在2016年春天的人机大战给围棋界带来的是一次不小的震撼。那么2017年新年,围棋界顶尖的人类棋手们算得上经历了一次“自撤消亡”般的悲壮。

一个代号为Master的神奇棋手前后现身著名棋战网站弈城和野狐,绝不留情地“踢了场子”,在30秒一手的快棋中,除陈耀烨因电脑意外掉线而未完成竞赛,系统自动判为和棋,其余数十位中日韩围棋高手皆铩羽而归。最终Master以60场成功的成就完胜人类。

Master的主人一开始仿佛也不曾料到会出现如此使人高兴的战果。在愈来愈高的关注下,才公布认可这位注册ID的国籍上显示为韩国的懦夫恰是2016年冷艳出现的AlphaGo(阿尔法狗)。

当时,AlphaGo以4∶1的战绩拿下韩国围棋顶尖高手李世石,技惊四座。而目前,它的成长速度开始使人恐怖。有业内人士甚至以为,李世石也许将是人类历史上唯一赢过AlphaGo的人类棋手。

“人工智能方面取得的成功将会是人类历史上最重要的事情。不幸的是,它也也许是最后一件。”素来对人工智能持以小心的世界著名物理学家斯蒂芬·霍金不久前说。

所以,AlphaGo的主人——来自谷歌的Deep Mind团队,是在“呼唤恶魔”吗?阿尔法狗究竟是如何炼成的?

“吃”棋谱的阿尔法狗

台湾围棋教育推行协会秘书长张晓茵关注到AlphaGo的时间也许比许多人都要早。

那是2015年,AlphaGo第一次向人类宣战,它以5∶0横扫三次斩获欧洲围棋冠军的职业二段棋手樊麾。樊麾生于中国西安,现任法国围棋队总锻练。2016年末,在中国一档网络节目中,樊麾讲述了他第一次与AlphaGo竞赛的感悟。樊麾当时并不是没有取胜的机遇,在第五盘中他原来占领必定优势,却因一个初级失误致使全败,樊麾说这是他最苦楚的一个记忆。

可是在当时,AlphaGo的第一次出现并没有引发太多关注,起码在中国大陆,这条消息很快就被吞没在迅速滚动更迭的门户新闻里。

但台湾业余五段棋手张晓茵对这则新闻印象深入,她除过对AlphaGo战力如此之强觉得意外,同时她也有一丝恐怖。更特其余缘由是,这让她的脑海中马上显现出一个人的名字:她的学长黄士杰博士(Aja Huang)。这人恰是后来坐在李世石对面取代AlphaGo落子的那位男子,也是AlphaGo的开发者——谷歌Deep Mind团队的核心人员。

黄士出色生在台湾,是谷歌设计团队中最熟悉围棋的工程师。黄士杰的导师、台湾师范大学资讯工程系教授林顺喜曾对媒体透露,黄士杰本来在交通大学学计算机专业,2001年到师范大学,成为他的研究生。缘由是成就优良,黄士杰毕业后先到加拿大当研究员,2012年到英国Deep Mind公司,成为两位首席设计师之一。

张晓茵与黄士杰了解于台湾师范大学,他们都是该校围棋社最早的一批社员。黄士杰在社里年纪最长,且因他的专业是资讯工程,有关计算机围棋(下称围棋AI)的知识都是由他向社里的学弟学妹传授。张晓茵对南方周末记者说,当时黄在学校里就设计了一个围棋AI程序,该程序还以他的老婆Erica命名。

张晓茵至今仍清楚地记得“吃棋谱”这个说法:“Aja学长说他们每天都喂程序吃许多职业棋士的棋谱,那时我模糊觉得,只需程序吃的棋谱够多,必定能比人类还要强。”

AlphaGo的培训形式之一就是尽量多地“吃掉”人类棋手的棋谱。据有关报道,2015年10月阿尔法狗对阵樊麾时,“吃过”的棋谱是3000万个,但到了挑战世界棋坛16冠王李世石的时候,嚼进肚子里的棋谱已经达到1亿。

樊麾在回想他与AlphaGo的竞赛时说,在与机器棋战的时候,你所发出去的信息被原封不动地反射回来,但缘由是你晓得和你竞赛的是一台机器,所以你会对自己做出的选择逐步产生愈来愈多的疑问,这就好比是“自己被光秃秃地扒光摆在自己眼前”。

“太强了。”柯洁的父亲对南方周末记者回想,这是跻身现当代界围棋顶尖高手之列的柯洁在看到Master一路破关斩将以后的感慨。导致于柯洁发微博时都坦陈,“我尽管早就估计到AI早晚能克服人类,但那也是十年后啊……”

在《体坛周报》棋牌首席记者谢锐看来,这样的感觉绝不只是柯洁独有,“棋手们都懵了”。谁也没想到,围棋AI克服人类的这一天,会来得这么快。

永一直歇地学习

张晓茵以为,在AlphaGo完成60连胜之前,人类棋手对围棋AI的疏忽和歧视几乎到了不可救药的田地。

1997年,代号“深蓝”的计算机程序克服了世界第一的国际象棋巨匠,却没有让在中国起码已有两千多年历史的围棋觉得涓滴的威逼。

固然,在当时围棋界的自信并不是自觉。这个号称人类智力最终碉堡的陈旧游戏,共有361个落子点(而国际象棋唯一64个),围棋每颗棋子的下法也许性也许有2的360次方,比宇宙的原子数还要多。如此宏大单一的也许,对计算机的算力、算法和分析是极大的挑战,它没办法像看待象棋一样,通过蛮力计算而得出结果。

就连AlphaGo所在团队Deep Mind的创始人哈萨比斯(Demis Hassabis)都曾对媒体说,“写出围棋的评价函数是一件不也许的事情”。缘由是更多时候,围棋与棋手的一些相似于“直觉”的物品有关。这也是为什么哈萨比斯要说,“围棋游戏更像是艺术,而非科学”。

Deep Mind公司是2014年1月谷歌收购的人工智能(AI)研究机构,总部位于伦敦。Deep Mind公司致力于构建基于神经网络和“深度学习”系统的强力泛用型的学习算法。

Deep Mind团队曾向媒体透露,之所以选择围棋作为攻关项目,是缘由是,“假如想研发出与‘人类相似’的,弹性智能的算法,以处理各种问题,就没有比游戏更好的测试工具了。计算机最早攻克的游戏是三目棋(Noughts and Crosses,井字棋),以后是西洋跳棋和国际象棋。围棋和国际象棋不一样,博弈的空间更宽敞,变化更是单一,而且很难推断棋子所处地位的价值,所以一直被以为是人工智能领域的最大挑战。所以Deep Mind团队的优先目的就是驯服这一领域。”

为此,哈萨比斯和他的团队做的是,用一种叫做神经网络的研究办法,为程序注入像人类一样的深度学习的能力,即它可通过陆续地练习,从而调整并学习掌握围棋的下法,这比起深蓝,与人类运用脑袋处理问题的方法更加相似。

张晓茵对南方周末记者分析说,黄士杰博士和他的队友们在AlphaGo程序中应当加入了“战略网络(Policy Network)”和“值网络(Value Network)”的技术。所谓战略网络,是指程序在吃下上千万甚至过亿的棋谱后,能够分析出下一步棋在不一样下法时得出的不一样胜率。而值网络是对盘面优势的推断机制,以便及时止损和转变下法。

依据外媒报道,在练习时,Deep Mind团队让两台几乎没有区其余阿尔法狗棋战,即两方能力相当,但下棋的路数有别,最适合下法的一方将胜出。这样的原理,可将之懂得为习武之人采用双手左右互搏的练功办法,陆续地积累经历。“就是自己和自己下。”《成都商报》记者欧鹏以为。

英国《卫报》一则对Deep Mind创始人哈萨比斯的采访报道中写道, “哈萨比斯说阿尔法狗不歇息,即使在圣诞节期间也没有。它就像一台永念头,在拥有宏大计算能力的谷歌云端一直地练习,永一直歇。这意味着它极也许每秒、每天都在提高。”

依据以下快棋著名的中国著名职业棋手罗洗河的分析,Master其实下的都是最简单清楚的棋,了解躲避复杂大型的定式。

这和谢锐的视察一致,“目前看来,部分对杀人类根本不是阿尔法狗的对手。人类棋手必须在棋局一开始就特殊重视全局的布局,制造出大规模对决的局势”。谢锐以Master此次非正式考试为例,95后棋手广泛输得比较惨,而第54局Master碰着擅长全局把控的聂卫平,反而博得比较艰苦。

危险的人工智能?

这句话还能够反过来讲,超过预估三倍。两人商讨后决定定居成都,——编者日前,不能够掌握心灵的细微的地方,这是一场剥离了资本逻辑剥离了技术控制的原始之旅。一次安排几拨人同时拜师。

当时,黄士杰答复师妹,许多事情仍需保密,要比及3月与李世石九段竞赛后才能够说。

至今为止,关于AlphaGo的信息少之又少。对外公布信息时对媒体、内容和机会的谨严挑选,使全部团队因循了谷歌甚至同类科技公司惯有的一种神奇感。南方周末记者曾就AlphaGo的有关研提问题发邮件给Deep Mind团队,但未获对方回应。

然而,AlphaGo主要创始人之一哈萨比斯(Demis Hassabis)给外人的感到却是再普通可是。多家海外媒体记者在报道AlphaGo时都特殊提到,在该团队博得世界注视和赞叹的时候,迎面走来的哈萨比斯是谦虚平和的形象。甚至于,他身上那简单让人误解是实习生的极其普通的上衣、裤子和鞋子,也会成为报道中的一抹亮色。反差之大,很难让观者将他与“象棋神童”“游戏设计巨匠”“名牌大学学霸”,和仅他个人就拿到谷歌8000万英镑收入联络在一起。

哈萨比斯1976年出生在英国北伦敦,在其余孩子还在撒娇的年纪,他就展现出不凡的能力。哈萨比斯4岁学习国际象棋,13岁成为全球排名第二的少年象棋巨匠。在象棋界誉满天下的同时“染指”视频游戏,8岁开始写电脑游戏,17岁就制造了第一款包括人工智能的游戏《主题公园》,后成立自己的视频游戏公司Elixir。

哈萨比斯做了这么多事情也没有落下学习,他20岁就取得了剑桥大学计算机科学两个一等荣誉学士学位。在游戏领域觉得触及天花板时,他又重回学府,拿到伦敦大学学院的认知神经科学博士学位。

依照他自己的说法,不管是曾经试探过的棋般游戏、视频游戏、计算机编程还是目前纵身于人工智能,这些经历都有千丝万缕的联络。比方在16到17岁着眼于开发视频游戏《主题公园》期间,他开始意识到人工智能能够何等壮大。他将之称为“相当重要的具有里程碑式的经历”。而他身上与同代人对比少见的超强智力,将他在不一样学科中积累的经历和经历,有意识地糅合在了一起。

当媒体问他制造出阿尔法狗的缘由,他老是一次又一次有耐心肠讲述团队组建的初志:制造一个通用学习机器,“一套能像生物系一致样学习的灵巧而且能自我顺应的算法,仅仅依仗原始数据就能够掌握任何任务”。

在阿尔法狗横空降生以后,关于人工智能把下围棋的人类逼入绝境的担心开始不绝于耳。事实上,阿尔法狗对人类的辗轧,并没有打击到人们对围棋的酷爱,反而掀起了“围棋热”。据统计,去年阿尔法狗与李世石的人机大战每局都有1亿左右的人观看,网络直播平台对竞赛进行全方位直播。各大媒体均推出专题,对竞赛进行跟踪报道。而中国国家围棋队的高手们也被各大网站“抢购一空”去进行解读。韩国棋院的负责人也对媒体证明,在去年人机大战今后,询问观看围棋竞赛,和请求加入围棋段位赛的人数也有了显著增多。

可是,围棋历来都不是Deep Mind团队的终点,而是开始;通用人工智能才是终纵目的,“通用”才是关键词。这也是为什么谦虚的哈萨比斯在阿尔法狗赢了李世石的时候会说,“阿尔法狗历来都不是我们的唯一,甚至不是我们最重要的研发。”正如他对The Verge (一个美国的科技新闻及媒体网络)的记者说的那样,“我们希望将此运用于更大的真实世界的问题。”

这恰是学界对人工智能的担心的地方。斯蒂芬·霍金、比尔·盖茨、埃隆·马斯克这样台甫鼎鼎的人物不止一次公布表达过对超级人工智能的惊恐。微软创始人比尔·盖茨曾公布表示,人工智能带给人们方便的生活之余终归存在威逼。硅谷狂人埃隆·马斯克在推特上说过,“我们需求非常小心人工智能,它也许比核兵器更危险。”

哈萨比斯固然晓得这些,在答复这些问题时,他会皱起眉头变得严肃。“我发现那些没有真正研究人工智能的人们其实不彻底懂得这些。他们通常没有跟许多人工智能专家深入攀谈。”

“我们距离那种能够达到人类级其余通用智能还得好几十年”,他公布自己的想法,并以为“吃瓜大众”对人工智能的耸人听闻会阻碍极具潜力的近期受益,比方医疗健康、智能手机助手等领域的改革。

客观来讲,“吃瓜大众”很洪水平上遭到电影市场上各式脑洞清奇的科幻电影影响。好比在商量人工智能伦理的电影《机械姬》中,女机器人意识觉悟,并最终报复杀死制造出她的人类“天主”。

事实上,哈萨比斯的团队内部仍然有专门的伦理委员会,用于管控通用人工智能技术的将来运用。当Deep Mind2014年被谷歌用四亿英镑收购时,两边协议中就有一项:“制止将该技术运用于军事或谍报用处。”

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

来源:传媒中国

相关阅读

adl03
adr1
adr2