当前位置: > 投稿>正文

带你了解AlphaGo的发展历程,前世今生测试(从AlphaGo窥探人工智能的进化轨迹)

02-18 互联网 未知 投稿

关于【带你了解AlphaGo的发展历程】,前世今生测试,今天乾乾小编给您分享一下,如果对您有所帮助别忘了关注本站哦。

1、人机大战:从AlphaGo窥探人工智能的进化轨迹

提要

借着谷歌IO大会的东风,《连线》杂志发文深入剖析AI向人类进化的整个过程。结果李世石成功在右方收气,稳住一大片形势。以下为文章主要内容:

带你了解AlphaGo的发展历程,前世今生测试(从AlphaGo窥探人工智能的进化轨迹)

黄士杰的手从黑色的棋盒中摸出了一个黑子,不过他并没有转移他的视线,棋子在他的大拇指和食指之间徘徊。最后,他把黑子落在棋盘一个很空的区域。棋盘对面,李世石-过去十年中最好的棋手,凝神屏息。他看着37手的落子,然后站起来就离开了。

在解说室,迈克尔·雷德蒙是通过闭路电视观看了这场比赛。雷德蒙,西方唯一的九段棋手,所得到的震撼并不亚于李世石本人。 “我真的不知道这是一步好棋还是坏棋。”当时有近200万人观看了比赛。

美国围棋协会通讯副总裁英语解说员克里斯·加洛克表示,“我认为这是一个错误。”

几分钟后,李世石回到比赛房间。一分钟过去了,接着又过去了十五分钟。最后,李世石将白子落在了黄士杰所落黑子的旁边。但李世石并没有从打击中恢复过来。四小时二十分钟后,他败下阵来。

但黄士杰并不是这场比赛的真正赢家。他只是奉命行事,传达人工智能旨意的傀儡,黄士杰身旁的电子屏幕链接了数百个分布在世界各地的谷歌数据中心,人们把它命名AlphaGo。它击败了可能是有史以来人类设计的最复杂的游戏中最好的选手。

在同一房间,另一围棋高手手三次欧洲冠军樊麾也在注视着比赛。首先,李世石的第37手同样让他产生了疑惑。但他与AlphaGo的纠葛比其他任何人类都多,他是AlphaGo的陪练。五个多月,他与AlphaGo进行了上百盘比赛。它一天天看着他长大,他的失败次数越来越多,但他是最了解AlphaGo的人。和其他人一样都做不到。看着AlphaGo的第37子落地,他觉得这不是常人的举动,但琢磨10秒后,他表示,“太妙了,如此精妙。”

在五场比赛中,AlphaGo获得压倒性胜利。第37手表明AlphaGo不只是有程序堆砌用运算进行预测。当下AlphaGo证明它可以理解围棋,或者至少能够表现出某种理解围棋的能力,就好像真正的棋手一样。李世石坐在对面,AlphaGo显示了棋手通常称为棋感的东西。不仅像人一样下棋,甚至超出常人。第37步具有历史意义,机器和人类终于开始有了真正融合的一天。

带你了解AlphaGo的发展历程,前世今生测试(从AlphaGo窥探人工智能的进化轨迹)

David Silver是AlphaGo团队的领军人物

哈萨比斯1976年生于伦敦,母亲是新加坡华侨,父亲是希腊裔塞浦路斯人。他4岁开始接触国际象棋,聪敏的天资早已表露无遗,小小年纪就在国内外比赛屡获殊荣,13岁晋身「大师级」(chessmaster),在14岁以下棋手中名列世界第二,仅次被喻为史上最强女棋手、匈牙利的波尔加尔(JuditPolgár)。

哈萨比斯8岁时以象棋比赛奖金买下一部Spectrum电脑,靠看书及杂志学懂编写程式,兴趣亦渐渐由棋盘转至电脑。哈萨比斯16岁完成A-Level考试获剑桥大学取录,趁休学年加入英国Bulldog制作公司,变身录像游戏设计师。由他操刀设计及编写程式的模拟管理游戏《主题公园》(ThemePark)大受欢迎,销量数百万。

重返校园在剑桥攻读电脑后,哈萨比斯对AI的兴趣日浓,立志投身其中,更以棋手一贯的深谋远虑,谋定20年大计,一步步向着梦想进发。他毕业后先创立游戏开发公司ElixirStudio,学习创业营商之道;28岁在伦敦大学学院(UCL)攻读认知神经科学博士课程,主力研究脑部负责导航、回忆及想像的海马回(hippocampus),为打造思考方式更近似人类的电脑铺路,他提出的新理论更获《科学》杂志选为2007年十大科技突破。

1997 年,当 IBM 深蓝电脑击败国际象棋冠军的那一刻,正好是Demis在剑桥大学攻读电脑科学的时候,在剑桥内第一次接触到围棋-这个已有千年历史的棋类运动。Demis回忆,当时看到这场比赛内心萌生很多想法,也让他下定决心,有一天要做出一个下围棋胜过人类的电脑系统。

游戏,就是他探索这个宇宙的第一步。早在 17 岁时,Demis就曾制作过一套名为主题公园(ThemePark)的模拟游戏,全球销售超过百万套。离开剑桥后,Demis创办了电子游戏公司ElixirStudios,10年后他重回校园,在伦敦大学完成认知神经科学博士学位,也在麻省理工和哈佛大学从事博士后研究。

作为一个神经科学家、电脑科学家和国际象棋神童。 2010年,它与ShaneLegg、MustafaSuleyman两人共同创办了DeepMind。在DeepMind官网首页,他们这么写下公司宗旨:“解构智慧,用它来让世界更好。”AlphaGo,就是DeepMind跨入AI领域的重要一步,这一步,世界瞩目,但即使AlphaGo证明自己能够胜过人脑,大家感到期待、惊讶,隐而未显的却是更多对于未来的恐惧。

对于人工智慧的发展,持反对意见的科技意见领袖不少,包括特斯拉的马斯克、科学家史蒂芬?霍金都是知名的反对派,霍金更曾语出惊人一句人工智慧将使人类灭绝。人们害怕的是人工智能会不会有一天懂得思考?会不会铺天盖地控制我们的生活?

但Demis表示,我不觉得AI是个威胁,我觉得他很令人惊奇!相较于媒体询问到任何有关AlphaGo的技术细节,Demis总能细细的、不厌其烦的解释。他在讲这一句话的时候,语气特别加重了些。

在Demis眼中,AI并不是用来取代人类,AI终归是一项工具,意在让人类的生活进步。机器不会有喜、不会有怒,当然也不会感到疲惫,机器可以不间断的进行运算,在数以百万计的数据资料中,找出最有价值的一个。运用在医疗、科学领域,都能带来极大的帮助,但人类的思想、好奇、想像,才是创造出这一切的根本。AlphaGo在围棋中胜过人类,但不代表它能够知道或是理解自己正在做些什么,要从机器学习进步到机器理解,还有非常长的距离,让机器能像人脑一样理解,也不会是DeepMind未来要做的。

所以,Demis如何想像未来5年有AI的世界?“我觉得其实不会有什么太大的改变,可能你的手机、你的家庭用品更理解你的使用行为了,也或许无人车满街跑了,但如果说是什么天翻地覆的改变,我觉得不会。”

带你了解AlphaGo的发展历程,前世今生测试(从AlphaGo窥探人工智能的进化轨迹)

DeepMind创始人Demis Hassabis

没人会拿6.5亿美金建造只会下棋的机器,深度学习和神经网络已经深入谷歌的各种服务。AlphaGo和以往那些会下棋的机器人的区别在于,他不是被设计出来专门下棋的,他是来“学习”下棋的——这是一个有着“深度学习”功能的机器人,他的使命在于模仿人类的思维进行学习。

换句话说,他今天可以学下棋,明天就可以学写歌。其次,传统的会下棋的机器人是根据一步棋子带来的所有的可能性来布局的,导出所有可能的结果,再往前推“当前这一步该怎么走”,但是这在围棋上是不可行的。

围棋每回合的可能性可达250种,一盘棋可以长达150回,总共有3^361种局面,而我们目前可观测到的宇宙,原子数量才10^80,所以根本不可能逆推计算。所以这就是AlphaGo机器人最厉害的地方,他不是一个机械的编码程序,他有一个“监督预判机制”,每走一步,他会考虑这种走法是不是更有前途,这是一种类似“想象力”的能力。

这种思维模式,几乎和人类的直觉类似,使得他前所未有地更加像人类。一直以来,外界普遍认为利用人工智能超越围棋专业选手至少需要10年。

韩国围棋九段棋手李世石与Google人工智能程序AlphaGo之间的“人机对弈”展开第四局,在近五个小时的激战之后,李世石最终扳回一局,取得首胜。李世石称AlphaGo的程序虽然表现惊人,但也展现出弱点。而外界也期望李世石能在余下两局为人脑挣回一些面子。出战第四局时,李世石进场时神情较前几天轻松。但在对弈开始后,手执白子的李世石不断陷入长时间思考,而且逐渐落入下风。

战至中盘,AlphaGo的思考时间比李世石足足用少近1小时,一些直播评论甚至认为已经看不到李世石有逆转的希望。眼看李世石即将进入每一手必须在60秒内落子的“读秒”阶段,令形势更加不利,但他却妙招频出,尤其于第78手下了一子妙棋,成功令僵局现出生机,并能逐步串连起占据棋盘各处的白成功令僵局现出生机,并能逐步串连起占据棋盘各处的白子。有职业棋手形容李世石下出“神之一手”,甚至猜测李世石是否已经看穿AlphaGo的行棋弱点,故意在布局阶段布下诱敌之阵。

李世石逆转形势后,在右方发动攻势,AlphaGo开始计算应对办法。然而,AlphaGo一度看似想在右方“提劫”,却没有成功,反而跑出“死子”。有职业棋手判断,李世石下出AlphaGo计算以外的变化,让程序出现混乱,甚至笑言程序可能发生故障。现场评论指,就连AlphaGo开发者之一,连日来代其走子的黄士杰看到AlphaGo在右方下子招式时也面露困惑。结果李世石成功在右方“收气”,稳住一大片形势。战至这个阶段,AlphaGo每下一手平均都要思考3分钟以上。职业棋手们判断AlphaGo已无法扭转劣势,胜负已分。而李世石在“收官”阶段,仍然小心翼翼,没有出现失误。最终,AlphaGo投子认输,李世石获得首胜。这也是AlphaGo自去年10月以5:0战胜欧洲围棋冠军樊麾后,首次在对奕中向人类“投降”。

由于李世石在第四局执白获胜,在他自己的要求下,第五局比赛由他执黑先行。李世石选择了较为稳健的开局,AlphaGo则继续走出新鲜的招法。不过AlphaGo在右下角出现了令人费解的下法,白棋“送死”了数子,这也再次表现出AlphaGo似乎不太在乎局部的损失。棋局进入中盘,李世石在左上角一手“尖冲”试图削弱中央白棋势力范围,但AlphaGo在空中反镇,中央模样逐渐成型;李世石在上边稳健做活,AlphaGo又顺势围出中央大空。

后半盘AlphaGo的实力开始展现,但李世石也并未放弃。尽管再次进入“读秒”,但李世石连续走出强硬下法,试图把局面变得更加复杂,以干扰AlphaGo的判断。但发挥稳健的AlphaGo把微弱的优势保持到了最后,李世石于180手投子认负。

带你了解AlphaGo的发展历程,前世今生测试(从AlphaGo窥探人工智能的进化轨迹)

AlphaGo的训练者樊麾

世界上也许只有一人可以与李世石感同身受那就是樊麾,三届欧洲冠军和AlphaGo事实上的教练。他曾以5:0输给AlphaGo。随后,樊麾加盟DeepMind作为训练者。樊麾不断的输掉棋局。但是,随着樊麾不断输给AlphaGo,有趣的事情发生了。范来以一种全新的方式开始看待围棋。在与其他人的比赛中他赢得更多,棋力上升,排名飙升。AlphaGo事实上也在训练他。

对阵谷歌的AI重新燃起了李世石对围棋的激情。这些天来,世界上最大的,最富有的科技公司利用AlphaGo建立具有竞争优势的技术。哪些应用可以更好识别照片?能够对语音命令做出反应?不久,这些相同类型的系统可以帮助机器人与真实世界的进行向人一样的互动。

在比赛前,Hassabis告诉世界AlphaGo的AI技术可以推动一种新的科学研究,让人类突破新的领域。当时,这些说法毫无凭证,让人认为是典型的高科技炒作。但现在不是了,机器做了非常人性化的事情甚至比人类还要好。是的,你可以看到AlphaGo的37手证明了作为机器向人类进化的早期征兆。或者你可以认为:没有AlphaGo的37手,就不会有李世石的78手。

带你了解AlphaGo的发展历程,前世今生测试(从AlphaGo窥探人工智能的进化轨迹)

(来源:《连线》杂志)

带你了解AlphaGo的发展历程,前世今生测试(从AlphaGo窥探人工智能的进化轨迹)

新兴产业智库

助新兴产品“落户”

申报top10评选,直戳“阅读原文”

2、前世今生,带你了解AlphaGo的发展历程

阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。

AlphaGo的主要设计者:

大卫·席尔瓦 (David Silver),剑桥大学计算机科学学士,硕士,加拿大阿尔伯塔大学计算机科学博士。现为伦敦大学学院讲师及Google DeepMind研究员。

黄士杰(Aja Huang),台湾交通大学计算机科学学士,台湾师范大学计算机科学硕士和博士,加拿大阿尔伯塔大学计算机科学博士后。现为Google DeepMind研究员。

阿尔法围棋(AlphaGo)是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。

这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。

第一大脑:落子选择器 (Move Picker)

阿尔法围棋(AlphaGo)的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。

第二大脑:棋局评估器 (Position Evaluator)

阿尔法围棋(AlphaGo)的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。

2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾。2016年3月挑战世界围棋冠军、职业九段选手李世石。根据日程安排,5盘棋将分别于3月9日、10日、12日、13日和15日举行,即使一方率先取得3胜,也会下满5盘。最后以4:1结束了这场“战争”。

2016年3月27日,AlphaGo确认挑战《星际争霸2》。2016年12月29日晚起,一个注册为“master”、标注为韩国九段的“网络棋手”接连“踢馆”弈城网和野狐网。 2016年12月29日晚起到2017年1月4日晚,master对战人类顶尖高手的战绩是60胜0负。最后一盘前,大师透露,“他”就是阿尔法围棋(AlphaGo)。

2017年5月23日-27日柯洁与围棋人工智能AlphaGo在“中国乌镇·围棋峰会”展开对弈。三局比赛,分别于5月23、25、27日进行。

在未来,Alpha Go将和医疗、机器人等进行结合,更好的服务人类。

本文关键词:前世今生2副本详细攻略,前世今生书籍简介,前世今生追夫火葬场小说,前世今生,前世今生催眠。这就是关于《带你了解AlphaGo的发展历程,前世今生测试(从AlphaGo窥探人工智能的进化轨迹)》的所有内容,希望对您能有所帮助!更多的知识请继续关注《犇涌向乾》百科知识网站:http://www.029ztxx.com!

版权声明: 本站仅提供信息存储空间服务,旨在传递更多信息,不拥有所有权,不承担相关法律责任,不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请发送邮件至 举报,一经查实,本站将立刻删除。

猜你喜欢