+86 400 041 7515

海外经销商:+852 5804 4670

周一至周五:9:00 - 18:00

阿尔法狗再进化 通过自我对弈进行学习升级-热点

邮件分享
打印本页
2017-10-20  

伦敦当地时间10月18日下午6点钟,AlphaGo再次登上世界顶级科学杂志《自然》。导读经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以击败AlphaGo Master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。

阿尔法狗再进化 通过自我对弈进行学习升级

阿尔法狗再进化 通过自我对弈进行学习升级

今年5月,以3:0的比分赢下中国棋手柯洁后,AlphaGo宣布退役,但DeepMind公司并没有停下研究的脚步。伦敦当地时间10月18日,DeepMind团队公布了最强版AlphaGo ,代号AlphaGo Zero。它的独门秘籍,是“自学成才”。而且,是从一张白纸开始,零基础学习,在短短3天内,成为顶级高手。

团队称,AlphaGo Zero的水平已经超过之前所有版本的AlphaGo。在对阵曾赢下韩国棋手李世石那版AlphaGo时,AlphaGo Zero取得了100:0的压倒性战绩。DeepMind团队将关于AlphaGo Zero的相关研究以论文的形式,刊发在了10月18日的《自然》杂志上。

“AlphaGo在两年内达到的成绩令人震惊。现在,AlphaGo Zero是我们最强版本,它提升了很多。Zero提高了计算效率,并且没有使用到任何人类围棋数据,”AlphaGo之父、DeepMind联合创始人兼CEO戴密斯·哈萨比斯(Demis Hassabis)说,“最终,我们想要利用它的算法突破,去帮助解决各种紧迫的现实世界问题,如蛋白质折叠或设计新材料。如果我们通过AlphaGo,可以在这些问题上取得进展,那么它就有潜力推动人们理解生命,并以积极的方式影响我们的生活。”

值得注意的是,虽然AlphaGo Zero在几周的训练期间学会了一些关键概念,但该系统学习的方法与人类有所不同。另外,AlphaGo Zero也比前几代系统更加节能,AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。

来都来了,关注一下吧!

精明买家养成中心

全能顾问服务区

我要提问
标签:
本网注明“来源:居外”的所有作品,版权均属于居外,未经本网授权不得转载、摘编或利用其它方式使用上述作品。违反上述声明者,本网将追究其相关法律责任。 凡本网注明“来源:XXX(非居外)”的作品,均转载自其它媒体,转载目的在于传递更多信息,仅供参考,并不代表本网赞同其观点和对其真实性负责。
关注居外官方微信号
06 月
01
11 月
26
12 月
23
06 月
21
01 月
09
05 月
17
06 月
13
04 月
11
04 月
28
美国资讯索引 more>>
居外名家专栏 more>>
房市看点more>>
提交置业要求
让居外帮你找房

居外服务热线 400-041-7515

港澳台及海外客户请致电
+852 5804 4670

周一至周五 9:00 - 18:00

居外微信服务号 居外微信服务号