分享到:文章主题: 288_能击败alpha狗的AI出现了
lazygamer楼主
lazygamer
身份
用户
文章
167158
星座
射手座
积分
2277
等级
紫檀(11)

发信人: lazygamer (lazygamer), 信区: Weiqi
标  题: 288_能击败alpha狗的AI出现了
发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 06:40:27 2019), 转信  [累计积分奖励: 300/0]
  
Figure 2 shows the performance throughout training in each game.  
In Go, MuZero slightly exceeded the performance of AlphaZero, despite using  
less computation per node in the search tree (16 residual blocks per evaluation
in MuZero compared to 20 blocks in AlphaZero).  
  
This suggests that MuZero may be caching its computation in the search tree  
and using each additional application of the dynamics model to gain a deeper  
understanding of the position.
  
更通用,更灵活,更强劲。
  
--
  
※ 修改:·lazygamer 于 Dec  1 06:41:27 2019 修改本文·[FROM: 122.60.196.*]
※ 来源:·山西快3app下载_山西快3app - 花少钱中大奖木社区 http://vkyz.cn·[FROM: 122.60.196.*]
  

附件(2.6MB) 1911.08265.pdf

返回顶部
zszqzzzf第1楼
炼狱天使——反者道之动
身份
用户
文章
133521
星座
魔羯座
积分
32536
等级
楠木(12)

发信人: zszqzzzf (炼狱天使——反者道之动), 信区: Weiqi
标  题: Re: 288_能击败alpha狗的AI出现了
发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 08:43:02 2019), 转信  [累计积分奖励: 500/0]
  
  
【 在 lazygamer (lazygamer) 的大作中提到: 】
: Figure 2 shows the performance throughout training in each game.  
: In Go, MuZero slightly exceeded the performance of AlphaZero, despite using  
: less computation per node in the search tree (16 residual blocks per evaluation
: ...................
谷歌推出终极版AlphaGo:MuZero
  
作为引发AI人工智能热潮的,谷歌的AlphaGo早已为人所熟知。特别是AlphaGo在几乎横
288扫人类围棋选手后,却宣布收手隐退江湖。不过所有人的心里都清楚,围棋项目上人类
是已经不可能战胜AI了。但是对于谷歌旗下的DeepMind来说,战胜人类,显然还不是他
288们开发AlphaGo的终极目的。因此在经过多次技术迭代,算法优化之后。近日,谷歌推出
了终极版的AlphaGo:MuZero。
  
  
288那么这次的MuZero又和之前的AlphaGo有何区别呢。目前DeepMind公开推出的AlphaGo一
共有三个大版本。第一个版本,AlphaGo,能通过学习人类大师的棋谱,再加上自己与自
己下(左右互搏),最后练成高手,战胜人类世界冠军。第二个版本,AlphaZero,可以
288不用人类棋谱,只是懂得规则后就开始左右互搏,3天出关,并且超过阿尔法狗。最后一
个版本,MuZero,没有规则,一开始就左右互搏。像小孩子玩电脑游戏,不用看说明,
上手就玩,在玩中学习规矩(需要给MuZero看一些游戏图像,让它知道什么是正常情况
,已经如何判断输赢)。
  
  
简单来说,就是以前的AlphaGo每换一种游戏(如围棋换成国际象棋),就需要更换核心
算法。因为每种游戏的规则不同,而这些规则通常都已经整合到AI所使用的算法当中。
只有算法中包含有规则,AI才能不断的训练学习,找到如何取胜的最优解。
  
  
对于MuZero的出现,柯洁也发声了
  
但是对于谷歌最新推出的这版MuZero来说,已经完全不需要提前把游戏规则编入算法。
288MuZero是在过程中学习规则,一边学规则,一边训练。并且MuZero可以将这种学习手法
应用到不同游戏中,结果全部达到甚至超出各个游戏的最佳程序(比如围棋中的阿尔法
零)。而且这样训练出来的MuZero在和AlphaZero下围棋时,MuZero搜索步数更少却反而
更强,这说明MuZero对围棋的理解比AlphaZero更深。
  
  
而DeepMind开发MuZero的动机就是,在现实生活中有许多问题(比如股票,战场),并
没有现成的规则,许多规则都在随时改变。因此AI要想能真正应用到现实之中,就要有
能力在没有掌握规则的前提下,边应对边学习规则,最终还要能掌握规则并应对获胜。
而这正是人类以前对人工智能最大的优势。但现在看来,DeepMind再一次把AI的智能山西快3app下载_山西快3app - 花少钱中大奖
288平推进了一大步。虽然现在我们还无法预测AI未来到底是否能超越人类,可是现在面对
人工智能这样快速的发展趋势,你还笑得出来么?
  
  
--
  
※ 来源:·山西快3app下载_山西快3app - 花少钱中大奖木社区 vkyz.cn·[FROM: 121.207.80.*]

返回顶部
GunL第2楼
大尾巴狼
身份
核心驻版
文章
7858
积分
75688
等级
砥柱(15)

发信人: GunL (大尾巴狼), 信区: Weiqi
标  题: Re: 288_能击败alpha狗的AI出现了
发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 11:49:17 2019), 转信  [累计积分奖励: 2000/0]
  
MuZero本身有很高的学术意义。在棋类游戏上的进步主要体现在可以自行学习规则,而不是棋力提升。
论文中用于比较的MuZero在象棋和将棋上并没有超过原来的AZ,在围棋上,MuZero Go的运转方式实际上相当于32B Resnet。32B比20B强是理所当然的。
288另外训练速度快很多。288对于从头开始搞研究的,还是很有吸引力。
  
【 在 zszqzzzf (炼狱天使——反者道之动) 的大作中提到: 】
: 谷歌推出终极版AlphaGo:MuZero
: 作为引发AI人工智能热潮的,谷歌的AlphaGo早已为人所熟知。特别是AlphaGo在几乎横
: 扫人类围棋选手后,却宣布收手隐退江湖。不过所有人的心里都清楚,围棋项目上人类
: ...................
  
--
  
  
※ 来源:·山西快3app下载_山西快3app - 花少钱中大奖木社区 vkyz.cn·[FROM: 123.122.69.*]

返回顶部
computec第3楼
刀傍
身份
元老
文章
49569
积分
53106
等级
椽桷(13)

发信人: computec (刀傍), 信区: Weiqi
标  题: Re: 288_能击败alpha狗的AI出现了
发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 11:54:22 2019), 转信
  
为什么这么多搞围棋ai的 但最具意义的算法总是谷歌开创?
  
【 在 zszqzzzf (炼狱天使——反者道之动) 的大作中提到: 】
: 谷歌推出终极版AlphaGo:MuZero
: 作为引发AI人工智能热潮的,谷歌的AlphaGo早已为人所熟知。特别是AlphaGo在几乎横
: 扫人类围棋选手后,却宣布收手隐退江湖。不过所有人的心里都清楚,围棋项目上人类
: ...................
  
--
世界的所有秘密都被呈现在围棋中,而只要稍微开拓一下视野,那无穷无尽的变化就会滚滚涌现。在那如同迷宫般交错的横线和竖线上思索,然后每次解决困局找到新的棋路的欣喜,就如同发现天下至宝。                                             -- 李昌镐
如果平平淡淡地走,你找不到机会与他战斗。当你对子效理解力强的时候,
即使不发生正面交锋,也能感觉到战斗时的风声鹤唳。                 -- 江维杰
这些波浪在既不小也不大的石头周围 不会感到单一或个别 也没有确切或永恒的名字 -- S
绝大部分人的更多精力是用在了更无聊的事情上。                     -- GunL
  
  
  
※ 来源:·山西快3app下载_山西快3app - 花少钱中大奖木社区 vkyz.cn·[FROM: 106.121.133.*]

返回顶部
GunL第4楼
大尾巴狼
身份
核心驻版
文章
7858
积分
75688
等级
砥柱(15)

发信人: GunL (大尾巴狼), 信区: Weiqi
标  题: Re: 288_能击败alpha狗的AI出现了
发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 12:03:24 2019), 转信
  
把围棋ai换成一般意义的科研课题,把谷歌换成美国,这问题的指向和答案是一样的。
  
【 在 computec (刀傍) 的大作中提到: 】
: 为什么这么多搞围棋ai的 但最具意义的算法总是谷歌开创?
  
  
--
形而上学的含义:当对事物的结构、原理或规律了解不够完整、清晰、准确时,以盲目的推测代替真实结论,并对一切反对意见以“不可知论”的态度加以否定。
最常见的表现是,当形而上学主义者做出一个草率的判断时,会利用对事物了解不充分的特点作为对立观点不成立的证据;与此形成鲜明讽刺的事实是,形而上学主义者的观点本身就建立在了解不充分的基础上。
形而上学主义者经常使用的一种荒谬逻辑是:如果你说我不对,请你给出有力的证据和详细的证明,如果你给不出来,就说明我是对的。换句话说,当双方都无法给出“绝对正确”的观点是,形而上学主义者就认为自己的观点“永远无法反驳”。
因此,形而上学主义者通常都是不可知论的信徒,神秘主义是他们最信赖的掩护。永远忽视事物的内在规律或机制,盲目推崇福尔摩斯的神棍式判断,持续沉迷于因果论证的怪圈,这就是形而上学的本质。
据我观察,山西快3app下载_山西快3app - 花少钱中大奖木上围绕各种话题展开的争论中,充斥着一大批形而上学主义拥泵。希望网友认真学习以上内容,提高认识,维护科学发展观,建设和谐山西快3app下载_山西快3app - 花少钱中大奖木。
  
  
※ 来源:·山西快3app下载_山西快3app - 花少钱中大奖木社区 vkyz.cn·[FROM: 123.122.69.*]

返回顶部
computec第5楼
刀傍
身份
元老
文章
49569
积分
53106
等级
椽桷(13)

发信人: computec (刀傍), 信区: Weiqi
标  题: Re: 288_能击败alpha狗的AI出现了
发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 12:09:23 2019), 转信
  
问题太大容易被忽悠 具体一点好验证
  
是不是和整个社会的价值观有关?
【 在 GunL (大尾巴狼) 的大作中提到: 】
: 把围棋ai换成一般意义的科研课题,把谷歌换成美国,这问题的指向和答案是一样的。
  
  
--
世界的所有秘密都被呈现在围棋中,而只要稍微开拓一下视野,那无穷无尽的变化就会滚滚涌现。在那如同迷宫般交错的横线和竖线上思索,然后每次解决困局找到新的棋路的欣喜,就如同发现天下至宝。                                             -- 李昌镐
如果平平淡淡地走,你找不到机会与他战斗。当你对子效理解力强的时候,
即使不发生正面交锋,也能感觉到战斗时的风声鹤唳。                 -- 江维杰
这些波浪在既不小也不大的石头周围 不会感到单一或个别 也没有确切或永恒的名字 -- S
绝大部分人的更多精力是用在了更无聊的事情上。                     -- GunL
  
  
  
※ 来源:·山西快3app下载_山西快3app - 花少钱中大奖木社区 vkyz.cn·[FROM: 106.121.133.*]

返回顶部
tasdingo第6楼
君子生非异也,善假于物也
身份
用户
文章
24593
星座
天蝎座
积分
54923
等级
梧桐(9)

发信人: tasdingo (君子生非异也,善假于物也), 信区: Weiqi
标  题: Re: 288_能击败alpha狗的AI出现了
发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 12:20:59 2019), 转信
  
什么时候科研能让机器这么搞就好了。。。
  
【 在 GunL (大尾巴狼) 的大作中提到: 】
: 标  题: Re: 288_能击败alpha狗的AI出现了
: 发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 11:49:17 2019), 转信  [累计积分奖励: 2000/0]
:  
: MuZero本身有很高的学术意义。在棋类游戏上的进步主要体现在可以自行学习规则,而不是棋力提升。
: 论文中用于比较的MuZero在象棋和将棋上并没有超过原来的AZ,在围棋上,MuZero Go的运转方式实际上相当于32B Resnet。32B比20B强是理所当然的。
: 另外训练速度快很多。对于从头开始搞研究的,还是很有吸引力。
:  
: 【 在 zszqzzzf (炼狱天使——反者道之动) 的大作中提到: 】
: : 谷歌推出终极版AlphaGo:MuZero
: : 作为引发AI人工智能热潮的,谷歌的AlphaGo早已为人所熟知。特别是AlphaGo在几乎横
: : 扫人类围棋选手后,却宣布收手隐退江湖。不过所有人的心里都清楚,围棋项目上人类
: : ...................
:  
: --
:  
:  
: ※ 来源:·山西快3app下载_山西快3app - 花少钱中大奖木社区 vkyz.cn·[FROM: 123.122.69.*]
  
  
--
  
※ 来源:·山西快3app下载_山西快3app - 花少钱中大奖木社区 vkyz.cn·[FROM: 111.196.215.*]

返回顶部
yellowChange第7楼
yellowChange
身份
用户
文章
3034
星座
天蝎座
积分
36721
等级
灵樨(8)

发信人: yellowChange (yellowChange), 信区: Weiqi
标  题: Re: 288_能击败alpha狗的AI出现了
发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 12:27:19 2019), 转信
  
我估计是他们的核心人员一直就做这个,长期的思考积累
我们的啥热就去做啥,也可以差不多,但是关键攻关时候积累很重要
  
【 在 computec 的大作中提到: 】
: 问题太大容易被忽悠 具体一点好验证
:  
: 是不是和整个社会的价值观有关?
: ....................
  
- 来自「最山西快3app下载_山西快3app - 花少钱中大奖木 for iPhone Xr」
--
  
※ 来源:·最山西快3app下载_山西快3app - 花少钱中大奖木 客户端·[FROM: 123.121.79.*]

返回顶部
beanpole第8楼
咊 期待在春天里
身份
用户
文章
6213
积分
45198
等级
椽桷(13)

发信人: beanpole (咊 期待在春天里), 信区: Weiqi
标  题: Re: 288_能击败alpha狗的AI出现了
发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 12:51:46 2019), 转信
  
让他来大A跟众股份公司大股东过过招~
【 在 zszqzzzf 的大作中提到: 】
: 谷歌推出终极版AlphaGo:MuZero
: 作为引发AI人工智能热潮的,谷歌的AlphaGo早已为人所熟知。特别是AlphaGo在几乎横
: 扫人类围棋选手后,却宣布收手隐退江湖。不过所有人的心里都清楚,围棋项目上人类
: ...................
  
--
  
※ 来源:·山西快3app下载_山西快3app - 花少钱中大奖木社区 http://vkyz.cn·[FROM: 106.127.208.*]

返回顶部
sgdf第9楼
散光大夫
身份
用户
文章
2143
星座
狮子座
积分
50721
等级
沉香(10)

发信人: sgdf (散光大夫), 信区: Weiqi
标  题: Re: 288_能击败alpha狗的AI出现了
发信站: 山西快3app下载_山西快3app - 花少钱中大奖木社区 (Sun Dec  1 12:58:19 2019), 转信
  
让子棋的规则是不是也能自学了?
  
【 在 zszqzzzf 的大作中提到: 】
: 谷歌推出终极版AlphaGo:MuZero
: 作为引发AI人工智能热潮的,谷歌的AlphaGo早已为人所熟知。特别是AlphaGo在几乎横
: 扫人类围棋选手后,却宣布收手隐退江湖。不过所有人的心里都清楚,围棋项目上人类
: ...................
  
--
  
※ 来源:·山西快3app下载_山西快3app - 花少钱中大奖木社区 http://vkyz.cn·[FROM: 171.88.161.*]

返回顶部