楼主: 514050209
1019 1

【李善宰和你讨论进化神经科学】第二记 [推广有奖]

  • 0关注
  • 9粉丝

博士生

49%

还不是VIP/贵宾

-

威望
0
论坛币
17892 个
通用积分
4.9045
学术水平
16 点
热心指数
19 点
信用等级
16 点
经验
3743 点
帖子
147
精华
0
在线时间
175 小时
注册时间
2013-2-21
最后登录
2024-2-20

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

这种受欢迎程度扩展到AI研究,许多论文和两个不同的比赛证明了这一点。 Pac-Man女士很有趣,因为简单的规则引发了需要复杂的策略来取得成功的游戏。 Pac-Man女士是一个捕食者 - 猎物的情景,有一个扭曲。吃豆人通常是鬼的猎物,但如果吃了药丸,情况就会相反:幽灵暂时成为猎物。游戏动态的切换需要切换游戏策略。换句话说,需要多种不同的行为模式。尽管需要多模式行为,但游戏的大多数学习方法都集中在学习整体策略,无论幽灵是威胁还是可食用,都可以控制Pacman的女士。虽然有可能用这种政策来代表多式联运行为,但是很难这样做。相比之下,本文使用称为模块化多目标NEAT(MM-NEAT)的框架,利用多个输出模块来演化神经网络。每个模块代表不同的策略,代理可以一次使用一个。模块之间的仲裁(即何时使用哪个模块)可以基于类似于多任务学习[1]中使用的人类指定的任务部分,或通过使用指示网络偏好使用每个模块的特殊神经元自动发现。可以使用模块突变(也称为模式突变[2])来修复偏好神经元模块的数量或发现。本文建立在较早的结果,表明模拟神经网络可以成功地演变为Pacman [3]。早期的研究集中在具有固定数量的模块的偏好神经元网络,并且使用一种形式的模块突变演进网络。本文对各种模块进行了评估,并比较了两种模块突变形式[2],这三种形式的组合,以及上述的多任务学习方法。此外,虽然所有早期的结果都是基于不区分威胁和可食用幽灵的传感器,但本文还评估了分裂传感器(第VI-B节),展示了如何在传感器级别并入任务部门。通过模块化网络实现的成果是Pac-Man女士迄今为止最强的学习成果。主要结论是,学习具有偏好神经元的任务部门产生优于非模块化和多任务网络的网络。使用偏好神经元的最好的模块划分是意想不到的:一个模块处理包围时的逃避的关键行为,通常在诱发威胁附近的力量药丸之后的鬼魂,这使得它们更容易吃。因此,MM-NEAT是自动发现游戏代理行为的有前途的方法。本文的进展如下:多模态行为相关工作和Pac-Man女士在第二部分。 Pac-Man女士模拟器在第三部分描述,Pac-Man女士对多模式行为的需求在第四节中有启发。第五节描述了发现这种行为的进化方法。第VI和VII节描述了评估这些方法的实验,这在第八部分中讨论。

schrum.tciaig16.pdf (597.68 KB, 需要: 20 个论坛币)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:李善宰

沙发
墨子巨 发表于 2017-7-17 11:32:48 |只看作者 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-23 16:08