DRL前沿之:Hierarchical Deep Reinforcement Learning
来源:互联网 发布:域名隐私保护 免费
比如上图这款游戏,叫做Montezuma’s Revenge。这种游戏类似超级玛丽,难在哪里呢?需要高级的策略。比如图中要拿到钥匙,然后去开门。这对我们而言是通过先验知识得到的。但是很难想象计算机如何仅仅通过图像感知这些内容。感知不到,那么这种游戏也就无从解决。
Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation
来源: arXiv.org
尝试解决这种问题。
不得不说,这个想法显而易见(本人也想过啦)但是,问题的关键是
如何确定内在的目标???
说白了就是人工给定目标。然后再来训练。(本质上就是嵌套两个DQN)
那就没什么意思了。
这样从直观感觉可以训练出来。
但是意义就比较小了。
这篇文章比较夸大的提出层次DRL来解决稀疏反馈的问题,但是实际上并不算真正的解决,中间的目标给定太过人工,不具备通用性。也不太可能像作者说的专门为这些游戏开发一个游戏目标物体检测算法。
但是,在否则这篇文章价值的同时,它也是有一定意义的。比如对于自动驾驶汽车,之前Nvidia完全的端到端训练实现自动驾驶,但是如果中间加入一个物体检测作为顶层决策环节,或许可以大大提高控制水平。
而对于image caption这种问题,也是同样的道理。先物体检测,再进入RNN输出文字描述。
不过,个人却不喜欢这种做法。虽然会work,但不智能。
- DRL前沿之:Hierarchical Deep Reinforcement Learning
- DRL前沿之:Benchmarking Deep Reinforcement Learning for Continuous Control
- Deep Reinforcement Learning 基础知识
- Deep Reinforcement Learning
- Deep Reinforcement learning
- DRL前沿之:End to End Learning for Self-Driving Cars
- FeUdal Networks for Hierarchical Reinforcement Learning 阅读笔记
- Deep Reinforcement Learning 深度增强学习资源
- Deep Reinforcement Learning 基础知识(DQN方面)
- Deep Reinforcement Learning Papers 强化学习论文集
- Deep Reinforcement Learning 基础知识(DQN方面)
- Deep Reinforcement Learning 深度增强学习资源
- Playing Atari with Deep Reinforcement Learning
- Deep Reinforcement Learning for Dialogue Generation
- Playing Atari with Deep Reinforcement Learning
- Deep Reinforcement Learning 深度增强学习资源
- 【DQN】深度增强学习Deep Reinforcement Learning
- Deep Reinforcement Learning for Dialogue Generation 翻译
- GIT的认识
- java和Spring发送邮件
- UVA - 11997 K Smallest Sums
- Nginx配置PHP框架时出现Access Denied时的解决办法
- test
- DRL前沿之:Hierarchical Deep Reinforcement Learning
- 如何将jpg转换成pdf图片格式
- 俩台服务器搭建redis主从的问题
- AngularJs获取数组的元素例子
- 博客第一天!努力的开始!
- 安卓 集成微信支付和支付宝
- 详细解析Dynamo存储引擎
- GitHub 上Top100 的 Objective-C 项目
- 微信消息回复