- 链接地址:https://blog.csdn.net/lyly1995/article/details/87932306
- 链接标题:【读书笔记】《深入浅出强化学习》思维导图(Reinforce Learning)及前两章节选_强化学习 思维导图-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:4487
文章浏览阅读2.1k次,点赞7次,收藏28次。从最基本的马尔科夫决策过程入手,问题最基本的方法——动态规划方法。解决强化学习问题的基本思路:交互迭代策略和策略改善。介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。定义强化学习:目标:解决决策优化问题。所谓决策优化,是指面对特定状态(State,S),采取什么行动方案(Action,A),才能使收益最大(R..._强化学习 思维导图
版权声明:本文发布于特牛生活网 内容均来源于互联网 如有侵权联系删除
标签:强化学习 思维导图