特牛生活网

【读书笔记】《深入浅出强化学习》思维导图(Reinforce Learning)及前两章节选_强化学习 思维导图-CSDN博客

网友收藏
文章浏览阅读2.1k次,点赞7次,收藏28次。从最基本的马尔科夫决策过程入手,问题最基本的方法——动态规划方法。解决强化学习问题的基本思路:交互迭代策略和策略改善。介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。定义强化学习:目标:解决决策优化问题。所谓决策优化,是指面对特定状态(State,S),采取什么行动方案(Action,A),才能使收益最大(R..._强化学习 思维导图