特牛网址导航

强化学习(第二版)笔记——第五章 蒙特卡洛方法_强化学习第2版第五章答案-CSDN博客

网友收藏
文章浏览阅读1k次。参考周博磊老师课程Richard S.Sutton 《Reinforcement Learning》第五章蒙特卡洛方法 Monte Carlo Methods1 蒙特卡洛方法在强化学习中的应用2 蒙特卡洛预测(Monte Carlo Prediction)2.1 蒙特卡洛算法学习状态价值函数2.2 蒙特卡洛算法与动态规划的区别3 动作价值的蒙特卡洛估计3.1 使用蒙特卡洛算法确定动作价值函数3.2 试探性出发4 蒙特卡洛控制4.1 经典策略迭代算法的蒙特卡洛版本4.2 基于试探性出发的蒙特卡洛(_强化学习第2版第五章答案