- 链接地址:https://blog.csdn.net/LagrangeSK/article/details/82556644
- 链接标题:强化学习系列(十二):Eligibility Traces-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:4642
文章浏览阅读8k次,点赞6次,收藏25次。一、前言Eligibility Traces是强化学习的基本原理之一。例如TD(λλ\lambda)算法,(λλ\lambda)表示eligibility traces的使用情况。几乎所有TD方法,如 Q-Learning或Sarsa,都可以和eligibility traces结合起来生成更高效通用的方法。Eligibility Traces可以用于泛化TD和MC方法。当用eligibi..._eligibility traces
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除