- 链接地址:https://blog.csdn.net/kittyzc/article/details/85921651
- 链接标题:强化学习系列10:无模型的直接策略搜索_强化学习策略查询方法-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:8206
文章浏览阅读807次。1. 非参函数逼近法在非参函数逼近法中,不是提前确定好ϕ\phiϕ,而是每个样本会成为函数逼近的一部分,比如基于核的函数逼近公式是:ΣiαiyiK(x,xi)+b\Sigma_i\alpha_iy_iK(x,x_i)+bΣiαiyiK(x,xi)+b..._强化学习策略查询方法
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除
标签:强化学习策略查询方法