特牛网址导航

动手学强化学习第七章(DQN算法)_dqn更新公式-CSDN博客

网友收藏
文章浏览阅读3.9k次,点赞4次,收藏53次。文章目录DQN算法1.理论部分1.1 简介1.2 经验回放1.3 目标网络2.实践部分DQN算法1.理论部分1.1 简介简而言之,DQN就是解决Q-learning只能应用于离散obs,离散act的状况,当obs连续时再用一个Q表格来记录Q值不再可能,于是引入神经网络来近似表示从连续输入到离散输出之间的函数关系。Q-learning中的更新公式是:Q(s,a)←Q(s,a)+α[r+γmax⁡a′∈AQ(s′,a′)−Q(s,a)]Q(s, a) \leftarrow Q(s, a)+\al_dqn更新公式
标签:dqn更新公式