强化学习笔记+代码(二):SARSA算法原理和Agent实现

迈不过友情╰ 2023-07-17 15:59 467阅读 0赞

发表评论

表情:
评论列表 (有 0 条评论,467人围观)

还没有评论,来说两句吧...

相关阅读

    相关 强化学习、MDP

            前面已经讲解了什么是强化学习,也以Maze游戏为例形象的介绍了强化学习涉及到的主要概念:S、A、P、R、γ,但并未涉及到数学公式。想了解强化学习的朋友可以参考链