强化学习(一):基本概念01【state、action、state transition、policy、reward、trajectories、return、episode】

╰+攻爆jí腚メ 2024-02-18 12:07 4阅读 0赞

发表评论

表情:
评论列表 (有 0 条评论,4人围观)

还没有评论,来说两句吧...

相关阅读

    相关 强化学习中的一些概念

    1、强化学习要解决的是贯序决策问题,它不关心输入长什么样子,只关心当前输入下应该采取什么样的动作才能实现最终目标 2、监督学习与强化学习的区别:二者的相同点是都需要大量的数据