reinforcement learning

系统管理员 2022-08-23 03:54 35阅读 0赞

we are supposed to be different,folks,and wen people look at us,believe in yourself.

开山之作

Reinforcement Learning: An Introduction

Deep Reinforcement Learning 基础知识(DQN方面)

增强学习Reinforcement Learning经典算法梳理1:policy and value iteration

增强学习Reinforcement Learning经典算法梳理2:蒙特卡洛方法

增强学习Reinforcement Learning经典算法梳理3:TD方法

DRL前沿之:Hierarchical Deep Reinforcement Learning

A Painless Q-learning Tutorial (一个 Q-learning 算法的简明教程)

http://blog.csdn.net/dark\_scope/article/details/8252969

强化学习系列

增强学习(一) ——- 基本概念

增强学习(二)——- 马尔可夫决策过程MDP

增强学习(三)——- MDP的动态规划解法

增强学习(四) ——- 蒙特卡罗方法(Monte Carlo Methods)

增强学习(五)——- 时间差分学习(Q learning, Sarsa learning)

增强学习与马尔科夫决策过程

Torch中的增强学习层

[深度学习]利用Keras深度学习框架和卷积神经网络玩FlappyBird

FlappyBirdRL

用Tensorflow基于Deep Q Learning DQN 玩Flappy Bird

深度强化学习:基于像素的乒乓游戏

深度增强学习方向论文整理

发表评论

表情:
评论列表 (有 0 条评论,35人围观)

还没有评论,来说两句吧...

相关阅读