reinforcement learning

系统管理员 2022-08-23 03:54 35阅读 0赞

we are supposed to be different,folks,and wen people look at us,believe in yourself.

开山之作

Reinforcement Learning: An Introduction

Deep Reinforcement Learning 基础知识（DQN方面）

增强学习Reinforcement Learning经典算法梳理1：policy and value iteration

增强学习Reinforcement Learning经典算法梳理2：蒙特卡洛方法

增强学习Reinforcement Learning经典算法梳理3：TD方法

DRL前沿之：Hierarchical Deep Reinforcement Learning

A Painless Q-learning Tutorial (一个 Q-learning 算法的简明教程)

http://blog.csdn.net/dark\_scope/article/details/8252969

强化学习系列

增强学习（一） ——- 基本概念

增强学习（二）——- 马尔可夫决策过程MDP

增强学习（三）——- MDP的动态规划解法

增强学习（四） ——- 蒙特卡罗方法(Monte Carlo Methods)

增强学习（五）——- 时间差分学习(Q learning, Sarsa learning)

增强学习与马尔科夫决策过程

Torch中的增强学习层

[深度学习]利用Keras深度学习框架和卷积神经网络玩FlappyBird

FlappyBirdRL

用Tensorflow基于Deep Q Learning DQN 玩Flappy Bird

深度强化学习：基于像素的乒乓游戏

深度增强学习方向论文整理

发表评论取消回复

表情：

评论列表（有 0 条评论，35人围观）

还没有评论，来说两句吧...

相关阅读

相关强化学习算法中深度强化学习（Deep Reinforcement Learning）

深度强化学习（Deep Reinforcement Learning）是一种结合深度学习和强化学习的算法，用于解决具有高维状态空间和动作空间的复杂任务。它通过将神经网络作为值函

本是古典何须时尚/ 2024年03月24日 23:33/ 0 赞/ 142 阅读

相关深度学习算法中的强化学习（Reinforcement Learning）

![ac7cd0a8b5d549ef88cb450044b2fcde.png][] 目录引言强化学习在深度学习中的应用自动驾驶游戏玩家机器人控制强化学

谁践踏了优雅/ 2024年03月02日 09:56/ 0 赞/ 89 阅读

相关人工智能-强化学习(Reinforcement Learning)：综述【Actor/Policy π、Critic--＞Q-Learning、Actor+Critic】

强化学习算法 \{ Policy-Based Approach：Policy Gradient算法：Learning an Actor/Policy π Value-base

淩亂°似流年/ 2023年10月05日 16:45/ 0 赞/ 52 阅读

相关 Deep Reinforcement Learning —— DDPG原理和算法

背景描述概括来说，RL要解决的问题是：让agent学习在一个环境中的如何行为动作(act)，从而获得最大的奖励值总和(total reward)。这个奖励值一般与a

小咪咪/ 2022年11月29日 05:48/ 0 赞/ 128 阅读

相关 reinforcement learning

we are supposed to be different,folks,and wen people look at us,believe in yourself

系统管理员/ 2022年08月23日 03:54/ 0 赞/ 36 阅读

相关 NOTE:Deep Reinforcement Learning with a Natural Language Action Space

论文链接：[Deep Reinforcement Learning with a Natural Language Action Space][] 标题：Deep Reinf

ゞ浴缸里的玫瑰/ 2022年07月14日 05:38/ 0 赞/ 88 阅读

相关论文引介 | Information Extraction with Reinforcement Learning

　　文章原名：Improving Information Extraction by Acquiring External Evidence with Reinforcemen

痛定思痛。/ 2022年07月13日 12:39/ 0 赞/ 360 阅读

相关 Deep Reinforcement Learning 基础知识

文章来源： http://blog.csdn.net/songrotek/article/details/50580904 Introduction 深度增强学习Dee

不念不忘少年蓝@/ 2022年06月06日 00:13/ 0 赞/ 189 阅读

相关 Generating Test Input with Deep Reinforcement Learning 论文笔记

[论文地址][Link 1] 摘要 Searchbased Software Testing (SBST)使用metaheuristic algorithms（元启发式

男娘i/ 2022年05月15日 04:40/ 0 赞/ 223 阅读

相关强化学习（Reinforcement Learning, RL）初步介绍

下一篇 [从Multi-arm Bandits问题分析 - RL进阶 ][Multi-arm Bandits_ - RL_]】　　当前的机器学习算法可以分为3种：有监督的学

心已赠人/ 2022年05月10日 05:12/ 0 赞/ 286 阅读