热文强化学习六、DQN

到目前为止已经介绍了强化学习的基本方法:基于动态规划的方法、基于蒙特卡罗的方法、基于时间差分的方法。这些方法都有一个基本的前提条件:状态空间和动作空间是离散的,而且都不能太大。

热文我从 HX 辞职了

![我从 HX 辞职了][HX] > 这篇文章早就想写了,结果一直拖到 2020 最后一天,借着年终总结的感觉,记一下流水账,算是给这段经历画上一个句号。 2020 年十一

热文IDEA2020.3详细安装教程

目录 一、官网下载 二、选择安装 下载好之后选择安装包文件点击安装 建议IDEA的安装目录要在全英文路径下。 按照教程一路Next走到底  安装完成重新启动  阅

热文Flume知识点总结

  概述   Flume定义   Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。

热文NIO记录

NIO—NonBlocking IO(new IO) 1. io面向流编程,只能作为输入或者输出流的一种,是同步阻塞的,每一个连接过来都要创建一个线程去处理,线程上下文