发表评论取消回复
相关阅读
相关 Hadoop系列之 MapReduce 性能优化(32)
MapReduce 性能优化 对 MapReduce 作业进行性能调优,需要从 MapReduce 的原理出发。下面来重温一下 MapReduce 原理,并对各个阶段进行
相关 Hadoop系列之MapReduce 计数器(31)
MapReduce 计数器 计数器是收集作业统计信息的有效手段之一,用于质量控制或者应用级统计。计数器还可用于辅助诊断系统故障。如果需要将日志信息传输到 map 或 re
相关 Hadoop系列之MapReduce 推测执行 (30)
MapReduce 推测执行 Hadoop 并不会尝试诊断或者修复执行缓慢的任务,相反,在一个任务运行比预期慢的时候,它会尽量检测,并启动另一个相同的任务作为备份。这就是
相关 Hadoop系列之MapReduce 数据本地化 (29)
MapReduce 数据本地化 数据本地化是指把计算移动到数据所在节点上进行执行的过程,也就是通常所说的 “移动计算而不是移动数据”。移动计算比移动数据具有更大的优势,它
相关 Hadoop系列之MapReduce OutputFormat(27)
MapReduce OutputFormat Hadoop OutputFormat 负责检验 job 的输出规范,RecordWriter 把输出数据写到输出文件的具体
相关 Hadoop系列之MapReduce Partitioner(26)
MapReduce Partitioner MapReduce Partitioner 是用来对 mapper 输出的数据进行分区的。partitioner 通过哈希函数
相关 Hadoop系列之MapReduce RecordReader(25)
MapReduce RecordReader 为了理解 MapReduce 框架的 RecordReader 原理,首先得搞清楚 Hadoop 的数据流程。下面我来了解一
相关 Hadoop系列之MapReduce InputSplit(24)
MapReduce InputSplit ![mapreduce inputsplit原理][mapreduce inputsplit] Hadoop InputSp
相关 Hadoop系列之MapReduce InputFormat(23)
MapReduce InputFormat Hadoop InputFormat 会检查作业的数据输入规范,它把输入文件分割成 InputSplit 分片,并发送给 Ma
相关 Hadoop之资源调度器与任务推测执行
Hadoop之资源调度器 -------------------- 目录 1. 资源调度器概述 2. 先进先出调度器(FIFO) 3. 容量调度器(Capa
还没有评论,来说两句吧...