发表评论取消回复
相关阅读
相关 Hadoop系列之 MapReduce 性能优化(32)
MapReduce 性能优化 对 MapReduce 作业进行性能调优,需要从 MapReduce 的原理出发。下面来重温一下 MapReduce 原理,并对各个阶段进行
相关 Hadoop系列之MapReduce 计数器(31)
MapReduce 计数器 计数器是收集作业统计信息的有效手段之一,用于质量控制或者应用级统计。计数器还可用于辅助诊断系统故障。如果需要将日志信息传输到 map 或 re
相关 Hadoop系列之MapReduce 数据本地化 (29)
MapReduce 数据本地化 数据本地化是指把计算移动到数据所在节点上进行执行的过程,也就是通常所说的 “移动计算而不是移动数据”。移动计算比移动数据具有更大的优势,它
相关 Hadoop系列之MapReduce OutputFormat(27)
MapReduce OutputFormat Hadoop OutputFormat 负责检验 job 的输出规范,RecordWriter 把输出数据写到输出文件的具体
相关 Hadoop系列之MapReduce Partitioner(26)
MapReduce Partitioner MapReduce Partitioner 是用来对 mapper 输出的数据进行分区的。partitioner 通过哈希函数
相关 Hadoop系列之MapReduce RecordReader(25)
MapReduce RecordReader 为了理解 MapReduce 框架的 RecordReader 原理,首先得搞清楚 Hadoop 的数据流程。下面我来了解一
相关 Hadoop系列之MapReduce InputSplit(24)
MapReduce InputSplit ![mapreduce inputsplit原理][mapreduce inputsplit] Hadoop InputSp
相关 Hadoop系列之MapReduce InputFormat(23)
MapReduce InputFormat Hadoop InputFormat 会检查作业的数据输入规范,它把输入文件分割成 InputSplit 分片,并发送给 Ma
相关 Hadoop系列之MapReduce 键值对(22)
MapReduce 键值对 Apache Hadoop 主要用于数据分析,我们利用数据分析里面的统计和逻辑技术来描述,说明和评估数据。Hadoop 可以用来处理机构化,非
相关 Hadoop系列之MapReduce工作原理(20)
MapReduce 工作原理 本节主要详细介绍 MapReduce 的工作原理。 核心组件 ![mapreduce 工作原理][mapreduce] 上面这个流
还没有评论,来说两句吧...