我的架构梦:(五十九) Apache Hadoop 架构与原理
Apache Hadoop 架构与原理
- 一、Hadoop的重要组成
- 二、HDFS分布式文件系统
- 三、MapReduce编程框架
- 四、YARN资源调度
一、Hadoop的重要组成
Hadoop
=HDFS
(分布式文件系统)+MapReduce
(分布式计算框架)+Yarn
(资源协调框架)+Common
模块
1、Hadoop HDFS:(Hadoop Distribute File System )一个高可靠、高吞吐量的分布式文件系统
比如:100T数据存储,“分而治之”
分:拆分–》数据切割,100T数据拆分为10G一个数据块由一个电脑节点存储这个数据块。
数据切割
、制作副本
、分散储存
图中涉及到几个角色
NameNode
(nn): 存储文件的元数据,比如文件名、文件目录结构、文件属性(生成时间、副
本数、文件权限),以及每个文件的块列表和块所在的DataNode
等。
SecondaryNameNode</
还没有评论,来说两句吧...