我的架构梦:(五十九) Apache Hadoop 架构与原理

客官°小女子只卖身不卖艺 2022-12-22 09:05 205阅读 0赞

Apache Hadoop 架构与原理

    • 一、Hadoop的重要组成
    • 二、HDFS分布式文件系统
    • 三、MapReduce编程框架
    • 四、YARN资源调度

一、Hadoop的重要组成

Hadoop=HDFS(分布式文件系统)+MapReduce(分布式计算框架)+Yarn(资源协调框架)+Common模块

1、Hadoop HDFS:(Hadoop Distribute File System )一个高可靠、高吞吐量的分布式文件系统

比如:100T数据存储,“分而治之”

分:拆分–》数据切割,100T数据拆分为10G一个数据块由一个电脑节点存储这个数据块。

数据切割制作副本分散储存

在这里插入图片描述
图中涉及到几个角色

NameNode(nn): 存储文件的元数据,比如文件名、文件目录结构、文件属性(生成时间、副
本数、文件权限),以及每个文件的块列表和块所在的DataNode等。

SecondaryNameNode</

发表评论

表情:
评论列表 (有 0 条评论,205人围观)

还没有评论,来说两句吧...

相关阅读