Linux下hadoop伪分布式模式部署

左手的ㄟ右手 2022-02-03 10:25 412阅读 0赞

文章目录

  • 一、前言
  • 二、设置环境变量
  • 三、hadoop文件配置
  • 四、启动hadoop
  • 五、总结

一、前言

hadoop伪分布式部署需要jdk环境及安装hadoop,因之前在hadoop单机版配置写过,这里就不多赘述,未配置jdk环境或未安装hadoop可以去看看
https://blog.csdn.net/qq_41521180/article/details/88311299#hadoop_146

二、设置环境变量

编辑环境变量文件

  1. vim ~/.bash_profile

在环境变量中添加hadoop的home、bin、sbin目录,我hadoop安装的路径为/usr/local/hadoop-2.6.5,大家记得修改为自己安装hadoop的路径

  1. HADOOP_HOME=/usr/local/hadoop-2.6.5 //此处改为自己的hadoop目录路径
  2. export HADOOP_HOME
  3. PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
  4. export PATH

在这里插入图片描述
使环境变量生效

  1. source ~/.bash_profile

三、hadoop文件配置

进入hadoop下的etc/hadoop目录编辑hadoop-env.sh文件

  1. vim hadoop-env.sh

注释以下这行

  1. export JAVA_HOME=${JAVA_HOME}

在注释下增加

  1. export JAVA_HOME=/usr/java/jdk1.8.0_191-amd64

路径为jdk安装路径,安装过的可输入 echo $JAVA_HOME获取
在这里插入图片描述
在这里插入图片描述
在hadoop目录下新建tmp文件夹用以存放datanode数据

  1. mkdir tmp

分别配置hdfs-site.xml、core-site.xml、mapred-site.xml、yarn-site.xml文件

配置文件在hadoop目录里的etc/hadoop/目录下
在这里插入图片描述
在hadoop路径下进入配置文件目录

  1. cd etc/hadoop //进入配置文件目录

注意!在配置文件中,云服务器用户的,ip地址需要使用服务器私有ip
可输入ip addr查看或在云服务控制台查看
在这里插入图片描述

1、配置hdfs-site.xml文件

  1. vim hdfs-site.xml

在 < configuration > < /configuration > 里添加以下内容

  1. <!--配置HDFS的副本,冗余度-->
  2. <property>
  3. <name>dfs.replication</name>
  4. <value>1</value>
  5. </property>
  6. <!--配置HDFS的权限-->
  7. <property>
  8. <name>dfs.permissions</name>
  9. <value>false</value>
  10. </property>

在这里插入图片描述
以此类推

2、配置core-site.xml文件

  1. <!--配置存放Datenode数据-->
  2. <property>
  3. <name>hadoop.tem.dir</name>
  4. <value>tem文件路径</value>
  5. </property>
  6. <!-- 配置主机NameNode的主机地址-->
  7. <property>
  8. <name>fs.defaultFS</name>
  9. <value>hdfs://ip地址:9000</value>
  10. </property>

其中 我的tem文件路径为/usr/local/hadoop-2.6.5/tmp,服务器私有ip为
172.18.77.138,大家要根据自身情况修改,以免错误,下同

在这里插入图片描述
3、配置mapred-site.xml文件

  1. <!--配置MR运行框架-->
  2. <configuration>
  3. <property>
  4. <name>mapreduce.framework.name</name>
  5. <value>yarn</value>
  6. </property>
  7. </configuration>

在这里插入图片描述
4、配置yarn-site.xml文件

  1. <!--配置resourcemanagerd的地址-->
  2. <property>
  3. <name>yarn.resourcemanager.hostname</name>
  4. <value>ip地址</value>
  5. </property>
  6. <!--配置Nodename的执行方式-->
  7. <property>
  8. <name>yarn.nodemanager.aux-services</name>
  9. <value>mapreduce_shuffle</value>
  10. </property>

在这里插入图片描述

四、启动hadoop

格式化namenode

  1. hdfs namenode -format

格式化成功后,启动hadoop,有让选择yes/no的选择yes,输入多次密码即可启动成功

  1. start-all.sh

键入jps命令查看结点情况
在这里插入图片描述
如上图则启动成功,在网页输入http://ip:8088 可看到一只黄色小象

注意!!!!:在网页输入的ip地址为公网ip,而不是私有ip

云服务器则需要在安全组开放8088端口才可访问
在这里插入图片描述

五、总结

hadoop伪分布式模式是本地模式的升级版,基本具备所有hadoop功能,如果结点只启动了部分,可以去logs目录查看未启动结点的日志信息,根据错误提示来解决问题。

发表评论

表情:
评论列表 (有 0 条评论,412人围观)

还没有评论,来说两句吧...

相关阅读

    相关 Hadoop部署分布式

    伪分布式模式也是只需要一台机器,但是与本地模式的不同,伪分布式使用的是分布式的思想,具有完整的分布式文件存储和分布式计算的思想。只不过在进行存储和计算的时候涉及到的相关的守护进

    相关 Centos7分布式部署Hadoop

    前期准备 本教程基于vmware中创建的Centos7虚拟机环境进行教学。vmware中创建虚拟机与安装Centos7系统的步骤这里就不再赘述了,直接从系统安装完成后进行