hadoop 集群安装

朱雀 2023-06-25 03:17 20阅读 0赞

单机hadoop

集群部署,在单机版基础上进行的,我们需要配置4个机器master,node1,node2,node3
hadoop单机部署 教程 步骤

配置IP

安装完后,需要给4台服务器配置固定IP
教程:VirtualBox最小安装cetnos7后配置固定IP

然后要修改主机名和dns

  1. # 4个依次为master node1 node2 node3
  2. vim /etc/hostname
  3. master
  4. vim /etc/hosts
  5. 127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
  6. ::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
  7. 192.168.56.201 master
  8. 192.168.56.202 node1
  9. 192.168.56.203 node2
  10. 192.168.56.204 node3

免密登录

修改完成后,需要配置ssh免登陆
ssh免密登录教程

  1. # 生成秘钥
  2. ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
  3. id_dsa id_dsa.pub 两个文件复制到 master node1 node2 node3主机上
  4. 复制地址 ~/.ssh/ 这个文件夹下
  5. 然后都执行此操作
  6. cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

基本配置验证

  1. ssh master
  2. ssh node1
  3. ssh node2
  4. ssh node3

配置集群

  1. vim /usr/local/hadoop/etc/hadoop/core-site.xml
  2. 修改 master:9000
  3. <configuration>
  4. <property>
  5. <name>fs.default.name</name>
  6. <value>hdfs://master:9000</value>
  7. </property>
  8. </configuration
  9. vim /usr/local/hadoop/etc/hadoop/yarn-site.xml
  10. 新增
  11. <property>
  12. <name>yarn.resourcemanager.resource-tracker.address</name>
  13. <value>master:8025</value>
  14. </property>
  15. <property>
  16. <name>yarn.resourcemanager.scheduler.address</name>
  17. <value>master:8030</value>
  18. </property>
  19. <property>
  20. <name>yarn.resourcemanager.address</name>
  21. <value>master:8050</value>
  22. </property>
  23. 解释:
  24. resourcemanager nodemanager 连接地址 8025
  25. resourcemanager applicationmaster 连接地址 8030
  26. resourcemanager 客户端连接地址 8050
  27. vim /usr/local/hadoop/etc/hadoop/mapred-site.xml
  28. 修改为
  29. <property>
  30. <name>mapred.job.tracker</name>
  31. <value>master:54311</value>
  32. </property>
  33. # 除了master是namenode,其它都是datanode
  34. vim /usr/local/hadoop/etc/hadoop/hdfs-site.xml
  35. <property>
  36. <name>dfs.replication</name>
  37. <value>3</value>
  38. </property>
  39. <property>
  40. <name>dfs.namenode.name.dir</name>
  41. <value>file:/usr/local/hadoop/hadoop_data/hdfs/datanode</value>
  42. </property>

master 编辑slaves

  1. vim /usr/local/hadoop/etc/hadoop/slaves
  2. node1
  3. node2
  4. node3

node1 node2 node3操作

  1. rm -rf /usr/local/hadoop/hadoop_data/hdfs
  2. mkdir -p /usr/local/hadoop/hadoop_data/hdfs/datanode
  3. # root 可省略给权限的步骤
  4. # sudo chown -R hduser:hduser /usr/local/hadoop

master操作

  1. rm -rf /usr/local/hadoop/hadoop_data/hdfs
  2. mkdir -p /usr/local/hadoop/hadoop_data/hdfs/namenode
  3. sudo chown -R hduser:hduser /usr/local/hadoop

master 启动集群

  1. # 格式化hdfs
  2. hadoop namenode -format
  3. # 启动
  4. start-dfs.sh start-YARN.sh
  5. start-all.sh

网页访问验证

  1. # http://master:8088/
  2. http://192.168.56.201:8088
  3. http://192.168.56.201:50070

集群停止

  1. stop-all.sh

发表评论

表情:
评论列表 (有 0 条评论,20人围观)

还没有评论,来说两句吧...

相关阅读

    相关 Hadoop篇:Hadoop安装

    规划 在搭建Hadoop集群前,我们肯定需要先规划一下集群的各个节点安装的组件。如果你是伪分布式或单机模式,则不需要遵循任何规则,可以随意安装各个组件。如果你是完全分布式

    相关 hadoop 安装

    单机hadoop 集群部署,在单机版基础上进行的,我们需要配置4个机器master,node1,node2,node3 [hadoop单机部署 教程 步骤][hado

    相关 hadoop分布式安装

    搭建分布式集群的前提安装步骤需要每一台机器都要执行(jdk安装,ip配置,主机名设置,hosts文件配置,关闭防火墙,免密登录) 免密登录注意,至少确保主节点可以免密登录到

    相关 hadoop安装教程

    Hadoop介绍: Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高