• Hadoop2.7.6集群安装部署记录(3台云服务器)


     安装最后的效果

    HDFSYARN
    hadoop01namenode+datanodenodemanager
    hadoop02datanode+secondarynamenodenodemanager
    hadoop03datanodenodemanager+resourcemanager

    参考:Hadoop 集群安装_iFulling的博客-CSDN博客_hadoop集群的安装

    安装说明

    如果没有特殊说明操作过程中使用账号:rd  Linux账号普通账号新建与授权_磊杰哟的博客-CSDN博客

    准备三台机器:
    192.168.1.18(主)----hadoop01
    192.168.1.137(从)----hadoop02
    192.168.1.248(从)----hadoop03


    jdk安装目录:/usr/local/java
    hadoop安装目录:/home/rd/soft/hadoop-2.7.6

    环境准备

    hadoop安装文件下载

    修改配置文件

    解压安装文件至:/home/rd/soft/hadoop-2.7.6

    以下操作首先在其中一台机器上操作,比如现在hadoop01(192.168.1.18)机器上操作,最后统一传输至其他服务器(hadoop02、hadoop03)

    修改 hadoop-env.sh 文件

    1. 配置hadoop使用的jdk
    2. cd /home/rd/soft/hadoop-2.7.6/etc/hadoop
    3. vi hadoop-env.sh

     修改JAVA_HOME的值为本机的jdk安装根目录

    修改 core-site.xml 文件

    1. 进入hadoop安装目录,创建临时目录tmp(用于存放数据)
    2. /home/rd/soft/hadoop-2.7.6
    3. mkdir tmp

    修改Hadoop核心配置文件core-site.xml,这里配置的是HDFS的地址和端口号。

    cd /home/rd/soft/hadoop-2.7.6/etc/hadoop

    vi core-site.xml

    1. <configuration>
    2.     <property>
    3.         <!--hadoop hdfs的访问入口 namenode的访问入口-->
    4.         <name>fs.defaultFS</name>
    5.         <value>hdfs://hadoop01:9000</value>
    6.     </property>
    7.     <property>
    8.         <!--hadoop namenode的管理数据的存储位置  namenode所在的节点本地-->
    9.         <name>hadoop.tmp.dir</name>
    10.         <value>/home/rd/soft/hadoop-2.7.6/tmp</value>
    11.     </property>
    12. </configuration>

    新建并修改mapred-site.xml 

    cd /home/rd/soft/hadoop-2.7.6/etc/hadoop
    cp mapred-site.xml.template mapred-site.xml

    1. <configuration>
    2. <property>
    3. <name>mapreduce.framework.name</name>
    4. <value>yarn</value>
    5. </property>
    6. </configuration>

    修改mapred-site.xml

    cd /home/rd/soft/hadoop-2.7.6/etc/hadoop

    vi mapred-site.xml

    1. <configuration>
    2. <!-- Site specific YARN configuration properties -->
    3. <property>
    4. <!--resourcemanager节点-->
    5. <name>yarn.resourcemanager.hostname</name>
    6. <value>hadoop03</value>
    7. </property>
    8. <property>
    9. <name>yarn.nodemanager.aux-services</name>
    10. <value>mapreduce_shuffle</value>
    11. <description>YARN 集群为 MapReduce 程序提供的 shuffle 服务</description>
    12. </property>
    13. </configuration>

    新建或修改slaves文件

    1. cd /home/rd/soft/hadoop/etc/hadoop
    2. vi slaves

    在里面删掉"localhost",加入集群中所有Slave机器的IP,也是每行一个。

    1. 192.168.1.18
    2. 192.168.1.248
    3. 192.168.1.137

    将文件复制传输至其他服务器

    从hadoop01机器将hadoop文件传输至其他服务器

    scp -r /home/rd/soft/hadoop-2.7.6 hadoop02:/home/rd/soft

    scp -r /home/rd/soft/hadoop-2.7.6 hadoop03:/home/rd/soft

    配置hadoop环境变量

    • 为了操作方便,切换到root账号修改环境变化;
    • 三台机器全部执行环境变量配置操作并且将配置生效;

    设置环境变量

    1. vi /etc/profile
    2. 最底下追加
    3. export HADOOP_HOME=/home/rd/soft/hadoop-2.7.6
    4. export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

    加载生效当前配置

    source /etc/profile

    确认环境变量配置

    确认上面配置的环境变量配置的是否正确且已经生效

    1. [rd@5ljzd8ppi2avyaqh ~]$ hadoop version
    2. Hadoop 2.7.6
    3. Subversion https://shv@git-wip-us.apache.org/repos/asf/hadoop.git -r 085099c66cf28be31604560c376fa282e69282b8
    4. Compiled by kshvachk on 2018-04-18T01:33Z
    5. Compiled with protoc 2.5.0
    6. From source with checksum 71e2695531cb3360ab74598755d036
    7. This command was run using /home/rd/soft/hadoop/share/hadoop/common/hadoop-common-2.7.6.jar
    8. [rd@5ljzd8ppi2avyaqh ~]$

    格式化

    登录主机器(hadoop01-192.168.1.18)执行下面的命令

    hdfs namenode -format

    关闭防火墙

    systemctl stop firewalld

    启动服务

    在任意节点启动hdfs

    start-dfs.sh

    在resourcemanager(hadoop03)节点启动yarn

    start-yarn.sh

    启动后验证:jps

    启动后效果如下 

    HDFSYARN
    hadoop01namenode+datanodenodemanager
    hadoop02datanode+secondarynamenodenodemanager
    hadoop03datanodenodemanager+resourcemanager

    管控台

    hdfs:http://hadoop01:50070/ 

    yarn:http://hadoop03:8088/ 

  • 相关阅读:
    MySQL5.7.35的安装
    高教社杯数模竞赛特辑论文篇-2018年A题:高温作业专用服装设计(附获奖论文及MATLBA代码)(续)
    springmvc-day01
    java 版本企业招标投标管理系统源码+功能描述+tbms+及时准确+全程电子化
    【Matplotlib绘制图像大全】(十九):Matplotlib绘制等高线
    Pytorch训练深度强化学习时CPU内存占用一直在快速增加
    kafka消费者理解
    使用 Set-Cookies HttpOnly & Secure标志保护 Tomcat
    weak的自动置空
    【HDLBits 刷题 14】Verification Reading Simulations
  • 原文地址:https://blog.csdn.net/weixin_38916435/article/details/127417755