• Linux-Hadoop部署


    一、Hadoop部署模式

    1、独立模式

    在独立模式下,所有程序都在单个JVM上执行,调试Hadoop集群的MapReduce程序也非常方便。一般情况下,该模式常用于学习或开发阶段进行调试程序。

    2、伪分布式模式

    在伪分布式模式下, Hadoop程序的守护进程都运行在一台节点上,该模式主要用于调试Hadoop分布式程序的代码,以及程序执行是否正确。伪分布式模式是完全分布式模式的一个特例。

    3、完全分布式模式

    在完全分布式模式下,Hadoop的守护进程分别运行在由多个主机搭建的集群上,不同节点担任不同的角色,在实际工作应用开发中,通常使用该模式构建企业级Hadoop系统。

    二、Hadoop集群规划

    1、集群拓扑

    • 一个主节点,两个从节点
      请添加图片描述

    2、角色分配

    • 完全分布式Hadoop集群搭建需要在集群的每个节点都安装Hadoop,集群角色分配如下表所示。
    节点角色
    masterNameNode, DataNode
    slave1DataNode
    slave2DataNode

    三、JDK安装与配置

    由于Hadoop是由Java语言开发的,Hadoop集群的使用依赖于Java环境,因此安装Hadoop集群之前,需要先安装并配置好JDK。

    1、下载JDK压缩包

    • 下载链接:Oracle (需要登录Oracle官网才能下载)
    • 百度网盘下载:👉jdk221 、👉jdk231

    2、上传到master虚拟机

    • 将JDK压缩包上传到master虚拟机/opt目录
      请添加图片描述

    查看上传的JDK压缩包
    请添加图片描述

    3、在master虚拟机上安装配置JDK

    • 执行命令:tar -zxvf jdk-8u231-linux-x64.tar.gz -C /usr/local,将JDK压缩包解压到指定目录
      请添加图片描述

    • 执行命令:ll /usr/local/jdk1.8.0_231,查看解压之后的jdk1.8.0_231目录

    请添加图片描述

    • 执行命令:vim /etc/profilevi /etc/profile,配置环境变量
      请添加图片描述
    export JAVA_HOME=/usr/local/jdk1.8.0_231
    export PATH=$JAVA_HOME/bin:$PATH
    export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
    
    • 1
    • 2
    • 3
    • 存盘退出,执行命令:source /etc/profile,让配置生效
      请添加图片描述

    • 查看JDK版本
      请添加图片描述

    • 编写一个Java程序 - HelloWorld.java
      请添加图片描述

    • 存盘退出后,执行命令:javac HelloWorld.java,编译成字节码文件
      请添加图片描述

    • 执行命令:java HelloWorld
      请添加图片描述

    4、将JDK分发到slave1和slave2虚拟机

    执行命令:scp -r $JAVA_HOME root@slave1:$JAVA_HOME (-r:recursive - 递归)
    请添加图片描述

    • 在slave1虚拟机上查看JDK是否拷贝成功
      请添加图片描述

    • 执行命令:scp -r $JAVA_HOME root@slave2:$JAVA_HOME (-r recursive - 递归)

    请添加图片描述

    • 在slave2虚拟机上查看JDK是否拷贝成功
      请添加图片描述

    5、将环境配置文件分发到slave1和slave2虚拟机

    • 执行命令:scp /etc/profile root@slave1:/etc
      请添加图片描述

    • 执行命令:scp /etc/profile root@slave2:/etc
      请添加图片描述

    • 在slave1与slave2虚拟机上执行命令:source /etc/profile,让环境配置生效

    请添加图片描述
    请添加图片描述

    • 在slave1虚拟机上查看JDK版本
      请添加图片描述

    • 在slave2虚拟机上查看JDK版本
      请添加图片描述

    四、Hadoop安装

    1、下载Hadoop压缩包

    2、上传Hadoop压缩包到虚拟机

    • 将Hadoop压缩包上传到master虚拟机/opt目录
      请添加图片描述

    • 查看上传的Hadoop压缩包
      请添加图片描述

    3、将Hadoop压缩包解压到指定目录

    • 执行命令:tar -xzvf hadoop-3.3.4.tar.gz -C /usr/local
      请添加图片描述

    • 查看解压之后的hadoop目录
      请添加图片描述

    目录作用
    bin目录命令脚本
    etc/hadoop目录存放hadoop的配置文件
    lib目录hadoop运行的依赖jar包
    sbin目录存放启动和关闭hadoop等命令
    libexec目录存放的也是hadoop命令,但一般不常用
    • 在配置Hadoop时,常用的就是binetcsbin三个目录

    • 查看bin目录
      请添加图片描述

    • 查看etc/hadoop目录,主要是hadoop配置文件
      请添加图片描述

    • 查看sbin目录
      请添加图片描述

    4、配置Hadoop环境变量

    • 执行命令:vim /etc/profile
      请添加图片描述

    • 说明:hadoop 2.x用不着配置用户,只需要前两行即可

    export HADOOP_HOME=/usr/local/hadoop-3.3.4
    export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
    export HDFS_NAMENODE_USER=root
    export HDFS_DATANODE_USER=root
    export HDFS_SECONDARYNAMENODE_USER=root
    export YARN_RESOURCEMANAGER_USER=root
    export YARN_NODEMANAGER_USER=root
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 存盘退出,执行命令source /etc/profile,让配置生效
      请添加图片描述

    5、验证Hadoop环境

    • 执行命令:hadoop version,检查Hadoop安装是否成功
      请添加图片描述
  • 相关阅读:
    【BSP开发学习4】Linux 内核时间管理
    交叉编译链的问题
    flex布局(学习笔记)
    JavaSE——字符串常量池(StringTable)
    入行测试一年半的心得体会
    软件架构师必需要了解的 saas 架构设计?
    P1347 排序(拓扑 + spfa判断环 or 拓扑[内判断环])
    基于openGauss的五子棋AI项目
    单片机FLASH下载算法的制作
    Servlet生命周期与线程安全
  • 原文地址:https://blog.csdn.net/Pythonwudud/article/details/128120499