【大数据】 linux | 安装hadoop | 单机hadoop

一、说明

1、着手大数据应用

2、我的环境： CentOS8

3、我的hadoop版本： 3.2.2

4、hadoop依赖jdk，本文不涉及jdk安装与配置，请自行配置

5、我的服务器ip： 192.168.1.102，配置过程看到102请更换为自己服务器的ip

二、准备工作

1、下载安装包

1）云盘
https://pan.baidu.com/s/1m-NwgxGIpniYL7QndNPx9g 
密码：6326

2）其他版本
https://dlcdn.apache.org/hadoop/common/
~~

2、上传服务器

1）我的路径
/opt/hadoop
2）示例图

~~

3、安装与配置hadoop

0）创建用户
useradd hadoop
修改密码
passwd hadoop
密码使用，输入两次
hadoop
说明：hadoop不支持用root操作

增加用户组
groupadd hadoop
usermod -a -G hadoop hadoop
切换成hadoop用户操作
su hadoop
1）解压
tar zxvf hadoop
说明： tab补全

2）进入配置目录
cd /opt/hadoop/hadoop-3.2.2/etc/hadoop
3）打印JAVA_HOME路径并复制，配置要用到
echo $JAVA_HOME
4）配置hadoop-env.sh
vi hadoop-env.sh
增加配置：
export JAVA_HOME=/home/jdk/jdk1.8.0_231
示例图：

5）配置yarn-env.sh
vi yarn-env.sh
新增配置：
export JAVA_HOME=/home/jdk/jdk1.8.0_231
说明：新增到最后一行即可，不再截图

6）配置mapred-env.sh
vi mapred-env.sh
新增配置：
export JAVA_HOME=/home/jdk/jdk1.8.0_231
说明1：新增到最后一行即可

7）配置core-site.xml
vi core-site.xml
新增配置：
<property>
        <name>fs.defaultFSname>
        
        <value>hdfs://192.168.1.102:38020value> 
    property>
 
    <property>
        <name>hadoop.tmp.dirname>
        
        <value>/opt/hadoop/hadoop-3.2.2/datavalue>
    property>
说明：放到标签里面

说明：ip改成自己服务器的ip

8）配置hdfs-site.xml
vi hdfs-site.xml
新增配置：
<property>
        
        <name>dfs.replicationname>
        <value>1value>    
    property>
 
    <property>
        <name>dfs.namenode.http-addressname>
        
        <value>192.168.1.102:50070value>
    property>
说明：放到标签里面

说明：ip改成自己服务器的ip

9）配置yarn-site.xml
vi yarn-site.xml
新增配置：
<property>
        
        <name>yarn.resourcemanager.hostnamename>
        <value>192.168.1.102value>
    property>
 
    <property>
        
        <name>yarn.log-aggregation-enablename>
        <value>truevalue>
    property>
    <property>
        
        <name>yarn.log-aggregation.retain-secondsname>
        <value>86400value>
    property>
 
    <property>
        <name>yarn.nodemanager.aux-servicesname>
        <value>mapreduce_shufflevalue>
    property>
10）配置mapred-site.xml
vi mapred-site.xml
新增配置：
<property>
        
        <name>mapreduce.jobhistory.webapp.addressname>
        <value>192.168.1.102:19888value>
    property>
    
 
     <property>
        
        <name>mapreduce.framework.namename>
        <value>yarnvalue>
    property>
说明：到此hadoop自身配置完成，还需要系统配置

说明： hadoop配置完后，请留意端口；已使用端口：
jobhistory: 19888
namenode: 50070
hadoop服务端： 38020
说明：请保证端口没有被占用，如果被占用，请自行更换

说明：可使用命令查看是否被占用
netstat -anp | grep 38082
11）加入到环境变量
vi ~/.bashrc
最后一行加入配置：
export HADOOP_HOME=/opt/hadoop/hadoop-3.2.2
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
配置生效：
source ~/.bashrc
12）初始化namenode
/opt/hadoop/hadoop-3.2.2/bin/hdfs namenode -format
13）启动namenode
hdfs --daemon start namenode
14）启动datanode
hdfs --daemon start datanode
15）查看是否启动成功
jsp
成功示例：

~~

相关阅读:
Android技术知识点：如何使用数据绑定显示数据
Spring中获取bean的方式
深入理解操作系统——cpu处理机调度详解
如何隐藏自己的代码（很酷）
点云采样方法
Kafaka丢消息吗
文献学习02_A Survey on Deep Learning for Named Entity Recognition_20221121
交通流预测——day59 交通网络动态性与多权重交通图卷积（MW-TGC）网络的交通预测
MIB 6.S081 System calls（1）using gdb
（39）STM32——FLASH闪存

原文地址：https://blog.csdn.net/myloverisxin/article/details/126259949