• 大数据学习1.5-单机Hadoop


    1.修改主机信息

    vi /etc/hosts

    2.修改信息如下(这里第三位一定是自己的IP 每个人都不一样)

    1. 192.168.216.140 hadoop01
    2. 192.168.216.141 hadoop02
    3. 192.168.216.142 hadoop03

    3.修改Hadoop配置信息-1进入配置信息文件

    cd /usr/local/hadoop/hadoop-2.7.1/etc/hadoop/

    4.修改Hadoop配置信息-2vi hadoop-env.sh 

    vi hadoop-env.sh 

    追加如下信息

    JAVA_HOME=/usr/local/java/jdk1.8.0_221

    5.修改Hadoop配置信息-3vi hdfs-site.xml

    vi hdfs-site.xml

    追加如下信息(这里是单机 以后还需要改 先一步一步来 )

    1. <property>
    2. <name>dfs.replication</name>
    3. <value>2</value>
    4. </property>
    5. <property>
    6. <name>dfs.namenode.secondary.http-address</name>
    7. <value>hadoop01:50090</value>
    8. </property>

    6.修改Hadoop配置信息-4vi core-site.xml

    vi core-site.xml

    追加如下信息

    1. <property>
    2. <name>fs.defaultFS</name>
    3. <value>hdfs://hadoop01:9000</value>
    4. </property>
    5. <property>
    6. <name>hadoop.tmp.dir</name>
    7. <value>/usr/local/hadoop/hadoop-2.7.1/tmp</value>
    8. </property>

    7.修改Hadoop配置信息-5vi mapred-site.xml

    首先进行一个复制

    cp mapred-site.xml.template mapred-site.xml

    vi mapred-site.xml

    添加下面内容

    1. <property>
    2. <name>MapReduce.framework.name</name>
    3. <value>yarn</value>
    4. </property>

    8.修改Hadoop配置信息-3vi yarn-site.xml

    vi yarn-site.xml

    9.生成公钥和私钥

    ssh-keygen -t rsa

    然后三下回车

    10.发送密钥

    ssh-copy-id hadoop01
    

    11.格式化namenode(第一次启动格式化 以后不需要)

     hdfs namenode -format

    12.切换到hadoop文件夹

    cd /usr/local/hadoop/hadoop-2.7.1/
    

    .

    13.启动hadoop

    sbin/start-all.sh

    14.查看网站

    hadoop01:50090


    15.Hadoop实战-2创建input目录

    hadoop fs -mkdir /input

     16.Hadoop实战-1创建work.txt并编辑

    vi word.txt
    1. Hello Dear Firend
    2. Good Good Study
    3. Day Day up

    17.Hadoop实战-3将word,txt放入input中

     hadoop fs -put word.txt /input/word.txt

    18.Hadoop实战-4进行单词统计

    hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /input/word.txt /output

  • 相关阅读:
    webrtc快速入门——使用 WebRTC 拍摄静止的照片
    前端渲染后端返回的HTML格式的数据
    顶顶通呼叫中心中间件-限制最大通话时间(mod_cti基于FreeSWITCH)
    Textbooks Are All You Need
    LLM实战(二)| 使用ChatGPT API提取文本topic
    0.django部署(基础知识)
    第十九届浙江省 I. Barbecue
    关于操作系统中对进程管理的认识
    学习:原码-反码-补码
    【我的新学期】学习季
  • 原文地址:https://blog.csdn.net/qq_40992158/article/details/132991285