• 阿里云服务器部署安装hadoop与elasticsearch踩坑笔记


    2023-09-12 14:00——2023.09.13 20:06

    目录

    00、软件版本

    01、阿里云服务器部署hadoop

    1.1、修改四个配置文件

    1.1.1、core-site.xml

    1.1.2、hdfs-site.xml

    1.1.3、mapred-site.xml

    1.1.4、yarn-site.xml

    1.2、修改系统/etc/hosts文件与系统变量

    1.2.1、修改主机名解析文件/etc/hosts

    1.2.2、修改系统环境变量/etc/profile.d/my_env.sh

    02、阿里云服务器部署elasticsearch

    2.1、三节点的同样操作

    2.2、修改es的elasticsearch.yml文件


    00、软件版本

    环境及软件版本:

    1. centOS 7
    2. jdk-1.8
    3. hadoop-3.3.4
    4. elasticsearch-7.17.6

    01、阿里云服务器部署hadoop

    按照尚硅谷的教程安装hadoop-3.3.4,尚硅谷大数据技术之Hadoop.docx

    1.1、修改四个配置文件

    /opt/module/hadoop/hadoop-3.3.4/etc/hadoop

    1.1.1、core-site.xml

    1. "1.0" encoding="UTF-8"?>
    2. "text/xsl" href="configuration.xsl"?>
    3. <configuration>
    4. <property>
    5. <name>fs.defaultFSname>
    6. <value>hdfs://bd1:8020value>
    7. property>
    8. <property>
    9. <name>hadoop.tmp.dirname>
    10. <value>/opt/module/hadoop/hadoop-3.3.4/datavalue>
    11. property>
    12. <property>
    13. <name>hadoop.http.staticuser.username>
    14. <value>xxhvalue>
    15. property>
    16. <property>
    17. <name>hadoop.proxyuser.xxh.hostsname>
    18. <value>*value>
    19. property>
    20. <property>
    21. <name>hadoop.proxyuser.xxh.groupsname>
    22. <value>*value>
    23. property>
    24. <property>
    25. <name>hadoop.proxyuser.xxh.usersname>
    26. <value>*value>
    27. property>
    28. configuration>

    1.1.2、hdfs-site.xml

    1. "1.0" encoding="UTF-8"?>
    2. "text/xsl" href="configuration.xsl"?>
    3. <configuration>
    4. <property>
    5. <name>dfs.namenode.http-addressname>
    6. <value>bd1:9870value>
    7. property>
    8. <property>
    9. <name>dfs.namenode.secondary.http-addressname>
    10. <value>bd3:9868value>
    11. property>
    12. <property>
    13. <name>dfs.replicationname>
    14. <value>3value>
    15. property>
    16. <property>
    17. <name>dfs.permissionsname>
    18. <value>falsevalue>
    19. property>
    20. configuration>

    1.1.3、mapred-site.xml

    1. "1.0"?>
    2. "text/xsl" href="configuration.xsl"?>
    3. <configuration>
    4. <property>
    5. <name>mapreduce.framework.namename>
    6. <value>yarnvalue>
    7. property>
    8. <property>
    9. <name>mapreduce.jobhistory.addressname>
    10. <value>bd1:10020value>
    11. property>
    12. <property>
    13. <name>mapreduce.jobhistory.webapp.addressname>
    14. <value>bd1:19888value>
    15. property>
    16. configuration>

    1.1.4、yarn-site.xml

    1. "1.0"?>
    2. <configuration>
    3. <property>
    4. <name>yarn.nodemanager.aux-servicesname>
    5. <value>mapreduce_shufflevalue>
    6. property>
    7. <property>
    8. <name>yarn.resourcemanager.hostnamename>
    9. <value>bd2value>
    10. property>
    11. <property>
    12. <name>yarn.nodemanager.env-whitelistname>
    13. <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOMEvalue>
    14. property>
    15. <property>
    16. <name>yarn.scheduler.minimum-allocation-mbname>
    17. <value>512value>
    18. property>
    19. <property>
    20. <name>yarn.scheduler.maximum-allocation-mbname>
    21. <value>4096value>
    22. property>
    23. <property>
    24. <name>yarn.nodemanager.resource.memory-mbname>
    25. <value>4096value>
    26. property>
    27. <property>
    28. <name>yarn.nodemanager.pmem-check-enabledname>
    29. <value>falsevalue>
    30. property>
    31. <property>
    32. <name>yarn.nodemanager.vmem-check-enabledname>
    33. <value>falsevalue>
    34. property>
    35. <property>
    36. <name>yarn.log-aggregation-enablename>
    37. <value>truevalue>
    38. property>
    39. <property>
    40. <name>yarn.log.server.urlname>
    41. <value>http://bd1:19888/jobhistory/logsvalue>
    42. property>
    43. <property>
    44. <name>yarn.log-aggregation.retain-secondsname>
    45. <value>604800value>
    46. property>
    47. configuration>

    1.2、修改系统/etc/hosts文件与系统变量

    1.2.1、修改主机名解析文件/etc/hosts

    [root@bd1 ~]# vim /etc/hosts

    1. # 外网ip地址
    2. x.x.x.x bd1
    3. x.x.x.x bd2
    4. x.x.x.x bd3
    5. # 内网ip地址(使用命令ifconfig命令进行查看)
    6. x.x.x.x bd1
    7. x.x.x.x bd2
    8. x.x.x.x bd3

    1.2.2、修改系统环境变量/etc/profile.d/my_env.sh

    [root@bd1 ~]# vim /etc/profile.d/my_env.sh

    # HADOOP_HOME
    export HADOOP_HOME=/opt/module/hadoop/hadoop-3.3.4
    export PATH=$PATH:$HADOOP_HOME/bin
    export PATH=$PATH:$HADOOP_HOME/sbin

    # HADOOP相关配置【重中之重,使得root用户可以直接运行hadoop】
    export HDFS_NAMENODE_USER=root
    export HDFS_DATANODE_USER=root
    export HDFS_SECONDARYNAMENODE_USER=root
    export YARN_RESOURCEMANAGER_USER=root
    export YARN_NODEMANAGER_USER=root

    1. # JAVA_HOME
    2. export JAVA_HOME=/opt/module/jdk1.8.0_212
    3. export PATH=$PATH:$JAVA_HOME/bin
    4. # HADOOP_HOME
    5. export HADOOP_HOME=/opt/module/hadoop/hadoop-3.3.4
    6. export PATH=$PATH:$HADOOP_HOME/bin
    7. export PATH=$PATH:$HADOOP_HOME/sbin
    8. # zookeeper
    9. export ZK_HOME=/opt/module/zookeeper
    10. export PATH=$ZK_HOME/bin:$PATH
    11. # kafka
    12. #KAFKA_HOME
    13. export KAFKA_HOME=/opt/module/kafka
    14. export PATH=$PATH:$KAFKA_HOME/bin
    15. export PATH=$PATH:/opt/software/tool
    16. # HADOOP相关配置
    17. export HDFS_NAMENODE_USER=root
    18. export HDFS_DATANODE_USER=root
    19. export HDFS_SECONDARYNAMENODE_USER=root
    20. export YARN_RESOURCEMANAGER_USER=root
    21. export YARN_NODEMANAGER_USER=root

    02、阿里云服务器部署elasticsearch

    es安装教程

    1. Linux搭建es集群详细教程(最终版)_es集群搭建_Nick丶Xin的博客-CSDN博客
    2. Linux安装elk_upward337的博客-CSDN博客
    3. [2020-04-06T12:57:13,793][WARN ][o.e.b.ElasticsearchUncaughtExceptionHandler] [node-1] uncaught exce_Lan_Se_Tian_Ma的博客-CSDN博客

    2.1、三节点的同样操作

    三节点集群的服务器,每台服务器都需要:

    1. 创建es用户,useradd espasswd es
    2. 安装elasticsearch,tar -zxvf elasticsearch-7.17.6-linux-x86_64.tar.gz -C /opt/module/es/
    3. 修改elasticsearch文件夹权限,chown -R es:es /opt/module/es/
    4. 修改/etc/...目录下的若干配置文件,vi /etc/security/limits.confvi /etc/security/limits.d/20-nproc.confvi /etc/sysctl.conf
    5. 修改/opt/module/es/elasticsearch-7.17.6/config/jvm.options文件。

    启动elasticsearch时,需要切换到es用户,使用如下命令在后台启动es:

    1. [es@bd1 root]$ nohup /opt/module/es/elasticsearch-7.17.6/bin/elasticsearch & # 后台运行elasticsearch
    2. [es@bd2 root]$ nohup /opt/module/es/elasticsearch-7.17.6/bin/elasticsearch & # 后台运行elasticsearch
    3. [es@bd3 root]$ nohup /opt/module/es/elasticsearch-7.17.6/bin/elasticsearch & # 后台运行elasticsearch

    2.2、修改es的elasticsearch.yml文件

    修改每台服务器的elasticsearch.yml文件(/opt/module/es/elasticsearch-7.17.6/config/elasticsearch.yml),如下两个参数的配置每台服务器都不一样:

    1. node.name: node-1 # 节点名称,每个节点的名称不能重复
    2. network.host: 内网ip地址 # 内网ip地址,每个节点的地址不能重复

    1. # /opt/module/es/elasticsearch-7.17.6/config/elasticsearch.yml
    2. #es加入如下配置
    3. #集群名称
    4. cluster.name: cluster-es-7.17.6
    5. #节点名称,每个节点的名称不能重复
    6. node.name: node-1
    7. #内网ip地址,每个节点的地址不能重复
    8. network.host: 内网ip地址
    9. #是不是有资格主节点
    10. node.master: true
    11. node.data: true
    12. #http端口
    13. http.port: 9200
    14. # 服务通信端口
    15. transport.port: 9300
    16. # 数据文件及日志存储路径
    17. path.data: /opt/module/es/elasticsearch-7.17.6/data
    18. path.logs: /opt/module/es/elasticsearch-7.17.6/logs
    19. # head 插件需要这打开这两个配置
    20. http.cors.allow-origin: "*"
    21. http.cors.enabled: true
    22. http.max_content_length: 200mb
    23. #es7.x 之后新增的配置,初始化一个新的集群时需要此配置来选举 master
    24. cluster.initial_master_nodes: ["node-1"]
    25. #es7.x 之后新增的配置,节点发现
    26. discovery.seed_hosts: ["bd1:9300","bd2:9300","bd3:9300"]
    27. gateway.recover_after_nodes: 2
    28. network.tcp.keep_alive: true
    29. network.tcp.no_delay: true
    30. transport.tcp.compress: true
    31. #集群内同时启动的数据任务个数,默认是 2 个
    32. cluster.routing.allocation.cluster_concurrent_rebalance: 16
    33. #添加或删除节点及负载均衡时并发恢复的线程个数,默认 4 个
    34. cluster.routing.allocation.node_concurrent_recoveries: 16
    35. #初始化数据恢复时,并发恢复线程的个数,默认 4 个
    36. cluster.routing.allocation.node_initial_primaries_recoveries: 16

    😊😘加油~

  • 相关阅读:
    Profiler内存泄露实际案例分析
    剑指 Offer 53 - I. 在排序数组中查找数字 I(改进二分)
    【路径规划】基于卡尔曼滤波、三次插值实现极速赛道赛车路径规划附matlab代码
    pythonn笔记 -- 模块、文件
    试用无线调试器PowerDebugger小记
    清空回收站的照片还能找回来吗?照片恢复用这招
    力扣371周赛
    JAVA学习笔记DAY8——Spring_AOC Spring-tx
    CSS -- Margin Collapsing
    Zigbee 入网过程详解
  • 原文地址:https://blog.csdn.net/weixin_44949135/article/details/132863886