zookeeper/HA集群配置

1.zookeep配置

1.1 安装4台虚拟机

（1）按照如下设置准备四台虚拟机，其中三台作为zookeeper，配置每台机器相应的IP，hostname，下载vim，ntpdate配置定时器定时更新时间，psmisc（psmisc用于管理系统上运行进程，包括ps、kill、fuser、pstree等命令它能够更方便地使用Linux操作系统）

192.168.142.136 node1 zookeeper

192.168.142.137 node2 zookeeper

192.168.142.138 node3 zookeeper

192.168.142.139 node4

（2）四台机器vim /etc/hosts追加4台主机IP和hostname

（3）配置4台机器之间的免密通信：例如在node1上拷贝公钥至node2，node3，node4上

1.2 在四台机器上安装jdk并配置环境变量

环境变量文件可通过scp命令复制到其他三台机器

1.3 修改配置文件

（1）配置sysctl.conf文件：vim /etc/sysctl.conf文件末尾追加以下内容

vm.swappiness=0

vm.overcommit_memory=1

vm.overcommit_ratio=80

修改完成后，通过scp命令拷贝至其他3台机器

scp /etc/sysctl.conf root@node2:/etc/

scp /etc/sysctl.conf root@node3:/etc/

scp /etc/sysctl.conf root@node4:/etc/

（2）编辑文件：vim /etc/security/limits.conf

添加以下内容

hadoop soft nofile 16384

hadoop hard nofile 65536

hadoop soft nproc 16384

hadoop hard nproc 65536

修改完成后，通过scp命令拷贝至其他3台机器

1.4 安装zookeeper

（1）解压至/opt/soft目录下，并改名为zk345

（2）cd /opt/soft/zk345/conf切换目录

1）拷贝目录下文件：cp zoo_sample.cfg zoo.cfg

2）编辑zoo.cfg文件：vim ./zoo.cfg

dataDir=/opt/soft/zk345/tmp/zookeeper

dataLogDir=/opt/soft/zk345/tmp/logs

server.0=192.168.142.136:2287:3387

server.1=192.168.142.137:2287:3387

server.2=192.168.142.138:2287:3387

server.A=B:C:D。

A是一个数字，表示这个是第几号服务器；

B是这个服务器的IP地址；

C是这个服务器与集群中的Leader服务器交换信息的端口；

D是万一集群中的Leader服务器挂了，需要一个端口来重新进行选举，选出一个新的Leader，而这个端口就是用来执行选举时服务器相互通信的端口。

集群模式下配置一个文件myid，这个文件在dataDir目录下，这个文件里面有一个数据就是A的值，Zookeeper启动时读取此文件，拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是哪个server。

（3）创建目录：mkdir -p /opt/soft/zk345/tmp/zookeeper

在该目录下创建myid文件，文件内容为0

（4）配置环境变量：vim /etc/profile

#zk

export ZOOKEEPER_HOME=/opt/soft/zk345

export PATH=$PATH:$ZOOKEEPER_HOME/bin

配置完成后拷贝到其他三台机器上，并source更新

（5）配置完成后将zk345文件复制到node2和node3上

scp -r /opt/soft/zk345/ root@node2:/opt/soft/

scp -r /opt/soft/zk345/ root@node3:/opt/soft/

复制完成后将node2和node3上的myid内容分别改为1和2

（6）配置完成后在node1,2,3上启动zkServer：zkServer.sh start

注：如果出现错误，在zk345目录下查看zookeeper.out文件内输出的错误信息，若发现不能自动创建logs文件夹，手动创建文件夹：mkdir -p /opt/soft/zk345/tmp/logs

（7）完成启动zookeeper服务，并查看状态：zkServer.sh status

2.配置hadoop

安装hadoop，配置6个文件

确保三台zk集群正常启动

zkServer.sh start/stop/status

启动journalnode

四台机器上执行：hdfs –daemon start journalnode

初始化node1，node2

hadoop namenode -format会生成data目录

同步nn1和nn2拷贝data文件夹至node2机器：scp -r ./data/ root@node2:/opt/soft/hadoop313/

node1初始化hdfs zkfc -formatZK

启动hadoop

相关阅读:
depends工具查看exe和dll依赖关系
米勒拉宾算法——素性测试
SDUT—Python程序设计实验五(列表与元组)
Zotero(3)---使用茉莉花插件提取中文文献信息
深度分析：用户最喜欢用哪种NFT做头像
面试不到10分钟就被赶出来了，问的实在是太变态了...
【算法题】2525. 根据规则将箱子分类
【附源码】Python计算机毕业设计寿险公司保险业务管理系统
fiddler使用教程
[博士后申请]套磁信的五大误区

原文地址：https://blog.csdn.net/weixin_63713552/article/details/132696126