自动故障切换过程中,MHA总会试图从宕机的主服务器上保存二进制日志,最大程度的保证数据不丢失
但这并不总是可行,例如如果主服务器硬件故障或者无法通过ssh访问,MHA则无法保存二进制日志,只能进行故障转移而丢失了最新的数据
使用MySQL5.5的半同步复制,可以大大降低数据丢失的风险。MHA可以与半同步复制结合起来,如果只有一个slave已经收到了最新的二进制日志,MHA可以将最新的二进制日志应用于其他所有的slave服务器上,因此可以保证所有节点的数据一致性,有时候可故意设置从节点慢于主节点,当发生意外删除数据库倒是数据丢失时可从从节点二进制日志中恢复。
MHA有3个部分
MHA会通过Node监控MySQL数据库服务地节点信息,定期检测和返回Master角色地健康状态(健康检查)
MHA通过将VIP定义在Master节点上,并且数据库的访问也从此VIP进入,当Master异常时,MHA会进行"故障切换",就是VIP漂移+二进制日志保存
漂移到主备节点后,会通过脚本命令来控制MySQL服务器角色的变更,例如将主-备服务器变更为主服务器,将其他的从服务器指向新的主服务器,来继续运行
MHA工作原理总结如下:
1.从宕机崩溃的master保存二进制日志时间(binlog events)
2.识别含有最新的更新的slave日志
3.应用差异的中继日志(relay log)到其他的slave
4.应用从master保存的二进制日志事件
5.提升一个slave为新的master
6.使其他的slave联机新的master进行复制
- MAH manager: 192.168.127.130
- master : 192.168.127.199
- slave1 : 192.168.127.149
- slave2 : 192.168.127.140
-
- 关闭防火墙,核心防护
- systemctl stop firewalld
- systemctl disable firewalld
- setenforce 0
注:部署之前需要配置好主从复制,我这边已经部署好了,详情看上篇博客
- yum install epel-release --nogpgcheck -y
-
- yum install -y perl-DBD-MySQL \
- perl-Config-Tiny \
- perl-Log-Dispatch \
- perl-Parallel-ForkManager \
- perl-ExtUtils-CBuilder \
- perl-ExtUtils-MakeMaker \
- perl-CPAN

在所有服务器上必须先安装node组件,最后在MHA manager节点上安装manager组件,因为manager依赖node组件


注:每台机器上都要安装,这里就不展示了
扩展:node组件安装后也会在/usr/local/bin 下面会生成几个脚本
这些工具通常由 MHAManager 的脚本触发,无需人为操作,主要如下:

| save_binary_logs | 保存和复制 master 的二进制日志 |
|---|---|
| apply_diff_relay_logs | 识别差异的中继日志事件并将其差异的事件应用于其他的 slave |
| filter_mysqlbinlog | 去除不必要的 ROLLBACK 事件 |

扩展:manager组件安装后在/usr/local/bin下面会生成几个工具
主要包括以下几个:
- masterha_check_ssh 检查 MHA 的 SSH 配置状况
- masterha_check_repl 检查 MySQL 复制状况
- masterha_manger 启动 manager的脚本
- masterha_check_status 检测当前 MHA 运行状态
- masterha_master_monitor 检测 master 是否宕机
- masterha_master_switch 控制故障转移(自动或者手动)
- masterha_conf_host 添加或删除配置的 server 信息
- masterha_stop 关闭manager
- ssh-keygen -t rsa #一路回车
- ssh-copy-id 192.168.127.199
- ssh-copy-id 192.168.127.149
- ssh-copy-id 192.168.127.140


- ssh-keygen -t rsa
- ssh-copy-id 192.168.127.149
- ssh-copy-id 192.168.127.140
- ssh-keygen -t rsa
- ssh-copy-id 192.168.127.199
- ssh-copy-id 192.168.127.140
- ssh-keygen -t rsa
- ssh-copy-id 192.168.127.199
- ssh-copy-id 192.168.127.149
- cp -rp /opt/mha4mysql-manager-0.57/samples/scripts /usr/local/bin
-
- #复制后会有四个执行文件
- ll /usr/local/bin/scripts/

| master_ip_failover | 自动切换时 VIP 管理的脚本 |
|---|---|
| master_ip_online_change | 在线切换时 vip 的管理 |
| power_manager | 故障发生后关闭主机的脚本 |
| send_report | 因故障切换后发送报警的脚本 |
- cp /usr/local/bin/scripts/master_ip_failover /usr/local/bin
- ll /usr/local/bin

- vim /usr/local/bin/master_ip_failover
-
- #!/usr/bin/env perl
- use strict;
- use warnings FATAL => 'all';
-
- use Getopt::Long;
-
- my (
- $command, $ssh_user, $orig_master_host, $orig_master_ip,
- $orig_master_port, $new_master_host, $new_master_ip, $new_master_port
- );
- #############################添加内容部分#########################################
- my $vip = '192.168.127.100'; #指定vip的地址
- my $brdc = '192.168.127.255'; #指定vip的广播地址
- my $ifdev = 'ens33'; #指定vip绑定的网卡
- my $key = '1'; #指定vip绑定的虚拟网卡序列号
- my $ssh_start_vip = "/sbin/ifconfig ens33:$key $vip"; #使用ifoconfig命令将其启动,同时设置浮动地址
- my $ssh_stop_vip = "/sbin/ifconfig ens33:$key down"; #可以使用ifconfig命令将其down掉(关闭)
- my $exit_code = 0; #指定退出状态码为0
- #my $ssh_start_vip = "/usr/sbin/ip addr add $vip/24 brd $brdc dev $ifdev label $ifdev:$key;/usr/sbin/arping -q -A -c 1 -I $ifdev $vip;iptables -F;";
- #my $ssh_stop_vip = "/usr/sbin/ip addr del $vip/24 dev $ifdev label $ifdev:$key";
- ##################################################################################
- GetOptions(
- 'command=s' => \$command,
- 'ssh_user=s' => \$ssh_user,
- 'orig_master_host=s' => \$orig_master_host,
- 'orig_master_ip=s' => \$orig_master_ip,
- 'orig_master_port=i' => \$orig_master_port,
- 'new_master_host=s' => \$new_master_host,
- 'new_master_ip=s' => \$new_master_ip,
- 'new_master_port=i' => \$new_master_port,
- );
-
- exit &main();
-
- sub main {
-
- print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n";
-
- if ( $command eq "stop" || $command eq "stopssh" ) {
-
- my $exit_code = 1;
- eval {
- print "Disabling the VIP on old master: $orig_master_host \n";
- &stop_vip();
- $exit_code = 0;
- };
- if ($@) {
- warn "Got Error: $@\n";
- exit $exit_code;
- }
- exit $exit_code;
- }
- elsif ( $command eq "start" ) {
-
- my $exit_code = 10;
- eval {
- print "Enabling the VIP - $vip on the new master - $new_master_host \n";
- &start_vip();
- $exit_code = 0;
- };
- if ($@) {
- warn $@;
- exit $exit_code;
- }
- exit $exit_code;
- }
- elsif ( $command eq "status" ) {
- print "Checking the Status of the script.. OK \n";
- exit 0;
- }
- else {
- &usage();
- exit 1;
- }
- }
- sub start_vip() {
- `ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
- }
- ## A simple system call that disable the VIP on the old_master
- sub stop_vip() {
- `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
- }
-
- sub usage {
- print
- "Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
- }

使用app1.cnf配置文件来管理mysql节点服务器,配置文件一般放在/etc目录下
- mkdir /etc/masterha
- cp /opt/mha4mysql-manager-0.57/samples/conf/app1.cnf /etc/masterha
- ls /etc/masterha/

- vim /etc/masterha/app1.cnf #删除原有内容,直接复制并修改节点服务器的IP地址
-
- [server default]
- #日志文件
- manager_log=/var/log/masterha/app1/manager.log
- #工作目录
- manager_workdir=/var/log/masterha/app1
- #二进制文件
- master_binlog_dir=/usr/local/mysql/data
- #故障转移切换工具
- master_ip_failover_script=/usr/local/bin/master_ip_failover
- #在线切换VIP工具管理
- master_ip_online_change_script=/usr/local/bin/master_ip_online_change
- #以下是密码账号的管理配置
- password=manager #前文创建监控用户mha的密码
- ping_interval=1 #设置监控主库,发送ping包的事件间隔1s,默认是3s,尝试三次没有回应自动进行failover
- remote_workdir=/tmp #在远端mysql在发生切换后时binlog的保存位置
- repl_password=123456 #设置复制用户的密码
- repl_user=myslave #设置复制用户的用户名
- secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.127.149 -s 192.168.127.140 #这里定义的IP都是从数据库服务器节点的IP
- shutdown_script="" #设置故障发送后关闭故障主机脚本(该脚本的主要作用是关闭主机防止发送脑裂,这里没有使用)
- ssh_user=root #设置ssh的登陆用户名
- user=mha #设置监控用户root(管理员)
-
- [server1]
- hostname=192.168.127.199
- port=3306
-
- [server2]
- candidate_master=1 #手动指定主-备服务器 主服务器宕机,优先选则这台为主
- check_repl_delay=0
- hostname=192.168.127.149
- port=3306
-
- [server3]
- hostname=192.168.127.140
- port=3306

-
- ifconfig ens33:1 192.168.127.100/24
- ifconfig ens33:1

如果正常最后会输出 successfully,如下所示
masterha_check_ssh -conf=/etc/masterha/app1.cnf
