• Keepalived工具的基本介绍(原理:VRRP协议)


    目录

    一、keepalived工作原理

    1、VRRP

    1.1 VRRP相关术语

    1.2 VRRP相关技术

    1.3 VRRP工作过程

    2、keepalived介绍

    2.1 Keepalived架构

    3、keepalived的工作原理 

    3.1Keepalived高可用故障切换转移原理

    4、脑裂

    4.1什么是脑裂?

    4.2造成脑裂的原因有哪些?

    4.3如何解决keepalived脑裂问题?


    一、keepalived工作原理

    1、VRRP

    VRRP(Virtual Router Redundancy Protocol):虚拟路由冗余协议,解决静态网关单点故障风险,它能够保证当个别节点宕机时,整个网络可以不间断地运行。

    • 物理层:路由器、三层交换机
    • 软件层:keepalived
    1.1 VRRP相关术语
    • 虚拟路由器:Virtual Router
    • 虚拟路由器标识:VRID(0-255),唯一标识虚拟路由器
    • VIP:Virtual IP,虚拟路由器的IP地址
    • VMAC:Virutal MAC (00-00-5e-00-01-VRID)
    • 物理路由器:
    1. master:主设备,虚拟路由器中承担报文转发任务的路由器
    2. backup:备用设备,master路由器出现故障时,能够代替master路由器工作的路由器
    3. priority:优先级,VRRP根据优先级来确定虚拟路由器中每台路由器的地位。
    1.2 VRRP相关技术

    通告:心跳,优先级等;周期性

    工作方式:抢占式,非抢占式

    • 抢占模式:在抢占模式下,如果Backup设备的优先级比当前Master设备的优先级高,则主动将自己切换成Master。
    • 非抢占模式:在非抢占模式下,只要Master设备没有出现故障,Backup设备即使随后被配置了更高的优先级也不会成为Master设备。

    安全认证:

    • 无认证:不进行任何VRRP报文的合法性认证,不提供安全性保障
    • 简单字符认证:预共享密钥,在一个有可能受到安全威胁的网络中,可以将认证方式设置为简单字符认证
    • MD5认证:在一个非常不安全的网络中,可以将认证方式设置为MD5认证

    工作模式:

    • 主/备:单虚拟路由器
    • 主/主:主/备(虚拟路由器1),备/主(虚拟路由器2)
    1.3 VRRP工作过程

    VRRP的工作过程如下:

    (1)VRRP备份组中的设备根据优先级选举出Master。Master设备通过发送免费ARP报文,将虚拟MAC地址通知给与它连接的设备或者主机,从而承担报文转发任务。

    (2)Master设备周期性向备份组内所有Backup设备发送VRRP通告报文,以公布其配置信息(优先级等)和工作状况。

    (3)如果Master设备出现故障,VRRP备份组中的Backup设备将根据优先级重新选举新的Master。

    (4)VRRP备份组状态切换时,Master设备由一台设备切换为另外一台设备,新的Master设备会立即发送携带虚拟路由器的虚拟MAC地址和虚拟IP地址信息的免费ARP报文,刷新与它连接的主机或设备中的MAC表项,从而把用户流量引到新的Master设备上来,整个过程对用户完全透明。

    (5)原Master设备故障恢复时,若该设备为IP地址拥有者(优先级为255),将直接切换至Master状态。若该设备优先级小于255,将首先切换至Backup状态,且其优先级恢复为故障前配置的优先级。

    (6)Backup设备的优先级高于Master设备时,由Backup设备的工作方式(抢占方式和非抢占方式)决定是否重新选举Master。

    2、keepalived介绍

    keepalived基于VRRP协议的软件实现,原生设计目的为了高可用 ipvs服务

    ipvs,IP虚拟服务器(IP Virtual Server,简写为IPVS)。是运行在LVS下的提供负载均衡功能的一种技术。

    keepalived的功能:

    • 基于vrrp协议完成地址流动
    • 为vip地址所在的节点生成ipvs规则(在配置文件中预先定义)
    • 为ipvs集群的各RS(后端的Real Server)做健康状态检测
    • 基于脚本调用接口完成脚本中定义的功能,进而影响集群事务,以此支持nginx、haproxy等服务
    2.1 Keepalived架构

    用户空间核心组件:

    • vrrp stack:VIP消息通告
    • checkers:监测real server
    • system call:实现 vrrp 协议状态转换时调用脚本的功能
    • SMTP:邮件组件
    • IPVS wrapper:生成IPVS规则
    • Netlink Reflector:网络接口
    • WatchDog:监控进程

    控制组件:提供keepalived.conf 的解析器,完成Keepalived配置

    IO复用器:针对网络目的而优化的自己的线程抽象

    内存管理组件:为某些通用的内存管理功能(例如分配,重新分配,发布等)提供访问权限

    3、keepalived的工作原理 

    Keepalived高可用对之间是通过VRRP进行通信的,VRRP是通过竞选机制来确定主备节点的,主节点的优先级高于备节点,因此,工作时主节点会优先获得所有的资源,备节点处于等待状态,当主节点出现故障时,备节点就会接管主节点的资源,然后顶替主节点对外提供服务。

    在Keepalived服务对之间,只有作为主节点的服务器会一直发送 VRRP广播包,告诉备节点它还活着,此时备节点不会抢占主节点资源,当主节点不可用时,即备节点监听不到主节点发送的广播包时,备节点就会启动相关服务接管主节点的资源,保证业务的连续性。接管速度最快可以小于1秒。

    3.1Keepalived高可用故障切换转移原理

    Keepalived高可用服务之间的故障切换转移,还是通过VRRP(Vritual Route Redundancy Protocol,虚拟路由冗余协议)来实现的 。

    在Keepalived服务正常工作时,Master主节点会不断向Backup备节点发送心跳消息(多播的方式),用来告诉备用节点自己还活着,当Master主节点出现故障时,就无法发送心跳消息,备节点也就因此无法继续检测到来自Master主节点的心跳消息了,于是调用自身的接管程序,接管Master主节点的IP资源及服务。而当Master主节点恢复时,Backup备节点默认又会主动释放主节点故障时自身接管的IP资源及服务,恢复到原来的备用角色。

    4、脑裂

    4.1什么是脑裂?

    在高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来为一整体、动作协调的HA系统,就分裂成为2个独立的个体。

    由于相互失去了联系,都以为是对方出了故障。两个节点上的HA软件像“裂脑人”一样,争抢“共享资源”、争起“应用服务”,就会发生严重后果。共享资源被瓜分、两边“服务”都起不来了;或者两边“服务”都起来了,但同时读写“共享存储”,导致数据损坏

    4.2造成脑裂的原因有哪些?
    1. 高可用服务器对之间心跳线链路发生故障,导致无法正常通信。
    2. 因心跳线坏了(包括断了,老化)。
    3. 因网卡及相关驱动坏了,ip配置及冲突问题(网卡直连)
    4. 因心跳线间连接的设备故障(网卡及交换机)
    5. 因仲裁的机器出问题(采用仲裁的方案)
    6. 高可用服务器上开启了 iptables防火墙阻挡了心跳消息传输。
    7. 高可用服务器上心跳网卡地址等信息配置不正确,导致发送心跳失败
    8. 其他服务配置不当等原因,如心跳方式不同,心跳广插冲突、软件Bug等。
    4.3如何解决keepalived脑裂问题?
    • 同时使用串行电缆和以太网电缆连接、同时使用两条心跳线路,这样一条线路断了,另外一条还是好的,依然能传送心跳消息
    • 当检查脑裂时强行关闭一个心跳节点(这个功能需要特殊设备支持,如stonith、fence)相当于备节点接收不到心跳消息,通过单独的线路发送关机命令关闭主节点的电源
    • 做好对脑裂的监控报警

    解决常见方案:

    • 如果开启防火墙,一定要让心跳消息通过,一般通过允许IP段的形式解决
    • 可以拉一条以太网网线或者串口线作为主被节点心跳线路的冗余
    • 开发检测程序通过监控软件检测脑裂

     

  • 相关阅读:
    文件系统数据
    Jenkins搭建步骤Linux环境
    「C#」异步编程玩法笔记-Thread、ThreadPool、Task
    Elasticsearch学习(一)
    程序地址空间
    题目:2667.创建 Hello World 函数
    使用关键字abstract 声明抽象类-PHP8知识详解
    C: is too small to hold all values of ‘enum ABC‘
    上门洗衣洗鞋app小程序
    【SQL语法基础】什么是存储过程,在实际项目中用得多么?
  • 原文地址:https://blog.csdn.net/zk584715834/article/details/136603977