• 交换机堆叠与集群


    交换机堆叠与集群

    堆叠

    istack:智能堆叠

    • 作用:将多台支持堆叠特性的盒式交换机通过istack计算在逻辑上聚合成一台交换机,提高网络的可靠性,简化网络部署和管理,提高了设备及链路的利用率

    • 角色定义

      • 主交换机:一个堆叠系统只有一台主交换机,主要负责管理堆叠系统
      • 备交换机:一个堆叠系统只有一个备交换机,主要用来备份主交换机,当主交换机出现故障时,备交换机全面接替主的工作
      • 从交换机:一个堆叠系统可以有堕胎从交换机,主要用于业务的转发从交换机越多堆叠系统的转发能力越强

    堆叠优先级

    • 每台成员交换机的一个属性,用于选举交换机的角色,值越大越优,缺省为100

    堆叠ID

    • 用于在堆叠系统中唯一标识一台成员交换机
    • 也可以有主交换机分配堆叠ID
    • 作为槽位号,用来区分不同的成员交换机相同的接口号
    • 堆叠的每台成员交换机上支持两个逻辑堆叠口,分别为Stack-port n/1和stack-port n/2,其中n就是堆叠ID
    • 可以将多个物理端口绑定到一个逻辑堆叠口中,从高提高堆叠系统的可靠性和堆叠带宽
    • 堆叠成员交换机之间互联,本端的stack-port n/1必须与对端的stack-port n/2相连

    堆叠自动建立过程

    • 选举主交换机

      • 选择最先开启的交换机(时间差20s以内认为时同时启动)
      • 如果同时启动,则选择堆叠优先级最高的
      • 如果优先级一样,则选择MAC地址小的交换机,称为主交换机
    • 收集拓扑信息,选举备交换机

      • 主交换机收集堆叠系统的拓扑信息并发布给所有成员交换机,同时分配堆叠ID

        • 选择最先启动的成员交换机
        • 如果同时启动,则选择堆叠优先级高的
        • 如果优先级也一样,则选择MAC地址小的成员交换机
    • 系统版本和配置同步

      • 堆叠具有自动加载系统软件的功能,如果备交换机和从交换机的系统软件与主交换机版本不同或者不兼容,将自动从主交换机上下载系统软件以及配置文件,并使用新的系统软件和配置文件自动重启,重新加入堆叠系统

    堆叠的连接方式

    • 使用专用堆叠卡和堆叠线缆来组成堆叠系统

      • 专用的堆叠插卡或者集成到交换机后面的堆叠卡,堆叠卡之间需要使用专用堆叠线缆连接
    • 使用业务口堆叠

      • 需要创建逻辑堆叠口,将物理业务口与逻辑堆叠口绑定,使用普通线缆、光纤或者专用堆叠线缆连接

    堆叠的拓扑结构

    • 链形连接

      • 适用于堆叠系统成员交换机距离较远的场景
      • 缺点:可靠性低,任意一条堆叠线缆/成员交换机出现故障,都会导致堆叠系统分裂,容易出现单点故障
    • 环形连接:常用

      • 适用于堆叠系统成员交换机距离较近的场景
      • 优点:可靠性较高,不会出现单点故障,任意一条堆叠线缆/成员交换机出现故障都不会导致堆叠系统出现故障

    堆叠的实现

    • 只有相同型号且支持堆叠特性的交换机才可以组建堆叠系统

      • 如S5700 EI和S5700SI不能堆叠
    • 不同的子系统堆叠方式不同,S5700 EI和S5700 SI支持堆叠卡堆叠,S5700 LI和S570 HI支持业务口堆叠

    堆叠成员加入

    • 使能堆叠,并配置号堆叠相关参数
    • 保存配置并下电,将原堆叠系统某条线缆端口(环形链路),接入该交换机
    • 该交换机上电,系统自动完成,成为从交换机

    堆叠系统合并

    • 将两个稳定运行的堆叠系统通过堆叠线缆相连
    • 两个堆叠系统中的主交换机开始竞选
    • 竞争成功的堆叠系统保持不变
    • 竞争失败的堆叠系统自动重启,已从交换机身份加入堆叠系统中,由主交换机分配堆叠ID,并且同步配置文件和系统文件

    堆叠成员退出

    • 触发堆叠成员退出的原因

      • 堆叠成员交换机重启/故障
      • 堆叠端口或者物理端口down
      • 堆叠线缆端口
    • 主交换机退出

      • 备交换机升为主,虫子你选举备交换机,收集拓扑信息并同步到成员交换机上
    • 备交换机退出

      • 主交换机重新选举备交换机,收集拓扑信息并同步到成员交换机上
    • 从交换机退出

      • 收集拓扑信息并同步到成员交换机

    堆叠系统分裂

    • 主交换机和备交换机分裂到同一个堆叠系统

      • 主备交换机所在的堆叠系统更新拓扑信息
      • 另一个堆叠系统虫棍选举主备交换机
    • 主交换机和备份交换机分裂到不同的堆叠系统中

      • 主交换机所在的堆叠系统,重新选举备交换机,更新拓扑信息
      • 备交换机所在的堆叠系统,备升为主交换机,重新选举备交换机,更新拓扑信息

    主备切换和堆叠分裂导致的堆叠系统MAC地址切换的场景

    • 开启堆叠系统MAC地址切换延迟时间

      • 主交换机突出,备交换机升为主交换机,如果配置了堆叠系统MAC地址切换延迟时间(缺省延迟时间为10分钟),在计时器超时前,旧的主交换机重新加入堆叠系统,称为从交换机,堆叠系统MAC地址保持不变,也就是说,此时虽死额系统MAC地址为从交换机的MAC地址,反之,在计时器超时后,旧的主交换机还没有重新加入该堆叠系统,则MAC地址切换为新的主交换机的MAC地址

        • 当堆叠系统中从交换机(主交换回来之后又退出)退出时,如果退出的从交换机的MAC地址时堆叠系统的MAC地址,且该交换机在切换延迟时间内重新加入堆叠系统,则主交换机将堆叠系统MAC地址切换成自己的MAC地址
    • 未开启堆叠系统MAC地址切换延迟时间

      • 当主交换机的MAC地址为堆叠系统的MAC地址时,如果主交换机退出,且去使能堆叠系统MAC地址切换延迟时间,堆叠系统MAC地址会立即切换成新的主交换机的MAC地址

    堆叠分裂导致的问题

    • 由于同一个堆叠系统中的成员交换机共同维护同一个堆叠系统MAC地址和使用相同的IP地址,当一个堆叠系统分裂成多个堆叠系统时,可能会出现网络中同时存在多个具有相同MAC地址和IP地址的堆叠系统,从而造成网络故障

    • 解决方法

      • 多主检测机制(MAD

        • 作用

          • 检测堆叠系统是否分裂,处理分裂后产生的冲突,降低对业务转发的影响
        • 分类

          • 直连检测方式

            • 堆叠系统正常运行时,不发送MAD报文,堆叠系统分裂时,成员交换机每1s发送一次MAD报文进行冲突处理

              • 通过中间设备的直连检测方式

                • 适用于成员交换机距离较远的场景
                • 缺点:易造成中间设备单点故障,且浪费资源
                • 注意设备需要开启透传BPDU功能
              • 通过成员交换机full-mesh直连方式

                • 适用于成员交换机距离较近的场景
                • 缺点:占用成员交换机的业务口,成员叫喊及越多占用的接口也越多
          • 代理检测

            • 堆叠系统正常运行时,成员交换机每30s发送一次MAD报文,交换机接收到后,不处理;

            • 当堆叠系统出现分裂时,每1s发送一次MAD报文,进行多主中途处理

              • 单台设备作为代理设备
              • 两个堆叠系统互为代理设备
              • 优点:不会占用额外的业务口,不会造成成本的浪费
          • 以上两种检测方式互斥,不可同时配置

        • 冲突处理过程

          • 堆叠系统分裂后进行竞争,竞争成功的堆叠系统处于detect状态,竞争失败的堆叠系统处于recovery状态
          • 处于detect状态的堆叠系统可以转发业务流量
        • 故障恢复

          • 堆叠链路故障恢复后,处于recovery状态的堆叠系统重新启动,与detect状态的堆叠系统合并,同时将关闭的业务端口恢复UP,整个堆叠系统恢复
          • 堆叠系统在故障恢复前,detsct状态的堆叠系统出现故障,则将detect状态的堆叠系统一网络,再将recovery状态的堆叠系统重启,然后修复detect状态的堆叠系统,修复完后,加入到堆叠系统中

    集群

    CSS:集群交换系统

    • 作用

      • 将两台框式交换机通过CSS技术在逻辑上融合成一台交换机,提高网络可靠性,简单网络管理
    • 角色

      • 主交换机

        • 一个集群只有一台主交换机,主要负责管理集群
      • 备交换机

        • 一个集群只有一台备交换机,主要用来备份主交换机,当主交换机出现故障时,备接替主的工作
    • 集群ID

      • 标识 和管理成员交换机,具有唯一性
    • 集群优先级

      • 交换机的一个属性,用于选举交换机的角色,值越大越优先级越高
    • 集群自动建立过程

      • 选举主交换机

        • 选举最先启动的交换机
        • 如果同时启动,则选择集群中优先级最高的交换机
        • 如果优先级一样,则选择MAC地址最小的成为主交换机
        • 如果MAC地址相同,则比较集群ID最小的成为主交换机
        • 剩下的交换机为备交换机
      • 系统版本和配置 文件同步

        • 集群具有自动加载系统软件的功能,如果备交换机系统软件与主交换机的版本不同/不兼容,将自动从主交换机上下载系统软件,以及配置文件,并使用新的系统软件和配置文件自动重启,重新加入集群系统
    • 集群的连接方式

      • 集群卡连接:使用专用的集群卡和集群线缆连接

      • 业务口连接:使用物理接口绑定逻辑集群口,通过普通线缆连接

        • 物理连接方式

          • 传统CSS:使用主控班上集成的集群卡或者业务口组件集群系统

            • 所有业务流量都需要经过主控板,当单框交换机无法正常工作的主控板时,无法进行框内以及跨框流量转发
          • CSS2:使用交换网板上的集群卡组件集群系统

            • 所有业务流量转发都无需经过主控板,当单框交换机无法正常工作的主控板时,框内及跨框流量也能正常转发
            • 第二代集群系统支持集群系统中任意一台框式交换机的一个主控板征程工作时,框内及跨框流量都能正常进行,实现了转控分离,被称为“集群主控1+N”备份
    • CSS的加入和合并

      • 加入

        • 稳定运行的单框集群系统中加入一台框式交换机
        • 原集群系统的交换机作为主交换机,加入的交换机作为备交换机,自动加载系统软件和配置文件
      • 合并

        • 两个稳定运行单框集群系统进行合并
        • 进行竞争,竞争成功的称为主交换机,失败的称为备交换机,备交换机备份自己的配置文件并同步主交换机的配置文件和系统文件,以同步的主交换机的配置文件和系统文件重启
    • 集群分离

      • 触发集群分裂:两条框式交换机超过8s未接收到心跳报文
      • 当集群分裂时,会出现两个配置一样的单框集群系统,会引发网络故障,必须进行冲突检测
    • 多主检测:MAD

      • 作用

        • 检测集群分裂、处理冲去现象、故障恢复
      • 分类

        • 直连检测方式

          • 集群系统正常运行时,不发送MAD报文,集群分裂时,成员交换机每一秒发送一次MAD报文进行冲突处理

            • 通过中间设备的直连检测方式

              • 适用于成员交换机距离较远的场景
              • 缺点:易造成中间设备单点故障,且浪费资源
              • 注意:中间设备需要开启透传BPDU功能
            • 通过成员交换机full-mesh直连方式

              • 适用于成员交换机距离较近的场景
              • 缺点:占用成员交换机的业务口,成员交换机越多占用的接口也越多
        • 代理检测

          • 集群系统正常运行时,成员交换机每30s发送一次MAD报文,交换机接收到后,不处理

          • 当集群系统出现分裂时,每1s发送一次MAD报文,进行多主冲突处理

            • 单台设备作为代理设备
            • 两个集群系统互为代理设备
            • 优点:不会占用额外的业务口,不会造成成本的浪费
            • 以上两种检测方式互斥,不可同时配置
    • MAD冲突处理的过程

      • 集群系统分裂后进行竞争,竞争成功的集群系统处于detect状态,竞争失败的集群系统处于recovery状态

      • 处于detect状态的集群系统可以转发业务流量,处于reovery状态的集群系统将除保留端口以外的其他端口关闭,不参与业务流量的转发

        • 保留端口:集群 口、连接MAD线缆的物理口、手动配置的保留端口
    • MAD故障恢复

      • 集群链路故障恢复后,处于recovery状态的集群系统重新启动,与detect状态的集群系统合并,同时将关闭的业务端口恢复UP,整个集群系统恢复
      • 集群系统在故障恢复前,detsct状态的集群系统出现故障,则将detsct状态的集群系统一处网络,再将recovery状态的集群系统重启,然后修复detect状态的集群系统,修复完后,加入到集群系统中
  • 相关阅读:
    windows下安装rabbitmq
    滑动窗口最大值问题
    [补题记录] Atcoder Beginner Contest 323(E、F)
    集成crawlergo和xray的src漏洞挖掘利器(hscan)
    Linux编译FFmpeg
    C# 关于sendtoback()和bringtofront() 的特点说明
    java计算机毕业设计技术旅游平台MyBatis+系统+LW文档+源码+调试部署
    动态IP与静态IP的区别,你选对了吗?
    成为会带团队的技术人 技术债务:如何带领团队从困境中突围而出?
    LeetCode(31)无重复字符的最长子串【滑动窗口】【中等】
  • 原文地址:https://blog.csdn.net/m0_57713054/article/details/128210092