• CPU占用率过高排查


    · CPU占用率高是设备本身的一种现象,直观表现为display cpu-usage命令查询结果中整机CPU占用率“CPU usage”偏高,如超过70%。在网络运行中CPU高常常会导致其他业务异常,如BGP震荡、VRRP频繁切换、甚至设备无法登录。
    ·通常,整机CPU占用率过高,是由于某些任务的CPU占用率居高不下导致的。具体导致某任务CPU占用率高的可能原因:上送CPU报文过多,如环路或DoS报文攻击;STP网络频繁震荡,收到大量TC报文,造成设备频繁删除MAC表和ARP表项;设备产生海量日志,占用大量CPU资源。
    ·执行命令display cpu-usage,查看各任务的CPU占用率。记录CPU占用率超过70%的任务名称。这个取值并非绝对数值,有可能某些任务执行时就需要占用70%的CPU而对业务不会造成影响,也有可能某些任务占用CPU 30%时就会对业务造成影响。应该根据实际情况判断。
    ·执行命令display cpu-defend statistics,查看上送CPU报文的统计信息,关注丢弃计数。如果某种类型报文“Drop”计数较大,且对应上一步中占用的CPU使用率较高,可以判断为发生了报文攻击。
    ·如果没有发现有流量过大的报文,检查是否TC报文过多。支持STP的设备上,STP使能情况下,设备在接收到TC-BPDU报文时,会删除MAC地址表项和ARP表项。如果有人伪造TC-BPDU报文恶意攻击,设备短时间内会收到很多TC-BPDU报文,频繁的删除操作会导致CPU占用率比较高。执行命令display stp,查看接口下收到的TC报文和TCN报文计数。如果该值很大,系统视图下执行命令stp tc-protection配置对TC类型BPDU报文的抑制。配置此命令后,默认每个Hello周期处理3个TC报文。可以根据实际情况通过stp tc-protection threshold命令指定处理的报文数量门限值,可以通过stp timer hello命令修改Hello周期的时长。
    ·如果没有,执行命令loop-detect eth-loop alarm-only配置当发生MAC地址漂移时产生告警。如果网络中有环路,当设备两个接口学习到同一个MAC表项时,会产生告警根据告警提示信息,查看相应的接口连接以及组网需求。如果不需要环网,根据组网图,将其中一个端口shutdown处理。如果确实需要环网,关闭Loop Detection功能,并启动STP等破环协议。
    ·如果设备已经配置了loop-detect eth-loop alarm-only,但是没有看到告警,检查设备是否产生海量日志,某些异常情况下如受到攻击、运行中发生了错误、端口频繁Up/Down等,设备会不停打印诊断信息或日志信息。此时对存储器要进行频繁的读写操作,会造成CPU占用率升高。执行命令display logbuffer,查看是否有大量的异常日志。

  • 相关阅读:
    快鲸智慧楼宇系统在楼宇管理中发挥了哪些积极作用?
    R语言fpc包的dbscan函数对数据进行密度聚类分析、plot函数可视化聚类图
    “不敢去怀疑代码,又不得不怀疑代码”记一次网络请求超时分析
    C++读写锁
    想要精通算法和SQL的成长之路 - 可以攻击国王的皇后
    【JVM基础14】——垃圾回收-强引用、软引用、弱引用、虚引用的区别
    【学习笔记二十六】EWM 盘点后台配置和前台演示
    【微服务】Docker-Compose
    c单元语言测试--自定义代码、rspec 和Google test
    Spring Bean 详解
  • 原文地址:https://blog.csdn.net/Tony_long7483/article/details/138837475