常见性能分析 18 种方法:
哪个指标变动明显,调整哪个指标。一个 top 打天下。
最常用的方法,可解决 80% 的问题。
随机调整指标,看是否改善。
新手最常用方法,无处下手时的科学解决方案。
这个是甲方专属方法,解决问题最省力省心。
- 找一个不是自己负责的模块
- 假定问题与这个模块有关
- 把问题扔给相关负责人
- 如果证明错了,返回第一步。
针对清单,一项项核对。
这个需要清单是完整且准确的。通常光整理清单就要好几天。
详细询问客户,明确问题性质、范围。如:
- 你如何确定存在性能问题?
- 之前做过哪些变更?
- 业务场景有什么变化?
- 等等
该方法可解决 50% 的低级问题。
如果话术高超,可以解决 100% 问题。
看名称就知道,管用但很费力。基本步骤:
方法很科学,步骤很严谨,效率很低下。
和科学法很类似,只是少了定性问题和设计实验步骤。
拿论文举例,就是博士论文和硕士论文的区别。
运维工程师比较常用的方法,有啥工具用啥工具。
手里有螺丝刀就检查螺丝,有扳手就检查螺母,有锤子就找钉子,有镰刀就找韭菜。
如果工具够全面,还是能够发现并解决问题的。
综合考虑效率和准确性,USE 算是比较合适的方法。
根据资源(CPU、内存、网络、磁盘等)的使用率(Usage)、饱和度(Saturation)、报错(Error)来排查问题。
这个方法值得推荐一把。
这个方法要求对架构有足够的了解。
对负载特征进行归纳分析:
和上个方法类似,这个方法要求对架构有足够足够的了解。
并对操作系统有深入的认知。
将业务分解,通过分析每一步骤的延时,定位问题所在。
针对 Oracle 数据库的性能分析方法。基于时间的响应性能提升方法。
以下方法比较虚。电子书分享见《bcc-tools Linux运维中的要你命3000》