是什么引起数据库响应超时？

是什么引起数据库响应超时？

一、问题背景

一个核心业务数据库部署在AWS的EC2实例上，在业务活动期间发生了性能抖动导致业务超时。

下面记录一下问题排查的流程。

二、问题分析

1. 监控指标分析

发生问题后，第一时间肯定要看监控！首先分析服务器基础监控。

服务器的Load1使用率不足40%，看上去未达到瓶颈。

发现问题发生期间，数据盘的IOPS有不规律的波动，但是整体上IOPS峰值未超过1500，看上去不像达到了瓶颈。

再观察一下MySQL服务指标，可以看到问题发生时数据库运行线程是有突增的，同时也观察到数据库insert和update同样有突增。

这一点与调用方确认当时确实是有大量的写入和更新，但是从服务指标上看并没有达到服务运行的瓶颈。

2. 漫长的排查流程

重新梳理一下各方的情况。

基础监控

我们又重新Review了服务器监控指标，确认当时服务器的CPU使用率、内存使用率、磁盘使用率和磁盘IOPS均没有达到上限&#x
相关阅读:
xyhcms getshell
记一次（flink on yarn）提交任务的排错之旅（yarn队列、namenode、resourcemanager、flink job全崩盘）
diskgenius数据恢复软件，亲测可用！
全栈性能测试详解
 提高效率 Or 增加成本，开发人员应如何理解结对编程？
opengl pyqt 显示文字
 /etc/profile文件与.bashrc文件的作用
 Scratch软件编程等级考试一级——20191221
信号和槽机制
 如何检测照片中共有多少张人脸，机器学习
原文地址：https://blog.csdn.net/BUG_zhentan/article/details/126953332

一、问题背景

二、问题分析

1. 监控指标分析

​2. 漫长的排查流程

2. 漫长的排查流程