中秋放假期间,线上mysql数据库突然提示出现死锁异常怎么办?是不是内心突然慌的一批,假期再也不能愉快的玩耍了。
莫慌莫慌,今天老万教你遇到了mysql死锁应该怎么办。
所谓死锁:是指多个事务在并发执行过程中由于相互持有对方需要的锁,都在等待资源变的可用而不会主动释放自身持有的锁,从而导致循环等待的情况。
通常表级锁不会产生死锁,所以解决死锁主要还是针对于最常用的InnoDB。
官方文档:
Innodb死锁:https://dev.mysql.com/doc/refman/8.0/en/innodb-deadlocks.html
发生死锁的必要条件有4个, 分别为互斥条件、不可剥夺条件、请求与保持条件和循环等待条件
。
从这几点来看,mysql中的死锁产生条件和java程序中死锁产生条件是一致的。
但是java程序中的死锁往往会产生更严重的后果,而mysql中的死锁由于数据库内部的死锁处理机制,一般不会产生很严重的影响。
表和数据准备:
DROP TABLE if EXISTS user;
CREATE TABLE `user` (
`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
`account` varchar(30) DEFAULT NULL COMMENT '账号',
`name` varchar(30) DEFAULT NULL COMMENT '姓名',
`age` int(11) DEFAULT NULL COMMENT '年龄',
`email` varchar(50) DEFAULT NULL COMMENT '邮箱',
PRIMARY KEY (`id`),
UNIQUE KEY `uk_account` (`account`),
KEY `ik_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
-- 英文名,主要是更容易验证间隙锁
INSERT INTO `user` (`id`,`account`,`name`, `age`, `email`) VALUES (3, '000003','Andi', 12, '10003@qq.com');
INSERT INTO `user` (`id`, `account`,`name`, `age`, `email`) VALUES (10,'000010', 'Jack', 20, '100010@qq.com');
INSERT INTO `user` (`id`, `account`,`name`, `age`, `email`) VALUES (20, '000020','Tom', 30, '100020@qq.com');
INSERT INTO `user` (`id`, `account`,`name`, `age`, `email`) VALUES (30, '000030','Tom', 60, '100030@qq.com');
事务A:
mysql> START TRANSACTION;
Query OK, 0 rows affected (0.00 sec)
mysql> SELECT * FROM `user` WHERE id = 3 FOR UPDATE;
+----+---------+------+-----+--------------+
| id | account | name | age | email |
+----+---------+------+-----+--------------+
| 3 | 000003 | Andi | 12 | 10003@qq.com |
+----+---------+------+-----+--------------+
1 row in set (0.01 sec)
mysql> SELECT * FROM `user` WHERE id = 10 FOR UPDATE;
+----+---------+------+-----+---------------+
| id | account | name | age | email |
+----+---------+------+-----+---------------+
| 10 | 000010 | Jack | 20 | 100010@qq.com |
+----+---------+------+-----+---------------+
1 row in set (2.57 sec)
事务B:
mysql> START TRANSACTION;
Query OK, 0 rows affected (0.00 sec)
mysql> SELECT * FROM `user` WHERE id = 10 FOR UPDATE;
+----+---------+------+-----+---------------+
| id | account | name | age | email |
+----+---------+------+-----+---------------+
| 10 | 000010 | Jack | 20 | 100010@qq.com |
+----+---------+------+-----+---------------+
1 row in set (0.00 sec)
mysql> SELECT * FROM `user` WHERE id = 3 FOR UPDATE;
1213 - Deadlock found when trying to get lock; try restarting transaction
循环等待示意图:
show engine innodb status;
其中和死锁相关的信息:
select * from information_schema.innodb_trx;
说明:
LOCK WAIT
表示出现锁等待-- 查看加锁信息(MySQL5.X)
select * from information_schema.innodb_locks;
-- 查看锁等待(MySQL5.X)
select * from information_schema.innodb_lock_waits;
--查看加锁信息(MySQL8.0)
SELECT * FROM performance_schema.data_locks;
--查看锁等待(MySQL8.0)
SELECT * FROM performance_schema.data_lock_waits;
mysql内部采用2种机制解决死锁问题:
innodb_deadlock_detect
默认开启innodb_lock_wait_timeout
当启用死锁检测(默认情况下)时,InnoDB 会自动检测事务死锁并回滚一个或多个事务以打破死锁。InnoDB 尝试选择要回滚的小事务,其中事务的大小由插入、更新或删除的行数决定。如果使用 innodb_deadlock_detect
变量禁用死锁检测,则 InnoDB 依赖于 innodb_lock_wait_timeout
设置,在发生死锁的情况下回滚事务。
当检测到死锁后,就会出现下面这个提示:
mysql中的死锁探测机制有3种判定方式:
官网说明:If the LATEST DETECTED DEADLOCK section of InnoDB Monitor output includes a message stating
TOO DEEP OR LONG SEARCH IN THE LOCK TABLE WAITS-FOR GRAPH, WE WILL ROLL BACK FOLLOWING TRANSACTION
, this indicates that the number of transactions on the wait-for list has reached a limit of 200. A wait-for list that exceeds 200 transactions is treated as a deadlock and the transaction attempting to check the wait-for list is rolled back. The same error may also occur if the locking thread must look at more than 1,000,000 locks owned by transactions on the wait-for list.
除了超时机制,当前数据库都普遍采用等待图(wait-for graph
)的方式来进行死锁检测。
wait-for graph要求数据库保存以下两种信息:
通过上述链表可以构造出一张图,而在这个图中若存在回路,就代表存在死锁,因此资源间相互发生等待。在 wait-for graph中,事务为图中的节点。而在图中,事务T1指向T2边的定义为:
来看一个例子:
通过 Transaction Wait Lists中可以看到共有4个事务t1、t2、t3、t4。
通过Lock List列表,可以看到加锁的等待顺序。
在row1上,t1:s等待t2:x释放独占锁,才能添加共享锁。
在row2上,t1:s和t4:s持有相同的共享锁。
t2:x需要等待t1:s和t4:s释放共享锁后,才能添加独占锁。
t3:x需要等待t1:s和t4:s释放共享锁,并且t2:x释放独占锁后,才能添加独占锁。
故在wait-for graph中应有4个节点。根据等待关系画出等待图:
通过上图可以发现存在回路(t1,t2),因此存在死锁。可以发现wait-for graph是一种较为主动的死锁检测机制,在每个事务请求锁并发生等待时都会判断是否存在回路,若存在则有死锁,通常来说InnoDB存储引擎选择回滚undo量最小的事务。
关闭死锁探测:
对于高并发的系统,当大量线程等待同一个锁时,死锁检测可能会导致性能的下降。此时,如果禁用死锁检测,而改为依靠参数 innodb_lock_wait_timeout 执行发生死锁时的事务回滚可能会更加高效。
在 MySQL 8.0 中,增加了一个新的动态变量:innodb_deadlock_detect,可以用于控制 InnoDB 是否执行死锁检测。该参数的默认值为 ON,即打开死锁检测。
注意⚠️:innodb_deadlock_detect
是一个全局变量,在进行变量设置的时候需要加上global
。
查看是否开启死锁探测:
mysql> show global variables like 'innodb_deadlock_detect';
+------------------------+-------+
| Variable_name | Value |
+------------------------+-------+
| innodb_deadlock_detect | ON |
+------------------------+-------+
1 row in set (0.02 sec)
关闭死锁检测:
mysql> set global innodb_deadlock_detect=off;
Query OK, 0 rows affected (0.01 sec)
检测是否成功关闭:
mysql> show global variables like 'innodb_deadlock_detect';
+------------------------+-------+
| Variable_name | Value |
+------------------------+-------+
| innodb_deadlock_detect | OFF |
+------------------------+-------+
1 row in set (0.01 sec)
通常来说,应该启用死锁检测,并且在应用程序中尽量避免产生死锁,同时对死锁进行相应的处理,例如重新开始事务。
只有在确认死锁检测影响了系统的性能,并且禁用死锁检测不会带来负面影响时,可以尝试关闭 innodb_deadlock_detect
选项。另外,如果禁用了 InnoDB 死锁检测,需要调整参数 innodb_lock_wait_timeout
的值,以满足实际的需求。
默认的锁等待超时时间是50s,当发生超时后,就出现下面这个提示:
查看变量 innodb_lock_wait_timeout
:
//查看全局变量
mysql> show global variables like 'innodb_lock_wait_timeout';
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| innodb_lock_wait_timeout | 50 |
+--------------------------+-------+
1 row in set (0.02 sec)
//查看session级别变量
mysql> show variables like 'innodb_lock_wait_timeout';
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| innodb_lock_wait_timeout | 50 |
+--------------------------+-------+
1 row in set (0.02 sec)
修改锁超时等待时长:
//修改全局变量
mysql> set global innodb_lock_wait_timeout=30;
Query OK, 0 rows affected (0.00 sec)
//修改session级别变量
mysql> set innodb_lock_wait_timeout=30;
Query OK, 0 rows affected (0.00 sec)
再次查看变量,发现超时时间都变为30s。
注意⚠️:
innodb_lock_wait_timeout
参数分为session级别和global级别,如果发现锁等待超时时间一直没有设置成功,检测参数级别是否正确。
手动解除正在死锁的状态有两种方法:
1.查询是否锁表
show OPEN TABLES where In_use > 0;
2.查询进程(如果您有SUPER权限,您可以看到所有线程。否则,您只能看到您自己的线程)
show processlist
3.杀死进程id(就是上面命令的id列)
kill id
1.查看下正在等待锁的事务
SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX;
其中trx_state
中的LOCK WAIT
表示出现锁等待。
2.杀死进程id(就是上面命令的trx_mysql_thread_id
列)
kill 线程ID
Mysql中的死锁并不可怕,因为Mysql会通过内部的死锁探测机制
和锁等待超时机制
自动回滚事务释放锁。除非它们非常频繁,以至于您根本无法运行某些事务
。
最简单的死锁异常处理方式:重试
,可以通过捕捉死锁异常,进行指定次数的重试操作。
死锁的优化:空间维度
和时间维度
空间维度:减少锁的范围,保持加锁顺序
时间维度:减少加锁时间
本文主要是对mysql的死锁相关问题进行了介绍。
1、死锁产生的原因
2、为什么mysql中的死锁一般不会产生非常严重的影响
3、mysql内部对死锁的两种处理机制:死锁探测机制innodb_deadlock_detect
和锁等待超时机制innodb_lock_wait_timeout
4、怎么查看锁的相关信息,怎么分析死锁
5、怎么手动释放锁
6、通过哪些手段可以减少死锁的产生