参考视频及文章:
介绍MVCC之前,先介绍下事务:事务是指逻辑上的一组sql操作,要么全部执行成功,要么全部执行失败。事务是为了保证数据库中数据的完整性和一致性。
update
但未 commit
” 的数据,破坏了事务隔离性。update
或 delete
,并 commit
” 的数据,破坏了事务隔离性。insert/delete
并 commit
"的数据,导致前后读取记录数不一致(行记录数多了或少了都算是幻读)。可重复读 和 读已提交 的区别?
它们的主要区别在于创建 Read View 版本快照的时机不同,
「读已提交」隔离级别是在「每个语句执行前」都会重新生成一个 Read View 版本快照,而「可重复读」隔离级别是「启动事务时」生成一个 Read View 版本快照,然后整个事务期间都在用这个 Read View。
另外,企业中通常使用 RC-读已提交 的隔离级别。因为 RR-可重复读 的隔离级别下,存在间隙锁,在并发场景下容易产生死锁,死锁问题产生的影响比幻读更大!
提问:V1、V2、V3在不同事务隔离级别下读取到的值分别是:
- RU-读未提交 级别:20、20、20(可能发生:脏读、不可重复读)
- RC-读已提交 级别:18、20、20(不可能发生:脏读、可能发生:不可重复度)
- RR-可重复读 级别:18、18、20 (不可能发生:脏读、不可重复读;但是因为事务A已提交,所以V3再次查询时跟事务A是没有隔离性的要求的,因此V3读取到的是20)
lock in share mode
for update
常见问题:为什么要加入意向锁?
意向锁并不是真正用来锁定数据的,而是用来告诉你当前表中是否已经有了被 共享锁/排它锁 锁定的数据行。如果有就没必要再去加无用的表锁了,起到一个标识作用,提高加表锁的效率(相当于高铁洗手间门上方是否有人正在使用的 “指示灯”)。
目的:当Innodb需要对一个表上一个表级别的S锁和X锁时,可以快速判断表是否被上行锁,以避免用遍历的方式检验是否上行锁。
- 如果意向锁是行锁,则需要遍历每一行数据去确认;
- 如果意向锁是表锁,则只需要判断一次即可知道有没数据行被锁定,提升性能。
是 RR-可重复读 隔离级别下独有的
问题:如图示:执行此sql语句(先开启事务):BEGIN; SELECT * FROM tbl WHERE id > 15 FOR UPDATE;
,以下两个sql语句可以执行成功吗?
INSERT INTO tbl VALUES (20, 20);
INSERT INTO tbl VALUES (12, 12);
以上两句sql都是不会执行成功的,因为触发了 间隙锁-Gap lock,实际上锁住的范围是 (11, +∞)。实际上锁定范围是根据数据库当前表的记录来划分不同范围段的锁,例如上述例子中:最后一段就锁定的是 (11, +∞)。
因此,走索引是行锁,不走索引是表锁。所以为了避免两个事务同时修改一张表的不同记录会导致表锁的问题,建议加上具体索引,这样就只是行锁,而不会升级为表锁!
SELECT
查询,都是在副本中去取数据,所以不管数据库中后来是否又对数据进行了改变,都不会影响当前已经 BEGIN
的事务数据的读取。
SELECT
操作,属于快照读,不加锁。
SELECT
* FROM user WHERE id = xxx LOCK IN SHARE MODE
;INSERT
/ UPDATE
/ DELETE
/ SELECT ... FOR UPDATE
等写操作。问题:在 RR-可重复读 的默认隔离级别下,假设起始的age为18,那么Q1和Q2对应的age分别是多少呢?
- 针对 “事务B” 分析:因为存在
UPDATE
写操作,触发了 当前读,所以要先去读最新提交的版本号记录(即:事务CUPDATE
后提交的记录),然后事务B再去执行自己的UPDATE
操作。也就是要先去读事务C提交的最新数据为19,然后事务B自身再UPDATE
加1最终变为20。- 针对 “事务A” 分析:因为事务A本身是没有任何的写操作,仅仅是
SELECT
查询操作,触发 快照读。所以事务A只认准事务 BEGIN 开始之前记录的 最新最后提交的版本号,其记录值也就是初始的18。
BEGIN
事务开始的时候会创建一个快照,并为对应事务分配一个事务id,即 TRX_ID- 开启事务之前最后的版本号为:up_limit_id=999,对应 age=18
- 事务B和事务C都有
UPDATE
操作(当前读),所以 row_trx_id 为自身的 TRX_ID 的值,分别是1001和1002。而事务A没有UPDATE
操作(快照读),所以只认准事务A在 事务开始前 最后的版本号 up_limit_id=999,其 age=18。
但是要注意:RR的默认隔离级别下,不能完全解决幻读的问题。
比如下面的例子:参考 大佬文章
事务1 可重复读&事务手动提交 | 事务2 可重复读&事务手动提交 |
---|---|
begin; | |
select * from student where id > 0; | begin; |
select * from student where id > 0; | |
insert into student (id, name, sex, age) values(3, ‘tom’, ‘男’, 66) ; | |
select * from student where id > 0; | |
select * from student where id > 0; | |
commit; | |
select * from student where id > 0;(快照读:读取历史数据) | |
update student set sex = ‘男’ where id > 0;(当前读:重新读取一次最新数据) | |
select * from student where id > 0; | |
commit; |
注意:事务1能正常
SELECT
、UPDATE
的前提是:事务2已COMMIT
。
注意:如果事务1不执行UPDATE
操作,那么在最后SELECT
时,是查询不到事务2新ISNERT
的记录的。
update
操作更新了事务2最新插入的 id=3(name=‘tom’) 的数据,所以事务1在执行 update student set sex = '男' where id > 0;(当前读)
后再去 select * from student where id > 0;
会查询出事务2新插入并提交的数据,也就是幻读。如果事务1的 update
操作没有涉及到事务2新插入的数据,那么后续 select
是不会出现幻读的。SELECT
语句时生成了一个ReadView版本链,之后事务2向 student 表中新插入一条id=2(name=‘Tom’)的记录并提交。ReadView并不能阻止事务1执行 UPDATE/DELETE 语句来改动这个事务2新插入的记录(由于事务2已经 COMMIT
,因此改动该记录并不会造成阻塞)。但是这样一来,这条新记录的 trx_id 隐藏列的值就变成了事务1的事务id,之后事务1再使用普通的 SELECT
语句去查询这条记录时就可以看到这条记录了,也就可以把这条记录返回给客户端。因为这个特殊现象的存在,我们也可以认为InnoDB中的MVCC并不能完全禁止幻读。SELECT
时,能够查询到 id=3(name=‘Tom’)记录。SELECT
时就使用 FOR UPDATE
加锁,这样其他事务,比如事务2就不能 INSERT
或 UPDATE
数据。而且事务1还可以执行任意的 INSERT
或 UPDATE
当前读类型语句,并且事务1最后查询的结果集也不会因为幻读而产生新的数据行记录了。SELECT
只触发 “快照读” 。而当你包含 INSERT
/ UPDATE
/ DELETE
/ SELECT ... FOR UPDATE
/ SELECT LOCK IN SHARE MODE
等 写操作 时,这时就会触发 当前读。也就是在事务中,当前读会在相关写操作之前会再去读取一次其他事务的最后提交记录。这里的关键在于你事务中的sql是单纯的 SELECT
语句(快照读),还是你事务在的sql是包含了INSERT
/ UPDATE
/ DELETE
/ SELECT ... FOR UPDATE
/ SELECT ... LOCK IN SHARE MODE
等 写操作(当前读)。INSERT
/ UPDATE
/ DELETE
/ SELECT ... FOR UPDATE
/ SELECT ... LOCK IN SHARE MODE
等当前读的情况下,表明此时需要看到或操作最新的数据(包含其他事务已提交的数据)。最后,补充一个问题点:
如果不声明的创建主键,会有哪些危害? 比如你的id(假设int类型)没有声明为主键,并且也没有声明唯一索引(当未声明主键时,唯一索引会被取代为主键)
- 行锁升级为表锁
- 当数据量达到顶峰的时候,可能会造成“主键冲突”,int的取值范围为2^32 -1,当未声明主键时,达到最大值范围时,id会再次重新从0开使自增,这时候可能会出现覆盖之前row_id记录的情况,造成数据丢失。相反的,如果声明主键的话,那么当id达到上限时,再次insert时会报“主键冲突”错误,这时候可以将之前的 int 类型的id改为big int。
- MySQL会自动声明一个“隐藏主键 row_id”,占6字节。而你自己声明int类型的主键时,只会消耗4字节。因此这是一种资源的浪费!