• MySQL事务与MVCC如何实现的隔离级别


    MySQL事务与MVCC如何实现的隔离级别

    事务的四⼤特性(ACID)

    1. 原⼦性(atomicity): 事务的最⼩⼯作单元,要么全成功,要么全失败。
    2. ⼀致性(consistency): 事务开始和结束后,数据库的完整性不会被破坏。
    3. 隔离性(isolation): 不同事务之间互不影响,四种隔离级别为RU(读未提交)、RC(读已提交)、RR(可重复读)、SERIALIZABLE (串⾏化)。
    4. 持久性(durability): 事务提交后,对数据的修改是永久性的,即使系统故障也不会丢失。

    事务的隔离级别

    读未提交(Read UnCommitted/RU)
    ⼜称为脏读,⼀个事务可以读取到另⼀个事务未提交的数据。这种隔离级别岁最不安全的⼀种,因为未提交的事务是存在回滚的情况。

    读已提交(Read Committed/RC)
    ⼜称为不可重复读,⼀个事务因为读取到另⼀个事务已提交的修改数据,导致在当前事务的不同时间读取同⼀条数据获取的结果不致。
    举个例⼦,在下⾯的例⼦中就会发现SessionA在⼀个事务期间两次查询的数据不⼀样。原因就是在于当前隔离级别为 RC,SessionA的事务可以读取到SessionB提交的最新数据。
    在这里插入图片描述
    可重复读(Repeatable Read/RR)
    ⼜称为幻读,⼀个事物读可以读取到其他事务提交的数据,但是在RR隔离级别下,当前读取此条数据只可读取⼀次,在当前事务中,不论读取多少次,数据任然是第⼀次读取的值,不会因为在第⼀次读取之后,其他事务再修改提交此数据⽽产⽣改变。因此也成为幻读,因为读出来的数据并不⼀定就是最新的数据。
    举个例⼦:在SessionA中第⼀次读取数据时,后续其他事务修改提交数据,不会再影响到SessionA读取的数据值。此为可重复读。
    在这里插入图片描述
    串⾏化(Serializable)
    所有的数据库的读或者写操作都为串⾏执⾏,当前隔离级别下只⽀持单个请求同时执⾏,所有的操作都需要队列执⾏。所以种隔离级别下所有的数据是最稳定的,但是性能也是最差的。数据库的锁实现就是这种隔离级别的更⼩粒度版本。
    在这里插入图片描述

    事务和MVCC原理

    不同事务同时操作同⼀条数据产⽣的问题
    在这里插入图片描述
    在这里插入图片描述
    上⾯的两种情况就是对于⼀条数据,多个事务同时操作可能会产⽣的问题,会出现某个事务的操作被覆盖⽽导致数据丢失。

    LBCC 解决数据丢失

    LBCC,基于锁的并发控制,Lock Based Concurrency Control。
    使⽤锁的机制,在当前事务需要对数据修改时,将当前事务加上锁,同⼀个时间只允许⼀条事务修改当前数据,其他事务必须等待锁释放之后才可以操作。

    MVCC 解决数据丢失

    MVCC,多版本的并发控制,Multi-Version Concurrency Control。
    使⽤版本来控制并发情况下的数据问题,在B事务开始修改账户且事务未提交时,当A事务需要读取账户余额时,此时会读取到B事务修改操作之前的账户余额的副本数据,但是如果A事务需要修改账户余额数据就必须要等待B事务提交事务。
    MVCC使得数据库读不会对数据加锁,普通的SELECT请求不会加锁,提⾼了数据库的并发处理能⼒。借助MVCC,数据库可以实现READ COMMITTED,REPEATABLE READ等隔离级别,⽤户可以查看当前数据的前⼀个或者前⼏个历史版本,保证了ACID中的I特性(隔离性)。

    InnoDB的MVCC实现逻辑

    InnoDB存储引擎保存的MVCC的数据
    InnoDB的MVCC是通过在每⾏记录后⾯保存两个隐藏的列来实现的。⼀个保存了⾏的事务 ID(DB_TRX_ID),⼀个保存了⾏的回滚指针(DB_ROLL_PT)。每开始⼀个新的事务,都会⾃动递增产 ⽣⼀个新的事务id。事务开始时刻的会把事务id放到当前事务影响的⾏事务id中,当查询时需要⽤当前事务id和每⾏记录的事务id进⾏⽐较。下⾯看⼀下在REPEATABLE READ隔离级别下,MVCC具体是如何操作的。
    SELECT
    InnoDB 会根据以下两个条件检查每⾏记录:

    1. InnoDB只查找版本早于当前事务版本的数据⾏(也就是,⾏的事务编号⼩于或等于当前事务的事务编号),这样可以确保事务读取的⾏,要么是在事务开始前已经存在的,要么是事务⾃身插⼊或者修改过的。
    2. 删除的⾏要事务ID判断,读取到事务开始之前状态的版本,只有符合上述两个条件的记录,才能返回作为查询结果。
      INSERT
      InnoDB为新插⼊的每⼀⾏保存当前事务编号作为⾏版本号。
      DELETE
      InnoDB为删除的每⼀⾏保存当前事务编号作为⾏删除标识。
      UPDATE
      InnoDB为插⼊⼀⾏新记录,保存当前事务编号作为⾏版本号,同时保存当前事务编号到原来的⾏作为⾏删除标识。
      保存这两个额外事务编号,使⼤多数读操作都可以不⽤加锁。这样设计使得读数据操作很简单,性能很好,并且也能保证只会读取到符合标准的⾏。不⾜之处是每⾏记录都需要额外的存储空间,需要做更多的⾏检查⼯作,以及⼀些额外的维护⼯作。
      MVCC 在mysql 中的实现依赖的是 undo log 与 read view 。

    undo log
    根据⾏为的不同,undo log分为两种:insert undo logupdate undo log
    insert 操作中产⽣的undo log,因为insert操作记录只对当前事务本身课件,对于其他事务此记录不可⻅,所以 insert undo log 可以在事务提交后直接删除⽽不需要进⾏purge操作。

    purge的主要任务是将数据库中已经 mark del 的数据删除,另外也会批量回收undo pages
    
    • 1

    update 或 delete 操作中产⽣的 undo log。因为会对已经存在的记录产⽣影响,为了提供 MVCC机制,因此update undo log 不能在事务提交时就进⾏删除,⽽是将事务提交时放到⼊ history list上,等待 purge 线程进⾏最后的删除操作。
    数据第⼀次被修改时:
    在这里插入图片描述
    当另⼀个事务第⼆次修改当前数据:
    在这里插入图片描述
    为了保证事务并发操作时,在写各⾃的undo log时不产⽣冲突,InnoDB采⽤回滚段的⽅式来维护undo log的并发写⼊和持久化。回滚段实际上是⼀种 Undo ⽂件组织⽅式。

    ReadView
    对于 RU(READ UNCOMMITTED) 隔离级别下,所有事务直接读取数据库的最新值即可,和SERIALIZABLE 隔离级别,所有请求都会加锁,同步执⾏。所以这对这两种情况下是不需要使⽤到Read View 的版本控制。

    对于 RC(READ COMMITTED)RR(REPEATABLE READ) 隔离级别的实现就是通过上⾯的版本控制来完成。两种隔离界别下的核⼼处理逻辑就是判断所有版本中哪个版本是当前事务可⻅的处理。针对这个问题InnoDB在设计上增加了ReadView的设计,ReadView中主要包含当前系统中还有哪些活跃的读写
    事务,把它们的事务id放到⼀个列表中,我们把这个列表命名为为m_ids

    举个例⼦:
    READ COMMITTED 隔离级别下的ReadView 每次读取数据前都⽣成⼀个ReadView (m_ids列表)
    在这里插入图片描述
    这⾥分析下上⾯的情况下的ReadView
    时间点 T5 情况下的 SELECT 语句:
    当前时间点的版本链:
    在这里插入图片描述
    此时 SELECT 语句执⾏,当前数据的版本链如上,因为当前的事务777,和事务888 都未提交,所以此时的活跃事务的ReadView的列表情况 m_ids:[777, 888] ,因此查询语句会根据当前版本链中⼩于 m_ids 中的最⼤的版本数据,即查询到的是 Mbappe。

    时间点 T8 情况下的 SELECT 语句:
    当前时间的版本链情况:
    在这里插入图片描述
    此时 SELECT 语句执⾏,当前数据的版本链如上,因为当前的事务777已经提交,和事务888 未提交,所以此时的活跃事务的ReadView的列表情况 m_ids:[888] ,因此查询语句会根据当前版本链中⼩于 m_ids 中的最⼤的版本数据,即查询到的是 Messi。

    时间点 T11 情况下的 SELECT 语句:
    当前时间点的版本链信息:
    在这里插入图片描述
    此时 SELECT 语句执⾏,当前数据的版本链如上,因为当前的事务777和事务888 都已经提交,所以此时的活跃事务的ReadView的列表为空 ,因此查询语句会直接查询当前数据库最新数据,即查询到的是 Dybala。

    总结: 使⽤READ COMMITTED隔离级别的事务在每次查询开始时都会⽣成⼀个独⽴的 ReadView。
    REPEATABLE READ 隔离级别下的ReadView
    在事务开始后第⼀次读取数据时⽣成⼀个ReadView(m_ids列表)

    MVCC总结:

    所谓的MVCC(Multi-Version Concurrency Control ,多版本并发控制)指的就是在使⽤ READ COMMITTDREPEATABLE READ 这两种隔离级别的事务在执⾏普通的 SEELCT 操作时访问记录的版本链的过程,这样⼦可以使不同事务的 读-写 、 写-读 操作并发执⾏,从⽽提升系统性能。

    在 MySQL 中, READ COMMITTED 和 REPEATABLE READ 隔离级别的的⼀个⾮常⼤的区别就是它们⽣成 ReadView 的时机不同。在 READ COMMITTED每次查询都会⽣成⼀个实时的 ReadView,做到保证每次提交后的数据是处于当前的可⻅状态。⽽ REPEATABLE READ 中,在当前事务第⼀次查询时⽣成当前的 ReadView,并且当前的 ReadView 会⼀直沿⽤当前事务提交,以此来保证可重复读(REPEATABLE READ)。

  • 相关阅读:
    git的基础操作
    C++的算法库
    Spark SQL【基于泰坦尼克号生还数据的 Spark 数据分析处理】
    MySQL之MHA高可用集群
    MongoDB【部署 04】Windows系统实现MongoDB多磁盘存储
    C# OpenCvSharp Mat操作-常用Mat数学运算
    软件测试打工人必须掌握的这9项技能.....
    Nginx反向代理、负载均衡理解及实践
    生产力工具评测:云笔记、离线笔记、云 Office、Markdown 编辑器
    计算机毕业设计django基于python图书馆借阅系统
  • 原文地址:https://blog.csdn.net/weixin_43118617/article/details/125639161