MySql教程

Mysql事务超详细(MVCC实现机制详解)

本文主要是介绍Mysql事务超详细(MVCC实现机制详解),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

Mysql事务(MVCC实现机制详解)

  • 事务
    • 什么是事务
    • 事务的四大特性
    • 事务的并发问题
    • 事务的隔离等级
  • MVCC
    • 什么是MVCC
    • MVCC实现所用到的技术及手段
      • 1. 两个隐藏列trx_id、roll_pointer
      • 2. 事务版本号
      • 3. 回滚日志(undo log)
      • 4. 读视图(read view)
    • MVCC具体工作流程(重点)

事务

什么是事务

  • 一个最小的不可再分的工作单元,每个事务可由一个或多个SQL语句组成。
    Mysql在Innodb引擎下才支持事务并且默认每条语句都是一个事务。

事务的四大特性

  1. 原子性:指一个事务是一个不可分割的工作单位,其中的操作要么都做,要么都不做。
    当事务发现有些语句不能执行时,需要将数据恢复到事务执行前,通过undo log实现。
  2. 持久性:指事务一旦提交,它对数据库的改变就应该是永久性的。接下来的其他操作或故障不应该对其有任何影响。
    持久性问题的产生:
    背景:Mysql为了保证存储效率,每次读写文件都是先对缓存池(Buffer Pool)操作,缓冲池再定期刷新到磁盘中(这一过程称为刷脏)。
    产生:由于数据不是直接写到磁盘,那么如果主机断电,就会有一部分数据丢失。
    解决:通过重做日志(redo log)恢复数据。在每次修改数据之前,都会将相应的语句写到redo log中,如果主机断电,那么再次启动时可通过redo log回复。
    拓展:redo log也需要在事务提交时将日志写入磁盘,它比缓冲池写入快的原因有两点:redo log是追加文件写,属于顺序IO,缓冲池是属于随机IO,且刷脏是以页为单位,有一点修改就要整页写入。
  3. 隔离性:隔离性是指,事务内部的操作与其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
    与原子性、持久性侧重于研究事务本身不同,隔离性研究的是不同事务之间的相互影响。
    下边讲到的事务并发问题就是隔离性的问题,MVCC就是解决这些问题的。
  4. 一致性:指事务执行结束后,数据库的完整性约束没有被破坏,事务执行的前后都是合法的数据状态。
    实现:前面提到的原子性、持久性和隔离性,都是为了保证数据库状态的一致性。

事务的并发问题

  1. 脏读:事务A读取到了事务B修改但未提交的数据。
    在这里插入图片描述

  2. 不可重复度: 事务A查询同一条语句的前后结果不一样。
    在这里插入图片描述

  3. 幻读:事务A条件查询同一语句前后两次结果不一样。
    在这里插入图片描述

事务的隔离等级

  • 事务的隔离等级越高,解决并发产生的问题越多,相应的执行效率也就越低

背景知识:读锁和写锁,在读数据时上读锁,在写数据时上写锁。
数据上读锁后不能被其他事务修改,知道读锁释放,数据上写锁其他事务不能读也不能修改。

  1. 读未提交:事务能读取其他事务未提交的数据。不检查任何锁
    三种并发问题都没结局。

  2. 读已提交(锁在读后释放):事务只能读取其他事务已经提交的数据。
    解决脏读。

  3. 可重复度(默认隔离等级)(锁在事务后释放):事务只能读取其他事务已经提交的数据。
    解决不可重复读。
    在这里插入图片描述

  4. 串行化:将事务强制以穿行的方式执行,就不会有并发发生。也使得数据库效率极低。

MVCC

什么是MVCC

刚才在上边讲的读已提交和可重复读都是已锁的方式实现的,MVCC是不加任何锁实现这两种隔离等级,并且MVCC在读已提交等级下解决的大部分幻读问题。因为没有锁,所以效率极高。
MVCC是通过Read View + undo log 实现的

MVCC实现所用到的技术及手段

1. 两个隐藏列trx_id、roll_pointer

在每条数据后边都会有这两个隐藏列。
trx_id表示该条数据的版本号。
roll_pointer像一个指针,指向该条数据上一次的版本。
在这里插入图片描述

2. 事务版本号

每个事务都会按顺序递增的分配一个版本号,通过此事务修改的数据都会把数据的trx_id修改成当前版本号。

3. 回滚日志(undo log)

保证原子性和一致性,用于MVCC的快照读(后边有介绍快照读)。

4. 读视图(read view)

先来介绍两个概念,快照读和当前读

  • 快照读:能从undo log中读取数据,也就是说能读取旧数据。不加锁,普通的select都是快照读。
  • 当前读:读取的记录是最新版本,显示加锁都是当前读。

read view:在读已提交模式下,每条SQL语句生成一个读视图。在可重复读模式下,一个事务用一个读视图。用来判断当前事务可见的该条数据的版本。

  • Read View的几个变量,通过这些变量来确定数据是否可见。

    1. m_ids:通过链表记录着当前系统正在执行的事务版本号。
    2. min_limit_id:表示在生成Read View时,当前系统中活跃的读写事务中最小的事务版本号,即m_ids中的最小值。
    3. max_limit_id:表示生成Read View时,系统中应该分配给下一个事务的版版本号。如当前最新事务版本号为100(可能执行完可能正在执行),那么max_limit_id=101。
    4. creator_trx_id: 创建当前Read View的事务版本号
  • Read view 匹配条件规则如下:
    在这里插入图片描述

MVCC具体工作流程(重点)

查询流程
1. 开始前系统顺序分配事务自己的版本号,即事务ID
2. 获取Read View
2. 查询得到的数据,然后Read View中的事务版本号进行比较。
3. 如果不符合Read View的可见性规则, 即就需要Undo log中历史快照;
4. 最后返回符合规则的数据
MVCC实现读已提交:
在这里插入图片描述
MVCC实现可重复读:
在这里插入图片描述
MVCC在可重复读模式下避免了部分的幻读:
如果是快照读数据,是不会发生幻读的。
如果是当前读,就有可能发生幻读,因为当前读都是读取最新的版本数据,Read View的可见性匹配规则就是功能。

这篇关于Mysql事务超详细(MVCC实现机制详解)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!