浅析MySQL - MVCC
作者:Dashjay's 发布时间:2024-01-24 14:29:22
版本链
在InnoDB引擎表中,他们的聚簇索引记录中有两个隐藏列:
trx_id:用来存储对数据进行修改时的事务id
roll_pointer:每次对哪条聚簇索引记录有修改的时候,就会把老版本写入undo日志中。这个roll_pointer就是存了一个指针,它指向这条聚簇索引记录的上一个版本的位置,通过它来获得上一个版本的记录信息。
id | name | trx_id | roll_pointer |
---|---|---|---|
1 | 小明 | 50 | 0x00af |
例如目前有个trx_id是60的事务正执行如下语句: update table set name = '小明1' where id = 1
此时在 undo 日志中就存在版本链
id | name | trx_id | roll_pointer |
---|---|---|---|
1 | 小明1 | 60 | last_version |
↓指向 | |||
1 | 小明 | 50 | null |
版本链可以类似git一样,对一行的数据进行版本控制,可以通过 undo_log进行回滚操作
ReadView
已提交读和可重复读的区别就在于它们生成ReadView的策略不同。
ReadView中主要就是有个列表来存储我们系统中当前活跃的读写事务( begin未 commit 的 tx)。通过这个列表来判断记录的某个版本是否对当前事务可见。假设当前列表里的事务 id 为[80,100]。
id <= 80(最小事务id)
id >= 80 && id <= 100
id >= 100
这些记录都是去版本链里面找的,先找最近记录,如果最近这一条记录事务id不符合条件,不可见的话,再去找上一个版本再比较当前事务的id和这个版本事务id看能不能访问,以此类推直到返回可见的版本或者结束。
举个例子 ,在已提交读隔离级别下:
比如此时有一个事务id为100的事务,修改了name,使得的name等于小明2,但是事务还没提交。则此时的版本链是
id | name | trx_id | roll_pointer |
---|---|---|---|
1 | 小明2 | 100 | last_version |
↓指向 | |||
1 | 小明1 | 60 | last_version |
↓指向 | |||
1 | 小明 | 50 | null |
那此时另一个事务发起了 select 语句要查询 id 为 1 的记录,那此时生成的 ReadView 列表只有[100]。那就去版本链去找了,首先肯定找最近的一条,发现 trx_id 是 100,也就是 name 为 小明2 的那条记录,发现在列表内,所以不能访问。
这时候就通过指针继续找下一条,name为 小明1 的记录,发现 trx_id 是 60,小于列表中的最小 id,所以可以访问,直接访问结果为 小明1 。
那这时候我们把事务 id 为 100 的事务提交了,并且新建了一个事务 id 为 110 也修改 id 为 1 的记录,并且不提交事务
-- trx_id = 110
BEGIN;
update table set name = '小明3' where id = 1
这时候版本链就是
id | name | trx_id | roll_pointer |
---|---|---|---|
1 | 小明3 | 110 | last_version |
↓指向 | |||
1 | 小明2 | 100 | last_version |
↓指向 | |||
1 | 小明1 | 60 | last_version |
↓指向 | |||
1 | 小明 | 50 | null |
这时候之前那个select事务又执行了一次查询,要查询id为1的记录。
不同隔离级别造成此处结果不同
如果你是 已提交读 隔离级别,这时候你会重新一个ReadView,那你的活动事务列表中的值就变了,变成了[110]。
按照上的说法,你去版本链通过trx_id对比查找到合适的结果就是小明2。
如果你是 可重复读 隔离级别,这时候你的 ReadView 还是第一次 select 时候生成的 ReadView, 也就是列表的值还是[100]。所以 select 的结果是小明1。所以第二次 select 结果和第一次一样,所以叫 可重复读 !
这就是Mysql的MVCC,通过版本链,实现多版本,可并发读-写,写-读。通过ReadView生成策略的不同实现不同的隔离级别。
来源:https://www.tuicool.com/articles/VZfQRnv
猜你喜欢
- 遇到个小白常见的问题,发现度娘里面没有记录,翻墙谷歌了下,解决问题,在此写个说明。事情起因:在jupyter notebook中导入文件时发
- 目前SQL INJECTION的攻击测试愈演愈烈,很多大型的网站和论坛都相继被注入。这些网站一般使用的多为SQL SERVER数据库,正因为
- 创建测试数据:import pandas as pdimport numpy as np#Create a DataFramedf1 = {
- 摘要:不同方法读取excel中的多个不同sheet表格性能比较# 方法1def read_excel(path): df=pd.
- 前言这些原则都是经历过实战总结而成每一条原则背后都是血淋淋的教训这些原则主要是针对数据库开发人员,在开发过程中务必注意一、核心原则1.尽量不
- 【pytorch官方文档】:https://pytorch.org/docs/stable/generated/torch.nn.AvgPo
- 最近发现各大类库都能利用div.innerHTML=HTML片断来生成节点元素,再把它们插入到目标元素的各个位置上。这东西实际上就是inse
- 本文实例讲述了Python实现正弦信号的时域波形和频谱图。分享给大家供大家参考,具体如下:# -*- coding: utf-8 -*-#
- 经过摸索和实践,我把自己的解决方法,写在下面: 说明: 我的Oracle客户端的版本是 oracle 9i, 安装client端的时候,不能
- 如下所示:######### Extract all files from src_dir to des_dirdef extract_ta
- 一、pandas的统计分析1、关于pandas 的数值统计(统计detail 中的 单价的相关指标)import pandas as pd#
- 1、合并列表(extend)跟元组一样,用加号(+)将两个列表加起来即可实现合并:In [1]: x=list(range(1, 13, 2
- WebStorm 遇到的问题总结最近自己WebStorm用得多一点了和android studio一样,同样是IDEA的ide(记得自己还是
- 人们对于产品设计这类事情,往往容易眼高手低,在宇宙层面上夸夸其谈,却落不了地,只能飘着。真正到了自己动手的时候,才会发现问题很多,实践和理论
- Django自带有个强大的后天管理系统,接下来我就给大家介绍一下x的admin一些强大的操作及后台美化。首先给大家介绍一些xadmin的注册
- 1、变量和类型变量是一种存储数据的载体,也就是一个容器。计算机中的变量是实际存在的数据或者说是存储器中存储数据的一块内存空间,变量的值可以被
- 通常,在完成了一件网页设计后,设计师的无知都会显露无遗而备受指责。他们把创建网页代码的繁重工作都留给了程序员们。这种现象不只出现在网络开发行
- 一、 for 循环根据变量赋值的次数进行循环for item in ["tom","bob",&qu
- 本文从树数据结构说到二叉堆数据结构,再使用二叉堆的有序性对无序数列排序。1. 树树是最基本的数据结构,可以用树映射现实世界中一对多的群体关系
- 此前piscdong已经做过一次评测了,这次的Beta正式推出,我也来参与一下.当回小白鼠吧.新的界面设计非常让人兴奋750){this.r