Mysql 数据库结构及索引类型
作者:??斜月???? 发布时间:2024-01-20 23:40:35
前言
数据库索引是mysql
数据库中重要的组成部分,是数据库查询数据速度提升的关键,本文将介绍数据库索引的一些内容。
数据库索引的数据结构
在数据库中的索引方法中,有TREE
和HASH
两种方法,HASH
是经常使用的,本文中主要介绍TREE
的数据结构。B+Tree
的高度一般是2-4
层,也就是说查找一条数据记录,最多使用 2-4 次 IO,当前一般的机械磁盘每秒至少可以做 100 次 IO, 2-4 词的 IO 操作时间大概耗时 20-40ms。
数据库中的B+Tree
索引分为聚集索引(clustered index
)和辅助索引(secondary index
),聚集索引和还是非聚集索引其内部的数据结构为平衡二叉树,所有的数据都存放在叶子节点,聚集索引存放的是一整行的数据,而辅助索引的叶子节点存放的是主键 id。 需要提一下的是B+Tree
是一个自底向上生长的树,在数据库表中的数据进行增长时,B+Tree
也会进行增长和分裂。
聚集索引
聚集索引就是按照每张表的主键 id 构造出的一个B+Tree
,同时叶子节点存放的是整行表的数据记录,所以聚集索引的叶子节点就是数据页,每个叶子节点所在的数据页通过双向链表来进行链接。
数据页智能按照一个B+Tree
进行排序,因此每张表智能由一个聚集索引。大多数情况下,查询优化器首先采用聚集索引,因为聚集索引上的叶子结点能够直接找到数据记录。由于数据是按照顺序排列的,索引聚集索引对于主键的排序查找和范围值的查询速度非常快。
辅助索引
辅助索引也是非聚集索引,叶子节点并不包含行记录的全部数据。叶子节点除了包含的主键值外,每个叶子结点中的索引行还包含一个书签(bookmark
)。借助这个书签InnoDB
能够很快找到索引对应的行记录。InnoDB 存储引擎是索引组织表,因此辅助索引的书签就是相应行数据的聚集索引。
数据库表中的聚集索引只有一个,辅助索引可以有多个,当通过辅助索引来查找数据时,InnoDB 存储引擎会遍历辅助索引并通过叶级别的指针获得指向主键索引的主键,然后通过主键索引来找到完整的行记录。如果辅助索引树的高度为 3,聚集索引树的高度同样为 3,那么如果需要找到一个完整的行记录数据,一共需要 6 次逻辑 IO 访问才能拿到数据页。
索引管理
索引的创建和删除方法如下:
# 创建和删除方法如下
alter table table_name index_name
create table table_name index_name
drop table table_name index_name
# 查询数据库表的索引
show index from table_name
如下图所示,查询数据库表中的索引情况:
表中的实际索引如下:
PRIMARY KEY (`id`),
UNIQUE KEY `uk_tb_user_2` (`username`,`id_card`) USING BTREE,
UNIQUE KEY `uk_tb_user_1` (`username`,`cellphone`) USING BTREE
在索引的展示项中,索引的值cardinality
是非常重要的选项,表示的是数据基数即是数据中不同元素的个数,如果数据内容为枚举,则再该列上建立索引就没有多大意义,因为去分部不大。但是这个值不是实时更新的,只能作为参考。
如果需要更新,则执行以下命令:
analyze table table_name;
上面我们讲述了数据库的索引类型,包括聚集索引和辅助索引,一般情况下这两种索引的索引列都是单列,接下来我们来介绍另外两种索引:联合索引和覆盖索引
。
联合索引
联合索引是指对表上的多个列建立索引,联合索引的创建方法与单个索引的创建方法一样,不同之处仅在于有多个索引列。联合索引的数据结构也是一个B+Tree。对于联合索引,其键值对的数量必定是大于 1,多个键值对的排序和单个键值对的排序都是一样的,通过叶子节点可以逻辑上顺序读取所有的数据。
多个键值的B+树:
如有有数据库表的索引建立为 (a,b),那么对于数据库的查询:
# 这两种情况下都可以查询到数据,而且可以用得到这个联合索引
select * from table_name where a = XX and b = XX;
select * from table_name where a = XX;
# 如果查询条件使用 b 列,那么就不会使用索引,因为 b 列位于索引的第二位
select * from table_name where b = XX;
# 这个查询条件的顺序和索引的顺序不同,但是依然可以使用索引,
# 这是因为在数据库查询时会进行sql 的优化
select * from table_name where b = XX and a = XX;
在使用联合索引时,选用性能最高也是区分度最高的列放在索引的前面,这样就可以最大限度的提高查询的新能。
覆盖索引
InnoDB 存储引擎支持覆盖索引(covering index,或称索引覆盖),即从辅助索引中就可以查询到数据记录。使用覆盖索引的一个好处是辅助索引不包含整行记录的所有记录,故其大小要远小于聚集索引,因此可以减少大量的 IO 操作。
使用覆盖索引,就是查询的条件和查询的内容是一致的,通过覆盖索引则可以避免回表的情况发生,减少了一次 IO 操作。
回表: 通过辅助索引查找数据时,在其的叶子节点上存放的是该表的主键id,通过主键id 在聚集索引上查找数据记录在进行返回,这个操作就称之为回表。
来源:https://juejin.cn/post/7063853864956461093


猜你喜欢
- 引子如今很多云原生系统、分布式系统,例如 Kubernetes,都是用 Go 语言写的,这是因为 Go 语言天然支持异步编程,而且静态语言能
- 如何定义记录集打开的游标类型和锁定类型?我们知道,打开记录集时,可以定义记录集打开的游标类型和锁定类型。在adovbs.inc文件中就定义了
- redis无法访问本机真实ip地址1.我在进行用jedis来连接redis时出现了问题:我用Jedis jedis = new Jedis(
- 今天记录一下如何使用python收发邮件,知识要点在python内置的poplib和stmplib模块的使用上。1. 准备工作首先,我们需要
- 目录背景方案一:老数据备份方案二:分表方案三:迁移至tidb重点说下同步老数据遇到的坑最终同步脚本方案总结背景由于历史业务数据采用mysql
- JS调试技巧技巧一:格式化压缩代码 技巧二:快速跳转到某个断点的位置右侧的Breakpoints会汇总你在JS文件所有打过的断点,点击跟ch
- 作用域是JavaScript最重要的概念之一,想要学好JavaScript就需要理解JavaScript作用域和作用域链的工作原理。今天这篇
- 本篇文章将介绍:xlwt 常用功能xlrd 常用功能xlutils 常用功能xlwt写Excel时公式的应用xlwt写入特定目录(路径设置)
- 前言得益于 Vite 卓越的前端开发体验,越来越多的 Electron 项目也开始应用它来构建开发。翻阅各种社区资源可以发现很多基于 Vit
- 第一种:使用CSS属性var display =$('#id').css('display');if(dis
- 介绍文档解析涉及检查文档中的数据并提取有用的信息。它可以通过自动化减少了大量的手工工作。一种流行的解析策略是将文档转换为图像并使用计算机视觉
- 使用MySql的窗口函数统计数据时,发现一个小的问题,与大家一起探讨下。环境配置:mysql-installer-community-8.0
- 最近发现周围的很多小伙伴们都不太乐意使用pandas,转而投向其他的数据操作库,身为一个数据工作者,基本上是张口pandas,闭口panda
- 第一种打开PyCharm, 然后PyCharm -> Preferences -> 在搜索框中输入Project Interpr
- Microsoft SQL Server 2008通过与Microsoft Office的深度集成,为所有人提供了可用的商业智能,以合适的价
- 在计算机编程中,数据类型是非常重要的一个概念。数据类型决定了计算机内部如何表示数据,以及在执行不同的操作时需要进行哪些转换。Go 语言作为一
- 在利用javascript内置的eval函数,将json格式的字符串转换成JS对象时,需要用一对"()"先将该字符串包住
- python的使用之所以方便,原因之一就是各种数据类型各样轻松的转换,例如numpy数组和list的相互转换,只需要函数方法的使用就可以处理
- 姓名的翻译: 英语是名(First name)在前,姓(Last name)在后。中文地址的翻译:如果你英语水平不高,填表时只要国家名用英语
- hp中怎么让json_encode不自动转义斜杠“/”?下面本篇文章给大家介绍一下PHP中让json_encode不自动转义斜杠“/”的方法