Mysql的复合索引如何生效
作者:程序新视界 发布时间:2024-01-26 06:53:17
目录
背景
认识复合索引
最左匹配原则
字段顺序的影响
复合索引可以替代单一索引吗?
小结
背景
最近频繁出现慢SQL导致系统性能问题,于是决定针对索引进行一些优化。一些表结构本身已经有了不少索引,如果再继续添加索引,势必会影响到插入数据的性能。那么,是否可以使用组合索引来达到目的呢?这篇文章咱们来一探究竟。
认识复合索引
如果where条件中使用到多个字段,并且需要对多个字段建立索引,此时就可以考虑采用复合索引(组合索引)。比如查询地址时需要输入省、市,那么在省、市上建立索引,当数据量大时会明显提高查询速度。
组合索引有啥优势呢?
减少查询开销:建立复合索引(c1,c2,c3),实际上相当于建立了(c1),(c1,c2),(c1,c2,c3)三个索引。对于大表来说,可以极大减少开销。
覆盖索引:MySQL可以直接通过遍历索引取得数据,而无需回表,减少了很多的随机io操作。
效率高:索引列越多,通过索引筛选出来的数据就越少,从而提升查询效率。
缺点:
索引字段越多,创建的索引越多,每个索引都会增加磁盘空间的开销;
索引越多对查询效率提升越高,但对需要更新索引的增删改操作会有效率影响;
复合索引使用建议:单表最好不要超过1个复合索引,单个复合索引最好不超过3个字段。一旦超过,就需要考虑必要性和是否有其他替代方案。
最左匹配原则
复合索引遵从最左匹配原则,顾名思义,在组合索引中,最左侧的字段优先匹配。因此,在创建组合索引时,where子句中使用最频繁的字段放在组合索引的最左侧。
辅助索引是B+树实现的,虽然可以指定多个列,但是每个列的比较优先级不一样,写在前面的优先比较高。一旦出现遗漏,在B+树上就无法继续搜索了(通过补齐等措施解决的除外),因此是按照最左连续匹配来的。既然是在B+树上搜索,对于条件的比较自然是要求精确匹配(即"="和"IN")。
在where子句中用到两个字段c1和c2,那么创建索引时,两个字段的顺序应该是(c1,c2)还是(c2,c1)呢?
正确的做法是:把重复值最少的放前面。比如,95%的值都不重复,则可考虑放最前面。
字段顺序的影响
复合索引遵从最左匹配原则,那么在where查询条件中的字段是否也需要按照索引的顺序来写呢?
比如,复合索引为(c1,c2,c3),下面两个查询条件是否会对索引有影响呢?
select * from t_user where c1 = 1 and c2 = 4;
select * from t_user where c2 = 4 and c1 = 1;
看到有文章提出第一条SQL语句的效率更高,是否可信?两种查询方式条件一样,结果也应该一样,正常来说Mysql也会让它们走同样的索引。
通过Mysql的查询优化器explain分析上述两个条语句,会发现执行计划完全相同。也就是说:SQL语句中的字段顺序并不需要与复合索引字段顺序一致,查询优化器会自动调整顺序。
如果说有效率影响,那么也就是查询优化器矫正顺序的影响吧,几乎可以忽略不计。
单字段是否可以触发索引?
对于复合索引为(c1,c2,c3),相当于(c1),(c1,c2),(c1,c2,c3)三个索引,如果查询条件中只有c1,很显然是会走索引的。
但如果where条件如下呢:
from t_user where c2 = 4;
上述语句是否会走索引呢?这得分几种情况来说明。
执行explan查询c1为条件的SQL语句:
explain select * from t_user where c1 = 1;
上述语句走的索引类型为:ref。ref类型表示Mysql会根据特定的算法快速查找到符合条件的索引,而不会对索引中每一个数据都进行扫描判断。这种类型的索引为了快速查出数据,索引就需要满足一定的数据结构。
执行explan查询c2为条件的SQL语句:
explain select c2 from t_user where c2 = 4;
上述语句走的索引类型为:index。index类型表示Mysql会对整个索引进行扫描,只要是索引或索引的一部分Mysql就可能会采用index方类型的方式扫描。由于此种方式是一条数据一条数据查找,性能并不高。
在这个例子中,对查询的字段有一定的要求,where中条件为c2,select中查询出的字段也只能是c2,才会走index类型的索引。
如果将c2换成*或其他字段:
explain select * from t_user where c2 = 4;
上述语句会发现,不再走index索引,而是走全表扫描了。这也从侧面说明了Mysql为什么要讲最左匹配原则了。
所以结论是:如果单个字段为复合索引的首个字段,则会正常走索引;如果单个字段是复合索引的其他字段,且仅有该字段出现在select后面,则会走index类型索引;而其他情况,则走全表扫描。
复合索引可以替代单一索引吗?
单一索引:(c1),复合索引:(c1,c2)。
当c1作为查询条件时,单一索引和复合索引查询速度几乎一样,甚至比复合索引还要略快。
如果仅用复合聚集索引的非起始列(c2)作为查询条件的话,复合索引是不起任何作用的。
对于一张表来说,如果有复合索引(c1,c2),则无需再建单一索引(c1)。
如果已经存在单一索引(c1),因查询所需,可添加复合索引(c1,c2)来提升效率。
小结
本篇文章整理了Mysql复合索引使用时所需注意的一些知识点,在使用时可以通过explain来查看一下你的SQL语句是否走了索引,走了什么索引。
但还要了解的是:Mysql的执行计划和查询的实际执行过程并不完全吻合。
别问我为什么知道,因为在实践中遇到过。同一条SQL语句,查询条件不同,有可能会走索引,也有可能不会走索引。
来源:https://juejin.cn/post/7047109421620527134


猜你喜欢
- 启动targetcli时遭遇ImportError: cannot import name ALUATargetPortGrou
- explain显示了mysql如何使用索引来处理select语句以及连接表.可以帮助选择更好的索引和写出更优化的查询语句.使用方法:在sel
- 今天用vue来实现一个分页组件,总体来说,vue实现比较简单,样式部分模仿了elementUI。所有代码的源码可以再github上下载的到:
- 一:图形界面安装 1、打开Anconda2、点击Environment3、将Installed点击为Not installed4、搜索dja
- 本文实例讲述了Django框架实现的简单分页功能。分享给大家供大家参考,具体如下:前面一篇《Django开发的简易留言板》写了个简单的留言板
- 使用Requests测试带签名的接口部分业务为了安全需要,需要对接口请求数据做签名校验,一般制定一下规则1、业务方接入系统,需申请业务ID以
- mysql存储引擎概述什么是存储引擎?MySQL中的数据用各种不同的技术存储在文件(或者内存)中。这些技术中的每一种技术都使用不同的存储机制
- 本文实例讲述了python在windows下创建隐藏窗口子进程的方法。分享给大家供大家参考。具体实现方法如下:import subproce
- 目录jiaba库的使用1、jieba库的安装2、统计荷塘月色词频总结jiaba库的使用jieba库是一款优秀的 Python 第三方中文分词
- 一、绘制折线图使用plot()绘制折线图常用的参数:x:表示x轴的数据y:表示y轴的数据fmt:表示快速设置条样式的格式字符串。label:
- 前言忘了在哪看到一位编程大牛调侃,他说程序员每天就做两件事,其中之一就是处理字符串。相信不少同学会有同感。在Python中,我们经常会遇到字
- 前言本文中所有的代码使用 JavaScript 编写,但你也可以用其他兼容 JSR 223 的脚本语言。这些例子可作为脚本文件也可以在交互式
- 看代码吧~package mainimport ( "fmt")type XCDataStu struct { Id &
- 在前面的章节中,我们讨论了Series的计算方法与Pandas的自动对齐功能。不光是Series,DataFrame也是支持运算的,而且还是
- 一、文件基本的操作1、open() 打开文件open() 方法用于打开一个文件,并返回File文件对象,在对文件进行处理过程都需要使用到这个
- 描述给ChatGPT的描述内容:python在桌面上显示动态的文字,不要显示窗口边框。窗口背景和标签背景都是透明的,但标签内的文字是有颜色。
- 您可以将SQL Server 数据库引擎升级到 SQL Server 2008。SQL Server 安装程序只需最少的用户干预就可升级 S
- PHP的isset()函数 一般用来检测变量是否设置 格式:bool isset ( mixed var [, mixed var [, .
- 简述公司使用gitlab 来托管代码,日常代码merge request 以及其他管理是交给测试,鉴于操作需经常打开网页,重复且繁琐,所以交
- 最近一直在做Dnn模块的开发,过程中碰到这么一个问题,需要同时插入N条数据,不想在程序里控制,但是SQL Sever又不支持数组参数.所以只