MySQL查询性能优化七种方式索引潜水
作者:一灯架构??????? 发布时间:2024-01-20 01:11:35
前言:
有读者可能会一脸懵?
啥是索引潜水?
你给起的名字的吗?有没有索引蛙泳?
这个名字还真不是我起的,今天要讲的知识点就叫索引潜水(Index dive) 。
先要从一件怪事说起:
我先造点数据复现一下问题,创建一张用户表:
CREATE TABLE `user` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键ID',
`name` varchar(100) NOT NULL DEFAULT '' COMMENT '姓名',
`age` int(11) NOT NULL DEFAULT 0 COMMENT '年龄',
PRIMARY KEY (`id`),
KEY `idx_age` (`age`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
通过一批用户年龄,查询该年龄的用户信息,并查看一下SQL执行计划:
explain select * from user
where age in (1,2,3,4,5,6,7,8,9);
where条件中有9个参数,重点关注一下执行计划中的预估扫描行数为279行。
到这里没什么问题,预估的非常准,实际就是279行。
但是,问题来了,当我们在where条件中,再加一个参数,变成了10个参数,预估扫描行数本应该增加,结果却大大减少了。
explain select * from user
where age in (1,2,3,4,5,6,7,8,9,10);
一下子减少到了30行,可是实际行数是多少呢?
实际是310行,预估扫描行数是30行,真是错到姥姥家了。
MySQL咋回事啊,到底还能不能预估?
不能预估的话,换其他人!
大家肯定也是满脸疑惑,直到我去官网上看到了一个词语,索引潜水(Index dive) 。
跟这个词语相关的,还有一个配置参数 eq_range_index_dive_limit。
MySQL5.7.3之前的版本,这个值默认是10,之后的版本,这个值默认是200。
可以使用命令查看一下这个值的大小:
show variables like '%eq_range_index_dive_limit%';
当然,我们也可以手动修改这个值的大小:
set eq_range_index_dive_limit=200;
这个 eq_range_index_dive_limit 配置的作用就是:
当where语句in条件中参数个数小于这个值的时候,MySQL就采用索引潜水(Index dive) 的方式预估扫描行数,非常准确。
当where语句in条件中参数个数大于等于这个值的时候,MySQL就采用另一种方式索引统计(Index statistics) 预估扫描行数,误差较大。
MySQL为什么要这么做呢?
都用索引潜水(Index dive) 的方式预估扫描行数,不好吗?
其实这是基于成本的考虑,索引潜水估算成本较高,适合小数据量。索引统计估算成本较低,适合大数据量。
一般情况下,我们的where语句的in条件的参数不会太多,适合使用索引潜水预估扫描行数。
建议还在使用MySQL5.7.3之前版本的同学们,手动修改一下索引潜水的配置参数,改成合适的数值。
如果你们项目中in条件最多有500个参数,就把配置参数改成501。
这样MySQL预估扫描行数更准确,可以选择更合适的索引。
来源:https://juejin.cn/post/7128043063661821966
猜你喜欢
- 一、 什么是遗传算法?遗传算法是仿真生物遗传学和自然选择机理,通过人工方式所构造的一类搜索算法,从某种程度上说遗传算法是对生物进化过程进行的
- 霍夫变换是一种检测任何形状的流行技术,可以检测形状,即使它被破坏或扭曲一点点.一条线可以表示成y = mx + c或参数形式,像ρ=xcos
- 实验环境:windows 7,anaconda 3(python 3.5),tensorflow(gpu/cpu)函数介绍:所用函数为six
- 1、层次索引1.1 定义在某一个方向拥有多个(两个及两个以上)索引级别,就叫做层次索引。通过层次化索引,pandas能够以较低维度形式处理高
- 问题创建一个二叉树二叉树有限多个节点的集合,这个集合可能是:空集由一个根节点,和两棵互不相交的,分别称作左子树和右子树的二叉树组成创建二叉树
- 前后端分离的开发模式,原本觉得没什么稀奇的玩艺,在最近参与的一个大型项目中,让我有了更深的理解。前后端分离的开发模式:系统分析阶段,系分和前
- 前面我们给了Tkinter接管Python输入和输出的介绍,我们不难可以想到,能用Tkinter来开发自己的Python代码编辑器.例如可以
- 代码如下:Function htmll(mulu,htmlmulu,FileName,filefrom,htmla,htmlb,h
- 本文实例讲述了python中迭代器(iterator)用法。分享给大家供大家参考。具体如下:#-----------------------
- 前言:处理字符串时经常要定制化去掉无用的空格,python 中要么用存在的常规方法,或者用正则处理1.去掉左边空格string = &quo
- 模型VGG,数据集cifar。对照这份代码走一遍,大概就知道整个pytorch的运行机制。 来源 定义模型:'''V
- 在 Google 搜索结果页面中,将其 Logo 图标右键另存为后可以发现,它并非单纯的
- SQL语句更改表所有者SQL语句更改表所有者单个修改所有者sql语句如下:查询分析器输入:EXEC sp_changeobject
- 目录一、axis简介二、不一样的axis对于axis=0三、总结补充:python中某些函数axis参数的理解在我们使用Python中的Nu
- 很多小伙伴都会有这样的问题,说一个ip地址十分钟内之内注册一次,用来防止用户来重复注册带来不必要的麻烦逻辑:取ip,在数据库找ip是否存在,
- python五子棋原创算法,供大家参考,具体内容如下我们都见过五子棋,但是在我看来五子棋单机游戏中,逻辑赢法很重要,经常用到的算法是五子连珠
- 前言相信大家都玩过斗地主,规则就不再介绍了。直接上一张朋友圈看到的残局图:这道题我刚看到时,曾尝试用手工来破解,每次都以为找到了农民的必胜策
- 简单的测试用例#!/usr/bin/python# -*- coding: UTF-8 -*-import timefrom pymongo
- 默认本系列的的读者已经初步熟悉tensorflow。我们通过tf.Variable构造一个variable添加进图中,Variable()构
- SQL Server 2005的新功能为动态管理对象,它们是在指定时间返回某个数据库实例的特殊状态信息的数据库视图或函数。这些对象允许数据库