SQLSERVER的非聚集索引结构深度理解
发布时间:2024-01-20 01:54:00
我们知道SQLSERVER的数据行的存储有两种数据结构:A: 堆 B :B树(binary 二叉树)
数据按照这种两种的其中一种来排序和存储,学过数据结构的朋友应该知道二叉树,为什麽用二叉树,因为方便用二分查找法来快速
找到数据。如果是堆,那么数据是不按照任何顺序排序的,也没有任何结构,数据页面也不是首尾相连的,不像B树,数据页面
使用双向链表首尾相连。堆表只依靠表里的IAM页(索引分配映射页)将堆的页面联系在一起,IAM里记录了页面编号,页面位置
除非表里有聚集索引,如果没有的话那么表里的数据的存储就是堆结构
那么非聚集索引呢?非聚集索引也是堆结构?其实SQLSERVER有几种页面类型(数据都使用一页一页来存储,就像Windows的内存也是使用页面来组织的)
其中有一种是索引页 ,一种是数据页
我感觉很多书都说不清,就像我一样,在文章的开头也是这样说的:数据行的存储有两种数据结构:A: 堆 B :B树(二叉树)
我觉得应该是数据页面的存储有两种数据结构:1、堆 2、B树
先说一下:索引页,不管是聚集索引还是非聚集索引,这些索引数据都存放在索引页,而索引页都是按照B树的结构里存储的
而堆页:也就是实际的数据行,如果表里没有聚集索引,那么实际的数据就放在堆页,如果聚集索引,那么数据就放在索引页
而B树里的节点 ,其实又叫页面,又叫节点 在B树里会有一页:root page(亦即是根节点),非聚集索引和聚集索引都是一样的
所以:数据行的存储有两种数据结构:A: 堆 B :B树(二叉树)
上面这句话应该明白了吧?
在说一下,在堆里的数据页面完全是随机存放的,而数据页面之间唯一的逻辑连接是记录在IAM页里的,所以IAM页也就扮演了root page的角色
那么聚集索引呢?聚集索引也是堆结构?
非聚集索引放在索引页,B树结构,数据依旧放在堆页,那么如果数据页放在堆里,不像聚集索引放在B树的叶子节点里
(亦即是放在索引页里),那么非聚集索引和实际的数据如何发生联系呢?
答案是:在非聚集索引的叶子节点(叶子页面)会有行 * ,而行 * 的作用请看下面红色字
非聚集索引与聚集索引具有相同的B树结构,他们之间的显著差别在于以下两点:
(1)基础表的数据行不按非聚集键的顺序排序和存储
(2)非聚集索引的叶层是由索引页而不是由数据页组成
(3)建立非聚集索引的表可以是一个B树,也可以是一个堆
(4)如果表是堆(意味着该表没有聚集索引),行 * 指向行的指针。该指针是由文件标识符ID:页码:页上的行数生成。整个
指针称为行ID(RID)
(5)如果表有聚集索引或索引视图上有聚集索引,则行 * 会指向聚集索引键。SQL通过使用存储在非聚集索引的叶子内的
指针(指向聚集索引键)搜索聚集索引来检索实际数据
非聚集索引不会改变或改善实际数据页的存储模式。他的B树结构只针对自己的索引页面。
不过,非聚集索引跟聚集索引的作用还是一样的,相当于检字表
最后总结一下吧,这麽短的随笔总结啥子呢?
当然是总结表的结构,因为曾经有人在论坛里问过一张表的结构
A 有聚集索引的表或者有聚集索引也有非聚集索引 (B树)
B 没有任何索引(堆)
C 没有聚集索引,有非聚集索引(B树+堆)
论坛里有人简称A为聚集表 ,B和C为堆表
记得以前在大学里数据结构老师讲过的一些数据结构:大根堆 ,小根堆 ,双向链表,二叉树
可惜现在全部还给老师了
附上图片
堆表的结构
非聚集索引的结构
聚集索引的结构


猜你喜欢
- Celery (芹菜)是基于Python开发的分布式任务队列。它支持使用任务队列的方式在分布的机器/进程/线程上执行任务调度。架
- django-debug-toolbar介绍django-debug-toolbar 是一组可配置的面板,可显示有关当前请求/响应的各种调试
- Qt Designer用于像VC++的MFC一样拖放、设计控件PyUIC用于将Qt Designer生成的.ui文件转换成.py文件Qt D
- 一 前言前几天一个开发同事咨询我,update 更新字段为相同的值是否会记录binlog,我回复说不会。其实 严格的说这个答案是不准确的,说
- 前言当使用pandas读取csv文件时,如果元素为空,则将其视为缺失值NaN(Not a Number, 非数字)。使用dropna()方法
- PDOStatement::fetchPDOStatement::fetch — 从结果集中获取下一行(PHP 5 >= 5.1.0,
- 一、使用等号查询可以像普通查询使用等号进行查询,但必须查询时间必须和字段对应时间完全相等,比如我要查下面这个值sql如下:SELECT id
- 本文实例为大家分享了梅尔倒谱系数实现代码,供大家参考,具体内容如下""" @author: zoutai@fi
- 什么是事务?事务是数据库管理系统执行过程中的一个逻辑单位,由一个有限的数据库操作序列构成。数据库事务通常包含了一个序列的对数据库的读/写操作
- 原理:建一个栈,每次碰到一个新标签,就与栈顶的标签配对,如果配对,栈顶的标签就出栈,如果不配对,这个新标签就进栈,最终,栈如果是空的,说明所
- --新增表字段 ALTER procedure [dbo].[sp_Web_TableFiled_Insert] ( @TableName
- 本文实例讲述了JavaScript使用indexOf()实现数组去重的方法。分享给大家供大家参考,具体如下:数组去重方法有多中,这里列举出自
- 一、什么是数据库连接池就是一个容器持有多个数据库连接,当程序需要操作数据库的时候直接从池中取出连接,使用完之后再还回去,和线程池一个道理。二
- getDatagetData方法主要是获取方法的元数据metadata。getData实现上借助metaMap和noop两个内部方法。met
- turtle.pencolor(* args )返回或设置pencolor。允许四种输入格式:pencolor()将当前的pencolor返
- 题目描述705. 设计哈希集合不使用任何内建的哈希表库设计一个哈希集合(HashSet)。实现 MyHashSet 类:void add(k
- 官方链接:https://cli.vuejs.org/zh/guide/installation.html1.安装Vue cli3 关于旧版
- 本文实例讲述了Python实现统计给定列表中指定数字出现次数的方法。分享给大家供大家参考,具体如下:直接看实现:#!usr/bin/env
- select语句中只能使用sql函数对字段进行操作(链接sql server),select 字段1 from 表1 where 字段1.I
- 记录一次报错解决方法:No converter found capable of converting from type [java.la