MySQL InnoDB 索引 (INDEX) 页结构
InnoDB 为了不同的目的而设计了不同类型的页,我们把用于存放记录的页叫做索引页
索引页内容
索引页分为以下部分:
- File Header:表示页的一些通用信息,占固定的38字节
- Page Header:表索引页专有的一些信息,占固定的56个字节
- Infimum & Supremum:两个虚拟的伪记录,分别表示页中的最小和最大记录,占固定的26个字节
- User Records:真实存储我们插入的记录的部分,大小不固定
- Free Space:页中尚未使用的部分,大小不固定
- Page Directory:页中的某些记录相对位置,也就是各个槽在页面中的地址偏移量,大小不固定,插入的记录越多,这个部分占用的空间越多
- File Trailer:用于检验页是否完整的部分,占用固定的8个字节
文件头部(File Header)
文件头部各个类型的页都有
包含以下部分:
名称 | 大小 | 作用 |
---|---|---|
FIL_PAGE_SPACE_OR_CHKSUM | 4 | 页的校验和 (checksum) |
FIL_PAGE_OFFSET | 4 | 页号 (每个页的都不同) |
FIL_PAGE_PREV | 4 | 上一个页的页号 |
FIL_PAGE_NEXT | 4 | 下一个页的页号 |
FIL_PAGE_LSN | 8 | 页面被最后修改时对应的日志序列位置 (Log Sequence Number) |
FIL_PAGE_TYPE | 2 | 该页的类型 |
FIL_PAGE_FILE_FLUSH_LSN | 8 | 仅在系统表空间的一个页中定义,代表文件至少被刷新到了对应的 LSN 值 |
FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID | 4 | 页属于哪个表空间 |
FIL_PAGE_PREV
和 FIL_PAGE_NEXT
代表上一页和下一页的页码,使得多个索引页之间像双向链表一样连接起来
页面头部(Page Header)
页面头部索引页特有的,记录了当前页面的状态信息
包含以下部分:
名称 | 大小 (byte) | 作用 |
---|---|---|
PAGE_N_DIR_SLOTS | 2 | 页目录中的槽数量 |
PAGE_HEAP_TOP | 2 | 还未使用的空间最小地址,也就是说从该地址之后就是 Free Space |
PAGE_N_HEAP | 2 | 本页中的记录的数量(包括最小和最大记录以及标记为删除的记录) |
PAGE_FREE | 2 | 第一个已经标记为删除的记录地址(各个已删除的记录通过 next_record 也会组成一个单链表,这个单链表中的记录可以被重新利用) |
PAGE_GARBAGE | 2 | 已删除记录占用的字节数 |
PAGE_LAST_INSERT | 2 | 最后插入记录的位置 |
PAGE_DIRECTION | 2 | 记录插入的方向 (新插入记录的主键值比上一条记录的主键值大,插入方向就是右边,反之则是左边) |
PAGE_N_DIRECTION | 2 | 一个方向连续插入的记录数量 |
PAGE_N_RECS | 2 | 该页中记录的数量(不包括最小和最大记录以及被标记为删除的记录) |
PAGE_MAX_TRX_ID | 8 | 修改当前页的最大事务 ID,该值仅在二级索引中定义 |
PAGE_LEVEL | 2 | 当前页在 B+ 树中所处的层级 |
PAGE_INDEX_ID | 8 | 索引 ID,表示当前页属于哪个索引 |
PAGE_BTR_SEG_LEAF | 10 | B+ 树叶子段的头部信息,仅在 B+ 树的 Root 页定义 |
PAGE_BTR_SEG_TOP | 10 | B+ 树非叶子段的头部信息,仅在 B+ 树的 Root 页定义 |
最小记录(Infimum) & 最大纪录(Supremum)
两个虚拟的行记录,分别位于记录链表的开头和结尾
用户记录(User Records)
用户记录是按照相应行格式存储数据的地方
MySQL 行格式 <- 点击查看
记录之间的连接
以 Compact 为例:
借助 next_record
,记录之间像链表一样连接起来,顺序为主键从小到大排序,第一个为最小记录,最后一条为最大纪录
next_record
指向的是下一纪录真数据开始的地方,也就是下一纪录 next_record
之后
删除记录
当其中的一条记录被删除后,上一条记录的 next_record
指向下一条纪录,此记录标记为删除,next_record
指向 0,当前组最后一条记录 n_owned
更新
页目录 (Page Directory)
页目录在靠近页尾部的地方,记录着每组记录中最后一条记录的地址偏移量,每个偏移量被放在槽 (Slot) 中
分组
最小记录所在的分组只能有 1 条记录,最大记录所在的分组拥有的记录条数只能在 1~8 条之间,剩下的分组中记录的条数范围只能在是 4~8 条之间
n_owned
表示当前组中一共有几条记录
查找
由于页目录中记录的主键是有顺序的,所以可以通过二分法进行查找
通过二分法在页目录找到对应的槽,再遍历整个组中的记录
File Trailer
用于确认内存同步到磁盘是否完整
分为两部分:
前 4 个字节:校验和
当一个页面在内存中修改之后,在同步之前需要先计算出校验和
File Header 在页面的前面,所以校验和会先进行同步,File Trialer 在最后进行同步,如果两次校验和不同说明数据改变了
后 4 个字节:LSN
总结
索引页之间的连接
各个索引页可以按照页中最小主键值从小到大组成一个双向链表,每个索引页中的记录又会按照主键值从小到大组成一个单链表