• 【Mysql】InnoDB 引擎中的页目录


    一、页目录和槽

    接上一篇,现在知道记录在页中按照主键大小顺序串成了单链表。

    那么我使用主键查询的时候,最顺其自然的办法肯定是从第一条记录,也就是 Infrimum 记录开始,一直向后找,只要存在总会找到。这种在数据量少的时候还好说,一旦数据多了,遍历耗时一定非常长。

    于是,作者又想到了一个好办法,灵感来自于书本中的目录。我们翻书的时候想查找一些内容,就会去查看目录,然后直接确定好内容所在的页码。

    那么对于 InnoDB 来说,过程如下:

    • 将所有正常的记录划分为几个组,这里包括那 2 条虚拟记录,但是不包含已经被移除到垃圾链表的记录。
    • 每个组内最后一条记录(也就是最大的那条)就是“大哥”,其他记录都是“小弟”,而“大哥”记录的头信息中的 n_owned 属性表示该组内共有几条记录。
    • 将每个组中最后一条记录在页面中的地址偏移量单独提取出来,按顺序存储到靠近页尾部的地方。

    这个地方就是页目录 Page Directory。而上述的地址偏移量就是该记录的真实数据与页面中第 0 个字节之间的距离,这些地址偏移量被称为

    每个槽占用 2 字节,页目录就是由多个槽组成

    二、页目录的规定

    在上一篇中,创建的表里存在 4 条数据,那么在页中还要算上 Infimum 和 Supremum,共 6 条记录。

    这时候 InnoDB 会把它们分出 2 个组:

    • 第一组:只有一个 Infimum 记录
    • 第二组:剩下的 5 条记录

    每个槽中,存放着每个组里最大的那条记录所在页面中的地址偏移量。

    从图中,需要关注页目录的一些点:

    • 页目录有 2 个槽,说明记录被分为 2 个组。
    • Infimum 记录的 n_owned 属性值为 1,而 Supremum 的为 5。

    为什么这 6 条记录要这样分?因为作者对于每组中的记录数量有规定

    • 对于 Infimum 所在的分组只能有 1 条记录。
    • Supremum 所在的分组只能在 1~8 条之间。
    • 剩下的分组,记录条数范围只能是 4~8 之间。

    三、页目录查找记录的过程

    现在继续向测试表里插入 12 条数据,也就是说在页中共有 18 条记录。

    然后这些记录就被分成了 5 个组,这里参考书籍上的示意图(只保留一些关键属性):

    现在,要查找主键是 6 的记录,要如何进行?

    因为 5 个槽的编号分别为 0、1、2、3、4 挨着的,并且里面的主键值也都是从小到大进行排序的,可以使用二分法(不清楚的可以百度),那么初始情况下 low=0,high=4:

    1. 计算中间槽的位置,(0+4)/ 2=2,于是查看槽 2 对应记录的主键值为 8,因为 8 > 6,所以 high = 2,low 不变。
    2. 重新计算中间槽位置,(0+2)/ 2=1,于是查看槽 1 对应记录的主键为4,因为 4 < 6,所以 high 不变,low = 1。
    3. 因为 high - low = 1,所以确定主键值为6 的记录就在槽 2 对应的组中。接着找到该组中主键最小的记录,沿着单链表向后遍历,最终找到主键 6 的记录。

    这里有个问题,槽对应的值都是这个组的主键最大的记录,如何找到组里最小的记录?比如槽 2 对应最大主键是 8 的记录,那如何找到最小记录。

    解决办法是:

    • 通过槽 2 找到 槽 1 对应的记录,也就是主键为 4 的记录。
    • 主键为 4 的记录的下一条记录就是槽 2 当中主键最小的记录,可以找到主键 5。

    总结
    在一个数据页中查找指定主键值的记录,过程分为 2 步:

    1. 通过二分法确定该记录所在分组对应的槽,然后找到该槽所在分组中主键值最小的记录。
    2. 通过记录的 next_record 属性比那里该槽所在组的各个记录,最终找到目标记录。



    本文参考书籍: 小孩子4919 《mysql是怎样运行的》
    --不要用肉体的勤奋,去掩盖思考的懒惰--
  • 相关阅读:
    多线程中,上锁的理解
    sql server 2008 联机丛书
    序列化是线程安全的么
    对象化下的编程——字段
    Dic实现工厂模式
    design principle:java 回调与委派/委托机制(转)
    风筝数据结构学习笔记(2)后序遍历二叉树(非递归)
    风筝数据结构学习笔记(1)利用链式存储结构和递归构建二叉树
    吕震宇老师《设计模式系列》
    吕震宇老师《设计模式随笔系列》
  • 原文地址:https://www.cnblogs.com/pingguo-softwaretesting/p/15053856.html
Copyright © 2020-2023  润新知