• SQL索引


    SQL索引目录   

    借这次机会呢,将SQL索引的理解整理出来,供大家一起学习提高,这是我的学习笔记,有错误的地方,欢迎大家批评指正。下面是预计的目录:

    • 索引基础知识  
    • 聚集索引  
    • 非聚集索引  
    • 认识执行计划  
    • 灵活设计数据库      

    页和区

    要想做好索引优化,知道索引的存储结构是至关重要的。谈到存储就需要了解SQL中的页和区的概念:  

    • SQL中存储数据的基础单位就是页,一个页大小为8K,数据库可以将数据从逻辑上分成页,磁盘的I/O操作就是在页级执行。页包信三项内容:
      • 96字节大小的标头,存储统计信息,包括页码、页类型、页的可用空间以及拥有该页的对象的分配单元 ID。页类型我们知识如下三项基本就够用:
        • 数据页,除了大型对象的数据列之外的数据存储页,比如int,float,varchar等。     
        • 索引页,存放索引的条目。
        • 大型对象数据类型,比如text,image,nvarchar(max)等。        
      • 数据行
      • 行偏移量
    • 一个区包含8个页,它是管理空间的单位,分为如下两类
      • 统一区,由单个对象所有。
      • 混合区,最多可由八个对象共享。
    • 一般情况下,给表或者索引申请新的空间时,从混合区分配,当这个表或者索引的空间超过8个页大小时,会将原本在混合区的页转移到统一区管理。

    表存储结构

    知识了区以及页的概念,再看下数据表和这两者之间的联系, 表包含一个或多个分区,每个分区在一个堆或一个聚集索引结构中包含数据行。从下图的结构中,我们就看到了索引的重要结构B-树了。

                 

    聚集索引结构

    索引中的底层节点称为叶节点。根节点与叶节点之间的任何索引级别统称为中间级。在聚集索引中,叶节点包含基础表的数据页。根节点和中间级节点包含存有索引行的索引页。每个索引行包含一个键值和一个指针,该指针指向 B -树上的某一中间级页或叶级索引中的某个数据行。每级索引中的页均被链接在双向链接列表中。

              

    非聚集索引结构

                

    非聚集索引与聚集索引之间的显著差别在于以下两点:

    • 基础表的数据行不按非聚集键的顺序排序和存储。
    • 非聚集索引的叶层是由索引页而不是由数据页组成。

    问题:

    • 索引的结构到底分多少层?

    我们先看下B-树,这种索引结构有一个重要的参数n,它决定了索引存储页的布局,每个存储页需要存放n个节点,以及n+1个指针。 这里我们来做个计算:比如我们的索引是一个整形数字,4个字节,指针需要8个字节,这里不考虑索引页标头信息的占用,算下最大的n,公式: 4n+8(n+1)<=8*1024 ,这个值是680,即最大可存放680个键,再按B-树充满度来取75%等于510,根结点有510个,那么它会有510*510个叶结点,这些叶结点会有510*510*510个指向最终记录的指针。这个数据足以说明绝多数情况下,只要三层就能够用。

    • 什么是稠密索引?

    索引中的键顺序与数据文件中的排序顺序相同,所以我们的索引结构中,叶级均采用稿密索引。

    • 什么是稀疏索引?

    它只为每个存储块设计键-指针对,比稿密索引节约空间,出现在叶级之上的结构中。

    • 索引结构中会出现如下情况吗?

    要想回答这个问题,就需要了解索引在维护过程中对于B-树的调整,SQL会通过一定的算法将B-树的充满度达到一定的平衡,这里就会涉及的节点的拆分以及合并,所以一般情况下无论对数据做怎样的更新,也不会出现下图中如此不平衡的情况。

    注:如果问重建索引的好处时,如果你回答是为了平衡B-树,那么要谨慎回答。

        

  • 相关阅读:
    临时产品id记录
    一张图包含SEO一切要点
    Java基础之Volatile原理
    docker
    Linux设置虚拟内存教学和实战
    用最简单的话告诉你什么是ElasticSearch
    git全局配置修改
    数组和字符串方法区别
    git初级使用
    JavaScript的5中基本数据类型
  • 原文地址:https://www.cnblogs.com/geowu/p/4732741.html
Copyright © 2020-2023  润新知