• mysql索引


    1.为什么要给表加上主键

    一个重要概念:平衡树,平衡因子的绝对值不能超过1
    myisam和innodb存储引擎只支持BTREE索引,即将平衡树当做数据表默认的索引数据结构
    
    #1.平时建表的时候都会为表加上主键,在某些关系数据库中,如果建表时不指定主键,数据库会拒绝建表的语句执行
    #2.一个没加主键的表,他的数据无序的放置在磁盘的存储器上,一行一行的排列的很整齐
    #3.事实上,一个加了主键的表,并不能被称为表,如果给表上了主键,那么表在磁盘上的存储结构就由整齐排列的结构转变成了树状结构,也就是上面说的平衡树结构,换句话说,就是整个表就变成了一个索引---》聚集索引
    
    主键的作用就是把表的数据格式转换成平衡树的格式放置

    #上图就是带有主键的表(聚集索引)的结构图
    其中树的所有结点(底部除外)的数据都是由主键字段中的数据组成,即结点只存key,也就是通常我们指定主键的id字段。最下面部分是真正表中的数据。假如我们执行一个SQL语句:select * from table where id = 126#首先根据索引定位到126这个值所在的叶结点,然后再通过叶结点取到id等于126的数据行,从上图看出,树一共有三层,从根节点至叶结点只需要经过三次查找就能找到结果

    2.为什么加索引后回事查询加快?

    #不使用索引
    假如一张表中有一亿条数据,需要查找其中某一条数据,按照常规逻辑,一条一条的去匹配的话,最快的情况下需要匹配一亿次才能得到结果,用大O标记法就是O(n)最坏时间复杂度,这是无法接受的,而且这一亿条数据显然不能一次性读入内存供程序使用,因此,这一亿次匹配在不经缓存优化的情况下就是一亿次的I/O开销,以现在磁盘的I/O能力和CPU的运算能力,有可能几月才能得出结果
    #使用索引
    如何把这张表转换成平衡树结构(一颗非常茂盛和节点非常多的树),假设这棵树有10层,那么只需要10次I/O开销就能查到所需要的数据,速度以指数级别提升,用大O标记就是O(logn)
    因此,利用索引会使数据库查询有惊人的性能提升

    3. 为什么加索引后会使写入,修改,删除变慢

    然而,事务都是有两面的,索引能让数据库查询数据的速度上升而使写入数据的速度下降,原因很简单的,#因为平衡树这个结构必须一致维持在一个正确的状态:增删改数据都会改变平衡树各节点中的索引数据内容,破坏树结构,因此,在每次数据改变时,DMS必须去重新梳理树(索引)的结构以确保他的正确,这会带来不小的性能开销,也就是为什么索引会给查询以外的操作带来副作用的原因。

    4. 当给表加上主键后,根据非主键字段查找时怎么加快,要是设置索引,查询机制是什么?

    # 引子:当我们设置id为主键,当我们执行下列查询语句:
    select * from table where name = Alex;
    遍历树结构,一个个找,同样很慢,因此需要如果将name也创建索引,就是常规索引即非聚集索引
    # 非聚集索引和聚集索引一样,同样是采用平衡树作为索引的数据结构
    索引树结构中各节点的值来自于表中的索引字段
    假如给user表的name字段加上索引,那么索引就是有name字段中的值构成,也就是说此树的节点就是name
    在数据改变时,DBMS需要一直维护索引结构的正确性。如果给表中多个字段加上索引,那么就会出现多个独立的索引结构,每个索引(非聚集索引)互相之间不存在关联。
    每次给字段建一个新索引,字段中的数据就会被复制一份出来,用于生成索引。因此给表添加索引,会增加表的体积,占用磁盘存储空间

     

    带有主键和三个非聚集索引的表的存储结构

    #非聚集索引和聚集索引的区别在于,通过聚集索引可以查到需要查找的数据,而非通过聚集索引可以查到记录对应的主键值,再使用主键的值通过聚集索引查找到需要的数据,如图
    不管以任何方式查询表,最终利用主键通过聚集索引来定位到数据,聚集索引(主键)是通过真实数据所在的唯一路径

    从非聚集索引开始查

    6.什么情况下要同时在两个字段上建索引?

    # 有一种例外可以不使用聚集索引就能查询出所需要的数据,这种非主流的方法称之为【覆盖索引】查询
    即复合索引或者多字段索引查询
    当为字段建立索引之后,字段中的内容就会被同步到索引之中,如果为一个索引指定两个字段那么这两个字段的内容都会被同步至索引之中
    # 先看下面这个SQL语句
    create index index_age on user_info(age);
    select user_name from user_info where age = '20';
    这句SQL语句的执行过程如下
        首先,通过非聚集索引index_age查找age等于19的所有记录的主键ID的值
        然后,通过得到主键ID值执行聚集索引查找,找到主键ID值对就的真实数据(数据行)存储的位置
        最后,从得到的真实数据中取得user_name字段的值返回,也就是最终取得的结果
    
    # 我们把birthday字段上的索引改成双字段的覆盖索引
        create index index_age_and_user_name on user_info(age, user_name);
    #这句SQL语句执行的过程就会变为
        通过非聚集索引index_age_and_user_name查找age等于19的叶节点的内容
        叶节点中除了有user_name表主键ID的值以外,user_name字段的值也在里面,因此不需要通过主键ID值得查找数据行的真实所在,直接去的叶节点中user_name的值返回即可
        通过这种覆盖索引直接查找的方式,可以省略不使用覆盖索引查找的后面两大步骤,大大提高了查询性能,如图:

    覆盖索引查找

    7.什么是最左前缀的规则

    #使用联合索引的时候,如果想要命中索引必须遵循最左前缀原则
    #最左匹配原则中,有如下说明:
        最左前缀匹配原则,非常重要的原则,mysql会一直向右匹配直到遇到查询范围(>,<,between,like)就停止匹配,比如a = 1 and b = 2 and c >3 and d = 4 如果建立(a,b,c,d)顺序的索引则都可以用到,a,b,c的顺序可以任意调整。
    
    =和in可以乱序,比如a=1 and b=2 and c=3建立(a,b.c)索引可以任意顺序,mysql的查询优化器会帮你优化成索引可以识别的形式
    生前无需久睡,死后自会长眠,努力解决生活中遇到的各种问题,不畏将来,勇敢面对,加油,你是最胖的,哈哈哈
  • 相关阅读:
    面试总结
    CentOS 6.4 yum安装LAMP环境
    windows下XAMPP安装php_memcache扩展
    linux学习笔记
    本地虚拟机LNMP环境安装
    Linux下php安装memcache扩展
    linux下memcached安装以及启动
    阿里云服务器---centos编译安装ffmpeg
    [Yii2.0] 以Yii 2.0风格加载自定义类或命名空间 [配置使用Yii2 autoloader]
    Linux常用命令
  • 原文地址:https://www.cnblogs.com/panshao51km-cn/p/12734974.html
Copyright © 2020-2023  润新知