• 索引


    简介
    官方定义:索引(index)是帮助MySQL高效获取数据的数据结构
    分类
    一个索引值包含单个列,一张表可以有多个单列索引
    索引列的值必须是唯一,单允许有空
    一个索引包含多个列,时间开发中推荐使用
    哪些情况需要创建索引
    1.主键,唯一索引
    2.经常用作查询条件的字段需要创建索引
    3.经常需要排序、分组和统计的字段需要创建索引
    4.查询中与其他表关联的字段,外键关系创建索引
    哪些情况不需要创建索引
    1.表中数据少,百万级以下的数据表不需要创建索引
    2.经常增删改的表不需要创建索引
    3.数据重复且分布平均的字段不需要创建索引
    4.频繁更新的字段不合适创建索引
    5.where条件里用不到的字段不需要创建索引
    优势
    1.提高数据的检索速度,降低数据库IO成本:使用索引的意义就是缩小表中需要查询的行数,从而加快搜索的速度。
    2.降低数据排序的成本,降低CUP消耗:索引之所以查的快,是因为先将数据排好序,若该字段正好需要排序,则正好降低了排序的成本。
    劣势
    1.占用存储空间:索引实际上也就是一张表,记录了主键和索引字段,一般以索引文件的形式存储在磁盘上
    2.降低更新表的速度:表的数据发生了变化,对应索引也需要一起变更,从而降低了更新速度;否则索引指向的物理数据及可能不对,这也是索引失效的原因之一。
    3.优质索引创建难:索引的创建并非一日之功,也并非一直不变。需要频繁根据用户的行为和具体的业务逻辑创建最佳的索引。
    MySQL自身瓶颈
    MySQL自身常见的性能问题有磁盘空间不足、磁盘IO太大、服务器硬件性能低
    CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据的时候
    磁盘IO瓶颈发生在装入数据远大于内存容量的时候
    top,free,iostat 和 vmstat来查看系统的性能状态
    explain分析sql语句
    使用explain关键字可以模拟优化器执行sql查询语句,从而得知MySQL 是如何处理sql语句。
    +----+-------------+-------+------------+------+---------------+-----+---------+------+------+----------+-------+
    | id | select_type | table | partitions | type | possible_keys | key | key_len | ref  | rows | filtered | Extra |
    +----+-------------+-------+------------+------+---------------+-----+---------+------+------+----------+-------+
    
    id
    select查询的序列号,包含一组可以重复的数字,表示查询中执行sql语句的顺序:
    第一种:id全部相同,sql的执行顺序是由上至下
    第二种:id全部不同,sql的执行顺序是根据id大的优先执行
    第三种:id既存在相同,有存在不同的,先根据id大的优先执行,再根据相同id从上至下执行
    select_type
    select 查询的类型,主要是用于区别普通查询,联合查询,嵌套的复杂查询
    简单的select 查询,查询中不包含子查询或者union
    查询中若包含任何复杂的子查询,最外层查询则被标记为primary
    在select或where 列表中包含了子查询
    在from列表中包含的子查询被标记为derived(衍生)MySQL会递归执行这些子查询,把结果放在临时表里。
    若第二个select出现在union之后,则被标记为union,若union包含在from子句的子查询中,外层select将被标记为:derived
    从union表获取结果的select
    partitions
    表所使用的分区,如果要统计十年公司订单的金额,可以把数据分为十个区,每一年代表一个区。这样可以大大的提高查询效率。
    type
    这是一个非常重要的参数,连接类型,常见的有:all , index , range , ref , eq_ref , const , system , null 八个级别。
    性能从最优到最差的排序:system > const > eq_ref > ref > range > index > all
    full table scan)全表扫描无疑是最差,若是百万千万级数据量,全表扫描会非常慢。
    (full index scan)全索引文件扫描比all好很多,毕竟从索引树中找数据,比从全表中找数据要快。
    只检索给定范围的行,使用索引来匹配行。范围缩小了,当然比全表扫描和全索引文件扫描要快。sql语句中一般会有between,in,>,< 等查询。
    非唯一性索引扫描,本质上也是一种索引访问,返回所有匹配某个单独值的行。比如查询公司所有属于研发团队的同事,匹配的结果是多个并非唯一值。
    唯一性索引扫描,对于每个索引键,表中有一条记录与之匹配。比如查询公司的CEO,匹配的结果只可能是一条记录,
    表示通过索引一次就可以找到,const用于比较primary key 或者unique索引。因为只匹配一行数据,所以很快,若将主键至于where列表中,MySQL就能将该查询转换为一个常量。
    表只有一条记录(等于系统表),这是const类型的特列,平时不会出现,了解即可
    possible_keys
    显示查询语句可能用到的索引(一个或多个或为null),不一定被查询实际使用。仅供参考使用。
    key
    显示查询语句实际使用的索引。若为null,则表示没有使用索引。
    key_len
    显示索引中使用的字节数,可通过key_len计算查询中使用的索引长度。在不损失精确性的情况下索引长度越短越好。key_len 显示的值为索引字段的最可能长度,并非实际使用长度,即key_len是根据表定义计算而得,并不是通过表内检索出的。
    ref
    显示索引的哪一列或常量被用于查找索引列上的值。
    rows
    根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数,值越大越不好。
    extra
    说明MySQL会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序” 。出现这个就要立刻优化sql。
    使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序 order by 和 分组查询 group by。 出现这个更要立刻优化sql。
    表示相应的select 操作中使用了覆盖索引(Covering index),避免访问了表的数据行,效果不错!如果同时出现Using where,表明索引被用来执行索引键值的查找。如果没有同时出现Using where,表示索引用来读取数据而非执行查找动作。
    也叫索引覆盖,就是select 的数据列只用从索引中就能够取得,不必读取数据行,MySQL可以利用索引返回select 列表中的字段,而不必根据索引再次读取数据文件。
    在5.6版本后加入的新特性,优化器会在索引存在的情况下,通过符合RANGE范围的条数 和 总数的比例来选择是使用索引还是进行全表遍历。
    表明使用了where 过滤
    表明使用了连接缓存
    where 语句的值总是false,不可用,不能用来获取任何元素
    优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。
    filtered
    一个百分比的值,和rows 列的值一起使用,可以估计出查询执行计划(QEP)中的前一个表的结果集,从而确定join操作的循环次数。小表驱动大表,减轻连接的次数。
    通过explain的参数介绍,我们可以得知:
    1 表的读取顺序(id)
    2 数据读取操作的操作类型(type)
    3 哪些索引被实际使用(key)
    4 表之间的引用(ref)
    5 每张表有多少行被优化器查询(rows)
  • 相关阅读:
    MySQL 数据实时同步到 Elasticsearch 的技术方案选型和思考
    编写高质量可维护的代码之优化逻辑判断
    Java8 lambda表达式常见用法
    jar安装到maven本地仓库
    微信小程序获取用户手机号
    spring aop 、Redis实现拦截重复操作
    redis自定义RedisCacheManager
    locust做并发测试实战
    几个绕过短信验证码限制的漏洞挖掘
    通达OA任意用户登录和后台GetShell漏洞复现
  • 原文地址:https://www.cnblogs.com/nubi/p/dbindex.html
Copyright © 2020-2023  润新知