• Explain关键字解析


    Explain 用法

    explain模拟Mysql优化器是如何执行SQL查询语句的,从而知道Mysql是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。

    语法:Explain + SQL 语句;

    如:Explain select * from user; 会生成如下 SQL 分析结果,

     

    列名 描述
    id 在一个大的查询语句中每个SELECT关键字都对应一个唯一的id
    select_type SELECT关键字对应的那个查询的类型
    table 表名
    partitions 匹配的分区信息
    type 针对单表的访问方法
    possible_keys 可能用到的索引
    key 实际上使用的索引
    key_len 实际使用到的索引长度
    ref 当使用索引列等值查询时,与索引列进行等值匹配的对象信息
    rows 预估的需要读取的记录条数
    filtered 某个表经过搜索条件过滤后剩余记录条数的百分比
    Extra 一些额外的信息

    下面详细对每个字段进行详解

    id

    id是一组数字,代表多个表之间的查询顺序,或者包含子句查询语句中的顺序,id 总共分为三种情况,依次详解

    1.id 相同,执行顺序由上至下

    2.id 不同,如果是子查询,id 号会递增,id 值越大优先级越高,越先被执行

    3.id 相同和不同的情况同时存在

     id相同的为一组,组内从上到到下执行,在所有组中,id越大,越优先执行

    select_type

    select_type 包含以下几种值

    • simple
    • primary
    • subquery
    • derived
    • union
    • union result

    simple

    简单的 select 查询,查询中不包含子查询或者 union 查询

    primary

    如果 SQL 语句中包含任何子查询,那么子查询的最外层会被标记为 primary

     

    subquery

    在 select 或者 where 里包含了子查询,那么子查询就会被标记为 subQquery,见上例

    derived

    在 from 中包含的子查询,会被标记为衍生查询,会把查询结果放到一个临时表中

    union / union result

    如果有两个 select 查询语句,他们之间用 union 连起来查询,那么第二个 select 会被标记为 union,union 的结果被标记为 union result。它的 id 是为 null 的

     

    table

    表示这一行的数据是哪张表的数据

    type

    type 是代表 MySQL 使用了哪种索引类型,不同的索引类型的查询效率也是不一样的,type 大致有以下种类

    • system
    • const
    • eq_ref
    • ref
    • range
    • index
    • all

    性能按type排序

    system > const > eq_ref > ref > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

    system

    表中只有一行记录,system 是 const 的特例,几乎不会出现这种情况,可以忽略不计

    const

    将主键索引或者唯一索引放到 where 条件中查询,MySQL 可以将查询条件转变成一个常量,只匹配一行数据,索引一次就找到数据了

    eq_ref

    在多表查询中,如 T1 和 T2,T1 中的一行记录,在 T2 中也只能找到唯一的一行,说白了就是 T1 和 T2 关联查询的条件都是主键索引或者唯一索引,这样才能保证 T1 每一行记录只对应 T2 的一行记录

    举个不太恰当的例子,EXPLAIN SELECT * from t1 , t2 where t1.id = t2.id

     

    ref

    不是主键索引,也不是唯一索引,就是普通的索引,可能会返回多个符合条件的行。

    range

    体现在对某个索引进行区间范围检索,一般出现在 where 条件中的 between、and、<、>、in 等范围查找中。

    index

    将所有的索引树都遍历一遍,查找到符合条件的行。索引文件比数据文件还是要小很多,所以比不用索引全表扫描还是要快很多。

    all

    没用到索引,单纯的将表数据全部都遍历一遍,查找到符合条件的数据

    possible_keys

    此次查询中涉及字段上若存在索引,则会被列出来,表示可能会用到的索引,但并不是实际上一定会用到的索引

    key

    此次查询中实际上用到的索引

    key_len

    表示索引中使用的字节数,通过该属性可以知道在查询中使用的索引长度,注意:这个长度是最大可能长度,并非实际使用长度,在不损失精确性的情况下,长度越短查询效率越高

    ref

    显示关联的字段。如果使用常数等值查询,则显示 const,如果是连接查询,则会显示关联的字段。

    • tb_emp 表为非唯一性索引扫描,实际使用的索引列为 idx_name,由于 tb_emp.name='rose'为一个常量,所以 ref=const。
    • tb_dept 为唯一索引扫描,从 sql 语句可以看出,实际使用了 PRIMARY 主键索引,ref=db01.tb_emp.deptid 表示关联了 db01 数据库中 tb_emp 表的 deptid 字段。

    rows

    根据表信息统计以及索引的使用情况,大致估算说要找到所需记录需要读取的行数,rows 越小越好

    extra

    不适合在其他列显示出来,但在优化时十分重要的信息

    using  fileSort(重点优化)

    俗称 " 文件排序 " ,在数据量大的时候几乎是“九死一生”,在 order by 或者在 group by 排序的过程中,order by 的字段不是索引字段,

    或者 select 查询字段存在不是索引字段,或者 select 查询字段都是索引字段,但是 order by 字段和 select 索引字段的顺序不一致,都会导致 fileSort

    using temporary(重点优化)

    使用了临时表保存中间结果,常见于 order by 和 group by 中。

    USING index(重点)

    表示相应的 select 操作中使用了覆盖索引(Coveing Index),避免访问了表的数据行,效率不错!

    如果同时出现 using where,表明索引被用来执行索引键值的查找;如果没有同时出现 using where,表面索引用来读取数据而非执行查找动作。

    Using wher

    表明使用了 where 过滤

    using join buffer

    使用了连接缓存

    impossible where

    where 子句的值总是 false,不能用来获取任何元组

    select tables optimized away

    在没有 GROUPBY 子句的情况下,基于索引优化 MIN/MAX 操作或者 对于 MyISAM 存储引擎优化 COUNT(*)操作,不必等到执行阶段再进行计算, 查询执行计划生成的阶段即完成优化。

    distinct

    优化 distinct,在找到第一匹配的元组后即停止找同样值的工作

     

     

    总结

    性能按type排序

    system > const > eq_ref > ref > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

    性能按Extra排序

    • Using index:用了覆盖索引
    • Using index condition:用了条件索引(索引下推)
    • Using where:从索引查出来数据后继续用where条件过滤
    • Using join buffer (Block Nested Loop):join的时候利用了join buffer(优化策略:去除外连接、增大join buffer大小)
    • Using filesort:用了文件排序,排序的时候没有用到索引
    • Using temporary:用了临时表(优化策略:增加条件以减少结果集、增加索引,思路就是要么减少待排序的数量,要么就提前排好序)
    • Start temporary, End temporary:子查询的时候,可以优化成半连接,但是使用的是通过临时表来去重
    • FirstMatch(tbl_name):子查询的时候,可以优化成半连接,但是使用的是直接进行数据比较来去重

    常见的优化手段

    • SQL语句中IN包含的值不应过多,不能超过200个,200个以内查询优化器计算成本时比较精准,超过200个是估算的成本,另外建议能用between就不要用in,这样就可以使用range索引了。
    • SELECT语句务必指明字段名称:SELECT * 增加很多不必要的消耗(cpu、io、内存、网络带宽);增加了使用覆盖索引的可能性;当表结构发生改变时,前断也需要更新。所以要求直接在select后面接上字段名。
    • 当只需要一条数据的时候,使用limit 1
    • 排序时注意是否能用到索引
    • 使用or时如果没有用到索引,可以改为union all 或者union
    • 如果in不能用到索引,可以改成exists看是否能用到索引
    • 使用合理的分页方式以提高分页的效率
    • 不建议使用%前缀模糊查询
    • 避免在where子句中对字段进行表达式操作
    • 避免隐式类型转换
    • 对于联合索引来说,要遵守最左前缀法则
    • 必要时可以使用force index来强制查询走某个索引
    • 对于联合索引来说,如果存在范围查询,比如between,>,<等条件时,会造成后面的索引字段失效。
    • 尽量使用inner join,避免left join,让查询优化器来自动选择小表作为驱动表
    • 必要时刻可以使用straight_join来指定驱动表,前提条件是本身是inner join

     

  • 相关阅读:
    xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
    xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
    Javascript事件机制
    DOM模型
    MVC与三层架构解析学习
    BOM基础
    Javascript对象
    Javascript关键字,条件语句,函数及函数相关知识
    单词首字母大写
    HTML5.1 新增的14项特性学习
  • 原文地址:https://www.cnblogs.com/lusaisai/p/13396071.html
Copyright © 2020-2023  润新知