• MySQL Explain查看执行计划详解



    前言

      什么是执行计划?简而言之,就是 SQL 在数据库中执行时的表现情况,通常用于 SQL 性能分析、优化和加锁分析等场景,执行过程会在 MySQL 查询过程中由解析器,预处理器和查询优化器共同生成。在MySQL中使用 explain 关键字来查看。

      执行计划能告诉我们什么?她可以用来分析SQL语句和表结构的性能瓶颈。通过分析explain的输出结果集,可以了解到诸如关联查询的执行顺序、查询操作的操作类型、哪些索引可以被命中、哪些索引实际被命中、每张表有多少记录参与查询等信息。接下来,我们将介绍在explain结果集中每一列的意义。

    EXPLAIN 中的列

    mysql> explain select * from servers;
    
    +----+-------------+---------+------+---------------+------+---------+------+------+-------+
    
    | id | select_type | table   | type | possible_keys | key  | key_len | ref  | rows | Extra |
    
    +----+-------------+---------+------+---------------+------+---------+------+------+-------+
    
    |  1 | SIMPLE      | servers | ALL  | NULL          | NULL | NULL    | NULL |    1 | NULL  |
    
    +----+-------------+---------+------+---------------+------+---------+------+------+-------+
    
    1 row in set (0.03 sec)
    

      expain执行后输出的结果集包含10列,分别是id、select_type、table、type、possible_keys、key、key_len、ref、rows和Extra,下面对这些字段进行解释。

    列名 说明
    id 执行编号,标识select所属的行。如果在语句中没子查询或关联查询,只有唯一的select,每行都将显示1。否则,内层的select语句一般会顺序编号,对应于其在原始语句中的位置
    select_type 显示本行是简单或复杂select。如果查询有任何复杂的子查询,则最外层标记为PRIMARY(DERIVED、UNION、UNION RESUlT)
    table 访问引用哪个表(引用某个查询,如“derived3”)
    type 数据访问/读取操作类型(ALL、index、range、ref、eq_ref、const/system、NULL)
    possible_keys 揭示哪一些索引可能有利于高效的查找
    key 显示mysql决定采用哪个索引来优化查询
    key_len 显示mysql在索引里使用的字节数
    ref 显示了之前的表在key列记录的索引中查找值所用的列或常量
    rows 为了找到所需的行而需要读取的行数,估算值,不精确。通过把所有rows列值相乘,可粗略估算整个查询会检查的行数
    Extra 额外信息,如using index、filesort等

    id 和select_type

      每个被独立执行的操作的标识,表示各个SQL片段被操作的顺序;在嵌套查询中id越大的语句越先执行,如果相同,那么按照从上到下的顺序执行。该值可能为NULL,如果这一行用来说明的是其他行的联合结果。

    -- 查看在研发部并且名字以Jef开头的员工,经典查询
    explain select e.no, e.name from emp e left join dept d on e.dept_no = d.no where e.name like 'Jef%' and d.name = '研发部';
    


      select_type表示查询的类型,其枚举值和说明见下表:

    类型 说明
    simple 简单SELECT,不包含子查询和union
    primary 包含union或者子查询,最外层的部分标记为primary
    subquery 一般子查询中的子查询被标记为subquery,也就是位于select列表中的查询
    derived 派生表——该临时表是从子查询派生出来的,位于from中的子查询
    union 位于union中第二个或者其以后的子查询被标记为union,第一个就被标记为primary。若union位于from中,则标记为derived。取决于外面的查询
    union result 用来从匿名临时表里检索结果的select子句被标记为union result
    dependent union 顾名思义,首先需要满足UNION的条件,及UNION中第二个以及后面的SELECT语句,同时该语句依赖外部的查询
    subquery 子查询中第一个SELECT语句
    dependent subquery 子查询中的第一个 select,取决于外侧的查询,一般是 in 中的子查询。


      该示例中,in子查询的select_type被标记为dependent subquery ,主查询被标记为primary。


      此图展示了 union 和 union result 的 SQL 案例。

    table

      对应行正在访问哪一个表,可以是表名或者别名

    • 关联优化器会为查询选择关联顺序,左侧深度优先
    • 当from中有子查询的时候,表名是derivedN的形式,N指向子查询,也就是explain结果中的下一列
    • 当有union result的时候,表名是union 1,2等的形式,1,2表示参与union的query id

       注意:MySQL对待这些表和普通表一样,但是这些“临时表”是没有任何索引的。

    type

      type显示的是各个表之间的关联类型,表示MySQL决定如何查找表中的记录。是最重要的一个指标,其性能从高到低依次是:

    system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

       一般来说,得保证查询至少达到range级别,最好能达到ref;否则,就可能会出现性能问题。

    类型 说明
    All 最坏的情况,全表扫描
    index 和全表扫描一样,只是扫描表的时候按照索引次序进行而不是行。主要优点就是避免了排序, 但是开销仍然非常大。如在Extra列看到Using index,说明正在使用覆盖索引,只扫描索引的数据,它比按索引次序全表扫描的开销要小很多
    range 根据索引检查给定范围的行。key 列显示使用了哪个索引,当使用=、 <>、>、>=、<、<=、IS NULL、<=>、BETWEEN 或者 IN 等操作符,用常量比较关键字列时,可以使用 range
    ref 非唯一性索引扫描,返回匹配某个值的所有行。这个类型跟eq_ref不同的是,它用在关联操作只使用了索引的最左前缀,或者索引不是UNIQUE和PRIMARY KEY。ref可以用于使用=或<=>操作符的带索引的列。
    eq_ref 主键或者唯一性索引扫描,最多只返回一条符合条件的记录(高效)。它是除了 const 类型外最好的连接类型
    const 当通过索引检索最多只会有一行匹配的时候,MySQL优化器会在查询前读取它而且只读取一次,因此非常快。当主键放入where子句时,mysql把这个查询转为一个常量(高效)
    system 这是const连接类型的一种特例,表中仅有一行数据,相当于系统表。
    Null 意味说mysql能在优化阶段分解查询语句,在执行阶段甚至用不到访问表或索引(高效)


      子查询通过id返回一条数据,故其type为const。而子查询结果集只有一条数据(rows=1),故主查询的type为system。

    possible_keys

      显示查询可以使用哪些索引,基于查询访问的列和使用的比较操作符来判断。表示他们可以进行高效地查找,但是他们对于后续优化过程可能是没有用的

    key 和 key_len

      key列显示MySQL实际决定使用的键(索引)。如果没有选择索引,键是NULL。要想强制MySQL使用或忽视possible_keys列中的索引,在查询中使用FORCE INDEX、USE INDEX或者IGNORE INDEX。

      key_len列显示MySQL在索引里使用的字节数。如果键是NULL,则长度为NULL。在语义清晰时,长度越短越好 。

    ref 和 rows

      ref列显示使用哪个列或常数从表中选择行。如下图所示,从 t2 读取数据时,要判断 t2.id = t1.id,所以 ref 就是 mysql.t1.id。

      rows列显示MySQL认为它执行查询时必须检查的行数。注意,这是一个预估值。

    Extra

      Extra是EXPLAIN输出中另外一个很重要的列,该列显示MySQL在查询过程中的一些详细信息,MySQL查询优化器执行查询的过程中对查询计划的重要补充信息。

    类型 说明
    Using filesort MySQL有两种排序算法——通过排序操作或者使用索引,当Extra中出现了Using filesort 说明MySQL使用了后者,但注意虽然叫filesort但并不是说明就是用了文件来进行排序,只要可能排序都是在内存里完成的。大部分情况下利用索引排序更快,所以一般这时也要考虑优化查询了。使用文件完成排序操作,这是可能是ordery by,group by语句的结果,这可能是一个CPU密集型的过程,可以通过选择合适的索引来改进性能,用索引来为查询结果排序。看到这个的时候,查询就需要优化了。
    Using temporary 用临时表保存中间结果,常用于GROUP BY 和 ORDER BY操作中。一般看到它说明查询需要优化了,就算避免不了临时表的使用也要尽量避免硬盘临时表的使用。
    Not exists MYSQL优化了LEFT JOIN,一旦它找到了匹配LEFT JOIN标准的行, 就不再搜索了。
    Using index 说明查询将使用覆盖索引,不需要读取数据文件,从索引树(索引文件)中即可获得信息。如果同时出现using where,表明索引被用来执行索引键值的查找;如果没有using where,表明索引用来读取数据而非执行查找动作。这是MySQL服务层完成的,但无需再回表查询记录。
    Using index condition 这是MySQL 5.6出来的新特性,叫做“索引条件推送”。简单说一点就是MySQL原来在索引上是不能执行如like这样的操作的,但是现在可以了,这样减少了不必要的IO操作,但是只能用在二级索引上。
    Using where 使用了WHERE从句来限制哪些行将与下一张表匹配或者是返回给用户。注意:Extra列出现Using where表示MySQL服务器将存储引擎返回服务层以后再应用WHERE条件过滤。
    Using join buffer 使用了连接缓存:Block Nested Loop,连接算法是块嵌套循环连接;Batched Key Access,连接算法是批量索引连接
    impossible where where子句的值总是false,不能用来获取任何元组
    select tables optimized away 在没有GROUP BY子句的情况下,基于索引优化MIN/MAX操作,或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。
    distinct 优化distinct操作,在找到第一匹配的元组后即停止搜索更多的行
    No tables used select 语句中使用from dual 或不含任何from子句


      如此图所示,展示了使用连接缓存和临时表时的Extra信息。


      No tables used 示例,执行 explain select now() 也会得到相同的结果。

    小结

    • EXPLAIN不会告诉你关于触发器、存储过程的信息或用户自定义函数对查询的影响情况
    • EXPLAIN不考虑各种Cache
    • EXPLAIN不能显示MySQL在执行查询时所作的优化工作
    • 部分统计信息是估算的,并非精确值
    • EXPALIN只能解释SELECT操作,其他操作要重写为SELECT后查看执行计划。

      以上就是这篇文章的全部内容了,希望本文对大家的学习或者工作具有一定的参考和学习价值;如果有疑问,大家可以在评论区留言交流,也希望大家多多点赞关注。谢谢大家对楼兰的胡杨的支持!

    Reference

    1. 高性能MySQL(第三版)
    2. https://dev.mysql.com/doc/refman/5.7/en/explain-output.html
    3. https://www.jianshu.com/p/ea3fc71fdc45
    4. https://developer.aliyun.com/article/765105
  • 相关阅读:
    有上下界的可行流
    NOIP模拟——change
    NOIP模拟 ———number(假的数位dp)
    18.8.18NOIP模拟。。。。Snow
    字符串算法(KMP,Trie树,AC自动机)
    BZOJ4293 Siano
    NOIP2017 DAY2 T1
    AtCoder Grand Contest 023 D GO Home
    浅谈SPFA(队列优化的Bellman-Ford算法)
    最短路最基本算法———Floyd算法
  • 原文地址:https://www.cnblogs.com/east7/p/13978784.html
Copyright © 2020-2023  润新知