• Mysql流程解析


    Mysql流程解析

    流程图

    2018032413170578

    流程图解析

    客户端发送一条sql语句。

    1、此时,mysql会检查sql语句,查看是否命中缓存,如果命中缓存,直接返回结果,不继续执行。没有命中则进入解析器。

    2、解析器会检查sql语句的语法,并生成一个解析树。

    3、预处理器会检查解析树的表名,列名等是否正确,表是否有权限等。

    4、当解析树是一个合法的了,优化器将其转化成执行计划,一个解析树有多个执行计划,但是都返回同样的结果,唯一不同的是,每个执行计划的成本不一样,mysql会选择一个最低成本的执行计划来执行。

    5、查询执行引擎解析执行计划,通过调用相应的存储引擎的接口来完成,最终返回sql的结果,如果缓存开启,那么将结果也存储到查询缓存中。

    1、查询缓存

    ①解析器解析sql语句之前,会先查看这条sql语句是否命中缓存的数据,如果缓存中有数据,则会检查权限之后返回数据。

    ②mysql将缓存存在一个表中,通过一个哈希算法的索引来检查是否命中缓存。这个哈希算法包括查询的sql语句本身、要查询的数据库,客户端协议版本号等一系列可能影响查询结果的信息计算出来的,所以如果sql语句有一个字符不相同,都不会命中缓存

    ③如果查询中含有自定义函数,存储过程,变量,临时表等,不会进行缓存,因为这些属于变量,在上面提到,如果不相同不会命中缓存。比如now(),current_date()等函数。

    ④如果表的结构或数据发生变化,那么这张表的所有缓存都会失效。因为缓存的数据在表中会被修改,会导致缓存和表不一致。所以在进行写操作时,写入后,对应的表的缓存都会失效。

    ⑤如果缓存太大或者缓存碎片太多,会导致系统性能下降,并且参考第④点,所以mysql默认不开启缓存。

    mysql> show variables like "%query_cache%";
    +------------------------------+---------+
    | Variable_name                | Value   |
    +------------------------------+---------+
    | have_query_cache             | YES     |
    | query_cache_limit            | 1048576 |
    | query_cache_min_res_unit     | 4096    |
    | query_cache_size             | 0       |
    | query_cache_type             | OFF     |
    | query_cache_wlock_invalidate | OFF     |
    +------------------------------+---------+
    6 rows in set
    

    2、解析器

    解析器会将一条sql语句解析成一个解析树。

    比如

    select username from ADMIN;
    

    先通过词义解析,会将这条sql语句解析成

    关键字 非关键字 关键字 非关键字
    select username from ADMIN

    然后通过语义解析

    2019-12-01_143646

    3、预处理器

    通过预处理器,会判断解析树的表名,字段名或表的权限是否符合要求。

    4、查询优化器

    通过预处理器后,解析树便是合法的了。于是查询优化器将解析树转换成执行计划,一个解析树可以转换成多个执行计划,但是它们的最终结果都是一样的。mysql的查询优化器会计算每个执行计划的成本,最终选择最低成本的执行计划来执行。

    最低成本通常认为是时间最短,但是mysql不这么认为,它是选择成本小的,成本小≠时间短。

    mysql的一些优化策略

    ①重新定义表的关联顺序。

    ​ 进行多表关联操作时,mysql不一定按照sql语句中的表的顺序执行,它使用了一些技巧来关联。

    ②优化min()和max()函数。

    ​ 查找某列的最大或最小值时,如果该列有索引,只需要查找最左端或最右端。

    ③提前终止查询。

    ​ 使用limit时,如果查找到了满足数量的结果,就终止查询。

    ④优化排序。

    ​ 老版本中会进行两次传输排序(先读取行指针和排序字段在内存中进行排序,然后根据排序的结果去寻找数据),新版本中只需单次传输排序(先一次性把所有数据读取,再进行排序)。

    5、查询执行引擎

    查询执行引擎会解析执行计划,然后调用相应的存储引擎的接口来完成sql语句里的操作。

    6、返回结果

    将结果返回给客户端,即便里面没有行数据,也会返回一些信息,比如执行时间,影响行数。如果开启了缓存,同时也会将结果存入缓存中。

    返回客户端是一个增量并逐步返回的过程,有可能在mysql查询到了第一条结果时就开始返回。这样做的好处是能够让客户端第一时间接收到sql语句执行的结果,同时服务端不用存储太多结果而占用过大的内存空间。

  • 相关阅读:
    Cookie和Session的区别
    get和post的区别
    TCP和UDP的区别
    TCP三次握手过程
    docker 安装prometheus
    大数据集群环境搭建之一 hadoop-ha高可用安装
    大数据集群环境 zookeeper集群环境安装
    Centos 脚本中几个特殊符号的作用笔记
    VMware 设置虚拟机Centos 上网的两种方式
    大数据集群环境搭建之一 Centos基本环境准备
  • 原文地址:https://www.cnblogs.com/lxxxxxxy/p/11966207.html
Copyright © 2020-2023  润新知