• 高性能Mysql笔记 — 优化


    性能优化

    了解查询的整个生命周期,清楚每个阶段的时间消耗情况

    性能分析

    慢查询日志——服务器性能分析

    参考
    慢查询日志是优化很重要的手段,但是开启慢查询日志对性能的影响并不大,所以可以考虑在线上打开慢查询日志

    • 查看慢查询是否打开、以及日志存储位置:show variables like '%slow%'
      统计当前数据库连接状态
      mysql -e 'show processlist G' -uroot -proot | grep State | sort | uniq -c | sort -rn

    剖析单条查询

    select @@profiling:查看profiling是否打开
    set profiling=1:打开profiling
    show profiles:查看每条查询的性能
    show profile for query id:查看query id的详细时间花费
    information_schema.profiling:该表存储了每个query的详细时间花费
    show status:查看会话级别的计数器
    show global status:查看全局的计数器
    show status where variable_name like '%handler%':查看某些变量的计数

    查询性能优化

    查询由多个子任务组成,优化查询也就是优化子任务

    1. 消除一些子任务
    2. 减少子任务执行次数
    3. 让子任务执行更快

    优化数据访问

    不要请求不需要的数据

    1. 只返回必要的行(limit)、列(尽量不要使用星号返回所有列)
    2. 尽量不要查询重复的数据,使用缓存

    是否在扫描额外的记录

    mysql衡量查询开销的指标:

    1. 响应时间
    2. 扫描行数
    3. 返回的行数

    访问类型
    explain语句中的type指明了访问类型,包括:全表扫描,索引扫描,范围扫描,唯一索引查询,常数引用,从左到右扫描的行数从多到少,速度从慢到快
    查询语句中where条件的使用,性能从好到坏是:

    1. 在索引中使用where条件过滤不匹配的记录,这是在存储引擎层完成的
    2. 使用覆盖引擎(extra中出现using index)来返回记录,直接从索引过滤不需要的记录并返回结果,在在服务器层完成,不需要回表
    3. 在表中返回数据,使用where过滤不匹配的记录(extra中出现using where),在服务层完成。mysql需要先读数据然后过滤

    分解复杂查询

    1. 切分查询:将数据量大的查询切分为几次(有些情况分析查询的性能更好,比如删除数据,每次删除10条比一次删除100条来得好,当在数据库业务繁忙的时候)
    2. 分解关联查询:
      • 缓存效率高:mysql中如果关联表发生了变化,缓存就失效了;而且应用程序可以缓存切分查询之后的结果
      • 执行单个查询减少锁竞争
      • 数据库表不做强关联,在应用层做,扩展性更好

    mysql执行、优化查询的方式

    mysql查询优化器的局限性

    优化器只关心随机页面的读取

    1. 关联子查询:有时候可以使用join的方式重写关联子查询,效率更好
    2. union的限制:mysql不能将条件放入union各个查询中,重写的时候可以把共同的条件写入各个查询中
    3. 索引合并优化:mysql可以利用同一张表上的多个索引,explain的时候type为index_merge,key为使用到的索引。如果存在合并(and的情况)那么可以考虑将多个单列索引合为一个多列索引
    4. 等值传递
    5. 并行执行:
    6. 松散索引
    7. 哈希关联
    8. 最大值和最小值:mysql的min和max函数
    9. 在同一个表上查询和更新:mysql不允许同时对一张表查询和更新,可以使用join的方式来select需要在该表上查询的字段

    干涉查询优化器

    mysql提供了一些选项来干涉优化器的行为,但是建议一般情况下不要使用,因为一般干涉优化器带来的收效较小,反而给版本升级的时候带来一些问题

    优化特定类型的查询

    count

    count(col):查询该列值得个数(不包含null)
    count(星号):查询行数

    1. myisam全表count(星号)很快
    2. 对于不精确的统计使用缓存

    优化关联查询

    1. 确保on和using列上有索引,A join B on col,那么一般只需要在B的col创建索引就够了
    2. 确保group by 和order by的表达式只涉及一个表中的列,mysql才可以使用索引来优化

    优化子查询

    使用关联查询代替子查询,在mysql5.6和mariadb不需要考虑

    优化group by和order by

    group by的结果默认会按照分组字段进行排序,如果不需要排序可以去掉排序,指定order by NULL

    优化分页查询

    当页码比较多的时候需要扫描的数据较大,这个时候可以使用覆盖索引进行优化,先使用索引覆盖查询出limit的分页数据,然后join该表,查询其他字段,这样就减少了扫描的行数

    select * from user_order inner join (select order_id from user_order order by buy_date limit 50, 5) as lim on lim.order_id=user_order.order_id;
    

    或者可以记下该分界行的标识列(该列最好有索引),比如主键id,然后查询基于该分界的记录

    select * from user_order where order_id > 500 order by order_id limit 5;
    

    对于总记录数,如果不那么精确的话可以使用explain的rows

    优化union查询

    除非有消除重复行的必要,否则使用union all,因为使用union会在临时表上加distinct,导致对整个临时表做唯一性校验

    使用自定义变量

  • 相关阅读:
    倒序数组的算法
    SQL 日期操作函数
    sp_executesql 练习
    c#编译器对byte类型的一些规则
    角度在excel中如何输入并使其能计算
    5天学会fx5800计算器测量编程(二) fx5800函数学习
    5天学会fx5800计算器测量编程(二) fx5800语法学习
    如何快速的将大地坐标系导入进施工结构的cad平面图纸中
    CAD中批量导入坐标和点号的方法命令
    5天学会fx5800计算器测量编程(一)
  • 原文地址:https://www.cnblogs.com/sunshine-2015/p/6765170.html
Copyright © 2020-2023  润新知