• mysql数据库大表加索引


    最近大后台查看一些数据统计的时候,很慢,甚至会有超时情况,前端设置的超时时间是20秒。

    后来通过查看日志和慢查询,发现一条sql语句执行时间超过18秒,基本都19秒左右。

     select count(*) from tb_name where create_time > xxx;

    最终得知是因为这个表数据行数已经超过 一千万了,然后create_time字段又没有索引 。

    那解决办法肯定是加索引喽。

    但是这个表是一直在线上运行,很重要和业务部分。如果给千万级的大表在线加索引 ,肯定会卡死。

    然后就搜罗了一大筐解决方案,比如 在线无锁加索引使用 

    ALTER TABLE tbl_name ADD PRIMARY KEY (column), ALGORITHM=INPLACE, LOCK=NONE;

    后来才发现,这个特性是Mysql 5.6以后才支持,然而我们的mysql用的是5.5版本

    最后在 《高性能Mysql》一书中看到,可在通过 “影子拷贝”来解决,

    就是 先创建一张和源表无关的新表,然后通过重命名和删表操作交换两张表;

    #操作步骤:
    #1、创建一张和原表结构一样的空表,只是表名不一样
        create table tb_name_tmp like tb_name;
    
    #2、把新建的空表非主键索引都删掉,因为这样在往新表导数据的时候效率会很快(因为除了必要的主键以外,不用再去建立其它索引数据了)
        alter tb_name_tmp drop index index_name;
    
    #3、从旧表往主表里导数据,如果数据太大,建议分批导入,只需确保无重复数据就行,因为导入数据太大,会很占用资源(内存,磁盘io, cpu等),可能会影响旧表在线上的业务。我是每批次100万条数据导入,基本上每次都是在 20s左右
        insert into tb_name_tmp select * from tb_name where id between start_id and end_id;
    
    #4、数据导完后,再对新表进行添加索引
         create index index_name on tb_name_tmp(column_name);
    
    #5、当大部分数据导入后,索引也建立好了,但是旧表数据量还是会因业务的增长而增长,这时候为了确保新旧表的数据一至性和平滑切换,建议写一个脚本,判断当旧表的数据行数与新表一致时,就切换。我是以 max(id)来判断的。
        rename table tb_name to tb_name_tmp1;
        rename table tb_name_tmp to tb_name;

    当给新表加完索引后,最上面那条查询直接就是0.0002s

    Talk is cheap, show me the code.
  • 相关阅读:
    vue的环境的搭建
    rem
    web前端面试题总结
    vue遇到的一些问题
    栅格布局的理解
    利用node的http模块创建一个简单的http服务器
    node 常用的一些终端的命令的快捷键
    node 环境变量设置方法
    CentOS7.5搭建Hadoop2.7.6完全分布式集群
    UUID做主键,好还是不好?这是个问题
  • 原文地址:https://www.cnblogs.com/cidgur/p/13502798.html
Copyright © 2020-2023  润新知