MySql数据库优化-汇总

MySql数据库优化-汇总
各位，不喜勿喷，和气生财～

数据库优化，是一种综合性的技术，不是通过某一种方式让数据库效率提高很多，而是通过各个方面的优化，来是数据库效率明显的稳步的提高。

主要包括以下：

1、库表的设计优化（三种范式）

2、库表添加合适的索引(普通索引+主键索引+唯一索引+全文索引)

3、分表技术-水平分割与垂直分割

4、读写分离（add/delete/update与select分开）

5、多用存储过程和触发器（模块化编程）

6、优化MqSql配置（配置最大并发数，调整缓存大小，my.ini）

7、SQL优化与慢查询

8、定时清楚垃圾数据，定时进行碎片整理（MyISAM）

除此之外，还有 MqSql服务器硬件升级

以下进行详细描述

题外话：

存储引擎：

MyISAM：查询速度快，插入速度快，但不支持事务，碎片多；

InnoDB ：5.5版本后Mysql的默认数据库，支持事务，支持ACID事务，支持行级锁定；

Memory ：所有数据置于内存中，拥有极高的插入，适合频繁的数据更新，更新和查询效率。但是会占用和数据量成正比的内存空间。并且其内容会在Mysql重新启动时丢失，不需要保存滴；

数据库三种模式结构/三级模式

外模式（用户）：用户所能看到的数据视图，可通过数据库操纵语言对数据进行操作；

模式（概念）：用户视图的最小并集，所有数据的逻辑结构和概念的描述；

内模式（物理）：实际存储组合，内部视图，是实际物理存储的抽象；

一、库表设计

良好的数据库设计，能够节省数据库空间，保持数据完整性，方便应用程序的开发；（相反：数据冗余，空间浪费，插入更新繁杂或者异常）

设计数据库

1、充分了解需求：标识实体(具体存在的对象、东西，名词)，标识实体属性，标识实体关系

以BBS论坛为例

实体：

用户（属性：昵称，密码，邮箱，生日，性别，登记，备注，积分，注册时间）

主贴（属性：标题，正文，发帖时间，状态，发帖人，回复数量，点击数）

回帖（属性：帖子编号，回帖人，回帖标题，回帖正文，回帖时间，点击数）

板块（属性：板块名称，版主，板块格言，点击数，发帖数）

2、实体关系

一对一，两个表的主键是公共字段

一对多，主键与非主键之间的关系

多对一，非主键与主键之间的关系

多对多，非主键与非主键之间的关系

3、E-R图，实体-联系图(Entity Relationship Diagram)，提供了表示实体类型、属性和联系的方法，用来描述现实世界的概念模型；

*1、创建表时，将实体转化为表，将属性转化为列，唯一标识一行数据的列可为主键，无合适字段做主键就用自动增加列，将关系转化为主外键展示实体之间的关系；

*2、表结构规范化-三范式（

1、列的原子性。列不可分解，确保每列都不能再分解成更基本的数据单位；

2、记录的唯一标识。给记录增加一个主键，非主键字段依赖主键字段，即表的列中若有重复数据且与主键无关，则可拆分表；

3、字段不存在冗余。不存在传递依赖，即若表的除主键外各个列间有直接关联，即非主键字段一个字段可以推导出另一个字段，则可拆分表

）

范式举例：

山东理工，山东淄博；山大，山东济南；其中山东济南就可以拆分（第一范式）山东理工，山东，淄博；山大，山东，济南；

学号-主，姓名；ID，科目，成绩，学号，姓名；满足第二范式；但不满足第三范式；如果学号非主键，则满足第三范式；

*但注意，也有第五第六等范式，范式越高表越多，查询效率一般就会降低，一般第三范式效率最高列。。

反三范式：学号，语文，数学，英语，总成绩；总成绩字段就是违反第三范式，适当的数据冗余允许，不然就查询效率低了：select sum(yw+sx+yy) from t_score或单独建表学号，总成绩；

由此可见，数据库的性能效率比规范化更重要；

二、库表添加合适的索引

主键索引，唯一索引见上述链接；

1、主键索引，主键查询时默认使用；

2、组合索引，左边用，右边不用；

3、模糊查询，%或者_写在左边不会用索引，右边会用；

4、条件语句中如果有or，or的两侧均为索引才能使用，否则不会使用；

普通索引与组合索引区别：多个普通索引MySQL只用到认为似乎是最有效率的一个单列索引；组合索引为最左前缀，name-age-city建索引，相当于name，age，age-name，city-name；

主键索引与唯一索引区别：主键执行计划优于唯一，主键索引不能为空，仅一个主键索引列，主键索引更适合自生成不改变的列，主键可被其他列引为外键；

唯一索引，检索到一个直接返回；普通索引，检查是否是全部才返回；

创建索引语法：

create index 索引名称 on 表明（字段名）

创建全文索引语法：

CREATE fulltext INDEX 索引名称 ON 表明（字段名）

例子：
1. SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('database'); 两个字段的索引：FULLTEXT (title,body)
2. SELECT * FROM articles WHERE MATCH (tags) AGAINST ('旅游' IN BOOLEAN MODE);IN BOOLEAN MODE是只有含有关键字就行,不用在乎位置,是不是起启位置.
*仅存储引擎为MyISAM支持全文索引，InnoDB不支持不支持全文索引；

*mysql默认的阀值是50%，当某字段出现次数只有低于50%（停止词）的才会出现在结果集中；（意思是，全文索引用在海量数据中，不存在高于50%的情况）

*fulltext不支持中文，用Sphinx是一个基于SQL的全文检索引擎，结合MySQL，PostgreSQL做全文搜索，他可以提供比数据库本身更专业的搜索功能，使得应用程序更容易实现专业化的全文检索；

三、分表

水平分表：字段不多但是记录行数超级多，达到千万级别，经常检索速度会很慢；按照合理的逻辑去拆分成一个个较小的表，比如按照月份或者类型等待，利于程序简单实现，同时必须考虑到避免union，否则不如不拆分；

垂直分表：记录不多但是字段较多或者较长，占用的空间也比较大，检索需要大量IO，降低性能；拆分时可将较大字段拆分出来，组成一对一的对应关系表；

四、读写分离

数据库服务器压力大时，可以利用主从数据库，对仅仅需要查询，且不特别关注失效性的功能，使用从数据库进行数据的查询；

五、存储过程与触发器

存储过程：可编程的函数，由sql语句和控制结构组成；

sql：需要先编译后执行；存储过程：跨平台和应用使用；速度快，减少网络流量，组件式编程，统一接口参数安全，灵活性差；
```
#语法
CREATE PROCEDURE  过程名([[IN|OUT|INOUT] 参数名 数据类型[,[IN|OUT|INOUT] 参数名 数据类型…]]) [特性 ...] 过程体
```
```
#小示例
CREATE PROCEDURE proc3(IN parameter int)
  BEGIN
    DECLARE var int;
    SET var=parameter+1;
    IF var=0 THEN
      INSERT INTO t VALUES (17);
    END IF ;
    IF parameter=0 THEN
      UPDATE t SET s1=s1+1;
    ELSE
      UPDATE t SET s1=s1+2;
    END IF ;
  END ;
```
存储过程内的普通变量
```
#语法：DECLARE 变量名1[,变量名2...] 数据类型 [默认值];
DECLARE x1 VARCHAR(5) DEFAULT 'outer';　　
```
变量赋值
```
#语法：SET 变量名 = 变量值 [,变量名= 变量值 ...]
SET x1=x1+1; 
```
存储过程中的用户变量
```
#用户变量一般以@开头
SET @y='Goodbye Cruel World';
```
参与select/update/where语句
```
SELECT data1,data2 INTO x1,@y FROM test.table1 LIMIT 1;
update test.table1 set data1=@y;
insert into test.table1 (data1,data2)values(x1,@y);
```
判断语句
```
#IF分支：
IF 条件1 THEN 语句;
ELSEIF 条件2 THEN 语句;
......
ELSE 语句;
END IF;

#CASE分支:
CASE [条件]
WHEN 条件1 THEN 语句1
WHEN 条件2 THEN 语句2  
......
ELSE 语句n
END CASE
```
循环语句
```
LOOP循环：
LOOP
语句群
END LOOP

WHILE语句：
WHILE 条件 DO
语句群
END WHILE

REPEAT UNTIL语句：
REPEAT
语句群
UNTIL 条件
END REPEAT 
```
跳转或者终止符
```
ITERATE 语句:  ITERATE只可以出现在LOOP, REPEAT, 和WHILE语句内。ITERATE意思为：“再次循环”   会再次回到label开始位置；
BEGIN
    DECLARE v INT;
    SET v=0;
    LOOP_LABLE:LOOP
      IF v=3 THEN
        SET v=v+1;
        ITERATE LOOP_LABLE;
      END IF;
      INSERT INTO t VALUES(v);
      SET v=v+1;
      IF v>=5 THEN
        LEAVE LOOP_LABLE;
      END IF;
    END LOOP;
  END;

LEAVE语句：这个语句被用来退出任何被标注的流程控制构造。它和BEGIN ... END或循环一起被使用，像其他语言中的break。
```
开始结束符
```
[begin_label:] BEGIN
语句群
END [end_label]
```
七、SQL优化与慢查询

切入点：一个较大的项目，我们想了解当前mysql的运行状态、是否有耗时较长的sql执行等待

1、数据库的增删改查

一般情况下，增删改总计占数据库的10%，而90%是查询操作；

2、show status的相关常用命令
```
#查看数据库的一些状态
show status；
#显示执行了多少条/次的增删改查
show stauts like 'com_select';
show stauts like 'com_insert';
show stauts like 'com_delete';
show stauts like 'com_update';
#[session|global] 默认是session会话级-只取出当前窗口的执行;global-从mysql启动到现在 
show global stauts like 'com_select';

#查询当前MySQL本次启动后的运行统计时间(单位：秒)-另外，存储引擎为MyISAM,且运行时间过长，则注意碎片整理
show status like 'uptime';
#查看试图连接到MySQL(不管是否连接成功)的连接数
show status like 'connections';
#查看线程缓存内的线程的数量。
show status like 'threads_cached';

#慢查询
#查看查询时间超过long_query_time秒的查询的个数-即慢查询
show status like 'slow_queries';
#可以显示当前慢查询时间(单位：秒)（默认10秒）
show variables like 'long_query_time'; 
#可以修改慢查询时间(单位：秒)
set long_query_time=1;
```
　　

3、启动MqSql使用记录慢查询日志（2种）
```
#第一种：中括号[]内的部分是可选的，file_name表示日志文件路径
#在5.5及以上版本的MySQL中，使用如下命令启动：
mysqld --safe-mode --show-query-log[=1] [--show-query-log-file=file_name]
#在5.0、5.1等低版本的MySQL中，使用如下命令启动：
mysqld --log-slow-queries[=file_name]

#第二种：启动命令配置到my.ini中的[mysqld]节点
[mysqld]
#设置慢查询界定时间为1秒
long_query_time=1
#5.0、5.1等版本配置如下选项
log-slow-queries="mysql_slow_query.log"
#5.5及以上版本配置如下选项
slow-query-log=On
slow_query_log_file="mysql_slow_query.log"
```
　重启mysql

停止net stop mysql 启动 net start mysql
4、explain

explain命令，可以用显示mysql如何使用索引来处理select语句以及连接表；　

上述图片中的字段再次描述：

id：查询序号，即执行顺序号，不重要；

select_type：simple 它表示简单的select,没有union和子查询；primary 最外面的select,在有子查询的语句中，最外面的select查询就是primary；union union语句的第二个或者说是后面那一个；

table：显示这一行的数据是关于哪张表的;

possible_keys：可能会使用的索引；

key：实际使用的索引；优化where语句，选择合适的字段或者表字段；

key_len：索引长度，越短越好；

ref：使用某个库表字段去匹配表中数据

rows：查询的行数，越小越好；

extra：关于mysql如何解析查询的额外信息

　　关注当内容显示using temporary，即需要优化sql，因为用到了缓存；--尽力用小表驱动大表

　　举例：联表排序：驱动表字段排序直接是驱动表排序/非驱动表排序则先合并结果集后排序（指定联接条件时满足查询条件较少数据表为驱动表，不指定联接条件时表数据较少的为驱动表）

type：重要，连接类型:

　　const 表示：表中最多有一个匹配行，且用到了primary key 或者unique索引；

　　eq_ref 表示：和前边表查询匹配的值，后边表中最多仅有一个匹配行，且都用到了primary key 或者unique索引，且是最好的表之间的联接类型

　　ref 表示：和前边表匹配的值，后边表均会取出，且基于的关键字段是索引字段，但不是后边表的primary key 或者unique索引，则为ref，且是较好的表之间的联接类型

八、碎片整理

存储引擎为MyISAM

数据insert会使用其占用空间增加，但delete数据不会是其占用的空间减少，原因：删除数据时，mysql并不会回收被已删除数据的占据的存储空间以及索引位；而是等待新的数据来弥补这个空缺；

语法命令（定期optimize）：
```
#删除数据后的优化 - 碎片整理
optimize table 表名
```
　　
相关阅读:
随机图片
 单页网站
 最安全的聊天工具——Cryptocat
一个游戏——小黑屋
 SAO Utils – SAO风格启动菜单
 对话框实现
 抖动文字
 Leetcode: 22. Generate Parentheses
Leetcode: 21. Merge Two Sorted Lists
Leetcode: 20. Valid Parentheses
原文地址：https://www.cnblogs.com/huasky/p/10500126.html