Mysql引擎及优化

Mysql引擎及优化
一. MyISAM与Innodb区别

1. MyISAM:

不提供事务的支持；

不支持行级锁和外键；

数据和索引分别存储；

索引实现方式：B+树索引，MyISAM是堆表。

2. Innodb：

提供了对数据库ACID事务的支持；

提供行级锁（锁定粒度小并发能力高）和外键的约束；

数据和索引是集中存储；

索引实现方式：B+树索引，Innodb是索引组织表；

InnoDB写的处理效率差一些，并且会占用更多的磁盘空间以保留数据和索引。

二. 策略优化

对于经常变更的数据来说，CHAR比VARCHAR更好，因为CHAR不容易产生碎片。

对于非常短的列，CHAR比VARCHAR在存储空间上更有效率。

使用时要注意只分配需要的空间，更长的列排序时会消耗更多内存。

尽量避免使用TEXT/BLOB类型，查询时会使用临时表，导致严重的性能开销。

日期和时间类型，尽量使用timestamp，空间效率高于datetime，用整数保存时间戳通常不方便处理。如果需要存储微妙，可以使用bigint存储。

三. 索引优化
1. 索引的原理(就是把无序的数据变成有序的查询)

1）把创建了索引的列的内容进行排序

2）对排序结果生成倒排表

3）在倒排表内容上拼上数据地址链

4）在查询的时候，先拿到倒排表内容，再取出数据地址链，从而拿到具体数据

2. 构建索引优劣势

优势：

类似于书籍的目录索引，提高数据检索的效率，降低数据库的IO成本；

通过索引列对数据进行排序，降低数据排序的成本，降低CPU的消耗。

劣势：

实际上索引也是一张表，该表中保存了主键与索引字段，并指向实体类的记录，所以索引列也是要占用空间；

虽然索引大大提高了查询效率，同时却也降低更新表的速度，如对表进行INSERT、UPDATE、DELETE。

3. 索引设计原则

1）对查询频次较高，且数据量比较大的表建立索引；

2）索引字段的选择，最佳候选列应当从where子句的条件中提取，如果where子句中的组合比较多，那么应当挑选最常用、过滤效果最好的列的组合；

3）索引可以有效的提升查询数据的效率，但对于插入、更新、删除等DML操作比较频繁的表来说，索引过多，会引入相当高的维护代价，降低DML操作的效率；

4）索引名尽量短些，索引创建之后也是使用硬盘来存储的，因此提升索引访问的I/O效率，也可以提升总体的访问效率。

5）尽量的扩展索引，不要新建索引。比如表中已经有a的索引，现在要加(a,b)的索引，那么只需要修改原来的索引即可

6）定义有外键的数据列一定要建立索引

7）对于那些查询中很少涉及的列，重复值比较多的列不要建立索引（索引时间=去索引中取+取相应的数据条件，而重复值太多效率反而更慢）

8）对于定义为text、image和bit的数据类型的列不要建立索引

9）利用最左前缀，N个列组合而成的组合索引，那么相当于是创建了N个索引，如果查询时where子句中使用了组成该索引的前几个字段，那么这条查询SQL可以利用组合索引来提升查询效率。

创建复合索引:

CREATE INDEX idx_name_email_status ON tb_seller(NAME,email,STATUS);

就相当于对name 创建索引 ;对name , email 创建了索引 ;对name , email, status 创建了索引

4. sql语句索引优化

1）order by

当我们使用order by将查询结果按照某个字段排序时，如果该字段没有建立索引，那么执行计划会将查询出的所有数据使用外部排序，即将数据从硬盘分批读取到内存使用内部排序，最后合并排序结果，影响性能。

优化：我们对该字段建立索引alter table 表名 add index(字段名)，那么由于索引本身是有序的，因此直接按照索引的顺序和映射关系逐条取出数据即可。

2）join

对join语句匹配关系（on）涉及的字段建立索引能够提高效率

3）优化关联查询

确定ON是否有索引，确保GROUP BY和ORDER BY只有一个表中的列，这样MySQL才有可能使用索引

4）应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描

（select id from t where num is null，可以在num上设置默认值0，确保表中num列没有null值）

5）应尽量避免在 where 子句中使用!=或<>操作符，否则引擎将放弃使用索引而进行全表扫描（但mysql5.7版本已经支持）

6）in 和 not in 也要慎用，否则会导致全表扫描

7）应尽量避免在where子句中对字段进行函数操作，这将导致引擎放弃使用索引而进行全表扫描

（select id from t where substring(name,1,3)=’abc’

-- name以abc开头的id应改为:

select id from t where name like ‘abc%’）

8） like 以%开头，索引无效；当like前缀没有%，后缀有%时，索引有效。

解决方案：通过覆盖索引来解决

9）字符串不加单引号，造成索引失效。

10）不要在索引列上进行运算操作，索引将失效。

11）尽量使用覆盖索引，避免select *；尽量使用覆盖索引（只访问索引的查询（索引列完全包含查询列）），减少select * 。

如果查询列，超出索引列，也会降低性能。
相关阅读:
Flink--Window apply
Flink--time-window 的高级用法
 Flink的Windows
Flink的流处理--KeyBy
Flink的分布式缓存
 Flink的广播变量
 Flink--本地执行和集群执行
 Flink-- 数据输出Data Sinks
存储管理-页式管理
 存储管理-覆盖技术和交换技术
原文地址：https://www.cnblogs.com/654wangzai321/p/14445789.html