mysql数据库索引系列专题

mysql数据库索引系列专题
1，现状

mysql数据库对我来说已经比较熟悉了，轻松建表查表配合各种花式查询，但是要说了解，那可能还差很远，基本功能会用，但是不精，高级功能知道，但是不知道原理，总而言之，这对我来说基本就是黑盒子，能用但是用不好，知道但是不了解。就拿索引来说，以前是各种索引建一堆，不管用上用不上。后来一看，果然，一个都没用上！今天就拿索引开刀吧.

2，先上调试神器explain

使用方法：
```
explain 你的查询语句

#比如explain select * from test;
```
你就能得到如下几个字段：
注意，explain不能做什么呢？

• EXPLAIN不会告诉你关于触发器、存储过程的信息或用户自定义函数对查询的影响情况
• EXPLAIN不考虑各种Cache
• EXPLAIN不能显示MySQL在执行查询时所作的优化工作
• 部分统计信息是估算的，并非精确值
• EXPALIN只能解释SELECT操作，其他操作要重写为SELECT后查看执行计划。

3，索引的类型

1）单列普通索引，非主键，非唯一列的索引，以表的单个列字段创建的索引。

2）联合普通索引（又叫组合索引），非主键，非唯一列的索引，以表的多个列字段组合创建的索引，在查询条件使用索引的从左字段顺序才会生效，遵循最左匹配原则。

所谓最左匹配原则就是这样的：

先创建一个test数据表：
```
create table test(
a int not null AUTO_INCREMENT ,
b int,
c int,
d int,
PRIMARY key (`a`),
key index_abc(b,c,d)
)engine=InnoDB default charset=utf8;
```
然后你会发现：
```
1）具体查询
EXPLAIN  select * from test where  b=1 and c=2 and d=3 ;
EXPLAIN  select * from test where  b=1 and  d=3 and c=2 ;
EXPLAIN  select * from test where d=3 and  c=2 and b=1;
##不管b，c，d顺序如何，以上三个查询都用到了联合普通索引，并且只通过索引，未通过数据表就可以拿到想要的数据
2）范围查询
EXPLAIN  select * from test where  b>1 and c>1 and d>1 ;
EXPLAIN  select * from test where d>1 and  c>1 and b>1;
#说好的最左呢？为什么两条语句的查询状况一样？别人查了一下资料发现：mysql查询优化器会判断纠正这条sql语句该以什么样的顺序执行效率最高，最后才生成真正的执行计划。
```
```
EXPLAIN  select * from test where  b>1 and d>1 ;
EXPLAIN  select * from test where  c>1 and d>1;
#这两个查询就不一样了，虽然都是使用了数据表和索引，但是效率有差别，第一个，type是range，key_len是5，rows是1，fitered是33.33（意思是如果读取了100条数据，有33条会被当成结果返回），而第二条查询，type是index，key_len是15，rows是6，fitered是16.67（读取100条数据，只有16条能被当成结果返回）
```
```
3）排序：
EXPLAIN  select * from test order by b ;
EXPLAIN  select * from test order by c ;
#这两个查询语句都用到了我们创建 bcd索引，但是两个语句执行还是有所不同，第二个的extra项目中除了有using index还多了一个Using filesort，Using filesort 是一种速度很慢的外部排序，说明一个问题，虽然第二个查询看起来用了索引，但是很明显不是我们想要的效果。
```
```
4）联合查询
```
explain select * from test where b>2 ;
explain select * from test where b=1 and c>2 and d=1 ;
explain select * from test where d =1;

#第一条，部分使用了abc索引，除此以外，extra中还用了Using where; Using index， key_len、rows和filtered分别是5，1，和100

#第二条，部分使用了abc索引，据说只有b和c用到了索引，d完全用不到索引，但我个人觉得c可能也只是用到了部分索引，所以key_len、rows和filtered分别是10，4，和16.67，当然extra和上一条一样

#第三条，虽然key中写明了inde_abc但是type是index,意思是扫描全部索引树，key_len、rows和filtered分别是15，6，和16.67

#所以，由此可以得出结论，通过最左匹配原则你可以定义一个联合索引，值得注意的是，当遇到范围查询(>、<、between、like)就会停止匹配。据说这是因为btree的原理决定的，可是我貌似并不知道btree的原理，哭，改天一定补上

#所以，如果有个表你需要这样查，SELECT * FROM DB.TB WHERE ID=2222 AND FID IN (9,8,3,13,38,40) ORDER BY INVERSE_DATE LIMIT 0, 5，那么你需要两个联合普通索引，IDX（ID,FID ,INVERSE_DATE）和IDX（ID,INVERSE_DATE）。详见这里
3）唯一索引，类似于主键，要求索引列的值必须唯一，但允许有空值。如果是组合索引，则列值的组合必须唯一。
```
#对于一个存储用户id，用户名，用户密码的表，可以在用户名上创建唯一索引，一方面是为了查询快，另一方面能防止用户名重复带来的一系列问题。

CREATE unique INDEX index_name ON t_user(user_name)；#创建独立索引
select * from t_user where user_name='admin' and user_state != 999；   #使用独立索引进行查询type为const，filtered是100
```
4）主键索引，是一种特殊的唯一索引，一个表必须有且只能有一个主键，不允许有空值，主键列的值必须唯一，一般是在建表的时候同时创建主键索引。

5）全文索引,主要用来查找文本中的关键字，而不是直接与索引中的值相比较。fulltext索引跟其它索引大不相同，它更像是一个搜索引擎，而不是简单的where语句的参数匹配。fulltext索引配合match against操作使用，而不是一般的where语句加like。它可以在create table，alter table ，create index使用，不过目前只有char、varchar，text 列上可以创建全文索引。值得一提的是，在数据量较大时候，现将数据放入一个没有全局索引的表中，然后再用CREATE index创建fulltext索引，要比先为一张表建立fulltext然后再将数据写入的速度快很多。

4，索引无法加速的情况

（1）insert操作

insert的过程是，先把数据插入到表中，然后再把数据插入到相关索引中，如果这个表有5个索引，那么就得维护这5个索引，不管这个插入的数据是否为NULL值。

所以，索引个数越多，对于insert操作来说，维护的成本就越大，插入一条数据的速度也就越慢。

如果发现插入速度很慢，可以检查一下是否这个表的索引太多了。

把数据插入索引的过程中，为了维护索引中字段的顺序，会先在索引中查找这个值，如果能找到，就把这个值查到后面空闲的地方，如果没有找到，就先把值加入到叶子节点，然后在分支节点中新增这个值和指向叶子节点的指针（就是一个地址）。

在这个过程中，如果某个页满了，还要新申请一个空的页，把满的页拆分开，把一半的索引数据放到空闲页中，而且为了保证数据的一致性（这个插入操作是并发的，可能有几十上百个线程同时进行），会给相关的索引页加上闩锁（一种更低级别的内存锁）。

如此看来，这个过程的开销是很大的。

（2）delete操作

delete操作刚好和isnert相反，当删除一条数据时，会把这条数据涉及到的多个索引中的数据删除。

比如：A表包含字段 ID，name，age，memo，biz_date，storeID，employeeID，update_date，等字段，在name、age、biz_date、storeID、employeeID字段上分别创建了索引，也就是总共有5个索引。

现在运行 delete from A where ID = 100

就得把ID=100的这条数据，在各个索引中删掉，但是开销要比insert小。

（3）update操作

这个操作不同于insert，delete，只有当update的这个字段，涉及到索引时，才需要维护索引，相对来说开销要小一些。

5,索引使用注意事项

使用索引时，有以下一些技巧和注意事项：
1.索引不会包含有null值的列
只要列中包含有null值都将不会被包含在索引中，复合索引中只要有一列含有null值，那么这一列对于此复合索引就是无效的。所以我们在数据库设计时不要让字段的默认值为null。
2.使用短索引
对串列进行索引，如果可能应该指定一个前缀长度。例如，如果有一个char(255)的列，如果在前10个或20个字符内，多数值是惟一的，那么就不要对整个列进行索引。短索引不仅可以提高查询速度而且可以节省磁盘空间和I/O操作。
3.索引列排序
查询只使用一个索引，因此如果where子句中已经使用了索引的话，那么order by中的列是不会使用索引的。因此数据库默认排序可以符合要求的情况下不要使用排序操作；尽量不要包含多个列的排序，如果需要最好给这些列创建复合索引。
4.like语句操作
一般情况下不推荐使用like操作，如果非使用不可，如何使用也是一个问题。like “%aaa%” 不会使用索引而like “aaa%”可以使用索引。
5.不要在列上进行运算
这将导致索引失效而进行全表扫描，
相关阅读:
mybatis模糊查询语句
 Java中解压文件名有中文的rar包出现乱码问题的解决
 tomcat服务器开启gzip功能的方法
 asp.net 操作word
asp.net webservice 返回json数据乱码解决方法
 阿里云服务器mysql修改编码问题
 阿里云服务器问题：访问
 EasyUI 在aspx页面显示高度不正常解决办法
 C# 或 JQuery导出Excel
如何分离数据库 (SQL Server Management Studio)
原文地址：https://www.cnblogs.com/0-lingdu/p/13969061.html

mysql数据库索引系列专题

1，现状

2，先上调试神器explain

3，索引的类型

4，索引无法加速的情况

5,索引使用注意事项