转载自:http://www.open-open.com/lib/view/open1349965222556.html
做了很多年有关数据库的开发工作,现在把我对sql优化的一些经验分享下。(由于我主要使用mysql,对其它结构化数据库不太熟悉,所以可能具有片面性,欢迎拍砖)
sql优化的方面:
1、设计好的数据库结构
2、分表与分区
3、创建正确的索引
4、减少访问的次数
5、减少不必要的返回数据
6、书写高效的sql
1、设计好的数据库结构
好的数据库结构不同的业务有不同的看法,这里主要说一条,好的数据库设计应高保留重构的可能性。
2、分表与分区
(1)、分表
分表就是将一张大表分成多张小表。
分表的作用是提高数据库的读写性能。
(2)、分区
分区是将一张表分成多个区块。多个区块可以在不同磁盘上。
分区的作用是提高磁盘的读写性能。
3、创建正确的索引
要创建正确的索引,有几点是值得注意的:
(1)、根据业务中调用频繁的sql的where语句建立索引。
(2)、索引的列的大小会对影响性能
(3)、联合索引中索引列的顺序是很关键的
(4)、索引并不是越多越好
4、减少访问的次数
如果你需要对1000条数据进行处理,可能的情况下当然是一次取出来再处理,而不是取一条处理一条。减少了访问次数也就减少了磁盘I/O,在很多应用里面,磁盘I/O都是性能的瓶颈。
5、减少不必要的返回数据
减少不必要的返回数据既指返回数据的条数,也指返回的数据字段。减少不必要的返回数据也就减少了网络传输时间和磁盘I/O。
6、书写高效的sql
(1)、尽量不要使用IS NULL或者IS NOT NULL
因为索引是不索引空的,因此他们将不使用索引。
(2)、尽量不要使用NOT
NOT也是不能使用索引的。
(3)、用EXISTS替代IN、用NOT EXISTS替代NOT IN
IN 是把外表和内表作hash连接,而EXISTS是对外表作loop循环,每次loop循环再对内表进行查询。因此使用EXISTS的时候不要忘了在子查询中加上外表字段与子表字段的联合条件,否则效率同样会很低。IN与EXISTS同样与两张表的数据量有一定的关系。
NOT EXISTS使用全表扫描,效率很低。
(4)、LIKE操作符
尽量不要使用'%www'的这种通配符前置的查询,因为不会使用索引。
(5)、用UNION ALL 替代 UNION
UNION需要排序删除重复,UNION ALL仅仅合并。
(6)、尽量少用OR
(7)、WHERE后面条件的顺序
前面的条件尽量减少数据,还有顺序也与索引有关。虽然新的数据库引擎会做一些优化,但是同样可以减少引擎优化的时间。