SQL 语句的执行效率

SQL 语句的执行效率

1、操作符号： NOT IN操作符此操作是强列推荐不使用的，因为它不能应用表的索引。推荐方案：用NOT EXISTS 或（外连接+判断为空）方案代替 "IS NULL", "<>", "!=", "!>", "!<", "NOT", "NOT EXISTS", "NOT IN", "NOT LIKE", "LIKE '%500'"，因为他们不走索引全是表扫描。NOT IN会多次扫描表，使用EXISTS、NOT EXISTS、IN、LEFT OUTER JOIN来替代，特别是左连接，而Exists比IN更快，最慢的是NOT操作。如果列的值含有空，以前它的索引不起作用，现在2000的优化器能够处理了。相同的是IS NULL，"NOT", "NOT EXISTS", "NOT IN"能优化她，而"<>"等还是不能优化，用不到索引。
   2、注意union和union all的区别。union比union all多做了一步distinct操作。能用union all的情况下尽量不用union。

   3、查询时尽量不要返回不需要的行、列。另外在多表连接查询时，尽量改成连接查询，少用子查询……、尽量少用视图，它的效率低。对视图操作比直接对表操作慢，可以用存储过程来代替它。特别的是不要用视图嵌套，嵌套视图增加了寻找原始资料的难度。

   我们看视图的本质：它是存放在服务器上的被优化好了的已经产生了查询规划的SQL。对单个表检索数据时，不要使用指向多个表的视图，直接从表检索或者仅仅包含这个表的视图上读，否则增加了不必要的开销，查询受到干扰。为了加快视图的查询，MsSQL增加了视图索引的功能。

   4、创建合理的索引，对于插入或者修改比较频繁的表，尽量慎用索引。因为如果表中存在索引，插入和修改时也会引起全表扫描。

   索引一般使用于where后经常用作条件的字段上。

   5、在表中定义字段或者存储过程、函数中定义参数时，将参数的大小设置为合适即可，勿设置太大。这样开销很大。

   6、Between在某些时候比IN速度更快，Between能够更快地根据索引找到范围。用查询优化器可见到差别。

   男','女男' and '女'是一样的。由于in会在比较多次，所以有时会慢些。

   7、在必要是对全局或者局部临时表创建索引，有时能够提高速度，但不是一定会这样，因为索引也耗费大量的资源。他的创建同是实际表一样。

   8、WHERE后面的条件顺序影响子句后面的条件顺序对大数据量表的查询会产生直接的影响，如以下以下以上两个SQL中dy_dj（电压等级）及xh_bz（销户标志）两个字段都没进行索引，所以执行的时候都是全表扫描，如果dy_dj = '1KV以下'条件在记录集内比率为99%，而xh_bz=1的比率只为0.5%，在进行第一条SQL的时候99%条记录都进行dy_dj及xh_bz的比较，而在进行第二条SQL的时候0.5%条记录都进行dy_dj及xh_bz的比较，以此可以得出第二条SQL的CPU占用率明显比第一条低。所以尽量将范围小的条件放在前面……、用OR的字句可以分解成多个查询，并且通过UNION 连接多个查询。他们的速度只同是否使用索引有关，如果查询需要用到联合索引，用 UNION all执行的效率更高。多个OR的字句没有用到索引，改写成UNION的形式再试图与索引匹配。一个关键的问题是否用到索引。

   9、没有必要时不要用DISTINCT和ORDER BY，这些动作可以改在客户端执行。它们增加了额外的开销。这同UNION和UNION ALL一样的道理。

   10、使用in时，在IN后面值的列表中，将出现最频繁的值放在最前面，出现得最少的放在最后面，这样可以减少判断的次数、当用SELECT INTO时，它会锁住系统表（sysobjects，sysindexes等等），阻塞其他的连接的存取。创建临时表时用显示声明语句，在另一个连接中SELECT * from sysobjects可以看到 SELECT INTO 会锁住系统表， Create table 也会锁系统表（不管是临时表还是系统表）。所以千万不要在事物内使用它！！！这样的话如果是经常要用的临时表请使用实表，或者临时表变量。

   11、一般在GROUP BY和HAVING字句之前就能剔除多余的行，所以尽量不要用它们来做剔除行的工作。他们的执行顺序应该如下最优：select 的Where字句选择所有合适的行，Group By用来分组个统计行，Having字句用来剔除多余的分组。这样Group By和Having的开销小，查询快。对于大的数据行进行分组和Having十分消耗资源。如果Group BY的目的不包括计算，只是分组，那么用Distinct更快、一次更新多条记录比分多次更新每次一条快，就是说批处理好、慎用临时表，临时表存储于tempdb库中，操作临时表时，会引起跨库操作。尽量用结果集和表变量来代替它。

   12、尽量将数据的处理工作放在服务器上，减少网络的开销，如使用存储过程。存储过程是编译好、优化过，并且被组织到一个执行规划里、且存储在数据库中的 SQL语句，是控制流语言的集合，速度当然快。

   13、不要在一段SQL或者存储过程中多次使用相同的函数或相同的查询语句，这样比较浪费资源，建议将结果放在变量里再调用。这样更快。

   14、按照一定的次序来访问你的表。如果你先锁住表A，再锁住表B，那么在所有的存储过程中都要按照这个顺序来锁定它们。如果你（不经意的）某个存储过程中先锁定表B，再锁定表A，这可能就会导致一个死锁。如果锁定顺序没有被预先详细的设计好，死锁很难被发现

个人觉得，在写SQL语句时，能使用运算符比表达式效率高。经自己测试在查询某段时间内4万条数据时，使用运算符">="、"<="要比使用BETWEEN　AND 效率高16%左右。
相关阅读:
菜鸟系列k8s——快速部署k8s集群(3)
菜鸟系列docker——docker容器(7)
菜鸟系列Fabric源码学习 — 区块同步
 菜鸟系列Fabric源码学习 — peer节点启动
 菜鸟系列Fabric源码学习 — orderer服务启动
 递归科赫雪花
 汉诺塔递归函数hanoi
字符串格式化与.format()
turtle风轮绘制
 接口签名2
原文地址：https://www.cnblogs.com/glj1203/p/1978152.html