标准的SQL 的解析顺序为:
1、FROM 子句 组装来自不同数据源的数据
2、WHERE 子句 基于指定的条件对记录进行筛选
3、GROUP BY 子句 将数据划分为多个分组
4、使用聚合函数进行计算
5、.使用HAVING子句筛选分组
6、.计算所有的表达式
7、使用ORDER BY对结果集进行排序
执行顺序:
1、FROM:对FROM子句中前两个表执行笛卡尔积生成虚拟表vt1
2、ON:对vt1表应用ON筛选器只有满足< join_condition> 为真的行才被插入vt2
3、OUTER(join):如果指定了 OUTER JOIN保留表(preserved table)中未找到的行将行作为外部行添加到vt2 生成t3如果from包含两个以上表则对上一个联结生成的结果表和下一个表重复执行步骤和步骤直接结束
4、WHERE:对vt3应用 WHERE 筛选器只有使< where_condition> 为true的行才被插入vt4
5、GROUP BY:按GROUP BY子句中的列列表对vt4中的行分组生成vt5
6、CUBE|ROLLUP:把超组(supergroups)插入vt6 生成vt6
7、HAVING:对vt6应用HAVING筛选器只有使< having_condition> 为true的组才插入vt7
8、SELECT:处理select列表产生vt8
9、DISTINCT:将重复的行从vt8中去除产生vt9
10、ORDER BY:将vt9的行按order by子句中的列列表排序生成一个游标vc10
11、TOP:从vc10的开始处选择指定数量或比例的行生成vt11 并返回调用者
尽量少做重复的工作
1、控制同一语句的多次执行,特别是一些基础数据的多次执行是很多程序员很少注意的。
2、减少多次的数据转换,也许需要数据转换是设计的问题,但是减少次数是程序员可以做到的。
3、杜绝不必要的子查询和连接表,子查询在执行计划一般解释成外连接,多余的连接表带来额外的开销。
4、合并对同一表同一条件的多次UPDATE
注意临时表和表变量的用法
在复杂系统中,临时表和表变量很难避免,关于临时表和表变量的用法,需要注意:
1、如果语句很复杂,连接太多,可以考虑用临时表和表变量分步完成。
2、如果需要多次用到一个大表的同一部分数据,考虑用临时表和表变量暂存这部分数据。
3、如果需要综合多个表的数据,形成一个结果,可以考虑用临时表和表变量分步汇总这多个表的数据。
4、其他情况下,应该控制临时表和表变量的使用。
5、关于临时表和表变量的选择,很多说法是表变量在内存,速度快,应该首选表变量,但是在实际使用中发现,主要考虑需要放在临时表的数据量,在数据量较多的情况下,临时表的速度反而更快。执行时间段与预计执行时间(多长)。
6、关于临时表产生使用SELECT INTO和CREATE TABLE + INSERT INTO的选择,一般情况下,SELECT INTO会比CREATE TABLE + INSERT INTO的方法快很多,但是SELECT INTO会锁定TEMPDB的系统表SYSOBJECTS、SYSINDEXES、SYSCOLUMNS,在多用户并发环境下,容易阻塞其他进程,所以我的建议是,在并发系统中,尽量使用CREATE TABLE + INSERT INTO,而大数据量的单个语句使用中,使用SELECT INTO。