1 引言
SQL操作往往是程序员必备的技能,对于算法工程师而言,熟练掌握SQL操作则更为重要。本文以《SQL语句执行顺序》作为学习资料,总结SQL的理论部分。
2 SQL查询语句的执行顺序
SQL语句与其他代码的处理顺序不同,在SQL中,第一个被处理的子句是FROM子句,尽管SELECT语句第一个出现,但是几乎总是最后被处理。
SQL语句的执行中,每个步骤都会产生一个虚拟表,虚拟表的作用是作为下一个步骤的输入。这些虚拟表对于调用者不可用,只是最后一步生成的表才会返回给调用者。
那么SQL语句的运行顺序到底是怎样的呢?
FROM:对FROM子句中的前两个表执行笛卡尔积,生成虚拟表VT1;
ON:对VT1应用ON筛选器,只有那些满足<join_condition>的行才被插入VT2;
OUTER(JOIN):如果指定OUTER JOIN(包括LEFT OUTER JOIN、RIGHT OUTER JOIN和FULL OUTER JOIN,经常省略OUTER)中未找到匹配的行将作为外部行添加到VT2,生成VT3。
WHERE:对VT3应用WHERE筛选器,只有满足<where_condition>的行才被插入VT4;
GROUP BY:按GROUP BY子句中的列队VT4进行行分组,生成VT5;
CUBE|ROLLUP:把超组插入VT5,生成VT6;
HAVING:对VT6应用HAVING筛选器。只有满足<having_condition>的行才被插入VT7;
SELECT:处理SELECT列表,产生VT8;
DISTINCT:将重复的行从VT8中移除,产生VT9;
ORDER BY:将VT9中的行按ORDER BY子句中的列排序,生成游标(VC10);
TOP:从VC10的开始处选择指定数量或比例的行,生成表VT11,并返回调用者;