一.where和on的区别
数据库在通过连接两张或多张表来返回记录时,都会生成一张中间的临时表,然后再将这张临时表返回给用户。
在使用
left
jion时,
on
和
where
条件的区别如下:
1、
on
条件是在生成临时表时使用的条件,它不管
on
中的条件是否为真,都会返回左边表中的记录。
2、
where
条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有
left
join
的含义(必须返回左边表的记录)了,条件不为真的就全部过滤掉。
假设有两张表:
表
1
:tab1
id size
1
10
2
20
3
30
表
2
:tab2
size name
10
AAA
20
BBB
20
CCC
两条SQL:
1
、select * from tab1 left join tab2 on tab1.size = tab2.size where tab2.name=
'AAA'
2
、select * from tab1 left join tab2 on tab1.size = tab2.size and tab2.name=
'AAA'
第一条SQL的过程:
1
、中间表
on条件:
tab1.size = tab2.size
tab1.id tab1.size tab2.size tab2.name
1
10
10
AAA
2
20
20
BBB
2
20
20
CCC
3
30
(
null
) (
null
)
2
、再对中间表过滤
where 条件:
tab2.name=
'AAA'
tab1.id tab1.size tab2.size tab2.name
1
10
10
AAA
第二条SQL的过程:
1
、中间表
on条件:
tab1.size = tab2.size and tab2.name=
'AAA'
(条件不为真也会返回左表中的记录) tab1.id tab1.size tab2.size tab2.name
1
10
10
AAA
2
20
(
null
) (
null
)
3
30
(
null
) (
null
)
其实以上结果的关键原因就是
left
join
,
right
join
,
full
join
的特殊性,
不管
on
上的条件是否为真都会返回
left
或
right
表中的记录,
full
则具有
left
和
right
的特性的并集。
而
inner
jion没这个特殊性,则条件放在
on
中和
where
中,返回的结果集是相同的。
在说区别之前,得先介绍GROUP BY这个子句,而在说GROUP子句前,又得先说说“聚合函数”——SQL语言中一种特殊的函数。例如SUM, COUNT, MAX, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。
如:
SELECT SUM(population) FROM vv_t_bbc ;
这里的SUM作用在所有返回记录的population字段上,结果就是该查询只返回一个结果,即所有国家的总人口数。
而通过使用GROUP BY 子句,可以让SUM 和 COUNT 这些函数对属于一组的数据起作用。当你指定 GROUP BY region 时,只有属于同一个region(地区)的一组数据才将返回一行值,也就是说,表中所有除region(地区)外的字段,只能通过 SUM, COUNT等聚合函数运算后返回一个值。
下面再说说“HAVING”和“WHERE”:
HAVING子句可以让我们筛选成组后的各组数据,WHERE子句在聚合前先筛选记录.也就是说作用在GROUP BY 子句和HAVING子句前;而 HAVING子句在聚合后对组记录进行筛选。
让我们还是通过具体的实例来理解GROUP BY 和 HAVING 子句:
SQL实例:
一、显示每个地区的总人口数和总面积:
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
先以region把返回记录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。
二、显示每个地区的总人口数和总面积.仅显示那些人口数量超过1000000的地区。
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(population)>1000000
[注] 在这里,我们不能用where来筛选超过1000000的地区,因为表中不存在这样一条记录。
相反,HAVING子句可以让我们筛选成组后的各组数据.
ps:如果想根据sum后的字段进行排序可以在后面加上:order by sum(population) desc/asc