分组
一个表中有很多供应商,每个供应商都有很多商品,假设要返回每个供应商提供的产品数目,这时候用前面提到的聚集函数无法完成,这是需要使用分组功能
SELECT vend_id , COUNT(*) AS num_prods
FROM products
GROUP BY vend_id;
vend_id | num_prods |
---|---|
1001 | 2 |
1002 | 4 |
1003 | 12 |
在具体使用GROUP BY子句前,需要知道一些重要的规定:
- GROUP BY子句可以包含任意数目的列。这使得能对分组进行嵌套,为数据分组提供更细致的控制。
- 如果在GROUP BY子句中嵌套了分组,数据将在最后规定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)。
- GROUP BY 子句中列出的每个列都必须是检索列或有效的表达式 (但不能是聚集函数)。如果在 SELECT 中使用表达式, 则必须在GROUP BY子句中指定相同的表达式。不能使用别名。
- 除聚集计算语句外,SELECT语句中的每个列都必须在GROUP BY子句中给出。
- 如果分组列中具有NULL值,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。
- GROUP BY子句必须出现在WHERE子句之后,ORDER BY子句之前
过滤分组
分组的过滤使用是HAVING子句。HAVING非常类似于WHERE,目前为止所学过的所有类型的 WHERE 子句都可以用 HAVING 来替代。 唯一的差别是 WHERE过滤行,而HAVING过滤分组
下面是一个复杂的查询,它返回具有两个以上订单并且订单价格不低于10元的顾客
SELECT vend_id, COUNT(*) AS num_prods
FROM products
WHERE prod_price >= 10
GROUP BY vend_id
HAVING COUNT(*) >= 2;
注意:一般在使用GROUP BY子句时,应该也给出ORDER BY子句,因为GROUP BY输出可能不是分组的顺序。所以为了保证数据正确的排序,提供ORDER BY是唯一的方法。千万不要仅依赖GROUP BY默认排序数据