SQL系列（八）—— 分组（group by）

在很多场景时，需要对数据按照某条件进行分组统计其数量、平均值等等。有这种需求，SQL自然也有解决方式。

在SQL中通过group by子句对结果按某条件进行分组。语法：

select count(column1), columnJ from table_name group by columnJ;

group by是后接检索的列或者表达式。表示对该列或者表达式的数据进行分组，该列上或者表达式相同的数据放在同一组。

group by使用的注意点:

注：大多数情况的场景都是使用group by进行分组，然后对分组的数据进行聚合统计。很少是分组后取某组中的个别列的数据。如：

select name, age from teacher group by age;

select子句中包含了非聚合的列name（这属于取分组结果中个别列的数据情况）。
在Mysql中默认模式：ONLY_FULL_GROUP_BY下，如果执行以上SQL会报错；可以将其关闭，如果再执行以上SQL，mysql将会取分组中的每组的第一行数据作为结果集。

通过看下面的示例，来熟悉下group by：

select age, count(name) as group_count from teacher group by age;

以上的SQL表示的含义：按年龄分组统计每个年龄的老师数量，执行结果：

再来看一个例子：

select name, max(age), min(age) from person group by name;

以上SQL表示，按照姓名分组统计，找出每组中最大年龄，最小年龄的人，执行结果如下

以上的例子足以理解group by。group by即对结果集进行按条件进行分组，然后常进行聚合处理。
但是往往仍需要对分组后的结果进行过滤处理，SQL中使用另外一个子句HAVING对group by的分组结果进行过滤处理，如下：

select age, count(name) as group_count from teacher group by age having age < 27;

执行结果

age	count
25	2
26	2

对分组结果进行过滤，只检索出分组中年龄小于27的组。

在看到having时，不免联系到where子句，下面总结下他们的异同点：

相同点	1.having和where都是对结果按照条件过滤； 2.在使用where的地方都可以使用having（不常用）；
不同点	1.针对的过滤数据不一样，having主要是用来过滤分组，where主要是过滤表中数据行； 2.having和where子句的位置不一样，having在group by后，where在from子句后； 3.having通常配合group by使用；

那么在有having过滤情况下是否还能使用where呢？
根据上表中不同点1可以看出，是可以的。where是对数据行过滤，然后再对过滤后的行进行分组，再对分组进行having过滤。

下表列出了SQL的执行顺序：

《SQL必知必会》