Oracle DB 对行进行分组-group by、having

Oracle DB 对行进行分组-group by、having
创建数据组
所有组函数都将表当作一个大型的信息组。但是，有时需要将此信息表分成几个较小的组。可以通过使用GROUP BY子句完成此任务。
创建数据组：GROUP BY子句的语法
可以通过使用GROUP BY子句将表中的行分成较小的组。

SELECT column, group_function(column)

FROM table

[WHERE condition]

[GROUP BY group_by_expression]

[ORDER BY column];
可以使用GROUP BY子句将表中的行分成组。然后，可以使用组函数返回每个组的汇总信息。

在该语法中：

group_by_expression 指定某些列，这些列的值确定对行进行分组的基准准则

• 除非在GROUP BY子句中指定了单个列，否则即使在SELECT子句中包括组函数，也不能选择单个结果。如果未在GROUP BY子句中包括列的列表，则会收到一条错误消息。

• 通过使用WHERE子句，可以在将行分成多个组之前先排除某些行。

• 必须将列包括在GROUP BY子句中。

• 不能在GROUP BY子句中使用列别名。
使用GROUP BY子句
SELECT列表中未出现在组函数中的所有列都必须包含在GROUP BY子句中。
hr@TEST0924> SELECT department_id, AVG(salary) FROM employees GROUP BY department_id ;

DEPARTMENT_ID AVG(SALARY)

------------- -----------

100 8601.33333

30 4150

7000

20 9500

70 10000

90 19333.3333

110 10154

50 3475.55556

40 6500

80 8955.88235

10 4400

60 5760

12 rows selected.

使用GROUP BY子句时，应确保将SELECT列表中未出现在组函数中的所有列都包含在GROUP BY子句中。示例显示每个部门的部门编号和平均薪金。下面介绍含有

GROUP BY子句的SELECT语句是如何进行求值的：

• SELECT：子句指定要检索的列，如下所示：

- EMPLOYEES：表中的部门编号列

- GROUP BY：子句指定的组中所有薪金的平均值

• FROM：子句指定数据库必须访问的表：EMPLOYEES表。

• WHERE：子句指定要检索的行。由于没有WHERE子句，默认情况下会检索所有行。

• GROUP BY：子句指定如何对行进行分组。由于是按部门编号对行进行分组，因此应用于薪金列的AVG函数会计算每个部门的平均薪金。

注：要按升序或降序对查询结果进行排序，请在查询中包含ORDER BY子句。
使用GROUP BY子句
GROUP BY列不一定要出现在SELECT列表中。

hr@TEST0924> SELECT AVG(salary) FROM employees GROUP BY department_id ;

AVG(SALARY)

-----------

8601.33333

4150

7000

9500

10000

19333.3333

10154

3475.55556

6500

8955.88235

4400

5760

12 rows selected.
GROUP BY列不一定要出现在SELECT子句中。例如，示例中的SELECT语句显示每个部门的平均薪金，但没有显示相应的部门编号。但是如果没有部门编号，结果看起来毫无意义。

也可以在ORDER BY子句中使用组函数：

hr@TEST0924> SELECT department_id, AVG(salary) FROM employees GROUP BY department_id ORDER BY AVG(salary);

DEPARTMENT_ID AVG(SALARY)

------------- -----------

50 3475.55556

30 4150

10 4400

60 5760

40 6500

7000

100 8601.33333

80 8955.88235

20 9500

70 10000

110 10154

90 19333.3333

12 rows selected.
按多个列进行分组
有时，需要查看组内的各个组的结果。

hr@TEST0924> SELECT department_id, job_id, sum(salary) FROM employees GROUP BY department_id, job_id ORDER BY job_id;

DEPARTMENT_ID JOB_ID SUM(SALARY)

------------- ---------- -----------

110 AC_ACCOUNT 8300

110 AC_MGR 12008

10 AD_ASST 4400

...

20 rows selected.

此示例显示一个报表，其中显示要付给各个部门中每种职务的薪金总和。

EMPLOYEES表首先按部门编号进行分组，然后在各个组中又按职务进行分组。例如，将部门50 中的四个仓储职员分成一个组，并为该组中的所有仓储职员生成一个结果（薪金总和）。
对多个列使用GROUP BY子句
hr@TEST0924> SELECT department_id, job_id, SUM(salary) FROM employees WHERE department_id > 40 GROUP BY department_id, job_id ORDER BY department_id;

DEPARTMENT_ID JOB_ID SUM(SALARY)

------------- ---------- -----------

50 SH_CLERK 64300

50 ST_CLERK 55700

50 ST_MAN 36400

60 IT_PROG 28800

70 PR_REP 10000

80 SA_MAN 61000

80 SA_REP 243500

90 AD_PRES 24000

90 AD_VP 34000

100 FI_ACCOUNT 39600

100 FI_MGR 12008

110 AC_ACCOUNT 8300

110 AC_MGR 12008

13 rows selected.
通过列出多个GROUP BY列，可以返回组和子组的汇总结果。GROUP BY子句对行进行分组，但不保证结果集的顺序。要对组进行排序，请使用ORDER BY子句。

在示例中，包含GROUP BY子句的SELECT语句按如下方式进行求值：

• SELECT子句指定要检索的列：

- EMPLOYEES表中的部门ID

- EMPLOYEES表中的职务ID

- GROUP BY子句指定的组中所有薪金的总和

• FROM子句指定数据库必须访问的表：EMPLOYEES表。

• WHERE子句将结果集限定为部门ID 大于40 的行。

• GROUP BY子句指定应如何对结果行进行分组：

- 首先，按部门ID 对行进行分组

- 其次，在部门ID 组中按职务ID 对行进行分组

• ORDER BY子句按部门ID 对结果进行排序。

注：SUM函数将应用于每个部门ID 组的结果集中所有职务ID 的薪金列。另外，请注意，不返回SA_REP 行。此行的部门ID 为NULL，因此不满足WHERE条件。
使用组函数的非法查询
SELECT列表中不在聚集函数中的任何列或表达式都必须出现在GROUP BY子句中：

hr@TEST0924> SELECT department_id, COUNT(last_name) FROM employees;

SELECT department_id, COUNT(last_name) FROM employees

*

ERROR at line 1:

ORA-00937: not a single-group group function

必须添加GROUP BY子句，才能对每个department_id对应的姓氏进行计数。

hr@TEST0924> SELECT department_id, job_id, COUNT(last_name) FROM employees GROUP BY department_id;

SELECT department_id, job_id, COUNT(last_name) FROM employees GROUP BY department_id

*

ERROR at line 1:

ORA-00979: not a GROUP BY expression

要么在GROUP BY中添加job_id，要么从SELECT列表中删除job_id列。
只要在同一个SELECT语句中混合使用单个项(DEPARTMENT_ID) 和组函数(COUNT)，就必须包括一个指定这些单个项（本例中为DEPARTMENT_ID）的GROUP BY子句。如果缺少GROUP BY子句，则会出现错误消息“not a single-group group function（不是一个组的组函数）”，而且显示一个指向错误列的星号(*)。可通过添加GROUP BY子句更正第一个示例中的错误：

hr@TEST0924> SELECT department_id, count(last_name) FROM employees GROUP BY department_id;

DEPARTMENT_ID COUNT(LAST_NAME)

------------- ----------------

100 6

30 6

1

20 2

70 1

90 3

110 2

50 45

40 1

80 34

10 1

60 5

12 rows selected.

SELECT列表中不在聚集函数中的任何列或表达式都必须出现在GROUP BY子句中。

在第二个示例中，job_id既不在GROUP BY子句中也不在组函数中，因此将出现“not a GROUP BYexpression（不是GROUP BY表达式）”错误。可通过

在GROUP BY子句中添加job_id更正第二个示例中的错误。

hr@TEST0924> SELECT department_id, job_id, COUNT(last_name) FROM employees GROUP BY department_id, job_id;

DEPARTMENT_ID JOB_ID COUNT(LAST_NAME)

------------- ---------- ----------------

110 AC_ACCOUNT 1

90 AD_VP 2

50 ST_CLERK 20

...

20 rows selected.
使用组函数的非法查询

• 不能使用WHERE子句限定组。

hr@TEST0924> SELECT department_id, AVG(salary) FROM employees WHERE AVG(salary) > 8000 GROUP BY department_id;

SELECT department_id, AVG(salary) FROM employees WHERE AVG(salary) > 8000 GROUP BY department_id

*

ERROR at line 1:

ORA-00934: group function is not allowed here

• 可以使用HAVING子句限定组。

• 不能在WHERE子句中使用组函数。
不能使用WHERE子句限定组。示例中的SELECT语句产生了一个错误，因为该语句使用WHERE子句限定显示平均薪金大于$8,000 的那些部门的平均薪金。

但是，通过使用HAVING子句限定组，可以更正该示例中的错误：

hr@TEST0924> SELECT department_id, AVG(salary) FROM employees GROUP BY department_id HAVING AVG(salary) > 8000;

DEPARTMENT_ID AVG(SALARY)

------------- -----------

100 8601.33333

20 9500

70 10000

90 19333.3333

110 10154

80 8955.88235

6 rows selected.
限定组结果

与使用WHERE子句限定所选行的方式相同，可以使用HAVING子句限定组。要在最高薪金大于$10,000 的每个部门中查找最高薪金，需要执行以下操作：

1.通过按部门编号进行分组，查找每个部门的最高薪金。

2.将组限定为最高薪金大于$10,000 的部门。
使用HAVING子句限定组结果

使用HAVING子句时，Oracle Server 将按以下方式对组进行限定：

1. 对行进行分组。

2. 应用组函数。

3. 显示符合HAVING子句的组。

SELECT column, group_function

FROM table

[WHERE condition]

[GROUP BY group_by_expression]

[HAVING group_condition]

[ORDER BY column];
可使用HAVING子句指定要显示的组，该子句基于汇总信息进一步限定组。

在上述语法中，group_condition用于限定满足指定条件的组的返回行组。

使用HAVING子句时，Oracle Server 会执行以下步骤：

1.对行进行分组。

2.对组应用组函数。

3.显示符合HAVING子句中的标准的组。

HAVING子句可放在GROUP BY子句之前，但建议将GROUP BY子句放在前面，因为这样更符合逻辑。应先形成组并计算组函数，然后再对SELECT列表中的组应用HAVING子句。

注：WHERE子句限定行，而HAVING子句限定组。
使用HAVING子句

hr@TEST0924> SELECT department_id, MAX(salary) FROM employees GROUP BY department_id HAVING MAX(salary)>10000 ;

DEPARTMENT_ID MAX(SALARY)

------------- -----------

100 12008

30 11000

20 13000

90 24000

110 12008

80 14000

6 rows selected.
示例显示最高薪金大于$10,000 的部门的部门编号和最高薪金。

可以在SELECT列表中使用GROUP BY子句，而不使用组函数。如果根据组函数的结果来限定行，则必须采用GROUP BY子句和HAVING子句。

下面的示例显示最高薪金大于$10,000 的部门的部门编号和平均薪金：

hr@TEST0924> SELECT department_id, AVG(salary) FROM employees GROUP BY department_id HAVING max(salary)>10000;

DEPARTMENT_ID AVG(SALARY)

------------- -----------

100 8601.33333

30 4150

20 9500

90 19333.3333

110 10154

80 8955.88235

6 rows selected.
使用HAVING子句

hr@TEST0924> SELECT job_id, SUM(salary) PAYROLL FROM employees WHERE job_id NOT LIKE '%REP%' GROUP BY job_id HAVING SUM(salary) > 13000 ORDER BY SUM(salary);

JOB_ID PAYROLL

---------- ----------

PU_CLERK 13900

AD_PRES 24000

IT_PROG 28800

AD_VP 34000

ST_MAN 36400

FI_ACCOUNT 39600

ST_CLERK 55700

SA_MAN 61000

SH_CLERK 64300

9 rows selected.
示例显示工资合计超过$13,000 的每个职务的职务ID 和月薪总额。该示例将销售代表排除在外，而且按月薪总额对列表进行排序。

嵌套组函数

下列语句显示最高平均薪金：

hr@TEST0924> SELECT MAX(AVG(salary)) FROM employees GROUP BY department_id;

MAX(AVG(SALARY))

----------------

19333.3333

组函数可以嵌套两层。示例计算每个department_id对应的平均薪金，然后显示最高平均薪金。

请注意，嵌套组函数时，必须使用GROUP BY子句。
相关阅读:
监督学习
 第一个应用：鸢尾花分类
 第一章计算机系统漫游
 前言
 python批量下载验证码，用来做验证码处理
 windows下安装tesserocr
python 爬虫之requests爬取页面图片的url，并将图片下载到本地
 electron实现透明点投的方法
 css之实现下拉框自上而下展开动画效果&&自下而上收起动画效果
 react项目中canvas之画形状（圆形，椭圆形，方形）
原文地址：https://www.cnblogs.com/hzcya1995/p/13316871.html