学习目的:
了解什么是SQL的聚集函数,以及如何利用它们汇总表的数据。
聚集函数:
我们经常需要汇总数据而不用把它们实际检索出来,为此MySQL提供了专门的函数,以便分析和报表生成。其用途如下:
- 确定表中行数(或者满足某个条件或包含某个特定值的行数)
- 获得表中行组的和。
- 找出表列(或所有行或某些特定行)的最大值、最小值和平均值。
聚集函数(aggregate function)运行在行组上,计算和返回单个值的函数。
SQL聚集函数
函数
|
说明
|
AVG()
|
返回某列的平均值
|
COUNT()
|
返回某列的行数
|
MAX()
|
返回某列的最大值
|
MIN()
|
返回某列的最小值
|
SUM()
|
返回某列值之和
|
AVG()函数:
AVG()通过对表中行数计算特定列值之和,求得该列的平均值。AVG()可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。
Q:求products表中所有产品的平均价格。
SELECT AVG(prod_price) AS avg_price
FROM products;
只用于单个列。如果要获取多个列的平均值,要使用多个AVG()函数。
NULL值,AVG()函数忽略列值为NULL的行。
COUNT()函数:
COUNT()函数进行计数,可利用COUNT()确定表中行的数目或符合特定条件的行的数目。
COUNT()函数的两种使用方式:
(1)COUNT(*)对表中所有行的数目进行计数。不管表列中包含的是空值(NULL)还是非空值。
(2)COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。
Q:只对具有电子邮件地址的客户计数。
SELECT COUNT(cust_email) AS num_cust
FROM customers;
NULL值 如果指定列名,则指定列的值为空的行被COUNT() 函数忽略,但如果COUNT()函数中用的是星号(*),则不忽略。
MAX()函数:
MAX()返回指定列的最大值,MAX()要求指定列名。
Q:返回products 表中最贵的物品的价格。
SELECT MAX(prod_price) AS max_price
FROM products;
对非数值数据使用MAX()。MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()返回最后一行。
NULL值,MAX()函数忽略列值为NULL的行。
MIN()函数:
MAX()返回指定列的最小值,MIN()要求指定列名。
Q:返回products 表中最便宜的物品的价格。
SELECT MIN(prod_price) AS min_price
FROM products;
对非数值数据使用MAX()。MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()返回最前一行。
NULL值,MAX()函数忽略列值为NULL的行。
SUM()函数:
SUM()函数用来返回指定列值的和(总计)。
Q:检索所订购物品的总数(所有quantity 值之和)
SELECT SUM(quantity) AS items_ordered
FROM orderitems
WHERE order_num = 20005;
SUM也可用来合计每项物品的item_price*quantity,得出订单的总金额:
Q:用SUM()合计订单总金额
SELECT SUM(item_price*quantity) as total_price
FROM orderitems
WHERE order_num = 20005;
在多个列上进行计算。如本例所示,利用标准的算术操作符,所有的聚集函数都可以用来执行多个列上的计算。
NULL值 SUM()函数忽略列值为NULL的行。
聚集不同值:
在聚集函数中ALL或DISTINCT参数的使用:
(1)对所有的行执行计算,指定ALL参数或不给参数(因为ALL是默认行为)
(2)只包含不同的值,指定用DISTINCT参数。
例子:使用AVG()函数返回特定供应商提供的产品的平均价格。
SELECT AVG( DISTINCT `prod_price`) AS avg_price
FROM products
WHERE vend_id = 1003;
DISTINCT必须使用列名,不能用于计算或表达式。
DISTINCT从技术上可用于MIN()或MAX(),但这样做实际上没有价值。一个列中的最小值和最大值不管是否包含不同值都是相同的。
组合聚集函数:
SELECT语句可根据需要包含多个聚集函数
SELECT COUNT(*) AS num_items,
MIN(prod_price) AS price_min,
MAX(prod_price) AS price_max,
AVG(prod_price) AS price_avg
FROM products;
取别名:在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名。虽然这样做并非合法,但使用唯一的名字会使你的SQL更易于理解和使用(以及将来容易排除故障)。