• 10 汇总数据


    10.1 聚集函数

    • 我们经常需要汇总数据而不用把它们实际检索出来,为此MySQL提供了专门的函数。使用这些函数,MySQL查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有以下几种。
      • 确定表中行数(或者满足某个条件或包含某个特定值得行数)。
      • 获得表中行组的和。
      • 找出表列(或所有行或某些特定的行)的最大值、最小值和平均值。
    • 上述例子都需要对表中数据汇总。因此,返回实际表数据是对时间和处理资源的一种浪费。重复一遍,实际想要的是汇总信息。
    • 聚集函数 运行在行组上,计算和返回单个值得函数。
    • SQL聚集函数:
    函数 说明
    AVG() 返回某列的平均值
    COUNT() 返回某列的行数
    MAX() 返回某列的最大值
    MIN() 返回某列的最小值
    SUM() 返回某列值之和

    10.1.1 AVG()函数

    • AVG()通过对表中行数计数并计算特定列值之和,求得该列的平均值。AVG()可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。
    • 下面的例子使用AVG()返回products表中所有产品的平均价格:
    select AVG(prod_price) as avg_price
    from products;
    
    +-----------+
    | avg_price |
    +-----------+
    | 16.133571 |
    +-----------+
    
    • AVG()也可以用来确定特定列或行的平均值。下面的例子返回特定供应商所提供产品的平均价格:
    select AVG(prod_price) as avg_price
    from products
    where vend_id = 1003;
    
    +-----------+
    | avg_price |
    +-----------+
    | 13.212857 |
    +-----------+
    
    • 只用于单个列 AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()函数。
    • NULL值 AVG()函数忽略列值为NULL的行。

    10.1.2 COUNT()函数

    • COUNT()函数进行计数。可利用COUNT()确定表中行的数目或符合特定条件的行的数目。
    • COUNT()函数有两种使用方式:
      • 使用COUNT(*)对表中行的数目进行计数,不管表列中包含是空值还是非空值。
      • 使用COUNT(column)对特定列中具有值得行进行计数,忽略NULL值。
    • 下面的例子返回customers表中客户的总数:
    select COUNT(*) as num_cust
    from customers;
    
    +----------+
    | num_cust |
    +----------+
    |        5 |
    +----------+
    
    • 下面的例子只对具有电子邮件地址的客户计数:
    select count(cust_email) as num_cust
    from customers;
    
    +----------+
    | num_cust |
    +----------+
    |        3 |
    +----------+
    
    • NULL值 如果指定列名,则指定列的值为空的行数被COUNT()函数忽略,但如果COUNT()函数中用的是星号(*),则不忽略。

    10.1.3 MAX()函数

    • MAX()返回指定列中的最大值。MAX()要求指定列名,如下所示:
    select MAX(prod_price) as max_price
    from products;
    
    +-----------+
    | max_price |
    +-----------+
    | 55        |
    +-----------+
    
    • 对非数值数据使用MAX() 虽然MAX()一般用来找出最大的数值或日期,但MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()返回最后一行。
    • NULL值 MAX()函数忽略列值为NULL的行。

    10.1.4 MIN()函数

    • MIN()的功能正好与MAX()功能相反,它返回指定列的最小值。与MAX()一样,MIN()要求指定列名,如下所示:
    select MIN(prod_price) as min_price
    from products;
    
    +-----------+
    | min_price |
    +-----------+
    | 2.5       |
    +-----------+
    
    • 对非数值数据使用MIN() MIN()函数与MAX()函数类似,MySQL允许将它用来返回任意列中的最小值,包括返回文本列中的最小值。在用于文本数据时,如果数据按相应的列排序,则MIN()返回最前面的行。
    • NULL值 MIN()函数忽略列值为NULL的行。

    10.1.5 SUM()函数

    • SUM()用来返回指定列值和(总计)。
    • 下面举一个例子,orderitems表包含订单中实际的物品,每个物品有相应的数量(quantity)。可如下检索所订购物品的总数(所有quantity值之和):
    select SUM(quantity) as items_ordered
    from orderitems
    where order_num = 20005;
    
    +---------------+
    | items_ordered |
    +---------------+
    | 19            |
    +---------------+
    
    • SUM()也可以用来合计计数值。在下面的例子中,合计每项物品的item_price * quantity,得出总的订单金额:
    select SUM(item_price * quantity) as total_price
    from orderitems
    where order_num = 20005;
    
    +-------------+
    | total_price |
    +-------------+
    | 149.87      |
    +-------------+
    
    • NULL值 SUM()函数忽略列值为NULL的行。

    10.2 聚集不同值

    • 以上5个聚集函数都可以如下使用:
      • 对所有的行执行计算,指定ALL参数或不给参数(因为ALL是默认行为);
      • 只包含不同的值,指定DISTINCT参数。
    • ALL为默认 ALL参数不需要指定,因为它是默认行为。如果不指定DISTINCT,则假定为ALL。
    • 下面例子使用AVG()函数返回特定供应商提供的产品的平均价格。它与上面的SELECT语句相同,但使用了DISTINCT参数,因此平均值只考虑各个不同的价格:
    prod_price) as avg_price
    from products
    where vend_id = 1003;
    
    +-----------+
    | avg_price |
    +-----------+
    | 13.212857 |
    +-----------+
    
    select AVG(distinct prod_price) as avg_price
    from products
    where vend_id = 1003;
    
    +-----------+
    | avg_price |
    +-----------+
    | 15.998    |
    +-----------+
    
    • 可以看到,在使用了DISTINCT后,此例子中的avg_price比较高,因为有多个物品具有相同的较低价格。排除它们提升了平均价格。
    • 注意 如果指定列名,则DISTINCT只能用于COUNT()。DISTINCT不能用于COUNT(*),因此不允许使用COUNT(DISTINCT),否则会产生错误。类似地,DISTINCT必须使用列名,不能用于计算或表达式。

    10.3 组合聚集函数

    • 目前为止的所有聚集函数例子都只涉及单个函数。但实际上SELECT语句可根据需要包含多个聚集函数。请看下面的例子:
    select COUNT(*) as num_items,
           MIN(prod_price) as price_min,
           MAX(prod_price) as price_max,
           AVG(prod_price) as price_avg
    from products;
    
    +-----------+-----------+-----------+-----------+
    | num_items | price_min | price_max | price_avg |
    +-----------+-----------+-----------+-----------+
    |        14 | 2.5       | 55        | 16.133571 |
    +-----------+-----------+-----------+-----------+
    
    • 取别名 在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名。虽然这样做并非不合法,但使用唯一的名字会使你的SQL更易于理解和使用。
  • 相关阅读:
    口袋摸球
    后渗透(四)数据包捕获
    后渗透(二)权限提升
    文件上传11-21
    MySQL之UDF提权
    《白帽子讲Web安全》读书笔记(一)
    XSS盲打获取cookies&&XSS钓鱼&&XSS键盘记录
    nginx目录穿越漏洞复现&&nginx目录遍历漏洞复现
    python教程(一)·简介
    DataPipeline如何实现数据质量管理?
  • 原文地址:https://www.cnblogs.com/sanjun/p/8278532.html
Copyright © 2020-2023  润新知