• SQL必需掌握的100个重要知识点:汇总数据


    9.1 聚集函数
    我们经常需要汇总数据而不用把它们实际检索出来,为此 SQL提供了专
    门的函数。使用这些函数,SQL 查询可用于检索数据,以便分析和报表
    生成。这种类型的检索例子有:
      确定表中行数(或者满足某个条件或包含某个特定值的行数);
      获得表中某些行的和;
      找出表列(或所有行或某些特定的行)的最大值、最小值、平均值。
    上述例子都需要汇总出表中的数据,而不需要查出数据本身。因此,返
    回实际表数据纯属浪费时间和处理资源(更不用说带宽了)。再说一遍,
    我们实际想要的是汇总信息。
    为方便这种类型的检索,SQL给出了 5个聚集函数,见表 9-1。这些函数
    能进行上述检索。与前一章介绍的数据处理函数不同,SQL 的聚集函数
    在各种主要 SQL实现中得到了相当一致的支持。

    聚集函数(aggregate function)
    对某些行运行的函数,计算并返回一个值。
    表9-1 SQL聚集函数
    函 数  说 明
    AVG()  返回某列的平均值
    COUNT()  返回某列的行数
    MAX()  返回某列的最大值
    MIN()  返回某列的最小值
    SUM()  返回某列值之和
    下面说明各函数的使用。
    9.1.1  AVG() 函数
    AVG() 通过对表中行数计数并计算其列值之和,求得该列的平均值。 AVG()
    可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。
    下面的例子使用 AVG() 返回 Products 表中所有产品的平均价格:
    输入▼
    SELECT AVG(prod_price) AS avg_price
    FROM Products;
    输出▼
    avg_price
    -------------
    6.823333
    分析▼
    此 SELECT 语句返回值 avg_price ,它包含 Products 表中所有产品的
    平均价格。如第 7课所述, avg_price 是一个别名。

    AVG() 也可以用来确定特定列或行的平均值。下面的例子返回特定供应
    商所提供产品的平均价格:
    输入▼
    SELECT AVG(prod_price) AS avg_price
    FROM Products
    WHERE vend_id = 'DLL01';
    输出▼
    avg_price
    -----------
    3.8650
    分析▼
    这条 SELECT 语句与前一条的不同之处在于,它包含了 WHERE 子句。此
    WHERE 子句仅过滤出 vend_id 为 DLL01 的产品,因此 avg_price 中返
    回的值只是该供应商产品的平均值。
    注意:只用于单个列
    AVG() 只能用来确定特定数值列的平均值,而且列名必须作为函数参
    数给出。为了获得多个列的平均值,必须使用多个 AVG() 函数。只有
    一个例外是要从多个列计算出一个值时,本课后面会讲到。
    说明: NULL 值
    AVG() 函数忽略列值为 NULL 的行。
    9.1.2  COUNT() 函数
    COUNT() 函数进行计数。可利用 COUNT() 确定表中行的数目或符合特定
    条件的行的数目。

    COUNT() 函数有两种使用方式:
      使用 COUNT(*) 对表中行的数目进行计数,不管表列中包含的是空值
    ( NULL )还是非空值。
      使用 COUNT(column) 对特定列中具有值的行进行计数,忽略 NULL 值。
    下面的例子返回 Customers 表中顾客的总数:
    输入▼
    SELECT COUNT(*) AS num_cust
    FROM Customers;
    输出▼
    num_cust
    --------
    5
    分析▼
    在此例子中,利用 COUNT(*) 对所有行计数,不管行中各列有什么值。计
    数值在 num_cust 中返回。
    下面的例子只对具有电子邮件地址的客户计数:
    输入▼
    SELECT COUNT(cust_email) AS num_cust
    FROM Customers;
    输出▼
    num_cust
    --------
    3

    分析▼
    这条 SELECT 语句使用 COUNT(cust_email) 对 cust_email 列中有值的
    行进行计数。在此例子中, cust_email 的计数为 3 (表示 5个顾客中只
    有 3个顾客有电子邮件地址)。
    说明: NULL 值
    如果指定列名,则 COUNT() 函数会忽略指定列的值为 NULL 的行,但
    如果 COUNT() 函数中用的是星号( * ),则不忽略。
    9.1.3  MAX() 函数
    MAX() 返回指定列中的最大值。 MAX() 要求指定列名,如下所示:
    输入▼
    SELECT MAX(prod_price) AS max_price
    FROM Products;
    输出▼
    max_price
    ----------
    11.9900
    分析▼
    这里, MAX() 返回 Products 表中最贵物品的价格。
    提示:对非数值数据使用 MAX()
    虽然 MAX() 一般用来找出最大的数值或日期值,但许多(并非所有)
    DBMS 允许将它用来返回任意列中的最大值,包括返回文本列中的最
    大值。在用于文本数据时, MAX() 返回按该列排序后的最后一行。

    说明: NULL 值
    MAX() 函数忽略列值为 NULL 的行。
    9.1.4  MIN() 函数
    MIN() 的功能正好与 MAX() 功能相反,它返回指定列的最小值。与 MAX()
    一样, MIN() 要求指定列名,如下所示:
    输入▼
    SELECT MIN(prod_price) AS min_price
    FROM Products;
    输出▼
    min_price
    ----------
    3.4900
    分析▼
    其中 MIN() 返回 Products 表中最便宜物品的价格。
    提示:对非数值数据使用 MIN()
    虽然 MIN() 一般用来找出最小的数值或日期值,但许多(并非所有)
    DBMS 允许将它用来返回任意列中的最小值,包括返回文本列中的最
    小值。在用于文本数据时, MIN() 返回该列排序后最前面的行。
    说明: NULL 值
    MIN() 函数忽略列值为 NULL 的行。
    9.1.5  SUM() 函数
    SUM() 用来返回指定列值的和(总计)。

    下面举一个例子, OrderItems 包含订单中实际的物品,每个物品有相应
    的数量。可如下检索所订购物品的总数(所有 quantity 值之和):
    输入▼
    SELECT SUM(quantity) AS items_ordered
    FROM OrderItems
    WHERE order_num = 20005;
    输出▼
    items_ordered
    ----------
    200
    分析▼
    函数 SUM(quantity) 返回订单中所有物品数量之和, WHERE 子句保证只
    统计某个物品订单中的物品。
    SUM() 也可以用来合计计算值。在下面的例子中,合计每项物品的
    item_price*quantity ,得出总的订单金额:
    输入▼
    SELECT SUM(item_price*quantity) AS total_price
    FROM OrderItems
    WHERE order_num = 20005;
    输出▼
    total_price
    ----------
    1648.0000
    分析▼
    函数 SUM(item_price*quantity) 返回订单中所有物品价钱之和, WHERE

    子句同样保证只统计某个物品订单中的物品。
    提示:在多个列上进行计算
    如本例所示,利用标准的算术操作符,所有聚集函数都可用来执行多
    个列上的计算。
    说明: NULL 值
    SUM() 函数忽略列值为 NULL 的行。
    9.2 聚集不同值
    以上 5个聚集函数都可以如下使用。
      对所有行执行计算,指定 ALL 参数或不指定参数(因为 ALL 是默认行
    为)。
      只包含不同的值,指定 DISTINCT 参数。
    提示: ALL 为默认
    ALL 参数不需要指定,因为它是默认行为。如果不指定 DISTINCT ,则
    假定为 ALL 。
    下面的例子使用 AVG() 函数返回特定供应商提供的产品的平均价格。它
    与上面的 SELECT 语句相同,但使用了 DISTINCT 参数,因此平均值只考
    虑各个不同的价格:
    输入▼
    SELECT AVG(DISTINCT prod_price) AS avg_price
    FROM Products
    WHERE vend_id = 'DLL01';

    输出▼
    avg_price
    -----------
    4.2400
    分析▼
    可以看到,在使用了 DISTINCT 后,此例子中的 avg_price 比较高,因
    为有多个物品具有相同的较低价格。排除它们提升了平均价格。
    注意: DISTINCT 不能用于 COUNT(*)
    如果指定列名,则 DISTINCT 只能用于 COUNT() 。 DISTINCT 不能用
    于 COUNT(*) 。类似地, DISTINCT 必须使用列名,不能用于计算或表
    达式。
    提示:将 DISTINCT 用于 MIN() 和 MAX()
    虽然 DISTINCT 从技术上可用于 MIN() 和 MAX() ,但这样做实际上没
    有价值。一个列中的最小值和最大值不管是否只考虑不同值,结果都
    是相同的。
    说明:其他聚集参数
    除了这里介绍的 DISTINCT 和 ALL 参数,有的 DBMS还支持其他参数,
    如支持对查询结果的子集进行计算的 TOP 和 TOP PERCENT 。为了解具
    体的 DBMS支持哪些参数,请参阅相应的文档。
    9.3 组合聚集函数
    目前为止的所有聚集函数例子都只涉及单个函数。但实际上, SELECT 语
    句可根据需要包含多个聚集函数。请看下面的例子:

    输入▼
    SELECT COUNT(*) AS num_items,
    MIN(prod_price) AS price_min,
    MAX(prod_price) AS price_max,
    AVG(prod_price) AS price_avg
    FROM Products;
    输出▼
    num_items price_min price_max price_avg
    ---------- --------------- --------------- ---------
    9 3.4900 11.9900 6.823333
    分析▼
    这里用单条 SELECT 语句执行了 4个聚集计算,返回 4个值( Products
    表中物品的数目,产品价格的最高值、最低值以及平均值)。
    注意:取别名
    在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列
    名。虽然这样做也算合法,但许多 SQL实现不支持,可能会产生模糊
    的错误消息。

  • 相关阅读:
    解决 UDP 接收不到数据问题
    内部排序算法的比较
    STM32物联网项目-触摸按键
    一个案例搞懂工厂模式和单例模式
    网络读卡器开发,带你智能感知无线设备
    【springboot】19、数据库操作
    ThreadLocal详解
    虚拟机上安装Linux出现的问题
    6 张图告诉你 RocketMQ 是怎么保存偏移量的
    java 调用C#语言写的dll文件代码 超详细过程
  • 原文地址:https://blog.csdn.net/tysonchiu/article/details/125486868