
这是一段摘抄自MySQL官网的文字。其大致意思是MySQL拓展了group by的使用,MySQL允许选择没有出现在group by中的字段。换句话说,标准SQL是不允许select column出现没在group by中出现的字段
所以在MySQL中,select * from table group by column是允许的

BUT
select *, count(column) from table group by column是不允许的

我们来简单分析一下原因
扫描表数据:
按分组列进行排序或哈希:
分配行到各个分组:
应用聚合函数:
生成输出:
假设我们有一个简单的表 Sales:
CREATE TABLE Sales (
sale_id INT,
sale_date DATE,
amount DECIMAL(10, 2)
);
INSERT INTO Sales (sale_id, sale_date, amount) VALUES
(1, '2023-06-01', 100.00),
(2, '2023-06-01', 150.00),
(3, '2023-06-02', 200.00),
(4, '2023-06-03', 250.00),
(5, '2023-06-03', 300.00);
我们要按 sale_date 分组,并计算每个日期的总销售额:
SELECT sale_date, SUM(amount) AS total_sales
FROM Sales
GROUP BY sale_date;
执行步骤:
扫描表数据:
按分组列进行排序或哈希:
分配行到各个分组:
应用聚合函数:
生成输出:
说的通俗点就是形成如下数据结构
Map
然后迭代groupBy,对每个List做聚合处理
ans = []
for key, values in groupBy:
ans.append(key, 聚合函数(values))
通过上述分析不难发现,count() 函数是对**聚合后的List
加入我们是select *,那么Row中的数据将会包含一行的所有字段,此时的count应该处理的是count函数 中所指定的字段。count处理完成后,将List
所以,count()和*理论上不能同时出现在select字段中。因为count只聚合函数指定的字段,而select *则表示数据行出现所有字段。
其中 一个字段制定了聚合规则,从List聚合为value,那其他字段可不知道怎么聚合,处理后依然是List,因此出现了数据维度的差异,所以理论上count()和*不能同时出现
BUT,我们看看这段SQL

依然是能够跑通的,但这是为什么呢?
其实原因很简单。虽然其他字段不知道聚合规则,但要从List聚合为value,随便选一条数据不久完事了。我们从上图可知,对于非聚合字段,MySQL选择了组间第一行数据作为输出
理论上,group by [col1, col2…]只能和select [col1, col2…]配合,也就是如果存在group by,那么select的字段必须出现在group by中
但是MySQL做出了拓展,允许非聚合字段和聚合字段同时出现
并且允许select *, count(col1) from table group by col1这种形式的SQL出现