作者:汤圆学Java
个人博客:https://www.javalover.cc/
group by 用来对数据进行分组,即按照指定的字段或者表达式进行分组;
语句格式如下:
select column1, ..., aggregate_fun() from table where filters... group by column1, ... order by column1 desc
group by 作用于 where 之后,order by 之前:即先通过 where 过滤数据,再对过滤后的数据中进行分组,分组的依据就是字段 column的值,即不同的column字段值,分成不同的组;然后再根据column字段值进行降序排列
流程如下图所示:
假设有如下所示的数据库 s_user;
select * from s_user where name like 'jalon%' group by name order by id desc
输出结果如下:
可以看到,只有两条数据以id降序返回,其中名字name没有重复的;
下面我们用 group by + aggregate 聚合函数 进行查询:用聚合函数 sum 求出分组之后的用户 年龄之和
select *, sum(age) from s_user where name like 'jalon%' group by name order by id desc
输出结果如下:
可以看到,这里的结果多了一列 sum(age)数据,这列数据就是 group by 搭配 sum聚合函数,用来统计 分组中年龄总和;
下面我们再用 group by 进行查询:分组依据为表达式
有时候我们需要对字段的值进行一些处理,然后再进行分组,比如下面的例子:只取name字段值的前5个字符,然后对其进行分组,用到了substring()字符串函数
select *, substring(name,1, 5) from s_user where age > 10 group by substring(name, 1, 5) order by id desc
输出结果如下:
可以看到,这里group by + substring()
实现的效果,跟前面的where like
很像;
本质上都是对字符串进行模糊匹配处理;
只是 group by
会把匹配到的数据集中到一条记录中(分组),而where like
则是正常展示所有符合条件的记录;
因为group by 作用于where条件之后,所以无法通过where来过滤 group by之后的分组数据;
但是可以通过having来实现,比如下面的例子:根据名字的前5位进行分组,然后找到分组中的记录数>1的分组;
select *, substring(name,1, 5), count(*) from s_user where age > 10 group by substring(name, 1, 5) having count(*) > 1 order by id desc
这里的count()也是一个聚合函数,统计的是每个分组中的记录个数
输出结果如下:
可以看到,之前的那条name=polay1
的记录没有显示,因为这条记录所在的分组,没有满足having count(*)>1
上面的SQL中,都是直接用的聚合函数来显示返回结果;
其实我们可以给聚合函数的结果取一个别名,且这个别名还可以用在当前语句的后续位置;
我们可以把上面的那条SQL简化成下面的例子:
select *, substring(name,1, 5) as nameSub, count(*) as groupCount from s_user where age > 10 group by nameSub having groupCount > 1 order by id desc
下图是简化前后的对比图:
输出结果如下:
可以看到,聚合函数的结果也是以别名进行展示,这样比较符合结果集的字段格式;