• 数据库 SQL高级查询语句:聚合查询,多表查询,连接查询


    创建学生表

    创建Students和Courses表

    CREATE TABLE Students (
        StudentID int PRIMARY KEY,
        Name varchar(255),
        Gender varchar(1),
        Age int,
        City varchar(255)
    );
    INSERT INTO Students VALUES(1, 'David', 'M', 21, 'Shanghai');
    INSERT INTO Students VALUES(2, 'Kevin', 'M', 19, 'Beijing');
    INSERT INTO Students VALUES(3, 'Emily', 'F', 22, 'Shanghai');
    INSERT INTO Students VALUES(4, 'William', 'M', 20, 'New York City');
    INSERT INTO Students VALUES(5, 'Alice', 'F', 19, 'Los Angeles');
    INSERT INTO Students VALUES(6, 'Frank', 'F', 22, 'Los Angeles');
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    CREATE TABLE Courses (
        CourseID int PRIMARY KEY,
        CourseName varchar(255)
    );
    INSERT INTO Courses VALUES(1, 'CS101');
    INSERT INTO Courses VALUES(2, 'CS202');
    INSERT INTO Courses VALUES(3, 'EE101');
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    聚合查询

    在这里插入图片描述

    聚合函数

    直接查询

    SELECT COUNT(*) FROM Students;
    
    • 1

    在这里插入图片描述

    设置别名查询

    SELECT COUNT(*) AS StudentsNum FROM Students;
    
    • 1

    设置条件查询

    使用COUNT(*) 和 COUNT(StudentID)是一样的效果,因为StudentID是主键,每行记录的主键都不同。另外我们在聚合查询中还是能使用WHERE子句的,比如我们要查找年龄大于20岁的学生数量,可使用以下SQL语句:

    SELECT COUNT(*) FROM Students AS s WHERE s.age > 20; 
    
    • 1

    常用的聚合函数

    函数 说明
    SUM 计算某一列的总和,该列必须为数值类型
    AVG 计算某一列的平均数,该列必须为数值类型
    MAX 计算某一列的最大值
    MIN 计算某一列的最小值

    查询学生的平均年龄

    SELECT AVG(Age) FROM Students;
    
    • 1

    使用AVG聚合函数
    在这里插入图片描述

    分组查询

    单个字段Group by

    根据城市City对学生进行分组,并需要查询每个城市有多少学生

    SELECT City, COUNT(*) FROM Students GROUP BY City;
    
    • 1

    在这里插入图片描述

    报错分组查询

    如果将Name也放入查询结果,会报错,因为来自相同城市的学生可能有很多位,名字各不相同,所以以下语句是不合法的:

    SELECT City, COUNT(*), Name FROM Students GROUP BY City;
    
    • 1

    报错信息如下
    在这里插入图片描述
    SELECT 列表的表达式 #3 不在 GROUP BY 子句中,并且包含非聚合列“tuling.Students.Name”,该列在功能上不依赖于 GROUP BY 子句中的列;这与 sql_mode=only_full_group_by 不兼容。

    #3就指的是Name那一列

    多字段分组查询

    GROUP BY 也能放入多个字段,比如我们想先将学生根据City分组,然后再根据性别分组,可以使用以下语句:

    SELECT City, Gender, COUNT(*) FROM Students GROUP BY City, Gender;
    
    • 1

    在这里插入图片描述
    学生表中Los Angeles的两个人性别一样,分组显示的为F,计数为2
    在这里插入图片描述
    现在我将其中一人人的性别改为M,思考一下查询结果会发生变化吗?

    地点相同,性别不同的被区分出来了。
    在这里插入图片描述
    可以看到原来Los Angeles为2,现在变成了两个1,性别M和F被区分了。
    在这里插入图片描述

    多表查询

    SELECT 查询除了能从单表中查数据外,也能从多表中查询数据。语法如下:

    直接查询

    SELECT * FROM Students, Courses;
    
    • 1

    查询结果是两个表的笛卡尔积

    假设Students有5列字段和7行记录,Courses有2列字段和3行记录,其结果就是一个拥有21 (3 * 7) 行记录和 7 (5 + 2) 列字段的二维表,既Students表的每一行和Courses表的每一行两两拼在一起。结果集的列数会是两表列数之和,而行数是两表行数之积。
    在这里插入图片描述

    重命名查询

    有时候两张表可能拥有相同名字的字段,那么结果则会让人疑惑,我们可以通过使用 AS 取别名来区别字段。比如使用以下语句给StudentID和CourseID改名为StudentId和CourseId:

    SELECT Students.StudentID AS StudentId, Courses.CourseID AS CourseId FROM Students, Courses;
    
    • 1

    给字段取别名的语法类似 column_name AS new_column_name,上面的语句分别给StudentID和CoursesID取了别名StudentId和CourseId,虽然在这个例子中,我们只是将最后的字母D变为小写。但考虑一下另一种情况:假设Students和Courses的主键字段都叫ID,那么这个别名就很有帮助了,我们可以使用以下语句使查询结果更明了:

    SELECT Students.ID AS StudentId, Courses.ID AS CourseId FROM Students, Courses;
    
    • 1

    除了给输出字段取别名外,给表格取别名也很有用的,语法类似table_name AS alias,我们可以将上面的语句写成下面这样:

    SELECT S.ID AS StudentId, C.ID AS CourseId FROM Students AS S, Courses AS C;
    
    • 1

    Students表新建一列CourseID

    在多表查询中,还是能使用WHERE子句。为了帮助大家理解之后的内容,我们需要给Students添加一列新的字段CourseID,代表此学生选择的课程:

    新建一列CourseID在City之后

    alter table Students add column CourseID int(4) not null after City;
    
    • 1

    在这里插入图片描述
    CouseID的值设置为StudentID的值一半

    update Students set CourseID = StudentID/2
    
    • 1

    在这里插入图片描述

    查询StudentID和其对应的课程名字

    SELECT S.StudentID,C.CourseName 
    FROM Students AS S,Courses AS C
    WHERE S.CourseID = C.CourseID;
    
    • 1
    • 2
    • 3

    在这里插入图片描述
    报错!!! 知道为什么吗一般 erro syntax就是中文字符的问题,

    Students as S,Courses as C 这个逗号是中文字符,改成英文字符后运行成功啦
    
    • 1

    在这里插入图片描述
    除了WHERE子句,其他子句类似ORDER BY,GROUP BY也都适用于多表查询。

    除了WHERE子句,其他子句类似ORDER BY,GROUP BY也都适用于多表查询。

    连接(JOIN)查询

    INNER JOIN

    连接查询是另一种类型的多表查询,连接查询会对多个表格进行JOIN运算。也就是说,先确定一个主表作为结果集,然后将其他表的记录有选择性地“嵌入”到主表结果集上。

    假设我们想要知道每个学生选择的课程名字,除了上面提到的多表查询加WHERE子句,我们还能使用INNER JOIN子句:

    SELECT S.StudentID, C.CourseName 
    FROM Students AS S 
    INNER JOIN Courses AS C ON S.CourseID = C.CourseID;
    
    • 1
    • 2
    • 3

    在这里插入图片描述
    此语句就能将每个StudentID和其对应的课程名查询出来,要注意INNSER JOIN语句的内在执行过程如下:

    • 1 确定主表,使用 FROM table_name
    • 2 紧接着确认连接的表,使用 INNER JOIN table_name
    • 3 再确定连接条件,使用 ON condition,上面语句的条件就是 S.CourseID = C.CourseID
    • 4 最后还能加上 : WHERE、ORDER BY等子句
      除了INNER JOIN外,我们还有LEFT JOIN, RIGHT JOIN, 和FULL JOIN。

    补充:别名不是必须的,只是为了增加可读性。

    RIGHT JOIN, LEFT JOIN

    如果我们将语句改为 RIGHT JOIN:

    SELECT S.StudentID, C.CourseName
    FROM Students AS S 
    RIGHT JOIN Courses AS C ON S.CourseID = C.CourseID;
    
    • 1
    • 2
    • 3

    在这里插入图片描述

    修改Students表格,让5,6选课程1,重新右连接查询。
    在这里插入图片描述
    执行上面的语句之后,如果有一节课没有任何学生加入,我们会有一行多余的记录,记录中仅有CourseName,但是StudentID为NULL。
    在这里插入图片描述
    为什么会这样呢?INNER JOIN 会返回同时存在两张表的数据,如果Students有1, 2, 3, 5课号,Courses也有1, 2, 3, 4课号,那么结果就是其相交集1, 2, 3。而 RIGHT JOIN 返回的则是右表存在的记录,如果左表不存在右表中的某几行,那结果中的那几行就会是NULL。

    而 LEFT JOIN 则会返回左表中都存在的数,如果给Students加上CourseID=10,即使Courses表中没有ID为10的课程记录,那么LEFT JOIN的结果还是会多一行记录,其对应的CourseName是NULL。(补充:LEFT JOIN 在有些数据库中叫做 LEFT OUT JOIN,同理 RIGHT JOIN 也可能叫做 RIGHT OUT JOIN。)

    FULL JOIN

    最后一种 JOIN 是 FULL JOIN,结果集会把两张表的所有记录全部选出来,并自动把两张表中不存在的列补充为NULL。

    为了帮助大家理解连接查询的逻辑,大家可以参看以下的图示,左边的圆可以理解为左表,右边的圆可以理解为右表。
    在这里插入图片描述
    以上就是SQL语法的基本教程啦,现在大家已经学会了如何使用 SQL 创建表格和记录,并使用高级的 SQL 语句进行复杂的查询,下一章我们就开始学习使用真正的数据库软件 MySQL。

    课后练习

    请写出SQL语句,找出加入CourseID为1的学生数量和课程名字,要注意的是,我们只寻找那些年纪大于20岁的男学生数量。

    方法1 使用Where

    SELECT COUNT(*) AS StudentsNum,CourseName 
    FROM Students AS S,Courses AS C
    WHERE S.CourseID = C.CourseID AND S.CourseID = 1 AND S.Age > 20 AND S.Gender = 'M';
    
    • 1
    • 2
    • 3

    方法2 Group by + where

    SELECT COUNT(*) AS StudentsNum, CourseName 
    FROM Students LEFT JOIN Courses ON Students.CourseID = Courses.CourseID 
    WHERE Students.Age > 20 AND Students.Gender = 'M'
    GROUP BY Students.CourseID;
    
    • 1
    • 2
    • 3
    • 4

    复习

    • 1 确定主表,使用 FROM table_name
    • 2 紧接着确认连接的表,使用 INNER JOIN table_name
    • 3 再确定连接条件,使用 ON condition,上面语句的条件就是 S.CourseID = C.CourseID
    • 4 最后还能加上 : WHERE、ORDER BY等子句
      除了INNER JOIN外,我们还有LEFT JOIN, RIGHT JOIN, 和FULL JOIN。

    参考

    【SQL高级查询语句:聚合查询,多表查询,连接查询【关系数据库SQL教程5】】 https://www.bilibili.com/video/BV1Zp4y1Q7mj/?share_source=copy_web&vd_source=fe6c23f6f1353ed1eff5d5e866171572

  • 相关阅读:
    10 种保证接口数据安全的方案!
    电力行业放大招了!赶紧学起来
    在 SPRING Boot JPA 中调用带有本机查询中的参数的存储过程
    苹果开源高效语言模型 OpenELM;全球首个 AI 基因编辑器开源丨RTE 开发者日报 Vol.192
    【MySQL】数据类型——MySQL的数据类型分类、数值类型、小数类型、字符串类型
    论文阅读 3 | Few-shot Domain Adaptation by Causal Mechanism Transfer
    单机搭建Nacos集群
    qt-C++笔记之信号与槽
    C++11主要新增使用语法介绍
    BI业务用户商业分析新时代,如何把数据用透?
  • 原文地址:https://blog.csdn.net/qq_41398619/article/details/132263105