• 【MySQL系列】- SELECT语句执行顺序


    【MySQL系列】- SELECT语句执行顺序

    一、MYSQL逻辑查询处理的步骤图

    在这里插入图片描述

    二、MYSQL执行顺序详解

    2.1 执行FROM操作

    这一步需要做的是对FROM子句前后的两张表进行笛卡尔积操作,也称作为交叉连接,生成虚拟表VT1。如果FROM子句前的表包含a行数据,FROM子句后的表中包含b行数据,那么虚拟表VT1将包含a*b行数据。

    2.2 应用ON过滤器

    SELECT查询共有3个过滤流程,分别是ON、WHERE、HAVING。ON是最先执行的过滤流程。 在大多数的编程语言中,逻辑表达式的值只有两种:TRUE 和 FALSE。但是在关系数据库中起逻辑表达式作用的并非只有两种,还有一种称为三值逻辑的表达式。这是因为在数据库中对NULL值的比较与大多编程语言不同。在C语言中,NULL == NULL的比较返回的是1,即相等,而在关系型数据库中,NULL的比较就不一样了。对于在ON过滤条件下的NULL值比较,此时的比较结果为UNKNOWN,却被视为FALSE来处理,即两个NULL并不相同。但是在下面两种情况认为两个NULL值的比较是相等的

    • GROUP BY 子句把所有的NULL值都分到一组;
    • ORDER BY 子句中将所有NULL值排列在一起;

    因此在生成虚拟表VT2的时候,会增加一个额外的列来表示ON过滤条件的返回值,返回值有FALSE 、 TRUE 、 UNKNOWN。

    2.3 JOIN外部行

    这一步只有在连接类型是OUTER JOIN时才发生,如LEFT OUTER JOIN , RIGHT OUTER JOIN , FULL OUTER JOIN.虽然在大多数时候可以省略OUTER关键字,但OUTER代表的就是外部行。关于保留表:

    • LEFT OUTER JOIN把左表记为保留表;
    • RIGHT OUTER JOIN把右表记为保留表;
    • FULL OUTER JOIN把左右表都作为保留表;

    添加外部行的工作就是在VT2表的基础上添加保留表中被过滤掉的数据,非保留表中的数据被赋NULL值,最后生成虚拟表VT3

    2.4 应用WHERE过滤器

    对上一步骤产生的虚拟表VT3进行WHERE条件过滤,只有符合的记录才会输出到虚拟表VT4中。

    在当前应用WHERE过滤器时,有两种过滤是不被允许的:

    1. 由于数据还没有分组,因此现在还不能在WHERE过滤器中使用where_condition=MIN(col)这类统计的过滤;
    2. 由于没有进行列的选取操作,因此在SELECT过滤器中使用列名也是不被允许;

    此外,在WHERE过滤器中进行的过滤和在ON过滤器中进行的过滤是有所不同的:

    1. 对于OUTER JOIN中的过滤,在ON过滤器过滤完成之后还会添加保留表中被ON条件过滤掉的记录。
    2. WHERE 条件中被过滤掉的记录则是永久的过滤,在INNER JOIN中两者是没有差别的,因为没有添加外部行的操作。

    2.5 GROUP BY分组

    在本步骤中根据指定的列对上个步骤中产生的虚拟表进行分组,最后得到虚拟表VT5; MySQL对查询做了加强,使得在GROUP BY 后面可以使用SELECT中定义的别名。

    在MySQL中,Group By中可以使用别名;WHERE中不能使用别名;ORDER BY中可以使用别名。在ORACLE,HIVE中别名的使用都是严格遵循SQL执行顺序的,GROUP BY后面不能用别名。

    2.6 应用ROLLUP 或 CUBE

    • ROLLUP

      如果指定了ROLLUP选项,那么将创建一个额外的记录添加到虚拟表VT5的最后,并生成虚拟表VT6

    • CUBE

      对于CUBE选项,MySQL数据库虽然支持该关键字的解析,但是并未实现功能。

    2.7 HAVING过滤

    在该步骤中对于上一步产生的虚拟表应用HAVING过滤器,HAVING是对分组条件进行过滤的筛选器。生成的虚拟表VT7

    2.8 处理SELECT 列表

    虽然SELECT是查询中最先被指定的部分,但是知道步骤8时才真正进行处理,在这一步中,将SELECT中指定的列从上一步产生的虚拟表中选出。

    2.9 DISTINCT子句

    如果在查询中指定了DISTINCT子句,则会创建一张内存临时表VT9(如果内存放不下就放到磁盘上)。这张临时表的表结构和上一步产生的虚拟表一样,不同的是对进行DISTINCT操作的列增加了一个唯一索引,以此来去除重复的数据。

    2.10 应用ORDER BY 子句

    根据ORDER BY子句中指定的列上对上一步输出的虚拟表进行排列,返回新的虚拟表,最后得到的虚拟表VT10。

    2.11 LIMIT子句

    在该步骤中应用LIMIT子句,从上一步骤的虚拟表中选出从指定位置开始的指定行数据。对于没有应用ORDER BY 的LIMIT子句,结果同样可能是无序的,因此LIMIT语句通常和ORDER BY子句一起使用。

    三、总结

    MYSQL语句每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者(客户端应用程序或者外部查询)不可用。只有最后一步生成的表才会给调用者。如果没有在查询中指定某一个子句,将跳过相应的步骤。

  • 相关阅读:
    计算狗携手成都超算中心和重庆大学,共同助力“碳中和”
    算法分析与设计CH25:回溯算法Back-Tracking——N皇后问题
    Linux学习之:进程的控制
    最简洁网站 SEO 优化,Lighthouse SEO 评分 92
    Android导航抽屉
    Arxiv 2206 | Global Context Vision Transformers
    【LeetCode】61. 旋转链表
    我没有机器学习的学位,却拿到了 DeepMind 研究工程师的 Offer
    【科普】电脑屏幕刷新率:了解和选择需要的刷新率
    Win10+Anaconda+tensorflow VS Win10+CPU+Pytorch
  • 原文地址:https://blog.csdn.net/songjianlong/article/details/133915449