码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 数据库迭代模型扩展


    火山模型(Volcano Model)也称为迭代模型(Iterator Model),是最著名的查询执行模型,早在 1990 年就在论文 “Volcano, an Extensible and Parallel Query Evaluation System” 中被提出。主流的 OLTP 数据库 Oracle、MySQL 都采用了这种模型。引用地址

    但是,在使用过程中感觉到该模型存在一些工程上的缺陷,需要扩展。

    存在问题

    火山模型定义的接口清晰、简单,使得各个算子只需要关注算子本身的算法,无需关心上游是谁产出的数据。例如,Sort 算子做排序,下游数据可能来自 TableScan,可能来自 GroupBy,也可能来自 Limit。

    但是,在特定场景下,下游算子如果能知道上游算子的一些额外信息,有利于执行优化。例如:

    WINDOW
      SORT
        TBALE SCAN
    
    • 1
    • 2
    • 3

    在火山模型里,WINDOW 算子并不知道它的 CHILD 算子是 SORT,即便知道也没有一个规范的办法从 SORT 里取得任何信息。WINDOW 算子如果能知道输入的数据总行数,可以做很多动态优化。而 SORT 是阻塞算子,它正好有条件计算出总行数。这两个算子相互配合,就能让 WINDOW 算子更好地优化。

    解决方案

    在火山模型里,算子只有一种输出:

    • 行数据

    而在工程实现里,算子可以有两种产物输出:

    • 行数据
    • 其它统计信息、执行辅助信息

    借助通信领域的概念,我将其抽象为:

    • 带内数据
    • 带外数据

    关于带外数据的应用场景,可以参考这篇文章,写得很好。

    有了带外数据的概念,上下层算子之间就有可能实现信息的共享与传输了。

    接口定义

    为了描述方便,还是使用上面的计划作为例子。

    WINDOW
      SORT
        TBALE SCAN
    
    • 1
    • 2
    • 3

    首先,在计划优化阶段,优化器可以明确告诉 WINDOW 算子,它的下面是 SORT。
    然后,在计划生成阶段,Code Generator 模块告知 WINDOW 算子它可以调用 child.get_stat() 接口
    最后,在计划执行阶段,WINDOW 算子在 get_next_row 之前调用 child.get_stat() 传入回调对象以获取统计信息。SORT 算子检测到回调对象存在时,就会在返回任何行之前向回调对象里传入统计信息。

    从上面的描述可知,每个阻塞算子都可以和一个特定类型的回调对象绑定,通过改对象对外暴露自身状态。

    存在问题

    如果 WINDOW 想要获得 TABLE SCAN 的统计信息呢?应该如何处理?OceanBase 里的 Datahub 组件是一种方法,但这个方法依赖了网络。我们需要一个 Local Datahub 组件,用于 DFO/fragment 内部的快算子带外数据传输。

    本文重点是引入“带外数据” 的概念,其具体实现细节不做过多讨论,故而本文打住至此。

  • 相关阅读:
    Android系统10 RK3399 init进程启动(四十三) ROM定制开机自启动服务(C++程序)
    QT学习:使用JSON/XML等非ts文件实现多语言国际化
    某宝长x-mini-wua分析与破解
    基于物联网的农村地区智能微电网系统(Simulink)
    06_ElasticSearch:索引和文档的CURD
    【线性代数】P2 行列式的性质
    容器基本概念_从虚拟化技术_到容器化技术_开通青云服务器_并远程连接_容器安装---分布式云原生部署架构搭建007
    华为浏览器,Chrome的平替,插件无缝连接
    并发修改异常
    哈希 -- 位图、布隆过滤器、海量数据处理
  • 原文地址:https://blog.csdn.net/maray/article/details/126778948
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号