LLVM技术在GaussDB等数据库中的应用

LLVM技术在GaussDB等数据库中的应用
数据库引入LLVM之后，可以为具体的查询生成定制化的机器码，并尽可能地将数据存储在CPU的寄存器中进一步加快计算的速度。
合集 - 数据库最新分享(54)
1.华为云峰会2024，GaussDB扬帆出海，给世界一个更优选择02-28 2.预算有限，资源冗余？DWS集群缩容如何帮你解决烦劳02-29 3.数智融合，华为云GaussDB(for MySQL)助力企业释放数据新价值03-01 4.RDS for MySQL Serverless公测上线：弹性伸缩，最高可降成本超80%03-04 5.GaussDB跨云容灾：实现跨地域的数据库高可用能力03-05 6.实例详解如何构建动态SQL语句03-05 7.GaussDB(DWS)运维利刃：TopSQL工具解析03-07 8.手把手带你认识GaussDB轻量化运维管理工具03-08 9.守护更多女性健康，华为云GeminiDB助力美柚数据库高效稳定迁移03-08 10.GaussDB(DWS)集群通信：详解pooler连接池03-11 11.Libcomm通信库：GaussDB(DWS) 为解决建联过多的小妙招03-12 12.实例带你了解GaussDB数据库的LOCK TABLE03-12 13.RDS for MariaDB“智能DBA助手”，让运维效率嗖嗖地！03-12 14.实例带你了解GaussDB的索引管理03-14 15.详解GaussDB(DWS)中3个防过载检查项03-18 16.华为云数据库创新发展论坛，打造行业更优数据库底座！03-19 17.GaussDB(分布式)实例故障处理03-19 18.华为云GeminiDB新版本发布：全面支持Redis 6.203-20 19.究竟什么样的数据库，才能承接RTA广告这个技术活！03-20 20.GaussDB(DWS) 业务高可靠的三大利器：CN RETRY、远程读、ELB03-25 21.走在前、做示范，苏州农商银行携华为云完成超级网银系统改造03-25 22.分布式数据库技术的演进和发展方向03-26 23.新版Redis不再“开源”，对使用者都有哪些影响？03-27 24.cgroup、资源池、用户的关系..涉及到GaussDB(DWS)的资源设置03-29 25.GeminiDB Cassandra接口新特性FLASHBACK发布：任意时间点秒级闪回04-01 26.探索GaussDB(DWS)湖仓融合：Hudi与元数据打通的深度解析04-01 27.详解数仓对象设计中序列SEQUENCE原理与应用04-02 28.数仓调优实战：GUC参数调优04-07 29.详讲openGauss 5.0 单点企业版如何部署_Centos7_x8604-08 30.华为云GeminiDB，广告RTA的“登云梯”04-09 31.DTC2024，华为云数据库创新融合大发展，打造世界级数据库！04-17 32.GaussDB(DWS)基于Flink的实时数仓构建04-18 33.数仓的两种轻量级数据交换格式：json与jsonb04-19 34.重磅新品发布！云耀数据库HRDS，享受轻量级的极致体验04-23 35.“企业创新新引擎”数据库专项赋能会，让云原生技术普惠千行百业！04-24 36.GaussDB SQL查询语句执行过程解析04-24 37.详解数仓的向量化执行引擎04-25 38.Redis开源社区持续壮大，华为云为Valkey项目注入新的活力05-06 39.详解数仓的3A安全能力05-07 40.【GaussDB(for MySQL)】 Big IN查询优化05-09 41.GaussDB细粒度资源管控技术透视05-09 42.带你了解GaussDB SQL中的BOOLEAN表达式05-10 43.数仓安全：数据脱敏技术深度解析05-10 44.详解GaussDB(DWS)中的行执行引擎05-11 45.了解GaussDB SQL中CASE表达式05-13 46.JDBC连接openGauss6.0和PostgreSQL16.2性能对比05-14 47.MySQL 给用户添加 ALTER VIEW 的权限05-15 48.MySQL全文索引源码剖析之Insert语句执行过程05-20 49.全球厂商之最，华为17篇论文入选国际数据库顶会ICDE05-22 50.GeminiDB PITR，让游戏回档“进退自如”！05-24 51.浅析MySQL 8.0直方图原理05-27
52.LLVM技术在GaussDB等数据库中的应用06-03
53.告别内存OOM，解决MySQL内存增长问题06-04 54.从数据库设计到性能调优，全面掌握openGemini应用开发最佳实践06-04
收起

本文分享自华为云社区《【GaussTech第3期】LLVM技术在GaussDB等数据库中的应用》，作者：GaussDB 数据库。

Hi，别急！

让技术触达每一个角落，赋能更多的人，GaussTech第3期《LLVM技术在GaussDB等数据库中的应用》，不仅带来满满的技术干货，还推出【分享集赞回帖赢好礼】活动，参与就能赢好礼，文末见惊喜哦！
万物互联的态势下，数据量的激增使得“如何提升数据处理性能”成为各家数据库共同面临的挑战。作为编译优化技术的代表，基于LLVM的CodeGen技术，能为每个查询生成定制的机器码替代原本的通用函数，减少实际查询时冗余的条件逻辑判断、虚函数调用并提高数据局域性，从而达到提升查询整体性能的目的，成为数据库性能优化的一项重要技术。

LLVM能在分析类场景中给用户带来较大的收益，也能在特定的交易性场景中给用户带来一定的收益。接下来详细解读一下LLVM技术在GaussDB等数据库中的应用吧。

LLVM和数据库

LLVM（Low Level Virtual Machine）是一款流行的开源编译器框架，是CodeGen（生成源代码的工具）技术的事实标准，被广泛运用于数据库（如KES, AnalyticDB, GaussDB）、大数据（如Spark）、AI平台（如tensorflow）等领域，用于提升数据处理的性能。

在没有引入LLVM这类CodeGen技术之前，数据库会使用通用的处理逻辑来处理数据。但通用逻辑“笨重”（递归、封装、类型判断转换）的代码实现方式，存在虚函数开销、缓存使用率低下、对指令集不敏感等性能短板。

引入LLVM之后，可以为具体的查询生成定制化的机器码，并尽可能地将数据存储在CPU的寄存器中进一步加快计算的速度：

LLVM天然支持JIT，该技术可以解决条件逻辑冗余的问题；

减少大量的虚函数调用；

将数据尽可能地从内存加载到Cache上；

LLVM做了很多自动矢量化的工作；

比如，下图左侧是通用代码，右侧是CodeGen之后的代码。CodeGen根据实际情况消除了不必要的循环和判断。

▲ 图1 通用性处理逻辑和LLVM代码示意

另外，LLVM技术可以有不同的实现粒度。比如：可使用LLVM加速表达式计算，或再进一步，将多个算子融合编译成定制的机器码，或将自定义函数、存储过程等编译成定制的机器码。

▲ 图2 LLVM的实现粒度

数据库在执行引擎中，运用LLVM技术提升SQL的执行速度。如下图所示：

▲ 图3 LLVM技术运用于执行引擎

LLVM适用场景

LLVM对所有类型的SQL都会有收益吗？

答案是否定的。

因为执行实时编译本身需要耗费一定的时间（简单表达式能做到毫秒级，复杂情况在百毫秒级），对于查询本身耗时较少的场景，加入LLVM反而会导致性能劣化。

因此，目前LLVM在OLAP/HTAP分析型业务场景中收益较大，有着广泛应用，而在OLTP交易型业务场景中，则相对没有那么广泛。

LLVM在OLTP中就一定没有收益吗？

答案同样是否定的。

找对场景，一样有收益。比如根据ISPRAS 2017年发表的实验结果（jit-compiling sql queries in postgresql using llvm）可知：pgbench测试下，OLTP场景中简单的查询加上JIT（Just-in-time及时编译，LLVM天然支持）扩展没有带来性能的提升，甚至将TPS（事务数/秒）从21.8降低到了7.8。

但是在Prepared query（plan cached）的情况下，和简单的查询相比，Plancache + CodeGen将TPS从21.8提升到了43，性能上有了约两倍的提升。

▲ 图4 简单查询、CodeGen流程、Plancache和“Plancache +CodeGen”流程的性能对比

GaussDB中的LLVM

1. LLVM在华为应用于数据库的时间线

华为数据库在LLVM上的研究还是非常超前的。早在2015年，华为就作为PostgreSQL全球开发者大会的赞助商，在会上发表的动态编译（Go Faster with Native Compilation）演讲并引起了很大的反响。

当时社区领袖Josh Burkus在其博客里面，用一节篇幅专门详细介绍了华为动态编译的议题。

▲ 图5 2015年社区领袖Josh Burkus介绍华为的动态编译议题

在2017年，华为在面向OLAP场景的数据库内核中突破了LLVM动态编译技术，并在运营商、金融证券等多个行业的POC项目中帮助客户提升数据处理性能，同时，在软件开发过程中充分模块化、通用化接口设计，将LLVM同年落地到面向OLTP的数据库设计中。

目前，GaussDB数据库对于LLVM也在不断地演进开发。

2. GaussDB LLVM实现简析

GaussDB针对向量化引擎（主要用于分析场景）、行存（主要用于交易场景）都实现了CodeGen。如下图所示，从代码模块层次来看：

1) GaussDB通过API接口层封装处理了LLVM环境、资源、基本元素等。

2) GaussDB在CodeGen层调用API接口进行了不同粒度的实现。

3) GaussDB在执行引擎侧根据情况使用CodeGen技术进行性能优化。

▲ 图6 GaussDB LLVM 模块层次图

GaussDB启动后会进行LLVM的初始化工作，检查CPU对CodeGen的支持情况，并进行环境初始化。

在执行启动阶段，以表达式为例，程序会判断当前表达式是否可JIT，是的话，则会进行IR函数的生成和生成定制机器码，及原本表达式执行函数的入口替代工作。

在实际执行过程中，运行处理函数（该函数已经在上一阶段进行了入口替代）进行实际执行工作。

在执行结束后的清理阶段，释放LLVM相关资源。

▲ 图7 GaussDB CodeGen编译执行流程简图

GaussDB使用了阈值codegen_cost_threshold来估算当前查询使用LLVM技术是否能带来收益。如果处理数据的规模大于该阈值后，才会继续使用LLVM技术进行相关处理。该阈值代表行数，也可以理解成处理数据的规模，默认值为100000行，可以调节。

在OLAP场景中，GaussDB在判断是否能够对于一个算子进行CodeGen后（如：数据类型，算子类型判断等），开始生成对应的IR bytecode片段，之后MCJIT模块会调用生成的LLVM Module单元进行执行。

在OLTP场景中，GaussDB则会在Plan Cache场景下结合CodeGen框架，通过缓存机器码的方式，节省下编译生成中间语言IR Func以及优化成机器码的时间，整个过程是异步的。因此，在大量重复查询的场景下，后续的查询也会因为LLVM技术而受益。

另外，为了避免行数估计错误而选择CodeGen导致性能劣化，GaussDB还研发了当前业界独有的异步编译功能，即在查询语句确定要使用CodeGen的时候，将编译工作转交给后台线程，工作线程在JIT函数编译完成前继续使用原始执行逻辑执行，编译完成后，再替换成JIT函数执行。

3. GaussDB LLVM支持加速的场景

支持LLVM的表达式：

行存表达式计算支持的数据类型不受限制。

在向量化执行引擎中，仅当表达式出现在Scan节点的filter、Hash Join节点中的complicate hash condition, hash join filter, hash join target, Nested Loop节点中的filter, join filter, Merge Join节点的merge join filter, merge join target, Group节点中的filter表达式时，才会考虑是否使用LLVM动态编译优化。

在行执行引擎中，除一次性的表达式计算外，会考虑为所有算子的filter和Targetlist表达式都使用LLVM动态编译优化。

支持LLVM的算子：

Join ：HashJoin（仅向量化执行引擎支持）

Agg ：HashAgg

Sort（仅向量化执行引擎支持）

其中，HashJoin算子仅支持Hash Inner Join，对应的hash cond仅支持int4, bigint, bpchar类型的比较；HashAgg算子仅支持针对bigint, numeric类型的sum及avg操作，且group by语句仅支持int4, bigint, bpchar, text, varchar, timestamp类型操作，同时支持count(*)聚集操作。Sort算子仅支持对int4, bigint, numeric, bpchar, text, varchar数据类型的比较操作。除此之外，无法使用LLVM动态编译优化，具体可通过explain performance工具进行显示。

4. GaussDB LLVM使用建议

GUC参数：

enable_codegen：控制LLVM特性的打开和关闭。目前数据库内核侧默认打开。

codegen_cost_threshold：使用处理行数控制是否开启codegen，默认为10000。10000是通过实验验证得出的优化值，不建议将此值设置的过低。

另外，在开启LLVM特性的前提下，建议在允许的条件下尽可能设置较大的work_mem，如果出现大量下盘，则建议关闭LLVM动态编译优化。用户可通过analysis_options为on(LLVM_COMPILE)，执行对应查询语句，在User Define Profiling中就可以看到LLVM的编译时间。结合此数据，可对codegen_cost_threshold进一步调整以获取更好的查询性能。

5. GaussDB LLVM性能表现

GaussDB实验室分别就codegen打开和关闭进行了TPCH性能测试。

▲ 表1 测试环境

测试结果显示，打开codegen时，带有qual的SQL，查询性能都有明显提升，且提升比例与qual在整个SQL中的占比相关，像Q6、Q12、Q19等qual占比较高的查询，性能提升也较多。

▲ 表2 TPCH 部分Query的测试结果

TPCC的性能提升并没有TPCH那么多，但据实验室数据，打开codegen后，tpmC提升了约7%。

PostgreSQL中的LLVM

1. LLVM在PostgreSQL应用的时间线

LLVM在PostgreSQL社区中的技术讨论开始的比较早：

2015年，上文提到的华为在PostgreSQL开发者大会上做的演讲；

2016年，PostgreSQL社区开始对JIT的实现进行了讨论；

2018年，PostgreSQL11中，第一次正式采用LLVM加速表达式计算。

2. PostgreSQL LLVM实现简析

如下图所示，和GaussDB相同，PostgreSQL执行引擎使用CodeGen技术做性能优化。针对表达式求值和元组分解为所需的属性集合两大性能瓶颈，做了可选的编译执行加速。

▲ 图 8 PgSQL LLVM 模块层次图

PostgreSQL使用了三个参数来判断是否使用CodeGen优化：

jit_above_cost，表示超过多少cost 的查询才会使用JIT 功能。默认为100000，如果设置为-1 则关闭JIT。

jit_inline_above_cost，表示超过多少cost 的查询使用JIT 的inline 功能。默认为500000，-1则关闭inline 功能。

jit_optimize_above_cost，表示超过多少cost 的查询使用JIT 的optimization 功能。默认为500000，-1则关闭优化功能。

其中，后两个参数都需要设置得比jit_above_cost大，否则没有意义。这和GaussDB的使用数据集大小来控制是否开启CodeGen思想类似。

另外，PostgreSQL对于LLVM生成的字节码目前无法在plan cache中复用。这个功能的实现在PostgreSQL的中长期计划中。

3. PostgreSQL LLVM支持加速的场景

当前，PostgreSQL的JIT实现支持对表达式计算以及元组拆解的加速。

表达式计算被用来计算WHERE子句、target lists, aggregate聚合和projections投影。通过为每一种情况生成专门的代码来实现加速。

元组拆解是把一个磁盘上的元组转换成其在内存中表示的过程。通过创建一个专门针对该表布局和要被抽取的列数的函数来实现加速。

总结

华为和PostgreSQL关于LLVM特性的研究都起步很早，华为作为LLVM技术应用于数据库先驱者引领了PostgreSQL的技术发展。对于LLVM应用于数据库，GaussDB和PostgreSQL各有实现方法。GaussDB作为企业级数据库，对比PostgreSQL数据库，其实现特性多于PostgreSQL。

“【分享集赞回帖赢好礼】LLVM技术在GaussDB等数据库中的应用”活动来啦！参与就有机会赢取华为背包、华为云定制短袖、蓝牙音箱、书籍等好礼！

活动时间：2024/5/28-6/10

如何参与？

长按识别二维码，即可参与！
点击关注，第一时间了解华为云新鲜技术~
相关阅读:
总结了几个做用户体验设计的原则，分享给需要的朋友
 码农在长沙如何流浪
 linux进阶55——service文件
 deeplearning4j使用vgg19图片向量比对springboot+es环境
 linux下二进制安装docker最新版docker-24.0.6
再谈毕业论文设计投机取巧之IVR自动语音服务系统设计（信息与通信工程专业A+其实不难）
TortoiseSVN 详细操作指南
 【零基础微信小程序】证件照换底色小程序实战开发
 springboot项目做成公共项目
 城市三维地理信息可视化技术解析
原文地址：https://www.cnblogs.com/huaweiyun/p/18228112

LLVM和数据库

LLVM适用场景

LLVM对所有类型的SQL都会有收益吗？

LLVM在OLTP中就一定没有收益吗？

GaussDB中的LLVM

1. LLVM在华为应用于数据库的时间线

2. GaussDB LLVM实现简析

3. GaussDB LLVM支持加速的场景

4. GaussDB LLVM使用建议

5. GaussDB LLVM性能表现

PostgreSQL中的LLVM

1. LLVM在PostgreSQL应用的时间线

2. PostgreSQL LLVM实现简析

3. PostgreSQL LLVM支持加速的场景

总结