[ruby on rails] postgres sql explain 优化

[ruby on rails] postgres sql explain 优化
一、查看执行计划
```
sql = User.all.to_sql
# 不会实际执行查询
puts ActiveRecord::Base.connection.explain(sql)

# 会实际执行查询，再列出计划
User.all.explain

# 会实际执行查询，再列出计划
ActiveRecord::Base.connection.execute('EXPLAIN (ANALYZE, VERBOSE, BUFFERS, FORMAT TEXT) '+ sql).each { |a| pp a } # FORMAT { TEXT | XML | JSON | YAML }

# 常用
ActiveRecord::Base.connection.execute('EXPLAIN (ANALYZE) '+ sql).each { |a| p a } 
1
2
3
4
5
6
7
8
9
10
11
12
```
EXPLAIN 中可以带的参数很多，以下一些比较常用：
Analyze 实际上你要实际运行SQL 并给出实际执行的结果
Verbose 将信息更加详细，括计划树中每个节点的输出列列表、模式限定表和函数名
Buffers 给出语句到底是读取数据的路径是磁盘还是内存以及多少块被涉及，shared hit 命中缓存数，read IO读取数
另外timming costs 等都是默认打开的。

注意：
在加上 ANALYZE 选项后，会真正执行实际的 SQL，如果 SQL 语句是一个插入、删除、更新或 CREATE TABLE AS 语句，这些语句会修改数据库。为了不影响实际的数据，可以把 EXPLAIN ANALYZE 放到一个事务中，执行完后回滚事务，如下：
```
BEGIN;
EXPLAIN ANALYZE ...;
ROLLBACK;
1
2
3
```
节点是从下往上看，上一级节点的成本，是包含了下一级的成本的
```
pry(#)> ActiveRecord::Base.connection.execute('EXPLAIN ANALYZE '+ sql).each { |a| pp a }
   (4.9ms)  EXPLAIN ANALYZE SELECT "users".* FROM "users"
{"QUERY PLAN"=>
  "Seq Scan on users  (cost=0.00..67.63 rows=1463 width=587) (actual time=0.056..2.063 rows=1463 loops=1)"}
{"QUERY PLAN"=>"Planning Time: 0.409 ms"}  # 执行计划耗时
{"QUERY PLAN"=>"Execution Time: 2.207 ms"}  # 实际执行耗时
1
2
3
4
5
6
```
二、解释
- cost=0.00…67.63 rows=1463 width=587, 左到右：
1. 预计启动成本。这是输出阶段开始之前所花费的时间，也就是返回第一行需要多少 cost 值，例如，在排序节点中进行排序的时间。
2. 预计总成本。这是基于计划节点运行完成的假设，即检索所有可用行。实际上，节点的父节点可能无法读取所有可用行（请参见LIMIT下面的示例）。
3. rows 该计划节点输出的估计行数。同样，假设该节点已运行完成。
4. width 该计划节点输出的行的估计平均宽度（以字节为单位）。
5. buffers
  shared hit：表示在共享内存中直接读到 xxx 个块，
  read：表示从磁盘读了 xxx 块
  written：写磁盘工 xxx 块
  .
  默认 cost 值如下
  顺序扫描一个数据块，cost 值定为 1
  随机扫描一个数据块，cost 值定为 4
  处理一个数据行的 CPU，cost 为 0.01
  处理一个索引行的 CPU，cost 为 0.005
  每个操作符的 CPU 代价为 0.0025
注意： "actual time"数值是以真实时间的毫秒来计算的，而"cost"预估值是以磁盘页面读取数量来计算的，所以它们很可能是不一致的。

三、解释

 1. Bitmap Scan
- Bitmap Scan 扫描的出现是基于获取的数据在 INDEX SCAN 中的问题点而产生的一个数据的获取的方式，在INDEX SCAN 中获取到数据的位置后，还是需要到对应的数据页面中，在扫描到对应的数据，而BITMAP SCAN 就是要解决数据通过索引定位后，在去原数据页面定位的问题，解决最后一公里的问题。
- 所以通过位图来获取数据的方式，速度更快，当然相对的付出的成本也更多一些。
2. Bitmap Index Scan 与Bitmap Heap Scan

BitmapIndex Scan 与Index Scan 很相似，都是基于索引的扫描，但是BitmapIndex Scan 节点每次执行返回的是一个位图而不是一个元组，其中位图中每位代表了一个扫描到的数据块。而BitmapHeap Scan一般会作为BitmapIndex Scan 的父节点，将BitmapIndex Scan 返回的位图转换为对应的元组。这样做最大的好处就是把Index Scan 的随机读转换成了按照数据块的物理顺序读取，在数据量比较大的时候，这会大大提升扫描的性能。

2. 大多数情况下， Index Only Scan < Index Scan < Bitmap Scan < Seq Scan
- Index Scan 要比 Seq Scan 快。但是如果获取的结果集占所有数据的比重很大时，这时Index Scan 因为要先扫描索引再读表数据反而不如直接全表扫描来的快。
- 如果获取的结果集的占比比较小，但是元组数很多时，可能Bitmap Index Scan 的性能要比Index Scan 好。
- 如果获取的结果集能够被索引覆盖，则Index Only Scan 因为不用去读数据，只扫描索引，性能一般最好。但是如果VM 文件未生成，可能性能就会比Index Scan 要差。
四、解读例子：

四、其他
- Seq Scan：全表扫描无启动时间
- Index Scan：索引扫描
- Bitmap Index Scan 位图索引扫描
- Bitmap Heap Scan：位图索引扫描
- Subquery Scan 子查询无启动时间
- Tid Scan ctid = …条件无启动时间
- Function Scan 函数扫描无启动时间
- Nested Loop 循环结合无启动时间
- Merge Join 合并结合有启动时间
- Hash Join 哈希结合有启动时间
- Sort 排序，ORDER BY操作有启动时间
- Hash 哈希运算有启动时间
- Result 函数扫描，和具体的表无关无启动时间
- Unique DISTINCT，UNION操作有启动时间
- Limit LIMIT，OFFSET操作有启动时间
- Aggregate count, sum,avg, stddev集约函数有启动时间
- Group GROUP BY分组操作有启动时间
- Append UNION操作无启动时间
- Materialize 子查询有启动时间
- Filter：条件过滤
- Nestloop Join：嵌套循环连接，是在两个表做连接时，内表被外表驱动，外表返回的每一行都要在内表中检索找到与它匹配的行，因此整个查询返回的结果集不能太大，要把返回子集较小的表作为外表，而且在内表的连接字段上要有索引，否则会很慢。执行过程：
  
  1.确定一个驱动表（outer table），另一个表为 inner table
  2. 驱动表中的每一行与 inner 表中的相应记录 JOIN 类似一个嵌套的循环
- Hash Join：使用两个表中较小的表，并利用连接键在内存中建立散列表，然后扫描较大的表并探测散列表，找出与散列表匹配的行。适用于较小的表可以完全放入内存中的情况。如果表很大，不能完全放入内存，优化器会将它分割成若干不同的分区，把不能放入内存的部分写入磁盘的临时段。
- Merge Join：如果源数据上有索引，或者结果已经被排过序，在执行排序合并连接时就不需要排序了，Merge Join 的性能会优于散列连接。
  执行计划运算类型操作说明是否有启动时间
相关阅读:
【云原生之Docker实战】使用Docker部署Piwigo图片管理服务器
 C语言：把整数123改成字符串123
对知识蒸馏的一些理解
 人工智能Linux基础命令
 44特征02—— 对角化：相似对角化的条件
 wallys/IPQ8074A 4x4 2.4G 8x8 5G 802.11ax
LLVM系列第二十八章：写一个JIT Hello World
【RocketMQ 九】mqadmin命令
 GDB常用指令与调试汇总
 C#设计模式---工厂方法模式
原文地址：https://blog.csdn.net/qq_41037744/article/details/133394419

一、查看执行计划

二、解释

三、解释

1. Bitmap Scan

2. Bitmap Index Scan 与Bitmap Heap Scan

2. 大多数情况下， Index Only Scan < Index Scan < Bitmap Scan < Seq Scan

四、解读例子：

四、 其他

四、其他