• SQLite的DBSTAT 虚拟表(三十六)


    返回:SQLite—系列文章目录   

    上一篇:SQLite运行时可加载扩展(三十五)

    下一篇:SQLite—系列文章目录   

    1. 概述

    DBSTAT 虚拟表是一个只读的同名虚拟表,返回 有关用于存储内容的磁盘空间量的信息 的 SQLite 数据库。 示例用例 DBSTAT 虚拟表包括 sqlite3_analyzer.exe 实用程序和表大小饼图 Fossil 实现的版本控制系统 对于 SQLite。

    当使用 SQLITE_ENABLE_DBSTAT_VTAB 编译时选项构建 SQLite 时,DBSTAT 虚拟表在所有数据库连接上都可用。

    DBSTAT 虚拟表是同名的虚拟表,意思是 运行 CREATE VIRTUAL TABLE 以创建 dbstat 虚拟表的实例,然后再使用它。“dbstat” 模块名称可以像表名一样使用,以查询 dbstat 虚拟表。例如:

    SELECT * FROM dbstat;

    如果需要使用 dbstat 模块的命名虚拟表, 然后是创建 dbstat 实例的推荐方法 虚拟表如下:

    CREATE VIRTUAL TABLE temp.stat USING dbstat(main);

    请注意虚拟表名称 (“stat”) 之前的 “temp.” 限定符。这 限定符使虚拟表是临时的 - 仅存在 当前数据库连接的持续时间。这是 推荐的方法。

    dbstat 的“main”参数是默认模式 为此提供信息。默认值为“main”,并且 因此,在上面的例子中使用“main”是多余的。对于任何 特定查询,则可以通过指定 作为虚拟表的函数参数的替代架构 name 在查询的 FROM 子句中。(有关详细信息,请参阅 FROM 子句中对表值函数的进一步讨论。

    DBSTAT 虚拟表的架构如下所示:

    1. CREATE TABLE dbstat(
    2. name TEXT, -- Name of table or index
    3. path TEXT, -- Path to page from root
    4. pageno INTEGER, -- Page number, or page count
    5. pagetype TEXT, -- 'internal', 'leaf', 'overflow', or NULL
    6. ncell INTEGER, -- Cells on page (0 for overflow pages)
    7. payload INTEGER, -- Bytes of payload on this page or btree
    8. unused INTEGER, -- Bytes of unused space on this page or btree
    9. mx_payload INTEGER, -- Largest payload size of all cells on this row
    10. pgoffset INTEGER, -- Byte offset of the page in the database file
    11. pgsize INTEGER, -- Size of the page, in bytes
    12. schema TEXT HIDDEN, -- Database schema being analyzed
    13. aggregate BOOL HIDDEN -- True to enable aggregate mode
    14. );

    DBSTAT 表仅报告数据库文件中 btree 的内容。 自由列表页面、指针映射页面和锁定页面被省略 分析。

    默认情况下,DBSTAT 表中每个 DBSTAT 都有一行 btree 页面数据库文件。每行提供 有关该页的空间利用率的信息 数据库。但是,如果隐藏列“aggregate”为 TRUE,则 结果是聚合的,并且 DBSTAT 表中只有一行 对于数据库中的每个 btree,提供有关空间的信息 整个 btree 的利用率。

    2. dbstat 虚拟表的 “path” 列

    “path”列描述了从 btree 结构的根节点添加到每个页面。这 根节点本身的“路径”是“/”。 当“aggregate”为 TRUE 时,“path”为 NULL。 根目录最左边子页面的“路径” btree 页面为 '/000/'。(Btrees 存储内容从左到右的顺序 因此,左边的页面比右边的页面具有更小的键。 根页最左边的子项是 '/001',依此类推, 每个同级页面都由 3 位十六进制值标识。 第 451 个最左边的兄弟姐妹的孩子有这样的路径 如 '/1C2/000/, '/1C2/001/' 等。 溢出页面通过附加“+”字符和 六位十六进制值到它们所链接的单元格的路径 从。例如,链中的三个溢出页面链接自 识别根页的第 450 个子页面的最左边单元格 通过路径:

    '/1c2/000+000000'         // First page in overflow chain
    '/1c2/000+000001'         // Second page in overflow chain
    '/1c2/000+000002'         // Third page in overflow chain
    

    如果使用 BINARY 排序规则序列对路径进行排序,则 与单元格关联的溢出页面将出现在 排序顺序,而不是其子页面:

    '/1c2/000/'               // Left-most child of 451st child of root
    

    3. 汇总数据

    从 SQLite 版本 3.31.0 (2020-01-22) 开始,DBSTAT 表 有一个名为“aggregate”的新隐藏列,如果将其约束为 TRUE 将导致 DBSTAT 在数据库中为每个 b tree 生成一行, 而不是每页一行。在聚合模式下运行时, “path”、“pagetype” 和 “pgoffset” 列始终为 NULL,并且 “pageno”列保存整个 btree 中的页数,而不是 比与行对应的页码。

    下表显示了 (非隐藏) 列的含义 正常模式和聚合模式下的 DBSTAT:

    正常含义聚合模式含义
    名字实现的表或索引的名称 当前行的 btree
    路径请参阅上面的描述始终为 NULL
    页码当前行的数据库页的页码当前行的 btree 中的总页数
    页面类型“叶子”或“内部”始终为 NULL
    ncell(英语:ncell)当前页面或 btree 上的单元格数
    有效载荷当前页面或 btree 上有用有效负载的字节数
    闲置当前页面或 btree 上未使用的字节
    mx_payload在当前页面中任意位置找到的最大有效负载 或 btree。
    pgoffset到页面开头的字节偏移量始终为 NULL
    pgsize的当前页面或 btree 使用的总存储空间。

    4. dbstat 虚拟表的示例用法

    要查找用于在模式“aux1”中存储表“xyz”的总页数, 使用以下两种查询之一(第一种是传统方式, 第二个显示了聚合特征的使用):

    1. SELECT count(*) FROM dbstat('aux1') WHERE name='xyz';
    2. SELECT pageno FROM dbstat('aux1',1) WHERE name='xyz';

    要查看表内容在磁盘上的存储效率, 计算用于保存实际内容的空间量 按已用磁盘空间的总量。这个数字越接近 是100%,包装效率越高。(在此示例中, 假定“xyz”表位于“main”模式中。同样,那里 是两个不同的版本,显示了 DBSTAT 的使用,两者都没有 和新的聚合功能。

    1. SELECT sum(pgsize-unused)*100.0/sum(pgsize) FROM dbstat WHERE name='xyz';
    2. SELECT (pgsize-unused)*100.0/pgsize FROM dbstat
    3. WHERE name='xyz' AND aggregate=TRUE;

    若要查找表的平均扇出,请运行:

    SELECT avg(ncell) FROM dbstat WHERE name='xyz' AND pagetype='internal';

    当磁盘访问是顺序的时,现代文件系统的运行速度更快。 因此,如果数据库文件的内容,SQLite 将运行得更快 位于连续页面上。找出页面的比例 数据库是连续的(因此获得可能 在确定何时进行 VACUUM 时很有用),运行如下所示的查询:

    1. CREATE TEMP TABLE s(rowid INTEGER PRIMARY KEY, pageno INT);
    2. INSERT INTO s(pageno) SELECT pageno FROM dbstat ORDER BY path;
    3. SELECT sum(s1.pageno+1==s2.pageno)*1.0/count(*)
    4. FROM s AS s1, s AS s2
    5. WHERE s1.rowid+1=s2.rowid;
    6. DROP TABLE s;

  • 相关阅读:
    编译原理—x86汇编指令
    每天一个数据分析题(三百九十二)- 多元线性回归
    服务器端口,服务器远程端口修改操作
    解决高并发问题不只有分布式
    Java中的static关键字
    springboot集成redis
    【C++ techniques】让函数根据一个以上的对象类型来决定如何虚化
    LayaBox---知识点
    实战教程:如何在API监控中实现高效报警和通知
    Codeforces Round #836 (Div. 2)
  • 原文地址:https://blog.csdn.net/lyfwwb/article/details/138088959