• SQL数据迁移实战:从产品层级信息到AB测试表


    创建表

    首先,代码中定义了两个表格:dim_prod_hierarchy_info 和 app_abtest_product_info,都位于 test 数据库中。

    • dim_prod_hierarchy_info 表用于存储产品层级信息,有三列:hier_node_level_1_name, hier_node_level_2_name, hier_node_level_3_name。这些列分别存储产品的不同层级名称。
    • app_abtest_product_info 表用于存储产品信息,也有三列:prod_level_1, prod_level_2, prod_level_3,与第一个表的列功能类似。

    sql:

    CREATE TABLE test.dim_prod_hierarchy_info (
        hier_node_level_1_name VARCHAR(255),
        hier_node_level_2_name VARCHAR(255),
        hier_node_level_3_name VARCHAR(255)
    );
    
    CREATE TABLE test.app_abtest_product_info (
        prod_level_1 VARCHAR(255),
        prod_level_2 VARCHAR(255),
        prod_level_3 VARCHAR(255)
    );
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    插入数据

    接着,代码通过 INSERT INTO 语句向 dim_prod_hierarchy_info 表中插入了几行数据。这些数据代表不同类别的产品及其层级。

    代码如下:

    INSERT INTO test.dim_prod_hierarchy_info (hier_node_level_1_name, hier_node_level_2_name, hier_node_level_3_name) VALUES
    ('SmartPhone', 'Galaxy S21', 'S21 Ultra'),
    ('Tablet', 'Galaxy Tab', 'Tab S7'),
    ('SmartWatch', 'Galaxy Watch', 'Watch 3'),
    ('Earbuds', 'Galaxy Buds', 'Buds Live');
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    清空数据表

    在向 app_abtest_product_info 表插入数据之前,代码使用 DELETE FROM 语句删除了该表中的所有现有数据。这确保了表中没有旧数据。

    DELETE FROM test.app_abtest_product_info WHERE 1=1;
    
    • 1

    数据迁移和筛选

    最后,使用 INSERT INTO … SELECT 语句,从 dim_prod_hierarchy_info 表中选取特定的数据行,并将这些数据插入到 app_abtest_product_info 表中。这个查询只选择那些符合特定条件的行:hier_node_level_1_name 字段必须是预定义的产品类别之一,且 hier_node_level_3_name 不能为空。

    INSERT INTO test.app_abtest_product_info(prod_level_1, prod_level_2, prod_level_3)
    SELECT hier_node_level_1_name, hier_node_level_2_name, hier_node_level_3_name
    FROM test.dim_prod_hierarchy_info
    WHERE hier_node_level_1_name IN ('SmartPhone', 'Tablet', 'SmartWatch', 'Earbuds')
       AND hier_node_level_3_name IS NOT NULL
    GROUP BY hier_node_level_1_name, hier_node_level_2_name, hier_node_level_3_name;
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    查询数据

    最后,使用一个简单的 SELECT * FROM 查询来查看 dim_prod_hierarchy_info 表中的数据。

    代码如下:

    SELECT * FROM test.dim_prod_hierarchy_info;
    
    • 1

    结论

    通过这个示例,用户可以学习如何创建和操作SQL表,包括如何插入、删除和迁移数据。这是数据库管理和数据分析中的一个重要技能,可以应用于各种实际场景。

  • 相关阅读:
    flowable工作流所有业务概念
    前端js读取本地md或txt文件内容
    学会用数据分析汇报工作,升职加薪指日可待
    javascript IP地址正则表达式
    构建应用程序的低代码思路
    Java开发中List数据量大,需要分片批次处理
    VSCode开发go手记
    一个包搞定中文数据集: datasetstore
    jmeter教程系列(22)造数据
    【Python】Labelme/PIL读取图片朝向错误解决
  • 原文地址:https://blog.csdn.net/weixin_46211269/article/details/134533992