• BI神器Power Query(25)-- 使用PQ实现表格多列转换(1/3)


    实例需求:原始表格包含多列属性数据,现在需要将不同属性分列展示在不同的行中,att1、att3、att5为一组,att2、att3、att6为另一组,数据如下所示。

    更新表格数据

    原始数据表

    Col1Col2Att1Att2Att3Att4Att5Att6
    AAADDDXOalphadelta100400
    BBBEEEYPbetavega200500

    结果数据表:

    Col1Col2cn1cn3cn3
    AAADDDXalpha100
    AAADDDOdelta400
    BBBEEEYbeta200
    BBBEEEPvega500

    示例代码

    let
        Source = Excel.CurrentWorkbook(){[Name="Table1"]}[Content],
        add_index = Table.AddIndexColumn(Source, "Index", 1, 1, Int64.Type),
        tab1 = Table.RemoveColumns(add_index,{"Att2", "Att4", "Att6"}),
        rename_tab1 = Table.RenameColumns(tab1,{{"Att1", "cn1"}, {"Att3", "cn2"}, {"Att5", "cn3"}}),
        tab2 = Table.RemoveColumns(add_index,{"Att1", "Att3", "Att5"}),
        rename_tab2 = Table.RenameColumns(tab2,{{"Att2", "cn1"}, {"Att4", "cn2"}, {"Att6", "cn3"}}),
        combine_tab = Table.Combine({rename_tab1, rename_tab2}),
        sort_row = Table.Sort(combine_tab,{{"Index", Order.Ascending}}),
        output = Table.RemoveColumns(sort_row,{"Index"})
    in
        output
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    代码解析:
    第2行代码加载源表格,表格名称为Table1。
    第3行代码添加索引列,用于确保输出结果表的数据顺序于原始表保持一致。
    第4行代码移除多余列,保留部分属性列。
    第5行代码重命名属性列名称。
    第6~7行代码功能类似,用于提取第二组属性。
    第8行代码合并两个子表。
    第9行代码按索引列排序。
    第1行代码移除索引列。
    第12行代码输出最终结果表。

    转换结果如下图所示。

    在这里插入图片描述


    部分代码也可以简化为如下,但是处理逻辑与上面代码相同,上述代码分步处理更容易理解。

    let
        Source = Excel.CurrentWorkbook(){[Name="Table1"]}[Content],
        add_index = Table.AddIndexColumn(Source, "Index", 1, 1, Int64.Type),
        combine_tab = Table.Combine({
            Table.RenameColumns(add_index[[Col1],[Col2],[Att1],[Att3],[Att5],[Index]],{{"Att1","cn1"},{"Att3","cn2"},{"Att5","cn3"}}),
            Table.RenameColumns(add_index[[Col1],[Col2],[Att2],[Att4],[Att6],[Index]],{{"Att2","cn1"},{"Att4","cn2"},{"Att6","cn3"}})
            }),
        sort_row = Table.Sort(combine_tab,{{"Index", Order.Ascending}}),
        output = Table.RemoveColumns(sort_row,{"Index"})
    in
        output
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    总结:
    Power Query提供了丰富的表处理功能,可以方便地实现表格列的转换需求。

  • 相关阅读:
    北京筑龙&京东安全:为采购与招标平台筑起“防火墙”
    不同厂商SOC芯片在视频记录仪领域的应用
    单链表的插入删除
    centos安装redis
    Debian中fping应用丢失之重新安装方法
    使用uniapp实现小程序获取wifi并连接
    Java中Map的 entrySet() 详解以及用法(四种遍历map的方式)
    大佬带飞,代码分享不会用?玩转Git,跟上大佬节奏!
    git设置代理
    华为云云耀云服务器L实例评测|部署war格式的web项目
  • 原文地址:https://blog.csdn.net/taller_2000/article/details/133476806