在导入外部数据源后,有时候根据数据分析的需要,需增加辅助列,便于后续数据建模使用
Power Query中添加列有添加自定义列、条件列、索引列和重复列形式
添加列操作的位置选项:【添加列】
自定义列是通过公式创建新列
例如,根据价格列和数量列,通过自定义列公式,创建新列"销售额"
数据源(部分截图)
创建新列"销售额"具体操作步骤如下所示
步骤1:将数据源导入到Power BI Desktop,单击【转换数据】选项,进入Power Query查询编辑器界面
步骤2:点击【添加列】|【自定义列】指令,弹出自定义列命令窗口,将新列名取名为"销售额",自定义列公式下,直接单击右边的字段名,将其插入添加到公式中,如下图所示,当左下角显示"未检测到语法错误"时,表示操作正确,单击【确定】按钮
最终自定义新增列"销售额"呈现结果如下所示
按照某条件创建新列,类似于Excel或者Mysql中的IF函数
练习案例
数据源(部分截图)
单击【添加列】|【条件列】指令,在弹出的命令窗口中输入指定条件,例如根据销售额,如果大于或等于200,则返回"达标",否则返回"不达标"
最终呈现结果如下所示
索引列是包含不重复数字的列,通过为每行增加一个序号,记录每一行所在的位置(可理解为Mysql中设置的主键id)
索引列可以选择从0或者1开始
练习案例
数据源
问题:新增索引列,按照索引号作为排序依据对月份字段列进行排序
具体操作步骤如下所示
步骤1:将"月份"字段中的日期值进行处理,结果如下所示
步骤2:点击"月份"列,选择【添加列】|【索引项】|【从1】指令,将索引字段名改为"月份排序依据",结果如下所示
有时为了分析的需要,需复制现有的列,并对复制后的列进行操作处理
例如:复制包含日期列并让该列只显示日期中的年份或月份
数据源
点击"日期"列,选择【添加列】|【重复列】指令即可复制列,复制后的列位于数据区域的最右侧,其字段标题中带有"复制"两字(双击字段标题可以修改字段名字)