在PowerQuery中,我们经常需要动态改变一列的值。我知道的有两种情形:
1.在不涉及表格中的其他列的情况下改变列值;
2.基于表格的其他列的值,动态改变列值。
而常见的方法也有两种:
1.通过新增列来实现改变列值,这是最直观的方法。很容易通过UI就完成任务了。缺点是新增了列,可能还需要删除不需要的列。
2.通过列变换来实现改变列值,而不需要新增列。
由于通过新增列改变列值的方法最简单最直观,因此不作演示。
本文主要罗列几种不需要新增列就能改变列值的方法。这些方法都不是我原创,不过可能加入了一点我自己的思考。
示例表格如下:
要求将性别(必填项)的值变为性别列对应的值,同时保留两行并不增加新的行。
方法一:Table.ReplaceValue()替换
= Table.ReplaceValue(源,each [#"性别(必填项)"],each [性别],Replacer.ReplaceValue,{"性别(必填项)"})
方法二:Table.FromRecords()结合Table.TransformRows()和Record.TransformFields()
Table.FromRecords(Table.TransformRows(源,(row)=>Record.TransformFields(row,{"性别(必填项)", each row[性别]})))
这两种方法均来源于:https://bondarenkoivan.wordpress.com/2016/12/12/transform-column-using-custom-function-in-power-query-part-2/#more-1033
其中方法二来源于正文,方法一来源于该文读者的评论。我将方法一排列在前面,是因为我认为方法一最简洁。
这里我杀个回马枪,当我们想到列变换的时候,脑子里首先想到的是Table.TransformColumns()函数,为什么不用它来实现动态变换呢?
事实上Table.TransformColumns()函数确实能解决大部分列变换的问题,但是它唯独搞不定要动态引用其他列对应值来进行相关计算的问题。这也是为什么来源作者IVAN BONDARENKO丝毫没有提及这个函数的缘故。
在PowerBI社区中,MarcelBeug提到,“With Table.TransformColumns, it is not possible to reference other columns.我之前不知道有这个缘故,套用Table.AddColumn()的方法,引用列名:
= Table.TransformColumns(设置性别,{"性别(必填项)",each [性别]})
总是提示“Expression.Error: 无法对类型 Text 应用字段访问”的错误。
那为什么方法一的Table.ReplaceValue()却可以引用列名呢?奥秘就在微软官方对这两个函数的官方解释上。
Table.ReplaceValue()的官方解释是:
Table.ReplaceValue(table as table, oldValue as any, newValue as any,replacer as function, columnsToSearch as {Text}) as table
Table.TransformColumns()的官方解释是:
Table.TransformColumns(table as table, transformOperations as list, optional defaultTransformation as nullable function, optional missingField as nullable number) as table
可以看到Table.ReplaceValue()的两个参数都是“any”类型,而Table.TransformColumns()的主要参数是“list”。那我能不能猜想,凡是参数是“any”类型,就可以自由引用列名,如果不是就不能呢?
我找到了Table.FirstN(),可选参数的type是“any”:
Table.FirstN( table as table, optional countOrCondition as any) as table
我测试引用列名:
= Table.FirstN(设置性别,each [性别]="女")
结果如下:
所以我推测如下:如果函数参数type是“any”,就可以自由引用列的内容。