【转载】PowerQuery中的筛选误区

无意中看到这篇博文,豁然开朗。虽然是一个很小的点,但实际应用中很容易就犯同样的错误,故而根据作者的思路,做了一个练习,并有一点新补充,记录如下。
假设有这样一个数据列:

【转载】PowerQuery中的筛选误区_第1张图片
column_to_be_filtered.png

我要筛选所有区局单位。很直观的做法是像下图这样:


【转载】PowerQuery中的筛选误区_第2张图片
filtered_column.png

这样并没什么错。确定后检查PowerQuery代码,发现如下:

  = Table.SelectRows(重命名的列, each ([单位] <> "京烟零售" and [单位] <> "北京市局(公司)" and [单位] <> "物流中心" and [单位] <> "营销中心" and [单位] <> "通大物业" and [单位] <> "金健恒通"))

对这一次处理来说,这并没有什么不妥。但是,这样做的问题在于,将来原始数据更新后,我们无法确保新增的不包含“区局”二字的记录被剔除出来,那么,最后筛选出来的结果中就会混入其他不含“区局”二字的单位。这会导致难以觉察的错误。
和该博文给出的实例对照,可以发现这类筛选错误有两种情形:一是筛选的结果不包含新增数据中符合要求的结果(原博文),二是筛选结果无法排除新增数据中不符合要求的结果(本文)。
因此正确的做法应该是通过“文本包含”来筛选:

【转载】PowerQuery中的筛选误区_第3张图片
$RO1840H.png
【转载】PowerQuery中的筛选误区_第4张图片
textcontain_filter.png

代码如下:

= Table.SelectRows(删除的列1, each Text.Contains([组织机构名称.2], "区局"))

这样做的好处是,当原始数据刷新后,新增的区局单位被筛选出来的同时,不会混入其他非区局单位。

你可能感兴趣的:(【转载】PowerQuery中的筛选误区)