当你设计一个数据模型,你应该要注意一个复杂的概念,也就是公式的循环引用。这节中,我们要学习什么是循环引用,以及如何避免。
介绍循环引用概念之前,我们先介绍一些简单的,线性的依赖关系。我们看下如下的计算列。
Product[Profit] = Product[Unit Price] - Product[Unit Cost]
这个计算列依赖同一个表的两个列。这个情况下,我们说Profit列依赖于unit price和unit cost。接着,你要定义一个新的列。例如ProPct,使用的代码如下:
Product[ProfitPct] = Product[Profit] / Product[Unit Price]
可以很简单的看出来,ProfitPct依赖于Profit和Uint Price,因此,当DAX在表中计算计算列的时候。它知道要先计算Profit才能计算ProfitPct,否则,这个函数就不能正确的计算。
线性的依赖关系不是通常我们需要考虑的问题。在DAX内部,当数据模型刷新的时候,DAX会自动检测正确的计算顺序。即使是复杂的,包含很多计算列的数据模型,DAX也会很轻松的解决。
循环引用是当计算中使用循环的时候,发生的一种问题。例如,这样一个简单情况就是,当你稍微修改以下上面的计算公式:
Product[Profit] := Product[ProfitPct] * Product[Unit Price]
因为ProfitPct依赖于Profit,这个新的函数中,Profit依赖了ProfitPct,这样的话,DAX就会拒绝修改函数并且提示一个错误:“A circular dependency was detected”,发现循环引用。
目前为止,我们所学的循环引用都是在函数使用角度来说。我们发现问题总是只基于表达式,而没有注意到表内容。这里还有一种循环引用,它发生的更隐蔽,是只用calculate的时候可能会发生的。我们用一个案例来介绍一下这个场景,我们使用product的一个子集来说明问题,如下图,作为说明问题用我们只加载了Product表,然后移除了模型中的其他表。这个是为了使场景简单话。
我们用一个新的计算列,值使用calculate来计算,来看看循环引用的问题,代码如下:
Product[SumOfUnitPrice] = CALCULATE ( SUM ( Product[Unit
Price] ) )
第一眼看去,这列只有依赖于Unit Price,因为这个是公式中仅有的列。不过,因为我们使用calculate的时候,会把行上下文自动转换为筛选上下文。我们没有和其他表格定义任何关系,也没有给表格定义主键,所以当calculate转换的时候,它会对表格的所有列生成筛选条件。如果我们把calculate函数展开解释,意思就是这样:
对product表的所有列筛选,把具有相同productkey,product name,unit cost,unit price的记录值相加起来。
如果你是这样阅读这个函数,那么很明显,这个代码依赖于product的所有列,因为新生成的筛选上下文会自动过滤表格的所有列,我们在下面的表格中可以看到结果。
你可能还会去定义一个新的计算列,我们使用了类似的函数,也是在这个表中。定义一个newsumofunitprice,代码如下:
Product[NewSumOfUnitPrice] = CALCULATE ( SUM ( Product[Unit
Price] ) )
让人惊奇的是,这次,DAX报了一个错误,说发现了一个循环引用。而这个公式在上一次使用的时候,还是正常工作的。事实上,第二次的时候,情况已经发生了改变,改变的是现在表格中的列。如果我们把newsumofunitprice添加到表个,那么我们得到的意思是这样:
sumofunitprice对product表中 具有和当前行相同的 productkey,productname,unit cost,unit price以及newsumofunitprice的记录的unit price求和。
newsumofunitprice对product表中所和当前行具有相同productkey,productname,unitcost,unitprice和sumofunitprice的行的值进行求和。
计算列和表格中的其他列一样,在使用calculate的时候,都会成为筛选条件的一部分。因此,所有的计算列都会是依赖条件的一部分。如果看了前面的定义,就会明白两列的之前的循环依赖关系,这个就是为什么DAX拒绝新建newsumofunitprice的原因。
要解决这个问题很简单。这里的问题是因为表没有主键,然后其他使用calculate的计算列都建立上下文转换的时候,都会把所有的列考虑进去,包括计算列。但是如果这时候表中有主键,那么情况就会不同。即如果某列是主键,那么所有的使用calculate的计算列,都会依赖于这个主键列,而不是表的所有列。
在product表中,productkey列可以作为主键列。要定义该列为行的标识,可以有两种方式:
可以把productkey列作为关系的一方,定义一个关系。通过这样操作可以使得productkey作为一个唯一值。
可以手动在表格属性中定义,把productkey定义为表格的主键:
这两种方式都会让DAX知道表格有主键。这样的的情况下,我们定义newsumofunitprice列不会出现循环引用的错误,因为两个计算列中的calculate都是依赖于主键。