[PowerBI]用DAX完成简单线性回归

12月追加:欢迎加入知乎【微软BI技术圈】,一起讨论、分享包括PowerBI在内的一切BI话题!

[PowerBI]用DAX完成简单线性回归_第1张图片
简单线性回归的方法:
只需要一个度量值就可以完成简单线性回归:

要让下面代码适用于你的模型,只需要把对应的字段/度量值
替换为你自己模型的字段/度量值:
Simple linear regression =
VAR Known =
    FILTER (
        SELECTCOLUMNS (
            ALLSELECTED ( Table[Column] ), 
            #这里替换成包含你需要的类别值的字段引用
            "Known[X]", [Measure X], 
            #这里替换成你的线性模型自变量
            "Known[Y]", [Measure Y], 
            #这里替换成你的线性模型因变量
        ),
        AND (
            NOT ( ISBLANK ( Known[X] ) ),
            NOT ( ISBLANK ( Known[Y] ) )
        )
    )
VAR Count_Items =
    COUNTROWS ( Known )
VAR Sum_X =
    SUMX ( Known, Known[X] )
VAR Sum_X2 =
    SUMX ( Known, Known[X] ^ 2 )
VAR Sum_Y =
    SUMX ( Known, Known[Y] )
VAR Sum_XY =
    SUMX ( Known, Known[X] * Known[Y] )
VAR Average_X =
    AVERAGEX ( Known, Known[X] )
VAR Average_Y =
    AVERAGEX ( Known, Known[Y] )
VAR Slope =
    DIVIDE (
        Count_Items * Sum_XY - Sum_X * Sum_Y,
        Count_Items * Sum_X2 - Sum_X ^ 2
    )
VAR Intercept =
    Average_Y - Slope * Average_X
RETURN
    Intercept + Slope * [Measure X]

另一种线性回归方法:
(注:实际上这一种方法和前法相同,只不过此方法是针对于时间序列的)

Simple linear regression =
VAR Known =
    FILTER (
        SELECTCOLUMNS (
            ALLSELECTED ( 'Date'[Date] ), 
            "Known[X]", 'Date'[Date],
            "Known[Y]", [Measure Y]
        ),
        AND (
            NOT ( ISBLANK ( Known[X] ) ),
            NOT ( ISBLANK ( Known[Y] ) )
        )
    )
VAR Count_Items =
    COUNTROWS ( Known )
VAR Sum_X =
    SUMX ( Known, Known[X] )
VAR Sum_X2 =
    SUMX ( Known, Known[X] ^ 2 )
VAR Sum_Y =
    SUMX ( Known, Known[Y] )
VAR Sum_XY =
    SUMX ( Known, Known[X] * Known[Y] )
VAR Average_X =
    AVERAGEX ( Known, Known[X] )
VAR Average_Y =
    AVERAGEX ( Known, Known[Y] )
VAR Slope =
    DIVIDE (
        Count_Items * Sum_XY - Sum_X * Sum_Y,
        Count_Items * Sum_X2 - Sum_X ^ 2
    )
VAR Intercept =
    Average_Y - Slope * Average_X
RETURN
    SUMX (
        DISTINCT ( 'Date'[Date] ),
        Intercept + Slope * 'Date'[Date]
    )

需要注意的是,要在总计级别上显示正确的金额,还需要修改RETURN表达式。在体现销售数据的情况下,使用SUMX是合适的;但如果您处理的是类似温度的数据,使用Averagex()也许更加合适。
然后你可以完成下面的图表:
[PowerBI]用DAX完成简单线性回归_第2张图片
红线看起来很像趋势线,不是吗?事实上,如果在图表中添加趋势线,它将与红线完全相同:
[PowerBI]用DAX完成简单线性回归_第3张图片
至于为何要计算趋势线,有以下两种考量:

1.使用内置趋势线,只能从Y轴推断其值,而计算出的趋势线允许您显式地查看值。
2.Power BI只允许为数字或日期时间轴添加趋势线(截至2017年9月)。一旦使用字符串(例如月份名称),就失去了添加趋势线的能力。通过简单的线性回归,你可以自己计算它们,只要你有连续的数值作为已知的x值

(注:本文原本做为原创文,但Daniil早在2017年即发表了该主题的博客,并且代码更加简洁易用,因此弃用了自己的代码。此外他还写了很多其他有趣的博客,有很多PowerBI实用的技巧,可以点击这里查看他的博文。)

你可能感兴趣的:(PowerBI,DAX)