DAX学习笔记

一、什么是DAX

DAX是SSAS(sql server as service)和power pivot for excel的编程语言,于2010年发布。

DAX被设计用于计算基于数据模型的业务函数。

二、DAX与SQL的差别

1)SQL中表之间尽管定义了主外键关系,但是查询时必须显式指定join关系。

      DAX则不需要指定,表之间的关系是DAX数据模型的一部分,并且这个关系只能是left outer join.

     例如:select Customers.CustomerName,sum(Sales.SalesAmount) as SumOfSales

                from sales inner join on Sales.CustomerKey = Customers.CustomerKey

                group by Customers.CusTomerName

      等价的DAX:

                ECALUATE

                SUMMARIZE(

                         Sales,                 

                         Customers[CustomerName],

                         ”SumOfSales”,

                         SUM(Sales[SalesAmount])

                 )

 2) SQL是一种声明式语言,你只需要声明需要什么样的数据集合,而不需要关心引擎是如何获取这些数据。

     DAX是一种函数语言。DAX的所有表达式都是函数调用,一个函数的参数也可以是另外一个函数调用。

     在SQL中的WHERE对应DAX中的FILTER函数,二者功能类似。(DAX的抽象层次更低一些,更贴近计算过程。)

             例如:

              select Customers.CustomerName,sum(Sales.SalesAmount) as SumOfSales

                from sales inner join on Sales.CustomerKey = Customers.CustomerKey

               where Customers.Continent = ‘Europe' 

               group by Customers.CusTomerName


             等价的DAX:


              ECALUATE

                SUMMARIZE(

                         FILTER(Customers,Customers[Continent] = “Europe"), 

                         Customers[CustomerName],

                       ”SumOfSales”,

                        SUM(Sales[SalesAmount])

                 )

 3)SQL语言中,对查询语言和编程语言有清晰的区分。例如存储过程就是作为基于SQL的一种编程语言。但是DAX并不区分编程语言和查询语言,它只是一个丰富的函数集合,操作物理表然后输出物理表。因此DAX比SQL要更简单一些。

4)SQL中的子查询是一种非常强大的功能,DAX也有类似机制,而且比SQL表达跟自然和简洁。

      例如:

             select * from

                (

               select Customers.CustomerName,sum(Sales.SalesAmount) as SumOfSales

                from sales inner join on Sales.CustomerKey = Customers.CustomerKey

               where Customers.Continent = ‘Europe' 

               group by Customers.CusTomerName

                )

              where SumOfSales > 100

      等价的DAX:


              EVALULATE

              FILTER(

                SUMMARIZE(

                         FILTER(Customers,Customers[Continent] = “Europe"), 

                         Customers[CustomerName],

                       ”SumOfSales”,

                        SUM(Sales[SalesAmount])

                 ),

                 [SumOfSales] > 100

             )

三、DAX基本语法

3.1 DAX的数据类型:


实际开发中,可能并不需要太关注这些类型,因为DAX支持隐式转换,而且比一般的SQL隐式转换强大。例如 Sales[Order Date]+7  这种在SQL中是一定要用函数实现的,但是DAX可以识别为是Order Date字段日期往后加7天。

    例1:  = 5 & 4

    例2:  = ”5“ + ”4“



虽然DAX的隐式转换很强大,但是跟SQL一样,通常不建议在可以明确的场景下依赖隐式转换,因为可能会导致不符合预期的转换错误。

3.2 DAX的操作符


3.3 计算字段与度量

在DAX中,计算字段是一个字段表达式,表达单行计算的语义。而度量也是一个字段表达式,但是表达的是行间汇总计算的语义。

     例1: sales[SalesAmount] - sales[TotalProductCost]  是一个计算字段

     例2: sum(sales[SalesAmount]) - sum(sales[TotalProductCost] ) 是一个度量

四、DAX常用函数

函数分类:



五、DAX表达式

DAX的表达式分为两类:scalar expression 和 table expression

所谓scalar expression, 一般只返回一个String或number类型的单值。

 例如: = 4+3   

             = sum(Sales[Quantity])

             = countrows(Filter(sales,sales[unit price]))

而table expression则输出的是一个二维表。

 例如: = Filter(sales,sales[unit price])

DAX的语法全集是

[ DEFINE { MEASURE [] = } ]

EVALUATE

 

[ ORDER BY { [ { ASC | DESC } ] } [ , …]  

     [START AT {|} [,…]]

]

六、计算上下文

filter context: 可以理解为是一组表,每张表只有一列,该列包含该列可以显示的值。

一个filter是某一列上的一组值。

一个filter总是只作用于单一列。

七、常用函数

values : 

[NumOfCustomers] = COUNTROWS( VALUES( Sales[CustomerKey] ) )

HASONEVALUE :

检测是否表达式只返回一个值

例:[ScaledSalesAmount] := IF ( HASONEVALUE ( Scala[ DivideBy] ),

                                                        DIVIDE ( [ Sales Amount ] , VALUES ( Scale[ DivideBy ] )),

                                                        [ Sales Amount ]

                                                      )

CALCULATE:

[ Measure ] := CALCULATE ( Expression, Condition1 , Condition2 ,…)

本函数是唯一可以修改filter context的函数。

它接收两类条件输入,一类是值列表(table expression),一类是布尔表达式。

实际上第二类也会被转化为第一类。

例如:


会被转化为:


案例:

目标表格


错误的写法和结果:



正确的写法:


案例2:


结果:


如果Filter中加ALL,是不是跟CALCULATE表达式等价呢?

结果是:


并不等价,因为ALL会把外部的所有列的过滤条件都清除了。

这就需要另外一个函数,CALCULATETABLE。

CALCULATETABLE与CALCULATE的差别在于返回值,前者返回table,后者返回单元格。


结果是:

简化的写法:



CALCULATE函数的Context转换

我们知道CALCULATE函数可以接收外部的row context,这是一个非常有用的特性。例如:



可以看到CALCULATE函数过滤了Product name,而单纯的sum函数始终输出的是总和。

原理是,CALCULATE函数可以把外部的row context转化为等价的filter context,然后作用于内部计算。

如果是measure则计算时会自动加上CALCULATE,行为跟显式加CALCULATE是一致的。

例如下面两种写法是等价的:


你可能感兴趣的:(DAX学习笔记)