ssas渐变维度处理
为了能够追踪历史,我们通常有两种方法:
1.时间戳(起始生效日期和结束日期);
2.使用是否当前有效的字段标记。
这里使用这些字段的目的,在于采集事实表时,能根据这些标记查找对应的维度记录ID(通常使用代理键,不要使用自然键,并且更新时应该先更新维度表,在更新事实表)。
但是我们经常会碰到存在层次关系的维度,在这些维度记录中通常通过ID作为层次关系的根据。如下图所示的维度物理表:
设置好层次关系。
选中属性列表中的属性,设置部门,分公司,人员对应的显示名称(选中上面属性行,在属性窗口的“NameColumn”属性进行设置)。
查看结果如下:
加入现在2010-12-3日,市场部的名字更改成了“销售部”。更通过渐变维度更新,最将记录1、2的有效结束日期更改为2010-12-3日,并添加两条新的记录。如下图所示:
注意:记录3没有做任何改动,如果2010-12-3日进行事实表更新,则事实表中关联的ID为3、4、5而不再是1、2、3。
如果我们此时重新更新维度,更新到SSAS服务器,则会报错“OLAP 存储引擎中存在错误: 处理时找到重复的属性键: 表:“dbo_人员维度”,列:“部门ID”,值:“1001”。该属性为“部门ID”。”
因为更新维度时,1001对应另个名字“市场部”“销售部”。我们必须对老的记录和新记录的数据进行“隔离”。
选中属性列表中的部门ID设置“键列”(设置属性窗口中的KeyColumns),我们看到只有“部门ID”,把“有效开始时间”也放进来变成组合键列,并且人员也进行同样的设置。最顶级别的“分公司ID”则用“分公司ID”和“分公司名称”做为组合键。
更新到服务器后,可以看到如下的层次结构:
有些人会说,当前“市场部”已经不要了,怎么还出来了。其实这个没关系,因为我们查看事实表的时候有个时间维度,选定一个日期关联的事实表,而同一天的这些事实表不可能同时有关联“市场部”又有关联“销售部”的。
总之:最高级别的“分公司”的键列为“分公司ID”+“分公司名称”;其他的键列为“ID”+“有效其实日期”。
怎么使用MDX查询历史数据:
这里的时间戳,只是为了事实表关联维度表的时候,能根据这个时间戳(有效标志)找到当时应该对应的维度记录行。实际查询的时候,应该根据时间查出事实表,然后事实表表记录自动关联起历史中的维度
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/jzdzhiyun/archive/2010/12/03/6052993.aspx
http://files.cnblogs.com/emmy/testfu.rar
只能在vs2008下才能新建维度属性关系。在vs2005上没有这个页签。
缓慢变化的维表:
员工代理键 生效日期 失效日期 员工ID 员工姓名 所属部门
1 20010101 20091231 A 张三 营业部
2 20100101 20991231 A 张三 市场部
事实表:
员工代理键 数据所属日期 事实数据
1 20050101 100.00
2 20100501 220.00
归纳:
1、缓慢变化维可以认为是维度的关键属性发生变化时,根据变化时间将数据进行拆分并独立ID(代理键)化(个人观点描述,大体是这样)
2、维度中必须包含生命周期(有效时间段)和虚拟的ID(代理键),这样才能有效区分数据的变化
3、事实表中用维表ID(代理键)进行外键匹配,保证按照时间统计可区分维度属性的变化
4、事实表尽量包含一个数据所属日期,以保证数据是可逆的,也就是说当事实表损坏的时候可利用数据所属日期重新匹配维表(数据所属日期 between (生命周期) )
5.6读后感:
1.数据仓库的 维表设计:代理键,用户ID,用户name,生效日期,失效日期
事实表设计:代理键,数据所属日期
2.如果维表发生变化,首先在维表添加一条新数据,生效日期,并把旧数据的失效日期改为新数据的生效日期。
3.当有新的事实数据产生时,我们先用
select 维表代理键 from 维表
where 用户ID=XX
and
事实表的数据所属日期 between 维表的生效日期 and 维表的失效日期 。
把得到的代理键插入到事实表的新一条数据中。
4.在建ssas的cube时,用事实表的代理键 关联 维表的代理键 ,事实表的日期 关联 日期维度的日期ID
5.cube建立完成后,查询数据一定要选日期维度。
最后:ssas的cube只能做关联 代理键,拿代理键对应的数据,对数据的处理 还得在数据仓库设计和ETL这一段解决......