sap bw入门

今天开始我 sap bw 学习笔记的第一记,讲一下我这个菜鸟对 sap bw 的认识。     我以前做过一个 bi 的项目,其实只是参与开发了一个报表开发与展现的工具,当时对于指标、维度、星形结构、 etl 都不是很了解。对于 sap bw 就更加不懂了。经过几天的学习,我熟悉了下 bw workbench 。写一下我学到的建模初步知识。
   
一, sap NetWeaver bi 的概述
    sap NetWeaver
sap 退出的 soa 的一个平台,他可以集成企业需要的应用服务,提供一个开放的服务。 sap NetWeaver 是所有 sap solutions 的基础。 sap bw 就是该平台提供的一个核心功能。除此之外,他还提供了 EP sap Application server 等,他可以提供 java 引擎,从而可以在上面进行 java 开发。
    sap bw
介绍 :sap bw 可以处理 sap 系统的数据和外部系统的数据,他提供了 OLAP bex bex 提供了丰富的报表和分析工具,这些工具包括 query 、报表和 OLAP 功能。 sap bw 提取数据通过 source system ETL 是所有 bi 系统的量比较大的工作, sap bw 也不例外。外部数据(非 sap 系统数据,包括平面文件等)可以方便的抽取到 sap bw 中。 sap bw 也为抽取不同的数据,提供了几种接口, db connect bapi file soap 等。
   
二, sap bw 中的对象
    infoPriver:
信息提供者是一个在 BEx 中可以为其创建或执行查询的对象。 infoProvider 是物理对象,有时是用于报表的逻辑 视图 DSO infocube 都可以作为 infoProvider
    infocube
包含数据表和维度表,数据表里面包含了关键值的值,最多包含 233 个值。 infocube 里面最少包含 4 个维度表,做多 16 个。其中三个是系统创建,包括:单位维度表、数据包维度表、时间维度表。用户创建的维度表里面放的是 sid ,这些 sid 最多与 248 个特性相连,这就构成了 sap 的星形模式。
    sap
的星形模式和传统的星形模式是不同的,传统的星形模式是一个事实表关联多高维表。而 sap 的星形模式是由关键值组成的数据表关联维表,维表里面放的是 sid ,再通过 sid 去关联文本,属性,层级主数据。 sap 星形结构的优势:
1
,通过自动自动生成的 int4 类型的 sid 可以比阿拉伯数字主键更加快速的访问到数据。
2
,查询的性能提高了,因为关键值可以存储在他们自己的事实表里面。
3
,由于使用 sid 技术通过维表来查找主数据,使得多语言能力等模型成为可能。
     infoObject
:信息对象是 sap bw 的基本单位。 infoObject 分为,关键值信息对象和特性信息对象。特性关键值可以有属性、文本、层级。特性可以带有导航属性,特性也可以定义为仅属性,仅属性不能作为其他特性的导航属性。 sap bw 里面的数据时如何从其他系统得到的,本次记录我对这个过程的认识。 sap bw 中一个 psa psa 是持久数据缓存区,里面放的是和源系统一样的表结构和数据。 ETL 的作用就是从源系统提取、转换、加载数据到 psa 中。 infoPackage 的作用便是执行这个 ETL ,在 infoPackage 执行完毕后,可以通过右击 psa 在管理中查看其内容。对比 psa 中的数据是否正确。
   
在数据加载到 psa 之后,我们就可以通过转换往 dso 或者主数据属性、文本、层级里面添加数据了。转换定义了从 psa 到其目标对象,比如 dso 的转换规则。而用来执行这个转换的是 dtp data  transport process ),在一次 dtp 转换执行完成后我们同样可以通过右击管理目标对象查看其内容,如果目标对象是 dso ,我们需要对新数据有一个激活操作。在这个操作执行完成后,注意查看激活后对象的内容是否正确,并查看 monitor 里面是否有错误,有些时候在执行 dtp 的时候不报错,但在激活新数据的时候会有报错。
   
dww 中的左侧菜单中有 datasource 选项,给出 datasource 的定义。 datasource 是用来从源系统中提取加载数据的 bi 对象。 datasource 将源系统中提供的数据细分为独立的业务领域。
psa
的相关定义:支持数据转换的存储和处理,通常是临时的,其构造不支持最终用户或工具访问,为 ETL 提供工作(或暂存)空间而专门创建。 看了下 EDW ,很困惑它和 DW 的关系。一直以为 EDW DW 的增强版,现在明白,原来 EDW DW 的一种见面方法。      EDW 有三层;
    1
,运营数据存储层
   
本层的作用是:存储一下实时的数据,里面的数据可以改变,通常由写优化的 dso 来作为该层。写优化的 dso 的特点是只有激活表,不需要激活,效率相对较高。
    2
,企业数据仓库层
   
该层作用:存储海量历史数据,通常不做 update 操作。由标准 dso 来做该层。
    3
,架构式数据库层
   
该层作用:通常由 multiProvider infoCube 作为该层。该层可以作为数据集市向外提供数据。
   
如果为整个公司建立了 EDW 层, EDW 层可以视为公司的内存,作为整个公司的信息库。因此该层通常被看做企业数据仓库本身。
    EDW
的目标:

1
,单点事实:可清晰追踪架构式数据库中评估的每个主数据记录和交易数据的数据流。所有数据必须从源中经过 EDW 层进入架构式数据库。

2
,完整性:数据未累计,因此以精确结构存储。未覆盖或更改旧版本,但是可添加其他相关信息。

3
,可控的提取和数据加载:仅可一次提取数据,然后用于几个数据库。通常共同使用的数据会一起处理。

4
,可重复的使用性,灵活性:未操作或更改数据,使其适合特定项目范围。数据应该可靠,在将来的项目中可以使用。

 

 

  • 版权声明 :转载时请以超链接形式标明文章原始出处和作者信息及 本声明
    http://qiqeloveyou.blogbus.com/logs/102128439.html

 

你可能感兴趣的:(数据库,SAP,存储,数据仓库,工具,报表)