OWB
前提:
按照先后顺序分别安装oracle数据库、工作流和owb。
OWB工作过程:
1. 设计目标数据仓库模型
2. 定义源数据
3. 映射源数据
4. 生成代码
5. 部署数据仓库
6. 抽取和转换数据
Oracle Warehouse Builder的特性:
A) 能自动生成Oracle数据库性能最优的代码
B) 能支持包括多种数据库和文本文件以及SAP系统在内的数据源
C) 图形化的目标数据仓库和ETL设计
D) 可以通过工作流和OEM来自动完成相应的ETL过程
Oracle数据仓库的完整解决方案 |
|
ETL工具 |
Oracle Warehouse Builder |
数据管理 |
Oracle Database |
报表 |
Oracle Report |
即席查询 |
Oracle Discoverer |
预测分析 |
Oracle BI Beans |
数据挖掘 |
Oracle Data Miner |
企业门户 |
Oracle Portal |
Owb中有两个资料档案库:
一个叫repository,另一个叫runtime repository(运行时资料档案库)。
其中repository用来存放owb设计过程中的对象。Runtime repository用来存放运行所需的数据,包括元数据、映射定义、转换规则等等。
每个资料档案库都有相应的用户。一般来说至少需要四个用户:repository所有者、runtime repository所有者、runtime repository访问者、目标数据库所有者。
数据源可以分为三类:oracle数据库、非oracle数据库、文件。
OWB中每种操作跟sql的对应关系如下:
Owb operator |
Sql |
复制器Deduplicator |
Distinct |
过滤器Filter |
where |
连接器Joiner |
join |
关键字查找Key lookup |
join |
移动表头区Pivot |
一条记录拆分成多条 |
Unpivot |
与pivot相反 |
映射序列Sequence |
Currval,nextval |
集合运算Set |
Union,union all,intersect,minus |
排序器Sorter |
Ordre by |
拆分器Spliter |
Mutiple table where |
聚集函数Aggregator |
Group by,having |
常数Constant |
|
Warehouse Builder functions include:
■ Importing data definitions.(输入数据的定义)
■ Designing and creating database schemas.(设计和创建数据库方案)
■ Defining data movement and transformation.(定义数据移动和转换)
■ Assigning dependencies between ETL processes.(依赖于ETL程序进行指派)
■ Managing and updating definitions.(管理并更新定义)
■ Deploying, upgrading, and managing schemas.(部署,升级和管理方案)
■ Designing and creating an ad-hoc query tool environment.(设计并创建一个即席查询环境)
■ Designing and creating an OLAP environment.(设计并创建一个联机分析处理环境)
Warehouse Builder tools including the following:
■ Data Object Editor: Provides a canvas for creating and editing data objects properties for data objects such as
tables, views, and materialized views.
(数据对象编辑器:提供了一个用于对表、视图、物化视图等数据对象进行创建和编辑的工具包。)
■ Mapping Editor: Provides a canvas for creating and editing ETL logic.
(映射编辑器:提供用于创建和编辑ETL逻辑的包)
■ Control Center Manager: Provides centralized management and monitoring capabilities for all deployments
and executions.
(控制中心管理器:提供了对所有部署的集中管理和性能监控)
■ Change Manager: Allows you to manage changes to ensure that all changes are reflected in associated areas.
(转换编辑器:允许你管理更改,确保所有的与更改都反映到相关联的地方)
■ Process Flow Editor: Provides a canvas for creating and managing process flows that are used to create
organized processes that include multiple mappings.
(进程流编辑器:提供了创建与管理用于创建包含复杂映射有组织的进程的进程流的包)
■ Experts Editor: Allows you to manage changes and to ensure that all changes are reflected in associated areas.
(添加删除Expert)
■ Metadata Dependency Manager: Allows you to discover an object's lineage and also assess the impact of
change to an object before implementing the change.
(元数据相关性管理器:允许你查看一个对象的血统,也在实施改变之前评估了改变的影响)
最优的映射
有一些提示和指导方针保证你在数据库中创建一个可扩展的和符合逻辑的映射:
1.典型情况是你为目标模式中的每个实体创建一个映射,举例:一个映射对应一个维度。
2.不要join远程数据库对象;不如通过两个映射暂存对象到目标,然后再做join操作。
3.在一个操作中用基本原子操作;不要在一个视图中写很多的逻辑,这样会丢失数据渊源性,影响数据仓库提供的分析。
4.瞄准批处理方式=>这种方式速度快
5.使用正确的提交顺序,在多目标的情形中。
6.瞄准清晰的错误处理=>要求了解你的数据。
删除Location
OMBDROP LOCATION 'TEST_LOCATION' ;
使用命令启动owb控制中心
/oracle/OraHome_2/owb/bin/unix/run_service.sh -manual 1 /oracle/OraHome_2 REP_DW 10.212.11.100 1521 dc