Power Center的架构跟简介

整理笔记

Emma......

 

正文:

网上能够找到如下的图:

Power Center的架构跟简介_第1张图片

 

Domain:是PowerCenter中所有服务器对象以及服务对象的集合。最常见的对象包括节点,IS(Integration Service),R(Repository Service),Web Service Hub等。

Node:是物理服务器在PowerCenter架构中的逻辑名,事实上是一系列的服务,用于表示物理的服务器。

IS:Integration Service。所有的ETL的工作的指挥者,当一个session启动时,会启动一个或者多个的pmdtm进程。这些进程中的线程都是由IS负责控制指挥的。

R:(Repository Service)。是Repository的管理人,当需要访问Repository时可以通过R来进行。

Repository:是数据库某个用户下一系列的表以及其中存放的数据,是Power Center在配置的过程中通过Create Repository Content创建的。这些表是由PowerCenter管理的,与数据源或者目标表无关。可以通过Repository Guide中的Using Metadata Exchange(MX) Views了解部分表的定义以及其存放的内容。

 

 

Power Center 的构成

POWER CENTER由4个最常用的客户端组成:PowerCenter Designer,PowerCenter Workflow Manager,PowerCenter Workflow Monitor,PowerCenter Repository Manager。

    1.PowerCenter Designer:用于导入ETL元数据,开发ETL程序。在PowerCenter中ETL程序被叫做Mapping,为源到目标的映射。为了方便的实现这些Mapping,PowerCenter会有很多的Transformation(大致几十个吧),还有很多的常用的函数。

    2.PowerCenter Workflow Manager:在PowerCenter中,所开发的Mapping是无法直接运行的。在开始运行前需要给Mapping配置一系列的参数,例如具体的数据源,target,使用的字符集以及调优化,这些工作是在Workflow Manager中完成的。另外Workflow还提供基本的调度排程能力,例如定时调度,持续运行,也包括并行执行,串行执行以及更多的高级功能。

    3.PowerCenter Workflow Monitor:用于监控运行时的Workflow和Session,通过Workflow Monitor可以监控ETL的执行情况,是否正常执行,执行效率以及异常的错误信息。

    4.PowerCenter Repository Manager:这个客户端适用于管理Respository自身,例如创建文件夹,导入/导出Mapping,Workflow,版本管理,部署,Respository的清除等。

 

 

其他的在特定情况也会用的客户端:Data Transformation Studio,PowerCenter Mapping Architecture for Visio,Informatica Developer。

Data Transformation Studio:主要用于开发,解析非结构化,半结构化数据的客户端工具。例如,解析,抽取Excel表格,PDF文档或者某些行业的规范化数据,如Jason,HL7,FIX,XBRL。在这里完成的开发的程序,在发布之后,可以使用PowerCenter UDO(Unstructure Data Option) Transformation直接调用,可以实现与其他客户端的无缝集成。

PowerCenter Mapping Architecture for Visio:在ETL的开发中,会遇到很多相似的Mapping的开发,这个客户端主要用于支持PowerCenter批量开发,在后续的章节中将有详细的介绍。

Informatica Developer:这是一个新的,基于Eclipse的客户端,未来可能成为主流的开发工具,同样的可以完成对于Mapping开发所需要的所有的功能。

 

 

 

 

 

你可能感兴趣的:(BI)