Informatica 了解架构和工具

一、首先谈下informatica架构

Informatica 了解架构和工具_第1张图片

1.Domain:是Power Center中所有服务器对象及服务对象的集合,最常见的对象包括节点、Integration Service、Repository Service、 Web Service Hub、 Grid等。它可以包括一个或者多个如上的对象。

2.Node:它是事先物理服务器在PowerCenter架构中的逻辑名,事实上它是一系列的服务,用于表示物理的服务器。

3.IS:即Integration Service,所有的ETL工作都由其来指挥。当一个Session启动时,会启动一个或者多个pmdtm进程,这些进程或者其中的线程都是由Integration Service负责指挥的。

4.R:即Repository Service。它是Repository的管理人,当需要访问Repository时,需要通过Repository Service进行。

5.Repository:是数据库某个用户下一系列的表及其中存放的数据,是PowerCenter在配置过程中通过Create Repository Content创建的,这些表是PowerCenter自动创建且由PowerCenter来管理的,与数据源或者目标表无关。在PowerCenter的联机文档中,可以通过Repository Guide中的Using Metadata Exchange Views了解部分表的定义及其存放的内容。

二、PowerCenter客户端

POWER CENTER由4个最常用的客户端组成:PowerCenter Designer,PowerCenter Workflow Manager,PowerCenter Workflow Monitor,PowerCenter Repository Manager。

    1.PowerCenter Designer:用于导入ETL元数据,开发ETL程序。在PowerCenter中ETL程序被叫做Mapping,为源到目标的映射。为了方便的实现这些Mapping,PowerCenter会有很多的Transformation(大致几十个吧),还有很多的常用的函数。

    2.PowerCenter Workflow Manager:在PowerCenter中,所开发的Mapping是无法直接运行的。在开始运行前需要给Mapping配置一系列的参数,例如具体的数据源,target,使用的字符集以及调优化,这些工作是在Workflow Manager中完成的。另外Workflow还提供基本的调度排程能力,例如定时调度,持续运行,也包括并行执行,串行执行以及更多的高级功能。

    3.PowerCenter Workflow Monitor:用于监控运行时的Workflow和Session,通过Workflow Monitor可以监控ETL的执行情况,是否正常执行,执行效率以及异常的错误信息。

    4.PowerCenter Repository Manager:这个客户端适用于管理Respository自身,例如创建文件夹,导入/导出Mapping,Workflow,版本管理,部署,Respository的清除等。

你可能感兴趣的:(Informatica)