阅读更多
1.
1)PowerCenter Designer:设计开发环境,定义源及目标数据结构;设计转换规则,生成ETL映射。
2)Workflow Manager:合理地实现复杂的ETL工作流,基于时间,事件的作业调度
3)Workflow Monitor:监控Workflow和Session运行情况,生成日志和报告
4)Repository Manager:资料库管理,包括安全性管理,元数据维护,安全操作等
5)Repository Server Administrator Console:对知识库的操作,知识库的创建,备份,恢复等操作。所有元数据都存储在知识库里面,该元数据可以保存在所有主流关系型数据库中。
2.
1)Informatica服务器端的安装
选择Server,选择license key.选择上面两个。create domain。
2)Informatica客户端的安装
3)配置ODBC数据源:在管理工具里面配置;数据库tnsnames文件的配置;workflow配置(默认的username、pwd:administrator)
PowerCenter Server配置:启动Informatica Orchestration Server跟Informatica Services8,6;
在Explorer中输入https://localhost:8443/adminconsole/登陆管理控制台,username,pwd(为在安装过程中输入的)。Domain tab——Repository Service(创建repository,主要是连接数据库的基本信息)——Integration service 。
POwerCenter不通过JDBC连接数据库,而是通过在server上安装Oracle client连接数据库,所以必须在server上安装oracle客户端程序,且Net Configuration Assistant配置本地net服务名。在配置完贝蒂net服务名后,使用tnsping infa_demo来测试一下是否oracle配置生效。
3.简单组件的介绍
Normalizer:行转换列组件
Expression组件:表达式组件
Aggregator组件:聚合组件
Filter组件:过滤组件(过滤条件返回真或假的表达式,表达式为假就过滤)
Sorter组件:排序组件(在一个mapping里建立该组件指定多个用来排序的端口)
Stored Procedure组件:调用存储过程组件
Sequence Generator组件:生成序列号组件
Update Strategy组件:insert/update/delete组件
Source Qualifier:每个数据源后面都会带一个Source qualifier组件;连接同构的源数据可以连接多个表,异构数据源需要使用JOIN组件。定制select语句来读取源数据去除重复记录,加过滤条件,关联条件等。