Datastage的学习革命道路之首篇

2014年2月12号

   今天是学习Datastage这门技术的第一天,也是这个博客开始的首篇。坚持与否,完成与否,全凭个人喜好和意志。道路坎坷哉!


   首先,Datastage的概念与用途。

    IBM InfoSphere DataStage是IBM开发的一种ETL工具,也是IBM信息平台解决方案套件和IBM InfoSphere的其中一部分。它是一个以图形界面方式来提供数据整合解决方案的集成工具。DataStage有服务器版本和企业版本等多种版本。(copy from 维基百科)

   ETL是Extraction-Transformation-Loading的简写。它是数据仓库和数据集成应用中的一个重要部分。主要是一个将数据进行抽取,转换,最后加载的过程。是数据仓库重要的一个环节。主要是负责将分散的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。

   Datastage 便是这个ETL技术的工具之一,还有类似工具有OWB(Oracle Warehouse Builder)、ODI(Oracle Data Integrator)等等。

   介绍:

   一、数据源

         数据整合中,数据源的连接范围直接决定着它的使用范围。DS支持多种数据源,包括;

           1.文本文件

           2.xml 文件

           3.企业应用程序,比如 SAP、PeopleSoft、Siebel、Oracle Application

           4. 几乎所有的数据库系统,比如 DB2、Oracle、SQL Server、Sybase ASE/IQ、Teradata、Informix等以及可通过ODBC连接的数据库

           5.Web Service

           6. SAS、WebSphere MQ

 二、坚持多语言

 三、支持任务并行工作。

 四、开发环境。DS是基于C/S的开发模式。通过DS client 连接到DS Server上进行工作。说DS client 只能在windows平台上安装,而server端是多平台安装的。DS Client端有四种客户端工具:DataStage Administrator、DataStage Designer、DataStage Manager、DataStage Director。

   目前我对datastage的了解是它是一个用于数据仓库中数据整合的工具,可以有多个异构数据源,通过各种函数控件将数据转化成合理需要的,并加载到目标数据仓库中。




你可能感兴趣的:(oracle,服务器,博客,解决方案,数据源)