本文主题是用SSIS对数据进行ETL操作:
首先,安装SQL Server2005自带的数据库AdventureWor ks。安装这个数据库分为两种情况。
1如果SQL Server2005已经安装好了却没有安装这个数据库。那么
【第一种方法】
开始菜单->所有程序->Microsoft Visual Studio 2005->configuration tools->Notification Services Command Prompt
->键入以下命令
SQLCMD -S (local)/sqlexpress -E
->按Enter
->键入以下命令
select physical_name from sys.database_files where name = 'master'
go
(此查询将返回 master.mdf 文件的位置,从而确认将放置 AdventureWorks 数据库文件的 SQL Server 数据目录。)
->键入以下命令(现在将 AdventureWorks 附加到 SQL Server 中)
exec sp_attach_db @dbname=N'AdventureWorks', @filename1=N'C:/Program Files/Microsoft SQL Server/MSSQL.1/MSSQL/Data/AdventureWorks_Data.mdf', @filename2=N'C:/Program Files/Microsoft SQL Server/MSSQL.1/MSSQL/Data/AdventureWorks_log.ldf'
->键入 go。
->按 Enter
->键入exit关闭命令窗口
然后到Management Studio中去查看数据库文件,如果有AdventureWorks就说明成功。
【第二种方法】
到microsoft官方网站上去搜索AdventureWorks,或者点击这里(http://msftdbprodsamples.codeplex.com/releases/view/4004)下载后放入路径n:/Program Files/Microsoft SQL Server/90/Tools/Samples/AdventureWorks OLTP. 然后进行安装,过程如下:
控制面板->添加删除程序->更改或删除程序->进行SQL Server 2005的更改->Change Installed Components->进入Feature Selection向导->Books Online Documentations and Samples->DataBases->AdventureWork Sample OLTP和AdventureWorksDW Sample DataWarehouse
2如果还没有装SQL,那就在安装的时候做好自定义。
【第三种方法】
如果还没有装SQL,那就在安装的时候做好自定义。与上面类似,Feature Selection向导->Books Online Documentations and Samples->DataBases->AdventureWork Sample OLTP和AdventureWorksDW Sample DataWarehouse
然后,以下部分介绍SSIS的四个主要组成部分:
Integration Services服务,Integration Services对象模型,Integration Services运行时和运行时可执行的包,数据流任务。
SQL Server官网上的图显示了以上四个组成部分之间的关系:
最后,以下部分简单介绍SSIS的创建过程:
1 打开SQL Server Management Development Studio。新建一个Integration Services项目。
2 这样就打开了SSIS设计器。在SSIS设计器中,有四个管理标签,分别用于生成包控制流,数据流,事件处理程序和查看包的内容。当切换不同的管理标签是,窗口左侧的工具箱会有不同的组件出现。
3 设置连接管理器。
用鼠标右键单击“连接管理器”区域中的任意位置,在弹出的快捷菜单中选择“新建OLE DB连接”命令。
在“配置OLE DB连接管理器”对话框中单击新建按钮,在弹出对话框选择对应服务器的AdventureWorks数据库。并测试连接。
4 把管理标签切换为控制流,从工具箱中选择“数据流任务”以及“文件系统任务”。将“数据流任务”名字修改为“计算归档值”,将“文件系统任务“的名字修改为“备份”。将“数据流任务”下的绿色箭头拖动到“文件系统任务”中,这样就建立好了二者之间的连接。
5 从工具箱中拖动“序列容器”到设计界面中,并且把已经设定好的“数据流任务”和“文件系统任务”都放入“序列容器”中。
6双击“计算归档值”,进入数据流管理界面。
7 按照和在控制流管理界面相似的方式,选择合适的组件。比如,以书为例,分别选择“OLE DB源(OLE DB source)”,“派生列(derived column)”,“聚合(aggregate)”,“排序(sort)”,“平面文件目标(plaint text destination)”。然后依次定义好各个组件之间的数据连接。这样数据流管理界面的任务就完成了。
8 回到控制流管理界面,定义已改名为“备份”的“文件系统任务”。
9 运行包。