BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈

简介

最近公司业务需要用到BI SSIS来处理商业智能和大数据,网上大多数是以前版本介绍,没有最新版,响应公司需要,现现学现卖总结一下入门及调试技巧,随便附加常用技术栈。SSIS是什么?“SSIS是Microsoft SQL Server Integration Services的简称,是生成高性能数据集成解决方案(包括数据仓库的提取、转换和加载 (ETL) 包)的平台。
”SQL Server Integration Services (SSIS) 提供一系列支持业务应用程序开发的内置任务、容器、转换和数据适配器。您无需编写一行代码,就可以创建 SSIS 解决方案来使用 ETL 和商业智能解决复杂的业务问题,管理 SQL Server 数据库以及在 SQL Server 实例之间复制 SQL Server 对象。

1.1 入门

新建,微软Visual Studio 最近版本新建就不用多说了,如图;


BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第1张图片
image.png

2 ,SSIS控件

2.1,Variables

(1) 参数设置,在Package设计页面空白处“右键”选择Variables,点击
image.png

添加参数

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第2张图片
image.png

(2)Expression设置,点击
image.png

配置带函数的参数,选择所需要的参数直接拖动即可

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第3张图片
image.png

2.2,设置数据连接

(1)在Connection Managers窗口中“右键”创建各种Connection


image.png

(2)配置带参数的数据连接,选中创建的Connection后选择Properties窗口中

Expressions配置连接参数,参数配置同上

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第4张图片
image.png

2.3,Sequence Container

容器控件,用来将相似的tasks分组,一般用来将所有维度表和事实表处理分开

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第5张图片
image.png

2.4,Execute SQL Task

image.png

执行SQL任务

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第6张图片
image.png

(1)选中控件,选择Edit

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第7张图片
image.png

SQL Statement栏中配置ConnectionType(数据库类型),Connection(数据库),SQLSourceType

SQLSourceType有三种类型:

  • Direct input ,直接在SQLStatement中输入SQL语句,若需要参数请用“?”代替

  • File connection,File类型连接

  • Variable,从我们配置的Variables中选择

(2)配置SQL语句中需要的参数“?”,选中Parameter Mapping

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第8张图片
image.png

2.5,Script Task

image.png

执行C#代码脚本任务,并返回成功或失败,

(1)选中,右键Edit


BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第9张图片
image.png

选择ReadOnlyVariables,配置需要传入C#代码的参数

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第10张图片
image.png

(2)编辑C#代码,
image.png

进入代码编辑界面

2.6,Data Flow Task

image.png

数据流任务控件,在其编辑中可放入对数据操作的SSIS控件,

2.7,Excel Source Plus

image.png

将Excel数据源导入数据库,在其Edit界面编辑需要导入的Excel数据源,点击[图片上传失败...(image-2c445-1524627024788)]

添加新的数据源


BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第11张图片
image.png

2.8,Conditional Split

image.png

可以根据设置的条件函数处理数据,如对数据进行过滤、合并。在其Edit界面,

  • Order条件执行顺序,可上下调节

  • Output Name 输出名

  • Condition配置数据处理条件

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第12张图片
image.png

2.9,OLE DB Source

image.png

OLEDB类型数据源,在其Edit界面配置数据源

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第13张图片
image.png

New添加新数据库,Data access mode选择数据源获取方式,直接选取或者从Variables参数中选取,或者通过SQL语句获取,若SQL语句需要参数点击
image.png

配置


BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第14张图片
image.png

2.10,Derived Column

image.png

向要导入的数据库表中派生列,其Edit界面

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第15张图片
image.png
  • Derived Column Name 派生新列的字段名

  • Derived Column 派生列的方式

  • Expression 新列字段值的表达式

2.11,Lookup Plus

image.png

将其他数据库表中的字段值插入数据中,其Edit界面

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第16张图片
image.png

Input Column 数据中要插入数据的字段名

Reference 需要引用的数据,双击后进入其Edit界面

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第17张图片
image.png

首先编辑其需要引用数据的数据库,选择数据库Table/View作为数据源或者通过SQL语句查询数据,Key Column为两表关联字段,Value Column为要插入的数据字段

2.12,Data Conversion

image.png

数据转换,将数据类型转换为MSSQL的数据类型,在其Edit界面选择需要转换的字段即可

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第18张图片
image.png

2.13,Row Count – Source

image.png

数据统计,统计处理的数据量,需要在Variables中定义Int32数据类型的参数来接受统计值

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第19张图片
image.png

2.14,OLE DB Destination

image.png

OLE DB目标,数据导入的目标,其Edit界面

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第20张图片
image.png

配置好需要导入数据的数据库与数据表,若出现
image.png

错误,请点击Mapping仔细检查数据字段匹配是否正确

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第21张图片
image.png

3.0调试

3.1 第一种调试方法

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第22张图片
image.png

如图,再箭头上直接右键 选中Enable Data Viewer,这样运行到这里会停止,并且能看到详细数据情况如下图,点击继续往下走。


BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第23张图片
image.png

3.2 第二种调试方法

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第24张图片
image.png

如图,在package执行时,会出现一个progress显示执行的进度

3.3第三种调试方法

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第25张图片
image.png
BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第26张图片
image.png

选中Execute SQL Task,点击右键,选中Edit Breakpoint来设置断点,进行调试。运行到这里会断点

3.4第四种调试方法

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈_第27张图片
image.png

package 事件调试,可以在事件选中指定事件,当错误出现时,发送runtime的错误信息或将错误信息写入文档,方便捉错误信息。

4.0 其他

注意,下面部分来自网上

Control Flow 控制流程

Containers 容器

  • For Loop Container
  • Foreach Loop Container
  • Sequence Container

Core Task 核心任务

  • Data Flow Task

Other Task 其他任务

  • Analysis Services Execute DDL Task
  • Analysis Services Processing Task
  • Back Up Database Task
  • Bulk Insert Task
  • CDC Control Task
  • Check Database Integrity Task
  • Data Mining Query Task
  • Data Profiling Task
  • Execute Pakcage Task
  • Execute Process Task
  • Execute SQL Server Agent Job Task
  • Execute SQL
  • Execute T-SQL Statement Task
  • Expression Task
  • File System Task
  • FTP Task
  • Hadoop File System Task
  • Hadoop Hive Task
  • Hadoop Pig Task
  • History Cleanup Task
  • Maintenance Cleanup Task
  • Message Queue Task
  • Notify Operator Task
  • Rebuild Index Task
  • Reorganize Index Task
  • Script Task
  • Send Mail Task
  • Shrink Database Task
  • Transfer Database Task
  • Transfer Error Messages Task
  • Transfer Jobs Task
  • Transfer Logins Task
  • Transfer Master Stored Procedures Task
  • Update Statistics Task
  • Web Service Task
  • WMI Data Reader Task
  • WMI Event Watcher Task
  • XML Task

Data Flow 数据流程

Transforms 传输

  • Aggregate Transformation
  • Audit Transformation
  • Balanced Data Distributor Transformation
  • Character Map Transformation
  • Conditional Split Transformation
  • Copy Column Transformation
  • Data Conversion Transformation
  • Data Mining Query Transformation
  • DQS Cleansing Transformation
  • Derived Column Transformation
  • Export Column Transformation
  • Fuzzy Grouping Transformation
  • Fuzzy Lookup Transformation
  • Import Column Transformation
  • Lookup Transformation
  • Merge Transformation
  • Merge Join Transformation
  • Multicast Transformation
  • OLE DB Command Transformation
  • Percentage Sampling Transformation
  • Pivot Transformation
  • Row Count Transformation
  • Row Sampling Transformation
  • Script Component
  • Slowly Changing Dimension Transformation
  • Sort Transformation
  • Term Extraction Transformation
  • Term Lookup Transformation
  • Union All Transformation
  • Unpivot Transformation

Sources 数据源

  • ADO NET Source
  • CDC Source
  • Excel Source
  • Flat File Source
  • OLE DB Source
  • Raw File Source
  • XML Source

Destination 目标

  • Destination Assistant
  • ADO NET Destination
  • Data Mining Model Training Destination
  • DataReader Destination
  • Dimension Processing Destination
  • Excel Destination
  • Flat File Destination
  • OLE DB Destination
  • Partition Processing Destination
  • Raw File Destination
  • Recordset Destination
  • SQL Server Destination
  • SQL Server Compact Edition Destination

你可能感兴趣的:(BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈)