okbin1991

第三章可视化ETL平台——Kettle

第三章可视化ETL平台——Kettle课程目标 能够理解Kettle的主要用途 能够搭建Kettle开发环境 能够掌握Kettle输入组件的使用 能够掌握Kettle输出组件的使用 能够掌握Kettle转换组件的使用1. Kettle介绍1.1 数据仓库数据仓库是一个很大的数据存储集合，出于企业的分析性报告和决策支持目的而创建的，对多样的业务数据进行筛选与整合。它为企业提供一定的BI能力，指导业务流程改进，监视时间成本、质量以及控制。

重点数据仓库是专门用来进行数据分析的，它可以是一个MySQL，也可以是Oracle，也可以将来后面大数据会学习到的Hive等。1.2 ETLETL，是英文Extract-Transform-Load的缩写，用来描述将数据从来源端经(extrac过抽取t)、转换(transform)、加载(load)至目的端的过程。ETL是将业务系统的数据经过抽取、清洗、转换之后加载到数据仓库的过程，目的是将企业中分散、零乱、标准不统一的数据整合到一起。

1.3 Kettle介绍对于企业或行业应用来说，经常会遇到各种数据的处理，转换，迁移，掌握一种etl工具的使用，必不可少，这里要学习的ETL工具是——Kettle，现在已经更名为PDI。 Kettle是一款国外开源的ETL工具，纯java编写，可以在Window、Linux、Unix上运行，绿色无需安装 Kettle中文名称叫水壶，该项目的主程序员MATT希望把各种数据放到一个壶里，然后以一种指定的格式流出 Kettle允许管理来自不同数据库的数据，提供一个图形化的用户环境来描述想做什么，无需关心怎么做

2. windows安装Kettle2.1 安装JDK要在windows系统中使用Kettle，必须先安装好JDK。2.1.1 安装JDK软件截图步骤 1.找到资料/安装包中的jdk软件安装包，双击打开。 2.点击「下一步」按钮 3.将路径修改为 c:\opt\jdk1.8.0_241，点击「确定」按钮 4.点击「下一步」，等待进度条完成。

5.在新弹出的窗口中，点击「更改」按钮，将JRE的安装路径修改为 c:/opt/jre1.8.0_241。注：碰到以下错误可以忽略(是因为机器名中包含了一些JDK不识别的支付) 6.点击「关闭」完成安装。

2.1.2 配置环境变量要让JDK环境生效，需要配置下系统的环境变量。此处大家先无需关心环境变量的意义，先按照下面的步骤配置好。截图步骤 1.打开我的电脑，右键点击「此电脑」。 2.点击「高级系统设置」。 3.在弹出窗口中点击「高级」选项卡中的「环境变量」。 4.点击「新建...」按钮添加环境变量。 5.变量名写入：JAVA_HOME，变量值设置为之前安装JDK的路径：c:\opt\jdk1.8.0_241 6.点击「确定」按钮保存。 7.将JAVA_HOME添加都Path中2.2 安装KettleKettle的安装非常简单，只需要下载后解压即可。但前提需要安装好JDK。 1.下载Kettle(可以在资料/安装包/pdi-ce-9.0.0.0-423.zip) 2.解压Kettle(解压到非中文目录) 3.进入解压后的文件夹data-integration,双击Spoon.bat，启动kettle注：kettle也可以到可以到https://sourceforge.net/projects/pentaho/files/下载3. 快速入门3.1 需求有一个txt文件，内容如下：id,name,age,gender,province,city,region,phone,birthday,hobby,register_date392456197008193000,张三,20,0,北京市,昌平区,回龙观,18589407692,1970-8-19,美食;篮球;足球,2018-8-6 9:44267456198006210000,李四,25,1,河南省,郑州市,郑东新区,18681109672,1980-6-21,音乐;阅读;旅游,2017-4-7 9:14892456199007203000,王五,24,1,湖北省,武汉市,汉阳区,18798009102,1990-7-20,写代码;读代码;算法,2016-6-8 7:34492456198712198000,赵六,26,2,陕西省,西安市,莲湖区,18189189195,1987-12-19,购物;旅游,2016-1-9 19:15392456197008193000,张三,20,0,北京市,昌平区,回龙观,18589407692,1970-8-19,美食;篮球;足球,2018-8-6 9:44392456197008193000,张三,20,0,北京市,昌平区,回龙观,18589407692,1970-8-19,美食;篮球;足球,2018-8-6 9:44我们需要使用Kettle将这个文件中的数据抽取出来，然后装载到Excel中。id name age gender province city region phone birthday hobby register_date392456197008193000 张三 20 0 北京市昌平区回龙观 18589407692 1970-08-19 美食;篮球;足球 2018-08-06 09:44:43267456198006210000 李四 25 1 河南省郑州市郑东新区 18681109672 1980-06-21 音乐;阅读;旅游 2017-04-07 09:14:13892456199007203000 王五 24 1 湖北省武汉市汉阳区 18798009102 1990-07-20 写代码;读代码;算法 2016-06-08 07:34:23492456198712198000 赵六 26 2 陕西省西安市莲湖区 18189189195 1987-12-19 购物;旅游 2016-01-09 19:15:53392456197008193000 张三 20 0 北京市昌平区回龙观 18589407692 1970-08-19 美食;篮球;足球 2018-08-06 09:44:43392456197008193000 张三 20 0 北京市昌平区回龙观 18589407692 1970-08-19 美食;篮球;足球 2018-08-06 09:44:43

3.2 Kettle的基本开发步骤1.要使用Kettle来进行数据处理，首先要做的是构建Kettle的数据流图，也就是用可视化操作像排积木的方式，把要做的事情排列出来。

2.配置数据流图中的各个组件3.保存并启动执行3.3 构建Kettle数据流图效果图：

开发步骤1.将左边的核心对象中的输入文件夹下的文本文件输入拖拽到中间空白区域。

2.从输出文件夹中将Excel输出组件拖拽到中间空白区域。

3.按住Shift键点击文本文件输入组件，移动鼠标到Excel输出，然后释放鼠标，这样就可以将两个组件连接到一起。

3.3.1 配置文件文本输入组件1.双击文本文件输入组件，在弹出窗口中点击「浏览」按钮。

2.选择资料/测试数据中的 user.txt 文件

3.点击「增加」按钮，将文件加入到要抽取的数据中来。注意：不点添加按钮，将不会抽取数据。

4.点击「内容」选项卡，将分隔符修改为逗号(注意是英文状态的逗号)，将编码方式修改为：UTF-8。

5.点击「字段」选项卡，再点击「获取字段」按钮，可以读取到txt文件中的所有字段。

6.点击「预览记录」按钮，查看Kettle是否能够读取到 user.txt 中的数据。

7.点击「确定」按钮保存。

3.3.2 配置Excel输出组件配置好了抽取 user.txt 组件后，接下来要配置将数据装载到Excel的组件。1.双击 Excel输出组件，在弹出窗口中点击「浏览」按钮。

2.点击「内容」选项卡，设置要将Excel文件输出到哪儿的路径，然后点击确定，再删除文件后缀xls

3.点击「字段」选项卡，再点击「获取字段」，将age的格式设置为0，表示只输出不带小数点的数字。

3.4 保存并启动执行1.点击工具条上方的保存按钮，或者按快捷键Ctrl +S。

2.Kettle会提示让我们保存该数据流图(转换)，我们保存到一个指定位置即可，然后点击「保存」按钮即可。3.点击工具栏上的播放按钮启动执行。

4.执行完后，我们可以到指定的位置，发现Excel文件已经生成，可以看到里面的内容。

4. 程序员小姐姐的烦恼4.1 问题来了公司来了有个漂亮的程序员小姐姐叫小花，她刚大学毕业，项目经理安排她这样一项工作：有这样一个Excel文件：user.xls，这个文件内容是这样的。

项目经理想要让她将这些数据导入到MySQL中来。小花刚来，急得团团转，不知所措，机会来了。4.2 数据抽取的需求需要从Excel中将这些用户的数据，使用Kettle抽取到MySQL中。4.3 准备工作为了完成本案例，我们需要准备以下几件工作：4.3.1 找到小姐姐的Excel文件在资料/测试数据文件夹中可以找到user.xlsx文件4.3.2 在MySQL数据库中创建数据库为了方便将Excel文件中的数据抽取到MySQL中，我们必须要创建一个名字叫kettle_demo的数据库，后续Excel中的数据会装载到该数据库的表中。 1.在DataGrip中右键点击MySQL连接，选择New/Schema 2.在创建数据库的对话框中输入kettle_demo，点击Execute 3.我们可以看到kettle_demo数据库名称就已经创建好了4.3.3 在kettle中加载MySQL驱动Kettle要想连接到MySQL，必须要安装一个MySQL的驱动，就好比我们装完操作系统要安装显卡驱动一样。加载MySQL驱动只需以下两步：1.将资料中的 MySQL jdbc 驱动包mysql-connector-java-5.1.47.jar和mysql-connector-java-8.0.13.jar导入到 data-integration/lib 中

3.重启Kettle即可4.4 构建Kettle数据流图效果图：

开发步骤1.在Kettle中创建一个转换(两种方式)(1)点击菜单：文件/新建/转换(2)点击按钮：

(3)快捷键：Ctrl + N

2.从左边的核心对象中，分别拖入「输入/Excel输入」、「输出/表输出」两个组件到中间区域

3.然后按住Shift键，在「Excel输入」组件上点击鼠标左键，拖动到「表输出」组件上，连接两个组件，这样数据流图就构建好了

4.5 配置Kettle数据流图中的组件刚刚已经把数据流图构建好了，那么Kettle就可以将Excel文件中的数据抽取到MySQL中吗？显然是不行的。Kettle根本不知道要将哪个Excel文件中的数据，抽取到哪个MySQL中。我们需要配置这两个组件，告诉Kettle从哪个Excel文件中抽取，以及将数据装载到哪个MySQL中。4.5.1 配置Excel输入组件1.双击Excel输入组件，会弹出一个对话框，我们可以再该对话框中配置该组件

2.* 因为此处要抽取的Excel文件为Excel 2007版本，所以指定表格类型为Excel 2007 XLSX (Apache POI)

3.随后我们需要找到要抽取的那个Excel文件，点击「浏览」按钮，找到「资料/测试数据/user.xlsx」文件

4.再点击旁边的「增加」按钮，切记：一定要点击增加按钮哦！否则没有效果！

5.在弹出菜单中，点击「Sheet1」工作簿，并点击「>」按钮移动到右边。

6.点击「字段」选项卡，点击「获取来自头部数据的字段...」按钮，Kettle会从Excel中读取第一行字段名称。

7.将 age 字段的格式设置为#，register_date的格式设置为 yyyy-MM-dd HH:mm:ss。

8.点击「预览记录」按钮查看抽取到的数据。

9.点击「确定」按钮保存。

4.5.2 配置MySQL组件4.5.2.1 创建数据库连接要使用Kettle操作MySQL，必须要建立Kettle与MySQL的连接，否则Kettle也不知道操作哪个MySQL库。1.双击「表输入」组件，会自动弹出配置窗口，点击「新建」按钮

2.配置MySQL连接(1)输入连接名称，此处用mysql_开头，数据库名称kettle_demo为结尾(2)在连接类型列表中，选择MySQL(3)输入连接方式: (4)输入MySQL的连接参数

3.点击测试按钮，测试Kettle是否能够正确连接到MySQL4.点击确认保存，到这里数据库连接就应该创建好了。

4.5.2.2 使用Kettle在MySQL中自动创建表要保存数据到MySQL，必须先要创建好表。那么，我们是否需要自己手动在MySQL中创建一个表，用来保存Excel中抽取过来的数据呢？答案是：不需要。Kettle可以自动为我们在MySQL中创建表。1.输入目标表的名称为：t_user，后续Kettle将在MySQL中创建一张名为 t_user 的表格。

2.点击下方的「SQL」按钮，可以看到Kettle会自动帮助我们生成MySQL创建表的SQL语句

将age、gender字段类型设置为INT

将 id 改为 primary key 防止出现重复插入的情况。

3.点击执行按钮。Kettle将会让MySQL执行该SQL脚本。执行完后，可以在DataGrip中刷新在数据库，可以查看到Kettle帮助我们创建的t_user表。

4.点击「确定」按钮，保存配置

4.6 保存并启动执行Kettle转换数据流图中的组件都已经准备好了，接下来就可以开始执行Kettle转换了。1.点击保存按钮保存转换。

2.点击工具栏上的播放按钮启动执行。

3.执行成功后，可以看到以下界面。组件上都显示了绿色的对号，执行结果中可以看到：转换完成！日志，说明Kettle的转换已经执行成功！！

4.7 确认执行结果Kettle是否已经帮助我们将Excel中的数据抽取并装载到MySQL呢？我们需要到MySQL中看一看，t_user表中是否有数据呢。在DataGrip中双击 t_user 表格，可以看到Excel中的数据都已经抽取到了MySQL。

到这里，恭喜你，程序员小姐姐小花的问题你已经帮她解决了，晚上让她请你吃个饭吧。5. Transformation(转换)开发5.1 共享数据库连接在后续的Kettle中，我们需要多次用到上面的数据库连接。那么是不是每一次都要创建数据库连接呢？这样就比较麻烦了。在Kettle中，可以将一个数据库共享，这样其他的Kettle转换就都可以复用该数据库连接了。1.在转换中，点击「主对象树」，点击[DB连接]右键新建数据库连接(如果连接已经存在，则无需创建)

2.右键单击需要的数据库连接，选择「共享」

3.发现刚刚选择的数据库连接已经变成黑体字，说明已经共享成功。

我们兴奋地发现，在新建的转换中，都可以看到该数据库连接了。这样就避免了每次我们都需要配置该数据库连接了。

5.2 表输入组件5.2.1 需求前面我们已经将Excel中数据抽取到了MySQL的t_user表中。

现在有了新需求，要将MySQL数据库中的 t_user 表中的数据抽取出来，装载到另外一张表 t_user1中。5.2.2 构建Kettle数据流图1.从核心对象的输入组件中，将「表输入」组件拖拽到中间的空白处。

2.从输出中将「表输出」组件拖拽到中间空白处。

3.安装Shift键，并鼠标左键点击表输入组件，并拉动鼠标，移动到表输出组件，松开鼠标。

5.2.3 配置Kettle数据流图中的组件接下来，需要指定，数据从哪个数据库中读取数据。5.2.3.1 配置表输入组件1.双击表输入组件，在弹出对话框中选择「获取SQL查询语句」。

2.选择 t_user 表，点击确定。

3.在弹出对话框中选择「否」。

4.点击「预览」按钮，查看是否能够从MySQL读取数据。

5.可以看到，Kettle中可以查看到 t_user 表中的数据。

5.2.3.2 配置表输出组件1.双击表输出组件，在目标表中输入 t_user1

2.点击「SQL」按钮，让Kettle中自动创建表结构。

3.可以看到，Kettle自动为我们生成了创建表的SQL语句。

4.我们可以到DataGrip中看到 t_user1 已经创建，但表中没有任何数据。

5.点击「确定」按钮保存。

5.2.4 保存并启动执行1.点击保存按钮保存该转换。

2.点击播放按钮执行，如果看到每个组件上都打上了绿色的对号，说明转换已经执行成功。

3.再打开DataGrip，刷新下表格，可以看到数据已经加载到 t_user1 中来了。

5.3 插入/更新组件5.3.1 组件介绍插入/更新组件能够将Kettle抽取的数据，与某个表的数据进行对比，如果数据存在就更新，不存在就插入。

5.3.2 需求修改 t_user中的张三这一行数据，修改age为22

同时，我们想要使用Kettle将 t_user1 中的张三这一行数据的age也修改为22。

5.3.3 测试之前开发的t_user_to_t_user1转换我们是否能够使用 t_user_to_t_user1.ktr转换来进行数据的同步呢？直接执行转换，我们发现，Kettle又将t_user表中的数据新增到了t_user1表中

说明，表输入组件根本无法同步数据，只是将抽取到的数据，装载到指定的表中。5.3.4 恢复数据为了方便后续的测试，我们需要恢复 t_user1中的数据。1.清空 t_user1 中的数据

2.点击OK执行清空

3.点击刷新按钮，发现数据已经清空

4.重新运行 t_user_to_t_user1.ktr 转换5.并将张三对应的年龄恢复为20

5.3.5 构建Kettle数据流图效果图：

开发步骤1.拖入一个表输入组件，用于读取 t_user 表中的数据。

2.从输出中拖入「插入/更新」组件。

3.将两个组件连接起来。

5.3.6 配置Kettle数据流图中的组件5.3.6.1 配置表输入组件1.双击表输入组件，点击获取SQL查询语句，选择 t_user1 表。

2.点击预览按钮，查看Kettle是否能够从MySQL中读取数据。

5.3.6.2 配置插入/更新组件1.双击插入/更新组件，点击浏览按钮，找到 t_user1 表。

2.添加用来查询的关键字，设置表字段为：id，比较符为：=，流里的字段为：id。

3.点击「获取和更新字段」，这样Kettle将会自动更新、或插入所有的字段。

5.3.7 保存并启动执行Kettle转换1.保存并启动该Kettle转换。

2.执行完后，打开DataGrip刷新 t_user1 表格，发现张三的年龄已经更新为22。

注：我们可以往 t_user 中添加一条数据，然后再执行Kettle转换，再用DataGrip查看 t_user1 表中是否也插入了一条数据。5.4 删除组件删除组件能够按照指定条件，将表中的数据删除。

5.4.1 需求有以下一个文本文件，文本文件包含了要删除的两个用户id：id392456197008193000267456198006210000需要使用Kettle将文本文件中两个ID对应的t_user1表的数据删除。5.4.2 构建Kettle数据流图效果图：1.将文本文件输入组件拖拽到中间的空白区域。

2.再从输出文件夹中输出一个「删除」组件。

3.按住Shift键，将两个组件连接到一起。

5.4.3 配置Kettle数据流图组件5.4.3.1 配置文本文件输入组件1.双击文本文件输入组件，点击浏览，找到资料/测试数据中的要删除的user_id.txt 文件，再点击OK按钮。

2.点击「增加」按钮。

3.再点击「字段」选项卡，点击「获取字段」，将文本文件中的字段读取出来。

4.点击预览记录按钮，可以查看到Kettle能够读取到文本文件中的内容。

5.4.3.2 配置删除组件1.双击删除组件，然后点击浏览按钮，选择 t_user1 表。

2.在查询值所需的关键字，设置要根据什么条件删除数据。这里表字段设置为：id，比较符设置为：=，流里的字段1设置为：id。

5.4.4 保存并启动运行

我们发现，在DataGrip中，指定ID的行已经被删除了。

5.5 排序记录组件5.5.1 组件介绍排序组件可以将Kettle数据流中的数据进行排序，可以指定升序、还是降序排列。

5.5.2 需求使用Kettle将t_user表中的用户数据，按照年龄升序排序，并将排序后的数据装载到Excel

5.5.3 构建Kettle数据流图效果图：

开发步骤1.将表输入组件拖拽到中间空白区域。

2.将转换文件夹中的「排序记录」拖拽到中间的空白区域。

3.再将输出文件夹中的Excel输出组件拖拽到中间空白区域。

4.按住Shift键将组件连接起来。

5.5.4 配置Kettle数据流图组件5.5.4.1 配置表输入组件1.双击表输入组件，选择数据库连接，然后点击获取SQL查询语句。再预览数据查看是否能够读取到 t_user 中的数据。

5.5.4.2 配置排序记录组件双击排序记录组件，设置字段名称为 age，升序选择「是」，这样该组件将会以 age 字段来进行升序排序。

5.5.4.3 配置Excel输出组件1.双击Excel输出组件，点击浏览按钮，选择要将Excel文件输出到哪个位置。

2.点击「获取字段」，并将age的格式设置为0。

5.5.5 保存并启动运行

打开Excel，发现所有数据都是按照年龄升序排序的。

5.6 switch/case组件5.6.1 机智的体育老师——条件判断有一天，体育老师要让班上的男女同学分别排成两队。但这个班上还有几名同学，很特殊——他们是蜘蛛！！所以，机智的体育老师需要把他们排成三队，男同学一队，女同学一队，蜘蛛一队。

体育老师要做一件非常重要的事情：判断学生是男孩还是女孩、或者是蜘蛛，然后让他们各自到指定的队伍中。

体育老师做的事情，我们同样也会在Kettle中会经常用来。在Kettle中，switch/case组件可以来做类似于体育老师要做的事情——判断。5.6.2 组件介绍switch/case提供了一种条件判断的实现。

5.6.3 需求从 t_user 表中读取所有用户数据，我们需要将性别为男的用户导出到一个Excel、性别为女的导出到另外一个Excel。5.6.4 构建Kettle数据流图效果图：

开发步骤1.将表输入组件拖拽到中间的空白区域。

2.从流程文件夹中将 Switch/case 组件拖拽到中间的空白区域。

3.再分别拖入两个Excel输出组件。

4.将组件按照下图方式连接起来。

5.6.5 配置Kettle数据流图组件5.6.5.1 配置表输入组件1.双击表输入组件，指定从 t_user 表中抽取数据。

5.6.5.2 配置switch/case组件1.此处要指定，按照性别来判断输出到Excel文件。需要设置 Switch字段为gender，在Case值列表中将值分别改为男、女。如果gender是男的话，则将数据装载到 Excel输出 - 男，如果gender是女的话，将数据装载到 Excel输出 - 女。

5.6.5.3 配置Excel输出组件1.双击Excel输出组件，分别指定输出到指定的文件夹中。

5.6.6 启动执行

Kettle会自动生成两个Excel文件，一个文件保存了性别为男的所有用户，另一个文件保存了性别为女的所有用户。5.7 SQL脚本组件接下来，我们来讲解一个高级用法。在实际开发中，也经常容易使用得到。假设我们有一段SQL脚本，想要用Kettle来执行，此时该使用哪个组件呢？5.7.1 组件介绍执行SQL脚本组件，可以让Kettle执行一段SQL脚本。我们可以利用它来自动执行某些操作。5.7.2 需求使用Kettle执行SQL脚本，将 t_user1 表中的数据清空。5.7.3 构建Kettle数据流图

5.7.4 配置Kettle数据流图组件参数

5.7.5 启动执行

我们发现，t_user1中的数据已经被完全清除掉了。说明：Kettle已经帮助我们执行了SQL脚本

5.8 设置转换参数5.8.1 需求让Kettle帮助我们删除指定省份的用户，具体删除哪个省份不确定，由执行Kettle时指定。首先我们可以使用执行SQL脚本组件来删除某个省份的用户，类似下图：

delete from t_user1 where province = '北京市'但如果把北京市写在执行SQL脚本组件中，那么每次删除的都是北京市的用户。而此处的需求是，要执行Kettle转换时，我们需要手动来指定要删除哪个省份的用户。此时就需要用到Kettle中的参数了。5.8.2 参数的使用方法双击Kettle转换的空白处，会弹出转换属性窗口。我们可以在属性窗口中找到命名参数选项卡，在里面配置Kettle转换所需要的参数。例如：下图设置了一个叫做province的参数

5.8.3 在SQL脚本组件中使用Kettle转换参数delete from t_user1 where province = '${province}'通过 ${province} 可以应用Kettle配置的转换参数，而且一定要勾选上：「变量转换」

5.8.4 运行带参数的转换在运行转换时，可以指定参数的值，例如：此处指定要删除的城市为北京市。

运行完后，我们发现：北京市的用户已经被删除了。

再来测试下删除河南省的用户：

同样，我们发现当执行完Kettle转换后，河南省的用户也被删除了。

6. JOB(作业)开发6.1 程序员小姐姐的第二次邂逅——JOB前几天帮助程序员小姐姐小花解决了使用Kettle从Excel中抽取数据到MySQL问题，小姐姐特别高兴，请你吃了一顿饭，好一顿魂牵梦绕。小姐姐好几天都没有联系了，今天小姐姐又抱着电脑来找你了。你知道，又有新的问题来了。项目经理要求小姐姐小花能够每5秒钟执行一次Kettle转换，也就是每5秒钟将Excel中的数据抽取并装载到MySQL中。怎么实现呢？要实现这个需求，我们需要学习Kettle的JOB，也就是作业。Kettle中的作业(job)定义了转换应该如何执行，可以配置转换来进行定时执行。6.2 JOB定时任务开发6.2.1 需求每5秒钟执行一次Kettle转换，也就是每5秒钟将Excel中的数据抽取并装载到MySQL中6.2.2 创建作业6.2.3 构建作业流组件图效果图：

开发步骤1.将核心对象中，通用文件夹下的 Start 组件拖拽到中间的空白区域。

2.将通用文件夹的「转换」组件拖拽到中间的空白区域。

3.将通用文件夹中的「成功」组件拖拽到中间的空白区域。

4.同样使用Shift键，将组件都连接起来。

6.2.4 配置作业流图组件6.2.4.1 配置转换组件配置转换这里选择作业中要执行的转换，此处选择之前开发好的excel_to_mysql.ktr即可

注意：此处要先保存作业，然后再配置转换。

6.2.4.2 配置Start启动组件我们需要在Start组件中，配置定时执行。

6.2.5 启动运行作业点击播放箭头启动作业，并观察数据库中的数据是否会5秒钟增加一次。

我们看到数据每隔5秒钟就会增加一次。7. Kettle的Linux系统部署7.1 Linux安装Kettle课程提供的Linux系统中已经安装好了Kettle，可以直接使用，kettle的安装文档请参考文档:06-安装Kettle.doc7.2 Pan转换执行引擎pan.sh可以用来在服务器中执行一个转换pan.sh的命令行参数: -version：显示版本信息 -file: 指定要运行的转换文件(XML文件) -level: 设置日志级别(Basic,Detailed,Debug,Rowlevel,Error,Nothing) -log: 指定日志文件 -param:key=value (该参数可以指定多个)需求：在Linux中，将 /root/kettle/user.txt数据抽取到 /root/kettle/out_user.xls 表格中id,name,age,gender,province,city,region,phone,birthday,hobby,register_date392456197008193000,张三,20,0,北京市,昌平区,回龙观,18589407692,1970-8-19,美食;篮球;足球,2018-8-6 9:44267456198006210000,李四,25,1,河南省,郑州市,郑东新区,18681109672,1980-6-21,音乐;阅读;旅游,2017-4-7 9:14892456199007203000,王五,24,1,湖北省,武汉市,汉阳区,18798009102,1990-7-20,写代码;读代码;算法,2016-6-8 7:34492456198712198000,赵六,26,2,陕西省,西安市,莲湖区,18189189195,1987-12-19,购物;旅游,2016-1-9 19:15392456197008193000,张三,20,0,北京市,昌平区,回龙观,18589407692,1970-8-19,美食;篮球;足球,2018-8-6 9:44392456197008193000,张三,20,0,北京市,昌平区,回龙观,18589407692,1970-8-19,美食;篮球;足球,2018-8-6 9:44实现步骤：1、在 windows 中开发转换，将文本文件数据抽取装载到Excel文件中

2、抽取路径参数，通过参数指定输入路径和输出路径

3、将转换配置保存为transform_param.ktr文件 4、将数据文件user.txt和转换文件transform_param.ktr都上传到 /root/kettle目录5、使用 pan.sh 执行转换cd /root/kettlepan.sh -file transform_param.ktr -level Basic -param:input=/root/kettle/user.txt -param:output=/root/kettle/output_user

6、结果查看在/root/kettle目录会生成输出文件output_user.xls

从Linux将该文件下载下来查看内容

7.3 Kitchen作业执行引擎在Linux中对Kettle做Linux配置(和Windows相同，添加驱动jar包)1、在Windows中开发作业

2、配置Start组件

2、配置转换组件修改4.5中Excel存入Mysql的转换配置如下

将转换文件保存为2-excel-mysql.ktr中作业转换配置如下:

${Internal.Entry.Current.Directory}/2-excel-mysql.ktr

1、配置作业命名参数

2、将作业配置到9-linux-job.kjb文件中，并将该job文件和user.xlsx文件上传到Linux服务器的/root/kettle/目录,

7、使用kitchen.sh执行作业cd /root/kettlekitchen.sh -file 9-linux-job.kjb -level Basic -param:input=/root/kettle/user.xlsx

打开可查看终端信息，发现每隔5秒钟执行一次转换任务

最后查看t_user表，发现每隔几秒，数据会增多几行数据

8. 问题1：错误连接数据库[MySQL]报错：无法连接到数据库。

解决办法：将MySQL的驱动包复制到 pdi-ce-8.2.0.0-342\data-integration\lib 中，然后重启kettle

你可能感兴趣的:(etl,数据仓库,数据库)

GaussDB 权限管理：从 RBAC 到精细化控制的技术实践如清风一般 gaussdb
GaussDB权限管理：从RBAC到精细化控制的技术实践一、引言在分布式数据库环境中，权限管理是保障数据安全和合规性的核心环节。GaussDB（开源版及云服务版）提供了一套完整的权限管理体系，支持基于角色的访问控制（RBAC）、细粒度权限分配和动态审计等功能。本文将深入解析GaussDB的权限管理模型、操作方法及实战技巧。二、GaussDB权限管理模型核心对象与层级GaussDB的权限管理围绕以下
数据库左连接、右连接、内连接、全连接 872792silence 数据库 mysql
在数据库增删改查中，数据通常不在同一张表中，涉及多表数据查询就需要表之间的连接方式，常用的数据库表连接方式有；1）内连接：innerjoin2）全连接：union3）右连接（右外连接）：rightjoin4）左连接（左外连接）：leftjoin例子：一、内连接内连接查询的是两张表（多表）的交集sql语句：select*fromAinnerjoinBonA.id=B.id也可以写成：select*f
AntDesignPro动态路由配置全攻略 bemyrunningdog 前后端
目录AntDesignPro前后端动态路由配置指南(TypeScript+Java)一、整体架构二、Java后端实现1.数据库设计(MySQL)2.实体类定义3.DTO对象4.服务层实现5.控制器三、前端实现(TypeScript)1.定义路由类型2.路由转换器3.应用配置(app.tsx)4.路由加载优化四、权限控制整合1.Java端权限检查2.前端权限整合五、部署优化方案六、生产环境建议七、完
Java高级工程师面试模拟：高并发电商秒杀系统设计与技术解析搞Java的小码农 Java技术场景题 Java 面试技术面试后端开发 Spring Redis Kafka
《Java高级工程师面试模拟：高并发电商秒杀系统设计与技术解析》场景设定面试地点：某互联网大厂的现代化办公区，面试室宽敞明亮，面试官坐在主位，表情严肃而专注，小兰则坐在对面，自信满满但内心略显紧张。第1轮：Java核心、基础框架与数据库问题1：Java中的ConcurrentHashMap是如何保证线程安全的？面试官：小兰，ConcurrentHashMap是Java中常用的线程安全集合，请简单说
Docker快速构建Hive测试环境静谧星光 docker hive 容器编程
Docker是一种流行的容器化平台，可以帮助我们快速构建和管理应用程序的环境。在本文中，我们将学习如何使用Docker快速构建Hive测试环境。Hive是一个基于Hadoop的数据仓库基础设施，它提供了一种类似于SQL的查询语言，用于分析和处理大规模数据集。步骤1：安装Docker和DockerCompose首先，我们需要安装Docker和DockerCompose。您可以根据您的操作系统类型，从
MsSql 其他（2） hello 早上好 #面试汇总-MySql 数据库 mysql
✨✨✨✨✨✨✨✨✨✨✨✨✨✨✨Mysql中的MVCC一、MVCC的核心目标与设计背景MVCC（Multi-VersionConcurrencyControl，多版本并发控制）是InnoDB存储引擎为实现高并发事务处理而设计的核心机制。其核心目标是：在不牺牲事务隔离性的前提下，通过“读不阻塞写，写不阻塞读”的方式，大幅提升数据库的并发性能。传统数据库的并发控制依赖锁机制（如读锁、写锁），但锁会导致读
多线程导出excel高并发_表格存储：使用TableStoreWriter进行高并发、高吞吐的数据写入-阿里云开发者社区... rayyangul 多线程导出excel高并发
概述表格存储(原OTS)的一大特性是能够支撑海量数据的高并发、高吞吐率的写入，特别适合日志数据或物联网场景(例如轨迹追踪或溯源)数据的写入和存储。这些场景的特性是，会在短时间内产生大量的数据需要消化并写入数据库，需要数据库能够提供高并发、高吞吐率的写入性能，需要满足每秒上万行甚至上百万行的写入吞吐率。针对这些场景，我们在存储层做了很多的优化(本篇文章不赘述)，同时在SDK接口层也做了一些优化，专门
spring boot 之集成mybatis-plus、druid整合多数据源我叫晨曦啊 spring boot spring boot mybatis 后端 java mysql
springboot版本：2.3.12.RELEASEMySQL版本：8.0数据表准备--数据库test1CREATETABLE`t_product`(`id`intNOTNULLAUTO_INCREMENT,`produce_name`varchar(255)CHARACTERSETutf8mb4COLLATEutf8mb4_general_ciDEFAULTNULL,`produce_pric
存储延时数据，帮你选数据库和缓存架构呢喃coding 系统架构设计架构
1.理解存储媒介量化延时类别描述延时缓存/内存L1cachereference1ns缓存/内存L2cachereference4ns缓存/内存Mainmemoryreference（DDR4，5-10ns为补充说明）100ns网络传输SendpacketCA->Netherlands->CA150,000,000ns（150ms）磁盘存储HDD(HardDiskDrive)读写1-10ms磁盘存储
C#配置全面详解：从传统方式到现代配置系统阿蒙Armon C#工作中的应用 c#网络数据库
C#配置全面详解：从传统方式到现代配置系统在软件开发中，配置是指应用程序运行时可调整的参数集合，如数据库连接字符串、API地址、日志级别等。将这些参数从代码中分离出来，便于在不修改代码的情况下调整应用行为。C#提供了多种配置管理方式，从传统的XML配置文件到现代的多源配置系统，每种方式都有其适用场景。本文将全面介绍C#中的配置技术，帮助开发者根据项目需求选择合适的配置方案。一、配置基础与核心概念1
什么是DO、DTO、VO、BO、AO，还在傻傻分不清？今天一文带你了解这些概率 Gq.xxu java 系统架构
在分层架构的Java应用中，DO、DTO、VO、BO、AO等概念用于解耦不同层级的数据传递和业务逻辑。它们分别承担不同职责，以下是对这些概念的详细解释：1.DO（DataObject/DomainObject）定义：与数据库表结构直接映射的对象，通常由DAO层操作。用途：在数据访问层（DAO）中承载数据库查询结果，如UserDO对应user表字段。特点：属性与数据库字段一一对应。仅包含数据，不包含
clickhouse数据库表和doris数据库表迁移starrocks数据库时建表注意事项总结积跬步，慕至千里软件安装及程序错误解决方案集数据库 clickhouse
目录零、前言一、clickhouse数据库表在starrocks数据库建表时问题总结1.1数据类型类问题：1.2数据导出阶段：二、doris数据库表在starrocks数据库建表时问题总结2.1properties不支持的属性（直接删除）：2.2properties需修改属性2.3properties：doris建表语句分区明细，starrocks数据不需要明确设定，会自动更新2.4分桶设置问题2
【LLM】Llama-Index 架构 FOUR_A LLM llama 架构
数据源（DataSources）PDF/文档数据库API网页音频/视频知识库自定义源数据连接器（DataConnectors）用于从各种数据源提取和加载数据，以便进行索引和查询。1.SimpleDirectoryReader含义：简单目录读取器。功能：主要用于读取本地文件系统中的目录内容。它可以列出目录中的文件和子目录，通常用于文件管理或数据预处理阶段。例如，在一个数据处理项目中，你可能需要列出某
软考（软件设计师）数据库原理-数据库规范化理论，四大范式，完整性约束
关系数据库规范化理论，四大范式，完整性约束关系数据库规范化是一种组织数据库表结构和字段的技术，目的是减少数据冗余、消除更新异常，并确保数据依赖的合理性。一、范式基本概念范式（NormalForm）是符合某一种级别的关系模式的集合，分为1NF、2NF、3NF、BCNF、4NF、5NF等，级别越高约束越严格。二、各范式详细说明1.第一范式（1NF）要求：表中每个字段都是原子性的，不可再分每个字段具有相
基于新型非易失性内存（NVM）的数据库事务日志优化技术详解瑕疵热点资讯数据库
博客主页：瑕疵的CSDN主页Gitee主页：瑕疵的gitee主页⏩文章专栏：《热点资讯》基于新型非易失性内存（NVM）的数据库事务日志优化技术详解基于新型非易失性内存（NVM）的数据库事务日志优化技术详解基于新型非易失性内存（NVM）的数据库事务日志优化技术详解引言传统事务日志的挑战1.性能瓶颈分析2.典型性能对比NVM事务日志优化技术1.日志结构设计2.原子写入优化3.崩溃恢复机制性能优化策略1
微算法科技（NASDAQ: MLGO）探索Grover量子搜索算法，利用量子叠加和干涉原理，实现在无序数据库中快速定位目标信息的效果。 MicroTech2025 算法科技数据库
在信息爆炸的时代，数据的海量化带来了前所未有的挑战，如何从庞大的数据库中迅速找到所需信息，成为信息技术领域亟待解决的问题。传统的搜索算法在面对大规模数据时，效率逐渐下降，难以满足现代社会的需求。量子计算的出现为解决这一问题带来了新的思路和方法，Grover量子搜索算法作为量子计算领域的重要算法之一，在快速搜索目标信息方面具有巨大潜力。Grover量子搜索算法是一种基于量子力学原理的搜索算法，它利用
亲测有效！鸿蒙App用户数据备份与恢复全攻略（含代码）前端世界 harmonyos harmonyos 华为
摘要在鸿蒙（HarmonyOS）应用开发中，用户数据的安全和持久保存是非常关键的一环。不管是用户的登录信息、操作记录，还是偏好设置，若能提供备份和恢复功能，不仅能有效提升用户体验，也能在换设备、卸载重装后保留数据。本文将带你从头到尾实现一套用户数据的本地备份与恢复机制，涵盖数据库读取、文件写入、数据解析等，配合可运行的Java示例代码，并结合真实应用场景拆解原理和细节。引言在移动设备上运行的鸿蒙应
Apache SeaTunnel × Hive 深度集成指南：原理、配置与实践数据库
在大数据处理的复杂生态中，数据的高效流转与整合是实现数据价值的关键。ApacheSeaTunnel作为一款高性能、分布式、易扩展的数据集成框架，能够快速实现海量数据的实时采集、转换和加载；而ApacheHive作为经典的数据仓库工具，为结构化数据的存储、查询和分析提供了坚实的基础。将ApacheSeaTunnel与Hive进行集成，能够充分发挥两者的优势，构建起高效的数据处理链路，满足企业多样化的
文献分享: 注释数据库＆溯源半环理论(Part2) Dann Hiroaki 文献阅读笔记数据库抽象代数
文章目录3.\textbf{3.}3.处理递归查询:基于Datalog\textbf{Datalog}Datalog3.1.\textbf{3.1.}3.1.关于Datalog\textbf{Datalog}Datalog3.1.1.\textbf{3.1.1.}3.1.1.Datalog\textbf{Datalog}Datalog基本结构3.1.2.Datalog\textbf{3.1.2.}
C# 项目卷纸要用清风的 C#c#开发语言
语言基础开发环境与工具框架与库数据库与数据存储项目架构与设计模式前端技术（全栈开发场景）版本控制与协作测试与质量保障部署与运维安全实战项目建议学习资源推荐总结语言基础C#语法：变量、数据类型、控制流（条件语句、循环）、运算符、异常处理（try-catch）等。面向对象编程（OOP）：类与对象、继承、多态、封装、接口、抽象类。高级特性：委托（Delegate）与事件（Event）LINQ（Langu
MySQL数据库主从复制 KellenKellenHao 数据库 mysql
概述1、master开启二进制日志记录2、slave开启IO进程，从master中读取二进制日志并写入slave的中继日志3、slave开启SQL进程，从中继日志中读取二进制日志并进行重放4、最终，达到slave与master中数据一致的状态，我们称作为主从复制的过程。基础环境设置防火墙和上下文#主从[root@slave~]#systemctldisable--nowfirewalldRemov
MySQL8数据库高级特性 KellenKellenHao oracle 数据库 sql
创建测试表 createdatabasejxcharactersetutf8; usejx; my>descusers; +----------+-------------+------+-----+---------+----------------+ |Field |Type |Null|Key|Default|Extra | +----------+-------------+--
【学习教程】遥感、GIS和GPS技术在水文、气象、灾害、生态、环境及卫生等领域中的应用
【内容简介】：第一讲3S技术及软件简介1.13S技术及应用案例文献解析1.23S技术软件（ArcGIS、ENVI）简介1.3如何快速掌握ArcGIS1.4ArcGIS界面及数据加载1.5文档保存方式第二讲ArcGIS数据管理2.1ArcGIS数据类型与数据结构2.2shapefile数据、个人地理数据库MDB和文件地理数据库GDB2.3地理空间数据建库的理论、方法和步骤2.4ArcGIS数据管理第
领域驱动设计实战：用六边形架构解耦你的Spring Boot应用 lingRJ777 Java技术栈应用 java backend springboot ddd microservices
领域驱动设计实战：用六边形架构解耦你的SpringBoot应用引言在复杂的软件系统中，业务逻辑的持续演进和技术栈的不断更迭是两大核心挑战。以一个典型的电商系统为例，其订单处理模块不仅业务规则繁多（如价格计算、库存校验、优惠券使用、订单状态流转），还需与多种外部系统交互（如Web请求、数据库、消息队列、第三方支付接口）。在传统的N层架构中，我们常常会遇到以下核心挑战：技术债与僵化设计：业务逻辑与具体
分库分表之实战-sharding-JDBC水平分库+水平分表配置实战软件编程在线接单（需要可私）分库分表后端 java 数据库 mysql 分布式
大家好，我是工藤学编程一个正在努力学习的小博主，期待你的关注实战代码系列最新文章C++实现图书管理系统（QtC++GUI界面版）SpringBoot实战系列【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战环境搭建大集合环境搭建大集合(持续更新）分库分表分库分表之实战-sharding-JDBC广播表前情摘要：1、数据库
数据库表结构设计实战：从基础到商品三级分类实现 Code季风 GORM从入门到精通数据库 sql 微服务 golang 学习前端
数据库表结构设计是后端开发的基石，良好的设计能提升系统性能、降低维护成本。本文将从基础概念讲起，结合商品三级分类的实战案例，详解表结构设计的核心思路与最佳实践。一、数据库表结构设计基础1.关系数据库的核心约束与索引（1）列约束：保证数据完整性主键约束（PRIMARYKEY）：唯一标识表中每条记录，不可重复且非空。通常用id字段，如idINT32PRIMARYKEYAUTO_INCREMENT。外键
MemberCenter是一个为Typecho博客系统开发的综合性会员管理插件独立开发者阿乐原创 ai AI编程 AI写作前端 php html
文章目录Typecho会员中心插件插件介绍框架设计目录结构插件优势详细功能1.用户中心2.积分系统3.文章管理4.评论管理5.卡密系统6.推广返利7.后台管理安装方法使用说明访问地址会员等级后台管理功能前端显示配置选项常见问题1.数据库表未创建或遇到数据库错误？2.积分规则不生效？3.如何自定义会员中心样式？4.卡密兑换提示错误？5.会员等级没有自动更新？更新日志1.2.0(2025-02-23)
SQLShift 重磅更新：支持 SQL Server 存储过程转换至 GaussDB！
SQLShift作为一款多元异构数据库的SQL方言转换工具，在过去两个月，陆续支持了Oracle存储过程➝OceanBase/PostgreSQL的语法转换，本期让我们一起看看又有哪些新能力吧！https://www.bilibili.com/video/BV1253jzTE8t/?aid=114792748552...新特性速览✔️SQLServer存储过程➝GaussDB函数重构：支持T-SQ
尝试加载 Oracle 客户端库时引发 BadImageFormatException，如果在安装32位Oracle 客户端组件的情况下64位模式运行，将出现此问题尊治自动化 oracle 数据库 sql
1.错误发生的时的情况电脑软件配置：WIN10(64位)、Oracle12c(64位)、PLSQLDeveloper（64位），VS2019用VS2019工具栏里的连接到数据库功能连接Oracle时报错误，错误内容：尝试加载Oracle客户端库时引发BadImageFormatException，如果在安装32位Oracle客户端组件的情况下64位模式运行，将出现此问题根本原因:基本都是软件访问调
时序数据库：高效处理时间序列数据的核心技术时序数据说时序数据库数据库开源物联网 iotdb
时序数据库概述时序数据库（TimeSeriesDatabase，TSDB）是一种专门为存储、处理和查询时间序列数据而优化的数据库系统。随着物联网、金融科技、工业互联网等领域的快速发展，时序数据呈现出爆炸式增长，传统的关系型数据库在处理这类数据时面临诸多挑战，时序数据库应运而生并成为关键技术解决方案。时序数据的特点时序数据具有几个显著特征，这些特征直接影响了时序数据库的设计理念：时间属性：每条记录都
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj

第三章 可视化ETL平台——Kettle

你可能感兴趣的:(etl,数据仓库,数据库)

第三章可视化ETL平台——Kettle