E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
kettle
大数据&ETL&
kettle
学习积累
以下为本博客及其他资料的分享:大数据:Kudu的学习Sqoop同步数据命令HBASE知识积累大数据Hive的学习积累HDFS的学习积累impala-shellNotConnected的问题Azkaban介绍与使用Hive、Impala和Hbase的区别CDH大数据平台搭建:大数据平台CDH的介绍和5.16/6.3版本的搭建大数据CDH问题解决总结ssh免秘钥登录大数据时间同步之ntpLinux知识
大宇进阶之路
·
2020-06-29 19:22
大数据
ETL
大数据离线数据数据仓库项目(一)
基于项目需求实现查询功能(写SQL)或整理出查询流程阶段二学习、掌握
kettle
的使用、使用
kettle
将项目需求所需的数据在MYsql同步到Hive使用sqoop,将剩余的数据在MYsql同步到Hive
真情流露哦呦
·
2020-06-29 09:35
千亿离线数据仓库项目
Kettle
学习笔记
本文简要整理一下
Kettle
学习过程中的相关文档官网https://community.hitachivantara.com/docs/DOC-1009855-data-integration-
kettle
https
bluexiii
·
2020-06-29 02:38
使用
kettle
工具将文本数据导入到 mysql8.0
本地文件:test_user.txtmylsq8.0:test库test_user表下载:
kettle
工具(下面演示版本7.1)http://mirror.bit.edu.cn/pentaho/Data
小刁缘
·
2020-06-29 01:23
其它
Kettle
将数据转成JSON格式后通过restClient发送POST请求
第一步:处理好自己的数据,然后转成JSON格式,使用JSONOutput控件,并且把要转成JSON并发送出去的字段和元素名称的映射关系对应好数据条目行数选择不填,填数字将会按照填写的数字拆分数据,会导致后面发送POST请求变成一条一条传,效率低下输出值outputValue作为保存你转换后所有数据的对象,然后字段页面给要发送出去的字段赋好元素名第二步在常量设置要使用的POST请求头第三步使用res
YanKingONE
·
2020-06-29 00:18
kettle
Pentaho
Kettle
二次开发(简单数据交换)之
Kettle
连接达梦数据库思路及实现方式
过程很曲折,具体实现很简单,话不多说,直接上代码。需要在数据库连接的xml字符串配置中增加如下标签:*达梦数据库连接额外添加配置:*1.数据库类型选择通用连接*type:Genericdatabase*2.需要在connection标签中额外配置达梦数据库的数据库驱动和连接方式如下*""+*""+*"CUSTOM_DRIVER_CLASS"+*"dm.jdbc.driver.DmDriver"+*
GoSir1
·
2020-06-28 23:41
Kettle
Pentaho
Kettle
二次开发(简单数据交换)之SpringBoot+Maven集成
Kettle
根据
Kettle
转化的特性,仅需要配置以下几个属性:1.输入输出数据库属性2.输入输出表名,输出数据表数据池,可设计灵活配置SQL限制范围。3.字符串数组形式的输入输出表字段。
GoSir1
·
2020-06-28 23:41
Kettle
SpringBoot
Pentaho
Kettle
二次开发(简单数据交换)之使用
Kettle
源码获取连接数据库模式(用户)信息、表、字段
上篇我们讲到DatabaseMeta.class这个类,用来配置数据库连接属性,今天介绍核心类Database.class。Database.class为数据库连接类,与数据库相关联的所有直接操作方法均可以在这个类中找到,如:连接,断开连接,获取用户、模式、获取全部表,获取表全部字段+字段类型,提交操作,插入操作,更新操作等。这个类值得大家去学习一下他对对数据库连接的封装,对数据库操作的封装。Da
GoSir1
·
2020-06-28 23:10
Kettle
Pentaho
Kettle
二次开发(简单数据交换)之测试数据库连接状态(包括达梦数据库)
通过查看
Kettle
源码,发现DataBaseMeta.class这个类负责数据库连接属性配置相关操作。
GoSir1
·
2020-06-28 23:10
Kettle
Kettle
源码分析
最近做一个大型项目需要做数据的抽取和标准化处理,我们利用一款国外的开源工具
Kettle
,对
Kettle
的核心包进行二次开发,应用到我们的Java项目中。
梦是做出来的
·
2020-06-28 22:49
kettle
kettle
安装与配置
文章目录1相关文件下载2安装2.1window环境安装安装3
kettle
关键字说明(未完待续...)1相关文件下载
kettle
国内镜像下载地址:http://mirror.bit.edu.cn/pentaho
诸葛老刘
·
2020-06-28 22:32
工具使用
Kettle
(ETL利器)实战应用大全
ETL工具
Kettle
最全的实战应用详细列举了
kettle
的——安装、使用、问题、企业项目实战的解决方案。
逆転
·
2020-06-28 22:39
使用手册
kettle
ETL-
kettle
-自定义错误信息处理
在
kettle
执行的过程中,如果遇到错误,
kettle
会停止运行。在某些时候,并不希望
kettle
停止运行,这时候可以使用错误处理(StepErrorHandling)。
咸鱼(。・∀・)ノ゙嗨
·
2020-06-28 21:41
DB
[目录]Pentaho
Kettle
解决方案:使用PDI构建开源ETL解决方案
第一部分:开始1ETL入门1.1OLTP和数据仓库对比1.2ETL是什么1.2.1ETL解决方案的演化过程1.2.2ETL基本构成1.3ETL、ELT和EII1.3.1ETL1.3.2EII:虚拟数据整合1.4数据整合面临的挑战1.4.1方法论:敏捷BI1.4.2ETL设计1.4.3获取数据1.4.4数据质量1.5ETL工具的功能1.5.1链接1.5.2独立平台1.5.3数据规模1.5.4设计灵活
weixin_34405557
·
2020-06-28 18:32
如何通过java集成C
kettle
实现远程调用C
kettle
集群
packagecom.hry;importorg.pentaho.di.cluster.SlaveServer;importorg.pentaho.di.core.
Kettle
Environment;importorg.pentaho.di.core.Result
lzg880613
·
2020-06-28 16:16
Ckettle;远程;集群
使用
KETTLE
从mysql同步增量数据到oracle
2019独角兽企业重金招聘Python工程师标准>>>初次使用ETL工具抽取并同步数据,搜索之后决定使用
kettle
,使用后感觉很方便。
weixin_34279061
·
2020-06-28 15:08
如何彻底解决
Kettle
无法连接MySQL8的缺陷?
如何彻底解决
Kettle
无法连接MySQL8的缺陷?
lzg880613
·
2020-06-28 15:50
ETL内容
Kettle
系列文章二(安装配置
Kettle
+SqlServer+简单的输入输出作业)
一、下载
Kettle
下载地址:https://community.hitachivantara.com/docs/DOC-1009855下拉到DownLoad,点击红框中的链接进行下载。.
weixin_34167819
·
2020-06-28 12:36
ETL工具
1.
Kettle
1.多多使用获取字段按钮2.表输入中的数字字段(如:COUNT(1))会自动转换为小数点后一位,可以在获取变量时转为Integer,或者to_char(count(1))3.从表输入如果
PeterWang2017
·
2020-06-28 12:05
基于web版
kettle
开发的用户专业版B/S架构工具
代码地址如下:http://www.demodashi.com/demo/13399.html#web
Kettle
ETL产品介绍精卫ETL平台,创造性的将平台构建为B/S架构的ETL模型设计以及集成用户专业调度管理的分布式
weixin_34015336
·
2020-06-28 09:20
kettle
教程(1) 简单入门、
kettle
简单插入与更新。打开
kettle
本文要点:
Kettle
的建立数据库连接、使用
kettle
进行简单的全量对比插入更新:
kettle
会自动对比用户设置的对比字段,若目标表不存在该字段,则新插入该条记录。若存在,则更新。
weixin_30859423
·
2020-06-28 01:59
Kettle
和其它几种 ETL 工具(包括 Informatica)的比较
成本:软件成本包括多方面,主要包括软件产品,售前培训,售后咨询,技术支持等。开源产品本身是免费的,成本主要是培训和咨询,所以成本会一直维持在一个较低水平。商业产品本身价格很高,但是一般会提供几次免费的咨询或支持,所以采用商用软件最初成本很高,但是逐渐下降。手工编码最初成本不高,主要是人力成本,但后期维护的工作量会越来越大。风险:项目都是有风险的尤其是大项目。项目的风险主要包括:超出预算,项目延期,
weixin_30832405
·
2020-06-28 01:03
KETTLE
初学者使用教程
Kettle
的建立数据库连接、使用
kettle
进行简单的全量对比插入更新:
kettle
会自动对比用户设置的对比字段,若目标表不存在该字段,则新插入该条记录。若存在,则更新。
weixin_30736301
·
2020-06-28 00:19
kettle
plugin 插件开发
http://wiki.pentaho.com/display/COM/PDI+Plugin+Loadingsvn://source.pentaho.org/svn
kettle
root/plugins/
weixin_30675967
·
2020-06-27 23:57
大数据项目——互联网精准营销——数据清洗
使用
kettle
进行数据清洗:1.新建转换去除手机销售信息表的重复记录要求:去除该字段中的所有空格,方便后续聚合统计,字母统一大小写,去除该字段中的所有特殊字符(各种标点符号)这里可选用排序加去重组件,
weixin_30633405
·
2020-06-27 22:56
jdbc认为mysql datetime默认值无效
今天想使用
kettle
抽取一张30W记录的表,我想简单的看一下
kettle
抽取的效率,不想在抽取至7999行时报错。
weixin_30604651
·
2020-06-27 22:05
六种 主流ETL 工具的比较(DataPipeline,
Kettle
,Talend,Informatica,Datax ,Oracle Goldengate)...
六种主流ETL工具的比较(DataPipeline,
Kettle
,Talend,Informatica,Datax,OracleGoldengate)比较维度\产品DataPipeline
kettle
OracleGoldengateinformaticatalendDataX
weixin_30602505
·
2020-06-27 22:59
Kettle
资源库配置(数据库资源库和文件资源库)
一》文件资源库配置1.建立文件资源库:点击工具->资源库->连接资源库菜单使用文件资源库不需要用户名和密码,如果没有资源库可以点击右上角的"+"新建资源库,如下图:第一种方式为建立数据库的资源库,本例选择使用文件资源库,选择确定后会要求选择文件资源库的路径,并给文件资源库设置一个ID和名称2.创建转换和任务如下图,随意创建一个转换然后保存到资源库中,创建任务方式基本相同;3.浏览资源库内容如上图有
weixin_30586257
·
2020-06-27 21:59
kettle
学习笔记(一)——入门与安装
一、概述1.
kettle
是什么
Kettle
是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
weixin_30522183
·
2020-06-27 21:39
ETL工具
Kettle
使用以及与Java整合实现数据清洗
本文主要讲述
kettle
的使用和与Java整合,具体下载与安装请自行百度!
weixin_30436101
·
2020-06-27 19:26
Kettle
4.2源码分析第四讲--
Kettle
Job机制与Database插件简介(含讲解PPT)
1.Job机制一个job项代表ETL控制流中的一项逻辑任务。Job项将会顺序执行,每个job项会产生一个结果,能作为别的分支上job项的条件。图1job项示例1.1.Job类图简介图2Jobentry类图结构1.1.1.JobEntryInteface接口JobEntryInterface是JobEntry插件的主要实现接口。主要包含以下功能:1保存JobEntry设置实现类使用私有变量保存设置的
weixin_30399821
·
2020-06-27 19:50
kettle
抽取数据判断是否有数据
kettle
分为两种对象,一种是作业,另一种是转换,判断是否有数据,在作业中实现即可。
weixin_30379911
·
2020-06-27 18:04
大数据之
kettle
安装
1.
kettle
安装地址官网地址:https://community.hitachivantara.com/s/article/data-integration-
kettle
下载地址:https://sourceforge.net
weixin_30293079
·
2020-06-27 15:21
Kettle
4.2源码分析第一讲--
Kettle
简介
PentahoDataIntegration(PDI)简介1.PDI结构简介图1‑1PDI核心组件Spoon是构建ETLJobs和Transformations的工具。Spoon可以以拖拽的方式图形化设计,能够通过spoon调用专用的数据集成引擎或者集群。DataIntegrationServer是一个专用的ETLServer,它的主要功能有:功能描述执行通过PentahoDataIntegrat
weixin_30289831
·
2020-06-27 15:12
Kettle
7 ( Pentaho Data Integration )源码分析 每个step都有一个线程负责运行
Kettle
7要求Java环境是Java8
Kettle
中的Transformation中包含多个step组件,当运行transformation时,这些组件并不是串行初始化的(数据!
weidenglu11
·
2020-06-27 14:23
kettle7
nifi入门
目前常用的ETL工具如
kettle
(PDI),spoop以及商业软件OracleGoldenGate等。今天
wangqingming1989
·
2020-06-27 13:41
ETL
kettle
系列之五
kettle
远程执行和调度
参考http://www.cnblogs.com/John-Young/p/6349252.htmlhttps://wenku.baidu.com/view/fb20216858fafab069dc0241.html说明,不涉及集群搭建,只是远程执行作业的设定使用场景本地设计好job之后,本地无法连接到目标数据库的时候,需要上传到某个可以连接数据库的服务器(安装了PDI)执行。启动服务器参考命令:
copywang_1992
·
2020-06-27 13:53
kettle
kettle
系列之四 linux下使用
kettle
执行和调度
在linux环境下使用
kettle
安装JDK1.8以上参考链接:https://blog.csdn.net/zzq900503/article/details/51879745版本要求viSpoon.bat
copywang_1992
·
2020-06-27 13:21
kettle
Kettle
的一些常见问题
摘要:本文主要介绍使用
kettle
设计一些ETL任务时一些常见问题,这些问题大部分都不在官方FAQ上,你可以在
kettle
的论坛上找到一些问题的答案1.Join我得到A数据流(不管是基于文件或数据库),
酷酷的糖先森
·
2020-06-27 10:04
大数据
Linux服务器使用
kettle
抽取Oracle数据库数据, IO Error: Connection reset
Linux服务器使用
kettle
抽取Oracle数据库数据,偶尔会发生异常IOError:Connectionreset详细异常信息:2019/04/2511:51:30-vms_factorystock-ERROR
十五楼亮哥
·
2020-06-27 07:45
大数据
Kettle
— 常用组件使用
前言
Kettle
控件分为三种:转换控件、作业控件和Hop(跳)。转换控件输入控件表输入表输入控件是从数据库的表中读取数据的控件。我们可以在表中输入SQL语句(或者通过获取SQL查询语句获取)。
永远_不会懂
·
2020-06-27 07:11
Kettle
Kettle
— 安装和部署
前提
Kettle
是纯Java编写的ETL开源工具,目前
Kettle
7和
Kettle
8都需要Java8或者以上才能正常运行。
永远_不会懂
·
2020-06-27 07:39
Kettle
kettle
安装
部署
carte
Kettle
— 使用手册
Kettle
是ETL中其中一个开源工具,基于纯Java开发。
永远_不会懂
·
2020-06-27 07:39
Kettle
Kettle
— 源码启动和代码结构分析
众所周知
Kettle
是一个开源的项目,所有我们有必要把
Kettle
的源码pull下来进行简单的分析,搞清楚
Kettle
的执行原理和实现过程。首先我们需要从Github中将源代码Pull下来。
永远_不会懂
·
2020-06-27 07:07
Kettle
Kettle
— Spoon加载源码解析
在
Kettle
中,我们知道Spoon是其中最重要的一个组件。它可以让我们以图形化的方式开发转换和作业等工作。在spoon中
Kettle
采用了Xul界面技术和Swt相结合的方式进行图形界面的开发。
永远_不会懂
·
2020-06-27 07:07
Kettle
如何提高Pentaho
Kettle
的MySQL写入速度
使用
Kettle
的初期,一般只是关注Tranaction如何实现功能,对连接参数可以说基本不关注,其实这里面隐含一些性能问题,如果不熟悉这些性能参数,要想提高性能还真的不容易。
smooth00
·
2020-06-27 06:14
ETL学习总结(2)——ETL数据集成工具之
kettle
、sqoop、datax、streamSets 比较
常见的ETL工具或类ETL的数据集成同步工具很多,以下对开源的
Kettle
、Sqoop、Datax、Streamset进行简
科技D人生
·
2020-06-27 04:40
ETL学习总结
kettle
启动闪退,报错
##AfatalerrorhasbeendetectedbytheJavaRuntimeEnvironment:##SIGSEGV(0xb)atpc=0x00007ff2c237302c,pid=10261,tid=140680619304704##JREversion:Java(TM)SERuntimeEnvironment(7.0_45-b18)(build1.7.0_45-b18)#Java
不吃草的牛德
·
2020-06-27 02:41
etl
Kettle
系列:Pentaho DI (
Kettle
) 下载地址
Kettle
系列:PentahoDI(
Kettle
)下载地址
Kettle
8已经发布,下载地址还不太好找,这里记录一下:注:所有大型软件升级都需要谨慎,尤其是大版本的第一个小版本都不推荐在生产环境使用.github
贾维斯博客
·
2020-06-26 23:48
Pentaho
DI
(Kettle)
下
Kettle
实战100篇 第2篇 调用RESTful接口导入JSON结果入库
不管是通过Java或者是Python编码的方式调用RESTful接口将结果入库,都是有一定复杂度的,首先你要加载第三方REST组件,然后连接数据库,写SQL语句,最后插入的目标数据库中但我们有了
Kettle
萧明
·
2020-06-26 21:44
Kettle记录篇
上一页
28
29
30
31
32
33
34
35
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他