2021重返程序道路

大数据Kettle数仓工具快速入门

前言

一、官方介绍

二、个人总结

三、工具安装

1.1 下载方式

1.2 安装注意事项

四、命令介绍

2.1 Spoon命令

2.2 Pan命令

2.3 Kitchen命令

2.4 Carte命令

五、模块介绍

3.1 转换模块（Trans）

3.2 作业模块（Jobs）

六、实战操作

4.1 Excel导入数据到数据库

4.2 通过kettle解压文件

七、结束语

前言

在阅读该文档之前，我需要说明下，这个技术文档整理了我目前经历过的一些问题和踩过的坑，以及简单的几个demo教大家如何快速上手使用kettle，体会到kettle的便利之处。同时也希望能把我最近吸收到的知识分享给csdn大家庭，大家一起成长！

在理想的最美好世界中，一切都是为最美好的目的而设。 —— 伏尔泰

一、官方介绍

Kettle最早是一个开源的ETL工具，全称为KDE Extraction, Transportation, Transformation and Loading Environment。在2006年，Pentaho公司收购了Kettle项目，原Kettle项目发起人Matt Casters加入了Pentaho团队，成为Pentaho套件数据集成架构师 [1] ；从此，Kettle成为企业级数据集成及商业智能套件Pentaho的主要组成部分，Kettle亦重命名为Pentaho Data Integration [1-2] 。Pentaho公司于2015年被Hitachi Data Systems收购。 [3] （Hitachi Data Systems于2017年改名为Hitachi Vantara [4] ）

Pentaho Data Integration以Java开发，支持跨平台运行，其特性包括：支持100%无编码、拖拽方式开发ETL数据管道；可对接包括传统数据库、文件、大数据平台、接口、流数据等数据源；支持ETL数据管道加入机器学习算法。

二、个人总结

简单的可以理解成，kettle就是一个水壶，所有不同来源，不同格式的数据都可以扔进去，最后处理完成后可以统一方式输出，熟悉操作后可以提升数据处理效率，降低开发成本。

比如从数据库抽取数据，然后定时生成Excel文件功能，或者定时导入Excel数据到数据库功能等等都可以利用工具快速实现。

kettle可以分为四个操作命令和两个模块，以及存储位置说明，具体我用3个思维导图来让大家快速了解。

1/3=>四个操作命令

2/3=>两个模块

3/3=>脚本存储位置

三、工具安装

1.1 下载方式

Pentaho from Hitachi Vantara - Browse /Data Integration at SourceForge.netEnd to end data integration and analytics platformhttps://sourceforge.net/projects/pentaho/files/Data%20Integration/

这边建议直接使用7.1版本，然后点击下载

1.2 安装注意事项

软件免安装，下载好了以后，直接解压出来即可使用了，可以看到有/data-integration这个文件夹。如果执行./spoon.sh有报错就看这里，没报错跳过这节。

出现报错的80%是缺少数据库mysql对应的jar包，还有10%是java环境的jdk版本原因，所以这里会给出这两个报错的解决办法。

1.2.1 缺少mysql的jar包问题解决方式

jar包下载链接参考这个博客：不同版本mysql-connector-java的jar包下载地址_kt1776133839的博客-CSDN博客_mysql-connector-java-5.1.32.jarhttps://blog.csdn.net/kt1776133839/article/details/124539192

根据自己需要链接的mysql版本，找到对应的mysql-connector-java.jar包，目前我们用mysql-connector-java-5.1.49.jar包基本上能解决我们的问题。下载好jar包后，把文件移动到 /data-integration/lib目录即可解决问题。

1.2.2 JDK版本问题

这个是我踩了最久的坑了，我这边因为电脑一直更新最新版本的jdk，导致各种报错各种问题出现，尝试了好多种jdk版本都不行，最后发现，只有JDK8才能正常运行。

下载链接点这里 Download the Latest Java LTS Freehttps://www.oracle.com/java/technologies/downloads/

点击上面的对应系统和版本链接，下载安装即可。

命令行输入java -version 出现1.8.x即安装成功，如果是其他版本，说明你没安装成功，需要卸载掉原来的java版本，卸载方式见下面

1.2.3 卸载java方式

1、sudo rm -fr /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin

2、sudo rm -fr /Library/PreferencesPanes/JavaControlPanel.prefpane

3、ls /Library/Java/JavaVirtualMachines/ （查看安装的jdk版本）

输出：jdk-9.0.1.jdk

4、sudo rm -rf /Library/Java/JavaVirtualMachines/jdk-9.0.1.jdk

5、输入java -version提示安装Java就说明卸载成功。

四、命令介绍

提醒：由于我使用的是Linux和MacBook，所以以下都是用sh后缀的脚本作为示范，同时操作的位置都是在kettle的解压目录 /data-integration

2.1 Spoon命令

作用是启动图形界面，只需要在kettle的解压目录命令行输入 ./spoon.sh 即可，显示以下图形界面即表示启动成功。

2.2 Pan命令

用来处理转换模块(Trans)的命令，参数如下

-rep = 资源库名称
-user = 资源库用户名
-trustuser = 资源库用户名
-pass = 资源库密码
-trans = 要启动的转换名称
-dir = 目录(不要忘了前缀 /)
-file = 要启动的文件名(转换所在的 XML 文件)
-level = 日志等级 (基本, 详细, 调试, 行级, 错误, 没有)
-logfile = 要写入的日志文件
-listdir = 列出资源库里的目录
-listtrans = 列出指定目录下的转换
-listrep = 列出可用资源库
-exprep = 将资源库里的所有对象导出到 XML 文件中
-norep = 不要将日志写到资源库中
-safemode = 安全模式下运行: 有额外的检查
-version = 显示版本,校订和构建日期
-param = 传递参数 =. For example -param:FOO=bar

参数很多吧？那看个最基础用法如下即可启动一个本地脚本了。

./pan -file=/PATH/trans.ktr -param:name='2021重返程序道路' -param:gender='男'

2.3 Kitchen命令

用来处理作业(Jobs)模块的命令，参数和pan几乎一样，唯一不同的是pan命令参数有个-trans在这里就变成-job = 要启动的作业名称

2.4 Carte命令

启动一个常驻脚本，用来监听发送过来的job和trans任务，配合远程脚本存储使用比较适合，参数如下

-p 启动密码 (仅当需要停止服务时候才输入配置好的密码)

-u 启动用户 (仅当需要停止服务时候才输入配置好的用户)

-s 停止服务

注意：设置账号密码需要在/data-integration/pwd目录下的文件设置，启动命令并不是设置账号密码

./carte.sh 127.0.0.1 8080 这样就可以启动常驻服务了，浏览器访问127.0.0.1:8080，默认账号密码都是cluster

启动成功后，访问链接会要求输入账号密码，默认都是cluster，输入完毕后显示如下即表示成功

此时一个常驻服务就开启了，即使关闭终端也是能访问的。关闭carte服务的命令如下

./carte.sh 127.0.0.1 8080 -s -u cluster -p cluster

这样就成功关闭carte服务了，此刻访问127.0.0.1:8080提示错误。

五、模块介绍

3.1 转换模块（Trans）

这个其实就是处理数据输入输出，过滤数据，数据分类筛选分析等等操作~

先上图形工具的转换模块界面图。双击点击这里就切换成转换模块，同时TAB会自动从主对象树跳转到核心对象

可以看到，转换里面有输入输出，streaming，转换等等功能。我们这里尝试拖拽一个输入Excel到右侧，如下图

是不是很酷？这样就实现了从0到1的巨大进步了，其他功能就交给你去逐步摸索吧~ O(∩_∩)O

3.2 作业模块（Jobs）

这个模块主要是处理邮件收发，SFTP/FTP上传下载，文件增删改查等功能

模块功能清单如下

同样的我们可以拖拽一个功能到右侧画板里面

这样也踏出了作业模块定制的第一步了~ 接下来我将会在下一个收费章节里(bushi)(✿◡‿◡)，通过几个案例教大家怎么来使用几个功能，从而达到理解整个操作流程。

六、实战操作

4.1 Excel导入数据到数据库

终于来到紧张的实战教学环节了

问：现在你需要把一个带有学生信息的Excel导入到数据库中并且存在相同学号更新数据，利用kettle怎么做？

划重点，Excel录入到数据库，有2个要素，

Excel数据输入功能。

数据库插入功能。

也就是说我们需要用到转换模块的输入功能来实现，接着往下看。

我们准备一个学生信息Excel如下

从转换里拖入一个Excel输入到右侧

然后我们双击右侧的Excel输入编辑好信息

点击上方的增加按钮，把文件追加到下方选中的文件去

同时我们点击!字段选项，再点击获取来自头部数据的字段，就能够把表头给同步到kettle里了！

我们给这个步骤写一个好辨认的名字吧

这样这就完成了读取Excel的功能了

问题来了，那我们怎么把数据写入到数据库里面？别慌，看下面

我们找到左侧，输出-插入/更新，并且拖拽到右边

关键点来了，我们要把“读取学生信息表”和插入更新关联起来，就要用到连接线。

这样我们就把他们的关系链接起来了，接着我们双击插入/更新功能，编辑对应的数据库信息。

点击测试显示连接成功，就可以点击确定返回“插入/更新”的编辑界面了，然后点击“获取字段”按钮就能自动获取前面Excel表的字段，下图“流里的字段”就是Excel读取的字段，“表字段”就是数据库的字段，现在我们的数据库是这么个结构

这里有一点需要注意的是，插入更新的编辑界面的“用来查询的关键字”那个区域，指的是搜索条件。

“更新字段”区域指的是根据搜索条件搜索到数据后，需要更新到数据库的字段。

我们现在需求是要把学生信息导入到数据库中并且根据学号做更新数据。

也就是说，用来查询的关键字是学号，更新的字段是“姓名”，“性别”，“入学时间”这三个。

配置成如上图即可达到我们的目的，点击确定，我们来测试下功能，是否正常。

作为程序员，这里我们通过命令行来测试哈。先按command+s保存脚本文件到指定路径。

我保存到这个路径 /Users/apple/Desktop/trans/info.ktr

然后打开终端，执行如下命令处理转换模块脚本

./pan.sh -file=/Users/apple/Desktop/trans/info.ktr

看到这样就说明没有错误，成功执行完毕了，我们可以看到数据库表里已经增加了数据了。

4.2 通过kettle解压文件

问：如何通过kettle解压一个文件？文件存储在 /Users/apple/Desktop/jobs/学生信息.zip

前面有提到过，处理文件的话，需要使用到作业模块（Jobs）来处理，所以这次我们就直接上手打开一个作业模块吧。

注意注意! 作业模块和转换模块有不一样的地方，就是作业模块必须要有开始和成功(结束)！我们可以在通用里面找到。

我们把Start和成功拖拽到右侧，然后找到文件管理 - 解压缩文件也拖拽到右侧并连线。

双击解压缩文件功能，然后编辑信息如下图

这时候我们可以保存运行一下看看效果，是否有被解压出来。

运行命令如下

./kitchen.sh -file=/Users/apple/Desktop/jobs/unzip.kjb

运行命令结束后，显示上面信息则表示脚本正常执行完毕了。我们可以看看下面文件夹前后对比。

左边是解压之前，右边是执行脚本解压后，明显看到学生信息.xlsx 已经被解压出来了！

4.3 实现解压文件并把Excel更新到数据库

问：如何把一个被压缩过的Excel文件，解压出来，并且数据更新到数据库？

这次就需要同时使用作业模块和转换模块搭配来实现功能了。

前面我们有实现过解压功能和同步Excel数据到数据库功能，我们可以在那2个脚本基础上进行一些修改，即可实现这次的目的。

我们先编辑下之前的解压模块的脚本，添加一个转换功能到作业里面。

然后断开解压缩文件和成功的连接线，在线上面右键

最后按照这个顺序链接起来

这时候总体的执行流程就清晰明了了，但是还不够，我们还需要指定转换脚本，双击它！

这样就几乎完成了，但是有个细节需要注意的是，之前的转换脚本处理的是 /Users/apple/Desktop/trans/学生信息.xlsx 这个路径的文件，而我们的作业脚本是

解压到 /Users/apple/Desktop/jobs/学生信息.xlsx这个，所以还需要把文件移动到/trans/文件夹去。

添加如下功能到右侧

编辑如下信息

确定保存后，执行下刚才的job命令，查看下效果

命令执行成功！！文件成功解压出来并移动到指定文件夹，并且数据库插入了数据！

七、结束语

新手入门的操作就到这里了，如果你能够认真的看完这个入门教程并跟着做一遍，相信肯定很快就能够上手kettle这个工具的，当然学无止境，这只是开始，我也一样。如果遇到不懂的地方，可以留言发我信息，我很乐意解答（只要我会的话~）

Thanks♪(･ω･)ﾉ

【Linux】修改日志等级方法 zclinux_ linux 运维服务器
修改日志等级方法1：修改kernel启动参数内核参数console=ttyS0或console=tty1控制日志输出到哪个终端，可以尝试修改它：编辑GRUB配置：sudovim/etc/default/grub找到GRUB_CMDLINE_LINUX，移除console=相关参数，或改成：GRUB_CMDLINE_LINUX="quietloglevel=3"quiet：禁止大部分启动消息logl
从单一设备到万物互联：鸿蒙生态崛起的未来之路王子良. 经验分享 harmonyos 华为
目录一、引言：开启智能时代的钥匙二、鸿蒙生态概述：跨设备协同的核心价值三、开发者机遇与挑战：抓住鸿蒙崛起的机会四、鸿蒙生态崛起的前景：万物互联的未来五、开发者在鸿蒙生态中的实践机遇与挑战1.跨设备开发的机遇2.与人工智能和物联网结合的创新空间3.持续创新与生态完善的挑战六、鸿蒙生态未来的多维发展：智能硬件与大数据的深度结合1.智能硬件与大数据的结合2.在智能家居与城市管理中的应用3.行业领域的深度
多模态实操第一弹：多模态AI是什么？能做什么？江凯吴杰多模态的尝试人工智能
多模态AI专栏第一期：多模态人工智能概述与应用你是否想过，AI如何像人一样同时"看、听、说"？本期专栏将带你深入了解多模态AI的核心原理、发展脉络、关键技术、典型应用，并为后续实战打下坚实基础。最后，我们将详细介绍本系列所用的ERIT数据集及其任务背景。目录1.什么是多模态AI？2.多模态AI的发展历程3.多模态AI的核心技术4.多模态AI的应用场景5.多模态AI的挑战与机遇6.专栏预告与ERIT
遥感云大数据在灾害、水体与湿地领域典型案例实践及GPT模型应用科研的力量生态遥感双碳 chatgpt GEE 卫星遥感数据
以EarthEngine（GEE）、PIE-Engine为代表全球尺度地球科学数据（尤其是卫星遥感数据）在线可视化计算和分析云平台应用越来越广泛。GEE平台存储和同步遥感领域目前常用的MODIS、Landsat和Sentinel等卫星影像、气候与天气、地球物理等方面的数据集超过80PB，同时依托全球上百万台超级服务器，提供足够的运算能力对这些数据进行处理。相比于ENVI等传统的遥感影像处理工具，G
《量化开发》系列第 1 篇：金融知识基础入门指南（附 GitHub 学习项目） Natsume1710 金融 github 学习
本文为《量化开发学习路线与知识点》专栏的第一篇参考项目：Awesome-QuantDev-Learn量化金融是金融经济学与计算机科学交叉融合形成的新兴行业，越来越多的技术人才正积极投身其中。然而，面对纷繁复杂的金融概念与专业的开发技能，许多人常常感到无从下手。本专栏将为C++/Python工程师、自学者、量化岗求职者提供系统清晰的学习路径。本篇文章聚焦于量化开发所需的金融基础知识，帮助技术人打下坚
如何利用Web Compoent封装一个自定义右键菜单？程序员小寒前端 javascript 开发语言
一、右键菜单是什么所谓右键菜单，就是指我们在浏览器页面中，点击鼠标右键后弹出来的包含一系列功能键的组合框。二、核心代码核心就是监听contextmenu事件。最最核心的代码如下：document.addEventListener('contextmenu',function(e){e.preventDefault();//阻止默认的右键菜单弹出showMyMenu(e);//显示自定义菜单})三、
AI 大模型应用进阶系列（一）：Python 基础人工智能python
本文已同步到githubAI大模型应用进阶系列（一）：Python基础，欢迎Star。数据类型数字在Python中，数字类型是基本数据类型之一，用于表示数值整数a=10#十进制整数b=0b1010#二进制整数（等于十进制的10）c=0o12#八进制整数（等于十进制的10）d=0xA#十六进制整数（等于十进制的10）print(a,b,c,d)#输出:10101010浮点数x=3.14y=1.23e
**基于Python的数据分析与机器学习实战教程****一、引言**随着大数据时代的到来，数据处理和分析能力已经成为现代软件开发人员的必备技能之一。Python作为一种高效、简洁且功能丰富的编程语言， 2401_89451588 python 数据分析机器学习
基于Python的数据分析与机器学习实战教程一、引言随着大数据时代的到来，数据处理和分析能力已经成为现代软件开发人员的必备技能之一。Python作为一种高效、简洁且功能丰富的编程语言，在数据分析领域得到了广泛的应用。本文将介绍如何使用Python进行数据分析，并结合机器学习算法实现数据驱动的应用。二、Python基础首先，我们需要掌握Python的基本语法和常用的库。Python的语法简洁易懂，上
【知识图谱构建系列1】数据集介绍几道之旅人工智能智能体及数字员工 Python杂货铺 AI 自建MCP 学习记录知识图谱
文章目录项目简介数据集简介数据集核心内容应用与影响小细节参考论文：hal.science/hal-04862214/项目地址：https://github.com/ChristopheCruz/LLM4KGC/项目简介我们所要学习的项目（LLM4KGC）聚焦于利用大语言模型（LLMs）实现从文本到知识图谱（Text-to-KnowledgeGraph,T2KG）的自动化构建，旨在探索高效可靠的知识
深入了解大数据领域Zookeeper的ACL权限管理 AGI大模型与大数据研究院大数据 zookeeper wpf ai
深入了解大数据领域Zookeeper的ACL权限管理关键词：Zookeeper、ACL权限管理、大数据安全、分布式系统、访问控制、权限模型、数据保护摘要：本文深入探讨了Zookeeper中的ACL(AccessControlList)权限管理系统。作为分布式协调服务的核心组件，Zookeeper的ACL机制对于保障大数据环境中的数据安全至关重要。文章将从基础概念出发，详细解析ZookeeperAC
微信小程序实现下拉刷新首页数据、上拉加载下一页数据花铛微信小程序微信小程序
下拉刷新首页数据：使用页面的下拉，刷新首页数据：首先需要在页面对应的JSON文件中配置"enablePullDownRefresh":true。然后在页面对应的JS文件中使用微信小程序提供的onPullDownRefresh(){}监听用户下拉动作。//本质是获取首页的数据onPullDownRefresh(){this.setData({pageNum:1},this.getList)},get
【软件系统架构】系列四：嵌入式微处理器 34号树洞自学软件系统架构系统架构大数据
目录一、嵌入式微处理器体系结构1.1冯·诺依曼结构（VonNeumannArchitecture）1.2哈佛结构（HarvardArchitecture）二、嵌入式微处理器分类2.1按字长分类2.2按集成度分类2.3按应用功能分类三、典型嵌入式处理器类型详解3.1MCU（嵌入式微控制器）3.2MPU（嵌入式微处理器）3.3DSP（数字信号处理器）3.4SoC（片上系统）四、多核处理器架构与调度4.
Java基础(五)：流程控制全解析——分支（if/switch）和循环（for/while）的深度指南冬天vs不冷 java基础 java python 开发语言
Java基础系列文章Java基础(一)：发展史、技术体系与JDK环境配置详解Java基础(二)：八种基本数据类型详解Java基础(三)：逻辑运算符详解Java基础(四)：位运算符详解Java基础(五)：if/switch与for/while-深入理解流程控制目录引言一、分支结构1、if语句2、if-else语句3、if-else-if阶梯4、switch语句(传统与现代)4.1、传统语法(Java
Google 相机增强（GCam）框架原理初探：图像质量与计算摄影的系统性突破观熵影像技术全景图谱：架构调优与实战数码相机影像 Camera
Google相机增强（GCam）框架原理初探：图像质量与计算摄影的系统性突破关键词：GCam、GoogleCamera、HDR+、SuperResZoom、Camera2API、多帧合成、算法流程、图像增强、夜视模式、Pixel相机移植摘要：GCam（GoogleCamera）作为Pixel系列设备图像质量表现的核心支撑，其背后的增强框架融合了Google长期积累的计算摄影技术，从HDR+到Sup
场景题：有40亿个QQ号如何去重？仅1GB内存卷福同学社招面试面试阿里云京东云 java
场景题也有一些套路可以考虑，比如去重、判断给定数据是否存在1.大数据去重1.1现在有40亿个QQ号如何去重？仅1GB内存参考链接：https://juejin.cn/post/7396332696660131849介绍2种方法：Bitmap和布隆过滤器方法一：Bitmap首先介绍下什么是位图Bitmap位图是使用bit数组表示的，它只存储0或者1，因此我们可以把全部的QQ号放到位图中，当index
Java线程安全集合类 paishishaba java 开发语言
目录概述主要线程安全集合类及对比1.List系列2.Map系列3.Set系列4.Queue系列核心区别与选择标准使用场景案例实践建议概述Java集合框架提供了多种线程安全的集合实现，主要分为三大类：早期线程安全集合：Vector、Hashtable同步包装集合：Collections.synchronizedXxx()并发集合：java.util.concurrent包下的实现主要线程安全集合类及
TI Sitara AM57x 多核SoC开发板（DSP + ARM）-性能及参数资料 Tronlong创龙嵌入式ARM 软硬件原理图规格资料平台 AM5708 嵌入式硬件嵌入式 arm fpga开发 linux
创龙科技TL570x-EVM是一款基于TISitara系列AM5708ARMCortex-A15+浮点DSPC66x处理器设计的异构多核SoC评估板，由核心板和评估底板组成。核心板经过专业的PCBLayout和高低温测试验证，稳定可靠，可满足各种工业应用环境。评估板接口资源丰富，引出双路PRU百兆网口、千兆网口、USB3.0、CAMERA、GPMC、HDMI、PCIe等接口，方便用户快速进行产品方
YOLOv11性能评估全解析：从理论到实战的指标指南芯作者 D2:YOLO YOLO 计算机视觉
深入剖析目标检测核心指标，掌握模型优化的关键密码为什么需要性能评估指标？在目标检测领域，YOLO系列模型以其卓越的速度-精度平衡成为行业标杆。当我们训练或使用YOLOv11模型时，一个核心问题始终存在：如何量化模型的性能？性能评估指标正是回答这个问题的关键工具，它们不仅衡量模型效果，更是模型优化迭代的导航灯。本文将系统解析YOLOv11的七大核心评估指标，结合理论公式、可视化解释和实战代码，带您深
深度剖析数据中台：大数据领域的核心技术架构大数据洞察大数据架构 java ai
深度剖析数据中台：大数据领域的核心技术架构关键词：数据中台、大数据、核心技术架构、数据治理、数据服务摘要：本文旨在对数据中台这一大数据领域的核心技术架构进行深度剖析。首先介绍了数据中台的背景，包括其目的、适用读者、文档结构和相关术语。接着阐述了数据中台的核心概念、原理和架构，通过文本示意图和Mermaid流程图进行直观展示。详细讲解了核心算法原理及具体操作步骤，并结合Python源代码进行说明。引
运筹系列91：vrp算法包PyVRP IE06 运筹学人工智能
1.介绍PyVRP使用HGS（hybridgeneticsearch）算法求解VRP类问题。在benchmark上的评测结果如下，看起来还不错：2.使用例子2.1CVRPCOORDS=[(456,320),#location0-thedepot(228,0),#location1(912,0),#location2(0,80),#location3(114,80),#location4(570,1
集成段码LCD驱动低功耗系列MM32L0130 EVERSPIN MCU 单片机嵌入式硬件 MCU
灵动微集成段码LCD驱动低功耗系列MM32L0130搭载了最高主频为48MHz的ArmCortex-M0+处理器;提供至多64KB的Flash存储空间和8KB的SRAM空间。灵活易用的段码LCD控制器最高288段码·可驱动40x4或36x8个段码·支持COM和SEG任意映射多种占空比和偏压·静态、1/2、1/3、1/4、1/6·1/2、1/3和1/4偏压内置电荷泵·可在1.8到5.5V供电下驱动和
分享灵动微电子低功耗单片机MM32L系列 EVERSPIN MCU 单片机物联网 32位MCU 低功耗MCU
消费电子、可穿戴设备及其它电池供电的物联网终端都低功耗都有严格的要求。系统功耗是物联网部署的主要考虑因素之一，很多应用场景下的IoT设备都是电池供电，而且要求可持续使用10年以上。MCU在很多应用中大部分时间都是处于低功耗睡眠模式，只是偶尔被唤醒读取传感器发送的一些数据，或处理和传送数据。MCU子系统的功耗包括两部分——MCU工作时的动态功耗（与处理器主频成正比），以及MCU在睡眠状态下与漏电流相
c#：两个list不同元素，值类型，对象类型四夕立羽 C#Unity3d技术笔记 c#list不同元素 except
基本值类型publicstaticListGetListDiff(ListlistA,ListlistB){Listret=newList();if(listA.Count>listB.Count)ret=listA.Except(listB).ToList();else{ret=listB.Except(listA).ToList();}returnret;}对象类型publicclassDif
2025年全球数据安全发展趋势 jinan886 人工智能大数据安全数据分析
随着云计算、大数据、人工智能等技术的迅猛发展，数据已成为驱动经济社会发展的关键生产要素。然而，数据泄露、网络攻击等安全事件频发，给个人隐私、企业利益乃至国家安全带来了前所未有的挑战。全球数据安全发展趋势正随着技术进步和威胁演变而不断变化，以下是主要趋势：1.数据隐私法规加强GDPR（欧盟《通用数据保护条例）和CCPA（加州消费者隐私法案）等法规推动了全球对数据隐私的重视，更多国家和地区正在制定或更
从文心开源谈起，论大模型发展新生态 CSDN资讯开源
6月30日，百度正式宣布开源ERNIE4.5即文心4.5系列模型，覆盖47B和3B激活参数的MoE（混合专家）模型，以及0.3B参数的稠密模型，并实现了预训练权重+推理代码的完全开源。文心大模型4.5系列开源模型国内下载地址：https://ai.gitcode.com/theme/1939325484087291906百度成为继DeepSeek之后又一重磅国产大模型开源。这不仅是数量的堆叠，更标
机器学习在智能仓储中的应用：库存管理与物流优化 Blossom.118 机器学习与人工智能机器学习人工智能深度学习机器人 sklearn tensorflow cnn
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。随着电子商务的蓬勃发展，仓储和物流行业面临着前所未有的挑战和机遇。智能仓储通过整合先进的信息技术，如物联网（IoT）、大数据和机器学习，能够实现从货物入库到出库的全流程
Java基础(六)：数组全面解析冬天vs不冷 java基础 java python 开发语言
Java基础系列文章Java基础(一)：初识Java——发展历程、技术体系与JDK环境搭建Java基础(二)：八种基本数据类型详解Java基础(三)：逻辑运算符详解Java基础(四)：位运算符详解Java基础(五)：流程控制全解析——分支（if/switch）和循环（for/while）的深度指南Java基础(六)：数组全面解析目录一、数组的概述1、什么是数组？2、数组的特点3、数组分类二、一维数
RAG系列：提升RAG检索力：三大Query变形术，助你玩转AI知识检索！数智前沿数字化转型人工智能 RAG
之前的帖子大多在优化向量化的过程，让文本内容分块更合理和更精准，本篇重点介绍使用RAG时如何优化提示词，以提高查询结果的精准度！一、RAG的“灵魂拷问”：你真的会提问吗？在AI时代，信息检索的效率和质量，80%取决于你“怎么问”。RAG系统的本质，就是“你问得好，我答得妙”。但现实往往是——用户提问：“AI会抢我饭碗吗？”检索系统：一脸懵逼，给你扔来一堆“AI是什么”“就业趋势”……用户：？？？这
postgresql增量备份系列二 pg_probackup necessary653 postgresql postgresql 数据库
已经很久没有发文章了，主要是最近工作上的内容都不适合发文章公开。可能往后文章发表也不这么频繁了，不过大家有问题我们可以交流。之前有写过PG增量备份的其他工具使用方法，pg_probackup也是应用比较多的PG备份工具。一.pg_probackuppg_probackup是一个用于管理PostgreSQL数据库集群备份与恢复的实用工具，截止2.5.15版本，支持PostgreSQL11-16及以上
04《区块链财富指北》账号篇（1）：混沌之初，抢注公链短账号的生意经。肖南飞区块链财富指北区块链 python 比特币 eos github
账号（1）：混沌之初，抢注公链短账号的生意经。《区块链财富指北》系列文章由NOCY.COM策划，肖南飞主笔撰写。技术选型基于BOScore公链，旨在以有趣易懂的方式传播普及区块链技术，不构成任何投资建议！0x01混乱不是深渊，混乱是阶梯。行业兴起之初，总会有很多衍生产业。淘金热带富了卖铲子的；互联网红火了域名生意；就连手机、QQ普及也带动了对应靓号生意。区块链世界，每个人、每家企业、每个实体必然要
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

大数据Kettle数仓工具快速入门

前言

一、官方介绍

二、个人总结

三、 工具安装

1.1 下载方式

1.2 安装注意事项

四、命令介绍

2.1 Spoon命令

2.2 Pan命令

2.3 Kitchen命令

2.4 Carte命令

五、模块介绍

3.1 转换模块（Trans）

3.2 作业模块（Jobs）

六、实战操作

4.1 Excel导入数据到数据库

4.2 通过kettle解压文件

七、结束语

你可能感兴趣的:(KETTLE系列,数据仓库,大数据,etl)

三、工具安装