项哥

KETTLE常见问题和优化

http://www.cnblogs.com/jifeng/p/4741498.html 这篇介绍KETTLE的博文可以经常阅读

下面是我自己开发的一些体会：

1.创建MySQL空资源库报错问题：因为boolean类型的问题，Mysql中的boolean类型实际上保存为TINYINT，需要手动的修改生成资源库的sql脚本，将其中的插入用户ENABLED的值由Y修改为1，在数据同步的时候也特别要注意TINYINT类型的字段，ETL在读取数据以后会将值显示为Y或者N，保存到另外一张表的TINYINT中就会报错。

2.乱码问题：首先确保，资源库数据库建库的时候使用的是utf8格式，数据库连接在选项中添加characterEncoding=utf-8，连接资源库的数据库连接也必须要加上这个，否则在Mac下中文会乱码

http://wiki.pentaho.com/display/EAI/MySQL 这篇文章介绍mysql参数讲的非常好

useUnicode = true
characterEncoding = utf8
characterSetResults = utf8

上面三个参数是为了解决乱码

3.Javascript组件：

1）使用函数前先到左侧找内置函数，Transform Functions，展开，选中某个函数双击可以插入到编辑框中，右击还可以打开Sample使用示例

使用isEmpty函数前要先判断!=null，否则会出错，字符串比较就用==即可

2）解析成json，可以用

eval("("+RESULT+")") 和JSON.parse(RESULT)

3）输出的Integer类型在后面的表输出中报错

IS_ENABLE Integer(1) : There was a data type error: the data type of java.lang.Double object [1.0] does not correspond to value meta [Integer(1)]

解决办法：js组件中输出类型要定义为Number类型，而不能定义为Integer类型，如果定义为Integer类型，原来的值会被转换为Double类型，1就变成了1.0了，后面再加一个select组件将类型改为Integer类型

4.Java组件

1）往输出流中插入整数取值时会报错：There was a data type error: the data type of java.lang.Integer object [1] does not correspond to value meta [Integer]

没找到解决办法，暂时只能存为字符串类型来解决，但是存为字符串类型以后用SELECT VALUE组件也不能转成int类型

问题重现：int id=Integer.pasrseInt(get(Fields.In, "ID").getString(rowIn));id++;

get(Fields.Out, "ID_NEW").setValue(rowOut, id)，底部的Fileds设置ID_NEW为Integer类型，在取ID_NEW的值时就会报错

最终解决方案：java操作字段设为long类型，然后底部输出设为Integer类型，Java代码钟

long id=get(Fields.In, "ID").getInteger(rowIn)，getInteger函数返回的就是Long类型

5.连接池问题：启用连接池以后在Spoon界面中运行卡住了，在Spoon界面运行时先取消掉连接池，需要Java调用启动在保存到资源库或文件前再开启连接池

我的java程序中使用了druid连接池，数据库是mysql,但是调用资源库执行ETL时设置了dbcp连接池，会经常出现Communications link failure during commit()错误，Communications link failure The last packet successfully received from the server was 3,607,233 milliseconds ago. The last packet sent successfully to the server was 1 milliseconds ago。

网上说增加连接配置：autoReconnect=true&failOverReadOnly=false但是不起作用，maxIdleTime不能设为0但只有c3p0连接池才有这个属性，启动测试testWhileIdle

说是用其它的连接池替换掉dbcp连接池，比如tomcat-jdbc，或者用2.x版本的dbcp连接池commons-pool2才能解决这个问题，但是现在kettle自己只集成了commons-pool要怎么使用其它的连接池呢，commons-pool有一个最新版本1.6.0.redhat-9，不知道这个是否有解决问题?现在公司生成环境不再给我机会测试启用连接池，本地没法测试了,现在解决办法只是关闭了ETL资源库连接池。有哪位大牛有更好的解决办法请给我留言。

在官方文档中http://wiki.pentaho.com/display/EAI/.03+Database+Connections

MySQL

By default, MySQL returns complete query results in one block to the client, (Kettle in this case), so "result streaming" is enabled. One drawback associated result streaming is that it allows only one single query to be opened at any given time. You can disable this option in the MySQL tab of the database connection dialog box if necessary.

Another issue you may encounter is that the default timeout in the MySQL JDBC driver is set to 0 (no timeout). In certain instances, this may not allow Kettle to detect a server crash or sudden network failure if it occurs in the middle of a query or open database connection. This in turn leads to the infinite stalling of a transformation or job. To solve problem, set the "connectTimeout" and "socketTimeout" parameters for MySQL in the Options tab. The value to be specified is in milliseconds: for a 2 minute timeout you would specify value 120000 ( 2 x 60 x 1000 ).

也就是说设置mysql的连接参数connectTimeout和socketTimeout为120000毫秒来解决这个问题。But没有测试机会，因为我本地死活不会出现那个错误。

综合起来解决措施如下：

数据库选项Tab页配置：

autoReconnect true

failOverReadOnly false

connectTimeout 120000

socketTimeout 120000

数据库连接池Tab页配置

validationQuery select 1

testWhileIdle true

pom中使用最新版本的commons-pool

commons-pool
commons-pool
1.6.0.redhat-9

以上解决措施未经实际验证，坐等以后公司给我机会在产品生成环境下验证，如果能够解决该问题就perfect了。

6.死锁问题：在用到sort,lookup等组件的时候因为逻辑原因可能造成死锁，此外多并发对同一张数据表格进行操作的时候也会造成表格死锁而导致数据插入或更新失败。

http://wiki.pentaho.com/display/EAI/Transformation+Deadlocks

7.Mysql连接问题：http://wiki.pentaho.com/display/EAI/MySQL

useServerPrepStmts=false
rewriteBatchedStatements=true
useCompression=true

上面三个参数是为了加快批量插入的速度

如果为了增加读的速度：useServerPrepStmts=true&cachePrepStmts=true

乱码问题看上面的第2点

连接池问题看上面的第5点

内存不足问题，启用Use Result Streaming Cursor，这样不需要把所有的数据都读取到内存中，因为是一次性读拆分为了多次读效率会降低，为了防止数据库连接过长丢失1）设置mysql系统变量net_write_timeout，默认60s，我们可以设置为30min 2）在选项tab页中设置参数useCursorFetch=true和defaultFetchSize=1000，系统内存大的话defaultFetchSize这个值可以设置大一点

下面的内容是转载

KETTLE手记 http://blog.sina.com.cn/s/blog_598ba0e20102vn6a.html

Kettle优化就这么多 http://blog.csdn.net/calmreason/article/details/49930479

下面的内容来自http://www.cnblogs.com/mybi/archive/2012/06/28/2568740.html

1. Join

　　我得到A 数据流（不管是基于文件或数据库），A包含field1 ， field2 ， field3 字段，然后我还有一个B数据流，B包含field4 ， field5 ， field6 ，我现在想把它们 ‘加’ 起来，应该怎么样做.

　　这是新手最容易犯错的一个地方，A数据流跟B数据流能够Join，肯定是它们包含join key ，join key 可以是一个字段也可以是多个字段。如果两个数据流没有join key ，那么它们就是在做笛卡尔积，一般很少会这样。比如你现在需要列出一个员工的姓名和他所在部门的姓名，如果这是在同一个数据库，大家都知道会在一个sql 里面加上where 限定条件，但是如果员工表和部门表在两个不同的数据流里面，尤其是数据源的来源是多个数据库的情况，我们一般是要使用Database Join 操作，然后用两个database table input 来表示输入流，一个输入是部门表的姓名，另一个是员工表的姓名，然后我们认为这两个表就可以 ”Join” 了，我们需要的输出的确是这两个字段，但是这两个字段的输出并不代表只需要这两个字段的输入，它们之间肯定是需要一个约束关系存在的。另外，无论是在做Join ， Merge ， Update ， Delete 这些常规操作的时候，都是先需要做一个compare 操作的，这个compare 操作都是针对compare key 的，无论两个表结构是不是一样的，比如employee 表和department 表，它们比较的依据就是employee 的外键department_id ，没有这个compare key 这两个表是不可能连接的起来的.. 对于两个表可能还有人知道是直接sql 来做连接，如果是多个输入数据源，然后是三个表，有人就开始迷茫了，A表一个字段，B表一个字段，C表一个字段，然后就连Join操作都没有，直接database table output ，然后开始报错，报完错就到处找高手问，他们的数据库原理老师已经在吐血了。如果是三个表连接，一个sql 不能搞定，就需要先两个表两个表的连接，通过两次compare key 连接之后得到你的输出，记住，你的输出并不能代表你的输入. 下面总结一下:

　　1. 单数据源输入，直接用sql 做连接

　　2. 多数据源输入，（可能是文本或是两个以上源数据库），用database join 操作.

　　3. 三个表以上的多字段输出.

　　2. Kettle的数据库连接模式

　　Kettle的数据库连接是一个步骤里面控制一个单数据库连接，所以kettle的连接有数据库连接池，你可以在指定的数据库连接里面指定一开始连接池里面放多少个数据库连接，在创建数据库连接的时候就有Pooling 选项卡，里面可以指定最大连接数和初始连接数，这可以一定程度上提高速度.

　　3. transaction

　　我想在步骤A执行一个操作（更新或者插入），然后在经过若干个步骤之后，如果我发现某一个条件成立，我就提交所有的操作，如果失败，我就回滚，kettle提供这种事务性的操作吗？

　　Kettle里面是没有所谓事务的概念的，每个步骤都是自己管理自己的连接的，在这个步骤开始的时候打开数据库连接，在结束的时候关闭数据库连接，一个步骤是肯定不会跨session的（数据库里面的session），另外，由于kettle是并行执行的，所以不可能把一个数据库连接打开很长时间不放，这样可能会造成锁出现，虽然不一定是死锁，但是对性能还是影响太大了。ETL中的事务对性能影响也很大，所以不应该设计一种依赖与事务方式的ETL执行顺序，毕竟这不是OLTP，因为你可能一次需要提交的数据量是几百GB都有可能，任何一种数据库维持一个几百GB的回滚段性能都是会不大幅下降的.

　　4. 我真的需要transaction 但又不想要一个很复杂的设计，能不能提供一个简单一点的方式

　　Kettle 在3.0.2GA版中将推出一种新功能，在一个table output 步骤中有一个Miscellaneous 选项卡，其中有一个Use unique connections 的选项，如果你选中的话就可以得到一个transaction 的简单版，

　　由于是使用的单数据库连接，所以可以有错误的时候回滚事务，不过要提醒一点是这种方式是以牺牲非常大的性能为前提条件的，对于太大的数据量是不适合的(个人仍然不建议使用这种方式)

　　5. temporary 表如何使用

　　我要在ETL过程中创建一个中间表，当某个条件成立的时候，我要把中间表的数据进行转换，当另一条件成立的时候我要对中间表进行另一个操作，我想使用数据库的临时表来操作，应该用什么步骤。

　　首先从temp 表的生命周期来分，temp分为事务临时表和会话临时表，前面已经解释过了，kettle是没有所谓事务的概念的，所以自然也没有所谓的事务临时表。Kettle的每个步骤管理自己的数据库连接，连接一结束，kettle也就自然丢掉了这个连接的session 的handler ，没有办法可以在其他步骤拿回这个session 的handler ，所以也就不能使用所谓的会话临时表，当你尝试再开一个连接的时候，你可以连上这个临时表，但是你想要的临时表里面的数据都已经是空的(数据不一定被清除了，但是你连不上了)，所以不要设计一个需要使用临时表的转换

　　之所以会使用临时表，其实跟需要 ”事务” 特性有一点类似，都是希望在ETL过程中提供一种缓冲。临时表很多时候都不是某一个源表的全部数据的镜像，很多时候临时表都是很小一部分结果集，可能经过了某种计算过程，你需要临时表无非是基于下面三个特性：

　　1. 表结构固定，用一个固定的表来接受一部分数据。

　　2. 每次连接的时候里面没有数据。你希望它接受数据，但是不保存，每次都好像执行了truncate table 操作一样

　　3. 不同的时候连接临时表用同一个名字，你不想使用多个连接的时候用类似与temp1 ， temp2 ， temp3 ， temp4 这种名字，应为它们表结构一样。

　　既然临时表不能用，应该如何设计ETL过程呢？（可以用某种诡异的操作搞出临时表，不过不建议这样做罢了）

　　如果你的ETL过程比较的单线程性，也就是你清楚的知道同一时间只有一个这样的表需要，你可以创建一个普通的表，每次连接的时候都执行truncate 操作，不论是通过table output 的truncate table 选项，还是通过手工执行truncate table sql 语句（在execute sql script 步骤）都可以达到目的（基于上面的1，2 特性）

　　如果你的ETL操作比较的多线程性，同一时间可能需要多个表结构一样并且里面都是为空的表（基于上面1，2，3特性），你可以创建一个 “字符串+序列”的模式，每次需要的时候，就创建这样的表，用完之后就删除，因为你自己不一定知道你需要多少个这种类型的表，所以删除会比truncate 好一些。

　　下面举个例子怎么创建这种表：

　　你可以使用某种约定的表名比如department_temp 作为department 的临时表。或者

　　把argument 传到表名，使用 department_${argument} 的语法，

　　如果你需要多个这种表，使用一个sequence 操作+execute sql script 操作，execute sql script 就下面这种模式

　　Create table_?(…………..)

　　在表的名字上加参数，前面接受一个sequence 或类似的输入操作.

　　需要注意的是这种参数表名包括database table input 或者execute sql script ，只要是参数作为表名的情况前面的输入不能是从数据库来的，应为没有办法执行这种preparedStatement语句，从数据库来的值后面的操作是 “值操作” ，而不是字符串替换，只有argument 或者sequence 操作当作参数才是字符串替换. (这一点官方FAQ也有提到)

　　6. update table 和execute sql script 里面执行update 的区别

　　执行update table 操作是比较慢的，它会一条一条基于compare key 对比数据，然后决定是不是要执行update sql ，如果你知道你要怎么更新数据尽可能的使用execute sql script 操作，在里面手写update sql （注意源数据库和目标数据库在哪），这种多行执行方式（update sql）肯定比单行执行方式（update table 操作）快的多。

　　另一个区别是execute sql script 操作是可以接受参数的输入的。它前面可以是一个跟它完全不关的表一个sql :

　　select field1， field2 field3 from tableA

　　后面执行另一个表的更新操作：

　　update tableB set field4 = ? where field5=? And field6=?

　　然后选中execute sql script 的execute for each row .注意参数是一一对应的.(field4 对应field1 的值，

　　field5 对应field2 的值， field6 对应field3 的值)

　　7. kettle的性能

　　kettle本身的性能绝对是能够应对大型应用的，一般的基于平均行长150的一条记录，假设源数据库，目标数据库以及kettle都分别在几台机器上（最常见的桌面工作模式，双核，1G内存），速度大概都可以到5000 行每秒左右，如果把硬件提高一些，性能还可以提升，但是ETL 过程中难免遇到性能问题，下面一些通用的步骤也许能给你一些帮助.

　　尽量使用数据库连接池

　　尽量提高批处理的commit size

　　尽量使用缓存，缓存尽量大一些（主要是文本文件和数据流）

　　Kettle 是Java 做的，尽量用大一点的内存参数启动Kettle.

　　可以使用sql 来做的一些操作尽量用sql

　　Group ， merge ， stream lookup ，split field 这些操作都是比较慢的，想办法避免他们.，能用sql 就用sql

　　插入大量数据的时候尽量把索引删掉

　　尽量避免使用update ， delete 操作，尤其是update ，如果可以把update 变成先delete ，后insert .

　　能使用truncate table 的时候，就不要使用delete all row 这种类似sql

　　合理的分区

　　如果删除操作是基于某一个分区的，就不要使用delete row 这种方式（不管是delete sql 还是delete 步骤），直接把分区drop 掉，再重新创建

　　尽量缩小输入的数据集的大小（增量更新也是为了这个目的）

　　尽量使用数据库原生的方式装载文本文件(Oracle 的sqlloader ， mysql 的bulk loader 步骤)

　　尽量不要用kettle 的calculate 计算步骤，能用数据库本身的sql 就用sql ，不能用sql 就尽量想办法用procedure ，实在不行才是calculate 步骤.

　　要知道你的性能瓶颈在哪，可能有时候你使用了不恰当的方式，导致整个操作都变慢，观察kettle log 生成的方式来了解你的ETL操作最慢的地方。

　　远程数据库用文件+FTP 的方式来传数据，文件要压缩。（只要不是局域网都可以认为是远程连接）

　　8. 描述物理环境

　　源数据库的操作系统，硬件环境，是单数据源还是多数据源，数据库怎么分布的，做ETL的那台机器放在哪，操作系统和硬件环境是什么，目标数据仓库的数据库是什么，操作系统，硬件环境，数据库的字符集怎么选，数据传输方式是什么，开发环境，测试环境和实际的生产环境有什么区别，是不是需要一个中间数据库(staging 数据库) ，源数据库的数据库版本号是多少，测试数据库的版本号是多少，真正的目标数据库的版本号是多少……. 这些信息也许很零散，但是都需要一份专门的文档来描述这些信息，无论是你遇到问题需要别人帮助的时候描述问题本身，还是发现测试环境跟目标数据库的版本号不一致，这份专门的文档都能提供一些基本的信息

　　9. procedure

　　为什么我不能触发procedure?

　　这个问题在官方FAQ里面也有提到，触发procedure 和 http client 都需要一个类似与触发器的条件，你可以使用generate row 步骤产生一个空的row ，然后把这条记录连上procedure 步骤，这样就会使这条没有记录的空行触发这个procedure (如果你打算使用无条件的单次触发) ，当然procedure 也可以象table input 里面的步骤那样传参数并且多次执行.

　　另外一个建议是不要使用复杂的procedure 来完成本该ETL任务完成的任务，比如创建表，填充数据，创建物化视图等等.

　　10. 字符集

　　Kettle使用Java 通常使用的UTF8 来传输字符集，所以无论你使用何种数据库，任何数据库种类的字符集，kettle 都是支持的，如果你遇到了字符集问题，也许下面这些提示可以帮助你：

　　1. 单数据库到单数据库是绝对不会出现乱码问题的，不管原数据库和目标数据库是何种种类，何种字符集

　　2. 多种不同字符集的原数据库到一个目标数据库，你首先需要确定多种源数据库的字符集的最大兼容字符集是什么，如果你不清楚，最好的办法就是使用UTF8来创建数据库.

　　3. 不要以你工作的环境来判断字符集：现在某一个测试人员手上有一个oracle 的基于xxx 字符集的已经存在的数据库，并且非常不幸的是xxx 字符集不是utf8 类型的，于是他把另一个基于yyy字符集的oracle 数据库要经过某一个ETL过程转换到oracle ，后来他发现无论怎么样设置都会出现乱码，这是因为你的数据库本身的字符集不支持，无论你怎么设置都是没用的. 测试的数据库不代表最后产品运行的数据库，尤其是有时候为了省事把多个不同的项目的不相关的数据库装在同一台机器上，测试的时候又没有分析清楚这种环境，所以也再次强调描述物理环境的重要性.

　　4. 你所看到的不一定代表实际储存的：mysql 处理字符集的时候是要在jdbc 连接的参数里面加上字符集参数的，而oracle 则是需要服务器端和客户端使用同一种字符集才能正确显示，所以你要明确你所看到的字符集乱码不一定代表真的就是字符集乱码，这需要你检查在转换之前的字符集是否会出现乱码和转换之后是否出现乱码，你的桌面环境可能需要变动一些参数来适应这种变动

　　5. 不要在一个转换中使用多个字符集做为数据源.

　　11. 预定义时间维

　　Kettle提供了一个小工具帮助我们预填充时间维，这个工具在kettle_home / samples / transformations / General – populate date dimension. 这个示例产生的数据不一定能满足各种需要，不过你可以通过修改这个示例来满足自己的需求.

　　12. SQL tab 和 Options tab

　　在你创建一个数据库连接的时候除了可以指定你一次需要初始化的连接池参数之外（在Pooling 选项卡下面），还包括一个Options 选项卡和一个 SQL 选项卡， Options 选项卡里面主要设置一些连接时的参数，比如autocommit 是on 还是off ， defaultFetchSize ， useCursorFetch (mysql 默认支持的)，oracle 还支持比如defaultExecuteBatch ， oracle.jdbc.StreamBufferSize， oracle.jdbc.FreeMemoryOnEnterImplicitCache ，你可以查阅对应数据库所支持的连接参数，另外一个小提示：在创建数据库连接的时候，选择你的数据库类型，然后选到Options 选项卡，下面有一个Show help text on options usage ，点击这个按钮会把你带到对应各个数据库的连接参数的官方的一个参数列表页面，通过查询这个列表页面你就可以知道那种数据库可以使用何种参数了.

　　对于SQL 选项卡就是在你一连接这个Connection 之后，Kettle 会立刻执行的sql 语句，个人比较推荐的一个sql 是执行把所有日期格式统一成同一格式的sql ，比如在oracle 里面就是:

　　alter session set nls_date_format = xxxxxxxxxxxxx

　　alter session set nls_xxxxxxxxx = xxxxxxxxxxxx

　　这样可以避免你在转换的时候大量使用to_date() ， to_char 函数而仅仅只是为了统一日期格式，对于增量更新的时候尤其适用.

　　13. 数据复制

　　有的时候可能我们需要的是类似数据复制或者一个备份数据库，这个时候你需要的是一种数据库私有的解决方案，Kettle 也许并不是你的第一选择，比如对于Oracle 来说，可能rman ， oracle stream ， oracle replication 等等， mysql 也有mysql rmaster / slave 模式的replication 等私有的解决方法，如果你确定你的需求不是数据集成这方面的，那么也许kettle 并不是一个很好的首选方案，你应该咨询一下专业的DBA人士也会会更好.

　　14. 如何控制版本变更

　　Kettle 的每一个transformation 和job 都有一个version 字段（在你保存的时候），不过这个功能还不实用，如果你需要版本控制的话，还是建议你将transformation 和job 转换成文本文件保存，然后用svn 或cvs 或任意你熟悉的版本控制系统将其保存，kettle 将在下一个版本加入版本控制的功能（做的更易用）.

　　15. 支持的数据源

　　Kettle 支持相当广的数据源，比如在数据库里面的一些不太常见的Access ， MaxDB (SAP DB) ， Hypersonic ， SAP R/3 system ， Borland Interbase ， Oracle RDB ， Teradata和3.0新加入的Sybase IQ .

　　另外还包括Excel ， CSV ， LDAP ，以及OLAP Server Mondrian ，目前支持Web Service 不过暂时还不支持SOAP.

　　16. 调试和测试

　　当ETL转换出现不可预知的问题时，或是你不清楚某个步骤的功能是什么的情况下，你可能需要创建一个模拟环境来调适程序，下面一些建议可能会有所帮助：

　　尽量使用generate row 步骤或者固定的一个文本文件来创建一个模拟的数据源

　　模拟的数据源一定要有代表性，数据集一定尽量小（为了性能考虑）但是数据本身要足够分散.

　　创建了模拟的数据集后你应该清楚的知道你所要转换之后的数据时什么样的.

　　17. 错误处理

　　在ETL任务中由于数据问题出现转换错误是一件非常正常的事情，你不应该设计一个依赖于临时表或者拥有事务特点的ETL过程，面对数据源质量问题的巨大挑战，错误处理是并不可少的，kettle同样提供非常方便的错误处理方式，在你可能会出错的步骤点击右键选择Define Error handing ，它会要求你指定一个处理error 的步骤，你可以使用文本文件或者数据库的表来储存这些错误信息，这些错误信息会包含一个id 和一个出错的字段，当你得到这些错误信息之后就需要你自己分析出错的原因了，比如违反主键约束可能是你生成主键的方式有错误或者本身的数据有重复，而违反外键约束则可能是你依赖的一些表里面的数据还没有转换或者外键表本身过滤掉了这些数据. 当你调整了这些错误之后，确定所有依赖的数据都被正确的处理了.kettle user guide 里面有更详细的解释，里面还附带了一个使用javascript 来处理错误的示例，这种方式可以作为处理简单数据质量的方式.

　　18. 文档，文档，文档

　　Kettle 提供了丰富的文档和使用手册，小到一个数据库连接怎么连，大到一个功能怎么实现，所有的参数列表，对话框的每一个输入输出代表什么意思都有解释，所以当你遇到问题你应该第一时间翻阅这些文档，也许上面已经告诉你怎么做了. 另外kettle 还有一个非常活跃的社区，你可以到上面提问，但是记住在你提问之前先搜索一下论坛看有没有类似的问题已经问过了，如果没有记得描述清楚你的问题

你可能感兴趣的:(etl)

【网络】SSL/TLS介绍浅慕Antonio 网络编程网络 ssl 网络协议
一、SSL/TLS概述SSL（SecureSocketLayer）：最初由网景（Netscape）开发，用于在客户端和服务器之间建立安全的加密连接，防止数据被窃取或篡改。后来逐步演进，最终被TLS取代。TLS（TransportLayerSecurity）：TLS是SSL的后继协议，目前已经成为互联网安全通信的标准。它不仅实现了数据加密，还提供了身份验证和数据完整性保护，确保双方通信时的信息保密且
深入解析微信协议逆向：基于Go语言的手机号绑定功能实现梦玄海微信 golang java
引言在即时通讯系统开发领域，微信协议的逆向工程一直是一个充满挑战的技术方向。本文将基于一段真实的Go语言实现代码，深入剖析微信客户端绑定手机号功能的核心实现机制，解密其通信协议、数据序列化及安全传输等关键技术细节。一、功能概述与模块架构该代码片段实现了微信客户端的手机号绑定功能（BindOpMobile），主要包含以下技术模块：用户凭证管理：通过comm.GetLoginata获取会话密钥、设备信
我的世界模组开发进阶教程——机械动力的数据生成（2） lemon_sjdk 我的世界模组开发 java
==这篇文字继续来看看机械动力的数据生成==Create源码AssetLookupAssetLookup是Minecraft模组开发中用于简化数据生成的工具类，专注于自动处理方块（Block）和物品（Item）的模型（Model）文件路径生成与状态映射。其核心功能是根据规则动态构造资源路径，并适配不同状态（如供电状态、指示器数值）的模型。以下从两个维度详细解析：一、String...语法：Java
如何保证软件质量？汽车软件基于模型开发的十个问题与质量工具推荐 MESMarketing 自动驾驶
如何保证软件质量？汽车软件基于模型开发的十个问题与质量工具推荐基于模型的软件开发（MBD）在20世纪90年代兴起，当时Simulink®和Matrix®等工具正在从学术或研究领域过渡到生产支持领域。MBD在1999年引入高效自动代码生成后，借助EmbeddedCoder®和TargetLink®等工具迅速扩展。随着电子电器系统日趋复杂，有别于传统的软件开发，基于模型的软件开发成为自动化行业贴别是汽
ESP32学习笔记-读取SD卡并显示到屏幕上搞机械的假程序猿 ESP32学习笔记学习笔记 ESP32
硬件FireBeetle2ESP32-E开发板1.54"240x240IPS广视角TFT显示屏硬件接线测试代码//加载库#include"Arduino.h"#include"FS.h"#include"SD.h"#include"SPI.h"#include"DFRobot_GDL.h"//定义显示屏针脚#defineTFT_DCD2#defineTFT_CSD6#defineTFT_RSTD3
TS 函数泛型和泛型约束邱志刚 TS 前端
仅供参考，自己学习记笔记。//函数泛型functionAdd(a:T,b:T):Array{return[a,b]}Add(1,2);Add('1','2');//多个泛型functionSub(a:T,b:B):Array{return[a,b]}Sub(1,'aa')//泛型约束interfaceLen{length:Number}functiongetLength(arg:T){return
LangChain入门教学：（1）LangChain表达式
LangChain表达式LangChain表达式语言(LCEL)使得从基本组件构建复杂链条变得容易，并且支持诸如流式处理、并行处理和日志记录等开箱即用的功能LCEL基本示例：提示+模型+输出解析器将提示模板和模型链接在一起，让它为我们实现一个语言翻译的功能首先需要安装库文件pipinstall--upgrade--quietlangchain-corelangchain-communitylang
python实现读取文件的指定某行内容 Fitz1318 Python3学习 python
python实现读取文件的指定某行内容最近有一个需求就是读取一个文件中的指定某行的内容，现将方法记录如下importlinecache#这里填写你自己的文件位置和行号text=linecache.getline("../TestFile/test_C1.json",2)print(text)
右移的错误使用造成超出时间限制解决方案 aPurpleBerry LeetCode做题总结算法力扣二分查找
题目链接：https://leetcode.cn/problems/guess-number-higher-or-lower/?envType=study-plan-v2&envId=leetcode-75最开始的代码varguessNumber=function(n){letl=1,r=n;while(l>1;if(guess(m)===-1){r=m-1;}elseif(guess(m)===
线上正常，本地调用deepseek接口报错：Error:SSL certificate problem: unable to get local issuer certificate 落落鱼2013 ssl 服务器网络协议 deepseek
如题，线上调用deepseek接口正常，但本地调用接口时报以下错误：Error:SSLcertificateproblem:unabletogetlocalissuercertificate。问了下豆包，得知是缺少本地证书的问题。然后用小P配置了ssl证书用https访问依旧不行，报错不变：解决办法：调用curl函数时添加以下配置项：curl_setopt($ch,CURLOPT_SSL_VERI
【华为od刷题（C++）】HJ11 数字颠倒 m0_64866459 算法 c++开发语言
我的代码：#include#include#include//引入算法库，提供常见的算法，比如排序、查找、反转等,这里使用了reverse函数来反转字符串usingnamespacestd;intmain(){strings;getline(cin,s);reverse(s.begin(),s.end());/*reverse函数反转字符串的字符顺序s.begin()和s.end()分别表示字符串
ruoyi-实现表格按照属性排序 javachen__ vue.js javascript elementui ruoyi
......{{parseTime(scope.row.loginTime)}}/**排序触发事件*/handleSortChange(column,prop,order){this.queryParams.orderByColumn=column.prop;this.queryParams.isAsc=column.order;this.getList();},
csp基础之string 向日葵的小屋 c++学习算法
一、基础知识1.string的读入、输出、求长度、比较、拼接、遍历：getline(cin,s)：读入一个包含空格的字符串cin>>s：读入一个不包含空格的字符串couts2:直接比较大小s+=t：拼接字符串for(charc:s){c...}：遍历字符串中每一个元素for(inti=0;i>x;if(x>mi;二、经典例题&&函数应用：1.查找和截取函数：.find()&&.substr()s.
Jenkins执行svn update报错
在JenkinsPipeline脚本里面，执行sh：svnupdate报错信息：locale:CannotsetLC_CTYPEtodefaultlocale:Nosuchfileordirectorylocale:CannotsetLC_MESSAGEStodefaultlocale:Nosuchfileordirectorylocale:CannotsetLC_ALLtodefaultloca
针对数据仓库方向的大数据算法工程师面试经验总结巴基海贼王数据仓库大数据算法
⚙️一、技术核心考察点数据建模能力星型vs雪花模型：面试官常要求对比两种模型。星型模型（事实表+冗余维度表）查询性能高但存储冗余；雪花模型（规范化维度表）减少冗余但增加JOIN复杂度。需结合场景选择，如实时分析首选星型。建模实战题：例如设计电商销售数仓，需明确事实表（订单流水）、维度表（商品、用户、时间），并解释粒度选择（如订单级）。ETL流程与优化增量抽取方案：面试高频题。需掌握基于时间戳、CD
微信小程序安卓手机上wx.getLocation定位失败,苹果手机可以,定位已打开 TO_WebNow 微信小程序小程序
wx.getLocation({})用于定位获取经纬度的方法一.我先把我在安卓手机上调试微信小程序定位遇到的问题说下在安卓手机上开启了定位但是没反应,苹果手机上是正常的但在type的类型中选中了‘gcj02’,,然后在定位的时候直接走fail(){}方法了,也不知道为啥,然后我又换了回来换成了默认的‘wgs84’然后就又可以了,这个这个这个我也不知道为啥,不知道你们试试会是什么情况,如果有知道的希
django 中间件
在主目录下创建了一个middleware.py的文件；不使用中间件定义的方法get_response会跳过默写中间件的方法importlogginglogger=logging.getLogger(__name__)classCountRequestMiddleware():def__init__(self,get_response):self.get_response=get_responses
rust 使用tokio实现socket多人聊天若梦网络编程 rust rust 开发语言后端
首先我们实现多人聊天，首先要有服务端和客户端，服务端只有一个，客户端有很多个，看上面的图，客户端1如果要给客户端234发送一条消息，首先需要发送给服务端，然后转发给其余的3个客户端，明白了他们之前发送消息的流程，下面我们实现服务端，//创建监听ip和端口letaddr="127.0.0.1:5555".parse().unwrap();//创建tcpSocketletsocket=TcpSocke
Python 实现 ZeroMQ 的三种基本工作模式赛博Cookie ZeroMQ Python python 网络通信 zeromq 队列
技术博客：https://github.com/yongxinz/tech-blog同时，也欢迎关注我的微信公众号AlwaysBeta，更多精彩内容等你来。简介引用官方说法：ZMQ（以下ZeroMQ简称ZMQ）是一个简单好用的传输层，像框架一样的一个socketlibrary，他使得Socket编程更加简单、简洁和性能更高。是一个消息处理队列库，可在多个线程、内核和主机盒之间弹性伸缩。ZMQ的明确
css 四角线框跟随移动＆白帝＆ css css 前端
四角线框移动基本结构：使用绝对定位(position:absolute)通过CSS变量控制尺寸和位置添加了平滑过渡效果(transition:0.2s)核心步骤动态去设置pointer盒子left和top的值pointer.style.setProperty('--s',img.offsetWidth+'px')pointer.style.setProperty('--x',img.offsetL
大数据领域 OLAP 的数据立方体增量更新大数据洞察大数据 ai
大数据领域OLAP的数据立方体增量更新关键词：OLAP、数据立方体、增量更新、预计算、物化视图、ETL、大数据分析摘要：本文深入探讨大数据领域中OLAP数据立方体的增量更新技术。我们将从基本概念出发，详细分析数据立方体的结构和更新机制，介绍多种增量更新算法及其实现原理，并通过实际案例展示如何在分布式环境下高效维护数据立方体的时效性。文章还将讨论增量更新面临的挑战和未来发展方向，为大数据分析系统的设
小程序第四章作业胡小图图图图图小程序
操作题1.使用canvas组件实现“五个圆圈”的绘制。代码：.js代码：Page({onReady:function(e){constctx=wx.createCanvasContext('quanquan')//绘制蓝色圆环ctx.beginPath()ctx.arc(80,52,50,0,2*Math.PI)ctx.setStrokeStyle('#0072BB')ctx.setLineWid
信息化实施关键点 weixin_41800760 java
信息化的关键点一、管理集团领导层的预期1、内部要形成一个滚动规划，定义每年的合理目标，要坚持长期主义，每年持续投入。2、要求集团定义一个类似CIO的角色，跨部门协调。这个工作量会比较大开发平台支持敏捷迭代的开发方式泛微、致远、简道云都可以选择数据要进行实时同步到数据处理平台与财务，人力等系统进行程序对接。数据处理平台采用帆软的工具，培训熟练使用。这部分的应届生培训一下，可以很快上手。2、ETL的工
使用 bat 脚本获取git仓库版本信息 EchoCoder scripts git batch
使用bat脚本获取git仓库版本信息windows的bat脚本如下:@echooff::变量延迟执行setlocalenabledelayedexpansion::将版本信息写入的目标文件夹传参为脚本的第1个参数setdstDir=%1::在该目录执行git命令获取版本号（也就是git仓库目录）传参为脚本的第2个参数setbaseDir=%2if"%dstDir%"neq""(cd%baseDir
Win10/11: Windows Audio无法启动错误 0x80070005:拒绝访问积跬步至千里PRO Windows windows
解决办法进入目录C:\Windows\System32，找到cmd.exe，右键->以管理员身份运行在cmd窗口中输入：netlocalgroupAdministrators/addnetworkservice，回车在cmd窗口中输入：netlocalgroupAdministrators/addlocalservice，回车右击我的电脑-管理-服务和运用程序-服务，找到WindowsAudio-
Redis八股文莱茵不哈哈 redis 数据库缓存
一.基于redis实现限流功能，有哪几种方式？1.限流一段时间内，某行为允许操作的最大次数2.限流类型截断限流，固定时间窗口限流，固定窗口内的行为统计，实现方式:setlimits0nxex10incrlimits滑动时间窗口限流，滑动窗口行为统计，解决窗口间统计异常，容量固定的，速率也是固定的实现方式:zaddlimitsnownowzremrangebyscorelimits0periodzc
Spark 学习【一】
Spark基本概念MapReduce存在的缺陷编写难度大不能很好充分利用系统内存一个作业多个MR任务嵌套不友好（每一个task都是jvm进程级别创建销毁开销都很大、每一次都要涉及磁盘或dfs或db和网络的IO)（期望以pipeline流水线的方式从头到尾）只能离线处理数据处理读数据（read）–>规整（ETL）–>写(write)将业务系统的数据经过抽取（Extract）、清洗转换（Transfo
flutter 页面加载动画_十、Flutter加载动画蜜桃厨房 flutter 页面加载动画
目录一、效果展示二、RoundPainter三、RoundProgress四、旋转起来五、停止旋转一、效果展示Flutter加载动画.jpg二、RoundPainter同上篇文章《九、Flutter水波动画》画水波原理是一样的，都是通过画笔呈现不规则图形。this.offsetList是存储加载的动画里面的实心圆的坐标，通过drawCircle方法把坐标画到画布上。@overridevoidpai
北理工计算机考研复试上机2024年真题劳尔的狙击镜考研北理工考研复试机试 bit 计算机复试上机题目北理工计算机考研北理工计算机考研2011真题
1、输入一组单词(区分大小写),统计首字母相同的单词的个数，相同的单词不累加，输出格式:“字母，个数”input:Iamaboy,youareaboy.output:I,1a,3b,1y,1代码：#includeusingnamespacestd;vectornums;//存数intmain(){strings;getline(cin,s);//分解单词vectorans;inti=0;while
stream操作List转为List dianqu2773 java
JDK版本：1.8map中使用Long.parseLong去进行转换使用Long.getLong会得到一个所有元素为null的集合。。。转载于:https://www.cnblogs.com/ruozhu/p/10594702.html
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D