weixin_30731287

DSG-ETLplus-Oracle数据库数据实时抽取增强解决方案

1 ETL抽取现状

现有的ETL产品都是通过sql接口从生产数据库上抽取，或者是由生产数据库的应用开发商根据ETL的要求定期生成接口文件。这是ETL常见的两种接口方式。

在目前的ETL抽取机制中，一般有以下几种限制条件：

（1）ETL抽取频率为1天一次

无论是ETL直接从生产数据库中读取数据，还是通过生成数据文件的方式来传输数据。其频率一般都是每天进行一次。因为无论是直接抽取还是生成数据文件，都只能选择在夜间业务量较小的时间段完成。

（2）无法有效处理增量数据识别问题

按照ETL的设计原理，每天从生产系统抽取数据最好是当天的变化数据，这样能大幅度缩短抽取时间，将对生产系统的性能影响降到最低。为了实现增量数据的抽取，就必须具备识别增量数据的条件，通常的做法包括：

a) 通过生产系统中的table中的某个字段来表示该数据是否发生了改变，以及发生改变的日期；

b) 在生产系统中的table上增加timestamp字段，用来记录该条记录发生变化的时间；

c) 由应用厂商来根据业务逻辑判断，将当天的改变数据自动生成接口文件。

以上三种方式不能适合所有的情况，尤其是那些经常进行UPDATE的操作的表更是难以处理。

不得以，很对用户的ETL对那些无法识别增量的table进行每天一次全量抽取，通过全量数据来和前一次抽取的数据之间进行比较来判断数据的增、删、改。

这种方式最大的问题在于：

（1）每天抽取的数据量过于庞大。每天上亿到几十亿条记录都重新处理将占用大量资源和时间；

（2）每次的抽取对生产系统占用大量的资源，严重影响到生产系统的正常运行。

1.1 实时ETL抽取改造目标

因此，数据抽取领域需要一个ETL抽取增强的解决方案，以期望达到以下目标：

（1）解决目前需要应用厂商提供接口文件的复杂程度，以及需要每天对update的记录进行全表抽取所带来的问题

（2）为未来更加实时的ETL抽取奠定基础，例如将来可实现每几分钟、10分钟的抽取间隔；

（3）降低ETL抽取对生产系统的性能影响

（4）避免每天的全量数据处理

（5）提供增量识别机制

2 DSGETLPlus解决方案概要

DSG ETLPlus解决方案的目的是为ETL工具提供一个增量实时数据抽取解决方案。

该工具利用对生产系统ORACLE redo log的跟踪机制，来对生产系统的数据进行变化跟踪，然后将跟踪到的变化数据传输到中间数据库上，在中间数据上对数据进行整合、过滤和判断，并且生产数据接口，将接口文件提供给ETL工具使用。

ETL软件可以从接口数据文件中获取增量数据，同时ETL也可以从镜像库中获取所有需要的其他数据（例如首次数据抽取，或者全量数据抽取）

上图为DSG ETLPlus的工作原理图，从中我们可以看出ETLPlus不是去替代现有的ETL工具，而是对现有的ETL工具进行增强，增强之处在于：

（1）将ETL和生产系统分开，形成中间数据库。

（2）ETLPlus的增量通知功能，使得ETL简单容易识别增量数据；

（3）ETLPlus根据接口要求自动生成和ETL的接口数据，而且接口数据可以根据参数配置设定生产间隔，可以实现到每几秒钟生成一个接口文件。

（3）可为ETL提供一些有价值的附加功能，例如提供全量数据抽取时的静态数据支持等。

2.1 技术要点分析

为了提供增量数据实时抽取功能，ETLPlus软件提供了如下关键技术：

（1）oracle数据库的增量跟踪技术

增量跟踪技术是该组件的最重要环节，因为该环节的目的是解决传统ETL厂商无法解决的实时抽取和增量抽取问题。

DSG ETLPlus产品采取的增量识别技术如下：

在源端数据库上安装ETLPlus agent代理程序。源系统端的Agent进程对Oracle Log日志进行实时分析，从而获取源系统端的交易指令；然后，将这些交易指令和交易数据经过格式转化生成数据格式，并根据不同业务需求进行过滤和转化成与生产应用相吻合的指令；再次，实时传输到目标端系统。

（2）数据存储和增量变化通知功能

有了数据的实时捕获，那么捕获到的数据如何通知给ETL工具，如何将数据保存起来供ETL使用，这就是本产品的第二个关键点。

本产品采用的技术路线如下：

首先创建一个中间数据库，该数据库用作ETL直接数据抽取的数据库，避免ETL直接从生产数据库中抽取；

ETLPlus软件将识别到的技术发送到中间数据库的代理程序上；

代理程序将变化数据作两类处理：一是在中间数据库上维护一张和生产系统对应的数据表；二是根据变化记录经过整理形成完整的记录形成接口文件。

这样ETL工具就能够根据变化跟踪记录中记录所有发生过变化的记录，并且生成ETL工具所需要的增量数据。从而实现增量数据的实时抽取。

2.2 解决方案优势

本方案是在现有的数据仓库基础上进行改造和增强来完成，对现有的数据仓库中已经购买的ETL软件和数据仓库软件完全兼容。

经过此改造，我们认为对于数据库的数据抽取将带来本质上的变化：

（1） 缩短抽取时间：可达到准实时的数据抽取效果，间隔可达到几秒、几分钟；

（2） 降低对CRM数据库的影响：采用ETLPlus对CRM的redo log分析的CPU资源占用<5%，这远远小于ETL直接采用select方式所需要的资源；

（3） 降低数据仓库压力：采用该方式后，不用每天都对全量数据进行处理，只需需要多增量数据部分进行处理。

3 DSG ETLPlus部署方案

3.1 部署结构

为了部署ETLPlus，以采用如下方式来部署：

在数据源的oracle数据库上安装ETLPlus Agent，用来跟踪数据源上的数据变化，通过对redo log进行分析，将跟踪到的变化记录从日志中整合出来（不需要从生产数据库中select）。

在数据仓库服务器上或者在ODS服务器上也安装ETLPlus agent，同时在目标端机器上安装一个oracle数据库，ETLPlus Agent一方面将需要抽取的那些表在目标端服务器上维护一个实时更新的与生产系统保持同步的相同的表；同时在目标端上为每个表每隔一定时间生成一个接口文件。

ETL工具通过ETLPlus生成的接口文件来获取变化的数据内容，实现数据仓库或者ODS系统的数据更新；

如果ETL工具需要进行全量数据抽取，那么就可以直接在ETLPlus维护的目标端表中直接抽取，而不需要从生产数据库中再去抽取。

在ETLPlus部署中，需要一个中间数据库系统，该系统需要服务器、磁盘阵列和ORACLE数据库，ETLPlus将生成的ETL接口文件保存到该服务器的文件系统上供ETL工具读取。

3.2 软硬件环境要求

以上方案中提到了需要一个ETLPlus的中间数据库（这里我们叫做接口数据库），该接口数据库有两个目的：

（1）保存了ETL所需要的表的完全数据，这些表和生产系统保持实时同步

（2）这些表可用作全量抽取时使用，让全量抽取的时候也不需要到生产数据库上获取

（3）帮助生成增量接口数据文件，因为对于INSERT ,DELETE操作来说，完全可以依赖于从源表读取来的redo log生成完整的接口数据；但是对于UPDATE操作来说，无法根据redo log的数据来生成完成一条记录，而必须借助于接口数据库中的完整数据。

该中间数据库可在ODS系统或者数据仓库系统中预留部分空间即可。

3.3 ETL接口文件说明

一、 接口文件格式要求

根据和ETL开发商的沟通讨论结果，DSG ETLPlus将根据规则生成接口数据文件，接口数据文件以不同的table作为一个定义，这里以一个table的定义为例说明：

1．接口数据项

接口单元名称：		组织
接口单元编码：		11023
接口单元说明：		组织
抽取方式及周期：		定时增量
接口数据文件名：		a_YYYYMMHH24MI_11023.dat
校验文件名：		a_YYYYMMHH24MI_11023.verf
接口单元属性列表：
属性编码	属性名称	属性类型	是否可为空	是否主键	备注
PARTY_ID	参与人标识	DECIMAL(12,0)	N	Y
PARENT_PARTY_ID	上级组织	DECIMAL(12,0)	N	N
ORG_CODE	组织标识	VARCHAR(30)	N	N
ORG_NAME	组织名称	VARCHAR(50)	N	N
ORG_LEVEL	组织级别	DECIMAL(5,0)	N	N
ORG_CONTENT	组织简介	VARCHAR(250)	N	N
ADDRESS_ID	地址标识	DECIMAL(12,0)	N	N
STATE	状态	VARCHAR(3)	N	N
STATE_DATE	状态时间	TIMESTAMP(0)	N	N
ORG_TYPE	组织类型	VARCHAR(3)	N	N

2．接口数据文件

a_200902221815_11023.dat

I|-1|-1|-1|缺省组织|-1|外键关联用，无意义|-1|00A|2009-2-2218:01:00|1|

I|1|-1|1|中国电信集团|1|中国电信集团|-1|00A|2009-2-2218:01:00|1|

I|10|1|10|甘肃电信|2|甘肃电信|-1|00A|2009-2-2218:01:00|2|

D|10|1|10|甘肃电信|2|甘肃电信|-1|00A|2009-2-2218:05:00|2|

I|931|10|931|兰州电信|3|兰州电信|-1|00A|2009-2-2218:01:00|2|

U|931|10|931|兰州电信公司|3|兰州电信公司|-1|00A|2009-2-2218:08:00|2|

3．接口数据校验文件

a_200902221815_11023.verf

a_200902221815_11023.dat 386 6 20090222181520090222182615

4．日接口校验汇总文件

d_a_20090225.verf

a_200902211230_10001.dat 0

a_200902211230_10002.dat 14

a_200902211230_10003.dat 200

a_200902211230_10004.dat 12

a_200902211230_10005.dat 50

a_200902211230_20001.dat 18

a_200902211230_20002.dat 62

a_200902211300_10001.dat 44

a_200902211300_10002.dat 23

a_200902211300_10003.dat 0

a_200902211300_10004.dat 15

a_200902211300_10005.dat 0

a_200902211300_20001.dat 18

a_200902211300_20002.dat 10087

二、 配置参数说明

为了提供上述信息的配置项，DSG ETLPlus将提供如下的配置信息来配置需要输出的接口定义：

ETL_INTF.CONF

[COMMON]

OUT_DIR=$DBPS_HOME/intdata /*指明输出数据所存放的路径*/

ITVL= 3600 /*指明数据输出的间隔，单位为秒*/

TMPFILE_suffix=.TMP /*指明临时文件的后缀名*/

Separator =‘|’ /*指明数据项之间的分隔符*/

[TABLE1]

TABLE_NAME=OWNER.TABLE_NAME /*表名*/

data_FILE_name=$tablename_YYYYMMDDHHMISS_????.dat /*该表所对应的输出接口datafile文件的命名格式*/

verify_FILE_name=$tablename_YYYYMMDDHHMISS_????.verf /*该表所对应的输出接口verifyfile文件的命名格式*/

date_verify_FILE_name=d_$tablename_YYYYMMDD.verf /*该表所对应的输出接口dateverify file文件的命名格式*/

field_list=PARTY_ID,PARENT_PARTY_ID,ORG_CODE,ORG_NAME /*定义该表所需要输出的字段及其输出顺序*/

[TABLE2]

TABLE_NAME=OWNER.TABLE_NAME /*表名*/

data_FILE_name=$tablename_YYYYMMDDHHMISS_????.dat /*该表所对应的输出接口datafile文件的命名格式*/

verify_FILE_name=$tablename_YYYYMMDDHHMISS_????.verf /*该表所对应的输出接口verifyfile文件的命名格式*/

date_verify_FILE_name=d_$tablename_YYYYMMDD.verf /*该表所对应的输出接口dateverify file文件的命名格式*/

field_list=PARTY_ID,PARENT_PARTY_ID,ORG_CODE,ORG_NAME /*定义该表所需要输出的字段及其输出顺序*/

4 名词术语

1、ETL

是英文 Extract-Transform-Load 的缩写，用来描述将资料从来源端经过萃取（extract）、转换（transform）、加载（load）至目的端的过程。

2、ETL配置文件

ETL配置文件是用于保存ETL相关操作规则的一个文本文件，所有和ETL相关的操作和转换都在这个文件里面定义。

3、配置文件保留字

配置文件保留字是指在ETL配置文件中使用的一些名称，这些名称是固定的，不能修改，大小写敏感。

4、ETL转换和ETL转换名

本文档中，对一个表的结构和数据行的转换过程称为一个“ETL转换”。在配置文件中，要对所有的“ETL转换”进行命名，称之为ETL转换名。

5、外部查询和外部查询名

在ETL转换过程中，可能要通过其它表进行数据的转换，如代码转换过程。本文档中，这种对于其它表的查询操作称为外部查询。对每一个外部查询，用户都必须赋以一个名字，谓之外部查询名。使用外部查询名可以让用户定义一个转换，并在多个表中使用该转换功能，而不必在每个转换中书写一次查询语句。

5 ETL配置文件

5.1 （一）、配置文件作用

配置文件是用户设置ETL转换规则的地方，该文件在用户发起同步（首次同步和实时同步都会作解析）时作解析，文件解析完成后在作具体数据转换时将不再加载该文件。

如果用户没有设置该文件或设置错误，或者该文件不存，那么对该文件解析将出错，这种情况下，转换功能将不起作用。只有当该文件存在并解析正确时将作下面的具体的数据转换工作。所以在作具体转换工作前请使用图形界面或其他的工具来检查配置文件是否正确。

配置文件名为rule.conf，存放在源端$DBPS_HOME/config/子目录下。

5.2 （二）、配置文件格式说明

以"#"符号开头的行为注释，注释不作解析。注释必须为单行。不支持多行注释。
配置文件分隔为节，每个节以方括号包围的节名开始，到下一节开始或文件结束为止。
配置文件由“[RULES]”节开始，格式如下：

[RULES]

RULES＝[,ETL转换名2...]

MAP_NAMES=<外部查询名1>[,外部查询名2 ...]

外部查询名1= 标准的select语句。参见实例说明。

说明：

该部分记录所有ETL转换名，也就是哪些表进行转换。换句话说，每个表的转换都独立成为配置文件的一节，并且列在配置文件保留字“RULES”一行中。不在该行中出现的ETL转换，即使写到配置文件中也不会起飞作用。

配置文件保留字“RULES”后面记录是所有的ETL转换名，ETL转换名由用户自定义，建议使用“用户名.表名”的格式，ETL转换名是区分大小写的。多个规则名间用“,”分隔开。ETL转换名中不可以包含空格。

配置文件保留字MAP_NAMES定义代码转换使用的外部查询，每个外部查询由一个标准的查询SQL语句和一个外部查询名组成。但这个查询SQL语句必须满足一定的限制条件。外部查询名是由用户定义的，大小写不敏感。查询名必须写到MAP_NAMES行中，否则不会生效。

使用外部查询的是定制函数SUBSTITUTE，它只能使用外部查询名，而不能直接给它一个查询SQL语句。

使用外部查询名可以让用户定义一个代码转换，并在多个表中使用该转换功能，而不必在每个转换中书写一次查询语句。

参见外部查询配置实例。

具体的ETL转换部分格式：

[ETL转换名]

DS_OWNER=<源端表的所有者名称>

DS_TNAME=<源端表名>

DT_OWNER=<目标端表的所有者名称>

DT_TNAME=<目标端表名>

COL_MAP_CNT=<该表列转换规则数>

COL_MAP_<顺序号1>=<源端列名[,源端列名…]>:<目标端列名>(目标端列数据类型)[转换表达式]

……

COL_MAP_<顺序号n>=<源端列名[,源端列名…]>:<目标端列名>(目标端列数据类型)[转换表达式]

ROW_FILTER_CNT=1

ROW_FILTER_1=<行过滤表达式>

说明：

配置文件保留字DS_OWNER、DS_TNAME和DT_OWNER、DT_TNAME分别标明表的源端表的所有者、源端表名，和目标端表的所有者、目标端表名

配置文件保留字COL_MAP_CNT记录该表中列转换规则个数。每个列转换规则对应本行之后的一行，也就是一个列替换规则。目标端不同于源端的列必须在这里定义，而目标端和源端相同的列不必记录。换句话说，默认情况下，没有记录在这里的字段都会原封不动复制到目标端。

每个列转换占用一行，由三个域组成。其中，

l 等于号左边为COL_MAP_顺序号，这个顺序号将影响目标端列的顺序。

l 等于号右测又分为两个域，由冒号分隔。

l 冒号左侧是源端列名列表，用逗号分隔。

l 冒号右侧由目标端列名、数据类型和一个由方括号包围的转换表达式组成。

l 在这几个域都不缺失时的意义为：源端列表涉及的字段通过转换表达式转换成目标端的相应的字段及数据类型。

l 冒号右侧缺失，表示冒号左侧的列不复制到目标端中，也就是删除一个列。

l 冒号左侧缺失，表示新增加一个列。这种情况下，如果冒号右侧转换表达式中使用到了源端的列时，表达式仍然有效。

l 其它较复杂的情况可以由以上几种情况的组合实现。参见实例说明

l 所有的数据转换都可以表示为一个算术表达式，表达式里可以使用函数，可以由函数和（Oracle支持的）操作符组合成复杂的表达式。但表达式中不支持SQL语句中的CASE…THEN…ELSE…END子句。在表达式中，一个“字符串值”要放在两个单引号“'”中间，不在单引号中间的字符串值将会被认为是一个字段名或者是一个数值。例如：在表达式col1+3||'col1'的意思是：字段col1的值加1然后转换成字符串，再将c、o、l和1四个字母组成的字符串连接到该字符串之后。目前表达式中不支持双引号“"”。

配置文件保留字ROW_FILTER_CNT规定转换中对行的过滤条件数，目前只支持一个行过滤条件，也就是说只能是ROW_FILTER_CNT=1。

配置文件保留字ROW_FILTER_1规定行过滤条件，行过滤条件是一个类似PL/SQL中的条件表达式，相当于SQL查询中的的WHERE条件。如col1+3>col2 AND fname IS NULL。凡是满足行过滤条件的记录都不会被复制到目标端。ROW_FILTER_CNT=1

5.3 （三）、可以支持的转换操作

数据转换部分现在可以支持的转换操作有：

1、名字修改转换：

l 支持源端和目标端用户名不同的转换，源端和目标端表名不同的转换，源端和目标端字段名不同的转换。

l 支持对一个表的字段增加，删除，修该源字段类型。

2、列数据具体转换：

l 支持对NUMBER类型数据作的+, -, *, /的转换。

l 支持给一个列设置默认值，当该列为空时自动替换为设置的默认值。

3、行数据过滤：

l 过滤条件可以为一个条件表示式：例如

(Col1 + 3) > col2 AND col3 IS NOT NULL

5.4 （四）、配置文件格式实例说明：

以下的例子中均使用这样的假设：

源端有表DSGSRC.TAB1，结构为：

序号	列名	列类型
1	COL1	NUMBER
2	COL2	VARCHAR2(10)
3	COL3	DATE

转换到目标端的DSGTGT. TAB_NEW

例1、增加列COL4，目标端结构如下

序号	列名	列类型
1	COL1	NUMBER
2	COL2	VARCHAR2(10)
3	COL3	DATE
4	COL4	VARCHAR2(10)，值为源端的COL1的内容转换成字符串而成

配置文件内容如下：

[RULES]

RULES=DSGSRC.TAB1

[DSGSRC.TAB1]

#源端用户名

DS_OWNER=DSGSRC

#源端表名

DS_TNAME=TAB1

#目标端用户名

DT_OWNER=DSGTGT

#目标端表名

DT_TNAME=TAB_NEW

# 列转换规则

COL_MAP_CNT=1

COL_MAP_1=:COL4(VARCHAR2(10))[col1]

例2、删除一列COL3，目标端结构如下

序号	列名	列类型
1	COL1	NUMBER
2	COL2	VARCHAR2(10)

[RULES]

RULES=DSGSRC.TAB1

[DSGSRC.TAB1]

#源端用户名

DS_OWNER=DSGSRC

#源端表名

DS_TNAME=TAB1

#目标端用户名

DT_OWNER=DSGTGT

#目标端表名

DT_TNAME=TAB_NEW

# 列转换规则

COL_MAP_CNT=1

COL_MAP_1=COL3:

例3、修改列名称

将COL1改名为FROMCOL1并且类型改变为VARCHAR2(10)，目标端结构如下

序号	列名	列类型
1	FROMCOL1	VARCHAR2(10)
2	COL2	VARCHAR2(10)
3	COL3	DATE

[RULES]

RULES=DSGSRC.TAB1

[DSGSRC.TAB1]

#源端用户名

DS_OWNER=DSGSRC

#源端表名

DS_TNAME=TAB1

#目标端用户名

DT_OWNER=DSGTGT

#目标端表名

DT_TNAME=TAB_NEW

# 列转换规则

COL_MAP_CNT=2

COL_MAP_1=COL1:

COL_MAP_2=COL1: FROMCOL1 (VARCHAR2(10))[COL1]

例4、数据行过滤

目标端结构和源端一样，但只复制COL1<=20的行。目标端结构如下：

序号	列名	列类型
1	COL1	NUMBER
2	COL2	VARCHAR2(10)
3	COL3	DATE

[RULES]

RULES=DSGSRC.TAB1

[DSGSRC.TAB1]

#源端用户名

DS_OWNER=DSGSRC

#源端表名

DS_TNAME=TAB1

#目标端用户名

DT_OWNER=DSGTGT

#目标端表名

DT_TNAME=TAB_NEW

# 行过滤规则

ROW_FILTER_CNT=1

ROW_FILTER_1=COL1>20

例5、通过中间表进行代码转换。

假设源端有一个中间代码表C，结构如下：

序号	列名	列类型
1	C1	NUMBER
2	C2	VARCHAR2(10)

表C的内容如下：

C1的值	C2的值
一	1
二	2
三	3
四	4
……	……

目标端结构增加一列B(VARCHAR2(10))，它的内容是COL1通过表C进行代码转换而成，如COL1为“1”，则B为“一”，COL1为“2”，则B为“二”，依此类推，对于不存在于C表C2列的数值，则填入“not found”。

序号	列名	列类型
1	B	VARCHAR2(10)
2	COL1	NUMBER
3	COL2	VARCHAR2(10)
4	COL3	DATE

[RULES]

RULES=DSGSRC.TAB1

# 定义代码转换使用的外部查询，本例定义了两个外部查询，但只使用了一个：

MAP_NAMES=conva,VESSELENAME

conva=selectc2,c1 form c

VESSELENAME= select distinct du.VES_code, vn.VES_name from dock_UNCODE du, EDI_UNCODE eu,VESSELENAME vn WHERE du.code=eu.code and eu.code=vn.code

[DSGSRC.TAB1]

#源端用户名

DS_OWNER=DSGSRC

#源端表名

DS_TNAME=TAB1

#目标端用户名

DT_OWNER=DSGTGT

#目标端表名

DT_TNAME=TAB_NEW

# 列转换规则

COL_MAP_CNT=1

COL_MAP_1=:B[SUBSTITUTE(COL1,'conva', ’not found’)]

例6、综合例子

综合例1到例5的例子，目标端的表结构如下：

序号	列名	列类型
1	COL4	VARCHAR2(10)
2	FROMCOL1	VARCHAR2(10)
3	B	VARCHAR2(10)
4	COL2	VARCHAR2(10)

[RULES]

RULES=DSGSRC.TAB1

MAP_NAMES=conva

# 定义代码转换使用的外部查询，这里只定义了一个外部查询：

MAP_NAMES=conva

conva=selectc2,c1 form c

[DSGSRC.TAB1]

#源端用户名

DS_OWNER=DSGSRC

#源端表名

DS_TNAME=TAB1

#目标端用户名

DT_OWNER=DSGTGT

#目标端表名

DT_TNAME=TAB_NEW

# 列转换规则

COL_MAP_CNT=5

COL_MAP_1=:COL4(VARCHAR2(10))[col1]

COL_MAP_2=COL3:

COL_MAP_3=COL1:

COL_MAP_4=COL1: FROMCOL1 (VARCHAR2(10))[COL1]

COL_MAP_5=:B[SUBSTITUTE(COL1,'conva', ’not found’)]

#行过滤规则

ROW_FILTER_CNT=1

ROW_FILTER_1=COL1>20

6 函数

6.1 概述

ETL转换表达式中，许多转换通过函数来完成。除“定制函数”外，其它函数参照Oracle10G的SQL函数实现。除个别函数和Oracle 10G的SQL函数有微小区别外，其它基本一致。所以，具体的细节可以参考Oracle 10G的SQL参考文档。

本章后面几节列出了所有受到支持的函数，不要试图使用任何未列在本文档中的函数，那只会导致转换失败。

另，在程序未实际交付使用前，本章列出的函数可能有一些暂时还没提供支持，请与开发人员联系确认。

6.2 定制函数

函数名

用法

说明

DEFAULT

DEFAULT(expr, default)

设置默认值。该函数用于模拟给某个列设置一个默认值。

函数首先计算expr的值，如果为空非NULL，则返回该值。如果expr的值为NULL，则返回default的值。这时，如果default的值为NULL，则返回NULL。

其中expr和default都可以是任意表达式。

SUBSTITUTE

SUBSTITUTE(expr, 'ex_query'[, default])

外部替换。该函数适用于代码转换一类的运算。

函数首先计算expr的值，如果为NULL，则返回NULL。

如果expr的值非NULL，则根据外部查询ex_query的结果进行代码替换。

代码替换的具体过程如下：

假设ex_query=select code search, name result form country_code。代码替换时，检查外部查询的结果集中，如果有一行记录的第一列search的值等于expr的值，则返回该行的第二列result的值。

如果在ex_query的查询结果中没有找到相应的内容，则返回default表达式（如果有的话）的值，如果没有default参数，则返回NULL。

ex_query是代码替换的查询名。必须是一个字符串，这个查询名是用户定义，是对一个标准的查询的命名，并保存在ETL配置文件的外部查询配置中，参见实例一节。它要满足一定的条件，参见外部查询的限制条件。

其中expr和default都可以是任意表达式。

SUBSTITUTE( )函数相当于对 DECODE( )的扩展，SUBSTITUTE函数通过'ex_query'获得一个外部查询的SQL语句得到类似DECODE( )函数参数表中间的那一大串参数

6.3 数值函数

函数名	用法	说明
ABS	ABS(n)	取n的绝对值
BITAND	BITAND(arg1, arg2)	按位与，计算arg1和arg2按位进行与操作的结果
CEIL	CEIL(n)	取得大于n的最小整数
EXP	EXP (n)	自然指数
FLOOR	FLOOR (n)	取得小于等于n的最大整数
LN	LN(n)	求对数
LOG	LOG(m, n)	求以m为底n的对数
MOD	MOD (m,n)	取余函数，取得m除以n的余数
POWER	POWER (m,n)	乘方，取得m的n次幂
SQRT	SQRT (n)	开平方，取n的平方根
TRUNC	TRUNC(n [, m ])	截断操作。将数值n截断到小数点后m位，如果省略m则全部舍掉小数部分。m可以为负数，这时从小数点开始，从右向左将整数部分-m位数字置0.

6.4 字符串函数

函数名	用法	说明
CHR	CHR (n)	整数转成字符
CONCAT	CONCAT (s1, s2)	字符串连接，和操作符“\|\|”相同
LOWER	LOWER (s)	全部小写
LPAD	LPAD(expr1, n [, expr2 ])	字符串左填充：用expr2或空格在字符串expr1的左侧填充，直到输出长度为n为止。
LTRIM	LTRIM(char [, set ])	左削边。删除字符串的左侧的set中的字符，默认为空格
REPLACE	REPLACE(char, search_string [, replacement_string ] )	将字符串char中所有出现的search_string替换为replacement_string
RPAD	RPAD(expr1 , n [, expr2 ])	字符串右填充：用expr2或空格在字符串expr1的右侧填充，直到输出长度为n为止。
RTRIM	LTRIM(char [, set ])	右削边。删除字符串的右侧的set中的字符，默认为空格
SUBSTR	SUBSTR(string, position[, substring_length ])	取子串。该函数和Oracle 10G的SQL函数SUBSTRB行为一致。
TRIM	TRIM(char [, set ])	两端修整，这个和Oracle的定义有所不同
UPPER	UPPER(char)	全部大写
ASCII	ASCII(char)	返回与指定的字符串第一个字符的ASCII值
INSTR	INSTR(string , substring [, position [, occurrence ] ])	模式匹配，从position处开始从string中查找substring的第occurrence次出现的位置。该函数和Oracle 10G的SQL函数INSTRB行为一致。
LENGTH	LENGTH (char)	求字符串长度。该函数和Oracle 10G的SQL函数LENGTHB行为一致。

6.5 时间日期处理函数

函数名	用法	说明
ADD_MONTHS	ADD_MONTHS(d, n)	日期d增加n个月
CURRENT_DATE	CURRENT_DATE [( )]	返回在为数据库会话设置的本地时区中的当前日期
CURRENT_TIMESTAMP	CURRENT_TIMESTAMP[ (precision) ]	从数据库服务器取得当前会话所在时区的时间戳，返回类型为TIMESTAMP WITH TIME ZONE
EXTRACT	EXTRACT(d, t)	从d取得某一个域t t的值可以是：YEAR, MONTH, DAY, HOUR, MINUTE, SECOND, TIMEZONE_HOUR, TIMEZONE_MINUTE
LAST_DAY	LAST_DAY(date)	取得date所在月的最后一天
LOCALTIMESTAMP	LOCALTIMESTAMP [(precision)]	返回TIMESTAMP类型的会话所在时区日期时间
MONTHS_BETWEEN	MONTHS_BETWEEN(date1, date2)	计算date1和date2之间有几个月。如果date1在日历中比date2早，那么MONTHS_BETWEEN()就返回一个负数。
NUMTODSINTERVAL	NUMTODSINTERVAL(n, 'interval_unit')	将以interval_unit指定的值为单位的数字n转换为一个INTERVAL DAY TO SECOND类型，interval_unit参数可以设置为DAY、HOUR、MINUTE或SECOND。
NUMTOYMINTERVAL	NUMTOYMINTERVAL(n, 'interval_unit')	将以interval_unit指定的值为单位的数字x转换为一个INTERVAL YEAR TO MONTH类型，interval_unit参数可以设置为YEAR或MONTH。
ROUND (date)	ROUND(date [, fmt ])	对date取整。默认情况下，date取整为最近的一天。fmt是一个可选字符串参数，它指明要取整的单元。
SYSDATE	SYSDATE [( )]	SYSDATE返回数据库服务器的操作系统中设置的当前时间值。
SYSTIMESTAMP	SYSTIMESTAMP [( )]	返回一个TIMESTAMP WITH TIME ZONE类型，其中包括数据库的当前日期、时间，以及数据库时区
TO_CHAR	TO_CHAR({ datetime \| interval } [, fmt [, 'nlsparam' ] ])	将datetime转换为字符串。该函数还可以为datetime提供可选的参数fmt。
TO_TIMESTAMP	TO_TIMESTAMP(char [, fmt [ 'nlsparam' ] ])	将字符串char转换为一个TIMESTAMP类型，还可以为char指定一个可选的参数format
TO_TIMESTAMP_TZ	TO_TIMESTAMP_TZ(char [, fmt [ 'nlsparam' ] ])	将字符串char转换为一个TIMESTAMP WITH TIMEZONE类型，还可以为char指定一个可选的参数format
TRUNC	TRUNC(date [, fmt ])	用于对date截断。默认情况下，x被截断为当天的开始时间。fmt是一个可选字符串参数，它指明要截断的单元。

6.6 转换处理函数

函数名	用法	说明
CHARTOROWID	CHARTOROWID(char)	将字符型数据转换成ROWID数据类型.
HEXTORAW	HEXTORAW(char)	将保存在CHAR, VARCHAR2, NCHAR, 或者 NVARCHAR2中的十六进制数值字符转换成raw类型值。
RAWTOHEX	RAWTOHEX(raw)	将raw类型值转换成相应的十六进制字符，参数raw必须是raw数据类型
ROWIDTOCHAR	ROWIDTOCHAR(rowid)	将一个rowid类型值转换成VARCHAR2类型。转换的结果有18个字符。
TO_BINARY_DOUBLE	TO_BINARY_DOUBLE(expr [, fmt [, 'nlsparam' ] ])	函数返回一个双精度的浮点数。参数expr可以是一个字符串，也可以是一个NUMBER, BINARY_FLOAT,或BINARY_DOUBLE类型的数值。如果expr是一个BINARY_DOUBLE类型的数值，则本函数返回expr。可选参数'fmt' 和 'nlsparam'只有当expr是一个字符串时才有效，此时与TO_CHAR(number) 函数使用的参数'fmt' 和 'nlsparam'相当。本函数不支持SQL同名函数对'INF'、'-INF'和'NaN'的定义不可以在expr字符串参数中引入浮点数的格式字符（F, f, D, 或 d）。
TO_BINARY_FLOAT	TO_BINARY_FLOAT(expr [, fmt [, 'nlsparam' ] ])	函数返回一个单精度的浮点数。参数expr可以是一个字符串，也可以是一个NUMBER, BINARY_FLOAT,或BINARY_DOUBLE类型的数值。如果expr是一个BINARY_FLOAT类型的数值，则本函数返回expr。可选参数'fmt' 和 'nlsparam'只有当expr是一个字符串时才有效，此时与TO_CHAR(number) 函数使用的参数'fmt' 和 'nlsparam'相当。本函数不支持SQL同名函数对'INF'、'-INF'和'NaN'的定义不可以在expr字符串参数中引入浮点数的格式字符（F, f, D, 或 d）。
TO_CHAR (character)	TO_CHAR(nchar \| clob \| nclob)	函数将NCHAR, NVARCHAR2, CLOB, 或NCLOB类型的数据转换成数据库字符集。
TO_CHAR (datetime)	TO_CHAR({ datetime \| interval } [, fmt [, 'nlsparam' ] ])	函数将一个DATE, TIMESTAMP, TIMESTAMP WITH TIME ZONE, 或TIMESTAMP WITH LOCAL TIME ZONE类型的datetime值或datetime间隔值转换成一个VARCHAR2类型的字符串，其格式由参数fmt指定，如果忽略这个参数，则转换按照以下规则进行： DATE类型的值按照默认日期格式转换； TIMESTAMP和TIMESTAMP WITH LOCAL TIME ZONE类型的值按照默认时间戳格式转换； TIMESTAMP WITH TIME ZONE类型的值按照默认时间戳格式和时区格式转换；参数nlsparam指定月份和天的名称及其简写所用的语言。如果这一参数被忽略，则本函数将使用当前会话的默认日期语言。
TO_CHAR (number)	TO_CHAR(n [, fmt [, 'nlsparam' ] ])	函数将数值n按照可选参数fmt（如果存在的话）指定的格式转换成VARCHAR2类型的字符串。 n可以是NUMBER, BINARY_FLOAT,或 BINARY_DOUBLE类型。如果忽略fmt参数，则转换结果字符串会足够长以存放n中的有效数字。
TO_DATE	TO_DATE(char [, fmt [, 'nlsparam' ] ])	将类型CHAR,VARCHAR2, NCHAR, 或NVARCHAR2的字符串转换成DATE类型的数据。参数fmt是datetime型格式，它指明了char的数据格式。如果忽略fmt参数，则char必须按照默认的日期格式。如果为转换成公历而传入fmt参数值为'J'，则char必须是一个整数。
TO_NUMBER	TO_NUMBER(expr [, fmt [, 'nlsparam' ] ])	函数将expr转换成NUMBER类型的值。expr可以是BINARY_FLOAT或 BINARY_DOUBLE类型，也可以是CHAR, VARCHAR2, NCHAR, 或NVARCHAR2类型的值，这些字符型expr包含的数值格式可由可选参数fmt指定。本函数不直接支持CLOB数据，然而CLOBs数据作为传入参数时，可以通过隐性数据转换来实现。
TO_TIMESTAMP	TO_TIMESTAMP(char [, fmt [ 'nlsparam' ] ])	本函数将char指定的CHAR, VARCHAR2, NCHAR, 或NVARCHAR2类型的值转换成TIMESTAMP类型。可选参数fmt指明传入参数char的数据格式。如果忽略参数fmt，则传入数据char必须是TIMESTAMP类型的默认格式（此格式由初始化参数NLS_TIMESTAMP_FORMAT来指定）。本函数的参数nlsparam与函数TO_CHAR在转换日期时的作用相同。
TO_TIMESTAMP_TZ	TO_TIMESTAMP_TZ(char [, fmt [ 'nlsparam' ] ])	本函数将参数char指定的CHAR, VARCHAR2, NCHAR, 或NVARCHAR2类型的值转换成TIMESTAMP WITH TIME ZONE类型。可选参数fmt指明传入参数char的数据格式。如果忽略参数fmt，则传入数据char必须是TIMESTAMP WITH TIME ZONE类型的默认格式。本函数的参数nlsparam与函数TO_CHAR在转换日期时的作用相同。

6.7 杂项函数

函数名	用法	说明
COALESCE	COALESCE(expr [, expr ]...)	函数返回表达式列表中第一个不等于NULL的expr的值。至少有一个expr不能为NULL，如果所有的expr都返回NULL，则本函数返回NULL。
DECODE	DECODE(expr, search, result [, search, result ]... [, default ])	Decode函数的目的是对每个search中的值与expr的值相比较，假设expr=sear,那么函数返回对应的result,假设没有找到响应的search，那么函数返回default，假设default没有设置，那么系统返回null。函数中的值可以是任何类型的number类型或者字符串类型。 Decode函数中的参数最大个数为255个。
GREATEST	GREATEST(expr [, expr ]...)	Greatest函数从一系列表达式中返回最大的值，该函数依据expr的类型来决定返回值的类型，如果第一个expr是数字型，那么该函数就按照数字型去判断最大值，如果是character类型则根据asc的先后顺序为依据进行比较。
LEAST	LEAST(expr [, expr ]...)	Leat函数从一系列表达式中返回最小的值，该函数依据expr的类型来决定返回值的类型，如果第一个expr是数字型，那么该函数就按照数字型去判断最小值，如果是character类型则根据asc的先后顺序为依据进行比较。
NULLIF	NULLIF(expr1, expr2)	用来判断expr1和expr2，如果相等，函数返回NULL,如果不相等，返回expr1，expr1不能为NULL值。
NVL	NVL(expr1, expr2)	判断expr1的值，如果expr1=null,函数返回expr2，如果expr1<>null,函数返回expr1
NVL2	NVL2(expr1, expr2, expr3)	假设expr1<>null,返回expr2，如果expr1＝null,返回expr3

7 限制条件

7.1 （－）、对单行记录进行转换可能造成的数据不一致：

1、更新（UPDATE）带有过滤条件字段的表：

如：源端表TAB1(A NUMBER, B CHAR(10))，目标表为TAB1(A NUMBER, B CHAR(10))，行过滤条件为：A > 20

现在有这样的两条记录：

10, 'AB10'

30, 'AB30'

首次同步操作完成后目标表将只有（A > 20的行数据过滤没有，不加载到目标端）：

10, 'ABC10'

情况一、现在在源端作这样的操作：UPDATE TAB1 SET A=15 WHEREA=30;

这样源端数据为：

10, 'ABC10'

15, 'ABC30'

但产生的XF1包中由于没有原来字段A的内容，那么将没有办法作合理的行过滤。即使这样的数据到了目标端由于首次同步没有这样的数据，在查找rowmapping关系的时候还是会出错，也就说后来目标端的记录不变，实际丢失了记录：15, 'ABC30'

情况二、现在在源端作这样的操作：UPDATE TAB1 SET A=50 WHEREA=10;

这样源端数据为：

50, 'ABC10'

30, 'ABC30'

由于产生的UPDATE XF1中A为50，这样的数据就需要过滤，所以UPDATE没办法到目标端，目标端数据不变。本来应该在目标端删除该记录的。这样以来目标端就多一条记录。

情况三、现在在源端作这样的操作：UPDATE TAB1 SETB='ABCX' WHERE A=10;

由于UPDATE XF1包存放的数据不完整（没有记录A字段数据），所以过滤条件也没办法很好的判断该条记录是否需要过滤。默认处理是认为该记录是符合要求的，直接转换完成后发送到目标端。这样到目标端如果真是需要转换的将加载成功，否则会出现rowmapping找不到的提示信息，但不影响数据正确性。

情况四、涉及两个以上字段的转换

假设将源的姓（FNAME）和名（LNAME）两个字段合并到目标端的一个字段，如姓名（NAME），转换的规则为：NAME=FNAME||LNAME。如果在源端更新了LANME的值，但没有更FNAME的值，那么在进行ETL转换时无法得到FNAME的值，所以转换会失败。

2、由于DELETE数据不作任何转换直接发送到目标端，也存在rowmapping找不到的问题，但不影响数据的正确性。

7.2 （二）外部查询的限制条件说明

1、所有中间表是相对固定的，也就是要求所有的中间表在相对长的时间内（比如一个星期或者一个月）是不会变动的。

2、所有中间表的数据都只是在程序启动时装入内存，程序启动后中间表的修改将不会反映到转换结果中。所以，一旦中间表数据有了变动，就要重启复制程序，并且进行全同步。否则无法保证数据的正确性。

3、用户要提供代码转换的SQL语句，并且该语句的查询结果集只能有两个字段。例如：

select distinctdu.VES_code, vn.VES_name from dock_UNCODE du, EDI_UNCODE eu, VESSELENAME vn WHEREdu.code=eu.code AND eu.code=vn.code

4、这个查询结果集的列名称并不重要，重要的是组成结果集的两个列的顺序，代码转换时总是查找第一个列的数据。如果找到相等的数据，返回的是第二列的数据。下面的两个转换是不同的：

Country1=selectcode search, name result form country_code

Country2=selectname result, code search form country_code

5、代码转换的SQL语句可以是任意合法的查询语句。但是，查询结果集目前只运行如下数据类型：CHAR,VARCHAR, VARCHAR2, NUMBER, DATE

6、对于上述支持的数据类型在进行代码替换时，可能会进行隐式的数据类型转换，所以，请勿在SQL语句中使用TO_CHAR()之类的显式数据类型转换函数。如果涉及目前不支持的数据类型，请使用显式的转换函数，如TO_CHAR( ),TO_NUMBER( )，否则转换过程会失败。

7、使用该方式后效率将有明显下降，当然，这和中间表的记录多寡有关。为了提高效率，代码转换的查询结果是在程序调动时一次性调入内存，所以空间效率也会下降，也就是要多占用内存。

转载于:https://www.cnblogs.com/oracle-dsg/archive/2010/05/31/1748147.html

你可能感兴趣的:(DSG-ETLplus-Oracle数据库数据实时抽取增强解决方案)

微信小店推客系统小程序搭建 2501_91869443 微信营销微信推客微信小店推客系统推客
推客招募与管理在系统加持下轻松许多。商家通过系统生成邀请码、分享二维码海报，一键触达潜在推客，无论是员工、老客户，还是社交达人，都能便捷加入。系统支持一级、二级分销管理，推客可邀请下级，上级能从下级推客出单中获相应比例佣金，激发推客裂变。商家还能在后台实时监测推客业绩，对表现优异的推客给予更多资源倾斜，实现精准管理，构建活跃推客团队。
中原焦点团队第25期楚雅丽坚持分享第4天 9e7302df85d1
书还没到，网上搜了关于正面管教的资料，正面管教即是：不矫纵、不惩罚，和善而坚定地教育孩子。那么怎样才能做到呢？1.和善而坚定。不论是控制型的父母还是娇纵型的父母，通常都是被动反应，而不是积极主动。和善而坚定的父母寻求的是解决方案，能够认识到必须先改变自己，在行动之前先观察并思考，引领孩子，消除自己的内疚感，也会允许孩子犯错，允许不完美，允许反复尝试。2，决定你怎么做，然后去做。正面管教的核心是学着
4D卓越团队 AMBR习书报告第17章成长教练继哥
Attention我关注的内容一、团队成员当停止指责和抱怨，发出4D请求承担责任。二、4种叫人失去反应能力的“戏剧状态”及解决方案：1、受害者（绿色）：抱怨他人、悲观无助->停止抱怨，发出请求；2、救助者（黄色）：为求认可，取悦他人，过度承诺、累垮自己->划定界限，适度承诺3、指责者（橙色）：怕被指责、归咎他人、愤怒掩盖->不再指责，生发好奇，了解未知4、理智者（蓝色）：过度理智、压抑情绪->放松
F5推出后量子密码学解决方案，助力企业应对新一代安全威胁 CSDN资讯密码学安全量子计算
近日，全球领先的应用交付和API安全解决方案提供商F5(NASDAQ:FFIV)宣布推出全新综合性后量子密码学（PQC）就绪解决方案，助力客户应对量子计算带来的网络安全范式变革。该解决方案现已无缝集成至F5应用交付与安全平台（F5ApplicationDeliveryandSecurityPlatform），为企业提供保障应用和API安全所需工具的同时，保持卓越的性能与可扩展性。随着量子时代的到来
智慧水厂怎么建？物联网数据采集+SCADA升级，水务工业智能转型
在智慧工业与“双碳”目标的双重驱动下，智慧水厂已成为水务行业数字化转型的必选项。通过物联网（IoT）技术实现水厂数据采集的实时化、自动化，不仅能提升供水效率与水质安全，还能降低能耗与运维成本。一、智慧水厂的核心痛点：数据孤岛与效率瓶颈传统水厂依赖人工巡检和分散式监控系统，普遍存在以下问题：1.数据滞后：人工抄表与离线分析导致决策延迟；2.设备盲区：水泵、阀门等关键设备状态无法实时感知；3.能耗浪费
《反脆弱》三金的成长笔记
《反脆弱》由壹心理编著，其中收录了周梵、李雪、小楼老师、曾奇峰等各位老师的佳作，从多个心理学角度讲解分析了生活的各种问题，真的是传道授业解惑也。其中感触颇深的几点分享给大家：第一，稀缺心态，因为穷所以稀缺心态，因为稀缺心态更穷，这是蛋跟鸡的循环问题。稀缺心态的人目光短浅透支未来带宽不足（不识人），解决方案是节约带宽，不透支，多做重要而不紧急的事；第二，人生最怕的不是失败，而是连失败的勇气都没有，“
【Oracle】Oracle 11g打补丁时遇到opatch apply命令无法识别瑞琪姐大数据模块 oracle 数据库
⚙️1.使用完整路径执行命令问题原因：若未将$ORACLE_HOME/OPatch加入系统PATH环境变量，直接输入opatchapply会因系统无法定位命令而报错。解决方案：改用绝对路径执行：$ORACLE_HOME/OPatch/opatchapply例如：/u01/app/oracle/product/11.2.0/db_1/OPatch/opatchapply注：此方法在Windows/L
python venv不适合变更路径（路径变更）的几种解决方案（venvpack、pip download、pip install --no-index --find-links=packages）
文章目录**为什么会出现路径问题？**1.**`pyvenv.cfg`文件**：该文件记录了虚拟环境的Python解释器路径（`home`字段）。如果源和目标机器的Python安装路径不一致，虚拟环境将无法找到正确的解释器。2.**脚本路径硬编码**：虚拟环境中的激活脚本（如`activate`）和可执行文件（如`python`）可能包含绝对路径或硬编码的相对路径，导致路径不匹配时失效。**解决方
Modbus协议开发应用挑战赛（一）
问题1：Modbus协议在主从通信模式设计中，为何严格规定“从站仅能响应主站请求而无法主动发送数据”？这种设计对工业控制场景的实时性保障与通信可靠性维护存在哪些具体影响？参考解析：设计原因：Modbus诞生于1979年，当时工业现场多采用RS-485等半双工总线，主从模式能避免多设备同时发送数据导致的总线冲突。通过集中控制（主站轮询），简化了通信仲裁机制，降低硬件实现复杂度。实时性影响：优势：主站
MATC：通过数学推理和图表还原增强视觉语言预训练 AI专题精讲模型加速人工智能 AI技术应用多模态视觉语言
温馨提示：本篇文章已同步至"AI专题精讲"MATC：通过数学推理和图表还原增强视觉语言预训练摘要视觉语言数据，如图表、图形和信息图，在人类世界中无处不在。然而，现有的最先进的视觉语言模型在这些数据上的表现并不理想。我们提出了MATCHA（数学推理与图表去渲染预训练），旨在增强视觉语言模型在联合建模图表/图形与语言数据方面的能力。具体而言，我们提出了几个预训练任务，涵盖了图形解构和数值推理，这些是视
.NET 8.0 使用 WebSocket csdn_aspnet .Net8.0 websocket .netcore
使用WebSocketWebSocket是一项关键技术，它支持客户端和服务器之间的全双工实时通信，从而促进联网应用中更动态的数据交换。与遵循请求-响应模式的传统HTTP请求不同，WebSocket提供持久连接，数据可以在两个方向上自由流动。这使得WebSocket对于需要低延迟通信的应用程序（例如在线游戏、实时聊天和实时财务数据流）尤为有用。借助.NET8和C#12及更高版本的全面支持，开发人员可
SpringbootSpringSecurityJWTredis框架搭建demo：多参数登录验证的安全解决方案
SpringbootSpringSecurityJWTredis框架搭建demo：多参数登录验证的安全解决方案去发现同类优质开源项目:https://gitcode.com/项目介绍在当今互联网安全日益重要的背景下，如何构建一个安全、高效的认证授权框架成为了开发者关注的焦点。SpringbootSpringSecurityJWTredis框架搭建demo正是为此而生，它集成了Springboot、
学习下区块链技术基础知识编程狂魔
区块链技术（“blockchain”）的兴起是一种类似于互联网崛起的范式转换事件。本文概述了区块链技术的优势和机遇。我们认为区块链技术有一天会促进世界上大多数的信息交换（“交易transactions”）。区块链不应被视为比特币的同义词。比特币代表了一种基于区块链的解决方案，适用于许多信息交换问题之一。虽然比特币是第一个基于区块链的数字货币，引起了媒体的广泛关注，但区块链的影响已经超越了比特币。在
28.【.NET8 实战--孢子记账--从单体到微服务--转向微服务】--单体转微服务--币种服务（二）喵叔哟 .NET 8 .net 微服务 java
仅有币种服务还不够，记账应用还需支持不同币种间的转换。要实现这一功能，首先需要获取币种之间的汇率。因此，本文将介绍如何实现汇率的同步。一、汇率数据从何而来？汇率数据无时无刻都在变动，因此需要一个可靠的来源来获取最新的汇率信息。通常可以通过以下几种方式获取：爬取数据：一些专业的金融数据服务商提供汇率数据，可以通过订阅获取。手动输入：对于小型应用，可以手动输入汇率数据，但这不适合大规模或实时更新的应用
游戏盾能否保护业务免受DDoS攻击吗？上海云盾第一敬业销售游戏 ddos 网络
在当今这个网络攻击日益频繁的时代，DDoS攻击已成为企业面临的最大威胁之一。游戏盾，作为一种先进的网络安全解决方案，被广泛用于保护在线游戏免受攻击，但其在企业业务保护方面的效果如何呢？本文将深入探讨游戏盾是否能够保护业务免受DDoS攻击，分析其在企业网络安全中的作用和重要性。随着网络攻击手段的不断升级，企业必须采取更为有效的防护措施，以确保业务连续性和数据安全。1、游戏盾的定义游戏盾最初是为在线游
2025前端面试题全攻略：高频考点解析与实战指南
助力金三银四跳槽季，覆盖90%大厂核心考点，技术进阶+面试技巧双提升一、HTML/CSS核心篇1.语义化与布局实战问题1：如何用HTML5语义化标签优化新闻详情页？答案要点：使用包裹主体内容，划分章节标记发布时间，+处理图文SEO优势：提升关键内容权重，增强可访问性问题2：实现等间距三栏布局（中间自适应）.container{display:flex;gap:20px;/*关键：替代margin方
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
FPGA通信设计十问
1.FFT有什么用？FFT（快速傅里叶变换）是离散傅里叶变换（DFT）的高效实现算法，它的核心作用是快速将信号从时域转换到频域，从而简化信号分析和处理的过程。自然界的信号（如声音、图像、电磁波等）通常以时域形式存在（即随时间变化的波形），但很多特性（如频率成分、谐波分布）在频域中更易分析FFT能快速计算信号中各频率分量的幅值和相位。可以进行频率拆分与实时处理。FFT是“信号的透视镜”，让我们能“看
MySQL主从模式的数据一致性 mysia
MySQL单机的数据一致性MySQL作为一个可插拔的数据库系统，支持插件式的存储引擎，在设计上分为Server层和StorageEngine层。在Server层，MySQL以events的形式记录数据库各种操作的Binlog二进制日志，其基本核心作用有：复制和备份。除此之外，我们结合多样化的业务场景需求，基于Binlog的特性构建了强大的MySQL生态，如：DTS、单元化、异构系统之间实时同步等等
Python基础和高级【抽取复习】斟的是酒中桃 python 学习
1.Python的深拷贝和浅拷贝有什么区别？浅拷贝【ls.copy()】：将列表的不可变对象【值】复制一份，同时引用其中的可变对象【列表】，共用一个内存地址深拷贝【ls=copy.deepcopy(list)】：完全的复制原可变对象，生成新的可变对象，两个对象互相独立2.列表和元组的区别是什么？1.列表概念：有序序列，使用[]定义，元素之间用，隔开有序序列增删改操作：可以增删改列表的任意元素不可变
Windows环境Chrome安装提示无可用更新问题解决【2024年版】 zrhsmile Windows chrome windows
现象卸载了Chrome浏览器之后，通过腾讯管家安装Chrome浏览器，发现都无法一键安装或安装【注：一键安装或安装，都没有任何反应】如果可以科学上网，发现通过下载Google的网址，下载Chrome浏览器的安装软件ChromeSetup.exe，也无法安装。提示：“无可用的更新”或“与服务器的连接意外终止”原因出现这个问题的原因是因为安装程序是和google直连的或者杀毒软件阻止了连接解决方案【亲
基于51单片机电机测速显示电路系统方案创新电子设计单片机 51单片机嵌入式硬件单片机
**单片机设计介绍，基于51单片机电机测速显示电路系统方案文章目录一概要二、功能设计设计思路三、软件设计原理图五、程序六、文章目录一概要基于51单片机的电机测速显示电路系统方案概要如下：一、引言本设计旨在通过51单片机为核心控制器，结合测速电路和显示电路，实现对电机转速的精确测量和实时显示。该系统可以广泛应用于需要电机转速监控的各类设备和系统中，如自动化设备、机器人、电动车等。二、系统组成51
面对诱惑的三种解决方案琢磨概念者
经过我多天的实践，面对诱惑/上瘾/沉迷等情况有三种解决方法。分别是隔离、臣服和他律。第一，隔离。隔离诱惑，隔离所有与诱惑物相关的一切事物。不再想它，转移注意力，运气好能成功。但如果诱惑总还浮现在你脑海里，祝你好运。举个例子，你要戒除抽烟，那就隔离与烟有关的一切事物。当你忙碌起来，你的注意力会被转移，也就不再想着抽烟了(前提是你烟瘾还没大到一定程度)。如果你是老烟枪，即便隔离所有相关事物，烟还是浮现
nuc10黑苹果无法wifi上网
家里小书房重新整理了下，也想放一台mac台式机用来工作学习，可惜公司已经有一台macmini，手头又有macpro，实在不好意思再购一台mac台式机。就打算重新把nuc10安装黑苹果。具体的nuc10黑苹果安装参考https://zhuanlan.zhihu.com/p/146191643安装好了后，一切都正常，就是没有wifi。这里记录下解决方案：下载wifi驱动https://github.c
Unet源码实现（pytorch） wyn20001128 pytorch 人工智能 python
U-Net是一种用于生物医学图像分割的卷积神经网络架构。它通过引入一种新颖的网络结构和训练策略解决了传统方法在数据量不足时面临的挑战。U-Net的主要思想是利用数据增强技术来高效利用有限的标注样本，并通过独特的网络设计来提高分割精度。主要贡献U-Net的主要贡献包括：1、数据增强策略：使用随机弹性变形和其他形式的数据增强来增加训练数据的多样性，从而在有限的数据集上训练出更强大的模型。2、U形网络结
OracleERP云软件二次开发：业务流程管理与自定义教程 kkchenjj 工业软件二次开发全集工业软件 ERP 数据库开发语言
OracleERP云软件二次开发：业务流程管理与自定义教程OracleERP云平台概览OracleERP云平台架构OracleERPCloud采用了一种多层架构设计，旨在提供高度可扩展、安全且灵活的云解决方案。其架构主要分为以下几个层次：用户界面层：提供直观的用户界面，支持多种设备访问，包括桌面、平板和手机。这一层利用了现代Web技术，如HTML5、CSS3和JavaScript，确保了良好的用户
算力网异构协同与能效优化驱动工业物联及智慧民生实践
内容概要算力网络作为数字基础设施的核心载体，正通过异构协同架构与能效优化框架的深度融合，构建起支撑工业物联网与智慧民生应用的技术底座。随着边缘计算节点的快速部署与模型压缩技术的突破性发展，工业场景中的设备健康检测与实时故障分析已实现毫秒级响应，典型应用场景包括产线异常识别、设备寿命预测等关键领域。与此同时，数据预处理技术的迭代升级有效缓解了工业传感器数据维度爆炸带来的算力压力，通过特征提取与噪声过
技术演进中的开发沉思-40 MFC系列：多线程协作
今天说说MFC的线程，当年用它实现中间件消息得心应手之时，可以实现一边实时接收数据，一边更新界面图表图文信息，顺滑得让人想吹声口哨。MFC多线程它像给程序装上了分身术，让原本只能“单任务跑腿”的代码，突然有了双重任务的本事。一、线程的底层逻辑设计模式里有个工厂模式，在我的眼里，进程就像一整个工厂：有独立的厂房（内存空间）、固定的设备（系统资源），是操作系统能调度的最小单位。而线程就是工厂里的工人—
正点原子stm32F407学习笔记7——看门狗实验蜗牛先森i stm32单片机 stm32 学习笔记
一、什么是看门狗在由单片机构成的微型计算机系统中，由于单片机的工作常常会受到来自外界电磁场的干扰，造成程序的跑飞，而陷入死循环，程序的正常运行被打断，由单片机控制的系统无法继续工作，会造成整个系统的陷入停滞状态，发生不可预料的后果，所以出于对单片机运行状态进行实时监测的考虑，便产生了一种专门用于监测单片机程序运行状态的模块或者芯片，俗称“看门狗”(watchdog)。就是在程序执行异常情况下系统复
stm32f407文件该怎么调试编译烧录？ bug菌¹ 全栈Bug调优(实战版)stm32 嵌入式硬件单片机 stm32f407
本文收录于《全栈Bug调优(实战版)》专栏，致力于分享我在项目实战过程中遇到的各类Bug及其原因，并提供切实有效的解决方案。无论你是初学者还是经验丰富的开发者，本文将为你指引出一条更高效的Bug修复之路，助你早日登顶，迈向财富自由的梦想！同时，欢迎大家关注、收藏、订阅本专栏，更多精彩内容正在持续更新中。让我们一起进步，Up！Up！Up！备注：部分问题/难题源自互联网，经过精心筛选和整理，结合数
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，