在奋斗的大道

DataX 使用详解

一、Datax 概述

1.1 Datax

1.2 Datax Features

1.3 Datax 环境要求

1.4 Datax 安装

1.5 Datax 演示示例

二、Datax 核心详解

2.1 DataX 3.0概览

2.2 DataX3.0框架设计

2.3 DataX3.0 支持的读写插件

2.4 DataX3.0核心架构

2.5 DataX3.0 六大核心优势

三、Datax 实现数据同步

3.1 通过 DataX 实 MySQL 数据同步

3.2 通过 DataX 实现 MySQL 数据同步Elasticsearch

3.3 通过 DataX 实现 Mongodb数据同步MySQL

3.4 通过 DataX 实现 Oracle数据同步MySQL

四、Datax 开发实战

一、Datax 概述

1.1 Datax

DataX 是阿里云 DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS 等各种异构数据源之间高效的数据同步功能。

1.2 Datax Features

DataX本身作为数据同步框架，将不同数据源的同步抽象为从源头数据源读取数据的Reader插件，以及向目标端写入数据的Writer插件，理论上DataX框架可以支持任意数据源类型的数据同步工作。同时DataX插件体系作为一套生态系统, 每接入一套新数据源该新加入的数据源即可实现和现有的数据源互通。

1.3 Datax 环境要求

Linux
JDK(1.8以上，推荐1.8)
Python(2或3都可以)
Apache Maven 3.x (Compile DataX)

1.4 Datax 安装

方法一、直接下载DataX工具包：DataX下载地址

下载后解压至本地某个目录，进入bin目录，即可运行同步作业：

$ cd  {YOUR_DATAX_HOME}/bin
$ python datax.py {YOUR_JOB.json}

自检脚本： python {YOUR_DATAX_HOME}/bin/datax.py {YOUR_DATAX_HOME}/job/job.json

方法二、下载DataX源码，自己编译：DataX源码

(1)、下载DataX源码：

$ git clone [email protected]:alibaba/DataX.git

(2)、通过maven打包：

$ cd  {DataX_source_code_home}
$ mvn -U clean package assembly:assembly -Dmaven.test.skip=true

打包成功，日志显示如下：

[INFO] BUILD SUCCESS
[INFO] -----------------------------------------------------------------
[INFO] Total time: 08:12 min
[INFO] Finished at: 2015-12-13T16:26:48+08:00
[INFO] Final Memory: 133M/960M
[INFO] -----------------------------------------------------------------

打包成功后的DataX包位于 {DataX_source_code_home}/target/datax/datax/ ，结构如下：

$ cd  {DataX_source_code_home}
$ ls ./target/datax/datax/
bin		conf		job		lib		log		log_perf	plugin		script

1.5 Datax 演示示例

功能描述：从stream读取数据并打印到控制台

第一步：创建作业的配置文件（json格式）

通过命令查看配置模板： python datax.py -r {YOUR_READER} -w {YOUR_WRITER}

温馨提示： {YOUR_READER} ：数据源读取类型，{YOUR_WRITER}: 数据源写入类型。稍后补充datax 支持数据类型和对应的read/write.

$ cd  {YOUR_DATAX_HOME}/bin
# 温馨提示：本示例使用的streamread/streamwrite 流做功能演示。
$  python datax.py -r streamreader -w streamwriter
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "streamreader", 
                    "parameter": {
                        "column": [], 
                        "sliceRecordCount": ""
                    }
                }, 
                "writer": {
                    "name": "streamwriter", 
                    "parameter": {
                        "encoding": "", 
                        "print": true
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""
            }
        }
    }
}

根据模板配置文件，修改相关参数。

定义切片记录总数(输出总数)："sliceRecordCount": 10

定义字段："column":[{"type":"long"， "value":"10"}，{"type": "string"，"value": "hello，你好，世界-DataX"}]

$ vi streamDemo.json
{
  "job": {
    "content": [
      {
        "reader": {
          "name": "streamreader",
          "parameter": {
            "sliceRecordCount": 10,
            "column": [
              {
                "type": "long",
                "value": "10"
              },
              {
                "type": "string",
                "value": "hello，你好，世界-DataX"
              }
            ]
          }
        },
        "writer": {
          "name": "streamwriter",
          "parameter": {
            "encoding": "UTF-8",
            "print": true
          }
        }
      }
    ],
    "setting": {
      "speed": {
        "channel": 5
       }
    }
  }
}

第二步：启动DataX

$ cd {YOUR_DATAX_DIR_BIN}
$ python datax.py ./stream2stream.json

datax 显示日志如下:

...
2022-12-16 11:20:25.263 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2015-12-17 11:20:15
任务结束时刻                    : 2015-12-17 11:20:25
任务总计耗时                    :                 10s
任务平均流量                    :              205B/s
记录写入速度                    :              5rec/s
读出记录总数                    :                  50
读写失败总数                    :                   0

二、Datax 核心详解

2.1 DataX 3.0概览

DataX 是一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。

设计理念

为了解决异构数据源同步问题，DataX将复杂的网状的同步链路变成了星型数据链路，DataX作为中间传输载体负责连接各种数据源。当需要接入一个新的数据源的时候，只需要将此数据源对接到DataX，便能跟已有的数据源做到无缝数据同步。
当前使用现状

DataX在阿里巴巴集团内被广泛使用，承担了所有大数据的离线同步业务，并已持续稳定运行了6年之久。目前每天完成同步8w多道作业，每日传输数据量超过300TB。

此前已经开源DataX1.0版本，此次介绍为阿里云开源全新版本DataX3.0，有了更多更强大的功能和更好的使用体验。Github主页地址：GitHub - alibaba/DataX: DataX是阿里云DataWorks数据集成的开源版本。

2.2 DataX3.0框架设计

DataX本身作为离线数据同步框架，采用Framework + plugin架构构建。将数据源读取和写入抽象成为Reader/Writer插件，纳入到整个同步框架中。

Reader：Reader为数据采集模块，负责采集数据源的数据，将数据发送给Framework。
Writer： Writer为数据写入模块，负责不断向Framework取数据，并将数据写入到目的端。
Framework：Framework用于连接reader和writer，作为两者的数据传输通道，并处理缓冲，流控，并发，数据转换等核心技术问题。

2.3 DataX3.0 支持的读写插件

经过几年积累，DataX目前已经有了比较全面的插件体系，主流的RDBMS数据库、NOSQL、大数据计算系统都已经接入。DataX目前支持数据如下：

类型	数据源	Reader(读)	Writer(写)	文档
RDBMS 关系型数据库	MySQL	√	√	读、写
	Oracle	√	√	读、写
	OceanBase	√	√	读、写
	SQLServer	√	√	读、写
	PostgreSQL	√	√	读、写
	DRDS	√	√	读、写
	达梦	√	√	读、写
	通用RDBMS(支持所有关系型数据库)	√	√	读、写
阿里云数仓数据存储	ODPS	√	√	读、写
	ADS		√	写
	OSS	√	√	读、写
	OCS	√	√	读、写
NoSQL数据存储	OTS	√	√	读、写
	Hbase0.94	√	√	读、写
	Hbase1.1	√	√	读、写
	MongoDB	√	√	读、写
	Hive	√	√	读、写
无结构化数据存储	TxtFile	√	√	读、写
	FTP	√	√	读、写
	HDFS	√	√	读、写
	Elasticsearch		√	写

2.4 DataX3.0核心架构

DataX 3.0 开源版本支持单机多线程模式完成同步作业运行，本小节按一个DataX作业生命周期的时序图，从整体架构设计非常简要说明DataX各个模块相互关系。

核心模块介绍：

DataX完成单个数据同步的作业，我们称之为Job，DataX接受到一个Job之后，将启动一个进程来完成整个作业同步过程。DataX Job模块是单个作业的中枢管理节点，承担了数据清理、子任务切分(将单一作业计算转化为多个子Task)、TaskGroup管理等功能。
DataXJob启动后，会根据不同的源端切分策略，将Job切分成多个小的Task(子任务)，以便于并发执行。Task便是DataX作业的最小单元，每一个Task都会负责一部分数据的同步工作。
切分多个Task之后，DataX Job会调用Scheduler模块，根据配置的并发数据量，将拆分成的Task重新组合，组装成TaskGroup(任务组)。每一个TaskGroup负责以一定的并发运行完毕分配好的所有Task，默认单个任务组的并发数量为5。
每一个Task都由TaskGroup负责启动，Task启动后，会固定启动Reader—>Channel—>Writer的线程来完成任务同步工作。
DataX作业运行起来之后， Job监控并等待多个TaskGroup模块任务完成，等待所有TaskGroup任务完成后Job成功退出。否则，异常退出，进程退出值非0

DataX调度流程：

举例来说，用户提交了一个DataX作业，并且配置了20个并发，目的是将一个100张分表的mysql数据同步到odps里面。 DataX的调度决策思路是：

DataXJob根据分库分表切分成了100个Task。
根据20个并发，DataX计算共需要分配4个TaskGroup。
4个TaskGroup平分切分好的100个Task，每一个TaskGroup负责以5个并发共计运行25个Task。

2.5 DataX3.0 六大核心优势

可靠的数据质量监控
- 完美解决数据传输个别类型失真问题
  
  DataX旧版对于部分数据类型(比如时间戳)传输一直存在毫秒阶段等数据失真情况，新版本DataX3.0已经做到支持所有的强数据类型，每一种插件都有自己的数据类型转换策略，让数据可以完整无损的传输到目的端。
- 提供作业全链路的流量、数据量运行时监控
  
  DataX3.0运行过程中可以将作业本身状态、数据流量、数据速度、执行进度等信息进行全面的展示，让用户可以实时了解作业状态。并可在作业执行过程中智能判断源端和目的端的速度对比情况，给予用户更多性能排查信息。
- 提供脏数据探测
  
  在大量数据的传输过程中，必定会由于各种原因导致很多数据传输报错(比如类型转换错误)，这种数据DataX认为就是脏数据。DataX目前可以实现脏数据精确过滤、识别、采集、展示，为用户提供多种的脏数据处理模式，让用户准确把控数据质量大关！
丰富的数据转换功能

DataX作为一个服务于大数据的ETL工具，除了提供数据快照搬迁功能之外，还提供了丰富数据转换的功能，让数据在传输过程中可以轻松完成数据脱敏，补全，过滤等数据转换功能，另外还提供了自动groovy函数，让用户自定义转换函数。详情请看DataX3的transformer详细介绍。
精准的速度控制

还在为同步过程对在线存储压力影响而担心吗？新版本DataX3.0提供了包括通道(并发)、记录流、字节流三种流控模式，可以随意控制你的作业速度，让你的作业在库可以承受的范围内达到最佳的同步速度。
```
"speed": {
   "channel": 5,
   "byte": 1048576,
   "record": 10000
}
```
强劲的同步性能

DataX3.0每一种读插件都有一种或多种切分策略，都能将作业合理切分成多个Task并行执行，单机多线程执行模型可以让DataX速度随并发成线性增长。在源端和目的端性能都足够的情况下，单个作业一定可以打满网卡。另外，DataX团队对所有的已经接入的插件都做了极致的性能优化，并且做了完整的性能测试。性能测试相关详情可以参照每单个数据源的详细介绍：DataX数据源指南
健壮的容错机制

DataX作业是极易受外部因素的干扰，网络闪断、数据源不稳定等因素很容易让同步到一半的作业报错停止。因此稳定性是DataX的基本要求，在DataX 3.0的设计中，重点完善了框架和插件的稳定性。目前DataX3.0可以做到线程级别、进程级别(暂时未开放)、作业级别多层次局部/全局的重试，保证用户的作业稳定运行。
- 线程内部重试
  
  DataX的核心插件都经过团队的全盘review，不同的网络交互方式都有不同的重试策略。
- 线程级别重试
  
  目前DataX已经可以实现TaskFailover，针对于中间失败的Task，DataX框架可以做到整个Task级别的重新调度。
极简的使用体验
- 易用
  
  下载即可用，支持linux和windows，只需要短短几步骤就可以完成数据的传输。请点击：Quick Start
- 详细
  
  DataX在运行日志中打印了大量信息，其中包括传输速度，Reader、Writer性能，进程CPU，JVM和GC情况等等。
- 传输过程中打印传输速度、进度等
- 传输过程中会打印进程相关的CPU、JVM等
- 在任务结束之后，打印总体运行情况

三、Datax 实现数据同步

3.1 通过 DataX 实 MySQL 数据同步

第一步：生成 MySQL 到 MySQL 数据同步的模板。

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py -r mysqlreader -w mysqlwriter
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",							# 读取端
                    "parameter": {
                        "column": [], 								# 需要同步的列 (* 表示所有的列)
                        "connection": [
                            {
                                "jdbcUrl": [], 						# 连接信息
                                "table": []							# 连接表
                            }
                        ], 
                        "password": "", 							# 连接用户
                        "username": "", 							# 连接密码
                        "where": ""									# 描述筛选条件
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter",							# 写入端
                    "parameter": {
                        "column": [], 								# 需要同步的列
                        "connection": [
                            {
                                "jdbcUrl": "", 						# 连接信息
                                "table": []							# 连接表
                            }
                        ], 
                        "password": "", 							# 连接密码
                        "preSql": [], 								# 同步前. 要做的事
                        "session": [], 
                        "username": "",								# 连接用户 
                        "writeMode": ""								# 操作类型
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""										# 指定并发数
            }
        }
    }
}

第二步：编写MySQL数据同步文件:MySQLToMySQL.json

[root@MySQL-1 ~]# vi MySQLToMySQL.json
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader", 
                    "parameter": {
                        "username": "root",
                        "password": "123123",
                        "column": ["*"],
                        "splitPk": "ID",
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:mysql://192.168.1.1:3306/course-study?useUnicode=true&characterEncoding=utf8"
                                ], 
                                "table": ["t_member"]
                            }
                        ]
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter", 
                    "parameter": {
                        "column": ["*"], 
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://192.168.1.2:3306/course-study?useUnicode=true&characterEncoding=utf8",
                                "table": ["t_member"]
                            }
                        ], 
                        "password": "123123",
                        "preSql": [
                            "truncate t_member"
                        ],
                        "username": "root", 
                        "writeMode": "insert"
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "5"
            }
        }
    }
}

第三步：验证

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py MySQLToMySQL.json

控制台输出:

2021-12-15 16:45:15.120 [job-0] INFO  JobContainer - PerfTrace not enable!
2021-12-15 16:45:15.120 [job-0] INFO  StandAloneJobContainerCommunicator - Total 2999999 records, 107666651 bytes | Speed 2.57MB/s, 74999 records/s | Error 0 records, 0 bytes |  All Task WaitWriterTime 82.173s |  All Task WaitReaderTime 75.722s | Percentage 100.00%
2021-12-15 16:45:15.124 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-12-15 16:44:32
任务结束时刻                    : 2021-12-15 16:45:15
任务总计耗时                    :                 42s
任务平均流量                    :            2.57MB/s
记录写入速度                    :          74999rec/s
读出记录总数                    :             2999999
读写失败总数                    :                   0

3.2 通过 DataX 实现 MySQL 数据同步Elasticsearch

第一步：生成 MySQL 到 Elasticsearch 数据同步的模板。

[root@MySQL-1 ~]# python datax.py -r mysqlreader -w elasticsearchwriter
Read writer [elasticsearchwriter] template error:: can't find file /home/**/tool/datax/plugin/writer/elasticsearchwriter/plug_job_template.json

问题原因 ：写elasticsearchwriter 插件没有生成plugin_job_template.json文件

解决办法：在/home/**/tool/datax/plugin/writer/elasticsearchwriter/文件目录下，新增plugin_job_template.json 文件，并为plugin_job_template.json添加相关权限。

vi plugin_job_template.json

# 编辑plugin_job_template.json 内容
{
    "name"： "elasticsearchwriter",
    "paramter": {

        "endpoint": "",
        "index": "",
        "type": "",
        "cleanup": true,
        "dynamic": true,
        "settings":{"index":{"number_of_shards":2, "nummber_of_replicas": 1}},
        "batchSize": 10000,
        "splitter": "",
        "column": []
    }

    
}

再次执行第一步，获取MySQL 同步Elasticsearch数据模板内容。

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",							# 读取端
                    "parameter": {
                        "column": [], 								# 需要同步的列 (* 表示所有的列)
                        "connection": [
                            {
                                "jdbcUrl": [], 						# 连接信息
                                "table": []							# 连接表
                            }
                        ], 
                        "password": "", 							# 连接用户
                        "username": "", 							# 连接密码
                        "where": ""									# 描述筛选条件
                    }
                }, 
                "writer": {
                        "name": "elasticsearchwriter",							# 写入端
                        "paramter": {

                            "endpoint": "",
                            "index": "",
                            "type": "",
                            "cleanup": true,
                            "dynamic": true,
                            "settings":{
                                "index":{
                                    "number_of_shards":2,                         
                                    "nummber_of_replicas": 1
                                }
                            },
                            "batchSize": 10000,
                            "splitter": "",
                            "column": []
                         }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""										# 指定并发数
            }
        }
    }
}

第二步：创建es 索引并指定mapping 映射。

PUT http://192.168.43.10:9200/es_db
 
{
    "mappings":{
        "properties":{
            "address":{
                "type":"text",
                "fields":{
                    "keyword":{
                        "type":"keyword",
                        "ignore_above":256
                    }
                }
            },
            "age":{
                "type":"long"
            },
            "book":{
                "type":"text",
                "fields":{
                    "keyword":{
                        "type":"keyword",
                        "ignore_above":256
                    }
                }
            },
            "name":{
                "type":"text",
                "fields":{
                    "keyword":{
                        "type":"keyword",
                        "ignore_above":256
                    }
                }
            },
            "sex":{
                "type":"long"
            }
        }
    }
}

第三步：编写MySQL数据同步文件:MySQLToES.json

[root@MySQL-1 ~]# vi MySQLToES.json
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader", 
                    "parameter": {
                        "username": "root",
                        "password": "123123",
                         "where":"created_dt>='${start_time} 00:00:00' and created_dt<='${end_time} 23:59:59'",
                        "column": [
                                "id",
                                "address",
                                "age",
                                "book",
                                "name",
                                "sex"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:mysql://192.168.1.1:3306/course-study?useUnicode=true&characterEncoding=utf8"
                                ], 
                                "table": ["t_user"]
                            }
                        ]
                    }
                }, 
                "writer": {
                     "name": "elasticsearchwriter",
                      "parameter": {
                            "endpoint": "http://127.0.0.1:9200",
                            "index":"es_db",
                            "type":"traces",
                            "settings": {"index" :{"number_of_shards": 5, "number_of_replicas": 1}},
                            "batchSize": 5000,
                            "splitter": ",",
                            "column": [
                              {"name":"pk","type":"id"},
                              {"name":"address","type":"keyword"},            
                              {"name":"book","type":"keyword"},
                              {"name":"sex","type":"integer"},
                              {"name":"age","type":"integer"},
                              {"name":"name","type":"keyword"}
                            ]
                          }

                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "5"
            }
        }
    }
}

第四步：验证

python /usr/local/datax/bin/datax.py ./MySQLToES.json -p "-Dstart_time=2022-12-17 -Dend_time=2022-12-17"

3.3 通过 DataX 实现 Mongodb数据同步MySQL

第一步：生成 Mongodb 到 MySQL数据同步的模板。

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py -r mongodbreader -w mysqlwriter
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mongodbreader",							# 读取端
                    "parameter": {
                        "address": [], 								# mongodb 地址
                        "collectionName":"",                        # 集合名称
                        "column": [], 							    # 字段名称
                        "dbName": "", 							    # 数据库名称
                        "userPassword": ""						    # 密码
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter",							# 写入端
                    "parameter": {
                        "column": [], 								# 需要同步的列
                        "connection": [
                            {
                                "jdbcUrl": "", 						# 连接信息
                                "table": []							# 连接表
                            }
                        ], 
                        "password": "", 							# 连接密码
                        "preSql": [], 								# 同步前. 要做的事
                        "session": [], 
                        "username": "",								# 连接用户 
                        "writeMode": ""								# 操作类型
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""										# 指定并发数
            }
        }
    }
}

第二步：编写Mongodb数据同步文件:MongodbToMySQL.json

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mongodbreader",
                    "parameter": {
                        "address": ["*************:27017"],
                        "collectionName": "mongo2mysql",
                        "column": [
                            {
                                "name":"name",
                                "type":"string"
                            },
                            {   "name":"age",
                                "type":"double"
                            },
                            {   "name":"gender",
                                "type":"string"
                            }
                        ],
                        "dbName": "test"
                    }
                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "column": ["*"],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://*************:3306/datax",
                                "table": ["test"]
                            }
                        ],
                        "password": "*******",
                        "username": "root",
                        "writeMode": "insert"
                    }
                }
            }
        ],
        "setting": {
            "speed": {
                "channel": "1"
            }
        }
    }
}

第三步：验证

python /usr/local/datax/bin/datax.py ./MongodbToMySQL.json

控制台输出：

3.4 通过 DataX 实现 Oracle数据同步MySQL

第一步：生成 Oracle 到 MySQL数据同步的模板。

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py -r oraclereader -w mysqlwriter
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "oraclereader",							# 读取端
                    "parameter": {
                        "column": [], 								# 字段名称
                        "connection":[{
                                "jdbcUrl": [],                      # 数据库url
                                "table": []                         # 表名
                        }],                        
                        "password": "", 							    # oracle 密码
                        "username": "", 							    # oracle 账户
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter",							# 写入端
                    "parameter": {
                        "column": [], 								# 需要同步的列
                        "connection": [
                            {
                                "jdbcUrl": "", 						# 连接信息
                                "table": []							# 连接表
                            }
                        ], 
                        "password": "", 							# 连接密码
                        "preSql": [], 								# 同步前. 要做的事
                        "session": [], 
                        "username": "",								# 连接用户 
                        "writeMode": ""								# 操作类型
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""										# 指定并发数
            }
        }
    }
}

第二步：编写Oracle数据同步文件:OracleToMySQL.json (全量同步)


{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "oraclereader", 
                    "parameter": {
                        "column": ["INVESTOR_ID","INVESTOR_NAME","ID_TYPE","ID_NO","CREATE_TIME"], 
                        "splitPk": "INVESTOR_ID",
                        "where" : "INVESTOR_ID is not null",
                        "connection": [
                            {
                                "jdbcUrl": ["jdbc:oracle:thin:@172.17.112.177:1521:helowin"], 
                                "table": ["CXX.CUSTOMER"]
                            }
                        ], 
                        "password": "123456", 
                        "username": "admin"
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter", 
                    "parameter": {
                        "column": [ 
                            "customer_no",
                            "customer_name",
                            "id_type",
                            "id_no",
                            "create_time"
                           
                        ], 
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://172.17.112.176:3306/customer_db?useUnicode=true&characterEncoding=UTF-8", 
                                "table": ["customer_datax"]
                            }
                        ], 
                        "username": "admin", 
                        "password": "123456", 
                        "preSql": ["truncate table customer_datax"], 
                        "writeMode": "insert"
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "3"
            }
        }
    }
}

第三步：控制台执行全量同步脚本

python /usr/local/datax/bin/datax.py ./OracleToMySQL.json

四、Datax 开发实战

实际功能需求：产品经理要求实现，除第一次Datax 全量同步Oracle 至MySQL数据外，还要求每天自动同步Oracle 数据至MySQL数据库。

功能设计关键点

datax 增量同步脚本
Shell 脚本调用Python 脚本，并动态传入相关参数
Linux 系统定时任务Cron 自动调用Shell 脚本或者Java 分布式定时任务框架XXL-JOB 调用Shelll脚本

第一步：编写Oracle 同步MySQL 同步全量脚本, Trans_All_House.json

# 创建Trans_All_House.json
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "oraclereader", 
                    "parameter": {
                        "splitPK": "LSBH",
                        "connection": [
                            {
                                "jdbcUrl": ["jdbc:oracle:thin:@172.17.112.177:1521:helowin"], 
                                "querySql": ["select LSHB, YWBH, TJSBYWBH, CHYWLB, FWBM, ZRZBH, BDCDYDM, FWZT, SZQSC, SZZZC, MYC, DY, FH, FWZL, ****, to_char(YWBJSJ, 'yyyy-MM-dd HH24:mm:ss') as YWBJSJ, to_char(SJCRSJ, 'yyyy-MM-dd HH24:mm:ss') as SJCRSJ  from BASE_HOUSE"]
                            }
                        ], 
                        "password": "123456", 
                        "username": "admin"
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter", 
                    "parameter": {
                        "column": [ 
                            "LSHB",
                            "YWBH",
                            "TJSBYWBH",
                            "CHYWLB",
                            "FWBM",
                            "ZRZBH",
                            "BDCDYDM",
                            "FWZT",
                            "SZQSC",
                            "SZZZC",
                            "MYC",
                            "DY",
                            "FH",
                            "FWZL",
                            ******
                            "YWBJSJ",
                            "SJCRSJ"
                           
                        ], 
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://172.17.112.176:3306/customer_db?useUnicode=true&characterEncoding=UTF-8", 
                                "table": ["BASE_HOUSE"]
                            }
                        ], 
                        "username": "admin", 
                        "password": "123456", 
                        "preSql": ["truncate table BASE_HOUSE"], 
                        "writeMode": "insert"
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "3"
            }
        }
    }
}

第二步：编写Shell 脚本调用全量同步脚本

# 编辑全量同步Shell脚本
vi trans_all_house.sh

# 文本内容
#!/bin/bash

# 执行datax脚本，传入时间范围
python /usr/local/datax/bin/datax.py usr/local/datax/job/Trans_All_House.json

温馨提示：

1、为trans_all_house.sh 脚本添加可执行权限

chmod +777 trans_all_house.sh

2、执行trans_all_house.sh 脚本

./trans_all_house.sh

第三步：编写Oracle 同步MySQL 同步增量脚本, Increase_Day_House.json

# 创建Increase_Day_House.json

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "oraclereader", 
                    "parameter": {
                        "splitPK": "LSBH",
                        "connection": [
                            {
                                "jdbcUrl": ["jdbc:oracle:thin:@172.17.112.177:1521:helowin"], 
                                "querySql": ["select LSHB, YWBH, TJSBYWBH, CHYWLB, FWBM, ZRZBH, BDCDYDM, FWZT, SZQSC, SZZZC, MYC, DY, FH, FWZL, ****, to_char(YWBJSJ, 'yyyy-MM-dd HH24:mm:ss') as YWBJSJ, to_char(SJCRSJ, 'yyyy-MM-dd HH24:mm:ss') as SJCRSJ  from BASE_HOUSE where CREATE_DT >='${start_time}' and CREATE_DT <='${end_time}'"]
                            }
                        ], 
                        "password": "123456", 
                        "username": "admin"
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter", 
                    "parameter": {
                        "column": [ 
                            "LSHB",
                            "YWBH",
                            "TJSBYWBH",
                            "CHYWLB",
                            "FWBM",
                            "ZRZBH",
                            "BDCDYDM",
                            "FWZT",
                            "SZQSC",
                            "SZZZC",
                            "MYC",
                            "DY",
                            "FH",
                            "FWZL",
                            ******
                            "YWBJSJ",
                            "SJCRSJ"
                           
                        ], 
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://172.17.112.176:3306/customer_db?useUnicode=true&characterEncoding=UTF-8", 
                                "table": ["BASE_HOUSE"]
                            }
                        ], 
                        "username": "admin", 
                        "password": "123456", 
                        "writeMode": "update"
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "3"
            }
        }
    }
}

第四步：编写Shell 脚本调用增量同步脚本

# 编辑增量同步Shell脚本
vi increase_day_house.sh

增量同步Shell 脚本内容：

#!/bin/bash

# 执行datax脚本，传入时间范围
python /usr/local/datax/bin/datax.py /usr/local/datax/job/increase_day_house.json -p "-Dstart_time='`date +"%Y-%d-%m"` 00:00:00' -Dend_time='`date +"%Y-%d-%m"` 23:59:59'"

第五步：设置 crontab 定时任务，每天23点执行一次。

#修改 crontab 文件，如果文件不存在会自动创建。
crontab -e

# 添加Shell 脚本定时任务调度
0 0 23 * * ? /usr/local/datax/sh/increment_day_house.sh >/dev/null 2>&1

你可能感兴趣的:(Java架构专栏,深蓝计划,数据库)

python-读写mysql(操作mysql数据库)
importpymysqlimportpandasaspdimporttimeonly_time=time.localtime(time.time())time_now=time.strftime('%Y-%m-%d%H:%M:%S',only_time)dt=time.strftime('%Y%m%d',only_time)t=time.time()tt=int(t)parentId=''sta
程序人生之项目团队那些人与事(1) chilavert318 熬之滴水穿石程序人生团队项目经理
序原本是打算继续温习我对于windows内核的理解的，已经写到我最为头疼的地方。说实话，把内核了解清楚，不是写几篇感悟就可以完全搞明白的。连日都开会，临近年底要参加很多会议，原本将每日更新技术贴的计划变得十分紧凑，思维也变得世俗起来。连日听各个项目汇报情况，怎会有这样或者那样的问题。似乎很多问题，我都似曾相识，但是为什么总会有人在重复着某些人的过去，这到底是为什么？看着工资条上工龄工资一栏，猛地意
减脂四部曲我叫丁坚持
关于减脂，我们都话可说，又都无话可说，就像有句话说的那样，我懂得很多道理，仍旧过不好这一生。其实，之所以屡战屡败，还是方法不到位，时间再长，终究不过是小白。且看我的四部曲一、计划任何事情的开始都涉及到计划层面，拿减脂来说，你准备用多少时间减脂多少斤，时间不要拉太长，否则思想和嘴巴容易出轨，拿一个月来减脂5斤（基数大，更明显）来讲，还是可以的，只是减脂它包括：饮食、运动、心情、睡眠。没有节食，莫要节
python读写mysql cavin_2017 Python 学习
目前用到的连接数据库，主要实现连个功能：1.根据sql查询2.将dataframe数据通过pandas包写入mysql数据库中1.根据sql查询：通常我们通过sql查询mysql中的表，分三步1.连接数据库2.数据查询3.关闭连接，如果需要查询的步骤较多，将查询封装成函数，通过参数传递sql代码会省事很多。##定义连接数据库函数defmy_db(host,user,passwd,db,sql,po
oracle查询数据结构滤涉及的sql语句胡斌附体 oracle sql 数据结构
背景：去客户数据库查询表数据。了解表结构以及表字段及索引等信息oracle数据库SELECTt.OWNERAS"用户名",t.TABLE_NAMEAS"表名",c.COMMENTSAS"表说明"FROMALL_TABLEStLEFTJOINALL_TAB_COMMENTScONt.OWNER=c.OWNERANDt.TABLE_NAME=c.TABLE_NAMEANDc.TABLE_TYPE='T
阿里云服务器ECS付费类型节省计划、按量付费、抢占式实例阿腾云
阿里云服务器ECS付费类型包年包月、按量付费和抢占式实例有什么区别？包年包月先付费后使用，最低购买一个月时长，平均下来价格优惠；按量付费先使用后付费，按小时结算费用，适合短期使用，平均下来费用要比包年包月贵一些；抢占式实例和按量付费相类似，只是价格上要比按量的优惠90%，但是抢占式实例可能会被系统释放，抢占式实例适合无状态的应用。阿里云服务器网aliyunfuwuqi.com来详细说下阿里云服务器
python连接达梦数据库方式 water bucket python 数据库 pandas
1、通过jaydebeapi调用jdbcimportpandasaspdimportjaydebeapiif__name__=='__main__':url='jdbc:dm://{IP}:{PORT}/{库名}'username='{username}'password='{password}'jclassname='dm.jdbc.driver.DmDriver'jarFile='{DmJdb
k8s:手动创建PV，解决postgis数据库本地永久存储云游 k8s kubernetes 容器云原生
1.离线环境CPU:HygonC86728532-coreProcessor操作系统：麒麟操作系统containerd：1.7.27Kubernetes:1.26.12KubeSphere:4.1.2kubekey：3.1.10Harbor:2.13.1Postgis:17-3.52创建StorageClass2.1创建apiVersion:storage.k8s.io/v1kind:Storag
Shell 脚本加密操作：让用户可执行，不可查看脚本源码 —— shc 实战避坑指南
在日常运维和开发中，Shell脚本常包含敏感信息（如数据库密码、API密钥、服务器IP等）。若直接分发脚本，源码暴露风险极高。此时，加密脚本（可执行但不可读）成为刚需。常见的shc工具可将脚本编译为二进制文件，实现“能执行但不可看”的效果。一、shc加密脚本的使用方法安装shc包管理器安装（推荐）：#Ubuntu/Debiansudoaptinstallshc#CentOS/RHELsudoyum
今日计划与复盘2019.7.6 河北凤凰高飞
今日计划与复盘2019.7.61.早起：6点前达标2.写字一篇3.跑步五公里复盘：今天是妈妈生日，给妈妈买了生日蛋糕。说来惭愧，不是爸爸提醒，我差点忘了妈妈生日，还不如我儿子晚上从衡水一中打来电话，祝他奶奶生日快乐。今天以休息为主，很放松。打卡也很随意，晚上快11点才打了部分卡。
mysql+explain怎么看_MySQL学习----explain查看一条sql 的性能安123
在开发的过程中,对于我们写的sql语句，我们有时候会考虑sql语句的性能，那么explain就是首选。Explain命令在解决数据库性能上是第一推荐使用命令，大部分的性能问题可以通过此命令来简单的解决，Explain可以用来查看SQL语句的执行效果，可以帮助选择更好的索引和优化查询语句，写出更好的优化语句。Explain语法：explainselect…from…[where...]例如：expl
以太坊正处于漫长而复杂的过渡阶段！合并在即？短期痛苦为长期收益做准备！链科天下
目前，以太坊正处于“漫长而复杂的过渡”阶段，使其成为更强大的网络是“深度变革”的原因。在昨天法国举行的以太坊社区会议上，以太坊联合创始人VitalikButerin（V神）分享了以太坊的未来计划和愿景。V神将以太坊升级分为合并、激增、边缘和清除四个阶段。“合并”只是一系列计划升级中的第一部分，而激增、边缘和清除阶段实际上是以太坊扩展、清理和进化的关键部分，预计以太坊合并仅完成升级计划的55%。事实
【每日精进】少了读书和运动，不是美好的一天金台望道
6月25日星期六天气：晴好早晨：5点多起来，就整理发布“读毛年谱（176）”，顺便整理各个平台这个栏目的材料，均声明专栏是读书笔记，并非原创。以后这个栏目都不要放在宝贵的早上来做，完全放在晚上加工。早上做原创工作。以后每天还要安排读书和运动。少了这两样，这一天也不是美好的一天了！上午：到图书馆去，继续写小说第48章。下午：本想去图书馆，中午饭后，就在家里睡大觉了，一下午没做事。呜呼！晚上：完成“读
MySQL学习----Explain 典孝赢麻崩乐急 mysql 学习数据库
使用Explain可以查看sql的性能瓶颈信息，并根据结果进行sql的相关优化。当使用Explain分析SQL查询时，MySQL会返回一个包含多个字段的结果集，每个字段都提供了查询执行计划的重要信息。主要输出字段详解（1）id含义：SELECT标识符作用：表示查询中SELECT子句的执行顺序值说明：id相同：执行顺序从上到下id不同：从大到小执行id为NULL：表示结果集，如UNION结果（2）s
Python 进阶学习之全栈开发学习路线 Microi风闲【胶水语言】Python python 学习开发语言
文章目录前言一、Python全栈开发技术栈1.前端技术选型2.后端框架选择3.数据库访问二、开发环境配置1.工具链推荐2.VSCode终极配置3.项目依赖管理三、现代Python工程实践1.项目结构规范2.自动化测试策略3.CI/CD流水线四、部署策略大全1.传统服务器部署2.容器化部署3.无服务器部署五、性能优化技巧1.数据库优化2.异步处理3.静态资源优化结语前言Python作为当今最流行的编
骑昆明到北海—94 蒙自市海关旧址 61清风i
每年春季详细规划好线路，夏季出行，2020年因为疫情迟迟不能确定线路和行程。总算到了暑期疫情逐渐消失，规划了50多天的云南昆明—广西北海计划。2020年9月13日傍晚点从延平站出发，9月15日到达云南昆明开始这一旅程，一直到11月4日下午从北海市飞回福州顺利结束。虽然在云南骑过二次长途（一次从昆明往香格里拉方向。一次从泸沽湖往腾冲方向，）而这次选择往广西这一路，可以说路上每天都是新鲜的。确定线路和
MySQL入门学习-查询优化.EXPLAIN
在MySQL中，'EXPLAIN'命令用于获取查询执行计划的信息。一、关于'EXPLAIN'的一些常见查询优化方面的特点、使用方法、与其他比较及高级应用：1.特点：-提供查询执行计划的详细信息，帮助了解查询的执行方式。-可以用于优化查询性能，找出潜在的性能问题。-适用于各种类型的查询，包括简单查询和复杂查询。2.使用方法：-在查询语句前添加'EXPLAIN'关键字，例如：'EXPLAINSELEC
Java学习----Redis集群典孝赢麻崩乐急 java 学习 redis
在分布式系统开发中，Redis作为高性能的键值存储数据库，被广泛用于缓存、会话存储、消息队列等场景。当单节点Redis无法满足高并发、大容量的需求时，Redis集群成为解决性能瓶颈和数据可靠性问题的关键方案。Redis集群是Redis提供的分布式解决方案，通过将数据分片存储在多个节点上，实现数据的分布式存储和负载均衡。它由多个Redis节点组成，节点之间通过gossip协议进行通信，共同承担数据存
python3异步爬虫：asyncio + aiohttp + aiofiles（python经典编程案例）数据知道 python3案例和总结 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录1.安装依赖库2.异步爬虫的基本流程3.实现异步爬虫3.1代码实现3.2代码说明4.运行效果5.扩展功能5.1设置请求头5.2处理异常5.3限制并发数5.4爬取图片6.总结使用Python的异步编程技术（asyncio+aiohttp+aiofiles）可以实现高效的异步爬虫。以下是详细的使用指南和代码示例。1.安装依赖库首先安装所需的
2023-11-08 低代码云MES
万界星空科技半导体MES应用工艺流程：半导体制造涉及多个工艺步骤，包括晶圆制备、沉积、刻蚀、离子注入、扩散、封装等。MES系统可以在每个工艺步骤中发挥关键作用。01、晶圆制备在晶圆制备阶段，MES系统可以监测晶圆的生产状态，记录晶圆的特性参数，并确保按照计划进行。02、刻蚀和沉积刻蚀和沉积是半导体制造中的关键步骤，要求高度精密的控制。MES系统可以监控刻蚀和沉积过程，确保薄膜的均匀性和厚度。03、
Mysql主从复制技术栈壳 mysql 数据库
一、什么是主从复制1、Master（主数据库）将用户的操作命令以二进制的方式保存到bin-log下。2、Slave（从数据库）通过io进程，连接到主数据库，请求主数据库当中指定日志文件中的指定位置后的内容。3、Master接收到io的请求后，负责将IO所需要指定请求信息，发送给Slave的IO进程。4、Slave的IO进程收到信息后，将日志信息发添加Slave到中继日志relay-log的最末端。
《发现坚持能量附带的“赠品”》看破彩虹的蜗牛
图片发自App【一】迷茫总会暗淡，不自控也必将陨落；在暗淡迷茫的背后，总少不了坚持的影子，坚持终将使未来拨云见日。如果你看着这句话感到很熟悉那就证明了你也是《侠岚》的爱好者之一，没错这句话就是我从里面的经典名句改编过来的，虽然，读起来感觉好像有那么点不顺，但足以表达我的心情。【二】在这个5月份已然过去，6月份瞬间到来的日子里，我不禁沉思要想继续使“坚持”能量更好的传递下去，从内心感觉现在的计划还根
Linux-Mysql 日志
文章目录（一）二进制日志（二）错误日志（三）慢查询日志此处主要记录关于常用日志的作用和用法（一）二进制日志主要用于数据备份1）登入数据库，查看二进制日志是否打开，默认是OFF状态showvariableslike'%log_bin%'2）进入配置文件vim/etc/my.cnf添加以下参数log-bin=mysql-binserver_id=2#id必须唯一binlog_format=ROWexp
小程序直播间赌石是否可信？遭遇巨额损失寻求法律援助！天龙咨询
在网络直播已经成为一个趋势，越来越多的人参与到直播带货的潮流之中，可是有心人却开始在其中大量牟利，借助镜头实施诈骗计划。赌石是珠宝业术语，是一种翡翠原石交易方式。翡翠在开采出来时，有一层风化皮包裹着，无法知道其内的好坏，须切割后才能知道翡翠的质量。因此，“赌石”具有很大的风险性和不确定性。若你也不幸被骗遇到此类平台一定不要打草惊蛇，早期还有希望挽回。免费咨询作者微信电话见【文章末尾】不成功不收费！
linux-日志服务 Code Rhythm Linux linux 运维服务器
linux-日志服务一、rsyslog1.配置文件2.消息级别3.设备类型二、日志轮转1.主配置文件2.配置日志轮转功能3.结合cron使用总结一、rsyslogrsyslog是Linux/Unix系统上的一款高性能、模块化的日志管理服务，用于收集、处理、过滤和转发系统日志及应用程序日志。支持多种协议（如TCP/UDP/TLS）、数据库存储（MySQL/PostgreSQL）、远程日志转发等高级功
抄书打卡第2天八月荒
本来今天计划抄一章的，可是，由于生病住院，耽搁了，只抄了一半。虽然只抄了一半，但还是有收获的。本章节主要讲的是在录节目的时候，人们无法分辨真假情感流露，而作者又是追求真实的东西，讨厌弄虚作假。为博眼球，很多电视节目都把情感做了假。收视率肯定上去了，可这是我们需要的吗？这样的手段长期用，观众也会审视疲劳的。这就是很多节目陆陆续续淡出荧幕的根本原因。这就是我今天抄书的收获。抄书，是另一种学习进步的方式
Java 性能调优实战：JVM 参数配置与 GC 日志分析
Java性能调优实战：JVM参数配置与GC日志分析（10000字）一、Java性能调优的核心概念在现代企业级应用中，Java应用的性能直接影响用户体验、系统吞吐量以及资源利用率。因此，Java性能调优成为开发和运维团队的重要任务。性能调优的核心目标是提升应用的响应速度、减少延迟、优化资源使用，并确保系统在高并发环境下保持稳定。Java应用的性能优化涉及多个层面，包括代码优化、数据库访问优化、网络通
Agent架构与工作原理：理解智能体的核心机制 hdzw20 agent学习 ai 机器学习 agent 智能体
Agent架构与工作原理：深入理解智能体的核心机制AIAgent的核心组成部分一个完整的AIAgent通常由以下几个核心模块组成：1.规划模块（PlanningModule）规划模块是Agent的"大脑"，负责制定行动策略。它接收目标任务，分析当前状态，并制定一系列行动计划。规划可以是：短期规划：针对当前步骤的即时决策长期规划：面向整体目标的战略性规划动态规划：根据执行结果实时调整计划2.记忆模块
MySQL索引机制解析：B+树、索引类型与优化策略 hdzw20 mysql复习 mysql b树数据库
MySQL索引机制解析：B+树、索引类型与优化策略索引是MySQL数据库中提高查询效率的关键。深入理解索引的底层机制、不同类型及其优化策略，对于数据库性能调优和面试准备都至关重要。本文将围绕B+树、聚簇索引与非聚簇索引、索引下推、覆盖索引以及自适应哈希索引等核心概念进行阐述。1.B+树vsB树：为何MySQL选择B+树？B树（B-tree）和B+树（B±tree）都是常用的多路平衡查找树，它们旨在
MySQL存储引擎核心：了解Buffer Pool与Page管理机制 hdzw20 mysql 数据库
MySQL存储引擎核心：了解BufferPool与Page管理机制1.BufferPool：数据库的高速缓存1.1基本概念作用：缓存表数据与索引数据，减少磁盘IO组成：缓存数据页（Page，默认16KB）控制块（约800字节，记录表空间、页号、缓存页地址等）默认大小：128MB（控制块额外占用约5%内存）1.2工作流程查询过程：通过哈希表（Key=表空间号+页号）判断页是否在BufferPool缓
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(