愿许浪尽天涯

使用 DataX 实现数据同步（高效的同步工具）

DataX 使用介绍

前言
一、DataX 简介
- 1.DataX3.0 框架设计
- 2.DataX3.0 核心架构
二、使用 DataX 实现数据同步
- 1.Linux 上安装 DataX 软件
- 2.DataX 基本使用
- 3.安装 MySQL 数据库
- 4.通过 DataX 实 MySQL 数据同步
- 5.使用 DataX 进行增量同步

前言

我们公司有个项目的数据量高达五千万，但是因为报表那块数据不太准确，业务库和报表库又是跨库操作，所以并不能使用 SQL 来进行同步。当时的打算是通过 mysqldump 或者存储的方式来进行同步，但是尝试后发现这些方案都不切实际：

mysqldump：不仅备份需要时间，同步也需要时间，而且在备份的过程，可能还会有数据产出（也就是说同步等于没同步）

存储方式：这个效率太慢了，要是数据量少还好，我们使用这个方式的时候，三个小时才同步两千条数据…

后面在网上查看后，发现 DataX 这个工具用来同步不仅速度快，而且同步的数据量基本上也相差无几。

一、DataX 简介

DataX 是阿里云 DataWorks 数据集成的开源版本，主要就是用于实现数据间的离线同步。 DataX 致力于实现包括关系型数据库（MySQL、Oracle 等）、HDFS、Hive、ODPS、HBase、FTP 等 各种异构数据源（即不同的数据库） 间稳定高效的数据同步功能。

为了 解决异构数据源同步问题，DataX 将复杂的网状同步链路变成了星型数据链路，DataX 作为中间传输载体负责连接各种数据源；
当需要接入一个新的数据源时，只需要将此数据源对接到 DataX，便能跟已有的数据源作为无缝数据同步。

1.DataX3.0 框架设计

DataX 采用 Framework + Plugin 架构，将数据源读取和写入抽象称为 Reader/Writer 插件，纳入到整个同步框架中。

角色	作用
Reader（采集模块）	负责采集数据源的数据，将数据发送给 `Framework`。
Writer（写入模块）	负责不断向 `Framework` 中取数据，并将数据写入到目的端。
Framework（中间商）	负责连接 `Reader` 和 `Writer`，作为两者的数据传输通道，并处理缓冲，流控，并发，数据转换等核心技术问题。

2.DataX3.0 核心架构

DataX 完成单个数据同步的作业，我们称为 Job，DataX 接收到一个 Job 后，将启动一个进程来完成整个作业同步过程。DataX Job 模块是单个作业的中枢管理节点，承担了数据清理、子任务切分、TaskGroup 管理等功能。

DataX Job 启动后，会根据不同源端的切分策略，将 Job 切分成多个小的 Task (子任务)，以便于并发执行。
接着 DataX Job 会调用 Scheduler 模块，根据配置的并发数量，将拆分成的 Task 重新组合，组装成 TaskGroup（任务组）
每一个 Task 都由 TaskGroup 负责启动，Task 启动后，会固定启动 Reader --> Channel --> Writer 线程来完成任务同步工作。
DataX 作业运行启动后，Job 会对 TaskGroup 进行监控操作，等待所有 TaskGroup 完成后，Job 便会成功退出（异常退出时 值非 0）

DataX 调度过程：

首先 DataX Job 模块会根据分库分表切分成若干个 Task，然后根据用户配置并发数，来计算需要分配多少个 TaskGroup；
计算过程：Task / Channel = TaskGroup，最后由 TaskGroup 根据分配好的并发数来运行 Task（任务）

二、使用 DataX 实现数据同步

准备工作：

JDK（1.8 以上，推荐 1.8）
Python（2，3 版本都可以）
Apache Maven 3.x（Compile DataX）（手动打包使用，使用 tar 包方式不需要安装）

主机名	操作系统	IP 地址	软件包
MySQL-1	CentOS 7.4	192.168.1.1	`jdk-8u181-linux-x64.tar.gz` `datax.tar.gz`
MySQL-2	CentOS 7.4	192.168.1.2

安装 JDK：下载地址（需要创建 Oracle 账号）

[root@MySQL-1 ~]# ls
anaconda-ks.cfg  jdk-8u181-linux-x64.tar.gz
[root@MySQL-1 ~]# tar zxf jdk-8u181-linux-x64.tar.gz 
[root@DataX ~]# ls
anaconda-ks.cfg  jdk1.8.0_181  jdk-8u181-linux-x64.tar.gz
[root@MySQL-1 ~]# mv jdk1.8.0_181 /usr/local/java
[root@MySQL-1 ~]# cat <<END >> /etc/profile
export JAVA_HOME=/usr/local/java
export PATH=$PATH:"$JAVA_HOME/bin"
END
[root@MySQL-1 ~]# source /etc/profile
[root@MySQL-1 ~]# java -version

因为 CentOS 7 上自带 Python 2.7 的软件包，所以不需要进行安装。

1.Linux 上安装 DataX 软件

[root@MySQL-1 ~]# wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
[root@MySQL-1 ~]# tar zxf datax.tar.gz -C /usr/local/
[root@MySQL-1 ~]# rm -rf /usr/local/datax/plugin/*/._*						# 需要删除隐藏文件 (重要)

当未删除时，可能会输出：[/usr/local/datax/plugin/reader/._drdsreader/plugin.json] 不存在. 请检查您的配置文件.

验证：

[root@MySQL-1 ~]# cd /usr/local/datax/bin
[root@MySQL-1 ~]# python datax.py ../job/job.json							# 用来验证是否安装成功

输出：

2021-12-13 19:26:28.828 [job-0] INFO  JobContainer - PerfTrace not enable!
2021-12-13 19:26:28.829 [job-0] INFO  StandAloneJobContainerCommunicator - Total 100000 records, 2600000 bytes | Speed 253.91KB/s, 10000 records/s | Error 0 records, 0 bytes |  All Task WaitWriterTime 0.060s |  All Task WaitReaderTime 0.068s | Percentage 100.00%
2021-12-13 19:26:28.829 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-12-13 19:26:18
任务结束时刻                    : 2021-12-13 19:26:28
任务总计耗时                    :                 10s
任务平均流量                    :          253.91KB/s
记录写入速度                    :          10000rec/s
读出记录总数                    :              100000
读写失败总数                    :                   0

2.DataX 基本使用

查看 streamreader --> streamwriter 的模板：

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py -r streamreader -w streamwriter

输出：

DataX (DATAX-OPENSOURCE-3.0), From Alibaba !
Copyright (C) 2010-2017, Alibaba Group. All Rights Reserved.


Please refer to the streamreader document:
     https://github.com/alibaba/DataX/blob/master/streamreader/doc/streamreader.md 

Please refer to the streamwriter document:
     https://github.com/alibaba/DataX/blob/master/streamwriter/doc/streamwriter.md 
 
Please save the following configuration as a json file and  use
     python {DATAX_HOME}/bin/datax.py {JSON_FILE_NAME}.json 
to run the job.

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "streamreader", 
                    "parameter": {
                        "column": [], 
                        "sliceRecordCount": ""
                    }
                }, 
                "writer": {
                    "name": "streamwriter", 
                    "parameter": {
                        "encoding": "", 
                        "print": true
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""
            }
        }
    }
}

根据模板编写 json 文件

[root@MySQL-1 ~]# cat <<END > test.json
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "streamreader", 
                    "parameter": {
                        "column": [								# 同步的列名 (* 表示所有)
			    {
			        "type":"string",
				"value":"Hello."
			    },
			    {
			        "type":"string",
				"value":"河北彭于晏"
			    },
			], 
                        "sliceRecordCount": "3"					# 打印数量
                    }
                }, 
                "writer": {
                    "name": "streamwriter", 
                    "parameter": {
                        "encoding": "utf-8",					# 编码
                        "print": true
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "2"									# 并发 (即 sliceRecordCount * channel = 结果)
            }
        }
    }
}

输出：（要是复制我上面的话，需要把 # 带的内容去掉）

3.安装 MySQL 数据库

分别在两台主机上安装：

[root@MySQL-1 ~]# yum -y install mariadb mariadb-server mariadb-libs mariadb-devel   
[root@MySQL-1 ~]# systemctl start mariadb												# 安装 MariaDB 数据库
[root@MySQL-1 ~]# mysql_secure_installation												# 初始化	
NOTE: RUNNING ALL PARTS OF THIS SCRIPT IS RECOMMENDED FOR ALL MariaDB
      SERVERS IN PRODUCTION USE!  PLEASE READ EACH STEP CAREFULLY!

Enter current password for root (enter for none):	     	# 直接回车
OK, successfully used password, moving on...
Set root password? [Y/n] y                       	 	 	# 配置 root 密码
New password: 
Re-enter new password: 
Password updated successfully!
Reloading privilege tables..
 ... Success!
Remove anonymous users? [Y/n] y                			 	# 移除匿名用户
 ... skipping.
Disallow root login remotely? [Y/n] n            		 	# 允许 root 远程登录
 ... skipping.
Remove test database and access to it? [Y/n] y 		     	# 移除测试数据库
 ... skipping.
Reload privilege tables now? [Y/n] y             	     	# 重新加载表
 ... Success!

1）准备同步数据（要同步的两台主机都要有这个表）

MariaDB [(none)]> create database `course-study`;
Query OK, 1 row affected (0.00 sec)

MariaDB [(none)]> create table `course-study`.t_member(ID int,Name varchar(20),Email varchar(30));
Query OK, 0 rows affected (0.00 sec)

因为是使用 DataX 程序进行同步的，所以需要在双方的数据库上开放权限：

grant all privileges on *.* to root@'%' identified by '123123';
flush privileges;

2）创建存储过程：

DELIMITER $$
CREATE PROCEDURE test()
BEGIN
declare A int default 1;
while (A < 3000000)do
insert into `course-study`.t_member values(A,concat("LiSa",A),concat("LiSa",A,"@163.com"));
set A = A + 1;
END while;
END $$
DELIMITER ;

3）调用存储过程（在数据源配置，验证同步使用）：

call test();

4.通过 DataX 实 MySQL 数据同步

1）生成 MySQL 到 MySQL 同步的模板：

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py -r mysqlreader -w mysqlwriter
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",							# 读取端
                    "parameter": {
                        "column": [], 								# 需要同步的列 (* 表示所有的列)
                        "connection": [
                            {
                                "jdbcUrl": [], 						# 连接信息
                                "table": []							# 连接表
                            }
                        ], 
                        "password": "", 							# 连接用户
                        "username": "", 							# 连接密码
                        "where": ""									# 描述筛选条件
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter",							# 写入端
                    "parameter": {
                        "column": [], 								# 需要同步的列
                        "connection": [
                            {
                                "jdbcUrl": "", 						# 连接信息
                                "table": []							# 连接表
                            }
                        ], 
                        "password": "", 							# 连接密码
                        "preSql": [], 								# 同步前. 要做的事
                        "session": [], 
                        "username": "",								# 连接用户 
                        "writeMode": ""								# 操作类型
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""										# 指定并发数
            }
        }
    }
}

2）编写 json 文件：

[root@MySQL-1 ~]# vim install.json
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader", 
                    "parameter": {
                        "username": "root",
                        "password": "123123",
                        "column": ["*"],
                        "splitPk": "ID",
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:mysql://192.168.1.1:3306/course-study?useUnicode=true&characterEncoding=utf8"
                                ], 
                                "table": ["t_member"]
                            }
                        ]
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter", 
                    "parameter": {
                        "column": ["*"], 
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://192.168.1.2:3306/course-study?useUnicode=true&characterEncoding=utf8",
                                "table": ["t_member"]
                            }
                        ], 
                        "password": "123123",
                        "preSql": [
                            "truncate t_member"
                        ], 
                        "session": [
                            "set session sql_mode='ANSI'"
                        ], 
                        "username": "root", 
                        "writeMode": "insert"
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "5"
            }
        }
    }
}

3）验证

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py install.json

输出：

2021-12-15 16:45:15.120 [job-0] INFO  JobContainer - PerfTrace not enable!
2021-12-15 16:45:15.120 [job-0] INFO  StandAloneJobContainerCommunicator - Total 2999999 records, 107666651 bytes | Speed 2.57MB/s, 74999 records/s | Error 0 records, 0 bytes |  All Task WaitWriterTime 82.173s |  All Task WaitReaderTime 75.722s | Percentage 100.00%
2021-12-15 16:45:15.124 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-12-15 16:44:32
任务结束时刻                    : 2021-12-15 16:45:15
任务总计耗时                    :                 42s
任务平均流量                    :            2.57MB/s
记录写入速度                    :          74999rec/s
读出记录总数                    :             2999999
读写失败总数                    :                   0

你们可以在目的数据库进行查看，是否同步完成。

上面的方式相当于是完全同步，但是当数据量较大时，同步的时候被中断，是件很痛苦的事情；
所以在有些情况下，增量同步还是蛮重要的。

5.使用 DataX 进行增量同步

使用 DataX 进行全量同步和增量同步的唯一区别就是：增量同步需要使用 where 进行条件筛选。（即，同步筛选后的 SQL）

1）编写 json 文件：

[root@MySQL-1 ~]# vim where.json
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader", 
                    "parameter": {
                        "username": "root",
                        "password": "123123",
                        "column": ["*"],
                        "splitPk": "ID",
                        "where": "ID <= 1888",
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:mysql://192.168.1.1:3306/course-study?useUnicode=true&characterEncoding=utf8"
                                ], 
                                "table": ["t_member"]
                            }
                        ]
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter", 
                    "parameter": {
                        "column": ["*"], 
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://192.168.1.2:3306/course-study?useUnicode=true&characterEncoding=utf8",
                                "table": ["t_member"]
                            }
                        ], 
                        "password": "123123",
                        "preSql": [
                            "truncate t_member"
                        ], 
                        "session": [
                            "set session sql_mode='ANSI'"
                        ], 
                        "username": "root", 
                        "writeMode": "insert"
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "5"
            }
        }
    }
}

需要注意的部分就是：where（条件筛选）和 preSql（同步前，要做的事）参数。

2）验证：

[root@MySQL-1 ~]# python /usr/local/data/bin/data.py where.json

输出：

2021-12-16 17:34:38.534 [job-0] INFO  JobContainer - PerfTrace not enable!
2021-12-16 17:34:38.534 [job-0] INFO  StandAloneJobContainerCommunicator - Total 1888 records, 49543 bytes | Speed 1.61KB/s, 62 records/s | Error 0 records, 0 bytes |  All Task WaitWriterTime 0.002s |  All Task WaitReaderTime 100.570s | Percentage 100.00%
2021-12-16 17:34:38.537 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-12-16 17:34:06
任务结束时刻                    : 2021-12-16 17:34:38
任务总计耗时                    :                 32s
任务平均流量                    :            1.61KB/s
记录写入速度                    :             62rec/s
读出记录总数                    :                1888
读写失败总数                    :                   0

目标数据库上查看：

3）基于上面数据，再次进行增量同步：

主要是 where 配置："where": "ID > 1888 AND ID <= 2888"						# 通过条件筛选来进行增量同步

同时需要将我上面的 preSql 删除(因为我上面做的操作时 truncate 表)

任务1 将单表中的单个rfid增加为多个rfid 王天华帅哥数据库 java sql
方案使用连表查询解决单独创建一个rfid的表让tool_id对应多个rfid需要优化的表1：tool_materials_stock库存管理已完成数据迁移完成原库rfid字段未删除2：tool_borrow_return借出借还管理已完成3：tool_materials_inspection质检管理已完成4：tool_materials_maintain维修信息已完成5：tool_material
OPPO 2025届校招补招正式开启 weixin_53585422 算法求职招聘前端硬件工程大数据
OPPO2025届校招补招正式开启（秋招投过的同学也可投递！）面向对象：2025届全球应届本科生与硕士研究生招聘岗位：AI/算法类、标准研究类、软件类、硬件类、产品类、设计类、工程技术类、销售服务类、品牌策划类、采购类、综合职能类（每人最多可投递2个岗位）工作城市：东莞、深圳、成都、上海、北京、西安、南京、重庆薪酬福利：极具竞争力的薪资+制化培养体系+多样化发展机制内推链接：https://sou
【Stable Diffusion部署至GNU/Linux】安装流程星星点点洲 stable diffusion
以下是安装StableDiffusion的步骤，以Ubuntu22.04LTS为例子。显卡与计算架构介绍CUDA是NVIDIAGPU的专用并行计算架构技术层级说明CUDAToolkit提供GPU编译器(nvcc)、数学库(cuBLAS)等开发工具cuDNN深度神经网络加速库（需单独下载）GPU驱动包含CUDADriver（需与CUDAToolkit版本匹配）CUDA与NIDIA：硬件指令集绑定：N
阿里云RDS到亚马逊云RDS的实时数据同步方案详解 ivwdcwso 运维阿里云云计算 aws kda 数据同步
1.需求背景在当今的多云环境中,企业经常需要在不同云平台之间同步数据。本文将详细介绍如何实现从阿里云RDSMySQL数据库到亚马逊云RDSMySQL数据库的实时数据同步。这种同步对于数据备份、跨区域数据访问、数据分析等场景都非常有用。2.方案概述我们将使用AWSKinesisDataAnalytics(KDA)作为核心组件来实现这个实时同步方案。KDA基于ApacheFlink,支持使用SQL或J
KTransformers：告别天价显卡！国产框架让单卡24G显存跑DeepSeek-R1 671B大模型：推理速度飙升28倍蚝油菜花每日 AI 项目与应用实例人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！微信公众号｜搜一搜：蚝油菜花“还在为千亿模型租天价显卡？清华团队用CPU/GPU协同计算，让4090跑起671B参数全量模型！”大家好，我是蚝油菜花。如果你也经历过——看着API调用账单瑟瑟发抖，微调一次模型吃掉半月算力预算️盯着OOM报错抓狂，为了
轻量级的注意力网络（LANMSFF）模型详解及代码复现清风AI 深度学习算法详解及代码复现深度学习人工智能神经网络 python 计算机视觉
定义与特点在深度学习领域，轻量化网络设计已成为一个重要的研究方向。LANMSFF模型作为一种新型的轻量级网络架构，在保持高性能的同时，显著降低了模型的复杂度。LANMSFF模型的核心特点可以概括为以下几个方面：轻量级设计：通过精心设计的网络结构和参数优化，在保持较高性能的同时，显著降低了模型的复杂度。注意力机制：引入了一种新的注意力机制，能够有效地捕捉图像中的关键特征，提高模型的表达能力。多尺度特
实战探析：云数据库 RDS SQL Server 版的优点与应用案例步入烟尘 python 数据库 oracle 性能优化
实战探析：云数据库RDSSQLServer版的优点与应用案例背景：随着云计算技术的不断发展，越来越多的企业开始将数据库迁移到云端，以降低成本、提高可用性和灵活性。而在云数据库的选择上，AmazonRDS（RelationalDatabaseService）SQLServer版本成为了众多企业的首选之一。本文将深入探讨在实际应用中，利用云数据库RDSSQLServer版所带来的优点及其实战应用。云数
深兰科技创始人陈海波获选2024福布斯中国新时代颠覆力创始人 AI周刊物联网 OFweek 深兰科技人工智能深兰科技陈海波 javascript c#ruby perl
12月1日，福布斯中国携手全球化商业研究院(GBRC)正式发布了2024福布斯中国新时代颠覆力创始人评选的最终结果，深兰科技集团创始人、董事长陈海波成功获选。同时获选的还有360集团创始人周鸿祎、爱斯康医疗创始人蔡磊、科大讯飞创始人刘庆峰、蔚来创始人李斌等明星企业家。本届2024福布斯中国新时代颠覆力创始人评选，历经8个月的深入调研和行业洞察，以“新时代”和“颠覆力”为核心主题，基于相关候选人本身
MongoDB入门与实践风中凌乱的猿笔记 mongodb 数据库
MongoDB是一个NoSQL数据库，它采用文档模型来存储数据，具有高性能、易扩展、灵活的特点。以下是MongoDB的入门指南和一些基本的实践示例，帮助你开始使用MongoDB。1.安装和基本配置安装MongoDB具体安装方法取决于你的操作系统。以Ubuntu为例，可以通过以下命令安装MongoDB：sudoaptupdatesudoaptinstall-ymongodb启动MongoDB安装完成
Manus Xsens Metagloves专用动捕手套宋13810279720 数据手套机器人人工智能人机交互云计算
ManusXsensMetagloves新一代手指捕捉XsensMetagloves经过专门开发，可与XsensMVN软件无缝协作。只需点击一下，即可将精确的量子手指跟踪添加到Xsens设置中。手指追踪的全新黄金标准我们的新跟踪系统为Xsens套装提供了富有表现力的手指数据。使用我们精确的量子追踪技术捕捉每一个细节动作。手指捕捉从此不再有任何限制。帮助用户再制作动画时节省宝贵的时间，同时不会失去动
教您如何选购触觉力反馈设备宋13810279720 力反馈机器人人工智能计算机外设 3d 硬件工程
触觉力反馈技术是指在人机交互过程中，计算机对用户的输入做出响应，并通过力反馈设备作用于用户的过程。它是一种机械装置表现出来的反作用力，将力反馈设备与环境中物体交互的信息转化成用户能够感知的力的效果，如触碰物体的阻力、举起物体的重力和“触摸”物体表面的摩擦力。可以沟通交流，力反馈全系列。目前全球市场上基本被三大品牌垄断。分别为：美国3Dsystems（Geomagic/Sensable），瑞士For
dapp链上合约算力LP质押项目挖矿系统开发流程详细/源码版 2301_78234743 java
dapp链上合约算力LP质押项目挖矿系统开发流程详细/源码版开发一个DApp（去中心化应用）链上合约算力LP质押项目挖矿系统需要考虑到智能合约的设计、用户滴滴三面自我介绍写一道题讲下操作系统进程管理操作系统内存管理工作和学生生活有什么区别上段实习学到了什么，难点许愿淘天OC！刚面完hr面，万能的牛客，让过吧Dapp/swap只涨不跌智能合约项目系统开发功能步骤/源码开发DApp/Swap的"只涨不
英码科技基于昇腾算力实现DeepSeek离线部署英码科技科技
DeepSeek-R1模型以其创新架构和高效能技术迅速成为行业焦点。如果能够在边缘进行离线部署，不仅能发挥DeepSeek大模型的效果，还能确保数据处理的安全性和可控性。英码科技作为AI算力产品和AI应用解决方案服务商，积极响应市场需求，率先完成了昇腾系列产品与DeepSeek模型的深度适配。从硬件调校到软件优化，英码科技确保了昇腾系列产品的稳定、高效适配，为用户提供了更具竞争力的部署选择。Dee
95%人都不知道的，或许是最全DeepSeek 提示词合集、使用技巧与代码实现全攻略【建议收藏】大F的智能小课 python 开发语言人工智能算法
一、引言DeepSeek作为一款强大的AI大语言模型工具，凭借其高效、灵活的特点，受到了众多开发者和用户的青睐。本文将全面介绍DeepSeek的提示词合集、使用技巧以及代码实现方法，帮助读者更好地利用这一工具，提升工作效率和创造力。二、DeepSeek提示词合集（一）代码处理代码改写：优化代码，进行纠错、注释、调优等。示例：请对以下代码进行优化，提高运行效率：[代码片段]对代码进行修改，来实现纠错
netfilter和iptables--netfilter源码篇 Estrella-q linux网络协议栈 linux
netfilter和iptables–netfilter源码篇防火墙是保护服务器和基础设施的重要工具，在Linux系统下，目前广泛使用的防火墙工具是iptables，但实际进行规则实施并产生实际作用的是Netfilter，iptables与内核中的netfilter框架中Hook协同工作，实现IP数据包的控制与过滤，本次将基于Linux6.5从源码视角分析。总视角下网络通信协议栈模式如下：图中各个
linux 内核回调,Linux 内核通知链随笔【下】 iwbunny linux 内核回调
书接上回，闲话不表。话说，女神无论是在土豪或者屌丝那里都找不到归属感，冥冥之中天上掉下来一个王子(PS:又名高富帅)，既可以满足女神的物质需求还可以满足女神的精神需求：点击(此处)折叠或打开/*GFS.c*/#include#include#include#include#include#include#include#includeMODULE_LICENSE("GPL");/**注册通知链*/
linux是一个单用户的系统,linux系统进入单用户模式 weixin_40005437 linux是一个单用户的系统
进入单用户模式可进行root账户和其他普通账户的密码的修改1)Ubuntu开机到grub时(在开机时长按shift键)，用上下键移到第二行的恢复模式(recoverymode)，按e(注意不是回车)把rosingle改成rwquietinit=/bin/bash然后按Ctrl+x2)redhat1)开机出现倒数秒---回车2)看见RedHatEnterpriseLinuxServer(2.6.18
【vLLM 学习】安装
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM是一个Python库，包含预编译的C++和CUDA(12.1)二进制文件。依赖环境操作系统：LinuxPython：3.8-3.12GPU：计算能力7.0或更高（例如V100、T4、RTX20xx、A100、L
三种方式实现人车流统计（yolov5+opencv+deepsort+bytetrack+iou） Jayson God 人工智能 c++yolov5 opencv 算法人工智能
一、运行环境1、项目运行环境如下2、CPU配置3、GPU配置如果没有GPUyolov5目标检测时间会比较久二、编程语言与使用库版本项目编程语言使用c++，使用的第三方库，onnxruntime-linux-x64-1.12.1，opencv-4.6.0opencv官方地址Releases-OpenCVopencvgithub地址https://github.com/opencv/opencv/tr
Cursor 小白入门迪小莫学AI 工具职场和发展 leetcode vscode 编辑器
Cursor简介什么是Cursor？Cursor是一款基于AI的智能代码编辑器，结合了强大的代码编辑功能和AI技术，旨在通过AI驱动的智能补全、聊天功能和代理帮助开发者提高工作效率。它基于VSCode构建，拥有用户熟悉的界面和功能，同时通过深度集成的AI功能，极大提升开发过程中的生产力。核心功能1.Tab（智能代码补全）Tab是Cursor提供的智能代码补全功能，能够根据上下文智能推荐代码，帮助用
基于Unity引擎的日志管理模块深度技术分析晴空了无痕项目框架 unity 游戏引擎系统架构
引言在游戏开发领域，日志系统是诊断运行时问题的重要基础设施。本文将以GameFramework.Logging命名空间下的LogController类为研究对象（原YouYou.LoggerManager），从架构设计、实现机制、性能优化等多个维度进行深入剖析，并提出改进建议。本文涉及的类名和变量名均经过语义化重构，以提升代码可读性。一、架构设计分析1.1类层次结构设计publicclassLog
6款日常工作管理软件深度评测，提升工作效率
本文介绍了6款广受欢迎的日常工作管理软件，包括：1.Worktile；2.Asana；3.Wrike；4.Teambition；5.Todoist；6.Notion。在项目管理中，进度规划是确保项目按时完成的重要环节。无论是小型项目还是大型工程，合理的进度安排不仅能提升团队效率，还能有效避免项目延期、资源浪费等问题。选择一款好用的进度计划软件，可以帮助团队更好地安排任务、分配资源，并实时跟踪项目进
基于 LLM 的智能运维 Agent 系统设计与实现 LLM教程人工智能 embedding LLM python 大模型 Agent 智能体
摘要本文详细介绍了一个基于大语言模型(LLM)的智能运维Agent系统的设计与实现。该系统采用多Agent协同的架构，通过事件驱动的方式实现了自动化运维流程。系统集成了先进的AI能力，能够实现故障自动诊断、预测性维护、知识沉淀等核心功能。一、运维Agent架构设计在设计智能运维Agent系统时，我们采用了模块化和事件驱动的架构思想，将复杂的运维场景分解为多个独立的能力域，并通过消息总线实现各组件的
.Net 7 新编译器 ILC 简析 dotNET跨平台 .net
楔子：这个新编译器的全称是ILCompiler。是之前CoreRT项目合并过来的，在.Net7成熟，并且可以产业化应用。本质：ILC编译器的本质除了构建CLR的所拥有的主要功能，还包含了对LLVM这种意图取代GCC编译器的操作，对于LLVM主要是用来Win，Linux,Macos三种不同的操作系统的目标文件而所做的封装。一.CLR的主要功能：1.构建内存模型，比如MethodTable,EECla
Linux（WSL/Ubuntu）vscode配置C++调试环境与相关问题力行128 linux ubuntu vscode c++
步骤：先cmake编译得到可执行的二进制文件，将生成的二进制文件添加到launch.json的"program":处。可用的json文件如下，根据自己程序更改：tasks.json（编译器构建设置）launch.json（调试器设置）c_cpp_properties.json（编译器路径和IntelliSense设置）1.launch.json注：需要将可执行文件填到launch的program处
【python学习】深度解析 Python 的 .env配置与最佳实践：温格高的环境变量配置之道 NLP仙人 python python 学习开发语言人工智能
1.文章简介在开发和部署Python项目时，环境变量配置对于管理敏感信息如数据库连接字符串、API密钥至关重要。本文将以温格高（2023年环法冠军）的项目为例，详细介绍如何通过.env文件简化环境配置，并分享多环境管理、Docker集成等热门功能。我们还将覆盖一些小技巧和常见错误，帮助你避免开发中的踩坑。2.使用.env文件的好处温格高团队正在开发一个记录自行车赛事的应用，涉及多个开发环境和敏感信
智能巡检装置的“奇幻之旅”：输电线路的无人守护者深圳特力康何哈哈安全运维
产品别名：电线路实时监控设备、电力线路动态监测系统、输电线路智能巡检装置、智能输电线路监控方案产品型号：TLKS-PMG-100B输电线路通道可视化监测装置一、产品描述：随着电力需求的不断增长和电网规模的持续扩大，传统的输电线路巡检方式已经难以满足现代电网高效、全面、准确的巡视需求。人工巡检不仅耗时费力，而且在复杂地形和恶劣环境下存在较大的安全风险。为此，深圳特力康科技有限公司推出了输电线路通道可
网络安全入门信息收集与漏洞扫描（二）挣扎与觉醒中的技术人网络安全入门及实战 web安全网络安全 c++程序人生
主动信息收集1Nmap扫描端口与服务（1）Nmap是什么？定义：网络探测工具，用于扫描开放端口、识别服务及操作系统。典型用途：发现目标存活主机（ping扫描）。识别开放端口和运行的服务（如SSH、HTTP、数据库）。探测操作系统类型（Windows/Linux）。（2）基础扫描命令快速扫描常用端口：nmap-sV-T4192.168.1.100#-sV探测服务版本，-T4加速扫描示例输出：PORT
Visual Studio Code支持WSL，直接修改linux/ubuntu中的文件柳鲲鹏 docker vscode ide 编辑器
步骤1开始通过WSL使用VSCode|MicrosoftLearn点击远程开发扩展包。步骤2RemoteDevelopment-VisualStudioMarketplace点击install，允许打开VisualStudioCode。步骤3共有4项，一齐安装。步骤4在WSLLinux(Ubuntu)中：sudoapt-getinstallwgetca-certificates打开步骤1准备工作完
DeepSeek 如何获取数据库中的表信息（表名和字段名称） Python测试之道数据库 python
问题背景在测试或开发过程中，了解数据库的表结构（包括表名和字段名称）是非常重要的一环，尤其是当我们需要测试数据库相关的功能或验证数据时。然而，手动查看数据库结构可能耗时且容易出错。如果能够通过DeepSeek与数据库直接交互，自动获取表名和字段信息，将大大提升测试效率。本文将介绍如何利用DeepSeek模型结合数据库查询，自动生成表结构信息（包括表名和字段名称）。此外，还会展示如何通过自然语言描述
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少