程序员潇潇

DataX，数据同步工具，亲测真香

有些项目的数据量高达五千万，但是因为报表那块数据不太准确，业务库和报表库又是跨库操作，所以并不能使用 SQL 来进行同步。当时的打算是通过 mysqldump 或者存储的方式来进行同步，但是尝试后发现这些方案都不切实际：

mysqldump：不仅备份需要时间，同步也需要时间，而且在备份的过程，可能还会有数据产出（也就是说同步等于没同步）

存储方式：这个效率太慢了，要是数据量少还好，我们使用这个方式的时候，三个小时才同步两千条数据…

常见数据异构的几款中间件的区别如下：

今天介绍一款不错的中间件：DataX

DataX 简介

DataX 是阿里云 DataWorks 数据集成的开源版本，主要就是用于实现数据间的离线同步。 DataX 致力于实现包括关系型数据库（MySQL、Oracle 等）、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源（即不同的数据库）间稳定高效的数据同步功能。

为了 解决异构数据源同步问题，DataX 将复杂的网状同步链路变成了星型数据链路 ，DataX 作为中间传输载体负责连接各种数据源；

当需要接入一个新的数据源时，只需要将此数据源对接到 DataX，便能跟已有的数据源作为无缝数据同步。

DataX3.0 框架设计

DataX 采用 Framework + Plugin 架构，将数据源读取和写入抽象称为 Reader/Writer 插件，纳入到整个同步框架中。

角色	作用
Reader（采集模块）	负责采集数据源的数据，将数据发送给 `Framework`。
Writer（写入模块）	负责不断向 `Framework` 中取数据，并将数据写入到目的端。

Framework（中间商）负责连接 Reader 和 Writer，作为两者的数据传输通道，并处理缓冲，流控，并发，数据转换等核心技术问题。

DataX3.0 核心架构

DataX 完成单个数据同步的作业，我们称为 Job，DataX 接收到一个 Job 后，将启动一个进程来完成整个作业同步过程。DataX Job 模块是单个作业的中枢管理节点，承担了数据清理、子任务切分、TaskGroup 管理等功能。

DataX Job 启动后，会根据不同源端的切分策略，将 Job 切分成多个小的 Task (子任务)，以便于并发执行。

接着 DataX Job 会调用 Scheduler 模块，根据配置的并发数量，将拆分成的 Task 重新组合，组装成 TaskGroup（任务组）

每一个 Task 都由 TaskGroup 负责启动，Task 启动后，会固定启动 Reader --> Channel --> Writer 线程来完成任务同步工作。

DataX 作业运行启动后，Job 会对 TaskGroup 进行监控操作，等待所有 TaskGroup 完成后，Job 便会成功退出（异常退出时值非 0 ）

DataX 调度过程：

首先 DataX Job 模块会根据分库分表切分成若干个 Task，然后根据用户配置并发数，来计算需要分配多少个 TaskGroup；

计算过程：Task / Channel = TaskGroup，最后由 TaskGroup 根据分配好的并发数来运行 Task（任务）

使用 DataX 实现数据同步

准备工作：

JDK（1.8 以上，推荐 1.8）
Python（2，3 版本都可以）
Apache Maven 3.x（Compile DataX）（手动打包使用，使用 tar 包方式不需要安装）

主机名	操作系统	IP 地址	软件包
MySQL-1	CentOS 7.4	192.168.1.1	`jdk-8u181-linux-x64.tar.gz` `datax.tar.gz`
MySQL-2	CentOS 7.4	192.168.1.2

安装 JDK：

下载地址：https://www.oracle.com/java/technologies/javase/javase8-archive-downloads.html（需要创建 Oracle 账号）

[root@MySQL-1 ~]# ls
anaconda-ks.cfg  jdk-8u181-linux-x64.tar.gz
[root@MySQL-1 ~]# tar zxf jdk-8u181-linux-x64.tar.gz 
[root@DataX ~]# ls
anaconda-ks.cfg  jdk1.8.0_181  jdk-8u181-linux-x64.tar.gz
[root@MySQL-1 ~]# mv jdk1.8.0_181 /usr/local/java
[root@MySQL-1 ~]# cat <> /etc/profile
export JAVA_HOME=/usr/local/java
export PATH=$PATH:"$JAVA_HOME/bin"
END
[root@MySQL-1 ~]# source /etc/profile
[root@MySQL-1 ~]# java -version

因为 CentOS 7 上自带 Python 2.7 的软件包，所以不需要进行安装。

Linux 上安装 DataX 软件

[root@MySQL-1 ~]# wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
[root@MySQL-1 ~]# tar zxf datax.tar.gz -C /usr/local/
[root@MySQL-1 ~]# rm -rf /usr/local/datax/plugin/*/._*      # 需要删除隐藏文件 (重要)

当未删除时，可能会输出：[/usr/local/datax/plugin/reader/._drdsreader/plugin.json] 不存在. 请检查您的配置文件.

验证：

[root@MySQL-1 ~]# cd /usr/local/datax/bin
[root@MySQL-1 ~]# python datax.py ../job/job.json       # 用来验证是否安装成功

输出：

2021-12-13 19:26:28.828 [job-0] INFO  JobContainer - PerfTrace not enable!
2021-12-13 19:26:28.829 [job-0] INFO  StandAloneJobContainerCommunicator - Total 100000 records, 2600000 bytes | Speed 253.91KB/s, 10000 records/s | Error 0 records, 0 bytes |  All Task WaitWriterTime 0.060s |  All Task WaitReaderTime 0.068s | Percentage 100.00%
2021-12-13 19:26:28.829 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-12-13 19:26:18
任务结束时刻                    : 2021-12-13 19:26:28
任务总计耗时                    :                 10s
任务平均流量                    :          253.91KB/s
记录写入速度                    :          10000rec/s
读出记录总数                    :              100000
读写失败总数                    :                   0

DataX 基本使用

查看 streamreader \--> streamwriter 的模板：

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py -r streamreader -w streamwriter

输出：

DataX (DATAX-OPENSOURCE-3.0), From Alibaba !
Copyright (C) 2010-2017, Alibaba Group. All Rights Reserved.
 
 
Please refer to the streamreader document:
     https://github.com/alibaba/DataX/blob/master/streamreader/doc/streamreader.md 
 
Please refer to the streamwriter document:
     https://github.com/alibaba/DataX/blob/master/streamwriter/doc/streamwriter.md 
 
Please save the following configuration as a json file and  use
     python {DATAX_HOME}/bin/datax.py {JSON_FILE_NAME}.json 
to run the job.
 
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "streamreader", 
                    "parameter": {
                        "column": [], 
                        "sliceRecordCount": ""
                    }
                }, 
                "writer": {
                    "name": "streamwriter", 
                    "parameter": {
                        "encoding": "", 
                        "print": true
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""
            }
        }
    }
}

根据模板编写 json 文件

[root@MySQL-1 ~]# cat < test.json
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "streamreader", 
                    "parameter": {
                        "column": [        # 同步的列名 (* 表示所有)
       {
           "type":"string",
    "value":"Hello."
       },
       {
           "type":"string",
    "value":"河北彭于晏"
       },
   ], 
                        "sliceRecordCount": "3"     # 打印数量
                    }
                }, 
                "writer": {
                    "name": "streamwriter", 
                    "parameter": {
                        "encoding": "utf-8",     # 编码
                        "print": true
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "2"         # 并发 (即 sliceRecordCount * channel = 结果)
            }
        }
    }
}

输出：（要是复制我上面的话，需要把 # 带的内容去掉）

安装 MySQL 数据库

分别在两台主机上安装：

[root@MySQL-1 ~]# yum -y install mariadb mariadb-server mariadb-libs mariadb-devel   
[root@MySQL-1 ~]# systemctl start mariadb            # 安装 MariaDB 数据库
[root@MySQL-1 ~]# mysql_secure_installation            # 初始化 
NOTE: RUNNING ALL PARTS OF THIS SCRIPT IS RECOMMENDED FOR ALL MariaDB
      SERVERS IN PRODUCTION USE!  PLEASE READ EACH STEP CAREFULLY!
 
Enter current password for root (enter for none):       # 直接回车
OK, successfully used password, moving on...
Set root password? [Y/n] y                            # 配置 root 密码
New password: 
Re-enter new password: 
Password updated successfully!
Reloading privilege tables..
 ... Success!
Remove anonymous users? [Y/n] y                     # 移除匿名用户
 ... skipping.
Disallow root login remotely? [Y/n] n                # 允许 root 远程登录
 ... skipping.
Remove test database and access to it? [Y/n] y         # 移除测试数据库
 ... skipping.
Reload privilege tables now? [Y/n] y                    # 重新加载表
 ... Success!

1）准备同步数据（要同步的两台主机都要有这个表）

MariaDB [(none)]> create database `course-study`;
Query OK, 1 row affected (0.00 sec)
 
MariaDB [(none)]> create table `course-study`.t_member(ID int,Name varchar(20),Email varchar(30));
Query OK, 0 rows affected (0.00 sec)

因为是使用 DataX 程序进行同步的，所以需要在双方的数据库上开放权限：

grant all privileges on *.* to root@'%' identified by '123123';
flush privileges;

2）创建存储过程：

DELIMITER $$
CREATE PROCEDURE test()
BEGIN
declare A int default 1;
while (A < 3000000)do
insert into `course-study`.t_member values(A,concat("LiSa",A),concat("LiSa",A,"@163.com"));
set A = A + 1;
END while;
END $$
DELIMITER ;

正在上传…重新上传取消

图片

3）调用存储过程（在数据源配置，验证同步使用)：

call test();

通过 DataX 实 MySQL 数据同步

1）生成 MySQL 到 MySQL 同步的模板：

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py -r mysqlreader -w mysqlwriter
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",       # 读取端
                    "parameter": {
                        "column": [],         # 需要同步的列 (* 表示所有的列)
                        "connection": [
                            {
                                "jdbcUrl": [],       # 连接信息
                                "table": []       # 连接表
                            }
                        ], 
                        "password": "",        # 连接用户
                        "username": "",        # 连接密码
                        "where": ""         # 描述筛选条件
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter",       # 写入端
                    "parameter": {
                        "column": [],         # 需要同步的列
                        "connection": [
                            {
                                "jdbcUrl": "",       # 连接信息
                                "table": []       # 连接表
                            }
                        ], 
                        "password": "",        # 连接密码
                        "preSql": [],         # 同步前. 要做的事
                        "session": [], 
                        "username": "",        # 连接用户 
                        "writeMode": ""        # 操作类型
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""          # 指定并发数
            }
        }
    }
}

2）编写 json 文件：

[root@MySQL-1 ~]# vim install.json
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader", 
                    "parameter": {
                        "username": "root",
                        "password": "123123",
                        "column": ["*"],
                        "splitPk": "ID",
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:mysql://192.168.1.1:3306/course-study?useUnicode=true&characterEncoding=utf8"
                                ], 
                                "table": ["t_member"]
                            }
                        ]
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter", 
                    "parameter": {
                        "column": ["*"], 
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://192.168.1.2:3306/course-study?useUnicode=true&characterEncoding=utf8",
                                "table": ["t_member"]
                            }
                        ], 
                        "password": "123123",
                        "preSql": [
                            "truncate t_member"
                        ], 
                        "session": [
                            "set session sql_mode='ANSI'"
                        ], 
                        "username": "root", 
                        "writeMode": "insert"
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "5"
            }
        }
    }
}

3）验证

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py install.json

输出：

2021-12-15 16:45:15.120 [job-0] INFO  JobContainer - PerfTrace not enable!
2021-12-15 16:45:15.120 [job-0] INFO  StandAloneJobContainerCommunicator - Total 2999999 records, 107666651 bytes | Speed 2.57MB/s, 74999 records/s | Error 0 records, 0 bytes |  All Task WaitWriterTime 82.173s |  All Task WaitReaderTime 75.722s | Percentage 100.00%
2021-12-15 16:45:15.124 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-12-15 16:44:32
任务结束时刻                    : 2021-12-15 16:45:15
任务总计耗时                    :                 42s
任务平均流量                    :            2.57MB/s
记录写入速度                    :          74999rec/s
读出记录总数                    :             2999999
读写失败总数                    :                   0

你们可以在目的数据库进行查看，是否同步完成。

上面的方式相当于是完全同步，但是当数据量较大时，同步的时候被中断，是件很痛苦的事情；
所以在有些情况下，增量同步还是蛮重要的。

使用 DataX 进行增量同步

使用 DataX 进行全量同步和增量同步的唯一区别就是：增量同步需要使用 where 进行条件筛选。 （即，同步筛选后的 SQL）

1）编写 json 文件：

[root@MySQL-1 ~]# vim where.json
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader", 
                    "parameter": {
                        "username": "root",
                        "password": "123123",
                        "column": ["*"],
                        "splitPk": "ID",
                        "where": "ID <= 1888",
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:mysql://192.168.1.1:3306/course-study?useUnicode=true&characterEncoding=utf8"
                                ], 
                                "table": ["t_member"]
                            }
                        ]
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter", 
                    "parameter": {
                        "column": ["*"], 
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://192.168.1.2:3306/course-study?useUnicode=true&characterEncoding=utf8",
                                "table": ["t_member"]
                            }
                        ], 
                        "password": "123123",
                        "preSql": [
                            "truncate t_member"
                        ], 
                        "session": [
                            "set session sql_mode='ANSI'"
                        ], 
                        "username": "root", 
                        "writeMode": "insert"
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": "5"
            }
        }
    }
}

需要注意的部分就是：where（条件筛选）和 preSql（同步前，要做的事）参数。

2）验证：

[root@MySQL-1 ~]# python /usr/local/data/bin/data.py where.json

输出：

2021-12-16 17:34:38.534 [job-0] INFO  JobContainer - PerfTrace not enable!
2021-12-16 17:34:38.534 [job-0] INFO  StandAloneJobContainerCommunicator - Total 1888 records, 49543 bytes | Speed 1.61KB/s, 62 records/s | Error 0 records, 0 bytes |  All Task WaitWriterTime 0.002s |  All Task WaitReaderTime 100.570s | Percentage 100.00%
2021-12-16 17:34:38.537 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-12-16 17:34:06
任务结束时刻                    : 2021-12-16 17:34:38
任务总计耗时                    :                 32s
任务平均流量                    :            1.61KB/s
记录写入速度                    :             62rec/s
读出记录总数                    :                1888
读写失败总数                    :                   0

目标数据库上查看：

3)基于上面数据，再次进行增量同步：

主要是 where 配置："where": "ID > 1888 AND ID <= 2888"      # 通过条件筛选来进行增量同步
同时需要将我上面的 preSql 删除(因为我上面做的操作时 truncate 表)

最后感谢每一个认真阅读我文章的人，礼尚往来总是要有的，虽然不是什么很值钱的东西，如果你用得到的话可以直接拿走：

这些资料，对于【软件测试】的朋友来说应该是最全面最完整的备战仓库，这个仓库也陪伴上万个测试工程师们走过最艰难的路程，希望也能帮助到你！

React 高阶组件（HOC） web Rookie React react.js javascript 前端
文章目录一.高阶组件（HOC）的定义二.HOC的作用和优势三.HOC的使用方式四.HOC的注意事项和潜在问题五.应用场景1.权限控制与认证2.数据获取与预加载3.样式和主题管理4.性能优化-缓存数据或组件渲染结果5.日志记录与调试辅助六.总结一.高阶组件（HOC）的定义高阶组件（Higher-OrderComponent，简称HOC）是一种在React中用于复用组件逻辑的高级技术。它本质上是一个函
NotebookLM：Google 最新 AI 笔记助理解析与实战应用赵大仁人工智能技术大语言模型深度学习人工智能语言模型自然语言处理机器学习笔记
NotebookLM：Google最新AI笔记助理解析与实战应用在AI驱动的生产力工具不断进化的今天，Google推出的NotebookLM（NotebookLanguageModel）成为了一款备受关注的智能笔记助理。它结合了Google的大语言模型（LLM）能力，帮助用户更高效地整理、理解和生成知识内容。本文将全面解析NotebookLM的技术原理、核心功能、应用场景，并提供实际使用指南，帮助
青龙面板脚本开发指南：高效自动化任务的实现赵大仁运维 docker 虚拟化服务器运维运维开发自动化 python javascript 开源
青龙面板脚本开发指南：高效自动化任务的实现青龙面板（QinglongPanel）是一款强大的任务管理平台，支持多种语言的脚本开发和执行。通过在青龙面板中编写和管理脚本，用户可以轻松实现自动化任务，提高工作效率。本文将深入介绍青龙面板脚本开发的基本流程、最佳实践和常见应用场景，帮助开发者快速上手并提升任务管理能力。1.青龙面板脚本开发简介1.1脚本开发的意义在青龙面板中，脚本是实现自动化任务的核心。
统计用户输入的数字（0到9）出现的次数，并输出每个数字出现的次数（超详细解析）人机yu 算法数据结构学习方法笔记
1.头文件#include#include：这行代码引入了标准输入输出库stdio.h，该库提供了输入输出函数，比如scanf()和printf()。2.主函数声明intmain()intmain()：这是C语言程序的入口函数，程序从这里开始执行。3.变量声明intx;intcount[10];inti;intx;：声明了一个整数变量x，用来存储用户输入的数字。intcount[10];：声明了一
matlab快速入门（2）-- 数据处理与可视化 kyle~ matlab matlab 人工智能算法
MATLAB的数据处理1.数据导入与导出(1)从文件读取数据Excel文件：data=readtable('data.xlsx');%读取为表格（Table）CSV文件：data=readtable('data.csv');%自动处理表头和分隔符文本文件：data=load('data.txt');%数值数据直接加载为矩阵(2)导出数据到文件保存为Excel：writetable(data,'ou
Java软件架构：2020年2月最佳实践与趋势王元祺
本文还有配套的精品资源，点击获取简介：本资源探讨了2020年2月软件架构领域的主要趋势，重点关注微服务、容器化、DevOps、云原生以及CI/CD等关键议题。特别强调了Java在现代软件架构中的应用，包括微服务架构的实现，容器化技术如Docker的使用，以及Kubernetes等容器编排工具。还涉及到了Java的新特性、性能优化、安全性、可扩展性以及设计和架构模式。资料包括实例代码、文档和教程，致
云计算部署模式全面解析 ivwdcwso 云计算
目录引言公有云私有云混合云三种部署模式的对比选择建议未来趋势结语1.引言随着云计算技术的快速发展,企业在选择云部署模式时面临着多种选择。本文将深入探讨云计算的三种主要部署模式:公有云、私有云和混合云,帮助读者全面了解它们的特点、优势及适用场景。©ivwdcwso(ID:u012172506)2.公有云2.1定义公有云是由第三方云服务提供商提供的云计算服务,通过互联网向公众开放。多个客户共享同一基础
使用 Docker(Podman) 部署 MongoDB 数据库及使用详解特立独行的猫a Go语言实践笔记数据库 docker podman
在现代开发环境中，容器化技术（如Docker和Podman）已成为部署和管理应用程序的标准方式。本文将详细介绍如何使用Podman/Docker部署MongoDB数据库，并确保其他应用程序容器能够通过Docker网络成功连接到MongoDB。我们将逐步解决常见的问题，如权限配置和认证设置，应用容器如何连接和使用容器中的MongoDB数据库等。选择Podman而不是Docker为什么选择Podman
使用crontab 对docker下的mongoDB数据定时备份 YLIHMS crontab linux mongodb
定时备份MongoDB数据环境：我做备份的环境是linux4.1964位、docker19、Mongo:4.2.3crontab：crontab命令常见于Unix和类Unix的操作系统之中，用于设置周期性被执行的指令。该命令从标准输入设备读取指令，并将其存放于“crontab”文件中，以供之后读取和执行。该词来源于希腊语chronos(χρ?νο?)，原意是时间。通常，crontab储存的指令被守
Qt MDI和Ribbon界面集成实践教程 Pella732
本文还有配套的精品资源，点击获取简介：本文深入介绍了基于Qt的RibbonMDIDemo项目，该项目展示了一个具有MicrosoftOffice风格的RibbonBar的多文档界面应用程序。通过一个完整的示例工程，读者可以学习如何在Qt环境中构建Ribbon风格的用户界面以及多文档界面（MDI）的应用程序。教程覆盖了RibbonBar的设计、MDIArea的管理、菜单和工具栏的整合，以及文档和视图
99.24 金融难点通俗解释：MLF（中期借贷便利）vs LPR（贷款市场报价利率） AI量金术师金融资产组合模型进化论金融 python 机器学习人工智能数据可视化
目录0.承前1.什么是MLF？1.1专业解释1.2通俗解释1.3MLF的三个关键点：2.什么是LPR？2.1专业解释2.2通俗解释2.3LPR的三个关键点：3.MLF和LPR的关系4.传导机制4.1第一步：央行调整MLF4.2第二步：银行调整LPR4.3第三步：影响实际贷款5.实际案例6.为什么要关注？7.小贴士7.1关注渠道7.2实用建议8.总结9.LPR数据获取代码实现&数据可视化9.1数据获
如何使用SliverGrid组件 talk_8 一起Talk Flutter吧移动开发Flutter
文章目录1概念介绍2使用方法3示例代码我们在上一章回中介绍了SliverList组件相关的内容，本章回中将介绍SliverGrid组件.闲话休提，让我们一起TalkFlutter吧。1概念介绍我们在本章回中介绍的SliverGrid组件是一种网格类组件，主要用来创建网格类布局，它和GridView组件类似，它们的不同之处在于SliverGrid组件可以被当作一个整体来滑动。我们将在本章回中详细介绍
基于Spring Boot的校园志愿者服务网站超级无敌暴龙战士塔塔开 Java课设与毕设资源 spring boot java 后端
文章目录项目介绍主要功能截图：登录个人中心志愿者管理活动类型管理活动报名管理活动心得部分代码展示设计总结项目获取方式作者主页：Java韩立简介：Java领域优质创作者、简历模板、学习资料、面试题库【关注我，都给你】文末获取源码联系项目介绍校园志愿者服务网站，java项目，springboot项目。eclipse和idea都能打开运行。推荐环境配置：eclipse/ideajdk1.8mavenmy
Java学习教程，从入门到精通，JDBC中WHERE子句的语法知识点及案例代码（107）知识分享小能手大数据 Java 编程语言如门 java 学习开发语言数据库大数据 JDBC intellij-idea
JDBC中WHERE子句的语法知识点及案例代码JDBCWHERE子句语法知识点WHERE子句用于在SQL查询中对数据进行筛选，它可以根据指定的条件过滤数据行。在JDBC中，WHERE子句通常用于SELECT、UPDATE和DELETE语句中。常见的WHERE子句条件比较运算符=：等于：大于=：大于等于18ANDscore>=80";try{//加载数据库驱动Class.forName("com.m
Mac M1 源码安装FFmpeg，开启enable-gpl 和 lib x264 福葫芦 macos ffmpeg
1、第一步：下载并安装minicodacurl-Ohttps://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.shshMiniconda3-latest-MacOSX-arm64.sh2、第二步：安装必要的依赖condainstall-cconda-forgegccmakenasmyasm3、第三步：下载FFmpeg源代码（
【python 类型注解详解】放飞自我的Coder python 开发语言 linux
在Python中，类型注释（TypeAnnotations）允许你为变量、函数参数和返回值指定类型信息。预定义变量选项通常指的是在代码中预先定义一些可能的变量值，并在类型注释中使用这些预定义的值。1.使用Literal类型Literal类型允许你指定一个变量只能是某些特定的字面量值。这在处理枚举值或预定义选项时非常有用。fromtypingimportLiteral#预定义的选项Option=Li
基于天地图的应用服务系统设计开发—以甘肃高校招生服务为例刘一哥GIS 天地图 SQL server 服务招生 VS网站
“天地图”是国家测绘地理信息局建设的地理信息综合服务网站。它是“数字中国”的重要组成部分，是国家地理信息公共服务平台的公众版。“天地图”的目的在于促进地理信息资源共享和高效利用，提高测绘地理信息公共服务能力和水平，改进测绘地理信息成果的服务方式，更好地满足国家信息化建设的需要，为社会公众的工作和生活提供方便。本文基于天地图提供的位置服务，采用B/S（浏览器/服务器）的系统设计开发模式，以用户的实际
Spring Boot 篇五: Log的使用 alvachien Java Spring Boot spring boot log logback spring
本文目录Log在Spring的前世今生log4j,logback和log4j2SLF4JAPI使用Logbackloggerrootappenderappendfilterencoderfile和rollingPolicy一些实际案例不写入Console的日志在Console显示日志，但将错误写入文件使用log4j2Log在Spring的前世今生Log对于任一系统的重要性不言而喻。跟JPA类似，S
一、引论，《组合数学(第4版)》卢开澄卢华明 _Equinox 组合数学算法数学
零、前言发现自己数数题做的很烂，重新学一遍组合数学吧。参考卢开澄卢华明编著的《组合数学(第4版)》，只打算学前四章。通过几个经典问题来了解组合数学所研究的内容。一、幻方问题据说大禹治水之前，河里冒出来一只乌龟，龟背上是一个3*3的矩阵，每个格子里面有若干点，行和列和对角线和都相等且为15。然后大禹就以15为周期来治水了。对于一个nxn的矩阵，满足行和，列和，主副对角线和都相等，那么这个矩阵就是一个
精讲 JS return 语句的作用谦虚的w javascript 前端
函数作用域的限制-在JavaScript中，函数有自己的作用域。在函数内部定义的变量和对象（如localObj）默认情况下在函数外部是无法直接访问的。这是因为函数的作用域是封闭的，它将内部的变量和对象隐藏起来，以防止外部代码随意访问和修改。return语句的作用-当在函数内部使用return语句返回一个对象（如returnlocalObj;）时，实际上是将这个对象的引用传递到函数外部。这样，在函数
SpringBoot核心特性：自动配置与起步依赖 YY...yy SpringBoot框架学习 spring boot java spring
前言SpringBoot通过一系列创新的设计和特性，极大地简化了Spring应用的开发和配置工作。其中，自动配置（Auto-Configuration）和起步依赖（Starter）是SpringBoot最为核心的功能之一。这两项特性不仅降低了开发者的入门门槛，还显著提升了开发效率。一、SpringBoot的核心优势：零配置与自动化SpringBoot的最大魅力在于它能够最大限度地减少开发者的手动配
PTA—设计圆和圆柱体 YY...yy java 开发语言
编写一个完整的JavaApplication程序。包含类Circle、Cylinder、Main，具体要求如下。（1）编写类Circle，表示圆形对象，包含以下成员①属性：1)radius：私有，double型，圆形半径；②方法：1)Circle(doubleradius),构造方法,用参数设置圆的半径2)Circle(),构造方法，将圆形初始化为半径为0。3)voidsetRadius(doub
Python 类型注解叫我DPT python python
文章目录Python类型注解详解1.引言2.Python类型注解基础2.1变量类型注解2.2函数参数和返回值注解2.3`typing`模块的支持3.进阶：复杂数据类型3.1可选类型（Optional）3.2联合类型（Union）3.3泛型（Generics）4.运行时类型检查4.1`get_type_hints()`获取类型信息4.2自定义类型检查装饰器5.静态类型检查工具`mypy`6.总结Py
Spring Boot 配置文件详解：YAML vs Properties YY...yy SpringBoot框架学习 spring boot java 前端
前言在SpringBoot开发中，配置文件是应用运行的核心。无论是开发、测试还是生产环境，配置文件都起到了至关重要的作用。SpringBoot提供了两种主流的配置文件格式：Properties和YAML。它们各有特点，适用于不同的场景。本文将从以下几个方面详细解析SpringBoot的配置文件：YAML和Properties的区别与使用场景多环境配置：管理开发、测试、生产环境的不同设置自定义配置：
数据仓库之Kappa架构 james二次元数据仓库数据仓库
Kappa架构是一种简化的数据处理架构，旨在处理实时数据流，解决传统Lambda架构中批处理和实时处理的复杂性。Kappa架构完全基于流处理，不区分批处理和实时处理，所有数据都是通过流处理系统进行处理。以下是对Kappa架构的详细介绍：核心概念数据流处理：所有数据都是以事件流的形式处理的，没有批处理的概念。数据流是连续的，实时的，不需要区分历史数据和实时数据。简化架构：通过统一的流处理框架简化数据
汽车IVI中控开发入门及进阶（六）：仪表和中控车机GUI界面开发工具介绍芯片-嵌入式汽车电子芯片学习从入门到精通汽车 GUI IVI Qt Genevi
汽车中控IVI，也有人称之为车机，HUD+仪表盘(Cockpit)+车载娱乐信息系统(In-VehicleInfotainment,IVI)三个组成了智能座舱域。中控的屏幕也是大小不一，比如问界M7就采用了10.25英寸的液晶仪表盘和15.6英寸的中控悬浮大屏设计,液晶仪表盘显示信息丰富。而这些液晶屏大部分是LCD屏，不管是异形还是长方形，都需要进行GUI界面设计，这个需要用什么软件工具来设计呢？
Python从0到100（八十一）：神经网络-Fashion MNIST数据集取得最高的识别准确率是Dream呀 python 神经网络开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
HTML基础与进阶技术指南王奥雷
本文还有配套的精品资源，点击获取简介：HTML是构建网页的基础语言，负责定义网页的内容结构和样式。初学者需要掌握HTML元素、属性、结构等基础知识，并了解HTML5新增的语义化标签，表单元素的使用，布局与定位技术，响应式设计原则，以及如何与JavaScript交互。此外，学习SEO优化和无障碍性设计也是提高网页质量和可访问性的关键。本指南旨在引导初学者从基础到高级技巧，逐步深入理解并实践网页开发。
rocksdb原理_RocksDB解析 weixin_39899226 rocksdb原理
0.存储引擎基础存储引擎的基本功能和数据结构一个存储引擎需要实现三个基本的功能：write(key,value)二分查找并插入read(key)->returnvalue二分查找并返回scan(begin,end)->returnvalues求key在某区间内的所有元素。先两次二分查找，确定begin和end的位置。两位置之间的数据就是结果集values上述的存储引擎和普通的哈希表不同。最大的区别
详解：订单履约系统规划 java
大家好，我是汤师爷~什么是订单履约系统？订单履约是从消费者下单支付到收到商品的全流程管理过程，包括订单接收、订单派单、库存分配、仓储管理和物流配送等环节，核心目标是确保商品准时、准确地送达消费者手中。通过订单履约系统，消费者可以实时了解商品的物流状态和预计送达时间，并可以根据需求选择同城配送、快递或自提等多样化的履约方式。对商家而言，订单履约系统可以自动化处理订单信息，大幅降低人工操作成本。系统能
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_