sdmei

数据归档工具pt-archiver原理研究与使用

1.介绍

之前处理mysql历史数据归档，直接写存储过程实现的（《mysql历史数据自动归档》），换新东家后，还是决定研究下主流的pt-archiver并实施。

mysql除了社区版，还有percona、mariadb两个分支；其中percona是一家做mysql咨询的公司，除了开发了自己的mysql分支外，还开发了大量的mysql运维工具，统称percona toolkit。

使用最为广泛的，如pt-online-schema-change：解决DDL锁表问题，pt-archiver：数据归档。

pt-archiver是mysql开源归档工具的主流，是大多数mysql DBA的常用工具。

2.安装与使用

2.1.安装

官网下载最新的rpm包，yum安装即可

# yum localinstall percona-toolkit-3.3.1-1.el7.x86_64.rpm

2.2.使用

[root@iZbp1ckjqrnvsfle1x9kzdZ ~]# pt-archiver \
> --source h=***.mysql.rds.aliyuncs.com,D=crm,t=t1,u=username,p=password,A=utf8mb4 \
> --dest h=***.mysql.rds.aliyuncs.com,D=testdb,t=t1,u=username,p=password,A=utf8mb4 \
> --where "create_time < date_sub(now(), interval 3 month)" \
> --limit 1000 --commit-each --bulk-delete --bulk-insert --progress 10000 --run-time 600s --sleep 1

TIME ELAPSED COUNT
2021-08-19T15:11:07 0 0
2021-08-19T15:11:08 0 10000
2021-08-19T15:11:08 0 20000
2021-08-19T15:11:08 0 30000
2021-08-19T15:11:08 0 40000
2021-08-19T15:11:09 1 50000
2021-08-19T15:11:09 1 60000
2021-08-19T15:11:09 1 70000
2021-08-19T15:11:09 1 80000
2021-08-19T15:11:10 2 84820

2.3.参数说明

--source：源库信息

--dest：目标库信息

--where：归档的数据必须满足的条件，如3个月前

--limit：一个SQL处理的记录数，即一个批次归档多少条记录

--commit-each：每个批次处理后提交

--bulk-delete：通过一条语句删除一个批次：delete from table where id >= ? and id <= ?；如不指定，则一条一条删除：delete from table where id = ?

--bulk-insert：每个批次的数据生产临时文件，然后通过LOAD DATA LOCAL INFILE方式加载到历史库

--progress：输出执行进度

--run-time：脚本每次最大执行时长

--sleep：每个事务之间间隔的时间

2.4.原理说明

线上表、历史表可以在同一个实例，或不同的实例；
pt-archiver通过perl DBI模块（Database Independent Interfacefan）远程访问数据库；
pt-archiver底层通过执行sql和简单的分布式事务实现归档逻辑

2.4.1. 实现逻辑（无批量执行）

参数未指定--bulk-delete\--bulk-insert

执行顺序	线上表	历史表	分批	说明
1	select * from source where (归档条件) and id < max_id order by id limit 3		第一批	按主键升序获取limit条数据
2		insert into target values (1001,……)		事务大小有两种控制方式： 1.一个批次提交一次，事务大小=limit，设置：--commit-each（推荐） 2.指定事务大小，设置：--txn-size
3	delete from source where id = 1001
4		insert into target values (1002,……)
5	delete from source where id = 1002
6		insert into target values (1003,……)
7	delete from source where id = 1003
8		commit		先提交insert,后提交delete
9	commit			先提交insert,后提交delete
10	select * from source where (归档条件) and id < max_id and id > last_archived_id order by id limit 3		第二批	与第一批相比，增加了条件： id > last_archived_id，缩小扫描范围
11		……
12	……

2.4.2. 实现逻辑（批量执行）

参数指定--bulk-delete\--bulk-insert

执行顺序	线上表	历史表	分批
1	select * from source where (归档条件) and id < max_id order by id limit 3		第一批
2		LOAD DATA LOCAL INFILE …… INTO TABLE
3	DELETE FROM `crm`.`t1` WHERE (((`id` >= ?))) AND (((`id` <= ?))) AND (归档条件) LIMIT 3
4		commit
5	commit
6	select * from source where (归档条件) and id < max_idand id > last_archived_id order by id limit 3		第二批
7		……
8	……

与单条记录insert、delete相比，批量执行性能更好；
limit不能设置过大，否则可能会导致主从延迟、锁冲突等，建议设置为1000左右。
批量执行的一个缺点：load data过程中如果遇到主键或唯一键冲突，不会报错，直接忽略冲突的记录，整个事务正常提交。

2.4.3. 工具执行的SQL

# pt-archiver --source h=***.mysql.rds.aliyuncs.com,D=crm,t=t1,u=username,p=password,A=utf8mb4 --dest h=***.mysql.rds.aliyuncs.com,D=testdb,t=t1,u=username,p=password,A=utf8mb4 --where "create_time < date_sub(now(), interval 10 minute)" --limit 1000 --commit-each --bulk-delete --bulk-insert --progress 10000 --dry-run

SELECT /*!40001 SQL_NO_CACHE */ `id`,`name`,`create_time` FROM `crm`.`t1` FORCE INDEX(`PRIMARY`) WHERE (create_time < date_sub(now(), interval 10 minute)) AND (`id` < '522372') ORDER BY `id` LIMIT 1000
SELECT /*!40001 SQL_NO_CACHE */ `id`,`name`,`create_time` FROM `crm`.`t1` FORCE INDEX(`PRIMARY`) WHERE (create_time < date_sub(now(), interval 10 minute)) AND (`id` < '522372') AND ((`id` >= ?)) ORDER BY `id` LIMIT 1000
DELETE FROM `crm`.`t1` WHERE (((`id` >= ?))) AND (((`id` <= ?))) AND (create_time < date_sub(now(), interval 10 minute)) LIMIT 1000
LOAD DATA LOCAL INFILE ? INTO TABLE `testdb`.`t1`(`id`,`name`,`create_time`)

2.4.4. 源码中的事务控制

commit函数

sub commit {
   my ( $o, $force ) = @_;                                                                       
   my $txnsize = $o->get('txn-size');
   if ( $force || ($txnsize && $txn_cnt && $cnt % $txnsize == 0) ) {            ## 事务提交的条件：force参数强制提交，或根据事无大小判断是否提交
      if ( $o->get('buffer') && $archive_fh ) {
         my $archive_file = $o->get('file');
         trace('flush', sub {
            $archive_fh->flush or die "Cannot flush $archive_file: $OS_ERROR\n";
         });
      }
      if ( $dst ) {
         trace('commit', sub {
            $dst->{dbh}->commit;                                                ## 先提交目标库的事务
         });
      }
      trace('commit', sub {
         $src->{dbh}->commit;                                                   ## 后提交源库的事务                             
      });
      $txn_cnt = 0;
   }
}

主流程

ROW:
while (                                     # Quit if:                          ## 循环处理记录                     
   $row                                     # There is no data
   && $retries >= 0                         # or retries are exceeded
   && (!$o->get('run-time') || $now < $end) # or time is exceeded
   && !-f $sentinel                         # or the sentinel is set
   && $oktorun                              # or instructed to quit
   )
{
   my $lastrow = $row;
   if ( !$src->{plugin} ||
        trace('is_archivable', sub {$src->{plugin}->is_archivable(row => $row)})
   )
   {
                                                                                ## 非批量操作，即逐行insert\delete
      if ( $dst && !$bulkins_file ) {
         my $ins_sth;
         $ins_sth ||= $ins_row; # Default to the sth decided before.
         my $success = do_with_retries($o, 'inserting', sub {                   ## insert
            my $ins_cnt = $ins_sth->execute(@{$row}[@ins_slice]);
            PTDEBUG && _d('Inserted', $ins_cnt, 'rows');
            $statistics{INSERT} += $ins_sth->rows;
         });
         if ( $success == $OUT_OF_RETRIES ) {
            $retries = -1;
            last ROW;                                                           ## insert报错，终止循环
         }
      }
      if ( !$bulk_del ) {
         if ( !$o->get('no-delete') ) {
            my $success = do_with_retries($o, 'deleting', sub {                 ## delete
               $del_row->execute(@{$row}[@del_slice]);
               PTDEBUG && _d('Deleted', $del_row->rows, 'rows');
               $statistics{DELETE} += $del_row->rows;
            });
            if ( $success == $OUT_OF_RETRIES ) {                               
               $retries = -1;
               last ROW;                                                        ## delete报错，终止循环
            }
         }
      }
   }
   $now = time();
   ++$cnt;
   ++$txn_cnt;
   $retries = $o->get('retries');
   commit($o) unless $commit_each;                                              ## 提交场景1：未设置commit-each, 由txn-size控制是否提交，记录数被txn-size整除时提交
   if ( $get_sth->{Active} ) { # Fetch until exhausted
      $row = $get_sth->fetchrow_arrayref();
   }
   if ( !$row ) {                                                               ## 批量操作, 一条SELECT返回的的所有数据都遍历完毕
      if ( $bulkins_file ) {
         $bulkins_file->close()
            or die "Cannot close bulk insert file: $OS_ERROR\n";
         my $ins_sth; # Let plugin change which sth is used for the INSERT.
         $ins_sth ||= $ins_row;
         my $success = do_with_retries($o, 'bulk_inserting', sub {              ## 批量insert
            $ins_sth->execute($bulkins_file->filename());
            $src->{dbh}->do("SELECT 'pt-archiver keepalive'") if $src;
            PTDEBUG && _d('Bulk inserted', $del_row->rows, 'rows');
            $statistics{INSERT} += $ins_sth->rows;
         });
         if ( $success != $ALL_IS_WELL ) {
            $retries = -1;
            last ROW;                                                           ## insert报错，终止循环
         }
      }
      if ( $bulk_del ) {
         if ( !$o->get('no-delete') ) {
            my $success = do_with_retries($o, 'bulk_deleting', sub {            ## 批量delete
               $del_row->execute(
                  @{$first_row}[@bulkdel_slice],
                  @{$lastrow}[@bulkdel_slice],
               );
               PTDEBUG && _d('Bulk deleted', $del_row->rows, 'rows');
               $statistics{DELETE} += $del_row->rows;
            });
            if ( $success != $ALL_IS_WELL ) {
               $retries = -1;
               last ROW;                                                        ## delete报错，终止循环
            }
         }
      }
      commit($o, 1) if $commit_each;                                            ## 提交场景2：设置了commit-each的情况下，提交一个完整批次的数据
      $get_sth = $get_next;
 
      trace('select', sub {                                                     ## 获取下一个批次的数据
         $get_sth->execute(@{$lastrow}[@asc_slice]);
      });
   }
}
commit($o, $txnsize || $commit_each);                                           ## 最后再提交一次

3. 实施

3.1. 阿里云X-Engine引擎RDS

X-Engine是阿里云自研的OLTP数据库存储引擎。作为自研数据库PolarDB的存储引擎之一，已经广泛应用在交易历史库、钉钉历史库等核心应用，大幅缩减了业务成本（官方介绍：https://help.aliyun.com/document_detail/148660.html）。

阿里自研X-Engine引擎的目的：

极高的并发事务处理能力（尤其是双十一的流量突发式暴增）？
超大规模的数据存储。

X-Engine使用了LSM-Tree作为分层存储的架构基础，基于Copy-on-write技术，避免原地更新数据页，从而对只读数据页面进行编码压缩，相对于传统存储引擎（例如InnoDB），使用X-Engine可以将存储空间降低至10%~50%。

使用X-Engine注意事项：

只支持RDS MYSQL 8.0版本；
不支持分区表；
最好不要在同一个实例中混用Innodb和X-Engine，两种引擎对内存的要求和管理方式不同；
RDS同等配置的两种引擎实例价格相同。

3.2. pt-archiver脚本

ptArchive.sh

# more ptArchiver.sh
#!/bin/bash
HOST_UAT_OMP=***.mysql.rds.aliyuncs.com
HOST_UAT_MMP=***.mysql.rds.aliyuncs.com
HOST_TEST_OMP=***.mysql.rds.aliyuncs.com
HOST_PROD_ARCHIV=***.mysql.rds.aliyuncs.com
 
LOG_FILE=/root/ptArchiver/log/ptArchiver.`date +%Y%m%d`
 
function log_begin()
{
    TAB=$1
    echo >> $LOG_FILE
    echo `date +%Y-%m-%d"T"%H:%M:%S`"  ${TAB} begin..." >> $LOG_FILE
    echo "------------------------------------" >> $LOG_FILE
}
 
function log_end()
{
    TAB=$1
    echo "------------------------------------" >> $LOG_FILE
    echo `date +%Y-%m-%d"T"%H:%M:%S`"  ${TAB} end" >> $LOG_FILE
}
 
log_begin crm.t1
/usr/bin/pt-archiver \
--source h=${HOST_UAT_OMP},A=utf8mb4,D=crm,t=t1,u=username,p=password \
--dest h=${HOST_UAT_MMP},A=utf8mb4,D=testdb,t=t1,u=username,p=password \
--where "create_time < str_to_date(concat(date_format(date_sub(now(), interval 10 minute),'%Y-%m-%d %H:%i'),':00'),'%Y-%m-%d %H:%i:%S')" \
--limit 1000 --commit-each  --bulk-delete --bulk-insert --progress 20000 --run-time=600s --sleep 1 >> $LOG_FILE 2>&1
log_end crm.t1
 
log_begin yunkc_finance_bak.finance_d_t_third_pay_info
/usr/bin/pt-archiver \
--source h=${HOST_TEST_OMP},A=utf8mb4,D=yunkc_finance_bak,t=finance_d_t_third_pay_info,u=username,p=password \
--dest h=${HOST_PROD_ARCHIV},A=utf8mb4,D=testdb,t=finance_d_t_third_pay_info,u=username,p=password \
--where "((create_time < str_to_date(concat(date_format(date_sub(now(),interval 351 day),'%Y-%m-%d %H'),':00:00'),'%Y-%m-%d %H:%i:%S')) and (flow_type in (1000211,1000212)))" \
--no-version-check \
--limit 1000 --commit-each  --bulk-delete --bulk-insert --progress 20000 --run-time=600s --sleep 1 >> $LOG_FILE 2>&1
log_end yunkc_finance_bak.finance_d_t_third_pay_info

注：归档条件中的时间条件，最好取整到小时或天，如果直接用now()-n天，且线上表每秒都在入数据，则pt-archiver脚本会因为一直有数据需要归档而不退出，直到run-time结束。

log

# more ptArchiver.20210825
 
2021-08-25T10:00:01  crm.t1 begin...
------------------------------------
TIME                ELAPSED   COUNT
2021-08-25T10:00:01       0       0
2021-08-25T10:00:03       2    2160
------------------------------------
2021-08-25T10:00:04  crm.t1 end
 
2021-08-25T10:00:04  yunkc_finance_bak.finance_d_t_third_pay_info begin...
------------------------------------
TIME                ELAPSED   COUNT
2021-08-25T10:00:05       0       0
2021-08-25T10:00:31      26   20000
2021-08-25T10:00:55      49   40000
2021-08-25T10:01:18      73   60000
2021-08-25T10:01:41      96   80000
2021-08-25T10:02:05     120  100000
2021-08-25T10:02:28     143  120000
2021-08-25T10:02:51     166  140000
2021-08-25T10:03:15     190  160000
2021-08-25T10:03:38     213  180000
2021-08-25T10:04:01     236  200000
2021-08-25T10:04:24     259  220000
2021-08-25T10:04:48     283  240000
2021-08-25T10:05:12     306  260000
2021-08-25T10:05:35     330  280000
2021-08-25T10:05:59     354  300000
2021-08-25T10:06:22     377  320000
2021-08-25T10:06:46     401  340000
2021-08-25T10:07:09     424  360000
2021-08-25T10:07:32     447  380000
2021-08-25T10:07:56     471  400000
2021-08-25T10:08:20     494  420000
2021-08-25T10:08:43     518  440000
2021-08-25T10:09:07     542  460000
2021-08-25T10:09:30     565  480000
2021-08-25T10:09:53     588  500000
2021-08-25T10:10:05     600  509001
------------------------------------
2021-08-25T10:10:05  yunkc_finance_bak.finance_d_t_third_pay_info end

在嵌入式系统中实现低功耗MQTT协议：从协议解析到硬件优化 W说编程物联网嵌入式网络编程物联网网络协议 c语言嵌入式硬件
在嵌入式系统中实现低功耗MQTT协议：从协议解析到硬件优化1.引言：物联网时代的低功耗挑战随着物联网设备的爆炸式增长，设备续航与网络可靠性成为嵌入式系统设计的核心矛盾。据统计，70%的物联网设备因功耗问题导致维护成本倍增。核心需求：在维持TCP/IP协议栈功能的前提下，将设备待机功耗降至μA级；确保弱网环境（如2G/NB-IoT）下的数据传输可靠性。本文将以MQTT协议为例，详解在STM32+LW
【硬核实战】ETCD+AI智能调度深度整合！从架构设计到调优避坑，手把手教你打造高可用调度系统！码农突围计划人工智能 etcd 大数据
一、核心架构设计：ETCD如何赋能AI调度？架构图：[AI调度引擎]←实时数据→[ETCD集群]↓决策指令[执行层（车辆/物流/交通设备）]核心角色：ETCD：存储调度策略、节点状态、任务队列、实时环境数据（如交通流量、天气）AI模型：基于ETCD数据动态决策（如路径规划、资源分配）调度执行层：接收ETCD下发的指令并执行（如车辆调度、信号灯控制）优势：强一致性：ETCD的Raft协议确保调度策略
当我被面试官追问如何优化慢SQL时，我悟了这些底层逻辑 mysql数据库程序员后端
当我被面试官追问如何优化慢SQL时，我悟了这些底层逻辑去年面试字节跳动时，我遇到了一个至今印象深刻的场景：面试官在白板上写了一条包含三表JOIN且带有子查询的SQL，淡淡地说"请分析这条SQL的性能问题"。当时我的后背瞬间绷直——这道题考察的不仅是SQL优化技巧，更是对数据库底层原理的深刻理解。一、面试官到底在考察什么？实战经验：是否真正处理过线上慢查询问题，能否结合业务场景分析知识体系：从索引设
烧掉 700 亿学费后，中国企业终于懂了：换软件才是真正的省钱程序员安全数据库
2018年深圳宝安机场，76岁的中兴创始人侯为贵拖着行李箱赶赴美国的照片全网刷屏。芯片断供7天，这家通信巨头市值蒸发700亿；2022年某新能源车企因EDA软件禁用，耗资数十亿的研发项目直接停摆。中国企业终于意识到：躺在全球化温床上的时代，结束了。从芯片到数据库，从工业软件到办公系统，中国企业正把“进口零件”一个个抠下来——这不是赌气，而是被逼出来的生存智慧。一、当“卡脖子”变成商机2020年哈工
deepseek时代，快消行业AI搜索破局战：3步抢占3亿用户决策入口白雪讲堂人工智能大数据
——2025年滋补品牌必须掌握的AI搜索生存法则一、残酷现状：滋补行业正被AI搜索重构规则1.AI搜索用户规模爆发，高净值人群加速迁移3.31亿用户：2025年AI搜索用户规模（QuestMobile数据），中青年、高学历人群占比超60%决策路径缩短50%：用户从“搜索-比价-购买”转变为“提问-获取答案-下单”品牌生死线：当用户搜索“阿胶品牌推荐”，若答案中无品牌露出，等于永久失去客户2.滋补行
用指针实现数组元素循环移动 Stimpay 算法数据结构 c语言
任务描述本关任务：编写程序，用指针实现以下功能，n个整数存入一维数组中，将该数组循环左移m位。如一个长度为10的数组中原来的元素顺序为0123456789，则循环左移3个位置后元素的顺序为3456789012。相关知识为了完成本关任务，有两种算法思想：一种是使用辅助数组实现数据移动；另一种是不使用辅助数组，只需一个中间变量就可实现数据移动。使用辅助数组实现数据移动创建一个同样大小辅助数组，存放临时
华纳云如何优化 MySQL 的内存使用？服务器
优化MySQL的内存使用是提高数据库性能和效率的关键步骤。以下是一些有效的策略和方法，结合了多轮对话中的信息，帮助您优化MySQL的内存使用：1.调整缓冲区和缓存大小InnoDB缓冲池（InnoDBBufferPool）：作用：用于缓存InnoDB表的数据和索引，是MySQL中最重要的内存区域之一。优化建议：将innodb_buffer_pool_size设置为物理内存的50%-80%，具体取决于
FPGA——DDS原理及代码实现
FPGA——DDS原理及代码实现一、DDS各参数意义如图，一个量化的32点的正弦波，也就是说一个ROM里存了32个这样的数据，每次读出一个数据要1ms，分别读出1,2,3...30,31,32,共32个点，读取完整的正弦波需要1ms*32=32ms的时间该正弦波参数为>周期T=1ms*32=32ms,>频率为f=1/T=1/(1ms*(32/1))在读出一个数据时间不变（1ms）的情况下，想要让读
Elasticsearch 介绍：分布式搜索与分析引擎吱屋猪_ elasticsearch
在如今大数据时代，企业和开发者面临着前所未有的数据量和实时性要求。为了能够高效地处理、存储和查询这些数据，Elasticsearch作为一种强大的分布式搜索引擎，已经成为了很多组织和开发者的首选解决方案。1.什么是Elasticsearch？Elasticsearch是一个开源的、基于ApacheLucene构建的全文搜索引擎。它提供了高效的搜索功能，并且非常适合处理大量数据，尤其是在需要快速搜索
合合信息名片全能王上架原生鸿蒙应用市场，成为首批数字名片类应用华为harmonyos
长期以来，名片都是企业商务沟通的重要工具。随着企业数字化转型，相较于传统的纸质名片，数字名片对于企业成员拓展业务、获取商机、提升企业形象等方面发挥着重要作用。近期，合合信息旗下名片全能王正式上线原生鸿蒙应用市场，成为首批上线的数字名片类应用，帮助用户用AI扫描、识别和管理名片，提高商务沟通和客户数据管理的效率。名片全能王是一款智能名片及人脉管理APP，基于合合信息的智能文字识别技术，可将复杂场景下
【MYSQL学习】5分钟学会MySQL登录，新手也能轻松搞定？墨瑾轩 MySql入门~精通 mysql 学习 adb
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣5分钟学会MySQL登录，新手也能轻松搞定？引言嘿，小伙伴们！今天我们来聊聊MySQL的登录问题。对于初学者来说，登录数据库可能是你接触MySQL的第一步，也是最重要的一步。那么，MySQL是如何登录的呢？有哪些常见的问题需要注意？别急，今天我就带你一步步了解
如果企业数据仓库全部使用 Couchbase Analytics 服务，可能会面临哪些问题？ PersistDZ 数据存储数据仓库
如果企业数据仓库全部使用CouchbaseAnalytics服务，可能会面临哪些问题？一、概述CouchbaseAnalytics服务是一项强大的工具，旨在为NoSQL数据提供近实时的分析能力。然而，如果企业的数据仓库全部依赖于CouchbaseAnalytics服务，可能会遇到一些问题和挑战。以下将从多个角度详细分析这些可能的问题。二、可能的问题和挑战资源消耗和成本高资源需求：Couchbase
知识库在意图识别中扮演着**数据支撑**和**语义理解辅助**的双重角色 PersistDZ 大数据与AI 人工智能
知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色，而训练智能客服的意图识别Agent需要结合知识库的结构化数据与机器学习技术。以下是详细解析：一、知识库在意图识别中的作用1.提供标注数据意图标签定义：知识库中存储了预先定义的意图分类体系（如“订单查询”“退换货”“投诉”等），为模型提供明确的训练目标。标注样本：知识库包含大量用户对话历史及其对应的意图标签，是训练监督学习模型的核心数据源。2
记服务器MongoDB数据库迁移实战记录【云MongoDB数据库迁移】一键难忘数据库 mongodb 服务器
文章目录一.服务器MongoDB数据库迁移实战记录1.1备份MongoDB数据库步骤1.2恢复数据库到新服务器里1.3总结一.服务器MongoDB数据库迁移实战记录1.背景：我原来的服务器到期了，因为高昂的费用我只能使用新用户的身份购买一个服务器。2.需求：将原来的云端MongoDB数据库迁移到新购买的服务器上。3.注意：之前的MongoDB并没有使用宝塔的可视化创建，而是使用命令行，导致，可视化
java 实现数据库备份李逍遙️ mysql 数据库 java mysql
importcom.guangyi.project.model.system.DataBaseInFo;importjava.io.BufferedReader;importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjava.io.Inp
Gmsh教程网卡了 Gmsh python Gmsh
13、在没有底层CAD模型的情况下重新擦除STL文件importgmsh#导入Gmsh库，用于几何建模和网格划分importmath#导入数学库，用于计算importos#导入操作系统库，用于处理文件路径importsys#导入系统库，用于处理命令行参数gmsh.initialize()#初始化Gmsh环境defcreateGeometryAndMesh():#清除之前的模型和数据gmsh.cle
A/B测试结果置信度不足时如何决策测试工具
在A/B测试结果置信度不足时，我们需要综合采用多种策略来做出明智决策。增加样本量、延长测试周期、结合实际业务场景、多指标综合评估。其中，增加样本量尤为关键，因为样本量不足往往导致数据波动较大，易产生假阳性或假阴性，从而使测试结论失去可靠性。通过优化采样策略和科学分配资源，能够有效提升测试数据的稳定性和可信度，为后续决策提供更为坚实的数据支撑。一、A/B测试原理与背景、测试信度的重要性A/B测试作为
需求池膨胀时如何科学排序优先级需求分析
需求池膨胀时如何科学排序优先级主要依靠数据驱动、战略对齐、风险评估**。其中数据驱动是关键，通过收集历史数据、用户反馈与市场趋势，对各项需求进行量化评估，帮助企业在需求膨胀时做出精准排序和资源配置。实践表明，数据驱动的决策可使需求响应速度提升约30%，大大优化资源分配效果。一、需求池膨胀现象的背景与挑战、需求池指的是企业内部或市场上积累的各类需求、项目或功能请求。随着企业发展和市场环境变化，需求池
软件定义世界下的教育创新：高校计算机实验室应重心转向开源平台开源
一、一键式教学环境部署，节省90%准备时间•应用模板库：提供200+预置教学工具模板（如JupyterLab+TensorFlow、MySQL集群），教师可根据课程需求选择模板，5分钟内完成包含依赖库、运行环境的全栈部署。•多版本隔离：支持同一服务器并行运行不同版本框架（如Django3.2教学版与4.1开发版），避免版本冲突导致30%的课堂时间浪费。•自助式环境创建：学生通过命令行快速申请带GP
golang接口用法-代码案例 JavaPub-rodert golang golang 开发语言后端
文章目录Go语言中接口（interface）的含义接口的常见应用场景示例1示例2（Dog和Cat）使用场景-多数据库Go语言中接口（interface）的含义接口在Go语言中是一种类型，它定义了一组方法的集合。一个类型只要实现了接口中定义的所有方法，就认为该类型实现了该接口。接口不关心具体的实现细节，只关心方法的签名（即方法的名称、参数和返回值类型）。接口可以看作是不同类型之间的桥梁，它允许不同类
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人南七小僧人工智能网站开发 AI技术产品经理服务器数据库 windows
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
mysql 统计同一字段不同值的个数 liudachu Mysql数据库 mysql
在一个项目中,制作呃echart图表的时候，遇到一个需求，需要从后端接口获取数据----售票员的姓名和业绩所以需要在订单表中，获取不同售票员的订单数量。订单表解决方案汇总MySQL统计一个列中不同值的数量需求：MySQL统计一个列中不同值的数量，其中origin是用户来源，其中的值有iPhone、Android、Web三种，现在需要分别统计由这三种渠道注册的用户数量。方案1:SELECTcount
数仓建模—Data Warebase AI 时代数据平台应当的样子不二人生数仓建模人工智能数据仓库数仓建模
DataWarebaseAI时代数据平台应当的样子引言：在这个AI技术飞速发展的时代，我们有能力更深入地发掘数据潜在的价值，而数据处理不应当成为阻碍。云原生分布式DataWarebase将开启处理数据的新范式，它让数据的使用返璞归真，不论是存储还是查询，一个系统满足业务全方位数据需求。打破复杂数据架构的束缚，大大降低数据的使用门槛，释放数据潜能，让数据涌现智能。背景近二十年大数据发展史2002年我
2025美团最新面试题—Java程序减少GC的设计程序员共鸣 java jvm 开发语言
1.对象复用与池化线程局部变量：通过ThreadLocal缓存线程私有对象，避免竞争。可变对象：优先使用可修改对象（如StringBuilder代替String拼接）。2.减少对象创建避免隐式装箱：使用基本类型（int而非Integer）。优化循环：避免在循环内创建临时对象。静态不可变对象：将常量声明为staticfinal（如配置参数）。3.数据结构优化预分配容量：初始化集合时指定合理大小（如A
Flink 通过 Chunjun Oracle LogMiner 实时读取 Oracle 变更日志并写入 Doris 的方案 roman_日积跬步-终至千里 #flink 实战 flink oracle 大数据
文章目录一、技术背景二、关键技术1、OracleLogMiner2、Chunjun的LogMiner关键流程3、修复ChunjunOracleLogMiner问题一、技术背景在大数据实时同步场景中，需要将Oracle数据库的变更数据（CDC）采集并写入ApacheDoris，以支持数据分析、BI报表、实时数据仓库等应用。本方案基于Flink+Chunjun，通过OracleLogMiner解析Re
【第11章】亿级电商平台订单系统-海量数据架构设计 cherry5230 架构系统架构架构分布式
1-1本章导学课程导学课程定位：大型系统架构设计核心难点解析核心项目：BToB电商平台订单系统（年交易额200亿级）本章知识体系1.核心概念辨析海量数据vs大数据本质区别解析常见认知误区说明2.方法论框架海量数据处理核心思想分布式计算原理数据分片策略弹性扩展机制3.数据库架构设计方法论体系读写分离模式分库分表策略数据分区方案缓存层设计4.数据处理体系海量数据处理之道批处理与流处理数据压缩技术异步处
北京数智医保创新竞赛 | 以“智慧”升级医保，智领云BDOS牢筑竞赛“地基” LinkTime_Cloud 人工智能大数据编程语言数据分析分布式
点击“蓝字”关注我们“任重道远”是对当前医保信息化建设最简明的概括，由于涉及人数多、数据庞大、业务复杂，医保升级之路异常艰难，亟需信息化建设的支持。作为首都，北京面临的医保问题更为错综复杂，例如医疗保障种类繁多，金额巨大，医疗机构举办主体多元，隶属关系复杂，医疗机构药品、耗材用量大，医保服务群体与医保层次多元等等。如此一来，建设高水平的首都医疗保障信息化平台迫在眉睫，但就目前来看，北京医保信息化基
NET Core 大数据处理 Gene Z .Net C#c#
在.NETCore里处理10万条以上的大数据时，可采用以下几种方式，同时也适用于不同的应用场景。1.批量处理方式借助批量操作一次性处理大量数据，从而减少与数据库或外部系统的交互次数，提高性能。例如，在向数据库插入大量数据时，可使用批量插入操作。应用场景适用于数据导入、数据迁移等场景。比如将CSV文件中的大量数据批量导入到数据库中。2.并行处理方式运用并行编程技术（像Parallel.ForEach
火山云与腾讯云的优势对比苹果企业签名分发腾讯云云计算
首先，我需要确定用户的需求是什么。可能他们是在选择云服务提供商，或者在做市场调研。用户可能是企业的IT决策者，或者是开发人员，需要了解哪个平台更适合他们的项目。接下来，我得收集火山云和腾讯云的基本信息。火山云是字节跳动旗下的，虽然进入市场较晚，但可能有字节的技术支持，比如大数据和AI方面的优势。腾讯云作为老牌厂商，生态完善，产品线全，尤其在游戏、社交等领域有优势。需要对比的方面包括：背景与市场地位
Flume与Couchbase集成原理与实例 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Flume与Couchbase集成原理与实例作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着大数据时代的到来，企业对数据存储和处理的效率要求越来越高。在数据采集、存储、处理和分析的各个环节，都需要高效、可靠的技术支持。Flume和Couchbase正是这样两种优秀的工具，前者擅长于数据采集和传输，后者擅长于键值存储和文
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http