javasalatu

重复数据删除(De-duplication)技术研究

1、Dedupe概述

　De-duplication，即重复数据删除，它是一种目前主流且非常热门的存储技术，可对存储容量进行有效优化。它通过删除数据集中重复的数据，只保留其中一份，从而消除冗余数据。如下图所示。这种技术可以很大程度上减少对物理存储空间的需求，从而满足日益增长的数据存储需求。Dedupe技术可以带许多实际的利益，主要包括以下诸多方面：
　(1) 满足ROI(投资回报率，Return On Investment)/TCO(总持有成本，Total Cost of Ownership)需求；
　(2) 可以有效控制数据的急剧增长；
　(3) 增加有效存储空间，提高存储效率；
　(4) 节省存储总成本和管理成本；
　(5) 节省数据传输的网络带宽；
　(6) 节省空间、电力供应、冷却等运维成本。

　Dedupe技术目前大量应用于数据备份与归档系统，因为对数据进行多次备份后，存在大量重复数据，非常适合这种技术。事实上，dedupe技术可以用于很多场合，包括在线数据、近线数据、离线数据存储系统，可以在文件系统、卷管理器、NAS、SAN中实施。Dedupe也可以用于数据容灾、数据传输与同步，作为一种数据压缩技术可用于数据打包。Dedupe技术可以帮助众多应用降低数据存储量，节省网络带宽，提高存储效率、减小备份窗口，节省成本。

　Dedupe的衡量维度主要有两个，即重复数据删除率(deduplocation ratios)和性能。Dedupe性能取决于具体实现技术，而重复数据删除率则由数据自身的特征和应用模式所决定，影响因素如下表[2]所示。目前各存储厂商公布的重复数据删除率从20:1到500:1不等。

高重复数据删除率	低重复数据删除率
数据由用户创建	数据从自然世界获取
数据低变化率	数据高变化率
引用数据、非活动数据	活动数据
低数据变化率应用	高数据变化率应用
完全数据备份	增量数据备份
数据长期保存	数据短期保存
大范围数据应用	小范围数据应用
持续数据业务处理	普通数据业务处理
小数据分块	大数据分块
变长数据分块	定长数据分块
数据内容可感知	数据内容不可知
时间数据消重	空间数据消重

2、Dedupe实现要点

　研发或应用Dedupe技术时应该考虑各种因素，因为这些因素会直接影响其性能和效果。

　(1) What：对何种数据进行消重？
　对时间数据还是空间数据进行消重，对全局数据还是局部数据进行消重？这是首先需要考虑的因素，这直接决定着Dedupe实现技术和数据消重率。随时间变化的数据，如周期性的备份、归档数据，比空间数据具有更高的消重率，Dedupe技术在备份归档领域中被广泛应用。不难想象，全局范围内的数据重复率比局部范围数据要高，会获得更高的数据消重率。

　(2) When：何时进行消重？
　数据消重时机分为两种情形：在线消重和离线消重。采用在线消重模式，数据写入存储系统同时执行消重，因此实际传输或写入的数据量较少，适合通过LAN或WAN进行数据处理的存储系统，如网络备份归档和异地容灾系统。由于它需要实时进行文件切分、数据指纹计算、Hash查找，对系统资料消耗大。离线消重模式，先将数据写入存储系统，然后利用适当的时间再进行消重处理。这种模式与前面一种刚好相反，它对系统资料消耗少，但写入了包含重复的数据，需要更多的额外存储空间来预先存储消重前数据。这种模式适合直连存储DAS和存储区域网络SAN存储架构，数据传输不占用网络带宽。另外，离线消重模式需要保证有足够的时间窗口来进行数据去重操作。总之，在何时进行消重，要根据实际存储应用场景来确定。

　(3) Where：在何处进行消重？
　数据消重可以在源端(Source)或者目标端(Target)进行。源端消重在数据源进行，传输的是已经消重后的数据，能够节省网络带宽，但会占用大量源端系统资源。目标端消重发生在目标端，数据在传输到目标端再进行消重，它不会占用源端系统资源，但占用大量网络带宽。目标端消重的优势在于它对应用程序透明，并具有良好的互操作性，不需要使用专门的API，现有应用软件不用作任何修改即可直接应用。

　(4) How：如何进行消重？
　重复数据删除技术包含许多技术实现细节，包括文件如何进行切分？数据块指纹如何计算？如何进行数据块检索？采用相同数据检测还是采用相似数据检测和差异编码技术？数据内容是否可以感知，是否需要对内容进行解析？这些都是Dedupe具体实现息息相关。本文主要研究相同数据检测技术，基于二进制文件进行消重处理，具有更广泛的适用性。

3、Dedupe关键技术

　存储系统的重复数据删除过程一般是这样的：首先将数据文件分割成一组数据块，为每个数据块计算指纹，然后以指纹为关键字进行Hash查找，匹配则表示该数据块为重复数据块，仅存储数据块索引号，否则则表示该数据块是一个新的唯一块，对数据块进行存储并创建相关元信息。这样，一个物理文件在存储系统就对应一个逻辑表示，由一组FP组成的元数据。当进行读取文件时，先读取逻辑文件，然后根据FP序列，从存储系统中取出相应数据块，还原物理文件副本。从如上过程中可以看出，Dedupe的关键技术主要包括文件数据块切分、数据块指纹计算和数据块检索。

　(1) 文件数据块切分

　Dedupe按照消重的粒度可以分为文件级和数据块级。文件级的dedupe技术也称为单一实例存储(SIS, Single Instance Store)，数据块级的重复数据删除其消重粒度更小，可以达到4-24KB之间。显然，数据块级的可以提供更高的数据消重率，因此目前主流的dedupe产品都是数据块级的。数据分块算法主要有三种，即定长切分(fixed-size partition)、CDC切分(content-defined chunking)和滑动块(sliding block)切分。定长分块算法采用预先义好的块大小对文件进行切分，并进行弱校验值和md5强校验值。弱校验值主要是为了提升差异编码的性能，先计算弱校验值并进行hash查找，如果发现则计算md5强校验值并作进一步hash查找。由于弱校验值计算量要比md5小很多，因此可以有效提高编码性能。定长分块算法的优点是简单、性能高，但它对数据插入和删除非常敏感，处理十分低效，不能根据内容变化作调整和优化。Deduputil中FSP分块算法代码如下。

/* * fixed-sized file chunking */ static int file_chunk_fsp(int fd, int fd_ldata, int fd_bdata, unsigned int *pos, unsigned int *block_num, block_id_t **metadata, hashtable *htable, char *last_block_buf, unsigned int *last_block_len) { int ret = 0; unsigned int rwsize; unsigned char md5_checksum[16 + 1] = {0}; char *buf = NULL; buf = (char *)malloc(g_block_size); if (buf == NULL) { perror("malloc in file_chunk_fsp"); return errno; } while (rwsize = read(fd, buf, g_block_size)) { /* if the last block */ if (rwsize != g_block_size) break; /* calculate md5 */ md5(buf, rwsize, md5_checksum); if (0 != (ret = dedup_regfile_block_process(buf, rwsize, md5_checksum, fd_ldata, fd_bdata, pos, block_num, metadata, htable))) { perror("dedup_regfile_block_process in file_chunk_fsp"); goto _FILE_CHUNK_FSP_EXIT; } } *last_block_len = (rwsize > 0) ? rwsize : 0; if ((*last_block_len)) memcpy(last_block_buf, buf, *last_block_len); _FILE_CHUNK_FSP_EXIT: if (buf) free(buf); return ret; }

　CDC(content-defined chunking)算法是一种变长分块算法，它应用数据指纹(如Rabin指纹)将文件分割成长度大小不等的分块策略。与定长分块算法不同，它是基于文件内容进行数据块切分的，因此数据块大小是可变化的。算法执行过程中，CDC使用一个固定大小(如48字节)的滑动窗口对文件数据计算数据指纹。如果指纹满足某个条件，如当它的值模特定的整数等于预先设定的数时，则把窗口位置作为块的边界。CDC算法可能会出现病态现象，即指纹条件不能满足，块边界不能确定，导致数据块过大。实现中可以对数据块的大小进行限定，设定上下限，解决这种问题。CDC算法对文件内容变化不敏感，插入或删除数据只会影响到检少的数据块，其余数据块不受影响。CDC算法也是有缺陷的，数据块大小的确定比较困难，粒度太细则开销太大，粒度过粗则dedup效果不佳。如何两者之间权衡折衷，这是一个难点。Deduputil中CDC分块算法代码如下。

/* * content-defined chunking: * 1. BLOCK_MIN_SIZE <= block_size <= BLOCK_MAX_SIZE * 2. hash(block) % d == r */ static int file_chunk_cdc(int fd, int fd_ldata, int fd_bdata, unsigned int *pos, unsigned int *block_num, block_id_t **metadata, hashtable *htable, char *last_block_buf, unsigned int *last_block_len) { char buf[BUF_MAX_SIZE] = {0}; char block_buf[BLOCK_MAX_SIZE] = {0}; char win_buf[BLOCK_WIN_SIZE + 1] = {0}; char adler_pre_char; unsigned char md5_checksum[16 + 1] = {0}; unsigned int bpos = 0; unsigned int rwsize = 0; unsigned int exp_rwsize = BUF_MAX_SIZE; unsigned int head, tail; unsigned int block_sz = 0, old_block_sz = 0; unsigned int hkey = 0; int ret = 0; while(rwsize = read(fd, buf + bpos, exp_rwsize)) { /* last chunk */ if ((rwsize + bpos + block_sz) < BLOCK_MIN_SIZE) break; head = 0; tail = bpos + rwsize; /* avoid unnecessary computation and comparsion */ if (block_sz < (BLOCK_MIN_SIZE - BLOCK_WIN_SIZE)) { old_block_sz = block_sz; block_sz = ((block_sz + tail - head) > (BLOCK_MIN_SIZE - BLOCK_WIN_SIZE)) ? BLOCK_MIN_SIZE - BLOCK_WIN_SIZE : block_sz + tail -head; memcpy(block_buf + old_block_sz, buf + head, block_sz - old_block_sz); head += (block_sz - old_block_sz); } while ((head + BLOCK_WIN_SIZE) <= tail) { memcpy(win_buf, buf + head, BLOCK_WIN_SIZE); /* * Firstly, i think rabinhash is the best. However, it's performance is very bad. * After some testing, i found ELF_hash is better both on performance and dedup rate. * So, EFL_hash is default. Now, adler_hash as default. */ if (g_rolling_hash) { hkey = (block_sz == (BLOCK_MIN_SIZE - BLOCK_WIN_SIZE)) ? adler32_checksum(win_buf, BLOCK_WIN_SIZE) : adler32_rolling_checksum(hkey, BLOCK_WIN_SIZE, adler_pre_char, buf[head+BLOCK_WIN_SIZE-1]); } else hkey = g_cdc_chunk_hashfunc(win_buf); /* get a normal chunk */ if ((hkey % g_block_size) == CHUNK_CDC_R) { memcpy(block_buf + block_sz, buf + head, BLOCK_WIN_SIZE); head += BLOCK_WIN_SIZE; block_sz += BLOCK_WIN_SIZE; if (block_sz >= BLOCK_MIN_SIZE) { md5(block_buf, block_sz, md5_checksum); if (0 != (ret = dedup_regfile_block_process(block_buf, block_sz, md5_checksum, fd_ldata, fd_bdata, pos, block_num, metadata, htable))) { perror("dedup_reggile_block_process in file_chunk_cdc"); goto _FILE_CHUNK_CDC_EXIT; } block_sz = 0; } } else { block_buf[block_sz++] = buf[head++]; /* get an abnormal chunk */ if (block_sz >= BLOCK_MAX_SIZE) { md5(block_buf, block_sz, md5_checksum); if (0 != (ret = dedup_regfile_block_process(block_buf, block_sz, md5_checksum, fd_ldata, fd_bdata, pos, block_num, metadata, htable))) { perror("dedup_reggile_block_process in file_chunk_cdc"); goto _FILE_CHUNK_CDC_EXIT; } block_sz = 0; } } /* avoid unnecessary computation and comparsion */ if (block_sz == 0) { block_sz = ((tail - head) > (BLOCK_MIN_SIZE - BLOCK_WIN_SIZE)) ? BLOCK_MIN_SIZE - BLOCK_WIN_SIZE : tail - head; memcpy(block_buf, buf + head, block_sz); head = ((tail - head) > (BLOCK_MIN_SIZE - BLOCK_WIN_SIZE)) ? head + (BLOCK_MIN_SIZE - BLOCK_WIN_SIZE) : tail; } adler_pre_char = buf[head -1]; } /* read expected data from file to full up buf */ bpos = tail - head; exp_rwsize = BUF_MAX_SIZE - bpos; adler_pre_char = buf[head -1]; memmove(buf, buf + head, bpos); } /* last chunk */ *last_block_len = ((rwsize + bpos + block_sz) >= 0) ? rwsize + bpos + block_sz : 0; if (*last_block_len > 0) { memcpy(last_block_buf, block_buf, block_sz); memcpy(last_block_buf + block_sz, buf, rwsize + bpos); } _FILE_CHUNK_CDC_EXIT: return ret; }

　滑动块(sliding block)算法结合了定长切分和CDC切分的优点，块大小固定。它对定长数据块先计算弱校验值，如果匹配则再计算md5强校验值，两者都匹配则认为是一个数据块边界。该数据块前面的数据碎片也是一个数据块，它是不定长的。如果滑动窗口移过一个块大小的距离仍无法匹配，则也认定为一个数据块边界。滑动块算法对插入和删除问题处理非常高效，并且能够检测到比CDC更多的冗余数据，它的不足是容易产生数据碎片。Deduputil中SB分块算法代码如下。

/* * slideing block chunking, performance is a big issue due to too many hash lookup. */ static int file_chunk_sb(int fd, int fd_ldata, int fd_bdata, unsigned int *pos, unsigned int *block_num, block_id_t **metadata, hashtable *htable, char *last_block_buf, unsigned int *last_block_len) { char buf[BUF_MAX_SIZE] = {0}; char win_buf[BLOCK_MAX_SIZE + 1] = {0}; char block_buf[BLOCK_MAX_SIZE] = {0}; char adler_pre_char; unsigned char md5_checksum[16 + 1] = {0}; unsigned char md5_checksum1[16 + 1] = {0}; unsigned char crc_checksum[16] = {0}; unsigned int bpos = 0; unsigned int slide_sz = 0; unsigned int rwsize = 0; unsigned int exp_rwsize = BUF_MAX_SIZE; unsigned int head, tail; unsigned int hkey = 0; unsigned int bflag = 0; int ret = 0; while(rwsize = read(fd, buf + bpos, exp_rwsize)) { /* last chunk */ if ((rwsize + bpos + slide_sz) < g_block_size) break; head = 0; tail = bpos + rwsize; while ((head + g_block_size) <= tail) { memcpy(win_buf, buf + head, g_block_size); hkey = (slide_sz == 0) ? adler32_checksum(win_buf, g_block_size) : adler32_rolling_checksum(hkey, g_block_size, adler_pre_char, buf[head+g_block_size-1]); uint_2_str(hkey, crc_checksum); bflag = 0; /* this block maybe is duplicate */ if (hash_exist(g_sb_htable_crc, crc_checksum)) { bflag = 2; md5(win_buf, g_block_size, md5_checksum); if (hash_exist(htable, md5_checksum)) { /* insert fragment */ if (slide_sz != 0) { md5(block_buf, slide_sz, md5_checksum1); if (0 != (ret = dedup_regfile_block_process(block_buf, slide_sz, md5_checksum1, fd_ldata, fd_bdata, pos, block_num, metadata, htable))) { perror("dedup_regfile_block_process in file_chunk_sb"); goto _FILE_CHUNK_SB_EXIT; } } /* insert fixed-size block */ if (0 != (ret = dedup_regfile_block_process(win_buf, g_block_size, md5_checksum, fd_ldata, fd_bdata, pos, block_num, metadata, htable))) { perror("dedup_regfile_block_process in file_chunk_sb"); goto _FILE_CHUNK_SB_EXIT; } head += g_block_size; slide_sz = 0; bflag = 1; } } /* this block is not duplicate */ if (bflag != 1) { block_buf[slide_sz] = buf[head]; head++; slide_sz++; if (slide_sz == g_block_size) { if (bflag != 2) md5(block_buf, g_block_size, md5_checksum); if (0 != (ret = dedup_regfile_block_process(block_buf, g_block_size, md5_checksum, fd_ldata, fd_bdata, pos, block_num, metadata, htable))) { perror("dedup_regfile_block_process in file_chunk_sb"); goto _FILE_CHUNK_SB_EXIT; } hash_checkin(g_sb_htable_crc, crc_checksum); slide_sz = 0; } } adler_pre_char = buf[head - 1]; } /* read expected data from file to full up buf */ bpos = tail - head; exp_rwsize = BUF_MAX_SIZE - bpos; adler_pre_char = buf[head - 1]; memmove(buf, buf + head, bpos); } /* last chunk */ *last_block_len = ((rwsize + bpos + slide_sz) > 0) ? rwsize + bpos + slide_sz : 0; if (*last_block_len > 0) { memcpy(last_block_buf, block_buf, slide_sz); memcpy(last_block_buf + slide_sz, buf, rwsize + bpos); } _FILE_CHUNK_SB_EXIT: lseek(fd, 0, SEEK_SET); return ret; }

　(2) 数据块指纹计算

　数据指纹是数据块的本质特征，理想状态是每个唯一数据块具有唯一的数据指纹，不同的数据块具有不同的数据指纹。数据块本身往往较大，因此数据指纹的目标是期望以较小的数据表示(如16、32、64、128字节)来区别不同数据块。数据指纹通常是对数据块内容进行相关数学运算获得，从当前研究成果来看Hash函数比较接近与理想目标，比如MD5、SHA1、SHA-256、SHA-512、为one-Way、RabinHash等。另外，还有许多字符串Hash函数也可以用来计算数据块指纹。然而，遗憾的是这些指纹函数都存在碰撞问题，即不同数据块可能会产生相同的数据指纹。相对来说，MD5和SHA系列HASH函数具有非常低的碰撞发生概率，因此通常被采用作为指纹计算方法。其中，MD5和SHA1是128位的，SHA-X(X表示位数)具有更低的碰撞发生概率，但同时计算量也会大大增加。实际应用中，需要在性能和数据安全性方面作权衡。另外，还可以同时使用多种Hash算法来为数据块计算指纹。

　(3) 数据块检索

　对于大存储容量的Dedupe系统来说，数据块数量非常庞大，尤其是数据块粒度细的情况下。因此，在这样一个大的数据指纹库中检索，性能就会成为瓶颈。信息检索方法有很多种，如动态数组、数据库、RB/B/B+/B*树、Hashtable等。Hash查找因为其O(1)的查找性能而著称，被对查找性能要求高的应用所广泛采用，Dedupe技术中也采用它。Hashtable处于内存中，会消耗大量内存资源，在设计Dedupe前需要对内存需求作合理规划。根据数据块指纹长度、数据块数量(可以由存储容量和平均数据块大小估算)可以估算出内存需求量。

　散列表(Hashtable，也叫哈希表)，是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。散列表的查找过程基本上和造表过程相同，一些关键码可通过散列函数转换的地址直接找到，另一些关键码在散列函数得到的地址上产生了冲突，需要按处理冲突的方法进行查找。详细请参考散列表设计。

4、Dedupe数据安全

　这里的数据安全包含两个层面的含义：一是数据块碰撞，二是数据可用性。这两种安全性对用户来说都是至关重要的，必须事先考虑。

　数据块指纹FP(FingerPrinter)通常使用Hash函数来计算获得，如MD5、SHA1、SHA-256、SHA-512等。从纯数学角度看，如果两个数据块指纹不同，则这两个数据块肯定不同。然而，如果两个数据块指纹相同，我们则不能断定这两个数据块是相同的。因为Hash函数会产生碰撞，山东大学的王小云教授所带领的团队已经找到快速产生碰撞的方法。但是，这种碰撞的概率是非常非常小的，小到甚至低于磁盘发生损坏的概率，因此通常近似认为：如果数据块指纹相同，则数据块相同。由于数据产生碰撞可能性的存在，Dedupe技术很少被用于关键数据存储的应用场合，一旦发生碰撞将产生巨大的经济损失。针对这种问题，目前主要有两种解决路径：一是对数据指纹相同的块进行字节级完全比较，它的难点在于数据块原始数据有时难以方便获得，另外性能会产生一定损失。本人开发的开源软件deduputil采用就是这种策略，详见deduputil数据块零碰撞算法。二是最大可能降低碰撞产生的概率，即采用更优的Hash函数（如SHA-512, SHA-1024），或者采用两种以上hash算法组合方式，这显然会对性能造成影响。本人在"数据同步算法研究"中采用的是该种方法，为每个数据块计算两个指纹，一个类似Rsync算法中的弱校验值（Rsync滚动校验算法）和一个强校验值MD5。弱校验值计算消耗远小于MD5计算量，先计算目标数据块的弱校验值，如果与源数据块不同则不必再计算其MD5校验值，相同则计算MD5并作比较。这种方式以较小的性能代价极大地降低了碰撞产生的概率，而且通过优化，性能损失无几。

　Dedupe仅保存唯一的数据副本，如果该副本发生损坏将造成所有相关数据文件不可访问，数据可用性压力要高于不作Dedupe许多。数据可用性问题可以采用传统数据保护方法来解决，常用的方式包括数据冗余(RAID1,RAID5, RAID6)、本地备份与复制、远程备份与复制、纠错数据编码技术(如海明码、信息分散算法IDA)、分布式存储技术。这些技术均可以有效消除单点故障，从而提高数据可用性。当然，这需要付出一定代价，以空间换取安全性。

5、开源软件Deduputil

　Dedup util是本人开发的一款开源的轻量级文件打包工具，它基于块级的重复数据删除技术，可以有效缩减数据存储容量，节省用户存储空间。它的主要特征如下：
　(1) 支持FSP定长分块、CDC变长分块和SB滑动块分块三种文件切分技术；
　(2) 零数据块碰撞，但损失部分性能；
　(3) 全局、源端、在线数据消重实现；
　(4) 支持数据包文件追加、删除、数据消重率统计功能；
　(5) 支持消重后数据压缩。

　Deduputil项目相关信息如下：
　(1) Soureforge项目信息：http://sourceforge.net/projects/deduputil
　(2) 介绍与使用方法：http://blog.csdn.net/liuben/archive/2010/06/02/5641891.aspx

6、扩展阅读

[1] SNIA DDSR SIG. http://www.snia.org/forums/dmf/programs/data_protect_init/ddsrsig
[2] The business value of data deduplication. http://www.snia.org/forums/dpco/knowledge/pres_tutorials/Dedupe_Business_Value_V5.pdf
[3] Evaluation criteria for data de-dupe. http://www.snia.org/forums/dmf/news/articles/DMF_DeDupe.PDF
[4] 敖莉,舒继武,李明强. 重复数据删除技术. 软件学报, 2010,5(21):pp916-929.
[5] 程菊生. 重复数据删除技术的研究. 华赛科技, 2008,4:p8-11.

Tomcat性能调优指南
文章目录一、Tomcat性能调优概述为什么需要调优Tomcat？二、Tomcat架构与性能关键点三、JVM调优1.内存配置优化2.垃圾回收优化3.其他JVM优化参数四、连接器(Connector)调优1.NIOvsAPR/Native2.高级NIO配置五、线程池优化六、会话管理优化1.会话超时配置2.会话持久化选择七、静态资源处理优化1.启用Sendfile2.配置静态资源缓存八、其他优化措施1.
equine在神经网络中建立量化不确定性 struggle2025 神经网络人工智能深度学习
一、软件介绍文末提供程序和源码下载众所周知，用于监督标记问题的深度神经网络（DNN）可以在各种学习任务中产生准确的结果。但是，当准确性是唯一目标时，DNN经常会做出过于自信的预测，并且无论测试数据是否属于任何已知标签，它们也总是进行标签预测。EQUINEwascreatedtosimplifytwokindsofuncertaintyquantificationforsupervisedlabel
Linux学习笔记：PCIe内核篇（1）：初始化与枚举流程 ZH_2025 嵌入式协议篇 PCIE
根据system.map查看内核中PCIe加载流程：root@zh-vm:~#cat/boot/System.map-5.15.0-130-generic|greppci|grepinitcallffffffff8350ff68d__initcall__kmod_pci__453_6907_pci_realloc_setup_params0ffffffff83510098d__initcall__
Vue2案例尔-尔学习笔记 vue 前端
一、自定义创建项目1、基于VueCli自定义创建项目Babel/Router/Vuex/CSS/LinterVue2.xVueRouterhash模式CSS预处理LessESlint:StandardconfigLintonSaveIndedicatedconfigfiles(配置文件所在位置)Npm2、ESlint代码规范1.认识代码规范代码规范:一套写代码的约定规则。赋值符号的左右是否需要空格
java nonematch_Java 使用anyMatch、allMatch与noneMatch方法 weixin_39680208 java nonematch
Java使用anyMatch、allMatch与noneMatch方法，用户希望确定流中是否有元素匹配Predicate，或全部元素匹配Predicate，或没有元素匹配Predicate。使用java.util.stream.Stream接口定义的anyMatch、allMatch与noneMatch方法，每种方法返回一个布尔值。Java使用anyMatch、allMatch与noneMatch
Failed to configure a DataSource: ‘url‘ attribute is not specified and no em.. 怎么可能-怎么可能 java maven zookeeper
nacos动态配置yml文件模块启动不起来报错：FailedtoconfigureaDataSource:'url'attributeisnotspecifiedandnoembeddeddatasourcecouldbeconfigured.Reason:Failedtodetermineasuitabledriverclass在启动类上加一下内容：@SpringBootApplication(
【CATIA的二次开发35】对象Selection部分属性介绍江树月华 CATIA VBA二次开发 CATIA的VBA二次开发 CATIA VBA CATIA宏 CATIA VBA
在CATIAV5的VBA开发中，Selection对象是用户交互的核心组件，用于管理用户在图形区域或特征树中的选择操作。Selection对象是CATIAVBA中的中央交互枢纽，充当用户界面与程序逻辑之间的桥梁。它代表当前在图形区域或特征树中被选中的元素集合，是自动化操作的基础。一、Selection对象属性和方法二、属性分类概览属性类型作用域主要用途ApplicationObject全局获取当前
【CATIA的二次开发36】对象Selection选择集管理部分方法介绍01 江树月华 CATIA VBA二次开发 CATIA的VBA二次开发 CATIA VBA CATIA宏 CATIA VBA
在CATIAV5的VBA开发中，Selection对象是用户交互的核心组件，用于管理用户在图形区域或特征树中的选择操作。Selection对象是CATIAVBA中的中央交互枢纽，充当用户界面与程序逻辑之间的桥梁。它代表当前在图形区域或特征树中被选中的元素集合，是自动化操作的基础。一、Selection对象属性和方法二、方法分类概览分类方法核心功能选择集管理Add,Remove,Remove2,Cl
java复习 06 im_AMBER java 开发语言学习
线程还没学会，然后查漏补缺。再学一下泛型，下一篇博客写。1线程控制方法名说明staticvoidsleep(longmillis)使当前正在执行的线程停留（暂停执行）指定的毫秒数voidjoin()等待这个线程死亡voidsetDaemon(booleanon)将此线程标记为守护线程，当运行的线程都是守护线程时，Java虚拟机将退出sleep方法的应用，这里用trycatch包围packagePT
【笔记】DIDs 去中心化身份的相关名词释义 m0_47843842 去中心化
Authenticate身份验证是一个过程（通常是某种类型的协议），通过该过程，实体可以使用一种或多种验证方法证明其具有特定属性或掌控特定秘密。对于DID，一个常见的例子是证明对与DID文档中发布的公钥相关联的私钥的控制。Decentralizedidentifier(DID)不需要中心注册机构的全球唯一持久标识符，因为它是通过加密方式生成和/或注册的。DID的通用格式在DID核心规范[DID-C
【TVM 教程】PAPI 入门
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/性能应用程序编程接口（PerformanceApplicationProgrammingInterface，简称PAPI）是一个可在各种平台上提供性能计数器的库。在指定的运行期间，性能计数器提供处理器行为的准确底层信息，包含简单的指标，如总
trycatch捕获不到的错误前端javascript
在浏览器环境的JavaScript中，try...catch是处理运行时错误的常用机制，但并非所有错误都能被其捕获。以下是无法被try...catch捕获的几类错误及其原因与解决方案：⚠️1.语法错误（SyntaxErrors）原因：语法错误发生在代码解析阶段，此时代码尚未执行，try...catch无法捕获。示例：try{consta=;//缺少赋值表达式}catch(e){console.lo
实战｜StarRocks 通过 JDBC Catalog 访问 MongoDB 的数据
方案介绍本文档介绍如何通过StarRocks的JDBCCatalog功能，结合MongoDBBIConnector，将MongoDB数据便捷接入StarRocks，实现数据打通和SQL查询分析，以下是整体流程图。前提条件StarRocks环境：版本≥3.0，支持JDBCCatalog功能。MongoDBBIConnector：已安装并运行，版本需与MongoDB兼容（参考MongoDB官方文档）。
【保姆级】新机器部署Nacos 猫学学先安装再开始表演 java 数据库开发语言
1、登录服务器，如果非root用户则切root用户sudosu-2、在/usr/tmp目录上传nacos安装包3、将安装包移到/usr/local/目录mvnacos-server-2.0.3.tar.gz/usr/local/4、解压tar-zxvfnacos-server-2.0.3.tar.gz5、创建nacos数据库，执行官网SQL建库建表cat/usr/local/nacos/conf/
MCP+A2A：从实验室到生产环境的落地之旅 CarlowZJ AI应用落地+MCP+A2A 数据库 MCP+A2A
目录摘要一、引言二、MCP与A2A概念讲解（一）MCP（ModelContextProtocol）（二）A2A（Application-to-Application）（三）MCP与A2A的融合三、MCP+A2A技术架构图与工作流程图（一）整体架构图（二）工作流程图四、MCP+A2A代码示例（一）基于Python的MCP+A2A通信示例（二）基于Java的MCP+A2A应用集成示例五、MCP+A2A
宝塔+fastadmin：给项目添加定时任务+log日志自定义添加 25号底片~ php 后端配置（宝塔）php
一、定时任务脚本编写1.使用shebang声明执行器#!/usr/bin/envphp这是Unix/Linux系统中脚本文件的标准开头。表示这个脚本使用系统环境变量中的php来执行。2.定义ThinkPHP入口路径并加载框架define('APP_PATH',__DIR__.'/../../application/');require__DIR__.'/../../thinkphp/start.p
【Java从入门到放弃之 ConcurrentModificationException】 ThetaarSofVenice #Java从入门到放弃 java 开发语言
ConcurrentModificationExceptionConcurrentModificationException探索ConcurrentModificationException解决问题总结ConcurrentModificationExceptionConcurrentModificationException是Java中的一种运行时异常，通常发生在使用迭代器遍历集合（如ArrayL
苍穹外卖Day07 guslegend windows
缓存菜品问题用户端小程序展示的菜品数据都是通过查询数据库获得，如果用户端访问量比较大，数据库访问压力随之增大。结果：系统响应慢、用户体验差解决方案通过Redis来缓存菜品数据，减少数据库查询操作缓存逻辑分析：每个分类下的菜品保存一份缓存数据数据库中菜品数据有变更时清理缓存数据DishController代码改写(用户端)publicResult>list(LongcategoryId){//构造r
建议是先把base完全搞懂 weixin_47868976 Web云存储项目网络
并发编程日志系统啥的我只了解了一点点直接从网络层入手这个项目可行么？底层base模块没搞懂从web开始合理么？你的担心很有道理！让我来分析一下学习路径的可行性，并给你一个合理的学习建议。一、项目依赖关系分析1.模块依赖层次application/(应用层)↓强依赖net/(网络层)↓强依赖base/(基础层)↓强依赖系统调用(LinuxAPI)2.具体依赖关系Rantool从依赖分析可以看出，网络
python爬取京东图片通信小小白 python 爬虫 python 爬虫图片
网上的淘宝爬取图片的代码一般都已经不能实际运行了，在查看淘宝网源代码是找不到图片源地址，估计采取了反爬技术。又去京东看了下，发现很容易爬取。根据下面网址构建urlhttps://list.jd.com/list.html?cat=670%2C671%2C1105&go=0https://list.jd.com/list.html?cat=670,671,1105&page=2&sort=sort_
H265 Intro - General Concepts fanbird2008 Stream Media Stream Media/HEVC/H265 hevc
http://www.f265.org/f265/static/txt/h265_companion.htmlH.265CompanionPurposeandorganizationofthisdocumentThisdocumentcontainshuman-readableinformationaboutthemorecomplexpartsoftheH.265specification.It
半导体FAB中的服务器硬件故障监控与预防全方案：从预警到零宕机实战爱吃青菜的大力水手服务器运维半导体 FAB运维 IT运维
服务器硬件故障监控与预防全方案：从预警到零宕机实战关键词：SMART监控RAID预警IPMI传感器性能基线PrometheusZabbix高可用架构一、硬件故障前的7大预警信号（附关联工具）故障类型关键指标监控工具预警阈值磁盘故障Reallocated_Sector_Countsmartctl+smartd>0立即告警Current_Pending_SectorPrometheus+NodeExp
MySQL常用函数性能优化及索引影响分析 Hai－W 数据库 mysql 性能优化数据库 sql
MySQL常用函数性能优化指南（含索引影响分析）以下是MySQL函数使用指南，新增性能影响评级、索引失效分析和优化方案，帮助您高效使用函数：一、字符串处理函数（含性能分析）函数示例性能影响索引影响优化建议CONCAT()SELECTCONCAT(first_name,last_name)FROMusers;⭐⭐❌导致全扫描存储计算列：ALTERTABLEusersADDfull_nameVARCH
iOS 应用安全加固指南：通过 IPA 混淆与防破解技术实现全面防护 00后程序员张 http udp https websocket 网络安全网络协议 tcp/ip
在现代移动应用开发中，安全性已不再是一个可以忽视的领域。随着黑客技术的日益成熟以及用户对隐私保护的重视，开发者必须将安全性嵌入到应用的每一个开发环节中，而不仅仅是在开发的后期进行加固。尤其是对于那些涉及用户数据、支付信息等敏感内容的应用，确保应用的安全性是至关重要的。本文将介绍iOS应用开发中的安全实践，并结合具体的安全加固技术，如使用IpaGuard、Obfuscator-LLVM，从应用的设计
关于插件参数传递 harmonyos
关于插件参数传递按照以前的习惯，dart端传递map参数，原生端根据map解析参数。但由于ts支持将字符串直接转换成对应的interface，那么我们可以将dart的端的参数。参数定义比如geolocator_ohos中的CurrentLocationSettingsOhos在dart端的实现为如下:MaptoMap(){return{if(priority!=null)'priority':pr
解决报错：org.apache.catalina.connector.ClientAbortException: java.io.IOException: Broken pipe 天黑请闭眼 Java异常处理 java
目录一、场景二、报错信息三、原因四、解决一、场景1、前端调用后端接口报错2、接口功能为导出excel二、报错信息org.apache.catalina.connector.ClientAbortException:java.io.IOException:Brokenpipeatorg.apache.catalina.connector.OutputBuffer.realWriteBytes(Out
Aop和Ioc有什么关系？（面试简洁版）乞讨不是罪过面试 java 职场和发展
AOP（面向切面编程）和IoC（控制反转）是Spring框架的两大核心，它们既独立又协作，共同实现松耦合、可扩展的架构设计。以下是它们的核心关系基础关系1.IoC是基石：Spring通过IoC容器（如ApplicationContext）统一管理所有Bean（包括普通业务Bean和AOP代理对象）。没有IoC，AOP无法自动生效。2.AOP是增强：AOP基于IoC管理的Bean，通过动态代理（JD
基于springboot的社会志愿者管理系统 QQ242219979 spring boot 后端 java
目录部分效果实现截图本系统介绍关于我开发技术详细介绍开发思路核心代码参考示例基于springboot的社会志愿者管理系统论文提纲参考系统测试源码获取详细视频演示或者查看其他版本：文章底部获取博主联系方式！部分效果实现截图本系统介绍基于springboot的社会志愿者管理系统采用的开发工具：IntelliJIDEA，VScode；数据库管理软件：Navicat；服务器运行平台：Tomcat；开发技术
linux驱动开发（20）-DMA（四） yyc_audio linux驱动开发驱动开发 linux 服务器
分散/聚集映射分散/聚集映射通过将虚拟地址上分散的DMA缓冲区通过一个类型为structscatterlist的数组或者链表组织起来，然后通过一次的DMA传输操作在主存RAM与设备之间传输数据，如图所示：图中显示了主存中三个分散的物理页面与设备之间进行的一次DMA传输时分散/聚集映射示意，其中单个物理页面与设备之间可以看做是一个单一的流式映射，每个这样的单一映射在内核中有数据结构structsca
sentinel 自定义 dashboard 用户名密码运维阿峰 sentinel sentinel python 开发语言
默认情况下，sentineldashboard用户名密码为sentinel/sentinel，这里我使用重写镜像的方式：//定义Dockerfile$catDockerfile#基于现有SentinelDashboard镜像FROMbladex/sentinel-dashboard:1.8.4#重新定义ENTRYPOINT，确保参数顺序正确ENTRYPOINT["java","-Djava.sec
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n

重复数据删除(De-duplication)技术研究

你可能感兴趣的:(cat)