hellopbc

CD-HIT

文章目录

CD-HIT
- ref
- 介绍
- 算法原理
- - 索引表
  - Short word filter
  - 短词统计
  - Banded alignment
  - 算法限制
- PSI-CD-HIT
- 在线服务器
- 离线安装
- 工具使用方式
- - CD-HIT-EST
  - - 参数
    - 示例
  - CD-HIT-EST-2D
Gclust
CD-HIT-EST实验

CD-HIT

CD-HIT is a very widely used program for clustering and comparing protein or nucleotide sequences.

主要用于基因序列根据阈值去重

ref

官方：

CD-HIT 官网

github CD-HIT

cdhit-web-server

github-wiki-cdhit

最完善的介绍，包含算法、安装、用户指导、web服务器、使用案例、CD_HIT_OTU_MiSeq

资料：

CD-HIT的使用

介绍

github-wiki-cdhit

Currently, CD-HIT package has many programs: cd-hit, cd-hit-2d, cd-hit-est, cd-hit-est-2d, cd-hit-para, cd-hit-2d-para, psi-cd-hit, cd-hit-454, cd-hit-dup, cd-hit-lap, cd-hit-otu, etc. There are also many utility scripts, written in Perl, to help run and analyze CD-HIT jobs. Briefly:

  * cd-hit	        Cluster peptide sequences	
  * cd-hit-est	        Cluster nucleotide sequences
  * cd-hit-2d	        Compare 2 peptide databases	
  * cd-hit-est-2d	Compare 2 nucleotide databases
  * psi-cd-hit	        Cluster proteins at <40% cutoff	
  * cd-hit-lap	        Identify overlapping reads
  * cd-hit-dup          Identify duplicates from single or paired Illumina reads	
  * cd-hit-454          Identify duplicates from 454 reads 
  * cd-hit-otu	        Cluster rRNA tags	
  * cd-hit Web server	Cluster user-uploaded data 
  * cd-hit-para         Cluster sequences in parallel on a computer cluster	
  * scripts             Parse results and so on
  * h-cd-hit            Hierarchical clustering

算法原理

github-wiki-cdhit：里面有7篇论文说了这个

CD-HIT的使用：中文原理

采用贪婪增量聚类方法[a greedy incremental clustering approach]；

将基因序列从长到短排序；

第一条最长的那条序列自动归为一类，作为第一簇具有代表性的序列；

剩余的每条序列和找到的代表性序列做比较，根据它是否与现有代表序列之一相似来分类为冗余或代表；

快速模式下（默认）

序列只和每个簇里的第一条代表序列（最长的）做比较
准确模式下

序列会和每个聚类中的所有序列进行比较然后决定是成为新的一类（簇）还是归为其中的一类中
参数是-g

索引表

对kmer使用维一的索引表，就是每个kmer都有一个维一的索引，加快运算。

In CD-HIT, we use k=2~5 for proteins and k=8~12 for DNAs, because the all the k-mers can be indexed in computer memory.

Short word filter

短词过滤器

具有一定同一性的两个序列一定共享一定数量的同一的k-mers;

通过统计共有的kmers，两个序列的同一性会在某一截断值(cutoff)之下；

这个过滤器检查这些共同的k-mers和拒绝不必要的比对(alignments)

短词统计

短词过滤器高效的重点所在。

通过对真实比对(alignments)的统计分析，确定了常见k-mer在不同序列长度和同一性下的分布，并将结果应用于短词过滤。

Banded alignment

短词过滤器不仅过滤掉了不必要的比对，当需要比对时，它还识别了带状动态规划比对的窄带，这比常规的动态规划要快得多。

算法限制

主要是两点：

阈值，不能低于40%
序列长度

A limitation of short word filter is that it can not be used below certain clustering thresholds. For proteins:

  word size 5 is for thresholds 0.7 ~ 1.0
  word size 4 is for thresholds 0.6 ~ 0.7
  word size 3 is for thresholds 0.5 ~ 0.6
  word size 2 is for thresholds 0.4 ~ 0.5 (also see psi-cd-hit)

For DNAs:

Choose of word size:
-n 5 for thresholds 0.7 ~ 1.0
-n 4 for thresholds 0.6 ~ 0.7
-n 3 for thresholds 0.5 ~ 0.6
-n 2 for thresholds 0.4 ~ 0.5

Because of the algorithm, cd-hit may not be used for clustering proteins at <40% identity. Cd-hit-est cannot cluster very long sequences either (e.g. genome sized sequences). In such cases, please use PSI-CD-HIT, which will be introduced in following sections.

cd-hit 只能完成在40%以上的序列相似性的聚类，假设要将阈值设置为30%的相似性则需要两次聚类并使用psi-cd-hit.pl 脚本才能完成

PSI-CD-HIT

github 包含install和usage

对蛋白质支持**截断值（-c）低于40%**的情况

psi-cd-hit完成小于40%的蛋白质相似性聚类

在Hierarchical clustering中使用：

通过 CD-HIT 的多步迭代运行，您可以在邻接方法中执行聚类，从而生成层次结构。第三步使用 psi-cd-hit，详见 psi-cd-hit 部分。

这种方式比一步聚类更快。它也可以更准确。

一步聚类存在问题。两个非常相似的序列 A 和 B 可以聚集成不同的簇。例如，设聚类阈值为 60%，IAB（AB 的同一性）=95%，IAC ≥ 60%，但 IBC < 60%。如果 C 首先被选为集群代表，那么 A 将在集群“C”中，但“B”不会，导致几乎相同的 AB 位于不同的集群中。层次聚类将减少这个问题。

PSI-CD-HIT 以非常低的阈值聚集蛋白质，它还通过 blastp、blastn 和 metablast 聚集长 DNA 序列。 PSI-cd-hit 是一个 Perl 脚本，它运行类似于 CD-HIT 的增量算法，但使用 BLAST 来计算相似度。Below are the procedures of PSI-CD-HIT:

Sort sequences by decreasing length
First one is the first representative
Using 1st one blast all remaining sequences, pick up its neighbors that meet the clustering threshold
Repeat until done

在线服务器

cd-hit
cd-hit**-est**
**h-**cd-hit
**h-**cd-hit-est
cd-hit**-2d**
cd-hit-est**-2d**

cd-hit：处理蛋白质（肽 peptide），将满足相似性阈值（通常是序列同一性）的蛋白质聚集在一起。

input：fasta格式的蛋白质数据集
return：生成一个代表序列的 fasta 文件和一个簇列表的文本文件

cd-hit-est：同上，但处理的是核苷酸，且不能用于非常长的序列，如全基因组。

h-...：多个...运行。首先以高同一性（如 90%）聚集，非冗余序列进一步以低同一性（如 60%）聚集。第三个集群可以以较低的身份执行。多步运行比单步运行更高效、更准确。

...-2d：比较两个数据集。它识别 db2 中在某个阈值处与 db1 相似的序列。同样，cd-hit-est-2d不适用于非常长的序列。

input：fasta格式的两个数据集
return：db2 中与 db1 不相似的蛋白质的 fasta 文件和列出 db1 和 db2 之间相似序列的文本文件

离线安装

github install

支持conda install

conda install -c bioconda cd-hit

工具使用方式

github userGuide

CD-HIT-EST

github_CD-HIT-EST

bilibili 演示视频

输入冗余序列的fasta文件，输出非冗余的fasta文件

参数

-i 输入文件，fasta格式的序列

-o 输出文件路径和名字

-c 相似性（clustering threshold）。default 0.9，0.9表示相似性大于等于90%的为一类

-n 两两序列进行序列比对时选择的 word_length,default=5

-d 0表示使用 fasta 标题中第一个空格前的字段作为序列名字,default=20

-M 程序内存限制(M)。default 800; 0 for unlimitted；

-T 使用的线程数。default 1; with 0, all CPUs will be used

-g 1 or 0, default 0。通过 cd-hit 的默认算法，将一个序列聚类到第一个满足阈值的聚类（快速聚类）。如果设置为 1，程序会将其聚类到满足阈值（准确但慢模式）的最相似的集群中，但 1 或 0 不会改变最终集群的代表。

-g	1 or 0, default 0
 	by cd-hit's default algorithm, a sequence is clustered to the first 
 	cluster that meet the threshold (fast cluster). If set to 1, the program
 	will cluster it into the most similar cluster that meet the threshold
 	(accurate but slow mode)
 	but either 1 or 0 won't change the representatives of final clusters

示例

CD-HIT的使用

cd-hit-est -i est_human -o est_human95 -c 0.95 -n 10 -d 0 -M 16000 - T 8 # cd-hit-est的使用,用于核酸序列聚类

-n 10, 11 for thresholds 0.95 ~ 1.0
-n 8,9 for thresholds 0.90 ~ 0.95
-n 7 for thresholds 0.88 ~ 0.9
-n 6 for thresholds 0.85 ~ 0.88
-n 5 for thresholds 0.80 ~ 0.85
-n 4 for thresholds 0.75 ~ 0.8

cd-hit-est -i est_human -o est_human70 -c 0.7  -d 0 - T 8 # cd-hit-est的使用,用于核酸序列聚类

CD-HIT-EST-2D

Gclust

paper

Gclust是一种用于聚类非常长的微生物基因组序列的新工具。

CD-HIT-EST实验

fasta文件顺逆序对结果的影响

操作：将数据顺序排列和逆序排列

结果：得到的结果不一致
采用快速算法和准确算法对结果的影响

操作：使用-g 0和-g 1

结果：没发现改变
分段执行和统一执行对结果的影响

操作：全部数据一次性做cd-hit和数据拆分后做数次ch-hit

结果：拆分的得到的结果冗余度更高

你可能感兴趣的:(bioinfo,生物信息,cd-hit,序列去冗余,核苷酸,蛋白质)

Cache与DB的数据一致性（缓存更新设计模式和操作顺序）
description:总结Cache与DB的数据一致性相关内容。缓存一致性的三个障碍当对主数据库的更改未反映在缓存中时更新缓存结果时出现延迟当缓存节点之间不一致时如何设计缓存更新模式？首先，提出我阅读相关文章时遇到的疑惑。当我使用搜索引擎（百度orGoogle）去搜索缓存与数据库的数据一致性如何保证时,我会看到三种结果：仅讲解先操作数据库or先操作缓存（最多）讲解四种缓存更新策略模式将上述两者结
reactor-test lang20150928 reactor java
在Reactor中，reactor-test是一个专门用于测试的工具库，它提供了多种功能来帮助开发者验证响应式流的正确性和可靠性。根据我搜索到的资料，reactor-test的三个主要用途可以总结如下：1.使用StepVerifier按步骤验证序列StepVerifier是reactor-test的核心接口之一，它允许你定义和验证响应式序列的每一步行为。你可以通过expectNext、expect
003-128 最长连续序列 Ernest_NEU 算法 leetcode
题目我的思考+word题解题解题解思路classSolution{publicintlongestConsecutive(int[]nums){SetnumSet=newHashSet<>();for(intnum:nums){numSet.add(num);}intmaxLength=0;for(intnum:numSet){if(!numSet.contains(num-1)){intcurN
Django REST framework - 序列器关系 djangopython
简介数据结构而非算法是编程的核心。—RobPike关系字段用于表示模型间的关系。它们可以应用于ForeignKey、ManyToManyField和OneToOneField关系，以及反向关系和自定义关系（如GenericForeignKey）。注意：关系字段在relations.py中声明，但按照惯例，应从serializers模块导入，使用fromrest_frameworkimportser
Flutter Dart Macro 宏简化 JSON 序列化独立开发者_猫哥 Flutter技巧 flutter json
FlutterDartMacro宏简化JSON序列化视频https://youtu.be/gBZYjBmoOcUhttps://www.bilibili.com/video/BV1tT421a7ev/前言原文https://ducafecat.com/blog/using-dart-macros-to-simplify-json-serialization今天我们将会体验dart语言新特性macr
mac安装linux时触控板不能用,苹果笔记本安装Win10触摸板右键无法使用的处理方法... 旁间拓式
一位用户反馈自己在苹果笔记本MacBookair上安装了Windows10系统，可是后面发现触摸板右键根本无法使用，这是怎么回事呢？其实，这个是和苹果笔记本安装win7时的设置一样的，我们需要在BootCamp中进行设置。接下来，就随小编一起看看具体方法吧！方法如下：1、首先你确定已经安装过BootCamp,如果没有去苹果官方下载相应版本BootCamp下载(注意按机型下载)。如果已经安装过，那么
LeetCode第300题_最长递增子序列 @蓝莓果粒茶算法 leetcode 算法职场和发展学习 c#游戏 python
LeetCode第300题：最长递增子序列文章摘要本文详细解析LeetCode第300题"最长递增子序列"，这是一道考察动态规划和二分查找的中等难度题目。文章提供了动态规划和贪心+二分查找两种实现方案，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合学习动态规划和二分查找的读者。核心知识点：动态规划、二分查找、贪心算法难度等级：中等推荐人群：具备基础算法知识，想要提升
Python二分查找库bisect 来个大包的二重积分编程基础 python 算法排序算法
找暑期实习的时候做到某厂的笔试题里面用到这个，就总结一下。。。1.bisect_left(a,x,lo=0,hi=len(a))功能：在已排序序列a中查找元素x应该插入的位置，并返回最左侧的插入位置（index啊）。区别：如果有多个相同元素，bisect_left返回最左侧的插入位置。默认情况下，查找范围是整个序列a，但可以通过lo和hi参数来限制查找范围。2.bisect_right(a,x,l
深入理解Tomcat类加载器：为何打破双亲委派模型？一休哥助手 java 工具 tomcat java
引言Java作为一种广泛使用的编程语言，其类加载器在应用程序的运行和部署过程中起着至关重要的作用。类加载器负责在运行时动态地加载Java类文件到JVM中，使得Java的灵活性和动态性得以实现。但为了保证安全性和避免重复加载，Java引入了双亲委派模型作为其类加载机制的核心。双亲委派模型是Java类加载器机制的基石，它遵循一个简单的原则：当一个类加载器收到类加载请求时，它首先不会自己去尝试加载这个类
2025 华为OD机试 B卷 - 考勤信息 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025B卷华为OD机试2025B卷华为OD机试
考勤信息华为OD机试2025B卷真题目录:点击去查看华为OD2025B卷100分题型题目描述公司用一个字符串来表示员工的出勤信息absent：缺勤late：迟到leaveearly：早退present：正常上班现需根据员工出勤信息，判断本次是否能获得出勤奖，能获得出勤奖的条件如下：缺勤不超过一次；没有连续的迟到/早退；任意连续7次考勤，缺勤/迟到/早退不超过3次。输入描述用户的考勤数据字符串记录条
数据分析与做菜的关系，makedown 过期的秋刀鱼！数据分析数据挖掘数据分析小白 markdown 数据可视化 powerbi 数据分析流程
#数据分析就像做一道菜##1️⃣明确需求例子：今天想做**"番茄炒蛋"**✅对应分析：老板要看**"上个月哪些商品最赚钱"**##2️⃣拆解需求例子：做番茄炒蛋需要**番茄2个+鸡蛋3个+盐糖少许**（步骤：先炒蛋→再炒番茄→混合）✅对应分析：需要**销售表（含成本/售价）+商品名称表**→先算利润→再排名##3️⃣数据准备例子：**去菜市场买番茄、鸡蛋**✅对应分析：从财务系统**导出销售Exc
回归预测 | MATLAB实现LSTM-SVR(长短期记忆神经网络-支持向量机)多输入单输出 matlab科研社神经网络回归 matlab
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍长短期记忆神经网络(LSTM)作为一种循环神经网络(RNN)的变体，擅长处理序列数据并捕捉长期依赖关系，而支持向量机(SVR)则是一种强大的回归算法，能够有效地处理高维数据并防止过拟合。将两者结合的LSTM
Python @dataclass 装饰器详解添财小哥 python 开发语言
1.用途和主要功能@dataclass是Python3.7引入的一个装饰器（位于标准库dataclasses模块中），用于简化“纯数据”类的定义。它自动为类生成常用的特殊方法（如init、repr、eq等），避免手动编写冗余模板代码。这样定义的数据类在代码量和可读性上都有显著优势，如便于维护、减少错误。使用@dataclass后，我们“可以直接创建和操作对象，而无需手动编写这些基础方法”。总体而言
leetcode:1218. 最长定差子序列 uncle_ll 编程练习-Leetcode leetcode 算法最长定差子序列动态规划 1218
题目来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/longest-arithmetic-subsequence-of-given-difference给你一个整数数组arr和一个整数difference，请你找出并返回arr中最长等差子序列的长度，该子序列中相邻元素之间的差等于difference。子序列是指在不改变其余元素顺序的情况下，通过
[Leetcode] 594. 最长和谐子序列 java 哈希表 niceHou666 Leetcode leetcode java 哈希表
和谐数组是指一个数组里元素的最大值和最小值之间的差别正好是1。现在，给定一个整数数组，你需要在所有可能的子序列中找到最长的和谐子序列的长度。示例1:输入:[1,3,2,2,5,2,3,7]输出:5原因:最长的和谐数组是：[3,2,2,2,3].思想：哈希表，求map.get(nums[i])和map.get(nums[i+1])的最大和classSolution{publicintfindLHS(
colour-demosaicing：实现多款CFA去马赛克算法的Python开源包常琚蕙
colour-demosaicing：实现多款CFA去马赛克算法的Python开源包colour-demosaicingCFA(ColourFilterArray)DemosaicingAlgorithmsforPython项目地址:https://gitcode.com/gh_mirrors/co/colour-demosaicing项目介绍在数字图像处理领域，马赛克效应（Mosaicing）是
数据库Mysql基础------第一部分数据的准备与基础命令 Judy~judy 数据库数据库 mysql
一、初识数据库一、为什么要用数据库？数据库（Database）是按照数据结构来组织、存储和管理数据的仓库数据库随时随地的存在，并且使用，简单的说，数据库就是收集数据的结构。数据涉及很多，例如一个产品属于种类，并且有自己的数据标签，这就是为什么要用关系型数据。在关系数据库，我们建模数据包括产品，品类，标签等等，所有这些都用一个表格，包含行和列，就像Excel中的电子表格。从文件中读取数据的反序列化操
C#索引和范围：简化集合访问的现代特性详解阿蒙Armon C#工作中的应用 c#开发语言
C#索引和范围：简化集合访问的现代特性详解在C#8.0中引入的索引（Index）和范围（Range）特性，为集合元素的访问提供了更简洁、直观的语法。无论是数组、列表还是字符串，这些特性都能大幅简化获取元素或子序列的代码，使开发者能够更专注于业务逻辑而非边界计算。本文将全面解析索引和范围的工作原理、使用方法及实战技巧，帮助你彻底掌握这一现代C#特性。一、索引：超越传统下标的访问方式传统上，C#通过从
Java面试题专项（Redis篇）嗨，正在熬夜的你面试部分 java redis 开发语言
1.什么是缓存穿透？怎么解决？答：缓存穿透是指查询一个一定不存在的数据（例：假设数据库只有用户1-1000的信息，黑客一直请求用户ID=99999，每次都查DB，DB扛不住。），由于存储层查不到数据因此不写入缓存，这将导致这个不存在的数据每次请求都要到DB去查询，可能导致DB挂掉。这种情况大概率是遭到了攻击。通常都用布隆过滤器（提前用布隆过滤器存储所有存在的key。查询前先查布隆过滤器，不存在的直
Golang-数组和切片的区别星雨丶阿 golang 算法 golang
在Golang中，数组和切片是两种不同的数据类型，它们在使用方式和特性上有一些区别。1.基本概念数组是一组固定长度的元素序列，它的长度是在定义时就确定了，而且数组的每个元素的类型必须相同。数组的声明方式为：var数组名[元素个数]元素类型。例如：定义一个包含5个整数的数组：vararr[5]int切片是一个动态数组，它可以根据需要动态增加或缩减长度，而且切片的元素类型可以是任意类型。切片的声明方式
python序列化工具_python_restframework(序列化) weixin_39623271 python序列化工具
django自带的序列化工具serializers三步骤导入fromdjango.coreimportserializers生成对象并传参response=serializers.serialize('json',book_list)第一个json是解析器，说明要解析成json格式的字符串,第二个是queryset对象,最后返回结果returnJsonResponse(response,safe=
Python大数据分析&人工智能教程 - Django-RestFramework框架（深入解析+实操案例） AI_DL_CODE python 数据分析 django RestFramework框架
文章目录1.Django-RestFramework基础1.1Django-RestFramework概述1.2安装与配置1.3构建第一个API1.3.1定义模型1.3.2创建序列化器1.3.3定义视图1.3.4配置URL路由1.4进阶功能1.4.1权限控制1.4.2限流1.5实战案例1.5.1创建图书1.5.2查询图书1.5.3更新图书1.5.4删除图书2.序列化器(Serializers)2.
Golang中的数组 white.tie Golang golang 开发语言后端
GolangArray和以往认知的数组有很大不同。有点像Python中的列表1.数组：是同一种数据类型的固定长度的序列。2.数组定义：vara[len]int，比如：vara[5]int，数组长度必须是常量，且是类型的组成部分。一旦定义，长度不能变。3.长度是数组类型的一部分，因此，vara[5]int和vara[10]int是不同的类型。4.数组可以通过下标进行访问，下标是从0开始，最后一个元素
突发！微信链接被拦截？微信内打不开，已停止访问该怎么办？提示复制去浏览器打开？小北网络知识分享链接问题微信计算机网络开发语言网络安全
精心制作的营销链接刚分享到微信群，瞬间弹出「已停止访问该网页」的提示？数据显示，2025年上半年微信拦截违规链接超2亿条，其中60%的运营者因不了解规则导致解封失败。别慌！本文结合最新政策与实战案例，手把手教你快速定位问题、72小时高效解封，并建立长效防封机制。一、拦截真相：微信系统紧盯的5大「高危行为」微信的智能拦截系统基于内容安全、技术合规、用户反馈三大维度，以下行为极易触发「红色警报」：1.
1、快速上手 [代码级手把手解析diffusers库] Yuezero_ AIGC 人工智能深度学习
快速上手Pipeline内部执行步骤后续更新计划diffusers是HuggingFace推出的一个diffusion库，它提供了简单方便的diffusion推理训练pipe，同时拥有一个模型和数据社区，代码可以像torchhub一样直接从指定的仓库去调用别人上传的数据集和pretraincheckpoint。除此之外，安装方便，代码结构清晰，注释齐全，二次开发会十分有效率。diffusers使用
学习如何让STM32在运行时改变PWM频率和占空比 ZERONG_H 嵌入式 stm32 嵌入式硬件单片机
前言最近有个需求是关于调节占空比去控制风扇实现三挡风力大小的。由于硬件供电和控制成本等原因，普通的芯片支撑不起几个风扇同时转起来，于是就沿用了一个神奇的电路方案，但是这个方案在输出占空比的时候达不到真正的占空比（这里解释不清），因为电机类需要特别注意频率的大小，频率太高或者太低或多或少都会让人耳接受不了，反正是需要在运行时同时改变PWM频率和占空比，本文着重于应用，不讲原理。一、定时器介绍使用的是
Django REST framework - 验证器 pythondjango
验证器可以用于在不同类型字段之间重用验证逻辑。大多数情况下，您在处理RESTframework中的验证时，仅依赖默认字段验证，或编写序列化器或字段类的显式验证方法即可。但是，有时您可能希望将验证逻辑放置在可重用的组件中，以便在代码库中轻松地重复使用。这可以通过使用验证器函数和验证器类来实现。RESTframework中的验证DjangoRESTframework序列化器中的验证与Django的Mo
LabVIEW荧光微管图像模拟 LabVIEW开发 LabVIEW开发案例 LabVIEW设备控制 LabVIEW知识 LabVIEW程序 LabVIEW开发案例 LabVIEW知识
利用LabVIEW平台，集成PI压电平台、Nikon荧光显微镜及AndorsCMOS相机等硬件，构建荧光微管滑行实验图像序列模拟系统。通过程序化模拟微管运动轨迹、荧光标记分布及显微成像过程，为生物医学领域微管跟踪算法测试、运动特性分析提供标准化仿真环境，解决传统实验中手动跟踪效率低、误差大及硬件漂移等问题。应用场景科研算法验证：高校及科研机构用于验证微管跟踪软件（如MTrack2）在不同运动轨迹下
FHQ无旋平衡树可持久化详解 xwztdas 线段树/平衡树 FHQ Treap 平衡树数据结构可持久化
引入在上一篇题解，我们研究了FHQ实现维护有序序列与区间翻转，在这一篇题解，我们将要探讨关于FHQ实现可持久化的操作。例题洛谷P3835【模板】可持久化平衡树由题目可得这显然必须使用可持久化，我们先了解一下什么是可持久化。可持久化定义可持久化是指一个数据结构在修改操作（如插入、删除、更新）后，仍然保留其修改前的版本，并且能够同时访问修改前和修改后的所有历史版本。他的关键特征如下：保留历史版本：每次
YOLOv10 全面升级解析：关键改进点一文掌握要努力啊啊啊计算机视觉 YOLO 目标跟踪人工智能目标检测深度学习
✅YOLOv10改进点详解一、前言YOLOv10是由Ultralytics团队在2024年提出的新一代目标检测模型，在保持高精度的同时进一步优化了部署效率和推理速度。它的核心改进包括：改进方向内容✅非解耦头轻量化设计消除非必要分支，减少冗余计算✅Anchor-Free模式默认启用，无需手动设置anchor✅TAL+DFLLoss提升边界框回归质量✅多任务统一接口detect/segment/pos
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他