E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
cd-hit
如何删除有90%以上一致性的序列
如何删除有90%以上一致性的序列学习是个漫长的过程,每次遇到不会的总想要把它收藏起来,今天就是碰到了不熟悉的
CD-HIT
,就各种百科,各种查找资料,就随手把笔记记录下来,方便日后和大家交流学习。
天明豆豆
·
2024-01-09 18:40
cdhit工具的使用方法
cd-hit
:是一种贪婪的增量聚类方法,首先对输入的序列根据序列的长短进行排序,并从最长到最短的顺序处理它们。
灰太狼家的小鸭子
·
2023-07-28 12:25
生物信息学知识
机器学习
人工智能
CD-hit
安装及使用
cd-hit
是用于蛋白质序列或核酸序列聚类的工具,根据序列的相似度对序列进行聚类以去除冗余的序列,一般用于构建非冗余的数据集用于后续的实验分析。
喜欢吃土豆的彭某人
·
2023-04-07 10:45
CD-HIT
去除冗余序列
1、简介
CD-HIT
是用于蛋白质序列或核酸序列聚类的工具,根据序列的相似度对序列进行聚类以去除冗余的序列,一般用于构建非冗余的数据集用于后续的实验分析。
xiaobai1_1
·
2023-01-29 21:22
CD-HIT
的使用
据说Uniprot的UniRef数据集就是由
CD-HIT
创建的。首先是官方介绍:
CD-HIT
是一个非常广泛使用的
拾年如一
·
2023-01-29 21:22
生物信息学
生物信息学
教程 | 如何用
cd-hit
去除冗余序列?
0.简介生信分析中经常要根据指定条件查找相似序列,比如构建多个样品间的非冗余基因集、分析样品间的相似程度等等,
cd-hit
这款软件就可以用较短的时间解决此类问题,可以对单个数据集进行去冗余,包括DNA/
ypfzhao
·
2023-01-29 21:21
生物信息
蛋白质多序列
CD-HIT
处理
db=Protein,上传文件,点击RETRIEVE按钮开始匹配3:点击右上角SENDTO:选项进行下载,注意选择保存格式(保存为FASTA格式)4:打开
CD-HIT
官网http://weizhongli-lab
LostWinds_0401
·
2023-01-29 21:51
linux
cd-hit
下载安装,教程 | 如何用
cd-hit
去除冗余序列?
原标题:教程|如何用
cd-hit
去除冗余序列?生信分析中经常要根据指定条件查找相似序列,比如构建多个样品间的非冗余基因集、分析样品间的相似程度等等,
cd-hit
这款软件就可以用较短的时间解决此类问题。
按剑四顾
·
2023-01-29 21:51
linux
cd-hit下载安装
linux
cd-hit
下载安装,
CD-HIT
学习
CD-hit
参数解读-i设置输入文件-o设置输出文件,可以将每次分析的ID阈值放到名称中,方便以后使用,如clean90,就是被清洗后,使用-c0.90的分析结果-c设置ID阈值-n在ID各个范围内,作者给了一些设置
崲峰
·
2023-01-29 21:21
linux
cd-hit下载安装
cd-hit
linux,使用
cd-hit
对蛋白质或核酸序列进行聚类
cd-hit
聚类算法通常来说,根据序列相似度对序列进行聚类,首先想到的可能是通过计算两两序列之间的相似度对序列进行聚类,这样需要进行allbyall的比较,相对来说比较费时,而
cd-hit
软件可以避开allbyal
王知遇
·
2023-01-29 21:21
cd-hit
linux
linux文件cd小工具,科学网—关于Linux系统
cd-hit
软件和probcons软件的解析 - 陈振玺的博文...
cd-hit
软件是华人科学家WeizhongLi开发的一个快速去除冗余序列的软件,不仅速度快且准确度高,至于软件的详细介绍,科学网博主高山流水已在其博客中做了介绍(address:http://blog.sciencenet.cn
falsecarefree
·
2023-01-29 21:21
linux文件cd小工具
cygwin,
cd-hit
安装和使用
最近想使用
cd-hit
对RNA进行取冗余1cygwin安装具体安装过程参考下面链接,不过要注意在安装组件包的时候记得安装make组件,不然会很麻烦Windows:安装cygwin教程_Big_quant
黑脸少年
·
2023-01-29 21:20
生物信息
windows
其他
CD-Hit
生信 碱基序列去除冗余的方法
1.CD-Hit介绍官方介绍:
CD-HIT
是一个非常广泛使用的程序,用于蛋白质或核苷酸序列的聚类和比较。
oyoli
·
2023-01-29 21:19
生信
机器学习
生物信息学
使用
cd-hit
对核酸序列或氨基酸序列聚类
目录
cd-hit
简要原理
cd-hit
的参数叮!
cd-hit
简要原理
cd-hit
是一款用于蛋白质序列或者核酸序列聚类的工具,由Dr.WeizhongLi开发。
你大佬来啦
·
2023-01-29 21:49
生信新手分享
jie
经验分享
一站解决:如何用
cd-hit
去低于30%的冗余(资源见百度云链接)
一站解决:如何用
cd-hit
去低于30%的冗余(资源见百度云链接)环境简介遇到的问题使用流程百度云链接运行代码举例环境cd-hit-v4.8.1Linux简介一般情况下我们使用
cd-hit
去冗余阈值不会低于
AtomWW
·
2023-01-29 21:48
生物信息
安装生物序列去冗余软件
cd-hit
cd-hit
是一款生信常用于序列去冗余的工具,在https://github.com/weizhongli/cdhit下载后,需要自己编译,对于windows系统,工作步骤如下(以下以windows10
javafalcon
·
2023-01-29 21:48
bioinformatics
生信软件
ubuntu安装
CD-HIT
法1首先在官网下载安装包:我这时候的版本是:cd-hit-v4.8.1-2019-0228.tar.gz切换到安装包所在目录,执行:gzip-dcd-hit-v4.8.1-2019-0228.tar.gztar-xvfcd-hit-v4.8.1-2019-0228.tar进入解压好的文件夹,进行编译(make),这里有时候会报错:Infileincludedfromcdhit-common.c++
Gentlezzx
·
2023-01-29 21:18
CD-HIT
文章目录CD-HITref介绍算法原理索引表Shortwordfilter短词统计Bandedalignment算法限制PSI-CD-HIT在线服务器离线安装工具使用方式CD-HIT-EST参数示例CD-HIT-EST-2DGclustCD-HIT-EST实验CD-HITCD-HITisaverywidelyusedprogramforclusteringandcomparingproteinor
hellopbc
·
2023-01-29 21:47
bioinfo
生物信息
cd-hit
序列去冗余
核苷酸
蛋白质
基因BIN来源分析(一)
cd-hit
去冗余,salmon计算基因TPM
导读humann中有一个模块可以进行基因物种来源分析,但是内部怎么分析的。如果能获得每个物种的基因序列文件,那么不用humann也能进行此分析。所以基因BIN来源分析很适合Binning下游分析。一、合并基因序列ffn文件mkdirBin_all/Bin_genetouchBin_all/Bin_gene/bin.ffnecho-e"\033[32m合并bin.ffn基因序列文件begin:\03
胡童远
·
2022-05-18 16:31
基因BIN来源分析(二)获取基因-BIN-样品/组TPM表,绘制散点图和饼图矩阵
导读继续:基因BIN来源分析(一)
cd-hit
去冗余,salmon计算基因TPM4制作genebinmap文件提取所有bin的prokka注释结果中的predict_id,bin_id,gene,annotation
胡童远
·
2020-11-09 20:51
生信 |
cd-hit
下载:http://www.bioinformatics.org/
cd-hit
/背景:生信分析中经常要根据指定条件查找相似序列,比如构建多个样品间的非冗余基因集、分析样品间的相似程度。
rojyang
·
2020-09-15 14:59
生物信息软件应用
#
生信
生信软件应用
WebMGA:超快的基因组序列聚类注释在线工具
文章目录超快的基因组序列聚类注释在线工具WebMGA序列聚类
cd-hit
基因预测ORFprediction蛋白COG注释作者简介参考文献猜你喜欢写在后面超快的基因组序列聚类注释在线工具WebMGA撰文:
刘永鑫Adam
·
2020-08-08 01:05
宏基因组
使用Python删除具有某些特征的几行数据
进行数据整理时所写的脚本,使用
CD-HIT
去冗余,设置阈值为100%,将有多条的簇留下来。
Leesuha
·
2020-08-05 12:39
Python
2019-12-23 学习记录7
通常来说,根据序列相似度对序列进行聚类,首先想到的可能是通过计算两两序列之间的相似度对序列进行聚类,这样需要进行allbyall的比较,相对来说比较费时,而
cd-hit
软件可以避开allbyall比较的问题
o迷幻天使o
·
2020-07-16 05:58
CD-HIT
学习
CD-hit
参数解读-i设置输入文件-o设置输出文件,可以将每次分析的ID阈值放到名称中,方便以后使用,如clean90,就是被清洗后,使用-c0.90的分析结果-c设置ID阈值-n在ID各个范围内,作者给了一些设置
热爱大自然的小和尚
·
2020-07-12 18:33
宏基因组分析概述
序列组装与基因预测——拼接:MEGAHIT序列组装与基因预测——ORF预测:Prodigal拼接和装箱binning——组装拼接:Megahit;组装评估quast;;基因注释:prokka;构建非冗余基因集:
CD-HIT
小王的学习杂记
·
2020-03-01 11:49
使用
cd-hit
对蛋白质或核酸序列进行聚类
cd-hit
聚类算法通常来说,根据序列相似度对序列进行聚类,首先想到的可能是通过计算两两序列之间的相似度对序列进行聚类,这样需要进行allbyall的比较,相对来说比较费时,而
cd-hit
软件可以避开allbyal
biolearn
·
2020-02-07 15:32
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他