病原微生物笔记-NCBI taxonomy

NCBI taxonomy 数据库简介

NCBI公共序列列数据库中所有⽣生物的策划分类和命名法,⽬目前包含地球上⼤大概10%的物种。 NCBI taxonomy 专业术语

image.png

在NCBI中呢就不不得不不说⼀一下它的专业术语~~ 如上图所示:

Taxa:代表整个物种树中的⼀一个节点,该节点可以是物种,也可以是⽐比物种更更⾼高级的分类单元⽐比如⻔门, 纲,⽬目,科属等等

物种树:整个物种数据库中的taxa相互联系,构成⼀一个树状结构,成为物种树。每⼀一个节点都有⼀一个 taxid。

Lineage:为⼀一个taxa的世系链,从跟节点到任意节点的路路径,称为该任意节点的世系。

Rank表⾯面⼀一个taxa的分类级别,如Rank为⽬目的他打⽐比rank为科的(family)的taxa级别⾼高,⽽而完整的 taxa rank值如下表:

image.png

ncbi所有的taxonomy 存储在taxonomy database 中,可通过以下链接进⾏行行下载。 NCBI taxonomy 数据下载

https://ftp.ncbi.nih.gov/pub/taxonomy/

整体内容如下:​

image.png

关于taxonomy的详细介绍可以看官⽅方的readme https://ftp.ncbi.nih.gov/pub/taxonomy/new_taxdu mp/taxdump_readme.txt ⽂文件中解释了了每个⽂文件的每⼀一列列信息(注意|是列列间隔,⽽而⾮非列列本身)

也可以看知乎的⽂文章 https://zhuanlan.zhihu.com/p/90747645有个⼤大致的印象

image.png

https://github.com/frallain/NCBI_taxonomy_tree

利用NCBI Taxonomy数据库构建⼦子库

很多时候我们需要构建⼀一些我们关注的⼦子库,⽐比如⼀一些致病的像葡萄球菌,链球菌所属的⾰革兰阳性菌

库,那么我们如何通过taxonomy数据库达到拆分的⽬目的呢?
==============先看链接,内容待定======================================
https://www.jianshu.com/p/72d9271db051
http://www.chenlianfu.com/?p=2691

https://zhuanlan.zhihu.com/p/59757585

https://indexofire.gitbooks.io/notebook_of_analyzing_pathogen_ngs_data/content/chapter_2/ma pping.html

ftp://ftp.ncbi.nlm.nih.gov/pub/factsheets/HowTo_Downloading_Genomic_Data.pdf

你可能感兴趣的:(病原微生物笔记-NCBI taxonomy)