生物信息学基础知识(一)

基本类型及测序技术

一、类型

1、核苷酸序列数据

DNA:ATCG

RNA:AUCG

2、蛋白序列

20种氨基酸排列的顺序

3、其他

(1)分子标记数据

(2)生物芯片数据

(3)生物表型数据

二、测序技术

1、一代测序

主要是sanger法

2、二代测序

illumina

MGI

还有其他用的不多的方法

3、三代测序

pacbio

nanopore

常用数据库

一、基因序列数据库

GeneBank

EMBL

DDBJ

RefSeq

GDB

二、蛋白数据库

Uniprot

TrEMBL

swiss-prot

iProClass

PIR

PDB

SCOP

CATH

InterPro

三、疾病相关数据库

OMIM

HGMD

ClinVar

HGVA

HGVS

ExAC

HGBASE

常用数据类型

一、fasta

第一部分以">"开头,包括id、序列描述等内容

第二部分为序列

二、fastq

第一部分以"@"开头,包括id、序列描述等内容

第二部分为序列

第三部分为"+"开头,描述信息

第四部分为质量值

三、gff/gft

基因注释文件,包括染色体、基因、位点、转录本、CDS等描述信息

四、sam/bam

比对后生成的文件,主要描述比对的信息

五、bed

主要来描述注释信息

六、wig

主要是描述覆盖深度和测序深度

 

 

你可能感兴趣的:(python,linux,r语言)