学习小组Day7笔记-----张钧保

常用的基因格式

GenBank格式
以LOCUS和一些注释行开始。
序列的开头以“ORIGIN”标记,末尾以“//”标记。

学习小组Day7笔记-----张钧保_第1张图片
摘自美格基因

EMBL格式

以标识符行(ID)开头,后面跟着更多注释行。

序列的开头以“SQ”开头标记,序末尾以“//”标记。

学习小组Day7笔记-----张钧保_第2张图片
摘自美格基因

Fasta格式:

学习小组Day7笔记-----张钧保_第3张图片
摘自美格基因

1:以“>”为开头,fasta格式标志。
2:序列ID号,gi号,NCBI数据库的标识符,具有唯一性。
格式为:gi|gi号|来源标志|序列标志(接收号、名称等),若某项缺失可以留空,“|”保留。
3:序列描述。
4:碱基序列,序列中允许空格、换行、空行,一般一行60个。

测序原理简介

学习小组Day7笔记-----张钧保_第4张图片
测序原理

你可能感兴趣的:(学习小组Day7笔记-----张钧保)