二代测序组装

Step1 :质控 Read Quality Control

#了解数据,包括reads类型、reads数量、read质量、GC含量、可能的污染和其他问题
#然后决定是否对数据进行去接头、去标签、过滤低质量序列操作。
#软件:
质量控制:FastQC
数据清洗:Trimmomatic

Step2:组装 Assembly

#测序软件有很多参数,这些参数会影响测序结果,其中关键参数是K值  3,基因组大小,基因组测序深度。
使用测序软件组装
Sspades
SOAP-denovo
MIRA
ALLPATHS

5、基因组评价

busco、QUAST

6、基因组注释

结构注释
功能注释

--------------------------------------------------------------------------------------------------

参考链接、软件教程和补充信息

1、参考链接
https://www.melbournebioinformatics.org.au/tutorials/tutorials/assembly/assembly-protocol/
2、软件教程
fataqc安装与使用
https://blog.csdn.net/boringfantasy/article/details/80612886
https://rtsf.natsci.msu.edu/genomics/tech-notes/fastqc-tutorial-and-faq/
Trimmomatic安装与使用(Illumina平台数据过滤工具)
https://www.jianshu.com/p/a8935adebaae
https://www.jianshu.com/p/bc3ad9379e3e?utm_campaign=hugo

3、补充信息
测序原理
(1)一代sanger测序原理
https://zhuanlan.zhihu.com/p/94183808
(2)二代Illumina测序原理
https://blog.csdn.net/u011262253/article/details/102525491
(2)二代Roche454测序原理
https://www.creative-biogene.com/blog/index.php/2017/02/02/the-next-generation-sequencing-platform-of-roche-454/
(3)三代SMRT测序原理
https://www.bilibili.com/video/av625217828
(3)一、二、三代技术原理与比较
https://blog.csdn.net/tanzuozhev/article/details/78499194

测序数据
(1)单端测序与双端测序
https://blog.csdn.net/hanli1992/article/details/82982434
(2)关于数据,质控的意义
http://blog.sina.com.cn/s/blog_668c63770102v4f2.html
(3)数据格式
fasta :
fastaQ :最常用
SAM :
BAM :SAM的二进制格式
四种格式.gz压缩文件

你可能感兴趣的:(二代测序组装)