如何向Sequence Read Archive (SRA) 提交未组装的高通量测序reads?

基本简介

原始数据(Raw data) 指测序下机后未经处理的全部原始数据文件,SRA是NCBI中收录原始数据的主要数据库,有454,Illumina,SOLiD,IonTorrent,Helicos 和CompleteGenomics的下机数据,最为常见的是illumina 产生的fastq格式数据。

一:注册NCBI账号

点击NCBI主页my profile填写个人信息(用户名,密码,邮箱),并向NCBI发送邮件确认邮箱号,构建NCBI账号。如果已有账号,点击sign in直接登录。

链接:https://submit.ncbi.nlm.nih.gov/


二:申请BioSample号和BioProject号

在提交原始数据前,我们需要先申请BioSample号和BioProject号,主要填写一些描述样本、测序方面的相关信息。点击New submission开始填写,下图为填写内容简介。链接:

https://submit.ncbi.nlm.nih.gov/subs/biosample/

https://submit.ncbi.nlm.nih.gov/subs/bioproject/

三:提交原始fastq格式文件至SRA

当完成上面两步时,已申请的Biosample和Bioproject号待用,点击New submission开始填写,下图是填写内容简介。链接:

https://submit.ncbi.nlm.nih.gov/subs/sra/

总结

越来越多实验会涉及到测序。细菌、真菌、宏基因组、RNA-seq、16S等等。虽然测序公司帮助你做了数据分析,但是当你投文章的时候,难免会被编辑或者审稿人问道:你的原始数据提交到公共数据库了吗?或者请提供能找到测序数据的accseeion number?这个时候,如果你的样本少,数据量小,你可以考虑自己通过网页上传哦,再也不用担心文章发表时没上传原始数据了。

你可能感兴趣的:(如何向Sequence Read Archive (SRA) 提交未组装的高通量测序reads?)