下载已发表文章原始数据之SRA Toolkit(Fastq转换bam)

https://www.cnblogs.com/liujiaxin2018/p/15083885.html

1、下载进NCBI官网



2、



3、



4、根据系统选择版本,下载即可




5、查看自己系统

6、centos和redhed 使用软件一致

因此选择:



7、

[root@PC3 test]#wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.11.0/sratoolkit.2.11.0-centos_linux64.tar.gz

8、进度

9、

[root@PC3 test]# ls sratoolkit.2.11.0-centos_linux64.tar.gz

10、解压

[root@PC3 test]# tar -xzvf sratoolkit.2.11.0-centos_linux64.tar.gz

11、

[root@PC3 test]# ls

12、

[root@PC3 test]#cd sratoolkit.2.11.0-centos_linux64/

[root@PC3 sratoolkit.2.11.0-centos_linux64]# ls

[root@PC3 sratoolkit.2.11.0-centos_linux64]#cd bin

[root@PC3 bin]# ls

13、

[root@PC3 bin]#./fastq-dump

显示 This sra toolkit installation has not been configured.Before continuing, please run:vdb-config --interactiveFor more information, see https://www.ncbi.nlm.nih.gov/sra/docs/sra-cloud/


15、

[root@PC3 bin]#./vdb-config --interactive

16、直接输入f选择(默认)

17、输入y选择yes

18、输入o

19、输入x 离开

20、输入y保存修改

21、输入o即可

22、测试软件

[root@PC3 bin]#./fastq-dump

23、添加环境变量

[root@PC3 bin]#pwd/home/software/sratoolkit.2.11.0-centos_linux64/bin

24、  路径是上一条命令pwd输出的路径, 后面是追加>>,  千万不要写成重定向>.

[root@PC3 bin]# echo"export PATH=$PATH:/home/software/sratoolkit.2.11.0-centos_linux64/bin">>~/.bashrc

25、加载

[root@PC3 bin]#source ~/.bashrc

27、使用数据测试,下载好的两个样本的测试数据

fastq-dump -v --split-3 --gzip SRR3951713

使用NCBI提供的SRA-toolkit中的工具fastq-dump直接下载SRR文件,并转换为FASTQ格式,--split-3参数表示如果是双端测序就自动拆分,如果是单端不受影响。--gzip转换fastq为压缩文件,节省空间。

下载的数据集一般比较大,放入后台不中断下载 (nohup cmd &)。

比对到参考基因组输出bam文件

bwa进行索引构建

bwa index -a bwtsw -p hg19.fa hg19.fa

#1. 一个个比对,生成BAM文件,对质量好的测序数据进行比对

sample=SRR3951713

bwa mem -t 2 -R "@RG\tID:$sample\tSM:$sample\tLB:WGS\tPL:Illumina" /home/ug0439/zjs/ref/ref-hg19/ SRR3951713_1.fastq.gz SRR3951713_2.fastq.gz |samtools sort -@ 2 -o SRR3951713.bam -

##=========增加第一列文件名,记得不能空格,要Tab分隔如果样本量很多就用脚本,具体见大样本分析那篇align目录下

##==========查看bam文件

$ samtools view -H SRR3951713.bam |grep -v "SQ"

##==========将bam文件转换为bed文件===============

bedtools bamtobed -i SRR3951713.bam > SRR3951713.bed

你可能感兴趣的:(下载已发表文章原始数据之SRA Toolkit(Fastq转换bam))