https://www.cnblogs.com/liujiaxin2018/p/15083885.html
1、下载进NCBI官网
2、
3、
4、根据系统选择版本,下载即可
5、查看自己系统
6、centos和redhed 使用软件一致
因此选择:
7、
[root@PC3 test]#wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.11.0/sratoolkit.2.11.0-centos_linux64.tar.gz
8、进度
9、
[root@PC3 test]# ls sratoolkit.2.11.0-centos_linux64.tar.gz
10、解压
[root@PC3 test]# tar -xzvf sratoolkit.2.11.0-centos_linux64.tar.gz
11、
[root@PC3 test]# ls
12、
[root@PC3 test]#cd sratoolkit.2.11.0-centos_linux64/
[root@PC3 sratoolkit.2.11.0-centos_linux64]# ls
[root@PC3 sratoolkit.2.11.0-centos_linux64]#cd bin
[root@PC3 bin]# ls
13、
[root@PC3 bin]#./fastq-dump
显示 This sra toolkit installation has not been configured.Before continuing, please run:vdb-config --interactiveFor more information, see https://www.ncbi.nlm.nih.gov/sra/docs/sra-cloud/
15、
[root@PC3 bin]#./vdb-config --interactive
16、直接输入f选择(默认)
17、输入y选择yes
18、输入o
19、输入x 离开
20、输入y保存修改
21、输入o即可
22、测试软件
[root@PC3 bin]#./fastq-dump
23、添加环境变量
[root@PC3 bin]#pwd/home/software/sratoolkit.2.11.0-centos_linux64/bin
24、 路径是上一条命令pwd输出的路径, 后面是追加>>, 千万不要写成重定向>.
[root@PC3 bin]# echo"export PATH=$PATH:/home/software/sratoolkit.2.11.0-centos_linux64/bin">>~/.bashrc
25、加载
[root@PC3 bin]#source ~/.bashrc
27、使用数据测试,下载好的两个样本的测试数据
fastq-dump -v --split-3 --gzip SRR3951713
使用NCBI提供的SRA-toolkit中的工具fastq-dump直接下载SRR文件,并转换为FASTQ格式,--split-3参数表示如果是双端测序就自动拆分,如果是单端不受影响。--gzip转换fastq为压缩文件,节省空间。
下载的数据集一般比较大,放入后台不中断下载 (nohup cmd &)。
比对到参考基因组输出bam文件
bwa进行索引构建
bwa index -a bwtsw -p hg19.fa hg19.fa
#1. 一个个比对,生成BAM文件,对质量好的测序数据进行比对
sample=SRR3951713
bwa mem -t 2 -R "@RG\tID:$sample\tSM:$sample\tLB:WGS\tPL:Illumina" /home/ug0439/zjs/ref/ref-hg19/ SRR3951713_1.fastq.gz SRR3951713_2.fastq.gz |samtools sort -@ 2 -o SRR3951713.bam -
##=========增加第一列文件名,记得不能空格,要Tab分隔如果样本量很多就用脚本,具体见大样本分析那篇align目录下
##==========查看bam文件
$ samtools view -H SRR3951713.bam |grep -v "SQ"
##==========将bam文件转换为bed文件===============
bedtools bamtobed -i SRR3951713.bam > SRR3951713.bed