2019-12-11

找到SRA号

2019-12-11_第1张图片
image.png

在右上角的搜索框中输入 bacteria genome
2019-12-11_第2张图片
image.png

随便选择一篇文章
2019-12-11_第3张图片
image.png

有一句话说SRA号在Table 1
找到Table 1
2019-12-11_第4张图片
image.png

随便选一个 (我选了最小的那个)不能直接复制 只能连接到SRA数据库 在这个页面复制
2019-12-11_第5张图片
image.png

下载

sratoolkit --version

下载文件

prefetch SRR8648835

下载的时候出现了与链接https://cloud.tencent.com/developer/article/1518672
相同的问题 也试过用linux课上的Redhat下载 问题以运 过了几天再次去尝试 就没有了... 不知道为什么

2019-12-11_第6张图片
image.png

位置在ncbi/public/sra


image.png
fastq-dump --gzip --split-files SRR8648835.sra
image.png

质控 去接头

fastqc --veision
image.png
fastqc -o ~/job4/ SRR8492865_1.fastq.gz SRR8492865_2.fastq.gz
image.png
java -jar ~/biosofts/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 SRR8492865_1.fastq.gz  SRR8492865_2.fastq.gz ~/job_4/SRR8492865_forward_paired.fq.gz ~/job_4/SRR8492865_forward_unpaired.fq.gz ~/job_4/SRR8492865_reverse_paired.fq.gz ~/job_4/SRR8492865_reverse_unpaired.fq.gz ILLUMINACLIP:/home/scarlett/biosofts/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75
2019-12-11_第7张图片
image.png
image.png
SRR8648835_1_fastqc.html
2019-12-11_第8张图片
image.png

2019-12-11_第9张图片
untitled.png

2019-12-11_第10张图片
untitled1.png
2019-12-11_第11张图片
untitled2.png
2019-12-11_第12张图片
untitled3.png
2019-12-11_第13张图片
untitled4.png
2019-12-11_第14张图片
untitled5.png
2019-12-11_第15张图片
untitled6.png
2019-12-11_第16张图片
untitled7.png
SRR8648835_2_fastqc.html
2019-12-11_第17张图片
image.png

2019-12-11_第18张图片
2.png
2019-12-11_第19张图片
3.png
2019-12-11_第20张图片
4.png
2019-12-11_第21张图片
5.png
2019-12-11_第22张图片
6.png
2019-12-11_第23张图片
7.png
2019-12-11_第24张图片
8.png
2019-12-11_第25张图片
11.png

spades组装

spades.py -1 SRR8492865_forward_paired.fq.gz -2 SRR8492865_forward_unpaired.fq.gz -o ~/job_4/spades_out
image.png

出现了上述情况 内存不足 电脑是4G的 把虚拟机内存改成2G也没有 用seqtk处理一下 减少文件大小
先解压为fastq文件

gunzip -c SRR8648835_forward_paired.fq.gz > SRR8648835_forward_paired.fq
gunzip -c SRR8648835_reverse_paired.fq.gz > SRR8648835_reverse_paired.fq
image.png

将forward和reverse各抽出100000条

seqtk sample -s 60 SRR8648835_forward_paired.fq 100000 > SRR8648835_forward_paired_out.fq
seqtk sample -s 60 SRR8648835_reverse_paired.fq 100000 > SRR8648835_reverse_paired_out.fq
image.png

再用spades组装

spades.py -1 SRR8648835_forward_paired_out.fq -2 SRR8648835_reverse_paired_out.fq -o ./spades_out
2019-12-11_第26张图片
image.png

应该是成功了?只有warning
看了一下spades_out文件夹


image.png

成功

Quast评价组装的基因组效果

quast.py ~/job_4/spades_out/contigs.fasta -o ~/job_4/quast_out
2019-12-11_第27张图片
image.png

2019-12-11_第28张图片
image.png

你可能感兴趣的:(2019-12-11)