在windows系统下解压ncbi下载的man后缀文件(找到很慢的原因了)

软件安装

手动在ncbi下载了一些sra文件,一看后缀.man,查了下发现是一个压缩包,双端测序文件,解压后可以得到两个fastq文件。

那么问题来了,怎么解压?

第一种:直接尝试改后缀为.7z,解压失败。

第二种:利用sratoolkit

1. 去ncbi下载sratoolkit,简单粗暴。中间发现打不开,原来链接的是github

Github下载地址

在windows系统下解压ncbi下载的man后缀文件(找到很慢的原因了)_第1张图片选择window 64 位,下载,解压。在windows系统下解压ncbi下载的man后缀文件(找到很慢的原因了)_第2张图片

将bin文件的路径加入到系统变量中,参考了(53条消息) Windows系统下载SRA数据,使用sratoolkit工具_铭&婵旭的博客-CSDN博客

win+R输入sysdm.cpl,打开配置path,点击环境变量,再点击系统变量的path,点击新建,把你存放sratoolkit的路径复制黏贴加上去,最后点击确定。

在windows系统下解压ncbi下载的man后缀文件(找到很慢的原因了)_第3张图片

 在windows系统下解压ncbi下载的man后缀文件(找到很慢的原因了)_第4张图片

在cmd或者powershell利用cd指令进入存放sratoolkit的目录,或者也可以直接在当前目录下进行。

 输入(存放你这个下载包的路径)sratoolkit.3.0.1-win64\bin\prefetch.exe -h

在windows系统下解压ncbi下载的man后缀文件(找到很慢的原因了)_第5张图片

这样就可以直接使用这个工具进行下载和解压啦!我直接就成功了,如果有没有成功的可以继续参考这个方法:

一开始是报错的,它显示我要配置,没有图片保存就用文字描述,报三行代码,那我就根据这个输入vdb-config --interactive,出现配置界面,但是这个界面我好想没有改动什么,反正我按了s,再按x就退出了,再运行bin\prefetch.exe -h,显示帮助信息,就是安装成功。

 然后一定要注意使用工具的时候路径是正确的,要不就cd到这个bin文件下直接输入prefetch.exe -h

下载sra文件

不详述,两种方法:

1. 单个:prefetch [accession list]

2. 批量:prefetch.exe --option-file 你存放accession list的txt,分行符分割

解压

下载后的数据一般是无后缀/srr后缀/man后缀,这时候就有一个要解压开的问题,解压了才能获得fastq文件。

解压要用bin目录下的工具fasterq-dump.exe

查找了一下,在不知道是双端数据还是单端数据的情况下用 --split-3最合适

我喜欢在数据的目录下进行,这时候记得在用工具时加上路径

(之前我解压,每次都要一个小时,后来才发现原因,是因为没有加上man后缀,每次都是重新下载+解压。也就是说:如果文件夹下没有这个文件,faster-dump就会重新下载再解压!!!正常解压已下载的文件一分钟不到!

 [安装路径]\sratoolkit.3.0.1-win64\bin\fasterq-dump.exe --split-3 SRR121928.man

一些参数的介绍可以看Fastq-dump: 一个神奇的软件 - 简书 (jianshu.com)

你可能感兴趣的:(组学数据分析,linux,大数据,windows,云计算)