sra文件下载及解析的问题

昨天在NCBI上下载了一份sra文件,使用fastq-dump提取fastq文件时遇到报错:

2019-12-24T08:59:08 fastq-dump.2.9.6 sys: timeout exhausted while reading file within network system module - mbedtls_ssl_read returned -76 ( NET - Reading information from the socket failed )

这是我使用的命令:

fastq-dump --split-3 -O ERR3378079_output ERR3378079

查看该github项目,发现fastq-dump可能还会从网上下载ERR3378079这条记录,于是添加成全路径:

fastq-dump --split-3 -O ERR3378079_output /data/path/ERR3378079

但是仍然报错,后来发现fastq-dump还会在home目录下缓存index,缓存目录如下:

~/ncbi/public

这样下载到一半我的home目录就已经爆掉了,解决方案:

mkdir ~/.ncbi
echo "/repository/user/main/public/root = \"/data/tmp/sra\"" > $HOME/.ncbi/user-settings.mkfg

或者直接更改dump(不建议):

./sratoolkit.2.9.6-1-centos_linux64/bin/ncbi/default.kfg
该文件中有一行
/repository/user/main/public/root = "$(HOME)/ncbi/public"
把后面那个更改成你想要的缓存路径就可以了

其中/data/tmp/sra替换成你自己的目录,这样缓存路径就更改到了/data/tmp/sra,就不会造成home目录爆掉的尴尬情况了。

到最后还是没能解决这个报错,才发现是磁盘IO过高,等一会会就好了。。。

不过还是提前把要踩的雷挖了。

你可能感兴趣的:(生物信息)