单细胞测序数据分析(1)—数据下载

参考:
单细胞实战(一)数据下载
参考链接里主要是下载了一篇文章里提及到的两个患者单细胞数据分析集,

第一个患者:
SRR7722937
SRR7722938
SRR7722939
SRR7722940
SRR7722941
SRR7722942
第二个患者:
SRR7692286
SRR7692287
SRR7692288
SRR7692289

下载的方式,有两种,
第一种,采用ASPERA下载,我的RNA-seq学习笔记中有这个软件的下载和安装,这儿省略介绍此步骤。

export PATH="/home/leo/.aspera/connect/bin:$PATH"
source ~/.bashrc
ascp -QT -l 500m -P 33001 -i /home/leo/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/vol1/fastq/SRR772/000/SRR7722940/SRR7722940.fastq.gz .

但是,结果很不辛,提示报错

Session Stop  (Error: Session initiation failed, read timed out)  

我尝试用下面的方法解决,提示也不行。

root@gongyong:/mnt/f/biotech/10# iptables -I INPUT -p tcp --dport 33001 -j ACCEPT
                                 iptables -I OUTPUT -p tcp --dport 33001 -j ACCEPT
    提示报错:                                                           
iptables v1.4.21: can't initialize iptables table `filter': Table does not exist (do you need to insmod?)                                     
Perhaps iptables or your kernel needs to be upgraded.            

我还尝试用我在RNA-seq中可以执行的数据进行下载结果还是不行,提示相同的报错。

root@gongyong:/mnt/f/biotech/10# ascp -QT -l 500m -P 33001 -i /home/leo/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/vol1/fastq/SRR533/000/SRR5337720/SRR5337720_2.fastq.gz .                                                                                                                                                                                                                                      
Session Stop  (Error: Session initiation failed, read timed out)      

我就呵呵了,至今不知道为啥。(2020.9.10 补充:目前可以采用ASCP这种方式下载了)

只能采用第二种方法,下载一个ACCESION-list,步骤如下:
1.我们要知道SRP号,分别为SRP157915和SRR155988

单细胞测序数据分析(1)—数据下载_第1张图片
2.打开 SRA RUN SELECTOR
单细胞测序数据分析(1)—数据下载_第2张图片或者直接去SRA selector 网址,写上咱们所需要的SRR号。
3.下载一个list
单细胞测序数据分析(1)—数据下载_第3张图片

两个SRR 中的list 内容可以合在一起。

4.执行代码

cat SRR_Acc_List.txt |while read i
do prefetch $i -O    `pwd` && echo "** ${i}.sra done **"
done

就是速度是真的没有ASPERA 快。
5.下载下来的数据是SRA 格式,需要我们自己转化成fastq 格式,这一点,也没有ASPERA好。
下载Sratoolkit,我用conda 安装没有成功,采用了下面的代码,具体其他版本参考SRA Toolkit - prefetch 快速下载NCBI SRA数据

$ wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.6/sratoolkit.2.9.6-ubuntu64.tar.gz
$ tar zxvf sratoolkit.2.9.6-ubuntu64.tar.gz
$ cd sratoolkit.2.9.6-ubuntu64

#加入环境路径
$ echo 'export export PATH=$PATH:YOUR_PATH/sratoolkit.2.9.6-ubuntu64/bin' >> ~/.bash_profile
$ source ~/.bash_profile
 fastq-dump --gzip --split-files ./SRR7722937/SRR7722937.sra 

酶=每一个SRA会产生三个文件:在这里插入图片描述

你可能感兴趣的:(生信分析)