单细胞实战(1):原始测序数据下载

前言

目前的课题是10X单细胞测序(植物方面),之前已经把所有的流程基本走过一遍,现在就将自己的学习过程整理成笔记给大家分享一下,我在学习单细胞分析的时候主要跟着单细胞天地的公众号和jimmy老师在B站上上传的单细胞分析视频进行学习的,在前期的数据下载过程中也参考了刘小泽的文章,希望对大家能有所帮助。

数据来源:《Acquired cancer resistance to combination immunotherapy from transcriptional loss of class I HLA》文章中的部分数据

ID Description SRR_ID
GSM3330559 Tumor Disc Pre SRR7722937
GSM3330560 Tumor Disc AR SRR7722938
GSM3330561 PBMC Pre SRR7722939
GSM3330562 PBMC Disc Early SRR7722940
GSM3330563 PBMC Disc Resp SRR7722941
GSM3330564 PBMC Disc AR SRR7722942

数据下载

两种方法

1.使用sratools

conda install -c daler sratoolkit

##sra数据下载加速
wget https://download.asperasoft.com/download/sw/connect/3.8.1/ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
# 小心版本号有变动,不要直接复制上面的命令
tar zxvf ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
bash ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.sh
# 默认安装路径 /home/user/.aspera


cat >SRR_Acc_List-2586-4.txt
SRR7722937
SRR7722938
SRR7722939
SRR7722940
SRR7722941
SRR7722942

cat SRR_Acc_List-2586-4.txt |while read i
do prefetch $i -O `pwd` && echo "** ${i}.sra done **"
done

2.利用ascp由ftp.ncbi下载测序数据

第一种情况下有的数据可能无法下载,也可以直接利用ascp下载,速度也很快

在EBI上搜索想要的SRR号,复制连接地址

ftp://ftp.sra.ebi.ac.uk/vol1/srr/SRR772/007/SRR7722937

然后将地址按照如下格式修改

ascp -QT -l 300m -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:vol1/srr/SRR772/007/SRR7722937 ./
ascp -QT -l 300m -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:vol1/srr/SRR772/008/SRR7722938 ./
ascp -QT -l 300m -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:vol1/srr/SRR772/009/SRR7722939 ./
ascp -QT -l 300m -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:vol1/srr/SRR772/000/SRR7722940 ./
ascp -QT -l 300m -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:vol1/srr/SRR772/001/SRR7722941 ./
ascp -QT -l 300m -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:vol1/srr/SRR772/002/SRR7722942 ./

参考链接

单细胞实战(一):数据下载

【生信技能树】使用10X单细胞转录组数据探索免疫治疗

你可能感兴趣的:(单细胞实战(1):原始测序数据下载)