转录组 Day 1 背景介绍,测序原理,工作准备,数据下载

root用户的命令行以#开头
目录 文件命名:
由字母,下划线,数字组成,不要以数字开头,不要使用特殊符号
下划线命名法:project_backup
峰驼法:projectBackup

3.数据下载

Aim:airway数据下载

由文献得到GEO accession:GSE52778

image.png

GEO数据库内搜索 得到

BioProject:PRJNA229998
SRA:SRP033351

image.png
image.png

方法一:sra-tools工具:在SRA数据库使用SRA编号 得到AccList

image.png

image.png

得到SRR编号,使用sra-tools工具包的prefetch命令下载数据

法1.用已下载好的数据

image.png

法2..sra-tools工具包的prefetch命令(官方工具)

# 使用prefetch命令下载单个文件:如SRR1039510
prefetch SRR1039510

# 批量下载:建立循环,并查看
# =号两边没有空格
outputdir=/teach/project/Human-16-Asthma-Trans/data/rawdata/sra
cat sampleId.txt | while read id
do
    echo "prefetch ${id} -O ${outputdir} "
done >download.sh

# 运行脚本,由于服务器资源有限,运行不报错就好了,ctrl+C强制退出
nohup sh download.sh >download.log &

# 验证数据的完整性
vdb-validate SRR1039510

方法二.使用aspera下载(推荐)

aspera下载:使用BioProject编号在ENA数 据库得到aspera下载链接

image.png
image.png
image.png

tax id:物种编号缩写,人是9606
scientific_name:Homo sapiens 人的物种的拉丁文
library layout:paired双端测序

安装aspera软件

image.png
image.png

image.png

你可能感兴趣的:(转录组 Day 1 背景介绍,测序原理,工作准备,数据下载)