BSA分析-实战笔记(二)数据准备

参考:
以水稻为例教你如何使用BSA方法进行遗传定位(上篇) - (jianshu.com)

一、环境构建

为了防止主页过于混乱,我一般把跑的这些流程放在workspace目录

cd workspace
mkdir BSA
cd BSA
mkdir data

二、数据准备

  • 文章:Identification of a cold-tolerant locus in rice (Oryza sativa L.) using bulked segregant analysis with a next-generation sequencing strategy - PubMed (nih.gov)
  • 材料:Kongyu131(耐寒)×Dongnong422(不耐寒)→F2→RIL
  • 文章的图:


    ED

    SNP-index
  • 数据下载:
    ①参考序列(IRGSP-1.0_genome.fasta);
mkdir data
cd data
mkdir ref
cd ref
#下载参考序列
wget https://rapdb.dna.affrc.go.jp/download/archive/irgsp1/IRGSP-1.0_genome.fasta.gz
gunzip IRGSP-1.0_genome.fasta.gz
#bwa构建索引
bwa index IRGSP-1.0_genome.fasta
#SRR6327815, SRR6327816, SRR6327817, SRR6327818

②测序数据(SRR6327815, SRR6327816, SRR6327817, SRR6327818)
ENA Browser (ebi.ac.uk)搜索SRR号获取下载序列,如下图,复制链接

在NCBI上下载的是SRA格式,需要做数据转换,而从ENA上可以直接下载压缩过的fastq文件

ENA
#{a,b}.txt  → a.txt b.txt
vi SRR.txt
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/005/SRR6327815/SRR6327815_{1,2}.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/006/SRR6327816/SRR6327816_{1,2}.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/007/SRR6327817/SRR6327817_{1,2}.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/008/SRR6327818/SRR6327818_{1,2}.fastq.gz
#后台批量下载
wget -b -i SRR.txt

你可能感兴趣的:(BSA分析-实战笔记(二)数据准备)