基因组重测序分析干货

### 一般从测序公司拿到的下级数据有raw data,或者经过质控之后的clean data,格式为fq。参考基因组及注释文件gff从网上下载。分析流程如尾图所示。

分析软件bwa、samtools、bcftools、annovar通过conda install安装。

bwa 得到sam文件

```

conda install bwa

bwa index /mnt/d/Desktop/S288C_genomic.fna

bwa mem /mnt/d/Desktop/S288C_genomic.fna /mnt/d/r_1.fq.clean.gz /mnt/d/r_2.fq.clean.gz > aln-pe.sam

```

···

samtools 得到bam、bcf文件

conda install samtools

···

samtools faidx /mnt/d/Desktop/S288C_genomic.fna #sam文件转换为bam文件

samtools view -bS -1 /mnt/d/Desktop/YEAST/aln-pe.sam > test.bam

samtools sort /mnt/d/Desktop/YEAST/test.bam -o test.sort.bam #bam文件排序

samtools index /mnt/d/Desktop/YEAST/test.sort.bam #为bam文件建立索引

samtools depth /mnt/d/Desktop/YEAST/test.sort.bam > depth.txt #测试参考基因组每个位点或一段区域的测序深度

samtools flagstat /mnt/d/Desktop/YEAST/test.sort.bam > stat.txt #统计比对结果

samtools rmdup /mnt/d/Desktop/YEAST/test.sort.bam nopcr.bam #去除PCR重复

samtools mpileup -gf /mnt/d/Desktop/YEAST/S288C_genomic.fna nopcr.bam > bwa.bcf #生成bcf文件

bcftools 基因变异检测,得到snps.bcf文件

conda install bcftools

bcftools call -vm /mnt/d/Desktop/YEAST/bwa.bcf -o variants.bcf

bcftools view -v snps,indels /mnt/d/Desktop/YEAST/variants.bcf > snps.vcf

bcftools filter -i 'QUAL>20 &&DP>5' /mnt/d/Desktop/YEAST/snps.vcf -o snps.filtered.vcf #变异位点过滤

annovar 变异基因注释,生成variant_function和exonic_variant_function后缀的两个结果文件

convert2annovar.pl -format vcf4 snps.vcf > snps.avinput #生成annovar输入文件

gunzip S288C_genomic.gff.gz #自定义注释数据库

wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/gff3ToGenePred

chmod 777 gff3ToGenePred

./gff3ToGenePred -useName /mnt/d/Desktop/YEAST/S288C_genomic.gff refGene.txt #gff3文件转为GenePred文件

cut -f 12 7055-genome_refGene.txt >column1.txt #修改GenePred文件

cut -f 2-15 refGene.txt > column_else.txt

paste column1.txt column_else.txt >new_refGene.txt

retrieve_seq_from_fasta.pl #为建立每个基因与编码序列对应文件

cp 7055-genome_new_refGene* ~/BioSofts/annovar/humandb/#拷贝数据库文件到annovar安装目录humandb文件夹

annotate_variation.pl --geneanno --dbtype refGene --buildver 7055-genome_new  snps.avinput ~/BioSofts/annovar/humandb/ #注释变异基因位点

重测序分析一般流程

[

重测序分析一般流程

End

你可能感兴趣的:(基因组重测序分析干货)