gtx超算工作站运行命令
1、生成index(如果没有创建的话)
gtx index ref.fa
2、比对
#1 快速比对,生成vcf
gtx wgs -R '@RG\tID:输出文件名\tSM:输出文件名\tPL:ILLUMINA' -o 输出文件名.vcf /index/hg19/hg19.fa 原始数据.R1.fastq 原始数据.R2.fastq
#2 快速比对,生成gvcf
gtx wgs -R '@RG\tID:输出文件名\tSM:输出文件名\tPL:ILLUMINA' -o 输出文件名.g.vcf /index/hg19/hg19.fa 原始数据.R1.fastq 原始数据.R2.fastq -g
#3 精准比对,生成vcf文件
gtx wgs -R '@RG\tID:输出文件名\tSM:输出文件名\tPL:ILLUMINA' -o 输出文件名.vcf /index/hg19/hg19.fa 原始数据.R1.fastq 原始数据.R2.fastq --bwa
#4 精准比对,生成gvcf文件
gtx wgs -R '@RG\tID:输出文件名\tSM:输出文件名\tPL:ILLUMINA' -o 输出文件名.g.vcf /index/hg19/hg19.fa 原始数据.R1.fastq 原始数据.R2.fastq -g --bwa -L bed
3、Joint calling 分析:
- 对所有样本精准比对,生成g.vcf文件
gtx wgs -R '@RG\tID:输出文件名\tSM:输出文件名\tPL:ILLUMINA' -o 输出文件名.g.vcf /参考基因组文件路径/参考基因组文件夹/参考基因组.fa 原始数据.R1.fastq.gz 原始数据.R2.fastq.gz -g --bwa
- 对每个样本进行压缩和索引
bgzip /样本放置路径/样本放置文件夹/样本名1
(例:bgzip /home/gtx/jointcall/文件名1)
tabix -p vcf /样本放置路径/样本放置文件夹/样本名1
(例:tabix -p vcf /home/gtx/jointcall/文件名1)
bgzip /样本放置路径/样本放置文件夹/样本名2
(例:bgzip /home/gtx/jointcall/文件名2)
tabix -p vcf /样本放置路径/样本放置文件夹/样本名2
(例:tabix -p vcf /home/gtx/jointcall/文件名2)
bgzip /样本放置路径/样本放置文件夹/样本名3
(例:bgzip /home/gtx/jointcall/文件名3)
tabix -p vcf /样本放置路径/样本放置文件夹/样本名3
(例:tabix -p vcf /home/gtx/jointcall/文件名3)
... ...
gtx gi -V /样本放置路径/样本放置文件夹/样本名1 -V /样本放置路径/样本放置文件夹/样本名2 -V /样本放置路径/样本放置文件夹/样本名3 -G /样本放置路径/样本放置文件夹/db
(例:gtx gi -V /home/gtx/jointcall/文件名1 -V /home/gtx/jointcall/文件名2 -V /home/gtx/jointcall/文件名3 -G /home/gtx/jointcall/db)
gtx joint -R /参考基因组路径/参考基因组文件夹/参考基因组.fa -V gendb:///样本放置路径/样本放置文件夹/db -O 输出文件名(jointcall_gtx_pig.vcf)
(例:gtx joint -R /home/gtx/jointcall/ref/参考基因组.fa -V gendb:///home/gtx/jointcall/db -O jointcall_gtx_pig.vcf)