作者:charon , 童蒙
编辑:angelica
高通量测序的诞生为科研和临床工作者在突变位点的检测和疾病分析上带来了“福音”,随之而来的则是如何从突变中甄别出真正致病相关的基因位点、并对此实现较为全面的注释和致病性评估,这也成为当前高喊“精准医学”的一个考验。如何标准化衡量突变位点的致病性以及是否具有或者潜在具有临床意义则成为变异检测后又一个需要解决的问题。2015年,《ACMG遗传变异分类标准与指南》的发布为标准化和规范化评估和解读致病位点带来了极大便利。而今天给大家分享的CharGer软件则能实现快速进行ACMG打分。接下来跟着小编看下这个非常好用的软件怎么使用吧~
一、软件说明
软件CharGer(Characterization of Germline variants)利用数据库和注释信息,依据ACMG标准对变异分类以评估变异的致病性。数据库可以下载到本地,也可以通过ReST APIs(联网)获取信息。用户也可以自己添加致病性标准,加入到CharGer规范中,来创建自己的分类标准。CharGer 可以使用两个不同的方法进行分类,一个是标准的ACMG的变异分类体系,一个是对ACMG进行扩展,使用自定义的模块来进行打分。
通过对给定的输入文件,CharGer进行突变位点的注释,并且对这些注释的变异同ACMG和自定义的模型进行匹配后打分。根据得分,使用ACMG和CharGer的分类算法,得到变异的致病性检测分类。
二、软件安装
本地安装
依赖环境:python 2.7.x;pip 10.X;vertulenv
使用命令:
pip install charger
Docker安装
Dockerfile路径:Dockerfile
docker build -t charger:version dockerfile
安装结果:成功安装,软件正常运行
三、注意事项
安装后可能有3个脚本出现语法错误,需要修改
- /usr/local/lib/python2.7/site-packages/biomine/webapi/entrez/entrezapi.py
332和333行 entrezaip 修改为 entrezapi - /usr/local/lib/python2.7/site-packages/charger/charger.py
928行 varSet 修改为 varsSet - /usr/local/lib/python2.7/site-packages/biomine/webapi/ensembl/ensemblapi.py
报错 IndexError: list index out of range,需在381行添加 if len(vals) < 6 : continue
四、 程序说明
用法
charger -f
主要参数说明
输入文件:
可以是以下三种格式的一种,每种可以输入一个文件。
-m Standard .maf
-f Standard .vcf
-T Custom .tsv
如果使用.maf 或者.tsv作为输入,那么需要指定使用哪一列作为输入列。注意标准的.maf文件不包含蛋白注释,因此,如果需要使用的话,需要指定;对于包含VEP注释的vcf文件,CharGer可以自动处理这个信息。
输出
tsv或者html格式
-o output file
-w output as HTML (flag)
-k annotate input (flag)
--run-url-test test url when creating links
--include-vcf-details (flag)
输出文件的名称默认为charger_summary.tsv,也可以指定输出名。
数据库
-l ClinVar (flag)
-x ExAC (flag)
-E VEP (flag)
-t TCGA cancer types (flag)
当本地没有VEP数据库时,软件会调用BioMine的ReST接口去读取数据,目前可以获得release97的数据。
其他参数
-O override with ClinVar description (flag)
-D suppress needing disease specific (flag)
-z pathogenic variants, .vcf
\# vcf文件,包含已知的致病突变。作为支持PS1和PM5的证据。
-e expression matrix file, .tsv
\# tsv文件,列为样本,行为基因。
--inheritanceGeneList inheritance gene list file, (format: gene\tdisease\tmode_of_inheritance) .txt
\# 用户编辑文件,包含已知的致病基因。作为支持PVS1, PSC1, PM4, PP2, and PPC1的证据。
--PP2GeneList PP2 gene list file, (format: column of genes) .txt
\# 每行一个基因,作为支持PP2证据。
--BP1GeneList BP1 gene list file, (format: column of genes) .txt
\# 每行一个基因,作为支持BP1证据。
-d diseases file, (format: gene\\tdisease\\tmode_of_inheritance) .tsv
-n de novo file, standard .maf
-a assumed de novo file, standard .maf
-c co-segregation file, standard .maf
-H HotSpot3D clusters file, .clusters
这些文件中的变异或者基因可以作为额外的已知信息,用于结果的判定;基因名需要是HUGO symbols。
过滤参数
--recurrence-threshold : HotSpot3D的打分阈值,默认是2
--rare-threshold : 稀有突变的频率 (default = 0.0005 (0.05%)):
--common-threshold: 普通突变的频率 (default = 0.005 (0.5%))
打分参数
确定每个分类类别的数值,默认值如下:
标准ACMG模块:
--PVS1 very strong pathogenicity (default = 8)
--PS1 , --PS2 , --PS3 , --PS4 strong pathogenicity (defaults: PS1 = 7, PS2=PS3=PS4 = 4)
--PM1 , --PM2 , --PM3 , --PM4 , --PM5 , --PM6 moderate pathogenicity (defaults: PM1=PM2=PM3=PM4=PM5 = 2)
--PP1 , --PP2 , --PP3 , --PP4 , --PP5 supporting pathogenicity (defaults: PP1=PP2=PP3=PP4=PP5 = 1)
--BP1 , --BP2 , --BP3 , --BP4 , --BP5 , --BP6 , --BP7 supporting benignity (defaults: BP1=BP2=BP3=BP4=BP5=BP6=BP7 = -1)
--BS1 , --BS2 , --BS3 , --BS4 strong benignity (defaults: BS1=BS2=BS3=BS4 = -4)
--BA1 stand-alone benignity (defaults: BA1 = -8)
用户自定义的CharGer-defined模块和评分:
--PSC1 strong pathogenicity (defaults: PSC1 = 4)
--PMC1 moderate pathogenicity (defaults: PMC1 = 2)
--PPC1 , --PPC2 supporting pathogenicity (defaults: PPC1=PPC2 = 1)
--BMC1 moderate benignity (defaults: BMC1 = -2)
--BSC1 strong benignity (defaults: BSC1 = -6)
Pathogenicity/benignity category thresholds
Specify the option and positive whole number value to change the default value.
--min-pathogenic-score threshold for classifying variant as pathogenic (default = 9)
--min-likely-pathogenic-score threshold for classifying variant as likely pathogenic (default = 5)
--max-likely-benign-score threshold for classifying variant as likely benign (default = -4)
--max-benign-score threshold for classifying variant as benign (default = -8)
本地数据库
--exac-vcf ExAC vcf.gz
--mac-clinvar-`tsv ClinVar from MacArthur lab (clinvar_alleles.tsv.gz)`
五、软件实操
使用Demo目录下的demo.vcf
运行命令
charger -f demo.vcf -o charged.demo.tsv -D --inheritanceGeneList inheritanceGeneList.txt --PP2GeneList PP2GeneList.txt --BP1GeneList BP1GeneList.txt -l -E
结果说明
结果文件为tab键分割的文本文件,共24列。其中比较关注的列为:
HUGO_Symbol:HUGO symbol基因名
Chromosome:染色体编号
Start:起始位点
Stop:终止位点
Reference:参考序列
Alternate:变异序列
ClinVar_Pathogenicity:clinvar致病性分类
ACMG_Classification:ACMG致病性分类
CharGer_Classification:Charger软件致病性分类
CharGer_Summary:注释结果描述。
六、参考
- Adam D Scott, Kuan-Lin Huang, Amila Weerasinghe, R Jay Mashl, Qingsong Gao, Fernanda Martins Rodrigues, Matthew A Wyczalkowski, Li Ding, CharGer: clinical Characterization of Germline variants, Bioinformatics, Volume 35, Issue 5, 01 March 2019, Pages 865–867
https://doi.org/10.1093/bioinformatics/bty649 - https://github.com/ding-lab/CharGer
- https://www.acmg.net
本文作者:charon , 童蒙
本文编辑:Angelica