【数据库-4】clinvar

欢迎关注公众号:oddxix
如果觉得写的不错记得点个赞哦!


留步看一下这个讲解视频吧~~
https://v.qq.com/x/page/m03789y9j98.html

搭配这个pdf食用更佳哦~

https://www.clinicalgenome.org/site/assets/files/1594/landrum_clinvar.pdf

1.简介

网址https://www.ncbi.nlm.nih.gov/clinvar
ClinVar是NCBI主办的与疾病相关的人类基因组变异数据库。它的强大在于整合了dbSNP、dbVar、Pubmed、OMIM等多个数据库在遗传变异和临床表型方面的数据信息,形成一个标准的、可信的遗传变异-临床相关的数据库。ClinVar同时支持在线和下载到本地两种形式。

网站主页

clinvar是一个开放的数据库,每个研究机构都可以向其提交数据,对于提交的信息,会有专家团队进行审核评级。对于数据库中的位点,根据注释信息的可靠性,分成了1到4个不同的星级,星级越高,可信度越高。截至到2018年11月12日,数据库中所有记录统计如下:

clinvar主要整合以下四块信息:

ClinVar 采用的是星标系统(star-based system),可以评估某个特定突变在疾病中的本来或者注释作用。四星级是最高级,指这个突变的功能已经经过了多位专家的测评。这样详细审查过程的好处在于用户能信任三、四星突变的功能注释,但是在ClinVar 数据库中只有少量此类数据(3800个)。更多时候是只有一星的突变,这通常只基于单个提出注释功能的研究成果,还有没有星的,也就是提交者没有提供解释标准和支持证据。ClinVar 工具的一个问题在于其数据库中大多数临床上重要的突变(83%)都是某个家庭中独一无二的,或者非常罕见的。


2.在线搜索

搜索方式可以分为简单搜索和高级搜索。在该数据库中,提供了以下7种检索方式

  • gene symbols

  • HGVS expressions

  • protein change

  • rs number

  • disease

  • submitters

  • location on a chromosome

PTEN这个gene symbol为例,检索出的部分记录如下:

从结果中,我们可以获知这个基因多种信息,其中有:

  • 1.总体信息:在左侧栏目找到这个关键词的总体统计信息,同时这些信息也可以作为筛选条件而使用。

  • 2.变异和位置信息:可以发现基因的变异位置、变异类型(C>T还是其他)、所在染色体信息等。

  • 3.与其相关的疾病。

  • 4.变异频率:这个minor变异类型在不同数据库中的出现频率,如GO-ESP:0.00054(T)表示在ESP数据中含有“T”的等位基因频率为0.00054。

  • 5.临床意义:可以简单理解为这个突变对临床疾病的重要性。分为pathogenic(致病),likely benign(可能有害)等多个等级。

  • 6.审核状态:因为这些临床意义是提交者自己定义并且提交的,因此有可能会对数据有一定误导作用,通过对数据的审核,有助于加强数据的可靠性。但不是每个数据都会有审核。


2.1 Interpretation

这部分会给出突变位点的临床意义Clinical significance, 和相关数据库的链接,这些数据库通常包含MedGen, OMIM, dbSNP, PubMed等。

2.2 Allele

这部分会给出allel的详细信息,包括变异类型,HGVS表达式等信息。



2.3 Assertion and evidence details

这部分会给出详细临床信息


3.FTP下载

下载地址:[ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/](ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/)

image

下载代码


## ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/
mkdir -p ~/annotation/variation/human/clinvar
cd ~/annotation/variation/human/clinvar
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/disease_names
mkdir vcf_GRCh37 && cd vcf_GRCh37
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20170130.vcf.gz
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/common_and_clinical_20170130.vcf.gz
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/common_no_known_medical_impact_20170130.vcf.gzwget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20170228.vcf.gz
wget  ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20170228.vcf.gz.tbi

4.本地注释

~/biosoft/ANNOVAR/annovar/annotate_variation.pl -downdb -webfrom annovar -build hg19 -downdb clinvar_20170130 ~/biosoft/ANNOVAR/annovar/humandb/

~/biosoft/ANNOVAR/annovar/annotate_variation.pl --filter  -buildver hg19 -out clinvar_20170130_anno         -dbtype clinvar_20170130 jmzeng.annovar_input ~/biosoft/ANNOVAR/annovar/humandb/
wget https://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar_20180429.vcf.gz
wget https://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar_20180429.vcf.gz.tbi
java -jar  ~/biosoft/SnpEff/snpEff/SnpSift.jar  annotate clinvar_20180429.vcf.gz merge_snpeff.vcf >merge_clinvar.vcf

参考:

http://www.biotrainee.com/thread-991-1-1.html

http://www.bio-info-trainee.com/3321.html

https://www.clinicalgenome.org/site/assets/files/1594/landrum_clinvar.pdf

欢迎关注oddxix

有趣的灵魂等着你~

感谢关注


你可能感兴趣的:(【数据库-4】clinvar)