dbvar:染色体结构变异数据库

欢迎关注”生信修炼手册”!

染色体结构变异structural variation(SV), 被定义为1kb以上范围的DNA结构变化,通常包括缺失,重复,倒位,易位,当然也包含拷贝数变异(CNV), 染色体的结构变异来源于内因或者外因的作用,很多疾病就是由于染色体结构变异导致的,环境因素也可以诱导产生结构变异。

CMT是一种神经系统疾病,影响大脑和脊髓外的外周神经系统,主要表现为腿部肌肉萎缩,行走困难,可能出现足弓变高,足部畸形等症状,科学研究发现,该疾病与17号染色体上一段结构变异相关,示意如下

dbvar:染色体结构变异数据库_第1张图片

两个同源染色体的不平等交叉产生了两种基因型,基因型A包含了PMP22基因的3个拷贝,而基因型B包含了PM22基因的单拷贝,基因型A的个体就会发生CMT, 基因型B的个体则易感压力性麻痹HNPP。

dbvar数据库收录了来自多个研究项目的结构变异结构,网址如下

https://www.ncbi.nlm.nih.gov/dbvar/

在该数据库中,数据分为以下3个层级

  1. study,用std表示, 代表一个研究项目,该项目包含了一组结构变异分析结果,每个study有一个唯一的编号,如果来自NCBI,则以nstd开头,如果来自EBI,则以estd开头

  2. variant regions, 用sv表示,代表存在结构变异的基因组区域,同样有一个唯一的编号,如果来自NCBI,则以nsv开头,如果来自EBI,则以esv开头

  3. variant calls, 用ssv表示,代表一个具体的结构变异事件,包含了缺失,重复,CNV等多种类型,同样有一个唯一的编号,如果来自NCBI,则以nssv开头,如果来自EBI,则以essv开头

variant region与variant call的对应关系如下,一段染色体区域可以存在多个结构变异事件

dbvar:染色体结构变异数据库_第2张图片

通过Study Browser菜单,可以以study为单位查看相关的结构变异信息,示意如下

dbvar:染色体结构变异数据库_第3张图片

通过Genomes Browser菜单,可以在基因组浏览器中查看相关的结构变异信息,示意如下

dbvar:染色体结构变异数据库_第4张图片

该数据库是可以免费下载的,ftp地址如下

ftp://ftp.ncbi.nlm.nih.gov/pub/dbVar/data/Homo_sapiens/by_study

dbvar:染色体结构变异数据库_第5张图片

提供了VCF, CSV, TSV等多种格式,dbvar与来自EBI的DGVa是互作关系,共同提供了包含健康人类与患病人类的结构变异信息,而DGV数据库则只包含了健康人群的染色体结构变异信息。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

你可能感兴趣的:(数据库,大数据,人工智能,编程语言,数据分析)