PsyMuKB:发育障碍的整合DNV知识库

PsyMuKB:An Integrative De Novo Variant Knowledge Base for Developmental Disorders

PsyMuKB

摘要

DNV对发育和神经精神障碍疾病至关重要,但是关于DNV在isoform水平上的影响研究不足。大脑中的可变剪切出现较多,需要在转录调控水平上解释神经性疾病。因此:NeuroPsychiatric Mutation Knowledge Base(PsyMuKB)开发的其中一个目的是用于提高对变异在isoform水平上的解释。

PsyMuKB

tips:1、isoform:特指某个基因的众多可变剪切变异中的一个,暗示有多个isoforms。也即同一个基因的不同版本的蛋白。
2、可变剪切:可变剪切differential splicing,也叫做选择性剪切alternative splicing, 指的是在mRNA前体到成熟mRNA的过程当中,不同的剪切方式使得同一个基因可以产生多个不同的成熟mRNA, 最终产生不同的蛋白质。

introduction

研究背景:

DNV发生于配子形成阶段。

DNV :de novo variant
DNM :de novo mutation()
SNV : single-nucleotide variant
indel : small insertions and deletions
de novo CNV : larger structural variations in DNVs

*de novo* variants

isoforms

isoforms在大脑组织中发生更频繁,可以影响细胞命运

二者的联系

组织特异性isoforms和疾病突变的关联研究对疾病理解至关重要。大脑中的isoforms和DNMs之间关系的研究不足。

PsyMuKB

可以探究在DNP疾病中组织特异性调控和DNV之间的关联。


Flowchart of PsyMuKB

数据收集

1、DNV数据

收集了123个研究中的DNV信息,将得到的DNM进行质控,利用ANNOVAR标记平台注释,对非编码区增加DeepSea scores,同时对每个基因加入the Haploinsufficiency Score和the probability of being loss of function (LoF) intolerant (pLI) score。

2、表达数据

基因表达数据

来源:GTEx, BrainSpan,human embryonic prefrontal cortex single-cell expressions,adult mouse brain single-cell expression atlas data(
为了将突变和表达数据联系起来,将DNM在基因组位置映射到每个表达基因亚型的外显子-内含子结构上。

蛋白表达数据

来源:ProteomicsDB
为了将突变与大脑中表达的蛋白质亚型关联,先将突变的基因组位置映射到所有Gencode mRNA转录本;之后将Gencode mRNA转录本ID和UniProt ID连接起来,用来识别proteomicsDB提供的蛋白isoforms表达数据。最后,通过UniPort ID将表达数据映射到所有的蛋白及其isoform中,并将所有蛋白表达信息按照不同的组织类型绘制直方图。

3、调控元件处理和突变映射

tips:什么是调控元件
该网站提供了调控元件注释,帮助研究非编码突变是否击中调控元件,潜在影响下游基因或者isoform。做法:将位于基因组非编码区域的DNM映射到所有的调控区域,作为注释的一部分。

4、相互作用数据处理

利用PPI网络做注释

数据库结构设计

工具 作用
MongoDB 大数据平台
python web界面和可视化
plotly 表达可视化,调控元件映射
cytoscape.js 相互作用可视化
muPIT 3D蛋白标记突变位置

数据库内容和使用

数据库简介

突变统计

包含DNM和de novoCNV,涉及20+种癌症类型以及对照样本。

新颖性

DBDde novo-dbNPdenovo做了比较,无论临床表型和变异类型,都有了更加全面的DNVs,并集成了不同级别的基因组和蛋白质组注释。

网站介绍

搜索方式:‘‘Gene IDs” or ‘‘Gene symbols”, ‘‘Chromosomal regions”, and ‘‘Variants”.

在isoform水平上探究突变:

首先按确定19%的DNM是isoform特异的
然后评估组织特异性亚型在DNMs中的重要性,按照longest term ,non-brain expression和brain-expression分类。
最终说明疾病变异体在isoform水平和组织特异性上的影响是重要的

总结

PsyMuKB侧重于探索和描述DNV数据的综合注释,例如isoforms、expression、蛋白质交互和蛋白质结构。PsyMuKB的目标是成为在研究变异时考虑到不同组织的亚型特异性的知识库,因为一个特定的变异可能在转录和翻译级别上对交替剪接和调控的亚型产生不同的影响。

禁止转载,如有需要,请简信联系作者!

你可能感兴趣的:(PsyMuKB:发育障碍的整合DNV知识库)