2021-09-27

Cell | 3'UTR变体的全基因组功能筛查--揭示人类疾病与进化驱动因素

原创 huacishu 图灵基因 今天

收录于话题#前沿生物大数据分析

撰文:huacishu

IF=41.581

推荐度:⭐⭐⭐⭐⭐

亮点:

1、作者开发了3′非翻译区(3UTR)大规模平行报告基因测定法(MPRAu),能够灵敏地测定121733UTR变异。

2、作者将MPRAu应用于六个人类细胞系,重点研究与全基因组关联研究(GWAS)和人类进化适应有关的遗传变异。

3、作者揭示了数百个3UTR的因果变体,这些变体在遗传学上有细微的表型关联,并报道了年龄相关性黄斑变性中转录变化的一个因果变体。


近日哈佛大学系统生物学中心Sabeti博士团队在国际知名期刊cell在线发表题为“Genome-wide functional screen of 3’UTR variants uncovers causal variants for human disease and evolution”的研究论文。3'非翻译区(3'UTR)变异与人类疾病密切相关,但是它们之间的因果关系还没有被完全确定。作者开发了3'UTR的大规模平行报告分析(MPRAu),来解析12173个3'UTR变体。将MPRAu应用于六种人类细胞系,重点关注与全基因组关联研究(GWAS)和人类进化适应相关的遗传变异。MPRAu扩展了对3'UTR功能的理解,表明简单序列主要阐释3'UTR调节活性。采用MPRAu来揭示碱基对分辨率的不同分子机制,包括富含腺苷酸尿苷酸(AU)的LEPR元素与东亚人潜在的代谢进化的适应有关。推荐了数百个3'UTR变异体,这些变异体具有遗传精细定位的表型关联。利用内源性等位基因替换,继而描述了一种干扰调节病毒防御基因TRIM14的miRNA位点的变体和一种改变PILRB丰度的变体,指出了导致年龄相关性黄斑变性转录变化的原因变体。

应用MPRAu系统地评估了来自3'UTR的遗传变异的功能效应。为此,作者设计并合成了100个来自人类3'UTR的碱基对(bp)寡核苷酸,以变体的“参考”(ref)或“替代”(alt)等位基因为中心(图1A),用于MPRAu的测试。首先试图确保分析能够再现预期的3'UTR生物学效应。与3'UTR抑制转录表达的主要调节功能一致,所有MPRAu测试的3'UTR的主要作用是降低mRNA丰度(图1B)。在所有细胞类型的实验复制之间的标准化RNA读取计数的强相关性中可重复观察到该效应(图1C)。作者确信该分析能够评估具有调节活性的寡核苷酸,然后通过比较相同3'UTR等位基因之间的表达变化来确定改变3'UTR功能的tamVars(图1D)。在所有细胞类型中共发现2368个tamVars。为了评估tamVars的细胞特异性,应用mash发现tamVars在所有六种细胞类型(81.2%)中大部分是共享的,而对一种细胞类型(1.6%)具有特异性(图1E、1F)。对转染了测试文库子集的HEK293细胞进行了分析,发现RNA表达与稳态RNA表达高度相关。此外,多体RNA和稳态RNA之间的变异效应是一致的。为了证明变异效应可直接翻译到蛋白质水平,还通过荧光素酶分析测试了tamVar和非tamVar对照的子集。结果观察到荧光素酶发光分析与MPRAu测量的大范围效应大小的等位基因偏斜(图1G)之间存在强烈的相关性,这也突出了MPRAu在低通量荧光素酶方法中对3'UTR变异效应进行分类的能力,多聚体分析和荧光素酶与MPRAu的一致性表明,该分析的RNA丰度测量在表型水平上是有意义的。

为了证实MPRAu效应与3'UTR生物学的分子机制一致,作者分析了整个寡核苷酸序列的特征。结果发现鸟嘌呤胞嘧啶(GC)含量和二级结构与衰减水平正相关(图2A)。这一发现可以解释为高GC含量和结构性在RBP占有率中的作用,从而解释其功能性。在更精细的序列水平上,MPRAu从经验RBP基序和预测的miRNA基序的存在中捕捉到预期的衰减和增强效应。如富含腺苷酸尿苷酸(AU)的元件和miRNA基序等调控特征对表达表现出预期的衰减效应(图2B)。干扰这些预测元素的变体消除了功能效应(图2B)。强调MPRAu捕捉内源性干扰效应的能力,具有高背景活性的寡核苷酸和具有高等位基因偏斜的变体也主要存在于体内RBP占有率特征升高的区域(图2C)。作者发现,给定在细胞系中转录水平的衰减和等位基因倾斜通常由该细胞系中大量表达的miRNA决定,这证明了MPRAu捕获甚至相对罕见的细胞类型特异性效应的能力(图2D)。这些数据共同证明了MPRAu检测已知3'UTR细胞类型特异性调节机制作用的能力。

在确定了MPRAu转录水平下的关键3'UTR特征后,作者训练了测试序列的预测模型,并比较了几种分类模型的敏感性和特异性,以预测活性减弱的3'UTR元件。结果发现该模型在所有模型类型中表现良好,平均精度为0.23–0.48,接收器工作特性曲线下的面积为0.67–0.79(图3A和3B)。值得注意的是,最佳模型比其他几个测试的分类模型表现得更好,包括使用百分比U的单变量控制模型。从仅使用序列特异性注释的模型中,发现几个特征对于使用Shapley加法注释(SHAP)进行预测非常重要。这些特征包括均多聚物长度、序列多样性以及与尿嘧啶含量相关的各种特征,如U/UC百分比和UA/UU二核苷酸计数(图3C)。通过研究这些重要特征的个体效应,发现mfe与衰减预测呈单调负相关。还发现百分比GC与mfe反相关,因此与衰减呈正相关(图3D)。具体而言,较长的尿嘧啶多聚物表现出最弱的活性(图3D),与它们作为许多RBP结合基序的功能一致。衰减的识别特征可能有助于构建具有精确表达水平的合成3'UTR。

接下来将GM12878中的tamVars与Geuvadis RNA测序(RNA seq)数据集中杂合子个体的细胞类型匹配等位基因特异性表达(ASE)数据进行比较,并使用此比较来估计分析中tamVars的阳性预测值(PPV)。结果观察到TamVar和内源性观察到的ASE之间具有中等强度的一致性(图4A)。接着扩展了分析,将TamVar与组织EQTL进行比较,从遗传精细定位中获得了假定的因果等位基因。通过聚集不同细胞类型和组织的等位基因效应,观察到具有高因果关系概率的变体在聚集MPRAu和GTEx中间效应大小之间的方向性上显示出显著一致性(图4B)。随着因果关系(PIP)阈值的增加,MPRAu功能更加丰富(图4C)。这表明,除了引起体内基因表达变化外,研究中确定的TamVar具有表型效应,MPRAu是关联研究的有力方法。当将MPRAu等位基因偏斜与罕见变异功能指标进行比较时,观察到显著的正相关(图4D)。这一发现表明,MPRAu可以识别常见和罕见的3'UTR变体的功能,而现代关联研究的检测能力较低。

作者发现3'UTR拼接有助于识别RBP序列基序。rs16975240(CIBAR2)显示出强烈的等位基因倾斜,ref等位基因表现出强烈的表达衰减。然而,alt等位基因表现出一种静音效应,这表明衰减元件的扰动。在ref背景上,变量位置和上游10个基点之间的删除确定了这样一个元素,当删除该元素时,会减轻这种衰减。正如在alt背景中所预期的,相同序列的删除产生的变化最小。饱和突变在ref区域发现了一个10 bp的基序,与U1小核核糖核蛋白(snRNP)结合序列一致性完全匹配(图5A)。在alt背景下,tamVar周围45 bp窗口内的删除将表达恢复到接近ref水平,这表明存在重叠的功能元素。RNAfold预测该区域的茎环结构,可能介导这种衰减(图5B)。这两个3'UTR等位基因都表现出衰减,但alt等位基因表现出明显更强的效应,这在荧光素酶分析中得到了验证。缺失映射了一个25 bp的富含AU元素,该元素由已知施加衰减效应的AUUUA五聚体重复组成(图5C)。

rs705866(PILRB)与年龄相关性黄斑变性相关,位于从标签SNP到强LD的151个SNP中(图6A)。MPRAu鉴定了ref等位基因的暗示等位基因效应,该等位基因对表达具有减弱作用(图6B)。为了证实内源性基因组背景下的MPRAu等位基因效应,使用CRISPR对神经元SK-N-SH细胞中的rs705866进行等位基因替换。将来自具有所需编辑的细胞的RNA和DNA的等位基因比率与未受干扰的细胞进行比较,发现等位基因倾斜与MPRAu测量的效应一致(图6C)。研究该变异的序列背景表明,它可能与几个RBP或一个miRNA结合。基因组显示rs1059273周围的扩展单体型杂合性得分,但识别因果等位基因仍然很困难(图6D)。MPRAu确定了ref背景的衰减效应,但未确定alt(图6E)。rs1059273破坏miRNA结合位点(hsa-miR-142-3p),可能解释alt等位基因的高表达(图6E)。转染miRNA抑制剂消除了使用阴性对照抑制剂未观察到的等位基因歪斜(图6F),提供了hsa-miR-142-3p在机制上对等位基因倾斜的证据。

作者开发的MPRAu,这是一种高通量的工具,可以从功能上描述3'UTR变体,并使用它来识别2368个3'UTR变体,这些变体在六个细胞系中调节转录物的丰度。作者建立了3'UTR功能的强大预测模型,并确定了3'UTR调节模式。作者预计MPRAu将成为一种常见的实验模式,用于测试意义未知的变异和未来罕见的变异。将来,MPRAu可能会进一步修改,以特异性检测影响特定调控机制的变体,如转录终止或mRNA定位,以及研究已经鉴定的许多TamVar的miRNA/RBP机制。虽然目前的检测方法并不是最佳的设计来获得3'UTR变异对APA的影响,但未来的修改也可以让人们更全面地检测这些变异功能。总的来说,MPRAu提供了一个框架,用于根据功能对3'UTR的监管变化进行优先排序。该研究有助于进一步更全面地理解非编码变异功能的重要调控过程。

教授介绍

Sabeti博士是哈佛大学系统生物学中心以及生物和进化生物学的教授,也是麻省理工学院和哈佛大学博德研究所的成员。Pardis Sabeti从事计算遗传学和传染病研究,主要研究领域有两个。首先,Sabeti和她的团队开发了研究人员可以轻松利用的方法和工具,以打开人类基因组生物学和医学研究的新领域。其次,他们综合了来自广泛不同领域的见解和工具——如人类基因组学、病毒测序、信息理论——以创建检测、控制和治疗致命病毒性疾病的综合方法。他们的努力包括应对埃博拉、寨卡、腮腺炎和新冠病毒的传播。以通讯作者在相关杂志上发表论文多篇。

参考文献

Griesemer D, Xue JR, Reilly SK, et al. Genome-wide functional screen of3'UTR variants uncovers causal variants for human disease and evolution. Cell.2021;S0092-8674(21)00999-5. doi:10.1016/j.cell.2021.08.025

你可能感兴趣的:(2021-09-27)