2022-08-12

Nature Methods | 深度学习编码蛋白质亚细胞定位的高分辨率特征

原创 风不止步 图灵基因 2022-08-12 10:54 发表于浙江

收录于合集#前沿生物大数据分析


撰文:风不止步

IF=47.99

推荐度:⭐⭐⭐⭐⭐

亮点:

文章开发了一个新的计算软件包LORALS,通过长读等位基因特异性来分析转录组上罕见和常见变异的遗传效应。


2022年8月3日,哈弗医学院的Beryl Cummings博士等人在《Nature Methods》上发表了一篇“Transcriptome variation in human tissues revealed by long-read sequencing”的文章,文章使用牛津纳米孔技术从来自GTEx组织和细胞系的88个样本挖掘了一个大型的人类长阅读RNA序列数据集,补充了GTEx资源。


通过RNA剪接和5' /3'非翻译区 (UTR)的差异导致转录结构变化是基因调控的一个关键特征。转录结构的破坏在人类疾病中具有重要作用,剪接变化相关的遗传变异丰富常见疾病的全基因组关联,并与许多孟德尔疾病有关。影响转录结构的常见遗传变异可以通过转录比率和剪接数量性状基因座(trQTL和sQTL)分析来绘制,进一步表明影响基因表达水平和剪接的遗传变异往往是不同的。一种用于分析遗传调控效应的正交方法,即等位基因特异性表达(ASE)分析,已被证明是研究罕见遗传变异的一种高度敏感的方法。然而,这些方法对短读数据的应用依赖于完整转录结构和量化。此外,大多数指标仅试图量化可变剪接,尽管 UTR在疾病中的关键作用已被证明。长读长RNA测序技术现已达到成熟阶段,已用于研究转录本结构和新转录本,以及早期等位基因特异性分析。因此,通过长读长转录组数据实现的等位基因特异性转录本结构 (ASTS) 分析可以提供重要的新信息,说明罕见和常见变异如何影响转录本结构和疾病风险。

图1:数据集的概述和质量控制。


研究展示了迄今为止最大的长读长RNA-seq数据集,使用来自GTEx项目收集的细胞系和人体组织的材料。发现新的转录本这件事可能是由于样本量大和组织多样性,与发现的大量组织特异性新转录本一致。在高通量质谱蛋白质组数据中新转录本的高验证率下,数据对人类转录本注释做出重要贡献。将长读长研究扩展到更多的组织和细胞类型,加上更广泛的验证工作,将有助于理解不同类型转录本变化的调节机制、不同转录本可产生的功能不同的蛋白质亚型,以及改进的变异注释,正如所证明的那样。

图2:新转录本的发现和组织之间的比较。


长读取提供在转录本上绘制等位基因效应的能力,而不仅仅是表达,从而提供分析遗传变异对转录本的顺式效应的机会。作者开发了LORALS,一个专门针对长读长等位基因分析工具包,考虑到该技术固有的各种偏差。它适用于任何长读数据,改进该领域以前的工作。观察到大多数ASTS事件与ASE相吻合,这表明对转录物使用的遗传影响很少通过相互翻转的转录物表达发生,但通常伴随着总表达水平的变化,例如通过特定转录物的稳定性改变。

图3:长读数据的等位基因分析。


然而,ASTS与ASE以及表现为ASTS的eQTL的广泛共存与多个QTL作图研究不一致,这些研究确定表达和剪接受不同的调节变体和过程的影响。在ASTS数据中区分确切的替代转录结构事件的能力,可发现等位基因特异性5'差异是导致eQTL表现在转录结构变化中的原因,而表达和剪接确实是高度独立的。鉴于启动子差异极大地影响基因表达水平并且大多数sQTL作图方法不能捕获UTR变异,这解释sQTL和eQTL的因果变体之间的低重叠以及ASTS与ASE和eQTL的重叠。

图4:通过新转录本和等位基因特异性转录本结构分析进行变异解释。


结果促进对分析转录组重要性的新认识,而不是在基因水平或不精确定义的剪接,而是对特定转录物、它们的变化和组合的详细表征。这些特征容易被长读物捕捉到。鉴于影响转录结构的遗传变异在疾病风险中的重要作用,预计使用长读长数据对转录组进行高分辨率表征将是发现疾病相关变异调控机制的重要方法。

教授介绍


Beryl Cummings博士

Beryl博士从哈佛医学院的生物和生物医学科学项目获得博士学位,从事医学和人口遗传学项目和ATGU工作,在Broad研究所完成了人类遗传学博士学位,是基因组聚合数据库(gnomAD)团队的一员。动机是不断学习在药物发现中利用人类遗传学的最佳方法,并热衷于为罕见病家族带来新疗法。Beryl是Daniel MacArthur和Mark Daly指导的研究员。研究重点是功能基因组学的整合,特别是转录组测序与遗传变异解释的整合。

参考文献

Dafni A Glinos, Garrett Garborcauskas et al.Transcriptome variation in human tissues revealed by long-read sequencing(2022)

你可能感兴趣的:(2022-08-12)