Transcriptional noise ratio(转录噪音比例)

在一篇文章中,在研究young和old 的小鼠的过程中,提到了old的样本的转录噪音增加的问题。这篇文章的名字是《An atlas of the aging lung mapped by single celltranscriptomics and deep tissue proteomics》,有兴趣的话大家可以下载看一看。在这里我们就讨论一下什么是Transcriptional noise和Transcriptional noise ratio(转录噪音比例)

什么是Transcriptional noise?

举一个简单的例子,随着年龄的增加,研究发现转录有了更大的不稳定性,也是就是准确转录出稳定、准确、成熟的mRNA的概率开始下降,而转录出细胞不需要的mRNA的概率开始增加,这种转录过程发生的不稳定性而导致产生“垃圾”mRNA,就叫做转录噪音。转录噪音的增加对细胞是有害的,有可能会造成细胞不能发育成预期的细胞,转变了细胞的“命运”,也可能会在组织中增加新的细胞类型,而新的细胞类型往往是有害的!

Transcriptional noise是如何评估的?

对与经常做单细胞转录组的童鞋来说,对于细胞分群和定义并不陌生,当我们在研究young和old的细胞类型的过程中,转录噪音是我们可以分析的一个重要环节,这次我们来分享一下这篇文章中是如何量化转录噪音。
对于具有至少10个old细胞和young细胞的每种细胞类型,我们按以下方式量化转录噪声:
(1)For each cell type with at least 10 old and young cells, we
quantified transcriptional noise in the following manner. To account for differences in total UMI counts, all cells were downsampled so that all cells had equal number of total UMI counts. To account for differences in cell-type frequency, cell numbers were down-sampled so that equal numbers of young and old cells were used.(这一步使得每个用于分析的细胞具有相同的UMI counts,以及young和old的细胞类型具有相同的数量)
(2)接下来,根据平均表达将基因分为10个大小相等的bins,并排除top and bottom bin。在每个bin内,选择变异系数最低的基因的10%。Subsampled raw count data were reduced to this set of genes and square-root transformed(这一步的目的在于进行使用表达稳定的基因用于比较)。
(3)接下来,计算每个年龄段内每个细胞和细胞类型之间的欧式距离([欧氏距离](https://www.cnblogs.com/xregan/p/11006912.html)),该欧氏距离用作每个细胞转录噪声的一种量度,此外,将每只young or old小鼠样本得到的欧氏距离取平均值,and calculated the transcriptional noise ratio between young and old mice.
(4)Alternatively, we calculated Spearman's correlation coefficients on the down-sampled expression matrices across all genes between all pairwise cell comparisons within each cell type and age group(这一步用于计算相关性,确定转录噪音结果的准确性。To be consistent with the sign of the metric we used 1–Spearman correlation coefficient as the second measure of transcriptional noise.
(5)为了统计评估每种细胞类型中转录噪声与年龄之间的关联,我们使用了Wilcoxon的秩和检验。随后使用R函数p.adjust()实现的Bonferroni-Hochberg方法对p值进行多次测试的校正。

Transcriptional noise ratio(转录噪音比例)_第1张图片
Transcriptional noise.png


这次我补充一下具体的转录噪音的算法。
(1)首先,我们计算了生物学变异bijk = 1-cor(xijk,uij),其中ui是第i类细胞,患者j的平均表达向量,xijk是第i类细胞,患者j的细胞的表达向量。
(2)接下来我们计算了相关技术变化tijk =1-cor(xcontrijk,ucontr),其中xcontrijk是样本的表达向量而ucontr是样本的平均表达向量。
(3)最终度量为bijk / tijk-生物噪声占技术噪声的比例。细胞在细胞类型中按此距离排序,并将其归一化用于线性回归。
(4)对于每个样本间的衡量,我们还首先将细胞分为细胞类型,并计算每种细胞类型的平均表达向量。然后,我们计算每个细胞及其对应的细胞类型均值向量之间的欧几里得距离,各个数据点汇总为箱线图(如上图的箱线图)。最后,作为一种测量单个细胞转录噪声的替代方法,我们首先将基因counts列表二次采样至每个细胞100000个counts。然后,我们在平均表达范围内平均选择了一组不变基因。首先,我们通过平均丰度将基因分类到10个大小相等的bin中,然后从每个区域中选择CV最低的基因的10%,并排除top and bottom bin。然后,我们使用这些基因来确定从每个细胞到所有细胞的平均轮廓的欧几里得距离。
(5)为了确定其mRNA丰度显着取决于转录不稳定性的基因,我们对CPM值使用了linear rank regression回归。使用Benjamini&Hochberg的FDR程序(FDR <1E-15作为显着性临界值)对p值进行多次测试进行调整,并按其系数排序。


各位小伙伴们,如果我们在研究年龄对我们细胞组织造成的影响,转录噪音是一个很好的指标。希望各位道友多多提提相关意见,共同学习和进步。

你可能感兴趣的:(Transcriptional noise ratio(转录噪音比例))