2022-03-02 #文献阅读-个体多基因风险评分评估存在较大的不确定性,影响了基于PRS的风险分层

一级标题个体多基因风险评分评估存在较大的不确定性,影响了基于PRS的风险分层

二级标题

五级标题
  • 列表第一项
  • 列表第二项
  1. 有序列表第一项
  2. 有序列表第二项
    标题
    [图片上传失败...(image-e2f728-1646232750719)]
    斜体
    粗体

引用段落

代码块

Large uncertainty in individual polygenic risk score estimation impacts PRS-based risk stratification

因属于算法类文章,不是很感兴趣,所以笔记不多。(太菜了,看不大懂,属于是)

结果:
1、提供了个体PRS方差的期望析估计量方法,来评估SNP遗传力、因果SNP数目和样本量。
2、显示了将个人PRS估计中的不确定性纳入后续分析的重要性。

做了什么:
1、首先,我们将LDpred2(参考24)的贝叶斯框架扩展到从个体的GV (GVi)的后验分布中取样,以估计(1)后验s.d.(?PRSi)和(2)不同ρ值的遗传值的ρ-level可信区间(ρGVi- ci)。

2、其次,我们引入了一种分析形式,将s.d.个体期望(?PRSi)作为遗传力、因果变量数量和训练数据样本大小的函数,并表明该分析形式在模拟和真实数据中是准确的。

3、第三,仿真结果表明,当目标样本与训练数据匹配时,ρGVi-CI得到了很好的校正,并且s.d.(?PRSi)随着多基因性(因果变量的数量)的增加、遗传度的增加和GW as样本容量的减少而增加。

4、通过分析英国生物库中的13个真实特征,我们发现个人PRS估计中存在很大的不确定性,这极大地影响了基于PRS的个人排名的可解释性。

5、最后,我们探索了一种将 PRS 不确定性纳入基于 PRS 的分层的概率方法,并展示了这种方法如何在不同的成本情景下实现有原则的风险分层。

图1 | LD和有限GWaS样本容量引入不确定性的PRS估计。

图1:我们模拟GWAS N个人跨3个snp LD结构R (SNP2和SNP3 LD 0.9而SNP1与其他不相关的SNPs), SNP1和SNP2因果效应大小相同的βc =(0.016, 0.016, 0)的方差解释为该地区是var (xTβc) = 0.5/1000,对应于总遗传力为0.5的性状均匀分布于1000个因果区域。。GWAS的边际效果观察,ˆβ,有期望的R c和variance-covarianceβ(σ2 e / N) R,从而展示统计噪声引入了有限样本大小的GWAS (N)。例如,边际GWAS的概率效应在标签SNP3超过真正的因果SNP2的边际效应,尽管它随着N的增加而减少,但对于现实样本和效应量来说,它仍然相当高(对于在1000个因果区域中分裂为h2g = 0.5的性状,在N = 100,000时,它占12%;我们考虑在GWAS中观察到的效应:ˆβGWAS =(0.016, 0.016, 0.016)。根据这样的观察,除了真正的因果效应(βc),其他的因果配置是可能的:β1 =(0.016, 0, 0.016)或β2 =(0.016, 0.008, 0.008)。基因型xi =(0,1,0)⊤的个体在这些不同的因果配置下会获得不同的PRS估计。最重要的是,在缺乏其他先验信息的情况下,β1和βc在该数据下是等可能的,从而导致对个体xi =(0,1,0)的不同PRS估计。

图2基于概率prs分层的贝叶斯方法不确定性提取框架

a,从LDpred2求不确定度的过程。LDpred2使用MCMC对给定GWAS边际效应、LD和先验因果效应的后验因果效应分布进行采样。它输出用于估计后验均值遗传值的因果效应的后验均值(PRS点估计)。我们的框架样本来自后验的因果效应,以近似后验分布的遗传值。密度图表示个体GV的后验分布。阴影区域表示ρ级CI。圆点代表后验平均值。b,基于概率prs的分层框架。给定一个阈值t,基于概率prs的分层方法不是二分法将个体分为阈上(?PRSi >t)和阈下(?PRSi≤t)两组(左),而是给每个个体分配一个阈上Pr(GVi > t)的概率(右)。

你可能感兴趣的:(2022-03-02 #文献阅读-个体多基因风险评分评估存在较大的不确定性,影响了基于PRS的风险分层)