精细定位——降低 GWAS的复杂度

今天跟大家分享的是16年1月发表在Cell Cycle(IF=3.530)上的一篇perspective前瞻性文章 Reducing GWAS Complexity (https://doi.org/10.1080/15384101.2015.1120928)

精细定位——降低 GWAS的复杂度_第1张图片

一句话总结:用精细定位来缩小候选功能SNPs的范围

关键词:GWAS; SNP; Cancer; chromatin; non-coding DNA; enhancer; fine-mapping

随着测序成本的不断降低和meta分析的应用,复杂表型相关的GWAS在大样本数据的处理中越来越强大,越来越多MAF很低的SNPs被鉴定出来。这些候选risk SNPs之间由于LD相互关联,使得给定locus的关联分析变得复杂,更何况超过90%的risk SNPs位于非编码的DNA序列中。

为了解决以上问题,作者结合染色体的生物特征(chromatin biofeatures)去确认GWAS最初发掘的SNPs的潜在功能。这些SNP被称为索引SNP (index SNPs),之后由r2计算LD后得到的SNPs,被称为替代SNP (surrogate SNPs)。许多软件FunciSNP RegulomeDB, Haploreg, Annovar, IGV以及最新的FunSeq8和motifbreakR9 可以根据染色体的注释信息对risk SNPs进行重新定位,这会大大减少SNP的数目(表1)。在过去的几年里,作者把这个注释方法成功运用到前列腺癌和乳腺癌的risk regions筛选中。

精细定位——降低 GWAS的复杂度_第2张图片

尽管此方法把候选SNP数目从50,000筛到了500,再到平均10个(中位数是5)和前列腺癌相关的risk SNPs,但这10个SNP仍需要一一进行详细和全面的湿实验验证。精细定位(fine-mapping) 的新方法可以解决这个问题(来减少实验量)。

除了p值,有许多新的分析方法来统计筛选候选SNP,比如贝叶斯和重新采样(re-sampling approaches)方法(原文如下,不太好翻译,但是很重要

“These methods include Bayesian and re-sampling approaches that formally incorporate the uncertainty in estimation and ranking, model selection approaches to condition on multiple SNPs in the region using either individual-level data or marginal test statistics, and approaches that formally incorporate prior information, such as SNP annotation, into the final inference.”

最近,作者和他人合作,使用多种族人群、单一大型欧洲人群数据对前列腺癌风险区进行了精细定位,降低了每个区域候选risk SNP的数量(表1)。FunciSNP3注释的功能和2个精细作图研究,进一步减少了共同候选SNP的数量,平均每个区域只有大约2个SNP(表1)。这意味着,如果没有功能性的注释或精细定位,每个位点都有大量的假阳性结果,从而导致与risk无关的功能分析。Ultimately SNPs must be func- tional to be causal, but not all functional SNPs are inevitably involved in risk.

然而,即使有精细作图的数据在手,当多个功能性SNP位于单一基因座上且其中只有一个对疾病有主效作用时,下游分析也会变得复杂。也可能是多个变异位点效应互补,亦或是某一特定疾病位点的病因靶组织位于原发组织的外部。

举个例子,除了前列腺上皮细胞的失调,前列腺癌可能还受到免疫细胞的影响。这可以解释,为什么现有的前列腺上皮表观基因组学数据中大约1/3的风险位点 (risk loci) 没有功能。此外,浆液性卵巢癌中精细作图的risk SNP 富集在FTSE (fallopian tube serous epithelium) 原生代细胞系而并非卵巢浆液性上皮细胞系,表明该组织是由FTSE起源而来的,因此作者预计多个候选组织(或所有已知细胞类型)之间的比较将成为该领域的标准。Thus, in the midst of so much uncertainty, it is essential that biological assays give repeatable and reliable measures of these complex interactions。必须强调的是,单独的功能注释显然不是全面的,其他与染色质有关的未知功能在将来也会被考虑。最终目标是在每个risk位点鉴定出真正的功能/致病性SNP(具有超过1个SNP或多个causal等位基因)。实现这一目标需要开发特定的检测方法,一旦相应的表观基因组(或其他)的变异功能得到验证,即可检测等位基因对对癌症进程的影响。The eventual utility from this will be the compilation of more informative nomograms for risk assess- ments and the identification of risk mechanisms.

参考文献:

见原文

扩展阅读:

GWAS – Science topic

What is the Perspectives?  From New Journal of Chemistry

Perspectives are brief reviews giving the personal viewpoint of a leading scientist in their area of research, setting it in the context of the work of others and looking forward to future developments.

In some cases, pairs of collaborating scientists from different disciplines are invited to each give their perspective on their common field of research in order to demonstrate the benefits of collaborative research and facilitate dialogue between communities.

The majority of Perspectives are invited by the editorial office, however suggestions of suitable Perspectives in the form of a brief synopsis and biography of the author, are welcome.

你可能感兴趣的:(精细定位——降低 GWAS的复杂度)