如何做GWAS关联分析

全基因组关联分析(genome wide association study, GWAS) 是利用全基因组范围内筛选出高密度的分子标记对所研究的群体进行扫描, 分析扫描得出的分子标记数据与表型性状之间关联关系的方法。GWAS的出现为全面系统地研究基因组学掀开了新的一页, 目前主要应用于人类疾病复杂性状的分析, 已鉴定出大量与人类复杂疾病或数量性状相关的遗传变异, 成为研究人类基因组学的关键手段。在植物基因组中的研究应用也取得了良好的效果, 应用GWAS发掘植物复杂数量性状基因、为植物分子育种提供依据已成为国际植物基yans因组学研究的热点。

在动植物研究中,GWAS相对于传统的传统的利用遗传图谱做QTL定位有很多优势:

节约时间 无需构建遗传群体,GWAS自然群体或者种质资源直接可以用于关联分析;

定位精确,人工群体由于群体大小限制,重组不充分定位区间往往很大,而GWAS使用自然群体都经过长时间多世代的繁衍基因组重组充分,关联定位准确;

GWAS中表型性状变异丰富,只要群体足够大,可以涵盖几乎所有的表型性状,因此GWAS可以关联任何性状,而人工群体由于群体遗传背景单一,如果父母本中某些表型不存在就无法定位该性状。

GWAS关联分析常常登陆顶级期刊:

案例1:GB -苦荞-2021群体+gwas文章


基础数据:510份苦荞种质,包括32份野生种质、478份地方种质和7份荞麦属种质。本研究对全球14个国家的510份苦荞种质资源进行了测序分析,共生成原始数据3.98 Tb,平均测序深度为12.65X,基因组覆盖率为91.72%。最终鉴定了1,095,748个SNP和116,516个InDel。

案例2:NC –梨-2021群体gwas文章

基础数据:312个沙梨(Pyrus pyrifolia)品系进行了测序,其中231个品系是本地品种(landrace),81个品系是改进的栽培种(improved cultivar)。总测序量产出为2.15Tb数据,经过比对参考基因组、变异检测以及变异过滤之后得到340万个SNP(单核苷酸突变)用于下游研究。(值得注意的是,本研究中使用的参考基因组是白梨Pyrus bretschneideri,数据与参考基因组的平均比对率是73.5%,这在涉及不同品系和品种的重测序研究当中,是一个可以接受的数字。)在系统发育与群体结构的分析当中,显示出选择的梨品系大致区分成两类(中国品系Group I和日韩品系Group II)。

案例3:NC –毛竹-2021群体gwas文章

基础数据:毛竹(Phyllostachys edulis)是世界上最重要的竹种,在我国主要分布于华南地区。本研究中,作者对来自15个代表性地理区域的427份毛竹进行全基因组重测序,构建了毛竹基因组变异图谱,进行了种群进化分析,并对9个重要性状进行全基因组关联分析以确定候选基因,揭示了这一无性繁殖物种的群体多样性,为了解毛竹进化和农业重要性状的遗传机制提供了基础与资源。427份来自于15个代表性区域的毛竹种质与近缘种Phyllostachys kwangsiensis,Illumina测序(平均20X)获得16.60TB数据。

GWAS关联分析课程推出:

为方便大家快速掌握GWAS分析,我们组学大讲堂推出GWAS分析课程,课程主要内容和课程特色:

GWAS分析原理解读

GWAS分析多软件多模型关联分析(tassel,GAPIT,EMMAX,GEMMA)

众多模型支持(GLM MLM CMLM ECMLM SUPER FarmCPU Blink FaST EMMA EMMAx GEMMA等)

课程采用docker镜像,软件安装一键搞定,数据分析无障碍

绘图命令脚本打包,快速出图,并可根据参数个性化设置,如下面两个配色的Manhattan图

图片精心调制,发表级图片输出:

你可能感兴趣的:(如何做GWAS关联分析)