连锁不平衡 LD

1.2 连锁不平衡 LD

1.2.1 r 2 r^2 r2 D ′ D' D

LD,两种测量, r 2 r^2 r2 D ′ D' D

r 2 r^2 r2指的是两个SNP之间等位基因相关系数的平方,介于0和1之间,它是对两个标记之间共享信息的统计度量,通常用于确定一个SNP作为另一个SNP代理的效果。

D ′ D' D,种群遗传指标,在O和1之间,表明SNP之间的重组概率。 D ′ D' D=0,表明完全的连锁平衡和频繁的重组, D ′ D' D=1,表明两个变异之间不发生重组,处于完全连锁不平衡状态。

--ld,plink命令,检查一对变异之间的相关性,每个单倍型的频率(基于MAF),基于单倍型的 r 2 r^2 r2 D ′ D' D

$ plink --bfile hapmap-ceu --ld rs2883059 rs2777888 --out ld_example
# 产生两个文件,ld_example.log  ld_example.hh
--ld rs2883059 rs2777888:

   R-sq = 0.715909       D' = 1

   Haplotype     Frequency    Expectation under LE
   ---------     ---------    --------------------
          CA     -0                       0.21
          TA      0.45                    0.24
          CG      0.466667                0.256667
          TG      0.083333                0.293333

   In phase alleles are CG/TA

1.2.2 r 2 r^2 r2与D’的选择

进行研究时,如果您的研究重点是一个多态给定另一个多态的可预测性,那么 r 2 r^2 r2是首选的度量方法。

D’是用来评估重组模式的度量,因为单倍型块通常被定义为 D ′ D' D的基础。

LDlink (https://ldlink.nci.nih.gov)

参考:
An Introduction to Statistical Genetic Data Analysis.

你可能感兴趣的:(生物信息学,plink,GWAS)