1. 宏基因组数据假设检验介绍
1.1 假设检验在科研中的应用
随着人类微生物研究从技术发展和基础科学发现向转化医学和环境研究的转变,统计假设检验的应用将变得越来越重要。
假设检验:一种统计过程,用以确定所收集的数据是否提供了足够的证据来接受一个无效的假设。
1.2 多少样本才能达到特定效能水平支持组别的差异
明确四个问题:
1)生成数据的分布是什么?
2)效应值(Effectsize)有多大?
3)什么样的检验统计量将被用来拒绝或不拒绝无效假设?
4)需要怎样的统计学性能水平?P<0.0580%检验功效;P<0.0190%检验功效。
1.3 P值、检验功效、效应值和样本量是相关的
如果P值和检验功效保持不变,则较大(较小)的效应值会导致较小(较大)的样本量。
假设P值和效应值大小保持不变,增大(减小)样本量将增大(减小)研究的检验功效。
这说明了为什么在设计一个实验时必须指定这四个参数(P值、检验功效、效应值和样本量)。
2.宏基因组数据及假设检验分析
2.1 数据结构展示
数据结构展示示意图
数据的标准化或规范化问题:转换数据应该基于坚实的理论基础和特定的目的。
2.2 在不同分组中比较感兴趣的分类单元
问题:不同组间推断某一分类单元特殊性。
重要的是分类单元不是研究人员通过查看数据得知哪些分类单元最不一样,而是应用检验来证明他们所观测到的不同是真实的。
当想要比较不同类群的物种丰富度时,将数据标准化到一个共同的尺度是很重要的。(比如:百分比-如果很大一部分百分比介于0–20%和80–100%之间,则可能会出现问题,在这种情况下,应考虑使用逆正弦变换来稳定方差;对计数数据进行更复杂的建模,如负二项回归,也可以考虑看看分类单元计数是否受受试者表型[如年龄、性别和健康状况])的影响)
问题:比较分类单元是否以不同的速率存在于不同的组别中。
如果该分类单元缺失—0;如果该分类单元存在—1;常使用卡方检验。
如果预实验结果理想,正式实验时想确保检验功效的情况下,可以通过如下计算获取样本量信息。
计算检验功效,首先需要评估效应值,效应值相当于平均值的差异。分类数据则需要其他度量方式(比如:Cramer’sPhi、oddsratio、relativerisk)。
样本量
多重检验的问题:在不同的组别中,分别独立比较每个分类单元时发生。
P值含义:如果在检验情况下,零假设是真的(即,分类单元在组间的分布是相同的),P值告诉我们在数据中,观察到的组间差异发生的概率完全是由于偶然性。当我们接受P≤0.05的同时也就同样明确地接受,有5%的偶然性表示无差异组别存在差异性(即,被称为I类错误,当零假设为真时拒绝零假设,或假阳性)。
2.3 比较所有组别中分类单元频数分布
虽然可以通过每个分类单元的丰度,对多个组别的分类单元进行调整,完成多重比较。但该方法通常不如多变量分析方法有力,因为它没有考虑类群之间存在的相互作用。多元统计方法正是针对这类问题而发明的。
分类单元数量的Dirichlet-Multinomial(DM) model是一种应用于宏基因组数据的多重分布方法。
与非参数方法相比,参数模型改进了数据分析,并且通常简化了P值、样本量、功效、误差度量和置信区间的计算。往往通过参数自然度量效应值。
对数据使用错误的统计模型往往会导致错误的结果,因此,在设计研究时必须留意。对宏基因组计数数据的第一步,自然观察可能会导致统计学家考虑使用多项式模型进行假设检验,以及功效和样本量的计算。
多项式模型是不正确的,因为它不能捕捉到宏基因组数据中存在的过度变异性(即,过度分散)。
使用错误的分布模型将导致在判断组别是否存在差异时,显著增加差异组别的非差异性(II类型错误或假阴性)。
2.4 注意事项
使用多重检验并使用几种不同的多重检验来调整P值。这种分析方法的优点:允许针对单个类群进行检验,以了解它们如何影响表观现象。缺点:是忽略了类群之间的相互作用或相关性,并将它们视为独立的,这在分析宏基因组数据未必合适。
基于置换检验的PERMANOVA和ANOSIM等其他方法也经常被使用,并且可以使用统计学工具来定义效应值、效能计算和样本量。对于喜欢使用非参数方法的研究者来说,有大量的文献来指导和使用。