【PaperReading】空间分析方法在微生物生态学研究中的应用

空间分析方法在微生物生态学研究中的应用
The application of spatial analysis methods to microbial ecology
投稿时间:2009-08-18  修订日期:2009-11-09
DOI:
关键词:微生物生态  空间分析  地统计  空间自相关  空间格局
Key Words:microbial ecology  spatial analysis  geostatistics  spatial autocorrelation  spatial pattern
基金项目:山东省环境保护重点科技资助项目(2006007); 国家自然科学基金资助项目(408010088); 山东省自然科学基金资助项目(Q2008B09)
作者 单位 E-mail
王强  山东大学生命科学学院山东 济南 250100   
戴九兰*  山东大学环境研究院山东 济南 250100  [email protected] 
付合才  山东大学生命科学学院山东 济南 250100   
申天琳  山东大学生命科学学院山东 济南 250100   
吴大千  山东大学生命科学学院山东 济南 250100   
王仁卿*  山东大学生命科学学院山东 济南 250100山东大学环境研究院山东 济南 250100  [email protected] 

摘要:
微生物生态正在受到越来越多的关注,对其研究也渐趋深入。然而由于微生物个体微小的特点及研究手段的限制,多数研究还停留在探索阶段,研究方法也在不断完善当中。近年来,较多的研究开始探讨空间因素在微生物多样性和分布中的影响,对空间分布的探讨有助于更好地认识生态过程,是一种有力的研究手段。微生物空间分析方法已经成为微生物生态学领域中重要的研究方向之一,我国空间方法在微生物生态研究中的应用还没有得到普遍的重视。从不同研究角度出发,结合空间统计的作用,对空间统计方法在微生物生态研究中的应用的必要性及现状做了评述。介绍了空间自相关性的检验,方差图,Mantel检验,Kriging插值等方法在微生物生态研究中的应用,并论述了微生物研究中的尺度问题。这一梳理,对丰富微生物生态学研究中的新方法、新手段具有一定价值。
Abstract:
Studies of microbial ecology are receiving increasing attention in the world and are developing very quickly. Nevertheless, due to the limitations of research techniques and special characteristics of microbes, most studies are only at the exploratory stage while the relative methods are also in development. In recent years, considerations of spatial factors have shown a significant trend and many researchers have focused on this area. Many studies have begun to consider the spatial influence of the distribution of microbial communities and significant results had been achieved in this area. Studies on spatial patterns of microbial community can give us a better understanding of ecological processes. However, due to subject barriers and the minuteness of microbes, at present spatial concepts are not receiving adequate attentions in China. This paper focuses on a brief review of the current situation and progress of spatial analysis, and its potential application in microbial ecology. We introduced descriptions of spatial autocorrelation in microbial ecology studies, including Moran′ I and Geary′s c, Mantel test and the use of variogram analysis. Kriging was referred to as a tool to predict microbial patterns and the scale of microbial studies were also discussed. This review will be helpful for understanding spatial methods and their application in microbial ecology.

空间自相关性

1.使用自相关系数检验

空间自相关性用于度量某一变量是否存在空间依赖关系以及变量自身在较近的空间中是否有较强的关联。微生物生态研究中常期望得到不同环境因子与微生物种群之间的关系,然而这些相关关系是尺度依赖的,往往受到空间自相关特性的影响,甚至可以说,如果把空间自相关性纳入考虑,有可能会颠覆原有的结果。生物指标的空间自相关性可能来自两个方面,其一是由于物理环境的空间自相关性而对生物体产生的相应影响;其二是生物群落本身分布可能产生的空间自相关性。这两种效应较难区分,但不管是出于哪一种原因,其作为一个整体对微生物特性表现出的影响都是不可忽略的,研究者应该对其有响应的了解、刻画和分析。通过对不同尺度空间结果的刻画,也可以做出不同的生态过程推断假说。

微生物生态研究中,一元变量(如生物量碳,基础呼吸,硝化作用,以及通过多元数据得出的多样性指标等)的空间自相关性可用空间自相关系数来刻画,其表征类似于一般Pearson相关系数,区别在Pearson相关系数是对两个变量的刻画,而空间自相关性则是有“一个变量”计算得出的。常用的空间自相关指数有Moran'I和Geary's C。这两个指标都可以写成标准化的交叉积统计,表征两个矩阵对应项之间的相关度,最终起到度量某一尺度空间自相关性的作用。不仅自相关系数的计算,其他空间方法的要点也在于得到一定生态尺度内感兴趣的参数——生物或环境的均可——然后按尺度(距离)不同将关心的参数一一对应起来,并进行汇总,由此在进行尺度依存(自相关性)研究,分布模式研究等等。

在计算不同距离相关指数后,可将其对样本距离作图得到的相关图,通过对该图的形状、变化趋势等特征的研究也可得到较粗糙的关于空间结构的信息。如相关图呈单调递减趋势等,研究区域为线性梯度变化;突然降低时则表示该距离离开了某一特性中心区域,如污染、高盐分、微生物活性的突然变化等。不过这种方法可资利用的信息较少,而且无法进行函数拟合、预测等功能,在微生物生态研究中仅作为最基本的描述指标。

上式两个指标仅在应用于单因素变量,如生物量碳、呼吸指标、分子方面的指标等。而在微生物生态研究中常需要处理的表征群落结构的多元变量,如DGGE条带,PLFA峰值、BIOLOG碳源利用指标等。对多元数据空间自相关性的分析可使用标准Mantel检验或偏Mantel检验。Mantel检验的目标是验证所研究多元变量是否存在空间依赖性。通过将研究对象的关联程度量化(以不同距离公式度量),产生样本间两两距离矩阵F1,同时计算取样位置的两两位置,得到F2(图1)。通过计算两个矩阵的相关性,验证多元变量是否具有空间依赖性。该方法可以避免数据类型的限制,对数据分布类型要求不高,各种多维数据可通过计算差异矩阵应用该方法。

Mantel检验的基本目标及步骤如图1所示,所得统计值Rm,Zm表征的是整体空间相关程度。在实际应用中又有若干延伸,如Mantel相关图的使用,可对不同尺度下自相关性的变化进行刻画。该方法主要思想是首先按照不同尺度(距离)将研究对象分组,然后对各组分别进行Mantel检验,最后将得到的统计值标准化,并对分组的不同尺度作图。这是一种和空间自相关指数图非常类似的一种方法,差别只在于其可用于多元数据的处理,且一般认为该方法较普通Mantel检验可发现更加精细的结构。

【PaperReading】空间分析方法在微生物生态学研究中的应用_第1张图片

Lilleskov等使用Mantel相关图研究小尺度上菌根真菌(EMF)群落,结果表明该方法与传统的Mantel检验及对不同斑块大小的方差图分析有较大差异,并发现了后面两种方法未能发现的显著空间结构。同样是研究真菌空间分布的工作,偏Mantel分析也有应用,研究时间、空间的双重作用。偏Mantel分析通过3个距离矩阵(群落,空间,时间)间的偏相关分析,可以确定在控制时间因素的作用下,空间因素单独对群落相似性的影响,并通过置换检验验证结果的显著性。但Legedre曾指出,这种分析方法的结果解释是比较困难的。

2.空间自相关性的描述及可视化

 对不同尺度及方向的空间自相关性描述在本质上等价于对空间结构的描述,一般有两种方法。一为使用相关图或方差图;另一方法为使用以空间指标作为限制因子的聚类分析或排序方法。相关图即上文所述Moran'I及Geary's C对空间距离作图,或Mantel统计量对距离的相关图。在实际的应用中,方差图更加常见。

方差图为任意两个取样点间所研究变量的差异或变异多距离的函数,是一种验证过采样点之间空间相关性的有效方法。此类研究的流程一般为分析举例及所研究变量的关系——作图形成经验方差图——以不同函数建模形成理论方差图——进行优度检测——以理论方差图进行变量预测。

建立经验方差图时,对样本变异的度量常用半方差来表示(\widehat{\gamma })

\widehat{\gamma }(d)=\frac{1}{2n} \sum_{i=1}^{n_d}{[y_{x_i +d}-y_{x_i}]^2}

式中,\widehat{\gamma }表示从经验拟合的估计值,y为所研究变量,如生物量,呼吸,多样性指数等;d是两个采样点间的距离,n_d为间距是d的所有样本对数。半方差为所研究变量y增量(y_{x_i +d}-y_{x_i})的变异之半。半方差对距离作图所得即半方差图。但据Bachamierd等最新研究,该图称为方差图更合适。因为虽然\widehat{\gamma }(d)包含y增量的一半变异,但同时含特定距离d类别下包含变量的全部方差。当然这只是称谓的变异,没有本质区别,对研究也没有影响,本文统称为方差图。

图2为一个典型的方差图。黑点代表经验图,线条则为模型拟合。方差图有3中基本模式:nugget不变型,增长型,及增长至基台型。每一种模式都代表不同的空间分布状态,如梯度变化、斑块嵌套等等。各项参数意义如下:

  • Nugget(块金值):为模型不可解释的方差,由于测量误差或小于最小取样距离的空间变异导致。
  • Range(变程):半方差达到此即不在增长的距离,超过此距离样本丧失空间自相关性。
  • Sill(基台值):模型所能解释的最大方差,大体等于所有样本的变异。

【PaperReading】空间分析方法在微生物生态学研究中的应用_第2张图片

得到了经验方差图后,可根据需要拟合理论方差图,这样做的目的一般有三:1.发现规律;2.预测;3.估计有价值的参数。

常用的拟合函数有常数、线性、指数、高斯及球形函数。可进行多次拟合观察后择优选用。若观察不到明显优势,则可通过检验各自的拟合优度来确定最合适的函数。拟合之后则可确定相关参数,进而量化确定空间结构,或将不同参数结合其他变量比较分析。当然,所有上述分析之前,同任何统计分析一样,应有探索分析阶段,以便对数据结构有初始的认识,去取异常值等等。

方差图可以考察数据的空间相关性,空间结构,也可以进行拟合预测,是一种非常有用的方法,但也只适合分析单因素变量。微生物生态研究中,特别是针对群落的考察,大多数时候产生的是多元变量,只能分析单因素变量显然不够。针对这种情况,可使用主成分分析(PCA)或通过计算“相对差异值”等数据压缩方法得到中间变量,再使用方差图进行分析。如Saetre等使用PLFA方法表征微生物群落多样性,在分析其空间结构前首先使用PCA压缩数据,然后分析得到的主成分,并发现不同位置的不同相关尺度。Franklin等采用扩增片段长度多态性(AFLP)分子指纹方法刻画微生物群落特征,并经过由此计算得出的相对差异值,实现使用“准方差图”分析空间结构的目的。

此类研究的核心为使用各种数据压缩方法从多维数据中发现可以刻画样本特征的单个数值,并将之纳入分析。关于相对差异值及差异矩阵的计算可参考Legendre等Numerical ecology。

2.结合空间结构对数据进行预测及矫正

克里金/克里格法应用的目的是通过理论方差来拟合预测采样区中未知点的数值,是一种根据经验进行局部未知部分的推算,指一系列估算过程中使用的最小方差回归计算方法。该方法又可以分为点估计和面估计两种。对刻画微生物及相关环境因子的空间分布结构,确定有预测作用的微生物种群有重要作用。

在当前研究中,主要目标是发现微生物分布模式,通过插值的方法而估计位置点的值,或作出相应指标的分布图。Becker等研究了小尺度下土壤细菌活性、种群结构域重金属污染之间的关系,发现微生物活性及重金属含量均有较强的空间相关性,并从空间角度发现重金属对微生物的抑制作用。Philippot等近期研究了微生物功能空间异质性与群落空间差异性之间的关系,其选择不同放牧类型区域硝化菌群作为研究对象,在39.6m×14.4m的尺度内选取60个点,测定其硝化功能参数及相应功能菌群结构(图3),发现群落在6-16m的尺度上具有空间结构,土壤性质对功能参数及特定功能基因由显著影响,但对整个功能菌群大小影响不大。拟合值可以通过图表现出来,具有更直观的解释效果,如Philippot对采样区全碳含量的插值估计(图3)。

从空间角度研究微生物群落结构比较重要的一个问题就是采样问题,特别是在微生物生态研究中,由于无法像动植物研究中定位特定研究对象的位置,采样策略从某种程度上决定了所研究问题能达到的深度。从另外一个角度说,所研究问题也对采样策略提出了特定的要求,不同的研究目的所需的采样分布及样品数量都有差异。

研究空间结构本身可以是目的,也可以是手段或中间步骤。如果需要考察的是环境因素与微生物指标关系,需要考虑或者剔除其中的空间要素,并将发现的空间结构纳入常规的回归分析中,在这种情况下,可先进行回归获得变量残差,然后利用上述类似方法对所得残差进行空间结构考察,获得空间方面的信息并加利用。若对微生物分布有一定预设,也可将实际数据与模型函数拟合,并进行显著性检验,以达到验证假说的目的。

3.尺度问题

不管研究角度如何切入,尺度问题都是空间研究中的关键问题。在微生物空间生态研究中也必须受到高度的重视,近期的研究在不同尺度上都有涉及,从研究微生物个体分布的微观研究到跨越大陆的大尺度研究均有实现。研究的尺度与采样的尺度有其准则,但最终是由所关注的问题决定的,很多情况下需要在多个不同尺度进行研究。

当前大部分工作是在研究区域进行随机取样,这样做有其不完善的方面。随机取样的前提是研究区域内的微生物趋于均质化,而这一点在实际中往往是无法实现的。不考虑空间结构的最大缺陷即无法发现空间自相关因素的影响,因而难以对所研究生态现象做出客观的评价,这在针对生态过程中的研究中是应予以尽量避免的。在检验特定生态因子的作用,或检验某些假说时,最好在不同尺度采取足够的样品,以便在分析中将空间因素剥离出来,从理论角度,最为严谨的方法是通过预实验对空间结构有初步的了解,然后在进行细致的实验。然而实际研究中由于财力人力及时间的限制,往往难于实现。虽然如此,当考虑空间作用时还是应该尽量满足研究需要。简言之,根据研究需要,在采样时应保持采样样本之间的距离足够远,而重复之内的距离足够的近,并满足一定的采样量。如果采样间距大小所研究生态因子的作用区域,可能会发现非常强烈的空间自相关性,从而检测不出作用关系;而如果跨度太大,则容易遗漏或忽略生态系统内部的结构及功能关系,这都是应该注意避免的。

你可能感兴趣的:(Data,Mining&Analysis,我的学习历程)