一、 排序的目的和意义
早在30年代,前苏联学者Ranensky就提出了排序的概念,并发展了一个简单的排序方法(见Sobolev和Utekhin 1973),但只限于在前苏联传播(Greig-Smith 1980),Ramensky当时应用一个或两个环境因子梯度去排列植物群落,他用的名词是德文“ordnung”。直到20世纪50年代,排序对大多数生态学者来说仍是新名词。排序最初的概念是指植被样方在某一空间(一维或多维)的排列,这里空间指植物种空间或环境因素空间。它是随着“植被连续体”概念的提出而诞生。50年代许多学者强调植被的连续性,认为分类是确定植被间断性的有效方法,但不能用于揭示植被的连续性。因此对排序方法才开始研究而得以发展。当时的排序是用于分析群落之间的连续分布关系。到50年代后期,排序概念已趋完善,其不仅排列样方,也可以排列植物种及环境因素,用于研究群落之间、群落与成员之间、群落与其环境之间的复杂关系。
排序的过程是将样方或植物种排列在一定的空间,使得排序轴能够反映一定的生态梯度,从而,能够解释植被或植物种的分布与环境因子间的关系,也就是说排序是为了揭示植被-****环境间的生态关系。因此,排序也叫梯度分析(gradient analysis)。简单的梯度分析是研究植物种和植物群落在某一环境梯度或群落线(coenocline)上的变化,也就是一维排序。复杂的梯度分析是揭示植物种和群落在某些环境梯度(群落面coenoplane或群落体coenocube)上的变化关系,这相当于二维或多维排序。只使用植物种的组成数据的排序称作间接梯度分析(****indirect gradient analysis****),同时使用植物种的组成数据和环境因子组成数据的排序叫做直接梯度分析(direct gradient analysis****)。间接梯度分析完成后,研究者需要通过再分析找出排序轴的生态意义,再用其解释植物群落或植物种在排序图上的分布。而直接梯度分析因为使用了环境因子组成数据,排序轴的生态意义往往是一目了然的,在结果解释上比较容易。
从数学上讲,排序基本上是一个几何问题,我们要把样方(实体)作为点在*****P*****维种类(属性)空间排列,使得排列结果能客观地反映样方间的相互关系,这种用属性(种或环境因子)来对实体(样方)进行排序的过程叫做正分析(normal analysis****)或者正排序(normal ordination****);如果反过来用实体去排列属性则叫做逆分析(inverse analysis****)或者逆排序(inverse ordination****)。由于排序的结果能够客观地反映群落间的关系,所以它可以与分类方法结合使用,而检验分类的结果,就是先用某一分类方法对样方进行分类。比如用传统的定性方法或某一数量方法进行分类,然后再在排序图上圈定群落的界限,这样可以直观地看出各植被类型间的关系,以检验分类的合理性,并且可以用排序轴所含的生态意义来帮助解释分类的结果。正因为如此,有些学者也将排序归入植被数量分类方法中(阳含熙等 1981)。
海拔高度;(b)泥炭深度;(c)坡度(引自Tallis 1969)
排序的结果一般用直观的排序图表示,排序图通常只能表现出三维坐标。因此排序的一个重要内容是要降低维数,减少坐标轴的数目,降低维数往往会损失信息。一个好的排序方法应该是由降低维数引起的信息损失尽量少,即发生最小的畸变,也就是说它的低维排序轴包含大量的生态信息。在研究中最常用的是二维排序图和三维排序图,前者是用前两个排序轴组成的平面图。样方就是分布在平面上的点;后者是由前三个排序轴绘成的立体三维坐标图。早期的排序方法中,有的只有一维坐标,即一维排序。一维排序图是一条直线,样方就是沿该直线分布的一些点。在现代植被研究中,已很少使用一维排序图。
(a) Phleum; (b)鸭茅; (c)猪秧秧; (d)Helictotrichon;(e)黄花茅; (f)Sieglingia (引自Gittins 1965)
排序是将样方排列在种类空间或环境因子空间的过程,使得排序轴能够反映一定的生态关系。但大多数排序方法并不是同时使用种类数据和环境数据,而是采用其中之一。因此,要研究植被与环境间的关系,一般是将环境因子的变化作为数值等级或等值线标在种类空间,或者反过来,将种类的多度、盖度等用数值等级或等值线表示在环境因子空间。这样它们的空间变化趋势可以反映植被-环境间的关系。
图9.1是以数量等级来表示三个环境因子在植被数据排序图上的变化。在图上,这三个因子都表现出明显的变化趋势,说明植被的分布与这三个因子密切相关。但各因子的影响又有所不同,比如第一和第二排序轴都与海拔高度(a)有较大的相关性,而土壤泥炭的厚度(b)则主要与第一排序轴相关联。图9.2是6个植物种在排序图上的分布,图中数值为频度等级,1代表频度〈25%,2=26%-50%,3=51%-75%,4=76%-100%,短线表示种不存在。实线表示等值线。6个植物种分别是 (a) Phleum bertolonii; (b) Dyctylis glomerata; (c) Gahum verum; (d)Helictotrichon pubeccens; (e) Anthoxanthum odoratum; (f) Sieglingia decumbens。在排序轴的生态意义明确以后,种类分布与环境因子间的关系是显而易见的。
有的排序方法本身要求使用环境因子数据,比如梯度分析,模糊数学序等,可以直接用于研究植被-环境关系的分析。
排序是基于实体或属性间的相似关系之上的,它不同于分类的是在排序方法中,相似(相异)关系的计算,一般各排序方法都有特殊的要求而成为方法的组成部分,所以相似(相异)关系的计算将在分类一章里介绍,另外一点不同于分类的是所有排序方法对二元数据和数量数据都适合,没有特殊要求;而分类方法则不同,有的只能使用二元数据(见分类一章)。
二、 种类环境关系模型
所有排序方法都是基于一定的模型之上,这种模型反映植物种和环境之间的关系以及在某一环境梯度上的种间关系。最常用的关系模型有两种:一种是线形模型(linear model****),另一种是非线性模型(non-linear model****)。
线性模型包括直线和曲线线性关系,其含义是某个植物种随着某一环境因子的变化而呈线性变化或叫线性反应(linear response****)。这样的模型所反映的种间关系也是线性关系(如图9. 3a~d)。大量的研究表明,植物种和环境间的关系多数情况下不是线性关系,而是非线性关系。非线性模型一般是指二次曲线模型,最著名的生态关系模型是高斯模型(****Gaussian model****)或叫高斯曲线(Gaussian curve)(见第3章)。高斯模型是正态曲线,含义是某个植物种的个体数随某个环境因子值的增加而增加。当环境因子增加到某一值时,植物种的个体数达到最大值,此时的环境因子值称为该种的最适值(****optimum****);随后当环境因子值继续增加时,种的个体数逐渐下降,最后消失。高斯模型已得到不少生态实验的证实(Austin和Austin 1980,Zhang 1991)。非线性模型所反映的种间关系复杂化,如图9.3e~f所示,它决定于每个种在环境梯度上所处的位置。
左边图表示两个种对环境梯度反应的不同模型,右边图表示模型所对应的关系,ad为线形模型,ef为单峰模型。
在自然植物群落中,植物种和环境间的关系十分复杂,不可能完全符合高斯曲线。研究表明,即使是种数—环境关系不能与高斯曲线(正态曲线)完全吻合,但大多数种也表现为一个单峰曲线,即二次曲线模型。所以有人将植物种—环境关系模型统称为单峰模型(Unimodle modle)(Braak 1986,1987,1988)。
三、 线性排序和非线性排序
基于线性模型上所建立的排序方法叫做线性排序(linear ordination****),而基于单峰模型上的排序称为非线性排序(nonlinear ordination****)。非线性排序结果好于线性排序,因为它能更好地反映种—环境间及种—种间的关系。在现代的排序方法中,依其模型可分为两大类:一类是以主分量分析(****Principal components analysis****,PCA****)为主的线性排序方法;另一类是以对应分析(Correspondence analysis, CA****)为基础而发展起来的非线性排序方法。在CA家族中有的方法如除趋势对应分析(Detrended correspondence analysis, DCA)是基于高斯模型,生态学者和统计学者都比较满意,因此,它成为20世纪80年代以来使用最广泛的排序方法。
对于主分量分析(PCA),线形模型是它的一大缺点。但在过去植被研究实践中,PCA曾得到了广泛应用,并且大多数研究结果都表明PCA是一非常有效的排序方法。关于这一点有不同的解释,最主要的一点是,在应用PCA时,大部分学者都对数据进行转换或标准化等处理,使数据结构发生一定的变化,在一定程度上符合PCA的线形模型。
在对应分析出现之前,早在****20世纪60年代就有一类排序方法被称作非线性排序(Legendre和Legendre 1983),这一类方法主要是通过数据转换(Transformation)或排序轴的重新标定(rescaling)来实现非线性化(Legendre和Legendre 1987,Leeuw 1987,Gifi 1990)。60年代,他们也发明了一些具有特点的方法,比如 Shepard和Kruskal的方法,但这些方法现在被统称为无度量多维标定法(见后述)。这一类所谓的非线性排序方法主要是加拿大法语区和法国、荷兰的一些学者坚持使用,他们多为统计学者。Gifi(1990)出版了一本新书《非线性多元分析》,重新描述了他们的方法,但没有什么新内容。英国著名生态学者Hill(1990)评论该书说:“虽然该书文字写的很漂亮,但它最大的特点是落后于时代步伐 10多年。”这一类方法,在现代植被生态学研究中很少使用。
张金屯老师数量生态学专第9章讲排序