[转载]模糊系统:挑战与机遇并存——十年研究之感悟 王立新 |
http://www.ee.ust.hk/ece.php http://www.ee.ust.hk/~eewang/ 模糊系统:挑战与机遇并存——十年研究之感悟 王立新王立新 于1984和1987年在西北工业大学分别获学士和硕士学位 1992年于美南加州大学获博士学位。1993年至今任教于香 港科技大学电机与电子工程系。研究成果被广泛引用。现为Automatic和IEEE Transaction on Fuzzy Systems 的副主编。负责有关模糊控制、模糊神经网络、模糊系统逼近性能等方面论文的评审工作。 一直以来,模糊系统就是个充满争议的领域。从1990年我进入这个领域至今己整整十个年头了。从开始刚到美国的博士生,拜师于模糊理论的创始人Zadeh 教授,到现在Automatic和IEEE Transaction on Fuzzy Systems 的 副主编,我一直没有离开过这个领域。在一个充满争议的领域内工作是艰辛的。目睹这个领域从冷变热 从普遍怀疑到基本接受,感悟甚多。这里借着这 个专刊的机遇,将感悟的一些要点写出来与大家共享。 由于这些观点带有强烈的个人色彩,而又是针对一些敏感性且富有争议的话题,所以敬请大家带 探讨的眼光来看。欢迎大家的批评与讨论。 1 、挑战 作为一个模糊系统领域的研究者,我最大的痛苦是在很多情况下还没开口就已经被归入一类人了。 这类人没有严格的科学态度与积极的进取精神,这类 人做不出严格的理论结果所以就"模糊"一下算了,这类人没有坚实的功底来解决传统领域中的难题,所以就来到 "模糊"里面来淘金,还美其名曰提 出种种创新思想。为什么很多传统领域的研究者对模糊理论持这样的怀疑态度呢?我想有以下几个方面的原因 1.1 模糊理论引起争议的原因 原因1 模糊理论的某些出发点有问题 在一些模糊理论论文的引言中(包括一些经典论文)经常会看到这样的话语:传统理论的要求太精细了,越来越难以解决日益复杂的实际问题,所以需要一种"模 糊"理论。言外之意,在这里严格的证明、推导与验证是不需要的。模糊模糊就行了 我不敢肯定有多大比例的模糊理论研究者持这种观点,但这样的研 究者肯定不在少数。而且在不同的场合不断地传播着这种观点。这种观点的支持者肯定有他们的道理,由于篇幅有限无法在这里就这个优点进行深入讨论。所能说的 是我个人是非常反对这种观点的,严格是在任何情况下都必须坚持的基本原则,不能以问题复杂为借口放弃。 原因2 模糊理论体系有不完善的地方 从工程应用的角度而言,20世纪90年代以前的模糊系统理论有两个弱点。一是没有一套系统而有效的方法来获取知识,而只能采用专家问卷形式,费时日又难以 得到满意的结果;二是缺少完整的理论体系来保证系统的稳定性、收敛性等基本要求。20世纪90年代以来模糊系统理论在这两个方面取得了突破性的进展,利用 各种学习算法我们现在可以从数据中学习知识(所谓的模糊神经网络)。而越来越多的具有严格数学证明的模糊控制论文的出现(如本专刊的大部分论文)使得模糊 控制不再是一种只能基于经验的简单控制器,而是具有严格理论支持的高性能非线性控制器。所以近年来基于这个原因,对模糊控制的批评越来越少。我们高兴地看 到模糊系统的理论支柱已基本建立,我们的任务是不断地完善它。 原因3 模糊领域的论文质量参差不齐 模糊控制的特点之一是容易上手:几条规则,几个仿真,结果还不错——一篇论文,是应急(毕业、交差、保住饭碗等)的好方法。应急者能写出好论文吗?传统领 域(如经典控制理论)就不同,必须经过严格的训练,修很多门课才能上手。所以传统领域较难用来应急(相对于模糊领域而言),一个领域质量差的论文多了,人 们对它的评价自然也就低了。但是,大浪淘沙,好论文终究会浮出水面。当积累的好论文多了这个领域也就慢慢成熟了。亲身经历这个成熟过程和领域一起成长,是 一件非常爽心的事。欢迎大家的参加。 原因4 部分模糊理论研究者对传统领域不加分析地批评与否定 这与原因1中的优点有直接关系。这些论文一上来就否定传统理论,说传统理论不能解决某某问题,所以需要模糊理论。这种批评的很大一部分并不是建立在对传统 理论深入分析的基础上的。这样的批评的后果就是将模糊理论与传统理论对立起来,使模糊理论成为众矢之的。近年来以Zadeh为首倡导的"软计算"试图将模 糊理论与其它传统及新兴理论溶为一体。"加强合作,避免对抗"取得了良好的效果。 1.2模糊理论常被问及的问题 问题1 能否给出一个例子,只能用模糊控制来解决,而其它方法无法解决?(这是在各大控制会议上经常被问到的问总) 回答。有两个回答,一个简单一个复杂。简单的回答是,这个问题不应该这样问。因为没有任何理论是解决某个问题的唯一方法(就绝大部分工程理论 而言)。请问什么问题只能用线性控制理论解决、而不能采用其它控制方案?问题是方法的好坏,而不是是否唯一。模糊控制是众多控制方案中的一种,对某些问题 极有可能给出优于其他控制方案的控制结果这些问题有以下特点:一是没有可用的数学模型,而被控对象又呈强非线性(因此现代控制与PID控制都难以使用); 另一个特点是有很好的专家经验,充分利用这些经验能明显提高控制性能。这就引出了第二个复杂的回答。有这样的例子。这个例子只有以上两个特点,由于篇幅有 限,构造具体例子的任务就留给读者自己了。 问题2 我们不需要模糊理论,因为模糊理论能解决的问题用概率论同样可以解决而且会解决得更好(这是模糊与随机辩论中最突出的论点)。 回答。回答这个问题先要了解这个问题的起因,Zadeh提出模糊理论的出发点之一是描述不确定性。不确定性是多种多样的,有模糊性、随机性等。随机性用概 率分布函数来描述,而模糊性则用模糊集的隶属函数来描述,这是引入模糊集的基本出发点之一。而概念论的支持者正是怀疑这个基本出发点。他们认为所谓的模糊 不确定性同样可以用概率分布函数来描述,他们认为模糊理论支持者在评价概率论时只提到了概率的频率解释,而忽略了概念的主观解释,即主观概率及 Bayesian理论。因此,不需要一种专门的模糊理论来描述模糊不确定性,用概率论就够了,基于概率论丰富的内涵及完整的理论体系肯定能得出更好的结 果。这是一个极具争议的话题,如果只对不确定性的描述这一个问题来讲,我个人同意概率论支持的观点。问题是描述了以后怎么办。我用一个函数描述一个不确定 现象,如 "很热"这个函数叫什么并不重要(叫做模糊隶属函数或概率分布函数)。重要的是下一步该怎么办,该怎样处理这个函,这是模糊理论与概 率论的分叉点。概率论的公理体系对运算有着严格的限制,而模糊理论就宽松与灵活得多正是这种宽松与灵活使得模糊理论在描述人类语言交流的各种复杂与充满矛 盾的现象时变得得心应手。因此,模糊理论更适用于描述用人类语言表达的知识,并将这些知识应用于各种具体问题;而概率论更适用于描述数据的不确定性,进而 除去这些不确定性而透视数据所代表的核心内容。 问题3 你所讲的方法没有什么模糊的地方。为什么叫做模糊系统方法?(这是我在宣读完一篇论文后常被问到的一个问题)。 回答。人们常有一种误解,认为模糊系统方法就是把问题变模糊。其实事实正好相反模糊方法是把模糊现象用确定的数学函数来表示。从而他模糊问题 变得清晰,即模糊方法本质上是解模糊,而不是模激化。"很热"是一个模糊现象。而一旦用一个隶属函数来描述"很热","很热"就不再模糊了,"很热"就等 于这个隶属函数。怎样确定这个隶属函数是另外一个问题,与模糊无关。比如可通过数据的学习来确定隶属函数,还可用专家问卷方法等等。 问题4 模糊系统与其它非线形建模方法相比,如神经网络、分段多项式(Spline)、决策树、小波级数等优点在哪里?(这是我最喜欢问答的问题,因为一旦提问者接受了我的回答,他(她)很有可能在以后的研究与应用中尝试使用模糊系统方法) 回答。模糊系统、神经网络、分段多项式、决策树、小波级数都是用来描述非线性关系时在非线性建模的世界里没有绝对最优的方法。因为非线性关系包含所有可能 的关系,对于某种特定的方法我们总能找出适应于这种方法的非线性关系,从而使得这种方法对这类非线性关系为最优 。正是由于这个原因,所以才山 现了以上众多非线性建模方法。那么怎样比较不同方法的好坏呢?我想可以基于以下四个方面来考虑 1) 逼近精度与复杂度的平衡 以上方法都是万能逼近器,即使用足够多的项及参数以上方法均能逼近任意非线性函数到任意精度。项及参数越多,系统的复杂度就越高,而一般来讲逼近精度也就 越高。现在的问题是对于相近的复杂度,哪种方法所能表达的非线性关系更加灵活,更加一般。在这个方面模糊系统、神经网络、分段多项式、决策树都是很不错 的。具体地讲,通过隶属函数位置、形状的选择及不同的组合。模糊系统可以相当灵活地描述各种非线性关系。神经网络有类似于投影的特性,可以自动寻找非线性 的方位,从而有效地表达。分段多项式及决策树则通过区域的灵活划分,简处从简,繁处用繁,效率很高。小波级数要差一点。因为小波级数的原始出发点是一维信 号的分解,直接推广到高维后效率变低。 2) 学习算法的收敛速度 一般认为神经网络及分段多项或收敛速度慢。但现在的情况并非一定如此,神经网络及分段多项式也在不断地改进。引入快速算法,收敛速度并不差。 3) 结果的可解释性 即能否给出结构及参数的物理意义使其容易被一般人理解和接受。 4) 充分利用各种不同形式的信息 非线性建模的目的就是建立一级变量与另外一级变量之间的数学关系。而我们靠什么建立这种关系呢?靠的是我们可以得到的有关这两级变量之间关系的各种信息。 这些信息可以是采样数据,即一组变量取特定值时另一组变量是什么值;也可以是一般性的描述,如某某变量大则某某变量小;还可以是近似的数学关系等等。一个 好的方法应该能尽可能多地利用各种不同形式的信息。这个方面模糊系统有着十分突出的优点,模糊系统不仅仅可以利用采样数据,还可以将一般性的描述很自然地 归入系统之中,实现数据信息与语言信息的有机结合而其它方却只能利用数据信息。 问题5 为什么模糊理论在东方容易被接受,是不是与东方人的思维哲学有关?(回答了一些挑战性及技术性很强的问题以后,我把这个问题当作一个很轻松的话题来回答。 言语不妥之处请大家见谅)。 回答。怎么说呢?或许是吧,东方人喜欢圆形,左推右推还是圆形。悠悠洒洒,融天地于一体,这不就是模糊吗?你模糊我模糊,大家一起倒浆糊,倒 出经验,倒出水平,倒它个上不冒泡下不沉底中间不结块,倒出一个黑白合一的太平盛世,一个学者与骗子共存的学术阶层。中庸之道、难得糊涂等作为中华文化的 重要组成部分世代相传。它促进了社会的稳定,增强了民族的凝聚力,也造就了中国人温文尔雅的性格。它的最大副作用是严重腐蚀了人性中最美丽的成份——真 诚!很多情况下一个人所说的和真正所想的相差其远,云山雾里,拐弯抹角,由你自己理解了。成熟,被定义为知道而说不知道。由于缺少真诚,人与人之间很难建 立信任。必须交往时就只有模糊了事。还有很多类似的例子。这一切说明我们祖先留给我们的思维方式确实与"模糊"这两个字有着千丝万缕的联系。难怪"模糊理 论"在西方一出现,我们很快就接受了。 所以,如果说模糊理论与东方人的思维理念相近。那么至少对于我来说是由于人们对模糊理论的误解而造成的。正如我在问题3的回答中所说的,模糊理论并不模 糊,而是把模糊的现象用精确的理论来表述。也许有人问为什么模糊理论在日本也很受欢迎呢?我想主要原因是在日文中Fu是音译的。像很多外来技术词如 Computer 等都是音译的一样,它只是一个符号,代表一种新兴技术,与模糊这两个字的内涵无关。中文喜欢意译,"用中国人的眼光看世界"误解就容易发生了。或许大家想 知道为什么当初Zadeh选了模糊(Fu)这个词?在一次吃午饭时我问过Zadeh这个问题。他的回答是,我当时想不出更好的词来。我又问他现在看来这个 词选对了还让选错了。他的回答是,就领域的推广来讲是选对了,现在有很多人在讨论Fu,做这方面的研究。如果选用其它一般的词,如连续 (Continuous)或平滑(Smooth)等,则很可能只是另外一个领域的一个分支,很难像现在这样形成一个独立的学派。我不知如何评价,请人家自 己琢磨吧。 2、 机遇 方向1 将模糊控制与非模糊控制相结合。一方面用传统控制理论中的方法解决模糊控制问题,另一方面用模糊控制的理念为解决各种控制问题提供新的思路。 比较流行的做法有,将LMI理论及H无穷理论用于模糊控制器的分析与设计。也有用传统最优控制理论设计最优模糊控制器,还有利用滑模控制的办法来分析模糊 控制器的性能。以及借鉴自适应控制理论的一些理念来设计自适应模糊控制器。这些应用与结合有些是比较直接的。而更多的则需要将已有的方法进行改进和推广使 之适应于模糊控制问题。目前这类研究的不足之处是模糊控制的特点体现得不够明确。即只适用于模糊控制器的特殊结果比较少,往往这些结果具有一般性。模糊控 制器只是一个非线性逼近器而已。如何将模糊控制器的结构细节考虑进动,量体裁衣,得到更为优化的结果是一个很有意义的研究方向。 方向2 深入分析模糊系统的结构特性及逼近精度,建立一套完整的理论体系,使人们在应用模糊系统时做到心中有数。经典非线性结构(如分段多项式)的优点之一是,人 们对它们已经进行了几十甚至上百年的研究,积累了大量的理论结果。近年来神经网络在这方面也取得了长足的进步。如果将这些非线性结构比做不同的动物,那么 这项研究就是对这些动物进行解剖的越详细越彻底,我们对其的了解就越清楚,也就越能知道它适用于干什么及不适用于干什么。对模糊系统来说这方面研究的具内 容包括,不同的结构参数是怎样具体地影响逼近精度;逼近误差随着参数个数的增多是以什么样的速率在减小。局部性和全局性能否得到平衡;什么样的非线分结构 特别适于表示等等 。近十年来这些方面的研究已取得了一些进展,但由于起步较晚,和分段多项式、神经网络、小波级数等相比还存在着明显的差距。 方向3 适用于模糊系统的不同学习算法的提出,算法的收敛性分析及学习完成后模糊系统的性能分析。若将方向2的研究比作对动物的静态解剖,那么这个方向就是研究动 物在奔跑时的动态特性。显然这个方向要相对困难一些。这个方向的研究又可进一步分为两种情况:一种是数据可以任意采样或已知数据的概率分布且数据的个数可 假设趋于无穷。另一种情况是只给出有限个数据采样点且数据的分布不能人为控制。第一种情况容易得出比较深入的理论结果。但假设条件太强,与大部分实际情况 不符。第二种情况更加贴近于实际。但理论分析起来要困难得多。虽然两种情况的研究都很会必要,但重点应放在第二种情况。目前,这两个方向的理论研究都非常 欠缺。往往人们只给出算法的具体步骤,然后进行大量仿真,很少见到严格的理论分析与证明。神经网络在这个方面的研究成果是比较少的,由于神经网络的参数缺 少明确的物理意义。分析起来比模糊系统更加困难一些,这个方向的一种研究思路是利用模糊系统的分解特性,在小的局部进行简化,从而得到收敛性的结果。 方向4 针对高维情况(输入变量众多)的模糊系统方法。假设我们的问题是预测一个主要变量的数值。于是我们将这个变量作为模糊系统的输出,而将影响这个变量的各种 因素作为模糊系统的输入。在很多实际情况下,影响这个主要变量的因素是非常众多,那么是不是考虑的影响因素越多,即模糊系统的输入变量越多,则预测的效果 就越好呢?遗憾的是情况并非这么简单。维数越高,我们能找到真正的非线性关系的可能性就越低。这主要是由于随着维数的增高,采样数据变得越来越稀疏。考虑 一维区间[0,1]有100个采样点,则可以说数据是很密的。将100个数据放在二维平面[0,1]2上,就不向那么密了。考虑三 维中间[0,1]3中的100个数据点,可以说是稀稀拉拉。那么将100个数据点放在四维、五维、更高维空间中会是什么情况呢?可 以说中间中的绝大部分区域没有采样点。如果一个区域内没有采样点,那么怎么能知道输入变量落在这个区域时输出变量是什么值呢?这就是高维问题的困难核心所 在,被Bellman称做"邪恶的维数"(the curse of dimensionality)。解决高维问题的途 径有两种:一是减少输入变量的个数。即只考虑重要的因素内忽略次要的因素;二是找到或有效地刻画输入变量之间的相互依赖关系,在输入中间中引入结构,从而 限制搜索的范围。第一种途径比较简单,但需要有效的方法来排列变量的重要程度。寻找这样的方法是非常有实用价值的研究方向。第二种途径是非常好的研究方 向,目前这个方向的研究成果不多,多层模糊系统是方法之一。利用决策树的概念划分输入空间也是非常值得深入研究的课题。新的结构提出以后,还要象方向2和 方向3中所说的那样进行系统的静态解剖及动态分析。经典方法中投影跟随是针对高维问题的好方法,由于神经网络的结构具有投影跟随的特点,而又比投影跟随更 具一般性,所以神经网络在很多实际问题中得到了成功的应用(大部分实际问题是高维的)。标准的模糊系统不具有适应高维的特点,所以必须改革,提出适应高维 情况的新的结构及相应的学习算法。 方向5 能够利用其它知识及信息表达形式的模糊系统.现有的模糊系统只能利用IF-THEN规则。而我们人类表达知识及信息的形式是多种多样的,比如说"类比"就 是我们人类用以表达及获取知识的非常重要的方法。我们说"给这个人讲道理就像对牛弹琴", 这是非常重要的信息。因为基于这个信息我们就可以基 本预测到如果给这个人讲道理会得到什么样的反应。这里问题的困难在于"对牛弹琴"和"给这个人讲道理"是发生在两个不问范畴内的事情,如何将它们表述在同 一个数学空间中不是容易的。只给出理念是不够的,没有细节等于什么都没有。能够利用类比信息的模糊系统必须是具体的数学表达式,必须能够进行数值计算,同 时必须符合常理并具有可解释性。这是一个非常具有挑战性的方向,而一旦在这个方向取得突破,就从本质上扩大模糊系统的根基。从而使我们的领域得到长足的发 展。 以上就是我认为比较重要的五个研究方向。在结束本访问之前以要强调的是以上研究方向只是针对模糊系统(包括模糊控制)这个领域的。而模糊系统只是整个模糊 理论的一个分支,模糊理论的其它重要分支包括,模糊数学、模糊优化、模糊逻辑等。这些领域同样有非常重要的研究方向。本文没在进行讨论。另外,以上研究方 向属于理论研究范畴,如何巧妙地将这些方法用于解决各种实际问题,是非常重要且极具趣味的课题。只有这些应用取得成功,理论方法才能站稳脚跟并受到普遍欢 迎。 3 总结 |