关于云模型(Cloud Model)

云模型在统计数学和模糊数学的基础上,统一刻化了不确定性语言值和精确数值之间的随机性和模糊性,实现了定性语言值和定量数值之间的自然转换.
目前基于云模型的云技术已被成功地应用于智能控制、跳频电台、大系统的效能评估中.在进行空间数据挖掘时,空间数据的不确定性是不可避免的.它主要由随机性、模糊性、不完备性、混沌性和未确知性等多种要素综合引起,并受粒度、尺度、抽样等因素的综合影响.位置不确定性与属性不确定性是空间数据不确定性的基本内容,抑制空间数据不确定性主要有数据采集和认知两种技术方向,空间数据不确定性的减少与数据的增加并不等价.

在研究空间数据不确定性时,概率论和数理统计具有"硬计算"的不足,模糊集的隶属函数固有不彻底性,粗集含有局限性, GIS 数据模型存在缺陷,灵敏度分析本身也有困难.最好方法是自然语言,自然语言中含有随机性和模糊性的定性值和定量值之间的相互转换,是空间数据挖掘的研究热点.云模型汲取了自然语言的优点,能在空间数据挖掘中兼顾随机性和模糊性,在用语言值表示的定性概念与其定量表示之间建立起定性和定量间的相互映射关系[6J 基于云模型,一种新的数据挖掘技术"数据一概念一规则加例外"被提出来.

 

云模型( Cloud modeI)是用语言值表示的某个定性概念与其定量表示之间的不确定性转换模型,主要反映客观世界或人类知识中概念的模糊性和随机性,并且把二者集成在一起,掏成定性和定量相互间的映射[5J 云模型具有期望值Ex 、En 和超崎He 三个数字特征[7J (图1).

 

Ex 是在数域空间中最能够代表定性概念的点值,反映了这个概念的云滴群的云重心.

En 被用来综合度量定性概念的模糊度和概率,揭示了模糊性和随机性的关联性,它一方面直接地反映了在数域空间中可被概念接受的元素范围,即模糊度;另一方面还反映了在数域空间中的点能够代表这个概念的概率,即随机性.

He 是En 的不确定度量,即恼的情,反映了在数域空间代表该语言值的所有点的不确定度的凝聚性,即云滴的凝聚度.超摘的大小间接地表示了云的离散程度和厚度

 

云发生器

云的可视化方法都可以通过云的三个数字特征由正向云发生器来实现.逆向云发生器也是必要的,它能够实
现从数据转换成语言值,挖掘由精确数据点所指点的云滴的三个数字特征.

 

云的生成算法称为云发生器。云发生器包括正向云发生器、X 条件云发生器、Y 条件云发生器和逆向云发生器。由云的数字特征产生若干云滴,称为正向云发生器;给定云的3 个数字特征(Ex ,En ,H e)和特定的数值x0 的条件下的云发生器称为X 条件云发生器;给定云的3 个数字特征(Ex ,En ,He )和特定的隶属度y0 条件下的云发生器称为Y 条件云发生器;给定符合某一正态云分布规律的一组云滴(xi ,yi )作为样本,产生描述云模型所对应的定性概念的3 个数字特征(Ex ,En ,He)称为逆向云发生器。X 和Y 两种条件云发生器是运用

云模型进行不确定性推理的基础。结合正向云发生器和逆向云发生器,可以实现定性与定量的随时转换。


1)正向云发生器

function [Cloud,u] = ForwardCloud(Ex,En,He,N)
% 正向云发生器 ForwardCloud
% 期望(Expectation) Ex;熵(Entropy) En;超熵(Hyper Entropy) He
%   [Cloud,u] = ForwardCloud(Ex,En,He,N)
% 输入参数:    Ex    期望
%                  En    熵
%                  He    超熵
%                  N     产生云滴的个数,若没有默认为1
%
% 输出参数:   Cloud    云滴(N个)
%             u        云滴的确定度(N个)
%   2010.10 zhangxj,  [email protected]
          
if(nargin < 4)
    N = 1;
end;
for i = 1:N
    Enn = randn(1) * He + En;
    Cloud(i) = randn(1) * Enn + Ex;
    u(i) = exp(-(Cloud(i) - Ex)^2/(2 * Enn^2));
end;

 

2)逆向云发生器

function [Ex,En,He] = BackwardCloud(Cloud,u)
% 逆向向云发生器 BackwardCloud
% 期望(Expectation) Ex;熵(Entropy) En;超熵(Hyper Entropy) He
%  [Ex,En,He] = BackwardCloud(Cloud,u)
% 输入参数:   Cloud    云滴(N个)
%                 u      云滴的确定度(N个)(没有确定度直接由Cloud计算)
%
% 输出参数:    Ex    期望
%                  En    熵
%                  He    超熵
%           
%       2010.10 zhangxj,[email protected]

N = length(Cloud);
MeanValue = sum(Cloud)/N;  % 平均值--也可以利用中值
var = sum((Cloud - MeanValue)^2)/(N-1);  % 样本方差
if(nargin < 2)  % 无确定度u的计算
    AbsCenter = sum(abs(Cloud - MeanValue))/N; % 一介样本绝对中心距 
    Ex = MeanValue;
    En = sqrt(pi/2) * AbsCenter;
    He = sqrt(var - En^2);  % 标准差
else % 有确定度u的计算
   Ex = MeanValue;
   En = sqrt(var);  % Cloud的标准差
   Enn = sqrt(-(Cloud - Ex).^2./(2 * log(u)));
   EnnMean = sum(Enn)/N;
   He = sqrt(sum((Enn - EnnMean)^2)/(N-1));  % Enn标准差
end;

 

特征空间和概念空间
在基于云模型的空间数据挖掘中,概念空间描述的是同一属性范畴的不同概念.而特征空间描述的是具有多个属性的复杂空间实体.一个基本概念的粒度可以用它对应的云的三个数字特征来表达,期望值Ex 反映概念云的中心,情En 表示概念粒度的大小,超恼He 表示云滴的凝聚程度.例如,概念唯移小"的情比"9 mrn 左右"的摘要大,这意味着前者比后者有更大的粒度.通常情况下,分布在概念空间的云滴形成概念空间的势,所有云滴的等势线将自动形成一个概念层次.这种思想也能被扩展到特征空间中的空间实体,所有实体的等势线将自动形成聚类和聚类层次.在所有属性目标的特征空间,每个属性将有一个它自己概念空间中的概念层次.

 

在概念空间,每个数据对概念的形成作出自身的贡献,贡献的大小可以用云的概念空间中的势来度量.势的大小不仅与云滴的位置有关,而且与云滴的辐射亮度有关.辐射亮度越大,其数据能量的影响力也越大.人们从不同的角度观察和分析空间数据库实际上就是在概念空间中选择不同的函数来计算点的势的大小.图3 所示的是概念空间中所绘制的等势线和等势面,所用的函数是

P = sum(Di^2/c * En^2 * Ct (dxi)

其中m 是从概念空间中的某点到云滴(面, Gr ( dxi)) 所在位置的位移, Gr (dxi) 是云滴的辐射亮度, En 是云模型的婿, N是概念空间中云滴的数量.

 

此外,当概念空间中的许多云滴形成概念空间的势时,他们自然也形成概念层次.例如,当讨论语言变量"距离"这个范畴内的不同语言值时,如"3000 km 左右"、"12 h 左右的火车路程"或"很远"等概念,常常要明确这些概念在数域上是大概念还是小概念,粗概念还是细概念,以及相互之间的等价(相似)关系或从属(包含)关系.概念具有层次性,概念和概念之间通过数据场相互作用,形成概念之间的泛概念树.严格意义上的树结掏,一个结构只能有一个父结点,而在泛概念树中,一个结点可以多个父结点.不同的属性有不同的泛概念树,空间实体群组合状态因不同属性的泛概念树的不同而多种多样,通常决定于发现任务.

 


特征空间

当研究由多个不同特征描述的复杂空间实体群时,常常用特征空间作为讨论问题和发现知识的更大范畴.空间数据挖掘从概念空间跳跃到特征空间中,粒度世界将变得更大,空间实体的多个不同特征掏成一个多维特征空间.在空间数据挖掘中,按照数据库中某个实体记录的多个属性把该实体映射到数域空间中的一个特定点上,成千上万的实体记录在数域空间中是成千上万个点,它们整体上所呈现出来的抱团特性,就在空间数据挖掘中形成自然的聚类知识.特征空间中势的思想和确定等势线的方法和概念空间相似,不同的只是特征空间的基本单位是空间实体点,而概念空间为表达概念的属性数据点.在特征空间中,势所表示的是原始数据集中所有样本的贡献,聚类的结果是由整个数据集推导出,普通的聚类方法总是将原始数据集分成两部分,练习数据集归纳聚类,测试数据集用于证明方法的有效性.尽管如此,它仍然不具有说服力,比如,两部分数据集的比例,选择什么样的样本作为练习数据集.而且,每个样本都对聚类的结果有贡献,但是普通的聚类方法忽略了测试数据集,因此,从特征空间中得到的聚类结果更合理.

 

 

 

云理论是一个分析不确定信息的新理论.由云模型、不确定性推理和云变换三部分构成.云理论把定性分析和定量计算结合起来.可以用于处理随机性和模糊性为一体的属性不确定性.云在空间由系列云滴组成,远观像云,近视元边.云具有期望值、恼和超摘三个数字特征.期望值是概念在论域中的中心值,完全隶属于该定性概;1脑是定性概念模糊度的度量,其值越大,概念所接受的数值范围越大,概念越模糊;超饷反映云滴的离散程度,其值越大,隶属的随机离散度越大.云理论构成定性和定量相互间的映射,是用自然语言值表示的定性概念与其定量数据表示之间的不确定性转换模型.数据挖掘是基于不同认知层次的"数据→概念→知识"视图,空间知识是各级的"类和离群或者"规则加例外文章研究了云模型对空间数据挖掘的可视化解释.不同空间粒度之间的概念云在概念空间形成多层次的云的泛概念树结构,基础概念云在云变换下升华为知识云,空间尺度反映了不同比例尺或分辨率下的概念云粒度的缩放程度.

 

相关实现:

X条件云发生器 XConditionCloud

 

function [Cloud,u] = XConditionCloud(Ex,En,He,x,N)
% X条件云发生器 XConditionCloud
% 期望(Expectation) Ex;熵(Entropy) En;超熵(Hyper Entropy) He
%   [Cloud,u] = XConditionCloud(Ex,En,He,x,N)
% 输入参数:    Ex    期望
%              En    熵
%              He    超熵
%              x     X条件
%              N     产生云滴的个数,若没有默认为1
%
% 输出参数:   Cloud    云滴(N个)(固定值)
%             u        云滴的确定度(N个)(计算值)
%   2010.10 zhangxj,[email protected]

if(nargin < 5)
    N = 1;
end;
for i = 1:N
    Enn = randn(1) * He + En;
    u(i) = exp(-(x - Ex)^2/(2 * Enn^2));
    Cloud(i) = x;
end;

 

 

Y条件云发生器 YConditionCloud

 

function [Cloud,u] = YConditionCloud(Ex,En,He,u1,N)
% Y条件云发生器 YConditionCloud
% 期望(Expectation) Ex;熵(Entropy) En;超熵(Hyper Entropy) He
%   [Cloud,u] = YConditionCloud(Ex,En,He,u,N)
% 输入参数:    Ex    期望
%              En    熵
%              He    超熵
%              u1     u条件
%              N     产生云滴的个数,若没有默认为1
%
% 输出参数:   Cloud    云滴(N个)(计算值)
%             u        云滴的确定度(N个)(固定值)
%   2010.10 zhangxj,[email protected]

if(nargin < 5)
    N = 1;
end;
for i = 1:N
    Enn = randn(1) * He + En;
    % 如果输入值激活的是规则前件的上升沿,则规则的后件也是上升沿,反之亦然
    if (u1 < Ex)
        b = Ex - sqrt(-2 * log2(u1))* Enn;
    else
        b = Ex + sqrt(-2 * log2(u1))* Enn;
    end;
    Cloud(i) = b;
    u(i) = u1;
end;

 

云规则选择器 Cloud Rule Selector

function [u] = CloudRS(mdU,n)
% 云规则选择器 Cloud Rule Selector
% 期望(Expectation) Ex;熵(Entropy) En;超熵(Hyper Entropy) He
%   [u] = CloudRS(mdU,n)
% 输入参数:    mdU     多维云确定度u (n*m)
%               n      需要选择的确定度个数(1...N)
%        
% 输出参数:  u        乘法处理器处理后的确定度u(1*n)
% 2010.10 zhangxj,[email protected]

if(nargin < 2)
    n = 1;
end;
[N,M] = size(mdU);
if (M > 1)
    for i = 1:N
        tu(i) =  max(mdU(i,:)); % 选择每个云滴确定度最大的值
    end;
else
    tu = mdU;
end;
if (N == n)
    u = tu;  % 全部选择
else
    tu =  sort(tu,'descend'); % 降序排序(大-->小)
    u = tu(1:n);  % 选择最大的做确定度
end;

 

云乘法处理器 Cloud Multiplying process unit

function [u] = CloudMP(mdU)
% 云乘法处理器 Cloud Multiplying process unit
% 期望(Expectation) Ex;熵(Entropy) En;超熵(Hyper Entropy) He
%   [u] = CloudMP(mdU)
% 输入参数:    mdU     多维云确定度u(1*n)
%
% 输出参数:  u        乘法处理器处理后的确定度u
% 2010.10 zhangxj,[email protected]


N = length(mdU);
u = 1;
for i = 1:N
    u = u * mdU(i);
end;

 

 

 

 

云模型应用:

 

 

 

你可能感兴趣的:(算法,数据挖掘,hyper,语言,2010,function,数据库)