粗糙集_属性约简

粗糙集_属性约简_第1张图片
咬定青山不放松,立根原在破岩中!
ECRZ 记录美好事物。

1.粗糙集简介

粗糙集理论,是继概率论、模糊集、证据理论之后的有一个处理不确定性的数学工具。于1982年 波兰理工大学Z.pawlak教授提出用来研究不完整数据,不精确知识表达、学习、归纳等的一套理论。其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。从数学的角度看,粗糙集是研究集合的;从编程的角度看,粗糙集的研究对象是矩阵,只不过是一些特殊的矩阵;从人工智能的角度来看,粗糙集研究的是决策表。

2.粗糙集的价值

粗糙集是用来处理不确定信息,可以通过一系列处理之后得出一个确定的结论.

3.《粗糙集理论》例题1.11

  • 决策表构成部分

    • 决策表S=(U,A,V,f),A=C∪D,C∩D=∅,C为条件属性,D为决策属性(条件属性用来做筛选,决策属性用来做约简)

    • U:全集

    • A:属性集

    • V:属性值域范围

    • f:信息函数

    例如:由表1.4可得U={1,2,3,4,5},A={a,b,c,d},V={Va={0,1,2},Vb={0,1,2},Vc={0,1,2},Vd={0,1,2}},f如下所示

  • 表1.4(知识表达系统)

U a b c d
1 0 1 2 0
2 1 2 0 2
3 1 0 1 0
4 2 1 0 1
5 1 1 0 2
由表1.4可得
U/a={1},{2,3,5},{4}
U/b={3},{1,4,5},{2}
U/c={2,4,5},{3},{1}
U/d={1,3},{4},{2,5}
U/A={1},{2},{3},{4},{5}
  1. 根据属性的值,进行分类,例如U/a,即a属性在全集中,属性值域为0的个体是{1},属性值域为1的个体是{2,3,5},属性值域为2的个体是{4},所以U/a={1},{2,3,5},{4}

  2. U/A这个是指A={a,b,c,d},A在U中的属性值域分类,相同的合并,不相同的单独存放。例如个体1,A的值域为 0120,与其他的四个并不同所以单独存放。

  • 表1.4.1(压缩后的知识表达系统)
U a b c d
1 0 1 2 0
2 1 2 0 2
3 1 0 1 0
4 2 1 0 1
5 1 1 0 2

表1.4.1是根据U/A得出得表达系统,因为个体没有相同的,所以最终压缩后的结果表1.4.1和之前的表1.4是一样的

  • 表1.5(区分矩阵)
1 2 3 4 5
1 Null a,b,c,d a,b,c a,c,d a,c,d
2 a,b,c,d Null b,c,d a,b,d b
3 a,b,c b,c,d Null a,b,c,d b,c,d
4 a,c,d a,b,d a,b,c,d Null a,d
5 a,c,d b b,c,d a,d Null

在表1.4中根据属性值域,找出不同的属性来。例如 1:2 = A1(a,b,c,d):A2(a,b,c,d) =A1(0,1,2,0):A2(1,2,0,2) ,其中1,2得属性元素值都不同,所以在表1.5中第二行第一列取值为(a,b,c,d)

  • 由表1.5可得,表1.5是一个区分矩阵所以还可以缩写为以下形式

  • 表1.5.1(区分矩阵)

1 2 3 4 5
1 Null
2 a,b,c,d Null
3 a,b,c b,c,d Null
4 a,c,d a,b,d a,b,c,d Null
5 a,c,d b b,c,d a,d Null

区分矩阵:也称对称矩阵,即矩阵数据是以对角线为基准对称起来。

  • 根据表1.5.1可得出以下区分函数:

按照元素个体,一列一列的看,然后将每个个体合取起来.最终得到区分函数

基本等值式
重叠律: A ∨ A = A,A ∧ A = A
交换律: A ∨ B = B ∨ A ,A ∧ B = B ∧ A
结合律: (A ∨ B) ∨ C = A ∨ (B ∨ C), (A ∧ B) ∧ C = A ∧ (B ∧ C)
吸收律: A ∨ (A ∧ B) = A,A ∧ (A ∨ B) = A
分配律: A ∨ (B ∧ C) = (A ∨ B) ∧ (A ∨ C),A ∧ (B ∨ C) = (A ∧ B) ∨ (A ∧ C)
  • 区分函数的计算过程
Δ =     (a ∨ b ∨ c ∨ d )( a ∨ b ∨ c )( a ∨ c ∨ d )( a ∨ c ∨ d )		Ⅰ

​		· (b ∨ c ∨ d )( a ∨ b ∨ d )( b )		Ⅱ

​		· (a ∨ b ∨ c ∨ d )( b ∨ c ∨ d )		Ⅲ

​		· (a ∨ d)		Ⅳ

1.各个式子根据吸收律后可得   (注意此处将( a ∨ b ∨ c)看成一个整体,即t =  (a ∨ b ∨ c),q = ( a ∨ c ∨ d ) 之后可得出以下
( t ∨ d )  ( t ) ( q ) ( q ) = ( t ∨ d ) ∧ ( t ) ∧ ( q ) ∧ ( q ) = (t) ∧ (q)最终得出Ⅰ式)

Ⅰ: ( a ∨ b ∨ c )( a ∨ c ∨ d ) 

Ⅱ: b

Ⅲ: ( b ∨ c ∨ d )

Ⅳ:  (a ∨ d)

2.联立ⅡⅢ(根据吸收律可得)

Ⅰ: ( a ∨ b ∨ c )( a ∨ c ∨ d ) 

Ⅱ: b

Ⅳ:  (a ∨ d)

3.联立ⅠⅡ(根据吸收律可得)

Ⅰ: (b)( a ∨ c ∨ d ) 

Ⅱ:  (a ∨ d)

注意此处将(a ∨ d)看成一个整体,即t = (a ∨ d),之后可得出以下

Ⅰ: (b)( t ∨ c ) 

Ⅳ:  t

4.联立ⅠⅣ(根据吸收律可得)

Ⅰ: (b)(t) = (b)(a ∨ d) 

5.最终结果为

Ⅰ:ba∨bd

6.最终得出{b,a}{b,d}为知识表达系统的约简,核为{b}
  1. (a ∨ b)(a ∨ b) = (a ∨ b) ∧ (a ∨ b)
  2. · = ∧ 例如:(a ∨ b) · (a ∨ b)=(a ∨ b) ∧ (a ∨ b)

参考文献:
[1]cowboy_wz.粗糙集理论[OL],2008

你可能感兴趣的:(粗糙集,大数据,数据分析,算法,数据挖掘)