1.1、在下面这张图片中若只包含编号为1和4的两个样例,试给出相应的版本空间。
分析: 什么叫版本空间?
现实问题中我们常面临很大的假设空间,但学习过程是基于有限样本训练集进行的,因此,可能有多个假设与训练集一致,即存在着一个与训练集一致的“假设集合”,我们称之为“版本空间”(version space).例如,在西瓜问题中,与表1.1训练集所对应的版本空间如图1.2所示.注意的是
表1.1的训练数据集对应的假设空间应该如下:
1 色泽=*,根蒂=*,敲声=*
2 色泽=青绿,根蒂=*,敲声=*
3 色泽=乌黑,根蒂=*,敲声=*
4 色泽=*,根蒂=蜷缩,敲声=*
5 色泽=*,根蒂=硬挺,敲声=*
6 色泽=*,根蒂=稍蜷,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
8 色泽=*,根蒂=*,敲声=清脆
9 色泽=*,根蒂=*,敲声=沉闷
10 色泽=青绿,根蒂=蜷缩,敲声=*
11 色泽=青绿,根蒂=硬挺,敲声=*
12 色泽=青绿,根蒂=稍蜷,敲声=*
13 色泽=乌黑,根蒂=蜷缩,敲声=*
14 色泽=乌黑,根蒂=硬挺,敲声=*
15 色泽=乌黑,根蒂=稍蜷,敲声=*
16 色泽=青绿,根蒂=*,敲声=浊响
17 色泽=青绿,根蒂=*,敲声=清脆
18 色泽=青绿,根蒂=*,敲声=沉闷
19 色泽=乌黑,根蒂=*,敲声=浊响
20 色泽=乌黑,根蒂=*,敲声=清脆
21 色泽=乌黑,根蒂=*,敲声=沉闷
22 色泽=*,根蒂=蜷缩,敲声=浊响
23 色泽=*,根蒂=蜷缩,敲声=清脆
24 色泽=*,根蒂=蜷缩,敲声=沉闷
25 色泽=*,根蒂=硬挺,敲声=浊响
26 色泽=*,根蒂=硬挺,敲声=清脆
27 色泽=*,根蒂=硬挺,敲声=沉闷
28 色泽=*,根蒂=稍蜷,敲声=浊响
29 色泽=*,根蒂=稍蜷,敲声=清脆
30 色泽=*,根蒂=稍蜷,敲声=沉闷
31 色泽=青绿,根蒂=蜷缩,敲声=浊响
32 色泽=青绿,根蒂=蜷缩,敲声=清脆
33 色泽=青绿,根蒂=蜷缩,敲声=沉闷
34 色泽=青绿,根蒂=硬挺,敲声=浊响
35 色泽=青绿,根蒂=硬挺,敲声=清脆
36 色泽=青绿,根蒂=硬挺,敲声=沉闷
37 色泽=青绿,根蒂=稍蜷,敲声=浊响
38 色泽=青绿,根蒂=稍蜷,敲声=清脆
39 色泽=青绿,根蒂=稍蜷,敲声=沉闷
40 色泽=乌黑,根蒂=蜷缩,敲声=浊响
41 色泽=乌黑,根蒂=蜷缩,敲声=清脆
42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷
43 色泽=乌黑,根蒂=硬挺,敲声=浊响
44 色泽=乌黑,根蒂=硬挺,敲声=清脆
45 色泽=乌黑,根蒂=硬挺,敲声=沉闷
46 色泽=乌黑,根蒂=稍蜷,敲声=浊响
47 色泽=乌黑,根蒂=稍蜷,敲声=清脆
48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷
49 Ø
列出来所有的假设空间。
以下进行学习过程,就是:可以不断删除与正例不一致的假设、和(或)与反例一致的假设.最终将会获得与训练集一致:
1).(色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜
可以删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49
2). (色泽=乌黑、根蒂=蜷缩、敲声=浊响),好瓜)
可以删除剩余假设空间中的2、10、16、31
3). (色泽=青绿、根蒂=硬挺、敲声=清脆),坏瓜)
可以删除剩余假设空间中的1
4). (色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜)
剩余假设空间中无可删除的假设
学习过后剩余的假设为
4 色泽=*,根蒂=蜷缩,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
22 色泽=*,根蒂=蜷缩,敲声=浊响
这就是最后的“假设集合”,也就是“版本空间”。
解答:
西瓜1((色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜))为正例
找到与它不一致的假设:3、5、6、8、9、11-15、17-21、23-30、32-49
西瓜4((色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜))为反例
找到与它一致的假设:1,、3、6、9、15、21、30、48
所以在搜索过程中删除的假设有:1、3、5、6、8、9、11-15、17-21、23-30、32-49
剩下的假设有为:2、4、7、10、16、22、31
所以,所求版本空间为:{2、4、7、10、16、22、31}
从这些概念看来,确实很懵逼。
什么叫单个合取式、析合范式?
析合范式(disjunctive normal form)亦称析取范式一种析取式。是若干简单合取式的析取式。
解答:
由题1.1知,共有49种假设,其中:
全部不泛化 2∗3∗3=182∗3∗3=18种假设;
一个属性泛化:2∗3+3∗3+2∗3=21种假设;
两个属性泛化:2+3+3=82+3+3=8种假设;
三属性泛化:1种假设
空集:1种假设
不考虑空集,则有48种假设,所以k的最大值为48。
泛化的不算,因为泛化的会早造成一定的重复性,于是乎最基本的就是18中假设,18个合取式进行析取,结果为2^18 - 1
这里借鉴下面大佬的博客,首先表示感谢。
(58条消息) 周志华《机器学习》习题答案(不断更新中)_不一样的天蝎座的博客-CSDN博客_机器学习答案