西瓜书第一章习题及答案

西瓜书第一章习题及答案_第1张图片
西瓜书第一章习题及答案_第2张图片
注释:
1、假设空间:可以简单理解为所有属性各种取值的不同组合,假设空间大小为(属性1取值个数+1)(属性2取值个数+1)……(属性n取值个数+1)+1。
2、版本空间:从假设空间删除掉与正例不一致和与反例一致的假设后,剩余的假设所组成的集合,即存在着一个与训练集一致的“假设集合”。

解答:
表1.1它存在的假设空间为:
1 色泽=*,根蒂=*,敲声=*
2 色泽=青绿,根蒂=*,敲声=*
3 色泽=乌黑,根蒂=*,敲声=*

4 色泽=*,根蒂=蜷缩,敲声=*
5 色泽=*,根蒂=硬挺,敲声=*
6 色泽=*,根蒂=稍蜷,敲声=*

7 色泽=*,根蒂=*,敲声=浊响
8 色泽=*,根蒂=*,敲声=清脆
9 色泽=*,根蒂=*,敲声=沉闷

10 色泽=青绿,根蒂=蜷缩,敲声=*
11 色泽=青绿,根蒂=硬挺,敲声=*
12 色泽=青绿,根蒂=稍蜷,敲声=*

13 色泽=乌黑,根蒂=蜷缩,敲声=*
14 色泽=乌黑,根蒂=硬挺,敲声=*
15 色泽=乌黑,根蒂=稍蜷,敲声=*

16 色泽=青绿,根蒂=*,敲声=浊响
17 色泽=青绿,根蒂=*,敲声=清脆
18 色泽=青绿,根蒂=*,敲声=沉闷

19 色泽=乌黑,根蒂=*,敲声=浊响
20 色泽=乌黑,根蒂=*,敲声=清脆
21 色泽=乌黑,根蒂=*,敲声=沉闷

22 色泽=*,根蒂=蜷缩,敲声=浊响
23 色泽=*,根蒂=蜷缩,敲声=清脆
24 色泽=*,根蒂=蜷缩,敲声=沉闷

25 色泽=*,根蒂=硬挺,敲声=浊响
26 色泽=*,根蒂=硬挺,敲声=清脆
27 色泽=*,根蒂=硬挺,敲声=沉闷

28 色泽=*,根蒂=稍蜷,敲声=浊响
29 色泽=*,根蒂=稍蜷,敲声=清脆
30 色泽=*,根蒂=稍蜷,敲声=沉闷

31 色泽=青绿,根蒂=蜷缩,敲声=浊响
32 色泽=青绿,根蒂=蜷缩,敲声=清脆
33 色泽=青绿,根蒂=蜷缩,敲声=沉闷
34 色泽=青绿,根蒂=硬挺,敲声=浊响
35 色泽=青绿,根蒂=硬挺,敲声=清脆
36 色泽=青绿,根蒂=硬挺,敲声=沉闷
37 色泽=青绿,根蒂=稍蜷,敲声=浊响
38 色泽=青绿,根蒂=稍蜷,敲声=清脆
39 色泽=青绿,根蒂=稍蜷,敲声=沉闷

40 色泽=乌黑,根蒂=蜷缩,敲声=浊响
41 色泽=乌黑,根蒂=蜷缩,敲声=清脆
42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷
43 色泽=乌黑,根蒂=硬挺,敲声=浊响
44 色泽=乌黑,根蒂=硬挺,敲声=清脆
45 色泽=乌黑,根蒂=硬挺,敲声=沉闷
46 色泽=乌黑,根蒂=稍蜷,敲声=浊响
47 色泽=乌黑,根蒂=稍蜷,敲声=清脆
48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷

49 Ø

如果只含1和4,1对应的是‘好瓜=是’,根据注释2,将与正例不一致的假设删除;4对应的是‘好瓜=否’,将与反例一致的假设删除。
根据1删除得有假设:3、5、6、8、9、11-15、17-21、23-30、32-49;
根据4删除的假设:1,、3、6、9、15、21、30、48;
搜索过程中总的删除的假设有:1、3、5、6、8、9、11-15、17-21、23-30、32-49;
剩下的假设有为:2、4、7、10、16、22、31
剩余的假设即为所求版本空间为:{2、4、7、10、16、22、31}

西瓜书第一章习题及答案_第3张图片由题1.1知,共有49种假设,其中:
全部不泛化 2∗3∗3=182∗3∗3=18种假设;
一个属性泛化:2∗3+3∗3+2∗3=21种假设;
两个属性泛化:2+3+3=82+3+3=8种假设;
三属性泛化:1种假设
空集:1种假设
不考虑空集,则有48种假设,所以k的最大值为48。
而组成的析合范式是这48种假设的排列组合,展开序列为(即杨辉三角的一排):(1、48、1128、… 、1128、48、1)共49个数,左边的1表示:一个假设都没选,右边的1表示:全部假设都被选。

如果k=48,就是说最多采用48种合取式来组成析合范式,排除一种都不选的情况,就是2^48 - 1种。(2^48是根据二项式系数之和得的);
如果0 如果指定了k的个数,那就是展开序列的第k+1(因为展开序列从0开始数)项的数。

但是,这个结果得去重才行,因为泛化是对若干种假设的包含(包容),它本身不是某种假设。把泛化的 * 展开后,就是若干种具体的假设。如果此题采取48,那么把 * 展开后,假设集合中一定有重复,而且一种具体假设还不止重复一次。此题应该采用18种具体假设来计算, 就是:2^18 - 1

文章参考链接:参考链接

你可能感兴趣的:(机器学习-西瓜书,机器学习)