机器学习(周志华) 第一章 绪论 课后习题答案
文章目录
1.1 表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间。
编号 | 色泽 | 根蒂 | 敲声 | 是否好瓜 |
---|---|---|---|---|
1 | 青绿 | 蜷缩 | 浊响 | 是 |
4 | 乌黑 | 稍蜷 | 沉闷 | 否 |
假设空间:问题所有可能出现的情况组成的空间。
版本空间:与训练集正例一致的假设空间。
上表有3个属性,每个属性有两个取值。所以上述数据集假设空间大小为$$ 3 \\times 3 \\times 3 + 1 = 28 $$。
编号 | 色泽 | 根蒂 | 敲声 | 与训练集正例是否一致 |
---|---|---|---|---|
1 | 青绿 | 蜷缩 | 浊响 | 是 |
2 | 青绿 | 稍蜷 | 浊响 | 否 |
3 | 青绿 | * | 浊响 | 是 |
4 | 青绿 | 蜷缩 | 沉闷 | 否 |
5 | 青绿 | 蜷缩 | * | 是 |
6 | 青绿 | * | * | 是 |
7 | 青绿 | 稍蜷 | 沉闷 | 否 |
8 | 青绿 | 稍蜷 | * | 否 |
9 | 青绿 | * | 沉闷 | 否 |
10 | 乌黑 | 蜷缩 | 浊响 | 否 |
11 | 乌黑 | 稍蜷 | 浊响 | 否 |
12 | 乌黑 | * | 浊响 | 否 |
13 | 乌黑 | 蜷缩 | 沉闷 | 否 |
14 | 乌黑 | 蜷缩 | * | 否 |
15 | 乌黑 | * | * | 否 |
16 | 乌黑 | 稍蜷 | 沉闷 | 否 |
17 | 乌黑 | 稍蜷 | * | 否 |
18 | 乌黑 | * | 沉闷 | 否 |
19 | * | 蜷缩 | 浊响 | 是 |
20 | * | 稍蜷 | 浊响 | 否 |
21 | * | * | 浊响 | 是 |
22 | * | 蜷缩 | 沉闷 | 否 |
23 | * | 蜷缩 | * | 是 |
24 | * | * | * | 否 |
25 | * | 稍蜷 | 沉闷 | 否 |
26 | * | 稍蜷 | * | 否 |
27 | * | * | 沉闷 | 否 |
28 | 空 | 空 | 空 | 否 |
综上所述,问题一的版本空间为:
- 色泽=“青绿”,根蒂=“蜷缩”,声音=“浊响”
- 色泽=“青绿”,根蒂=“蜷缩”,声音="*"
- 色泽=“青绿”,根蒂="*", 声音=“浊响”
- 色泽=“青绿”,根蒂="*" 声音 ="*"
- 色泽="*",根蒂=“蜷缩”, 声音="*"
- 色泽="*", 根蒂 =“蜷缩”,声音=“浊响”
- 色泽="*", 根蒂 ="*",声音=“浊响”
1.2 与使用单个合取式来进行假设表示相比,使用“析合范式”将使得假设空间具有更强的表示能力。若使用最多包含k个合取式的析合范式来表达1.1的西瓜分类问题的假设空间,试估算有多少种可能的假设。
表1.1包含3种属性,它的假设空间和大小为 $$ 3 \\times 4 \\times 4 + 1 = 49 $$。 考虑冗余情况: 具体假设:$$ 2 \\times 3 \\times 3 = 18 $$种; 一个通配符:$$ 2 \\times 3 + 3 \\times 3 + 2 \\times 3 =21 $$种; 两个通配符:$$2 + 3 + 3 =8 $$种; 三个通配符:1种。
不考虑冗余、空集的情况下k最大取值为48,考虑冗余的情况下k最大取值为18.
- k=1时,共48种;
- k=18时,共1种。
- k取中间值,比较复杂,暂时没有想到解法。