机器学习(周志华) 第一章 绪论 课后习题答案
文章目录
1.1 表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间。
| 编号 | 色泽 | 根蒂 | 敲声 | 是否好瓜 |
|---|---|---|---|---|
| 1 | 青绿 | 蜷缩 | 浊响 | 是 |
| 4 | 乌黑 | 稍蜷 | 沉闷 | 否 |
假设空间:问题所有可能出现的情况组成的空间。
版本空间:与训练集正例一致的假设空间。
上表有3个属性,每个属性有两个取值。所以上述数据集假设空间大小为
| 编号 | 色泽 | 根蒂 | 敲声 | 与训练集正例是否一致 |
|---|---|---|---|---|
| 1 | 青绿 | 蜷缩 | 浊响 | 是 |
| 2 | 青绿 | 稍蜷 | 浊响 | 否 |
| 3 | 青绿 | * | 浊响 | 是 |
| 4 | 青绿 | 蜷缩 | 沉闷 | 否 |
| 5 | 青绿 | 蜷缩 | * | 是 |
| 6 | 青绿 | * | * | 是 |
| 7 | 青绿 | 稍蜷 | 沉闷 | 否 |
| 8 | 青绿 | 稍蜷 | * | 否 |
| 9 | 青绿 | * | 沉闷 | 否 |
| 10 | 乌黑 | 蜷缩 | 浊响 | 否 |
| 11 | 乌黑 | 稍蜷 | 浊响 | 否 |
| 12 | 乌黑 | * | 浊响 | 否 |
| 13 | 乌黑 | 蜷缩 | 沉闷 | 否 |
| 14 | 乌黑 | 蜷缩 | * | 否 |
| 15 | 乌黑 | * | * | 否 |
| 16 | 乌黑 | 稍蜷 | 沉闷 | 否 |
| 17 | 乌黑 | 稍蜷 | * | 否 |
| 18 | 乌黑 | * | 沉闷 | 否 |
| 19 | * | 蜷缩 | 浊响 | 是 |
| 20 | * | 稍蜷 | 浊响 | 否 |
| 21 | * | * | 浊响 | 是 |
| 22 | * | 蜷缩 | 沉闷 | 否 |
| 23 | * | 蜷缩 | * | 是 |
| 24 | * | * | * | 否 |
| 25 | * | 稍蜷 | 沉闷 | 否 |
| 26 | * | 稍蜷 | * | 否 |
| 27 | * | * | 沉闷 | 否 |
| 28 | 空 | 空 | 空 | 否 |
综上所述,问题一的版本空间为:
- 色泽=“青绿”,根蒂=“蜷缩”,声音=“浊响”
- 色泽=“青绿”,根蒂=“蜷缩”,声音="*"
- 色泽=“青绿”,根蒂="*", 声音=“浊响”
- 色泽=“青绿”,根蒂="*" 声音 ="*"
- 色泽="*",根蒂=“蜷缩”, 声音="*"
- 色泽="*", 根蒂 =“蜷缩”,声音=“浊响”
- 色泽="*", 根蒂 ="*",声音=“浊响”
1.2 与使用单个合取式来进行假设表示相比,使用“析合范式”将使得假设空间具有更强的表示能力。若使用最多包含k个合取式的析合范式来表达1.1的西瓜分类问题的假设空间,试估算有多少种可能的假设。
表1.1包含3种属性,它的假设空间和大小为
不考虑冗余、空集的情况下k最大取值为48,考虑冗余的情况下k最大取值为18.
- k=1时,共48种;
- k=18时,共1种。
- k取中间值,比较复杂,暂时没有想到解法。