一、填空题
1.‌我们要用概率模型对数据和标签进行学习,需要数据/标签对服从某种概率分布,称为 (        )。
正确答案:数据生成分布
2.‏在决策树学习中将已生成的树进行简化的过程称为(        ) 。
正确答案:剪枝
二、判断题
1.‏支持向量分类器的判断规则只由训练观测的一部分(支持向量)确定。
正确答案:
2.‏支持向量机通过使用核函数来扩大特征空间。
‎正确答案:
在常用的正则化计算方法中 属于
3.‎支持向量机可看作是一类简单、直观的最大间隔分类器的推广。
‎正确答案:
4.‏支持向量是最靠近决策表面的数据点。
正确答案:
5.‏树的内部结点用特征作标签,树枝用是否符合特征来标签。
正确答案:
6.‍过拟合发生在模型太过偏向训练数据时,对于决策树可以采用修剪的方法阻止过拟合。
正确答案:
7.​对于实值特征,可以用比较测试将数据划分为两部分,或者选择范围过滤。
正确答案:
8.​决策树的节点有两种类型:内部节点和叶节点。内部节点表示一个特征或属性,叶节点表示一个类。
正确答案:
9.‌过拟合发生在模型太过偏向训练数据时。
正确答案:
10.‍决策树的修剪可以采用正则化的方法。
正确答案:
三、单选题
1.怎样理解非完美分类的超平面分类器?(        )
A.允许小部分训练观测被误分。
B.允许大部分训练观测被误分。
C.两种说法都对。
D.两种说法都不对。
正确答案:A
2.‍SVM算法的性能取决于(        )。
A.核函数的选择
B.核函数的参数
C.软间隔参数C
D.以上都是
正确答案:D
3.‏SVM算法的最小时间复杂度是O(n*n)。基于这一点,(          )规格的数据集并不适用于该算法。
A.大数据集
B.小数据集
C.中数据集
D.不受数据集大小的影响
正确答案:A
4.‌假定现在有一个四分类问题,你要用One-vs-all策略训练一个SVM的模型,你需要训练几个SVM模型?(        )
A.1
B.2
C.3
D.4
正确答案:D
5.‏在构建决策树时,需要计算每个用来划分数据特征的得分,选择分数最高的特征,以下可以作为得分的是?(            )
A.熵
B.基尼系数
C.训练误差
D.以上都是
正确答案:D
6.‎在决策树学习过程中,哪些情况可能会导致问题数据(特征相同但是标签不同)?(          )
A.数据错误
B.数据有噪音
C.现有的特征不足以区分或决策
D.以上都是
正确答案:D
7.‏在构建决策树时,以下属于处理有多个值的特征的方法的是(          )。
A.处理成多个二值划分
B.处理成多个划分
C.以上都是
D.以上都不是
正确答案:C
四、多选题
1.‏常用的核函数有(            )。
A.线性核
B.径向核
C.拉普拉斯核
D.Sigmoid核
正确答案:A、B、C、D
2.‍下面哪些是SVM在实际生活中的应用。(          )
A.文本分类
B.图片分类
C.新闻聚类
D.手写字体识别
正确答案:A、B、C、D
3.‌在构建决策树时,以下属于处理实值特征的方法的是(            )。
A.用比较测试将数据划分为两个部分
B.处理成多个二值划分
C.选择范围过滤
D.以上都不是
正确答案:A、C
4.‌在下列哪些情况下可以为标签创建叶节点。(          )
A.达到一个足够小的训练误差
B.剩下一定数量/比例的数据
C.所有数据属于同一个类
D.所有数据具有相同的特征值
正确答案:A、B、C、D

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。