人工智能机器学习技术练习(习题卷29)
第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]聚类属于()
A)监督学习
B)无监督学习
C)强化学习
答案:B
解析:
2.[单选题]对于 随机森林和GradientBoosting Trees, 下面说法正确的是:
A)在随机森林的单个树中, 树和树之间是有依赖的, 而GradientBoosting Trees中的单个树之间是没有依赖的.
B)这两个模型都使用随机特征子集, 来生成许多单个的树.
C)我们可以并行地生成GradientBoosting Trees单个树, 因为它们之间是没有依赖的, GradientBoosting Trees训练模型的表现总是比随机森林好
答案:B
解析:随机森林是基于bagging的, 而Gradient Boosting trees是基于boosting的, 所有说反了,在随机森林的单个树中, 树和树之间是没有依赖的, 而GradientBoosting Trees中的单个树之间是有依赖关系.
这两个模型都使用随机特征子集, 来生成许多单个的树.
3.[单选题]在(__)特征选择中,特征选择算法本身作为组成部分嵌入到学习算法中,最典型的就是决策树算法。
A)过滤式
B)嵌入式
C)包裹式
D)随机
答案:B
解析:
4.[单选题]给定的数据集包括“胡佛塔”和其他一些塔的图像。现在要使用PCA(特征脸)和最近邻方法来构建一个分类器,可以预测新图像是否显示“胡佛塔”。该图给出了输入的训练图像样本
alt="" >
为了从“特征脸”算法获得合理的性能,这些图像将需要什么预处理步骤?
A)1
B)2
C)1和2
D)都不是
答案:C
解析:
5.[单选题]根据操作的反馈总结更好的策略,这个过程抽象出来,就是
A)强化训练
B)加强训练
C)强化学习
D)加强学习
答案:C
解析:
6.[单选题]下列关于L1正则化与L2正则化的描述,错误的是()。
A)L1范数正则化有助于降低过拟合风险
B)L2范数正则化有助于降低过拟合风险
C)L1范数正则化比 L2范数正则化更有易于获得稀疏解
D)L2范数正则化比 L1 范数正则化更有易于获得稀疏解
答案:C
解析:参考周志华著《机器学习》252页。
7.[单选题]不属于判别式模型的是()。
A)决策树
B)BP神经网络
C)支持向量机
D)贝叶斯
答案:D
解析:正则化可以产生稀疏权值
8.[单选题]()算法的训练数据集部分有特征有标签,部分有特征无标签
A)有监督学习
B)半监督学习
C)无监督学习
解析:
9.[单选题]()是指机器学习算法对新鲜样本的适应能力。
A)模型测试
B)泛化能力
C)过拟合
D)模型训练
答案:B
解析:
10.[单选题]拆分和合并图像通道的方法为()。
A)Split()和merge()
B)split()和merge()
C)split()和Merge()
D)Split()和merge()
答案:B
解析:
11.[单选题]多次“采样”,然后求取平均累积奖赏来作为期望积累奖赏的近似,这称为(__)。
A)免模型学习
B)机器学习
C)深度学习
D)蒙特卡罗强化学习
答案:D
解析:
12.[单选题]与k均值算法类似,(__)也是试图到一组原型向量来刻画聚类结构,但与一般聚类方法不同的是,该算法假设数据样本带有类别标记,学习过程利用样本的这些监督信息来辅助聚类。
A)高斯混合聚类密度聚类
B)学习向量量化
C)k均值算法
D)密度聚类
答案:B
解析:
13.[单选题]下列哪些不是“子集搜索”中的搜索方式
A)单向搜索
B)双向搜索
C)前向搜索
D)后向搜索
答案:A
解析:
14.[单选题]下面不属于大数据4V特性有( )。
A)容量大
B)类型多
C)速度快
D)应用价值高
答案:D
15.[单选题]解决隐马模型中预测问题的算法是?
A)前向算法
B)后向算法
C)Baum-Welch算法
D)维特比算法
答案:D
解析:
16.[单选题]关于BP算法特点描述错误的是 ( )
A)输入信号顺着输入层、隐层、输出层依次传播
B)计算之前不需要对训练数据进行归一化
C)预测误差需逆向传播,顺序是输出层、隐层、输入层
D)各个神经元根据预测误差对权值进行调整
答案:B
解析:
17.[单选题]()聚类方法采用概率模型来表达聚类。
A)K-means
B)LVQ
C)DBSCAN
D)高斯混合聚类
答案:D
解析:高斯混合聚类(Mixture of Gaussian)采用概率模型来表达聚类。
18.[单选题]字符串"//^▽^//\n"的长度是
A)6
B)7
C)8
D)9
答案:C
解析:
19.[单选题]( )是一种处理时序数据的神经网络,常用于语音识别,机器翻译等领域。 [] *
A)前馈神经网络
B)卷积神经网络
C)循环神经网络
D)对抗神经网络
答案:C
解析:
20.[单选题]点击率的预测是一个数据比例不平衡问题(如训练集中样本呈阴性的比例为99%,阳性的比例是1%),如果我们用这种数据建立模型并使得训练集的准确率高达99%。我们可以得出结论是()。
A)模型的准确率非常高,我们不需要进一步探索
B)模型不好,我们应建一个更好的模型
C)无法评价模型
D)以上答案都不正确
答案:C
解析:对于失衡数据,模型的准确率不能作为衡量模型效果的标准。因为我们需要探索的是少数1%的数据,为更好地评估模型效果,可以用灵敏度、特异度、F-measure来判断。
21.[单选题]以下哪个不是常见的属性类型? ( )
A)标称属性
B)数值属性
C)高维属性
D)序数属性
答案:C
解析:
22.[单选题]数据科学是一门以“数据时代”,尤其是“大数据时代”面临的新挑战、新机会、新思维和新方法为核心内容的,包括新的理论、方法、模型、技术、平台、工具、应用和最佳实践在内的( )。
A)新兴科学
B)交叉性学科
C)独立学科
D)一整套知识体系
答案:D
解析:
23.[单选题]采用主成分分析法映射到低维空间,将最小的 d-d′个特征向量舍弃,产生的影响是( )。
A)使样本采样密度增大
B)丢失最优解
C)增大噪声
D)使样本采样密度减小
答案:A
解析:低维空间与原始高维空间必有不同,因为对应于最小的 d-d'个特征值的特征向量被舍弃了,这是降维导致的结果。但舍弃这部分信息往往是必要的: 一方面舍弃这部分信息之后能使样本的采样密度增大,这正是降维的重要动机;另一方面,当数据受到噪声影响时,最小的特征值所对应的特征向量往往与噪声有关。将它们舍弃能在一定程度上起到去噪的效果。
24.[单选题]以下描述中,属于集合特点的是
A)集合中的数据是无序的
B)集合中的数据是可以重复的
C)集合中的数据是严格有序的
D)集合中必须嵌套一个子集合
答案:A
解析:
25.[单选题]tensorflow中的v2d()的函数,其作用是( )。
A)图像输入
B)进行卷积
C)进行池化
D)图像输出
答案:B
解析:
26.[单选题]以下关于感知器说法错误的是: ( )
A)感知器中的偏置只改变决策边界的位置
B)可为感知器的输出值设置阈值使其用于处理分类问题
C)单层感知器可以用于处理非线性学习问题
D)感知器是最简单的前馈式人工神经网络
答案:C

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。