人工智能机器学习技术练习(试卷编号1141)
1.[单选题]在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟合(over-
fitting)中影响最大?
A)多项式阶数
B)更新权重 w 时,使用的是矩阵求逆还是梯度下降
C)使用常数项
答案:A
解析:选择合适的多项式阶数非常重要。如果阶数过大,模型就会更加复杂,容易发生过拟合;如果阶数较小,模型就会过于简单,容易发生欠拟合。
2.[单选题]对于神经网络的说法, 下面正确的是 :
A)增加神经网络层数, 可能会增加测试数据集的分类错误率
B)减少神经网络层数, 总是能减小测试数据集的分类错误率
C)增加神经网络层数, 总是能减小训练数据集的分类错误率
答案:A
解析:深度神经网络的成功, 已经证明, 增加神经网络层数, 可以增加模型范化能力, 即, 训练数据集和测试数据集都表现得更好. 但是, 在这篇文献中, 作者提到, 更多的层数, 也不一定能保证有更好的表现. 所以, 不能绝对地说层数多的好坏, 只能选A
3.[单选题]对于 随机森林和GradientBoosting Trees, 下面说法正确的是:
A)在随机森林的单个树中, 树和树之间是有依赖的, 而GradientBoosting Trees中的单个树之间是没有依赖的.
B)这两个模型都使用随机特征子集, 来生成许多单个的树.
C)我们可以并行地生成GradientBoosting Trees单个树, 因为它们之间是没有依赖的, GradientBoosting Trees训练模型的表现总是比随机森林好
答案:B
解析:随机森林是基于bagging的, 而Gradient Boosting trees是基于boosting的, 所有说反了,在随机森林的单个树中, 树和树之间是没有依赖的, 而GradientBoosting Trees中的单个树之间是有依赖关系.
这两个模型都使用随机特征子集, 来生成许多单个的树.
4.[单选题]SVM在下列那种情况下表现糟糕
A)线性可分数据
B)清洗过的数据
C)含噪声数据与重叠数据点
答案:C
解析:当数据中含有噪声数据与重叠的点时,要画出干净利落且无误分类的超平面很难
5.[单选题]主成分分析是一种常用的(__)方法。
A)降维
B)分类
C)回归
D)聚类
答案:A
解析:
6.[单选题]关于SMO神经网络描述错误的是
A)一种竞争学习型的无监督神经网络;
B)将高维输入数据映射到低维空间,保持输入数据在高维空间的拓扑结构;
C)SMO寻优目标为每个输出神经元到合适的权重;
D)输出层神经元以矩阵方式排列在二维空间;
答案:C
解析:
7.[单选题](__)是根据数据采样来估计概率分布参数的经典方法。
A)贝叶斯判定准则
B)贝叶斯决策论
C)贝叶斯分类器
D)极大似然估计
答案:D
解析:
8.[单选题]下面哪个是NLP用例?
A)从图像中检测物体
B)面部识别
C)语音生物识别
D)文本摘要
答案:D
解析:
9.[单选题]下列哪个方法不属于情感分析的评测?
A)COAE评测
B)cifar10数据集评测
C)CCF TCCI评测
D)TAC评测
答案:B
正则化描述正确的是解析:
10.[单选题]线性模型有很好的(__)。
A)可描述性
B)分类结果
C)可解释性
D)聚类结果
答案:C
解析:
11.[单选题]在大规模的语料中,挖掘词的相关性是一个重要的问题。以下哪一个信息不能用于确定两个词的相关性。
A)互信息
B)最大熵
C)卡方检验
D)最大似然比
答案:B
解析:
12.[单选题]最早被提出的循环神经网络门控算法是什么。()
A)长短期记忆网络
B)门控循环单元网络
C)堆叠循环神经网络
D)双向循环神经网络
答案:A
解析:
13.[单选题]有关深度神经网络的训练(Training)和推断(Inference),以下说法中不正确的是:()
A)将数据分组部署在不同GPU上进行训练能提高深度神经网络的训练速度。
B)TensorFlow使用GPU训练好的模型,在执行推断任务时,也必须在GPU上运行。
C)将模型中的浮点数精度降低,例如使用float16代替float32,可以压缩训练好的模型的大小。
D)GPU所配置的显存的大小,对于在该GPU上训练的深度神经网络的复杂度、训练数据的批次规模等,都是一个无法忽视的影响因素。
答案:B
解析:
14.[单选题]半监督学习不包括
A)直推学习
B)纯半监督学习
C)主动学习
D)图半监督学习
答案:C
解析:
15.[单选题]在抽样估计中,随着样本容量的增大,样本统计量接近总体参数的概率就越大,这一性质称为( )。
A)无偏性
B)有效性
C)及时性
D)一致性
答案:D
解析:一致性是指随着样本容量的增大,样本统计量接近总体参数的概率就越大。对于给定的偏差控制水平,两者间偏差高于此控制水平的可能性越小。
16.[单选题]如下代码中plt的含义是( )
import matplotlib.pyplot as plt
A)别名
B)类名
C)函数名
D)变量名
答案:A
解析:
17.[单选题]研究某超市销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的那类问题()
A)关联规则发现
B)聚类
C)分类
D)自然语言处理
答案:A
解析:
18.[单选题]下列关于特征选择的说法错误的是
A)可以提高特征关联性
B)可以减轻维数灾难问题
C)可以降低学习任务的难度
D)特征选择和降维具有相似的动机
答案:A
解析:
19.[单选题]输入图像为32x32,经过步长为1,不进行padding,卷积核为5x5的卷积层后,得到的特征图尺寸是多少?()
A)28x28
B)27x27
C)29x29
D)32x32
答案:A
解析:
20.[单选题]所谓不确定性推理就是从( )的初始证据出发,通过运用( )的知识,最终推出具有一定
程度的不确定性但却是合理或者近乎合理的结论的思维过程
A)不确定性, 不确定性
B)确定性, 确定性
C)确定性, 不确定性
D)不确定性 确定性
答案:A
解析:
21.[单选题]下面不属于跨平台性基础设施和跨平台分析工具的有(__)。
A)IBM
B)Microsoft
C)Amazon
D)redeo
答案:D
解析:
22.[单选题]情感分析技术可以应用于()
A)股票市场分析
B)互联网舆情分析与监控
C)商品服务质量评估
D)以上都是
答案:D
解析:
23.[单选题]对于在原空间中线性不可分问题,支持向量机()。
A)无法处理
B)将数据映射到核空间中
C)在原空间中寻非线性函数的划分数据
D)在原空间中寻线性函数划分数据
答案:B
解析:
24.[单选题]调用sklearn中的train_test_split函数将数据集切分为训练集和测试集。训练集与测试集比例为6:4。最合适的代码为:
A)X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.4)
B)X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.6)
C)X_train,y_train,X_test,y_test=train_test_split(X,y,test_size=0.6)
D)y_train,y_test,X_train,X_test =train_test_split(X,y,test_size=0.4)
答案:A
解析:
25.[单选题]机器学习的经典定义是: ()
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论