人工智能机器学习技术练习(习题卷6)第1部分:单项选择题,共62题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]如果一个 SVM 模型出现欠拟合,那么下列哪种方法能解决这一问题?
A)增大惩罚参数 C 的值
B)减小惩罚参数 C 的值
C)减小核系数(gamma参数)
答案:A
解析:
2.[单选题]决策树每个非叶结点表示()
A)某一个特征或者特征组合上的测试
B)某个特征满足的条件
C)某个类别标签
答案:A
解析:
3.[单选题]以下不是开源工具特点的是
A)免费
B)可以直接获取源代码
C)用户可以修改源代码并不加说明用于自己的软件中
D)开源工具一样具有版权
答案:C
解析:
4.[单选题]下列核函数特性描述错误的是
A)只要一个对称函数所对应的核矩阵半正定,就能称为核函数;
B)核函数选择作为支持向量机的最大变数;
C)核函数将影响支持向量机的性能;
D)核函数是一种降维模型;
答案:D
解析:
5.[单选题]关于 Python 变量的使用,说法错误的是(  )。
A)变量不必事先声明
B)变量无需先创建和赋值即可直接使用
C)变量无须指定类型
D)可以使用del释放资源
答案:B
解析:
6.[单选题]马尔可夫随机场是典型的马尔可夫网,这是一种著名的(__)模型。
A)无向图
B)有向图
C)树形图
解析:
7.[单选题]当k=3时,使用k近邻算法判断下图中的绿方框属于()
A)圆形
B)三角形
C)长方形
D)以上都不是
答案:B
解析:
8.[单选题](__)是具有适应性的简单单元组成的广泛并行互联的网络。
A)神经系统
B)神经网络
C)神经元
D)感知机
答案:B
解析:
9.[单选题]所有预测模型在广义上都可称为一个或一组(__)。
A)公式
B)逻辑
C)命题
D)规则
答案:D
解析:
10.[单选题]6. AGNES是一种()聚合策略的层次聚类算法
A)A自顶向下
B)自底向上
C)由最近样本决定
D)D最远样本决定
答案:B
解析:
11.[单选题]互为对偶的两个线性规划问题的解存在关系()
A)原问题无可行解,对偶问题也无可行解
B)对偶问题有可行解,原问题可能无可行解
C)若最优解存在,则最优解相同
D)一个问题无可行解,则另一个问题具有无界解
答案:B
解析:
12.[单选题]过滤式特征选择与学习器(),包裹式特征选择与学习器()。
A)相关,相关
B)相关,不相关
C)不相关,相关
D)不相关,不相关
答案:C
解析:过滤式特征选择先对数据集进行特征选择,然后再训练学习器,特征选择过程与后续学习器无关。包裹式特征选择
13.[单选题](__)是交叉验证法的一种特例。
A)自助法
B)留一法
C)交叉验证法
D)错误率分析
答案:B
解析:
14.[单选题]以下说法中:
①一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的;
②如果增加模型复杂度,那么模型的测试错误率总是会降低;
③如果增加模型复杂度,那么模型的训练错误率总是会降低,正确的是()。
A)1
B)2
C)3
D)1、3
答案:C
解析:如果增加模型复杂度,那么模型的测试错误率总是会降低,训练错误率可能降低,也可能增高。
15.[单选题]下面关于深度学习相关描述不正确的有(__)。
A)深度学习是一种特征学习方法
B)深度学习通过足够多的简单转换函数及其组合方式来学习一个复杂的目标函数
C)深度学习的关键在于计算观测书记的分层特征及其表示
D)ANN不是深度学习
答案:D
解析:
16.[单选题]Pandas中转为日期格式的方法是()。
A)datetime()
B)to_datetime()
C)to_time()
D)date()
答案:B
解析:
17.[单选题]我们建立一个5000个特征,100万数据的机器学习模型。我们怎么有效地应对这样的大数据训练()。
A)我们随机抽取一些样本,在这些少量样本之上训练
B)我们可以试用在线机器学习算法
C)我们应用PCA算法降维,减少特征数
D)以上答案都正确
答案:D
解析:样本数过多或者特征数过多,而不能单机完成训练,可以用小批量样本训练,或者在线累计式训练,或者主成分PCA 降维方式减少特征数量再进行训练。
18.[单选题]下列哪项关于模型能力(model capacity)的描述是正确的?(指神经网络模型能拟合复杂函数的
能力)
A)隐藏层层数增加,模型能力一定增加
B)Dropout的比例增加,模型能力增加
C)学习率增加,模型能力增加
D)都不正确
19.[单选题]归结原理的特点是
A)发明新的概念和关系
B)发现更多的规则正则化是为了防止
C)缓解过拟合的风险
D)将复杂的逻辑规则与背景知识联系起来化繁为简
答案:D
解析:
20.[单选题]代码select bin(17)与下面结果一致:
A)select conv(17,10,2)
B)select conv(17,2,10)
C)select conv(17,2,16)
D)select conv(17,10,16)
答案:A
解析:
21.[单选题]对数几率回归(logistics regression)和一般回归分析有什么区别?:
A)对数几率回归是设计用来预测事件可能性的
B)对数几率回归可以用来度量模型拟合程度
C)对数几率回归可以用来估计回归系数
D)以上所有
答案:D
解析:
22.[单选题]下面关于参数估计相关描述不正确的有(__)。
A)参数估计是根据样本的统计量来估计总体的参数
B)相关分析是参数估计
C)点估计是参数估计
D)利用样本均值估计总体均值是参数估计
答案:B
解析:
23.[单选题]关于L1、L2正则化,下列说法正确的是()。
A)L2正则化能防止过拟合,提升模型的泛化能力,但L1 做不到这点
B)L2正则化技术又称为Lasso Regularization
C)L1正则化得到的解更加稀疏
D)L2正则化得到的解更加稀疏
答案:C
解析:L1 正则化可以产生稀疏权值矩阵,即产生一个稀疏模型,可以用于特征选择;L2正则化可以防止模型过拟合,一定程度上L1也可以防止过拟合,L1正则化又称Lasso Regression。
24.[单选题]以下哪个不是HDFS的守护进程?
A)secondarynamenode
B)datanode
C)mrappmaster/yarnchild
D)namenode
答案:C
解析:
B)规则
C)关系式
D)模式
答案:B
解析:
26.[单选题]线性判别分析(LDA)从贝叶斯决策理论阐释,当两类数据同先验且满足()时,LDA达到最优分类。
A)高斯分布
B)协方差相等
C)高斯分布且协方差相等
D)协方差不等
答案:C
解析:
27.[单选题]线性判别分析常被视为一种经典的__技术。
A)非监督降维
B)半监督降维
C)监督降维
D)半监督SVM
答案:B
解析:
28.[单选题]考虑如下数据集,其中Customer ID(顾客id),Transaction ID(事务id),Items Bought(购买项)。如果将每个事务id看成一个购物篮,计算项集{e}, {b, d}, {b,
D, e}的支持度:
A)s({e}) =0.8s({b, d})= 0.2s({b,
D, e})= 0.2
B)s({e}) =0.7s({b, d})= 0.3s({b,
D, e})= 0.3
C)s({e}) =0.6s({b, d})= 0.4s({b,
D, e})= 0.3
D)s({e}) =0.8s({b, d})= 0.1s({b,
D, e})= 0.1
答案:A
解析:
29.[单选题]在利用矢量形式的图像数据文件中?
A)图像的分辨率与数据文件的大小成正比;
B)如果显示其中的图像会有方块;’
C)图形由空间分布的像素的集合来表示;
D)不仅有数据还有命令;
答案:D
解析:
30.[单选题]在BMP格式、GIF格式、TIFF格式和JPEG格式中,下面哪个选项正确?
A)表示同一副图像,BMP格式使用的数据量最多;
B)GIF格式独立于操作系统;
C)每种格式都有文件头,其中TIFF格式的最复杂;

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。