人工智能机器学习技术练习(试卷编号221)
1.[单选题]分类的类别标签列是()
A)类别数值
B)类别的不同
C)具有次序、大小的意义
答案:B
解析:
2.[单选题]主成分分析用于()
A)特征降维
B)特征膨胀
C)特征子集计算
答案:A
解析:
3.[单选题]分类模型在进行训练时需要()
A)训练集
B)训练集与测试集
C)训练集、验证集、测试集
答案:C
解析:
4.[单选题]如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的?
A)测试样本误差始终为零
B)测试样本误差不可能为零
C)以上答案都不对
答案:C
解析:根据训练样本误差为零,无法推断测试样本误差是否为零。值得一提是,如果测试样本样本很大,则很可能发生过拟合,模型不具备很好的泛化能力!
5.[单选题]Task 运行在下来哪里个选项中 Executor 上的工作单元 ()。
A)Driver program
B)spark master
C)worker node
D)Cluster manager
答案:C
解析:
A)基因数据
B)影评数据
C)股票市场价格
D)以上所有
答案:D
解析:本题考查的是隐马尔可夫模型适用于解决哪类问题。
隐马尔可夫模型(Hidden Markov Model,HMM)是关于时序的概率模型,描述一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观察而产生观测随机序列的过程。因此,隐马尔可夫模型适用于解决时间序列问题。
7.[单选题]以下对大数据“涌现”描述不正确的是( )。
A)安全涌现是大数据涌现现象
B)小数据可能没价值,但是小数据组成的大数据却很有价值,这叫做价值涌现
C)小数据可能质量没问题,但是大数据质量会出现问题这叫质量涌现
D)小数据可能不涉及隐私,但是大数据可能严重威胁个人隐私,这叫隐私涌现
答案:C
解析:
8.[单选题]使用什么函数接收用输入的数据()。
A)accept()
B)input()
C)readline()
D)login()
答案:B
解析:
正则化描述正确的是9.[单选题](__)的学习目的是生成一颗泛化能力强,即处理未见示例能力强的决策树。
A)线性回归
B)贝叶斯分类器
C)神经网络
D)决策树
答案:D
解析:
10.[单选题]()算法是通过智能体不断与环境进行交互,通过试错的方式来获得最佳策略
A)有监督学习
B)半监督学习
C)无监督学习
D)强化学习
答案:D
11.[单选题]TF-IDF模型中IDF是指(__)。
A)词频数
B)逆文档频率
C)词频率
D)逆文档频数
答案:B
解析:
12.[单选题]K-Means(聚类)算法基于距离来度量实例间的相似程度(与kNN算法一样),然后把较为相似的实例划分到同一簇。下列说法中,不正确的是:
A)聚类属于有监督式学习
B)聚类属于无监督式学习
C)K-Means算法基于距离来度量实例间的相似程度,通过对无标记样本的学习来揭示蕴含于数据中的性质及规律
D)聚类算法的任务是根据数据特征将数据集相似的数据划分到同一簇
答案:A
解析:
13.[单选题]关于异常值的说法,下列选项中描述错误的是()。
A)异常值是指样本中明显偏离其余观测值的个别值
B)可以使用3σ原则检测异常值
C)可以使用Pandas中的箱线图检测异常值
D)异常值可以使用其它的值来替换
答案:A
解析:异常数据并不一定是数据错误,所以会根据实际情况下选择删除或保留。
14.[单选题]假定你现在训练了一个线性 SVM并推断出这个模型出现了欠拟合现象,在下一次训练时,应该采取的措施是()。
A)增加数据点
B)减少数据点
C)增加特征
D)减少特征
答案:C
解析:欠拟合是指模型拟合程度不高,数据距离拟合曲线较远,或指模型没有很好地捕捉到数据特征,不能够很好地拟合数据。可通过增加特征解决。
15.[单选题](__)是神经网络的基本单位。
A)神经系统
B)神经网络
C)神经元
16.[单选题]如果我们现有一个安装2.6.5版本的hadoop集,在不修改默认配置的情况下存储200个每个200M的文本文件,请问最终会在集中产生多少个数据块(包括副本)?
A)200
B)40000
C)400
D)1200
答案:D
解析:
17.[单选题]以下哪些选项为真?
A)线性回归误差值必须正态分布,但是在Logistic回归的情况下,情况并非如此
B)逻辑回归误差值必须正态分布,但是在线性回归的情况下,情况并非如此
C)线性回归和逻辑回归误差值都必须正态分布
D)线性回归和逻辑回归误差值都不能正态分布
答案:A
解析:
18.[单选题]有如下数据集,则频繁3-项集为:
class="fr-fic fr-dib cursor-hover"
A){O,K,E}
B){M,U,E}
C){N,K,O}
D){Y,U,E}
答案:A
解析:
19.[单选题]下面哪个操作是窄依赖 ()。
A)join
20.[单选题]高斯核也称为(__)。
A)多项式核
B)拉普拉斯核
C)RBF核
D)Sigmoid核
答案:C
解析:
21.[单选题]对OpenCV中绘制线段的line()方法中描述不正确的是()。
A)line()方法中的img参数表示画布
B)line()方法中的pt1参数表示线段的起点坐标
C)line()方法中的pt2参数表示线段的终点坐标
D)line()方法中的color参数表示画布的颜
答案:D
解析:
22.[单选题]随机森林相比Bagging,进一步在决策树的训练过程中引入了()选择
A)随机属性
B)重点属性
C)最优属性
D)集成属性
答案:A
解析:
23.[单选题]以下哪个不是常见的属性类型? ( )
A)标称属性
B)数值属性
C)高维属性
D)序数属性
答案:C
解析:
24.[单选题]在留出法、交叉验证法和自助法三种评估方法中,()更适用于数据集较小、难以划分训练集和测试集的情况。
A)留出法
B)交叉验证法
C)自助法

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。