人工智能机器学习技术练习(习题卷22)
说明:答案和解析在试卷最后
第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]逻辑回归常用于解决( )
A)回归问题
B)分类问题
C)优化问题
2.[单选题]假设有n组数据集,每组数据集中,x的平均值都是9,x的方差都是11,y的平均值都是7.50,x与y的相关系数都是
0.816,拟合的线性回归方程都是y=3.00+0.500x。那么这n组数据集()。
A)一样
B)不一样
C)无法确定是否一样
3.[单选题]()算法要求基学习器能对特定的数据分布进行学习,在训练过程的每一轮中,根据样本分布为每个训练样本重新赋予一个权重。
A)Boosting
B)支持向量机
C)贝叶斯分类器
D)神经网络
4.[单选题](__)代表的是生成数据的机构。
A)数据资源
B)数据源
C)数据端
D)数据站
5.[单选题]给定测试样本,基于某种距离度量出训练集中与其最靠近的k个训练样本,然后基于这k个样本的信息来进行预测。这种学习算法称为(__)。
A)k-means
B)k近邻学习
C)随机森林
D)决策树
6.[单选题]下列哪种去噪方法能较好的保持图像边缘。()
A)中值滤波
B)双边滤波
C)均值滤波
D)高斯滤波
A)(AB)C
B)AC(B)
C)A(BC)
D)所有效率都相同
8.[单选题]利用平滑滤波器可对图像进行低通滤波,消除噪声,但同时模糊了细节。一下哪项措施不能减小图像的模糊程度?
A)增加对平滑滤波器输出的或值处理(即仅保留大于或值的输出);
B)采用中值滤波的方法;
C)采用领域平均处理;
D)适当减小平滑滤波器的领域操作模板;
9.[单选题]软间隔SVM的阈值趋于无穷,下面哪种说法正确( )
A)只要最佳分类超平面存在,它就能将所有数据全部正确分类
B)软间隔SVM分类器将正确分类数据
C)会发生误分类现象
D)以上都不对
10.[单选题]概念分层图是( )图
A)无向无环
B)有向无环
C)有向有环
D)无向有环
11.[单选题]一个包含n类的多分类问题,若采用一对剩余的方法,需要拆分成多少次?
A)n
B)1
C)n-1
D)n+1
12.[单选题]下面属于Bagging方法的特点是( )
A)构造训练集时采用Bootstraping的方式
B)每一轮训练时样本权重不同
C)分类器必须按顺序训练
D)预测结果时,分类器的比重不同
13.[单选题]一般而言,在个体学习器性能相差较大时宜使用___,而在个体学习器性能相近时宜使用____
A)简单平均法,加权平均法
B)加权平均法,
C)简单平均法,
D)加权平均法,
14.[单选题]有关回归模型的系数,以下说法错误的是哪个( )。正则化是结构风险最小化策略的实现
A)一元线性回归模型的系数可以使用最小二乘法求得
B)多元回归模型的系数可以使用梯度下降法求得
C)一元线性回归模型的系数大小和正负说明自变量对因变量的相对影响大小
D)回归分析的目的是计算回归方程的系数,使得样本的输入和输出变量之间的关系能够合理拟合
15.[单选题]下列有关KNN算法的流程顺序,描述正确的是()①确定K的大小,和距离的计算方法②根据K个样本的所属
C)① ③ ②
D)② ① ③
16.[单选题]下面有关分类算法的准确率,召回率,F1 值的描述,错误的是?
A)准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率
B)召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率
C)正确率、召回率和 F 值取值都在 0 和 1 之间,数值越接近 0,查准率或查全率就越高
D)为了解决准确率和召回率冲突问题,引入了F1分数
17.[单选题]双边滤波能够较好的保留图像的(__)。
A)边缘信息
B)彩信息
C)亮度信息
D)高频信息
18.[单选题]对于分类任务来说,在所有相关概率都已知的理想情形下,(__)考虑如何基于这些概率和误判损失来选择最优的类别标记。
A)支持向量机
B)间隔最大化
C)线性分类器
D)贝叶斯决策论
19.[单选题]通常来说,哪个模型被认为易于解释? ()
A)SVM
B)Logistic Regression
C)Decision Tree
D)K-nearest Neghbor
20.[单选题]英文如何分词?()
A)利用空格对句子分词
B)利用逗号分词
C)根据英文短语分词
D)根据词性分词
21.[单选题]TF-IDF与该词在整个语言中的出现次数成(__)。
A)正比
B)反比
C)无关
D)幂次
22.[单选题]F1参数的大小反映了模型的(__)。
A)准确度
B)误差
C)稳定性
D)偏差
23.[单选题]移动端开发中常用的数据库是
A)MySQL
24.[单选题]词汇表的增长将会导致文档向量不断的增长,表现为文档向量的( )不断增加。
A)个数
B)维度
C)集合
D)元素
25.[单选题]随机森林是( )分类方法中最具代表性的一个。
A)串行
B)并联
C)串联
D)并行
26.[单选题]已知均值和方差,下面哪种分布的熵最大( )
A)几何分布
B)指数分布
C)高斯分布
D)均匀分布
27.[单选题]LSTM与RNN相比可以解决( )。
A)梯度消失
B)训练结果发散
C)需要激活函数
D)无法处理长距离的依赖的问题
28.[单选题]平面上平均每4个单位面积有一个染点,观察一定面积上的点数X,X近似服从()
A)均匀分布
B)泊松分布
C)二项分布
D)正态分布
29.[单选题]K-摇臂属于(__)算法。
A)机器学习
B)深度学习
C)强化学习
D)有监督学习
30.[单选题]下面不属于脏数据的是(__)。
A)有缺失值
B)冗余数据
C)噪声数据
D)无序数据
31.[单选题]话题模型的典型代表是。
A)贝叶斯模型
B)拉普拉模型
C)隐狄利克雷模型
D)马尔可夫模型
A)都属于计算机程序
B)输出结果不同
C)输出结果相同
D)经验总结问题处理上传统程序效果更好
33.[单选题]关于k-means算法,正确的描述是( )
A)能到任意形状的聚类
B)初始值不同,最终结果可能不同
C)每次迭代的时间复杂度是O(n^2), 其中n是样本数量
D)不能使用核函数
34.[单选题]()表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界,即刻画了学习问题本身的难度。
A)偏差
B)方差
C)噪声
D)泛化误差
35.[单选题]若学习如何种瓜,在种瓜过程中不断摸索,从而总结出好的种瓜策略。这个过程抽象出来,就是(__)。
A)机器学习
B)深度学习
C)强化学习
D)有监督学习
36.[单选题]将两个簇的邻近度定义为不同簇中任意两点的最短距离,它是哪一种凝聚层次聚类技术?( )
A)MIN(单链)
B)MAX(全链)
C)组平均
D)Ward方法
37.[单选题]在概率图模型中,(__)模型是一种判别式无向图模型。
A)马尔可夫随机场
B)隐马尔可夫模型
C)条件随机场
D)逆误差传播
38.[单选题]在机器学习算法中,选择具有最大间隔的分割线进行预测的算法是哪一个()
A)线性回归
B)支持向量机
C)决策树
D)K-Means
39.[单选题](__)主要为数据科学和大数据产业链提供大数据分析类的技术支持。
A)分析工具
B)基础设施
C)数据科学平台
D)机器学习
40.[单选题]下列不属于数据预处理的操作是(__)。
A)抽样
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论