人工智能机器学习技术练习(习题卷28)
第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]KNN算法应用于回归时,计算的是()
A)从属类别的均值
B)从属类别的最大值
C)从属类别的最小值
答案:A
正则化其实是破坏最优化解析:
2.[单选题]分箱用于处理()
A)连续型数据
B)离散型数据
C)连续型和离散型数据即可
答案:A
解析:
3.[单选题]设有一幅二值图像,其中黑的背景上有一条宽为5个像素的白线,如要通过空域滤波消除这条白线,需要用?
A)3*3的算术均值滤波器
B)7*7的算术均值滤波器
C)3*3的谐波均值滤波器
D)7*7 的谐波均值滤波器
答案:D
解析:
4.[单选题]概率密度函数服从正态分布的噪声,叫做(__)。
A)泊松噪声
B)高斯噪声
C)乘性噪声
D)椒盐噪声
答案:B
解析:
5.[单选题]使用梯度下降法训练回归模型时,会由于各特征尺寸相差较大而造成算法收敛较慢。应该将特征尺寸进行缩放至接近或相同尺寸。可采用sklearn中的类或函数是:
A)StanderScaler
B)fit_transform
C)accuracy_score
D)LabelEcoder
答案:A
解析:
6.[单选题]无人超市采用了( )等多种智能技术,消费者在购物流程中将依次体验自动身份识别、自助导购服务、互动式营销、商品位置侦测、线上购物车清单自动生成和移动支付
A)计算机视觉、深度学习算法、传感器定位、图像分析
D)图像识别、人脸识别、物体检测、图像分析
答案:A
解析:
7.[单选题]在模型评估与度量的方法中,(__)直接将数据集划分为两个互斥的集合,一个作为训练集,另一个作为测试集。
A)自助法
B)留出法
C)交叉验证法
D)错误率分析
答案:B
解析:
8.[单选题](__)在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。
A)支持向量机
B)Boosting算法
C)贝叶斯分类器
D)神经网络
答案:B
解析:
9.[单选题]著名的C4.5决策树算法使用()来选择最优划分属性。
A)信息增益
B)增益率
C)基尼指数
D)均值
答案:B
解析:
10.[单选题]关于线性回归模型及模型参数,不正确的说法是:
A)线性回归模型的训练目标是到使得损失函数最大化的模型参数
B)线性回归模型的训练目标是到使得损失函数最小化的模型参数
C)线性回归模型通常使用均方误差(MSE)作为损失函数
D)均方误差即所有实例预测值与实际值误差平方的均值
答案:A
解析:
11.[单选题]观察如下数据集:
删除
A,b,c,d 哪个点对拟合回归线的影响最大?
A)a
B)b
C)c
D)d
答案:D
解析:线性回归对数据中的离点比较敏感。虽然 c 点也是离点,但它接近与回归线,残差较小。因此,d 点对拟合回归线的影响最大。
12.[单选题]在Numpy中创建全为 0 的矩阵使用()。
C)empty()
D)arange()
答案:A
解析:
13.[单选题]下列中为判别模型的是( )
A)高斯混合模型
B)隐含马尔科夫模型
C)GAN模型
D)逻辑回归模型
答案:D
解析:
14.[单选题]有两个样本点, 第一个点为正样本,它的特征向量是(0,-1);第二个点为负 样本,它的特征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分 类器的分类面方程是()
A)2x+y=4
B)x+2y=5
C)x+2y=3
D)以上都不对
答案:C
解析:
15.[单选题]sc.parallelize([(1,2),(1,3),(2,3),(2,4),(3,1)].reduceByKey(lambda x,y : x
+y).count().collect”操作中会产生( )个stage
A)1
B)2
C)3
D)4
答案:B
解析:
16.[单选题]下列命令中(在zookeeper 安装文件夹的bin 目录下执行),哪项是停止ZooKeeper的正确命令()。
A)start-all.sh
B)start-stop.sh
C)zkServer.sh stop
D)zkServer.sh start
答案:C
解析:
17.[单选题]()是预测一个数量 (连续型),属于监督学习
A)分类
B)回归
C)聚类
D)强化学习
答案:B
解析:
18.[单选题](__)是将低层次数据转换为高层次数据的过程。
A)数据化
D)数据整齐化
答案:C
解析:
19.[单选题]对于非线性回归问题,以下说法错误的是哪个( )。
A)可以分别求单个自变量与因变量的回归方程,然后简单求这些方程的加权和
B)非线性回归方程的系数需要把其转化为线性回归方程才方便求解
C)非线性回归模型的检验也可以使用R2
D)Logistic回归是一种典型的广义线性回归模型
答案:A
解析:
20.[单选题]已知数组trans_cnt[1,2,3,4],trans_cnt[2]代表的是哪一个元素:
A)1
B)2
C)3
D)4
答案:C
解析:
21.[单选题](__)是M-P神经元,也称为“阈值逻辑单元”。
A)输入层
B)输出层
C)第一层
D)第二层
答案:B
解析:
22.[单选题]以下的说法哪些是正确的?1 一个机器学习模型如果能得到很高的 准确率,则说明这是个好的分类器。2如果增加一个模型的复杂度,测试错误总会增加。3 如果增加一个模型的复杂度,训练错误总会增加。
A)1
B)2
C)3
D)1 and 3
答案:C
解析:
23.[单选题]以下可以用于处理决策树归纳中的过拟合的方法(__)。
A)先剪枝
B)使用确认集
C)结合模型复杂度
D)使用再代入估计
答案:A
解析:
24.[单选题]Task 运行在下来哪里个选项中 Executor 上的工作单元 ()。
A)Driver program
B)spark master
C)worker node
解析:
25.[单选题]下面那种2D变换有可能破坏平行性(平行的线变换后不再平行)的是( )?
A)刚性变换
B)投影变换
C)相似变换
D)仿射变换
答案:B
解析:
26.[单选题]若某学习器预测的是离散值,则此类学习任务称为( )
A)分类
B)聚类
C)回归
D)强化学习
答案:A
解析:
27.[单选题]spark 的 master 和 worker 通过什么方式进行通信的()。
A)http
B)nio
C)netty
D)Akka
答案:D
解析:
28.[单选题]在文本挖掘中,可以使用以下哪项命令完成将文本转换为tokens,然后将其转换为整数或浮点向量的操作?
A)CountVectorizer
B)TF-IDF
C)词袋模型(Bag of Words)
D)NERs
答案:A
解析:
29.[单选题]下列算法中,()更适合做时间序列建模。
A)CNN
B)决策树
C)LSTM
D)贝叶斯算法
答案:C
解析:LSTM为长短时记忆网络,是一种时间递归神经网络。
30.[单选题]关于正态分布,下列说法错误的是:
A)正态分布具有集中性和对称性
B)正态分布的均值和方差能够决定正态分布的位置和形态
C)正态分布的偏度为0,峰度为1
D)标准正态分布的均值为0,方差为1
答案:C
解析:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。