人工智能机器学习技术练习(试卷编号162)
说明:答案和解析在试卷最后
1.[单选题]分类的类别标签列是()
A)类别数值
B)类别的不同
C)具有次序、大小的意义
2.[单选题]关于线性回归算法,说法正确的是()
A)在高维空间中求解一个线性方程的系数组合
B)对异常值不敏感
C)无需对数据做标准化处理
3.[单选题]在分类中的“设备故障/异常检测”场景下,指标()要首先满足接近100%
A)accuracy
B)specificity
C)recall
4.[单选题]典型的分类算法是()
A)决策树
B)k-means
C)BIRCH
5.[单选题]()不是最近邻分类器的特点。
A)它使用具体的训练实例进行预测,不必维护源自数据的模型
B)分类一个测试样例开销很大
C)最近邻分类器基于全局信息进行预测
D)可以生产任意形状的决策边界
6.[单选题]一个文本邮件可以被归为【垃圾邮件】和【非垃圾邮件】两类,因此判断文本邮件是否为垃圾邮件,属于()问题
A)分类
B)回归
C)聚类
D)以上都不是
7.[单选题]如果将均匀噪声的定义范围增加一倍,则其方差?
A)不变
B)增加为两倍
C)增加为四倍
D)增加为八倍
8.[单选题]对一幅100'100像元的图象,若每像元用8 bit表示其灰度值,经霍夫曼编码后压缩图象的数据量为40000bit ,则图象的压缩比为?
正则化描述正确的是
A)2:1
B)3:1
C)4:1
D)1:2
9.[单选题]嵌入式选择是一种(__)算法。
A)聚类
B)特征选择
C)分类
D)回归
10.[单选题]信息增益即数据集的熵与在某特征条件下的条件熵之差。关于信息增益,正确的说法是:(2.0分)2.0 分
A)信息增益越大,说明此特征分类能力越弱
B)信息增益越小,说明此特征克服的不确定性越大,具有更强的分类能力
C)信息增益越大,说明此特征克服的不确定性越大,具有更强的分类能力
D)信息增益越小,说明此特征分类能力越强
11.[单选题]异常检测过程查基于()组标准值偏差的异常个案。
A)单体
B)分类
C)聚类
D)回归
12.[单选题]一批产品共8件,其中正品6件,次品2件。现不放回地从中取产品两次,每次一件,求第二次取得正品的概率
A)1/4
B)1/2
C)3/4
D)1
13.[单选题]下面关于奇异值分解(SVD)的描述中错误的是 ( )。
A)奇异值分解就是把一个线性变换分解成两个线性变换
B)奇异值往往对应着矩阵中隐含的重要信息,且重要性和奇异值大小正相关
C)SVD是对PCA的改进,其计算成本更低,相同之处是两者的目标都是为了降维
D)奇异值不仅可以应用在数据压缩上,还可以对图像去噪
14.[单选题]TF-IDF模型中TF是指(__)。
A)词频数
B)逆文档频率
C)词频率
D)逆文档频数
15.[单选题]下面那种2D变换有可能破坏平行性(平行的线变换后不再平行)的是( )?
A)刚性变换
B)投影变换
C)相似变换
D)仿射变换
16.[单选题]聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )
A)K-Means
B)DBSCAN
C)SVM
D)EM
17.[单选题]下列哪种嵌入方式支持双向上下文(Bidirectional Context)?
A)Word2Vec
B)BERT
C)GloVe
D)以上所有
18.[单选题]下列哪项不是目前深度学习的必备技术()
A)卷积可视化解释
B)反向传播算法
C)非线性激活函数
D)深度神经网络
19.[单选题]下列哪一项在神经网络中引入了非线性?
A)随机梯度下降
B)修正线性单元(ReLU)
C)卷积函数
D)以上都不正确
20.[单选题]卷积的过程是让过滤器在图像上( )。
A)缩放
B)剪切
C)镜像对称
D)窗口滑动
21.[单选题](__)先将数据集中的每个样本看做一个初始聚类簇,然后在算法运行的每一步到距离最近的两个聚类簇进行合并,该过程不端重复,直至达到预设的聚类簇个数。
A)原型聚类
B)密度聚类
C)层次聚类
D)AGNES
22.[单选题]在相同样本量下,重复抽样与不重复抽样的抽样平均误差大小关系是()
A)重复抽样误差大
B)不重复抽样误差大
C)二者相同
D)不确定
23.[单选题]线性模型试图学得一个属性的(__)来进行预测的函数。
A)线性组合
B)非线性组合
C)取值
D)维度
24.[单选题]Spark 支持的分布式部署方式中哪个是错误的 ()。
A)standalone
B)spark on mesos
C)spark on YARN
D)Spark on local
25.[单选题]假如你使用EM算法对一个有潜变量的模型进行最大似然估计(Maximum likelihood estimate)。
这时候要求你将算法进行修改,使得其能到最大后验分布(Maximum a Posteriori estimation, MAP),你需要修改算法的哪个步骤?
A)Expection
B)Maimization
C)不需要修改
D)都需要修改
26.[单选题]变量选择是用来选择最好的判别器子集, 如果要考虑模型效率,我们应该做哪些变量选择的考虑? :
1/多个变量其实有相同的用处
2/变量对于模型的解释有多大作用
3/特征携带的信息
4/交叉验证
A)1 和 4
B)1, 2 和 3
C)1,3 和 4
D)以上所有
27.[单选题]对比于机器学习程序与传统的计算机程序,下列说法不正确的是:
A)都属于计算机程序
B)输出结果不同
C)输出结果相同
D)经验总结问题处理上传统程序效果更好
28.[单选题]下面哪个端口不是 spark 自带服务的端口 ()。
A)8080
B)4040
C)8090
D)18080
29.[单选题]1下列关于线性回归说法错误的是()
A)在现有模型上,加入新的变量,所得到的R^2的值总会增加
B)线性回归的前提假设之一是残差必须服从独立正态分布
C)残差的方差无偏估计是SSE/(n-p)
D)自变量和残差不一定保持相互独立
30.[单选题]请看如下代码:
Import numpy as np
Arr = np.array([[6, 2, 7], [3, 6, 2], [4, 3, 2]]
Arr.sort()
Arr
对代码中的NumPy数组执行sort()方法结果正确的是( )。
A)[[2 6 7] [2 3 6]]
B)[[2 6 7] [6 3 2]]
C)[[7 6 2] [6 3 2]]
D)[[7 6 2] [2 3 6]]
31.[单选题]下列激活函数中,能够实现将特征限制到区间[-1,1]的是哪一个
A)Tanh
B)Logistic
C)ReLU
D)Sigmoid
32.[单选题](__)度量了同样大小的训练集的变动所导致的学习性能的变化。
A)偏差
B)方差
C)均方差

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。