人工智能机器学习技术练习(试卷编号161)
1.[单选题]分类的类别标签列是()
A)类别数值
B)类别的不同
C)具有次序、大小的意义
答案:B
解析:
2.[单选题]关于线性回归算法,说法正确的是()
A)在高维空间中求解一个线性方程的系数组合
B)对异常值不敏感
C)无需对数据做标准化处理
答案:A
解析:
3.[单选题]在分类中的“设备故障/异常检测”场景下,指标()要首先满足接近100%
A)accuracy
B)specificity
C)recall
答案:C
解析:
4.[单选题]典型的分类算法是()
A)决策树
B)k-means
C)BIRCH
答案:A
解析:
5.[单选题]()不是最近邻分类器的特点。
A)它使用具体的训练实例进行预测,不必维护源自数据的模型
B)分类一个测试样例开销很大
C)最近邻分类器基于全局信息进行预测
D)可以生产任意形状的决策边界
答案:C
解析:k近邻中的近邻指的是距离待预测数据的数据点,而k 近邻指的是取距 k近的前几个数据点,并非基于全局信息进行预测。
6.[单选题]一个文本邮件可以被归为【垃圾邮件】和【非垃圾邮件】两类,因此判断文本邮件是否为垃圾邮件,属于()问题
D)以上都不是
答案:A
解析:
7.[单选题]如果将均匀噪声的定义范围增加一倍,则其方差?
A)不变
B)增加为两倍
C)增加为四倍
D)增加为八倍
答案:B
解析:
8.[单选题]对一幅100'100像元的图象,若每像元用8 bit表示其灰度值,经霍夫曼编码后压缩图象的数据量为40000bit ,则图象的压缩比为?
A)2:1
B)3:1
C)4:1
D)1:2
答案:A
解析:
9.[单选题]嵌入式选择是一种(__)算法。
A)聚类
B)特征选择
C)分类
D)回归
答案:B
解析:
正则化描述正确的是10.[单选题]信息增益即数据集的熵与在某特征条件下的条件熵之差。关于信息增益,正确的说法是:(2.0分)2.0 分
A)信息增益越大,说明此特征分类能力越弱
B)信息增益越小,说明此特征克服的不确定性越大,具有更强的分类能力
C)信息增益越大,说明此特征克服的不确定性越大,具有更强的分类能力
D)信息增益越小,说明此特征分类能力越强
答案:C
解析:
11.[单选题]异常检测过程查基于()组标准值偏差的异常个案。
D)回归
答案:C
解析:异常检测过程查基于聚类组标准值偏差的异常个案。该过程设计为在探索性数据分析步骤中,快速检测到用于数据审核的异常个案,并优先于任何推论性数据分析。
12.[单选题]一批产品共8件,其中正品6件,次品2件。现不放回地从中取产品两次,每次一件,求第二次取得正品的概率
A)1/4
B)1/2
C)3/4
D)1
答案:C
解析:
13.[单选题]下面关于奇异值分解(SVD)的描述中错误的是 ( )。
A)奇异值分解就是把一个线性变换分解成两个线性变换
B)奇异值往往对应着矩阵中隐含的重要信息,且重要性和奇异值大小正相关
C)SVD是对PCA的改进,其计算成本更低,相同之处是两者的目标都是为了降维
D)奇异值不仅可以应用在数据压缩上,还可以对图像去噪
答案:A
解析:
14.[单选题]TF-IDF模型中TF是指(__)。
A)词频数
B)逆文档频率
C)词频率
D)逆文档频数
答案:C
解析:
15.[单选题]下面那种2D变换有可能破坏平行性(平行的线变换后不再平行)的是( )?
A)刚性变换
B)投影变换
C)相似变换
D)仿射变换
答案:B
解析:
16.[单选题]聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )
D)EM
答案:C
解析:
17.[单选题]下列哪种嵌入方式支持双向上下文(Bidirectional Context)?
A)Word2Vec
B)BERT
C)GloVe
D)以上所有
答案:B
解析:
18.[单选题]下列哪项不是目前深度学习的必备技术()
A)卷积可视化解释
B)反向传播算法
C)非线性激活函数
D)深度神经网络
答案:A
解析:
19.[单选题]下列哪一项在神经网络中引入了非线性?
A)随机梯度下降
B)修正线性单元(ReLU)
C)卷积函数
D)以上都不正确
答案:B
解析:
20.[单选题]卷积的过程是让过滤器在图像上( )。
A)缩放
B)剪切
C)镜像对称
D)窗口滑动
答案:D
解析:
21.[单选题](__)先将数据集中的每个样本看做一个初始聚类簇,然后在算法运行的每一步到距离最近的两个聚类簇进行合并,该过程不端重复,直至达到预设的聚类簇个数。
A)原型聚类
答案:D
解析:
22.[单选题]在相同样本量下,重复抽样与不重复抽样的抽样平均误差大小关系是()
A)重复抽样误差大
B)不重复抽样误差大
C)二者相同
D)不确定
答案:A
解析:
23.[单选题]线性模型试图学得一个属性的(__)来进行预测的函数。
A)线性组合
B)非线性组合
C)取值
D)维度
答案:A
解析:
24.[单选题]Spark 支持的分布式部署方式中哪个是错误的 ()。
A)standalone
B)spark on mesos
C)spark on YARN
D)Spark on local
答案:D
解析:
25.[单选题]假如你使用EM算法对一个有潜变量的模型进行最大似然估计(Maximum likelihood estimate)。这时候要求你将算法进行修改,使得其能到最大后验分布(Maximum a Posteriori estimation, MAP),你需要修改算法的哪个步骤?
A)Expection
B)Maimization
C)不需要修改
D)都需要修改
答案:A
解析:E step根据当前参数进行估算,M step根据估算结果更新参数。那么修改估算方法自然在E step中。
26.[单选题]变量选择是用来选择最好的判别器子集, 如果要考虑模型效率,我们应该做哪些变量

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。