人工智能机器学习技术练习(习题卷25)第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]基于层次的聚类,说法正确的是()
A)凝聚法是从一个大的数据簇开始计算
B)分裂法是从一个小的数据簇开始计算
C)簇与簇之间可以进行合并,进行层次分析
答案:C
解析:
2.[单选题]考虑下表中二元分类问题的训练样本,根据信息增益,哪个是最佳划分(在a1,a2,a3中):
class="fr-fic fr-dib cursor-hover"
A)a1
B)a2
C)a3
答案:A
解析:
3.[单选题]LDA的以下哪项是正确的?
alt="" >
A)LDA旨在最大化之间类别的距离,并最小化类内之间的距离
B)LDA旨在最小化类别和类内之间的距离
C)LDA旨在最大化类内之间的距离,并最小化类别之间的距离
D)LDA旨在最大化类别和类内之间的距离
答案:A
解析:
4.[单选题]ID3和C4.5是比较著名的基本决策树算法。两者的主要区别是:
A)ID3依据信息增益比做特征选择,而C4.5依据信息增益做特征选择
B)ID3依据信息增益比做特征选择,而C4.5依据基尼指数做特征选择
C)ID3依据基尼指数做特征选择,而C4.5依据信息增益做特征选择
D)ID3依据信息增益做特征选择,而C4.5依据信息增益比做特征选择
答案:D
解析:
5.[单选题]通过聚集多个分类器的预测来提高分类精确率的技术称为(    )。
A)组合(Composition)
B)聚集(Aggregation)
C)合并(Combination)
D)投票(Voting)
答案:A
解析:
6.[单选题]k-NN 最近邻方法在什么情况下效果较好?正则化其实是破坏最优化
A)样本较多但典型性不好
B)样本较少但典型性好
C)样本呈团状分布
D)样本呈链状分布
答案:B
解析:K 近邻算法主要依靠的是周围的点,因此如果样本过多,则难以区分,典型性好的容易区分。
样本呈团状或链状都具有迷惑性,这样 kNN 就发挥不出其求近邻的优势了,整体样本应该具有典型性好,样本较少,比较适宜。
7.[单选题]图像在opencv中的数据存储结构是()。
A)tensor
B)numpy
C)link
D)Mat
答案:D
解析:
8.[单选题]使用下列二维图形变换矩阵A=T*a,
class="fr-fic fr-dib cursor-hover" 将产生的变换结果为:
A)图形放大2倍
B)图形放大2倍,同时沿X、Y坐标轴方向各移动一个单位
C)沿x坐标轴方向移动2个单位
D)沿X坐标轴放大2倍,同时沿X、Y坐标轴方向各移动一个单位
答案:D
解析:
9.[单选题]“没有免费的午餐定理”告诉我们
A)我们不能对问题有先验假设
B)没有可以适应一切问题的算法
C)设计好的算法是徒劳的
D)对于一个特定的问题,任何算法都是一样好的
答案:B
解析:
10.[单选题]一幅256*256的图像,若灰度级数为16,则存储它所需的比特数是()
A)256k
B)512k
C)1m
D)2m
答案:A
解析:
11.[单选题]集成学习中, 每个基分类器的正确率的最低要求( )
A)50%以上
B)60%以上
C)70%以上
D)80%以上
答案:A
解析:
12.[单选题]()属于SVM应用。
A)文本和超文本分类
B)图像分类
C)新文章聚类
D)以上均是
答案:D
解析:SVM可用于分类与回归,文本和超文本分类、图像分类、新文章聚类。
13.[单选题]下列关于LARS算法的说法正确的是
A)每次选择一个与残差相关性最大的特征
B)是一种包裹式特征选择法
C)基于线性回归平绝对误差最小化
D)是通过对LASSO稍加修改而实现
答案:A
解析:
14.[单选题]执行以下代码
#define SUM(x,y) x+y
Int a=3;
Int b=2;
A+=a*SUM(a,b)*b;
A的值为
A)16
B)30
C)33
D)39
答案:A
解析:
15.[单选题]下面关于hdfs中SecondaryNameNode描述正确的一项是()
A)它是NameNode的热备
B)它对内存没有要求
C)它的目的是帮助NameNode合并editlog,减少NameNode 启动时间
D)SecondaryNameNode应与NameNode 部署到一个节点
答案:C
解析:
16.[单选题]算法性能显著不同时,需要进行__来进一步区分各算法。
A)后续检验
B)Friedman检验
C)交叉验证t检验
D)McNemar检验
答案:A
解析:
17.[单选题]LDA的思想是到最能区分两类别之间的线,下图中哪个是好的投影?
alt="" >
A)LD1
B)LD2
C)两者
D)都不是
答案:A
解析:
18.[单选题]关于 K-Means,描述正确的是(    )。
A)能到任意形状的聚类
B)初始值不同,最终结果可能不同
C)每次迭代的时间复杂度是 O(n^2),其中n是样本数量
D)不能使用核函数
答案:B
解析:
19.[单选题]假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序
):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:
A)18.3
B)22.6
C)26.8
D)27.9
答案:A
解析:
20.[单选题]CART决策树使用“基尼指数”来选择划分属性时,使划分后基尼指数()的属性为最优划分属性。
A)最大
B)最小
C)随机选择
D)按序选择
答案:B
解析:
21.[单选题]在模型评估与度量的方法中,(__)以自助采样法为基础。
A)自助法
B)留出法
C)交叉验证法
D)错误率分析
答案:A
解析:
22.[单选题]符号集a、b、c、d,它们相互独立,相应概率为1/2、1/4、1/8、1/16,其中包含信息量最小的符号是()
A)a
B)b
C)c
D)d
答案:A

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。