人工智能机器学习技术练习(习题卷20)
说明:答案和解析在试卷最后
第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的?
A)测试样本误差始终为零
B)测试样本误差不可能为零
C)以上答案都不对
2.[单选题]关于回归问题,说法正确的是()
A)可以不需要label
B)label列是连续型
C)属于无监督学习
3.[单选题](__)不属于基本分析方法。
A)回归分析
B)分类分析
C)聚类分析
D)元分析
4.[单选题]下列对于查全率的描述,解释正确的是(__)。
A)统计分类器预测出来的结果与真实结果不相同的个数,然后除以总的样例集D的个数。
B)先统计分类正确的样本数,然后除以总的样例集D的个数。
C)预测为正的样例中有多少是真正的正样例
D)样本中的正例有多少被预测正确
5.[单选题]n!后面有多少个0,6!=1*2*3*4*5*6=720.720后面有1个0,n=10000,求n!。
A)2498
B)2499
C)2450
D)2451
6.[单选题]以下不属于线性分类器最佳准则的是( )
A)感知准则函数
B)支持向量机
C)贝叶斯分类
D)Fisher准则
7.[单选题]以下对字典的说法错误的是()。
A)字典可以为空
B)字典的键不能相同
C)字典的键不可变
D)字典的键的值不可变
8.[单选题]假设我们有一个使用ReLU激活函数(ReLU activation function)的神经网络,假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或 函数(XNOR function)吗( )
A)可以
B)不能
C)不好说
D)不一定
9.[单选题]关于欠拟合(under-fitting),正确的是( )。
A)训练误差较大,测试误差较小
B)训练误差较小,测试误差较大
C)训练误差较大,测试误差较大
D)训练误差较小,测试误差较小
10.[单选题]()算法可以用于特征选择。
A)朴素贝叶斯
B)感知器
C)支持向量机
D)决策树
11.[单选题]spark 1.4 版本的最大变化 ()。
A)spark sql Release 版本
B)引入Spark R
C)DataFrame
D)支持动态资源分配
12.[单选题]一条规则形如:⊕←f1f2…fL,其中“←"左边的部分称为
A)规则长度
B)规则头
C)布尔表达式
D)规则体
13.[单选题]下面属于Boosting方法的特点是( )
A)构造训练集时采用Bootstraping的方式
B)每一轮训练时样本权重相同
C)分类器可以并行训练
D)预测结果时,分类器的比重不同
14.[单选题]变量的不确定性越大,相对应信息熵的变化是()。
A)熵变小
B)熵变大
C)不变
D)以上答案都不正确
15.[单选题]贝叶斯决策的最优分类面是(__)。
A)线性的
B)非线性的
C)不可构造的
D)不存在的
16.[单选题]使用似然函数的目的是()。
A)求解目标函数
B)得到最优数据样本
C)到最适合数据的参数
D)改变目标函数分布
17.[单选题]关于K均值和 DBSCAN 的比较,以下说法不正确的是()。
A)K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象
B)K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
C)K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
D)K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇
18.[单选题]回归分析的任务,就是根据()和因变量的观察值,估计这个函数,并讨论与之有关的种种统计推断的问题。
A)相关变量
B)样本
C)已知数据
D)自变量
19.[单选题]线性回归能完成的任务是
A)预测离散值
B)预测连续值
C)分类
D)聚类
20.[单选题]对应GradientBoosting tree算法, 以下说法正确的是:
A)2 和 4
B)2 和 3
C)1 和 3
D)1 和 4
21.[单选题]专家系统是以______为基础,推理为核心的系统。
A)专家
B)软件
C)问题
正则化是结构风险最小化策略的实现
D)知识
22.[单选题]如果在大型数据集上训练决策树。为了花费更少的时间来训练这个模型,下列哪种做法是正确的?
A)增加树的深度
B)增加学习率
C)减小树的深度
D)减少树的数量
23.[单选题]在支持向量机中,(__)允许支持向量机在一些样本上出错。
A)硬间隔
B)软间隔
C)核函数
D)拉格朗日乘子法
24.[单选题]先对数据集进行特征选择,然后再训练学习器,特征选择过程与后续学习器无关,这相当于先用特征选择对初始特征进行(__)。
A)排序
B)过滤
25.[单选题](__)由两层神经元组成。
A)神经系统
B)神经网络
C)神经元
D)感知机
26.[单选题]在逻辑回归输出与目标对比的情况下,以下评估指标中()不适用。
A)AUC-ROC
B)准确度
C)Logloss
D)均方误差
27.[单选题]LSTM中门的输出是( )之间的实数向量。
A)0到1
B)1到-1
C)0到-1
D)1到2
28.[单选题]Boosting算法要求基学习器能对特定的数据分布进行学习,可通过“____”实施,对无法接受带权样本的基学习算法,则可通过“____”来处理。
A)重赋权法,
B)重采样法,重赋权法
C)赋权法,
D)采样法,
29.[单选题]下面算法属于局部处理的是()。
A)灰度线性变换
B)二值化
C)傅里叶变换
D)中值滤波
30.[单选题]数据仓库是随着时间变化的,下面的描述不正确的是
A)数据仓库随时间的变化不断增加新的数据内容;
B)捕捉到的新数据会覆盖原来的快照;
C)数据仓库随事件变化不断删去旧的数据内容;
D)数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合.
31.[单选题]如果需要训练的特征维度成千上万,在高维情形下出现的数据样本稀疏、距离计算困难。我们通过()可以缓解这个问题。
A)K均值算法
B)支持向量机
C)降维
D)以上答案都不正确
32.[单选题]Transformer架构首先是由下列哪项引入的?
A)GloVe
B)BERT
C)Open AI’s GPT
33.[单选题]如右图所示有向图,以下陈述正确的有( )
A)B和G关于{C, F}条件独立
B)B和C关于F条件独立
C)B和G关于F条件独立
D)B和G关于{C, F, H}条件独立
34.[单选题]()不可以直接来对文本分类。
A)K-means
B)决策树
C)支持向量机
D)KNN
35.[单选题]下面关于SVM算法叙述不正确的是(    )
A)SVM在解决小样本、非线性及高维模式识别问题中具有优势
B)SVM是一种基于经验风险最小化准则的算法
C)SVM求得的解为全局唯一最优解
D)SVM最终分类结果只与少数支持向量有关
36.[单选题]以下集合是凸集的是
A){(x,y) |y=x+1}
B){(x,y) | x的平方 + y的平方 = 1}
C){(x,y) | x的平方 + y的平方 > 1 }
D){(x,y) |x=1 | y=1 }

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。