人工智能机器学习技术练习(习题卷15)
第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]混淆矩阵对角线上的值()
A)越大越好
B)越小越好
C)无所谓大小
答案:A
解析:
2.[单选题]对于线性回归,我们应该有以下哪些假设? :
A)到利点很重要, 因为线性回归对利点很敏感
B)线性回归要求所有变量必须符合正态分布
C)线性回归假设数据没有多重线性相关性
答案:A
解析:利点要着重考虑, 第一点是对的
不是必须的, 当然, 如果是正态分布, 训练效果会更好
有少量的多重线性相关性是可以的, 但是我们要尽量避免
3.[单选题]一对一法分类器,k个类别需要多少个SVM:
A)k(k-1)/2
B)k(k-1)
C)k
D)k!
答案:A
解析:
4.[单选题]以下关于学习率说法错误的是()。
A)学习率太大会导致无法收敛
B)学习率必须是固定不变的
C)学习率的选择不能太大也不能太小
D)学习率太小会使得算法陷入局部极小点
答案:B
解析:
5.[单选题]下列选项中,不属于ndarray对象属性的是( )。
A)shape
B)dtype
C)ndim
D)map
答案:D
numpy教程pdf解析:
6.[单选题]Python 的基本语法仅支持整型、浮点型和复数类型,而 NumPy 和 Pandas 包支持int64/int32/int16/int8等 20 余种数字类型,下列选项中,(    )说法是不正确的。
A)科学计算可能涉及很多数据,对存储和性能有较高要求,因此支持多种数字类型
B)NumPy 包底层是采用 C 语言实现的,因此,天然支持了多种数字类型
C)程序员必须精确指定数字类型,因此,会给编程带来一定负担
D)对元素类型进行精确定义,有助于 NumPy 和 Pandas 包更合理地优化存储空间
答案:C
解析:
7.[单选题]如下逻辑回归图显示了3种不同学习速率值的代价函数和迭代次数之间的关系(不同的颜在不同的学习速率下显示不同的曲线)。
为了参考而保存图表后,忘记其中不同学习速率的值。现在需要曲线的倾斜率值之间的关系。
以下哪一个是正确的?
注:
1蓝的学习率是L1
2红的学习率是L2
3绿学习率为lL3
alt="" >
A)L1> L2> L3
B)L1 = L2 = L3
C)L1
D)都不是
答案:C
解析:如果学习速率低下,代价函数将缓慢下降,学习速度过高,则其代价函数会迅速下降。
8.[单选题]二项式分布的共轭分布是( )
A)正态分布
B)Dirichlet分布
C)Beta分布
D)指数分布
答案:C
解析:
9.[单选题]下面不属于数据归约方法有(__)。
A)维归约
B)度归约
C)值归约
D)数据压缩
答案:B
解析:
10.[单选题]下列方法使用最大似然估计的是( )
A)线性鉴别分析
B)感知机
C)Logistic回归
D)SVM
答案:C
解析:
11.[单选题]StandardScaler预处理方法可以表示为?=(?-?)/?,其中?表示特征所在列的
A)最大值
B)分解阈值
C)均值
D)方差
答案:D
解析:
12.[单选题]在有监督学习中, 我们如何使用聚类方法?
A)2 和 4
B)1 和 2
C)3 和 4
D)1 和 3
答案:B
解析:我们可以为每个聚类构建不同的模型, 提高预测准确率。
“类别id”作为一个特征项去训练, 可以有效地总结了数据特征。
13.[单选题]下列机器学习算法中,不需要归一化处理的是()。
A)Decision Tree
B)SVM
C)K-means
D)Logistic Regression
答案:A
解析:Decision Tree属于概率模型,不需要归一化处理;SVM、K-means和Logistic Regression 之类的最优化问题需要归一化处理。
14.[单选题]()不是最近邻分类器的特点。
A)它使用具体的训练实例进行预测,不必维护源自数据的模型
B)分类一个测试样例开销很大
C)最近邻分类器基于全局信息进行预测
D)可以生产任意形状的决策边界
答案:C
解析:k近邻中的近邻指的是距离待预测数据的数据点,而k 近邻指的是取距 k近的前几个数据点,并非基于全局信息进行预测。
15.[单选题]下图显示了三个逻辑回归模型的AUC-ROC曲线。不同的颜表示不同超参数值的曲线。以
下哪个AUC-ROC会给出最佳果?
class="fr-fic fr-fil fr-dib cursor-hover">
A)黄
B)粉红
C)黑
D)都相同
答案:A
解析:
16.[单选题]当图像通过信道传输时,噪声一般与()无关。
A)信道传输的质量
B)出现的图像信号
C)是否有中转信道的过程
D)图像在信道前后的处理
答案:B
解析:
17.[单选题]池化层的作用是()。
A)标准化处理输入特征
B)对特征图进行特征选择和信息过滤
C)对提取的特征进行非线性组合以得到输出
D)直接输出每个像素的分类结果
答案:B
解析:
18.[单选题]对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,二是都设成0,下面哪个叙述是正确的?
A)其他选项都不对
B)没啥问题,神经网络会正常开始训练
C)神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西
D)神经网络不会开始训练,因为没有梯度改变
答案:C
解析:令所有权重都初始化为0这个一个听起来还蛮合理的想法也许是一个我们假设中最好的一个假设了, 但结果是错误的,因为如果神经网络计算出来的输出值都一个样,那么反向传播算法计算出来的梯度值一样,并且参数更新值也一样(w=wαdw)。更一般地说,如果权重初始化为同一个值,网络即是对称的, 最终所有的神经元最后都会变成识别同样的东西。
19.[单选题]随机森林相比Bagging,进一步在决策树的训练过程中引入了()选择
A)随机属性
B)重点属性
C)最优属性
D)集成属性
答案:A
解析:
20.[单选题]若对于数据分布D和概率密度函数p(),错误率与精度可分别描述为(__)。
A)若测试数据集的精度高或错误率小,则模型的泛化能力强;反之,则泛化能力弱。
B)若测试数据集的精度低或错误率小,则模型的泛化能力强;反之,则泛化能力弱。
C)若测试数据集的精度高或错误率高,则模型的泛化能力强;反之,则泛化能力弱。
D)若测试数据集的精度小或错误率高,则模型的泛化能力强;反之,则泛化能力弱。
答案:A
解析:
21.[单选题]下列不是SVM核函数的是:
A)多项式核函数
B)logistic核函数
C)径向基核函数
D)Sigmoid核函数
答案:B
解析:
22.[单选题]下列有关人工智能、机器学习、深度学习三者关系的说法正确的是( )
A)深度学习是实现机器学习的一种方法
B)深度学习是实现人工智能的一种技术
C)人工智能是实现机器学习的一种方法
D)深度学习是实现机器学习的一种技术
答案:D
解析:
23.[单选题]pandas中,Series使用切片查询代码如下:data = [1,2,3,4,5]res =
pd.Series(data,index=["a","b","c","d","e"])print(res[3])输出结果为:( )

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。