人工智能机器学习技术练习(习题卷21)
说明:答案和解析在试卷最后
第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]线性回归和逻辑回归中,关于损失函数对权重系数的偏导数,下列说法正确的是?
A)两者不一样
B)两者一样
C)无法确定
2.[单选题]分类模型在进行训练时需要()
A)训练集
B)训练集与测试集
C)训练集、验证集、测试集
3.[单选题](__)假设聚类结构能通过一组原型刻画,在显示聚类任务中极为常用。
A)原型聚类
B)密度聚类
C)层次聚类
D)AGNES
4.[单选题]以等可能性为基础的概率是()。
A)古典概率
B)经验概率
C)试验概率
D)主观概率
5.[单选题]批规范化(Batch Normalization)的好处都有啥?
A)在将所有的输入传递到下一层之前对其进行归一化(更改)
B)它将权重的归一化平均值和标准差
C)它是一种非常有效的反向传播(BP)方法
D)这些均不是
6.[单选题]在一个神经网络中,确定每个神经元的权重和偏差很重要。用()方法可以确定神经元的权重和偏差,从而对函数进行拟合。
A)随机赋值,祈祷它们是正确的
B)搜索所有权重和偏差的组合,直到得到最佳值
C)赋予一个初始值,通过检杳与真值的误差,逐步迭代更新权重
D)以上都不正确
7.[单选题]下列哪种归纳学习采用符号表示方式?
A)经验归纳学习
B)遗传算法
C)联接学习
D)强化学习
8.[单选题]剪枝是决策树学习算法对付(__)的主要手段。
A)欠拟合
B)过拟合
C)样本数过多
D)特征数过多
9.[单选题]机器学习是研究如何使用计算机()的一门学科。
A)模拟生物行为
B)模拟人类解决问题
C)模拟人类学习活动
D)模拟人类生产活动
10.[单选题](__)是将“现实生活中的问题”转换为“数据世界中的问题”,然后采用数据科学的理念、原则、方法、技术、工具,通过将数据、尤其的大数据,转换为知识和智慧。
A)数据工程师
B)数据码农
C)数据科学家
D)科学家
11.[单选题](__)主要为组织机构提供企业级应用技术或工具。
A)人力资本
B)行业应用
C)企业应用
D)B2B营销
12.[单选题]float表示的数据类型是:
A)整数型
B)字符型
C)布尔型
D)浮点型
13.[单选题]下面有关矩阵说法不正确的是()
A)行列式不等于0的方阵问奇异矩阵
B)相似矩阵是指同一个线性变换的不同的描述矩阵
C)矩阵可以作为描述坐标系的一种方式
D)矩阵是线性空间里的变换的描述
14.[单选题]关于Hadoop技术描述错误的是?()
A)HDFS是一个分布式文件系统
B)联盟链
C)HDFS适合存储大量的小文件
D)HDFS存储空间由数据节点数决定
15.[单选题]关于创建ndarray对象。下列描述错误的是( )。
A)使用list()函数可以创建一个ndarray对象
B)通过ones()函数创建元素值都为1的数组
C)ndarray对象可以使用array()函数创建
D)通过zeros()函数创建元素值都是0的数组
16.[单选题]给定训练样例集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能接近、异类样例的投影点尽可能远离,这说的是()算法。
A)PCA
B)SVM
C)K-means
D)LDA
17.[单选题]以下描述中不正确的是(___)。
A)整个数据集可以称作一个样本
B)样本不可以是单个示例
C)一个样本可以称为一个“特征向量”
D)样本中反映事件或对象在某方面的表现或性质的事项,可以称为“特征”
18.[单选题]当(__)过高,会出现欠拟合现象
A)偏差
B)方差
C)噪声
D)泛化误差
19.[单选题]PCA在做降维处理时,优先选取哪些特征( )
A)中心化样本的协方差矩阵的最大特征值对应特征向量
B)最大间隔投影方向
C)最小类内聚类
D)最速梯度方向
20.[单选题]有关 TensorFlow API,以下说法中正确的是:()
A)tf.Variable和一般编程语言中“变量(Variable)”的含义完全相同。
B)tf.placeholder定义的对象,对应于深度神经网络中的“超参数(Hyperparameter)”。
C)通过tf.constant定义的对象,因为是常量,所以,在session.run()运行前就可以用eval()方法获得对象的值。
D)session.run()运行一个训练过程时,TensorFlow会使用符号执行(SymbolicExecution)对计算图进行优化。
21.[单选题]构建一个最简单的线性回归模型需要几个系数(只有一个特征)?
A)1 个
B)2 个
C)3 个
D)4 个
22.[单选题]参数估计又可分为()和区间估计。
A)线型估计
B)点估计
C)回归估计
D)二维分析
23.[单选题]Spark 的四大组件下面哪个不是
A)Spark Streaming
B)Mlib
C)Graphx
D)Spark R
24.[单选题]如下表是用户是否使用某产品的调查结果( )
请计算年龄、地区、学历、收入中对用户是否使用调查产品信息增益最大的属性。
alt="" >
A)年龄
B)地区
C)学历
D)收入
25.[单选题]文本信息检索的一个核心问题是文本相似度计算,将查询条件和文本之间的相似程度数值化,从而方便比较。当文档和查询都表示成向量时,可以利用向量的内积的大小近似地表示两个向量之间的相关程度。
设有两个文档和查询抽取特征和去除停用词后分别是:
文档d1: a b c a f b a f h
文档d2: a c
查询q: a c a
特征项集合为 {a b c d e f g h}
如果采用二值向量表示,那么利用内积法计算出q和d1、d2的相似度分别是( )
A)1、1
B)2、2
C)7、2
D)0、0
26.[单选题]若学习算法不依赖于环境建模,则称为(__)
A)免模型学习
B)机器学习
C)深度学习
D)蒙特卡罗强化学习
27.[单选题]以下哪项方法不属于汉语分词方法?()
A)双向扫描法
B)正向最大匹配法
C)逐词遍历法
D)词向量匹配法
28.[单选题]下面是交叉验证的几种方法:
1/ Bootstrap
2/ 留一法交叉验证
3/ 5 折交叉验证
4/ 重复使用两次 5 折交叉验证
请对上面四种方法的执行时间进行排序,样本数量为 1000。
A)1 > 2 > 3 > 4
B)2 > 4 > 3 > 1
C)4 > 1 > 2 >3
D)2 > 4 > 3 > 1
29.[单选题]下列有关SVM和LR说法不正确的是()
A)SVM是分类模型,LR是回归模型
B)SVM和LR都是分类模型
C)SVM是判别式模型
D)LR判别式模型
正则化描述正确的是
30.[单选题]在一个线性回归问题中,我们使用 R 平方(R-Squared)来判断拟合度。此时,如果增加一个特征,模型不变,则下面说法正确的是?
A)如果 R-Squared 增加,则这个特征有意义
B)如果R-Squared 减小,则这个特征没有意义
C)仅看 R-Squared 单一变量,无法确定这个特征是否有意义。
D)以上说法都不对
31.[单选题]EM算法是()
A)有监督
B)无监督
C)半监督
D)都不是
32.[单选题]以下关于机器学习描述错误的是?
A)是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科
B)研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能
C)器学习强调三个关键词:算法、模型、训练
D)基于数据的机器学习是现代智能技术中的重要方法之一
33.[单选题]下列关于缺失值检测的说法中,正确的是()。
A)null()和notnull()可以对缺失值进行处理
B)dropna()方法既可以删除观测记录,也可以删除特征
C)fillna()方法中用来替换缺失值的值只能是DataFrame对象
D)Pandas库中的interpolate模块包含了多种插值方法
34.[单选题]近似推断不含有?
A)采样
B)变分推断
C)确定性近似完成近似推断
D)分类
35.[单选题]当(__)过高,会出现过拟合现象
A)偏差
B)方差
C)噪声
D)泛化误差
36.[单选题]当合适的样本容量很难确定时,可以使用的抽样方法是()。
A)有放回的简单随机抽样
B)无放回的简单随机抽样
C)分层抽样
D)渐进抽样

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。