人工智能机器学习技术练习(习题卷2)
说明:答案和解析在试卷最后
第1部分:单项选择题,共62题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]我们常用 ( ) 版。
A)apache 版
B)cdh 版
C)Hortonworks版本
2.[单选题]现在有一份数据,你随机的将数据分成了n份,然后同时训练n个子模型,再将模型最后相结合得到一个强学习器,这属于boosting方法吗
A)是
B)不是
C)不确定
3.[单选题]对于非概率模型而言,可按照判别函数线性与否分成线性模型与非线性模型。下面哪个模型不属于线性模型
A)感知机
B)AdaBoost
C)K-means
D)k近邻
4.[单选题]下列选项中,()是基于Web的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程。
A)Jupyter Notebook
B)Anconda Navigator
C)Anconda Prompt
D)Spyder
5.[单选题]为了观察测试 Y 与 X 之间的线性关系,X 是连续变量,使用下列哪种图形比较适合?
A)散点图
B)柱形图
C)直方图
D)以上都不对
6.[单选题]()是指数据减去一个总括统计量或模型拟合值时的残余部分
A)极值
B)标准值
C)平均值
D)残值
7.[单选题]在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:
A)有放回的简单随机抽样
B)无放回的简单随机抽样
C)分层抽样
D)渐进抽样
8.[单选题]在留出法、交叉验证法和自助法三种评估方法中,()更适用于数据集较小、难以划分训练集和测试集的情况。
A)留出法
B)交叉验证法
C)自助法
D)留一法
9.[单选题](__)先将数据集中的每个样本看做一个初始聚类簇,然后在算法运行的每一步到距离最近的两个聚类簇进行合并,该过程不端重复,直至达到预设的聚类簇个数。
A)原型聚类
B)密度聚类
C)层次聚类
D)AGNES
10.[单选题](__)是广义线性模型在g(·)=ln(·) 时的特例。
A)线性模型
B)线性回归
C)线性判别分析
D)对数线性回归
11.[单选题]下列对于PCA说法:
①我们须在使用 PCA前标准化数据;
②我们应该选择使得模型有最大 variance 的主成分;
③我们应该选择使得模型有最小 variance 的主成分;
④我们可以使用 PCA 在低维度上做数据可视化。正确的是( )。
A)①、②、④
B)②、④
C)③、④
D)①、③
12.[单选题]下列表示设置绘制图像大小正确的是()。
A)plt.figure(figsize=(10,6))
B)plt.figure(figsize={10,6})
C)plt.figure(10,6)
D)plt.figure(figsize=[10,6])
13.[单选题]隐马尔可夫模型是一种著名的(__)模型。
A)无向图
B)有向图
C)树形图
D)环形图
14.[单选题]以下有关神经网络的说法错误的是( )
A)MP模型在隐藏层和输出层都对神经元进行激活函数处理
B)使用多层功能神经元可以解决非线性可分问题
C)神经网络“学”到的东西,蕴含在连接权值和阈值中
D)BP算法基于梯度下降策略
15.[单选题]下列的数组统计计算中,用于计算数组中最大值的方法是( )。
A)max
B)maximum
C)min
D)maximal
16.[单选题]下列不属于大数据4V特性的是().
A)大量
B)多样
C)高速
D)快捷
17.[单选题]假设您已在数据集上拟合了一个复杂的回归模型。现在,您正在使用Ridge 回归,并调整参数λ以减少其复杂性。下面的描述哪个表达了偏差和方差与λ的关系()。
A)在λ非常小的情况下,偏差低,方差低
B)在λ非常小的情况下,偏差低,方差高
C)在λ非常小的情况下,偏差高,方差低
D)在λ非常小的情况下,偏差低,方差低
18.[单选题]以查准率为纵轴、查全率为横轴作图,就得到了查准率-查全率曲线,简称(__)。
A)双曲线
B)P-R曲线
C)科克曲线
D)共轭曲线
19.[单选题]KL散度是根据什么构造的可分性判据( )
A)最小损失准则
B)后验概率
C)类概率密度
D)几何距离
20.[单选题]关于数据及软件架构的CAP理论不包括下面哪些( )
A)可用性
B)一致性
C)分区容忍性
D)分布性
21.[单选题]以下描述中,属于决策树策略的是( )
A)最优投影方向
B)梯度下降方法
C)最大特征值
D)最大信息增益
22.[单选题]考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4-项集不包含
A)1,2,3,4
B)1,2,3,5
C)1,2,4,5
D)1,3,4,5
23.[单选题]一般来说,下列哪种方法常用来预测连续独立变量?
A)线性回归
B)逻辑回顾
C)线性回归和逻辑回归都行
D)以上说法都不对
24.[单选题]下面关于增强学习描述不正确的是(__)。
A)增强学习主要研究如何协助自治Agent的学习活动
B)增强学习基本思路是当Agent在环境中做出每个动作时,施教者会提供奖赏或者惩罚信息,以表示结果状态的正确与否
C)增强学习中的Agent需要具备环境交互能力和自治能力
D)基于马尔可夫决策不属于增强学习
25.[单选题]以下对知识描述不正确的是( )。
A)知识分为显性知识和隐性知识
B)知识是人们从数据和信息中发现的
C)知识是数据/信息中存在的共性规律、认知、经验与常识
D)隐性知识能够清晰的表述和有效的转移
26.[单选题]核主成分分析是一种(__)方法。
A)非线性降维
B)线性降维
C)分类
D)回归
27.[单选题]线性模型有很好的(__)。
A)可描述性
B)分类结果
C)可解释性
D)聚类结果
28.[单选题]下图显示的机器学习使用的激活函数(Activation function)的图形,是下列哪一个函数的图形?()
A)B)C)D)
29.[单选题]以P(w)表示词条w的概率,假设已知P(南京)=0.8,P(市长)=0.6,P(江大桥)=0.4:P(南京市)=0.3,P(长江大桥)=0.5:如果假设前后两个词的出现是独立的,那么分词结果就是( )
A)南京市 长江 大桥
B)南京 市长 江大桥
C)南京市长 江大桥
D)南京市 长江大桥
30.[单选题]从sd卡加载一张图片为bitmap并显示到屏幕上的一个view,该view占用的内存主要和什么因素有关。
A)图片文件大小及压缩格式
B)图片原始分辨率
C)view的尺寸
D)bitmap分辨率和颜位数
31.[单选题]下列关于数据标准化的说法中,不正确的是()
A)Z-Score标准化适用于特征最大值和最小值未知,数据较分散的情况
B)聚类算法要求数据集无量纲化
C)Logistic标准化函数σ(x)满足σ(0)=1
D)Min-Max标准化易受离值影响
32.[单选题]下列代码片段>>>del_selection import train_test_split
>>>X_train,X_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.4,random_state=0) 实现的功能是:
A)加载数据
B)分割数据
C)分组数据
D)删除部分数据
33.[单选题]专家系统的发展趋势不包括()。
A)知识库变大
B)推理引擎更加专用
C)用户接口更多样
D)用户需求量减少
34.[单选题]解线性方程组时,若因变量过多,则会解出多组解都能使均方误差最小化,选择哪一个解,常见的做法是引入__。
A)剪枝
B)对数线性回归
正则化是结构风险最小化策略的实现
C)极大似然法
D)正则化
35.[单选题]下列关于ndarray对象描述正确的是( )。
A)ndarray对象中可以存储不同类型的元素
B)ndarray对象中存储元素的类型必须是相同的
C)ndarray对象不支持广播操作
D)ndarray对象不具备矢量运算能力
36.[单选题]一般地,在新样本上的误差称为(__)。
A)泛化误差
B)训练误差
C)经验误差
D)精度
37.[单选题]关于ZooKeeper顺序节点的说法正确的是()
A)创建顺序节点的命令为:create/testvalue1
B)创建顺序节点时不能连续执行创建命令,否者报错节点已存在
C)通过顺序节点,可以创建分布式系统唯一ID
D)顺序节点的序号能无限增加
38.[单选题]评估完模型之后,发现模型存在高偏差(high bias),应该如何解决?
A)减少模型的特征数量
B)增加模型的特征数量
C)增加样本数量
D)以上说法都正确
39.[单选题]以下两种描述分别对应哪两种对分类算法的评价标准?
(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。
(b)描述有多少比例的小偷给警察抓了的标准。
A)Precision, Recall

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。