人工智能机器学习技术练习(习题卷8)
第1部分:单项选择题,共62题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]基于二次准则函数的H-K算法较之于感知器算法的优点是()?
A)计算量小
B)可以判别问题是否线性可分
C)其解完全适用于非线性可分的情况
答案:B
解析:
2.[单选题]构建回归树的时间复杂度最重要的因素是()
A)特征中类别的个数
B)label列值域
C)样本总量
答案:A
解析:
3.[单选题]()是指为最小化总体风险,只需在每个样本上选择能使特定条件风险最小的类别标记。
A)支持向量机
B)间隔最大化
C)线性分类器
D)贝叶斯判定准则
答案:D
解析:
正则化是结构风险最小化策略的实现4.[单选题]下列选择 Logistic回归中的 One-Vs-All方法中,()是真实的。
A)我们需要在n类分类问题中适合n个模型
B)我们需要适合n-1个模型来分类为n个类
C)我们需要只适合1个模型来分类为n个类
D)以上答案都不正确
答案:A
解析:如果存在n个类,那么n个单独的逻辑回归必须与之相适应,其中每个类的概率由剩余类的概率之和确定。
5.[单选题](__)不属于相关分析。
A)正相关
B)负相关
C)线性相关
D)误差相关
答案:D
解析:
6.[单选题]移动运营商对客户进行细分,设计套餐和营销活动可以使用下面哪种机器学习方法( )。
A)贝叶斯分类器
B)关联方法
C)聚类算法
D)多层前馈网络
7.[单选题]下面是三个散点图(A,B,C,从左到右)和和手绘的逻辑回归决策边界。
alt="" >上图中哪一个显示了决策边界过度拟合训练数据?
A)A
B)B
C)C
D)这些都没有
答案:C
解析:由于在图3中,决策边界不平滑,表明其过度拟合数据。
8.[单选题]半监督学习包括。
A)主动学习
B)回归学习
C)聚类学习
D)直推学习
答案:D
解析:
9.[单选题]在统计语言模型中,通常以概率的形式描述任意语句的可能性,利用最大相似度估计进行度量,对于一些低频词,无论如何扩大训练数据,出现的频度仍然很低,下列哪种方法可以解决这一问题()
A)一元切分
B)一元文法
C)数据平滑
D)N元文法
答案:C
解析:
10.[单选题]将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?
A)频繁模式挖掘
B)分类和预测
C)数据预处理
D)数据流挖掘
答案:C
11.[单选题]图像数据分析的常用方法不包括( )
A)图像变换
B)图像编码和压缩
C)图像增强和复原
D)图像数据采集
答案:D
解析:
12.[单选题]下列关于数据的说法,不正确的是()
A)数据的类别有多种多样
B)数据库中的一列代表一个特征
C)一组数据平均值不会受异常值影响
D)数据点之间的距离满足d_ij+d_jk≥d_ik
答案:C
解析:
13.[单选题]关于ZooKeeper的说法不正确是()
A)采用层次化的数据结构
B)采用类似于LINUX命令进行数据访问
C)具备临时节点和永久节点
D)永久节点会随客户端会话的结束而结束其生命周期
答案:D
解析:
14.[单选题]下面数据结构能够支持随机的插入和删除操作、并具有较好的性能的是
A)链表和哈希表
B)数组和链表
C)哈希表和队列
D)堆栈和双向队列
答案:A
解析:
15.[单选题]下面关于数据科学与统计学的关系描述不正确的有(__)。
A)数据科学是统计学的主要基础理论之一
B)数据科学的工具往往来自于统计学
C)统计学家在数据科学的发展中做出过突出贡献
D)第一篇以“数据科学”为标题的论文是由统计学家完成的
答案:A
解析:
16.[单选题]下列数据集适用于隐马尔可夫模型的是?
A)基因数据
B)影评数据
C)股票市场价格
D)以上所有
答案:D
解析:本题考查的是隐马尔可夫模型适用于解决哪类问题。
隐马尔可夫模型(Hidden Markov Model,HMM)是关于时序的概率模型,描述一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观察而产生观测随机序列的过程。因此,隐马尔可夫模型适用于解决时间序列
17.[单选题]下列哪种方法可以用来缓解过拟合的产生:( )。
A)正则化
B)增加更多的特征
C)以上都是
D)增加模型的复杂度
答案:A
解析:
18.[单选题]以下对于t-SNE和PCA的陈述中哪个是正确的?
A)t-SNE是线性的,而PCA是非线性的
B)t-SNE和PCA都是线性的
C)t-SNE和PCA都是非线性的
D)t-SNE是非线性的,而PCA是线性的
答案:D
解析:
19.[单选题]下列贝叶斯描述错误的是
A)贝叶斯是概率框架下实施决策的基本方法;
B)贝叶斯基于概率和误判损失来选择最优的类别标记;
C)贝叶斯中期望损失定义为风险;
D)贝叶斯判定准则为最大化总体风险;
答案:D
解析:
20.[单选题]机器学习的实质在于()
A)
B)想
C)判断
D)理解
答案:A
解析:
21.[单选题]下图是哪一种算法表示( )
A)K-近邻算法
B)贝叶斯
C)一元线性回归
D)多项式回归
答案:C
解析:
22.[单选题]借助对数形式的变换曲线可以达到压缩图像灰度动态范围的目的,这是因为?
A)变换前的灰度值范围比变换后的灰度值范围大;
B)变换后仅取了一部分灰度值的范围;
C)变换前后灰度值的范围不同;
D)对数形式的变换曲线是单增的曲线;
答案:B
解析:
23.[单选题]支持向量机优化问题的形式是(__)。
B)一个含有等式约束的二次规划问题
C)一个含有不等式约束的二次规划问题
D)一个含有不等式约束的线性规划问题
答案:C
解析:
24.[单选题]现有4个同时到达的作业J1,J2,J3和J4,它们的执行时间分别是1小时,3小时,5小时,7小时,系统按单道方式运行且采用短作业优先算法,则平均周转时间是()小时
A)4
B)5
C)6
D)7.5
答案:D
解析:
25.[单选题]关于EM算法正确的是
A)EM算法包括两步:E算法和M算法
B)EM算法一定能收敛到全局最大值点
C)英文全称是Expectation-Minimization
D)以上都不正确
答案:A
解析:
26.[单选题]下面不属于数据科学平台的有(__)。
A)dataiku
B)endor
C)knime
D)alpine
答案:B
解析:
27.[单选题]使用什么函数接收用输入的数据()。
A)accept()
B)input()
C)readline()
D)login()
答案:B
解析:
28.[单选题]设 q ( n , m )是将正整数 n 划分成最大加数不大于 m 的若干不同正整数之和的划分数,则 q ( n , m )为( )。
class="fr-fic fr-dib cursor-hover"
A)①
B)②
C)③
D)④
答案:B
解析:
29.[单选题]假设在庞大的数据集上使用Logistic 回归模型,可能遇到一个问题,Logistic 回归需要很长时间才能训练

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。