人工智能机器学习技术练习(习题卷9)说明:答案和解析在试卷最后
第1部分:单项选择题,共62题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]下面哪个/些超参数的增加可能会造成随机森林数据过拟合?
A)树的数量
B)树的深度
C)学习速率
2.[单选题]属于常见问题解答模块的主要技术的是( )。 [] *A问句相似度计算
A)语料库的构建
B)查询扩展
C)模式匹配
3.[单选题]采样分析的精确性随着采样随机性的增加而(),但与样本数量的增加关系
不大。
A)降低
B)不变
C)提高
D)无关
4.[单选题]以下表达式书写错误的是
A)year('2015-12-31 12:21')
B)month(2015-10-31)
C)day('2015-12-11')
D)date_sub('2015-12-01',3)
5.[单选题]下列分类方法中不会用到梯度下降法的是( )
A)感知机
B)最小二乘分类器
C)最小距离分类器
D)Logistic回归
6.[单选题]下列关于支持向量机的说法错误的是(__)。
A)硬间隔支持向量机易出现过拟合的情况
B)软间隔支持向量机的目标函数不是一个二次规划问题
C)松弛变量可用来解决线性不可分问题
D)支持向量机可用来进行数据的分类
7.[单选题]关于Logistic回归和SVM,以下说法错误的是?
A)Logistic回归可用于预测事件发生概率的大小
B)Logistic回归的目标函数是最小化后验概率
D)SVM可以有效避免模型过拟合
8.[单选题]研究某超市销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的那类问题()
A)关联规则发现
B)聚类
C)分类正则化可以理解为一种什么法
D)自然语言处理
9.[单选题]二分类任务中,有三个分类器h1,h2,h3,三个测试样本x1,x2,x3。假设1表示分类结果正确,0表示错误,h1在x1,x2,x3的结果分别(1,1,0),h2,h3分别为(0,1,1),(1,0,1),按投票法集成三个分类器,下列说法正确的是()(注:0,1不是类别标签,而是模型预测结果是正确还是错误的意思)
A)集成提高了性能
B)集成没有效果
C)集成降低了性能
D)集成效果不能确定
10.[单选题]根据TCP/IP协议栈的分层来看HTTP协议工作在哪一层
A)数据链路层
B)网络层
C)传输层
D)应用层
11.[单选题]以下(  )包提供了灵活高效的groupby功能,它使操作者能以一种自然的方式对数据进行切片,切块,摘要等操作。
A)Pandas
B)Matplotlib
C)NumPy
D)sklearn
12.[单选题]下列算法中属于图象平滑处理的是︰
A)梯度锐化
B)直方图均衡
C)中值滤波
D)Laplacian增强
13.[单选题]以下哪个不是 Python关键字( )。
A)from
B)assert
C)not
D)final
14.[单选题]两个种子点A(-1,1),B(2,1),其余点为(0,0),(0,2),(1,1),(3,2),(6,0),
(6,2),利用Kmeans算法,点中心按坐标平均计算。最终种子点A需要移动的次
数,种子点B需要移动的次数,属于种子点A的点数(不包含A),属于种子点B的
点数(不包含B)分别为( )
A)2,2,3,3
B)1,1,3,3
C)1,1,2,4
D)2,2,2,4
A)K-Means 丢弃被它识别为噪声的对象,而 DBSCAN 一般聚类所有对象
B)K-Means 使用簇的基于原型的概念,而 DBSCAN 使用基于密度的概念
C)K-Means 很难处理非球形的簇和不同大小的簇,而 DBSCAN 可以处理不同形状和不同大小的簇
D)K-Means 可以发现不是明显分离的簇,即使簇有重叠它也可以发现,但是 DBSCAN会合并有重叠的簇
16.[单选题]下面关于数据产品开发相关描述正确的有(__)。
A)数据科学家的主要职责是“数据的管理”
B)数据科学家一定是科学家
C)“数据码农”可以胜任数据科学家
D)数据科学家是为解决现实世界中问题提供直接指导、依据或参考的高级专家
17.[单选题]假如你在训练一个线性回归模型,有下面两句话:
1、如果数据量较少,容易发生过拟合。
2、如果假设空间较小,容易发生过拟合。
关于这两句话,下列说法正确的是?
A)1 和 2 都错误
B)1 正确,2 错误
C)1 错误,2 正确
D)1 和 2 都正确
18.[单选题](__)是常用的估计参数隐变量的利器,它是一种迭代的方法。
A)边际似然
B)EM算法
C)贝叶斯决策
D)贝叶斯分类器
19.[单选题]下面关于贝叶斯学习相关描述正确的有(__)。
A)贝叶斯学习等价于频数概率
B)频数概率引入先验知识和逻辑推理来处理不确定问题
C)贝叶斯学习只从数据本身获得结论
D)贝叶斯学习是一种以贝叶斯法则为基础的,并通过概率手段进行学习的方法
20.[单选题]“文档”是待处理的数据对象,它由一组词组成,这些词在文档中不计顺序的额,例如一篇论文、一个网页都可以看做一个文档;这样的表示方式称为?
A)语句
B)词袋
C)词海
D)词塘
21.[单选题]相同的词可以通过()来实现多个词嵌入?
A)GloVe
B)Word2Vec
C)ELMo
D)Nltk
22.[单选题]Spark Job 默认的调度模式 ()。
A)FIFO
B)FAIR
C)无
D)运行时指定
23.[单选题]关于特征选择,下列对 Ridge 回归和 Lasso 回归说法正确的是?
A)Ridge 回归适用于特征选择
B)Lasso 回归适用于特征选择
C)两个都适用于特征选择
D)以上说法都不对
24.[单选题](__)的基本思想是学习过程由信号的正向传播与误差反向传播两个过程组成。
A)感知机
B)神经元
C)神经系统
D)误差逆传播
25.[单选题]下列关于聚类分析的度量标准轮廓系数的描述不准确的是( )
A)轮廓系数的最大值是1
B)一个簇整体的轮廓系数越大,说明聚类的效果越好
C)轮廓系数不可能出现负数
D)聚类紧密的簇比聚类稀疏的簇的整体轮廓系数要大
26.[单选题]在训练集上每学到一条规则,就将该规则覆盖的训练样例去除,然后以剩下的训练样例组成训练集重复上述过程的方法称为
A)缺省规则
B)序贯覆盖
C)不放回学习
D)一阶规则
27.[单选题]逻辑回归的以下模型:P(y = 1 | x,w)= g(w0 + w1x)其中g(z)是逻辑函数。
在上述等式中,通过改变参数w可以得到的P(y = 1 | x; w)被视为x的函数。
在上面的问题中,你认为哪个函数会产生(0,1)之间的p?
A)逻辑函数
B)对数似然函数
C)两者的复合函数
D)都不会
28.[单选题]我们想在大数据集上训练决策树, 为了使用较少时间, 我们可以 :
A)增加树的深度
B)增加学习率 (learning rate)
C)减少树的深度
D)减少树的数量
29.[单选题]下列关于软支持向量机的说法正确的是(__)。
A)软间隔支持向量机不可应用拉格朗日乘子法求解
B)软间隔支持向量机和硬间隔支持向量机完全相同
C)软间隔支持向量机只能使用Hinge损失函数
D)软间隔支持向量机的目标函数仍是一个二次规划问题
30.[单选题]概率模型的训练过程就是()过程。
A)分类
B)聚类
C)参数估计
D)参数选择
31.[单选题]已知
class="fr-fic fr-dib cursor-hover"
A)-2,2
B)3,-3
C)-3,3
D)2,-2
32.[单选题]当k=5时,使用k近邻算法判断下图中的绿方框属于()
A)圆形
B)三角形
C)长方形
D)以上都不是
33.[单选题]对参数进行L2 正则,是机器学习常用的防止过拟合的方法。对参数做L2 正则时,()是对参数本身做先验分布假设。
A)高斯分布
B)拉普拉斯分布
C)泊松分布
D)均匀分布
34.[单选题](__)的目的是为给定学习器选择最有利于其性能、“量身定做”的特征子集。
A)过滤式选择
B)包裹式选择
C)嵌入式选择
D)正则化
35.[单选题]tensorflow中的tf.nn.max_pool()的函数,其作用是( )。
A)图像输入
B)进行卷积
C)进行池化
D)图像输出
36.[单选题]KNN算法是基于()
A)概率空间
B)颜空间
C)距离空间
D)线性空间
37.[单选题]应用PCA后,以下哪项可以是前两个主成分?
1 (0.5,0.5,0.5,0.5)和(0.71,0.71,0,0)
2 (0.5,0.5,0.5,0.5)和(0,0,-0.71,0.71)
3 (0.5,0.5,0.5,0.5)和(0.5,0.5,-0.5,-0.5)
4 (0.5,0.5,0.5,0.5)和(-0.5,-0.5,0.5,0.5)
A)1和2
B)1和3
C)2和4
D)3和4

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。