人工智能自然语言技术练习(习题卷11)第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]以下不是数据清洗的方法有
A)A: 缺失值填充
B)B: 重复值去除
C)C: 寻离点(奇点)
D)D: 集成不同的数据库
答案:D
解析:
2.[单选题]在同质集成(系统中个体学习器的类型相同)中,个体学习器又被称为
A)基学习器
B)组建学习
C)不能判断
D)以上都正确
答案:A
解析:
3.[单选题]tf.cast函数的返回值数据类型是什么
A)整数型
B)布尔型
C)浮点型
D)字符串
答案:C
解析:
4.[单选题]什么是KNN算法,如何理解KNN
A)KNN可以说是最简单的分类算法之一,同时,它也是最常用的分类算法之一
B)通过建立自变量因变量之间一次函数的关系去做回归
C)到间隔最大的超平面,去做分类
D)不确定
答案:A
解析:
5.[单选题]tf.reverse的正确说法是哪一项?
A)沿着某一维度连结tensor
B)沿着某一维度将tensor分离为num_split tensors
C)对tensor进行切片操作
D)沿着某维度进行序列反转
答案:D
解析:
6.[单选题]sigmoid的输出值在哪个区间?
A)0~1
B)0~2
C)-1~0
答案:A
解析:
7.[单选题]下列关于GBDT的说法正确的是哪个
A)GBDT是机器学习的算法
B)GBDT是深度学习的算法
C)GBDT属于特征工程部分
D)以上都正确
答案:A
解析:
8.[单选题]算法经常出现过拟合,以下四个选项中,哪个不容易陷入过拟合
A)未剪枝的决策树
B)随机森林
C)不加正则的线性回归
D)不加正则的逻辑回归
答案:B
解析:
9.[单选题]SVM有着广泛的应用,以下几个应用当中正确的是?
A)文本分类
B)特征提取
C)特征降维
D)缺失值处理
答案:A
解析:
10.[单选题]EM最大期望算法的第一步是做什么
A)求代价
B)最大化
C)计算期望
D)不确定
答案:C
解析:
11.[单选题]BERT有几个训练任务
A)1
B)2
C)3
D)4
答案:B
解析:
12.[单选题]LDA的优缺点说法正确的是哪个选项
A)LDA适合对非高斯分布样本进行降维;
B)不可以使用类别的先验知识;
C)LDA不会过度拟合数据。
D)LDA在样本分类信息依赖方差而不是均值时,降维效果不好;
答案:D
解析:
13.[单选题]如果对图像进行池化,ksize=[1,4,4,1]那么图像会变成多大
A)缩小到1/2
B)扩大四倍
C)扩大两倍
D)缩小到1/16
答案:D
解析:
14.[单选题]最简单常用的sigmoid激活函数的输出值的范围是在以下哪个区间中?
A)0~1
B)0~2
在常用的正则化计算方法中 属于C)-1~0
D)-1~1
答案:A
解析:
15.[单选题]在动量梯度下降(Momentum)中,其中的参数β一般的默认值是多少?
A)0.7
B)0.8
C)0.9
D)1
答案:C
解析:
16.[单选题]不属于分布式表示模型的是( )。
A)分类模型
B)LSA 矩阵分解模型
C)PLSA 潜在语义分析概率模型
D)Word2Vec 模型
答案:A
解析:
17.[单选题]以下几个选项,哪一个常赋值给batch_size
A)128
B)127
C)126
D)125
答案:A
解析:
18.[单选题]为什么要使用激活函数,有什么意义和用途
A)进行非线性变换,增强表达能力
B)进行线性变换,增强表达能力
C)进行线性变换,减少表达能力
D)进行非线性变换,减少表达能力
答案:A
解析:
19.[单选题]什么是似然函数如何去理解似然函数?
A)是一种关于统计模型中的参数的函数,表示模型参数中的似然性
B)是一个最优的超平面用作分类
C)是一个一次函数之间的关系
D)是一种正则化的方式
答案:A
解析:
20.[单选题]XGBoost虽然是在GBDT的基础上进行的改进但是它可以吧哪些方面发挥到极致
A)速度
B)代价
C)准确率
D)以上都是
答案:A
解析:
21.[单选题]自然语言处理难点目前有四大类,下列选项中不是其中之一的是
A)机器性能
B)语言歧义性
C)知识依赖
D)语境
答案:A
解析:
22.[单选题]使用网格搜索寻超参数的话,有什么缺点
A)准确率高
B)查的快
C)计算资源少
D)十分的耗时
答案:D
解析:
23.[单选题]以下哪个函数常用于解决多分类问题
A)tanh
B)sigmoid
C)softmax
D)relu
答案:C
解析:
24.[单选题]关于人工智能的RNN,将()信息带到下个环节中
A)先前
B)之后
C)丢失
D)LSTM
答案:A
解析:
25.[单选题]马尔可夫模型的构成要素包括
A)状态
B)周期长度
C)转换概率
D)其余选项结对
答案:D
解析:
26.[单选题]以下关于信息增益正确的是
A)信息增益 = 划分后熵 - 划分前熵
B)信息增益 = 划分前熵 - 划分后熵
C)信息增益就是信息熵
D)信息增益就是条件熵
答案:B
解析:
27.[单选题]下列哪一项在神经网络中引入了非线性?
A)随机梯度下降
B)修正线性单元(ReLU)
C)卷积函数
D)以上都不正确
答案:B
解析:
28.[单选题]信息增益和信息增益比相比有什么不同
A)它们的计算方法完全相同
B)信息增益总是偏向于选择取值较多的属性。信息增益比在此基础上增加了一个罚项
C)信息增益可以处理连续型的数据
D)信息增益比可以处理连续型的数据
答案:B
解析:
29.[单选题]CNN中,一般选择有多个卷积核是为了什么
A)同时提取多个图像的特征
B)提取某些图像多个特征
C)图像有多个通道
D)与多特征无关
答案:B
解析:
30.[单选题]以下有关文本分词的说法正确的是哪个?( )
A)英文文本不需要分词。
B)分词算法都需要一个词典。
C)基于统计的分词方法的性能与训练语料库的质量密切相关
D)分词合适与否不会引起句子的歧义
答案:C
解析:
31.[单选题]从概率论的角度来说,概率图中的节点代表什么
A)随机变量
B)关系
C)代价
D)学习率
答案:A
解析:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论