人工智能自然语言技术练习(习题卷20)第1部分:单项选择题,共43题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]GBDT是有一定局限性的,局限性体现在哪儿?
A)GBDT只能处理高维稀疏的数据集上
B)GBDT在处理文本分类特征问题上,相对其他模型的优势不如它在处理数值特征时明显。
C)GBDT在高维稀疏的数据集上,表现比支持向量机要好
D)训练过程需要并行训练
答案:B
解析:
2.[单选题]tanh的输出范围是多少
A)[0,1]
B)[-1,1]
C)[-1,0]
正则化描述正确的是D)[-0.5,0.5]
答案:B
解析:
3.[单选题]计算TensorFlow以硬件平台通常分为哪些版本
A)CPU,GPU,TPU
B)CPU,GPU
C)CPU
D)TPU
答案:A
解析:
4.[单选题]下列关于K均值说法,正确的是?
A)K均值接收未标记的数据集,然后将数据聚类成不同的组
B)通过生成树的形式对,数据集进行分类
C)通过自变量和因变量之间的一次函数关系,构建回归模型
D)构建一个超平面,将数据在更高维度上,使用超平面更好的划分
答案:A
解析:
5.[单选题]自动驾驶是如何起源的
A)BP算法
B)神经网络
C)前向算法
D)NFC
答案:A
解析:
6.[单选题]以下几个关于EM算法的说法,正确的是
A)传统EM算法对初始值不敏感
B)EM算法不能应用到HMM的求解中
C)不确定
D)传统EM算法对初始值敏感
答案:D
解析:
7.[单选题]Attention是通过那种方式计算权重的
A)tanh
B)relu
C)softmax
D)sigmoid
答案:C
解析:
8.[单选题]关于信息熵说法正确的是
A)信息熵是消除不确定性所需信息量的度量,也即未知事件可能含有的信息量。
B)信息熵就是极大似然函数
C)信息熵就是代价函数
D)不确定
答案:A
解析:
9.[单选题]预训练模型的本质思想是什么
A)使用数据训练处一个很合适的模型
B)事先训练好一个预训练模型,基于上下文去调整
C)使用自己的数据去训练模型
D)不确定
答案:B
解析:
10.[单选题]如果一个分类器的效果越好,那么它的AUC值会怎样
A)越小
B)越大
C)越低
D)不确定
答案:B
解析:
11.[单选题]如果文法中的每一条产生式α→β都满足|α|<=|β|,即规则左部的符号个数少于或等于规则右部的符号个数(例如,xYz→xyz),这种文法就称为
A)0型文法
B)1型文法
C)2型文法
D)左线性文法
答案:B
解析:
12.[单选题]决策树有很多的优点,但是它也有缺点那么,构建决策树时有可能会造成什么缺点
A)可能会对缺失值很敏感
B)无法处理不相关的数据
C)可能产生过渡匹配问题
D)计算的复杂度很高
答案:C
解析:
13.[单选题]我们常说的SVD中,它可以做什么任务
A)降维
B)聚类
C)分类
D)回归
答案:A
解析:
14.[单选题]马尔科夫链在计算时要依靠
A)先验概率
B)后验概率
C)条件概率
D)最大似然概率
答案:B
解析:
15.[单选题]编解码器的encode在中如果使用LSTM接收的是什么
A)每个单词的word embedding和上一时间点的hidden state
B)接收的是原始的单词
C)接收的是上一层和hidden state
D)接收的是每个单词的word embedding
答案:A
解析:
16.[单选题]带深度限制的Leaf-wise的叶子生长策略是以下哪个算法的优化
A)XGBoost
B)随机森林
C)GBDT
D)LightGBM
答案:D
解析:
17.[单选题]LSTM可以通过()来进行长短期记忆
A)RNN控制
B)前馈控制
C)BP控制
D)门控制
答案:D
解析:
18.[单选题]正则表达式的功能主要包括( )
A)判断输入是否匹配模式
B)在输入中查和模式匹配字符串
C)替换输入和模式匹配字符串
D)以上都对
答案:D
解析:
19.[单选题]以下四个选项中,人脸识别可以用网络架构
A)LeNET5
B)(CNN:AlexNet)
C)VGG
D)ResNet
答案:B
解析:
20.[单选题]tf.expand_dims是什么意思
A)改变tensor的形状
B)返回tensor的rank
C)插入维度1进入一个tensor中
D)返回数据的元素数量
答案:C
解析:
21.[单选题]基于语义的文本表示的深度学习方法有哪些
A)LDA
B)LSI
C)PLSI
D)word embedding
答案:B
解析:
22.[单选题]GB 18030采用()字节变长编码方式。
A)一二三
B)一二四
C)一三四
D)二三四
答案:B
解析:
23.[单选题]关于逆文档频率说法错误的是( )。
A)逆文档频率是一个词出现在文档集中文档频次的统计量
B)一个词在文档集中越少的文档中出现,说明这个词对文档的区分能力越强
C)一个词在文档集中越少的文档中出现,说明这个词对文档的区分能力越弱
D)逆文档频率统计量的计算公式为 idr,=logq回[,ed}+1
答案:C
解析:
24.[单选题]哪个不是计算相似度的深度模型
A)word2vec
B)DSSM
C)DRMM
D)MatchPyramid
答案:A
解析:
25.[单选题]Tensorflow1.0和2.0最本质的区别
A)1.0是动态图,2.0是经态度
B)1.0是静态图,2.0是动态图
C)1.0debug更方便
D)2.0运行速度更快
答案:B
解析:
26.[单选题]以下的序列数据中,属于一对多(一个输入,多个输出)的关系是哪个?
A)音乐生成
B)情感分类
C)机器翻译
D)DNA序列分析
答案:A
解析:
27.[单选题]RNN和CNN都可以处理文本,哪个处理长文本效果更好
A)RNN
B)CNN
C)一样好
D)不确定
答案:A
解析:
28.[单选题]可以利用状态估计等功能,督导考核()维护工作。
A)运行数据
B)原始数据
C)统计数据
D)基础数据
答案:D
解析:
29.[单选题]每个Transformer编码器中的第一层是__?
A)前馈神经网络
B)Attention
C)Self-Attention
D)不确定
答案:A
解析:
30.[单选题]关于数据清洗的下面方法中,描述不对的是()
A)A: 缺失值填充
B)B: 重复值去除
C)C: 寻离点(奇点)
D)D: 集成不同的数据库
答案:D
解析:
31.[单选题]在以下四个选项当中,关于LightGBM的说法正确的有哪些
A)更慢的训练速度
B)更低的内存消耗
C)更差的准确率
D)不支持分布式
答案:B
解析:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。