人工智能自然语言技术练习(习题卷29)
第1部分:单项选择题,共43题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]最大正向匹配法可以用于( )
A)文本分类
B)文本特征获取
C)分词
D)情感分析
答案:C
解析:
2.[单选题]零均值归一化会将原始数据的标准差映射为多少?
A)0
B)1
C)2
D)3
答案:B
解析:
3.[单选题]不是逻辑回归与朴素贝叶斯的区别是
A)逻辑回归是生成模型
B)朴素贝叶斯是判别模型
C)朴素贝叶斯需要独立假设
D)逻辑回归不需要特征之间的线性
答案:D
解析:
4.[单选题]关于贝叶斯判别规则,下列选项中描述正确的是?
A)就是判断自变量和因变量之间的关系
B)把特征向量X落入某类集wi的条件概率平P(wi/X)当成分类判别函数,把X落入某集的条件概率最大的类为X的分类这种判别规则叫贝叶斯判别规则
C)不确定
D)就是通过选择最优的超平面去进行最好的分类超平面
答案:B
解析:
5.[单选题]Adam算法的底层原理是
A)强化了RMSprop算法
B)强化了动量梯度算法
C)同时使用Momentum和RMSprop算法
D)没有核心
答案:C
解析:
6.[单选题]不属于常用的正则表达式函数的是( )。
C)findall
D)matplotlib函数
答案:D
解析:
7.[单选题]BERT-BASE的参数量有多大
A)1亿
B)2亿
C)3亿
D)4亿
答案:A
解析:
8.[单选题]relu是常用的激活函数,它可以将小于()的数输出为0
A)-1
B)0
C)1
D)x
答案:B
解析:
9.[单选题]零均值归一化是怎么做的
A)原始数据进行线性变换
B)使 结果映射到[0, 1]的范围
C)实现对原始数据的等比缩放
D)将原始数据映射到均值为 0、标准差为1的分布上
答案:D
解析:
10.[单选题]决策树可以从以下哪个包中导入
A)sklearn
B)numpy
C)Pandas
D)matplotlib
答案:A
解析:
11.[单选题]一个汉字在方阵中的坐标,称为该字的“()”。
A)区码
B)位码
C)区位码
D)位区码
答案:C
解析:
12.[单选题]以下几个选项中, 哪个选项没描述神经网络的超参数是正确的
A)权重
B)偏置
C)神经网络的层数
13.[单选题]像sigmoid,relu,tanh等等这类叫做什么函数
A)非激活
B)激活
C)极值
D)修正线
答案:B
解析:
14.[单选题]以下哪种不是文法的表示类型?
A)无约束短语结构文法
B)上下文有关文法
C)上下文无关文法
D)反则文法
答案:D
解析:
15.[单选题]自然语言处理( )。
A)就是像人一样听到语言,然后查数据库识别声音。
B)就是理解书面文字,翻译成另一种语言。
C)理解自然界的各种声响,并加以解释。
D)具备人类般文字处理能力,从文本中提取意义。
答案:D
解析:
16.[单选题]逻辑回归的损失函数是什么
A)信息熵
B)信息增益
C)对数损失
D)均方误差
答案:C
解析:
17.[单选题]并行地训练一系列各自独立的不同类模型,然后通过训练一个元模型(meta-model)来将各个模型输出结果进行结合,是什么思想
A)Bagging
B)Boosting
C)Stacking
D)以上都正确
答案:C
解析:
18.[单选题]建立了一个kNN分类器,该分类器在训练数据上获得100%的准确性。当他们在客户端上部署此模型时,发现该模型根本不准确。以下哪项可能出错了?
A)可能是模型过拟合
B)可能是模型未拟合
C)不能判断
D)这些都不是
19.[单选题]以下四个模型中,哪个使用了双向的LSTM语言模型
A)GPT
B)BERT
C)ULMFit
D)ELMo
正则化描述正确的是
答案:D
解析:ELMo尝试训练两个独立的LSTM语言模型(从左到右和从右到左),并将结果连接起来以产生词嵌入。
20.[单选题]下列关于双向 RNN 结构说法正确的是( )。
A)只考虑预测词前面的词,并没有考虑该词后面的内容
B)不仅从前往后保留该词前面的词的信息,而且还从后往前保留该词后面的词的信息
C)不是由两个 RNN上下叠加在一起组成
D)输出与隐藏层的状态无关
答案:B
解析:
21.[单选题]语料库的加工方式不包括
A)人工方式
B)半自动方式
C)自动方式
D)干预方式
答案:D
解析:
22.[单选题]( )是一种基于图的文本排序算法,它可以用于自动摘要和提取关键词。
A)TF-IDF算法
B)TextRank算法
C)LDA算法
D)主题模型
答案:B
解析:
23.[单选题]LDA中的一个函数指的是以下哪个?
A)Gibbs采样
B)pLSA
C)beta分布
D)gamma函数
答案:D
解析:
24.[单选题]GBDT属于集成学习,因此它拥有哪些优点
A)采用决策树作为弱分类器使得GBDT模型具有较好的解释性和鲁棒性,能够自动发现特征间的高阶关系。
B)GBDT在高维稀疏的数据集上,表现不如支持向量机或者神经网络。
C)GBDT在处理文本分类特征问题上,相对其他模型的优势不如它在处理数值特征时明显。
D)训练过程需要串行训练,只能在决策树内部采用一些局部并行的手段提高训练速度。
答案:A
解析:
B)基于概率模型
C)基于信息
D)以上没有
答案:A
解析:
26.[单选题]以下几个模型中哪个模型在建模的时候与词的位置无关
A)OpenAI GPT
B)ELMo
C)BERT
D)ULMFit
答案:C
解析:BERT Transformer架构将句子中每个词和所有其他词之间的关系建模,以生成注意力分数。这些注意力分数随后被用作所有词表示的加权平均值的权重,它们被输入到完全连接的网络中以生成新的表示。
27.[单选题]下列四个选项中,哪个选项指的是mini-batch
A)小批量梯度下降
B)随机梯度下降
C)批量梯度下降
D)小批量损失计算
答案:A
解析:
28.[单选题]支持向量机属于
A)判别模型
B)数据结构
C)蜜罐模型
D)语言
答案:A
解析:
29.[单选题]循环神经网络RNN的作用描述正确的是
A)增大文本数量
B)简化文本
C)特征提取
D)文本分类
答案:C
解析:
30.[单选题]以下几个函数中,上升速度最快的是哪个
A)线性函数
B)指数函数
C)幂函数
D)对数函数
答案:D
解析:
31.[单选题]SVM和LR都可以做分类,那么有什么异同点
A)都属于分类算法

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。