人工智能自然语言技术练习(习题卷10)说明:答案和解析在试卷最后
第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]词性标注最困难的是:( )
A)兼类词
B)外来词
C)新词
D)未登录词
2.[单选题]下列关于不精确推理过程的叙述错误的是( )。
A)不精确推理过程是从不确定的事实出发
B)不精确推理过程最终能够推出确定的结论
C)不精确推理过程是运用不确定的知识
D)不精确推理过程最终推出不确定性的结论
正则化是为了防止3.[单选题]我们在代价函数加入了L1,L2正则化,可以解决下面什么问题
A)过拟合
B)欠拟合
C)完美拟合
D)不确定
4.[单选题]下列关于doc2vec算法的描述错误的是?( )
A)DM 模型在给定上下文和文档向量的情况下预测单词的概率
B)DM 模型在训练时,首先将每个文档的 ID 和语料库中的所有词初始化一个 K 维的向量
C)DBOW 模型的训练方法是忽略输入的上下文,让模型去预测段落中的随机一个单词
D)在预测单词的概率时,利用了部分文档的语义。
5.[单选题]ELMO的输入句子中每个单词对应几个Embedding
A)1
B)2
C)3
D)4
6.[单选题]预训练模型GPT的优点是什么
A)引入了单向的Transformer效果得到提升
B)使用双向的Transformer
C)抛开了下文只用了上文信息
D)使用了双向的LSTM做特征提取
7.[单选题]一个文本语料库中我们要提取的特征可能是什么
A)文本中词计数
B)词的向量标注
C)词性标注(Part of Speech Tag)
D)以上所有
8.[单选题]SVM中通过()去寻的最优的超平面
A)支持向量机
B)线性回归
C)正则化
D)逻辑回归
9.[单选题]关于文本预处理的过程,下列描述错误的是( )。
A)文本分词是预处理过程中必不可少的一个操作
B)词干提取是一个很粗略的去除单词两端词缀的过程
C)词形还原是一个去除曲折的词缀且返回词典中包含的词的过程
D)文本中的每个单词都能够表明文本的特征
10.[单选题]batch_size一般设置为多少
A)61
B)62
C)63
D)64
11.[单选题]直方图算法,其算法中有一个参数:K,K代表的是什么意义
A)代价
B)常数
C)学习率
D)不确定
12.[单选题]ID3,C4.5,他们有什么,相同的地方?
A)将信息增益比作为了选择特征的标准
B)将信息增益作为了选择特征的标准
C)将基尼系数作为了选择特征的标准
D)都属于决策树算法
13.[单选题]如果说文本中出现多意现象,需要把上下文连接起来,可以怎么做
A)随机森林分类器
B)卷积神经网络
C)梯度爆炸
D)上述所有方法
14.[单选题]RNN可以将()时间步带入到神经元计算
A)先前
B)之后
C)丢失
D)LSTM
15.[单选题]激活函数也在不断的更新,以下哪个激活函数是在Relu的基础上优化的
A)sigmoid
B)tanh
C)relu
D)Leaky relu
16.[单选题]现有一份大小为n的数据集,如果采用mini-batch的方式,那么它的大小应该是多少
A)1
B)m
C)0
D)大于2,小于m
17.[单选题]以下哪个不是文本向量化的常用方法?
A)EM
B)CBOW
C)BDOW
D)DM
18.[单选题]tf.to_float的作用是什么
A)将张量转换为 float32 类型.
B)转为64位浮点类型-float64
C)转为32位整型-int32
D)转为64位整型-int64
19.[单选题]BP算法,其中的BP指的怎样传播?
A)反向
B)正向
C)前后向
D)全连接
20.[单选题]导出数据Data到微软的Excel文件,pandas用到的方法是
A)A: df.to_csv()
B)_excel()
C)C: df.to_sql()
D)D: df.to_json()
21.[单选题]以下哪个是激活函数呢?
A)sigmode
B)tanh
C)EELU
D)PLU
22.[单选题]以下选项中关于拟合的问题,说法描述正确的是?
A)过拟合的现象是训练集准确率低,而测试集准确率高
B)欠拟合的现象是训练集和测试集准确率相近
C)尽量不要出现适度拟合,会造成新数据准确率低
D)欠拟合是指验证集和测试集的准确率都无法保证正常业务使用
23.[单选题]符号主义是()
A)是人工智能的主流
B)是人工智能的基础
C)是人工智能的全部
D)不是人工智能
24.[单选题]CRF又叫什么
A)拉索回归
B)支持向量机
C)隐马尔科夫
D)条件随机场
25.[单选题]XGBoost中对树上叶子节点的得分w的L2模平方,有什么目的
A)为了避免过拟合
B)为了避免欠拟合
C)为了增加叶子节点个数
D)不确定
26.[单选题]不符合属性和数量类概念的规定的是
A)味道:DEF=attribute|属性,taste|味道,&edible|食物
B)气量:DEF=attribute|属性,tolerance|气量,&human|人
C)班次:DEF=quantity|数量,amount|多少,&transport|运送
D)比价:DEF=quantity|数量,rate|比率,price|价格
27.[单选题]目前情感分类的研究主要有基于情感词典的情感分析和基于( )的情感分类方法。
A)统计学习
B)机器学习
C)语料库
D)模式匹配
28.[单选题]tf.conv2d(a, b, c, d )函数的四个参数,哪个参数表示输入数据?
A)b
B)a
C)c
D)d
29.[单选题]人工智能NLP有很大的应用,那么下面哪些属于NLP的应用
A)从图像中检测物体
B)面部识别
C)语音生物识别
D)文本摘要
30.[单选题]基于统计的分词方法为()
A)正向最大匹配法
B)逆向最大匹配法
C)最少切分
D)条件随机场
31.[单选题]learning_rate用于网络的什么作用
A)调整学习率
B)批处理
C)dropout
D)过拟合
32.[单选题]不属于文本挖掘的基本技术分类的是( )
A)文本信息抽取
B)文本分类
C)文本聚类
D)文本数据挖掘
33.[单选题]以下几个选项中,哪个选项指的是“修正线性单元”
A)tanh
B)Leaky Relu
C)sigmoid
D)relu
34.[单选题]关于K-Means以下说法正确的是?
A)是无监督学习
B)是有监督学习
C)是半监督学习
D)是强化学习
35.[单选题]下列哪些是数据平滑技术?I 、Laplace法则。II 、Good-Turing估计。III、绝对折扣和线性折扣。IV 、Witten-Bell算法。V 、CYK分析法
A)I ,II ,V
B)I ,II ,III,IV
C)I ,V
D)III,IV ,V
36.[单选题]人工智能的模型在优化过程中,学习率LR会:
A)保持不变
B)持续减小
C)持续增大
D)不变
37.[单选题]Relu的求导,正半区的求导之后是多少
A)0
B)0.25
C)1
D)-1
38.[单选题]怎么去理解模型当中的过拟合现象
A)指的就是样本该学习到的特征没有学习到,导致了曲线拟合数据的时候,效果不好。
B)指的肯定就是说,这条曲线,过分的去描述现有的数据特征了。
C)指得就是说这个曲线能不能去很好的描述现有的数据。
D)欠拟合指的就是在训练和测试数据上的表现都不好
39.[单选题]_operations()的作用是什么
A)返回图中的操作节点列表
B)为节点创建层次化的名称,并返回一个上下文管理器
C)返回图中的操作节点列表
D)完成图的构建,即将其设置为只读模式
40.[单选题]特征提取器Transformer为什么使用多头机制
A)增加模型的复杂度
B)增加模型的运行时间
C)保证了Transformer可以注意到不同的子空间,捕捉更丰富的信息
D)无实际性的意义
41.[单选题]如果适当的增加了模型的复杂度会达到什么效果
A)防止过拟合

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。