人工智能自然语言技术练习(习题卷7)
说明:答案和解析在试卷最后
第1部分:单项选择题,共116题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]SVM中通过()去寻的最优的超平面
A)支持向量机
B)线性回归
C)正则化
D)逻辑回归
2.[单选题]通常的语义角标注分为()个步骤:①识别、②分类、③剪枝、④后处理
A)①②③④
B)①③④
C)①②④
D)①④
3.[单选题]已知一个单层神经网络的二进制输入x1,x2∈{0,1}和输出 hΘ(x),当权重不同时,可以表示不同的逻辑运算,则以下表达式为逻辑与的是
A)h(x)=g(-5+15x1+15x2)
B)h(x)=g(-10+15x1+15x2)
C)h(x)=g(-30+20x1)
D)h(x)=g(-20+10x1+15x2)
4.[单选题]下列对神经网络中的relu激活函数,正确的说法是哪个?
A)引用了无效的单元格地址
B)过滤无效神经元
C)不是激发函数
D)将正数保留,将负数置0
5.[单选题]以下哪个与LSTM无关
A)遗忘门
B)输入门
C)输出门
D)更新门
6.[单选题]关于对于数据切分的问题,以下说法正确的是?
A)可以不设置训练集
B)可以不设置测试集
C)可以不设置验证集
D)不确定
B)基于词性的n-gram模型
C)基于词自动聚类的n-gram模型
D)以上三者
8.[单选题]Adam算法的核心是
A)强化了RMSprop算法
B)强化了动量梯度算法
C)同时使用Momentum和RMSprop算法
D)没有核心
9.[单选题]如果文法中的每一条产生式A→β的形式,其中A是一个非终结符,β是终结符和/或非终结符组合(例如,Y→y),那么这种文法就称为
A)0型文法
B)1型文法
C)2型文法
D)左线性文法
10.[单选题]预处理是必不可少的阶段,以下哪一项不是预处理技术?
A)词干提取和词形还原(Stemming and Lemmatization)
B)转换成小写(Converting to Lowercase)
C)情绪分析(Sentiment Analysis)
D)删除标点符号(Remove Punctuation)
11.[单选题]关于 “与 / 或 ”图表示知识的叙述,错误的有( )。
A)用“与/ 或”图表示知识方便使用程序设计语言表达,也便于计算机存储处理。
B)“与 / 或 ”图表示知识时一定同时有 “与结点 ”和 “或结点 ”。
C)“与 / 或 ”图能方便地表示陈述性知识和过程性知识。
D)能用 “与 / 或 ”图表示的知识不适宜用其他方法表示。
12.[单选题]以下几个关于Bagging的说法正确的是
A)对于偏差来说,Bagging通常选用偏差高的弱学习器
B)对于方差来说,Bagging可以降低方差
C)不确定
D)对于方差来说,Bagging可以提高方差
13.[单选题]()衡量给定的特征区分训练样本的能力
A)信息增益
B)语义分析
C)词法分析
D)语义抽取
14.[单选题]下面哪个与过拟合问题有关?
A)Dorpout
B)正则化
C)批规范化
D)以上技术均可以
15.[单选题]Histogram算法的思想是什么
A)寻最优分割面
D)不确定
16.[单选题]造成RNN梯度消失与下面哪个因素有关
A)激活函数求导
B)学习率
C)批处理数
D)网络层数
17.[单选题]特征进行归一化可以做到什么效果
A)消除数据特征之间的量纲影响
B)可以为数据增加适量的沉余
C)可以为代价函数加入正则项
D)不确定
18.[单选题]当不知道数据所带标签时可以使用哪种技术促使带同类变迁的数据与带其他标签的数据分离
A)分类
B)聚类
C)关联分析
正则化的回归分析可以避免D)隐马尔可夫链
19.[单选题]()是词汇获取的基础工作。
A)字频统计
B)字符编码
C)中文文字编码
D)西文字符编码
20.[单选题]决策树种划分数据的大原则是什么?
A)将无序数据变得更有序
B)将有序序数据变得无序
C)将无序数据变得无序
D)不确定
21.[单选题]N 元语法模型存在的最大缺陷是什么
A)数据传输量大,概率总和大于1
B)计算需求过高
C)参数空间过大,不可能实用化,数据稀疏严重
D)公式太复杂
22.[单选题]模型训练阶段,使用优化算法是为了在迭代的过程中实现怎么的效果
A)增大损失值
B)使学习率衰减
C)降低损失值
D)提升正则项范围
23.[单选题]浅层句法分析方法大体分为两类,其一基于统计的方法,统计方法中不属于具有代表性的方法是
A)基于HMM模型的方法
B)Φ2统计方法
C)互信息方法
D)统计分组方法
A)-1
B)0
C)1
D)x
25.[单选题]以下四个选项当中哪个方法被用于句子中词意模糊
A)对比模糊词汇与近义词在词典上的定义
B)同指(Co-reference) 解决方案,使用先前句子中包含的正确词意解决模糊单词的含义。
C)使用句子的依存解析理解含义
D)不确定
26.[单选题]下边关于CBOW说法正确的是
A)使用中心词预测上下文单词
B)与上下问的词序是相关的
C)和Skip-Gram是相同的
D)使用上下文单词预测中心词
27.[单选题]下列哪一项在神经网络中引入了非线性?
A)随机梯度下降
B)修正线性单元(ReLU)
C)卷积函数
D)以上都不正确
28.[单选题]以下哪个不是文本向量化的常用方法?
A)EM
B)CBOW
C)BDOW
D)DM
29.[单选题]在进行神经网络建模时,需要对目标数据进行怎样的操作
A)度量化
B)抽象化
C)具体化
D)理想化
30.[单选题]决策树中为什么要进行剪枝的操作
A)决策树生成算法递归的产生决策树,进行剪枝毫无意义
B)决策树生成算法递归的产生决策树,直到不能继续下去为止,这样产生的树往往对训练数据的分类很准确,但对未知测试数据的分类缺没有那么精确,即会出现过拟合现象,因此需要剪枝
C)决策树的训练过程当中可能会发生欠拟合,因此需要做剪枝
D)决策树的需要做节点的选择,因此需要做剪枝
31.[单选题]XGBoost虽然是在GBDT的基础上进行的改进但是它可以吧哪些方面发挥到极致
A)速度
B)代价
C)准确率
D)以上都是
32.[单选题]使用jieba库提供的( )方法,可以对文本进行分词操作。
C)Break
D)apart
33.[单选题]在神经网络中常使用到的非线性激活函数sigmoid,该函数的模型曲线是()?
A)X型
B)S型
C)L型
D)U型
34.[单选题]如何理解NNLM这个模型,它是一个什么样的模型
A)基于统计的语言模型
B)基于神经网络的语言模型
C)预训练模型
D)编解码模型
35.[单选题]处理文本词的时候,经常会遇到衡量词不全面,那么TF-IDF可以怎么解决
A)使用one-hot
B)使用bag of word
C)使用Word2Vec
D)不确定
36.[单选题]常用的马尔科夫假设中,当前词(n)出现的概率依赖于哪些词
A)n-3
B)n-2
C)n
D)n-1
37.[单选题]GAN网络的全称是什么
A)生成对抗网络
B)卷积神经网络
C)循环神经网络
D)全连接网络
38.[单选题]RNN可以将()时间步带入到神经元计算
A)先前
B)之后
C)丢失
D)LSTM
39.[单选题]Tanh激活函数求导之后,它的取值区间是多少
A)(0,1)
B)(-1,1)
C)(0,0.5)
D)0或1
40.[单选题]在下列神经网络的参数中,其中的参数的调试不包括哪个?
A)学习率α
B)动量梯度下降的参数β
C)mini-Batch的大小
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论