人工智能自然语言技术练习(习题卷18)说明:答案和解析在试卷最后
第1部分:单项选择题,共43题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]以下哪个不属于长短期记忆网络
A)输入门
B)输出门
C)更新门
D)遗忘门
2.[单选题]下列模型中使用Transformer的是__?
A)word2vec
B)BERT
C)ELMO
D)GPT
3.[单选题]在神经网络中我们经常会使用到正则化,那么正则化有什么作用
A)A防止过拟合
B)B边缘检测
C)C提取特征
D)D简化数据
4.[单选题]谷歌开源出的BERT模型也得到了很广泛的应用,对于BERT有几个训练任务
A)1
B)2
C)3
D)4
5.[单选题]以下哪种情况下我们可以选择直接删除某个特征
A)数据情况良好
B)数据无过多缺失值
C)特征少
D)特征确实比较多
6.[单选题]CNN中设置多个卷积核是为了什么目的
A)同时提取多个图像的特征
B)提取某些图像多个特征
C)图像有多个通道
D)与多特征无关
7.[单选题]在对文本进行分词时,哪些词可以去掉( )
A)中文:的,了,是
B)中文:文本,可视化,大数据.
C)英文: text,analytics,
D)英文: the,
A, bad,
8.[单选题]设输入句子“我爱人工智能”,经过词性标注等得到“我/PN爱/VV人工智能/NR",其中,PN、VV和NR的含义分别是代词、动词、专有名词。以下( )是命名实体。
A)“我”
B)“爱”
C)“人工智能”
D)“我”、“人工智能”
9.[单选题]()根据文本的不同特征划分为不同的类
A)文本概括
B)文本分类
C)文本聚类
D)都可以
10.[单选题]以下四个选项当中,哪个不是不是python的“魔法”方法是
A)__enter__
B)__len__
C)__iter__
D)__list__
11.[单选题]关于logit 回归和SVM 不正确的是
A)Logit回归本质上是一种根据样本对权值进行极大似然估计的方法,而后验概率正比于先验概率和似然函数的乘积。logit仅仅是最大化似然函数,并没有最大化后验概率,更谈不上最小化后验概率。
B)Logit回归的输出就是样本属于正类别的几率,可以计算出概率
C)SVM的目标是到使得训练数据尽可能分开且分类间隔最大的超平面,应该属于结构风险最小化。
D)SVM可以通过正则化系数控制模型的复杂度,避免过拟合。
12.[单选题]下列特征选择的方法,不属于的是哪个?
A)嵌入
B)过滤
C)包装
D)抽样
13.[单选题]One-Hot是一种什么样的表示方式
A)分布式表示
B)基于矩阵的表示
C)基于神经网络的表示
D)离散型表示
14.[单选题]关于结构化数据,以下是哪个?
A)数据库中的数据
B)HTML文档
C)文本
D)图片
15.[单选题]语料库研究属于( )
A)实验研究
B)非实验研究
C)田野研究
D)化学研究
16.[单选题]预训练模型的思路说法正确的是__?
A)特征提取的地层差异性比较大
B)所有的任务都是一样的
C)在做特征提取的时候,底层的特征的提取往往是极其相似的
D)以上都正确
17.[单选题]在实际的应用中,通常的归一化和以下哪个选项中的描述一并使用
A)训练集的mini-batch
B)测试集的mini-batch
C)整个训练集
D)整个测试集
18.[单选题]tf.Variable(tf.random_normal([20,10,3,16])),在该操作中,关于定义的卷积核的高度,下列选项中描述正确的是?
A)10
B)20
C)16
D)3
19.[单选题]LSTM的那个门是选择性的丢弃信息?
A)输入门
B)遗忘门
C)输出门
D)更新门
20.[单选题]下列哪一种技术能被用于英语中的关键词归一化,即把关键词转化为其基本形式?
A)词形还原
B)探测法
C)余弦相似度
D)N元语法模型
21.[单选题]pytorch框架是哪个公司开发的
A)MIT
B)facebook
C)google
D)apple
22.[单选题]梯度爆炸如何解决??
A)对于RNN,可以通过梯度截断,避免梯度消失
B)可以通过添加正则项,避免梯度爆炸
C)使用LSTM等自循环和门控制机制,避免梯度爆炸
D)优化激活函数,譬如将sigmold改为relu,避免梯度消失
23.[单选题]Tanh的导数范围是多少?
A)(0,1]
B)(0,0.1]
C)(0,-1]
D)(0,10]
24.[单选题]以下选项中关于交叉熵使用的激活函数描述正确的是?
A)sigmoid
B)relu
C)tanh
D)cosh
25.[单选题]线性整流函数(Rectified Linear Unit, ReLU),又称修正线性单元
A)Sigmoid函数
B)tanh函数
C)ReLU
D)leaky ReLU
26.[单选题]bert这个预训练语言模型当中存在什么缺点
A)性能不好有很大提升空间
B)使用了双向的Transformer效果不好
C)没有LSTM特征提取的好
D)使用了单向的Transformer
27.[单选题]下列几个选项中关于GBDT,说法错误的是
A)GBDT是深度学习算法
B)传统的GBDT采用CART作为基分类器
C)传统的GBDT在每轮迭代时使用全部的数据
D)没有对确实值进行处理
28.[单选题]关于有限状态层叠法,下列说法正确的是
A)有限状态层叠法
B)基于转换的错误驱动的学习方法
C)基于实例的规则学习方法
D)以上三项都对
29.[单选题]概率图中的无向边表示的是什么
正则化是结构风险最小化策略的实现A)表示单向的依赖
B)表述互相依赖关系
C)表示无依赖关系
D)不确定
30.[单选题]分类模型包括决策树、贝叶斯和()分类方法
A)线性回归
B)岭回归
C)K-means
D)SVM
31.[单选题]深度学习模型在训练的时候需要达到哪些基本要求
A)对计算机硬件需求小
B)适合小数据训练
C)需要将问题逐层分解
D)对硬件要求高,并且需要大量数据集
32.[单选题]GAN网络指的是哪个网路
A)生成对抗网络
B)卷积神经网络
C)循环神经网络
D)全连接网络
33.[单选题]下列说法不正确的是()
A)最大匹配法的优点是程序简单易行,开发周期短
B)最少分词法只需要很少的语言资源,不需要任何词法,句法,语意资源
C)最大概率发可以发现所有的切分歧义,很大程度上取决于统计语言模型的精度和决策算法,不需要标注语料
D)最大概率法和词性标注相结合的分词方法需要同时利用词典和语料库
34.[单选题]下列几个预训练模型中,哪个使用了LSTM
A)BERT
B)GPT
C)GPT-2
D)ELMO
35.[单选题]TextRank是由以下哪个算法改进来的
A)TextRnn
B)TextCNN
C)Fasttext
D)PageRank
36.[单选题]下列不是机器学习中典型的分类是()
A)贝叶斯分类器
B)支持向量机
C)最大熵模型
D)分类机器
37.[单选题]实际工程问题中,需要根据业务和需求,构建相应的()?
A)架构
B)数学模型
C)流程图
D)数据集
38.[单选题]属于特征提取方法的是( )。
A)BOW模型
B)数据标准化
C)训练模型
D)模型融合
39.[单选题]SVM算法的性能取决于:
A)核函数的选择
B)核函数的参数
C)软间隔参数C
D)以上所有
40.[单选题]字表中必须有单字和()两个域。
A)单词
B)数组
C)词频
D)字频

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。