人工智能自然语言技术练习(习题卷9)
第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]如何理解NNLM这个模型,它是一个什么样的模型
A)基于统计的语言模型
B)基于神经网络的语言模型
C)预训练模型
D)编解码模型
答案:C
解析:
2.[单选题]文本文件中存储的其实并不是我们在编辑器里看到的一个个的字符,而是字符的()。
A)内码
B)外码
C)反码
D)补码
答案:A
解析:
3.[单选题]数据可视化data visualization,导入_哪个包?
A)A: sklearn.linear_model
B)B: del_selection
C)C: matplotlib.pylab
D)D: ics
答案:D
解析:
4.[单选题]dropout作为常用的函数,它能起到什么作用
A)没有激活函数功能
B)一种正则化方式
C)一种图像特征处理算法
D)一种语音处理算法
答案:B
解析:
5.[单选题]以下四个描述中,哪个选项正确的描述了XGBoost的基本核心思想
A)训练出来一个一次函数图像去描述数据
B)训练出来一个二次函数图像去描述数据
C)不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,其实是学习一个新函数f(x),去拟合上次预测的残差。
D)不确定
答案:C
解析:
C)LSTM 神经网络模型使用门结构实现了对序列数据中的遗忘与记忆
D)使用大量的文本序列数据对 LSTM 模型训练后,可以捕捉到文本间的依赖关系,训练好的模型就可以根据指定的文本生成后序的内容
答案:B
解析:
7.[单选题]relu函数的作用是可以将小于()的数输出为0
A)-1
B)0
C)1
D)x
答案:B
解析:
8.[单选题]以下不是语料库的三点基本认识的是
A)语料库中存放的是在语言的实际使用中真实出现出的语言材料。
B)语料库是以电子计算机为载体承载语言知识的基本资源,并不等于语言知识。
C)真实语料需要经过加工(分析和处理),才能成为有用的资源。
D)语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。
答案:D
解析:
9.[单选题]以下是softmax函数的是()
A)概率
B)归一化
C)损失函数
D)空间
答案:B
解析:
10.[单选题]()函数用于搜索搭配词语。
A)concordance
B)common_contexts
C)collocations
D)Sorted
答案:C
解析:
11.[单选题]如何去理解牛顿法?
A)实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未必是最快的
B)是一种在实数域和复数域上近似求解方程的方法
C)改善每次需要求解复杂的Hessian矩阵的逆矩阵的缺陷,它使用正定矩阵来近似Hessian矩阵的逆,从而简化了运算的复杂度
D)不确定
答案:B
解析:
答案:A
解析:
13.[单选题]马尔可夫模型不可应用于
A)词性标注
B)求解方程
C)中文分词
D)天气预报
答案:B
解析:
14.[单选题]tensorflow里的函数con1d是进行什么操作
A)二维卷积
B)一维卷积
C)GRU操作
D)lstm操作
答案:B
解析:
15.[单选题]自然语言处理的英文缩写是( )。
A)NLP
B)AI
C)DFS
D)TCP/IP
答案:A
解析:
16.[单选题]以下哪个选项让GBDT更好更快的用到工业当中
A)LightGBM
B)XGBoost
C)随机森林
D)岭回归
答案:A
解析:
17.[单选题]特征工程本质上是一个什么样的过程
A)特征工程是一个表示和展现数 据的过程
B)特征工程是一个文本分类的过程
C)特征工程是一个回归过程
D)特征工程是一个聚类过程
答案:A
解析:
18.[单选题]下列几个选项中对于卡方检验,描述正确的是
A)卡方检验主要用于类别数据
B)卡方检验不可以用于定量数据
19.[单选题]Adam动态优化器,下列关于它的说法正确的是?
A)强化了RMSprop算法
B)强化了动量梯度算法
C)同时使用Momentum和RMSprop算法
正则化英文D)没有核心
答案:C
解析:
20.[单选题]NLP研究的内容中,应用研究不包括( )。
A)键盘输入
B)语音识别
C)机器翻译
D)图像合成
答案:D
解析:
21.[单选题]Batch归一化操作用于网络的什么层?
A)输出层
B)输入层
C)无法在隐藏层起作用
D)用于输入层,甚至深度隐藏层的归一化过程
答案:D
解析:
22.[单选题]适合高阶 n-gram 模型的平滑方法为( )。
A)加 1 平滑
B)古德-图灵平滑
C)线性插值平滑
D)均值平滑
答案:D
解析:
23.[单选题]google开发的深度学习框架叫什么
A)pytorch
B)tensorflow
C)caffe
D)mxnet
答案:B
解析:
24.[单选题]在应用高斯核SVM之前,通常都会对数据做正态化(normalization),下面对特征正态化的
说法哪个是正确的?1.对特征做正态化处理后,新的特征将主导输出结果 2.正态化不适用于类别特征 3.对于高斯核SVM,正态化总是有用
A)1
B)1和2
C)1和3
25.[单选题]人类语言中的许多特点使得文本自动处理相当困难。原始文本拿来之后并不能直接进入标注流程,在这之前,需要做一些预处理工作。预处理工作主要包括以下内容
A)汉语和英语方面
B)法语方面
C)日语方面
D)符号方面
答案:A
解析:
26.[单选题]一家全国范围发行的杂志出版商聘用你分析他们的社交媒体数据集,并希望知道哪些新出版物是最有价值的。你会使用以下哪一项分析工具?( )
A)文本挖掘
B)情感分析
C)网络挖掘软件
D)关联分析的数据
答案:B
解析:
27.[单选题]以下哪个超参数的调试,对神经网络最重要?
A)mini-Batch的大小
B)动量梯度下降的参数β
C)学习率α
D)隐藏层数目
答案:C
解析:
28.[单选题]什么是拟合,如何去理解拟合
A)指曲线能不能去很好的描述现有的数据
B)一条曲线过分的去描述了现有的数据
C)指的是在训练集上表现良好,测试集上表现很差
D)指的是在训练测试集上表现都不好
答案:A
解析:
29.[单选题]网格搜索虽然有很多的优点,但是也有个关键的弊端是?
A)十分耗时
B)十分快速
C)计算资源少
D)效率快
答案:A
解析:
30.[单选题]马尔科夫假设当前词(n)出现的概率依赖于哪些词
A)n-3
B)n-2
C)n
D)n-1

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。