人工智能自然语言技术练习(习题卷6)说明:答案和解析在试卷最后
第1部分:单项选择题,共116题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]知识图谱中的边称为?
A)连接边
B)关系
C)属性
D)特征
2.[单选题]One-Hot是一种什么样的表示方式
A)分布式表示
B)基于矩阵的表示
C)基于神经网络的表示
D)离散型表示
3.[单选题]在 NLP 虚拟环境中安装需要的程序包,并自动安装这个包的依赖项需要用()。
A)pip
B)conda
C)conda
D)pip
4.[单选题]逻辑回归的损失函数是什么
A)信息熵
B)信息增益
C)对数损失
D)均方误差
5.[单选题]以下哪些方法可以优化K-Means?
A)较少K的个数
B)增加K的个数
C)增加样本特征
D)以上都可以
6.[单选题]假如说特征过少,模型过于简单,可能会发生什么情况
A)正常拟合
B)过拟合
C)欠拟合
D)不确定
7.[单选题]以下哪个激活函数用来处理二分类任务
A)tanh
B)Leaky Relu
C)sigmoid
D)relu
8.[单选题]关于采用卷积神经网络进行图像分类和文本分类的比较,下列说法错误的是( )
A)卷积神经网络只能用于图像分类,不能用于文本分类
B)使用卷积神经网络进行句子分类,一般将句子中每个词表示为固定长度的向量,这样句子就可以表示为矩阵,从而使得在结构上与图像类似,并在后续进行卷积等处
C)图像处理应用中,卷积核处理的局部区域为图像的一小块区域,而在文本分类时卷积核处理的局部区域通常为相邻的上下几行(几个词)。因此卷积核的宽度和输入矩阵的宽度相等
D)使用卷积神经网络进行句子分类或者文档分类,卷积提取的特征与采用n-gram 模式提取的特征类似
9.[单选题]X.dat中字段含义错误的是
A)ss_type:词性标注
B)w_cont:词语个数
C)word:词语
D)lex_id:2位16进制数表示的一个词语编号
10.[单选题]在图像的人脸识别中,深度学习有哪些应用,使用到的是哪个网络结构
A)LeNET5
B)(CNN:AlexNet)
C)VGG
D)ResNet
11.[单选题]在NLP中, 不可以做以下选项中的那个任务
A)聊天机器人
B)车牌检测
C)推荐系统
D)文本纠错
12.[单选题]下列不属于感知器学习算法的基本思想的是()
A)如果第i个神经元的输出是正确的,即有yi=ti,那么与第i个神经元联接的权值 wij和 偏差值bi保持不变。
B)如果第i个神经元的输出是0,但期望输出为1,即有yi =0,而ti = l,此时权值修正算法为:新的权值wij等于旧的权值 wij加上xj;类似的,新的偏差bi 为旧偏差bi加上它的输入1。
C)如果第i个神经元的输出为1,但期望输出为0,即有yi=1,而ti =0,此时权值修正算法为:新的权值wij等于旧的权值wij减去xj;类似的,新的偏差bi为旧偏差bi减去1。
D)寻样本空间中具有最大分类间隔的超平面(w·x)+b=0
13.[单选题]以下哪种方法中,模型参数不是根据在某个语料库上通过统计计数得到。
A)Witten-Bell算法
B)Good-Turing估计
C)扣留估计
D)线性折扣算法
14.[单选题]下面那个不属于判别式式模型
A)MEMM
B)CRF
C)HMM
D)SVM
15.[单选题]下列几个选项中关于GBDT,说法错误的是
A)GBDT是深度学习算法
B)传统的GBDT采用CART作为基分类器
C)传统的GBDT在每轮迭代时使用全部的数据
D)没有对确实值进行处理
16.[单选题]在机器学习算法中,正则化是为了
A)防止欠拟合
B)防止过拟合
C)防止拟合
D)其它都不对
17.[单选题]LDA模型可以做什么事情
A)将文档集 中每篇文档的主题以概率分布的形式给出,从而通过分析一些文档抽取出它们的主题(分布)出来后,便可以根据主题(分布)进行主题聚类或文本分类
B)可以出来最优的分类超平面
C)可以到因变量和自变量之间的一次关系
D)不确定
18.[单选题]EM算法在高斯混合模型中的应用中的E步骤主要做了什么事情
A)确定Q函数
B)明确隐变量,写出完全数据的对数似然函数
C)求Q函数对theta的极大值,即求新一轮迭代的模型参数
D)不确定
19.[单选题]Adam动态优化器,下列关于它的说法正确的是?
A)强化了RMSprop算法
B)强化了动量梯度算法
C)同时使用Momentum和RMSprop算法
D)没有核心
20.[单选题]对于选择超参数,选择了不同的取值,不可以_____?
A)选择对训练集目标而言的最优解
B)对于开发集而言的最优解
C)超参搜索过程中最想优化的东西
D)简化参数调试
21.[单选题]既不存在严重的数据稀疏问题,又不存在过于泛化问题的语言模型是
A)基于词的n-gram模型
B)基于词性的n-gram模型
C)基于词自动聚类的n-gram模型
D)其余三项皆可
22.[单选题]格语法提供了一种用于分析特定句子()的方法
A)主旨
B)含义
C)成分
D)类别
23.[单选题]transformer和seq2seq的差异在哪
A)都属于编解码模型
B)都可以做机器翻译
C)transformer使用了全Attention的形式
D)都可以做文本摘要
24.[单选题]以下哪些算法是分类算法
A)DBSCAN
B)C4.5
C)K-Mean
D)EM
25.[单选题]动量梯度法,是通过学习率和什么控制的,下列说法正确的是?
A)指数加权平均数
B)局部平均值
C)全局平局值
D)方差
26.[单选题]LSTM中,哪个门的作用是“确定输出,把前面的信息保存到隐层中去”?
A)输入门
B)遗忘门
C)输出门
D)更新门
27.[单选题]关于曼哈顿距离,以下哪项是正确的?
A)可用于连续变量
B)可用于分类变量
C)可用于分类变量和连续变量
D)无
28.[单选题]正则表达式的转义符是( )
A)\\
B)\
C);
D)$$
29.[单选题]梯度下降是一种()的算法,直到达到代价最小值
A)迭代优化
B)一次求解
C)求解函数最大值
D)迭代求解代价函数最小值
30.[单选题]下列哪个说法是正确的?
A)神经网络的更深层通常比前面层计算更复杂的输入特征。
B)神经网络的前面层通常比更深层计算更复杂的输入特性。
C)神经网络由输入和隐藏层构成
D)神经网络的隐藏层只能是一层
31.[单选题]如果对图像进行池化,ksize=[1,4,4,1]那么图像会变成多大
A)缩小到1/2
B)扩大四倍
二项式分布的正则化C)扩大两倍
D)缩小到1/16
32.[单选题]在对数据或者任务进行建模时,需要对目标进行怎样的操作
A)度量化
B)抽象化
C)具体化
D)理想化
33.[单选题]面向对象的特质有:
A)A: 封装
B)B: 继承
C)C: 多态
D)D: 消息
34.[单选题]下面哪个队tf.reverse的解释是正确的
A)沿着某一维度连结tensor
B)沿着某一维度将tensor分离为num_split tensors
C)对tensor进行切片操作
D)沿着某维度进行序列反转
35.[单选题]无指导学习是指()
A)没有语料库直接学习
B)使用未标注的语料库直接学习
C)没有专业技能专家指导直接学习
D)没有学习理论直接学习
36.[单选题]实际应用当中应该如何选激活函数
A)根据数据和需求凭经验选择
B)可以随意选择使用
C)使用到激活函数的地方都选用Relu
D)不确定
37.[单选题]以下四个说法中,哪个是GBDT的优点
A)在分布稠密的数据集上,泛化能力和表达能力都很好;
B)GBDT在高维稀疏的数据集上表现不佳;
C)训练过程需要串行训练,只能在决策树内部采用一些局部并行的手段提高训练速度。
D)不确定
38.[单选题]以下几个机器学习算法中,哪个算法是比较常用的无监督学习算法
A)聚类
B)K-近邻算法
C)回归算法
D)决策树
39.[单选题]TF-IDF中用权重衡量一个词肯定不够全面,怎么办
A)使用one-hot
B)使用bag of word
C)使用Word2Vec
D)不确定
40.[单选题]神经网络中经常使用到激活函数,下面关于激活函数的说法是正确的?
A)神经网络中最好的激活函数是sigmoid
B)激活函数有正则化作用
C)dropout是CNN中的激活函数

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。