人工智能自然语言技术练习(习题卷19)第1部分:单项选择题,共43题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]关于k-NN中的k,根据偏差,以下哪一项是正确的
A)当你增加k时,偏差会增加
B)当你减少k时,偏差会增加
C)不能判断
D)以上都不对
答案:A
解析:
2.[单选题]GBDT和随机森林都属于集成学习,因此他们有相似的地方,下列描述正确的是
A)组成随机森林的树可以并行生成,而GBDT是串行生成
B)随机森林的结果是多数表决表决的,而GBDT则是多棵树累加之和
C)都是由多棵树组成,最终的结果都是由多棵树一起决定。
D)随机森林对异常值不敏感,而GBDT对异常值比较敏感
答案:C
解析:
3.[单选题]如果数据特征太多,需要对数据特征做降维操作,可以使用以下那种方式
A)PCA降维
B)K-Means
C)SVM
D)岭回归
答案:A
解析:
4.[单选题]汉语自动分词的准确率具体定义是()
A)P=(系统输出正确词个数/系统输出词个数)*100%
B)R=(系统输出正确词个数/标准答案中词的个数)*100%
C)F=((β2+1)*P*R)/(β2*P+R)=(B=1)(2*P*R)/(P+R)
D)P(A|B)=P(B|A)*P(A)/P(B)
答案:A
解析:
5.[单选题]XGBoost中用到了和哪个树相同的想法,去寻最优
A)随机森林
B)CART回归树
C)ID3
D)C4.5
答案:B
解析:
6.[单选题]层次softmax使用什么结构编码
A)拉格朗日乘子方式
B)霍夫曼树的结构
C)负例采样
D)不确定
答案:B
解析:
7.[单选题]属于一对多输出的序列网络有:
A)音乐生成
B)情感分类
C)机器翻译
D)DNA序列分析
答案:A
解析:
8.[单选题]以下四个选项中,哪个激活函数的的输出在0~1的范围之间
A)relu
B)tanh
C)Leaky Relu
D)sigmoid
答案:D
解析:
9.[单选题]美国Brown大学于20世纪60~70年代开发的通用语料库是
A)LOB语料库
B)PropBank
C)Brown语料库
D)Penn TreeBank
答案:C
解析:
10.[单选题]sigmoid函数的缺点:导数值范围为(0,0.25],反向传播时会导致“梯度消失”。而( )函数导数值范围更大,相对好一点。
A)cosh
B)sin
C)tanh
D)sigmoid
答案:C
解析:
11.[单选题]SVM的应用也很广泛,支持向量机(SVM)是一个什么算法
A)分类
B)回归
C)聚类
D)降维
答案:A
解析:
12.[单选题]传统的自然语言处理使用()来进行。
A)基于规则的方法
B)基于统计的方法
C)基于深度学习的方法
D)基于神经网络的方法
答案:A
解析:
13.[单选题]在NLP自然语言处理中, 不可以做以下选项中的那个任务
A)会话机器人
B)人脸检测
C)推荐系统
D)文本纠错
答案:B
解析:
14.[单选题]1-NN,2-NN,3-NN所花费的时间之间是什么关系。
A)1-NN > 2-NN > 3-NN
B)1-NN < 2-NN < 3-NN
C)1-NN ~ 2-NN ~ 3-NN
D)这些都不是
答案:C
解析:
15.[单选题]常用的关键词提取算法有TF-DF算法、( )和主题模型算法。
A)正向最大匹配算法
B)聚类算法
C)Textrank算法
D)PageRank算法
答案:C
解析:
16.[单选题]线性判别分析LDA的思想是什么
A)投影后类内方差最大
B)类间方差最小
C)投影后类内方差最小
D)不确定
答案:C
解析:
17.[单选题]tanh激活函数也有造成梯度消失等问题和sigmoid相比,()sigmoid
A)优于
B)劣与
C)等于
D)小于等于
答案:A
解析:
18.[单选题]以下哪个是两个数据点A(1,3)和B(2,3)之间的欧几里得距离?
A)1
B)2
C)4
D)8
答案:A
解析:
19.[单选题]语言是()
A)句子的集合
B)产生式的集合
C)符号串的集合
D)句型的集合
答案:A
解析:
20.[单选题]集成学习中的随机森林和GBDT有很多异同点,关于他们相同点说法正确的是
A)都是由多棵树组成,最终的结果都是由多棵树一起决定。
B)组成随机森林的树可以并行生成,而GBDT是串行生成
C)随机森林的结果是多数表决表决的,而GBDT则是多棵树累加之和
D)随机森林对异常值不敏感,而GBDT对异常值比较敏感
答案:A
解析:
21.[单选题]考虑文字背后语义关联的是
A)TF(词频)
B)TF-IDF
C)TF,TF-IDF
D)LDA主题模型
答案:D
解析:
22.[单选题]谓词相关特征之一()
A)动词原形
B)动词正则化英文
C)父类框架
D)谓语动词的词性
答案:D
解析:
23.[单选题]tf.subtract的返回值是什么类型的数据
A)范数
B)数组
C)矢量
D)Tensor
答案:D
解析:
24.[单选题]下列关于mini-batch原理的说法,描述正确的是?
A)选取数据中部分数据进行梯度下降
B)和批量梯度下降相同,只是将算法进行优化
C)将数据每次进行一小批次处理,通过迭代将数据全部处理
D)随机选取一些数据,计算梯度进行下降,每次将学习率降低一点
答案:C
解析:
25.[单选题]EM算法收敛的效果好坏最主要取决于什么
A)代价函数
B)模型函数
C)初始参数
D)以上都正确
答案:C
解析:
26.[单选题]人工智能中关于F-范数, 可标记为( )
A)||*||F
B)||·||F
C)||-||F
D)F||·||
答案:B
解析:
27.[单选题]二项分布属于()
A)连续型分布
B)离散型分布
C)正态分布
D)伽玛分布
答案:B
解析:
28.[单选题]当样本数量特别大时,哪种方式能更快速的收敛
A)A: 随机梯度下降
B)B: 小批量梯度下降
C)C: 对代价函数求导
D)D: 批量梯度下降
答案:B
解析:
29.[单选题]在pLSA的基础上加入了什么框架就可以变成LDA
A)XGBoost
B)LightGBM
C)贝叶斯
D)随机森林
答案:C
解析:
30.[单选题]下面哪一个说法更能解释随机梯度下降的原理
A)随机赋值,祈祷它们是正确的
B)搜索所有权重和偏差的组合,直到得到最佳值
C)赋予一个初始值,通过检查跟最佳值的差值,然后迭代更新权重
D)以上都不正确
答案:C
解析:
31.[单选题]什么样的神经网络模型被称为深度学习模型?
A)加入更多层,使神经网络的深度增加
B)有维度更高的数据
C)当这是一个图形识别的问题时
D)以上都不正确
答案:A
解析:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论