人工智能自然语言技术练习(习题卷12)
说明:答案和解析在试卷最后
第1部分:单项选择题,共116题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]TF-IDF和词的那些因素相关
A)不确定
B)词意
C)词序
D)词权重
2.[单选题]自动驾驶是基于哪种技术提出的
A)BP算法
B)神经网络
C)前向算法
D)NFC
3.[单选题]NLP中做多分类任务可以使用__激活函数?
A)softmax
B)logic
C)K-Means
D)SVD
4.[单选题]EM最大期望算法的第一步是做什么
A)求代价
B)最大化
C)计算期望
D)不确定
5.[单选题]下列叙述错误的是
A)1993年提出统计机器翻译
B)1994年Candide翻译系统
C)1984年提出机器翻译方法
D)1970年隐马尔可夫模型
6.[单选题]先把连续的浮点特征值离散化成k个整数,构造一个宽度为k的直方图。是以下哪个算法的优化
A)直方图算法算法
B)带深度限制的Leaf-wise的叶子生长策略
C)不确定
D)直接支持类别特征
7.[单选题]为模型加上正则项, 可以很好的防止什么?
A)过拟合
B)欠拟合
C)完美拟合
D)不确定
8.[单选题]数据可视化data visualization,导入_哪个包?
A)A: sklearn.linear_model
B)B: del_selection
C)C: matplotlib.pylab
D)D: ics
9.[单选题]隐马尔可夫模型的训练算法是
A)前向后向算法
B)Viterbi算法
C)Baum-Welch算法
D)DTW算法
10.[单选题]马尔可夫模型分析的数据来源有
A)RCT数据
B)RWE数据
C)文献数据
D)其余选项皆对
11.[单选题]哪个激活函数修正了Relu激活函数的缺点
A)tanh
B)leaky-Relu
C)softmax
D)sigmoid
12.[单选题]在NLP当中,像Bi-Gram和TriGram这样的模型都属于什么模型
A)N-Gram
B)Seq2seq
C)Transformer
D)Bert
13.[单选题]互动问答平台是一类应用集合自动切分词,( ),自动分类等技术的网站。
A)智能检索
B)智能交流
C)互动交流
D)提供帮助
14.[单选题]下列哪个激活函数,处理梯度消失问题效果最好?
A)sigmoid
B)Leaky relu
C)relu
D)tanh
15.[单选题]我们在代价函数加入了L1,L2正则化,可以解决下面什么问题
A)过拟合
B)欠拟合
C)完美拟合
D)不确定
16.[单选题]以下四个人物中,哪个被誉为人工智能之父
A)图灵
B)冯-诺依曼
C)维纳
D)牛顿
17.[单选题]多分类问题的最后一层一般用什么激活函数
A)sigmoid
B)tanh
C)softmax
D)relu
18.[单选题]以下四个任务当中LDA可以很好的完成哪个任务?
A)对图像进行文本
B)对图像进行特征提取
C)对文档的主题进行分类或聚类
D)以上都正确
19.[单选题]BERT目前的到了很广泛的应用,那么BERT是哪个公司推出的
A)百度
B)华为
C)FaceBok
D)谷歌
20.[单选题]为什么我们要沿着梯度的反方向进行最小化代价
A)梯度的方向是函数上升最慢的方向,所以他的反方向就是下降最快的方向
B)梯度的方向是函数上升最快的方向,所以他的反方向就是下降最快的方向
C)这么做并无实际意义
D)不确定
21.[单选题]大数据中,哪种梯度下降速度最快
A)A: 随机梯度下降
B)B: 小批量梯度下降
C)C: 对代价函数求导
D)D: 批量梯度下降
22.[单选题]智能问答系统主要依靠的关键基础和技术不包括以下那个方面( )
A)大量高质量的数据和知识,主要是知识图谱技术
B)强大的自然语言处理技术
C)需要大量的标准训练语料,这主要是深度学习方法所需要
D)专业的智能算法
23.[单选题]造成自然语言处理困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种合样的()
A)一致性或统一性
B)复杂性或重复性
C)歧义性或多义性
D)一致性或多义性
24.[单选题]下列选项中不属于智能问答分类的是( )。
A)开放领域自动问答
B)非特定领域自动问答
C)特定领域自动问答
D)常用问题集自动问答
25.[单选题]下列关于 LSTM 说法不正确的是( )。
A)通过改进使 RNN 具备避免梯度消失的特性
B)LSTM 只能够刻画出输入数据中的短距离的相关信息,不能够捕捉到具有较长时间间隔的依赖关系
C)LSTM 神经网络模型使用门结构实现了对序列数据中的遗忘与记忆
D)使用大量的文本序列数据对 LSTM 模型训练后,可以捕捉到文本间的依赖关系,训练好的模型就可以根据指定的文本生成后序的内容
26.[单选题]马尔科夫是个几元组模型
A)1
B)2
C)3
D)4
27.[单选题]若参数C(cost parameter)被设为无穷,下面哪种说法是正确的?
A)只要最佳分类超平面存在,它就能将所有数据全部正确分类
B)软间隔SVM分类器将正确分类数据
C)二者都不对
D)不确定
28.[单选题]并行地训练一系列各自独立的不同类模型,然后通过训练一个元模型(meta-model)来将各个模型输出结果进行结合,是什么思想
A)Bagging
B)Boosting
C)Stacking
D)以上都正确
29.[单选题]以下自然语言文本表示中基于语义的的深度学习是哪个?
A)LDA
B)LSI
C)PLSI
D)word embedding
30.[单选题]基于()的n-gram模型参数空间最小,可以构造高元模型,用于描述长距离的语言约束关系
A)词性
B)词
C)词自动聚类
D)其余三项都可以
31.[单选题]怎样解决梯度爆炸
正则化是最小化策略的实现
A)对于RNN,可以通过梯度截断,避免梯度消失
B)可以通过添加正则项,避免梯度爆炸
C)使用LSTM等自循环和门控制机制,避免梯度爆炸
D)优化激活函数,譬如将sigmold改为relu,避免梯度消失
32.[单选题]Dropout函数的作用是什么
A)随机失活单元,防止过拟合
B)代价函数
C)动态优化器
D)交叉熵函数
33.[单选题]下面哪个选项说的不是Batch归一化的作用
A)减少了隐藏值分布变化的数量
B)减少了输入值改变的问题
C)有轻微的正则化效果
D)增加了输入值改变的问题
34.[单选题]深度学习常用框架TensorFlow,在该框架下如何正确调用dropout函数
dropout
ain.dropout
C)tf.dropout
D)tf.dropOut
35.[单选题]词法分析的任务就是()
A)识别单词
B)分析句子的含义
C)识别句子
D)生成目标代码
36.[单选题]下列不属于AdaBoost算法的特点的是()
A)每次迭代改变的是样本的分布(Reweight),而不是重复采样。
B)样本分布的改变取决于样本是否被正确分类:总是分类正确的样本权值低,总是分类错误的样本权值高(通常是边界附近的样本)。
C)最终的结果是弱分类器的加权组合,权值表示该 弱分类器的性能。
D)每次迭代重复采样
37.[单选题]以下哪个算法不能直接用于文本分类?
A)Kmeans
B)决策树
C)支持向量机
D)KNN
38.[单选题]“re.sub(自然语言处理”,"NLP", text1)”表示的含义为( )。
A)将test1中的“自然语言处理”替换为“NLP”
B)将 test1 中的“NLP”替换为“自然语言处理”
C)出 test1 中的“自然语言处理”
D)出 test1 中的“NLP”
39.[单选题]为什么要使用激活函数,有什么意义和用途
A)进行非线性变换,增强表达能力
B)进行线性变换,增强表达能力
C)进行线性变换,减少表达能力
D)进行非线性变换,减少表达能力
40.[单选题]SVM中的代价参数C表示什么?
A)交叉验证的次数
B)用到的核函数
C)在分类准确性和模型复杂度之间的权衡
D)以上都不对

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。