人工智能自然语言技术练习(习题卷3)第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]正则表达式的转义符是( )
A)\\
B)\
C);
D)$$
答案:A
解析:
2.[单选题]文本分类,情感识别等等属于以下哪个选项的子任务
正则化英语A)数据挖掘
B)不确定
C)图像识别
D)自然语言
答案:D
解析:
3.[单选题]通过getTreeDepth可以获取决策树中的什么
A)获取决策树叶子节点的个数
B)获取决策树的层数
C)绘制节点
D)标注有向边属性
答案:B
解析:
4.[单选题]格的中心是()
A)动词
B)名词
C)介词
D)副词
答案:A
解析:
5.[单选题]交叉检验的方法不包括以下几项
A)口头信息、书面信息与实际状况之间的验证
B)不同数据和信息之间的关系的合理性验证
C)不同时间的关联数据之间的合理性验证
D)同一个人对不同问题提供的信息的验证
答案:D
解析:
6.[单选题]下面关于数据粒度的描述不正确的是:
A)粒度是指数据仓库小数据单元的详细程度和级别;
B)数据越详细,粒度就越小,级别也就越高;
C)数据综合度越高,粒度也就越大,级别也就越高;
D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.
答案:C
解析:
7.[单选题]下面数据粒度的表述中有误的是:
A)粒度是指数据仓库小数据单元的详细程度和级别;
B)数据越详细,粒度就越小,级别也就越高;
C)数据综合度越高,粒度也就越大,级别也就越高;
D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.
答案:C
解析:
8.[单选题]以下哪个手段不属于CNN
A)局部连接
B)权值共享
C)池化操作
D)多层次结构
答案:D
解析:
9.[单选题]竖线“|”用于对两个正则表达式进行“或”操作。如果 A 和 B 是正则表达式,那么AIB 表示为( )。
A)匹配 A 和 B一起出现的字符
B)匹配 A 或 B 中出现的任何字符
C)匹配 A 中出现的任何字符
D)匹配 B 中出现的任何字符
答案:B
解析:
10.[单选题]下面那个不属于判别式式模型
A)MEMM
B)CRF
C)HMM
D)SVM
答案:C
解析:
11.[单选题]词库太大,使用词袋子模型做文本表示会出现什么问题
A)向量维度小
B)有很强的语义信息
C)维度爆炸
D)简单快速
答案:C
解析:
12.[单选题]哪个技术可以用来解决过拟合问题?
A)Dorpout
B)正则化
C)批规范化
D)以上技术均可以
答案:D
解析:
13.[单选题]正常的将数据集进行切分为三个集合,其中不包括下列哪个集合?
A)测试集
B)确认集
C)验证集
D)训练集
答案:B
解析:
14.[单选题]关于损失函数的意义说法正确的是
A)损失函数越小,模型鲁棒性越好
B)损失函数越小,模型鲁棒性越差
C)损失函数越大,模型鲁棒性越好
D)不确定
答案:A
解析:
15.[单选题]下列说法错误的是
A)浅层句法分析的方法基本上可以分成两类:基于统计的方法和基于规则的方法
B)浅层句法分析是与完全句法分析相似的
C)英语基本名词短语分为:由序数词、基数词和限定词修饰的名词短语;由形容词和名词修饰的名词短语
D)自顶向下的分析,优点是节约空间,它自始至终只需存储一棵树的结构
答案:B
解析:
16.[单选题]看以下这个单词,Random Forest指的是哪个算法
A)随机森林
B)决策树
C)聚类
D)逻辑回归
答案:A
解析:
17.[单选题]下列哪项不是词的多义现象类型
A)意义相关的多义
B)意义无关的多义
C)词性相同的多义
D)词性不同的多义
答案:C
解析:
18.[单选题]KNN算法的基本要素有()
A)K值的选择距离度量分类决策规则
B)利用自变量和因变量之间的一次函数关系
C)出最好的分类超平面
D)利用自变量和因变量之间的对数关系
答案:A
解析:
19.[单选题]关于HMM的解码问题,用什么算法处理
A)前向算法
B)后向算法
C)Viterbi算法
D)Baum-Welch算法
答案:C
解析:
20.[单选题]softmax又可以称为什么函数
A)概率
B)归一化
C)损失函数
D)空间
答案:B
解析:
21.[单选题]下列选项中,处理梯度消失问题效果最好的函数是哪个?
A)sigmoid
B)tanh
C)relu
D)Leaky relu
答案:D
解析:
22.[单选题]在几种语言模型中,()对近邻的语言约束关系的描述能力最强
A)基于词的n-gram模型
B)基于词性的n-gram模型
C)基于词自动聚类的n-gram模型
D)以上三者
答案:A
解析:
23.[单选题]知识图谱中的边称为?
A)连接边
B)关系
C)属性
D)特征
答案:B
解析:
24.[单选题]知识图谱属于哪个领域的任务
A)图像识别
B)自然语言
C)数据挖掘
D)不确定
答案:B
解析:
25.[单选题]每个算法都会有缺点,对于集成学习GBDT的缺点是什么
A)预测阶段的计算速度快,树与树之间可并行化计算。
B)GBDT在高维稀疏的数据集上,表现不如支持向量机或者神经网络。
C)在分布稠密的数据集上,泛化能力和表达能力都很好,这使得GBDT在Kaggle的众多竞赛中,经常名列榜首。
D)采用决策树作为弱分类器使得GBDT模型具有较好的解释性和鲁棒性,能够自动发现特征间的高阶关系。答案:B
解析:
26.[单选题]以下哪个激活函数指的是修正线性单元?
A)Relu
B)sigmoid
C)tanh
D)sin
答案:A
解析:
27.[单选题]关于Porter算法,以下描述错误的是()
A)v表示一个元音字母
B)c表示一个辅音字母
C)C表示不连续的辅音字母串
D)V表示连续的元音字母串
答案:C
解析:
28.[单选题]关于距离空间,其目的是()
A)度量后比较
B)求相关性
C)求信息熵
D)构成线性空间
答案:A
解析:
29.[单选题]在NLP的应用当中,估计条件概率常用的方法是什么
A)交叉熵函数
B)信息熵函数
C)加和求平均
D)极大似然估计
答案:D
解析:
30.[单选题]tf.tanh的作用是什么
A)计算元素的sigmoid值.
B)计算元素的softmax值.
C)计算元素的双曲正切值.
D)计算元素的relu值
答案:C
解析:
31.[单选题]最大熵分类器已经成功应用于()等多个自然语言处理领域
A)信息抽取
B)句法分析
C)其余3项都是
D)语义角
答案:C
解析:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论