人工智能机器学习技术练习(习题卷14)
说明:答案和解析在试卷最后
第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]个人健康和年龄的相关系数是 -1.09。根据这个你可以告诉医生哪个结论?
A)年龄是健康程度很好的预测器
B)年龄是健康程度很糟的预测器
C)以上说法都不对
2.[单选题]以下哪项是解决NLP用例(如语义相似性、阅读理解和常识推理)的更好选择?
A)ELMo
B)Open AI’s GPT
C)ULMFit
3.[单选题]下列关于神经元的陈述中,正确的是(
A)一个神经元有一个输入,有一个输出
B)一个神经元有多个输入,有一个或多个输出
C)一个神经元有一个输入,有多个输出
D)上述都正确
4.[单选题]下面关于分析学习描述不正确的是(__)。
A)分析学习是相对归纳学习的一种提法
B)分析学习使用先验知识来减小待搜索假设空间的复杂度
C)分析学习的优点是可以从稀疏数据中学习
D)分析学习通过统计推理来论证
5.[单选题]机器学习研究的目标有三个,不包括(
A)人类学习与过程的认知模型
B)通用学习算法
C)构造面问仕务的专用学习系统
D)制作长相接近人类的机器系统
6.[单选题]下面关于机器学习相关描述不正确的有(__)。
A)机器学习的主要议题是如何实现和优化机器的自我学习
B)机器学习的基本思路是以训练集为输入,通过机器学习算法让机器学习到能够处理更多数据的能力
C)AlphaGo的核心技术是深度学习与增强学习
D)机器学习的只能是预定义的
7.[单选题]线性回归的基本假设不包括()。
A)随机误差项是一个期望值为0的随机变量
B)对于解释变量的所有观测值,随机误差项有相同的方差
C)随机误差项彼此相关
8.[单选题]()操作属于预剪枝。
A)信息增益
B)计算最好的特征切分点
C)限制树模型的深度
D)可视化树模型
9.[单选题]随机森林是在(__)上的一个扩展变体。
A)Boosting
B)AdaBoost
C)RF
D)Bagging
10.[单选题]盲目搜索策略不包括下列那个()
A)广度优先搜索
B)深度优先搜索
C)有界深度优先搜索
D)全局择优搜索
11.[单选题]关于机器学习算法正确的是()
A)LR模型在加入正则化项后Variance将增大
B)线性SVM是寻最小边缘的超平面的一个分类器
C)xgboost和GDBT都是属于boosting算法
D)xgboost和随机森林都是属于bagging算法
12.[单选题]下列哪个方法不属于情感分析的评测?
A)COAE评测
B)cifar10数据集评测
C)CCF TCCI评测
D)TAC评测
13.[单选题]预剪枝是指在决策树生成过程中,对每个结点在划分(__)进行估计。
A)前
B)中
C)后
D)不估计
14.[单选题]关于决策树节点划分指标描述正确的是( )
A)类别非纯度越大越好
B)信息增益越大越好
C)信息增益率越小越好
D)基尼指数越大越好
15.[单选题]混淆矩阵的真负率公式是为
A)TP/(TP+FN)
B)FP/(FP+TN)
C)FN/(TP+FN)
D)TN/(TN+FP)
16.[单选题]下面的颜空间表示中,能较好的分离图像亮度和度信息的是( )?
C)HSV
D)CMY
17.[单选题]后剪枝是先从训练集生成一颗完整的决策树,然后()对非叶结点进行考察。
A)自上而下
B)在划分前
C)禁止分支展开
D)自底向上
18.[单选题]关于Pandas中数据排序,下列说法正确的是()。
A)即可以按照行索引排序,也可以按照列索引排序
B)sort_index()方法表示按照值进行排序
C)sort_values()方法表示按照索引进行排序
D)默认情况下,sort_index()方法按照降序排列
19.[单选题]四个点坐标为(1,1),(1,0),(-1,-1),(-1,0),用 SVM 分类的决策边界是
A)y = x
B)x = 0
C)y = -x
D)y = 0
20.[单选题]朴素贝叶斯的训练过程就是基于训练集D来估计类的()P(c),并为每个属性估计条件概率
A)后验概率
B)先验概率
C)条件概率
D)联合概率
21.[单选题]下列关于TF-IDF说法正确的是?
A)该值与特征项在文档中出现的频率成反比
B)该值与特征项在文档中出现的频率成正比
C)该值与在整个语料库中出现该特征项的文档库成正比
D)该值与特征项在文档中出现的频率无关
22.[单选题]以下说法正确的是 :
A)一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的
B)如果增加模型复杂度, 那么模型的测试错误率总是会降低
C)如果增加模型复杂度, 那么模型的训练错误率总是会降低
D)我们不可以使用聚类“类别id”作为一个新的特征项, 然后再用监督学习分别进行学习
23.[单选题]spark 的四大组件下面哪个不是 ()。
A)Spark Streaming
B)Mlib
C)Graphx
D)Spark R
24.[单选题]话题模型中的几个概念不含有?
A)词
B)句
C)文档
25.[单选题]下列关于数据预处理的说法中,描述不正确的是( )。
A)数据清洗的目的是为了提高数据质量
B)异常值不一定要删除
C)通过drop_duplicates()方法可以删除重复数据
D)concat()函数可以根据一个或多个键将不同的DataFrame进行合并
26.[单选题]下列算法中属于点处理的是:( )
A)梯度锐化
B)二值化
C)傅立叶变换
D)中值滤波
正则化其实是破坏最优化27.[单选题]当训练集特征非常多,而实例非常少的时候,可以采用()。
A)sigmoid核的支持向量机
B)不带核的支持向量机
C)高斯核的支持向量机
D)多项式核的支持向量机
28.[单选题]真正率是指(__)。
A)正样本预测结果数 / 正样本实际数
B)被预测为负的正样本结果数 / 正样本实际数
C)被预测为正的负样本结果数 /负样本实际数
D)负样本预测结果数 / 负样本实际数
29.[单选题]进行主成分分析的前提条件是各变量间()。
A)高度相关
B)低度相关
C)相互独立
D)完全相关
30.[单选题]情感信息抽取不包括以下哪些方法?()
A)基于命名实体识别的抽取方法
B)基于重复段落的识别方法
C)基于语义角标注的抽取方法
D)基于监督学习抽取的学习方法
31.[单选题]在图集合中发现一组公共子结构,这样的任务称为
A)频繁子集挖掘
B)频繁子图挖掘
C)频繁数据项挖掘
D)频繁模式挖掘
32.[单选题]()在划分属性时是在当前结点的属性集合中选择一个最优属性。
A)AdaBoost
B)RF
C)Bagging
D)传统决策树
33.[单选题]以下关于人工智能的说法中,错误的是
B)人工智能涵盖多个学科领域
C)人工智能包括自动推理,专家系统,机器学习等技术
D)现阶段的人工智能核心是机器学习
34.[单选题]多元线性回归的训练样本由(__)个属性描述。
A)一
B)二
C)三
D)多
35.[单选题]FOIL是( )的学习算法
A)命题规则
B)剪枝优化
C)一阶规则
D)序贯覆盖
36.[单选题]读取CSV文件中的数据用(  )包。
A)sklearn
B)Matplotlib
C)Pandas
D)pylab
37.[单选题]因为文本数据在可用的数据中是非常无结构的,它内部会包含很多不同类型的噪点,所以要做数据预处理。以下不是自然语言数据预处理过程的是:
A)词汇规范化
B)词汇关系统一化
C)对象标准化
D)噪声移除
38.[单选题]关于CNN,以下结论正确的是( )
A)在同样层数、 每层神经元数量一样的情况下, CNN比全连接网络拥有更多的 参数
B)CNN可以用于非监督学习, 但是普通神经网络不行
C)Pooling层用于减少图片的空间分辨率
D)接近输出层的filter主要用于提取图像的边缘信息
39.[单选题]9. 关于K-均值算法,以下说法不正确的是
A)K-均值算法是一种划分方法。
B)K-均值算法能发现任意形状的簇。
C)K-均值算法不一定收敛于全局最优解。
D)比起DBSCAN算法来,K更好
40.[单选题]下面对范数规则化描述错误的是(__)。
A)L0是指向量中0的元素的个数
B)L1范数是指向量中各个元素绝对值之和
C)L2范数向量元素绝对值的平方和再开平方
D)L0是指向量中非0的元素的个数
41.[单选题]下面关于SIFT特征描述错误的是( )?
A)具有尺度不变性
B)具有旋转不变性

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。