数据挖掘(公需课目)
(准确率72%)
1、(单选,4分)
以下哪个度量不属于数据中心趋势度描述?(  C )C
A、中位数
B、众数
C、四分位数
D、A.均值
2、(单选,4分)
以下那个不属于分类算法?( ) B
A、SVM
B、K-MEANS
C、KNN
D、朴素贝叶斯
3、(单选,4分)
以下哪个不是常见的属性类型?()A
A、高维属性
B、数值属性
C、A.标称属性
D、序数属性
4、(单选,4分)
当不知道数据所带标签时. 可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( )A
A、隐马尔可夫链
B、关联分析
C、聚类
D、分类
5、(单选,4分)
类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )A?
A、EM
B、KNN
C、DBSCAN
D、K-Means
6、(单选,4分)
以下哪些算法是分类算法?( )C
A、K-Mean
B、DBSCAN
C、C4.5
D、EM
7、(单选,4分)
建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?( )D
A、寻模式和规则
B、建模描述
C、根据内容检索
D、预测建模
8、(单选,4分)
以下哪些陈述是不正确的?( )D
A、聚类可以发现数据内部结构
B、聚类可以作为异常检测
C、聚类可以作为其他任务的预处理
D、聚类是一种监督学习方法
9、(单选,4分)
在构造决策树时,以下那个不属于选择属性的度量?( )C
A、信息增益
B、基尼指数
C、信息熵
D、信息增益率
10、(单选,4分)
DBSCAN算法最大的挑战是?( )D
A、确定聚类个数
B、确定半径及MINPTS
C、确定评估指标
D、确定聚类形状
11、(单选,4分)
正则化描述正确的是关于频繁模式,下面哪一个陈述是正确的?( )C
A、K项集频繁则K-1项则必定不频繁
B、K项集不频繁则K-1项则必定频繁
C、K项集频繁则K-1项则必定频繁
D、以上都不正确
12、(单选,4分)
聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )A
A、SVM
B、DBSCAN
C、EM
D、K-Means
13、(单选,4分)
对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?( )A
A、数据预处理
B、噪声检测
C、频繁模式挖掘
D、分类和预测
14、(单选,4分)
以下哪个度量属于数据散度的描述?()B
A、均值
B、标准差
C、中位数
D、众数
15、(单选,4分)
知识发现流程最核心的步骤是什么?( )A
A、数据挖掘
B、数据预处理
C、知识表示
D、模式评估
16、(单选,4分)
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )D
A、分类
B、聚类
C、自然语言处理
D、关联规则发现
17、(单选,4分)
以下哪项不属于知识发现的过程?( )B
A、知识可视化表达
B、数据测试
C、数据清理
D、数据挖掘
18、(单选,4分)
SVM通过什么实现线性不可分问题?( )D
A、基尼指数
B、特征降维
C、核函数
D、特征筛选
19、(单选,4分)
以下哪些不属于数据挖掘的内容?()A?
A、递归分析
B、分类
C、离点检测
D、聚类
20、(单选,4分)
以下哪个度量属于数据中心性的描述?()B
A、极差
B、标准差
C、均值
D、众数
21、(单选,4分)
机器学习中,下面哪些方法不可以避免分类中的过拟合问题?()A
A、正则化
B、去除噪声
C、增加样本数量
D、增加模型复杂度
22、(单选,4分)
下面那个不属于知识发现过程。()A
A、数据统计
B、模式评估和知识表示
C、数据挖掘
D、数据清理与集成
23、(单选,4分)
K-means算法的缺点不包括?( )C
A、选择初始聚类中心
B、对于“噪声”和孤立点数据是敏感的
C、可伸缩、高效
D、K必须是事先给定的
24、(单选,4分)
将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )B
A、分类和预测
B、数据预处理
C、数据流挖掘
D、频繁模式挖掘
25、(单选,4分)
在构造决策树时,以下哪种不是选择属性的度量的方法?( )D
A、信息增益
B、基尼指数
C、信息增益率
D、距离

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。