数据挖掘
马洪祥(72分)
1、(单选,4分)
以下哪个度量属于数据中心性的描述?()
A、标准差
B、极差
C、均值
D、众数
2、(单选,4分)
以下哪些算法是分类算法?( )
A、K-Mean
B、C4.5
C、DBSCAN
D、EM
3、(单选,4分)
知识发现流程最核心的步骤是什么?( )
A、数据挖掘
B、知识表示
C、数据预处理
D、模式评估
4、(单选,4分)
将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )
A、数据流挖掘
B、数据预处理
C、分类和预测
D、频繁模式挖掘
5、(单选,4分)
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )
A、聚类
B、分类
C、自然语言处理
D、关联规则发现
6、(单选,4分)
以下那个不属于分类算法?( )
A、SVM
B、KNN
C、K-MEANS
D、朴素贝叶斯
7、(单选,4分)
类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )
A、DBSCAN
B、KNN
C、K-Means
D、EM
8、(单选,4分)
K-means算法的缺点不包括?( )
A、选择初始聚类中心
B、对于“噪声”和孤立点数据是敏感的
C、可伸缩、高效
D、K必须是事先给定的
9、(单选,4分)
关于频繁模式,下面哪一个陈述是正确的?( )
A、以上都不正确
B、K项集不频繁则K-1项则必定频繁
C、K项集频繁则K-1项则必定频繁
D、K项集频繁则K-1项则必定不频繁
10、(单选,4分)
DBSCAN算法最大的挑战是?( )
A、确定聚类个数
B、确定半径及MINPTS
C、确定评估指标
D、确定聚类形状
11、(单选,4分)
以下哪些陈述是不正确的?( )
A、聚类是一种监督学习方法
B、聚类可以作为其他任务的预处理
C、聚类可以发现数据内部结构
D、聚类可以作为异常检测
12、(单选,4分)
以下哪项不属于知识发现的过程?( )
A、数据清理
B、数据测试
C、数据挖掘
D、知识可视化表达
13、(单选,4分)
机器学习中,下面哪些方法不可以避免分类中的过拟合问题?()
A、增加模型复杂度
B、正则化
C、去除噪声
D、增加样本数量
14、(单选,4分)
对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?( )
A、噪声检测
B、分类和预测
C、数据预处理
D、频繁模式挖掘
15、(单选,4分)
在构造决策树时,以下哪种不是选择属性的度量的方法?( )
A、基尼指数
B、距离
C、信息增益
D、信息增益率
16、(单选,4分)
以下哪个度量不属于数据中心趋势度描述?(D )
A、中位数
B、A.均值
C、四分位数
D、众数
17、(单选,4分)
下面那个不属于知识发现过程。()
A、数据清理与集成
B、数据挖掘
C、模式评估和知识表示
D、数据统计
18、(单选,4分)
以下哪个度量属于数据散度的描述?()
A、均值
B、众数
C、标准差
D、中位数
19、(单选,4分)
建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?( )
A、寻模式和规则
B、建模描述
C、预测建模
D、根据内容检索
20、(单选,4分)
以下哪些不属于数据挖掘的内容?()
A、聚类
正则化描述正确的是B、递归分析
C、离点检测
D、分类
21、(单选,4分)
在构造决策树时,以下那个不属于选择属性的度量?( )
A、信息增益率
B、基尼指数
C、信息增益
D、信息熵
22、(单选,4分)
以下哪个不是常见的属性类型?()
A、高维属性
B、序数属性
C、A.标称属性
D、数值属性
23、(单选,4分)
聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )
A、SVM
B、DBSCAN
C、K-Means
D、EM
24、(单选,4分)
SVM通过什么实现线性不可分问题?( )
A、特征筛选
B、特征降维
C、核函数
D、基尼指数
25、(单选,4分)
当不知道数据所带标签时. 可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( )
A、隐马尔可夫链
B、聚类
C、关联分析
D、分类

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。