数据挖掘整理(熊熊整理-----献给梦中的天涯)
单选题
1.下面哪种分类方法是属于神经网络学习算法?( )
A. 判定树归纳
B. 贝叶斯分类
C. 后向传播分类
D. 基于案例的推理
2.置信度(confidence)是衡量兴趣度度量( A )的指标。
A、简洁性
B、确定性
C.、实用性
D、新颖性
3.用户有一种感兴趣的模式并且希望在数据集中到相似的模式,属于数据挖掘哪一类任务?(A)
A. 根据内容检索 B. 建模描述
C. 预测建模 D. 寻模式和规则
A. 根据内容检索 B. 建模描述
C. 预测建模 D. 寻模式和规则
4.数据归约的目的是( )
A、填补数据种的空缺值
B、集成多个数据源的数据
C、得到数据集的压缩表示
D、规范化数据
5.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?
A.数据清理
B.数据集成
C.数据变换
D.数据归约
6.假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内? (B)
A 第一个 B 第二个 C 第三个 D 第四个
A 第一个 B 第二个 C 第三个 D 第四个
7.下面的数据操作中,( )操作不是多维数据模型上的OLAP操作。
A、上卷(roll-up)
B、选择(select)
C、切片(slice)
D、转轴(pivot)
8.关于OLAP和OLTP的区别描述,不正确的是: (C)
A. OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同.
B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.
C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高.
D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的
A. OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同.
B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.
C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高.
D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的
9.下列哪个描述是正确的?( )
A、分类和聚类都是有指导的学习
B、分类和聚类都是无指导的学习
C、分类是有指导的学习,聚类是无指导的学习
D、分类是无指导的学习,聚类是有指导的学习
10简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B )
A、层次聚类 B、划分聚类 C、非互斥聚类 D、模糊聚类
11将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C)
A. 频繁模式挖掘 B. 分类和预测 C. minimal数据预处理 D. 数据流挖掘
12 什么是KDD? (A)
A. 数据挖掘与知识发现 B. 领域知识发现
C. 文档知识发现 D. 动态知识发现
为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?(B)
A. 探索性数据分析 B. 建模描述
C. 预测建模 D. 寻模式和规则
A. 频繁模式挖掘 B. 分类和预测 C. minimal数据预处理 D. 数据流挖掘
12 什么是KDD? (A)
A. 数据挖掘与知识发现 B. 领域知识发现
C. 文档知识发现 D. 动态知识发现
为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?(B)
A. 探索性数据分析 B. 建模描述
C. 预测建模 D. 寻模式和规则
判断题
1. 数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。 (对)
2. 数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。(对)3. 图挖掘技术在社会网络分析中扮演了重要的角。(对)
1. 数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。 (对)
2. 数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。(对)3. 图挖掘技术在社会网络分析中扮演了重要的角。(对)
4. 模式为对数据集的全局性总结,它对整个测量空间的每一点做出描述;模型则对变量变化空间的一个有限区域做出描述。(错)
5. 寻模式和规则主要是对数据进行干扰,使其符合某种规则以及模式。(错)
6. 离点可以是合法的数据对象或者值。 (对)
7. 离散属性总是具有有限个值。 (错)
8. 噪声和伪像是数据错误这一相同表述的两种叫法。 (错)
9. 用于分类的离散化方法之间的根本区别在于是否使用类信息。 (对)
10. 特征提取技术并不依赖于特定的领域。 (错)
11. 序列数据没有时间戳。 (对)
12. 定量属性可以是整数值或者是连续值。 (对)
13. 可视化技术对于分析的数据类型通常不是专用性的。 (错)
14. DSS主要是基于数据仓库.联机数据分析和数据挖掘技术的应用。(对)
15. OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。 (对)
16. 商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商
5. 寻模式和规则主要是对数据进行干扰,使其符合某种规则以及模式。(错)
6. 离点可以是合法的数据对象或者值。 (对)
7. 离散属性总是具有有限个值。 (错)
8. 噪声和伪像是数据错误这一相同表述的两种叫法。 (错)
9. 用于分类的离散化方法之间的根本区别在于是否使用类信息。 (对)
10. 特征提取技术并不依赖于特定的领域。 (错)
11. 序列数据没有时间戳。 (对)
12. 定量属性可以是整数值或者是连续值。 (对)
13. 可视化技术对于分析的数据类型通常不是专用性的。 (错)
14. DSS主要是基于数据仓库.联机数据分析和数据挖掘技术的应用。(对)
15. OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。 (对)
16. 商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商
务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求。 (对)
17. 数据仓库中间层OLAP服务器只能采用关系型OLAP (错)
18.数据仓库系统的组成部分包括数据仓库,仓库管理,数据抽取,分析工具等四个部分. (错)
17. 数据仓库中间层OLAP服务器只能采用关系型OLAP (错)
18.数据仓库系统的组成部分包括数据仓库,仓库管理,数据抽取,分析工具等四个部分. (错)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论