数据挖掘——探索数据的奥秘智慧树知到课后章节答案2023年下青岛工学院
青岛工学院
第一章测试
1.数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。( )

A:对 B:错
答案:对

2.下面哪些是时空数据的应用( )。

A:气象学家使用人造卫星和雷达观察飓风 B:从多媒体数据库中发现有趣的模式 C:机动车辆管理者把GPS安装在汽车上,以便更好地监管和引导车辆 D:动物学家把遥感设备安装在野生动
物身上,以便分析生态行为
答案:气象学家使用人造卫星和雷达观察飓风;机动车辆管理者把GPS安装在汽车上,以便更好地监管和引导车辆;动物学家把遥感设备安装在野生动物身上,以便分析生态行为

3.数据挖掘生命周期的数据理解阶段,起于原始数据收集,止于熟悉数据、识别数据质量问题。( )

A:对 B:错
答案:错

4.以下关于数据挖掘规律的描述中,不正确的是( )。

A:业务知识是数据挖掘过程每一步的中心 B:对所有领域的每个数据挖掘问题,总有模式可循。
C:数据准备超过数据挖掘过程的3/4 D:给定应用的正确模型只能通过实验发现
答案:数据准备超过数据挖掘过程的3/4

5.关于数据挖掘生命周期的部署阶段,说法正确的是( )。

A:部署阶段要完成模型的创建 B:执行部署步骤的通常是数据分析师 C:部署通常是数据挖掘项目的终点 D:建立模型的目的不能仅仅是增加对数据的了解
答案:部署阶段要完成模型的创建

6.“8,000”和“10,000”表示:( ) 。

A:数据 B:信息 C:知识 D:智慧
答案:数据


7.“8,000米是飞机飞行最大高度”与“10,000米的高山”表示:( )。

A:数据 B:知识 C:信息 D:智慧
答案:信息

8.“飞机无法飞过高山”表示:( ) 。

A:知识 B:智慧 C:数据 D:信息
答案:知识

9.数据取样时,除了要求抽样时严把质量关外,还要求抽样数据必须在足够范围内有代表性。( )


A:错 B:对
答案:对

10.根据顾客喜好摆放商品位置属于数据挖掘范畴。( )

A:错 B:对
答案:对
第二章测试
11.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的( )任务?

A:建模描述 B:寻模式和规则 C:预测建模 D:探索性数据分析
答案:探索性数据分析


12.下列对学生相关属性描述中,不是标称属性的是( )。

A:婚姻状况 B:学号 C:身高 D:头发颜
答案:身高

13.下列哪些选项能表示序数属性的数据集中趋势度量( )。

A:四分位数 B:众数 C:均值 D:标准差
答案:众数

14.( )可以观察从一个分布到另一分布是否有漂移。

A:散点图 B:直方图 C:盒图 D:分位数-分位数图
答案:分位数-分位数图

15.考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是 ( )

A:3 B:3.5 C:5 D:2
答案:3.5

matlab等高线数据提取16.下列哪个不是专门用于可视化时间空间数据的技术: ( )

A:等高线图 B:饼图 C:曲面图 D:矢量场图
答案:饼图

17.皮尔森相关系数取值为( )时说明两个对象最不相似。

A:1 B:0 C:0.05 D:-1
答案:-1

18.下列哪些指标可以度量数据的离散趋势度量:( )。

A:四分位数极差 B:五数概括 C:四分位数 D:极差
答案:四分位数极差;五数概括;四分位数;极差

19.在探索性数据分析中,认为最有代表性,最能反映数据重要特征的五数概括,包括:( )。

A:四分位数Q3 B:中位数Q2 C:最小值 D:最大值
答案:四分位数Q3;中位数Q2;最小值;最大值

20.四分位数极差(IQR)是第1个和第2个四分位数之间的距离。( )

A:错 B:对
答案:错
第三章测试
21.下面( )不属于数据预处理的方法?

A:聚集 B:变量代换 C:估计遗漏值 D:离散化
答案:估计遗漏值

22.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在( )箱子内?

A:第二个 B:第四个 C:第三个 D:第一个
答案:第二个

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。