数据挖掘(练习)
1、(单选,4分)以下哪项不属于知识发现的过程?( )
A、数据清理 B、数据挖掘 C、知识可视化表达 D、数据测试 答案:D
2、(单选,4分)以下哪些不属于数据挖掘的内容?( )
A、分类 B、聚类 C、离点检测 D、递归分析 答案:D
3、(单选,4分)以下哪个不是常见的属性类型? ( )
A、A.标称属性 B、数值属性 C、高维属性 D、序数属性 答案:C
4、(单选,4分)以下哪个度量属于数据散度的描述? ( )
A、均值 B、中位数 C、标准差 D、众数 答案:C
5、(单选,4分)以下哪个度量不属于数据中心趋势度描述?( D )
正则化描述正确的是 A、A.均值 B、中位数 C、众数 D、四分位数 答案:D
6、(单选,4分)对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?( )
A、频繁模式挖掘 B、分类和预测 C、数据预处理 D、噪声检测 答案:C
7、(单选,4分)聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )
A、K-Means B、DBSCAN C、SVM D、EM 答案:C
8、(单选,4分)建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?( )
A、根据内容检索 B、建模描述 C、预测建模 D、寻模式和规则 答案:C
9、(单选,4分)
当不知道数据所带标签时. 可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( )
A、分类 B、聚类 C、关联分析 D、隐马尔可夫链 答案:B
10、(单选,4分)在构造决策树时,以下哪种不是选择属性的度量的方法? ( )
A、信息增益 B、信息增益率 C、基尼指数 D、距离 答案:D
11、(单选,4分)知识发现流程最核心的步骤是什么? ( )
A、数据挖掘 B、数据预处理 C、模式评估 D、知识表示 答案:A
12、(单选,4分)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )
A、频繁模式挖掘 B、分类和预测 C、数据预处理 D、数据流挖掘 答案:C
13、(单选,4分)以下哪个度量属于数据中心性的描述? ( )
A、均值 B、极差 C、众数 D、标准差 答案:A
14、(单选,4分)类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )
A、K-Means B、DBSCAN C、KNN D、EM 答案:C
15、(单选,4分)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题? ( ) A、关联规则发现 B、聚类 C、分类 D、自然语言处理 答案:A
16、(单选,4分)以下哪些算法是分类算法?( ) A、DBSCAN B、C4.5 C、K-Mean D、EM 答案:B
17、(单选,4分)K-means算法的缺点不包括?( ) A、K必须是事先给定的 B、选择初始聚类中心 C、对于“噪声”和孤立点数据是敏感的 D、可伸缩、高效 答案:D
18、(单选,4分)机器学习中,下面哪些方法不可以避免分类中的过拟合问题?( )
A、增加样本数量 B、增加模型复杂度 C、去除噪声 D、正则化 答案:B
19、(单选,4分)下面那个不属于知识发现过程。( )
A、数据清理与集成 B、数据统计 C、数据挖掘 D、模式评估和知识表示 答案:B
20、(单选,4分)在构造决策树时,以下那个不属于选择属性的度量? ( )
A、信息增益 B、信息增益率 C、基尼指数 D、信息熵 答案:D
21、(单选,4分)关于频繁模式,下面哪一个陈述是正确的? ( )
A、K项集频繁则K-1项则必定不频繁 B、K项集频繁则K-1项则必定频繁 C、K项集不频繁则K-1项则必定频繁 D、以上都不正确 答案:B
22、(单选,4分)DBSCAN算法最大的挑战是? ( )
A、确定聚类个数 B、确定聚类形状 C、确定半径及MINPTS D、确定评估指标 答案:C
23、(单选,4分)以下那个不属于分类算法? ( )
A、KNN B、朴素贝叶斯 C、K-MEANS D、SVM 答案:C
24、(单选,4分)以下哪些陈述是不正确的? ( )
A、聚类可以发现数据内部结构 B、聚类可以作为其他任务的预处理 C、聚类可以作为异常检测 D、聚类是一种监督学习方法 答案:D
25、(单选,4分)SVM通过什么实现线性不可分问题? ( )
A、特征降维 B、特征筛选 C、基尼指数 D、核函数 答案:D
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论