一、 单选题
1.“大数据”是指规模超过1000TB的数据集。
正确答案: × 
2.概率为0的事件是不可能事件,概率为1的事件是必然事件。
正确答案: ×
3.将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为等距抽样。
正确答案: √
4.统计图中的散点图主要用来观察变量之间的相关关系。
正确答案: √ 
5.抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。
正确答案: × 
6.Datahoop1.2版中 K-means聚类分析要求输入的数据必须是数值型数据。
正确答案: √ 
7.如果事件A,B互斥,且P(A)>0,P(B)>0,则A,B独立。
正确答案: × 
8. SQL中删除表的命令是“DELETE TABLE”。
正确答案: × 帕累托图制作步骤excel
9.聚类分析中,各变量的取值在数量级上不能有过大的差异。
正确答案: √ 
10.如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。
正确答案: × 
11.需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高价格。
正确答案: × 
12.使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引。
正确答案: √ 
13.线性回归模型的拟合优度可采用可决系数进行评判。可决系数越高,模型拟合效果越好;可决系数越小,模型拟合效果越差。
正确答案: × 
14.一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一一分解之后进行分析。
正确答案: × 
15.决策树中包含根结点、叶结点、内部结点和外部结点。
正确答案: × 
二、 单选题
1. 检查异常值常用的统计图形是(  )
A、柱状图
B、箱线图
C、帕累托图
D、气泡图
正确答案: B 
2. 什么是KDD?(  )
A、数据挖掘与知识发现
B、领域知识发现
C、文档知识发现
D、动态知识发现
正确答案: A 
3. 东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!" 
以上对话体现了数据分析方法中的(  )
A、关联
B、聚类
C、分类
D、自然语言处理
正确答案: A 
4. 假设检验中显著性水平是(  )
A、推断时犯取伪错误的概率
B、推断时取伪弃真的概率
C、正确推断的概率
D、是推断的可信度
正确答案: B 
5. 矩估计的基本原理是(  )
A、用样本矩估计总体矩
B、使得似然函数达到最大
C、使得似然函数达到最小
D、小概率事件在一次试验中是不可能发生的
正确答案: A 
6. SQL查询语句中HAVING子句的作用是(  )
A、指出分组查询的范围
B、指出分组查询的值
C、指出分组查询的条件
D、指出分组查询的内容
正确答案: C 
7. 以下哪项关于决策树的说法是错误的(  )
A、冗余属性不会对决策树的准确率造成不利的影响
B、子树可能在决策树中重复多次
C、决策树算法对于噪声的干扰非常敏感
D、寻最佳决策树是NP完全问题
正确答案: C 
8. 以下哪种方法不属于于监督学习模型(    )
A、决策树
B、线性回归
C、关联分析
D、判别分析
正确答案: C 
9考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,若采用合并策略,则由候选产生过程得到4-项集不包含( )
A、1,2,3,4
B、1,2,3,5
C、1,2,4,5
D、1,3,4,5
正确答案: C 
10. 下列不属于原始数据来源的是(   
A、行政记录
B、统计调查
C、统计年鉴
D、实验
正确答案: C 
11. 下列不属于分类算法的是(  )
A、C4.5算法
B、逻辑回归
C、KNN算法
D、TF-TDF算法
正确答案: D 
12. 相关分析与回归分析的一个重要区别是(  )
A、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示
B、前者研究变量之间的变动关系,后者研究变量间关系的密切程度
C、两者都研究变量间的变动关系

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。