数据分析概述测试试卷
模块1:单选题 单选题(100分,1-10每题10分)
1. 下列关于计算机存储容量单位的说法中,错误的是(C )。
A.1KB<1MB<1GB
B.基本单位是字节(Byte)
C.一个汉字需要一个字节的存储空间
D.一个字节能够容纳一个英文字符
2支撑大数据业务的基础是(B)。
A.数据科学
B.数据应用
hbase属于什么数据库C.数据硬件
D.数据人才
3.大数据的起源是(C)
A.金融
B.电信
C.互联网
D.公共管理
4. 数据仓库相对数据库的最大区别是(D)
A.记录业务系统日志数据
B.记录业务系统操作数据
C.关联业务系统的日志数据
D.汇总分析业务系统的数据
5. 下列哪一项是机器学习的主要输出成果(C)
A.数据
B.指标
C.规则
D.智能
6. 下列哪一项是数据仓库的主要输出成果(B)
A.数据
B.指标
C.规则
D.智能
7. 下列不属于ETL的内容有(D)
A.抽取
B.转换
C.加载
D.汇总
ETL用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。
8. 采用数据分层的思想来构建大数据分析平台,不包括下面哪项(B)
A.ODL ---目标解释语言
B.HDL ---硬件描述语言
C.IDL ---接口描述语言
D.ADL
9. 下列不属于大数据离线分析平台使用的组件有(D)
A.HDFS
B.MR
C.Hive
D.Hbase
10. CRISP-DM 模型中Evaluation表示对建立的模型进行评估,重点具体考虑得出的结果是否符合( C )的商业目的。
A.第二步
B.第三步
C.第一步
D.最后一步
模块二 判断题( 答案T代表正确,F代表错误)
11.在噪声数据中,波动数据比离点数据偏离整体水平更大。( F)
12.对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。(F)
13.一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(T )
14.具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。(F )
15.谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。( F)
16.决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。( T)
17. 当前,企业提供的大数据解决方案大多基于Hadoop开源项目(T)
18.简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。( F)
19.啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。(F )
20.对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。( F)
-------------------------------单选题参考答案
CBCDC
BDBDC
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论