试卷总分:19    得分:18
1.()充分利用了MapReduce和HDFS的扩展性和容错性,是基于MapReduce开发的数据挖掘,机器学习库
A.YARN
B.MAPREDUCE
C.MaHout
D.STORM
答案:C
2.特征抽取常用算法的互信息,互信息值()表示词条和类别的共现程度()
A.越大,越小
B.越小,越大
C.越小,越小
D.越大,越大
答案:D
3.RDD中进行count,collect,save等操作属于()
A.Active
B.Change
C.Acter
D.Transformation
答案:A
4.根据PageRank算法的基本思想,以下哪种情况说明了页面的重要性
A.被多次引用的页面
B.没有被多次引用的页面
C.页面的重要性无法传递
D.被非重要的页面引用的页面
答案:A
5.Web应用挖掘中最有效而且简单的分析方法是
A.数据挖掘
B.点击流分析
零基础学java编程
C.结构分析
D.内容分析
答案:B
6.Hadoop生态系统中,集的资源管理系统是()
A.YARN
B.HDFS
C.STORM
D.MAPREDUCE
答案:A
7.Hadoop提供的MapReduce的编程方式中,()是最原始的方式
A.HadoopStreaming
B.Java
C.PHP
D.HadoopPipes
答案:B
8.大数据的起源是( )
A.金融
B.公共管理
C.电信
D.互联网
答案:D
9.智慧城市的智慧之源是( )
A.云计算
B.物联网
C.数字城市
D.大数据
答案:D
10.假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是( )关系,而吸烟和肺癌则是()关系
A.并列相关
B.相关因果
C.因果相关
D.因果并列
答案:C
11.下列关于数据交易市场的说法中,错误的是( )
A.数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助
B.商业化的数据交易活动催生了多方参与的第三方数据交市场
C.数据交易市场是大数据资源化的必然产物
D.数据交易市场是大数据产业发展到一定程度的产物
答案:A
12.当前大数据技术的基础是由( )首先提出的
A.微软
B.阿里巴巴
C.百度
D.谷歌
答案:D
13.下列演示方式中,不属于传统统计图方式的是( )
A.曲线图
B.饼状图
C.柱状图
D.网络图
答案:D
14.支撑大数据业务的基础是( )。
A.数据硬件
B.数据科学
C.数据应用
D.数据人才
答案:C
15.下列关于舍恩伯格对大数据特点的说法中,错误的是( )
A.数据价值密度高
B.数据规模大
C.数据处理速度快
D.数据类型多样
答案:A
16.下列关于大数据的分析理念的说法中,错误的是( )
A.在数据基础上倾向于全体数据而不是抽样数据
B.在数据规模上强调相对数据而不是绝对数据
C.在分析效果上更追求效率而不是绝对精确
D.在分析方法上更注重相关分析而不是因果分析
答案:B
17.下列关于普查的缺点的说法中,正确的是( )
A.工作量较大,容易导致调查内容有限、产生重复和遗漏
现象
B.评测结果不够稳定
C.误差不易被控制
D.对样本的依赖比较强
答案:A
18.下列关于聚类挖掘技术的说法中,错误的是( )
A.要求同类数据的内容相似度尽可能小
B.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
C.与分类挖掘技术相似的是,都是要对数据进行分类处理
D.要求不同类数据的内容相似度尽可能小
答案:A
19.智慧城市的构建,不包含( )
A.联网监控
B.数字城市
C.物联网
D.云计算
答案:A

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。