2018年度
一、单选题(每题1分
1、小米摄像头记录下来的10分钟视频属于哪类数据:
A、结构化数据  B、半结构化数据  C、非结构化数据
2、结构化数据具备哪种特征:
A、具备明确逻辑关系    B、不具备明确逻辑关系    C、不一定具备明确逻辑关系
3、指纹打卡的数据属于哪些数据:
A、传感数据  B、交互数据  C、交易数据
4、大数据擅长处理哪个级别的数据?
A、MB    B、GB    C、TB    D、PB
5、是什么类型数据:
A、非结构化数据    B、结构化数据    C、半结构化数据
6、网络新闻是什么类型数据:
A、非结构化数据    B、结构化数据    C、半结构化数据
7、下列属于结构化数据的是:
A、图片        B、一卡通学生信息      C、简历
8、表1属于几维列表?
姓名
性别
学号
年级
成绩
张三
33
hbase属于什么类型数据库
2016
80
李四
38
2016
60
                                表1
A、二维          B、三维          C、四维          D、五维
9、图1中的级别属于哪种属性?
                                图1
A、标称属性      B、二元属性      C、序数属性      D、数值属性
10、关系型数据库中所谓的“关系”是指什么
A、数据库中的数据彼此间存在任意关联
B、数据模型满足一定条件的二维表格式
C、两个数据库之间有一定的关联
11、下列哪种数据类型不适合MySQL存储:
A、EXCEL报表      B、图片和声音            C、数据库里的财务数据
12、以下不属于ACID原则的是:
A、原子性          B、相对性            C、隔离性          D、 持久性
13、淘宝自主设计的自动化分布式存储系统是:
A、MongoDB          B、HBase            C、Oceanbase
14、BeansDB 是一个由我国哪个自主开发的:
A、淘宝        B、豆瓣社区        C、优酷        D、视觉中国
15、下列不是NewSQL数据库的是:
A、Sybase          B、MemSQL          C、TokuDB
16、下列不是NoSQL数据库的是:
A、Bigtable        B、Dynamo          C、DB2
17、下列不是传统关系型数据库的是:
A、MySQL          B、HBase        C、Sybase
18、下面关于数据挖掘的说法哪些是错误的:
A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容
B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据
C、所有发现的知识都是绝对的
19、下列不属于数据挖掘知识的方法
A、数学方法            B、归纳方法          C、实验方法
20、一般情况下,舆情监测内容不包含:
A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描
B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计
C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计
21、科学可视化、信息可视化和可视分析三者之间如何区分:
A、三者从属关系        B、三者属于递进关系            C、三者之间没有清晰边界
22、下列哪个不属于可视化的作用:
A、信息传播与协调      B、支持对信息的推理和分析      C、对信息进行筛选和储存
23、下图为百度地图显示某地区的加油站,此图为哪类可视化:
A、层次与网络可视化        B、时空数据可视化          C、多变量数据可视化 
24、下图为伦敦地铁图,此图为哪类可视化:
A、层次与网络可视化          B、时空数据可视化          C、多变量数据可视化 
25、下图为大数据标签云,此图为哪类可视化:
A、多变量数据可视化      B、时空数据可视化      C、非结构化数据可视化
26、目前在全球云计算市场份额占有率最高的公司是:
A、谷歌        B、亚马逊          C、微软        D、IBM
27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:
A、电子商务营销精准化和实时化
B、产品和服务高度差异化和个性化
C、价值链上企业运作差异化和静态化
D、新型增值服务模式不断涌现
28、下列哪个不是大数据下互联网广告的特点
A、广告内容更有针对性
B、提高广告决策效率
C、广告以平面媒体为主
D、广告传播模式的改变
29、朋友圈的FEED流广告的推广更为准确描述是:
A、大数据会使受众与产品的距离更贴近
B、对于目标受众的划分更加精细
C、大数据最本质的应用就在于预测
D、随意投放的广告
30、啤酒与尿布的营销案例应用了零售行业的哪种方法:
A、发现关联购买行为      B、客户体细分          C、供应链管理
二、多选题(每题2分
1.平台最核心的两个项目(组件)是:
A、HDFS      B、HIVE          C、HBase        D、MapReduce
2.以下平台属于Apache软件基金会项目的是:
A、Hadoop      B、Spark          C、Storm        D、MongoDB
3.以下属于大数据挖掘算法的是:
A、决策树      B、支持向量机          C、极差规格化      D、朴素贝叶斯
4.以下属于Spark平台特点的是:
A、共享变量      B、离线处理          C、内存计算      D、弹性分布式数据集
5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:
A、28M      B、64M          C、100M      D、128M
三、判断题(每题1分
1.Newsql是一种新兴的非关系型数据库。(
2.数据分析主要是指对过去的数据进行分析总结可视化,而数据科学主要是通过数据模型指对将来的发展趋势进行预测。(  )   
3.Python是一种跨平台语言,可以安装在Linux,MacOS和Windows操作系统中。(  )
4.数据ETL属于数据分析和挖掘的范畴。(  )
5.MapReduce的输入是基于Key-Value键值对。(  )
6.云计算提供的三种服务形式中,Iaas是指客户通过Internet即可使用租用商提供的软件。(  )
7.Hadoop主要用于离线大数据分析,而Storm主要用于在线实时大数据分析。(  )
8.商务智能(BI)的基本体系结构包括数据仓库、联机分析处理和数据挖掘。( 
9.R语言只能用作数据分析,而Python语言既可以用作数据分析也可以用作数据可视化。(  )
10.HDFS的主服务器名称叫做DataNode。( 

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。