大数据基础与应用_北京理工大学中国大学mooc课后章节答案期末考试题库2023年
1.大数据的特性不包括

答案:
分布地域广

2.Kafka 是一个高吞吐、分布式、基于发布订阅的消息系统,利用Kafka技术可在廉价PC Server上搭建起大规模消息系统。

答案:
正确

3.网络和层次化数据可视化的主要技术有力导图和TreeMap。
web服务器搭建原理

答案:
正确

4.如下关于大数据分析流程的哪一项是正确的?

答案:
数据采集、数据清洗、数据管理、数据分析、数据呈现

5.大数据分析与传统的数据分析的区别主要在于:

答案:
大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析
则作用在有限的小规模数据集上,模型较为简单。_传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。_大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。

6.1、大数据主要是由于数据规模巨大、来源分散、格式多样,所以需要新的体系架构、技术、算法和分析方法来对这些数据进行采集、存储和关联分析,以期望能够从中抽取出隐藏的有价值的信息。

答案:
正确

7.数据科学家主要负责开发、构建、测试和维护系统,比如数据库和大规模处理系统

答案:
测试用例覆盖率错误

8.大数据分析的目的是从类型多样的海量数据中挖掘出隐藏的有价值的信息。

答案:
正确

9.大数据分析能够应用在哪些领域?

答案:
交通 医疗 足球 零售 天文 政治

10.Hive的数据模型主要包括:

答案:
表(Tables)_桶(Buckets)_分区(Partitions)

11.NoSQL数据库的主要类型包括:

答案:
图形数据库_键值数据库_文档数据库_列族数据库

12.下列数据类型中,不属于Python内置数据类型的是:

java的入门与精通pdf答案:
dtype

13.以下不属于高维数据可视化技术的是.

答案:
词云
python3基础教程慕课版电子版
14.以下哪个是常见的大数据处理流程.

答案:
数据获取、数据清洗、数据分析、数据可视化

15.测得一组身高(cm)数据如下:176、165、173、168、176、180、177、168、174、176,则其众数和中位数分别是:


答案:regularexpressions功能
176, 175
免费学生动态网页制作成品

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。