大数据技术基础
1. 参数检验是指对参数平均值、方差进行的统计检验,其中t检验是通过t分布理论推断差异发生的概率来判断两个样本或样本与体的平均值差异是否显著的方法。
2.新型数据质量管理的方法和工具中,关联图是对原因-结果、目的-手段等关系复杂而相互纠缠的问题的表述,在逻辑上用箭头把各要素之间的因果关系连接起来,从而出主要因素的方法。
3. 云平台分为公有云、私有云以及混合云。公有云指第三方提供商为用户提供的云,一般可通过互联网使用,可能是免费或低成本的,其核心属性是共享资源服务。
4.多源数据融合工具NiFi是Apache公司的产品,适合初学者不需要编写代码。
5. 大数据决策是以大数据为主要驱动的决策方式。
6. 数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持
7. 大数据应用向前发展的主要瓶颈是数据价值挖掘过程中的隐私监管。
8. 存储区域网络是采用网状通道技术,是通过交换机等连接设备将磁盘阵列与相关服务器连接起来的高速专用子网。
9. Python语言的函数中lambda用来定义匿名函数
10. Echarts侧重于数据统计图表化层面,即使用传统的统计性图表来表示数据,用户可以通过其看到历史数据的统计和解读。
11. 视频的全局运动特征中,通过将视频帧划分为许多互不重叠的小块后,描述每个子块内像素运动矢量的是块运动特征
12.在执行HDFS的读写过程中,首先使用分布式文件系统调用的是数字节点DataNode。
13. 许多网站和网络服务提供相应的应用程序接口API,允许请求结构化格式的数据。API的大部分数据都是JSON或XML格式,对于JSON格式的数据,可以使用Python中的json模块来解析JSON。
14. 描述性时序分析指通过直观的数据比较或绘图观测来寻时间序列中蕴含的发展规律,其操作简单易懂且直观有效,通常是时间序列数据分析的第一步。
15. NoSQL主要用于存储非结构化数据
16. hbase属于什么类型数据库音调(或称音高)是声音听起来调子高低的程度。音调主要取决于声音的频率,它随频率的升降而升降。
17. etc存放系统配置文件
18.执行Hbase读操作时,ZooKeeper返回存储meta表的地址节点,客户端访问节点,读取元数据后得到存储RowKeys所在的节点,客户端向存储节点发起请求,对应节点先查数据是否存储在内存,然后查HDFS磁盘存储,最后返回数据给客户端。
19. 当循环体由多条语句组成时,循环体所有语句必须对齐是关于Python语言的循环
20. MapReduce包含由程序员构建的两个主要过程:映射(map)和归约(reduce)。
21. 大数据应用模式导致数据的所有权和使用权分离,产生了数据所有者、提供者、使用者
三种角,数据不再像传统技术时代那样在数据所有者的可控范围之内。
22. 传统的关系数据库难以应对Web2.0以及大数据时代带来的挑战。传统数据库的问题主要表现在以下几个方面:无法满足海量数据的管理需求;无法满足数据高并发的需求;无法满足高可扩展性和高可用性的需求。
23. 图像特征是指通过计算机算法来获取图像中某些关键信息,其是图像分析的起点,下列对图像数据特征的划分是正确的:
根据特征的计算区域大小可以将特征分为局部特征和全局特征;根据特征的表现形式可以分为点特征、线特征、区域特征;根据特征的语义理解可以分为视觉特征、中层语义特征、高层语义特征。
24.常用的计量经济学时间序列模型包括自回归模型(AR)、滑动平均模型(MR)、自回归移动平均模型(ARMA)。
25. JVM上NiFi的主要组件有Web服务器;控制器;数据流存储库;内容存储库。
26.下列对大数据可视化的理解是正确的:
利用计算机自动化分析能力的同时,充分挖掘人对于可视化信息的认知能力优势,将人、机进行有机融合;借助人机交互式分析方法和交互技术,包括图形图像处理、计算机视觉及用户界面,通过表达、建模以及对立体、表面、属性及动画等图形化手段,帮助人们更好地理解和利用大数据;能够出大数据背后隐藏的信息并转化知识以及规律;大数据可视化已经在用户画像、社交网络分析、地理信息系统等领域得到广泛应用

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。