不属于Hadoop生态系统的是( )
A、HDFS
B、GFS
C、HBase
D、Hive
答案:B
MapReduce计算模型的描述,错误的是( )
A、MapReduce采用的是一种分而治之的思想
B、MapReduceMapReduce要求待处理数据集可以分解为能并行处理的小数据集
C、MapReduce适合于实时在线任务的应用场景
D、MapReduce可以处理离线任务
答案:C
Spark描述正确的是( )
A、Spark Streaming是将Stream数据分成小的时间片段(几秒)
B、Spark是专为大规模数据处理而设计的快速通用的计算引擎
C、内存计算下Spark比Hadoop快100倍
D、Spark不适合处理离线数据。
答案:D
下列关于人工智能技术描述错误的是( )
A、人工智能技术是大数据分析的重要方法
B、计算智能属于人工智能技术
C、深度学习通常需要昂贵的GPU设备,不太适合于大数据分析
D、传统的机器学习对硬件环境要求不高,适合大数据分析。
答案:C
聚类分析的描述错误的是( )
A、基于“物以类聚,人以分”思想
B、采用样本间距离度量相似性,将数据分类划分到已有类别
C、k-means算法适合于非此即彼的聚类分析方法
D、对于有层级关系的样本,可以采用自底向上的凝聚式层次聚类分析方法
答案:B
关于深度学习算法的描述,错误的是( )
A、深度学习通过组合低层特征形成更加抽象的高层特征或类别。
B、深度学习算法适合于语音识别、文字识别、智能客服等应用场景
C、深度学习应用于人脸识别时,首先根据每个像素的亮度来识别边缘,然后根据边缘再识别出轮廓,最后根据轮廓识别出特定图像。
D、KNN、SVM等算法属于深度学习算法。
答案:D
计算智能描述错误的是( )
A、计算智能是在生物遗传、变异、生长以及外部环境的自然选择中产生的
B、计算智能包括遗传算法、粒子算法、蚁算法等
C、粒子算法是模拟鸟随机搜索食物的算法
D、计算智能是局部最优算法
答案:D
深度学习开源软件框架描述,错误的是( )
A、TensorFlow支持多种操作系统和终端设备
B、Caffe支持命令行、 Python和MATLAB接口
C、PyTorch内嵌自动求导系统,使其成为最流行的动态图像处理框架
D、2018年PyTorch项目并入Caffe2项目。
答案:D
HDFS是基于google的GFS白皮书设计开源分布式文件系统
A、正确
B、错误
答案:A
啤酒和尿布的关系是沃尔玛分析消费者购物行为时,利用分类分析方法发现的规律
A、正确
B、错误
答案:B
下列对大数据4V特征的说法中,错误的是( )
A、数据规模大
B、数据价值密度高
C、数据类型多样
D、数据处理速度快
答案:B
按照KB、MB、GB、TB、PB的有小到大顺序,下列换算错误的是( )
A、1KB=1024Byte
B、1MB=1024KB
C、1TB=1024MB
D、1PB=1024TB
答案:C
下列关于大数据中计算机存储容量单位的说法中,错误的是( )
A、基本存储容量单位是字节(Byte),
B、汉字字符存储空间要大于英文字符存储空间
C、一个英文字符需要2个字节的存储空间
D、一个汉字字符需要2个字节的存储空间
答案:C
数据清洗的方法不包括( )
A、缺失数据处理
B、噪声数据清除
C、数据的一致性检查
D、数据的可视化
答案:D
非关系型数据库不包括( )
A、Hbase
B、Mapreduce
C、Neo4j
D、MongoDB
答案:B
数据库不包括( )
A、Hbase
B、MongoDB
C、Neo4j
D、Mapreduce
答案:D
下列关于分布式数据库的说法中,错误的是( )
A、分布式数据库系统通常使用较小的计算机系统
B、分布式数据库是物理上分散的数据库
C、分布式数据库是逻辑上统一的数据库
D、每台计算机中都一定有DBMS的一份完整拷贝副本
答案:D
大数据4V特征不包括( )
A、规模性(Volume)
B、真实性(Veracity)
C、多样性(Varity)
D、高速性(Velocity)
答案:B
大数据的4V特征仅仅是指数据的体量大。
A、正确
B、错误
hbase属于什么数据库答案:B
分布式数据库是指物理上分散在不同地点,但是逻辑上是统一的数据库。
A、正确
B、错误
答案:A

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。