大数据技术原理与应用
1. 数据产生方式的变革主要经历了三个阶段,以下哪个不属于这三个阶段:1.数据产生方式的变革主要经历了三个阶段,以下哪个不属于这三个阶段:() [单选题] *
A.数据流阶段(正确答案)
B.运营式系统阶段
C.用户原创内容阶段
D.感知式系统阶段
2. 2单选(2分)第三次信息化浪潮的发生标志是以下哪种技术的普及() [单选题] *
A.物联网、云计算和大数据(正确答案)
B.CPU
C.个人计算机
D.互联网
3. 3单选(2分)1TB = ( )MB() [单选题] *
A.2^20(备注:2的20次方)(正确答案)
B.1024
C.1000
D.2^10(备注:2的10次方)
4. 4单选(2分)Hadoop的两大核心是 和 () [单选题] *
A.HDFS; HBase
B.MapReduce; HBase
C.GFS; MapReduce
D.HDFS; MapReduce(正确答案)
5. 5单选(2分)HDFS默认的一个块大小是() [单选题] *
A.32KB
B.8KB
C.64MB(正确答案)
D.16KB
6. 6单选(2分)在分布式文件系统HDFS中, 负责数据的存储和读取() [单选题] *
A.数据节点(正确答案)
B.名称节点
C.主节点
D.第二名称节点
7. 7单选(2分)上传当前目录下的本地文件到分布式文件系统HDFS的“/path”目录下的Shell命令是() [单选题] *
A.hdfs fs - /path
B.hdfs dfs - /path(正确答案)
C.hadoop dfs -put /
D.hdfs dfs -put /
8. 8单选(2分)在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文件夹dir,正确的shell命令是() [单选题] *
A.hadoop dfs -mkdir /test/dir
B.hadoop fs -mkdir -p /test/dir(正确答案)
C.hdfs fs -mkdir -p /test/dir
D.hdfs dfs *mkdir -p /test/dir
9. 9单选(2分)下列有关HBase的说法正确的是() [单选题] *
A.HBase是针对谷歌BigTable的开源实现,是高可靠、高性能的图数据库
B.在向数据库中插入记录时,HBase和关系数据库一样,每次都是以“行”为单位把整条记录插入数据库
C.HBase数据库表可以设置该表任意列作为索引
D.HBase是一种NoSQL数据库(正确答案)
10. 10单选(2分)已知一张表student存储在HBase中,向表中插入一条记录{id:2015001,name:Mary{score:math}:88},其id作为行键,其中,在插入数学成绩88分时,正确的命令是() [单选题] *
A.put ‘student’,‘score:math’,‘88’
B.put ‘student’,‘2015001’,‘score:math’,'88’(正确答案)
C.put ‘student’,‘2015001’,‘88’
D.put ‘student’,‘2015001’,‘math’,‘88’
11. 11单选(2分)NoSQL数据库的三大理论基石不包括() [单选题] *
A.ACID(正确答案)
B.CAP
C.最终一致性
D.BASE
12. 12单选(2分)在设计词频统计的MapReduce程序时,对于文本行“hello bigdata hello hado
op”,经过map函数处理后直接输出的结果应该是(没有发生combine和merge操作)() [单选题] *
A.
B.
C.
D.(正确答案)
13. 13单选(2分)假设已经配置好PATH环境变量,启动hadoop的命令是() [单选题] *
hbase官方文档
A.start-hadoop.sh
B.start-hdfs.sh
C.start-fs.sh
D.start-dfs.sh(正确答案)
14. 14单选(2分)下列说法错误的是() [单选题] *
A.HDFS HA可以解决单点故障问题
B.HDFS Federation使得HDFS的命名服务能够水平扩展
C.第二名称节点无法解决单点故障问题
D.第二名称节点是热备份,而HDFS HA不是热备份(正确答案)
15. 15单选(2分)RDD操作包括转换(Transformation)和动作(Action)两种类型,下列RDD操作属于动作(Action)类型的是() [单选题] *
A.map
B.join
C.groupBy
D.collect(正确答案)
16. 16单选(2分)下列关于Hive的说法正确的是() [单选题] *
A.Hive不支持索引
B.Hive支持批量导入(正确答案)
C.Hive的可扩展性差
D.Hive支持频繁数据更新
17. 17多选(3分)大数据的特点包括() *
A.数据种类繁多(正确答案)
B.价值密度低(正确答案)
C.处理速度快(正确答案)
D.数据量大(正确答案)
18. 18多选(3分)下列适用于批处理计算的框架有哪些() *
A.MapReduce(正确答案)
B.Pregel
C.Storm
D.Spark(正确答案)
19. 19多选(3分)下列适用于流计算的框架有哪些() *
A.Spark Streaming(正确答案)
B.Dremel
C.Pregel
D.Storm(正确答案)
20. 20多选(3分)下列适用于图计算的框架有哪些() *
A.Hama(正确答案)
B.GraphX(正确答案)
C.Pregel(正确答案)
D.Impala
21. 21多选(3分)从技术架构上来看,物联网可以分为哪几层() *
A.网络层(正确答案)
B.应用层(正确答案)
C.处理层(正确答案)
D.感知层(正确答案)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。