大数据技术原理与应用
1. 数据产生方式的变革主要经历了三个阶段,以下哪个不属于这三个阶段:1.数据产生方式的变革主要经历了三个阶段,以下哪个不属于这三个阶段:() [单选题] *
A.数据流阶段(正确答案) |
B.运营式系统阶段 |
C.用户原创内容阶段 |
D.感知式系统阶段 |
2. 2单选(2分)第三次信息化浪潮的发生标志是以下哪种技术的普及() [单选题] *
A.物联网、云计算和大数据(正确答案) |
B.CPU |
C.个人计算机 |
D.互联网 |
3. 3单选(2分)1TB = ( )MB() [单选题] *
A.2^20(备注:2的20次方)(正确答案) |
B.1024 |
C.1000 |
D.2^10(备注:2的10次方) |
4. 4单选(2分)Hadoop的两大核心是 和 () [单选题] *
A.HDFS; HBase |
B.MapReduce; HBase |
C.GFS; MapReduce |
D.HDFS; MapReduce(正确答案) |
5. 5单选(2分)HDFS默认的一个块大小是() [单选题] *
A.32KB |
B.8KB |
C.64MB(正确答案) |
D.16KB |
6. 6单选(2分)在分布式文件系统HDFS中, 负责数据的存储和读取() [单选题] *
A.数据节点(正确答案) |
B.名称节点 |
C.主节点 |
D.第二名称节点 |
7. 7单选(2分)上传当前目录下的本地文件到分布式文件系统HDFS的“/path”目录下的Shell命令是() [单选题] *
A.hdfs fs - /path |
B.hdfs dfs - /path(正确答案) |
C.hadoop dfs -put / |
D.hdfs dfs -put / |
8. 8单选(2分)在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文件夹dir,正确的shell命令是() [单选题] *
A.hadoop dfs -mkdir /test/dir |
B.hadoop fs -mkdir -p /test/dir(正确答案) |
C.hdfs fs -mkdir -p /test/dir |
D.hdfs dfs *mkdir -p /test/dir |
9. 9单选(2分)下列有关HBase的说法正确的是() [单选题] *
A.HBase是针对谷歌BigTable的开源实现,是高可靠、高性能的图数据库 |
B.在向数据库中插入记录时,HBase和关系数据库一样,每次都是以“行”为单位把整条记录插入数据库 |
C.HBase数据库表可以设置该表任意列作为索引 |
D.HBase是一种NoSQL数据库(正确答案) |
10. 10单选(2分)已知一张表student存储在HBase中,向表中插入一条记录{id:2015001,name:Mary{score:math}:88},其id作为行键,其中,在插入数学成绩88分时,正确的命令是() [单选题] *
A.put ‘student’,‘score:math’,‘88’ |
B.put ‘student’,‘2015001’,‘score:math’,'88’(正确答案) |
C.put ‘student’,‘2015001’,‘88’ |
D.put ‘student’,‘2015001’,‘math’,‘88’ |
11. 11单选(2分)NoSQL数据库的三大理论基石不包括() [单选题] *
A.ACID(正确答案) |
B.CAP |
C.最终一致性 |
D.BASE |
12. 12单选(2分)在设计词频统计的MapReduce程序时,对于文本行“hello bigdata hello hado
op”,经过map函数处理后直接输出的结果应该是(没有发生combine和merge操作)() [单选题] *
A. |
B. |
C. |
D.(正确答案) |
13. 13单选(2分)假设已经配置好PATH环境变量,启动hadoop的命令是() [单选题] *
A.start-hadoop.sh |
B.start-hdfs.sh |
C.start-fs.sh |
D.start-dfs.sh(正确答案) |
14. 14单选(2分)下列说法错误的是() [单选题] *
A.HDFS HA可以解决单点故障问题 |
B.HDFS Federation使得HDFS的命名服务能够水平扩展 |
C.第二名称节点无法解决单点故障问题 |
D.第二名称节点是热备份,而HDFS HA不是热备份(正确答案) |
15. 15单选(2分)RDD操作包括转换(Transformation)和动作(Action)两种类型,下列RDD操作属于动作(Action)类型的是() [单选题] *
A.map |
B.join |
C.groupBy |
D.collect(正确答案) |
16. 16单选(2分)下列关于Hive的说法正确的是() [单选题] *
A.Hive不支持索引 |
B.Hive支持批量导入(正确答案) |
C.Hive的可扩展性差 |
D.Hive支持频繁数据更新 |
17. 17多选(3分)大数据的特点包括() *
A.数据种类繁多(正确答案) |
B.价值密度低(正确答案) |
C.处理速度快(正确答案) |
D.数据量大(正确答案) |
18. 18多选(3分)下列适用于批处理计算的框架有哪些() *
A.MapReduce(正确答案) |
B.Pregel |
C.Storm |
D.Spark(正确答案) |
19. 19多选(3分)下列适用于流计算的框架有哪些() *
A.Spark Streaming(正确答案) |
B.Dremel |
C.Pregel |
D.Storm(正确答案) |
20. 20多选(3分)下列适用于图计算的框架有哪些() *
A.Hama(正确答案) |
B.GraphX(正确答案) |
C.Pregel(正确答案) |
D.Impala |
21. 21多选(3分)从技术架构上来看,物联网可以分为哪几层() *
A.网络层(正确答案) |
B.应用层(正确答案) |
C.处理层(正确答案) |
D.感知层(正确答案) |
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论