CDA LEVEL 2大数据分析师典型例题及详解 来源:CDA数据分析师大纲解析
一、基础理论
1. 影响抽样平均误差大小的因素有:( )。
A.样本各单位标志值的差异程度
B.总体各单位标志值的差异程度
C.样本单位数
D.抽样方法
答案:BCD
解析:本题是数据分析的统计理论部分的考点,主要考核数理统计的关键知识点--抽样平均误差的基本概念,抽样平均误差是抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。抽样平均误差的计算公式如下表:
表1 抽样平均误差的计算公式表
从计算公式可以看出,抽样平均误差和总体各单位标志值的差异程度s成正比,和样本单位数成反比,而且不同的抽样方法也会影响抽样平均误差的大小,因此正确答案为BCD。
2. 删除文件命令为:( )。
A. mkdir
B. rmdir
C. mv
D. rm
答案:D
cda数据分析师3. 在使用mkdir命令创建新的目录时,在其父目录不存在时先创建父目录的选项是( D ) 。
A. -m
B. -d
C. -f
D. -p
【题】查看当前所在的目录位置,使用______________命令。
解析:查看当前所在的目录位置,使用pwd命令。
4.【题】在局域网络内的某台主机用ping命令测试网络连接时发现网络内部的主机都可以连同,而不能与公网连通,问题可能是( C )。
A 主机ip设置有误
B 没有设置连接局域网的网关
C 局域网的网关或主机的网关设置有误
D 局域网DNS服务器设置有误
5.【题】下列文件中,包含了主机名到ip地址的映射关系的文件是:( B )。
A. /etc/HOSTNAME
B. /etc/hosts
C. /f
D. /etc/networks
解析:在配置SSH无密码访问时,其中一个步骤就是修改/etc/hosts文件,配置主机名到ip地址的映射关系。
6.【题】测试网络连通的命令是__________________。
解析:测试网络连通的命令是ping。
7. 【题】按照ubuntu版本发行规律,2016年04月发行的版本,版本号应该为_______。
解析:按照ubuntu版本发行规律,2016年04月发行的版本,版本号应该为16.04,这个版本应该是长期支持版本。
8. 【题】ubuntu下安装管理软件包使用_______命令。
解析:ubuntu下安装管理软件包使用apt-get命令。
9.【题】在ubuntu中,如何查看文件的权限?
解析:
可以用ls –al命令来观察文件的权限,每个文件的权限都用10位表示,并分为四段,其中第一段占 1 位,表示文件类型,第二段占3位,表示文件所有者对该文件的权限。
10.【题】在Linux系统中,压缩文件后生成后缀为.gz文件的命令是:(D)
A. zip
B. tar
C. jar
D. gzip
解析:
在 Linux系统中,压缩文件后生成后缀为.gz文件的命令是gzip。
11.【题】在Linux系统中,cp命令的作用是___________________________。
解析:cp命令在linux中的作用是用于复制文件到目的文件。
12. 在进行伪分布配置hadoop时,使用的SSH加密软件是( A )
A.OpenSSH
B. SSH
C. RSA
13.【题】如何开启linux的ssh服务?
解析:
在ubuntu系统下可以按照如下步骤开启ssh服务:
1) 首先使用netstat命令来判断是否已经启动了ssh服务, ssh服务的缺
省端口号是22
2) 如果没有安装ssh服务,可以通过执行$ sudo apt-get install openssh-
server 来进行安装
3) 通过一个客户端机器执行$ssh yourname@yourhost来判断是否能够
进行ssh访问
14. 【题】vi编辑器具有两种工作模式: _________________________________。
解析:vi编辑器有两种工作模式:命令模式和输入模式。
15. Hbase数据库使用Hbase shell怎样创建一张表(A)
A create ‘t1’,‘id’,‘name’
B create table t1(id number(10),name char(10))
C create table‘t1’,‘id’,‘name’
D create table‘t1’,‘id number(10)’,‘name char(10)’
解析:Hbase shell是一个简单的Hbase 操作工具,我们应当注意到它的用法和SQL语言的不同。当使用Hbase时,可能用Java、python、C++等等,语言可能有差别。也应该注意到,虽然Hbase中的表示按列存储的,我们依然能够从逻辑上把它们当做二维表来看待。
16. Hbase数据库的表中,可以单独的插入或者删除一行数据(A)
A 是
B 否
解析:Hbase数据库是存储在HDFS文件系统上的,我们都知道,HDFS文件系统是不支持随机修改单独一行数据的。因此,直接使用HDFS的数据仓库也不支持单独修改一行数据。但是Hbase的表,通过一种折中的方法实现了单行数据的随机修改。这点是和Hive数据仓库、HDFS文件系统有区别的,也是Hbase的重要优势所在。
17. 在Hbase中如何删除表t1(C)
A drop table t1
B truncate t1
C drop ‘t1’
D truncate table t1
解析:这是一个简单的考题,只要用Hbase shell做些实验就能熟悉起来。要注意区分删除表和删除表中所有数据的区别
18. Hbase的负载查询操作默认是通过那个分布式计算框架完成的(D)
A HDFS
B SPARK
C Hive
D MapReduce
解析:SPARK虽然也是分布式计算框架、一定情况下我们也能通过SPARK完成Hbase数据的查询,但这不是默认情况。所以选D。
19.使用Hbase的优势在于(ABCD)
A 相对Hive,Hbase支持随机查询
B 使用HDFS文件系统,让Hbase存储的扩展几乎随着节点数的增加线性扩展
C Hbase能够使用分布式计算,短时间内完成TB、PB级的数据搜索
D Hbase数据库数据块大小和HDFS数据库块大小一致更好
解析:当经常修改数据时,会在承Hbase数据块的扩大,当然根据参数设置,他们最终会分裂成两个较小的数据块,然后重新因为数据修改而增长体积。在超大规模的表中,数据储存结构会明显的影响性能。Hbase通过自动的拆分和合并块,能够提供更好的性能。
二、Hadoop理论
1.【题】用下面哪个命令来判断系统是否安装了java?( C D )
A. hdfs java
B. hadoop java
C. java -version
D. javac -version
2. Hadoop的安装模式有( ABC )
A单机模式 B伪分布式 C完全分布式 D 半分布式
3.【题】用下面哪个命令来判断系统是否安装了hadoop?( D )
A. hdfs java
B. hadoop java
C. hadoop -version
D. hadoop version
4.通过jps命令列表显示进程,以检查安装情况。仅作为slave节点将列出以下哪些服务:( )
A. NameNode
B. DataNode
C. ResourceManager
D. NodeManager
E. JobHistoryServer
答案:BD
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论