cdalevel2大数据分析师典型例题及详解--688IT编程网

CDA LEVEL 2大数据分析师典型例题及详解来源：CDA数据分析师大纲解析

一、基础理论

1. 影响抽样平均误差大小的因素有：（）。

A．样本各单位标志值的差异程度

B．总体各单位标志值的差异程度

C．样本单位数

D．抽样方法

答案：BCD

解析：本题是数据分析的统计理论部分的考点，主要考核数理统计的关键知识点--抽样平均误差的基本概念，抽样平均误差是抽样平均数（或抽样成数）的标准差。它反映抽样平均数（或抽样成数）与总体平均数（或总体成数）的平均误差程度。抽样平均误差的计算公式如下表：

表1 抽样平均误差的计算公式表

从计算公式可以看出，抽样平均误差和总体各单位标志值的差异程度s成正比，和样本单位数成反比，而且不同的抽样方法也会影响抽样平均误差的大小，因此正确答案为BCD。

2. 删除文件命令为：( )。

A. mkdir

B. rmdir

C. mv

D. rm

答案:D

cda数据分析师3. 在使用mkdir命令创建新的目录时，在其父目录不存在时先创建父目录的选项是( D ) 。

A. -m

B. -d

C. -f

D. -p

【题】查看当前所在的目录位置，使用______________命令。

解析：查看当前所在的目录位置，使用pwd命令。

4.【题】在局域网络内的某台主机用ping命令测试网络连接时发现网络内部的主机都可以连同，而不能与公网连通，问题可能是( C )。

A 主机ip设置有误

B 没有设置连接局域网的网关

C 局域网的网关或主机的网关设置有误

D 局域网DNS服务器设置有误

5.【题】下列文件中，包含了主机名到ip地址的映射关系的文件是：( B )。

A. /etc/HOSTNAME

B. /etc/hosts

C. /f

D. /etc/networks

解析：在配置SSH无密码访问时，其中一个步骤就是修改/etc/hosts文件，配置主机名到ip地址的映射关系。

6.【题】测试网络连通的命令是__________________。

解析：测试网络连通的命令是ping。

7. 【题】按照ubuntu版本发行规律，2016年04月发行的版本，版本号应该为_______。

解析：按照ubuntu版本发行规律，2016年04月发行的版本，版本号应该为16.04，这个版本应该是长期支持版本。

8. 【题】ubuntu下安装管理软件包使用_______命令。

解析：ubuntu下安装管理软件包使用apt-get命令。

9.【题】在ubuntu中，如何查看文件的权限？

解析：

可以用ls –al命令来观察文件的权限，每个文件的权限都用10位表示，并分为四段，其中第一段占 1 位，表示文件类型，第二段占3位，表示文件所有者对该文件的权限。

10.【题】在Linux系统中，压缩文件后生成后缀为.gz文件的命令是：(D)

A. zip

B. tar

C. jar

D. gzip

解析：

在 Linux系统中，压缩文件后生成后缀为.gz文件的命令是gzip。

11.【题】在Linux系统中，cp命令的作用是___________________________。

解析：cp命令在linux中的作用是用于复制文件到目的文件。

12. 在进行伪分布配置hadoop时，使用的SSH加密软件是（ A ）

A.OpenSSH

B. SSH

C. RSA

13.【题】如何开启linux的ssh服务？

解析：

在ubuntu系统下可以按照如下步骤开启ssh服务：

1) 首先使用netstat命令来判断是否已经启动了ssh服务, ssh服务的缺

省端口号是22

2) 如果没有安装ssh服务，可以通过执行$ sudo apt-get install openssh-

server 来进行安装

3) 通过一个客户端机器执行$ssh yourname@yourhost来判断是否能够

进行ssh访问

14. 【题】vi编辑器具有两种工作模式： _________________________________。

解析：vi编辑器有两种工作模式：命令模式和输入模式。

15. Hbase数据库使用Hbase shell怎样创建一张表（A）

A create ‘t1’，‘id’，‘name’

B create table t1（id number（10），name char（10））

C create table‘t1’，‘id’，‘name’

D create table‘t1’，‘id number（10）’，‘name char（10）’

解析：Hbase shell是一个简单的Hbase 操作工具，我们应当注意到它的用法和SQL语言的不同。当使用Hbase时，可能用Java、python、C++等等，语言可能有差别。也应该注意到，虽然Hbase中的表示按列存储的，我们依然能够从逻辑上把它们当做二维表来看待。

16. Hbase数据库的表中，可以单独的插入或者删除一行数据（A）

A 是

B 否

解析：Hbase数据库是存储在HDFS文件系统上的，我们都知道，HDFS文件系统是不支持随机修改单独一行数据的。因此，直接使用HDFS的数据仓库也不支持单独修改一行数据。但是Hbase的表，通过一种折中的方法实现了单行数据的随机修改。这点是和Hive数据仓库、HDFS文件系统有区别的，也是Hbase的重要优势所在。

17. 在Hbase中如何删除表t1（C）

A drop table t1

B truncate t1

C drop ‘t1’

D truncate table t1

解析：这是一个简单的考题，只要用Hbase shell做些实验就能熟悉起来。要注意区分删除表和删除表中所有数据的区别

18. Hbase的负载查询操作默认是通过那个分布式计算框架完成的（D）

A HDFS

B SPARK

C Hive

D MapReduce

解析：SPARK虽然也是分布式计算框架、一定情况下我们也能通过SPARK完成Hbase数据的查询，但这不是默认情况。所以选D。

19.使用Hbase的优势在于（ABCD）

A 相对Hive，Hbase支持随机查询

B 使用HDFS文件系统，让Hbase存储的扩展几乎随着节点数的增加线性扩展

C Hbase能够使用分布式计算，短时间内完成TB、PB级的数据搜索

D Hbase数据库数据块大小和HDFS数据库块大小一致更好

解析：当经常修改数据时，会在承Hbase数据块的扩大，当然根据参数设置，他们最终会分裂成两个较小的数据块，然后重新因为数据修改而增长体积。在超大规模的表中，数据储存结构会明显的影响性能。Hbase通过自动的拆分和合并块，能够提供更好的性能。

二、Hadoop理论

1.【题】用下面哪个命令来判断系统是否安装了java?( C D )

A. hdfs java

B. hadoop java

C. java -version

D. javac -version

2. Hadoop的安装模式有（ ABC ）

A单机模式 B伪分布式 C完全分布式 D 半分布式

3.【题】用下面哪个命令来判断系统是否安装了hadoop?( D )

A. hdfs java

B. hadoop java

C. hadoop -version

D. hadoop version

4.通过jps命令列表显示进程，以检查安装情况。仅作为slave节点将列出以下哪些服务：（）

A. NameNode

B. DataNode

C. ResourceManager

D. NodeManager

E. JobHistoryServer

答案：BD

688IT编程网

cdalevel2大数据分析师典型例题及详解

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

cdalevel2大数据分析师典型例题及详解

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行