大数据开发基础(习题卷21)第1部分:单项选择题,共57题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]启动YARN后,默认的web访问端口是多少?
A)8000
B)9000
C)8080
D)8088
答案:D
解析:
2.[单选题]Shark与Spark SQL的关系是:( )
A)二者没有任何关系
B)Shark是Spark
C)Spark
D)二者是一个软件的两个不同名称,本质上是一个东西
答案:B
解析:
3.[单选题]下列有关 KNN 算法的流程顺序,描述正确的是()
①确定 K 的大小,和距离的计算方法
②根据 K 个样本的所属类别,投票决定测试样本的类别归属
③计算训练集样本与测试样本的距离,选出 K 个与测试样本最相似的样本
A)、① ② ③
B)、③ ② ①
C)、① ③ ②
D)、② ① ③
答案:C
解析:
4.[单选题]以下哪种方法属于判别式模型(discriminative model)
A)隐马模型(HMM)
B)朴素贝叶斯
C)LDA
D)支持向量机
答案:D
解析:
5.[单选题]从节点程序()。
A)NameNode
B)DataNode
C)SecondaryNameNode
D)Jobtracker
答案:B
解析:
A)挖掘
B)联系
C)搜集
D)洞察
答案:D
解析:
7.[单选题]将python中的.py文件转换为.pyc文件的组件为( )。
A)编辑器
B)编译器文件删除数据恢复
C)虚拟机
D)解释器
答案:B
解析:
8.[单选题]DRDS实例名称不能以( )开头。
A)小写字母
B)中文
C)大写字母
D)下划线
答案:B
解析:
9.[单选题]下列对Hadoop存储机制描述不正确的是( )。
A)HDFS中的默认的存储单元是64M的数据块
B)在HDFS中,如果一个文件的大小小于一个数据块的大小,它是不需要占用整个数据块的存储空间的
C)HDFS中的默认的存储单元是32M的数据块
D)在HDFS中有量中两种重要的节点分别是NameNode和DataNode
答案:C
解析:
spring cloud security10.[单选题]关于Hive自定义UDF描述错误的是?
A)永久函数,可以在多个会话中使用,不需要每次创建
B)用户定义表生成函数UDTF,用于接受多个输入数据行,并产生一个输入数据行
C)临时函数,只能在当会话使用,重启会话后需要重新创建
D)普通的UDF,用于操作单个数据行,且产主一个数据行为输出
答案:B
解析:
11.[单选题]每一个Reducer类的实例生成了一个Java进程,负责处理某一个()上的数据
A)Map
B)Partition
C)Sort
D)Combine
答案:B
解析:
12.[单选题]下列关于 Flink barrier 描述错误的是?
A)一个 barrier 将本周期快照的数据与下一个周期快照的数据分隔开来
B)barrier 是Flink 快照的核心
D)barrier 周期性插入到数据流中,并作为数据流的一部分随之流动
答案:C
解析:
13.[单选题](__)不是遗传算法基本算子。
A)选择
B)感染
C)突变
D)交叉
答案:B
解析:
python基础知识单选题14.[单选题]()是企业级业务能力共享平台,将企业的核心业务处理能力沉淀为各共享能力中心,
提供“敏捷、快速、低成本”创新能力和统一的企业级共享服务,持续提升业务创新效
率。
A)、技术中台
B)、数据中台
C)、业务中台
D)、云平台
答案:C
解析:
15.[单选题]np.array split()函数的作用是(__)。
A)沿着它的水平轴分割
B)沿着纵向的轴分割
C)允许指定沿哪个轴分割
D)按深度方向分割
答案:C
解析:
16.[单选题]F1参数( ),说明模型越稳定。
A)越小
B)越大
C)越趋近于某一特定值
D)F1参数和模型稳定性没有关系
答案:B
解析:
17.[单选题]将内存引用赋值给另一个变量的操作叫(__)。
A)深拷贝
B)指针
C)参数实例化
D)浅拷贝
答案:D
解析:
18.[单选题]Maxcompute表T中某列C的数据类型为bigint,需要修改为double,以下( )方式可以实现。
A)将表T删掉重建
B)ALTER TABLE T COLUMN C RENAME TO C DOUBLE;
C)ALTER TABLE T DROP COLUMN C;ALTER TABLE T ADD C DOUBLE;
解析:
19.[单选题]通过DMS管理后台或者数据库客户端,连接RDS数据库时,提示错误信息“max_user_connections”,代表( )含义。
A)IOPS超出极限
B)RDS空间满了
C)网络中断
D)RDS数据库的连接数满了
答案:D
解析:
20.[单选题]以下图像分割方法中,不属于基于图像灰度分布的阈值方法的是(___)。二叉树遍历注意事项
A)类间最大距离法
B)最大类间、内方差比法
C)p-参数法
D)区域生长法
答案:D
解析:
21.[单选题]()对监管数据质量承担最终责任
A)董事长
B)风险管理部
C)行长
D)数据运管部
答案:A
解析:
22.[单选题]构建一个神经网络,将前一层的输出和它自身作为输入( )有反馈连接
A)循环神经网络
B)卷积神经网络
C)限制玻尔兹曼机
D)都不是
楞严咒属于什么法门答案:A
解析:
23.[单选题]阅读下面的程序:li_one = [2, 1, 5, 6]print(sorted(li_one[:2]))运行程序,输出结果是( )。
A)[1 ,2]
B)[2 ,1]
C)[1 ,2 ,5 ,6]
D)[6 ,5 ,2 ,1]
答案:A
解析:
24.[单选题]以下聚合函数求个数的是( )
A)AVG
B)SUM
C)MAX
D)COUNT
答案:D
25.[单选题]假设你在卷积神经网络的第一层中有5个卷积核,每个卷积核尺寸为7x7,具有零填充且步幅为1该层的输入图片的维度是224x224x3那么该层输出的维度是( )
A)217x217x3
B)217x217x8
C)218x218x5
D)220x220x7
答案:C
解析:
26.[单选题]如果我们现有一个安装2.6.5版本的Hadoop集,在不修改默认配置的情况下存储200个200M的文本文件,请问最终会在集中产生()个数据块(包括副本)。
A)200
B)40000
C)400
D)1200
答案:D
解析:在默认情况下,HDFS集默认存储文件3份,并且大文件会按照 128M的数据块大小(Hadoop2.× 版本以前的默认数据块的大小是64M,到了Hadoop2.×版本以后,默认的数据块大小就变成了128M)进行切割分散存储。所以题目中的总数据块有200×2=400 个,再加上会存储三份,共有400×3=1200个。
27.[单选题]决策树的基本流程遵循()的策略。
A)贪心
B)最优化
C)分而治之
D)顺序
答案:C
解析:
28.[单选题]关于数据分析,下列说法正确的是()。
A)描述性分析和预测性分析是诊断性分析的基础
B)诊断性分析是对规范性分析的进一步理解
C)预测性分析是规范性分析的基础
javabean属于java么D)规范性分析是数据分析的最高阶段,可以直接产生产业价值
答案:C
解析:在数据分析中,流程分为以下方式;描述性分析、诊断性分析、预测性分析、规范性分析。
29.[单选题]以下不属于数据治理工作的主要内容的有(__)。
A)理解自己的数据
B)数据部门的建立
C)有效监督与动态优化
D)岗位工资的定义
答案:D
解析:
30.[单选题]评估完模型之后,发现模型存在高偏差(highbi踊),应采取的解决方法是()
A)减少模型的特征数量
B)增加模型的特征数量
C)增加样本数量
D)以上答案都正确

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。