大数据开发基础(试卷编号1111)
1.[单选题]下列是数学模块的是()
A)math
B)random
C)re
D)sax
答案:A
解析:
2.[单选题]下列代码要打开的文件应该在( )。f = open('', 'w')
A)C盘根目录
B)D盘根目录
C)Python安装目录
D)程序所在目录
答案:D
解析:
3.[单选题]type(1e6)的结果为( )。
A)<class 'int'>
B)<class 'oat'>
C)<class 'complex'>
D)<class 'bool'>
答案:B
解析:1e6 为 oat 类型。
4.[单选题]随机森林中的随机是指(
A)随便构建树模
B)随机选择一个树模型
C)随机选择多个树模型
D)在构建每个树模型时随机选择样本和特征
答案:D
解析:
5.[单选题]Python变量作为实参时,它和对应的形参之间数据传递方式是( )。
A)由形参传给实参
B)由实参传给形参
C)由实参传给形参,再由形参传给实参
D)在用户干预情况下,实参形参能相互传递
答案:D
解析:
6.[单选题]若设1.启动,2.诊断,3.建立,4.行动,5.学习,则DMM模型中的顺序为(__)。
A)12345
B)12354
C)13254
D)13245
答案:A
解析:
7.[单选题]python中,()是字符串格式化的方法
A)count
B)format
C)in
D)replace
答案:B
解析:
8.[单选题]以下关于StreamExecution持续查询过程的描述哪项是正确的?
A)获取最新敛据oftsets---oftsets与入ottsetLog--构道LogicalPlan--优化LogicalPlan--计算完成 commit--计算结果Sink
B)offsets 写入offsetLog--获取最新数据offsets-构造 LogicalPlan-优化LogicalPlan--计算结果Sink--计算完成commit
C)获取最新数据offsets--offsets写入offsetlog--构造LogicalPlan--优化LogicalPlan--计算结果Sink--计算完
成comit
D)获取最新数据ofsets--offsets写入--优化Logica1Plan--构造LogicalPlan--计算结果Sink--计算完成commit
答案:C
解析:
9.[单选题]下列关于数据分析的说法正确的是( )。
A)描述性分析和预测性分析是诊断性分析的基础
B)诊断性分析是对规范性分析的进一步理解
C)预测性分析是规范性分析的基础
D)规范性分析是数据分析的最高阶段,可以直接产生产业价值
答案:C
解析:在数据分析中,流程分为以下方式:描述性分析、诊断性分析、预测性分析、规范性分析。
10.[单选题]在HBase系统架构中,HMaster主要负责( )
A)Database和Region的管理工作
B)Database和Master的管理工作
C)Table和Region的管理工作
D)Table和Master的管理工作
11.[单选题]按照共享等级、共享范围和要求,制定数据资产共享目录,原则上()修订一次。
A)每一年
B)每两年
C)每三年
D)每四年
答案:A
解析:
12.[单选题]以下有关计算机编程语言说法错误的是?
A)编程语言是用于书写计算机程序的语言
B)计算机语言可分为机器语言、汇编语言、高级语言
C)计算机能识别和执行所有编程语言写的程序
D)C/C++、pascal、javpython都属于高级编程语言
答案:C
解析:
13.[单选题]使用逻辑回归对样本进行分类,得到训练样本的准确率和测试样本的准确率。现在,在数据中增加 一个新的特征,其它特征保持不变。然后重新训练测试。则下列说法正确的是()
A)训练样本准确率一定会降低
B)训练样本准确率一定增加或保持不变
C)测试样本准确率一定会降低
D)测试样本准确率一定增加或保持不变
答案:B
解析:
14.[单选题](__)是一类用图来表达变量相关关系的概率模型。
A)神经元模型
B)感知机模型
C)概率图模型
D)SVM
答案:C
解析:
15.[单选题]执行以下代码段import df)时,输出为( )。hbase属于什么数据库
A)(0.0, 1.0)
B)(1.0, 0.0)
C)(0.0, 2.0)
D)(2.0, 0.0)
答案:C
16.[单选题]以下是字符转换成字节的方法是
A)decode()
B)encode()
C)upper()
D)rstrip()
答案:B
解析:
17.[单选题]( )是一个在HDFS上开发的面向列的分布式数据库。
A)Hive
B)Pig
C)Mahout
D)Hbase
答案:D
解析:
18.[单选题]将灰度图像转换成二值图像的命令为()。
A)ind2gray
B)ind2rgb
C)im2bw
D)ind2bw
答案:C
解析:
19.[单选题]下列不属于视觉通道表现力评价指标的是( )。
A)精确性
B)可辨认性
C)可分离性
D)可转换性
答案:D
解析:在数据来源和目标用户已定的情况下,不同视觉通道的表现力不同。视觉通道的表现力的评价指标包括精确性、可辨认性、可分离性和视觉突出性。
20.[单选题]为了提高系统性能, Spark 采取"惰性计算模式",具体为( )。
A)执行 Transformation 操作时不会提交,只有执行 Action 操作时才会被提交到集 中开始被执行
B)执行 Action 操作时不会提交,只有执行 Transformation 操作时才会被提交到集中开始被执行
C)只有执行完 Action 操作和 Transformation 操作时,所有操作才会被提交到集中开始被执行
D)执行完 Action 操作或 Transformation 操作时都不会提交到集
21.[单选题]通过DMS( )管理其他阿里云帐号下的RDS实例。
A)只要有数据库帐号即可管理
B)通过DMS“实例授权”功能授权后即可管理
C)完全不可以
D)通过RAM授权后才能管理
答案:B
解析:
22.[单选题]( )是实现数据战略的重要保障。
A)数据管理
B)数据分析
C)数据治理
D)数据规划
答案:C
解析:
23.[单选题]以下关于人工神经网络(ANN)的描述错误的有( )
A)神经网络对训练数据中的噪声非常鲁棒
B)可以处理冗余特征
C)训练ANN是一个很耗时的过程
D)至少含有一个隐藏层的多层神经网络
答案:A
解析:
24.[单选题]业务部门根据需要制定()需求,提交新增数据申请,数据资产管理归口部门依据当前外部数据资源状况统筹组织获取,在公司内部共享使用。
A)外部数据
B)内部数据
C)公共数据
D)结构数据
答案:A
解析:
25.[单选题]DIKW金字塔模型中,顶层与底层的名称分别为( )。
A)智慧与数据
B)知识与数据
C)智慧与数值
D)知识与数值
答案:A

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。