大数据开发基础(习题卷19)
第1部分:单项选择题,共57题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]下列关于智能物流的描述错误的是()。
A)是利用智能化技术,使物流技术能模仿人的智能,具有思维、感知、学习、推理判断和自行解决物流中某些问题的能力
B)实现物流资源优化配置和有效调度,并且提示物流系统效率
C)智能物流概念源于2010年IBM发布的研究报告《智慧的未来供应链》
D)提高了物流活动的一体化,增加了物流的复杂性
正则化是结构风险最小化策略的实现答案:D
解析:
2.[单选题]业务中台方面,以业务为导向,优先建设( )。
A)电网资源业务中台和客户服务业务中台
B)电网资源业务中台和账务结算业务中台
C)统一数据业务中台和客户服务业务中台
D)统一数据业务中台和账务结算业务中台
答案:A
解析:
3.[单选题]机器学习中L1正则化和 L2正则化的区别是()。
A)使用L1可以得到稀疏的权值,使用 L2可以得到平滑的权值
B)使用L1可以得到平滑的权值,使用L2可以得到平滑的权值
C)使用L1 可以得到平滑的权值,使用L2可以得到稀疏的权值
D)使用L1 可以得到稀疏的权值,使用L2可以得到稀疏的权值
答案:A
解析:使用 L1可以得到稀疏的权值,使用L2可以得到平滑的权值。
4.[单选题]数据恢复必须坚持审批登记制。需要恢复数据时,报批准后方可进行;恢复数据必须坚持(),一人操作,一人监督,并详细登记;恢复过程中若有异常情况,应及时与有关技术人员联系,不得任意处理;若恢复异常对业务造成重大影响,必须向主管领导汇报,并组织实施补救。
A)双人制
B)复核制
C)AA制
D)单人制
答案:A
解析:
5.[单选题]关于GaussDB 200的数据导入导出下列说法正确的是()?
A)GDs在数据导入时可以做预处理,比如非法字符詟换密错处理教据聚合等。
B)COPY方式使用简单,一般用在大量数据的导入导出中。
C)INSERT数据写入适合数据量不大,并发度不高的场景
D)使用gsq元命令和cOPY命令在使用和用法上是样的。
答案:A
解析:
6.[单选题]关于 k-meA、ns 说法不正确的是()
A)、k-meA、ns 聚类是一种典型的基于距离的聚类算法
B)、它采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大
C)、k-meA、ns 聚类的目的是寻固定数目的簇,而每个簇由距离靠近的对象组成
D)、在 k-meA、ns 聚类中,k 个初始聚类中心点的选取对聚类结果的影响不是很大
答案:D
解析:
7.[单选题]业务部门根据需要制定()需求,提交新增数据申请,数据资产管理归口部门依据当前外部数据资源状况统筹组织获取,在公司内部共享使用。
A)外部数据
B)内部数据
C)公共数据
D)结构数据
答案:A
解析:
8.[单选题]支持向量机的优化问题是最小化的平方,这实现了(__)。
A)几何间隔为1/的最大间隔超平面
B)几何间隔为的最大间隔超平面
C)几何间隔为1/的最小间隔超平面
D)几何间隔为的最小间隔超平面
答案:A
解析:
9.[单选题]有关MapReduce的输入输出,说法错误的是
A)链接多个MapReduce作业时,序列文件是首选格式
B)FileInputFormat中实现的getSplits()可以把输入数据划分为分片,分片数目和大小任意定义
C)想完全禁止输出,可以使用NullOutputFormat
D)每个reduce需将它的输出写入自己的文件中,输出无需分片
答案:B
解析:分片数目在numSplits中限定,分片大小必须大于mapred.min.size个字节,但小于文件系统的块
10.[单选题]( )代表了Oracle数据库中最小粒度的逻辑数据存储层次。
A)表空间
B)盘区
C)数据文件
D)数据块
答案:D
解析:
11.[单选题]以下哪项不属于Apache 顶级项目?
A)Flink
B)Storm
C)Eclipse
D)Spark
答案:C
解析:
12.[单选题]朴素贝叶斯是一种简单但是非常强大的( )
A)线性分类器
B)分析器
C)逻辑分析器
D)以上说法都不对
答案:A
解析:
13.[单选题]以下描述错误的是:()
A)传统的关系数据库可以较好地支持结构化数据存储和管理
B)Web 0的迅猛发展以及大数据时代的到来,使关系数据库的发展越来越力不从心
C)传统的关系数据库由于数据模型不灵活、水平扩展能力较差等局限性,已经无法满足各 种类型的非结构化数据的大规模存储需求
D)传统关系数据库引以为豪的一些关键特性,如事务机制和支持复杂査询,在Web 0时 代成为不可或缺的核心特性
答案:D
解析:
14.[单选题]下列有关Hive建表语句写法正确的是( )。
A)NEW TABLE employees( empID INT, name STRING);
B)CREATE TABLE employees(empID INT, name STRING);
C)NEW TABLE employees(INT empID, STRING name);
D)CREATE TABLE employees(INT empID, STRING name);
答案:B
解析:
15.[单选题]以下关于随机森林的说法正确的是( )
A)随机森林对于高维数据集的处理能力比较好
B)在对缺失数据进行估计时,随机森林是一个十分有效的方法
C)当存在分类不平衡的情况时,随机森林能够提供平衡数据集误差的有效方法
D)以上答案都正确
答案:D
解析:
16.[单选题]使用While循环语句时,如果想要使程序无限循环运行,则下列哪个选项可作为循环的判断语句( )
A)3.1
B)3.1>2.3
C)0
D)X=Y
答案:B
解析:
17.[单选题]非关系型数据库不包括
A)Hbase
B)Mapreduce
C)Neo4j
D)MongoDB
答案:B
解析:
18.[单选题]敏感信息核验中不包含以下哪类信息的核验:( )
A)用户实名制验证
B)联系人验证
C)用户上网行为验证
D)通话交叉验证
答案:C
解析:
19.[单选题]ADS的普通表的一级分区数量最多有( )。
A)无限制
B)128个
C)256个
D)1000个
答案:C
解析:
20.[单选题]以下表示返回系统当前日期的函数是( )
A)SystemDatetime
B)UnixtimeToDate
C)Datepart
D)FormatDate
答案:A
解析:
21.[单选题]Spark应用程序在集上以( )进程集合的形式运行。
A)独立
B)并发
C)分布式
D)多
答案:A
解析:
22.[单选题]下列方法中,用于向文件中写内容的是( )
A)open
B)write
C)close
D)read
答案:B
解析:
23.[单选题]执行以下代码段def describe_pet(animal_type, pet_name): print("I have a " + animal_type + ".") print("My " + animal_type + "'s name is " + pet_name.title() + ".")describe_pet('harry', 'hamster')时
,输出为( )。
A)I have a harry.My harry's name is Harry.
B)I have a harry.My harry's name is Hamster.
C)I have a hamster.My hamster's name is Hamster.
D)I have a hamster.My hamster's name is Harry.
答案:B
解析:
24.[单选题]LSM更能保证哪种操作的性能?
A)读
B)写
C)随机读
D)合并
答案:B
解析:LSM的思想,在于对数据的修改增量保持在内存中,达到指定的限制后将这些修改操作批量写入到磁盘中,相比较于写入操作的高性能,读取需要合并内存中最近修改的操作和磁盘中历史的数据,即需要先看是否在内存中,若没有命中,还要访问磁盘文件。
25.[单选题]如果A不等于null,则返回true,反之返回false的条件是( )
A)A IS NULL
B)A NOT NULL
C)A IS NOT NULL
D)A OR NOT NULL
答案:C
解析:
26.[单选题]关于 OLAP 的特性,下面正确的是:①快速性;②可分析性:③多维性:④信息 性;⑤共享性( )
A)①②③
B)②③④
C)①②③④
D)①②③④⑤
答案:D
解析:
27.[单选题]有如下程序:def C2F(c): return c * 9//5 + 13print(C2F(22))print(C2F(0))程序的输出结果是( )。
A)5313
B)5213
C)3513
D)5713
答案:B
解析:
28.[单选题]下面关于数据产品开发相关描述正确的有(__)。
A)数据科学家的主要职责是“数据的管理”
B)数据科学家一定是科学家
C)“数据码农”可以胜任数据科学家
D)数据科学家是为解决现实世界中问题提供直接指导、依据或参考的高级专家
答案:D
解析:
29.[单选题]sklearn.decomposition.PCA()的作用是( )。
A)因子分析
B)数据降维
C)稀疏编码
D)唯一编码
答案:B
解析:PCA()是一种常用的降维方法,在数据维度较高时使用。
30.[单选题]K-Means 算法无法聚()样本。
A)圆形分布
B)螺旋分布
C)带状分布
D)凸多边形分布
答案:B
解析:K-Means算法是基于距离测量的,无法聚非凸形状的样本。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。