大数据挖掘技术练习(试卷编号171)
1.[单选题]假设12个数字已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215,使用等高分箱,则第一个分箱序列为:
A)5,10,11,13
B)5,10,11,13,15,35,50,55,72
C)5,10,11,13,15
答案:A
解析:
2.[单选题]在数据预处理中,将多个数据源中的数据整合到一个一致的数据存储(如数据仓库)中,这一过程称为( )
A)数据提取
B)数据集成
C)数据清理
D)数据加载
答案:B
解析:
3.[单选题]下列不属于数据预处理原因的是( )。
A)数据有可能不能很好地反映潜在的模式
B)有些数据属性是无用的或者冗余的
C)数据可能存在缺失、错误、不一致等问题
D)数据量过于庞大
答案:D
解析:
4.[单选题]已知x = [1, 2, 3],执行语句x.append(4)之后,x的值是( )
A)[1, 2, 3, 4]
B)[4]
C)[1, 2, 3]
D)4
答案:A
解析:
5.[单选题]对于开通4G业务的用户,如果需要使用VoLTE业务,是否需要更换手机卡,是否需要更换VoLTE终端?
A)不需要更换手机卡,需要使用VoLTE终端
B)不需要更换手机卡,不需要使用VoLTE终端
C)需要更换手机卡,需要使用VoLTE终端
D)需要更换手机卡,不需要使用VoLTE终端
答案:A
解析:
6.[单选题]访问网页成功,返回的结果为: url=" (url) print(rq.status_code)
A)200
B)304
C)403
D)500
答案:A
解析:
7.[单选题]假设 12 个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15 在第几个箱子内? ( )
A)第一个
B)第二个
C)第三个
D)第四个
答案:B
解析:
8.[单选题]字典对象的______________方法返回字典的“值”列表
A)keys()
B)key()
C)values()
D)items()
答案:C
解析:
9.[单选题]在多元回归模型的检验中,目的是检验每一个自变量与因变量在指定显著性水平上是否存在线性相关关系的检验是()
A)r 检验
B)t 检验
C)f 检验
D)DW 检验
答案:B
解析:
10.[单选题]有学生选课表sc,其结构如下: sc(学号, 课程号, 成绩), 用SQL检索同时选修课程号为“C1”
和“C5”的学生的学号的正确命令是______。
A)SELECT 学号 FROM sc WHERE 课程号='C1' AND 课程号='C5';
B)SELECT 学号 FROM sc WHERE 课程号='C1' AND 课程号= (SELECT 课程号 FROM sc WHERE 课程号='C5');
C)SELECT 学号 FROM sc WHERE 课程号='C1' AND 学号= (SELECT 学号 FROM sc WHERE 课程号='C5');
D)SELECT 学号 FROM sc WHERE 课程号='C1' AND 学号 IN (SELECT 学号 FROM sc WHERE 课程号='C5');
答案:D
解析:
11.[单选题]Hbase是哪种数据库?
A)关系型数据库
B)Nosql数据库
C)网状数据库
D)层次数据库
答案:B
解析:
12.[单选题]下列哪项最恰当地描述了建立TCP连接时“第一次握手”所做的工作
A)“连接发起方”向“接收方”发送一个SYN-ACK段
B)“接收方”向“连接发起方”发送一个SYN-ACK段
C)“连接发起方”向目标主机的TCP进程发送一个SYN段
D)“接收方”向源主机的TCP进程发送一个SYN段作为应答
答案:C
解析:
13.[单选题]以下关于SELECT语句叙述错误的是______。
A)SELECT语句中可以使用别名
B)SELECT语句中只能包含表中的字段列及其构成的表达式
C)SELECT语句规定了结果集中的列顺序
D)如果FROM子句引用的两个表有同名的列,则SELECT语句引用这些列时必须添加表名称作为前缀答案:B
解析:
14.[单选题]FTP服务器使用的熟知端口是()
A)20
B)21
C)22
D)23
答案:A
解析:
15.[单选题]使用 urlopen()方法发送请求后,服务器会返回一个____类型的对象。
A)HTTPResponse
B)ResponseHTTP
C)Response
D)ServiceResponse
答案:A
解析:
16.[单选题]若I={a,b,c,d},D中含有10个事务,(a,b}和{a,c}是一个频繁项集,则以下叙述中
正确的是( )。
A){a,b,d}一定是频繁项集
B){a,b,c}一定是频繁项集
C){b,c}一定是频繁项集
D)以上都不对
答案:D
解析:
17.[单选题]一般,k-NN最近邻方法在( )的情况下效果较好
A)样本较多但典型性不好
B)样本较少但典型性好
C)样本呈团状分布
D)样本呈链状分布
答案:B
解析:
18.[单选题]假设某分类器在一个测试数据集上的分类结果的混淆矩阵如下所示,该分类器的召回率为()。
Predicted
yesno
Actual yes155
no1020
A)75%
B)80%
C)60%
D)70%
答案:A
解析:
19.[单选题]下列哪个指标是利用MR进行计算的()
A)VOLTE用户网络原因万投比
B)VOLTE用户VOLTE话务量占比
C)MR综合覆盖率
D)VOLTE超频注册占比
答案:C
解析:
20.[单选题]以下哪个指标不是家客数据端到端指标
A)网页首屏时延
B)网页打开成功率
C)视频平均播放卡顿次数
D)4G占网时长占比
答案:D
解析:
21.[单选题]受样本个数限制,若某个属性值在训练集中没有与某个同类同时出现过,如P清脆|是=P (敲声=清脆|好瓜=是)=0/8=0,则连乘公式 h (好瓜=是)则必为零,其他属性取任意值都不能改变这一结论。()方法可以修正这一缺陷
A)拉普拉斯变换
B)拉普拉斯定理
C)拉普拉斯平滑处理
D)拉普拉斯方程
答案:C
解析:
22.[单选题]相关分析与回归分析的一个重要区别是()
A)前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示
B)前者研究变量之间的变动关系,后者研究变量间关系的密切程度
C)两者都研究变量间的变动关系
D)两者都不研究变量间的变动关系
答案:Ahbase属于什么类型数据库
解析:
23.[单选题]收到全省性的咪咕阅读业务无法使用问题,下述维度中优先排查的是哪个
A)终端
B)PGW
C)地市
D)MME
答案:C
解析:
24.[单选题]熵表示为消除不确定性所需要的信息量,投掷均匀正六面体骰子的熵是( )比特。
A)1
B)2.6
C)3.2
D)3.8
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论