大数据挖掘技术练习(习题卷21)
第1部分:单项选择题,共51题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]能够完全匹配字符串“back”和“back-end”的正则表达式包括()
A)r“\w{4}-\w{3}|\w{4}”
B)r“\w{4}|\w{4}-\w{3}”
C)r “\S±\S+|\S+”
D)r“\w*\b-\b\w*|\w*”
答案:B
解析:
2.[单选题]LTE中的TA概念哪个是错误的()
A)TAI由MCC+MNC+TAC三部分组成
B)TAC的FQDN格式为:tac-hb<x1x2>.tac-lb<x3x4>.tac.epc. mnc<MNC>.mcc<MCC>.
C)TAC与LAC可重叠使用
D)一个TA可由一个或多个小区构成
答案:B
解析:
3.[单选题]下列哪个不是专门用于可视化时间空间数据的技术:
A)等高线图
B)饼图
C)曲面图
D)矢量场图
答案:B
解析:
4.[单选题]2016年,集团公司提出了()内容质量保障体系
A)四维三步法
B)三维三步法
C)四维四步法
D)四维五步法
答案:A
解析:
5.[单选题]朴素贝叶斯算法的预测判定准则为()
A)对每个样本选择使条件风险R(c∣x)最小的类别标记
B)保证某一单一样本x 的风险最小
C)以可能性最小的输出作为输入对应输出
D)计算每一种输出的可能性
答案:A
解析:
6.[单选题]以下关于列表操作的描述,错误的是:
A)通过 append 方法可以向列表添加元素
D)通过 add 方法可以向列表添加元素
答案:D
解析:
7.[单选题]( )是数据仓库体系架构的重要组成部分,具备数据仓库的部分特征和OLTP 系统的部分特征。
A)E.SB;
B)D.M
C)ODS
D)E.TL
答案:C
解析:
8.[单选题]以下哪个不是VoLTE终端与LTE CSFB终端共有的性能指标()
A)掉话率
B)呼叫时延
C)IMS注册成功率
D)接通率
答案:C
解析:
9.[单选题]终端品牌与以下哪个用户特征无关
A)性别
B)ARPU
C)上网习惯
D)生活所在地理位置
答案:C
解析:
10.[单选题]KNN算法可以用于()
A)分类
B)回归
C)测试
D)分类和回归
答案:D
解析:
11.[单选题]决策树中不包含一下哪种结点,
A)根结点(root node)
B)内部结点(internal node)
C)外部结点(external node)
D)叶结点(leaf node)
交易时间字符串是什么答案:C
解析:
12.[单选题]若MySQL数据表中有姓名为“李建华”的记录,下列无法查出“李建华”的表达式是______。
A)Like "华"
B)Like "%华"
C)Like "%华%"
D)Like "__华"
13.[单选题]以下叙述正确的是( )
A)极差较少受异常值的影响
B)四分位差较少受异常值的影响
C)方差较少受异常值的影响
D)标准差较少受异常值的影响
答案:B
解析:
14.[单选题]设有如下所示的某商场购物记录集合,每个购物篮中包含若干商品:
现在要基于该数据集进行关联规则挖掘。如果设置最小支持度为 60%,则如下频繁项集中,符合条件的是( )
A)鸡蛋,尿布
B)面包,尿布,牛奶
C)面包,牛奶
D)面包,啤酒,尿布
答案:C
解析:
15.[单选题]P(22,1,42,10),Q(20,0,36,8)为两个向量对象,这两个对象的曼哈顿距离是( )。
A)6
B)三次根号下233
C)根号下45
D)11
答案:D
解析:
16.[单选题]k均值聚类的目标是( )。
A)最大化簇间距离
B)最大化质心距离
C)簇的大小基本一致
D)最小化簇内距离的平方和
答案:D
17.[单选题]在客户端网页脚本语言中最为通用的是()
A)JavaScript
B)VB
C)Perl
D)ASP
答案:A
解析:
18.[单选题]假设检验中,拒绝域的边界称为( )
A)临界值
B)临界点
C)置信水平
D)边际值
答案:A
解析:
19.[单选题]以下哪个聚类算法不是属于基于原型的聚类( )。
A)模糊c均值
B)EM算法
C)SOM
D)CLIQUE
答案:D
解析:
20.[单选题]以下关于文件的描述错误的选项是()
A)readlines() 函数读入文件内容后返回一个列表,元素划分依据是文本文件中的换行符
B)read() 一次性读入文本文件的全部内容后,返回一个字符串
C)readline() 函数读入文本文件的一行,返回一个字符串
D)二进制文件和文本文件都是可以用文本编辑器编辑的文件
答案:D
解析:
21.[单选题]语句 SELECT * FROM student;中“*”号表示______。
A)student表的一个字段
B)student表的全部字段
C)student表的一条记录
D)student表的全部记录
答案:B
解析:
22.[单选题]多维空间中最适合的异常点检测方法是
A)正态分布图
B)等价图
C)马氏距离
D)散点图
答案:C
解析:
23.[单选题]对原始数据进行聚集、抽样、违归约等是哪个步骤的任务
C)数据理解
D)数据量挖掘
答案:A
解析:
24.[单选题]已知:
则s的取值是
A)10
B)12
C)13
D)15
答案:D
解析:
25.[单选题]在某文章很多话中部分或全部提到了顾客的年龄,性别,收入和工作地点,想查这四个词之间的联系以及联系的强弱,可以用()
A)回归方法
B)分类方法
C)聚类方法
D)关联分析
答案:D
解析:
26.[单选题]利用linear_model.LinearRegression()训练模型时调用.fit()方法需要传递的第二个参数是( )。
A)样本特征X
B)样本标签Y
C)是否考虑计算截距
D)样本权重
答案:B
解析:
27.[单选题]某超市研究销售记录发现,购买 奶的 很 概率会购买 包,这种属于数据挖掘的哪类问题?()
A)聚类分析
B)关联规则
C)分类分析
D)自然语言处理
答案:B

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。