sql数据库用什么软件打开第一章测试
1.2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和(  )能力的数据集。
A:分析
B:访问
C:计算
D:应用
答案:A
2.用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和(  )。
A:Vagary
B:Valley
C:Variety
D:Vainly
答案:C
3.大数据分析四个方面的工作主要是:数据分类、(  )、关联规则挖掘和时间序列预测。
A:数据聚类
B:数据清洗
C:数据统计
D:数据计算
答案:A
4.新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。
A:对
B:错
答案:B
5.目前的大数据处理技术只能处理结构化数据。
A:对
B:错
答案:B
第二章测试
6.我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是(  )。
A:xls
B:mdb
C:mdf
D:dbf
答案:B
7.大多数日志文件的后缀名是(  )。
A:txt
B:csv
C:log
D:xml
答案:C
8.本课程重点介绍的weka软件的专有文件格式是(  )。
A:MongoDB
B:value
C:key map
D:ARFF
答案:D
9.数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和(  )。
A:专业性
B:一致性
C:排他性
D:共享性
答案:B
10.八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个(  )来作为采集的目标。
A:关键词
B:网页地址
C:电话号码
D:用户名
答案:B
11.八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是(  )。
A:otd
B:gif
C:png
D:jpg
答案:A
12.Excel可以通过“数据有效性”按钮操作来规范数据输入的范围。
A:错
B:对
答案:B
13.Excel不能导入txt或csv格式的文件。
A:对
B:错
答案:B
14.八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。
A:错
B:对
答案:A
15.八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。
A:对
B:错
答案:A
第三章测试
16.使用DBSCAN算法对鸢尾花数据集(Iris.arff)进行聚类,将epsilon参数设置为0.2, minPoints参数设置为5,忽略class属性,那么将形成(  )个簇。 
A: 3
B: 4
C: 1
D: 2
答案:D
17.使用EM算法对天气数据集(weather.numeric.arff)进行聚类,将numClusters设置为4,即簇数为4,其他参数保持默认值,忽略play属性,从结果中可知,下列选项中,(  )是错误的。 
A: 第四个簇的先验概率是0.14
B: 第四个簇的实例数为4
C: 模型的最大似然估计值是-7.18
D: 这组数据用算法迭代15次
答案:B
18.使用SimpleKMeans算法对天气数据集(weather.numeric.arff)进行聚类,保持默认参数,即3个簇以及欧氏距离。选择play属性为忽略属性,从结果中可知,下列选项中,(  )是错误。 
A: 产生了三个中心点
B: 聚合为3个簇,分别有7,3,4个实例
C: 这组数据用算法迭代四次
D: 平方和误差为8.928
答案:C
19.使用线性回归(LinearRegression)分类器和用M5P分类器对cpu.arff分别进行分类,由其输出的误差指标可知(  )。
A: LinearRegression的标准误差比M5P的标准误差小
B: LinearRegression的相对误差比M5P的相对误差小
C: LinearRegression的平均绝对误差比M5P的平均绝对误差小
D: LinearRegression的平均方根误差比M5P的平均方根误差大
答案:D
20.删去cpu.arff数据文件中的CACH属性后,使用M5P分类器构建方案,在结果中,到达LM2的实例数有(  )个。 
A: 165
B: 21
C: 30
D: 23
答案:B
21.根据J48分类器训练inal.arff所生产的决策树,当outlook=sunny;temperature=cool;humidity =high;windy=TRUE时,分类的结果是(  )。 
A: 无法分类
B: 没有结果
C: No
D: Yes
答案:C

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。