2020年上海市高等学校信息技术水平考试试卷三级数据科学技术及应用A场...--688IT编程网

2020年上海市高等学校信息技术水平考试试卷

三级数据科学技术及应用（A 场）

（本试卷考试时间 150 分钟）

一、单选题 ( 本大题 15 道小题，每小题 1 分，共 15 分），从下面题目给出的A、B、C、D四个可供选择的答案中选择一个正确答案。

1.下面关于数据科学与大数据之间关系描述错误的是________。

A.大数据属于数据科学的范畴

B.大数据分析遵循数据科学的基本工作流程

C.大数据分析采用的方法完全不同于数据科学技术

D.大数据技术是指数据量达到某种规模时引入的分布式存储、计算和传输方法

2.下面关于DataFrame存储表结构数据的说法，错误的是________。

A.通常使用行存储一条数据，列存储该数据的各个特征项

B.DataFrame对象只能使用行、列索引对进行数据切片，不能使用位置序号

C.从DataFrame对象中取出一列，得到Series对象

D.Series对象可以使用Numpy的函数进行统计分析

3.统计量“方差”描述了________。

A.样本的平均值

B.样本的离散程度

C.样本中不同的值占样本容量的比例

D.样本中出现次数最多的值

4.CSV文件是常用的数据文件格式，可以使用_______查看。

A.文本编辑器、Excel

B.photoshop

C.powerpoint

D.画图工具

5.students对象数据如下：

age height weight

1 19 170 68

2 20 165 65

3 18 175 65

下面语句筛选出_______。

>>>[students['height']<170, 'weight']

A.身高小于170同学的体重

B.身高小于170同学的信息

C.身高大于170同学的体重

D.身高小于170同学的身高

6.为描述高校教师学历占比情况，适合的图形是_______。

A.散点图

B.曲面图

C.直方图

D.饼图

7.目前人工智能技术，特别是机器学习，主要模拟了人的_________过程。

A.学习

B.推理

C.思考

D.规划

8.________属于机器学习中的有监督学习问题。

A.分类和聚类

B.回归和聚类

C.分类和回归

D.聚类和数据降维

9.建模分析时，通常用于训练的样本数量_________测试的样本数量。

A.大于

B.小于

C.等于

D.小于等于

10. F1_score可用于衡量分类模型性能，根据以下混淆矩阵，F1 = _________。

A.2a/(2a+b+c)

B.(a+d)/(a+b+c+d)

C.a/(a+c)

D.a/(a+b)

11.关于聚类分析，正确的是_________。

A."簇"越少说明聚类效果越好

B.聚类是有监督学习方法

C.聚类可作为分类等其他任务的预处理过程scanf函数计算相除余数

D.同一个数据集，不同的聚类算法得到的结果是一样的

12.________属于机器学习中的回归问题。

A.垃圾短信预测

B.房价预测python基础知识填空题

C.车牌识别

D.人脸识别

13.识别文本中的情感通常使用________方法处理。

A.文本分类

B.文本聚类

C.自动问答

D.机器翻译

14.关于计算机数字图像的说法，错误的是________。

A.数字图像存储每个像素点的颜值

B.数字图像存储的是组成图像的几何形状、大小、颜等信息

C.同样大小的图，存储使用的像素点越多，图像越清晰

D.JPEG是一种有损的图像压缩方式

15.天气预报主要采用________数据处理技术。

A.Web

B.文本

stackoverflowatlineC.图结构

D.时间序列

二、多选题 ( 本大题 5 道小题，每小题 1 分，共 5 分），从下面题目给出的A、B、C、D四个可供选择的答案中选择所有正确答案。

1.大数据的特征有________。

A.规模性

B.高速性

C.多样性

D.低价值性

2.________属于聚类问题。

A.根据企业校招历史数据，建立应聘者是否被录用的分类器

B.给定房屋特征数据，构建出估计房屋价格的模型

C.给定文档集，将相似的文档分到同一组

D.给定用户的消费数据，将用户分为不同消费特征的体

3._________可用于展示离散数据。

A.柱状图

B.饼图

C.折线图

D.曲面图

4.神经网络可用于_________等问题的建模分析。

A.电信用户分类

B.根据房屋特性预测房价

C.机动车识别

D.数据降维

5.智能语音对话系统，主要通过人工智能技术处理_________等数据实现。

A.语音

B.文本

C.图形

D.图像

三、程序填空题 ( 本大题 4 道小题，每空 3 分，共 36 分）。

1. 提示：

a) 题目源程序存放在织梦dedecms授权"C:\KS"文件夹下，供程序调试；

b) Python科学计算库函数使用说明存放在"C:\KS"文件夹下，注意不同类库的函数存放在相应的sheet下。

某商品的成本（cost）可以根据产量（output）进行计算： cost=0.14*output+42.7，编

写程序模拟商品的生产数据，估计商品的成本（源程序fill_1.py）。

1) 使用数组记录6次生产的商品产量（千件），分别为10、5、7、9、11、8；

2) 根据公式计算每次生产商品的成本；

3) 假设实际成本围绕计算的成本值上下波动，波动值服从均值为给版面费就过的cssci0、方差为2的正态分布，随机生成6个数据，模拟每次的波动；

4）加上波动值，计算6次生产商品的实际成本。

源程序文件（fill_1.py）

#1）使用数组记录6次生产的商品产量（千件），分别为10、5、7、9、11、8；

output = 【1】

#2)根据公式计算每次生产商品的成本；

cost = 0.14*output + 42.7

print( '1:cost: ',cost)

#3)实际成本围绕计算成本上下波动，波动值服从均值为0，方差为2的正态分布。

#随机生成6个数据，模拟每次的波动；

varcost = np.【2】网页设计素材怎么算侵权(0,2,6)

print( '2:variance: ',varcost)

#4）加上波动值，计算6次生产商品的实际成本。

cost =【3】

print( '3:cost: ',cost)

2. 提示：

a) 题目源程序存放在"C:\KS"文件夹下，供程序调试；

b) Python科学计算库函数使用说明存放在"C:\KS"文件夹下，注意不同类库的函数存放在相应的sheet下。

根据IDC的统计数据，各品牌手机在中国的年销量如表1所示（源程序fill_2.py）。

1) 根据表1的数据，绘制折线图分析各品牌销量发展趋势，如图1所示；

2) 计算2018年各品牌手机的同比增幅（(Y2018-Y2017)/Y2017），并在原数据中增加新列"INC2018"，如图2所示；

3) 显示增幅为正的品牌2015-2018年的销售量。

图1 手机销量折线图

图2 增加列：2018年各品牌手机的同比增幅INC2018

源程序文件（fill_2.py）

#1)记录表1的数据，绘制折线图分析各品牌销量发展趋势;

index = ['Huawei','Apple','OPPO','vivo','Mi'];

columns = ['Y2015','Y2016','Y2017','Y2018']

data = np.array( [ [62.9,76.6,90.9,104.97], [58.4,44.9,41.1,36.32],

[35.3,78.4,80.5,78.94],[35.1,69.2,68.6,75.97],

[64.9,41.5,55.1,51.99] ] )

sales = DataFrame(【1】)

print(sales)

#绘制折线图

psales = DataFrame(data.T, columns, index)

print(psales)

ams['-serif'] = ['SimHei']

【2】(title='2015~2018国内手机销量',LineWidth=2, marker='o',

688IT编程网

2020年上海市高等学校信息技术水平考试试卷三级数据科学技术及应用A场...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

2020年上海市高等学校信息技术水平考试试卷三级数据科学技术及应用A场...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式