《Python大数据处理与分析》习题答案
易语言自动加入域脚本
第1章
1.简述什么是Python以及Python有哪些特点。
答:
Python是1989年荷兰人Guido van Rossum发明的一种面向对象的解释型编程语言。Python语言简洁、易读以及可扩展性好,语法非常清晰,而且Python的拓展库丰富,具有脚本语言中最丰富和强大的类库。Python语言及其众多的扩展库构成的开发环境十分适合工程技术、科研人员处理实验数据、制作图表,甚至开发科学计算应用程序。
2.Python在Linux系统的安装主要分为哪几步。
答:
(1)检查Python版本(2)下载源码包(3)解压编译源码(4)安装Python(5)调整系统默认Python指向
动力节点java视频
3.简述Anaconda的特点和作用。
答:
Anaconda是基于Python的数据处理和科学计算平台,它内置了许多非常有用的第三方库,其内部包含了conda、Python在内的超过180个科学包及其依赖项。Anaconda 是在conda(一个包管理器和环境管理器)上发展出来的。安装Anaconda,就相当于把Python和一些如Numpy、Pandas、Scrip、Matplotlib等常用的库自动安装好了,比在常规Python环境下安装这些组件更容易。
总结起来,Anaconda具有四大特点:①开源;②集成安装;③高性能使用Python和R语言;④免费的社区支持。
4.简述Jupyter和PyCharm的区别。
答:
Jupyter Notebook是一个交互式笔记本,一种模块化的Python编辑器,支持运行40多种编程语言。它的本质是一个Web应用程序,便于创建和共享程序文档,数学方程,可视化和markdown等。在Jupyter中,可以把大段的Python代码碎片化处理,分开每一段来运行。在软件开发中,Jupyter可能显得并没有那么好用,这个模块化的功能反而会破坏掉程序的整体性。但是当在做数据处理、分析、建模、观察结果等的时候,Jupyter
php怎么自动包含文件
模块化的功能不仅会提供更好地视觉体验,更能大大缩小运行代码及调试代码的时间,同时还会让整个处理和建模的过程变得异常清晰。
Pycharm是一种Python IDE,其有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,如调试、语法高亮、Project管理、代码跳转、智能提示、自动补全、单元测试、脚本控制等。此外,该IDE还提供了用户支持Django框架下的专业Web开发。Pycharm作为专业的IDE,比Jupyter Notebook更适合完整项目的开发,而Jupyter Notebook则更适合数据分析与建模。
第2章
1.简述什么是NumPy,如何安装NumPy。
答:
NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
NumPy的安装需要在电脑上打开cmd,然后使用pip工具安装。
2.数组对象的属性有哪些?
sublime text3安装教程
3.Python中数组的自增自减运算有什么特点?
答:
Python中没有“--”或“++”运算符,因此,对变量进行自增自减需要使用“+=”或“-=”运算符来完成,运算的结果不是赋值给一个新数组,而是修改实际数据,即原来的数值发生了改变。
4.求下列矩阵的逆:
array1=np.array([[1,4,7],[2,5,8],[3,6,9]])
答:
import NumPy as np
array1=np.array([[1,4,7],[2,5,8],[3,6,9]])#创建一个二维数组
np.linalg.inv(array1)
5.编程题:使用NumPy数组对象,创建两个3*3的矩阵,并计算矩阵乘法。
答:
import NumPy.matlib
import NumPy as np
array1=np.array([[2,4],[6,8]])#创建一个二维数组
array2=np.array([[22,44],[66,88]])#创建一个二维数组
np.dot(array1,array2)#使用dot()函数求数组的乘积
6.计算1+1
3+1
5
系统的应用有哪些+1
python数据分析基础教程答案
7
+⋯+1
99
的和。
答:
import NumPy as np
array1=np.arange(1,100,2)
sum=0
for i in array1:
sum+=(1/i)
print(sum)
第3章
1.简述什么是Pandas,如何安装Pandas?
答:
Pandas 是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法,是使Python成为强大而高效的数据分析环境的重要因素之一。
Pandas的安装需要在电脑上打开cmd,然后使用pip工具安装
2.简述Pandas和NumPy的区别与联系。
答:
NumPy中的ndarray用于处理多维数值型数组,重点在于进行数值运算,无索引。Pandas中的Series类似于DataFrame的子集,DataFrame中的每一列都可以看作是一个Series,有索引,方便进行数据的查询,筛选,所以Pandas重点在于进行数据分析。在数学与统计方法上,NumPy中的ndarray只能进行数值型统计,而Pandas中的DataFrame 既可以进行数值型,也可以进行非数值型统计。
3.Series对象和DataFrame对象有什么区别?
答:
Series是Pandas中最基本的对象,类似于一维数组的对象,由一组数据和一组与之相关的数据标签(索引)组成。DataFrame对象的数据结构跟excel表相似,其目的是将Series的使用场景由一维扩展到多维,它由按一定顺序排列的多列数据组成,各列的数据类型可以有所不同。
4.如何使用对象快速导入导出数据?
答:
导入数据使用函数read_csv(filrpath,sep,names,encoding)。
导出数据使用to_csv(filrpath,sep,names,encoding)。
5.尝试掷骰子100次,在excel表格里记录每一次的值,尝试将此数据使用Pandas做统计分析。
答:
使用导入数据使用read_csv(filrpath,sep,names,encoding)函数将数据导入Pandas变量中,然后使用各种统计函数对数据进行分析。
6.创建学生成绩excel表,快速完成成绩统计和分析。
答:
使用导入数据使用函数read_csv(filrpath,sep,names,encoding)将数据导入Pandas变量中,然后使用各种统计函数对数据进行分析,如3.5案例所示,然后完成数据分析和修改补充后,导出数据使用to_csv(filrpath,sep,names,encoding)函数。
第4章
1.简述使用Matplotlib进行数据可视化的绘图步骤。
答:
(1)导入第三方包(2)准备数据(3)函数绘图(4)完善图表(5)展示结果
2.折线图、柱状图、直方图、散点图、等值线图分别用什么函数绘制,它们的常用参数有哪些?
答:
(1)折线图:pyplot.plot()常用参数:x, y, format_string, **kwargs
(2)柱状图:pyplot.bar()常用参数:x, height, width, bottom, align, data, **kwargs
(3)直方图:pyplot.hist() 常用参数:x, bins, weights, bottom, histtype, align, orientation, rwidth, color, label, stacked, **kwargs
(4)散点图:pyplot.scatter() 常用参数:x, y, s, c, marker, cmap, vmin, vmax, alpha, linewidths, edgecolors, **kwargs
(5)等值线图:urf()常用参数:x, y, z, levels, **kwargs
3.简述基础类元素和容器类元素分别有哪些,它们的关系是什么?
答:
基础类元素:线(line)、点(marker)、文字(text)、图例、图表标题、图片(image)等容器类元素:图形、坐标图形、坐标轴(axis)和刻度(tick)。
容器类元素可以包含许多基础类元素并将它们组织成一个整体,它们也有层级结构:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。