2. 绘制简单的折线图
下面来使用matplotlib绘制一个简单的折线图,再对其进行定制,以实现信息更丰富的数据可视化。我们将使用平方数序列 1 、 4 、 9 、 16 和 25 来绘制折线图。
import matplotlib.pyplot as plt
squares = [1, 4, 9, 16, 25]
plt.plot(squares)
plt.show()
plt.show()打开matplotlib 查看器,并显示绘制的图形。
修改标签文字和线条粗细
图形表明数字是越来越大的,但标签文字太小,线条太细。所幸matplotlib让你能够调整可视化的各个方面。
import matplotlib.pyplot as plt
squares = [1, 4, 9, 16, 25]
plt.plot(squares, linewidth=5)
# 设置图表标题,并给坐标轴加上标签
plt.title("Square Numbers", fontsize=24)
plt.xlabel("Value", fontsize=14)
plt.ylabel("Square of Value", fontsize=14)
# 设置刻度标记的大小
plt.tick_params(axis='both', labelsize=14)
plt.show()
校正图形
图形更容易阅读后,我们发现没有正确地绘制数据:折线图的终点指出 4.0 的平方为 25 !下面来修复这个问题。
import matplotlib.pyplot as plt
input_values = [1, 2, 3, 4, 5]
squares = [1, 4, 9, 16, 25]
plt.plot(input_values, squares, linewidth=5)
# 设置图表标题,并给坐标轴加上标签
plt.title("Square Numbers", fontsize=24)
plt.xlabel("Value", fontsize=14)
plt.ylabel("Square of Value", fontsize=14)
# 设置刻度标记的大小
plt.tick_params(axis='both', labelsize=14)
plt.show()
使用scatter()绘制散点图并设置其样式
有时候,需要绘制散点图并设置各个数据点的样式。要绘制单个点,可使用函数 scatter() ,并向它传递一对 x 和 y 坐标,它将在指定位置绘制一个点:
import matplotlib.pyplot as plt
plt.scatter(2, 4)
plt.show()
下面来设置输出的样式,使其更有趣:添加标题,给轴加上标签,并确保所有文本都大到能够看清:import matplotlib.pyplot as plt
plt.scatter(2, 4, s=200)
# 设置图表标题并给坐标轴加上标签
plt.title("Square Numbers", fontsize=24)
plt.xlabel("Value", fontsize=14)
plt.ylabel("Square of Value", fontsize=14)
# 设置刻度标记的大小
plt.tick_params(axis='both', labelsize=14)
plt.show()
使用scatter()绘制一系列点
要绘制一系列的点,可向 scatter() 传递两个分别包含 x 值和 y 值的列表,如下所示:
import matplotlib.pyplot as plt
x_values = [1, 2, 3, 4, 5]
y_values = [1, 4, 9, 16, 25]
plt.scatter(x_values, y_values, s=100)
# 设置图表标题并给坐标轴加上标签
plt.title("Square Numbers", fontsize=24)
plt.xlabel("Value", fontsize=14)
plt.ylabel("Square of Value", fontsize=14)
# 设置刻度标记的大小
plt.tick_params(axis='both', which='major', labelsize=14)
plt.show()
自动计算数据
手工计算列表要包含的值可能效率低下,需要绘制的点很多时尤其如此。
import matplotlib.pyplot as plt
x_values = list(range(1, 1001))
y_values = [x**2for x in x_values]
plt.scatter(x_values, y_values, s=40)
# 设置每个坐标轴的取值范围
plt.axis([0, 1100, 0, 1100000])
plt.show()
matplotlib允许你给散点图中的各个点指定颜。默认为蓝点和黑轮廓,在散点图包含的数据点不多时效果很好。但绘制很多点时,黑轮廓可能会粘连在一起。要删除数据点的轮廓,可在调用scatter()时传递实参edgecolor='none':
自定义颜
要修改数据点的颜,可向scatter()传递参数c,并将其设置为要使用的颜的名称,如下所示:plt.scatter(x_values, y_values, c='red', edgecolor='none', s=40)
你还可以使用RGB颜模式自定义颜。
plt.scatter(x_values, y_values, c=(0, 0, 0.8), edgecolor='none', s=40)
(0, 0, 0.8)它们分别表示红、绿和蓝分量。值越接近0,指定的颜越深,值越接近1,指定的颜越浅。
使用颜映射
颜映射(colormap)是一系列颜,它们从起始颜渐变到结束颜。在可视化中,颜映射用于突出数据的规律,例如,你可能用较浅的颜来显示较小的值,并使用较深的颜来显示较大的值。
import matplotlib.pyplot as plt
x_values = list(range(1001))
y_values = [x**2for x in x_values]
plt.scatter(x_values, y_values, c=y_values, Blues, edgecolor='none', s=40)
这些代码将y值较小的点显示为浅蓝,并将y值较大的点显示为深蓝。
自动保存图表
plt.savefig('squares_plot.png', bbox_inches='tight')
第二个实参指定将图表多余的空白区域裁剪掉。如果要保留图表周围多余的空白区域,可省略这个实参。
3. 随机漫步
在自然界、物理学、生物学、化学和经济领域,随机漫步都有其实际用途。例如,漂浮在水滴上的花粉因不断受到水分子的挤压而在水面上移动。水滴中的分子运动是随机的,因此花粉在水面上的运动路径犹如随机漫步。我们稍后将编写的代码模拟了现实世界的很多情形。
创建RandomWalk()类
为模拟随机漫步,我们将创建一个名为RandomWalk的类,它随机地选择前进方向。这个类需要三个属性,其中一个是存储随机漫步次数的变量,其他两个是列表,分别存储随机漫步经过的每个点的x和y坐标。
RandomWalk类只包含两个方法:__init__ ()和fill_walk(),其中后者计算随机漫步经过的所有点。下面先来看看__init__(),如下所示:
from random import choice
class RandomWalk():
"""一个生成随机漫步数据的类"""
def__init__(self, num_points=5000):
"""初始化随机漫步的属性"""
self.num_points = num_points
# 所有随机漫步都始于(0, 0)
self.x_values = [0]
self.y_values = [0]
选择方向
我们将使用fill_walk()来生成漫步包含的点,并决定每次漫步的方向。
def fill_walk(self):
"""计算随机漫步包含的所有点"""
# 不断漫步,直到列表达到指定的长度
while len(self.x_values) <self.num_points:
数据可视化名词解释# 决定前进方向以及沿这个方向前进的距离
x_direction = choice([1, -1])
x_distance = choice([0, 1, 2, 3, 4])
x_step = x_direction*x_distance
y_direction = choice([1, -1])
y_distance = choice([0, 1, 2, 3, 4])
y_step = y_direction*y_distance
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论