NumPy教程(Numpy基本操作、Numpy数据处理)--688IT编程网

NumPy教程（Numpy基本操作、Numpy数据处理）Numpy 属性

介绍⼏种 numpy 的属性:

· ndim：维度

· shape：⾏数和列数

· size：元素个数

使⽤numpy⾸先要导⼊模块

import numpy as np

#为了⽅便使⽤numpy 采⽤np简写

列表转化为矩阵：

python array = np.array([[1,2,3],[2,3,4]])

#列表转化为矩阵

print(array)

""" array([[1, 2, 3], [2, 3, 4]]) """

numpy 的⼏种属性

接着我们看看这⼏种属性的结果:

print('number of dim:',array.ndim)# 维度

#number of dim: 2

print('shape :',array.shape)# ⾏数和列数

shape :(2,3)

print('size:',array.size)# 元素个数

size:6

Numpy 创建 array

关键字

· array：创建数组

· dtype：指定数据类型

· zeros：创建数据全为0

· ones：创建数据全为1

· empty：创建数据接近0

· arrange：按指定范围创建数据

· linspace：创建线段

创建数组

a = np.array([2,23,4])# list 1d

print(a)

#[2 23 4]

指定数据 dtype

a = np.array([2,23,4],dtype=np.int)

print(a.dtype)

#int 64

a = np.array([2,23,4],dtype=np.int32)

print(a.dtype)

#int32

a = np.array([2,23,4],dtype=np.float)

print(a.dtype)

#float64

a = np.array([2,23,4],dtype=np.float32)

print(a.dtype)

float32

创建特定数据

a = np.array([[2,23,4],[2,32,4]])# 2d 矩阵 2⾏3列

print(a)

"""

[[ 2 23 4]

[ 2 32 4]]

"""

创建全零数组

a = np.zeros((3,4))# 数据全为0，3⾏4列

"""

array([[ 0., 0., 0., 0.],

[ 0., 0., 0., 0.],

[ 0., 0., 0., 0.]])

"""

创建全⼀数组，同时也能指定这些特定数据的 dtype:

a = np.ones((3,4),dtype = np.int)# 数据为1，3⾏4列

"""

array([[1, 1, 1, 1],

[1, 1, 1, 1],

[1, 1, 1, 1]])

"""

创建全空数组，其实每个值都是接近于零的数:

a = np.empty((3,4))# 数据为empty，3⾏4列

"""

array([[ 0.00000000e+000, 4.94065646e-324, 9.88131292e-324, 1.48219694e-323],

[ 1.97626258e-323, 2.47032823e-323, 2.96439388e-323, 3.45845952e-323],

[ 3.95252517e-323, 4.44659081e-323, 4.94065646e-323, 5.43472210e-323]])

"""

⽤ arange 创建连续数组:

a = np.arange(10,20,2)# 10-19 的数据，2步长

"""

array([10, 12, 14, 16, 18])

"""

使⽤ reshape 改变数据的形状

a = np.arange(12).reshape((3,4))# 3⾏4列，0到11

"""

array([[ 0, 1, 2, 3],

[ 4, 5, 6, 7],

[ 8, 9, 10, 11]])

"""

⽤ linspace 创建线段型数据:

a = np.linspace(1,10,20)# 开始端1，结束端10，且分割成20个数据，⽣成线段

"""

array([ 1. , 1.47368421, 1.94736842, 2.42105263,

2.89473684,

3.36842105, 3.84210526,

4.31578947,

4.78947368,

5.26315789, 5.73684211,

6.21052632,

6.68421053,

7.15789474, 7.63157895,

8.10526316,

8.57894737, 9.05263158, 9.52631579, 10. ])

"""

同样也能进⾏ reshape ⼯作:

a = np.linspace(1,10,20).reshape((5,4))# 更改shape

"""

array([[ 1. , 1.47368421, 1.94736842, 2.42105263],

[ 2.89473684, 3.36842105, 3.84210526, 4.31578947],

[ 4.78947368, 5.26315789, 5.73684211, 6.21052632],

[ 6.68421053, 7.15789474, 7.63157895, 8.10526316],

[ 8.57894737, 9.05263158, 9.52631579, 10. ]])

"""

Numpy 基础运算1

让我们从⼀个脚本开始了解相应的计算以及表⽰形式：

import numpy as np

a=np.array([10,20,30,40])# array([10, 20, 30, 40])

b=np.arange(4)# array([0, 1, 2, 3])

numpy 的⼏种基本运算 ¶

上述代码中的 a 和 b 是两个属性为 array 也就是矩阵的变量，⽽且⼆者都是1⾏4列的矩阵，其中b矩阵中的元素分别是从0到3。如果我们想要求两个矩阵之间的减法，你可以尝试着输⼊：

c=a-b # array([10, 19, 28, 37])

通过执⾏上述脚本，将会得到对应元素相减的结果，即[10,19,28,37]。同理，矩阵对应元素的相加和相乘也可以⽤类似的⽅式表⽰：

c=a+b # array([10, 21, 32, 43])

c=a*b # array([ 0, 20, 60, 120])

有所不同的是，在Numpy中，想要求出矩阵中各个元素的乘⽅需要依赖双星符号 **，以⼆次⽅举例，即：

c=b**2# array([0, 1, 4, 9])

另外，Numpy中具有很多的数学函数⼯具，⽐如三⾓函数等，当我们需要对矩阵中每⼀项元素进⾏函数运算时，可以很简便的调⽤它们（以sin函数为例）：

c=10*np.sin(a)

array([-5.44021111,9.12945251,-9.88031624,7.4511316])

除了函数应⽤外，在脚本中对print函数进⾏⼀些修改可以进⾏逻辑判断：

print(b<3)

array([True,True,True,False], dtype=bool)

此时由于进⾏逻辑判断，返回的是⼀个bool类型的矩阵，即对满⾜要求的返回True，不满⾜的返回False。上述程序执⾏后得到的结果是[True True True False]。需要注意的是，如果想要执⾏是否相等的判断，依然需要输⼊ == ⽽不是 = 来完成相应的逻辑判断。

上述运算均是建⽴在⼀维矩阵，即只有⼀⾏的矩阵上⾯的计算，如果我们想要对多⾏多维度的矩阵进⾏操作，需要对开始的脚本进⾏⼀些修改：

a=np.array([[1,1],[0,1]])

b=np.arange(4).reshape((2,2))

print(a)

array([[1,1],

[0,1]])

print(b)

array([[0,1],

[2,3]])

此时构造出来的矩阵a和b便是2⾏2列的，其中 reshape 操作是对矩阵的形状进⾏重构，其重构的形状便是括号中给出的数字。稍显不同的是，Numpy中的矩阵乘法分为两种，其⼀是前⽂中的对应元素相乘，其⼆是标准的矩阵乘法运算，即对应⾏乘对应列得到相应元素：

c_dot = np.dot(a,b)

array([[2,4],

[2,3]])

除此之外还有另外的⼀种关于dot的表⽰⽅法，即：

c_dot_2 = a.dot(b)

array([[2,4],

[2,3]])

下⾯我们将重新定义⼀个脚本, 来看看关于 sum(), min(), max()的使⽤：

import numpy as np

a=np.random.random((2,4))

print(a)

array([[0.94692159,0.20821798,0.35339414,0.2805278],

[0.04836775,0.04023552,0.44091941,0.21665268]])

因为是随机⽣成数字, 所以你的结果可能会不⼀样. 在第⼆⾏中对a的操作是令a中⽣成⼀个2⾏4列的矩阵，且每⼀元素均是来⾃从0到1的随机数。在这个随机⽣成的矩阵中，我们可以对元素进⾏求和以及寻极值的操作，具体如下：

np.sum(a)# 4.4043622002745959

np.min(a)# 0.23651223533671784

np.max(a)# 0.90438450240606416

对应的便是对矩阵中所有元素进⾏求和，寻最⼩值，寻最⼤值的操作。可以通过print()函数对相应

值进⾏打印检验。

如果你需要对⾏或者列进⾏查运算，就需要在上述代码中为 axis 进⾏赋值。当axis的值为0的时候，将会以列作为查单元，当axis的值为1的时候，将会以⾏作为查单元。

为了更加清晰，在刚才的例⼦中我们继续进⾏查：

print("a =",a)

a =[[0.236512240.419006610.848694170.46456022]

[0.607710870.90438450.366032850.55746074]]

print("sum =",np.sum(a,axis=1))

sum=[1.968773242.43558896]

print("min =",np.min(a,axis=0))

min=[0.236512240.419006610.366032850.46456022]

print("max =",np.max(a,axis=1))

max=[0.848694170.9043845]

Numpy 基础运算2

通过上⼀节的学习，我们可以了解到⼀部分矩阵中元素的计算和查操作。然⽽在⽇常使⽤中，对应元素的索引也是⾮常重要的。依然，让我们先从⼀个脚本开始：

A = np.arange(2,14).reshape((3,4))

array([[2,3,4,5]

[6,7,8,9]

[10,11,12,13]])

print(np.argmin(A))# 0

print(np.argmax(A))# 11

numpy 的⼏种基本运算

其中的 argmin() 和 argmax() 两个函数分别对应着求矩阵中最⼩元素和最⼤元素的索引。相应的，在矩阵的12个元素中，最⼩值即2，对应索引0，最⼤值为13，对应索引为11。

如果需要计算统计中的均值，可以利⽤下⾯的⽅式，将整个矩阵的均值求出来：

an(A))# 7.5

print(np.average(A))# 7.5

仿照着前⼀节中dot()的使⽤法则，mean()函数还有另外⼀种写法：

an())# 7.5

同样的，我们可以写出求解中位数的函数：

dian())# 7.5

另外，和matlab中的cumsum()累加函数类似，Numpy中也具有cumsum()函数，其⽤法如下：

print(np.cumsum(A))

#[2 5 9 14 20 27 35 44 54 65 77 90]

在cumsum()函数中：⽣成的每⼀项矩阵元素均是从原矩阵⾸项累加到对应项的元素之和。⽐如元素9，在cumsum()⽣成的矩阵中序号为3，即原矩阵中2，3，4三个元素的和。

相应的有累差运算函数：

print(np.diff(A))

[[111]

[111]

[111]]

该函数计算的便是每⼀⾏中后⼀项与前⼀项之差。故⼀个3⾏4列矩阵通过函数计算得到的矩阵便是3⾏3列的矩阵。

下⾯我们介绍⼀下nonzero()函数：

o(A))

#(array([0,0,0,0,1,1,1,1,2,2,2,2]),array([0,1,2,3,0,1,2,3,0,1,2,3]))

python 定义数组

这个函数将所有⾮零元素的⾏与列坐标分割开，重构成两个分别关于⾏和列的矩阵。

同样的，我们可以对所有元素进⾏仿照列表⼀样的排序操作，但这⾥的排序函数仍然仅针对每⼀⾏进⾏从⼩到⼤排序操作：

import numpy as np

A = np.arange(14,2,-1).reshape((3,4))

#array([[14, 13, 12, 11],

[10,9,8,7],

[6,5,4,3]])

print(np.sort(A))

array([[11,12,13,14]

[7,8,9,10]

[3,4,5,6]])

矩阵的转置有两种表⽰⽅法：

688IT编程网

NumPy教程(Numpy基本操作、Numpy数据处理)

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

NumPy教程(Numpy基本操作、Numpy数据处理)

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式