python⾳频处理(持续更新)
准备⼯作:
⾸先,我们需要 import ⼏个⼯具包,⼀个是 python 标准库中的 wave 模块,⽤于⾳频处理操作,另外两个是 numpy 和 matplot,提供数据处理函数。
⼀:读取本地⾳频数据
处理⾳频第⼀步是需要从让计算机“听到”声⾳,这⾥我们使⽤ python 标准库中⾃带的 wave模块进⾏⾳频参数的获取。
(1) 导⼊ wave 模块
(2) 使⽤ wave 中的函数 open 打开⾳频⽂件,wave.open(file,mode)函数带有两个参数, 第⼀个 file 是所需要打开的⽂件名及路径,使⽤字符串表⽰;第⼆个 mode 是打开的模式,也是⽤字符串表⽰ (’rb’或’wb’)
(3) 打开⾳频后使⽤ getparams() 获取⾳频基本的相关参数(nchannels:声道数,
sampwidth:量化位数或量化深度,framerate:采样频率,nframes:采样点数)
#  导⼊ wave 模块
import wave
#  ⽤于绘制波形图
python获取数组长度
import matplotlib.pyplot as plt
#  ⽤于计算波形数据
import numpy as np
#  ⽤于系统处理,如读取本地⾳频⽂件
import os
# 打开WAV⽂档
f = wave.open(r"2.wav",'rb')
# 读取格式信息
params = f.getparams ()
nchannels,sampwidth, framerate, nframes = params [:4]
print(framerate)
⼆:读取单通道⾳频,并绘制波形图(常见⾳频为左右2个声道)
(1) 通过第⼀步,可以继续读取⾳频数据本⾝,保存为字符串格式
readframes:
读取声⾳数据,传递⼀个参数指定需要读取的长度(以取样点为单位),readframes返回的是⼆进制数据(⼀⼤堆bytes),在Python中⽤字符串表⽰⼆进制数据。
strData = f.readframes(nframes)
(2) 如果需要绘制波形图,则需要将字符串格式的⾳频数据转化为 int 类型
frombuffer:
根据声道数和量化单位,将读取的⼆进制数据转换为⼀个可以计算的数组。
通过frombuffer函数将⼆进制转换为整型数组,通过其参数dtype指定转换后的数据格式。
waveData=np.frombuffer(strData,dtype=np.int16)
此处需要使⽤到 numpy 进⾏数据格式的转化
(3) 将幅值归⼀化
把数据变成(0,1)之间的⼩数。主要是为了数据处理⽅便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。
waveData=waveData*1.0/(max(abs(waveData)))
这⼀步去掉也可画出波形图,可以尝试不⽤此步,出波形图的不同
(4) 绘制图像
通过取样点数和取样频率计算出取样的时间:
time = np.arange(0,nframes)*(1.0/framerate) import wave
#  导⼊ wave 模块
import matplotlib.pyplot as plt
#  ⽤于绘制波形图
import numpy as np
#  ⽤于计算波形数据
import os
#    ⽤于系统处理,如读取本地⾳频⽂件
f = wave.open(r"di.wav",'rb')
params = f.getparams ()
nchannels,sampwidth, framerate, nframes = params [:4] print(framerate)
# 读取波形数据
strData = f.readframes(nframes)
# 将字符串转换为16位整数
waveData = np.frombuffer(strData,dtype=np.int16)
# 幅值归⼀化
waveData = waveData*1.0/(max(abs(waveData)))
#计算⾳频的时间
time = np.arange(0,nframes)*(1.0/ framerate)
plt.plot(time,waveData)
plt.xlabel("Time(s)")
plt.ylabel("Amplitude")
plt.title("Single channel wavedata")
plt.show()
效果图

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。