⾳频之AMR-NB、AMR-WB
⾸先明⽩什么是Amr-Nb和Amr-wb?
adaptive⼀、什么是AMR、AMR-WB
全称Adaptive Multi-Rate和Adaptive Multi-Rate Wideband,主要⽤于移动设备的⾳频,压缩⽐⽐较⼤,但相对其他的压缩格式质量⽐较差,由于多⽤于⼈声,通话,效果还是很不错的。
1. AMR: ⼜称为AMR-NB,相对于下⾯的WB⽽⾔
语⾳带宽范围:300-3400Hz
8KHz采样率
2. AMR-WB:AMR WideBand,
语⾳带宽范围: 50-7000Hz
16KHz采样率
“AMR-WB”全称为“Adaptive Multi-rate - Wideband”,即“⾃适应多速率宽带编码”,采样频率为16kHz,是⼀种同时被国际标准化组织ITU-T和3GPP采⽤的宽带语⾳编码标准,也称 为G722.2标准。AMR-WB提供语⾳带宽范围达到50~7000Hz,⽤户可主观感受到话⾳⽐以前更加⾃然、舒适和易于分辨。
⼆、编码⽅式
下图详细解释了帧头和帧数据⼤⼩的关系:
1. AMR-NB:
AMR ⼀共有16种编码⽅式, 0-7对应8种不同的编码⽅式, 8-15 ⽤于噪⾳或者保留⽤。
2. AMR-WB:
我们来做⼀个简单的计算,PCM16和AMR之间的转换
Amr ⼀帧为20毫秒
AMR 4.75Kbits/s:
每秒产⽣的声⾳位数 = 4750bits/s
每20ms帧占⽤的位数 = 4750bits/s / 50frames/s = 95bits
每20ms帧占⽤的字节数 = 95bits / 8bits/byte = 11.875bytes - 圆整到12字节,不⾜的补0加上⼀个字节的帧头,所以,20ms⼀帧的AMR: 12-bytes + 1-byte = 13-bytes
相反,转换回来就成了
13-bytes * 50frames/s * 8bits/byte = 5200bits/s
注意,这⾥两个数值并不对应,是由于圆整地原因
三、帧格式解析
AMR语⾳帧格式为:帧头+语⾳数据组成,并且分为两种类型的帧格式:AMR IF1 和 AMR IF2
下⾯将分开讲述AMR IF1和AMR IF2的帧格式
(1)AMR IF1的帧格式如下图:
a) amr header 其中帧头占1个字节,各个位的含义如下图所⽰:
各个字段解释如下:
P: 0 (占1bit)
FT: frame type 对应不同编码模式 (占4bit)
Q: 帧质量指⽰器 0:表⽰为坏帧 (占1bit)
后⾯的2个P补0
b)帧头后⾯就是辅助信息。
此辅助信息针对⾃适应模式及差错检测。
c) 辅助信息后⾯就是语⾳数据。每⼀帧的数据有分为三个部分:Class A ,Class B ,Class C;
Class A:是⼀帧中最敏感、最重要的数据。这部分数据如有损坏,整个帧将⽆法解码。所以,⼀般在
⽆线传输的时候要使⽤各种冗余的⽅式对这部分数据加以保护。
Class B:相对⽽⾔,⽐Class A不重要的数据。
Class C:⽐Class B还不重要的数据。
下图描述了AMR IF1帧数据的bit位数及字节数、每帧Class A、Class B、Class C的bit位⼤⼩等信息。
(2)AMR IF2的帧格式如下图所⽰
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论