⾳频中采样位数,采样率,⽐特率的名词解释(转)
采样位数(采样⼤⼩):
采样位数可以理解为采集卡处理声⾳的解析度。这个数值越⼤,解析度就越⾼,录制和回放的声⾳就越真实。我们⾸先要知道:电脑中的声⾳⽂件是⽤数字0和1来表⽰的。所以在电脑上录⾳的本质就是把模拟声⾳信号转换成数字信号。反之,在播放时则是把数字信号还原成模拟声⾳信号输出。采集卡的位是指采集卡在采集和播放声⾳⽂件时所使⽤数字声⾳信号的⼆进制位数。采集卡的位客观地反映了数字声⾳信号对输⼊声⾳信号描述的准确程度。8位代表2的8次⽅--256,16位则代表2的16次⽅--64K。⽐较⼀下,⼀段相同的⾳乐信息,16位声卡能把它分为64K个精度单位进⾏处理,⽽8位声卡只能处理256个精度单位,造成了较⼤的信号损失,最终的采样效果⾃然是⽆法相提并论的。
通常市⾯上是这样说,16bit/24bit/32bit。数值越⾼声⾳越好。
采样率:
采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它⽤赫兹(Hz)来表⽰。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。采样定理指采样频率必须⼤于被采样信号带宽的两倍,另外⼀种等同的说法是奈奎斯特频率必须⼤于被采样信号的带宽。
如果信号的带宽是100Hz,那么为了避免混叠现象采样频率必须⼤于200Hz。
换句话说就是采样频率必须⾄少是信号中最⼤频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。过采样指采样频率超出信号带宽的两倍这样就可以⽤数字滤波器替换性能不好的模拟抗混叠滤波器。
⽐特率:
⽐特率是指将数字声⾳由模拟格式转化成数字格式的采样率,采样率越⾼,还原后的⾳质就越好。作为⼀种数字⾳乐压缩效率的参考性指标,⽐特率表⽰单位时间(1秒)内传送的⽐特数bps(bit per second,位/秒)的速度。通常使⽤kbps(通俗地讲就是每秒钟1000⽐特)作为单位。CD中的数字⾳乐⽐特率为1411.2kbps(也就是记录1秒钟的CD⾳乐,需要1411.2×1024⽐特的数据),⾳乐⽂件的BIT RATE⾼是意味着在单位时间(1秒)内需要处理的数据量(BIT)多,也就是⾳乐⽂件的⾳质好的意思。但是,BIT RATE⾼时⽂件⼤⼩变⼤,会占据很多的内存容量,⾳乐⽂件最常⽤的BIT RATE是128kbps,MP3⽂件可以使⽤的⼀般是8~320kbps,但不同MP3机在这⽅⾯⽀持的范围不⼀样,⼤部分的是32-256Kbps,这个指数当然是越⼴越好了,不过320Kbps是暂时最⾼等级了。
⽐特率值与现实⾳频对照:
1. 16Kbps=电话⾳质
2. 24Kbps=增加电话⾳质、短波⼴播、长波⼴播、欧洲制式中波⼴播
3. 40Kbps=美国制式中波⼴播
4. 56Kbps=话⾳
5. 64Kbps=增加话⾳(⼿机铃声最佳⽐特率设定值、⼿机单声道MP3播放器最佳设定值)
6. 112Kbps=FM调频⽴体声⼴播
7. 128Kbps=磁带(⼿机⽴体声MP3播放器最佳设定值、低档MP3播放器最佳设定值)
8. 160Kbps=HIFI⾼保真(中⾼档MP3播放器最佳设定值)
9. 192Kbps=CD(⾼档MP3播放器最佳设定值)
10. 256Kbps=Studio⾳乐⼯作室(⾳乐发烧友适⽤)
11. 实际上随着技术的进步,⽐特率也越来越⾼,MP3的最⾼⽐特率为320Kbps,但⼀些格式可以达到更⾼的⽐特率和更⾼的⾳质。
12. ⽐如正逐渐兴起的APE⾳频格式,能够提供真正发烧级的⽆损⾳质和相对于WAV格式更⼩的体积,其⽐特率通常为550kbps-----
950kbps。
博客为什么没人用了常见编码模式:
1. VBR(Variable Bitrate)动态⽐特率,也就是没有固定的⽐特率,压缩软件在压缩时根据⾳频数据即时确定使⽤什么⽐特率,这是以
质量为前提兼顾⽂件⼤⼩的⽅式,推荐编码模式;
2. ABR(Average Bitrate)平均⽐特率,是VBR的⼀种插值参数。LAME针对CBR不佳的⽂件体积⽐和VBR⽣成⽂件⼤⼩不定的特点独
创了这种编码模式。ABR在指定的⽂件⼤⼩内,以每50帧(30帧约1秒)为⼀段,低频和不敏感频率使⽤相对低的流量,⾼频和⼤动态表现时使⽤⾼流量,可以做为VBR和CBR的⼀种折衷选择。
3. CBR(Constant Bitrate),常数⽐特率,指⽂件从头到尾都是⼀种位速率。相对于VBR和ABR来讲,它压缩出来的⽂件体积很⼤,⽽
且⾳质相对于VBR和ABR不会有明显的提⾼。
通俗表⽰:
简单来讲,采样率和⽐特率就像是坐标轴上的横纵坐标。
横坐标的采样率表⽰了每秒钟的采样次数。
纵坐标的⽐特率表⽰了⽤数字量来量化模拟量的时候的精度。
采样率类似于动态影像的帧数,⽐如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的⼀个个静⽌画⾯再以采样率同样的速度回放时,看到的就是连续的画⾯。同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声⾳。显然,这个采样率越⾼,听到的声⾳和看到的图像就越连贯。当然,⼈的听觉和视觉器官能分辨的采样率是有限的,基本上⾼于44.1kHZ采样的声⾳,绝⼤部分⼈已经觉察不到其中的分别了。
⽽声⾳的位数就相当于画⾯的颜⾊数,表⽰每个取样的数据量,当然数据量越⼤,回放的声⾳越准确,不⾄于把开⽔壶的叫声和⽕车的鸣笛混淆。同样的道理,对于画⾯来说就是更清晰和准确,不⾄于把⾎和西红柿酱混淆。不过受⼈的器官的机能限制,16位的声⾳和24位的画⾯基本已经是普通⼈类的极限了,更⾼位数就只能靠仪器才能分辨出来了。⽐如电话就是3kHZ取样的7位声⾳,⽽CD是44.1kHZ取样
的16位声⾳,所以CD就⽐电话更清楚。
解释:
1、那为什么很多专业的标准都达到了24Bit/192KHz呢?
现在普遍在⼯程中都是使⽤48kHz或者96kHz频率录⾳,只有在最终母带处理时才会转成44.1kHz的CD格式,这样减少多次采样率转换造成的失真。
⽽在电脑领域,作为⾳频硬件codec标准的AC97规范只规定了48kHz。这造成⼏乎所有的输⼊、输出信号都要被重新采样(专业术语叫采样率转换,即 SRC)。SRC⼀般都会造成⾳质的损失,较简单(即较差)的SRC算法会造成⾳质明显劣化。但这已经是⼀个既成事实了。
2、既然44K够了,那为什么还要⽤192KHZ来录⾳?
⾸先,20kHz只是⼤多数⼈的听觉门限,也就是说,⼈⽿对于20kHz以上的声⾳很不敏感。注意不敏感并不意味着完全⽆法感知。⼤多数乐器(特别是钢琴和弦乐器)的乐⾳含有丰富的⾼次谐波,⽤⾳乐术语来说即所谓的上⽅泛⾳。截⽌频率为22.05kHz的CD⾳频,的确会给听惯了真实乐器的⼈⼀种不⾃然的感觉,尤其在⾼频部分,因为奈奎斯特截⽌频率造成更⾼频率泛⾳的信号失真。
其次,数字录⾳通常都需要进⾏后处理。⾳频处理会对信号产⽣进⼀步的失真,包括信号畸变、频谱混叠,等等。如果录⾳时仅仅⽤
44.1kHz对原始信号采样,那么在后处理前还得进⾏上采样(up-sampling),对采样频率进⾏扩展。由于这种扩展是“假”的,实际上并没有更多有⽤的原始信号,并且上采样算法的优劣也会影响原录⾳信号的失真,所以这个做法并不可取。因此,通常的做法是⽤更⾼的频率进⾏采样。
⽽现在的完全专业数字录⾳棚中,则不再按CD标准的规范录⾳、混⾳以及母带,⽽是优先使⽤HD⾳频规范。即:
采⽤24Bit 48KHz、24Bit 96KHz、24Bit 192KHz 三种规格进⾏录⾳,当然,24Bit 48KHz是⼀些⼩的录⾳棚使⽤,因为他们的处理器资源有限。⽽⼤的录⾳棚,都清⼀⾊的使⽤24Bit 96KHz和24Bit 192KHz 进⾏录⾳。
那么,这样的录⾳规范,有什么好处?
1.符合HD⾳频标准,这也是将来的主流标准,制作出的成品,可以直接应⽤于HDCD、DVD-Audio、蓝光唱⽚、数字⾳乐下载业务、数字对媒体播放机业务。
2.完全照顾数字影视视频业务,多声道电影视频都会采⽤HD⾳频规范。包括移动便携数字视频设备都⽤
它。
3.完全照顾消费性⾳频播放业务,⽐如:因特尔HD-Audio⾳频标准,AC97⾳频编码解码,便携MP3/mp4/电话/游戏机最⾼⾳频质量播放。
⽬前,专业录⾳⾏业的最⾼质量标准就是:24⽐特定点位深、192000Hz采样频率,简称“24Bit/192KHz”。当然,将来这个标准依然会继续提⾼,向32Bit 384KHz进发也是可能的。
实际上,现在的CD唱⽚市场上卖的产品(正版),最低级别的通常都是HDCD唱⽚,你买唱⽚时都会发现基本上都是HDCD标识,也就是⼀张激光唱⽚包含两种⾳轨:普通CD⾳轨和HDCD⾳轨。其中CD⾳轨记录16⽐特44.1KHz信号(这是这张唱⽚的兼容内容,照顾早期的CD播放机),HDCD⾳轨则记录24Bit 96KHz信号(这才是该唱⽚的主要内容)。普通的CD播放机只能播放CD⾳轨信号,⽽HDCD⾳轨则需要HDCD播放机才能播放(实际上现在的绝⼤多数 DVD播放机都能播放HDCD,⽽现在的电脑则更没问题了。)
最后附上⼀张图以便跟好的理解:
说明:虽然⽂章有⼀定历史,但可以了解相关知识点。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。