第一次作业:
1:、声音可分为两种:纯音和复合音,平常人们说话的声音属于哪一种?语音的频率范围是多少?音频通常包括哪几种声音信号?其频率范围是多少?
2、请说明音频信号数字化的三个步骤?
3、如何理解“量化是信号数字化过程中重要的一步,而这一过程又是引入噪声的主要根源”这句话的含义?通过哪些途径可以减小量化误差?
4对双极性信号若采用均匀量化,则量化信噪比SNR与量化比特数之间的关系为:SNR=6.02xN+1.76dB,试分析此式对实际量化与编码的指导意义?
5:、A/D、D/A转换器的技术指标有哪些?
答:1:人们说话的声音为复合音,语言的频率范围为300HZ-3000HZ。音频暴多语音、音乐、效果声等声音信号,频率范围为20HZ-20KHZ。
2:1取样:对连续信号按一定的时间间隔取样。奈奎斯特取样定理认为,只要取样频率大于等于信号中所包含的最高频率的两倍,则可以根据其取样完全恢复出原始信号,这相当于当信号是最高频率时,
每一周期至少要采取两个点。但这只是理论上的定理,在实际操作中,人们用混叠波形,从而使取得的信号更接近原始信号。2量化:取样的离散音频要转化为计算机能够表示的数据范围,这个过程称为量化。量化的等级取决于量化精度,也就是用多少位二进制数来表示一个音频数据。一般有8位,12位或16位。量化精度越高,声音的保真度越高。以8位的举例稍微说明一下其中的原理。若一台计算机能够接收八位二进制数据,则相当于能够接受256个十进制的数,即有256个电平数,用这些数来代表模拟信号的电平,可以有256种,但是实际上采样后的某一时刻信号的电平不一定和256个电平某一个相等,此时只能用最接近的数字代码表示取样信号电平。3编码:对音频信号取样并量化成二进制,但实际上就是对音频信号进行编码,但用不同的取样频率和不同的量化位数记录声音,在单位时间中,所需存贮空间是不一样的。波形声音的主要参数包括:取样频率.量化位数.声道数.压缩编码方案和数码率等,未压缩前,波形声音的码率计算公式为:波形声音的码率=取样频率*量化位数*声道数/8。波形声音的码率一般比较大,所以必需对转换后的数据进行压缩。
3:量化是按四舍五入对采样的样本值进行计量的,这个过程会产生误差可对噪声进行整形,提高采样频率等方法减小量化误差
4:量化比特数增加一位,则信噪比提高6dB,信噪比提高意味着声音动态范围的加宽,若采用量化比特N=16的A/D变换器的数字声记录在磁带上可以扩展到98dB,接近于交响乐动态范围,若将量化比特提高到N=20,可扩至人儿的122dB动态范围。
5:A/D的技术指标有:分辨率、转换速率、量化误差、偏移误差、满刻度误差和线性度误差等。D/A转换器的技术指标有:分辨率和建立时间。
第二次作业:
1.什么叫最小可闻阈?什么叫掩蔽阈?什么叫频域掩蔽?什么叫时域掩蔽?掩蔽效应的一般规律是什么?
2.何谓临界频带?简述它在音频编码中的应用。
3.音频编码通常分为哪几类?它们各有什么优缺点?
4.声音压缩的依据是什么?MPEG-1音频编码利用了听觉系统的什么特性?
5.子带编码的基本思想是什么?进行子带编码的好处是什么?
6 .在MUSICAM的MPEG Layer I编码器的比特分配中,请读/写出32位“标题”:1111 1111 1111 0010 1101 0001 0101 1101 所表示的信息。
7.什么叫做5.1声道环绕立体声?
8.MUSICAM音频比特流数据帧中的比例因子起什么作用?
9 .简述杜比AC-3的音频编码原理,并比较AC-3与MPEG2(AAC)音频编码的异同。
10 .怎样理解AC-3的音频编码中的“指数”、“尾数”、“指数策略”?
11 .MPEG-4音频编码有何特点?MPEG-4音频编码标准具有良好的发展前景,主要体现在哪些方面?
答:
1、最小可闻阈:等响度曲线中的0方曲线以下区域为不可闻区,他表示虽然人耳处存在一
定的声压,却感觉不到,因此把0方等响度曲线命名为最小可闻阈;掩蔽阈:当出现一个强度高于原频率的另一个频率声音时的最小可闻阈;频域掩蔽:强纯音掩蔽在其附近同时发生的弱纯音的特性;强音压弱音,低频音压高频音
2、当噪声掩蔽纯音是起作用的是以纯音频率为中心频率的一定频带宽度内噪音频率。如果
频带内的噪声功率等于在噪声中刚能响到该纯音的功率所对应的频率。临界频率表征了人类的主要听
觉特性,他是研究纯音对窄带噪声掩蔽时被发现的,在家款噪声带宽时,最初是掩蔽量大增,但带宽超过一定值后,掩蔽量是不同增加;这种音频编码中的主要作用在于去掉大量的冗余,压缩数码率。
3、(1)波形编码,包括自适应变换编码和子带编码:适应性强,算法复杂度低,编解码
延时短,重建音频信号质量一般较高,但压缩比不高。(2)参数编码:优点压缩比高,但计算量大,重建音频信号的质量差,自然度低,不适合高保真度要求的场合。(3)混合编码:在较低的数码率上得到较高的音质。:
4、压缩编码结合人的听觉特性将对听觉无关的信号删除,充分利用声音冗余度以进一步节
约数码率而对恢复后的声音质量无影响。MPEG-1利用了掩蔽效应的心理声学模型
5、子带编码的基本思想:利用声音信号频谱分布的不均匀,将其分割成许多子频带,就每
一个子带分别进行编码。好处:(1)减少了各子带信号能量分布不均匀的程度,减少了动态范围。(2)可根据每个子带信号在感知上的重要性(即利用人对声音信号的感知模型),对每个子带内的采样值分配不同的比特数。
6、同步字,算法为其他算法,layerIII,加入冗余度信息列音频数据内,比特率为256kbit/s,
采样频率44.1KHZ,它含有附加信道。个人专用,开启强度立体声,关闭MS立体声,有片反权比特流为整体,?
7、5.1声道环绕立体声:三个前方的左声道、右声道和中置声道以及两个后方的左、右环
绕声道,这五个声道皆为全频带的(20HZ~20KHZ),另一个超低音声道,其频带范围只有(20~120HZ)将此超低音称为0.1声道,加上前面的五个声道,就构成了杜比数字的
5.1声道。
8、1充分利用量化器的量化范围,通过比特分配和比例因子相结合,可以表示动态范围超
过120db;2若一个给定的子带中的量化噪声超过了心理声学模型所提供的掩蔽阈值,那么该子带的比例因子就该将调整减少量化噪声
9、原理:采用知压缩编码技术,将每一声道的音频数据通过时域混迭消除(TDAC)技术滤
波后,根据人耳听觉特性划分为许多最优的狭窄频段,对于每个频段,频段内噪声信号的频率与有用信号的频率非常接近,可以使遮蔽效应发挥最大作用,频段以外的所有信号可以全部被滤除掉而不会损伤有用信号,进行由时域变换到频域的指数变换,变换系数的指数部分经编码后构成了整个信号大
致的频谱包络,利用512个采样值点和256 个采样值点两种长度组成块的切换,得到较好的频率分辨力,同时也能得到较高的编码
效率
比较:杜比AC-3和MPEG-2(AAC)都是利用人耳听觉系统在频域时域中的掩蔽效应以及心理声学模型,但那不同的是MPEG-2(AAC)比AC-3有更大的灵活性,做到了极低的数据比特率下声音达到了广播级。
10、时域的PCM取样信号从时域变换到频域,得到一系列的频率系统,每个频率以二进制指数形式表示,即由一个指数和一个尾数构成,指数反映信号的频谱包络,用频谱包络决定分配给每个尾数,获取高的声音质量,因此需对每一个归一化尾数的比特进行优选化分配,用频谱包络(指数)决定分配给每个尾数多少比特
11、特点:高度的灵活性和可扩展性。
发展前景主要体现在:与以前的音频编码标准相比,MPEG-4增加了许多新的关于合成内容及场景描述等的领域的工作,增加了诸如可分级性,音调变化、可编辑性及延迟等新功能。MPEG-4将以前发展良好但相互独立的高质量音频编码、计算机音乐及合成语音等第一次合并在一起,在诸多领域内给
予高度的灵活性。为了实现基于内容的编码,MPEG-4音频编码也引入了音频对象的概念。AO可以是混合声音中的任一种基本音,例如交响乐中某一种乐器的演奏者,或者电影声音中人物的对白。通过不同AO的混合和去除,用户就能得到所需要的某种基本的混合音。此外,MPEG-4还支持自然声音、合成声音以及自然和合成声音混合在一起的合成/自然混合编码。以算法和工具形式对音频对象进行压缩和控制。
有个叫什么代码的电影第三次作业:
1.什么是MIDI?它有什么特点?
2.常用的MIDI乐音合成法有哪些?请说明它们的基本原理。
3.什么是MP3,它有哪些特点?请说明MP3与mp3PRO 的区别、联系?
4.数字音频文件的格式通常分为哪两类?它们各有什么特点?
5.常见的非压缩格式音频文件有哪些,压缩格式音频文件有哪些?
6.数字音频物理接口有哪些?又有哪些数字音频接口标准?请画出IEC958(AES/EBU)音频接口数据格式,并加以详细说明。
答案:
1:MIDI是MIDI协会设计的音乐文件标准时目前最常用的格式、MIDI文件记录的是指令而非数据,因此站有空间小;特点:1非数据文件,而是指令;2所需存储空间小;3声音质量取决于声音的输出设备,不会产生数据损耗问题
2:常用的MIDI乐音合成法有:频率调制(FM)合成法;波形表合成法。原理:FM合成法:数字式频率调制合成音乐,使用数学模型描述音乐波形,到生成基波和谐波的方法,并且将其用数字的方法合成乐音是其核心。波形合成法:;预先录制各种典型乐器音符,利用采样的方法将其数字化,然后将数字化的样本乐音做成一张波形表,用他们代替频率合成中产生基本乐音的方法,然后经过合成和包络处理生成需要的乐音。
3:MP3是MPEG-1标准音频层III;特点:MP3的压缩码结合了MUSICAM和ASPEC两种算法,利用了人体听觉系统掩蔽效应中的频域掩蔽效应。MP3与MP3PRO的区别与联系:MP3与MP3PRO的音质相同,MP3PRO部分编码与MP3相同,但是MP3PRO比MP3pro相比将压缩率提高了两倍。
4:数字音频文件的格式通常分为两大类:波形音频文件和MIDI文件。
波形音频文件是通过声音录入设备录制的原始声音,直接记录了原始真实声音信息的数据文件,通常文件较大。
MIDI文件是一种音乐演奏指令序列,相当于乐谱,可利用声音输出设备或与计算机相连的电子乐器进行演奏,其文件记录的是一系列指令而不是数字化后的波形数据,因此它占用存储空间比较小。
5:常见的非压缩格式音频文件有:wave和MIDI;压缩格式音频文件有REAL和MP3。
6:数字音频物理接口有:SCSI、ATA、USB、IEEE1394;音频接口标准:AES/EBU数字音频接口,CCIR数字音频接口,IEC数字音频接口,SPDIF数字音频接口,MADI多信道数字音频接口,MIDI音乐设备数字接口。见P126。
第四次作业
1.什么是数字域频率均衡?它有哪些类型及其特点?
2.请描述CD盘的结构,以及CD激光唱机的工作原理。
3.请说明双声道旋转磁头式(R-DAT)数字磁带录音机的磁带类型,以及磁迹规格。
4.请说明磁光盘的记录读出原理。
5.请说明调音台的功能及结构。
6.请说明多声道固定磁头式(S-DAT)数字磁带录音机的磁带格式。
答案:1、数字域频率均衡:通过某种手段调整复合信号总所含有的频率分量幅度,致使某些频率分量的幅度增大或降低。类型:1、斜坡型:频率均衡随频率变化呈现单调指开或衰减,可在较宽的频率段对低频或高频进行补偿,但不适合对窄频进行音的调整;2、峰谷型、均衡特性相似谐振峰,仅对某些频率点补偿量最强,偏离流点频率的两侧,频率呈现下降或上升趋势,其补偿量的上升若,而衰减若山谷;3、图式型:在20HZ~20000KHZ整个音频范围内,按照1/3或2/3倍频程安排多个固定频点实行峰谷型补偿;4:参量型:它是在峰谷型补偿基础上增加了峰点两侧频率范围的幅变改变。
2、CD盘是由透明塑料、信息坑、反射光的金属膜以及保护层共同组成。形状是圆形的外半径为60mm,信息坑用来存储信息;内径25mm,凹槽圆孔半径为5mm。
工作原理:由半导体激光器产生780~630mm范围内的一束波长红光,经光学系统聚焦成光点。照射到数字音频光盘上的有无信号坑处,将产生强度不同的反射光。经光电转换器件的转换可将存储在光盘上的数字音频信号转换为脉冲信号,再经数字信号处理,输出音频模拟信号,也可直接以数字音频信号输出。
3、磁带类型:外形尺寸为73mmx54mmx10.5mm,比模拟机带盒的长边短,短边也短,容量大,能连续记录2小时;磁迹规格:区域型信号配置,共分为上边缘区域、上副边缘区域、上ATF区域、主区
域、下ATF区域、下副区域、下边缘区域等七个区域。
4、将磁性体加温到居里温度时,矫顽力将变至最小,用外部的弱磁场(偏磁场)很容易地改变磁性体内磁单元的磁化方向,以信号极性形成的磁单元的磁化方向与周围不同的一系列微小区段来进行信号记录存储;再对数据进行读取时,刚好与记录的数据过程相反。
5、功能:调音台是一种将多路不同电平的音频信号经必要的处理,如动态、频率均衡、噪声抑制、时间效果;依照节目要求声音素材应有的电平值加以混合、分配,送入记录载体给予记录或送至重放系统回放的一个控制、处理设备。结构:调音台是由通道输入组件、母线输入组件、输出总控组件、振荡器等单元以及各种按键、电平监测和输入输出插座面板组成。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。