(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 105518775 A (43)申请公布日 2016.04.20 | ||
(21)申请号 CN201480041810.X
(22)申请日 2014.07.18
(71)申请人 弗朗霍夫应用科学研究促进协会
地址 德国慕尼黑
(72)发明人 西蒙·法格 阿西姆·孔茨 迈克尔·卡拉舒曼 威尔卡莫·尤哈
(74)专利代理机构 北京清亦华知识产权代理事务所(普通合伙)
代理人 宋融冰
(51)Int.CI
G10L19/008
权利要求说明书 说明书 幅图 |
(54)发明名称
使用自适应相位校准的多声道降混的梳型滤波器的伪迹消除 | |
(57)摘要
一种音频信号处理解码器,包含至少一个频带(36),且所述音频信号处理解码器用于处理在至少一个频带(36)内具有多个输入声道(38)的输入音频信号(37),其中所述解码器(2)被配置用于分析所述输入音频信号(37),识别所述输入声道(38)之间的声道间依赖性;被配置用于根据所述识别的声道间依赖性(39)以校准所述输入声道(38)的相位,其中所述输入声道(38)的相位互相之间被校准得越多,其声道间依赖性(39)越高;以及被配置用于将所述校准的输入音频信号降混至输出音频信号(40),所述输出音频信号(40)具有数目比所述输入声道(38)的数目少的输出声道(41)。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
权 利 要 求 说 明 书
1.一种音频信号处理解码器,包含至少一个频带(36),且所述音频信号处理解码器用于处理在至少一个频带(36)内具有多个输入声道(38)的输入音频信号(37),其中所述解码器(1)被配置用于
根据所述输入声道(38)之间的声道间依赖性(39)校准所述输入声道(38)的相位,其中所述输入声道(38)的相位互相之间被校准得越多,其声道间依赖性(39)越高;以及
将所述校准的输入音频信号降混至输出音频信号(40),所述输出音频信号(40)具有数目比所述输入声道(38)的数目少的输出声道(41)。
2.如权利要求1所述的解码器,其中为了识别所述输入音频声道(38)之间的所述声道间依赖性(39)或为了接收来自提供所述输入音频信号(37)的外部装置,例如编码器(1)的输入声道(38)之间的所述声道间依赖性(39),所述解码器(2)被配置用于分析在所述频带(36)内的所述输入音频信号(37)。
<Claim>3.如权利要求1或2所述的解码器,其中所述解码器(2)被配置用于根据所述输入音频信号(37)的已经确定的能量,归一化所述输出音频信号(40)的所述能量,其中所述解码器(2)被配置用于确定所述输入音频信号(37)的所述信号能量或用于接收来自于提供所述输入音频信号(37)的外部装置,例如编码器(1)的所述输入音频信号(37)的已经确定的能量。
<Claim>4.如权利要求1至3中任一项所述的解码器,其中所述解码器(2)包含降混器(42),所述降混器(42)用于根据降混矩阵(M,M<Sub>PA</Sub>)降混所述输入音频信号(37),其中所述解码器(1)被配置用于计算所述降混矩阵(M,M<Sub>PA</Sub>),使得根据所述识别的声道间依赖性(39)校准所述输入声道(38)的所述相位,或所述解码器(1)被配置用于接收计算得到的所述降混矩阵(M,M<Sub>PA</Sub>),使得根据来自于提供所述输入音频信号(37)的外部装置,例如编码器(1)的所述识别的声道间依赖性(39)校准所述输入声道(38)的所述相位。
5.如权利要求4所述的解码器,其中所述解码器(2)被配置用于计算所述降混矩阵(M,M<Sub>PA</Sub>),使得根据所述输入音频信号(37)的已经确定的能量归一化所述输出音频信号(41)的能量,或被配置用于接收所述降混矩阵(M,M<Sub>PA</Sub>),所述降混矩阵(M,M<Sub>PA</Sub>)被计算使得根据来自于提供所述输入音频信号(37)的外部装置,例如编码器(1)的所述输入音频信号(37)的所述已经确定的能量归一化所述输出音频信号(41)的能量。
<Claim>6.如权利要求1至5中任一项所述的解码器,其中所述解码器(2)被配置用于使用窗口函数分析所述输入音频信号(37)的时间间隔(43),其中所述声道间依赖性(39)对于每一个时间帧(43)都被确定,或其中所述解码器(2)被配置用于使用窗口函数从提供所述输入音频信号(37)的外部装置,例如编码器(1)接收所述输入音频信号(37)的时间间隔(43)的分析,其中所述声道间依赖性(39)对于每一个时间帧(43)都被确定。
<Claim>7.如权利要求1至6中任一项所述的解码器,其中所述解码器(2)用于计算协方差值矩阵(C,C<Sub>y</Sub>),其中所述协方差值(c<Sub>i,j</Sub>,C<Sub>y,A,B</Sub>)表示一对输入音频声道(38)的声道间依赖性(39),或其中所述解码器(2)用于从提供所述输入
音频信号(37)的外部装置,例如编码器(1)接收协方差值矩阵(C,C<Sub>y</Sub>),其中所述协方差值(c<Sub>i,j</Sub>,C<Sub>y,A,B</Sub>)表示一对输入音频声道(38)的声道间依赖性(39)。
8.如权利要求7所述的解码器,其中所述解码器(2)用于通过应用映射函数(f(c′<Sub>i,j</Sub>),T<Sub>A,B</Sub>)至所述协方差值矩阵(C,C<Sub>y</Sub>)或从所述协方差值矩阵(C,C<Sub>y</Sub>)所得到的矩阵(C′)而建立吸引力值矩阵(A,P),或用于接收吸引力值矩阵(A,P),所述吸引力值矩阵(A,P)是通过应用映射函数(f(c′<Sub>i,j</Sub>),T<Sub>A,B</Sub>)至所述协方差值矩阵(C,C<Sub>y</Sub>)或从所述协方差值矩阵(C,C<Sub>y</Sub>)所得到的矩阵(C′)而建立的,其中对于所有的协方差值(c<Sub>i,j</Sub>,C<Sub>y,A,B</Sub>)或从所述协方差值(c<Sub>i,j</Sub>,C<Sub>y,A,B</Sub>)所得到的数值(c′<Sub>i,j</Sub>,ICC<Sub>A,B</Sub>),所述映射函数(f(c′<Sub>i,j</Sub>),T<Sub>A,B</Sub>)的梯度优选地大于或等于0,且其中对于0至1之间的输入数值,所述映射函数(f(c′<Sub>i,j</Sub>),T<Sub>A,B</Sub>)优选地达到0至1之间的数值。
9.如权利要求8所述的解码器,其中所述映射函数(f(c′<Sub>i,j</Sub>),T<Sub>A,B</Sub>)为非线性函数(f(c′<Sub>i,j</Sub>),T<Sub>A,B</Sub>)。
<Claim>10.如权利要求8或9所述的解码器,其中对于小于第一映射阈值的所述协方差值(c<Sub>i,j</Sub>,C<Sub>y,A,B</Sub>)或从所述协方差值(c<Sub>i,j</Sub>,C<Sub>y,A,B</Sub>)得到的数值(c′<Sub>i,j</Sub>,ICC<Sub>A,B</Sub>),所述映射函数(f(c′<Sub>i,j</Sub>),T<Sub>A,B</Sub>)等于0;和/或其中对于大于第二映射阈值的所述协方差值(c<Sub>i,j</Sub>,C<Sub>y,A,B</Sub>)或从所述协方差值(c<Sub>i,j</Sub>,C<Sub>y,A,B</Sub>)所得到的数值(c′<Sub>i,j</Sub>,ICC<Sub>A,B</Sub>),所述映射函数(f(c′<Sub>i,j</Sub>),T<Sub>A,B</Sub>)等于1。
<Claim>11.如权利要求8至10中任一项所述的解码器,其中所述映射函数(f(c′<Sub>i,j</Sub>),T<Sub>A,B</Sub>)由形成S形曲线的函数表示。
<Claim>12.如权利要求7至11中任一项所述的解码器,其中所述解码器(2)用于计算相位校准系数矩阵(V,M<Sub>int</Sub>),其中所述相位校准系数矩阵(V,M<Sub>int</Sub>)以所
述协方差值矩阵(C,C<Sub>y</Sub>)及原型降混矩阵(Q,M<Sub>DMX</Sub>)为基础或用于接收来自提供所述输入音频信号(37)的外部装置,例如来自编码器(1)的相位校准系数矩阵(V,M<Sub>int</Sub>),其中所述相位校准系数矩阵(V,M<Sub>int</Sub>)是以所述协方差值矩阵(C,C<Sub>y</Sub>)及原型降混矩阵(Q,M<Sub>DMX</Sub>)为基础。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论