CN1629937A - 采用频带复现增强源编码 - Google Patents

采用频带复现增强源编码 Download PDF

Info

Publication number
CN1629937A
CN1629937A CNA2004101000787A CN200410100078A CN1629937A CN 1629937 A CN1629937 A CN 1629937A CN A2004101000787 A CNA2004101000787 A CN A2004101000787A CN 200410100078 A CN200410100078 A CN 200410100078A CN 1629937 A CN1629937 A CN 1629937A
Authority
CN
China
Prior art keywords
channel
signal
frequency band
version
sound signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004101000787A
Other languages
English (en)
Other versions
CN1308916C (zh
Inventor
拉斯·古斯塔夫·里杰利德
泊·鲁那·阿尔宾·埃克斯兰德
拉斯·夫莱基克·汉恩
汉斯·玛格那斯·克里斯托弗·克乔林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE9702213A external-priority patent/SE9702213D0/xx
Priority claimed from SE9704634A external-priority patent/SE9704634D0/xx
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Publication of CN1629937A publication Critical patent/CN1629937A/zh
Application granted granted Critical
Publication of CN1308916C publication Critical patent/CN1308916C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Abstract

本发明提出增强源编码系统的新方法和装置。本发明采用在编码器(103)之前或之中减小带宽(101),而后在解码器(107)处复现频带(105)。这是通过使用新的搬移方法结合频谱包络调节实现的。从而在给定的感觉质量下降低了比特率,或在给定的比特率下改进了感觉质量。本发明最好集成在硬件或软件编解码器中,但是也可以作为与编解码器结合的独立的处理器实现。本发明提供了实际上与编解码器类型及技术进步无关的实质性的改进。

Description

采用频带复现增强源编码
本申请是申请日为1998年6月9日,申请号为98800792.4,标题为“采用频带复现增强源编码”的专利申请的分案申请。
在源编码系统中,数字数据在传输或存储之前被压缩,以便降低所需的比特率或存储量。本发明涉及利用频带复现(SBR)改进源编码系统的新方法和装置。在保持相同的感觉质量之下达到了明显的比特率降低,或者反过来,在给定的比特率之下达到了感觉质量的改进。这是利用在编码器侧减小带宽而以后在解码器处复现频带实现的,从而本发明开拓了频域中信号冗余的新概念。
音频源编码技术可分为两类:自然音频编码和语音编码。自然音频编码通常用于音乐或中等比特率的任意信号,并一般提供很宽的音频带宽。语音编码器基本上限制在语音再生,但另一方面可在很低的比特率使用,虽然音频带宽低。宽带语音提供胜于窄带语音的显著主观质量的改进。增加带宽不仅改进了语音的可理解性和自然性,而且便于对说话者识别。于是,宽带语音编码在下一代电话系统中是很重要的项目,由于多媒体领域的急剧的发展,音乐和其它非语音信号通过电话系统高质量的传输是一种诱人的前景。
高保真线性PCM信号对感觉熵就比特率来说是非常低效的。CD标准规定采样频率为44.1kHz,每个样值为16位和立体声。这等于1411kbit/s的比特率。为了有力地降低比特率,可以使用分裂频带感觉音频编解码器进行源编码。这些自然音频编解码器利用了信号中的感觉非相干性和统计冗余性。使用最佳编解码技术,对标准的CD格式信号能够达到大约90%数据压缩,而实际上感觉不到质量有所下降。很高的立体声声音质量能够以96kbit/s,即大约为15∶1的压缩因子获得。某些感觉编解码器提供了更高的压缩比。为了达到这一点,通常要降低采样率,于是就要降低音频带宽。通常还要减少量化电平数,允许偶而有可听出的量化失真,并通过强度编码,使用立体声场的变差。过分使用这种方法的结果是令人生厌的感觉质量下降。当前的编解码器技术近于极限,故不能指望进一步提高编码增益。为了进一步改进编码性能,需要新的方法。
人类嗓音和许多乐器产生振动系统发出的准平稳信号。根据付立叶理论,任何周期信号能够表示为频率为f,2f,3f,4f,5f等的正弦波之和。这里f是基频。这些频率形成一个调和级数。这种信号的带宽限制等价于调和级数的截尾。这种截尾改变了听到的乐器或嗓音的音调,音色,并产生听起来“压抑”或“迟钝”的音频信号,并可能降低可理解性。这样,高频对于声音质量的主观印象是重要的。
先有的技术方法主要倾向于语音编解码器性能的改进,特别倾向于高频再生(HFR),这是语音编码中的一个问题。这种方法采用宽带线性频移,非线性性或折叠[U.S.Pat 5,127,054],这将产生互调或其它非谐波频率成分,当它们加到音乐信号时会引起严重不谐和音。在语音编码文献中这种不谐和音称为“刺耳的”或“难听的”声音。其它合成语音的HFR方法产生正弦谐波,该谐波基于基音调的估计,于是局限于音调平稳的声音[U.S.Pat.4,771,465]。这种先有的技术方法虽然对低质量的语音应用是有用的,但是对高质量的语音或音乐信号不适用。一些方法试图改进高质量音频源编解码器。一种方法使用在解码器产生的合成噪声信号以代替先前由编码器丢弃的语音或音乐中的类似噪声的信号[“Improving Audio Codecs by Noise Substitution”D.Schultz,JAES,Vol.44,No.7/8,1996]。当噪声信号存在时,这是在基于间歇另一种正常传输的高频带内进行的。另一种方法则再生某些在编码过程中丢失的高频带谐波[″Audio Spectral Coder″A.J.S.Ferreira,AES Preprint4201,100th Convention,May 11-14 1996,Copenhagen],这也是依靠音调信号和音高检测。两种方法都基于低占空度工作,提供比较有限的编码或性能增益。
本发明对数字源编码系统的实质改进或更具体来说对音频编解码器的改进,提供了新的方法和装置。目的包括降低比特率或改进感觉质量或这两者。本发明基于采用谐波冗余的新方法,提供在传输或存储之前丢弃信号的一些通带的可能性。如果解码器根据本发明进行高质量的频谱复现,则不会觉察到感觉质量下降。被丢弃的这些比特表示在固定感觉质量下的编码增益。另外,如果比特率保持不变,那么就能够分配更多的比特用于对低频带信号的编码,因而达到较高的感觉质量。
本发明假设基于低频带和高频带频谱成分之间的直接关系能够扩展出被截去的谐波序列。如果遵从以下这些规则,这一扩展的序列就在感觉上与原始序列类似:首先,外推的频谱成分与截去的谐波序列必需调和相关,以避免关系不谐和的人工痕迹。本发明使用搬移作为频谱复现过程的手段,这保证了符合这一准则。然而对于成功的操作并不需要低频带频谱成分形成谐波序列,因为与低频带频谱成分谐和相关的新的被复现的成分将不会改变信号的噪声形或瞬变性质。搬移定义为在保持分音频率比的同时将分音从音乐音阶的一个位置向另一位置谐音的搬移。第二,被复现的高频带的频谱包络,即粗燥的频谱分布,必须与原始信号的频谱包络很好地合理相似。本发明提供了两种不同的调节频谱包络的操作模式,SBR-1和SBR-2。
用于改进中等质量编解码器应用的SBR-1是一种单端过程,它只依赖于包含在解码器接收的低频带或低通信号中的信息。例如使用多项式与规则集或代码簿一同确定并推导出这种信号的频谱包络。这种信息用来连续调节并均衡复现的高频带。本发明的SBR-1方法提供了后处理的优点,即不需要编码器侧的修改。播音机构将在频带利用上获得好处或能够提供改进的感觉质量或两者的组合。能够使用现有的比特流句法和标准而无需修改。
用于改进高质量编解码器应用的SBR-2是一种双端过程,其中除了根据SBR-1传输的低频带信号之外,还对高频带的频谱包络进行编码和传输。由于频谱包络的变化具有比高频带信号成分低得多的速率,故为了成功地表示频谱包络只需要传输有限的信息。SBR-2能够用来改进当前编解码器技术的性能,对现有的句法或协议不需要或只需要很少的修改,可作为开发未来编解码器的有价值的工具。
当低频带中一些较小的通带在缺乏比特的条件下按心理声学模型规定的那样用解码器略去时,SBR-1和SBR-2都能够用于复现这些通带。其结果是通过在低频带之外的频谱复现和在低频带内的频谱复现改进了感觉质量。而且,SBR-1和SBR-2还能够用于采用比特率可变的编解码器,其中接收机的信号感觉质量依赖于传输频带的条件而变化。这通常意味着接收机音频带宽不良的变化。在这种条件下,SBR方法能够成功地用来保持不变的高频带宽,这又改进了感觉质量。
本发明基于连续方式操作,复现任何类型的信号内容,即音调的或非音调的(噪声形和瞬时信号)。本频谱复现方法根据解码器可得的频带生成在感觉上是被丢弃的频带的精确复现的拷贝。因而,SBR方法与先有技术相比提供了相当高的编码增益或改进的感觉质量。本发明能够与这种先有技术编解码器改进方法结合;然而,这种结合不会有性能上的提高。
SBR方法包括以下步骤:
-对从原始信号推导得出的信号进行编码,形成第一信号,在这过程中信号的一些频带在编码之前或编码期间被丢弃,
-在第一信号解码期间或解码之后,搬移第一信号的频带,形成第二信号,
-进行频谱包络调节,以及
-组合解码信号和第二信号,形成输出信号。
可以将第二信号的通带设置成与第一信号的通带不重叠或部分地重叠,并能够依照原始信号和/或第一信号的瞬时特征或传输信道的状态设置。基于来自所述第一信号的原始频谱包络的估计或被传输的原始信号包络信息,进行频谱包络调节。
本发明包括两种搬移器的基本类型:具有不同性质的多带搬移器和时变模式搜索预测搬移器。基本的多带搬移根据本发明可按以下进行:
-通过通带分别包括频率[f1,…fN]的N≥2个带通滤波器对要被搬移的信号进行滤波,形成N个带通信号,
-将这些带通信号在频率上移到包含频率M[f1,…fN]的区域,其中M≠1为搬移因子,以及
-组合这些搬移了的带通信号,形成搬移的信号。
另外,可以根据本发明如下进行这一基本多带搬移:
-使用分析滤波器组或产生低通型实或复值子带信号的变换对要被搬移信号的信号进行带通滤波,
-将所述分析滤波器组或变换的任意个频道k连接到合成滤波器组或变换中的频道Mk,M≠1,以及
-使用合成的滤波器组或变换形成搬移的信号。
根据本发明一种改进的多带搬移结合了相位调节,故提高了基本多带搬移的性能。
根据本发明的时变模式搜索预测搬移可以如下进行:
-对第一信号进行瞬时检测,
-根据瞬时检测的结果确定在复现/丢弃第一信号的部分时要使用第一信号的哪一段,
-根据瞬时检测的结果调节状态向量和码本的性质,以及
-基于先前同步点搜索中找到的同步点,搜索第一信号的所选段中的同步点。
根据本发明的SBR方法和装置提供了以下特点:
1.该方法和装置采用了频域中信号冗余的新概念。
2.该方法和装置适用于任意信号。
3.每一谐波集是被分别生成和控制的。
4.所有被复现的谐波是以形成与现有谐波序列连续这样的方式产生的。
5.频谱复现过程基于搬移且不生成或可觉察的人工痕迹。
6.频谱复现能够覆盖多个较小的频带和/或一个宽的频率范围。
7.在SBR-1方法中,处理只在解码器侧进行,能够使用所有的标准和协议而无需修改。
8.SBR-2方法能够根据大多数标准和协议实现,不需要或只要很少的修改。
9.SBR-2方法向编解码器设计者提供了新的有力的压缩工具。
10.编码增益是显著的。
许多吸引人的应用涉及各种类型的低比特率编解码器的改进,诸如MPEG1/2LayerI/II/III[U.S.Pat.5,040,217],MPEG2/4 AAC,Dolby AC-2/3,NTT TwinVQ[U.S.Pat.5,684,920]AT&T/Lucent PAC等等。本发明还可用于诸如宽带CELP和SB-ADPCM G.722等高质量语音编解码器,以改进感觉质量。以上的编解码器广泛用于多媒体,电话业,因特网以及专业应用。T-DAB(地面数字音频广播)系统使用低比特率协议,通过使用本发明的方法将增加频道的利用,或者改进FM和AM DAB中的质量。卫星S-DAB将显著增加,由于所涉及的过高的系统成本,通过使用本发明的方法以增加DAB多路复用的节目频道数。此外,首先,使用低速率电话调制解调器,通过因特网能够实现全带宽音频实时流。
以下将参照附图通过解释例的方式对本发明进行说明,但并不限制本发明的范围和精神,其中:
图1表示根据本发明装在编码系统中的SBR;
图2表示根据本发明的上谐波频谱复现;
图3表示根据本发明的带内谐波的频谱复现;
图4是对于根据本发明的搬移器的时域实现的框图;
图5是表示根据本发明的模式搜索预测搬移器的一个操作周期的流程图;
图6是表示根据本发明对于同步点搜索的流程图;
图7a-7b表示根据本发明在瞬态期间的码本定位;
图8是表示对于根据本发明的SBR操作,与适当的滤波器组相连接的时域搬移器的实现的框图;
图9a-9c是表示根据本发明为产生2次谐波配置的STFT分析和合成装置的框图;
图10a-10b是根据本发明在STFT装置中带有线性频移子带的框图;
图11表示使用根据本发明的相位乘法器的一个子带;
图12表示根据本发明如何产生3次谐波;
图13表示根据本发明如何同时产生3次和2次谐波;
图14表示根据本发明几个谐波段非重叠组合的产生;
图15表示根据本发明几个谐波段交替组合的产生;
图16表示宽带线性频移的产生;
图17表示根据本发明如何产生子谐波;
图18a-18b是感觉编解码器的框图;
图19最大抽取滤波器组的基本结构;
图20表示根据本发明在最大抽取滤波器组中2次谐波的产生;
图21是根据本发明对于最大抽取滤波器组对子带信号操作的改进的多带搬移的框图;
图22是表示根据本发明在对子带信号操作的最大抽取滤波器组中改进的多带搬移的流程图;
图23表示典型的编解码器的子带采样和标度因子;
图24表示根据本发明的SBR-2的子带采样和包络信息;
图25表示根据本发明的SBR-2中隐藏包络信息的传输;
图26表示根据本发明的SBR-2中冗余编码;
图27表示使用根据本发明的SBR-1方法的编解码器的实现;以及
图28表示使用根据本发明的SBR-2方法的编解码器的实现;
图29是根据本发明的“伪立体声”产生器的框图。
在这里实施例的整个说明中,强调自然音频源编码应用。然而应当明白,本发明也可适用于编码和解码音频信号以外的源编码应用范围。
搬移基本原理
根据本发明所定义的搬移是对于频谱复现理想的方法,与先有技术相比具有若干主要的优点,诸如:不需要音调检测,对单音调和复调节目材料获得同等的高性能,对于调性和非调性信号同等良好地作搬移。与其它方法不同,根据本发明的搬移能够用于对任意信号类型进行任何音频源编码的系统。
带有时变振幅的余弦和的形式的离散时间信号x(n)的因子为M的精确搬移,由以下关系定义
x ( n ) = Σ i = 0 N - 1 e i ( n ) cos ( 2 π f i n / f s + α i ) → - - - ( 1 )
y ( n ) = Σ i = 0 n - 1 e i ( n ) cos ( 2 πM f i n / f s + β i ) - - - ( 2 )
其中N是以下称为分音的正弦波的个数,fi,ei(n),αi分别为各输入的频率,时间包络和相位常数,βI为任意输出相位常数而fs为采样频率,且0≤Mfi≤fs/2。
图2中,示出M次谐波的产生,其中M≥2。为了简略起见使用术语M次谐波,虽然该过程对一定的频率区所有的信号都产生M次谐波,它们在许多情形下本身也是某次谐波。带有频域表示X(f)的输入信号带宽限制在0到fmax的范围,201。范围fmax/M到Qfmax/M中的信号内容是借助于带通滤波器抽取的,形成带有频谱XBP(f)203的带通信号,其中Q是所需的带宽扩展因子1<Q≤M。带通信号被搬移了一个因子M,形成带有覆盖范围为fmax到Qfmax的频谱XT(f)的第二带通信号,205。这一信号的频谱包络借助于程控均衡器调节,形成带有频谱XE(f)的信号207。这一信号与输入信号的为补偿由带通滤波器和搬移器造成的延迟的延迟版本组合,从而形成带有覆盖0到Qfmax的范围的频谱Y(f)的输出信号209。或者,在搬移M之后可以使用截止频率fmax和Qfmax进行带通滤波。当然能够使用多个搬移器同时产生不同次谐波。如图3所示,以上方案还可以用于“填充”输入信号中的阻带,其中输入信号具有从f0到Qf0延伸的阻带。然后抽取通带[f0/M,Qf0/M]301,搬移一个因子M,成为[f0,Qf0]303,再调节包络305,并与延迟输入信号组合形成带有频谱Y(f)的输出信号307。
可以使用精确搬移的一种近似。根据本发明,使用不谐和音理论确定这种近似的质量。不谐和音的一种标准由Plomp[“Tonal Consonanceand Critical Bandwith”R.Plomp,W.J.M.Levelt JASA,Vol38,1965]提出,并声称,如果两个分音频率差在分音所在的临界带的带宽大约5到50%以内,则认为它们是不谐和的。例如,对于给定频率的临界带宽能够由以下近似表示
cb ( f ) = 25 + 75 ( 1 + 1.4 ( f 1000 ) 2 ) 0.69 - - - ( 3 )
其中f和cb的单位为Hz。而且Plomp说,如果两个分音频率差大约小于它们所在的临界带宽的百分之五,则人类的听觉系统不能分辨这两个分音。方程式2中的精确搬移由以下公式近似表示
y approx ( n ) = Σ i - 0 N - 1 e i ( n ) cos ( 2 π ( M f i ± Δ f i ) n / f s + β i ) , - - - ( 4 )
其中Δfi是对精确搬移的偏移。如果输入分音形成一个谐波序列,则本发明的假说称,对被搬移的分音的谐波序列的偏移不得超过它们所在的临界带宽的百分之五。这可以解释,为什么先有技术方法给出不满意的“刺耳的”或“难听的”结果,因为宽带线性频率移动产生了比可接受的偏移大得多的偏移。当先有技术方法对于只一个输入分音产生一个以上的分音时,这些分音必须仍然在上述偏移限度之内,感觉起来才如同一个分音。这又解释了使用非线性等的先有技术方法所获得的不良结果,因为它们产生了不在偏移限度之内的互调分音。
当使用根据本发明的基于以上搬移的频谱复现方法时,实现了以下重要性质:
-通常,被复现的谐波和现有的分音之间不出现频域重叠。
-被复现的分音与输入信号的谐分谐和相关,且不会引起任何令人讨厌的不谐和或人工痕迹。
-被复现谐波的频谱包络形成输入信号频谱包络的平滑连续,感觉上与原始包络匹配。
基于时变模式搜索预测的搬移
有各种方式指定所需的搬移器。典型的时域实现通过基于音调周期复现各信号段在时间上扩展信号。然后这一信号以不同的速率读出。不幸的是这些方法对于信号段的精确的时间拼接严格依赖于音调检测。此外,强制处理基于音调周期的信号段使得它们对瞬态是敏感的。由于检测到的音调周期可能比实际的瞬态长得多,故显然有复现整个瞬态而不是在时间上扩展它的危险。另一种时域算法使用输出信号的模式搜索预测获得语音信号的时间扩展/压缩[“Pattern Search Prediction ofspeech”R.Bogner,T.Li,Proc.ICASSP′89,Vol.1,May 1989,“Time-Scale Modification of Speech based on nonlinear Oscillator Model”G.Kubin,W.B.Kleijn,IEEE,1994]。这是颗粒合成的形式,其中输入信号被分为一系列用来合成输出信号的小部分,即颗粒。这种合成通常通过对信号段进行相关确定最佳拼接点来实现。这意味着用来形成输出信号的段不依赖于音调周期,于是不需要音调检测的非平凡任务。然而,在这些方法中仍然有快速改变的信号振幅带来的问题,并且高质量的搬移会引起高的计算需求。然而,现在提出改进的时域音调位移器/搬移器,其中使用瞬态检测和动态系统参数,以低的计算成本对平稳(调性或非调性)和瞬态声音期间都产生了更加精确的高搬移因子的搬移。
参照图示,其中相同的号码指示相同的元件,图4中示出九个分开的模块:瞬态检测器401,窗口位置调节器403,码本产生器405,同步信号选择器407,同步位置存储器409,最小差估计器411,输出段存储器413,混合单元415,以及下降采样器417。输入信号提供给码本产生器405和瞬态检测器401。如果检测到瞬态,则其位置送到窗口位置模块403。当生成码本时这一模块规定了乘以输入信号的窗口的大小和位置。码本产生器405从同步选择模块407接收同步位置,假设它已经连接到另一搬移器。如果这同步位置在码本内,则使用该同步位置,并产生输出段。否则码本被发送到最小差估计器411,该估计器返回一个新的同步位置。新的输出段在混合模块415中与先前的输出段一同起受到窗处理之后,在模块417中被下降采样。
为了使说明清晰,引入状态空间表示。这里,状态向量或颗粒表示输入和输出信号。输入信号由状态向量x(n)表示:
x(n)=[x(n),x(n-D),x(n-2D),...,x(n-(N-I)D)]       (5)
这是从输入信号的N个延迟样本获得的,其中N是状态向量的维数,而D是用来构成向量的输入样本之间的延迟。颗粒映射产生在每一状态向量x(n-1)后的样本x(n)。这给出方程式6,其中a(*)是映射:
x(n)=α(x(n-1)).                                     (6)
本方法中,颗粒映射使用状态搬移码本,根据先前的输出确定下一个输出。长度为L的码本被连续重构成包含状态向量和每一状态向量后的下一个样本。每一状态向量与其相邻的状态向量相隔K个样本;这使得系统能够依靠当前的被处理的信号的特性调节时间分辨率,这里K等于一表示最细分辨率。基于可能的瞬态的位置和先前码本中的同步位置选择用来构成码本的输入信号段。
这意味着在理论上对包含在码本中所有的搬移计算映射a(·):
a ( x ( n - L ) x ( n - L + K ) · · · x ( n - 1 ) ) = x ( n - L + 1 ) x ( n - L + K + 1 ) · · · x ( n ) . - - - ( 7 )
使用这个转移码本,通过搜索码本中与当前状态向量y(n-1)最相似的状态向量,计算新的输出y(n)。通过计算最小差进行这个最邻近的状态向量搜索;给出新的输出样本:
y(n)=α(y(n-1)).                                   (8)
然而系统不限于基于逐个样本的处理,而是最好基于逐段的操作。对新的输出段加窗,再与先前的输出段相加、混合被下降采样。通过由码本表示的输入段长度和从码本读出的输出段长度的比确定音调搬移因子。
返回图示,在图5和图6的中示出流程图,显示搬移器操作的周期。在501表示输入数据,对一段输入信号进行瞬态检测503;对等于输出段长度的段长度进行瞬态搜索。如果找到瞬态505,则存储瞬态的位置507并调节参数L(表示码本长度)、K(表示每一状态向量之间的样本数距离),及D(表示每一状态向量中的样本之间的延迟)509。比较该瞬的位置与先前输出段的位置511,以确定瞬态是否已经被处理。如果是513,则调节码本(窗口L)的位置、及参数K、L和D,515。在必须的参数调节之后,基于瞬态检测的结果,进行搜索新的同步或拼接点517。这一过程显示在图6。首先基于先前的同步点计算新的同步点601,根据:
Sync_pos=Sync_pos_old+S·M-S,                     (9)
其中Sync_pos和Sync_pos_old分别是新的和老的同步位置,S是正在被处理的输入段的长度,而M是搬移因子。这一同步点用来对新的拼接点的精确性与老的拼接点的精确性进行比较603。如果匹配与先前的相同或更好605,则这一新的拼接点返回607,假设它在码本内。如果不是,则在回路609搜索新的同步点。这是使用相似性测量进行的,这种情形下是最小差函数,然而也能够使用时域或频域的相关性。如果位置产生比先前找到的613位置的匹配更好的匹配,则存储同步点615。当试验了所有位置617时,系统返回619图5的流程。所获得的新的同步点被存储519,并从码本521在给定的同步点开始读出新的段。对这一段加窗并添加到先前的那一段上523,通过搬移因子下降采样525,并存储在输出缓冲器527。
图7中示出在瞬态条件下关于码本位置的系统行为。在瞬态之前,表示输入段1的码本1配置在段的“左侧”。相关段1表示先前输出的部分并用来寻找码本1中的同步点1。当检测到瞬态且对瞬态点处理时,根据图7a移动码本并静止到当前正在处理的输入段一旦再次到码本的“右侧”。由于不允许系统在瞬态之前搜索同步点,这使之不能复现瞬态。
许多音调搬移器,或时间扩展器,基于模式搜索预测对语音和单音调材料给出满意的结果。然而,它们的性能对于高复杂性信号(如音乐)迅速劣化,特别是在搬移因子较大时。本发明为改进性能提供了几种解决办法,从而对于任何类型的信号都产生极好的结果。与其它设计不同,该系统是时变的,且系统参数基于输入信号的性质及先前操作周期中所使用的参数。不仅控制码本大小和位置,而且控制所包含的状态向量的性质的瞬态检测器的使用是健壮的和计算上有效的方法,能够避免快速改变信号段期间可听到的质量下降。此外,不需要处理会引起较高计算需求的信号段长度的变化。而且本发明使用基于来自先前搜索的结果的加细的码本搜索。这意味着与普通两信号段相关性,基于模式搜索预测时域系统中通常所作的不同,不是顺序地试验所有位置而是首先试验最可能的同步位置。这新的用于减少码本搜索的方法大大降低了系统的计算复杂性。而且,当使用几个搬移器时,如以下所示的实施那样,能够在搬移器之间共享同步位置信息以进一步降低计算复杂性。
以上所述的时域搬移器,用来实现根据以下说明性的但非限制性例子构成的SBR-1和SBR-2系统。图8中使用了三个时间扩展模块,以便产生二、三和四次谐波。在这一例子中由于每一时域扩展/搬移处理宽带信号,故不必添加分开的均衡器系统,最好在搬移之前调节源频率范围的频谱包络,这是考虑到在搬移之后这样作是没有意义的。频谱包络调节器801、803和805每一个处理几个滤波器组频道。必须这样设置包络调节器中每一频道的增益,使得在搬移之后输出的和813、815和817产生所需的频谱包络。搬移器807、809和811被互连以便共享同步位置信息。这是基于这样的事实,即在一定的条件下,在分开的搬移单元中相关期间码本中找到的同步位置之间将是高相关的。假如,作为也是不限制本发明范围的一个例子,四次谐波搬移器基于时间帧工作,二次谐波搬移器帧的一半,但是两倍于额定周期。进而假设,对于两个扩展器的码本是相同的,且两个时域扩展器的同步位置分别标以sync_pos4和sync_pos2。这产生以下的关系:
sync_pos2=sync_pos4-n·4·S-sync_offset,forn=1,2,3,4...,    (10)
其中
sync_offset=sync_pos4-sync_pos2,for n=0,              (11)
且S是由码本表示的输入段的长度。只要任何同步位置指针都没有达到码本的结束,这就是有效的。在正常操作期间对每一由二次谐波搬移器处理的时间帧n增加一,并当不可避免地由指针之一达到码本末端时,计数器n被设置为n=0,并分别计算sync_pos4和sync_pos2。对三次谐波搬移器当连接到四次谐波搬移器时,可获得类似的结果。
以上出现的几个互连的时域搬移器,显著减少了生成较高次谐波的计算。此外,提出的时域搬移器与适当的滤波器组连接使用则提供了调节所生成的频谱包络的机会,同时保持时域搬移器结构简单计算成本低,因为这些,或多或少可以实现使用定点算法和只使用加法/减法操作。
本发明的其它示例性但非限制性例子是:
-在子带滤波器组中每一子带内使用一个时域搬移器,这样降低对每一搬移器的信号复杂性。
-一个时域搬移器与一个频域搬移器组合使用,这样能够使系统按照被处理的输入信号的特性使用不同的搬移方法。
-在一个宽带语音编解码器中使用一个时域搬移器例如对线性预测后的获得的残留信号进行操作。
应当认识到以上概述的方法只要简单地省略采样速率变换就可以有利用于时标修改型。还可以理解,虽然所述方法专注于音调搬移到较高音调,即时间扩展,但对业内专业人员明显的是,在搬移到较低的音调即时间压缩时,能够使用相同的原理。
基于搬移的滤波器组
现在说明基于搬移技术的各种新的和革新的滤波器组。被搬移的信号被分为一系列BP或子带信号。任何子带信号被精确或近似地搬移,这最好通过以下称为“填补”的分析和合成子带的再连接实现。首先使用短时付立叶变换,STFT,说明该方法。
离散时间信号x(n)的N-点STFT由以下公式定义
X k ( n ) = Σ p = - ∞ ∞ x ( p ) h ( n - p ) e - j ω k p , - - - ( 12 )
其中k=0,1,…,N-1,及ωk=2πk/N,且h(n)是窗函数。如果窗满足以下条件
Figure A20041010007800172
则逆变换存在并由以下公式给出
x ( n ) = 1 N Σ k = 0 N - 1 X k ( n ) e j ω k n . - - - ( 14 )
参见图9a,直接变换可以解释为一个分析器,由一组脉冲响应为h(n)exp(jωkn)901的N个BP滤波器组成,后跟一组乘以载波exp(-jωkn)903的N个乘法器,乘法器把BP信号下移到0Hz区域附近,形成N个分析信号Xk(n)。窗口的作用是作为原型LP-滤波器。Xk(n)具有小的带宽并通常被下降采样905。这样只需对方程式12在n=rR估算,其中R是抽取因子而r是新时间变量。参见图9b,Xk(n)能够通过上升采样从Xk(rR)恢复,即插零907,后接LP滤波909。逆变换可解释为由一组乘以载波(1/N)exp(jωkn)911的N个乘法器组成的合成器,乘法器把信号Xk(n)上移到它们的原始频率,后跟图9c的级913,把来自所有频道的贡献yk(n)相加。可以重新排布STFT和ISTFT以便使用DFT和IDFT,这使得能够使用FFT算法[“Implementation of the PhaseVocoder using the Fast Fourier Transform”M.R.Portnoff,IEEEASSP,Vol.24,No.3,1976]。
图9c示出用于产生二次谐波的填补915,M=2,N=32。为简单起见,只示出频道0到16。BP16的中心频率等于奈奎斯特频率,频道17到31对应于负频率。稍后将说明标以P的块917和增益块919,现在只简短考虑。在这一例子中对输入信号加了频带限制,于是只有频道0到7包含信号。这样,分析器8到16是空的,不需要被映射到合成器。对应于输入信号延迟通路,分析器频道0到7连接到合成器频道0到7。分析频道k,4≤k≤7,还连接到合成频道Mk,M=2,它把信号移动到BP滤波器k的中心频率两倍的频率区域。这里,信号被上移到它们的原始范围,以及被向上搬移一个八度。为了探索以实值滤波器响应和调制器产生谐波,还必须考虑负频率,参见图10a的下面的分支。因而,必须估计再映射k→Mk1001和N-k→N-Mk1003(其中4≤k≤7)的组合输出。
这产生了
y ( n ) = 2 N [ x ( n ) * h ( n ) cos ( ω k n ) ] cos ( ( M - 1 ) ω k n ) +
- 2 N [ x ( n ) * h ( n ) sin ( ω k n ) ] sin ( ( M - 1 ) ω k n ) - - - ( 15 )
其中M=2。方程式15可以解释为输入信号的BP滤波,后跟线性频率移动或上边带(USB)调制,即使用上边带的单边带调制,参见图10b,其中1005和1007形成希尔伯特变换器,1009和1011为乘以余弦和正弦载波的乘法器,而1013是选择上边带的差级。显然,可以直接实现这种多带BP和SSB方法,即无需在时域或频域中滤波器组填补,允许任意选择各个通带和振荡器频率。
根据方程式15,分析频道k的通带内带有频率ωi的正弦波产生频率为Mωk+(ωik)的谐波。因而,称为基本多带搬移的方法只对频率为ωi=ωk(4≤k≤7)的输入信号产生精确的谐波。然而,如果滤波器数足够大,则对精确搬移的偏移可以忽略,参见方程式4。而且,假设每一分析频道包含最大一个分音,通过插入标以P的块917(图9c)对任意频率的准稳定调性信号进行精确搬移。这种情形下,Xk(rR)是频率等于分析滤波器的谐分音频率ωi和中心频率ωk之间的差的复指数。为了获得精确的搬移M,必须通过因子M使这些频率增加,修改以上频率关系为ωi→Mωk+M(ωik)=Mωi。Xk(rR)的频率等于它们各退缠相位角的时间导数,并能够使用相继相位角的一阶差分估计。使频率估计乘以M,并使用那些新的频率计算合成相位角。然而,除了相位常数之外,通过使分析幅角直接乘以M的简化方式可获得相同的结果,这免除了对频率估计的需要。这在表示块917的图11中描述。这样,Xk(rR),在本例中4≤k≤7,被从直角坐标转换为极坐标,由块R→P,1101表示。幅角乘以M=2(1103)而量值不变。然后信号被转换回直角坐标(P→R)1105,形成信号YMK(rR)并根据图9c供给分析频道。这样这一改进的多带搬移方法具有两级:填补作为以基本方法提供了粗搬移,而相位乘法器提供了细致的频率校正。以上多带搬移方法不同于使用STFT的传统的音调移动技术,其中为了合成使用查找表振荡器,或者当为了合成使用ISTFT时,对信号进行时间伸展和抽取,即不使用填补。
易于对非2的搬移因子修改图9c的谐波填补。图12示出为产生3次谐波的填补1203,其中1201是分析频道,1205是合成频道。如图13所示,可以同时生成一些不同次的谐波,其中使用了2和3次谐波。图14表示2、3和4次谐波的非重叠组合。使用频率尽可能高的最低次可能谐波。在谐波M的目标范围上限以上,使用谐波M+1。图15示出映射所有合成器频道的方法(所示N=64,频道0-32)。根据源和目标频道号之间的以下关系映射带有非素数下标的所有高频带频道:kdest=Mksource,其中M是满足ksource在低频带而kdest在高频带这样的条件的最小整数≥2。因而,任何一个合成器频道不会从多于一个的分析频道接收信号。素数高频带频道可能被映射到ksource=1,或者低频带频道ksource>1,这产生以上关系的良好的近似(图15中只示出带有M=2,3,4,5的非素数连接)。
还能够从不同的分析器频道组合振幅和相位信息。振幅信号|Xk(rR)|可根据图16连接,而相位信号arg{Xk(rR)}根据图16的原理连接。这样,低频带频率将仍然被搬移,从而产生源区域包络的周期性重复,而不是从根据图2的搬移得出的延伸包络。可以采用选通或其它措施,以避免“空”源频道的放大。图17示出另一应用,即使用从较高到较低子带的连接对高通滤波的或低音受限信号产生分谐波。当使用以上装置时,可能有利于采用基于信号特性的修补自适应切换。
在以上说明中,假设了包含在输入信号中的最高频率显著低于奈奎斯特频率。这样,能够进行带宽扩展而无需增加采样率。然而,这并不总是为什么先期上升采样也可能是必要的情形。当对搬移使用滤波器组方法时,能够在过程中集成上升采样。
在时间到频率的映射中大多数感觉编解码器采用最大抽取滤波器组[“Introduction to Perceptual Coding”K.Brandenburg,AES,Collected Paper on Digital Audio Biterate,1996]。图18示出感觉编码器系统的基本结构。分析滤波器组1801把输入信号分为几个子带信号。使用减少的比特数对子带采样分别量化1803,其中从估计最小掩蔽阈值的感觉模型1807确定量化电平数。子带采样被归一化后,以可选冗余度编码方法编码,并与由归一化因子、比特分配信息和其它编解码器特有的数据组成的副信息组合1805,以形成串行比特流。这个比特流然后被存储或传输。在解码器中,图18B,编码的比特流被多路分解1809,解码,且子带采样被重新量化为相等的比特数1811。合成滤波器组组合子带采样,以便重新生成原始信号1813。使用最大抽取滤波器组的实现将大大降低计算成本。在以下说明,专注于余弦调制滤波器组。然而应当理解,本发明可以使用其它类型的滤波器组或变换实现,包括小波变换的滤波器组解释程序,其它不等带宽滤波器组或变换,及多维滤波器组或变换。
在以下解释性的但非限制性的说明中,假设L频道余弦调制的滤波器组把输入信号x(n)分解为L子带信号。最大抽取滤波器组的一般结构示于图19中。分析滤波器1901标记为Hk(z),其中k=0,1,…L-1。子带信号vk(n)被最大抽取,每一采样频率fs/L,其中fs是x(n)的采样频率。在内插1905和滤波1907之后合成部分重新组合子带信号以产
Figure A20041010007800211
合成滤波器标记为Fk(z)。此外,本发明对 进行频谱复现,给出增强信号y(n)。
以QL频道滤波器组合成子带信号结果将是带有采样频率Qfs的输出比特流,其中只使用L个低频带频道,并选择带宽扩展因子Q使得QL为一整数值。因而,延伸的滤波器组的作用如同后跟一个上升采样器的L频道滤波器组。这种情形下,由于不使用L(Q-1)个高频带滤波器(以零供给),故音频带宽将不变-滤波器组将只是重构 的上升采样版本。然而如果对高频带滤波器填补L个子带信号,则 的带宽将增加因子Q,产生y(n)。根据本发明,这是基本多带搬移器的最大抽取滤波器组版本。使用这一方案,如同先前的说明,上升采样过程被集成在合成滤波中。应当注意,可以使用任何大小的合成滤波器组,其结果是输出信号不同的采样率,从而不同的带宽扩展因子。根据带有整数搬移因子M的基本多带搬移方法的本发明,对 进行频谱复现通过如下填补子带信号实现
vMk(n)=eMk(n)(-1)(M-1)knvk(n),                       (16)
其中kε[0,L-1]并选择成使Mkε[L,QL-1],eMk(n)是包络校正,而(-1)(M-1)kn是对倒谱带的校正因子。频谱颠倒是由于子带信号抽取造成的,且颠倒的信号可以通过在这些频道中每隔一次采样时改变符号而被重新颠倒回来。参见图20,考虑对搬移因子M=2以Q=2填补2009的16频道合成滤波器组。块2002和2003分别标记图19的分析滤波器Hk(z)和抽取器。类似地,2005和2007是内插器及合成滤波器Fk(z)。这时方程式16简化为把接收的数据的四个上频率子带信号填补为合成滤波器组中八个最高频道的每隔一个的频道。由于频谱颠倒,每隔一个填补的子带信号必须是合成之前被颠倒的频率。此外,填补的信号的量值必须根据SBR-1或SBR-2原理调节。
使用根据本发明的基本多频带搬移方法,所产生的谐波一般不是基频精确的倍数。每一子带中除了最低以外的所有频率都在某种程度上不同于精确的搬移。而且,由于目标区间覆盖了比源区间更宽的频率范围,故复现的频谱包含一些零。此外,由于在目标区间中在频率上子带信号被分开,故余弦调制的滤波器组的混叠抵销性质消失。即相邻的子带信号在高频带区域不重叠。然而,业内专业人员所知道的混叠降低的方法可用来减少这种类型的人工痕迹。这种搬移方法的优点在于易于实现,以及很低的计算成本。
为了实现完美的正弦波搬移,现在提出改进的多带搬移方法的有效最大抽取滤波器组解决方案。该系统使用增加的修改的分析滤波器组,而合成滤波器组是受如Vaidyanathan所描述的余弦调制为[“Multirate Systems and Filter Banks”p.p.Vaidyanathan,PrenticeHall,Engewood Cliffs,New Jersey,1993,ISBN 0-13-605718-7]。使用根据本发明基于最大抽取滤波器组改进的多带搬移方法的操作步骤,简略示于图21及图22的流程图中如下:
1.使用QL频道滤波器组2101、2201、2203合成L个收到的子带信号,其中对L(Q-1)个上频道供给零,以便形成信号x1(n),于是通过带宽扩展因子Q对其过采样。
2.通过因子Q对x1(n)下降采样,以便形成信号x2(n′)2103、2205,即x2(n′)=x1(Qn′)。
3.选择整数值K作为合成滤波器组的大小,限制其使得T=KM/Q为一整数,其中T是修改的分析滤波器组的大小,而M是搬移因子2207、2209、2211。最好应这样选择K,对于平稳(调性)信号为大,对于动态(瞬态)信号为较小。
4.x2(n′)是通过T频道修改的分析滤波器组2107、2213滤波的,其中对T个分析滤波器作幂调制,产生一组复值子带信号。按因子T/M对子带信号进行下降采样,给出子带信号vk (M)(n″),k=0,1,…,T-1。从而对滤波器组将按因子M过采样。
5.把样本vk (M)(n″)转换为极坐标表示(幅值和相角)。相角乘以因子M,并根据图11所示的方案样本被转换回直角坐标。提取复值样本的实部,给出信号sk (M)(n″)2109、2215。在这一操作之后,对信号sk (M)(n″)作临界采样。
6.根据SBR-1或SBR-2的原理调节sk (M)(n″)的增益。
7.使用普通余弦调制的K频道滤波器组合成子带信号sk (M)(n″),这里kε[T/M,min(K,T)-1],其中对频道0到T/M-1供给零2105、2221。这产生信号x3 (M)(n)。
8.最后把x3 (M)(n)加到x1(n)给出y(n)2223,这就是所需的频谱复现信号。
对不同的搬移因子M值可以重复步骤3到6,这样把多个谐波添加到x1(n)。这种操作模式由图21的虚线表示,并在图22中通过重复框2211-2219上的回路表示。这种情形下,选择K使T对于整数值M:s的M的所有选择为整数值;K最好这样选择,使K/Q为正整数。所有子带信号sk (Mi)(n″),i=1,2,…,m,m是搬移因子数,根据
s k ( n ′ ′ ) = Σ i = 1 m s k ( M i ) ( n ′ ′ ) - - - ( 17 )
对每一可用的k被相加。在图22的回路第一叠代中,可以把sk(n″)看作只是零的子带样本,这里k=0,1,…,K-1。在每次循环,新的样本被添加2219到sk(n″),有
s k ( n ′ ′ ) = s k ( n ′ ′ ) + s k ( M i ) ( n ′ ′ ) - - - ( 18 )
这里k=K/Q,K/Q+1,…,min(K,Ti)-1。使用K频道滤波器组根据步骤7一次合成子带信号sk(n″)。
步骤4的修改的分析滤波器组,是通过余弦调制滤波器组的理论推导得出的,其中调制叠搭变换[“Lapped Transform for EfficientTransform/Subband Coding”H.S Malvar,IEEE TransASSP,Vol.38,no.6,1990]是一种特别的情形。T频道余弦调制滤波器组中的滤波器的脉冲响应hk(n)可以写为
h k ( n ) = C p 0 ( n ) cos [ π 2 T ( 2 k + 1 ) ( n - N - 1 2 ) + Φ k ] , - - - ( 19 )
这里k=0,1,…,T-1,N是低通原型滤波器pk(n)的长度,C是常数,而Φk是保证相邻频道之间混叠消除的相位角。对Φk的限制是
Φ 0 = ± π 4 , Φ T - 1 = ± π 4 and Φ k = Φ k - 1 ± π 2 - - - ( 20 a - c )
这可以简化为封闭形式的表达式
Φ k = ± ( - 1 ) k π 4 . - - - ( 21 )
由Φk的这一选择,使用带有如下脉冲响应的合成滤波器组,可以获得完美的重构系统或近似的重构系统(准QMF系统)
f k ( n ) = C p 0 ( n ) cos [ π 2 T ( 2 k + 1 ) ( n - N - 1 2 ) - Φ k ] . - - - ( 22 )
考虑滤波器
h k ′ ( n ) = C p 0 ( n ) sin [ π 2 T ( 2 k + 1 ) ( n - N - 1 2 ) + Φ k ] , - - - ( 23 )
其中h′k(n)是原型滤波器p0(n)的正弦调制版本。滤波器h′k(n)和hk(n)具有等同的通带支持,但是相位响应不同。滤波器的通带实际上是彼此的希尔伯特变换(对于接近ω=0和ω=π的频率这是无效的)。根据
h k a ( n ) = h k ( n ) + j h k ′ = C p 0 ( n ) exp [ jπ 2 T ( 2 k + 1 ) ( n - N - 1 2 ) + j Φ k ] - - - ( 24 )
组合方程式19和23,产生具有对正频率与Hk(z)相同的幅值响应,而对负频率为零的滤波器。使用带有如方程式24中的脉冲响应的滤波器组,给出可以解释为对应于从带有如方程式19中脉冲响应的滤波器组获得的子带信号的解析(复)信号的一组子带信号。解析信号适用于操作,因为复值样本可以写成极坐标的形式,即z(n)=r(n)+ji(n)=|z(n)|exp{jarg(z(n))}。然而,当对于搬移使用复滤波器组时,对Φk的限制必须扩展到保持混叠消除性质。为了保证在与带有如方程式22中的脉冲响应的合成滤波器组的组合中的混叠消除,对Φk新的限制是
Φ k = ± ( - 1 ) k π 4 M - - - ( 25 )
当M=1时这简化为方程式21。使用这一选择,被搬移的分音将具有与M=1(不搬移)时它们具有的相同的相对相位。
组合方程式24和方程式25结果为
h k a ( n ) = C p 0 ( n ) exp { jπ [ ( 2 k + 1 ) 2 T ( n - N - 1 2 ) ± ( - 1 ) k 4 M ] } - - - ( 26 )
根据本发明这是在步骤4的修改的滤波器组中使用的滤波器。
一些涉及到步骤5的澄清:按因子Y/M对复值子带信号的下降采样使它们被按M过采样,当相位角相继乘以搬移因子M时,这是一重要准则。在搬移到目标范围后,过采样迫使每带宽的子带样本数等于源范围的子带样本数。由于相位乘法器,被搬移的子带信号的各带宽为M倍源范围的带宽。在使得子带信号在步骤5之后被临界采样,并且,当搬移调性信号时,频谱中将没有零。
为了避免三角计算,即必须计算新的子带信号如
s k ( M ) ( n ′ ′ ) = real { | v k ( M ) ( n ′ ′ ) | exp { jM arctan ( imag { v k ( M ) ( n ′ ′ ) } real { v k ( M ) ( n ′ ′ ) } ) } } =
= | v k ( M ) ( n ′ ′ ) | cos { M arctan ( imag { v k ( M ) ( n ′ ′ ) } real { v k ( M ) ( n ′ ′ ) } ) } , - - - ( 27 )
其中|vk (M)(n″)|是vk (M)(n″)的绝对值,使用以下的三角关系式:
a = arctan ( imag { v k ( M ) ( n ′ ′ ) } real { v k ( M ) ( n ′ ′ ) } ) , - - - ( 29 )
并注意到
cos ( α ) = cos ( arctan ( imag { v k ( M ) ( n ′ ′ ) } real { v k ( M ) ( n ′ ′ ) } ) ) = real { v k ( M ) ( n ′ ′ ) } | v k ( M ) ( n ′ ′ ) | , - - - ( 30 )
以及
sin ( α ) = sin ( arctan ( imag { v k ( M ) ( n ′ ′ ) } real { v k ( M ) ( n ′ ′ ) } ) ) = imag { v k ( M ) ( n ′ ′ ) } | v k ( M ) ( n ′ ′ ) | , - - - ( 31 )
无需三角计算即可实现步骤5的计算,降低了降低复杂性。
当使用M为偶数的搬移时,取决于低通原型滤波器p0(n)的特性,可能引起相位乘法器的障碍。所有可使用的原型滤波器在Z平面中单位圆上有零点。单位圆上的一个零点迫使滤波器的相位响应出现180°的移动。对于M为偶数,相位乘法器把这些移动转变为360°的移动,即相移消失。位于这种相移消失的频率中的分音将引起合成信号中的混叠。最不好的情形是当分音在频率上位于对应于分析滤波器的第一旁瓣的顶部时。取决于幅值响应中这一旁瓣的抑制,混叠将或多或少能够听到。作为一例,ISO/MPEG层1和2标准中使用的原型滤波器的第一旁瓣被抑制96分贝,而对于ISO/MPEG层3标准的MDCT方案中使用正弦窗口的第一旁瓣抑制仅为23分贝。很明显,使用正弦窗口的这种类型的混叠将是可听到的。将提出对这问题的解决方案,并被称为相对锁相。
滤波器ha k(n)都具有线性相位响应。相位角Φk导致相邻频道之间的相对相位差,且单位圆上的零点导致频率中频道之间可能不同的位置的180°的相移。通过监视相邻子带信号之间的相位差,在相位乘法器被激活之前,易于检测到包含相位反相信息的频道。考虑调性信号,根据方程式25对于非反向信号相位差近似于π/2M,因而对于两种信号之一反相的信号近似于π(1-1/2M)。可以简单地通过相邻子带中样本的点积完成反相信号的检测,如
v k ( M ) ( n ′ ′ ) ov k + 1 ( M ) ( n ′ ′ ) = real { v k ( M ) ( n ′ ′ ) } real { v k + 1 ( M ) ( n ′ ′ ) } + imag { v k ( M ) ( n ′ ′ ) } imag { v k + 1 ( M ) ( n ′ ′ ) } . - - - ( 32 )
如果方程式32中的乘积是负的,则相位差大于90°,于是出现相位反相状态。根据步骤5的方案,复值子带信号的相位角乘以M,并最后,标为反相的信号被反相。这种相对锁相方法迫使在相位乘法之后180°移动的子带信号保持这一移动,因而保持了混叠消除的性质。
谱包络调整
许多声音,象语音和音乐之类,被刻划为慢变包络和固定振幅的快变载波的乘积,如Stockam在[“The Application of GeneralizedLinearity to Automatic Gain Control”T.G.Stockham,Jr,IEEE Trans.on Audio and Electroacoustics,Vol.AU-16,No.2,June 1968]及方程式1所述。
在分裂频带感觉音频编码器中,把音频信号分段为帧,并使用子带滤波器或时域到频域变换分为多个频带。在许多类型的编解码器中,信号随之被分为用于传输或存储的两个主信号成分,即频谱包络表示和归一化子带样本或系数。在以下的全部说明中,术语“子带样本”或“系数”是指从子带滤波器获得的样本以及从时域到频域变换获得的系数。术语“频谱包络”或“标度因子”表示基于时间帧的子带的值,诸如每一子带中平均或最大的幅值,用于子带样本的归一化。然而,频谱包络还可以使用线性预测LPC获得[U.S.Pat.5,684,920]。在典型的编码器中,与可以用降低许多的速率编码(使用大约10%的可用比特率)的慢变临时包络,即频谱包络比较,归一化子带样本需要以高比特率编码(使用大约90%的可用比特率)。
如果要保持原始信号的音色的质量,则被复现的带宽的精确的频谱包络是重要的。乐器或嗓音的感觉音色主要由位于听觉最高八度中频率flim以下的频谱分布决定的。这样在flim以上的频谱细节不很重要,于是通过以上搬移方法获得的高频带细结构不需要调节,而粗结构一般是需要的。为了能够进行这种调节,对信号的频谱表示滤波,以便从细结构分离出包络粗结构,则是有用的。
在根据本发明的SBR-1实现中,是从解码器可得的低频带信息中估计高频带粗频谱包络。这种估计是通过连续监视低频带包络并根据特定的规则调节高频带频谱包络进行的。实现包络估计的一种新方法使用了对数频率幅值空间中的渐近线,这等价于线性空间中以变阶多项式的曲线拟合。估计低频带频谱的上部的电平和倾斜,并把估计用来定义表示新的高频带包络的一个或几个段的电平或倾斜。渐近线的交叉点在频率中固定,其作用是作为枢点。然而并不总是需要的,规定保持高频带包络在实际边界内的摆幅的限制是有益的。估计频谱包络的另一种方法是使用大量代表性的频谱包络的向量量化VQ,并在速查表或码本中存储它们。向量量化是通过对大量的训练数据训练所需数量的向量进行的,这种情形下数据是音频频谱包络。训练通常使用推广的Lloyd算法进行[“Vector Quantization and Signal Compression”A.Gersho,R.M.Gray Kluwer Academi Publisher,USA 1992 ISBN 0-7923-9181-0],并产生最优覆盖训练数据内容的向量。考虑由B个包络训练的A个频谱包络组成的VQ码本(B>>A),这时基于声音广泛变化的B个观察,A个包络表示从低频带包络到高频带包络A个最可能的转变。这就是理论上基于B个观察预测包络的A个最优化规则。当估计新的高频带频谱包络时,原来的低频带包络用来搜索码本,且最佳匹配码本项的高频带部分用来生成新的高频带频谱。
图23中,归一化子带样本由2301表示,而频谱包络由标度因子2305表示。为了说明的目的,到解码器2303的传输以并行的形式表示。在SBR-2的方法图24中,根据图23产生并传输频谱包络信息,从而只有低频带子带样本被传输。这样被传输的标度因子在全频率范围取值,而子带样本只在排除高频带的限制的频率范围内取值。在解码器处,低频带子带样本2401被搬移2403,并与收到的高频带频谱包络信息2405组合。这样,在保持显著的比特率降低的同时,合成的高频带频谱包络与原来的等同。
在某些编解码器中,如图24所示,能够在省略高频带子带样本的同时传输整个频谱包络的标度因子。其它的编解码器标准规定,标度因子和子带样本必须覆盖相同的频率范围,即如果子带样本被省略则标度因子不能传输。这种情形下,有几种解决方案;高频带频谱包络信息能够以独立的帧传输,这些帧有自己的标题及可选的出错保护,后跟数据。没有采纳本发明的优点的普通的解码器,将不能识别标题,从而摒弃这些额外的帧。在第二个解决方案中,高频带频谱包络信息作为被编码的比特流内的辅助数据传输。然而,可得的辅助数据字段必须足够大以保持包络信息。在头两个解决方案都不适合的情形下,可以使用第三个解决方案,将高频带频谱包络信息作为子带样本隐藏。子带标度因子覆盖了大的动态范围,通常超过100分贝。这样能够把任意数目的子带标度因子(图25中的2505)设置为非常低的值,“伪装”为子带样本,传输这些高频带标度因子,2501。这种把高频带标度因子传输到解码器2503的方式保证了与比特流句法的兼容性。因而,任意的数据都能够以这种方式传输。有一种相关的方法,把信息编码为子带样本流[U.S.Pat.5,687,191]。在码本系统使用霍夫曼或其它冗余编码2603时,可使用图26的第四个解决方案。这时对高频带的子带样本被设置为零2601或固定值,以便达到高冗余度。
瞬态响应的改进
涉及人工痕迹的瞬态是音频编解码器中的共同问题,且类似的人工痕迹出现在本发明中。一般来说,填补产生对应于时域前或后回声的频谱“零点”或凹口,即在“真实”的瞬态之前或之后的假的瞬态。尽管P-块对慢变调性信号“填入零点”,但仍有前和后回声。改进的多带方法是要处理离散正弦波的,其中正弦波的数目限制为每子带一个。可以把子带中的瞬态或噪声看作是该子带中大量的离散正弦波。这产生互调失真。这些人工痕迹被认为是瞬态区间期间与复现的高频带频道连接的附加噪声源。于是为避免感觉音频编码器中前和后回声人工痕迹的传统方法,例如自适应窗口切换,在此可用来提高改进的多带方法的主观质量。通过使用由编解码器或独立的检测器提供的瞬态检测并降低瞬态调件下的频道数,迫使“量化噪声”不超过与时间有关的掩蔽阈值。在瞬态通过期间使用较少数目的频道,而在调性通过期间使用较大数目的频道。这种自适应窗口切换在编解码器中是通常使用的,以便用频率分辨率换取时间分辨率。在滤波器组大小固定的应用中可以使用不同的方法。一个方法是通过频域中的线性预测使“量化噪声”在时间中成形。然后对作为线性预测滤波器输出的残余信号进行搬移。然后,把逆向预测滤波器同时施加到原始和频谱复现的频道。另一方法采用压缩扩展器系统,即在搬移或编码之前瞬态信号的动态振幅压缩,以及在搬移之后的互补扩展。还能够以信号相关的方式在搬移方法之间切换,例如对平稳信号使用高分辨率滤波器搬移方法,而对瞬态信号使用时变模式搜索预测方法。
实际的实现
使用标准的信号处理器或高性能PC,可进行SBR强化的编解码器的实时操作。还可以在通常的芯片上对SBR强化编解码器进行硬编码。还可以使用任意的编解码器在各种类系统中实现对模拟或数字信号的存储和传输,见图27和图28。SBR-1方法可以集成在解码器中或作为附加的硬件或软件后处理模块提供。SBR-2方法需要对编码器进行另外的修改。图27中,模拟输入信号提供给A/D转换器2701,形成供给进行源编码的任意编码器2703的数字信号。提供给系统的信号可以是那种低通类型的,其听觉范围内的一些频带已经被丢弃,或者在任意编码器中一些频带被丢弃。得到的低频带信号被提供给多路复用器2705,形成被传输或存储的串行比特流。多路分解器2709恢复信号并把它们提供给任意解码器2711。在解码器2711中,估计出频谱包络信息2715并提供给SBR-1单元2713,该单元把低频带信号搬移为高频带信号并生成包络被调节的宽带信号。最后,数字宽带信号被转换2717为模拟输出信号。
SBR-2方法需要对编码器作另外的修改。图28中,模拟输入信号提供给A/D转换器2801,形成供给进行源编码的任意编码器2803的数字信号。抽取频谱包络信息2805。所得信号,低频带子带样本或系数及宽带包络信息,提供给多路复用器2807,形成被传输或存储的串行比特流2809。多路分解器2811恢复这些信号,低频带子带样本或系数及宽带包络信息,并把它们提供给任意解码器2815。频谱包络信息2813从多路分解器2811供给SBR-2单元2817,该单元搬移低频带信号为高频带信号并生成包络经调节的宽带信号。最后,数字宽带信号被转换2819为模拟输出信号。
当只能使用很低的比特率时,(因特网及慢速电话调制解调器,AM-广播。)音频节目材料的单编码是不可避免的。为了改进收听质量并使节目声音更好听,通过引入抽头延迟线2901可获得简易的“准立体声”产生器,见图29。除了原来的单信号这可以向每一输出频道提供大约-6分贝2903的10ms和15ms延迟信号2905。准立体声产生器以低的计算成本提供了有价值的可感知的改进。
以上的实施例只是例示本发明的原理用于音频源编码改进的情况。应当理解,这里所述的结构和细节的修改和改型对于业内其它专业人员将是显然的。因此,本发明的专利保护范围仅由所附权利要求规定,而不局限于这里实施例的描述和解释方式所呈的特定细节。

Claims (9)

1.一种用于产生时间离散音频信号的上升采样版本的方法,其中以第一采样速率(fS)对该音频信号进行采样,该方法包括步骤:
提供(2001,2003)该音频信号的分析版本,该分析版本包含由L频道分析滤波器组获得的L个分析子带信号,其中L表示L频道分析滤波器组的滤波器组频道的数量;
使用具有L个低频带频道和L(Q-1)个高频带频道的QL频道合成滤波器组对该音频信号的该分析版本进行滤波(2005,2007),以获得时间离散音频信号的上升采样版本,该上升采样版本具有等于第一采样速率(fS)乘以Q的第二采样速率,其中Q表示一个因子,
其中,在滤波步骤中,只使用合成滤波器组的L个低频带频道,使得该音频信号的该上升采样版本具有与该音频信号相同的带宽,或者
其中,在滤波步骤之前,将L个低频带频道上的若干子带信号填补到若干高频带频道,使得该音频信号的该上升采样版本具有扩展带宽。
2.根据权利要求1的方法,其中提供步骤包含以下子步骤:
将时间离散音频信号馈送入L频道分析滤波器组,其中所述L个频道中的一个频道具有带通滤波器(2001),和顺序连接的抽取器(2003),该抽取器具有等于L的抽取因子。
3.根据权利要求1的方法,其中提供步骤包含以下子步骤:
在解码器处接收比特流;
用比特流多路分解(1809)量化子带样本;以及
重新量化(1811)该量化子带样本以获得所述音频信号的分析版本。
4.根据前述任一权利要求的方法,其中滤波步骤包含以下针对L个低频带频道中的频道的子步骤:
以内插因子QL对频道信号进行内插(2005),以获得内插频道信号;以及
通过所述频道的带通滤波器对该内插频道信号进行滤波(2007)。
5.根据前述任一权利要求的方法,其中滤波步骤包含以下针对L(Q-1)个高频带频道中的频道的子步骤:
向所述频道的带通滤波器馈送零。
6.根据权利要求4的方法,其中滤波步骤包含对L个低频带频道的滤波器输出进行求和的步骤。
7.根据前述任一权利要求的方法,其中选择因子Q,使得Q和L的乘积为整数值。
8.根据前述任一权利要求的方法,其中QL频道合成滤波器组被实现成以QL个频率系数输入为滤波器组频道的频率/时间变换,其中L(Q-1)个频率系数被设置为零。
9.一种用于产生时间离散音频信号的上升采样版本的装置,其中以第一采样速率(fS)对该音频信号进行采样,该装置包括:
用于提供该音频信号的分析版本的装置(2001,2003),该分析版本包含由L频道分析滤波器组获得的L个分析子带信号,其中L表示L频道分析滤波器组的滤波器组频道的数量;
具有L个低频带频道和L(Q-1)个高频带频道的QL频道合成滤波器组(2005,2007),用于获得时间离散音频信号的上升采样版本,该上升采样版本具有等于第一采样速率(fS)乘以Q的第二采样速率,其中Q表示一个因子,
其中,在合成滤波器组中,只使用合成滤波器组的L个低频带频道,使得该音频信号的该上升采样版本具有与该音频信号相同的带宽,或者
其中,将L个低频带频道上的若干子带信号填补到合成滤波器组的若干高频带频道,使得该音频信号的该上升采样版本具有扩展带宽。
CNB2004101000787A 1997-06-10 1998-06-09 采用频带复现增强源编码 Expired - Lifetime CN1308916C (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
SE97022131 1997-06-10
SE9702213A SE9702213D0 (sv) 1997-06-10 1997-06-10 A method and a device for bit-rate reduction using synthetic bandwidth expansion
SE9704634A SE9704634D0 (sv) 1997-12-12 1997-12-12 Synthetic bandwidth expansion of audio signals
SE97046346 1997-12-12
SE98002686 1998-01-30
SE9800268A SE512719C2 (sv) 1997-06-10 1998-01-30 En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB988007924A Division CN1206816C (zh) 1997-06-10 1998-06-09 采用频带复现增强源编码

Publications (2)

Publication Number Publication Date
CN1629937A true CN1629937A (zh) 2005-06-22
CN1308916C CN1308916C (zh) 2007-04-04

Family

ID=27355877

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB988007924A Expired - Lifetime CN1206816C (zh) 1997-06-10 1998-06-09 采用频带复现增强源编码
CNB2004101000787A Expired - Lifetime CN1308916C (zh) 1997-06-10 1998-06-09 采用频带复现增强源编码

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB988007924A Expired - Lifetime CN1206816C (zh) 1997-06-10 1998-06-09 采用频带复现增强源编码

Country Status (14)

Country Link
US (4) US6680972B1 (zh)
EP (2) EP0940015B1 (zh)
JP (2) JP3871347B2 (zh)
CN (2) CN1206816C (zh)
AT (2) ATE303679T1 (zh)
AU (1) AU7446598A (zh)
BR (1) BR9805989B1 (zh)
DE (2) DE69821089T2 (zh)
DK (2) DK1367566T3 (zh)
ES (2) ES2213901T3 (zh)
HK (2) HK1030843A1 (zh)
PT (2) PT940015E (zh)
SE (1) SE512719C2 (zh)
WO (1) WO1998057436A2 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
CN102449692A (zh) * 2009-05-27 2012-05-09 杜比国际公司 高效组合谐波转置
CN101676993B (zh) * 2005-07-13 2012-05-30 西门子公司 用于人工扩展语音信号的带宽的方法和装置
CN101842832B (zh) * 2007-10-31 2012-11-07 松下电器产业株式会社 编码装置和解码装置
CN101836250B (zh) * 2007-11-21 2012-11-28 Lg电子株式会社 用于处理信号的方法及装置
CN101789239B (zh) * 2009-01-23 2014-05-07 奥迪康有限公司 便携式听音设备中的音频处理
CN104813395A (zh) * 2012-09-17 2015-07-29 弗兰霍菲尔运输应用研究公司 从带宽有限音频信号生成带宽扩展信号的设备和方法
CN113516987A (zh) * 2021-07-16 2021-10-19 科大讯飞股份有限公司 一种说话人识别方法、装置、存储介质及设备

Families Citing this family (405)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69738056T2 (de) * 1996-11-07 2008-05-15 Koninklijke Philips Electronics N.V. Übertragung eines Bitstromsignals
JP4193243B2 (ja) * 1998-10-07 2008-12-10 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE9903552D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
US7085377B1 (en) * 1999-07-30 2006-08-01 Lucent Technologies Inc. Information delivery in a multi-stream digital broadcasting system
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
WO2001053982A1 (en) * 2000-01-18 2001-07-26 National Research Council Of Canada Parallel correlator archtitecture
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
CN1154975C (zh) * 2000-03-15 2004-06-23 皇家菲利浦电子有限公司 用于声频编码的拉盖尔函数
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
FR2807897B1 (fr) 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6718300B1 (en) * 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
JP3576935B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
JP3576941B2 (ja) * 2000-08-25 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
US20020049586A1 (en) * 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US20020087315A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented multi-scanning language method and system
US6845170B2 (en) * 2001-01-11 2005-01-18 Sony Corporation Watermark resistant to resizing and rotation
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
WO2002058052A1 (en) * 2001-01-19 2002-07-25 Koninklijke Philips Electronics N.V. Wideband signal transmission system
US7660424B2 (en) 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
FR2821501B1 (fr) * 2001-02-23 2004-07-16 France Telecom Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
FR2821476B1 (fr) * 2001-02-23 2003-04-11 France Telecom Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant
FR2821475B1 (fr) * 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
JP4008244B2 (ja) * 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
US7602936B2 (en) * 2001-03-08 2009-10-13 Sony Corporation Method to make wavelet watermarks resistant to affine transformations
US6865273B2 (en) * 2002-06-05 2005-03-08 Sony Corporation Method and apparatus to detect watermark that are resistant to resizing, rotation and translation
SE0101175D0 (sv) * 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
WO2003003345A1 (fr) * 2001-06-29 2003-01-09 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation des composantes de frequence d'un signal
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
EP1351401B1 (en) * 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
WO2003019533A1 (fr) * 2001-08-24 2003-03-06 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation adaptive de composantes de frequence d'un signal
CN1288626C (zh) * 2001-10-25 2006-12-06 皇家飞利浦电子股份有限公司 利用减少的带宽在传输通道上传输宽带音频信号的方法
WO2003038813A1 (en) 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
DE10154932B4 (de) * 2001-11-08 2008-01-03 Grundig Multimedia B.V. Verfahren zur Audiocodierung
JP4308229B2 (ja) * 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
CN100395817C (zh) 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
US20030108108A1 (en) * 2001-11-15 2003-06-12 Takashi Katayama Decoder, decoding method, and program distribution medium therefor
US20040199383A1 (en) * 2001-11-16 2004-10-07 Yumiko Kato Speech encoder, speech decoder, speech endoding method, and speech decoding method
US7433489B2 (en) * 2001-11-28 2008-10-07 Sony Electronics Inc. Method to ensure temporal synchronization and reduce complexity in the detection of temporal watermarks
US7317811B2 (en) * 2001-11-28 2008-01-08 Sony Electronics Inc. Method to decode temporal watermarks in compressed video
JP3870193B2 (ja) * 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
JP4317355B2 (ja) * 2001-11-30 2009-08-19 パナソニック株式会社 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CN1288625C (zh) 2002-01-30 2006-12-06 松下电器产业株式会社 音频编码与解码设备及其方法
JP3751001B2 (ja) * 2002-03-06 2006-03-01 株式会社東芝 オーディオ信号再生方法および再生装置
AU2002346344A1 (en) * 2002-03-20 2003-09-29 Igor Borisovich Dounaev Methods and systems for digital data transmission
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
EP1493146B1 (en) 2002-04-11 2006-08-02 Matsushita Electric Industrial Co., Ltd. Encoding and decoding devices, methods and programs
JP4296752B2 (ja) 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7921445B2 (en) * 2002-06-06 2011-04-05 International Business Machines Corporation Audio/video speedup system and method in a server-client streaming architecture
TWI288915B (en) * 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US7379956B2 (en) * 2002-07-14 2008-05-27 Apple Inc. Encoding and decoding data arrays
US7376280B2 (en) * 2002-07-14 2008-05-20 Apple Inc Video encoding and decoding
JP4313993B2 (ja) * 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP4227772B2 (ja) * 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
JP3579047B2 (ja) * 2002-07-19 2004-10-20 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
EP1527442B1 (en) * 2002-08-01 2006-04-05 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and audio decoding method based on spectral band replication
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
TW564375B (en) * 2002-09-17 2003-12-01 Ind Tech Res Inst Amplitude phase shift information embedding and detecting method based on phase features
AU2006235813B2 (en) * 2002-09-18 2009-03-12 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
CA2469674C (en) * 2002-09-19 2012-04-24 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
US7191136B2 (en) * 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
JP4041385B2 (ja) * 2002-11-29 2008-01-30 株式会社ケンウッド 信号補間装置、信号補間方法及びプログラム
KR100501930B1 (ko) * 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
AU2002953284A0 (en) * 2002-12-12 2003-01-02 Lake Technology Limited Digital multirate filtering
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US20040252772A1 (en) * 2002-12-31 2004-12-16 Markku Renfors Filter bank based signal processing
TWI220753B (en) * 2003-01-20 2004-09-01 Mediatek Inc Method for determining quantization parameters
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR100923300B1 (ko) * 2003-03-22 2009-10-23 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR100923301B1 (ko) * 2003-03-22 2009-10-23 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
RU2244386C2 (ru) * 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
CN1774956B (zh) * 2003-04-17 2011-10-05 皇家飞利浦电子股份有限公司 音频信号合成
ATE359687T1 (de) * 2003-04-17 2007-05-15 Koninkl Philips Electronics Nv Audiosignalgenerierung
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
JP2005010621A (ja) * 2003-06-20 2005-01-13 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び帯域拡張方法
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US7548852B2 (en) 2003-06-30 2009-06-16 Koninklijke Philips Electronics N.V. Quality of decoded audio by adding noise
JP2005024756A (ja) * 2003-06-30 2005-01-27 Toshiba Corp 復号処理回路および移動端末装置
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7082573B2 (en) 2003-07-30 2006-07-25 America Online, Inc. Method and system for managing digital assets
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7844992B2 (en) * 2003-09-10 2010-11-30 Thomson Licensing Video on demand server system and method
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
WO2005027095A1 (ja) 2003-09-16 2005-03-24 Matsushita Electric Industrial Co., Ltd. 符号化装置および復号化装置
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
JP4767687B2 (ja) * 2003-10-07 2011-09-07 パナソニック株式会社 スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
KR20060090995A (ko) 2003-10-23 2006-08-17 마쓰시다 일렉트릭 인더스트리얼 컴패니 리미티드 스펙트럼 부호화 장치, 스펙트럼 복호화 장치, 음향 신호송신 장치, 음향 신호 수신장치 및 이들의 방법
BR122018007834B1 (pt) * 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
US7672838B1 (en) 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
CN101014997B (zh) * 2004-02-18 2012-04-04 皇家飞利浦电子股份有限公司 用于生成用于自动语音识别器的训练数据的方法和系统
JP4741476B2 (ja) 2004-04-23 2011-08-03 パナソニック株式会社 符号化装置
CN1947174B (zh) * 2004-04-27 2012-03-14 松下电器产业株式会社 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法
TWI376520B (en) 2004-04-30 2012-11-11 Hillcrest Lab Inc Free space pointing devices and methods
US8629836B2 (en) 2004-04-30 2014-01-14 Hillcrest Laboratories, Inc. 3D pointing devices with orientation compensation and improved usability
EP1744139B1 (en) 2004-05-14 2015-11-11 Panasonic Intellectual Property Corporation of America Decoding apparatus and method thereof
CN101656076B (zh) * 2004-05-14 2013-01-23 松下电器产业株式会社 音频编码装置、音频编码方法以及通信终端和基站装置
BRPI0510400A (pt) 2004-05-19 2007-10-23 Matsushita Electric Ind Co Ltd dispositivo de codificação, dispositivo de decodificação e método dos mesmos
US8065139B2 (en) 2004-06-21 2011-11-22 Koninklijke Philips Electronics N.V. Method of audio encoding
GB2416285A (en) 2004-07-14 2006-01-18 British Broadcasting Corp Transmission of a data signal in an audio signal
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US7921007B2 (en) 2004-08-17 2011-04-05 Koninklijke Philips Electronics N.V. Scalable audio coding
KR100640893B1 (ko) * 2004-09-07 2006-11-02 엘지전자 주식회사 음성 인식용 베이스밴드 모뎀 및 이동통신용 단말기
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
WO2006030754A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、復号化装置、方法、及びプログラム
US7620675B1 (en) * 2004-09-23 2009-11-17 Texas Instruments Incorporated Image and audio transform methods
JP4618634B2 (ja) * 2004-10-07 2011-01-26 Kddi株式会社 圧縮オーディオデータ処理方法
JP4815780B2 (ja) * 2004-10-20 2011-11-16 ヤマハ株式会社 オーバーサンプリングシステム、デコードlsi、およびオーバーサンプリング方法
US7555081B2 (en) * 2004-10-29 2009-06-30 Harman International Industries, Incorporated Log-sampled filter system
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
CN101053019B (zh) * 2004-11-02 2012-01-25 皇家飞利浦电子股份有限公司 使用复值滤波器组的音频信号的编码和解码的装置和方法
WO2006049204A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、符号化方法及び復号化方法
WO2006058129A2 (en) 2004-11-23 2006-06-01 Hillcrest Laboratories, Inc. Semantic gaming and application transformation
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US20060143013A1 (en) * 2004-12-28 2006-06-29 Broadcom Corporation Method and system for playing audio at an accelerated rate using multiresolution analysis technique keeping pitch constant
US8082156B2 (en) * 2005-01-11 2011-12-20 Nec Corporation Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal
US20060187770A1 (en) * 2005-02-23 2006-08-24 Broadcom Corporation Method and system for playing audio at a decelerated rate using multiresolution analysis technique keeping pitch constant
JP5107574B2 (ja) * 2005-02-24 2012-12-26 パナソニック株式会社 データ再生装置、データ再生方法、プログラム、および集積回路
JP4761506B2 (ja) * 2005-03-01 2011-08-31 国立大学法人北陸先端科学技術大学院大学 音声処理方法と装置及びプログラム並びに音声システム
JP4645241B2 (ja) * 2005-03-10 2011-03-09 ヤマハ株式会社 音声処理装置およびプログラム
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
ATE482449T1 (de) 2005-04-01 2010-10-15 Qualcomm Inc Verfahren und vorrichtungen zum kodieren und dekodieren eines hochbandteils eines sprachsignals
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US7627481B1 (en) 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
US8249861B2 (en) 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
US8086451B2 (en) 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
TWI317933B (en) 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
EP1742509B1 (en) 2005-07-08 2013-08-14 Oticon A/S A system and method for eliminating feedback and noise in a hearing device
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
KR100803205B1 (ko) * 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US20070030923A1 (en) * 2005-08-02 2007-02-08 Xiaoming Yu High accuracy non data-aided frequency estimator for M-ary phase shift keying modulation
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
JP4715385B2 (ja) * 2005-08-19 2011-07-06 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
WO2007028407A1 (en) 2005-09-06 2007-03-15 Nero Ag Method for signing a data package and signing apparatus
JP4627548B2 (ja) * 2005-09-08 2011-02-09 パイオニア株式会社 帯域拡張装置、帯域拡張方法および帯域拡張プログラム
RU2008112137A (ru) 2005-09-30 2009-11-10 Панасоник Корпорэйшн (Jp) Устройство кодирования речи и способ кодирования речи
US20070118361A1 (en) * 2005-10-07 2007-05-24 Deepen Sinha Window apparatus and method
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US8069035B2 (en) * 2005-10-14 2011-11-29 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, and methods of them
KR100739180B1 (ko) * 2005-10-20 2007-07-13 엘지전자 주식회사 이동 통신 단말기의 멀티미디어 데이터를 송수신하는 장치및 그 방법
JP4950210B2 (ja) * 2005-11-04 2012-06-13 ノキア コーポレイション オーディオ圧縮
JP5034228B2 (ja) * 2005-11-30 2012-09-26 株式会社Jvcケンウッド 補間装置、音再生装置、補間方法および補間プログラム
EP1959433B1 (en) * 2005-11-30 2011-10-19 Panasonic Corporation Subband coding apparatus and method of coding subband
US7489111B2 (en) 2005-12-08 2009-02-10 Robert W. Wise Holstered cordless power tool
US7536299B2 (en) * 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
TWI311856B (en) * 2006-01-04 2009-07-01 Quanta Comp Inc Synthesis subband filtering method and apparatus
KR100739786B1 (ko) * 2006-01-20 2007-07-13 삼성전자주식회사 다중 채널 디지털 앰프 시스템 및 그 신호 처리 방법
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
WO2007098258A1 (en) * 2006-02-24 2007-08-30 Neural Audio Corporation Audio codec conditioning system and method
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
BRPI0621499B1 (pt) * 2006-03-28 2022-04-12 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Método melhorado para formatação de sinal em reconstrução de áudio de canais múltiplos
WO2007114291A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、およびこれらの方法
US8392176B2 (en) * 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
DE602007005630D1 (de) * 2006-05-10 2010-05-12 Panasonic Corp Codierungseinrichtung und codierungsverfahren
JP2007310298A (ja) * 2006-05-22 2007-11-29 Oki Electric Ind Co Ltd 帯域外信号生成装置及び周波数帯域拡張装置
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
WO2007148925A1 (en) 2006-06-21 2007-12-27 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
JP2010513940A (ja) * 2006-06-29 2010-04-30 エヌエックスピー ビー ヴィ ノイズ合成
AR061807A1 (es) * 2006-07-04 2008-09-24 Coding Tech Ab Compresor de filtro y metodo para fabricar respuestas al impulso de filtro de subbanda comprimida
EP1881485A1 (en) 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal
US8000960B2 (en) * 2006-08-15 2011-08-16 Broadcom Corporation Packet loss concealment for sub-band predictive coding based on extrapolation of sub-band audio waveforms
JP2008066851A (ja) * 2006-09-05 2008-03-21 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
JP4967618B2 (ja) 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
JP5103880B2 (ja) 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
EP1927981B1 (en) * 2006-12-01 2013-02-20 Nuance Communications, Inc. Spectral refinement of audio signals
JPWO2008084688A1 (ja) * 2006-12-27 2010-04-30 パナソニック株式会社 符号化装置、復号装置及びこれらの方法
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
EP1947644B1 (en) 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
US7852745B2 (en) * 2007-03-02 2010-12-14 Signalink Technologies Inc. Non-orthogonal frequency-division multiplexed communication through a non-linear transmission medium
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
US8983830B2 (en) * 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
JP5098492B2 (ja) * 2007-07-30 2012-12-12 ソニー株式会社 信号処理装置及び信号処理方法、並びにプログラム
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
US20090198500A1 (en) * 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
EP2186087B1 (en) * 2007-08-27 2011-11-30 Telefonaktiebolaget L M Ericsson (PUBL) Improved transform coding of speech and audio signals
US8315856B2 (en) * 2007-10-24 2012-11-20 Red Shift Company, Llc Identify features of speech based on events in a signal representing spoken sounds
WO2009055701A1 (en) * 2007-10-24 2009-04-30 Red Shift Company, Llc Processing of a signal representing speech
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
JP5147851B2 (ja) * 2007-10-26 2013-02-20 株式会社ディーアンドエムホールディングス オーディオ信号補間装置及びオーディオ信号補間方法
EP2629293A3 (en) * 2007-11-02 2014-01-08 Huawei Technologies Co., Ltd. Method and apparatus for audio decoding
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
EP2220646A1 (en) * 2007-11-06 2010-08-25 Nokia Corporation Audio coding apparatus and method thereof
WO2009059633A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US8688441B2 (en) 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
CN101903944B (zh) * 2007-12-18 2013-04-03 Lg电子株式会社 用于处理音频信号的方法和装置
ES2629453T3 (es) 2007-12-21 2017-08-09 Iii Holdings 12, Llc Codificador, descodificador y procedimiento de codificación
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090203395A1 (en) * 2008-02-08 2009-08-13 Sony Ericsson Mobile Communications Ab Amplitude modulation radio transmission with extended bandwidth
ES2739667T3 (es) * 2008-03-10 2020-02-03 Fraunhofer Ges Forschung Dispositivo y método para manipular una señal de audio que tiene un evento transitorio
JP5326311B2 (ja) 2008-03-19 2013-10-30 沖電気工業株式会社 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
ES2898865T3 (es) * 2008-03-20 2022-03-09 Fraunhofer Ges Forschung Aparato y método para sintetizar una representación parametrizada de una señal de audio
JP2009300707A (ja) * 2008-06-13 2009-12-24 Sony Corp 情報処理装置および方法、並びにプログラム
US9378751B2 (en) * 2008-06-19 2016-06-28 Broadcom Corporation Method and system for digital gain processing in a hardware audio CODEC for audio transmission
US8909361B2 (en) * 2008-06-19 2014-12-09 Broadcom Corporation Method and system for processing high quality audio in a hardware audio codec for audio transmission
JP5224219B2 (ja) * 2008-06-26 2013-07-03 独立行政法人科学技術振興機構 オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法
US20140184509A1 (en) 2013-01-02 2014-07-03 Movea Sa Hand held pointing device with roll compensation
US8010313B2 (en) 2008-06-27 2011-08-30 Movea Sa Hand held pointing device with roll compensation
US8880410B2 (en) 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
PL2301027T3 (pl) * 2008-07-11 2015-09-30 Fraunhofer Ges Forschung Urządzenie i sposób generowania danych wyjściowych rozszerzenia pasma
MY163454A (en) * 2008-07-11 2017-09-15 Frauenhofer-Gesellschaft Zur Apparatus or method for generating a bandwidth extended signal
PL2346030T3 (pl) 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
CN102089816B (zh) * 2008-07-11 2013-01-30 弗朗霍夫应用科学研究促进协会 音频信号合成器及音频信号编码器
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
US8463412B2 (en) 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8326640B2 (en) * 2008-08-26 2012-12-04 Broadcom Corporation Method and system for multi-band amplitude estimation and gain control in an audio CODEC
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010031049A1 (en) * 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2184929B1 (en) 2008-11-10 2013-04-03 Oticon A/S N band FM demodulation to aid cochlear hearing impaired persons
US8548816B1 (en) * 2008-12-01 2013-10-01 Marvell International Ltd. Efficient scalefactor estimation in advanced audio coding and MP3 encoder
CN101751925B (zh) * 2008-12-10 2011-12-21 华为技术有限公司 一种语音解码方法及装置
GB2466201B (en) 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) * 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
AU2013203159B2 (en) * 2008-12-15 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and bandwidth extension decoder
MX2011006163A (es) 2008-12-15 2011-11-02 Fraunhofer Ges Forschung Codificador de audio y descodificador de extension de ancho de banda.
EP2360687A4 (en) * 2008-12-19 2012-07-11 Fujitsu Ltd VOICE BAND EXTENSION DEVICE AND VOICE BAND EXTENSION METHOD
BR122019023704B1 (pt) * 2009-01-16 2020-05-05 Dolby Int Ab sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
AU2015221516B2 (en) * 2009-01-28 2017-08-10 Dolby International Ab Improved Harmonic Transposition
ES2826324T3 (es) 2009-01-28 2021-05-18 Dolby Int Ab Transposición armónica mejorada
EP2953131B1 (en) * 2009-01-28 2017-07-26 Dolby International AB Improved harmonic transposition
AU2013211560B2 (en) * 2009-01-28 2016-04-28 Dolby International Ab Improved harmonic transposition
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
CN102308596B (zh) 2009-02-06 2014-10-15 奥迪康有限公司 避免啸声和次振荡的谱带替换的设备和方法
TWI716833B (zh) * 2009-02-18 2021-01-21 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
TWI569573B (zh) 2009-02-18 2017-02-01 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
CA3093218C (en) 2009-03-17 2022-05-17 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
JP5267257B2 (ja) * 2009-03-23 2013-08-21 沖電気工業株式会社 音声ミキシング装置、方法及びプログラム、並びに、音声会議システム
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CO6440537A2 (es) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
AU2013207549B2 (en) * 2009-04-09 2015-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
AU2015264887B2 (en) * 2009-05-27 2017-12-07 Dolby International Ab Efficient Combined Harmonic Transposition
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
AU2014201331B2 (en) * 2009-06-29 2015-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
EP2273493B1 (en) * 2009-06-29 2012-12-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Bandwidth extension encoding and decoding
JP5365380B2 (ja) * 2009-07-07 2013-12-11 ソニー株式会社 音響信号処理装置、その処理方法およびプログラム
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
JP5031006B2 (ja) * 2009-09-04 2012-09-19 パナソニック株式会社 スケーラブル復号化装置及びスケーラブル復号化方法
JP5433022B2 (ja) * 2009-09-18 2014-03-05 ドルビー インターナショナル アーベー 高調波転換
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102754159B (zh) 2009-10-19 2016-08-24 杜比国际公司 指示音频对象的部分的元数据时间标记信息
KR101341115B1 (ko) 2009-10-21 2013-12-13 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 적응식 오버샘플링을 사용하는 고주파수 오디오 신호를 발생시키기 위한 장치 및 방법
WO2011048792A1 (ja) * 2009-10-21 2011-04-28 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
CN103559889B (zh) 2009-10-21 2017-05-24 杜比国际公司 组合换位滤波器组的过采样
US20110257978A1 (en) * 2009-10-23 2011-10-20 Brainlike, Inc. Time Series Filtering, Data Reduction and Voice Recognition in Communication Device
TWI484473B (zh) 2009-10-30 2015-05-11 Dolby Int Ab 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統
WO2011062538A1 (en) * 2009-11-19 2011-05-26 Telefonaktiebolaget Lm Ericsson (Publ) Bandwidth extension of a low band audio signal
CA2780971A1 (en) 2009-11-19 2011-05-26 Telefonaktiebolaget L M Ericsson (Publ) Improved excitation signal bandwidth extension
JP5812998B2 (ja) * 2009-11-19 2015-11-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
CN103854651B (zh) * 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
AU2014200151B2 (en) * 2010-01-19 2015-04-16 Dolby International Ab Improved subband block based harmonic transposition
AU2015203065B2 (en) * 2010-01-19 2017-05-11 Dolby International Ab Improved subband block based harmonic transposition
KR101663578B1 (ko) * 2010-01-19 2016-10-10 돌비 인터네셔널 에이비 고조파 전위에 기초하여 개선된 서브밴드 블록
KR101712101B1 (ko) * 2010-01-28 2017-03-03 삼성전자 주식회사 신호 처리 방법 및 장치
EP2362376A3 (en) 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using envelope shaping
ES2449476T3 (es) 2010-03-09 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y programa de ordenador para procesar una señal de audio
PL2545551T3 (pl) * 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
MX2012010416A (es) 2010-03-09 2012-11-23 Dolby Int Ab Aparato y método para procesar una señal de audio usando alineación de borde de patching.
EP2375782B1 (en) * 2010-04-09 2018-12-12 Oticon A/S Improvements in sound perception using frequency transposition by moving the envelope
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN102947882B (zh) 2010-04-16 2015-06-17 弗劳恩霍夫应用研究促进协会 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法
US8452826B2 (en) 2010-05-04 2013-05-28 Raytheon Applied Signal Technology, Inc. Digital frequency channelizer
US8751225B2 (en) 2010-05-12 2014-06-10 Electronics And Telecommunications Research Institute Apparatus and method for coding signal in a communication system
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
AU2011263191B2 (en) * 2010-06-09 2016-06-16 Panasonic Intellectual Property Corporation Of America Bandwidth Extension Method, Bandwidth Extension Apparatus, Program, Integrated Circuit, and Audio Decoding Apparatus
KR102632248B1 (ko) 2010-07-19 2024-02-02 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
CN103270553B (zh) 2010-08-12 2015-08-12 弗兰霍菲尔运输应用研究公司 对正交镜像滤波器式音频编译码器的输出信号的重新取样
BR122019025121B1 (pt) * 2010-09-16 2021-04-27 Dolby International Ab Sistema e método para gerar um sinal de tempo alongado e/ou um sinal de frequência transposta a partir de um sinal de entrada e meio de armazenamento legível por computador não transitório
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
KR20120046627A (ko) * 2010-11-02 2012-05-10 삼성전자주식회사 화자 적응 방법 및 장치
TWI412022B (zh) * 2010-12-30 2013-10-11 Univ Nat Cheng Kung 遞迴式離散餘弦正、逆轉換之系統
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN103477387B (zh) 2011-02-14 2015-11-25 弗兰霍菲尔运输应用研究公司 使用频谱域噪声整形的基于线性预测的编码方案
RU2586597C2 (ru) 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодирование и декодирование позиций импульсов дорожек аудиосигнала
JP5712288B2 (ja) * 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
RU2560788C2 (ru) 2011-02-14 2015-08-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки декодированного аудиосигнала в спектральной области
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
ES2913760T3 (es) * 2011-02-18 2022-06-06 Ntt Docomo Inc Codificador de voz y método de codificación de voz
PL2908313T3 (pl) * 2011-04-15 2019-11-29 Ericsson Telefon Ab L M Adaptacyjny podział współczynnika kształt - wzmocnienie
US9536534B2 (en) * 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
JP5986565B2 (ja) * 2011-06-09 2016-09-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
DE102011106034A1 (de) * 2011-06-30 2013-01-03 Zte Corporation Verfahren und Vorrichtung zur Spektralbandreplikation und Verfahren und System zur Audiodecodierung
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
EP2562751B1 (en) 2011-08-22 2014-06-11 Svox AG Temporal interpolation of adjacent spectra
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
US8781023B2 (en) 2011-11-01 2014-07-15 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth expanded channel
US8774308B2 (en) * 2011-11-01 2014-07-08 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth mismatched channel
JP6155274B2 (ja) 2011-11-11 2017-06-28 ドルビー・インターナショナル・アーベー 過剰サンプリングされたsbrを使ったアップサンプリング
JP5817499B2 (ja) 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
WO2013142650A1 (en) 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
US8965290B2 (en) * 2012-03-29 2015-02-24 General Electric Company Amplitude enhanced frequency modulation
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
JP6065452B2 (ja) * 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
EP2704142B1 (en) 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
PT3067890T (pt) 2013-01-29 2018-03-08 Fraunhofer Ges Forschung Codificador de áudio, descodificador de áudio, método para fornecer uma informação de áudio codificada, método para fornecer uma informação de áudio descodificado, programa de computador e representação codificada utilizando uma extensão da largura de banda adaptável ao sinal
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
RU2622872C2 (ru) 2013-04-05 2017-06-20 Долби Интернэшнл Аб Аудиокодер и декодер для кодирования по форме волны с перемежением
BR122017006701B1 (pt) * 2013-04-05 2022-03-03 Dolby International Ab Codificador e decodificador de áudio estereofônico
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
JP6224827B2 (ja) 2013-06-10 2017-11-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 分配量子化及び符号化を使用した累積和表現のモデル化によるオーディオ信号包絡符号化、処理及び復号化の装置と方法
RU2660633C2 (ru) 2013-06-10 2018-07-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем разделения огибающей аудиосигнала с использованием квантования и кодирования распределения
EP2822263B1 (en) 2013-07-05 2019-03-27 Sennheiser Communications A/S Communication device with echo suppression
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2830055A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
WO2015077641A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Selective phase compensation in high band coding
CA2934602C (en) 2013-12-27 2022-08-30 Sony Corporation Decoding apparatus and method, and program
CN103795420B (zh) * 2014-02-10 2017-04-05 南京邮电大学 一种基于分段的sbr多属性数据压缩方法
CN105659321B (zh) 2014-02-28 2020-07-28 弗朗霍弗应用研究促进协会 解码装置和解码方法
JP6439296B2 (ja) * 2014-03-24 2018-12-19 ソニー株式会社 復号装置および方法、並びにプログラム
MX367639B (es) 2014-03-31 2019-08-29 Fraunhofer Ges Forschung Codificador, decodificador, método de codificación, método de decodificación y programa.
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
EP3262639B1 (en) * 2015-02-26 2020-10-07 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for processing an audio signal to obtain a processed audio signal using a target time-domain envelope
TW202242853A (zh) * 2015-03-13 2022-11-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI732403B (zh) * 2015-03-13 2021-07-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016180704A1 (en) 2015-05-08 2016-11-17 Dolby International Ab Dialog enhancement complemented with frequency transposition
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US10861475B2 (en) * 2015-11-10 2020-12-08 Dolby International Ab Signal-dependent companding system and method to reduce quantization noise
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3408851B1 (en) 2016-01-26 2019-09-11 Dolby Laboratories Licensing Corporation Adaptive quantization
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
EP3246923A1 (en) * 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
JP6621709B2 (ja) * 2016-05-26 2019-12-18 アルパイン株式会社 音声処理装置、音声処理方法及びコンピュータプログラム
CN107845385B (zh) 2016-09-19 2021-07-13 南宁富桂精密工业有限公司 信息隐藏的编解码方法及系统
GB201620317D0 (en) * 2016-11-30 2017-01-11 Microsoft Technology Licensing Llc Audio signal processing
NO343581B1 (no) * 2017-03-01 2019-04-08 Dolby Int Ab Fremgangsmåte, anordning og program til spektralinnhyllingsjustering
CN109215675B (zh) * 2017-07-05 2021-08-03 苏州谦问万答吧教育科技有限公司 一种啸叫抑制的方法、装置及设备
US10714098B2 (en) 2017-12-21 2020-07-14 Dolby Laboratories Licensing Corporation Selective forward error correction for spatial audio codecs
KR20210005164A (ko) 2018-04-25 2021-01-13 돌비 인터네셔널 에이비 고주파 오디오 재구성 기술의 통합
KR102560473B1 (ko) 2018-04-25 2023-07-27 돌비 인터네셔널 에이비 후처리 지연을 저감시킨 고주파 재구성 기술의 통합
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
CN113113032A (zh) * 2020-01-10 2021-07-13 华为技术有限公司 一种音频编解码方法和音频编解码设备
JPWO2022097242A1 (zh) * 2020-11-05 2022-05-12
US20230386497A1 (en) * 2020-11-05 2023-11-30 Nippon Telegraph And Telephone Corporation Sound signal high frequency compensation method, sound signal post processing method, sound signal decode method, apparatus thereof, program, and storage medium

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4150253A (en) * 1976-03-15 1979-04-17 Inter-Technology Exchange Ltd. Signal distortion circuit and method of use
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4790016A (en) * 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
CA1220282A (en) * 1985-04-03 1987-04-07 Northern Telecom Limited Transmission of wideband speech signals
SE444750B (sv) * 1985-06-04 1986-04-28 Lars Gustaf Liljeryd Metod for att pa elektronisk veg astadkomma fortydligande av ljud- eller bildinformation jemte anordning for utforande av metoden
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US4771465A (en) 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US5040217A (en) 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5436940A (en) * 1992-06-11 1995-07-25 Massachusetts Institute Of Technology Quadrature mirror filter banks and method
CA2106440C (en) * 1992-11-30 1997-11-18 Jelena Kovacevic Method and apparatus for reducing correlated errors in subband coding systems with quantizers
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US5687340A (en) * 1995-05-16 1997-11-11 Hewlett-Packard Company Reduced area floating point processor control logic utilizing a decoder between a control unit and the FPU
US5692050A (en) * 1995-06-15 1997-11-25 Binaura Corporation Method and apparatus for spatially enhancing stereo and monophonic signals
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5687191A (en) 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
US5822370A (en) * 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US6049766A (en) * 1996-11-07 2000-04-11 Creative Technology Ltd. Time-domain time/pitch scaling of speech or audio signals with transient handling
JP3017715B2 (ja) * 1997-10-31 2000-03-13 松下電器産業株式会社 音声再生装置
EP0957579A1 (en) * 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for sampling-rate conversion of audio signals
JP3546755B2 (ja) * 1999-05-06 2004-07-28 ヤマハ株式会社 リズム音源信号の時間軸圧伸方法及び装置
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101676993B (zh) * 2005-07-13 2012-05-30 西门子公司 用于人工扩展语音信号的带宽的方法和装置
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US8374883B2 (en) 2007-10-31 2013-02-12 Panasonic Corporation Encoder and decoder using inter channel prediction based on optimally determined signals
CN101842832B (zh) * 2007-10-31 2012-11-07 松下电器产业株式会社 编码装置和解码装置
CN101836250B (zh) * 2007-11-21 2012-11-28 Lg电子株式会社 用于处理信号的方法及装置
CN101789239B (zh) * 2009-01-23 2014-05-07 奥迪康有限公司 便携式听音设备中的音频处理
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
CN102449692A (zh) * 2009-05-27 2012-05-09 杜比国际公司 高效组合谐波转置
CN102449692B (zh) * 2009-05-27 2014-05-07 杜比国际公司 高效组合谐波转置
TWI556227B (zh) * 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
TWI643187B (zh) * 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
TWI675367B (zh) * 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
CN104813395A (zh) * 2012-09-17 2015-07-29 弗兰霍菲尔运输应用研究公司 从带宽有限音频信号生成带宽扩展信号的设备和方法
CN104813395B (zh) * 2012-09-17 2017-11-24 弗劳恩霍夫应用研究促进协会 从带宽有限音频信号生成带宽扩展信号的设备和方法
US9997162B2 (en) 2012-09-17 2018-06-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US10580415B2 (en) 2012-09-17 2020-03-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN113516987A (zh) * 2021-07-16 2021-10-19 科大讯飞股份有限公司 一种说话人识别方法、装置、存储介质及设备

Also Published As

Publication number Publication date
EP1367566A3 (en) 2004-09-08
PT1367566E (pt) 2005-11-30
EP0940015A1 (en) 1999-09-08
SE9800268L (sv) 1998-12-11
HK1030843A1 (en) 2001-05-18
WO1998057436A3 (en) 2000-02-10
EP1367566A2 (en) 2003-12-03
ES2213901T3 (es) 2004-09-01
US7283955B2 (en) 2007-10-16
CN1272259A (zh) 2000-11-01
ES2247466T3 (es) 2006-03-01
SE512719C2 (sv) 2000-05-02
SE9800268D0 (sv) 1998-01-30
ATE257987T1 (de) 2004-01-15
EP0940015B1 (en) 2004-01-14
BR9805989A (pt) 1999-08-31
US20040125878A1 (en) 2004-07-01
HK1057815A1 (en) 2004-04-16
JP3871347B2 (ja) 2007-01-24
US20040078194A1 (en) 2004-04-22
JP2005173607A (ja) 2005-06-30
WO1998057436A2 (en) 1998-12-17
US6680972B1 (en) 2004-01-20
CN1308916C (zh) 2007-04-04
DE69821089D1 (de) 2004-02-19
PT940015E (pt) 2004-06-30
US6925116B2 (en) 2005-08-02
DE69831435D1 (de) 2005-10-06
US20040078205A1 (en) 2004-04-22
EP1367566B1 (en) 2005-08-31
ATE303679T1 (de) 2005-09-15
US7328162B2 (en) 2008-02-05
JP2001521648A (ja) 2001-11-06
JP4220461B2 (ja) 2009-02-04
CN1206816C (zh) 2005-06-15
AU7446598A (en) 1998-12-30
DK1367566T3 (da) 2005-10-10
DK0940015T3 (da) 2004-04-26
DE69831435T2 (de) 2006-06-14
BR9805989B1 (pt) 2009-12-01
DE69821089T2 (de) 2004-11-11

Similar Documents

Publication Publication Date Title
CN1308916C (zh) 采用频带复现增强源编码
TWI555008B (zh) 使用在智慧間隙填充架構內之雙聲道處理之音頻編碼器、音頻解碼器及相關方法
US6708145B1 (en) Enhancing perceptual performance of sbr and related hfr coding methods by adaptive noise-floor addition and noise substitution limiting
RU2376657C2 (ru) Системы, способы и устройства для высокополосного предыскажения шкалы времени
CN1096148C (zh) 信号编码方法和装置
CA2867069C (en) Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
JP5164834B2 (ja) スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック
JP3579047B2 (ja) オーディオ復号装置と復号方法およびプログラム
US9424847B2 (en) Bandwidth extension parameter generation device, encoding apparatus, decoding apparatus, bandwidth extension parameter generation method, encoding method, and decoding method
EP3336843B1 (en) Speech coding method and speech coding apparatus
JP4390208B2 (ja) 音声を可変レートで符号化および復号する方法
CN1875402A (zh) 音频信号编码或解码
CN1781141A (zh) 使用频谱分量耦合和频谱分量再生的改进音频编码系统和方法
CN102144259A (zh) 用于产生带宽扩展输出数据的装置和方法
JP4272897B2 (ja) 符号化装置、復号化装置およびその方法
JPWO2006003891A1 (ja) 音声信号復号化装置及び音声信号符号化装置
TW201419269A (zh) 用以再現音訊信號之裝置及方法、用以產生編碼音訊信號之裝置及方法、電腦程式、與編碼音訊信號
US20090171673A1 (en) Encoding apparatus and encoding method
JP2011507050A (ja) オーディオ信号処理方法及び装置
TW200931397A (en) An encoder
CN103548080A (zh) 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
CN1677493A (zh) 一种增强音频编解码装置及方法
CN1849648A (zh) 编码装置和译码装置
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
Bartkowiak Low bit rate coding of sparse audio spectra using frequency shift and interleaved MDCT

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: DUBI SWEDEN STOCK CO., LTD.

Free format text: FORMER NAME: ENCODING TECHNOLOGY STOCK CO., LTD.

CP03 Change of name, title or address

Address after: Stockholm

Patentee after: Dolby Sweden AG

Address before: Stockholm

Patentee before: Coding Technologies Sweden AB

C56 Change in the name or address of the patentee

Owner name: DOLBY INTERNATIONAL COMPANY

Free format text: FORMER NAME: DOLBY SWEDEN AB COMPANY

CP03 Change of name, title or address

Address after: Amsterdam

Patentee after: Dolby International AB

Address before: Stockholm

Patentee before: Dolby Sweden AG

EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20050622

Assignee: Lenovo Mobile Communication Technology Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2012990000858

Denomination of invention: Source coding enhancement using spectral-band replication

Granted publication date: 20070404

License type: Common License

Record date: 20121129

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20050622

Assignee: Beijing millet Communication Technology Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2013990000117

Denomination of invention: Source coding enhancement using spectral-band replication

Granted publication date: 20070404

License type: Common License

Record date: 20130326

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20050622

Assignee: Guangzhou Huaduo Network Technology Co., Ltd.

Assignor: Via licensing company

Contract record no.: 2014990000616

Denomination of invention: Source coding enhancement using spectral-band replication

Granted publication date: 20070404

License type: Common License

Record date: 20140804

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20070404