CN1286788A - 关于低比特率语音编码器的噪声抑制 - Google Patents

关于低比特率语音编码器的噪声抑制 Download PDF

Info

Publication number
CN1286788A
CN1286788A CN99801661A CN99801661A CN1286788A CN 1286788 A CN1286788 A CN 1286788A CN 99801661 A CN99801661 A CN 99801661A CN 99801661 A CN99801661 A CN 99801661A CN 1286788 A CN1286788 A CN 1286788A
Authority
CN
China
Prior art keywords
noise
input signal
spectrum
signal
band spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN99801661A
Other languages
English (en)
Inventor
史蒂文·H·伊莎贝尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1286788A publication Critical patent/CN1286788A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

在携带噪声和语音的组合的输入信号中的噪声得到了抑制。输入信号被划分成若干个信号块,对这些信号块进行处理以提供输入信号的短时间感知带谱的估计值。在不同的时间点上判断输入信号只携带噪声还是噪声和语音的组合。当输入信号只携带噪声时,输入信号的相应估计的短时间感知带谱用来修正噪声的长时间感知带谱的估计值。然后,根据噪声的长时间感知带谱的估计值和输入信号的短时间感知带谱确定噪声抑制频率响应,和噪声抑制频率响应用来成形与噪声抑制频率响应相一致的输入信号的当前块。

Description

关于低比特率语音编码器 的噪声抑制
                       发明背景
本发明提供了适用于低比特率语音编码器的前端的噪声抑制技术。这种创造性的技术尤其适合用在蜂窝式电话应用中。
下列的现有技术文件提供了有关本发明的技术背景:“改进的可变速率编解码器,用于宽带扩频数字系统的语音服务可选方案3,”(“ENHANCEDVARIABLE RATE CODEC,SPEECH SERVICE OPTION 3 FORWIDEBAND SPREAD SPECTRUM DIGITAL SYSTEMS”,TIA/EIA/IS-127standard),“关于语音改善方法的语音/暂停检测器的研究”(“THE STUDYOF SPEECH/PAUSE DETECTORS FOR SPEECH ENHANCEMENTMETHODS”,P.Sovka and P.Pollak,Eurospeech 95 Madrid,1995,P.1575-1578),“利用最小二乘法误差快速频谱估值器的语音改善”(“SPEECHENHANCEMENT USING A MINIMUM MEAN-SQUARE ERROR SHORT-TIME SPECTRAL AMPLITUPE ESTIMATOR”,Y.Ephraim,D.Malah,IEEETransactions on Acoustics Speech and Signal Processing,Vol.ASSP-32,No.6,Dec.1984,PP.1109-1121),“利用频谱扣除的声音噪声抑制”(“SUPPRESSION OF ACOUSTCC NOISE USING SPECTRALSUBTRACTION”,S.Boll,IEEE Trangactions on Acoustics Speech and SignalProcessing,Vol.ASSP-27,No.2,April 1979,PP113-120),“基于统计模型的语音改善系统”(“STATISTICAL-MODEL-BASED SPEECHENHANCEMENT SYSTEMS”,Proceedings of the IEEE,Vol.80,No.10,October 1992,PP1526-1544)。
用于噪声抑制的不太复杂的方法是频谱修正(也称为频谱扣除)。利用频谱修正的噪声抑制算法首先将含噪声的语音信号划分成几个频带。对每个频带进行增益计算,增益通常依赖于该带中估计的信噪比。应用这些增益,并且重构一个信号。这种类型的方案必须从所观察的含噪声语音信号中估计信号和噪声特性。在如下的美国专利中可以找到几个频谱修正技术的应用例子:US专利号:5,687,285;5,680,393;5,668,927;5,659,622;5,651,071;5,630,015;5,625,684;5,621,850;5,617,505;5,617,472;5,602,962;5,577,161;5,555,287;5,550,924;5,544,250;5,539,859;5,533,133;5,530,768;5,479,560;5,432,859;5,406,635;5,402,496;5,388,182;5,388,160;5,353,376;5,319,736;5,278,780;5,251,263;5,168,526;5,133,013;5,081,681;5,040,156;5,012,519;4,408,855;4,897,878;4,811,404;4,747,143;4,737,976;4,630,305;4,630,304;4,628,529和4,468,804。
频谱修正具有几个合乎要求的特性。首先,可以使它变成自适应的,因此,它可以应付可变的噪声环境。第二,许多计算可以在离散付里叶变换(DFT)域内进行。因此,可以使用快速算法(如快速付里叶变换(FFT))。
但是,在这方面技术的当前状态下,存在着几个缺点。这些缺点包括:
(ⅰ)在降低高噪声电平过程中所希望语音信号的不良畸变(这样的畸变有几方面原因,一些畸变将在下面细述);和
(ⅱ)计算的过份复杂性。
提供能克服现有技术中的缺点的噪声抑制技术是有益的。尤其是,提供考虑典型地出现在基于块的噪声抑制技术中的时域不连续的噪声抑制技术是有益的。进一步,提供这种减少由于频谱扣除所固有的频域不连续性引起的畸变的技术是有益的。还进一步,降低在提供噪声抑制过程中频谱成形操作的复杂性和提高在噪声抑制技术中所估计噪声统计的可靠性是有益的。
本发明提供了具有这些和其它优点的噪声抑制技术。
                     发明简述
本发明提供了其中由于典型地出现在基于块的噪声抑制技术中的时域不连续性引起的畸变得到减少的噪声抑制技术。随着在噪声抑制处理中所使用的频谱形成操作的复杂性得到降低,由于在频谱扣除中所固有的频域不连续性引起的畸变也得到减少。通过使用改进的语音灵敏检测器,本发明还提高了所估计噪声统计的可靠性。
根据本发明的方法抑制了传输噪声和语音的组合的输入信号中的噪声成分。输入信号被划分成信号块,对这些信号块进行处理以得出输入信号的短时间感知带谱(short-time perceptual band spectrum)的估计值。在不同时间点上确定输入信号只携带噪声还是传输噪声和语音的组合。当输入信号只携带噪声时,输入信号的相应估计的短时间感知带谱被用来修改噪声的长时间感知带谱的估计值。然后,根据噪声的长时间感知带谱的估计值和输入信号的短时间感知帝谱确定噪声抑制频率响应,并且噪声抑制频率响应被用来成形与噪声抑制频率响应相一致的输入信号的当前块。
本发明还可以包括预滤波输入信号以加强其中的高频成分的步骤。在图示的实施例中,输入信号的处理包括将离散付里叶变换应用到信号块中以便提供每块的复值频域表示。信号块的频域表示被转换成只有幅度的信号,在穿过几个分离的频带上对这些信号求平均以获得长时间感知带谱的估计值。对感知带谱的随时间变化的成分进行平滑以得到短时间感知带谱的估计值。
噪声抑制频率响应可以使用应用于成形输入信号的当前块的全极点滤波器器进行模拟。
本发明提供了抑制携带噪声和语音的组合的输入信号中的噪声的设备。能够预滤波输入信号以加强其中的高频成分的信号预处理器将输入信号分成若干块。然后,快速付里叶变换处理器处理这些块以提供输入信号的频域复值谱。配置累加器将频域复值谱累加成由不等宽频带组成的长时间感知帝谱。对长时间感知带谱进行滤波生成由所述长时间感知带谱的当前片段加噪声组成的短时间感知带谱的估计值。语音/暂停检测器判断在给定时间点上输入信号只是噪声,还是语音和噪声的组合。当输入信号只是噪声时,噪声谱估值器响应语音/暂停检测电路,根据短时间感知带谱来修正噪声的长时间感知带谱的估计值。谱增益处理器响应噪声谱估值器确定噪声抑制频率响应。然后,谱成形处理器响应谱增益处理器成形输入信号的当前块以抑制其中的噪声。谱成形处理器可以包括,例如,一个全极点滤波器。
此外,本发明还公开了抑制在传输噪声和诸如语音那样的音频信息的组合的输入信号中的噪声的方法。噪声抑制频率响应是针对频域中的输入信号来计算的。然后,所计算的噪声抑制频率响应应用于时域中的输入信号中抑制输入信号中的噪声。这种方法可以进一步包括在计算输入信号中的噪声抑制频率响应之前将输入信号划分成若干块的步骤。在图示的实施例中,噪声抑制频率响应是通过由确定噪声抑制频率响应的自相关函数所生成的全极点滤波器应用到输入信号中的。
                          附图简述
图1是根据本发明的噪声抑制算法的方块图;
图2是显示根据本发明的输入信号的分块处理的示意图;
图3是显示具有不同宽度的、含有离散付里叶变换(DFT)箱的各个噪声谱带(NS带)的相关性的示意图;
图4是一种可能的语音/暂停检测器实施例的方块图;
图5包括提供含噪声的语音发声的能量测量例子的波形;
图6包括提供含噪声语音发声的频谱转换测量例子的波形;
图7包括提供含噪声语音发声的频谱相似性测量例子的波形;
图8是模拟含噪声语音信号的信号状态器的图示;
图9显示分段恒定的频率响应;和
图10显示了图9所示的分段恒定频率响应的平滑。
                    发明详述
根据本发明,噪声抑制算法计算随时间变化的滤波响应并将它应用到含噪声语音中。此算法的方块图显示在图1中,其中标有“AR参数计算”和“AR频谱成形”的方块与随时间变化的滤波响应的应用有关,和“AR”表示“自回归”。图1中的所有其它方块与从含噪声语音中计算随时间变化的滤波响应相对应。
含噪声输入信号在使用简单高通滤波器的信号预处理器10中得到预处理来稍微加强其高频成分。然后,预处理器将滤波信号划分成若干个通过快速付里叶变换(FFT)模块12的块。FFT模块12为信号块开一个窗口并对信号进行离散付里叶变换。对产生的频域复值表示进行处理以生成只有幅度的信号。在几个分离的频带中对这些只有幅度的信号值求平均产生一个“感知带谱”。求平均值导致了必须要处理的数据量的减少。
感知带谱中的时间变化在信号和噪声谱估计模块14中被平滑生成输入信号的短时间感知带谱的估计值。这个估计值传送到语音/暂停检测器16、噪声谱估值器18和谱增益计算模块20。
语音/暂停检测器16判断当前输入信号仅仅是噪声,还是语音和噪声的组合。通过测量输入语音信号的几个特性、使用这些测量结果修正输入信号的模型和利用这个模型的状态作出最后的语音/暂停判定来作出这个判断。然后,这个判定结果传送到噪声谱估值器。
当语音/暂停检测器16确定出输入信号只由噪声组成时,噪声谱估值器18利用当前感知带谱修正噪声的感知带谱估计值。另外,噪声谱估值器的某些参数也在这个模块中得到修正并被反送到语音/暂停检测器16中。然后,噪声的感知带谱估计值传送到谱增益计算模块20中。
利用当前信号和噪声的感知带谱的估计值,谱增益计算模块20确定噪声抑制频率响应。正如图9所示的,这个噪声抑制频率响应是分段恒定的。每个分段恒定的片段对应于临界带谱的一个成分。这个频率响应传送到AR参数计算模块22。
AR参数计算模块利用全极点滤波器模拟噪声抑制频率响应。由于噪声抑制频率响应是分段恒定的,它的自相关函数可以以闭合形式容易得到确定。然后,全极点滤波器参数可以有效地从自相关函数中计算出来。分段恒定谱的全极模拟具有在噪声抑制谱中消除不连续的效果。应该认识到,现在为人所知的或以后发现的其它模拟技术都可以代替全极点滤波器的使用,所有这样的同等技术都意味着由本文所主张的发明所覆盖。
AR谱成形模块24利用AR参数将滤波应用到输入信号的当前块中。通过实现时域内的谱成形,由于块处理引起的时间不连续性得到降低。此外,由于噪声抑制频率响应也可以利用低阶全极点滤波器来模拟,因此,时域成形可以导致在某些处理器上更有效实现。
在信号预处理模块10中,信号首先利用形式为H(z)=1-0.8z-1的高通滤波器得到预加强。这种高通滤波器被选用来部分补偿语音中所固有的谱倾斜。由此预处理的信号生成更加精确的噪声抑制频率响应。
如图2所示,输入信号30以八十个样本(对应于8KHz取样速率上的10ms)为块单位得到处理。这在图中由分析块34所表示,分析块34的长度是八十个样本。更具体地说,在所示例子的实施例中,输入信号被划分成一百二十八个样本的块。每块由来自前一块的最后二十四个样本(参考标号32)、分析块34的八十个新样本和其值为零的二十四个样本(参考标号36)组成。每一块都用汉明窗来开窗并进行付里叶变换。
隐含在块结构中的零位填充值得进一步说明一下。尤其是,从信号处理的观点来看,零位填充是没有必要的,因为谱成形(下面将要说明)并没有利用离散付里叶变换来实现。但是,包含了零位填充可以容易地将此算法整合到由本发明的受让人、Solana技术发展公司(Solana Technology DevelopmentCorporation)研制的现有EVRC语音编解器中。这种块结构并不需要对现有EVRC代码的整个缓冲管理策略作什么改变。
每个噪声抑制帧都可以被看作一个128个点的序列。当这个序列由g[n]来表示时,信号块的频域表示可以定义为离散付里叶变换 G [ k ] = c Σ n = 0 M - 1 g [ n ] e j 2 πnk / M 这里,c是归一化常数。
然后,信号谱被累加成如下形式的不等宽频带:其中,
F1[k]={2、4、6、8、10、12、14、17、20、23、27、31、36、42、49、56}
Fh[k]={3、5、7、9、11、13、16、19、22、26、30、35、41、48、55、63}
这个不等宽频带被称为感知带谱。这个通常表示成50的频带显示在图3中。如图所示,噪声谱带(NS带)具有不同的宽度,并且与离散付里叶变换(DFT)箱(bins)相关。
信号加噪声的感知带谱的估计值是在模块14(图1)中利用例如单极点递归滤波器对感知带谱进行滤波生成的。信号加噪声的功率谱的估计值是:
Su[k]=β.Su[k]+(1-β).S[k]
由于语音特性只在相对较短时间的区间上是稳定的,因此,选择β只在n个(例如,2-3个)噪声抑制块上进行平滑。这种平滑被称为“短时间”平滑,并提供了“短时间感知带谱”的估计值。
为了能起适当作用,噪声抑制系统要求对噪声统计的精确估计。这种功能是由语音/暂停检测模块16来提供的。在一个可能的实施例中,配置了同时测量语音和噪声的单个麦克风。由于噪声抑制算法要求对噪声统计的估计,因此需要一种用来区分含噪声语音信号与只有噪声的信号的方法。这种方法必须从本质上检测到含噪声语音中的暂停。由于几方面的因素,这个工作变得更为困难:
1.暂停检测器[pause detector]必须能在低噪比(0-5dB的数量级)的状态下合格地工作。
2.暂停检测器必须对本底噪声统计的缓慢变化不灵敏。
3.暂停检测器必须精确地区分似噪声语音声音(例如,摩擦声)和本底噪声。
图4提供了一种可能的语音/暂停检测器16的实施例的方块图。
当在有限数量的信号模型之间进行转换生成含噪声语音信号时,暂停检测器模拟该含噪声语音信号。有限状态器(FSM)64支配模型之间的转换。语音/暂停判定与对当前信号的测量结果和其它适当的状态变量一起是FSM的当前状态的函数。状态之间的转换是当前FSM状态和对当前信号的测量结果的函数。
如下所述的测量值用来确定驱动信号状态状态器64的二进制值参数。通常,这些二进制值参数是通过将适当的实测量值与自适应的阀值进行比较来确定的。由测量模块60提供的信号测量结果量化成如下的信号特性:
1.能量测量判断该信号是高能的还是低能的。这个用E[i]表示的信号能量定义为 E i = log Σ k = 0 63 | G [ k ] | 2
含噪声语音发声的能量测量例子显示在图5中,其中各个语音样本的幅度由曲线70来表示,相应NS块的能量测量由曲线72来表示。
2.频谱转换测量判断该信号谱在短时间窗上是处在稳定状态还是处在暂态。这个测量是通过确定感知带谱的各个频带的经验平均值和方差来计算的。感知带谱的所有频带的方差之和用作频谱转换的测量。更具体地说,用Ti表示的转换测量计算如下:
感知带谱的每个频带的平均值是通过单极点递归滤波器Si[k]=α Si-1[k]+(1-α)Si[k]来计算的。感知带谱的每个频带的方差是通过递归滤波器 S ^ i [ k ] = a S ^ i - 1 [ k ] + ( 1 - a ) ( S i [ k ] - S ^ i [ k ] ) 2
来计算的。选择滤波参数α在相对较长的时间间隔,例如,10-12个噪声抑制块,上进行平滑。
总方差是作为每个频带的方差之和 σ i 2 = Σ k = 0 15 S i ^ [ k ] 计算出来的。请注意,当感知带谱偏离其长时间平均值并不太大时,σi 2本身的方差将是最小的。由此得出,频谱转换的合理测量是бi 2的方差,其值计算如下:
Figure 9980166100121
自适应时间常数ωi由下式给出:
通过采用时间常数,频谱转换测量适当地追踪信号处于稳定状态的那一部分。含噪声语音发声的频谱转换测量的例子显示在图6中,其中各个语音样本的幅度由曲线74来表示,相应NS块的能量测量由曲线75来表示。
3.用SSi表示的频谱相似性测量测量当前信号谱与估计噪声谱之间的相似程度。为了定义频谱相似性测量,我们假定,由Ni[k]表示的、噪声的感知带谱的对数估计值是可用的(下面结合对噪声谱估值器的讨论给出Ni[k]的定义)。然后,频谱相似性测量定义为 SS i = Σ k = 0 15 ‖ log S i [ k ] - N i [ k ] | 含噪声语音发声的频谱相似性测量的例子显示在图7中,其中各个语音样本的幅度由曲线76来表示,相应NS块的能量测量由曲线78来表示。请注意,频谱相似性测量的低值对应于高相似的频谱,而较高的频谱相似性测量值则对应于不相似频谱。
4.能量相似性测量判断当前信号能量 E i = log Σ k = 0 63 ‖ G [ k ] | 2 是否与估计的噪声能量相似。这是通过将信号能量与阈值应用模块62所施加的阈值相比较来确定的。实际阈值由阈值计算处理器66计算出来,阈值计算处理器可以由一个微处理器组成。
二进制参数通过由S[k]表示信号谱的当前估计值、由Ei表示信号能量的当前估计值、由Ni[k]表示对数噪声谱的当前估计值、由Ni表示噪声能量的当前估计值和由 N ^ i 表示噪声能量估计值的方差来确定。
参数high_Low_energy表示信号是否含有高能成分。高能是相对于本底噪声的估计能量定义的。它是通过估计当前信号帧中的能量并应用到阈值中计算出来的。其值定义如下:
high_Low_enery=1    Ei>Et
               0    Ei≤Et
这里,E是由 E i = log Σ k = 0 63 | G [ k ] | 2
定义的,Et是一个自适应阈值。
参数transition表示当信号谱正在经历转换的时候。它是通过从谱的平均值观察当前短时间谱的偏差来测量的。
从数学上,它定义为:
Transition=1    Ti>Tt
           0    Ti≤Tt
这里,T是在前一部分定义的频谱转换测量,Tt是下文将要作更详细描述的自适应计算的阈值。
参数Spectral_similarity测量当前信号谱与估计噪声谱之间的相似性。它是通过计算当前信号的对数谱与噪声的估计对数谱之间的距离来测量的。
Spectral_similarity=1    SSi<SSt
                    0    SSi≥SSt
这里,SSi如上所述,SSt是下面将要讨论的阈值(例如,一个常数)。
参数energy_similarity测量当前信号的能量与估计噪声能量之间的相似性。
energy_similarity=1  E<ESt
                  0  E≥ESt
这里,E由 E i = log Σ k = 0 63 ‖ G [ k ] ‖ 2 定义,ESt是下面将要确定的自适应计算的阈值。
如上所述的变量都是通过将一个数与一个阈值进行比较来计算的。前面三个阈值反应了动态信号的特性,它们将依赖于噪声的特性。这三个阈值是估计平均值与标准偏差的和积的和值。关于频谱相似性测量的阈值并不依赖于噪声的具体特性,可以将它设置成一个常值。
高/低能阈值是由阈值计算处理器66(图4)按照 E i = E - i - 1 + 2 E ^ i - 1 计算出来的,这里, 定义的经验方差, E1是由 E1=γ Ei-1+(1-γ)Ei定义的经验平均值。
能量相似性阈值是通过下式计算出来的:
Figure 9980166100145
请注意,在本例中,能量相似性阈值的增长率是受到因子1.05限制的。这样确保了高噪声能量不能对阈值产生不成比例的影响。
频谱转换阈值是按照Tt=2Ni来计算的。频谱相似性阈值是具有SSt=10量值的常数。
模拟含噪声语音信号的信号状态状态器更详细地显示在图8中。其状态转换是受前一部分所描述的信号测量结果支配的。信号状态是单元80所示的低能稳定状态、单元82所示的暂态和单元84所示的高能稳定状态。在低能稳定状态期间,没有频谱转换发生,信号能量在阈值以下。在暂态期间,发生了频谱转换。在高能稳定状态期间,没有频谱转换发生,信号能量在阈值之上。状态之间的转换是受上面所述的信号测量结果支配的。
状态器转换过程列在表1中。表1
转换 输入
初态→末态 转换值 高/低能
1→1 0 0
1→2 1 X
1→2 0 1
2→1 0 0
2→2 1 X
2→3 0 1
3→2 1 X
3→2 0 0
3→3 0 1
在此表中,“X”意味着“任意值”。注意,对任何测量结果都确保状态转换。
由检测器16(图1)提供的语音/暂停判定依赖于信号状态状态器的当前状态和结合图4所描述的信号测量结果。语音/暂停判定是受如下的伪码(暂停:dec=0;语音:dec=1)支配的。
Dec=1;
if spectral_similarity=1
       dec=0;
elseif durrent_state=1
    if energy_similarity=1
       dec=0
       end

  end
噪声谱是由噪声参数估计模块68(图4)在分类为暂停的帧期间利用公式Ni[k]=βNi[k]+[1-β]log(Si[k])估计出来的,这里β是在0与1之间的常数。噪声能量的当前估计值 Ni和噪声能量估计的方差Ni定义如下:
Ni=λ Ni-1[k]+(1-λ)log(Ei)1 N ^ i = λ N ^ i - 1 [ k ] + ( 1 - λ ) ( N - i - log ( E i ) ) 2 ,
这里,滤波常数λ被选择成在10-20个噪声抑制块上求平均值。
频谱增益可以通过现有技术中各种各样众所周知的方法来计算。与当前处理适合得好的一种方法包括将信噪比定义为SNR[k]=c*(log Su[k]-Ni[k]),这里,c是常数,Su[k]和Ni[k]定义如上。增益的噪声依赖成分定义为 γ N = - 10 * Σ k N [ k ] 瞬时增益是按照Gch[k]=10γx+C2(SNR[K]-6))/20来计算的。一旦瞬时增益已经计算出来,就利用单极点平滑滤波器Gs[k]=βGs[k-1]+(1-β)Gch[k]对其进行平滑,这里,向量Gs[k]是时刻t的平滑信道增益向量。
一旦目标频率响应已经计算出来,必须将它应用到含噪声语音中。这对应于修改含噪声语音信号的短时间谱的(随时间变化)滤波操作。结果是噪声得到抑制的信号。与当前的实践不同,这种频谱修改并不需要被应用在频域中。的确,频域处理可能存在如下缺点:
1.可能变得毫无必要的复杂
2.可能导致低质量的噪声抑制语音
频谱成形的时域处理具有成形滤波的脉冲响应并不需要线性相位的额外优点。此外,时域处理消除了由于循环卷积引起的赝信号的可能性。
本文所述的频谱成形技术包括用来设计与其应用一起处理噪声抑制频率响应的不太复杂滤波器的方法。这种滤波器是由AR频谱成形模块24(图1)根据AR参数计算处理器22所提供的参数来提供的。
由于所希望的频率响应对于相对少的片段是分段恒定的,如图9所示,因此,其自相关函数可以以闭合形式有效地确定下来。给定自相关系数,近似于分段恒定频率响应的全极点滤波器可以得以确定。这种方法具有几方面优点。首先,与分段恒定频率响应有关的频谱不连续性得以消除。其二,与FFT块处理有关的时间不连续性也得以消除。第三,由于成形是应用在时域中的,因此,并不需要逆DFT。给定全极点滤波器的低阶,这样可以提供定点处理上的优点。
这样的频率响应可以用数学表达式表示为 H ( ω ) = Σ i = 1 N c G s ‖ k ‖ l ( ω , ω k - 1 , ω k ) 这里,Gs[k]是平滑的信道增益,它设置第i个分段恒定片段的幅度,I(ω,ωi-1,ωi)是由频率ωi-1和ωi限定的间隔的指示函数,即,当ωi-1<ω<ωi时,I(ω,ωi-1,ωi)等于1,否则,等于0。自相关函数是H2(ω)的逆付里叶变换,即: R hh ( n ) = 2 Σ i = 1 N c ( i s 2 [ k ] sin ( γ i n ) cos ( β i n ) πn )
这里,γi=(ωii-1)和βi=(ωi-1i)/2。通过查阅有关sin(γin)cos(βin)/πn的数值表可以容易地对其进行处理。
给定上面所陈述的自相关函数,频谱的全极点模型可以通过求解正规方程来确定。所需的矩阵求逆可以通过,例如,Levinson/Durbin逆归法有效地计算出来。
利用十六阶滤波的全极点模拟的有效性的例子显示在图10中。可以看出,频谱不连续性已经得到平滑。很显然,通过提高全极点滤波器的阶数可以使模型变得更加准确。但是,十六的滤波阶数在合理的计算价格上提供了很好的性能。
为了提供频谱成形的输出信号,由AR参数计算处理器22计算的参数所提供的全极点滤波器应用到AR频谱成形模块24中的含噪声输入信号的当前块中。
现在,应该体会到本发明提供了带有各种独特特征的应用于噪声抑制的方法和设备。具体地说,本发明提供了由用来模拟输入信号的状态器组成的语音灵敏检测器。这个状态器由从输入信号得到的各种测量结果来驱动。这种结构产生了不太复杂但精度较高的语音/暂停判定。另外,噪声抑制频率响应是在频域中计算出来的但应用于时域之中。这样具有消除时域不连续性的效应,这种时域不连续性可能出现在应用于频域中的噪声抑制频率响应的“基于块”的方法之中。此外,利用确定噪声抑制频率响应的自相关函数的新颖方法设计噪声抑制滤波器。然后,这种自相关序列用来生成全极点滤波器。在一些情况下,这种全极点滤波器对实现频域方法是不太复杂的。
尽管通过结合本发明的具体实施例已经对本发明进行了说明,但应该明白,对其所作的各种修改和变动均不偏离权利要求书所述的本发明的范围。

Claims (14)

1.一种用来抑制在携带噪声和语音组合的输入信号中的噪声的方法,包括下列步骤:
将所述输入信号划分成若干信号块;
处理所述信号块以提供所述输入信号的短时间感知带谱的估计值;
在不同的时间点上判断所述输入信号只携带噪声还是语音和噪声的组合,和当输入信号只携带噪声时,利用输入信号的相应估计的短时间感知带谱修正噪声的长时间感知带谱的估计值;
根据所述噪声的长时间感知带谱的估计值和输入信号的估计短时间感知带谱确定噪声抑制频率响应;和
根据所述噪声抑制频率响应成形输入信号的当前块。
2.如权利要求1所述的方法,进一步包括下面步骤:
在所述处理步骤之前预滤波所述输入信号以加强其中的高频成分。
3.如权利要求2所述的方法,其中所述处理步骤包括下列步骤:
将离散付里叶变换应用到信号块中以提供每块的频域复值表示;
将信号块的频域表示转换成只有幅度的信号;
在穿过几个分离的频带上对只有幅度的信号求平均以提供所述长时间感知带谱估计值;和
平滑感知带谱中的时间变化以提供所述短时间感知带谱估计值。
4.如权利要求3所述的方法,其中所述噪声抑制频率响应是在所述成形步骤中利用全极点滤波器进行模拟的。
5.如权利要求1所述的方法,其中所述噪声抑制频率响应是在所述成形步骤中利用全极点滤波器进行模拟的。
6.如权利要求1所述的方法,其中所述处理步骤包括下列步骤:
将离散付里叶变换应用到信号块中以提供每块的频域复值表示;
将信号块的频域表示转换成只有幅度的信号;
在穿过几个分离的频带上对只有幅度的信号求平均以提供所述长时间感知带谱估计值;和
平滑感知带谱中的时间变化以提供所述短时间感知带谱估计值。
7.一种用来抑制在携带噪声和语音的组合的输入信号中的噪声的设备,包栝:
信号预处理器,用来将所述输入信号划分成若干块;
快速付里叶变换处理器,用来处理所述的块以提供所述输入信号的频域复值谱;
累加器,用来将所述频域复值谱累加成由不等宽频带组成的长时间感知带谱;
滤波器,用来滤波长时间感知带谱以生成由所述长时间感知带谱的当前片段加噪声组成的短时间感知带谱的估计值;
语音/暂停检测器,用来判断所述输入信号只是当前噪声,还是语音和噪声的组合;
噪声谱估值器,用来当输入信号只是噪声时,响应所述语音/暂停检测电路,根据输入信号的短时间感性带谱修正噪声的长时间感知带谱的估计值;
频谱增益处理器,用来响应所述噪声谱估值器确定噪声抑制频率响应;和
频谱成形处理器,用来响应所述频谱增益处理器成形输入信号的当前块来抑制其中的噪声。
8.如权利要求7所述的设备,其中所述频谱成形处理器包括全极点滤波器。
9.如权利要求8所述的设备,其中所述信号预处理器预滤波所述输入信号以加强其中的高频成分。
10.如权利要求7所述的设备,其中所述信号预处理器预滤波所述输入信号以加强其中的高频成分。
11.一种用来抑制在携带噪声和音频信息的组合的输入信号中的噪声的方法,包括下列步骤:
在频域中对所述输入信号计算噪声抑制频率响应;和
将所述噪声抑制频率响应应用到时域中的所述输入信号中以抑制输入信号中的噪声。
12.如权利要求1所述的方法,进一步包括在计算所述输入信号的噪声抑制频率响应之前将所述输入信号划分成若干块的步骤。
13.如权利要求12所述的方法,其中所述噪声抑制频率响应是通过由确定噪声抑制频率响应的自相关函数所产生的全极点滤波器应用到所述输入信号中的。
14.如权利要求11所述的方法,其中所述噪声抑制频率响应是通过由确定噪声抑制频率响应的自相关函数所产生的全极点滤波器应用到所述输入信号中的。
CN99801661A 1998-09-23 1999-09-22 关于低比特率语音编码器的噪声抑制 Pending CN1286788A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/159,358 1998-09-23
US09/159,358 US6122610A (en) 1998-09-23 1998-09-23 Noise suppression for low bitrate speech coder

Publications (1)

Publication Number Publication Date
CN1286788A true CN1286788A (zh) 2001-03-07

Family

ID=22572262

Family Applications (2)

Application Number Title Priority Date Filing Date
CN99813506A Pending CN1326584A (zh) 1998-09-23 1999-09-15 低比特率语音编码器的噪声抑制
CN99801661A Pending CN1286788A (zh) 1998-09-23 1999-09-22 关于低比特率语音编码器的噪声抑制

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN99813506A Pending CN1326584A (zh) 1998-09-23 1999-09-15 低比特率语音编码器的噪声抑制

Country Status (10)

Country Link
US (1) US6122610A (zh)
EP (1) EP1116224A4 (zh)
JP (1) JP2003517624A (zh)
KR (2) KR20010075343A (zh)
CN (2) CN1326584A (zh)
AU (2) AU6037899A (zh)
BR (1) BR9913011A (zh)
CA (2) CA2344695A1 (zh)
IL (1) IL136090A0 (zh)
WO (2) WO2000017859A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101223574B (zh) * 2005-12-08 2011-06-29 韩国电子通信研究院 使用话带信号的语音识别装置和方法
CN106068535A (zh) * 2014-03-17 2016-11-02 皇家飞利浦有限公司 噪声抑制
CN115173971A (zh) * 2022-07-08 2022-10-11 电信科学技术第五研究所有限公司 一种基于频谱数据的宽带信号实时检测方法

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
KR100281181B1 (ko) * 1998-10-16 2001-02-01 윤종용 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법
US7177805B1 (en) * 1999-02-01 2007-02-13 Texas Instruments Incorporated Simplified noise suppression circuit
US6397177B1 (en) * 1999-03-10 2002-05-28 Samsung Electronics, Co., Ltd. Speech-encoding rate decision apparatus and method in a variable rate
US6507623B1 (en) * 1999-04-12 2003-01-14 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by time-domain spectral subtraction
US6351729B1 (en) * 1999-07-12 2002-02-26 Lucent Technologies Inc. Multiple-window method for obtaining improved spectrograms of signals
US6980950B1 (en) * 1999-10-22 2005-12-27 Texas Instruments Incorporated Automatic utterance detector with high noise immunity
JP3878482B2 (ja) * 1999-11-24 2007-02-07 富士通株式会社 音声検出装置および音声検出方法
US6473733B1 (en) * 1999-12-01 2002-10-29 Research In Motion Limited Signal enhancement for voice coding
JP2001166782A (ja) * 1999-12-07 2001-06-22 Nec Corp 報知信号発生方法及び装置
US6317456B1 (en) * 2000-01-10 2001-11-13 The Lucent Technologies Inc. Methods of estimating signal-to-noise ratios
US9609278B2 (en) 2000-04-07 2017-03-28 Koplar Interactive Systems International, Llc Method and system for auxiliary data detection and delivery
DE10017646A1 (de) * 2000-04-08 2001-10-11 Alcatel Sa Geräuschunterdrückung im Zeitbereich
US6463408B1 (en) * 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
US7617099B2 (en) * 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
EP1244094A1 (de) * 2001-03-20 2002-09-25 Swissqual AG Verfahren und Vorrichtung zur Bestimmung eines Qualitätsmasses eines Audiosignals
KR20020082643A (ko) * 2001-04-25 2002-10-31 주식회사 호서텔넷 고속 푸우리에 변환(fft) 및 역고속 푸우리에변환(ifft)을 이용한 송,수신기의 동기검출장치
WO2003001173A1 (en) * 2001-06-22 2003-01-03 Rti Tech Pte Ltd A noise-stripping device
US6952482B2 (en) * 2001-10-02 2005-10-04 Siemens Corporation Research, Inc. Method and apparatus for noise filtering
KR100434723B1 (ko) * 2001-12-24 2004-06-07 주식회사 케이티 음성 신호특성을 이용한 돌발잡음 제거장치 및 그 방법
US8718687B2 (en) * 2002-03-26 2014-05-06 Zoove Corp. System and method for mediating service invocation from a communication device
US8326621B2 (en) * 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7593851B2 (en) * 2003-03-21 2009-09-22 Intel Corporation Precision piecewise polynomial approximation for Ephraim-Malah filter
US7330511B2 (en) 2003-08-18 2008-02-12 Koplar Interactive Systems International, L.L.C. Method and system for embedding device positional data in video signals
US7224810B2 (en) * 2003-09-12 2007-05-29 Spatializer Audio Laboratories, Inc. Noise reduction system
US9055239B2 (en) 2003-10-08 2015-06-09 Verance Corporation Signal continuity assessment using embedded watermarks
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
KR100657912B1 (ko) * 2004-11-18 2006-12-14 삼성전자주식회사 잡음 제거 방법 및 장치
US7983720B2 (en) * 2004-12-22 2011-07-19 Broadcom Corporation Wireless telephone with adaptive microphone array
US20070116300A1 (en) * 2004-12-22 2007-05-24 Broadcom Corporation Channel decoding for wireless telephones with multiple microphones and multiple description transmission
US8509703B2 (en) * 2004-12-22 2013-08-13 Broadcom Corporation Wireless telephone with multiple microphones and multiple description transmission
US20060133621A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US20060147063A1 (en) * 2004-12-22 2006-07-06 Broadcom Corporation Echo cancellation in telephones with multiple microphones
KR100784456B1 (ko) * 2005-12-08 2007-12-11 한국전자통신연구원 Gmm을 이용한 음질향상 시스템
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
US20090111584A1 (en) 2007-10-31 2009-04-30 Koplar Interactive Systems International, L.L.C. Method and system for encoded information processing
US8296136B2 (en) * 2007-11-15 2012-10-23 Qnx Software Systems Limited Dynamic controller for improving speech intelligibility
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
US8582781B2 (en) 2009-01-20 2013-11-12 Koplar Interactive Systems International, L.L.C. Echo modulation methods and systems
US8715083B2 (en) 2009-06-18 2014-05-06 Koplar Interactive Systems International, L.L.C. Methods and systems for processing gaming data
USRE48462E1 (en) * 2009-07-29 2021-03-09 Northwestern University Systems, methods, and apparatus for equalization preference learning
CN102044241B (zh) 2009-10-15 2012-04-04 华为技术有限公司 一种实现通信系统中背景噪声的跟踪的方法和装置
US20110125497A1 (en) * 2009-11-20 2011-05-26 Takahiro Unno Method and System for Voice Activity Detection
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
JP6059003B2 (ja) * 2012-12-26 2017-01-11 パナソニック株式会社 歪み補償装置及び歪み補償方法
WO2014153199A1 (en) 2013-03-14 2014-09-25 Verance Corporation Transactional video marking system
US9485089B2 (en) 2013-06-20 2016-11-01 Verance Corporation Stego key management
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
WO2015138798A1 (en) 2014-03-13 2015-09-17 Verance Corporation Interactive content acquisition using embedded codes
US10504200B2 (en) 2014-03-13 2019-12-10 Verance Corporation Metadata acquisition using embedded watermarks
US9639911B2 (en) 2014-08-20 2017-05-02 Verance Corporation Watermark detection using a multiplicity of predicted patterns
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
US9942602B2 (en) 2014-11-25 2018-04-10 Verance Corporation Watermark detection and metadata delivery associated with a primary content
WO2016086047A1 (en) 2014-11-25 2016-06-02 Verance Corporation Enhanced metadata and content delivery using watermarks
WO2016100916A1 (en) 2014-12-18 2016-06-23 Verance Corporation Service signaling recovery for multimedia content using embedded watermarks
US10257567B2 (en) 2015-04-30 2019-04-09 Verance Corporation Watermark based content recognition improvements
US10477285B2 (en) 2015-07-20 2019-11-12 Verance Corporation Watermark-based data recovery for content with multiple alternative components
US20190132652A1 (en) 2016-04-18 2019-05-02 Verance Corporation System and method for signaling security and database population
WO2018237191A1 (en) 2017-06-21 2018-12-27 Verance Corporation ACQUISITION AND TREATMENT OF METADATA BASED ON A WATERMARK
US11468149B2 (en) 2018-04-17 2022-10-11 Verance Corporation Device authentication in collaborative content screening
CN112562701B (zh) * 2020-11-16 2023-03-28 华南理工大学 心音信号双通道自适应降噪算法、装置、介质及设备
US11722741B2 (en) 2021-02-08 2023-08-08 Verance Corporation System and method for tracking content timeline in the presence of playback rate changes

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4658426A (en) * 1985-10-10 1987-04-14 Harold Antin Adaptive noise suppressor
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
US5450522A (en) * 1991-08-19 1995-09-12 U S West Advanced Technologies, Inc. Auditory model for parametrization of speech
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
JP3626492B2 (ja) * 1993-07-07 2005-03-09 ポリコム・インコーポレイテッド 会話の品質向上のための背景雑音の低減
IT1272653B (it) * 1993-09-20 1997-06-26 Alcatel Italia Metodo di riduzione del rumore, in particolare per riconoscimento automatico del parlato, e filtro atto ad implementare lo stesso
CA2153170C (en) * 1993-11-30 2000-12-19 At&T Corp. Transmitted noise reduction in communications systems
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
FR2726392B1 (fr) * 1994-10-28 1997-01-10 Alcatel Mobile Comm France Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101223574B (zh) * 2005-12-08 2011-06-29 韩国电子通信研究院 使用话带信号的语音识别装置和方法
CN106068535A (zh) * 2014-03-17 2016-11-02 皇家飞利浦有限公司 噪声抑制
CN106068535B (zh) * 2014-03-17 2019-11-05 皇家飞利浦有限公司 噪声抑制
CN115173971A (zh) * 2022-07-08 2022-10-11 电信科学技术第五研究所有限公司 一种基于频谱数据的宽带信号实时检测方法
CN115173971B (zh) * 2022-07-08 2023-10-03 电信科学技术第五研究所有限公司 一种基于频谱数据的宽带信号实时检测方法

Also Published As

Publication number Publication date
WO2000017855A1 (en) 2000-03-30
AU6037899A (en) 2000-04-10
KR20010075343A (ko) 2001-08-09
IL136090A0 (en) 2001-05-20
KR100330230B1 (ko) 2002-05-09
AU6007999A (en) 2000-04-10
KR20010032390A (ko) 2001-04-16
EP1116224A4 (en) 2003-06-25
US6122610A (en) 2000-09-19
CN1326584A (zh) 2001-12-12
WO2000017859A8 (en) 2000-07-20
CA2310491A1 (en) 2000-03-30
JP2003517624A (ja) 2003-05-27
WO2000017859A1 (en) 2000-03-30
EP1116224A1 (en) 2001-07-18
CA2344695A1 (en) 2000-03-30
BR9913011A (pt) 2001-03-27

Similar Documents

Publication Publication Date Title
CN1286788A (zh) 关于低比特率语音编码器的噪声抑制
US11694711B2 (en) Post-processing gains for signal enhancement
US8989403B2 (en) Noise suppression device
US6453289B1 (en) Method of noise reduction for speech codecs
US6415253B1 (en) Method and apparatus for enhancing noise-corrupted speech
US20040078199A1 (en) Method for auditory based noise reduction and an apparatus for auditory based noise reduction
EP1973104B1 (en) Method and apparatus for estimating noise by using harmonics of a voice signal
US20130191118A1 (en) Noise suppressing device, noise suppressing method, and program
US9094078B2 (en) Method and apparatus for removing noise from input signal in noisy environment
JP5881791B2 (ja) 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置
CN113724725B (zh) 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备
KR20010040669A (ko) 잡음 보상되는 음성 인식 시스템 및 방법
KR20110044990A (ko) 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법
KR102012325B1 (ko) 오디오 신호의 배경 잡음 추정
WO2008121436A1 (en) Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
JPWO2006006366A1 (ja) ピッチ周波数推定装置およびピッチ周波数推定方法
US10354659B2 (en) Frame loss compensation processing method and apparatus
JP2004519737A (ja) 音声強化デバイス
US7233894B2 (en) Low-frequency band noise detection
Grancharov et al. Noise-dependent postfiltering
CN1276896A (zh) 数字语音信号的去噪声方法
CN113593604A (zh) 检测音频质量方法、装置及存储介质
Wei et al. A new algorithm for voice activity detection
Shi et al. Experimental study on noise pre-processing for a low bit rate speech coder
Huang et al. A method of speech periodicity enhancement based on transform-domain signal decomposition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication