CN101903948B

CN101903948B - 用于基于多麦克风的语音增强的系统、方法及设备

Info

Publication number: CN101903948B
Application number: CN200880121535.7A
Authority: CN
Inventors: 詹国梁; 杰里米·托曼; 埃里克·维瑟; 朴雄靖
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2007-12-19
Filing date: 2008-12-18
Publication date: 2013-11-06
Anticipated expiration: 2028-12-18
Also published as: JP5479364B2; US20090164212A1; WO2009086017A1; KR20100105700A; EP2229678A1; CN101903948A; US8175291B2; KR101172180B1; TW200939210A; JP2011508533A

Abstract

本发明描述用于处理M通道输入信号的系统、方法及设备，其包括输出由多个空间分离滤波器中的选定一者所产生的信号。本发明描述用以从有噪声环境中分离出声学信号的应用，且本发明还描述可实施于多麦克风手持式装置上的配置。

Description

用于基于多麦克风的语音增强的系统、方法及设备

根据35U.S.C.§119主张优先权

本专利申请案主张以下临时申请案的优先权：2007年12月19日申请的题为“用于手持机中的基于多麦克风的语音增强的系统及方法(SYSTEM AND METHOD FORMULTI-MICROPHONE BASED SPEECH ENHANCEMENT IN HANDSETS”的第61/015,084号临时申请案；2007年12月26日申请的题为“用于手持机中的基于多麦克风的语音增强的系统及方法(SYSTEM AND METHOD FOR MULTI-MICROPHONEBASED SPEECH ENHANCEMENT IN HANDSETS)”的第61/016,792号临时申请案；2008年6月30日申请的题为“用于手持机中的基于多麦克风的语音增强的系统及方法(SYSTEM AND METHOD FOR MULTI-MICROPHONE BASED SPEECHENHANCEMENT IN HANDSETS)”的第61/077,147号临时申请案；及2008年7月9日申请的题为“用于基于多麦克风的语音增强的系统、方法及设备(SYSTEMS，METHODS，AND APPARATUS FOR MULTI-MICROPHONE BASED SPEECHENHANCEMENT)”的第61/079,359号临时申请案，所述申请案均转让给本受让人。

技术领域

本发明涉及语音处理。

背景技术

可能在不可避免地为有噪声的环境中俘获信息信号。因此，可能需要从包括来自所要信息源的信号及来自一个或一个以上干扰源的信号的若干源信号的叠加及线性组合当中区分信息信号。此问题可能出现于用于话音通信(例如，电话)的各种声学应用中。

一种用以从此混合物中分离出信号的方法是以公式表示近似混合环境的逆环境的非混合矩阵。然而，实际俘获环境通常包括例如时间延迟、多路径、反射、相位差、回声及/或混响等效应。这些效应产生源信号的卷积混合物，其可能引起传统线性模型化方法所具有的问题且还可为频率相依的。需要开发出用于从所述混合物中分离出一个或一个以上所要信号的信号处理方法。

一人可能需要使用话音通信信道来与另一人通信。所述信道可(例如)由移动无线手持机或头戴式耳机、步话机、双向无线电、汽车套件或其它通信装置提供。当人讲话时，通信装置上的麦克风接收人的话音的声音且将其转换为电子信号。麦克风还可能从各种噪声源接收声音信号，且因此，电子信号还可能包括噪声分量。由于麦克风可能位于距人的嘴的某距离处，且环境可能具有许多不可控制的噪声源，所以噪声分量可能为信号的实质分量。此实质噪声可能引起令人不满意的通信体验及/或可能致使通信装置以低效方式操作。

声学环境通常为有噪声的，从而使得难以可靠地检测所要信息信号且对所要信息信号做出反应。在一个特定实例中，语音信号在有噪声环境中产生，且语音处理方法用以分离语音信号与环境噪声。此语音信号处理在日常通信的许多领域中为重要的，因为噪声在真实世界条件下几乎一直存在。噪声可经定义为干扰所关注语音信号或使所关注语音信号降级的所有信号的组合。真实世界充满了包括单点噪声源在内的多个噪声源，所述多个噪声源通常侵入多个声音，从而导致混响。除非将所要语音信号与背景噪声分离及隔离，否则可能难以可靠且有效地使用所要语音信号。背景噪声可包括由一般环境所产生的众多噪声信号及由其他人的背景谈话所产生的信号，以及从所述信号中的每一者所产生的反射及混响。对于通信发生于有噪声环境中的应用来说，可能需要分离所要语音信号与背景噪声。

用于分离所要声音信号与背景噪声信号的现有方法包括简单滤波过程。虽然这些方法对于声音信号的实时处理可能为足够简单且快速的，但其不能容易地适于不同声音环境且可导致所要语音信号的实质降级。举例来说，过程可能根据包含过度的噪声特性的预定假设集合而移除分量，使得将所要语音信号的部分分类为噪声且将其移除。或者，过程可能根据包含过少的噪声特性的预定假设集合而移除分量，使得将背景噪声的部分(例如，音乐或谈话)分类为所要信号且将其保留于经滤波输出语音信号中。

如PDA及蜂窝式电话等手持机正作为精选的移动语音通信装置而快速地出现，从而充当用于对蜂窝式及因特网网络的移动接入的平台。先前在安静办公室或家庭环境中的桌上型计算机、膝上型计算机及办公室电话上所执行的越来越多的功能正在如汽车、街道或咖啡厅等日常情形中得以执行。此趋势意味着实质量的话音通信正发生于用户由其他人包围的环境中，所述环境具有在人倾向于聚集的情况下通常所遭遇的噪声内容种类。此噪声种类(包括例如竞争谈话者、音乐、串音、机场噪声)的特征通常为非静止的且靠近于用户自身的频率特征，且因此，此噪声可能难以使用传统单重麦克风或固定波束成形类型方法来模型化。此噪声还倾向于在电话谈话中使用户分心或烦恼。此外，许多标准自动化商业交易(例如，账户结余或股票报价核查)使用基于话音辨识的数据查询，且这些系统的精确度可能受到干扰噪声显著地妨碍。因此，可能需要基于多麦克风的高级信号处理(例如)以支持有噪声环境中的手持机使用。

发明内容

根据通用配置，一种处理包括语音分量及噪声分量的M通道输入信号(M为大于一的整数)以产生经空间滤波输出信号的方法包括：将第一空间处理滤波器应用于输入信号；及将第二空间处理滤波器应用于输入信号。此方法包括：在第一时间处，确定第一空间处理滤波器开始优于第二空间处理滤波器而分离语音与噪声分量；及响应于在第一时间处的所述确定，产生基于第一经空间处理信号的信号作为输出信号。此方法包括：在第一时间之后的第二时间处，确定第二空间处理滤波器开始优于第一空间处理滤波器而分离语音与噪声分量；及响应于在第二时间处的所述确定，产生基于第二经空间处理信号的信号作为输出信号。在此方法中，第一及第二经空间处理信号是基于输入信号。

还描述此方法的实例。在一个此类实例中，一种处理包括语音分量及噪声分量的M通道输入信号(M为大于一的整数)以产生经空间滤波输出信号的方法包括：将第一空间处理滤波器应用于输入信号以产生第一经空间处理信号；及将第二空间处理滤波器应用于输入信号以产生第二经空间处理信号。此方法包括：在第一时间处，确定第一空间处理滤波器开始优于第二空间处理滤波器而分离语音与噪声分量；及响应于在第一时间处的所述确定，产生第一经空间处理信号作为输出信号。此方法包括：在第一时间之后的第二时间处，确定第二空间处理滤波器开始优于第一空间处理滤波器而分离语音与噪声分量；及响应于在第二时间处的所述确定，产生第二经空间处理信号作为输出信号。

根据另一通用配置，一种用于处理包括语音分量及噪声分量的M通道输入信号(M为大于一的整数)以产生经空间滤波输出信号的设备包括：用于对输入信号执行第一空间处理操作的装置；及用于对输入信号执行第二空间处理操作的装置。所述设备包括：用于在第一时间处确定用于执行第一空间处理操作的装置开始优于用于执行第二空间处理操作的装置而分离语音与噪声分量的装置；及用于响应于来自所述用于在第一时间处确定的装置的指示而产生基于第一经空间处理信号的信号作为输出信号的装置。所述设备包括：用于在第一时间之后的第二时间处确定用于执行第二空间处理操作的装置开始优于用于执行第一空间处理操作的装置而分离语音与噪声分量的装置；及用于响应于来自所述用于在第二时间处确定的装置的指示而产生基于第二经空间处理信号的信号作为输出信号的装置。在此设备中，第一及第二经空间处理信号是基于输入信号。

根据另一通用配置，一种用于处理包括语音分量及噪声分量的M通道输入信号(M为大于一的整数)以产生经空间滤波输出信号的设备包括：第一空间处理滤波器，其经配置以对输入信号进行滤波；及第二空间处理滤波器，其经配置以对输入信号进行滤波。所述设备包括状态估计器，其经配置以在第一时间处指示第一空间处理滤波器开始优于第二空间处理滤波器而分离语音与噪声分量。所述设备包括转变控制模块，其经配置以响应于在第一时间处的指示而产生基于第一经空间处理信号的信号作为输出信号。在此设备中，状态估计器经配置以在第一时间之后的第二时间处指示第二空间处理滤波器开始优于第一空间处理滤波器而分离语音与噪声分量，且转变控制模块经配置以响应于在第二时间处的指示而产生基于第二经空间处理信号的信号作为输出信号。在此设备中，第一及第二经空间处理信号是基于输入信号。

根据另一通用配置，一种包含指令(所述指令在由处理器执行时致使处理器执行处理包括语音分量及噪声分量的M通道输入信号(M为大于一的整数)以产生经空间滤波输出信号的方法)的计算机可读媒体包括：在由处理器执行时致使处理器对输入信号执行第一空间处理操作的指令；及在由处理器执行时致使处理器对输入信号执行第二空间处理操作的指令。所述媒体包括：在由处理器执行时致使处理器在第一时间处指示第一空间处理操作开始优于第二空间处理操作而分离语音与噪声分量的指令；及在由处理器执行时致使处理器响应于在第一时间处的所述指示而产生基于第一经空间处理信号的信号作为输出信号的指令。所述媒体包括：在由处理器执行时致使处理器在第一时间之后的第二时间处指示第二空间处理操作开始优于第一空间处理操作而分离语音与噪声分量的指令；及在由处理器执行时致使处理器响应于在第二时间处的所述指示而产生基于第二经空间处理信号的信号作为输出信号的指令。在此实例中，第一及第二经空间处理信号是基于输入信号。

附图说明

图1A说明包括设备A100的实施方案的手持机H100的操作配置。

图1B说明手持机H100的另一操作配置。

图2展示手持机H100的可能定向范围。

图3A及图3B说明用于如图1A所示的手持机H100的操作配置的两个不同操作定向。

图4A及图4B说明用于如图1B所示的手持机H100的操作配置的两个不同操作定向。

图5说明对应于手持机H100的三个不同定向状态的区域。

图6A到图6C展示手持机H100的源原点区域的额外实例。

图7A说明手持机H100的实施方案H110。

图7B展示手持机H110的两个额外视图。

图8展示根据通用配置的设备A200的框图。

图9展示头戴式耳机63的两个不同定向状态。

图10展示设备A200的两通道实施方案A210的框图。

图11展示包括滤波器组120的两通道实施方案130的设备A210的实施方案A220的框图。

图12展示切换机构350的实施方案352的框图。

图13展示切换机构352及360的实施方案362的框图。

图14A到图14D分别展示状态估计器400的四个不同实施方案402、404、406及408。

图15展示设备A220的实施方案A222的框图。

图16展示状态估计器412的实施方案414的实例。

图17展示设备A210的实施方案A214的框图。

图18展示设备A222的实施方案A224的框图。

图19展示设备A210的实施方案A216的框图。

图20展示转变控制模块500的实施方案520的框图。

图21展示转变控制模块500的实施方案550的框图。

图22展示混频器70a到70m中的第j者的实施方案72j的框图。

图23展示混频器组700的两通道实施方案710的框图。

图24展示设备A210的实施方案A218的框图。

图25展示设备A220的实施方案A228的框图。

图26展示设备A228的实施方案A229的框图。

图27展示设备A210的实施方案A210A的框图。

图28展示设备A220的实施方案A224A的框图。

图29展示设备A220的实施方案A232的框图。

图30展示设备A220的实施方案A234的框图。

图31展示设备A220的实施方案A236的框图。

图32A及图32B展示指示符函数值到经估计状态S50的两个不同映射。

图33A到图33C分别展示设备A200的实施方案A310、A320及A330的框图。

图34说明衰减方案的一个实例。

图35A展示设备A210的实施方案A210B的框图。

图35B展示回声消除器EC10的实施方案EC12的框图。

图35C展示回声消除器EC20的实施方案EC22的框图。

图36展示设计及使用程序的流程图。

图37展示方法M10的流程图。

图38展示经配置以用于记录训练数据的声学无回声腔室的实例。

图39展示免持汽车套件83的实例。

图40展示图37的汽车套件的应用的实例。

图41展示具有线性麦克风阵列的写入仪器(例如，笔)或铁笔79的实例。

图42展示在设计阶段期间放置于两点源噪声场中的手持机。

图43A展示包括一对反馈滤波器C110及C120的自适应滤波器结构FS10的框图。

图43B展示包括直接滤波器D110及D120的滤波器结构FS10的实施方案FS20的框图。

图44展示根据通用配置的设备A100的框图。

图45展示设备A100的实施方案A110的框图。

图46展示设备A100的实施方案A120的框图。

图47展示方法M100的流程图。

图48展示设备F100的框图。

图49展示包括设备A100或A200的实施方案的通信装置C100的框图。

具体实施方式

本发明涉及用于从有噪声环境中分离出声学信号的系统、方法及设备。这些配置可包括从声学信号的混合物中分离出声学信号。可通过使用固定滤波级(即，具有以固定系数值进行配置的滤波器的处理级)来执行分离操作以从声学信号的输入混合物内隔离所要分量。还描述可实施于多麦克风手持式通信装置上的配置。此配置可适合于处理由通信装置所遭遇的可能包含干扰源、声学回声及/或空间分布背景噪声的噪声环境。

本发明还描述用于通过使用一个或一个以上盲源分离(BSS)、波束成形及/或经组合BSS/波束成形方法来处理使用通信装置的麦克风阵列记录的训练数据而产生滤波器系数值集合(或多个滤波器系数值集合)的系统、方法及设备。训练数据可基于相对于阵列的多种用户及噪声源位置以及声学回声(例如，来自通信装置的一个或一个以上扩音器)。所述麦克风阵列或具有相同配置的另一麦克风阵列可接着用以获得将如上文所提及进行分离的声学信号的输入混合物。

本发明还描述其中将所产生滤波器系数值集合提供到固定滤波级(或“滤波器组”)的系统、方法及设备。此配置可包括切换操作，所述切换操作基于通信装置相对于用户的当前所识别定向而在固定滤波级内的所产生滤波器系数值集合当中(且可能在用于后续处理级的其它参数集合当中)进行选择。

本发明还描述其中使用自适应(或部分自适应)BSS、波束成形或经组合BSS/波束成形滤波级来对基于如上文所描述的固定滤波级的输出的经空间处理(或“分离”)信号进行滤波以产生另一经分离信号的系统、方法及设备。这些经分离信号中的每一者可包括一个以上输出通道，使得输出通道中的至少一者含有所要信号与分布背景噪声，且至少一个其它输出通道含有干扰源信号与分布背景噪声。本发明还描述包括后处理级(例如，降噪滤波器)的系统、方法及设备，所述后处理级基于由另一输出通道所提供的噪声参考而降低携载所要信号的输出通道中的噪声。

本发明还描述可经实施以包括以下各项的配置：参数的调谐、初始条件及滤波器集合的选择、回声消除及/或通过切换操作而进行的在一个或一个以上分离或降噪级的固定滤波器系数值集合之间的转变处置。系统参数的调谐可依据基带芯片或芯片组的本质与设定及/或网络效应而定，以优化总降噪及回声消除性能。

除非受到上下文明确地限制，否则术语“信号”在本文中用以指示其普通意义中的任一者，包括在导线、总线或其它传输媒体上所表达的存储器位置(或存储器位置集合)的状态。除非受到上下文明确地限制，否则术语“产生”在本文中用以指示其普通意义中的任一者，例如计算或以其它方式生成。除非受到上下文明确地限制，否则术语“计算”在本文中用以指示其普通意义中的任一者，例如核算、评估及/或从值集合中进行选择。除非受到上下文明确地限制，否则术语“获得”用以指示其普通意义中的任一者，例如计算、导出、接收(例如，从外部装置)及/或检索(例如，从存储元件阵列)。在术语“包含”用于本描述及权利要求书中的情况下，其并不排除其它元件或操作。术语“基于”(如在“A基于B”中)用以指示其普通意义中的任一者，包括以下情况：(i)“至少基于”(例如，“A至少基于B”)；及如果在特定上下文中为适当的，(ii)“等于”(例如，“A等于B”)。类似地，术语“响应于”用以指示其普通意义中的任一者，包括“至少响应于”。

除非另有指示，否则具有特定特征的设备的操作的任何揭示还明确地既定揭示具有类似特征的方法(且反之亦然)，且根据特定配置的设备的操作的任何揭示还明确地既定揭示根据类似配置的方法(且反之亦然)。如由特定上下文所指示，可根据方法、设备或系统来使用术语“配置”。除非由特定上下文另外指示，否则一般地且互换地使用术语“方法”、“过程”、“程序”及“技术”。除非由特定上下文另外指示，否则也一般地且互换地使用术语“设备”及“装置”。术语“元件”及“模块”通常用以指示较大配置的一部分。文献的一部分以引用方式的任何并入还应被理解为并入有在所述部分内所参考的术语或变量的定义(其中这些定义显现于所述文献的其它地方)以及在所并入部分中所参考的任何图式。

可能需要产生具有两个或两个以上麦克风的用于便携式话音通信的装置。由多个麦克风所俘获的信号可用以支持空间处理操作，空间处理操作又可用以提供增加的感知质量，例如较大噪声抑制。此装置的实例包括电话手持机(例如，蜂窝式电话手持机)及有线或无线头戴式耳机(例如，蓝牙头戴式耳机)。

图1A展示处于第一操作配置的两麦克风手持机H100(例如，翻盖型蜂窝式电话手持机)。手持机H100包括主要麦克风MC10及次要麦克风MC20。在此实例中，手持机H100还包括主要扬声器SP10及次要扬声器SP20。

当手持机H100处于第一操作配置时，主要扬声器SP10为活动的，且次要扬声器SP20可被停用或以另外方式消音。可能需要使主要麦克风MC10及次要麦克风MC20在此配置中均保持为活动以支持用于语音增强及/或降噪的空间处理技术。图2展示在用于此操作配置的可能定向范围内的两个可能定向。在此定向范围内，手持机H100固持到用户的头部，使得主要扬声器SP10靠近于用户的耳朵，且主要麦克风MC10接近用户的嘴。如图2所示，主要麦克风MC10与用户的嘴之间的距离可变化。图2还说明可能的干扰声音信号，例如可由主要扬声器SP10响应于远端信号而产生的回声及可为指向及/或漫射的噪声。图3A及图3B展示其中用户可使用手持机H100的此操作配置的两个其它可能定向(例如，处于扬声器电话或即按即说模式)。当扬声器电话或即按即说模式在手持机H100的此操作配置中为活动时，可能需要使次要扬声器SP20为活动且可能使主要扬声器SP10停用或以另外方式消音。

图1B展示手持机H100的第二操作配置。在此配置中，主要麦克风MC10被关闭，次要扬声器SP20为活动，且主要扬声器SP10可被停用或以另外方式消音。再次，可能需要使主要麦克风MC10及次要麦克风MC20两者在此配置中均保持为活动(例如，以支持空间处理技术)。图4A及图4B展示其中用户可使用手持机H100的此操作配置的两个不同可能操作定向。手持机H100可包括一个或一个以上开关，所述一个或一个以上开关的状态指示装置的当前操作配置。

如以上各图所示，蜂窝式电话手持机可支持多种不同可能位置使用，每一位置使用与装置的麦克风与用户的嘴之间的不同空间关系相关联。举例来说，可能需要使手持机 H100支持例如全双工扬声器电话模式及/或半双工即按即说(PTT)模式等特征，可能预期所述模式涉及比如图2所示的常规电话操作模式广泛的位置改变范围。响应于这些位置改变而调适空间处理滤波器的问题可能过于复杂而不能实时地获得滤波器收敛。此外，充分地分离可随时间从若干不同方向到达的语音与噪声信号的问题可能过于复杂而不能由单一空间处理滤波器解决。可能需要使此手持机包括具有一个以上空间处理滤波器的滤波器组。在此情况下，可能需要使手持机根据装置相对于所要声音源(例如，用户的嘴)的当前定向而从此组中选择空间处理滤波器。

图5说明对应于手持机H100相对于所要声音源(例如，用户的嘴)的三个不同定向状态的区域。当手持机相对于所要源而定向以使得所要声音(例如，用户的话音)从区域A1中的方向到达时，可能需要使手持机使用指向于区域A1且倾向于衰减来自其它方向的声音的滤波器。同样地，当手持机相对于所要源而定向以使得所要声音从区域A2中的方向到达时，可能需要使手持机使用指向于区域A2且倾向于衰减来自其它方向的声音的不同滤波器。当手持机相对于所要源而定向以使得所要声音从区域A3中的方向到达时，可能需要使手持机不使用最初两个滤波器中的任一者。举例来说，在此情况下，可能需要使手持机使用第三滤波器。或者，在此情况下，可能需要使手持机进入单通道模式，使得仅一个麦克风为活动(例如，主要麦克风MC10)或使得当前为活动的麦克风混合到单通道，且可能需要暂停空间处理操作。

请注意，图5所示的区域边界仅是为了视觉说明性目的，且其并不意味着展示与各种定向状态相关联的区域之间的实际边界。图6A到图6C展示源原点区域的三个另外实例，对于所述源原点区域，可能预期一个空间分离滤波器优于另一空间分离滤波器而执行。这三个图式说明所述滤波器中的两者或两者以上针对超出距手持机的某距离的源可同等良好地执行(此定向还被称为“远场情境”)。此距离可极大地依据装置的麦克风之间的距离(其对于手持机来说通常为1.5到4.5厘米，且对于头戴式耳机来说可能甚至更小)而定。图6C展示实例，其中两个区域重叠，使得可预期两个对应滤波器针对位于重叠区中的所要源同等良好地执行。

通信装置(例如，手持机H100)的麦克风中的每一者可具有为全向、双向或单向(例如，心形)的响应。可使用的各种类型的麦克风包括压电麦克风、动态麦克风及驻极体麦克风。此装置还可经实施以具有两个以上麦克风。举例来说，图7A展示包括第三麦克风MC30的手持机H100的实施方案H110。图7B展示手持机H110的两个其它视图，其展示各种换能器沿装置轴线的放置。

图8展示根据通用配置的设备A200的框图，设备A200可实施于如本文中所揭示的通信装置(例如，手持机H100或H110)内。设备A200包括经配置以接收M通道输入信号S10的滤波器组100，其中M为大于一的整数，且M个通道中的每一者是基于M个麦克风(例如，手持机H100或H110的麦克风)中的对应一者的输出。麦克风信号通常经取样，可经预处理(例如，针对回声消除、降噪、频谱成形等等而经滤波)，且可甚至经预分离(例如，通过如本文中所描述的另一空间分离滤波器或自适应滤波器)。对于例如语音等声学应用来说，典型取样速率在从8kHz到16kHz的范围内。

滤波器组100包括n个空间分离滤波器F10-1到F10-n(其中n为大于一的整数)，其每一者经配置以对M通道输入信号S40进行滤波以产生对应经空间处理M通道信号。空间分离滤波器F10-1到F10-n中的每一者经配置以分离M通道输入信号的一个或一个以上指向所要声音分量与所述信号的一个或一个以上其它分量(例如，一个或一个以上指向干扰源及/或漫射噪声分量)。在图8的实例中，滤波器F10-1产生包括经滤波通道S2011到S20m1的M通道信号，滤波器F10-2产生包括经滤波通道S2012到S20m2的M通道信号，等等。滤波器F10-1到F10-n中的每一者是通过一个或一个以上系数值矩阵而特征化，所述一个或一个以上系数值矩阵可使用BSS、波束成形或经组合BSS/波束成形方法(例如，如本文中所描述的ICA或IVA方法或其变型)进行计算，且还可如本文中所描述而进行训练。在一些情况下，系数值矩阵可仅为系数值向量(即，一维矩阵)。设备A200还包括切换机构350，其经配置以从每一滤波器F10-1到F10-n接收M通道经滤波信号，确定这些滤波器中的哪一者当前最好地分离输入信号S10的至少一个所要分量与一个或一个以上其它分量，且产生M通道输出信号S40。

经实施以具有M个麦克风的耳机或其它头戴式耳机为可具有不同操作配置且可包括设备A200的实施方案的另一种类的便携式通信装置。此头戴式耳机可为有线或无线的。举例来说，无线头戴式耳机可经配置以经由与电话装置(例如，蜂窝式电话手持机)的通信而支持半双工或全双工电话(例如，使用如由华盛顿州贝尔维尤市蓝牙技术联盟公司(Bluetooth Special Interest Group，Inc.，Bellevue，WA)所颁布的Bluetooth^TM协议的版本)。图9展示例如经安装以供在用户的耳朵65上使用的头戴式耳机63的不同操作配置范围66的图解。头戴式耳机63包括主要(例如，端射)及次要(例如，侧向)麦克风阵列67，所述阵列可在使用期间相对于用户的嘴64而不同地定向。

为了在描述中避免不当的复杂性，本文中在设备A200的两通道及/或两滤波器实施方案的上下文中描述所揭示配置的一些特征，但仍然将理解，在此实施方案的上下文中所描述的任何特征均可通用化到M通道及/或n滤波器实施方案，且明确地预料及揭示此通用化。

图10展示设备A200的两通道(例如，立体声)实施方案A210的框图。设备A210包括滤波器组100的实施方案120，其包括n个空间分离滤波器F14-1到F14-n。这些空间分离滤波器中的每一者为滤波器F10-1到F10-n中的对应一者的两通道实施方案，其经布置以对两个输入通道S10-1及S10-2进行滤波以在两个经滤波通道(例如，语音通道及噪声通道)上产生对应经空间处理信号。滤波器F14-1到F14-n中的每一者经配置以分离输入信号S10的指向所要声音分量与所述信号的一个或一个以上噪声分量。在图10的实例中，滤波器F14-1产生包括语音通道S2011及噪声通道S2021的两通道信号，滤波器F14-2产生包括语音通道S2012及噪声通道S2022的两通道信号，等等。设备A210还包括切换机构350的实施方案360，其经配置以从滤波器F14-1到F14-n中的每一者接收两个经滤波通道，确定这些滤波器中的哪一者当前最好地分离输入信号S10的所要分量与噪声分量，且产生两个输出通道S40-1及S40-2的选定集合。

图11展示设备A210的特定实施方案A220，其包括滤波器组120的两滤波器实施方案130。滤波器F14-1及F14-2可如本文中所描述而进行训练及/或设计。滤波器组130还可经实施以使得滤波器F14-1与F14-2具有彼此大体上相同但以不同次序的系数值。(在此上下文中，术语“大体上”指示在1％、5％或10％的误差内。)在一个此类实例中，滤波器F14-1与F14-2具有彼此大体上相同但以不同次序的系数值。(在特定实例中，滤波器F14-1具有v个系数值a₁到a_v的向量，且滤波器F14-2具有以逆序a_v到a₁的大体上相同值的v元素向量。)在另一此类实例中，滤波器F14-1具有v列系数值A₁到A_v(每一列表示对输入通道中的相应一者的滤波操作)的矩阵，且滤波器F14-2具有v列矩阵，其具有以不同次序的大体上相同列。(在特定实例中，滤波器F14-1的系数值矩阵围绕中心垂直轴线而经翻转以获得滤波器F14-2的系数值矩阵)。在这些情况下，可预期滤波器F14-1与F14-2具有不同(例如，大约互补)空间分离性能。举例来说，一个滤波器可在所要声音源处于例如图5中的区域A1等区域中时执行将所要声音分离到对应语音通道中的较好分离，而另一滤波器可在所要声音源处于例如图5中的区域A2等相反区域中时执行将所要声音分离到对应语音通道中的较好分离。或者，滤波器组130可经实施以使得滤波器F14-1与F14-2在结构上相似，其中滤波器F14-2的系数值中的每一者大体上等于滤波器F14-1的对应系数值的加性逆元素(即，具有相同量值及相反方向，在1％、5％或10％的误差内)。

手持机或头戴式耳机的典型使用仅涉及一个所要声音源：用户的嘴。在此情况下，仅包括两通道空间分离滤波器的滤波器组120的实施方案的使用可能为适当的。还明确地预料及揭示在用于音频及/或视频会议的通信装置中包括设备A200的实施方案。对于用于音频及/或视频会议的装置来说，装置的典型使用可涉及多个所要声音源(例如，各个参与者的嘴)。在此情况下，包括R通道空间分离滤波器(其中R大于二)的滤波器组100的实施方案的使用可能为更适当的。一般来说，可能需要使滤波器组100的空间分离滤波器具有用于每一指向声音源的至少一个通道及用于漫射噪声的一个通道。在一些情况下，还可能需要提供用于任何指向干扰源中的每一者的额外通道。

图12展示包括状态估计器400及转变控制模块500的切换机构350的实施方案352的框图。响应于来自状态估计器400的经估计定向状态指示(或“经估计状态”)S50，转变控制模块500经配置以从经滤波通道S2011-S20ml到S201n-S20mn的n个集合当中进行选择以产生M个输出通道S40-1到S40-m的集合。图13展示切换机构352的特定实施方案362的框图，所述特定实施方案362包括状态估计器400的实施方案401及转变控制模块500的实施方案501，其中M的值等于二。

状态估计器400可经实施以基于以下各项来计算经估计状态指示S50：一个或一个以上输入通道S10-1到S10-m、一个或一个以上经滤波通道S2011到S20mn或输入通道与经滤波通道的组合。图14A展示经布置以接收n个语音通道S2011到S201n及n个噪声通道S2021到S202n的状态估计器401的实施方案402。在一个实例中，状态估计器402经配置以根据表达式max[E(S_i)-E(N_i)](其中1≤i≤n)来计算经估计状态指示S50，其中E(S_i)指示语音通道S201i的能量，且E(N_i)指示噪声通道S202i的能量。在另一实例中，状态估计器402经配置以根据表达式max[E(S_i)-E(N_i)+C_i]来计算经估计状态指示S50，其中C_i指示与滤波器F10-i相关联的优选常数。可能需要配置状态估计器400以响应于通信装置的操作配置及/或操作模式的改变而向一个或一个以上优选常数C_i中的每一者指派不同值。

状态估计器402可经配置以将能量值E(S_i)及E(N_i)的每一例项计算为由对应通道所携载的信号的连续样本块(还被称为“帧”)的平方样本值的和。典型帧长度在约五或十毫秒到约四十或五十毫秒的范围内，且帧可为重叠的或非重叠的。通过一个操作而处理的帧还可为通过不同操作而处理的较大帧的片段(即，“子帧”)。在一个特定实例中，由经滤波通道S2011到S202n所携载的信号被分为10毫秒非重叠帧的序列，且状态估计器402经配置以针对经滤波通道S2011及S2012中的每一者的每一帧而计算能量值E(S_i)的例项，且针对经滤波通道S2021及S2022中的每一者的每一帧而计算能量值E(N_i)的例项。状态估计器402的另一实例经配置以根据表达式min(corr(S_i，N_i))(或 min(corr(S_i，N_i))+C_i)(其中1≤i≤n)来计算经估计状态指示S50，其中corr(A，B)指示A与B的相关。在此情况下，可如上文所描述在对应帧上计算所述相关的每一例项。

图14B展示经布置以接收n个输入通道S10-1到S10-m及n个噪声通道S2021到S202n的状态估计器401的实施方案404。在一个实例中，状态估计器404经配置以根据表达式max[E(I_j)-E(N_i)](或max[E(I_j)-E(N_i)+C_i])(其中1≤i≤n且1≤j≤n)来计算经估计状态指示S50，其中E(I_j)指示输入通道S10-j的能量。在另一实例中，状态估计器404经配置以根据表达式max[E(I)-E(N_i)](或max[E(I)-E(N_i)+C_i])(其中1≤i≤n)来计算经估计状态指示S50，其中E(I)指示输入通道S10-1到S10-m中的选定一者I的能量。在此情况下，通道I为可能携载所要语音信号的输入通道。可基于对应麦克风在装置内的物理位置来选择通道I。或者，可基于输入通道中的两者或两者以上(可能全部)的信噪比的比较来选择通道I。

图14C展示经布置以接收n个语音通道S2011到S201n的状态估计器401的实施方案406。状态估计器406经配置以选择对应于具有语音测量(例如，语音特性测量)的最高值的语音通道的状态。在一个实例中，状态估计器406经配置以基于语音通道S2011到S201n的相对自相关特性来计算经估计状态指示S50。在此情况下，当前正携载在预期人类间距滞后值范围内具有自相关峰值的信号的通道可能优选于当前正携载仅在零滞后处具有自相关峰值的信号的通道。在另一实例中，状态估计器406经配置以基于语音通道S2011到S201n的相对峰度(例如，四阶矩)特性来计算经估计状态指示S50。在此情况下，当前正携载具有较高峰度的信号(即，为更非高斯的)的通道可能优选于当前正携载具有较低峰度的信号(即，为更高斯的)的通道。

图14D展示经布置以接收n个输入通道S10-1到S10-m的状态估计器401的实施方案408。在此情况下，滤波器集合F10-1到F10-n中的每一者与到达时间差(TDOA)值的不同范围相关联。状态估计器408经配置以估计输入通道当中的TDOA(例如，使用基于输入通道的相关、输入/输出相关及/或相对延迟输入和及差的方法)，且选择对应于相关联滤波器集合的状态。可能需要在基于输入信号的和及差测量来计算延迟估计之前执行输入通道的低通滤波，因为此滤波可有助于使延迟估计有规则及/或稳定。状态估计器408与状态估计器400的其它实施方案相比可能较不依赖于麦克风增益的精确校准及/或对于校准误差为更稳固的。

可能需要配置状态估计器400以在使用其输入参数值来执行经估计状态计算(例如，如上文所描述)之前使其输入参数值平滑。在一个特定实例中，状态估计器402经配置以计算语音通道S2011到S201n及噪声通道S2021到S202n中的每一者的能量，且接着根据例如E_c＝αE_p+(1-α)E_n等线性表达式而使这些能量平滑，其中E_c表示当前经平滑能量值，E_p表示先前经平滑能量值，E_n表示当前经计算能量值，且α表示值在零(非平滑)与例如0.9等小于一的值(针对最大平滑)之间可为固定或自适应的平滑因子。在此实例中，将此平滑应用于经计算能量值以获得值E(S_i)及E(N_i)。在其它实例中，可将此线性平滑(及/或非线性平滑操作)应用于如参看图14A到图14D所描述的经计算能量值以获得值E(S_i)、E(N_i)、E(I)及E(I_j)中的一者或一者以上。或者及/或另外，可能需要选择及/或预调节经提供到状态估计器400的信号(例如，如携载于语音、噪声及/或输入通道上)中的任何一者或一者以上，因为此预处理可有助于在高声干扰源存在的情况下避免错误的状态估计。

图15展示包括切换机构370的实施方案372的设备A220的实施方案A222的实例，所述实施方案372具有(A)经配置以处理来自两个滤波器的通道的状态估计器402的实施方案412及(B)转变控制模块501的对应实施方案510。图16展示状态估计器412的实施方案414的实例。在此实例中，分离测量计算器550a计算信号S2011与S2021之间的能量差，分离测量计算器550b计算信号S2012与S2022之间的能量差，且比较器560比较结果以指示对应于在通道之间产生最大分离(例如，最大能量差)的滤波器的定向状态。在计算相应能量差中，分离测量计算器550a及550b中的任一者(或两者)可经配置以根据例如如上文所描述的E_c＝αE_p+(1-α)E_n等表达式而随时间使经计算差平滑。比较器560还可经配置以在比较能量差之前将如上文所描述的对应滤波器优选常数相加到能量差中的一者或两者。这些原理可延伸到状态估计器402的其它实施方案(例如，对于大于二的M值)，且可以类似方式来实施状态估计器404及406。还请注意，状态估计器400可经配置以基于参看实施方案402、404、406及408所描述的技术当中的两者或两者以上的组合来产生经估计状态S50。

对于在期间无输入通道含有所要语音分量的时间间隔(例如，在仅噪声时间间隔期间)，可能需要抑制或停用滤波器输出之间的切换。举例来说，可能需要使状态估计器400仅在所要声音分量为活动时更新经估计定向状态。状态估计器400的此实施方案可经配置以仅在语音时间间隔期间且不在当通信装置的用户不在讲话时的时间间隔期间更新经估计定向状态。

图17展示设备A210的实施方案A214，其包括话音活动检测器(或“VAD”)20及切换机构360的实施方案364。话音活动检测器20经配置以产生更新控制信号S70，其状态指示在输入通道S10-1(例如，对应于主要麦克风MC10的通道)上是否检测到语音活动，且切换机构364是根据更新控制信号S70的状态来控制的。切换机构364可经配置以使得在当未检测到语音时的时间间隔(例如，帧)期间抑制经估计状态S50的更新。

话音活动检测器20可经配置以基于例如以下各项等一个或一个以上因子而将其输入信号的帧分类为语音或噪声(例如，以控制二进制话音检测指示信号的状态)：帧能量、信噪比(SNR)、周期性、零点交叉速率、语音及/或残余的自相关以及第一反射系数。此分类可包括将此因子的值或量值与阈值进行比较及/或将此因子的改变的量值与阈值进行比较。或者或另外，此分类可包括将一个频带中的此因子(例如，能量)的值或量值或此因子的改变的量值与另一频带中的类似值进行比较。话音活动检测器20通常经配置以产生更新控制信号S70作为二进制值话音检测指示信号，但产生连续及/或多值信号的配置也为可能的。

图18展示设备220的实施方案A224的框图，所述实施方案A224包括VAD 20及切换机构372的实施方案374。在此实例中，更新控制信号S70经布置以根据在输入通道S10-1上是否检测到语音活动来控制状态估计器412的实施方案416(例如，以启用或停用经估计状态S50的值的改变)。图19展示包括VAD 20的例项20-1及20-2的设备A210的实施方案A216，所述例项20-1与20-2可能但不需要为等同的。在设备A216的情况下，如果在任一输入通道上检测到语音活动，则启用切换机构360的实施方案366的状态估计器，且否则将其停用。

随着通信装置与用户的嘴之间的距离增加，VAD 20区分语音帧与非语音帧的能力可能降低(例如，归因于SNR的降低)。然而，如上文所提及，可能需要控制状态估计器400以仅在语音时间间隔期间更新经估计定向状态。因此，可能需要使用具有高可靠度的单通道VAD来实施VAD 20(或VAD 20-1及20-2中的一者或两者)(例如，以在远场情境下提供改进的所要扬声器检测活动)。举例来说，可能需要实施此检测器以基于多个准则(例如，能量、零点交叉速率等等)及/或新近VAD决策的记忆来执行话音活动检测。在设备A212的另一实施方案中，用产生如上文所提及可为二进制值的更新控制信号的双通道VAD来替换VAD 20的例项20-1及20-2。

状态估计器400可经配置以使用一个以上特征来估计通信装置的当前定向状态。举例来说，状态估计器400可经配置以使用上文参看图14A到图14D所描述的一个以上准则的组合。状态估计器400还可经配置以使用关于通信装置的当前状况的其它信息，例如位置信息(例如，基于来自通信装置的加速计的信息)、操作配置(例如，如由通信装置的状态或一个或一个以上开关所指示)及/或操作模式(例如，当前是否选择了例如即按即说、扬声器电话或者视频重放或记录等模式)。举例来说，状态估计器400可经配置以使用指示哪些麦克风当前为活动的信息(例如，基于当前操作配置)。

设备A200还可经构造以使得对于通信装置的一些操作配置或模式来说，假设空间分离滤波器中的对应一者提供足够分离使得继续的状态估计在所述装置处于所述配置或模式中是不必要的。当选择视频显示模式时，例如，可能需要将经估计状态指示S50约束到特定对应值(例如，关于用户正面向视频屏幕的定向状态)。由于基于来自输入信号S10的信息的状态估计过程必定涉及某些延迟，所以使用关于通信装置的当前状态的此信息可有助于加速状态估计过程及/或降低响应于经估计状态S50的改变(例如，对一个或一个以上后续处理级的激活及/或参数改变)的操作的延迟。

通信装置的一些操作配置及/或操作模式可支持尤其广泛的用户-装置定向范围。当以例如即按即说或扬声器电话模式等操作模式使用时，例如，通信装置可固持于距用户的嘴相对较大距离处。在这些定向中的一些定向中，用户的嘴距每一麦克风可为几乎等距的，且当前定向状态的可靠估计可变得较困难。(此定向可对应于(例如)与不同定向状态相关联的区域之间的重叠区，如图6C所示。)在此情况下，定向的小变化可导致经估计状态S50的不必要改变。

可能需要配置状态估计器400以抑制不必要改变(例如，通过并入有滞后或惯性)。举例来说，比较器560可经配置以仅在(A)最大分离测量与(B)对应于当前状态的分离测量之间的差超过(或者，不小于)阈值的情况下更新经估计状态指示S50。

图20展示转变控制模块500的实施方案520的框图。转变控制模块520包括M个选择器(例如，多路分用器)的集合。对于1≤j≤M，每一选择器j根据经估计状态S50的值而输出经滤波通道S20j1到S20jn当中的一者作为输出通道S40-j。

转变控制模块520的使用可导致输出信号S40从一个空间分离滤波器的输出到另一空间分离滤波器的输出的突然转变。对于通信装置当前接近两个或两个以上定向状态之间的空间边界的情形来说，转变控制模块520的使用还可导致从一个滤波器输出到另一滤波器输出的频繁转变(还被称为“抖动”)。由于各种滤波器的输出可大体上不同，所以这些转变可能引起输出信号S40中的不良产物，例如所要语音信号的临时衰减或其它不连续性。可能需要通过在从一个滤波器输出到另一滤波器输出的改变之间应用延迟周期(还被称为“滞留”)而减少这些产物。举例来说，可能需要配置状态估计器400以仅当在延迟时间间隔(例如，五或十个连续帧)上已一致地指示相同目标状态时更新经估计状态指示S50。状态估计器400的此实施方案可经配置以针对所有状态转变而使用相同延迟时间间隔，或根据特定源及/或潜在目标状态而使用不同延迟时间间隔。

输出信号S40的滤波器输出之间的突然转变在感知上可能为不良的，且可能需要在滤波器输出之间获得比由转变控制模块520所提供的转变更平缓的转变。在此情况下，可能需要使切换机构350随时间从一个空间分离滤波器的输出平缓地衰退到另一空间分离滤波器的输出。举例来说，除了应用如上文所论述的延迟时间间隔以外或作为对应用如上文所论述的延迟时间间隔的替代方案，切换机构350可经配置以在若干帧(例如，十个20毫秒帧)的合并时间间隔上执行从一个滤波器的输出到另一滤波器的输出的线性平滑化。

图21展示转变控制模块500的实施方案550的框图。代替模块520的多路分用器阵列，转变控制模块550包括m个混频器70a到70m的混频器组700。转变控制模块550还包括经配置以产生转变控制信号S60的滞留逻辑600。对于1≤j≤M，每一混频器70j经配置以根据转变控制信号S60来混合经滤波通道S20j1到S20jn以产生对应输出通道S40-j。

图22展示混频器70j的实施方案72j的框图(其中1≤j≤M)。在此实例中，转变控制信号S60并行地包括由混频器72j应用以使相应经滤波通道S20j1到S20jn加权的n个值，且求和器60j计算经加权信号的和以产生输出通道S40-j。

图23展示包括混频器组700的两通道实施方案710的转变控制模块550的实施方案555的框图。在一个此类实例中，滞留逻辑600的2通道实施方案610经配置以计算在预定数目的帧(即，合并时间间隔)上在零到一之间变化的加权因子ω，且输出ω及(1-ω)的值(以由经估计状态S50所确定的次序)作为转变控制信号60。混频器组710的混频器74a及74b各自经配置以根据例如下式等表达式来应用这些加权因子：ωFn+(1-ω)Fc，其中Fn指示混频器正向其转变的经滤波通道，且Fc指示混频器正从其转变的经滤波通道。

可能需要配置滞留逻辑600以针对经估计状态S50的不同转变而应用不同延迟及/或合并时间间隔。举例来说，经估计状态S50的一些转变与其它转变相比可能实际上较不可能发生。相对较不可能的状态转变的一个实例为指示用户已完全回转手持机的转变(即，从主要麦克风面向用户的嘴的定向到主要麦克风背离用户的嘴的定向)。可能需要配置滞留逻辑600以针对较不可能的转变而使用较长延迟及/或合并周期。此配置可有助于抑制经估计状态指示S50的伪瞬变。还可能需要配置滞留逻辑600以根据关于通信装置的当前及/或先前状态的其它信息(例如，如本文中所论述的位置信息、操作配置及/或操作模式)来选择延迟及/或合并时间间隔。

图24展示设备A210的实施方案A218的框图。在此实例中，切换机构360的实施方案368经配置以从n对经滤波通道以及所述对输入通道当中进行选择以产生语音通道S40-1及噪声通道S40-2。在一个实例中，切换机构368经配置成以双通道模式或单通道模式而操作。在双通道模式中，切换机构368经配置以从n对经滤波通道当中进行选择以产生语音通道S40-1及噪声通道S40-2。在单通道模式中，切换机构368经配置以选择输入通道S10-1以产生语音通道S40-1。在单通道模式的替代实施方案中，切换机构368经配置以从两个输入通道当中进行选择以产生语音通道S40-1。在此情况下，在两个输入通道当中的选择可基于一个或一个以上准则，例如最高SNR、最大语音似然性(例如，如由一个或一个以上统计度量所指示)、通信装置的当前操作配置及/或所要信号经确定为从其发源的方向。

图25展示设备A220的相关实施方案A228的框图，其中切换机构370的实施方案378经配置以接收输入通道中的一者(例如，与主要麦克风相关联的通道)且在处于单通道模式时输出此通道作为语音信号S40-1。切换机构可经配置以在经估计定向状态不对应于滤波器组中的n个滤波器中的任一者时选择单通道模式。对于滤波器组120的两滤波器实施方案130及如图5所示的三重可能定向状态来说，例如，切换机构可经配置以在经估计状态S50对应于区域A3时选择单通道模式。从设计观点来看，单通道模式可包括尚未发现(或者未预期)滤波器组中的滤波器中的任一者产生可靠空间处理结果的情况。举例来说，切换机构可经配置以在状态估计器不能可靠地确定空间分离滤波器中的任一者已将所要声音分量分离到对应经滤波通道中时选择单通道模式。在一个此类实例中，比较器560经配置以指示针对分离测量之间的差不超过最小值的情况而选择单通道模式。

对于滤波器组100的所有滤波器均是使用相同结构的相应例项来实施的情况，可能方便的是使用此结构的另一例项来实施单通道模式。图26展示设备A228的此实施方案A229的框图。在此实例中，滤波器F14-1及F14-2是使用相同滤波器结构的不同例项来实施，且透通滤波器F14-3是使用相同结构的经配置以在无任何空间处理的情况下传递输入通道S10-1及S10-2的另一例项来实施。举例来说，滤波器组100的滤波器通常是使用交叉滤波器前馈及/或反馈结构来实施。在此情况下，透通滤波器可使用所有交叉滤波器的系数值均为零的此结构来实施。在另一实例中，透通滤波器F14-3经实施以阻断输入通道S10-2，使得仅传递输入通道S10-1。设备A229还包括切换机构378的实施方案379，其经配置成以与用于其它经滤波通道S2011、S2012、S2021及S2022的方式相同的方式而转变到由透通滤波器F14-3所产生的通道及从由透通滤波器F14-3所产生的通道转变(例如，基于经估计状态指示S50)。

不相关噪声可使空间处理系统的性能降级。举例来说，不相关噪声的放大可能在空间处理滤波器中归因于白色噪声增益而发生。不相关噪声对于少于麦克风或传感器中的全部的麦克风或传感器(例如，对于麦克风或传感器中的一者)为特定的，且可包括归因于风、刮擦(例如，用户的指甲的刮擦)、直接到麦克风中的呼吸或吹气及/或传感器或电路噪声的噪声。此噪声倾向于尤其以低频率显现。可能需要实施设备A200以在检测到不相关噪声时关闭或绕过空间分离滤波器(例如，以转到单通道模式)及/或用高通滤波器从受影响的输入通道移除不相关噪声。

图27展示包括不相关噪声检测器30的设备A210的实施方案A210A的框图，所述不相关噪声检测器30经配置以在输入通道当中检测不相关的噪声。不相关噪声检测器30可根据2008年8月29日申请的题为“用于检测不相关分量的系统、方法及设备(SYSTEMS，METHODS，AND APPARATUS FOR DETECTION OF UNCORRELATEDCOMPONENT)”的第12/201,528号美国专利申请案中所揭示的配置中的任一者来实施，所述申请案据此为了限于不相关噪声的检测及/或对此检测的响应的揭示的目的而以引用的方式并入。在此实例中，设备A210A包括切换机构368的实施方案368A，其经配置以在不相关噪声检测器30指示不相关噪声的存在(例如，经由可为二进制值的检测指示S80)时进入如上文所描述的单通道模式。作为使用单通道模式的替代方案(或除了使用单通道模式以外)，设备A210A可经配置以在输入通道中的一者或一者以上上使用可调整的高通滤波器来移除不相关噪声，使得仅当在通道中检测到不相关噪声时才激活滤波器。

在用于话音通信(例如，电话)的收发器应用中，术语“近端”用以指示作为音频而接收(例如，从麦克风)且由通信装置所发射的信号，且术语“远端”用以指示由通信装置所接收且作为音频而再现(例如，经由装置的一个或一个以上扩音器)的信号。可能需要响应于远端信号活动而修改设备A200的实施方案的操作。尤其在全双工扬声器电话模式期间或在头戴式耳机中，例如，由装置的扩音器所再现的远端信号活动可由装置的麦克风拾取以显现于输入信号S10上，且最终使定向状态估计器分散。在此情况下，可能需要在远端信号活动的周期期间暂停对经估计状态的更新。图28展示在远端音频信号S15(例如，从通信装置的接收器部分所接收)上包括话音活动检测器(VAD)20的例项70的设备A224的实施方案A224A的框图。对于手持机来说，VAD 70可在全双工扬声器电话模式期间及/或在次要扬声器SP20为活动时经激活，且其所产生的更新控制信号S75可用以控制切换机构以在VAD指示远端语音活动时停用对状态估计器的输出的改变。图28展示切换机构374的特定实施方案374A，其经配置以在VAD 20及VAD 70中的至少一者指示语音活动时暂停对经估计状态S50的更新。对于头戴式耳机来说，VAD 70可在正常操作期间经激活(例如，除非装置的主要扬声器经消音)。

可能需要配置空间分离滤波器F10-1到F10-n中的一者或一者以上以处理具有少于M个通道的信号。举例来说，可能需要配置空间分离滤波器中的一者或一者以上(且可能全部)以仅处理一对输入通道(甚至对于M大于二的情况来说)。此配置的一个可能原因将为使设备A200的所得实施方案容许M个麦克风中的一者或一者以上的失效。另一可能原因为在通信装置的一些操作配置中，设备A200可经配置以减活或以另外方式忽视M个麦克风中的一者或一者以上。

图29及图30展示设备A200的两个实施方案，其中M等于三，且滤波器F14-1、F14-2及F14-3中的每一者经配置以处理一对输入通道。图29展示设备A232的框图，其中滤波器F14-1、F14-2及F14-3中的每一者经布置以处理三个输入通道S10-1、S10-2及S10-3中的不同对。图30展示设备A234的框图，其中滤波器F14-1及F14-2经布置以处理输入通道S10-1及S10-2，且滤波器F14-3经布置以处理输入通道S10-1及S10-3。图31展示设备A200的实施方案A236的框图，其中滤波器F14-1到F14-6中的每一者经配置以处理一对输入通道。

在设备A234中，切换机构360可经配置以针对对应于输入通道S10-3的麦克风经消音或有故障的操作配置而选择滤波器F14-1及F14-2当中的一者，且否则选择滤波器F14-1及F14-3当中的一者。对于在设备A236中选择输入通道S10-1到S10-3中的特定对(例如，基于当前操作配置，或响应于与其它输入通道相关联的麦克风的失效)的情况来说，切换机构360可经配置以仅从对应于接收所述对输入通道的滤波器F14-1到F14-6的两个状态当中进行选择。

在通信装置的某些操作模式中，在三个或三个以上输入通道当中选择一对输入通道可至少部分地基于试探法来执行。在如图2所描绘的常规电话模式中，例如，通常以具有有限可变性的受约束方式来固持电话，使得一对输入通道的固定选择可为充分的。然而，在如图3A及图3B或图4A及图4B所描绘的扬声器电话中，许多固持样式为可能的，使得一对输入通道的动态选择可能为需要的，以在所有预期使用定向中获得足够分离。

在通信装置的使用寿命期间，麦克风元件中的一者或一者以上可能变得损坏或可能以另外方式失效。如上文所提及，可能需要使设备A200容许麦克风中的一者或一者以上的失效。切换机构360可经配置有多个状态估计方案，其各自对应于输入通道的不同子集。举例来说，可能需要针对各种预期故障情境中的每一者(例如，针对每个可能故障情境)提供状态估计逻辑。

可能需要实施状态估计器400以通过将指示符函数的值映射到可能定向状态集合而产生经估计状态指示S50。在设备A200的两滤波器实施方案A220中，例如，可能需要将分离测量压缩成单一指示符且将所述指示符的值映射到可能定向状态集合中的对应可能定向状态。一种此类方法包括计算每一滤波器的分离测量、使用两个测量来评估指示符函数及将指示符函数值映射到可能状态集合。

可使用任何分离测量，包括上文参看图14A到图14D所论述的分离测量(例如，能量差、相关、TDOA)。在一个实例中，滤波器组130的相应空间分离滤波器F14-1及F14-2的分离测量Z₁及Z₂中的每一者经计算为滤波器的输出的能量之间的差，其中每一通道的能量可经计算为在二十毫秒帧上的平方样本和：Z₁＝e₁₁-e₁₂，、Z₂＝e₂₁-e₂₂，其中e₁₁、e₁₂、e₂₁、e₂₂分别表示通道S2011、S2021、S2012及S2022在对应帧上的能量。指示符函数可接着经计算为两个分离测量之间的差，例如，Z₁-Z₂。

在评估指示符函数之前，可能需要根据对应滤波器输入通道中的一者或一者以上来按比例缩放每一分离测量。举例来说，可能需要根据例如以下表达式中的一者在对应帧上的值的和等因子来按比例缩放测量Z₁及Z₂中的每一者：|x₁|、|x₂|、|x₁|+|x₂|、|x₁+x₂|、|x₁x₂|，其中x₁、x₂分别表示输入通道S10-1及S10-2的值。

可能需要针对分离测量而使用不同比例因子。在一个此类实例中，滤波器F14-1对应于所要声音较多地引导于对应于通道S10-1的麦克风处的定向状态，且滤波器F14-2对应于所要声音较多地引导于对应于通道S10-2的麦克风处的定向状态。在此情况下，可能需要根据基于|x₁|在帧上的和的因子来按比例缩放分离测量Z₁，且根据基于|x₂|在帧上的和的因子来按比例缩放分离测量Z₂。在此实例中，分离测量Z₁可根据例如

等表达式来计算，且分离测量Z₂可根据例如

等表达式来计算。

可能需要使比例因子在一个方向上比在另一方向上多地影响分离测量的值。在基于最大差的分离测量的情况下，例如，可能需要使比例因子响应于高输入通道音量而降低分离测量的值，而在输入音量为低时不会过度地增加分离测量的值。(在基于最小差的分离测量的情况下，相反效应可为所要的。)在一个此类实例中，根据例如以下表达式等表达式来计算分离测量Z₁及Z₂：

其中

且T_s为阈值。

图32A展示将指示符函数值(例如，Z₁-Z₂)映射到三个可能定向状态的集合的一个实例。如果值低于第一阈值T1，则选择状态1(对应于第一滤波器)。如果值高于第二阈值T2，则选择状态3(对应于第二滤波器)。如果值介于所述阈值之间，则选择状态3(不对应于任一滤波器，即，单通道模式)。在典型情况下，阈值T1与T2具有相反极性。图32B展示此映射的另一实例，其中不同阈值T1A、T1B及T2A、T2B用以依据转变正在进展的方向而控制状态之间的转变。此映射可用以降低归因于定向的小改变的抖动及/或降低重叠区域中的不必要的状态转变。

如上文所论述的指示符函数方案还可通过(例如)以获得每一对通道的选定状态的方式来处理所述对通道且接着选择总体具有最多投票的状态而延伸到设备A200的三通道(或M通道)实施方案。

如上文所提及，滤波器组130可经实施以使得滤波器F14-2的系数值矩阵相对于滤波器F14-1的对应系数值矩阵而经翻转。在此特定情况下，如上文所论述的指示符函数值可根据例如

等表达式来计算，其中β₁具有上文所指示的值。

图33A展示组合设备A210与自适应滤波器450的设备A200的实施方案A310的框图，所述自适应滤波器450经配置以执行输出信号S40的额外空间处理(例如，语音与噪声分量的进一步分离)以产生另一输出信号S42。可能需要实施自适应滤波器450以包括多个自适应滤波器，使得这些组件滤波器中的每一者对应于滤波器组120中的滤波器中的一者且可根据经估计状态指示S50来选择。举例来说，自适应滤波器450的此实施方案可包括类似于转变控制模块500的选择或混合机构，其经配置以根据经估计状态指示S50而选择组件滤波器中的一者的输出作为信号S42及/或在合并时间间隔期间混合组件滤波器中的两者或两者以上的输出以获得信号S42。

自适应滤波器450(或其组件滤波器中的一者或一者以上或可能全部)可根据如本文中所描述的一个或一个以上BSS、波束成形及/或经组合BSS/波束成形方法或根据适于特定应用的任何其它方法来配置。可能需要以初始条件集合来配置自适应滤波器450。举例来说，可能需要使组件滤波器中的至少一者具有非零初始状态。此状态可通过将组件滤波器训练到在经滤波信号上收敛的状态来计算，所述经滤波信号是通过使用滤波器组120中的对应滤波器以对训练信号集合进行滤波来获得的。在典型生产应用中，组件滤波器的参考例项及滤波器组120中的对应滤波器的参考例项用以产生接着存储到自适应滤波器450的组件滤波器的初始状态(即，滤波器系数的初始值集合)。初始条件的产生还描述于2008年8月25日申请的题为“用于信号分离的系统、方法及设备(SYSTEMS，METHODS，AND APPARATUS FOR SIGNAL SEPARATION)”的第12/197,924号美国专利申请案中的段落[00130]到[00134](以“For a configuration thatincludes(对于包括……的配置)”开始且以“during online operation(在在线操作期间)”结束)处，所述段落据此为了限于滤波器训练的揭示的目的而以引用的方式并入。下文还更详细地描述经由训练而产生滤波器状态。

设备A200还可经实施以包括经布置以执行经空间处理信号的频谱处理的一个或一个以上级。图33B展示组合设备A210与降噪滤波器460的设备A200的实施方案A320的框图。降噪滤波器460经配置以将噪声通道S40-2上的信号应用为噪声参考以降低语音信号S40-1中的噪声且产生对应经滤波语音信号S45。降噪滤波器460可经实施为维纳(Wiener)滤波器，其滤波器系数值是基于来自经分离通道的信号及噪声功率信息。在此情况下，降噪滤波器460可经配置以基于噪声参考(或对于输出通道S40具有两个以上通道的较一般情况来说，基于一个或一个以上噪声参考)来估计噪声频谱。或者，降噪滤波器460可经实施以基于来自一个或一个以上噪声参考的频谱而对语音信号执行频谱相减操作。或者，降噪滤波器460可经实施为卡尔曼(Kalman)滤波器，其中噪声协方差是基于一个或一个以上噪声参考。

可能需要配置降噪滤波器460以仅在非语音时间间隔期间估计例如频谱及或协方差等噪声特性。在此情况下，降噪滤波器460可经配置以包括话音活动检测(VAD)操作，或使用在设备或装置内以另外方式执行的此操作的结果，以在语音时间间隔期间停用对噪声特性的估计(或者，以仅在仅噪声时间间隔期间启用此估计)。图33C展示包括自适应滤波器450及降噪滤波器460两者的设备A310及A320的实施方案A330的框图。在此情况下，降噪滤波器460经布置以将噪声通道S42-2上的信号应用为噪声参考以降低语音信号S42-1中的噪声以产生经滤波语音信号S45。

可能需要使设备A200的实施方案驻留于通信装置内，使得装置的其它元件经布置以对输出信号S40或S45执行另外音频处理操作。在此情况下，可能需要解决设备A200与装置的任何其它降噪元件之间的可能交互，所述其它降噪元件例如为单通道降噪模块的实施方案(其可包括于(例如)移动台调制解调器(MSM)芯片或芯片组的基带部分内)。

在这些情况下，可能需要调整残余背景噪声的量及/或质量。举例来说，设备A200的多通道滤波器可能相对于单通道降噪模块的预期噪声输入电平来说为过度攻击性的。依据保持于输出信号S40中的噪声的振幅及/或频谱特征而定，单通道降噪模块可能引入较多失真(例如，快速变化的残余、音乐噪声)。在这些情况下，可能需要将一些经滤波的舒适噪声添加到输出信号S40及/或响应于经组合降噪方案的输出来调整一个或一个以上参数设定。

单通道降噪方法通常要求获取某经延伸周期的噪声及话音数据以提供用以支持降噪操作的参考信息。此获取周期倾向于在可观测的噪声移除中引入延迟。与这些方法相比，此处所呈现的多通道方法可归因于用户的话音与背景噪声的分离而提供相对立即的降噪。因此，可能需要相对于单通道降噪模块的动态特征而优化多通道处理级的攻击性设定的应用的时序。

可能需要响应于经估计状态指示S50的改变而在后续处理级中执行参数改变。还可能需要使设备A200起始可与特定参数改变及/或经估计定向状态相关联的时序提示及/或滞留逻辑的改变。举例来说，可能需要在经估计状态指示S50的改变之后使攻击性后处理级延迟某周期，因为特定经延伸估计周期可有助于确保对状态估计认知的足够信赖。

当定向状态改变时，当前噪声参考可能不再适于后续空间及/或频谱处理操作，且可能需要致使这些级在状态转变期间为较不具攻击性的。举例来说，可能需要使切换机构350在转变阶段期间衰减当前噪声通道输出。滞留逻辑600可经实施以执行此操作。在一个此类实例中，滞留逻辑600经配置以检测当前经估计状态与先前经估计状态之间的不一致性，且响应于此检测而衰减当前噪声通道输出(例如，设备A210的通道S40-2)。此衰减(其可为平缓或即刻的)可为实质性的(例如，达在50％或60％到80％或90％的范围内的量，例如75％或80％)。到新语音及噪声通道(例如，两者均处于正常音量)中的转变还可如本文中所描述来执行(例如，参看转变控制模块550)。图34展示在从通道对S2011及S2012到通道对S2021及S2022的转变期间此衰减方案的一个实例的语音通道S2011、S2021及噪声通道S2012、S2022的随时间的相对增益电平。

还可能需要根据经估计状态指示S50来控制一个或一个以上下游操作。举例来说，可能需要根据经估计状态指示S50而将对应初始条件集合应用于下游自适应滤波器(例如，如图33A及图33C所示)。在此情况下，可能需要如上文所描述根据经估计状态指示S50来选择自适应滤波器450的组件滤波器，且将组件滤波器复位到其初始状态。在从一个初始条件集合到另一初始条件集合或从一个组件滤波器到另一组件滤波器的转变期间，可能需要以类似于上文参看滞留逻辑600所描述的方式的方式来衰减当前噪声通道输出(例如，S42-2)。在设备A200的单通道操作期间，还可能需要停用例如下游自适应空间处理滤波器(例如，如图33A到图33C所示)等装置的其它空间处理操作。

可遭遇系统降噪性能相对于某些方向的某种敏感性(例如，归因于通信装置上的麦克风放置)。可能需要通过选择适于特定应用的麦克风布置及/或通过使用噪声时间间隔的选择性掩蔽而降低此敏感性。此掩蔽可通过选择性地衰减仅噪声时间间隔(例如，使用如本文中所描述的VAD)或通过添加舒适噪声以使得后续单通道降噪模块能够移除残余噪声产物来实现。

图35A展示包括回声消除器EC10的设备A200的实施方案A210B的框图，回声消除器EC10经配置以基于远端音频信号S15来消除来自输入信号S10的回声。在此实例中，回声消除器EC10产生由滤波器组120作为输入所接收的经消除回声的信号S10a。设备A200还可经实施以包括回声消除器EC10的例项，其经配置以基于远端音频信号S15来消除来自输出信号S40的回声。在任一情况下，可能需要在通信装置以扬声器电话模式进行操作期间及/或在通信装置以PTT模式进行操作期间停用回声消除器EC10。

图35B展示回声消除器EC10的实施方案EC12的框图，所述实施方案EC12包括单通道回声消除器EC20的两个例项EC20a及EC20b。在此实例中，回声消除器EC20的每一例项经配置以处理输入通道I1、I2的集合中的一个输入通道以产生输出通道O1、O2的集合中的对应一个输出通道。回声消除器EC20的各种例项可各自根据当前已知或仍待开发的任何回声消除技术(例如，最小均方技术)来配置。举例来说，回声消除论述于以上所引用的第12/197,924号美国专利申请案的段落[00139]到[00141](以“Anapparatus(设备)”开始且以“B500”结束)处，所述段落据此为了限于回声消除问题(包括但不限于设计、实施及/或与设备的其它元件的集成)的揭示的目的而以引用的方式并入。

图35C展示回声消除器EC20的实施方案EC22的框图，所述实施方案EC22包括经布置以对远端信号S15进行滤波的滤波器CE10及经布置以组合经滤波远端信号与正被处理的输入通道的加法器CE20。滤波器CE10的滤波器系数值可为固定及/或自适应的。可能需要使用多通道信号集合来训练滤波器CE10的参考例项(例如，如下文更详细地描述)，所述多通道信号是由通信装置的参考例项在其再现远端音频信号时记录的。

可能需要使设备A210B的实施方案驻留于通信装置内，使得装置的其它元件(例如，移动台调制解调器(MSM)芯片或芯片组的基带部分)经布置以对输出信号S40执行另外音频处理操作。在设计待包括于设备A200的实施方案中的回声消除器时，可能需要考虑此回声消除器与通信装置的任何其它回声消除器(例如，MSM芯片或芯片组的回声消除模块)之间的可能协同效应。

图36展示在设计及使用包括如本文中所描述的设备A200(或如下文所描述的设备A100)的实施方案的装置期间可遵循的程序的流程图。在设计阶段中，使用训练数据来确定固定滤波器集合(例如，滤波器组100中的滤波器的滤波器系数值)，且将对应用户-手持机状态特征化以使得能够进行对当前定向状态的在线估计(例如，通过如本文中所描述的切换机构)及对适于当前情形的固定滤波器集合的选择。训练数据为使用通信装置的参考例项(例如，手持机或头戴式耳机)在各种用户-装置声学情境下所记录的有噪声语音样本集合。在此记录(其可在无回声腔室中执行)之前，可能需要执行校准以确保参考装置的M个麦克风的增益的比率(其可随着频率而变化)是在所要范围内。一旦已使用参考装置确定了固定滤波器集合，便可将固定滤波器集合复制到通信装置的包括如本文中所描述的设备的实施方案的生产例项中。

图37展示设计方法M10的流程图，设计方法M10可用以获得将滤波器组100中的空间分离滤波器中的一者或一者以上特征化的系数值。方法M10包括记录多通道训练信号集合的任务T10及将训练信号集合分为子集的任务T20。方法M10还包括任务T30及T40。对于子集中的每一者，任务T30将对应空间分离滤波器训练到收敛。任务T40评估经训练滤波器的分离性能。任务T20、T30及T40通常使用个人计算机或工作站在通信装置外部执行。方法M10的任务中的一者或一者以上可经反复，直到在任务T40中获得可接受的结果为止。方法M10的各种任务在下文中更详细地论述，且对这些任务的额外描述在2008年8月25日申请的题为“用于信号分离的系统、方法及设备(SYSTEMS，METHODS，AND APPARATUS FOR SIGNAL SEPARATION)”的第12/197,924号美国专利申请案中找到，所述文献据此出于局限于空间分离滤波器的设计、训练及/或评估的目的而以引用的方式并入。

任务T10使用至少K个麦克风的阵列来记录K通道训练信号集合，其中K为至少等于M的整数。训练信号中的每一者包括语音及噪声分量两者，且在P个情境中的一者下记录每一训练信号，其中P可等于二，但通常为大于一的任何整数。如下文所描述，P个情境中的每一者可包含不同空间特征(例如，不同手持机或头戴式耳机定向)及/或不同频谱特征(例如，可能具有不同性质的声音源的俘获)。训练信号集合包括各自在P个情境中的不同一者下所记录的至少P个训练信号，但此集合通常将包括针对每一情境的多个训练信号。

K通道训练信号集合中的每一训练信号是基于由K个麦克风的阵列响应于至少一个信息源及至少一个干扰源而产生的信号。可能需要(例如)使训练信号中的每一者为对有噪声环境中的语音的记录。K个通道中的每一者是基于K个麦克风中的对应一者的输出。麦克风信号通常经取样，可经预处理(例如，针对回声消除、降噪、频谱成形等等而经滤波)，且可甚至经预分离(例如，通过如本文中所描述的另一空间分离滤波器或自适应滤波器)。对于例如语音等声学应用来说，典型取样速率在从8kHz到16kHz的范围内。

有可能使用含有如本文中所描述的设备A200的其它元件的相同通信装置来执行任务T10。然而，更通常来说，任务T10将使用通信装置的参考例项(例如，手持机或头戴式耳机)来执行。通过方法M10而产生的所得经收敛滤波器解答集合将接着在生产期间加载到相同或相似通信装置的其它例项中(例如，加载到每一此类生产例项的快闪存储器中)。

在此情况下，通信装置的参考例项(“参考装置”)包括K个麦克风的阵列。可能需要使参考装置的麦克风具有与通信装置的生产例项(“生产装置”)的麦克风相同的声学响应。举例来说，可能需要使参考装置的麦克风为与生产装置的麦克风相同的模型，且以与生产装置的麦克风相同的方式且在与生产装置的麦克风相同的位置中进行安装。此外，可能需要使参考装置另外具有与生产装置相同的声学特性。可能甚至需要使参考装置在声学方面与生产装置彼此等同。举例来说，可能需要使参考装置为与生产装置相同的装置模型。然而，在实际生产环境中，参考装置可为在一个或一个以上微小(即，在声学方面不重要)的方面中不同于生产装置的预生产版本。在典型情况下，参考装置仅用于记录训练信号，使得可能没有必要使参考装置自身包括设备A200的元件。

可使用相同的K个麦克风来记录所有训练信号。或者，可能需要使用以记录训练信号中的一者的K个麦克风的集合(在所述麦克风的一者或一者以上中)不同于用以记录训练信号中的另一者的K个麦克风的集合。举例来说，可能需要使用麦克风阵列的不同例项，以便产生对于麦克风当中的某程度的变化为稳固的多个滤波器系数值。在一种此类情况下，K通道训练信号的集合包括使用参考装置的至少两个不同例项所记录的信号。

P个情境中的每一者包括至少一个信息源及至少一个干扰源。通常，每一信息源为再现语音信号或音乐信号的扩音器，且每一干扰源为再现干扰声学信号(例如，来自典型预期环境的另一语音信号或周围背景声音)或噪声信号的扩音器。可使用的各种类型的扩音器包括电动(例如，音圈)扬声器、压电扬声器、静电扬声器、带式扬声器、平面磁性扬声器，等等。在一个情境或应用中充当信息源的源可在不同情境或应用中充当干扰源。在P个情境中的每一者下记录来自K个麦克风的输入数据可使用K通道磁带记录器、具有K通道声音记录或俘获能力的计算机或能够同时俘获或以另外方式记录K个麦克风的输出的另一装置来执行(例如，在约为取样分辨率内)。

声学无回声腔室可用于记录K通道训练信号集合。图38展示经配置以用于记录训练数据的声学无回声腔室的实例。在此实例中，头部及躯干模拟器(HATS，如由丹麦奈鲁姆的布鲁尔与克亚尔公司(Bruel&Kjaer，Naerum，Denmark)所制造)定位于向内聚焦式干扰源阵列(即，四个扩音器)内。HATS头部在声学方面类似于代表性人类头部，且在嘴中包括扩音器以用于再现语音信号。干扰源阵列可经驱动以建立如图所示封闭HATS的漫射噪声场。在一个此类实例中，扩音器阵列经配置以在HATS耳朵参考点或嘴参考点处重放处于75到78dB的声压电平的噪声信号。在其它情况下，一个或一个以上此类干扰源可经驱动以建立具有不同空间分布的噪声场(例如，指向噪声场)。

可使用的若干类型的噪声信号包括白色噪声、粉色噪声、灰色噪声及霍斯(Hoth)噪声(例如，如由新泽西州皮斯卡塔韦的电气电子工程师协会(IEEE)(Institute ofElectrical and Electronics Engineers(IEEE)，Piscataway，NJ)所颁布的IEEE标准269-2001“用于测量模拟及数字电话机、手持机及头戴式耳机的发射性能的标准草案方法(DraftStandard Methods for Measuring Transmission Performance of Analog and Digital TelephoneSets，Handsets and Headsets)”中所描述)。可使用的其它类型的噪声信号包括褐色噪声、蓝色噪声及紫色噪声。

P个情境在至少一个空间及/或频谱特征方面彼此不同。源及麦克风的空间配置可以至少以下方式中的任何一者或一者以上而在一个情境与另一情境之间变化：源相对于其它源的放置及/或定向、麦克风相对于其它麦克风的放置及/或定向、源相对于麦克风的放置及/或定向以及麦克风相对于源的放置及/或定向。P个情境当中的至少两者可对应于以不同空间配置所布置的麦克风及源集合，使得集合当中的麦克风或源中的至少一者在一个情境下具有不同于其在另一情境下的位置或定向的位置或定向。举例来说，P个情境当中的至少两者可涉及便携式通信装置(例如，具有K个麦克风的阵列的手持机或头戴式耳机)相对于例如用户的嘴等信息源的不同定向。在一个情境与另一情境之间不同的空间特征可包括硬件约束(例如，麦克风在装置上的位置)、装置的计划中使用样式(例如，典型的预期用户固持姿态)及/或不同麦克风位置及/或激活(例如，激活三个或三个以上麦克风当中的不同对)。

可在一个情境与另一情境之间变化的频谱特征包括至少以下各项：至少一个源信号的频谱含量(例如，来自不同话音的语音、不同颜色的噪声)，及麦克风中的一者或一者以上的频率响应。在如上文所提及的一个特定实例中，所述情境中的至少两者相对于麦克风中的至少一者有所不同(换句话说，在一个情境下所使用的麦克风中的至少一者在另一情境下由另一麦克风替换或根本不被使用)。此变化可能为需要的，以支持在麦克风的频率及/或相位响应的预期改变范围上为稳固的及/或对于麦克风的失效为稳固的解答。

在另一特定实例中，情境中的至少两者包括背景噪声且相对于背景噪声的特征(即，噪声在频率及/或时间上的统计)有所不同。在此情况下，干扰源可经配置以在P个情境中的一者下发射一种颜色(例如，白色、粉色或霍斯)或类型(例如，街道噪声、串音噪声或汽车噪声的再现)的噪声，且在P个情境中的另一者下发射另一颜色或类型的噪声(例如，在一个情境下为串音噪声，且在另一情境下为街道及/或汽车噪声)。

P个情境中的至少两者可包括产生具有大体上不同频谱含量的信号的信息源。在语音应用中，例如，两个不同情境下的信息信号可为不同话音，例如具有彼此相差不小于10％、20％、30％或甚至50％的平均间距(即，在情境的长度上)的两个话音。可在一个情境与另一情境之间变化的另一特征为源的输出振幅相对于其它源的输出振幅。可在一个情境与另一情境之间变化的另一特征为麦克风的增益敏感性相对于其它麦克风的增益敏感性。

如下文所描述，K通道训练信号集合在任务T30中用以获得经收敛滤波器系数值集合。训练信号中的每一者的持续时间可基于训练操作的预期收敛速率来选择。举例来说，可能需要针对每一训练信号选择持续时间，所述持续时间足够长以准许朝向收敛的显著进展，但足够短以允许其它训练信号也大体上有助于经收敛解答。在典型应用中，训练信号中的每一者持续从约0.5秒或一秒到约五秒或十秒。对于典型训练操作来说，训练信号的复本以随机次序连接以获得待用于训练的声音文件。训练文件的典型长度包括10、30、45、60、75、90、100及120秒。

在近场情境下(例如，当通信装置靠近于用户的嘴而固持时)，可在麦克风输出之间存在与在远场情境下(例如，当装置较远离于用户的嘴而固持时)不同的振幅及延迟关系。可能需要使P个情境的范围包括近场情境及远场情境两者。如下文所提及，任务T30可经配置以使用来自近场情境及远场情境的训练信号来训练不同滤波器。

对于P个声学情境中的每一者来说，信息信号可通过以下操作而提供到K个麦克风：从用户的嘴再现人工语音(如1993年3月瑞士日内瓦国际电信联盟(InternationalTelecommunication Union，Geneva，CH)的ITU-T推荐P.50中所描述)及/或发出例如哈佛句(Harvard Sentence)中的一者或一者以上等标准化词汇的话音(如1969年的IEEE音频及电声学学报(IEEE Transactions on Audio and Electroacoustics)第17卷第227到246页中的用于语音质量测量的IEEE推荐实践(IEEE Recommended Practices for SpeechQuality Measurements)中所描述)。在一个此类实例中，从HATS的嘴扩音器以89dB 的声压电平来再现语音。P个情境中的至少两者可相对于此信息信号而彼此不同。举例来说，不同情境可使用具有大体上不同间距的话音。另外或在替代方案中，P个情境中的至少两者可使用参考装置的不同例项(例如，以支持对于不同麦克风的响应变化为稳固的经收敛解答)。

在一个特定应用集合中，K个麦克风为用于无线通信的便携式装置(例如，蜂窝式电话手持机)的麦克风。图1A及图1B展示此装置的两个不同操作配置，且图2到图4B展示这些配置的各种不同定向状态。两个或两个以上此类定向状态可在P个情境中的不同情境下使用。举例来说，可能需要使K通道训练信号中的一者基于由处于这两个定向中的一者的麦克风所产生的信号，且使K通道训练信号中的另一者基于由处于这两个定向中的另一者的麦克风所产生的信号。

还有可能针对装置的不同操作配置中的每一者而执行方法M10的单独例项(例如，以获得每一配置的单独经收敛滤波器状态集合)。在此情况下，设备A200可经配置以在运行时间在各种经收敛滤波器状态集合当中(即，在滤波器组100的不同例项当中)进行选择。举例来说，设备A200可经配置以选择对应于开关的指示装置为打开还是关闭的状态的滤波器状态集合。

在另一特定应用集合中，K个麦克风为有线或无线耳机或其它头戴式耳机的麦克风。图9展示如本文中所描述的此头戴式耳机的一个实例63。此头戴式耳机的训练情境可包括如参看以上手持机应用所描述的信息源及/或干扰源的任何组合。可通过P个训练情境中的不同训练情境而模型化的另一差异为换能器轴线相对于耳朵的变化角度，如在图9中由头戴式耳机安装可变性66所指示。此变化实际上可在一个用户与另一用户之间发生。此变化可相对于相同用户在磨损装置的单一周期上相等。将理解，此变化可通过改变从换能器阵列到用户的嘴的方向及距离而不利地影响信号分离性能。在此情况下，可能需要使多个K通道训练信号中的一者基于头戴式耳机以处于或接近预期安装角度范围的一个极值的角度而安装于耳朵65中的情境，且使K通道训练信号中的另一者基于头戴式耳机以处于或接近预期安装角度范围的另一极值的角度而安装于耳朵65中的情境。P个情境中的其它情境可包括对应于为这些极值之间的中间值的角度的一个或一个以上定向。

在另一应用集合中，K个麦克风为提供于免持汽车套件中的麦克风。图39展示此通信装置83的一个实例，其中扩音器85侧靠于麦克风阵列84而安置。此装置的P个声学情境可包括如参看以上手持机应用所描述的信息源及/或干扰源的任何组合。举例来说，如图40所示，P个情境中的两者或两者以上可在所要扬声器相对于麦克风阵列的放置方面有所不同。P个情境中的一者或一者以上还可包括从扩音器85再现干扰信号。不同情境可包括从扩音器85所再现的干扰信号，例如在时间及/或频率方面具有不同特征(例如，大体上不同间距频率)的音乐及/或话音。在此情况下，可能需要使方法M10产生分离干扰信号与所要语音信号的至少一个滤波器状态。P个情境中的一者或一者以上还可包括干扰，例如如上文所描述的漫射或指向噪声场。

在另一应用集合中，K个麦克风为提供于笔、铁笔或其它绘图装置中的麦克风。图41展示此装置79的一个实例，其中麦克风80相对于从尖端到达且由尖端与绘图表面81之间的接触所引起的刮擦噪声82而以端射配置进行安置。此通信装置的P个情境可包括如参看以上应用所描述的信息源及/或干扰源的任何组合。另外或在替代方案中，不同情境可包括越过不同表面拖曳装置79的尖端以引出刮擦噪声82的不同例项(例如，在时间及/或频率方面具有不同特征)。与如上文所论述的手持机或头戴式耳机应用相比，可能需要在此应用中使方法M10产生分离干扰源(即，刮擦噪声)而非信息源(即，用户的话音)的滤波器状态集合。在此情况下，经分离干扰可在稍后处理级中从所要信号移除(例如，应用为如本文中所描述的噪声参考)。

通过方法M10而产生的经收敛滤波器解答集合的空间分离特性(例如，各种波束样式的形状及定向)可能对于在任务T10中用以获取训练信号的麦克风的相对特性为敏感的。可能需要在使用装置来记录训练信号集合之前至少相对于彼此校准参考装置的K个麦克风的增益。还可能需要在生产期间及/或之后至少相对于彼此校准每一生产装置的麦克风的增益。

即使个别麦克风元件在声学方面经良好地特征化，在例如元件安装到通信装置的方式及声学端口的质量等因素方面的差异也可导致类似麦克风元件在实际使用中具有显著不同的频率及增益响应样式。因此，可能需要在麦克风阵列已安装于通信装置中之后执行麦克风阵列的此校准。

麦克风阵列的校准可在特殊噪声场内执行，其中通信装置以特定方式定向于所述噪声场内。图42展示两麦克风手持机的实例，所述两麦克风手持机被放置到两点源噪声场中，使得两个麦克风(其每一者可为全向或单向的)均同等地暴露到相同SPL电平。可用以执行生产装置(例如，手持机)的工厂校准的其它校准外壳及程序的实例描述于2008年6月30日申请的题为“用于校准多麦克风装置的系统、方法及设备(SYSTEMS，METHODS，AND APPARATUS FOR CALIBRATION OF MULTI-MICROPHONEDEVICES)”的第61/077,144号美国专利申请案中，所述文献据此为了限于多麦克风装置的校准的目的而以引用的方式并入。使参考装置的麦克风的频率响应及增益匹配可有助于在生产期间校正声学空穴及/或麦克风敏感性的波动，且还可能需要校准每一生产装置的麦克风。

可能需要确保生产装置的麦克风与参考装置的麦克风使用相同程序而经适当地校准。或者，可在生产期间使用不同声学校准程序。举例来说，可能需要使用实验室程序而在房间大小的无回声腔室中校准参考装置，且在工厂地板上在便携式腔室(例如，如上文所并入的第61/077,144号美国专利申请案中所描述)中校准每一生产装置。对于在生产期间执行声学校准程序为不可行的情况，可能需要配置生产装置以执行自动增益匹配程序。此程序的实例描述于2008年6月2日申请的题为“用于一对麦克风的自动增益匹配的系统及方法(SYSTEM AND METHOD FOR AUTOMATIC GAIN MATCHINGOF A PAIR OF MICROPHONES)”的第61/058,132号美国临时专利申请案中，所述文献据此为了限于麦克风校准的技术及/或实施方案的描述的目的而以引用的方式并入。

生产装置的麦克风的特性可随时间而漂移。或者或另外，此装置的阵列配置可随时间而机械地改变。因此，可能需要在通信装置内包括校准例程，所述校准例程经配置以在服务期间周期性地或在发生某其它事件(例如，用户选择)后便使一个或一个以上麦克风频率性质及/或敏感性(例如，麦克风增益之间的比率)匹配。此程序的实例描述于如上文所并入的第61/058,132号美国临时专利申请案中。

P个情境中的一者或一者以上可包括驱动通信装置的一个或一个以上扩音器(例如，通过人工语音及/或发出标准化词汇的话音)以提供指向干扰源。包括一个或一个以上此类情境可有助于支持所得经收敛滤波器解答对于来自远端音频信号的干扰的稳固性。在此情况下，可能需要使参考装置的扩音器为与生产装置的扩音器相同的模型，且以与生产装置的扩音器相同的方式且在与生产装置的扩音器相同的位置中进行安装。对于如图1A所示的操作配置来说，此情境可包括驱动主要扬声器SP10，而对于如图1B所示的操作配置来说，此情境可包括驱动次要扬声器SP20。除了(例如)由如图38所示的干扰源阵列所建立的漫射噪声场以外或在所述漫射噪声场的替代方案中，情境可包括此干扰源。

或者或另外，方法M10的例项可经执行以获得如上文所描述的回声消除器EC10的一个或一个以上经收敛滤波器集合。对于回声消除器在滤波器组100的上游的情况，可在记录滤波器组100的训练信号期间使用回声消除器的经训练滤波器。对于回声消除器在滤波器组100的下游的情况，可在记录回声消除器的训练信号期间使用滤波器组100的经训练滤波器。

虽然位于无回声腔室内的HATS被描述为用于在任务T10中记录训练信号的合适测试装置，但任何其它具有人类特点的模拟器或人类扬声器可用以替代所要语音产生源。在此情况下，可能需要使用至少某种量的背景噪声(例如，以在所要音频频率范围上较好地调节滤波器系数矩阵)。还有可能在使用生产装置之前及/或在使用生产装置期间对生产装置执行测试。举例来说，可基于通信装置的用户的特征(例如，麦克风到嘴的典型距离)及/或基于预期使用环境来个人化所述测试。可针对用户响应而设计一系列预设“问题”，例如，其可有助于将系统调节到特定特征、特性、环境、使用等等。

任务T20分类训练信号集合中的每一训练信号以获得Q个训练信号子集，其中Q为等于待在任务T30中训练的滤波器的数目的整数。分类可基于每一训练信号的所有K个通道来执行，或分类可限于少于每一训练信号的所有K个通道的通道。对于K大于M的情况，例如，可能需要使分类限于每一训练信号的M个通道的相同集合(也就是说，仅源自用以记录训练信号的阵列的M个麦克风的特定集合的那些通道)。

分类准则可包括先验知识及/或试探法。在一个此类实例中，任务T20基于记录每一训练信号所在的情境而将每一训练信号指派到特定子集。可能需要使任务T20将来自近场情境的训练信号分类为不同于来自远场情境的训练信号的一个或一个以上子集。在另一实例中，任务T20基于训练信号的两个或两个以上通道的相对能量而将训练信号指派到特定子集。

或者或另外，分类准则可包括通过使用一个或一个以上空间分离滤波器来空间地处理训练信号而获得的结果。所述滤波器可根据通过任务T30的先前反复而产生的对应一个或一个以上经收敛滤波器状态来配置。或者或另外，一个或一个以上此类滤波器可根据如本文中所描述的波束成形或经组合BSS/波束成形方法来配置。可能需要(例如)使任务T20基于发现Q个空间分离滤波器中的哪一者产生信号的语音与噪声分量的最好分离(例如，根据如上文参看图14A到图14D所论述的准则)而分类每一训练信号。

如果任务T20不能将所有训练信号分类为Q个子集，则可能需要增加Q的值。或者，可能需要在执行分类任务T20的另一反复之前针对不同麦克风放置而重复记录任务T10以获得新训练信号集合，更改分类准则中的一者或一者以上，及/或选择每一训练信号的M个通道的不同集合。任务T20可使用个人计算机或工作站而在参考装置内执行，但通常在通信装置外部执行。

任务T30根据相应源分离算法而使用Q个训练子集中的每一者来训练对应自适应滤波器结构(即，以计算对应经收敛滤波器解答)。Q个滤波器结构中的每一者可包括前馈及/或反馈系数，且可为有限脉冲响应(FIR)或无限脉冲响应(IIR)设计。所述滤波器结构的实例描述于如上文所并入的第12/197,924号美国专利申请案中。任务T30可使用个人计算机或工作站而在参考装置内执行，但通常在通信装置外部执行。

术语“源分离算法”包括例如独立分量分析(ICA)等盲源分离算法及例如独立向量分析(IVA)等相关方法。盲源分离(BSS)算法为仅基于源信号的混合物来分离个别源信号(其可包括来自一个或一个以上信息源及一个或一个以上干扰源的信号)的方法。术语“盲”指代参考信号或所关注信号为不可用的事实，且这些方法通常包括关于信息及/或干扰信号中的一者或一者以上的统计的假设。在语音应用中，例如，通常假设所关注语音信号具有超高斯分布(例如，高峰度)。

典型的源分离算法经配置以处理经混合信号集合以产生经分离通道集合，所述经分离通道包括(A)具有信号及噪声两者的组合通道及(B)至少一个噪声占优势的通道。组合通道还可与输入通道相比具有增加的信噪比(SNR)。可能需要使任务T30产生经收敛滤波器结构，所述经收敛滤波器结构经配置以对具有指向分量的输入信号进行滤波，使得在所得输出信号中，指向分量的能量集中到输出通道中的一者中。

BSS算法类别包括多变量盲解卷积算法。源分离算法还包括BSS算法的变型(例如，ICA及IVA)，所述变型根据例如源信号中的一者或一者以上中的每一者相对于(例如)麦克风阵列的轴线的已知方向等其它先验信息而受约束。可仅基于指向信息且不基于所观测信号而区分这些算法与应用固定非自适应解答的波束成形器。

如本文中所提及，滤波器组100的空间分离滤波器及/或自适应滤波器450的空间分离滤波器中的每一者可使用BSS、波束成形或经组合BSS/波束成形方法来构造。BSS方法可包括实施ICA、IVA、受约束ICA或受约束IVA中的至少一者。独立分量分析为用于分离彼此大概独立的经混合源信号(分量)的技术。在其简化形式中，独立分量分析对经混合信号操作“未混合”权数矩阵(例如，使矩阵与经混合信号相乘)以产生经分离信号。向权数指派初始值，且接着对其进行调整以最大化信号的联合熵，以便最小化信息冗余。重复此权数调整及熵增加过程，直到将信号的信息冗余降低到最小值为止。例如ICA等方法提供用于分离语音信号与噪声源的相对准确且灵活的方式。独立向量分析(“IVA”)为相关技术，其中源信号为向量源信号而非单一可变源信号。因为这些技术不需要关于每一信号的源的信息，所以其被称为“盲源分离”方法。盲源分离问题指代分离来自多个独立源的经混合信号的观念。

Q个空间分离滤波器(例如，滤波器组100的Q个空间分离滤波器或自适应滤波器450的Q个空间分离滤波器)中的每一者是基于对应自适应滤波器结构，所述自适应滤波器结构的系数值是通过任务T30使用从源分离算法导出的学习规则来计算的。图43A展示包括两个反馈滤波器C110及C120的自适应滤波器结构FS10的两通道实例的框图，且图43B展示还包括两个直接滤波器D110及D120的滤波器结构FS10的实施方案FS20的框图。由任务T30用以训练此结构的学习规则可经设计以最大化滤波器的输出通道之间的信息(例如，以最大化由滤波器的输出通道中的至少一者所含有的信息量)。此准则还可重述为最大化输出通道的统计独立性或最小化输出通道当中的相互信息或最大化输出处的熵。可使用的不同学习规则的特定实例包括最大信息(还被称为infomax)、最大似然性及最大非高斯性(例如，最大峰度)。这些自适应结构及基于ICA或IVA自适应反馈及前馈方案的学习规则的其它实例描述于以下文献中：2006年3月9日公开的题为“用于根据稳定性约束使用独立分量分析进行语音处理的系统及方法(System andMethod for Speech Processing using Independent Component Analysis under StabilityConstraints)”的第2006/0053002A1号美国公开专利申请案；2006年3月1日申请的题为“用于使用盲信号源处理的改进型信号分离的系统及方法(System and Method forImproved Signal Separation using a Blind Signal Source Process)”的第60/777,920号美国临时申请案；2006年3月1日申请的题为“用于产生经分离信号的系统及方法(Systemand Method for Generating a Separated Signal)”的第60/777,900号美国临时申请案；及题为“用于盲源信号分离的系统及方法(Systems and Methods for Blind Source SignalSeparation)”的国际专利公开案WO 2007/100330A1(基姆(Kim)等人)。对自适应滤波器结构及可在任务T30中用以训练这些滤波器结构的学习规则的额外描述可在如上文以引用的方式并入的第12/197,924号美国专利申请案中找到。

Q个滤波器中的一者或一者以上(可能全部)可基于相同自适应结构，其中每一此类滤波器是根据不同学习规则来训练的。或者，所有Q个滤波器可基于不同自适应滤波器结构。可用以训练如图43A所示的反馈结构FS10的学习规则的一个实例可表达如下：

y_{1} (t) = x_{1} (t) + (h_{12} (t) &CircleTimes; y_{2} (t)) - - - (1)

y_{2} (t) = x_{2} (t) + (h_{21} (t) &CircleTimes; y_{1} (t)) - - - (2)

Δh_12k＝-f(y₁(t))×y₂(t-k) (3)

Δh_21k＝-f(y₂(t))×y₁(t-k) (4)

其中t表示时间样本索引，h₁₂(t)表示滤波器C110在时间t处的系数值，h₂₁(t)表示滤波器C120在时间t处的系数值，符号

表示时域卷积运算，Δh_12k表示在计算输出值y₁(t)及y₂(t)之后的滤波器C110的第k系数值的改变，且Δh_21k表示在计算输出值y₁(t)及y₂(t)之后的滤波器C120的第k系数值的改变。可能需要实施激活函数f作为近似所要信号的累积密度函数的非线性有界函数。可用于语音应用的激活信号f的非线性有界函数的实例包括双曲线正切函数、S型函数及符号函数。

ICA及IVA技术允许调适滤波器以解决非常复杂的情境，但并非一直有可能或需要针对经配置以实时地调适的信号分离过程实施这些技术。第一，为调适所需要的收敛时间及指令的数目对于一些应用可为禁止性的。虽然呈良好初始条件的形式的先验训练知识的并入可加速收敛，但在一些应用中，调适不是必要的或仅对于声学情境的一部分为必要的。第二，如果输入通道的数目较大，则IVA学习规则可能收敛慢得多且陷入局部最小值中。第三，IVA的在线调适的计算成本可为禁止性的。最后，自适应滤波可与可由用户感知为额外混响或有害于安装于处理方案的下游的语音辨识系统的瞬变及自适应增益调制相关联。

可用于线性麦克风阵列处理的另一技术类别通常被称为“波束成形”。波束成形技术使用通道之间由麦克风的空间分集所引起的时间差来增强从特定方向到达的信号的分量。更明确地说，很可能的是麦克风中的一者将较直接定向于所要源(例如，用户的嘴)处，而另一麦克风可产生经相对衰减的来自此源的信号。这些波束成形技术为空间滤波方法，其操纵波束朝向声音源，从而在其它方向处放置空值。波束成形技术不对声音源做出假设，但为了使信号解混响或局部化声音源的目的而假设源与传感器之间的几何形状或声音信号自身为已知的。滤波器组100中的滤波器中的一者或一者以上可根据数据相依性或数据独立性波束成形器设计(例如，超指向性波束成形器、最小平方波束成形器或统计最佳波束成形器设计)而配置。在数据独立性波束成形器设计的情况下，可能需要使波束样式成形以覆盖所要空间区域(例如，通过调谐噪声相关矩阵)。

被称为“通用化旁瓣消除(Generalized Sidelobe Canceling)”(GSC)的稳固自适应波束成形中的经良好研究的技术论述于1999年10月IEEE信号处理学报(IEEETransactions on Signal Processing)第47卷第10号第2677到2684页的O·宝珠山(Hoshuyama，O.)、A·杉山(Sugiyama，A.)、A·平野(Hirano，A.)的用于具有使用受约束自适应滤波器的阻断矩阵的麦克风阵列的稳固自适应波束成形器(A RobustAdaptive Beamformer for Microphone Arrays with a Blocking Matrix using ConstrainedAdaptive Filters)中。通用化旁瓣消除旨在从测量集合滤出单一所要源信号。GSC原理的较完整解释可在(例如)1982年1月IEEE天线及传播学报(IEEE Transactions onAntennas and Propagation)第30卷第1号第27到34页的L·J·格里菲思(Griffiths，L.J.)、C·W·吉姆(Jim，C.W.)的用以线性受约束自适应波束成形的替代方法(An alternativeapproach to linear constrained adaptive beamforming)中找到。

对于Q个训练子集中的每一者，任务T30根据学习规则而将相应自适应滤波器结构训练到收敛。响应于训练子集的信号来更新滤波器系数值可继续进行，直到获得经收敛解答为止。在此操作期间，训练子集的信号中的至少一些可被提交一次以上作为对滤波器结构的输入(可能以不同次序)。举例来说，训练子集可在回路中重复，直到获得经收敛解答为止。收敛可基于滤波器系数值来确定。举例来说，当滤波器系数值不再改变时或当滤波器系数值在某时间间隔上的总改变小于(或者，不大于)阈值时，可决定滤波器已收敛。还可通过评估相关测量而监视收敛。对于包括交叉滤波器的滤波器结构来说，可针对每一交叉滤波器而独立地确定收敛，使得用于一个交叉滤波器的更新操作可终止，而用于另一交叉滤波器的更新操作继续进行。或者，每一交叉滤波器的更新可继续进行，直到所有交叉滤波器已收敛为止。

有可能的是滤波器将在任务T30中收敛到局部最小值，从而在任务T40中针对对应评估集合中的信号中的一者或一者以上(可能全部)而导致所述滤波器的失效。在此情况下，可使用不同训练参数(例如，不同学习速率、不同几何约束，等等)至少针对所述滤波器而重复任务T30。

任务T40通过评估每一滤波器的分离性能而评估在任务T30中所产生的Q个经训练滤波器的集合。举例来说，任务T40可经配置以评估滤波器对一个或一个以上评估信号集合的响应。此评估可自动地及/或通过人类监督而执行。任务T40通常使用个人计算机或工作站而在通信装置外部执行。

任务T40可经配置以获得每一滤波器对相同评估信号集合的响应。此评估信号集合可与在任务T30中所使用的训练集合相同。在一个此类实例中，任务T40获得每一滤波器对训练信号中的每一者的响应。或者，评估信号集合可为不同于但类似于训练集合的信号(例如，使用相同麦克风阵列的至少一部分及相同P个情境中的至少一些而记录)的M通道信号的集合。

任务T40的不同实施方案经配置以获得Q个经训练滤波器中的至少两者(且可能全部)对不同相应评估信号集合的响应。用于每一滤波器的评估集合可与在任务T30中所使用的训练子集相同。在一个此类实例中，任务T40获得每一滤波器对其相应训练子集中的信号中的每一者的响应。或者，每一评估信号集合可为不同于但类似于对应训练子集的信号(例如，使用相同麦克风阵列的至少一部分及相同情境中的至少一者或一者以上而记录)的M通道信号的集合。

任务T40可经配置以根据一个或一个以上度量的值来评估滤波器响应。对于每一滤波器响应来说，例如，任务T40可经配置以计算一个或一个以上度量中的每一者的值且将经计算值与相应阈值进行比较。

可用以评估滤波器的度量的一个实例为以下两者之间的相关：(A)评估信号的原始信息分量(例如，从HATS的嘴扩音器所再现的语音信号)，及(B)滤波器对所述评估信号的响应的至少一个通道。此度量可指示经收敛滤波器结构如何良好地分离信息与干扰。在此情况下，当信息分量大体上与滤波器响应的M个通道中的一者相关且具有与其它通道的较小相关时指示分离。

可用以评估滤波器(例如，以指示滤波器如何良好地分离信息与干扰)的度量的其它实例包括例如方差、高斯性及/或高阶统计矩(例如，峰度)等统计性质。可用于语音信号的度量的额外实例包括零点交叉速率及随时间的突发性(还被称为时间稀疏性)。一般来说，语音信号与噪声信号相比展现较低零点交叉速率及较低时间稀疏性。可用以评估滤波器的度量的另一实例为如由滤波器对评估信号的响应所指示的在记录所述评估信号期间信息或干扰源相对于麦克风阵列的实际位置与波束样式(或空值波束样式)相符合的程度。可能需要使在任务T40中所使用的度量包括或限于在设备A200的对应实施方案中所使用的分离测量(例如，上文参看状态估计器402、404、406、408及414论述的分离测量中的一者或一者以上)。

任务T40可经配置以将每一经计算度量值与对应阈值进行比较。在此情况下，如果每一度量的经计算值高于(或者，至少等于)相应阈值，则滤波器可被称为针对信号产生充分分离结果。一般技术人员将认识到，在此用于多个度量的比较方案中，当一个或一个以上其它度量的经计算值为高时，可降低一个度量的阈值。

任务T40可经配置以检验对于每一评估信号，Q个经训练滤波器中的至少一者产生充分分离结果。举例来说，任务T40可经配置以检验Q个经训练滤波器中的每一者针对其相应评估集合中的每一信号提供充分分离结果。

或者，任务T40可经配置以检验对于评估信号集合中的每一信号，Q个经训练滤波器中的适当一者提供所有Q个经训练滤波器当中的最好分离性能。举例来说，任务T40可经配置以检验Q个经训练滤波器中的每一者针对其相应评估信号集合中的所有信号提供所有Q个经训练滤波器当中的最好分离性能。对于评估信号集合与训练信号集合相同的情况，任务T40可经配置以检验对于每一评估信号，已使用所述信号而训练的滤波器产生最好分离结果。

任务T40还可经配置以通过使用状态估计器400(例如，待用于生产装置中的状态估计器400的实施方案)来评估滤波器响应以将其分类。在一个此类实例中，任务T40获得Q个经训练滤波器中的每一者对训练信号的集合中的每一训练信号的响应。对于这些训练信号中的每一者，将所得Q个滤波器响应提供到状态估计器400，所述状态估计器400指示对应定向状态。任务T40确定所得定向状态集合与来自任务T20的对应训练信号的分类是否匹配(或如何良好地匹配)。

任务T40可经配置以改变经训练滤波器的数目Q的值。举例来说，任务T40可经配置以在Q个经训练滤波器中的一者以上针对其产生充分分离结果的评估信号的数目(或比例)高于(或者，至少等于)阈值的情况下降低Q的值。或者或另外，任务T40可经配置以在针对其发现不充分分离性能的评估信号的数目(或比例)高于(或者，至少等于)阈值的情况下增加Q的值。

有可能的是任务T40将仅针对评估信号中的一些而失效，且可能需要保持对应经训练滤波器适于任务T40针对其而通过的多个评估信号。在此情况下，可能需要重复方法M10以获得其它评估信号的解答。或者，任务T40针对其而失效的信号可作为特殊情况而被忽略。

可能需要使任务T40检验经收敛滤波器解答集合遵守其它性能准则，例如，如在例如TIA-810-B(例如，2006年11月的版本，由弗吉尼亚州阿灵顿的电信工业协会(Telecommunications Industry Association，Arlington，VA)所颁布)等标准文献中所指定的发送响应标称响度曲线。

方法M10通常为反复设计过程，且可能需要改变及重复任务T10、T20、T30及T40中的一者或一者以上，直到在任务T40中获得所要评估结果为止。举例来说，方法M10的反复可包括在任务T30中使用新训练参数、在任务T30中使用新划分及/或在任务T10中记录新训练数据。

有可能使参考装置具有比生产装置多的麦克风。举例来说，参考装置可具有K个麦克风的阵列，而每一生产装置具有M个麦克风的阵列。可能需要选择一麦克风放置(或K通道麦克风阵列的子集)，使得最小数目的固定滤波器集合可充分地分离来自最大数目的用户装置固持样式(或至少用户装置固持样式集合当中的最普通样式)的训练信号。在一个此类实例中，任务T40选择M个通道的子集以用于任务T30的下一反复。

一旦已在任务T40中针对Q个经训练滤波器的集合获得所要评估结果，便可将那些滤波器状态加载到生产装置中作为滤波器组100的滤波器的固定状态。如上文所描述，还可能需要执行用以校准每一生产装置中的麦克风的增益及/或频率响应的程序，例如实验室、工厂或自动(例如，自动增益匹配)校准程序。

在方法M10中所产生的Q个经训练滤波器还可用以对也使用参考装置而记录的另一训练信号集合进行滤波，以便针对自适应滤波器450(例如，针对自适应滤波器450的一个或一个以上组件滤波器)计算初始条件。此针对自适应滤波器计算初始条件的实例描述于2008年8月25日申请的题为“用于信号分离的系统、方法及设备(SYSTEMS，METHODS，AND APPARATUS FOR SIGNAL SEPARATION)”的第12/197,924号美国专利申请案中的(例如)段落[00129]到[00135](以“It may be desirable(可能需要)”开始且以“cancellation in parallel(并行取消)”结束)处，所述段落据此为了限于自适应滤波器的设计、训练及/或实施的描述的目的而以引用的方式并入。这些初始条件还可在生产期间加载到相同或类似装置的其它例项中(例如，就滤波器组100的经训练滤波器而论)。类似地，方法M10的例项可经执行以获得下文所描述的滤波器组200的滤波器的经收敛滤波器状态。

如上文所描述的设备A200的实施方案针对状态估计及产生输出信号S40两者使用单一滤波器组。可能需要针对状态估计及输出产生而使用不同滤波器组。举例来说，可能需要针对状态估计滤波器组使用连续地执行的较不复杂滤波器，且针对输出产生滤波器组使用仅按需要执行的较复杂滤波器。此方法可在一些应用中及/或根据一些性能准则而以较低功率成本来提供较好空间处理性能。一般技术人员还将认识到，此对滤波器的选择性激活还可经应用以支持在不同时间使用相同滤波器结构作为不同滤波器(例如，通过加载不同滤波器系数值集合)。

图44展示根据通用配置的设备A100的框图，所述设备A100包括如本文中所描述的滤波器组100(每一滤波器F10-1到F10-n经配置以产生n个M通道经空间处理信号S20-1到S20-n中的对应一者)及输出产生滤波器组200。滤波器组200的滤波器F20-1到F20-n中的每一者(其可在如上文所描述的设计程序中结合滤波器组100的滤波器而获得)经布置以接收及处理基于输入信号S10的M通道信号且产生M通道经空间处理信号S30-1到S30-n中的对应一者。切换机构300经配置以确定哪一滤波器F10-1到F10-n当前最好地分离输入信号S10的所要分量与噪声分量(例如，如本文中参看状态估计器400所描述)，且至少基于信号S30-1到S30-n中的对应选定一者而产生输出信号S40(例如，如本文中参看转变控制模块500所描述)。切换机构300还可经配置以选择性地激活滤波器F20-1到F20-n中的个别滤波器，使得(例如)仅其输出当前正有助于输出信号S40的滤波器当前为活动的。因此，在任一时间处，滤波器组200可能正输出信号S30-1到S30-n中的少于n个信号(且可能仅一个或两个信号)。

图45展示设备A100的实施方案A110的框图，所述实施方案A110包括滤波器组100的两滤波器实施方案140及滤波器组200的两滤波器实施方案240，使得滤波器组240的滤波器F26-1对应于滤波器组140的滤波器F16-1，且滤波器组240的滤波器F26-2对应于滤波器组140的滤波器F16-2。可能需要将滤波器组240的每一滤波器实施为滤波器组140的对应滤波器的较长或另外较复杂版本，且可能需要使这些对应滤波器的空间处理区域(例如，如图5及图6A到图6C的图中所示)至少大约重合。

设备A110还包括切换机构300的实施方案305，其具有状态估计器400的实施方案420及转变控制模块500的两滤波器实施方案510。在此特定实例中，状态估计器420经配置以将控制信号S90的例项S90-1到S90-2中的对应一者输出到滤波器组240的每一滤波器以仅按需要而启用滤波器。举例来说，状态估计器420可经配置以产生控制信号S90的每一例项(其通常为二进制值的)以(A)在当经估计状态S50指示对应于对应滤波器的定向状态时的周期期间及(B)在当转变控制模块510经配置以转变到所述滤波器的输出或转变远离所述滤波器的输出时的合并时间间隔期间启用所述滤波器。状态估计器420可因此经配置以基于例如以下各项等信息而产生每一控制信号：当前及先前经估计状态、相关联的延迟及合并时间间隔，及/或滤波器组200的对应滤波器的长度。

图46展示设备A100的实施方案A120的框图，所述实施方案A120包括滤波器组100的两滤波器实施方案150及滤波器组200的两滤波器实施方案250，使得滤波器组250的滤波器F28-1对应于滤波器组150的滤波器F18-1，且滤波器组250的滤波器F28-2对应于滤波器组150的滤波器F18-2。在此情况下，在两个级中执行滤波，其中第二级的滤波器(即，滤波器组250的滤波器)仅按需要而经启用(例如，在如上文所描述选择所述滤波器及转变到所述滤波器的输出或转变远离所述滤波器的输出期间)。滤波器组还可经实施以使得滤波器组150的滤波器为固定的，且滤波器组250的滤波器为自适应的。然而，可能需要实施滤波器组250的滤波器以使得每一两级滤波器的空间处理区域(例如，如图5及图6A到图6C的图中所示)与滤波器组100的滤波器中的对应一者的空间处理区域至少大约重合。一般技术人员将认识到，对于本文中揭示设备A200的实施方案的使用的任何上下文来说，可执行设备A100的类似实施方案的替代，且明确地预料且据此揭示所有此类组合及布置。

图47展示处理包括语音分量及噪声分量的M通道输入信号以产生经空间滤波输出信号的方法M100的流程图。方法M100包括将第一空间处理滤波器应用于输入信号的任务T110及将第二空间处理滤波器应用于输入信号的任务T120。方法M100还包括任务T130及T140。在第一时间处，任务T130确定第一空间处理滤波器优于第二空间处理滤波器而分离语音与噪声分量。响应于此确定，任务T140产生基于第一经空间处理信号的信号作为经空间滤波输出信号。方法M100还包括任务T150及T160。在第一时间之后的第二时间处，任务T150确定第二空间处理滤波器优于第一空间处理滤波器而分离语音与噪声分量。响应于此确定，任务T160产生基于第二经空间处理信号的信号作为经空间滤波输出信号。在此方法中，第一及第二经空间处理信号是基于输入信号。

如上文所描述的设备A100可用以执行方法M100的实施方案。在此情况下，在任务T110及T120中所应用的第一及第二空间处理滤波器为滤波器组100的两个不同滤波器。切换机构300可用以执行任务T130及T140，使得第一经空间处理信号为滤波器组200的对应于滤波器组100的在任务T110中所应用的滤波器的滤波器的输出。切换机构300还可用以执行任务T150及T160，使得第二经空间处理信号为滤波器组200的对应于滤波器组100的在任务T120中所应用的滤波器的滤波器的输出。

如上文所描述的设备A200可用以执行方法M100的实施方案。在此情况下，滤波器组100的在任务T110中所使用的滤波器还产生任务T140中的输出信号所基于的第一经空间处理信号，且滤波器组100的在任务T120中所使用的滤波器还产生任务T160中的输出信号所基于的第二经空间处理信号。

图48展示用于处理包括语音分量及噪声分量的M通道输入信号以产生经空间滤波输出信号的设备F100的框图。设备F100包括用于对输入信号执行第一空间处理操作的装置F110及用于对输入信号执行第二空间处理操作的装置F120(例如，如上文参看滤波器组100以及任务T110及T120所描述)。设备F100还包括用于在第一时间处确定用于执行第一空间处理操作的装置优于用于执行第二空间处理操作的装置而分离语音与噪声分量的装置F130(例如，如上文参看状态估计器400及任务T130所描述)及用于响应于此确定而产生基于第一经空间处理信号的信号作为输出信号的装置F140(例如，如上文参看转变控制模块500及任务T140所描述)。设备F100还包括用于在第一时间之后的第二时间处确定用于执行第二空间处理操作的装置优于用于执行第一空间处理操作的装置而分离语音与噪声分量的装置F150(例如，如上文参看状态估计器400及任务T150所描述)及用于响应于此确定而产生基于第二经空间处理信号的信号作为输出信号的装置F160(例如，如上文参看转变控制模块500及任务T160所描述)。

图49展示通信装置C100的一个实例的框图，所述通信装置C100可包括如本文中所揭示的设备A100或A200的实施方案。装置C100含有芯片或芯片组CS10(例如，如本文中所描述的MSM芯片组)，其经配置以经由天线C30而接收射频(RF)通信信号且解码及经由扩音器SP10再现在RF信号内所编码的音频信号。芯片/芯片组CS10还经配置以经由M个麦克风的阵列(展示两个麦克风MC10及MC20)而接收M通道音频信号，使用设备A100或A200的内部实施方案来空间地处理M通道信号，编码所得音频信号，且经由天线C30而发射描述经编码音频信号的RF通信信号。装置C100还可在去往天线C30的路径中包括双工器及一个或一个以上功率放大器。芯片/芯片组 CS10还经配置以经由小键盘C10而接收用户输入且经由显示器C20而显示信息。在此实例中，装置C100还包括一个或一个以上天线C40以支持全球定位系统(GPS)位置服务及/或与例如无线(例如，BluetoothTM)头戴式耳机等外部装置的短程通信。在另一实例中，此通信装置自身为蓝牙头戴式耳机且缺少小键盘C10、显示器C20及天线C30。

提供对所描述配置的前述呈现以使得所属领域的技术人员能够制作或使用本文中所揭示的方法及其它结构。本文所展示及描述的流程图、框图、状态图及其它结构仅为实例，且这些结构的其它变型也处于本发明的范围内。对这些配置的各种修改为可能的，且本文中所呈现的一般原理还可应用于其它配置。因此，本发明不希望限于上文所展示的配置，而是应被赋予与在本文中(包括在所申请的形成原始揭示内容的一部分的附加权利要求书中)以任何形式揭示的原理及新颖特征一致的最广范围。

如本文中所揭示的设备的实施方案的各种元件可以被视为适于既定应用的硬件、软件及/或固件的任何组合来体现。举例来说，可将所述元件制造为驻留于(例如)相同芯片上或芯片组中的两个或两个以上芯片当中的电子及/或光学装置。此装置的一个实例为固定或可编程逻辑元件(例如，晶体管或逻辑门)阵列，且这些元件中的任一者可实施为一个或一个以上此类阵列。这些元件中的任何两者或两者以上或甚至全部可实施于相同阵列内。所述阵列可实施于一个或一个以上芯片内(例如，包括两个或两个以上芯片的芯片组内)。

本文中所揭示的设备的各种实施方案的一个或一个以上元件还可整体或部分地实施为一个或一个以上指令集，所述指令集经布置以在一个或一个以上固定或可编程逻辑元件阵列上执行，所述逻辑元件阵列例如为微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA(现场可编程门阵列)、ASSP(专用标准产品)及ASIC(专用集成电路)。如本文中所揭示的设备的实施方案的各种元件中的任一者还可体现为一个或一个以上计算机(例如，包括经编程以执行一个或一个以上指令集或指令序列的一个或一个以上阵列的机器，还被称为“处理器”)，且这些元件中的任何两者或两者以上或甚至全部可实施于相同的所述计算机内。

技术人员将了解，结合本文中所揭示的配置而描述的各种说明性逻辑块、模块、电路及操作可实施为电子硬件、计算机软件或两者的组合。所述逻辑块、模块、电路及操作可用经设计以执行本文中所描述的功能的通用处理器、数字信号处理器(DSP)、ASIC或ASSP、FPGA或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合来实施或执行。通用处理器可为微处理器，但在替代方案中，处理器可为任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合，例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。软件模块可驻留于RAM(随机存取存储器)、ROM(只读存储器)、例如快闪RAM等非易失性RAM(NVRAM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储媒体中。说明性存储媒体耦合到处理器，使得处理器可从存储媒体读取信息及向存储媒体写入信息。在替代方案中，存储媒体可与处理器成一体式。处理器及存储媒体可驻留于ASIC中。ASIC可驻留于用户终端中。在替代方案中，处理器及存储媒体可作为离散组件而驻留于用户终端中。

请注意，本文中所揭示的各种方法(例如，根据如本文中所揭示的设备的各种实施方案的操作的描述)可通过例如处理器等逻辑元件阵列来执行，且如本文中所描述的设备的各种元件可实施为经设计以在此阵列上执行的模块。如本文中所使用，术语“模块”或“子模块”可指代呈软件、硬件或固件形式的任何方法、设备、装置、单元或包括计算机指令(例如，逻辑表达式)的计算机可读数据存储媒体。应理解，多个模块或系统可组合为一个模块或系统，且一个模块或系统可分离为用以执行相同功能的多个模块或系统。当以软件或其它计算机可执行指令来实施时，过程的元素本质上为用以例如通过例程、程序、对象、组件、数据结构及其类似者来执行相关任务的码段。术语“软件”应被理解为包括源码、汇编语言码、机器码、二进制码、固件、宏码、微码、可由逻辑元件阵列执行的任何一个或一个以上指令集或指令序列以及这些实例的任何组合。程序或码段可存储于处理器可读媒体中或经由传输媒体或通信链路而通过包含于载波中的计算机数据信号来传输。

本文中所揭示的方法、方案及技术的实施方案还可有形地体现(例如，在如本文中所列出的一个或一个以上计算机可读媒体中)为可由包括逻辑元件阵列(例如，处理器、微处理器、微控制器或其它有限状态机)的机器读取及/或执行的一个或一个以上指令集。术语“计算机可读媒体”可包括可存储或传送信息的任何媒体，包括易失性、非易失性、可装卸及非可装卸媒体。计算机可读媒体的实例包括电子电路、半导体存储器装置、ROM、快闪存储器、可擦除ROM(EROM)、软盘或其它磁性存储装置、CD-ROM/DVD或其它光学存储装置、硬盘、光纤媒体、射频(RF)链路或可用以存储所要信息且可被存取的任何其它媒体。计算机数据信号可包括可经由例如电子网络通道、光纤、空气、电磁、RF链路等传输媒体而传播的任何信号。可经由例如因特网或内部网等计算机网络而下载码段。在任何情况下，本发明的范围不应被解释为受这些实施例限制。

在如本文中所揭示的方法的实施方案的典型应用中，逻辑元件(例如，逻辑门)阵列经配置以执行所述方法的各种任务中的一者、一者以上或甚至全部。还可将任务中的一者或一者以上(可能全部)实施为包含于计算机程序产品(例如，一个或一个以上数据存储媒体，例如盘、快闪或其它非易失性存储卡、半导体存储器芯片，等等)中的代码(例如，一个或一个以上指令集)，所述计算机程序产品可由包括逻辑元件阵列(例如，处理器、微处理器、微控制器或其它有限状态机)的机器(例如，计算机)读取及/或执行。如本文中所揭示的方法的实施方案的任务还可由一个以上此类阵列或机器执行。在这些或其它实施方案中，任务可在用于无线通信的装置内执行，所述装置例如为蜂窝式电话或具有此通信能力的其它装置。此装置可经配置以与电路交换及/或包交换网络通信(例如，使用例如VoIP等一个或一个以上协议)。举例来说，此装置可包括经配置以接收经编码帧的RF电路。

明确地揭示，本文中所揭示的各种方法可由例如手持机、头戴式耳机或便携式数字助理(PDA)等便携式通信装置执行，且本文中所描述的各种设备可包括有此装置。典型的实时(例如，在线)应用为使用此移动装置而进行的电话谈话。

在一个或一个以上示范性实施例中，所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施，则功能可作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体而传输。术语“计算机可读媒体”包括计算机存储媒体及通信媒体两者，所述通信媒体包括促进将计算机程序从一个位置传送到另一位置的任何媒体。存储媒体可为可由计算机存取的任何可用媒体。借助于实例而非限制，所述计算机可读媒体可包含：存储元件阵列，例如半导体存储器(其可包括但不限于动态或静态RAM、ROM、EEPROM及/或快闪RAM)或铁电存储器、磁阻存储器、双向存储器、聚合存储器或相变存储器；CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置，或可用于以指令或数据结构的形式携载或存储所要程序代码且可由计算机存取的任何其它媒体。而且，可适当地将任何连接称为计算机可读媒体。举例来说，如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及/或微波等无线技术而从网站、服务器或其它远程源传输软件，则同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电及/或微波等无线技术包括于媒体的定义中。如本文中所使用，磁盘及光盘包括紧密光盘(CD)、激光光盘、光学光盘、数字通用光盘(DVD)、软性磁盘及Blu-ray DiscTM(加利福尼亚州环球城市蓝光光盘协会(Blu-RayDisc Association，Universal City，CA))，其中磁盘通常以磁性方式再现数据，而光盘通过激光以光学方式再现数据。上述各项的组合也应包括于计算机可读媒体的范围内。

如本文中所描述的声学信号处理设备可并入到例如通信装置等电子装置中，所述电子装置接受语音输入以便控制某些功能或可另外受益于所要噪声与背景噪声的分离。许多应用可受益于增强清楚的所要声音或分离清楚的所要声音与源自多个方向的背景声音。所述应用可包括并入有例如话音辨识及检测、语音增强及分离、话音激活式控制等能力的电子或计算装置中的人机界面。可能需要实施此声学信号处理设备以在仅提供有限处理能力的装置中为合适的。

本文中所描述的模块、元件及装置的各种实施方案的元件可制造为驻留于(例如)相同芯片上或芯片组中的两个或两个以上芯片当中的电子及/或光学装置。此装置的一个实例为固定或可编程逻辑元件(例如，晶体管或门)阵列。本文中所描述的设备的各种实施方案的一个或一个以上元件还可整体或部分地实施为一个或一个以上指令集，所述指令集经布置以在一个或一个以上固定或可编程逻辑元件阵列上执行，所述逻辑元件阵列例如为微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA、ASSP及ASIC。

有可能使如本文中所描述的设备的实施方案的一个或一个以上元件用以执行不直接与设备的操作相关的任务或执行不直接与设备的操作相关的其它指令集，例如与所述设备嵌入于其中的装置或系统的另一操作相关的任务。还有可能使此设备的实施方案的一个或一个以上元件具有共同结构(例如，用以在不同时间执行代码的对应于不同元件的部分的处理器、经执行以在不同时间执行对应于不同元件的任务的指令集，或在不同时间针对不同元件执行操作的电子及/或光学装置布置)。举例来说，VAD 20-1、20-2及/或70可经实施以在不同时间包括相同结构。在另一实例中，滤波器组100及/或滤波器组200的实施方案的一个或一个以上空间分离滤波器可经实施以在不同时间包括相同结构(例如，在不同时间使用不同滤波器系数值集合)。

Claims

1.一种处理包括语音分量及噪声分量的M通道输入信号以产生经空间滤波输出信号的方法，M为大于一的整数，所述方法包含：

将第一空间处理滤波器应用于所述输入信号；

将第二空间处理滤波器应用于所述输入信号；

在第一时间处，确定所述第一空间处理滤波器开始优于所述第二空间处理滤波器而分离所述语音与噪声分量；

响应于在第一时间处的所述确定，产生基于第一经空间处理信号的信号作为所述输出信号；

在所述第一时间之后的第二时间处，确定所述第二空间处理滤波器开始优于所述第一空间处理滤波器而分离所述语音与噪声分量；及

响应于在第二时间处的所述确定，产生基于第二经空间处理信号的信号作为所述输出信号，

其中所述第一及第二经空间处理信号是基于所述输入信号，且

其中所述第一空间处理滤波器的多个系数值是基于多个多通道训练信号，所述多通道训练信号包括使用声音源及麦克风的第一空间配置所记录的信号及使用声音源及麦克风的第二空间配置所记录的信号，所述第二空间配置不同于所述第一空间配置。

2.根据权利要求1所述的方法，其中所述第一空间处理滤波器的所述多个所述系数值是根据基于所述多个多通道训练信号的经收敛滤波器状态获得的。

3.根据权利要求1及2中任一权利要求所述的方法，其中所述将所述第一空间处理滤波器应用于所述输入信号产生所述第一经空间处理信号，且其中所述将所述第二空间处理滤波器应用于所述输入信号产生所述第二经空间处理信号。

4.根据权利要求3所述的方法，其中所述产生基于第一经空间处理信号的信号作为所述输出信号包含产生所述第一经空间处理信号作为所述输出信号，且

其中所述产生基于第二经空间处理信号的信号作为所述输出信号包含产生所述第二经空间处理信号作为所述输出信号。

5.根据权利要求3所述的方法，其中所述产生基于第一经空间处理信号的信号包括将第三空间处理滤波器应用于所述第一经空间处理信号，且其中所述产生基于第二经空间处理信号的信号包括将第四空间处理滤波器应用于所述第二经空间处理信号。

6.根据权利要求1到2中任一权利要求所述的方法，其中所述方法包含确定所述第一空间处理滤波器在紧接于所述第一时间之后的第一延迟时间间隔上继续优于所述第二空间处理滤波器而分离所述语音与噪声分量，且

其中所述产生基于第一经空间处理信号的信号作为所述输出信号在所述第一延迟时间间隔之后开始。

7.根据权利要求6所述的方法，其中所述方法包含确定所述第二空间处理滤波器在紧接于所述第二时间之后的第二延迟时间间隔上继续优于所述第一空间处理滤波器而分离所述语音与噪声分量，且

其中所述产生基于第二经空间处理信号的信号作为所述输出信号在所述第二延迟时间间隔之后发生，且

其中所述第二延迟时间间隔长于所述第一延迟时间间隔。

8.根据权利要求1到2中任一权利要求所述的方法，其中所述方法包含：

将第三空间处理滤波器应用于所述输入信号；

在所述第二时间之后的第三时间处，确定所述第三空间处理滤波器开始优于所述第一空间处理滤波器且优于所述第二空间处理滤波器而分离所述语音与噪声分量；及

响应于在第三时间处的所述确定，产生基于第三经空间处理信号的信号作为所述输出信号，

其中所述第三经空间处理信号是基于所述输入信号。

9.根据权利要求8所述的方法，其中所述产生基于第二经空间处理信号的信号作为所述输出信号包括在第一合并时间间隔上将所述输出信号从基于所述第一经空间处理信号的所述信号转变为基于所述第二经空间处理信号的信号，且

其中所述产生基于第三经空间处理信号的信号作为所述输出信号包括在第二合并时间间隔上将所述输出信号从基于所述第二经空间处理信号的所述信号转变为基于所述第三经空间处理信号的信号，

其中所述第二合并时间间隔长于所述第一合并时间间隔。

10.根据权利要求1到2中任一权利要求所述的方法，其中所述产生基于第二经空间处理信号的信号作为所述输出信号包括在第一合并时间间隔上将所述输出信号从基于所述第一经空间处理信号的所述信号转变为基于所述第二经空间处理信号的信号，且

其中所述转变包括在所述第一合并时间间隔期间产生基于所述第一及第二经空间处理信号两者的信号作为所述输出信号。

11.根据权利要求9所述的方法，其中所述第一经空间处理信号包括第一语音通道及第一噪声通道，且

其中所述转变包括在所述第一合并时间间隔期间相对于所述第一语音通道衰减所述第一噪声通道。

12.根据权利要求1到2中任一权利要求所述的方法，其中所述方法包含应用基于所述输出信号的至少一个通道的噪声参考以降低所述输出信号的另一通道中的噪声。

13.根据权利要求1到2中任一权利要求所述的方法，其中所述第二空间处理滤波器的多个系数值是基于多个多通道训练信号，所述多通道训练信号包括使用声音源及麦克风的第三空间配置所记录的信号及使用声音源及麦克风的第四空间配置所记录的信号，所述第四空间配置不同于所述第三空间配置，且

其中所述第三及第四空间配置两者不同于所述第一及第二空间配置两者。

14.根据权利要求1到2中任一权利要求所述的方法，其中所述第一空间处理滤波器是通过第一系数值矩阵来特征化，且所述第二空间处理滤波器是通过第二系数值矩阵来特征化，且

其中所述第二系数值矩阵至少大体上等于围绕中心垂直轴线翻转所述第一系数值矩阵的结果。

15.根据权利要求1到2中任一权利要求所述的方法，其中所述将第一空间处理滤波器应用于所述输入信号产生语音通道及噪声通道，且

其中在第一时间处的所述确定基于所述噪声通道、所述语音通道、所述输入信号的通道、或所述输入信号的通道与所述语音通道和/或噪声通道的组合。

16.根据权利要求1到2中任一权利要求所述的方法，其中所述将第一空间处理滤波器应用于所述输入信号产生第一经滤波信号，且

其中所述将第二空间处理滤波器应用于所述输入信号产生第二经滤波信号，且

其中在第一时间处的所述确定包括检测所述输入信号的通道与所述第一经滤波信号的通道之间的能量差大于所述输入信号的所述通道与所述第二经滤波信号的通道之间的能量差。

17.根据权利要求1到2中任一权利要求所述的方法，其中所述将第一空间处理滤波器应用于所述输入信号产生第一经滤波信号，且

其中在第一时间处的所述确定包括检测所述第一经滤波信号的两个通道之间的相关的值小于所述第二经滤波信号的两个通道之间的相关的值。

18.根据权利要求1到2中任一权利要求所述的方法，其中所述将第一空间处理滤波器应用于所述输入信号产生第一经滤波信号，且

其中在第一时间处的所述确定包括检测所述第一经滤波信号的通道之间的能量差大于所述第二经滤波信号的通道之间的能量差。

19.根据权利要求1所述的方法，其中在第一时间处的所述确定是基于第一优选常数的值。

20.根据权利要求19所述的方法，其中在第二时间处的所述确定是基于第二优选常数的值，所述第二优选常数的值不同于所述第一优选常数的值。

21.根据权利要求1到2中任一权利要求所述的方法，其中所述将第一空间处理滤波器应用于所述输入信号产生第一经滤波信号，且

其中在第一时间处的所述确定包括检测所述第一经滤波信号的通道的语音测量的值大于所述第二经滤波信号的通道的所述语音测量的值。

22.根据权利要求1到2中任一权利要求所述的方法，其中在第一时间处的所述确定包括计算所述输入信号的两个通道当中的到达时间差。

23.根据权利要求1到2中任一权利要求所述的方法，其中所述方法包含检测在时间间隔上在输入通道上不存在语音活动，及响应于所述检测，抑制(A)在第二时间处的所述确定及(B)响应于在第二时间处的所述确定的所述产生当中的至少一者在所述时间间隔期间发生。

24.一种用于处理包括语音分量及噪声分量的M通道输入信号以产生经空间滤波输出信号的设备，M为大于一的整数，所述设备包含：

用于根据第一多个系数值而对所述输入信号执行第一空间处理操作的装置；

用于对所述输入信号执行第二空间处理操作的装置；

用于在第一时间处确定所述用于执行第一空间处理操作的装置开始优于所述用于执行第二空间处理操作的装置而分离所述语音与噪声分量的装置；

用于响应于来自所述用于在第一时间处确定的装置的所述确定的指示而产生基于第一经空间处理信号的信号作为所述输出信号的装置；

用于在所述第一时间之后的第二时间处确定所述用于执行第二空间处理操作的装置开始优于所述用于执行第一空间处理操作的装置而分离所述语音与噪声分量的装置；及

用于响应于来自所述用于在第二时间处确定的装置的所述确定的指示而产生基于第二经空间处理信号的信号作为所述输出信号的装置，

其中所述第一多个系数值是基于多个多通道训练信号，所述多通道训练信号包括使用声音源及麦克风的第一空间配置所记录的信号及使用声音源及麦克风的第二空间配置所记录的信号，所述第二空间配置不同于所述第一空间配置。

25.根据权利要求24所述的设备，其中所述用于对所述输入信号执行所述第一空间处理操作的装置经配置以产生所述第一经空间处理信号，且其中所述用于对所述输入信号执行所述第二空间处理操作的装置经配置以产生所述第二经空间处理信号，且

其中所述用于产生基于第一经空间处理信号的信号作为所述输出信号的装置经配置以产生所述第一经空间处理信号作为所述输出信号，且

其中所述用于产生基于第二经空间处理信号的信号作为所述输出信号的装置经配置以产生所述第二经空间处理信号作为所述输出信号。

26.根据权利要求25所述的设备，其中所述用于产生基于第一经空间处理信号的信号的装置包括经配置以对所述第一经空间处理信号进行滤波的空间处理滤波器，且其中所述用于产生基于第二经空间处理信号的信号的装置包括经配置以对所述第二经空间处理信号进行滤波的空间处理滤波器。

27.根据权利要求24到26中任一权利要求所述的设备，其中所述用于产生基于第二经空间处理信号的信号作为所述输出信号的装置包括用于在第一合并时间间隔上将所述输出信号从基于所述第一经空间处理信号的所述信号转变为基于所述第二经空间处理信号的信号的装置，且

其中所述用于转变的装置经配置以在所述第一合并时间间隔期间产生基于所述第一及第二经空间处理信号两者的信号作为所述输出信号。

28.根据权利要求27所述的设备，其中所述第一经空间处理信号包括第一语音通道及第一噪声通道，且

其中所述用于转变的装置经配置以在所述第一合并时间间隔期间相对于所述第一语音通道衰减所述第一噪声通道。

29.根据权利要求24到26中任一权利要求所述的设备，其中所述设备包含用于应用基于所述输出信号的至少一个通道的噪声参考以降低所述输出信号的另一通道中的噪声的装置。

30.根据权利要求29所述的设备，其中所述用于应用噪声参考的装置包含降噪滤波器。

31.根据权利要求24到26中任一权利要求所述的设备，其中所述设备包含麦克风阵列，所述麦克风阵列经配置以产生所述输入信号所基于的M通道信号。

32.根据权利要求24到26中任一权利要求所述的设备，其中所述用于执行第二空间处理操作的装置经配置以根据第二多个系数值而执行所述第二空间处理操作，且

其中所述第二多个系数值是基于多个多通道训练信号，所述多通道训练信号包括使用声音源及麦克风的第三空间配置所记录的信号及使用声音源及麦克风的第四空间配置所记录的信号，所述第四空间配置不同于所述第三空间配置，且

33.根据权利要求24到26中任一权利要求所述的设备，其中所述用于执行第一空间处理操作的装置是通过第一系数值矩阵来特征化，且所述用于执行第二空间处理操作的装置是通过第二系数值矩阵来特征化，且

34.根据权利要求24到26中任一权利要求所述的设备，其中所述用于对所述输入信号执行第一空间处理操作的装置经配置以产生语音通道及噪声通道，且

其中所述在第一时间处的确定基于所述噪声通道、所述语音通道、所述输入信号的通道、或所述输入信号的通道与所述语音通道和/或噪声通道的组合。

35.根据权利要求24到26中任一权利要求所述的设备，其中所述用于对所述输入信号执行第一空间处理操作的装置产生第一经滤波信号，且

其中所述用于对所述输入信号执行第二空间处理操作的装置产生第二经滤波信号，且

其中所述用于在第一时间处确定的装置包括用于检测所述输入信号的通道与所述第一经滤波信号的通道之间的能量差大于所述输入信号的所述通道与所述第二经滤波信号的通道之间的能量差的装置。

36.根据权利要求24到26中任一权利要求所述的设备，其中所述用于对所述输入信号执行第一空间处理操作的装置产生第一经滤波信号，且

其中所述用于在第一时间处确定的装置包括用于检测所述第一经滤波信号的两个通道之间的相关的值小于所述第二经滤波信号的两个通道之间的相关的值的装置。

37.根据权利要求24到26中任一权利要求所述的设备，其中所述用于对所述输入信号执行第一空间处理操作的装置产生第一经滤波信号，且

其中所述用于在第一时间处确定的装置包括用于检测所述第一经滤波信号的通道之间的能量差大于所述第二经滤波信号的通道之间的能量差的装置。

38.根据权利要求24到26中任一权利要求所述的设备，其中所述用于在第一时间处确定的装置经配置以基于第一优选常数的值而执行所述确定。

39.根据权利要求38所述的设备，其中所述用于在第二时间处确定的装置经配置以基于第二优选常数的值而执行所述确定，所述第二优选常数的值不同于所述第一优选常数的值。

40.根据权利要求24到26中任一权利要求所述的设备，其中所述用于对所述输入信号执行第一空间处理操作的装置产生第一经滤波信号，且

其中所述用于在第一时间处确定的装置包括用于检测所述第一经滤波信号的通道的语音测量的值大于所述第二经滤波信号的通道的所述语音测量的值的装置。

41.根据权利要求24到26中任一权利要求所述的设备，其中所述用于在第一时间处确定的装置经配置以计算所述输入信号的两个通道当中的到达时间差。

42.根据权利要求24到26中任一权利要求所述的设备，其中所述设备包括话音活动检测器，所述话音活动检测器经配置以产生对在时间间隔上在输入通道上不存在语音活动的指示，且

其中所述设备经配置以响应于所述话音活动检测器的所述指示而抑制所述用于在第二时间处确定的装置的所述指示的状态改变在所述时间间隔期间发生。

43.根据权利要求24到26中任一权利要求所述的设备，其中所述用于对所述输入信号执行第一空间处理操作的装置是经配置以对所述输入信号进行滤波的第一空间处理滤波器，且

其中所述用于对所述输入信号执行第二空间处理操作的装置是经配置以对所述输入信号进行滤波的第二空间处理滤波器。

44.根据权利要求43所述的设备，其中所述第一空间处理滤波器的所述多个所述系数值是根据基于所述多个多通道训练信号的经收敛滤波器状态获得的。

45.根据权利要求24到26中任一权利要求所述的设备，其中所述设备包括转变控制模块，所述转变控制模块包含所述用于产生基于第一经空间处理信号的信号的装置及所述用于产生基于第二经空间处理信号的信号的装置。

46.根据权利要求24到26中任一权利要求所述的设备，其中所述设备包含用于确定所述用于执行第一空间处理操作的装置在紧接于所述第一时间之后的第一延迟时间间隔上继续优于所述用于执行第二空间处理操作的装置而分离所述语音与噪声分量的装置，且

其中所述用于产生基于第一经空间处理信号的所述信号作为所述输出信号的装置经配置以在所述第一延迟时间间隔之后开始产生所述信号。

47.根据权利要求46所述的设备，其中所述设备包括状态估计器，所述状态估计器包含所述用于在第一时间处确定的装置、所述用于在第二时间处确定的装置及所述用于确定所述用于执行第一空间处理操作的装置在紧接于所述第一时间之后的第一延迟时间间隔上继续优于所述用于执行第二空间处理操作的装置而分离所述语音与噪声分量的装置。

48.根据权利要求24到26中任一权利要求所述的设备，其中所述设备包括状态估计器，所述状态估计器包含所述用于在第一时间处确定的装置及所述用于在第二时间处确定的装置。