CN102859592A - 用于语音质量改进的用户特定的噪声抑制 - Google Patents
用于语音质量改进的用户特定的噪声抑制 Download PDFInfo
- Publication number
- CN102859592A CN102859592A CN2011800211261A CN201180021126A CN102859592A CN 102859592 A CN102859592 A CN 102859592A CN 2011800211261 A CN2011800211261 A CN 2011800211261A CN 201180021126 A CN201180021126 A CN 201180021126A CN 102859592 A CN102859592 A CN 102859592A
- Authority
- CN
- China
- Prior art keywords
- user
- squelch
- electronic installation
- parameter
- sound signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Abstract
本发明提供用于用户特定的噪声抑制的系统、方法及装置。举例来说,当在使用电子装置(10)的与语音有关的特征时,所述电子装置(10)可能会接收到包含用户语音的音频信号。因为此时例如环境声音(60)等噪声也可能会被所述电子装置(10)接收,所以电子装置(10)可以抑制所述音频信号中的此噪声。确切地说,所述电子装置(10)可以经由用户特定的噪声抑制参数抑制所述音频信号中的噪声同时实质上保留用户语音。这些用户特定的噪声抑制参数可以至少部分地基于用户噪声抑制偏好或用户语音简档或其组合。
Description
技术领域
背景技术
本发明大体上涉及用于噪声抑制的技术,且更确切地说涉及用于用户特定的噪声抑制的技术。
本部分意在向读者介绍可能与下文描述及/或主张的本发明的各个方面有关的技术的各个方面。相信本论述有助于为读者提供背景技术资料,便于更好地理解本发明的各个方面。因此,应当理解这些陈述要在此意义上理解,而并不是承认现有技术。
许多电子装置使用与语音有关的特征,其涉及记录及/或传输用户的语音。举例来说,语音备忘录记录特征可以记录用户所说的语音备忘录。类似地,电子装置的电话特征可以将用户的语音传输到另一个电子装置。然而,当电子装置获得用户的语音时,可以同时获得环境声音或背景噪声。这些环境声音可能会让用户的语音模糊不清,而且在有些情况下,会妨碍电子装置的与语音有关的特征正常运行。
为了在使用与语音有关的特征时减少环境声音的影响,电子装置可以应用各种噪声抑制方案。装置制造商可以对此些噪声抑制方案进行编程,使其根据经计算会被大多数用户良好接收的某些预定通用参数来操作。然而,某些语音可能不太适合这些通用噪声抑制参数。此外,一些用户可能偏爱更强或更弱的噪声抑制。
发明内容
下文阐述本文中揭示的某些实施例的概述。应当理解,呈现这些方面只是为了向读者提供对这些特定实施例的简要概述,并且这些方面并不希望限制本发明的范围。实际上,本发明可以涵盖下文可能未阐述的多个方面。
本发明的实施例涉及用于用户特定的噪声抑制的系统、方法及装置。举例来说,当在使用电子装置的与语音有关的特征时,电子装置可能会接收到包含用户语音的音频信号。因为此时例如环境声音等噪声也可能会被电子装置接收,所以电子装置可以抑制音频信号中的此噪声。确切地说,电子装置经由用户特定的噪声抑制参数可以抑制音频信号中的噪声,同时实质上保留用户语音。这些用户特定的噪声抑制参数可以至少部分地基于用户噪声抑制偏好或用户语音简档或其组合。
附图说明
在阅读了下文的具体实施方式且在参阅图式之后,可以更好地理解本发明的各个方面,在图式中:
图1是根据实施例的能够执行本文中揭示的技术的电子装置的框图;
图2是表示图1的电子装置的一个实施例的手持装置的示意图;
图3是表示根据一实施例可以使用图1的电子装置的与语音有关的特征的各种场合的示意性框图;
图4是根据一实施例可以在图1的电子装置中发生的噪声抑制的框图;
图5是表示根据一实施例的用户特定的噪声抑制参数的框图;
图6是描述用于在图1的电子装置中应用用户特定的噪声抑制参数的方法的实施例的流程图;
图7是根据一实施例在图2的手持装置被激活时起始语音训练序列的示意图;
图8是根据一实施例用于使用图2的手持装置选择起始语音训练系列的一系列屏幕的示意图;
图9是描述用于经由语音训练序列确定用户特定的噪声抑制参数的方法的实施例的流程图;
图10及11是根据一实施例的用于获得用于语音训练的用户语音样本的方式的示意图;
图12是说明根据一实施例在语音训练序列期间获得噪声抑制用户偏好的方式的示意图;
图13是描述用于在语音训练序列期间获得噪声抑制用户偏好的方法的实施例的流程图;
图14是描述用于执行语音训练序列的另一方法的实施例的流程图;
图15是描述用于获得高信噪比(SNR)用户语音样本的方法的实施例的流程图;
图16是描述用于经由分析用户语音样本来确定用户特定的噪声抑制参数的方法的实施例的流程图;
图17是描述根据一实施例在执行图16的方法时可以考虑的用户语音样本的特性的因数图;
图18是表示根据一实施例可以在图2的手持装置上显示以经由用户可选设置来获得用户特定的噪声参数的一系列屏幕的示意图;
图19是根据一实施例用于在使用手持装置的与语音有关的特征时实时获得用户特定的噪声抑制参数的图2的手持装置上的屏幕的示意图;
图20及21是表示根据一实施例的可形成用户特定的噪声抑制参数的各种子参数的示意图;
图22是描述用于基于检测到的环境声音来应用用户特定的参数的某些子参数的方法的实施例的流程图;
图23是描述用于基于电子装置的使用场合来应用噪声抑制参数的某些子参数的方法的实施例的流程图;
图24是表示根据一实施例可用于图23的方法的各种装置场合因数的因数图;
图25是描述用于获得用户语音简档的方法的实施例的流程图;
图26是描述用于基于用户语音简档应用噪声抑制的方法的实施例的流程图;
图27到29是描绘根据一实施例基于用户语音简档执行音频信号的噪声抑制的方式的图表;
图30是描述用于经由涉及预先记录的语音的语音训练序列获得用户特定的噪声抑制参数的方法的实施例的流程图;
图31是描述用于向从另一电子装置接收的音频应用用户特定的噪声抑制参数的方法的实施例的流程图;
图32是描述根据一实施例用于基于第一电子装置的用户特定的噪声参数使另一电子装置参与噪声抑制的方法的实施例的流程图;及
图33是根据一实施例用于基于与另一电子装置相关联的用户特定的噪声抑制参数对两个电子装置执行噪声抑制的系统的示意性框图。
具体实施方式
下文将描述一个或一个以上特定实施例。为了提供对这些实施例的简要描述,说明书中未描述实际实施方案的所有特征。应当理解,在研发任何此实际实施方案时,如在任何工程或设计项目中,必须进行许多实施方案特定的决策来实现研发人员的特定目标,例如符合与系统有关的及与商业有关的约束,这些决策可能在实施方案之间有所不同。此外,应当理解,此研发努力可能复杂而且耗时,但是仍然将是受益于本发明的所属领域的技术人员的设计、制作及制造的例行任务。
当前实施例涉及抑制与电子装置的与语音有关的特征相关联的音频信号中的噪声。此与语音有关的特征可包含例如语音备忘录记录特征、视频记录特征、电话特征及/或语音命令特征,其中的每一者可涉及包含用户的语音的音频信号。然而,除了用户的语音之外,音频信号还可包含在使用与语音有关的特征时存在的环境声音。由于这些环境声音可能会使用户的语音模糊不清,所以电子装置可以对音频信号应用噪声抑制以过滤掉环境声音,同时保留用户的语音。
根据当前实施例的噪声抑制不是采用在制造装置时编程的通用噪声抑制参数,而是可以涉及可能是电子装置的用户特有的用户特定的噪声抑制参数。这些用户特定的噪声抑制参数可以通过语音训练、基于用户的语音简档及/或基于手动选择的用户设置来确定。当基于用户特定的参数而不是通用参数发生噪声抑制时,经过噪声抑制的信号的声音可能更令用户满意。这些用户特定的噪声抑制参数可以用于任何与语音有关的特征,并且可以配合自动增益控制(AGC)及/或均衡(EQ)调谐来使用。
如上所述,可以使用语音训练序列来确定用户特定的噪声抑制参数。在此语音训练序列中,电子装置可以对与一个或一个以上干扰因素(例如,模拟环境声音,例如起皱的纸、白噪声、七嘴八舌的人等等)混合的用户的语音样本应用不同的噪声抑制参数。此后,用户可以指示哪些噪声抑制参数产生最优选的声音。基于用户的反馈,电子装置可以形成及存储用户特定的噪声抑制参数,用于稍后在使用电子装置的与语音有关的特征时使用。
另外或替代地,可通过电子装置依据用户的语音的特性来自动确定用户特定的噪声抑制参数。不同用户的语音可具有各种不同特性,包含不同的平均频率、不同的频率可变性及/或不同的区分的声音。此外,可以知道某些噪声抑制参数对于某些语音特性更加有效地操作。因此,根据特定本发明的某些实施例的电子装置可基于此些用户语音特性来确定用户特定的噪声抑制参数。在一些实施例中,用户可通过例如选择高/中/低噪声抑制强度选择器或指示电子装置上的当前呼叫质量来手动设置噪声抑制参数。
当已经确定了用户特定的参数时,电子装置可以抑制可能在使用与语音有关的特征时听到的各种类型的环境声音。在某些实施例中,电子装置可分析环境声音的特点,并且应用预期因此抑制当前环境声音的用户特定的噪声抑制参数。在另一实施例中,电子装置可以基于正在使用电子装置的当前场合来应用某些用户特定的噪声抑制参数。
在某些实施例中,电子装置可以基于与用户相关联的用户语音简档来执行针对用户定制的噪声抑制。此后,电子装置可以更加有效地在正在使用与语音有关的特征时将环境声音与音频信号隔离,因为电子装置大体上可能预期音频信号的哪些组成部分对应于用户的语音。举例来说,电子装置可以放大音频信号的与用户语音简档相关联的组成部分,同时抑制音频信号的不与用户语音简档相关联的组成部分。
还可以使用用户特定的噪声抑制参数来抑制音频信号中含有电子装置接收到的不是用户语音的语音的噪声。举例来说,当将电子装置用于电话或聊天特征时,电子装置可以对来自与用户对应的人的音频信号采用用户特定的噪声抑制参数。由于此音频信号先前可能已经被发送装置处理,所以此噪声抑制可以相对微弱。在某些实施例中,电子装置可以将用户特定的噪声抑制参数发射到发送装置,使得发送装置可以相应地修改其噪声抑制参数。同样,两个电子装置可以系统地起作用,以根据彼此的用户特定的噪声抑制参数来抑制传出的音频信号中的噪声。
鉴于前述内容,下文提供对用于执行当前揭示的技术的合适电子装置的总体描述。确切地说,图1是描绘适合与本技术一起使用的电子装置中可能存在的各种组件的框图。图2表示合适的电子装置的一个实例,如所说明,此电子装置可以是具有噪声抑制能力的手持电子装置。
首先转向图1,用于执行当前揭示的技术的电子装置10可以尤其包含:一个或一个以上处理器12、存储器14、非易失性存储装置16、显示器18、噪声抑制20、位置感测电路22、输入/输出(I/O)接口24、网络接口26、图像捕获电路28、加速计/磁力计30以及麦克风32。图1所示的各种功能块可以包含硬件元件(包含电路)、软件元件(包含存储在计算机可读媒体上的计算机代码)或硬件元件与软件元件两者的组合。应进一步注意,图1只是特定实施方案的一个实例,并且意在说明电子装置10中可以存在的类型的组件。
举例来说,电子装置10可以表示图2中描绘的手持装置或类似装置的框图。此外或替代地,电子装置10可以表示具有某些特性的电子装置的系统。举例来说,第一电子装置可以包含至少一麦克风32,其可向第二电子装置提供音频,第二电子装置包含处理器12及其它数据处理电路。应注意,数据处理电路可以完全或部分地体现为软件、固件、硬件或其任何组合。此外,数据处理电路可以是单个内含式处理模块,或者可以完全或部分地并入到电子装置10内的任何其它元件内。数据处理电路还可以部分地体现在电子装置10内,并且部分地体现在有线或无线地连接到装置10的另一电子装置内。最后,数据处理电路可以完全实施在有线或无线地连接到装置10的另一装置内。作为一非限制性实例,数据处理电路可以体现在与装置10连接的头戴耳机内。
在图1的电子装置10中,处理器12及/或其它数据处理电路可以可操作地与存储器14及非易失性存储器16耦合以执行用于实施当前揭示的技术的各种算法。由处理器12执行的此些程序或指令可以存储在任何合适的制造品中,所述制造品包含一个或一个以上至少共同存储指令或例程的有形的计算机可读媒体,例如存储器14及非易失性存储装置16。此外,在此计算机程序产品上编码的程序(例如,操作系统)还可以包含可以由处理器12执行以使得电子装置10能够提供各种功能性(包含本文中描述的功能性)的指令。显示器18可以是触摸屏显示器,其可以使得用户能够与电子装置10的用户接口交互。
可以通过例如处理器12等数据处理电路或者通过专用于对电子装置10处理的音频信号执行某种噪声抑制的电路执行。举例来说,可以通过基带集成电路(IC)(例如英飞凌公司制造的基带IC)基于外部提供的噪声抑制参数来执行噪声抑制20。此外或替代地,噪声抑制20可以在电话音频增强集成电路(IC)中执行,此电话音频增强IC经配置以基于外部提供的噪声抑制参数来执行噪声抑制,例如听众公司(Audience)制造的电话音频增强IC。这些噪声抑制IC可以至少部分地基于某些噪声抑制参数来操作。改变此些噪声抑制参数可以改变噪声抑制20的输出。
位置感测电路22可以表示用于确定电子装置10的相对或绝对位置的装置能力。举例来说,位置感测电路22可以表示全球定位系统(GPS)电路、用于基于紧接的无线网络(例如局域Wi-Fi网络)来估计位置的算法等等。I/O接口24可以使电子装置10能够与各种其它电子装置介接,与网络接口26一样。举例来说,网络接口26可以包含用于个域网(PAN)(例如蓝牙网络)的接口、用于局域网(LAN)(例如802.11x Wi-Fi网络)的接口及/或用于广域网(WAN)(例如3G蜂窝式网络)的接口。通过网络接口26,电子装置10可以与包含麦克风32的无线头戴耳机介接。图像捕获装置28可以实现图像及/或视频捕获,且加速计/磁力计30可以观测电子装置10的移动及/或相对定向。
当配合电子装置10的与语音有关的特征(例如电话特征或语音识别特征)采用时,麦克风32可以获得用户的语音的音频信号。虽然除了用户的语音以外还可能在音频信号中获得环境声音,但是噪声抑制20可以处理音频信号以基于某些用户特定的噪声抑制参数来排除大部分环境声音。如下文更详细描述,所述用户特定的噪声抑制参数可以通过语音训练、基于用户的语音简档及/或基于手动选择的用户设置来确定。
图2描绘表示电子装置10的一个实施例的手持装置34。举例来说,手持装置34可以表示便携式电话、媒体播放器、个人数据管理器、手持式游戏平台或此些装置的任何组合。举例来说,手持装置34可以是可从加利福尼亚州库珀蒂诺市的苹果公司购得的或型号。
手持装置34可以包含罩壳36,以保护内部组件免受物理损害,并且屏蔽内部组件免受电磁干扰。罩壳36可以围绕显示器18,显示器18可以显示指示符图标38。指示符图标38尤其可以指示蜂窝信号强度、蓝牙连接及/或电池寿命。I/O接口24可以穿过罩壳36开口,并且举例来说可以包含来自苹果公司的用于连接到外部装置的专有I/O端口。如图2中指示,手持装置34的反面可以包含图像捕获电路28。
用户输入结构40、42、44及46配合显示器18可以允许用户控制手持装置34。举例来说,输入结构40可以将手持装置34激活或去激活,输入结构42可以将用户接口20导航到主屏幕、用户可配置的应用程序屏幕及/或激活手持装置34的语音识别特征,输入结构44可以提供音量控制,且输入结构46可以在振动模式与响铃模式之间来回切换。麦克风32可以获得用于各种与语音有关的特征的用户的语音,且扬声器48可以实现音频回放及/或某些电话能力。头戴受话器输入50可以提供与外部扬声器及/或头戴受话器的连接。
如图2中说明,有线头戴耳机52可以经由头戴受话器输入50而连接到手持装置34。有线头戴耳机52可以包含两个扬声器48及一个麦克风32。麦克风32可以使得用户能够用与位于手持装置34上的麦克风32相同的方式对手持装置34中说话。在一些实施例中,靠近麦克风32的按钮可以致使麦克风32唤醒及/或可以致使手持装置34的与语音有关的特征激活。无线头戴耳机54可以经由网络接口26的无线接口(例如,蓝牙接口)类似地连接到手持装置34。与有线头戴耳机52相同,无线头戴耳机54也可以包含扬声器48及麦克风32。此外,在一些实施例中,靠近麦克风32的按钮可以致使麦克风32唤醒及/或可以致使手持装置34的与语音有关的特征激活。此外或替代地,独立麦克风32(未图示)(其可能没有集成扬声器48)可以经由头戴受话器输入50或经由网络接口26中的一者与手持装置34介接。
用户可能会在具有各种环境声音的各种场合中使用电子装置10的与语音有关的特征(例如语音识别特征或电话特征)。图3说明许多此些场合56,其中电子装置10(描绘为手持装置34)可能会在执行与语音有关的特征时获得用户语音音频信号58及环境声音60。举例来说,电子装置10的与语音有关的特征可以例如包含语音识别特征、语音备忘录记录特征、视频记录特征及/或电话特征。与语音有关的特征可以实施在电子装置10上,在由处理器12或其它处理器实施的软件中,及/或可以实施在专用硬件中。
当用户说出语音音频信号58时,此信号可能会进入电子装置10的麦克风32。然而,在大约相同时间,环境声音60还可进入麦克风32。环境声音60可依据正在使用电子装置10的场合56来改变。可以使用与语音有关的特征的各种场合56可以包含在家62、在办公室64、在健身馆66、在繁忙的街道上68、在车上70、在体育赛事中72、在饭店74及在派对76上,等等。应当理解,在繁忙的街道68上发生的典型的环境声音60可能与在家里62或在车上70发生的典型环境声音60有很大区别。
环境声音60的特点可能在场合56与场合56之间有所不同。如下文详细描述,电子装置10可以至少部分地基于用户特定的噪声抑制参数来执行噪声抑制20以过滤环境声音60。在一些实施例中,这些用户特定的噪声抑制参数可以经由语音训练来确定,在所述语音训练中,可以在包含用户语音样本及各种干扰因素(模拟环境声音)的音频信号上测试各种不同的噪声抑制参数。语音训练中采用的干扰因素可以经过选择以模拟在某些场合56中发现的环境声音60。此外,所述场合56中的每一者可以在某些位置及时间发生,具有电子装置10的变化的运动及环境光的量,且/或具有语音信号58及环境声音60的各种音量级别。因此,电子装置10可以使用用户特定的噪声抑制参数来过滤环境声音60,所述参数是针对某些场合56定制的,例如基于时间、位置、运动、环境光及/或音量级别等而确定。
图4是用于在使用电子装置10的与语音有关的特征时在电子装置10上执行噪声抑制20的技术80的示意性框图。在图4的技术80中,与语音有关的特征涉及用户与另一个人之间的双向通信,并且可以在使用电子装置10的电话或聊天特征时发生。然而,应当理解,电子装置10也可以在未发生双向通信时对通过电子装置的麦克风32或网络接口26接收的音频信号执行噪声抑制20。
在噪声抑制技术80中,电子装置10的麦克风32可以获得用户语音信号58及背景中存在的环境声音60。在进入噪声抑制20之前,可以通过编解码器82对此第一音频信号进行编码。在噪声抑制20中,可以对第一音频信号应用发射噪声抑制(TX NS)84。可以通过某些噪声抑制参数(说明为发射噪声抑制(TX NS)参数86)来定义噪声抑制20的发生方式,举例来说,所述参数是由处理器12、存储器14或非易失性存储装置16提供的。如下文更详细论述,TX NS参数86可以是由处理器12确定的用户特定的噪声抑制参数,并且针对电子装置10的用户及/或场合56而定制。在标号84处执行了噪声抑制20之后,可以通过网络接口26将所得信号传递到上行链路88。
网络接口26的下行链路90可以从另一装置(例如,另一电话)接收语音信号。可以在噪声抑制20中对此传入信号应用某些噪声接收器噪声抑制(RX NS)92。可以通过某些噪声抑制参数(说明为接收噪声抑制(RX NS)参数94)来定义此噪声抑制20的发生方式,举例来说,所述参数是由处理器12、存储器14或非易失性存储装置16提供的。由于在离开发送装置之前,传入音频信号先前可能已经经过处理来进行噪声抑制,所以可以将RX NS参数94选择成没有TX NS参数86强。可以通过编解码器82对所得的经过噪声抑制的信号进行解码,并且将其输出到电子装置10的接收器电路及/或扬声器48。
TX NS参数86及/或RX NS参数94可能是电子装置10的用户特有的。也就是说,如图5的图100所示,可以从针对电子装置10的用户定制的用户特定的噪声抑制参数102中选出TX NS参数86及RX NS参数94。可以用各种方式来获得这些用户特定的噪声抑制参数102,例如通过语音训练104、基于用户语音简档106,及/或基于用户可选设置108,如下文更详细描述。
语音训练104可以允许电子装置10通过测试与各种干扰因素或模拟背景噪声组合的各种噪声抑制参数来确定用户特定的噪声抑制参数102。下文参照图7到14更详细地论述用于执行此语音训练104的某些实施例。此外或替代地,电子装置10可以基于用户语音简档106来确定用户特定的噪声抑制参数102,所述用户语音简档106可以考虑用户的语音的特定特性,如下文参照图15到17更详细论述。此外或替代地,用户可以通过某些用户设置108来指示对用户特定的噪声抑制参数102的偏好,如下文参照图18及19更详细论述。举例来说,此些用户可选设置可以包含噪声抑制强度(例如,低/中/高)选择器及/或实时用户反馈选择器,以提供关于用户的实时语音质量的用户反馈。
一般来说,电子装置10可以在电子装置的与语音有关的特征正在使用时采用用户特定的噪声抑制参数102(例如,可以基于用户特定的噪声抑制参数102来选择TX NS参数86及RX NS参数94)。在某些实施例中,电子装置10可以基于对当前正在使用与语音有关的特征的用户的识别来在噪声抑制20期间应用某些用户特定的噪声抑制参数102。举例来说,此情形可以在其他家庭成员使用电子装置10时发生。家庭的每一成员可以代表有时候可以使用电子装置10的与语音有关的特征的用户。在此些多用户状况下,电子装置10可以查实是否存在与所述用户相关联的用户特定的噪声抑制参数102。
举例来说,图6说明在已经识别了用户时用于应用某些用户特定的噪声抑制参数102的流程图110。流程图110可以在用户正在使用电子装置10的与语音有关的特征时开始(框112)。在实施与语音有关的特征时,电子装置10可以接收音频信号,此音频信号包含用户语音信号58及环境声音60。根据所述音频信号,电子装置10大体上可以确定用户的语音的某些特性且/或可以从用户语音信号58中识别出用户语音简档(框114)。如下文论述,用户语音简档可以表示识别与用户的语音相关联的某些特性的信息。
如果在框114处检测到的语音简档不与同用户特定的噪声抑制参数102相关联的任何已知用户匹配(框116),则电子装置10可以应用某些默认噪声抑制参数来进行噪声抑制20(框118)。然而,如果在框114中检测到的语音简档不与电子装置10的已知用户匹配,且电子装置10当前存储与所述用户相关联的用户特定的噪声抑制参数102,则电子装置10可以替代地应用相关联的用户特定的噪声抑制参数102(框120)。
如上所述,可以基于语音训练序列104来确定用户特定的噪声抑制参数102。在电子装置10的一实施例(例如手持装置34)的激活阶段130期间,可以将对此语音训练序列104的起始作为选项向用户呈现,如图7所示。一般来说,此激活阶段130可以在手持装置34首次加入蜂窝式网络或者经由通信电缆134首次连接到计算机或其它电子装置132时发生。在此激活阶段130期间,手持装置34或计算机或其它装置132可以提供起始语音训练的提示136。在选择了所述提示之后,用户即刻可以起始语音训练104。
此外或替代地,语音训练序列104可以在用户选择电子装置10的设置时开始,此设置致使电子装置10进入语音训练模式。如图8所示,手持装置34的主屏140可以包含用户可选按钮142,所述按钮在被选择时致使手持装置34显示设置屏幕144。当用户选择在设置屏幕144上标记为“电话”的用户可选按钮146时,手持装置34可以显示电话设置屏幕148。电话设置屏幕148尤其可以包含标记为“语音训练”的用户可选按钮150。当用户选择语音训练按钮150时,语音训练104序列可以开始。
图9的流程图160表示用于执行语音训练104的方法的一个实施例。流程图160可以在电子装置10提示用户在某些干扰因素(例如,模拟环境声音)在背景中播放时说话的时候开始(框162)。举例来说,可以要求用户在某些干扰因素(例如摇滚乐、七嘴八舌的人、起皱的纸等等)正在计算机或其它电子装置132上或在电子装置10的扬声器48上大声播放时说某个单词或短语。在此些干扰因素正在播放时,电子装置10可以读取用户的语音的样本(框164)。在一些实施例中,在播放各种干扰因素时框162及164可以重复来获得包含用户的语音及一个或一个以上干扰因素两者的若干测试音频信号。
为了确定用户最偏好哪些噪声抑制参数,电子装置10可以在从用户请求反馈之前将噪声抑制20应用于测试音频信号时交替地应用某些测试噪声抑制参数。举例来说,电子装置10可以在经由扬声器48将音频输出给用户之前,向包含用户的语音样本及一个或一个以上干扰因素的测试音频信号应用第一组测试噪声抑制参数,此处标记为“A”(框166)。接下来,电子装置10可以在经由扬声器48将音频输出给用户之前,向用户的语音样本应用另一组测试噪声抑制参数,此处标记为“B”(框168)。用户接着可以决定用户偏好电子装置10输出的两个音频信号中的哪一者(例如,通过选择电子装置10的显示器18上的“A”或“B”)(框170)。
电子装置10可以用各种测试噪声抑制参数及用各种干扰因素来重复框166到170的动作,每次都知道关于用户的噪声抑制偏好的更多情况,直到已经获得了合适的用户噪声抑制偏好数据组为止(决策框172)。因此,电子装置10可以测试实际上应用于含有用户的语音以及某些常见环境声音的音频信号的各种噪声抑制参数的合意性。在一些实施例中,通过框166到170的每次重复,电子装置10可以通过逐渐改变某些噪声抑制参数(例如,逐渐增加或减少噪声抑制强度)直到用户的噪声抑制偏好已经稳定下来为止来“调谐”测试噪声抑制参数。在其它实施例中,电子装置10可以在每次重复框166到170时测试不同类型的噪声抑制参数(例如,在一次重复时测试噪声抑制强度,在另一次重复时测试某些频率的噪声抑制,等等)。在任何情况下,框166到170可以一直重复到已经获得了所需数目的用户偏好为止(决策框172)。
基于在框170处获得的所指示的用户偏好,电子装置10可以形成用户特定的噪声抑制参数102(框174)。举例来说,电子装置10可以在框166到170的重复已经稳定下来时,基于框170的用户反馈来到达优选的用户特定的噪声抑制参数组102。在另一实例中,如果框166到170的重复各自测试特定的噪声抑制参数组,则电子装置10可以基于所指示的对特定参数的偏好来形成复杂的用户特定的噪声抑制参数组。用户特定的噪声抑制参数102可以存储在电子装置10的存储器14或非易失性存储装置16中(框176),用于在同一用户稍后使用电子装置10的与语音有关的特征时进行噪声抑制。
图10到13涉及电子装置10可以实施图9的流程图160的特定方式。确切地说,图10及11涉及图9的流程图160的框162及164,且图12及13A-B涉及框166到172。转向图10,双装置语音记录系统180包含计算机或其它电子装置132及手持装置34。在一些实施例中,手持装置34可以通过通信电缆134或经由无线通信(例如,802.1lxWi-Fi WLAN或蓝牙PAN)加入计算机或其它电子装置132。在系统180的操作期间,计算机或其它电子装置132可以提示用户在背景中播放各种干扰因素182中的一者或一者以上时说一个单词或短语。举例来说,此些干扰因素182可以包含起皱的纸184、七嘴八舌的人186、白噪声188、摇滚乐190及/或马路噪声192的声音。举例来说,干扰因素182可以另外或替代地包含在各种场合56中通常遇到的其它噪声,例如上文参照图3论述的噪声。从计算机或其它电子装置132大声播放的这些干扰因素182可以在用户提供用户语音样本194的同时被手持装置34的麦克风32拾取。以此方式,手持装置34可以获得包含干扰因素182及用户语音样本194两者的测试音频信号。
在由图11的单装置语音记录系统200表示的另一实施例中,手持装置34可以同时既输出干扰因素182又记录用户语音样本194。如图11所示,手持装置34可以提示用户说一个单词或短语用于用户语音样本194。同时,手持装置34的扬声器48可以输出一个或一个以上干扰因素182。手持装置34的麦克风32接着可以在没有计算机或其它电子装置132的情况下记录测试音频信号,此信号包含当前播放的干扰因素182及用户语音样本194两者。
对应于框166到170,图12说明用于基于应用于测试音频信号的噪声抑制参数的选择来确定用户的噪声抑制偏好的实施例。确切地说,此处表示为手持装置34的电子装置10可以向包含用户语音样本194及至少一个干扰因素182两者的测试音频信号应用第一组噪声抑制参数(“A”)。手持装置34可以输出所得的经过噪声抑制的音频信号(标号212)。手持装置34还可在输出所得的经过噪声抑制的音频信号之前向测试音频信号应用第二组噪声抑制参数(“B”)(标号214)。
当用户已经听到将两组噪声抑制参数“A”及“B”应用于测试音频信号的结果时,手持装置34可以例如问用户“您偏好A还是B?”(编号216)。用户接着可以基于输出的经过噪声抑制的信号来指示噪声抑制偏好。举例来说,用户可以经由手持装置34上的屏幕218来选择第一经过噪声抑制的音频信号(“A”)或第二经过噪声抑制的音频信号(“B”)。在一些实施例中,用户可以例如通过大声说“A”或“B”来用其它方式指示偏好。
电子装置10可以用各种方式确定对特定噪声抑制参数的用户偏好。图13的流程图220表示用于执行图9的流程图160的框166到172的方法的一个实施例。流程图220可以在电子装置10应用一组噪声抑制参数(出于示范性目的,标记为“A”及“B”)时开始。如果用户偏好噪声抑制参数“A”(决策框224),电子装置10接下来可以应用新的噪声抑制参数组,所述参数出于类似说明目的被标记为“C”及“D”(框226)。在某些实施例中,噪声抑制参数“C”及“D”可以是噪声抑制参数“A”的变化形式。如果用户偏好噪声抑制参数“C”(决策框228),则电子装置可以将噪声抑制参数设置成“A”与“C”的组合(框230)。如果用户偏好噪声抑制参数“D”(决策框228),则电子装置可以将用户特定的噪声抑制参数设置成噪声抑制参数“A”与“D”的组合(框232)。
如果在框222之后,用户偏好噪声抑制参数“B”(决策框224),则电子装置10可以应用新的噪声抑制参数“C”及“D”(框234)。在某些实施例中,新的噪声抑制参数“C”及“D”可以是噪声抑制参数“B”的变化形式。如果用户偏好噪声抑制参数“C”(决策框236),则电子装置10可以将用户特定的噪声抑制参数设置成“B”与“C”的组合(框238)。否则,如果用户偏好噪声抑制参数“D”(决策框236),则电子装置10可以将用户特定的噪声抑制参数设置成“B”与“D”的组合(框240)。应当了解,仅将流程图220呈现为执行图9的流程图160的框166到172的一种方式。因此,应当理解,可以测试多得多的噪声抑制参数,并且可以结合某些干扰因素来具体测试此些参数(例如,在某些实施例中,可以针对分别包含干扰因素182中的每一者的测试音频信号来重复流程图220)。
可以用其它方式来执行语音训练序列104。举例来说,在图14的流程图250表示的一个实施例中,首先可以在未在背景中播放任何干扰因素182的情况下获得用户语音样本194(框252)。一般来说,可以在具有非常少的环境声音60的位置(例如,静噪房间)中获得此用户语音样本194,使得用户语音样本194具有相对高的信噪比(SNR)。此后,电子装置10可以将用户语音样本194与各种干扰因素182用电子方式混合(框254)。因此,电子装置10可以使用单个用户语音样本194产生具有各种干扰因素182的一个或一个以上测试音频信号。
此后,电子装置10可以确定用户最偏好哪些噪声抑制参数来确定用户特定的噪声抑制参数102。以与图9的框166到170类似的方式,电子装置10可以交替地向在框254处获得的测试音频信号应用某些测试噪声抑制参数以计量用户偏好(框256-260)。电子装置10可以用各种测试噪声抑制参数及用各种干扰因素来重复框256到260的动作,每次都知道关于用户的噪声抑制偏好的更多情况,直到已经获得了合适的用户噪声抑制偏好数据组为止(决策框262)。因此,电子装置10可以测试应用于含有用户的语音以及某些常见环境声音的测试音频信号的各种噪声抑制参数的合意性。
与图9的框174类似,电子装置10可以形成用户特定的噪声抑制参数102(框264)。用户特定的噪声抑制参数102可以存储在电子装置10的存储器14或非易失性存储装置16中(框266),以在同一用户稍后使用电子装置10的与语音有关的特征时进行噪声抑制。
如上所述,本发明的某些实施例可以涉及在干扰因素182未在背景中大声播放的情况下获得用户语音样本194。在一些实施例中,电子装置10可在用户第一次在不打断用户的情况下在静噪设置中使用电子装置10的与语音有关的特征时获得此用户语音样本194。如图15的流程图270中所表示,在一些实施例中,在电子装置10首次检测到含有用户的语音的音频的足够高的信噪比(SNR)时,电子装置10可以获得此用户语音样本194。
图15的流程图270可以在用户正在使用电子装置10的与语音有关的特征时开始(框272)。为了查实用户的身份,电子装置10可以基于麦克风32检测到的音频信号来检测用户的语音简档(框274)。如果在框274中检测到的语音简档表示电子装置的已知用户的语音的语音简档(决策框276),则电子装置10可以应用与所述用户相关联的用户特定的噪声抑制参数102(框278)。如果用户的身份是未知的(决策框276),则电子装置10可以首先应用默认噪声抑制参数(框280)。
电子装置10可以在使用与语音有关的特征时评估麦克风32接收到的音频信号的当前信噪比(SNR)(框282)。如果SNR足够高(例如,高于预设阈值),则电子装置10可以从麦克风32接收的音频中获得用户语音样本194(框286)。如果SNR不够高(例如,低于阈值)(决策框284),则电子装置10可以继续应用默认噪声抑制参数(框280),继续至少周期性地重新评估SNR。以此方式获得的用户语音样本194可以稍后用于语音训练序列104中,如上文参照图14所论述。在其它实施例中,电子装置10可以采用此用户语音样本194来基于用户语音样本194本身来确定用户特定的噪声抑制参数102。
具体来说,除了语音训练序列104之外,还可以基于与用户语音样本194相关联的某些特性来确定用户指定的噪声抑制参数102。举例来说,图16表示用于基于此些用户语音特性来确定用户特定的噪声抑制参数102的流程图290。当电子装置10获得用户语音样本194时,可以开始流程图290(框292)。用户语音样本可以例如根据图15的流程图270来获得,或者可以在电子装置10提示用户说特定单词或短语时获得。电子装置接下来可以分析与用户语音样本相关联的某些特性(框294)。
基于与用户语音样本194相关联的各种特性,电子装置10可以确定用户特定的噪声抑制参数102(框296)。举例来说,如图17的语音特性图300所示,用户语音样本194可以包含各种语音样本特性302。此些特性302可以尤其包含用户语音样本194的平均频率304、用户语音样本194的频率的可变性306、与用户语音样本194相关联的常见话音声音308、用户语音样本194的频率范围310、用户语音样本的频率中的共振峰位置312,及/或用户语音样本194的动态范围314。这些特性可能会出现,是因为不同用户可能具有不同的话音模式。也就是说,用户的语音的高度或深度、用户说话时的口音及/或口齿不清等等可以被纳入考虑范围,只要它们改变了话音的可测量特点,例如特性302。
如上所述,还可以通过直接选择用户设置108来确定用户特定的噪声抑制参数102。一个此实例在图18中作为用于手持装置32的用户设置屏幕序列320出现。当电子装置10显示一包含设置按钮142的主屏140时,可以开始屏幕序列320。选择设置按钮142可以致使手持装置34显示设置屏幕144。选择设置屏幕144上的标记为“电话”的用户可选按钮146,可以致使手持装置34显示电话设置屏幕148,其可以包含各种用户可选按钮,其中的一者可以是标记为“噪声抑制”的用户可选按钮322。
当用户选择用户可选按钮322时,手持装置34可以显示噪声抑制选择屏幕324。通过噪声抑制选择屏幕324,用户可以选择噪声抑制强度。举例来说,用户可以经由选择轮盘326来选择噪声抑制是应当高、中还是低强度。选择较高的噪声抑制强度可能会产生抑制接收到的音频信号中的较多环境声音60但是可能也抑制较多用户58的语音的用户特定的噪声抑制参数102。选择较低的噪声抑制强度可能会产生准许接收到的音频信号中保留较多环境声音60但是也准许保留较多用户58的语音的用户特定的噪声抑制参数102。
在其它实施例中,用户可以在使用电子装置10的与语音有关的特征时实时调整用户特定的噪声抑制参数102。举例来说,如图19的可以在手持装置34上显示的进行中的呼叫屏幕330中所见,用户可以提供语音电话呼叫质量反馈332的测量值。在某些实施例中,可以通过若干可选星级334来表示反馈以指示呼叫质量。如果用户选择的星级334的数目较高,则可以理解用户对当前用户特定的噪声抑制参数102感到满意,且因此电子装置10可能不改变噪声抑制参数。另一方面,如果所选星级334的数目较低,则电子装置10可以改变用户特定的噪声抑制参数102,直到星级334的数目增加,从而指示用户满意为止。此外或替代地,进行中的呼叫屏幕330可以包含实时用户可选噪声抑制强度设置,例如上文参照图18揭示的设置。
在某些实施例中,可以与某些干扰因素182及/或某些场合60相关联地确定用户特定的噪声抑制参数102的子组。如图20的参数图340说明,用户特定的噪声抑制参数102可以基于特定干扰因素182划分成子组。举例来说,用户特定的噪声抑制参数102可以包含干扰因素特定的参数344-352,所述参数可以表示经过选择以从还包含用户58的语音的音频信号中过滤与干扰因素182相关联的某些环境声音60的噪声抑制参数。应当理解,用户特定的噪声抑制参数102可以包含较多或较少的干扰因素特定的参数。举例来说,如果在语音训练104期间测试了不同的干扰因素182,则用户特定的噪声抑制参数102可以包含不同的干扰因素特定的参数。
可以在确定用户特定的噪声抑制参数102时确定干扰因素特定的参数344-352。举例来说,在语音训练104期间,电子装置10可以使用包含各种干扰因素182的测试音频信号来测试多个噪声抑制参数。依据与每一干扰因素182的噪声抑制相关的用户偏好,电子装置可以确定干扰因素特定的参数344-352。举例来说,电子装置可以基于包含起皱的纸干扰因素184的测试音频信号来确定用于起皱的纸的参数344。如下文所述,在特定例子中,参数图340的干扰因素特定的参数可以稍后被重新调用,例如当在存在某些环境声音60及/或在某些场合56中使用电子装置10时。
此外或替代地,可以相对于可以使用电子装置10的与语音有关的特征的某些场合56来定义用户特定的噪声抑制参数102的子组。举例来说,如图21所示的参数图360所表示,可以基于可最好地使用噪声抑制参数的场合56,将用户特定的噪声抑制参数102划分成子组。举例来说,用户特定的噪声抑制参数102可以包含场合特定的参数364-378,其表示经选择以过滤可能与特定场合56相关联的某些环境声音60的噪声抑制参数。应当理解,用户特定的噪声抑制参数102可以包含较多或较少的场合特定的参数。举例来说,如下文论述,电子装置10可能能够识别各种场合56,其中的每一者可以具有特定的预期的环境声音60。因此,用户特定的噪声抑制参数102可以包含不同的场合特定的参数以抑制可识别的场合56中的每一者中的噪声。
与干扰因素特定的参数344-352一样,可以在确定用户特定的噪声抑制参数102时确定场合特定的参数364-378。举一个实例,在语音训练104期间,电子装置10可以使用包含各种干扰因素182的测试音频信号来测试多个噪声抑制参数。依据与每一干扰因素182的噪声抑制相关的用户偏好,电子装置10可以确定场合特定的参数364-378。
电子装置10可以基于场合特定的参数364到378中的每一者的场合56与一个或一个以上干扰因素182之间的关系来确定场合特定的参数364到378。具体来说,应当注意,电子装置10可以识别的场合56中的每一者可以与一个或一个以上特定的干扰因素182相关联。举例来说,在车上70的场合56可能主要与一个干扰因素182(即,马路噪声192)相关联。因此,在车上的场合特定的参数376可以基于与包含马路噪声192的测试音频信号有关的用户偏好。类似地,体育赛事72的场合56可能与若干干扰因素182(例如七嘴八舌的人186、白噪声188及摇滚乐190)相关联。因此,用于体育赛事的场合特定的参数368可以基于与包含七嘴八舌的人186、白噪声188及摇滚乐190的测试音频信号有关的用户偏好的组合。可以对此组合进行加权以更加偏重考虑预期与场合56的环境声音60更加密切地匹配的干扰因素182。
如上所述,可以在有或没有语音训练104的情况下,基于用户语音样本194的特性来确定用户特定的噪声抑制参数102(例如,如上文参照图16及17所述)。在此些状况下,电子装置10可以另外或替代地自动(例如,没有用户提示)确定干扰因素特定的参数344-352及/或场合特定的参数364-378。可以基于应用于用户语音样本194及某些干扰因素182时此些噪声抑制参数的预期性能来确定这些噪声抑制参数344-352及/或363-378。
当在使用电子装置10的与语音有关的特征时,电子装置10可以使用干扰因素特定的参数344-352及/或场合特定的参数364-378针对用户及环境声音60的特点两者来定制噪声抑制20。具体来说,图22说明用于基于环境声音60的评估的特点来选择及应用干扰因素特定的参数344-352的方法的实施例。图23说明用于基于识别出的使用电子装置10的场合56来选择及应用场合特定的参数364-378的方法的实施例。
转向图22,用于选择及应用干扰因素特定的参数344-352的流程图380可以在使用电子装置10的与语音有关的特征时开始(框382)。接下来,电子装置10可以确定其麦克风32接收到的环境声音60的特点(框384)。在一些实施例中,电子装置10可以例如基于音量级别(例如,用户的语音58一般可能大于环境声音60)及/或频率(例如,环境声音60可能会在与用户的语音58相关联的频率范围外部发生)来区分环境声音60与用户的语音58。
环境声音60的特点可能类似于干扰因素182中的一者或一者以上。因此,在一些实施例中,电子装置10可以应用干扰因素特定的参数344-352中与环境声音60最密切地匹配的一个参数(框386)。举例来说,对于在饭店74的场合56,麦克风32检测到的环境声音60可能与七嘴八舌的人186最密切地匹配。电子装置10因此可以在检测到此些环境声音60时应用干扰因素特定的参数346。在其它实施例中,电子装置10可以应用干扰因素特定的参数344-352中与环境声音60最密切地匹配的几个参数。可以基于环境声音60与对应干扰因素182的相似度来对这几个干扰因素特定的参数344-352进行加权。举例来说,体育赛事72的场合56可能具有类似于几个干扰因素182(例如七嘴八舌的人186、白噪声188及摇滚乐190)的环境声音60。当检测到此些环境声音60时,电子装置10可以与每一者与环境声音60的相似度成比例地应用几个相关联的干扰因素特定的参数346、348及/或350。
以类似的方式,电子装置10可以基于识别出的使用电子装置10的场合56来选择及应用场合特定的参数364-378。转向图23,用于进行此操作的流程图390可以在使用电子装置10的与语音有关的特征时开始(框392)。接下来,电子装置10可以确定正在使用电子装置10的当前场合56(框394)。具体来说,电子装置10可以考虑各种装置场合因素(下文参照图24更详细论述)。基于经确定在使用电子装置10的场合56,电子装置10可以应用场合特定的参数364-378中的相关联的一者(框396)。
如图24的装置场合因数图400所示,电子装置10可以考虑各种装置场合因数402来识别正在使用电子装置10的当前场合56。可以单独或结合各种实施例考虑这些装置场合因数402,并且在一些情况下可以对装置场合因数402进行加权。也就是说,可以在确定场合56时给更加可能正确地预测当前场合56的装置场合因数402更大的加权,而可以给不太可能正确地预测当前场合56的装置场合因数402更小的加权。
举例来说,装置场合因数402中的第一因数404可以是电子装置10的麦克风32检测到的环境声音60的特点。由于环境声音60的特点可能与场合56有关,所以电子装置10可以至少部分地基于此分析来确定场合56。
装置场合因数402中的第二因数406可以是当前日期或一天中的时间。在一些实施例中,电子装置10可以将当前日期及/或时间与电子装置10的日历特征比较以确定场合。举例来说,如果日历特征指示用户预期在用餐,则第二特征406可以偏重于确定场合56是饭店74。在另一实例中,由于早晨或傍晚用户可能在赶路,所以在此些时间第二因数406可以偏重于确定场合56是车上70。
装置场合因数402中的第三因数408可以是电子装置10的当前位置,其可通过位置感测电路22来确定。使用第三因数408,电子装置10可以在确定场合56时,例如通过将当前位置与电子装置10的地图特征中的已知位置(例如,饭店74或办公室64)或电子装置10通常所在的位置(其可例如指示办公室64或家里62)比较来考虑其当前位置。
装置场合因数402中的第四因数410可以是例如经由电子装置的图像捕获电路28在电子装置10周围检测到的环境光的量。举例来说,大量环境光可以与某些位于户外的场合56(例如,繁忙的街道68)相关联。在此些状况下,因数410可以偏重于位于户外的场合56。相比之下,较低量的环境光可以与某些位于室内(例如,在家62)的场合56相关联,在此情况下,因数410可以偏重于此室内场合56。
装置场合因数402中的第五因数412可以是电子装置10的检测到的运动。可以基于加速计及/或磁力计30及/或基于位置感测电路22确定的随时间的位置变化来检测此运动。运动可以用各种方式来暗示给定场合56。举例来说,当检测到电子装置10在非常快速地移动(例如,比每小时20英里快)时,因数412可以偏重于电子装置10处在车上70或类似形式的交通工具中。当电子装置10在随机移动时,因数412可以偏重于电子装置10的用户可能在四处移动的场合(例如,在健身馆66或派对76)。当电子装置10大部分时间固定的时候,因数412可以偏重于用户一段时间内坐在一个位置上的场合56(例如,办公室64或饭店74)。
装置场合因数402中的第六因数414可以是与另一装置(例如,蓝牙手持机)的连接。举例来说,与车载免提电话系统的蓝牙连接可以致使第六因数414偏重于确定场合56是在车上70。
在一些实施例中,电子装置10可以基于与电子装置10的给定用户相关联的用户语音简档来确定用户特定的噪声抑制参数102。所得的用户特定的噪声抑制参数102可以致使噪声抑制20将看起来不与用户语音简档相关联且因此可以被理解为可能是噪声的环境声音60隔离。图25到29与此些技术有关。
如图25所示,用于获得用户语音简档的流程图420可以在电子装置10获得语音样本时开始(框422)。此语音样本可以用上文所述的方式中的任一者来获得。电子装置10可以分析语音样本的某些特性,例如上文参照图论述的那些特性(框424)。可以将特定特性量化及存储为用户的语音简档(框426)。可以采用所确定的用户语音简档来针对用户的语音定制噪声抑制20,如下所述。此外,用户语音简档可以使得电子装置10能够识别何时特定用户在使用电子装置10的与语音有关的特征,例如上文参照图15所述。
使用此语音简档,电子装置10可以用最适用于所述用户的语音的方式来执行噪声抑制20。在一个实施例中,如图26的流程图430所表示,电子装置10可以抑制音频信号的更可能对应于环境声音60而不是用户的语音58的频率,同时增强更可能对应于语音信号58的频率。流程图430可以在用户正在使用电子装置10的与语音有关的特征时开始(框432)。电子装置10可以将接收到的包含用户语音信号58及环境声音60两者的音频信号与同当前对电子装置10中说话的用户相关联的用户语音简档比较(框434)。为了针对用户的语音来定制噪声抑制20,电子装置可以用抑制音频信号的不与用户语音简档相关联的频率的方式且通过放大音频信号的与用户语音简档相关联的频率来执行噪声抑制20(框436)。
图27到29展示了进行此操作的一种方式,其表示将音频信号、用户语音简档及传出的经过噪声抑制的信号建模的曲线图。转向图27,曲线图440表示已经在使用与语音有关的特征时被接收到电子装置10的麦克风32中并且被变换到频率域中的音频信号。纵坐标442表示音频信号的频率的量值,且横坐标444表示音频信号的各种离散频率分量。应当理解,可以采用任何合适的变换(例如,快速傅立叶变换(FFT))将音频信号变换到频率域中。类似地,可以将音频信号划分成任何合适数目的离散频率分量(例如,40、128、256等)。
相比之下,图28的曲线图450是将与用户语音简档的频率建模的曲线图。纵坐标452表示用户语音简档的频率的量值,且横坐标454表示用户语音简档的离散频率分量。将图27的音频信号曲线图440与图28的用户语音简档曲线图450比较,可以看出建模的音频信号包含通常不与用户语音简档相关联的频率范围。也就是说,建模的音频信号除了用户的语音之外可能还包含其它环境声音60。
根据此比较,当电子装置10实施噪声抑制20时,其可以确定或选择用户特定的噪声抑制参数102,使得曲线图440的音频信号的对应于曲线图450的用户语音简档的频率的频率大体上被放大,而其它频率大体上被抑制。通过图29的曲线图460将此所得的经过噪声抑制的音频信号建模。曲线图460的纵坐标462表示经过噪声抑制的音频信号的频率的量值,且横坐标464表示经过噪声抑制的信号的离散频率分量。曲线图460的经过放大的部分466大体上对应于在用户语音简档中发现的频率。相比之下,曲线图460的经过抑制的部分468对应于经过噪声抑制的信号的不与曲线图450的用户简档相关联的频率。在一些实施例中,可以将较大量的噪声抑制应用于不与曲线图450的用户语音简档相关联的频率,而可以将较少量的噪声抑制应用于部分466,此部分可以被放大或者可以不被放大。
上文的论述大体上集中于确定用于对传出的音频信号执行噪声抑制20的TX NS 84的用户特定的噪声抑制参数102,如图4所示。然而,如上所述,用户特定的噪声抑制参数102也可以用于对来自另一装置的传入音频信号执行RX NS 92。由于此来自另一装置的传入音频信号将不包含用户自己的语音,所以在某些实施例中,可以基于除了几个干扰因素182之外还涉及几个测试语音的语音训练104来确定用户特定的噪声抑制参数102。
举例来说,如图30的流程图470呈现,电子装置10可以经由涉及预先记录的或模拟的语音及模拟干扰因素182的语音训练104来确定用户特定的噪声抑制参数102。语音训练104的此实施例可以涉及包含各种差值语音及干扰因素182的测试音频信号。流程图470可以在用户起始语音训练104时开始(框472)。电子装置10不是只基于用户自己的语音来执行语音训练104,而是可以对含有各种语音的各种测试音频信号应用各种噪声抑制参数,在某些实施例中所述语音中的一者可以是用户的语音(框474)。此后,电子装置10可以查实用户对于对各种测试音频信号测试的不同噪声抑制参数的偏好。应当理解,可以用与图9的框166-170类似的方式实施框474。
基于在框474处来自用户的反馈,电子装置10可以形成用户特定的噪声抑制参数102(框476)。基于图30的流程图470形成的用户特定的参数102可能非常适合于应用于接收到的音频信号(例如,用于形成RX NS参数94,如图4所示)。确切地说,当电子装置10被“近端”用户用作电话与“远端”用户说话时,接收到的音频信号将包含不同的语音。因此,如图31的流程图480所示,依据从远端用户接收到的音频信号中的远端用户的语音的特点,可以将使用例如参照图30所述的技术的技术来确定的用户特定的噪声抑制参数102应用于所述音频信号。
流程图480可以在电子装置10的与语音有关的特征(例如,电话或聊天特征)正在使用且在从另一电子装置10接收到包含远端用户的语音的音频信号时开始(框482)。随后,电子装置10可以确定音频信号中的远端用户的语音的特点(框484)。举例来说,进行此操作可能必须将接收到的音频信号中的远端用户的语音与在语音训练104(当如上文参照图30论述执行时)期间测试的某些其它语音比较。接下来,电子装置10可以应用对应于其它语音中最类似于最终用户的语音的一个语音的用户特定的噪声抑制参数102(框486)。
总地来说,当第一电子装置10在双向通信期间从第二电子装置10时接收到含有远端用户的语音的音频信号时,可能在第二电子装置10中已经处理了此音频信号以进行噪声抑制。根据某些实施例,第二电子装置10中的此噪声抑制可以针对第一电子装置10的近端用户而定制,如图32的流程图490所述。流程图490可以在第一电子装置10(例如,图33的手持装置34A)正在或即将开始从第二电子装置10(例如,手持装置34B)接收远端用户的语音的音频信号时开始(框492)。第一电子装置10可以将先前由近端用户确定的用户特定的噪声抑制参数102发射到第二电子装置10(框494)。此后,第二电子装置10可以对传出音频信号中的远端用户的语音的噪声抑制应用那些用户特定的噪声抑制参数102(框496)。因此,包含从第二电子装置10发射到第一电子装置10的远端用户的语音的音频信号可以具有第一电子装置10的近端用户偏好的噪声抑制特性。
可以使用两个电子装置10系统地采用图32的上述技术,所述电子装置说明为图33的系统500,包含具有类似的噪声抑制能力的手持装置34A及34B。当近端用户及远端用户分别通过网络(例如,使用电话或聊天特征)将手持装置34A及34B用于相互通信时,手持装置34A及34B可以交换与其相应用户相关联的用户特定的噪声抑制参数102(框504及506)。也就是说,手持装置34B可以接收与手持装置34A的近端用户相关联的用户特定的噪声抑制参数102。同样,手持装置34A可以接收与手持装置34B的远端用户相关联的用户特定的噪声抑制参数102。此后,手持装置34A可以基于远端用户的用户特定的噪声抑制参数102对近端用户的音频信号执行噪声抑制20。同样,手持装置34B可以基于近端用户的用户特定的噪声抑制参数102对远端用户的音频信号执行噪声抑制20。以此方式,手持装置34A及34B的相应用户可以听到来自另一方的噪声抑制与其相应偏好匹配的音频信号。
已经举例展示了上述特定实施例,且应当理解,这些实施例可以得到各种修改及替代形式。应进一步理解,权利要求书并不意图限于所揭示的特定形式,而是涵盖所有属于本发明的精神及范围内的修改、等效物及替代形式。
Claims (25)
1.一种方法,其包括:
在使用电子装置的与语音有关的特征时在所述电子装置中接收包含用户语音的音频信号;以及
使用所述电子装置至少部分地基于用户特定的噪声抑制参数来抑制所述音频信号中的噪声同时实质上保留所述用户语音,其中所述用户特定的噪声抑制参数至少部分是基于用户噪声抑制偏好或用户语音简档或其组合。
2.根据权利要求1所述的方法,其中所述用户噪声抑制偏好至少部分是基于用户噪声抑制训练序列。
3.根据权利要求2所述的方法,其中所述用户噪声抑制训练序列包括在已经对测试音频信号测试了噪声抑制参数且将所述噪声抑制参数回放给所述用户之后在所述电子装置中接收用户对偏好的噪声参数的选择。
4.根据权利要求2所述的方法,其中所述用户噪声抑制训练序列包括测试应用于包含用户语音样本及至少一个干扰因素的测试音频信号的噪声抑制参数。
5.根据权利要求1所述的方法,其中所述用户噪声抑制偏好至少部分是基于用户选择的噪声抑制设置。
6.根据权利要求5所述的方法,其中所述用户选择的噪声抑制设置包括噪声抑制强度设置。
7.根据权利要求5所述的方法,其中所述用户选择的噪声抑制设置可以在使用所述电子装置的所述与语音有关的特征时由用户实时选择。
8.根据权利要求1所述的方法,其中所述用户特定的噪声抑制参数至少部分地通过放大与所述用户语音简档相关联的频率来抑制所述音频信号中的噪声同时实质上保留所述用户语音。
9.根据权利要求1所述的方法,其中所述用户特定的噪声抑制参数至少部分地通过抑制不与所述用户语音简档相关联的频率来抑制所述音频信号中的噪声同时实质上保留所述用户语音。
10.一种制造品,其包括:
一个或一个以上有形的机器可读的存储媒体,其上面编码有用于由处理器执行的指令,所述指令包括:
用以确定包含用户语音样本及至少一个干扰因素的测试音频信号的指令;
用以至少部分地基于第一噪声抑制参数对所述测试音频信号应用噪声抑制以获得第一经过噪声抑制的音频信号的指令;
用以致使所述第一经过噪声抑制的音频信号被输出到扬声器的指令;
用以至少部分地基于第二噪声抑制参数对所述测试音频信号应用噪声抑制以获得第二经过噪声抑制的音频信号的指令;
用以致使所述第二经过噪声抑制的音频信号被输出到所述扬声器的指令;
用于获得对所述第一经过噪声抑制的音频信号或所述第二经过噪声抑制的音频信号的用户偏好的指示的指令;以及
用以依据对所述第一经过噪声抑制的信号或所述第二经过噪声抑制的信号的所述用户偏好的所述指示至少部分地基于所述第一噪声抑制参数或所述第二噪声抑制参数来确定用户特定的噪声抑制参数的指令,其中所述用户特定的噪声抑制参数经配置以在使用所述电子装置的与语音有关的特征时抑制噪声。
11.根据权利要求10所述的制造品,其中所述用以确定所述测试音频信号的指令包括用以在所述干扰因素正在所述扬声器上大声播放时使用麦克风记录所述用户语音样本的指令。
12.根据权利要求10所述的制造品,其中所述用以确定所述测试音频信号的指令包括用以在所述干扰因素正在另一装置上大声播放时使用麦克风记录所述用户语音样本的指令。
13.根据权利要求10所述的制造品,其中所述用以确定所述测试音频信号的指令包括用以使用麦克风记录所述用户语音样本且用电子方式将所述用户语音样本与所述干扰因素混合的指令。
14.根据权利要求10所述的制造品,其包括:
用以至少部分地基于第三噪声抑制参数对所述测试音频信号应用噪声抑制以获得第三经过噪声抑制的音频信号的指令;
用以致使所述第三经过噪声抑制的音频信号被输出到所述扬声器的指令;
用以至少部分地基于第四噪声抑制参数对所述测试音频信号应用噪声抑制以获得第四经过噪声抑制的音频信号的指令;
用以致使所述第四经过噪声抑制的音频信号被输出到所述扬声器的指令;
用以获得对所述第三经过噪声抑制的音频信号或所述第四经过噪声抑制的音频信号的用户偏好的指示的指令;以及
用以依据对所述第三经过噪声抑制的音频信号或所述第四经过噪声抑制的音频信号的所述用户偏好的所述指示至少部分地基于所述第一噪声抑制参数、所述第二噪声抑制参数、所述第三噪声抑制参数或所述第四噪声抑制参数或其组合来确定所述用户特定的噪声抑制参数的指令。
15.根据权利要求14所述的制造品,其包括用以至少部分地基于对所述第一经过噪声抑制的音频信号或所述第二经过噪声抑制的音频信号的所述用户偏好来确定所述第三噪声抑制参数及所述第四噪声抑制参数的指令。
16.一种电子装置,其包括:
麦克风,其经配置以获得包含用户语音及环境声音的音频信号;
噪声抑制电路,其经配置以至少部分地基于用户及场合特定的噪声抑制参数对所述音频信号应用噪声抑制,以抑制所述音频信号的所述环境声音;
存储器,其经配置以存储至少部分地基于对应用于用户语音样本及多个干扰因素的噪声抑制参数的测试而确定的多个噪声抑制参数;以及
数据处理电路,其经配置以通过确定所述电子装置的当前使用场合及选择所述多个噪声抑制参数中的至少一者来将所述用户及场合特定的噪声抑制参数提供到所述噪声抑制电路,其中所述多个噪声抑制参数中的所述至少一者是至少部分地基于对应用于所述用户语音样本及所述多个干扰因素中的至少一者的噪声抑制参数的测试而确定的,其中所述多个干扰因素中的所述至少一者与所述当前使用场合相关联。
17.根据权利要求16所述的电子装置,其中所述数据处理电路经配置以通过分析所述音频信号的所述环境声音来确定所述电子装置的所述当前使用场合且通过确定所述多个干扰因素中的哪一些与所述环境声音类似来确定所述多个干扰因素中与所述当前使用场合相关联的所述至少一者。
18.根据权利要求16所述的电子装置,其中所述数据处理电路经配置以至少部分地基于以下内容来确定所述电子装置的所述当前使用场合:来自所述电子装置的内部时钟的日期或时间或其组合、来自所述电子装置的位置感测电路的位置、来自所述电子装置的图像捕获电路的环境光的量、来自所述电子装置的运动感测电路的所述电子装置的运动、与另一电子装置的连接或来自所述麦克风的所述环境声音的音量或其任何组合,且其中所述数据处理电路经配置以通过确定所述多个干扰因素中的哪一些类似于所述确定的使用场合中的预期环境声音来确定所述多个干扰因素中与所述当前使用场合相关联的所述至少一者。
19.一种电子装置,其包括:
麦克风,其经配置以获得包含用户语音及环境声音的音频信号;
噪声抑制电路,其经配置以至少部分地基于用户特定的噪声抑制参数对所述音频信号应用噪声抑制,以抑制所述音频信号的所述环境声音;以及
数据处理电路,其经配置以提供所述用户特定的噪声抑制参数,其中所述数据处理电路经配置以至少部分地基于与所述用户语音相关联的用户语音简档来确定所述用户特定的噪声抑制参数。
20.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以至少部分地基于用户语音样本来确定所述用户语音简档,其中所述麦克风经配置以在所述电子装置的激活周期期间获得所述用户语音样本。
21.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以至少部分地基于用户语音样本来确定所述用户语音简档,其中所述麦克风经配置以通过监视在使用所述电子装置的与语音有关的特征时获得的另一音频信号的信噪比且在所述另一音频信号的所述信噪比超过阈值时记录所述另一音频信号来获得所述用户语音样本。
22.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以确定所述用户语音是否对应于已知用户,且在所述用户语音对应于所述已知用户时,重新调用与所述用户语音相关联的所述用户语音简档。
23.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以确定所述用户语音是否对应于已知用户,且在所述用户语音不对应于所述已知用户时,通过获得用户语音样本及至少部分地基于所述用户语音样本来确定与所述用户语音相关联的所述用户语音简档而确定所述用户语音简档。
24.一种系统,其包括:
第一电子装置,其经配置以从与所述第一电子装置相关联的麦克风获得第一用户语音信号,将所述第一用户语音信号提供到第二电子装置,且从所述第二电子装置接收第二用户噪声抑制参数,其中所述第一电子装置经配置以在将所述第一用户语音信号提供到所述第二电子装置之前至少部分地基于所述第二用户噪声抑制参数对所述第一用户语音信号应用噪声抑制。
25.根据权利要求24所述的系统,其中所述第一电子装置经配置以将第一用户噪声抑制参数提供到所述第二电子装置且从所述第二电子装置接收第二用户语音信号,其中在所述第一电子装置接收到所述第二用户语音信号之前,已经至少部分地基于所述第一用户噪声抑制参数对所述第二用户语音信号应用噪声抑制。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/794,643 | 2010-06-04 | ||
US12/794,643 US8639516B2 (en) | 2010-06-04 | 2010-06-04 | User-specific noise suppression for voice quality improvements |
PCT/US2011/037014 WO2011152993A1 (en) | 2010-06-04 | 2011-05-18 | User-specific noise suppression for voice quality improvements |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102859592A true CN102859592A (zh) | 2013-01-02 |
CN102859592B CN102859592B (zh) | 2014-08-13 |
Family
ID=44276060
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180021126.1A Active CN102859592B (zh) | 2010-06-04 | 2011-05-18 | 用于语音质量改进的用户特定的噪声抑制 |
Country Status (7)
Country | Link |
---|---|
US (2) | US8639516B2 (zh) |
EP (1) | EP2577658B1 (zh) |
JP (1) | JP2013527499A (zh) |
KR (1) | KR101520162B1 (zh) |
CN (1) | CN102859592B (zh) |
AU (1) | AU2011261756B2 (zh) |
WO (1) | WO2011152993A1 (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103594092A (zh) * | 2013-11-25 | 2014-02-19 | 广东欧珀移动通信有限公司 | 一种单麦克风语音降噪方法和装置 |
WO2014161299A1 (zh) * | 2013-08-15 | 2014-10-09 | 中兴通讯股份有限公司 | 一种语音质量处理的方法及装置 |
CN106062661A (zh) * | 2014-03-31 | 2016-10-26 | 英特尔公司 | 用于常开常听的语音识别系统的位置感知功率管理方案 |
CN106165383A (zh) * | 2014-05-12 | 2016-11-23 | 英特尔公司 | 远端上下文相关的预处理 |
CN106453760A (zh) * | 2016-10-11 | 2017-02-22 | 努比亚技术有限公司 | 一种改善环境噪声的方法及终端 |
CN106878533A (zh) * | 2015-12-10 | 2017-06-20 | 北京奇虎科技有限公司 | 一种移动终端的通信方法和装置 |
CN109905794A (zh) * | 2019-03-06 | 2019-06-18 | 中国人民解放军联勤保障部队第九八八医院 | 基于战场应用的自适应智能化防护耳塞的数据分析系统 |
CN111986689A (zh) * | 2020-07-30 | 2020-11-24 | 维沃移动通信有限公司 | 音频播放方法、音频播放装置和电子设备 |
WO2021093380A1 (zh) * | 2019-11-13 | 2021-05-20 | 苏宁云计算有限公司 | 一种噪声处理方法、装置、系统 |
Families Citing this family (195)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
EP2453979B1 (en) * | 2009-07-17 | 2019-07-24 | Implantica Patent Ltd. | A system for voice control of a medical implant |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US8639516B2 (en) | 2010-06-04 | 2014-01-28 | Apple Inc. | User-specific noise suppression for voice quality improvements |
CN102479024A (zh) * | 2010-11-24 | 2012-05-30 | 国基电子(上海)有限公司 | 手持装置及其用户界面构建方法 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
WO2013115768A1 (en) * | 2012-01-30 | 2013-08-08 | Hewlett-Packard Development Company , L.P. | Monitor an event that produces a noise received by a microphone |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9184791B2 (en) | 2012-03-15 | 2015-11-10 | Blackberry Limited | Selective adaptive audio cancellation algorithm configuration |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
WO2014062859A1 (en) * | 2012-10-16 | 2014-04-24 | Audiologicall, Ltd. | Audio signal manipulation for speech enhancement before sound reproduction |
US9357165B2 (en) * | 2012-11-16 | 2016-05-31 | At&T Intellectual Property I, Lp | Method and apparatus for providing video conferencing |
WO2014081408A1 (en) | 2012-11-20 | 2014-05-30 | Unify Gmbh & Co. Kg | Method, device, and system for audio data processing |
US9251804B2 (en) * | 2012-11-21 | 2016-02-02 | Empire Technology Development Llc | Speech recognition |
JP6314837B2 (ja) * | 2013-01-15 | 2018-04-25 | ソニー株式会社 | 記憶制御装置、再生制御装置および記録媒体 |
KR102516577B1 (ko) | 2013-02-07 | 2023-04-03 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9344815B2 (en) | 2013-02-11 | 2016-05-17 | Symphonic Audio Technologies Corp. | Method for augmenting hearing |
US9344793B2 (en) | 2013-02-11 | 2016-05-17 | Symphonic Audio Technologies Corp. | Audio apparatus and methods |
US9319019B2 (en) | 2013-02-11 | 2016-04-19 | Symphonic Audio Technologies Corp. | Method for augmenting a listening experience |
US20140278392A1 (en) * | 2013-03-12 | 2014-09-18 | Motorola Mobility Llc | Method and Apparatus for Pre-Processing Audio Signals |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9293140B2 (en) * | 2013-03-15 | 2016-03-22 | Broadcom Corporation | Speaker-identification-assisted speech processing systems and methods |
US9269368B2 (en) * | 2013-03-15 | 2016-02-23 | Broadcom Corporation | Speaker-identification-assisted uplink speech processing systems and methods |
US9520138B2 (en) * | 2013-03-15 | 2016-12-13 | Broadcom Corporation | Adaptive modulation filtering for spectral feature enhancement |
US20140278418A1 (en) * | 2013-03-15 | 2014-09-18 | Broadcom Corporation | Speaker-identification-assisted downlink speech processing systems and methods |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US9626963B2 (en) * | 2013-04-30 | 2017-04-18 | Paypal, Inc. | System and method of improving speech recognition using context |
US9083782B2 (en) | 2013-05-08 | 2015-07-14 | Blackberry Limited | Dual beamform audio echo reduction |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
ES2615877T3 (es) | 2013-06-25 | 2017-06-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Métodos, nodos de red, programas de ordenador y productos de programa de ordenador para gestionar el tratamiento de un flujo continuo de audio |
DK2835985T3 (en) * | 2013-08-08 | 2017-08-07 | Oticon As | Hearing aid and feedback reduction method |
WO2015026859A1 (en) * | 2013-08-19 | 2015-02-26 | Symphonic Audio Technologies Corp. | Audio apparatus and methods |
US9392353B2 (en) * | 2013-10-18 | 2016-07-12 | Plantronics, Inc. | Headset interview mode |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9578161B2 (en) * | 2013-12-13 | 2017-02-21 | Nxp B.V. | Method for metadata-based collaborative voice processing for voice communication |
US9466310B2 (en) * | 2013-12-20 | 2016-10-11 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Compensating for identifiable background content in a speech recognition device |
KR20150117114A (ko) | 2014-04-09 | 2015-10-19 | 한국전자통신연구원 | 잡음 제거 장치 및 방법 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
US9904851B2 (en) * | 2014-06-11 | 2018-02-27 | At&T Intellectual Property I, L.P. | Exploiting visual information for enhancing audio signals via source separation and beamforming |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
DE102014009689A1 (de) * | 2014-06-30 | 2015-12-31 | Airbus Operations Gmbh | Intelligentes Soundsystem/-modul zur Kabinenkommunikation |
JP6381062B2 (ja) | 2014-07-28 | 2018-08-29 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 通信デバイスのための音声信号を処理するための方法及びデバイス |
DE112015003945T5 (de) | 2014-08-28 | 2017-05-11 | Knowles Electronics, Llc | Mehrquellen-Rauschunterdrückung |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
CN107112025A (zh) | 2014-09-12 | 2017-08-29 | 美商楼氏电子有限公司 | 用于恢复语音分量的系统和方法 |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9530408B2 (en) | 2014-10-31 | 2016-12-27 | At&T Intellectual Property I, L.P. | Acoustic environment recognizer for optimal speech processing |
US10609475B2 (en) | 2014-12-05 | 2020-03-31 | Stages Llc | Active noise control and customized audio system |
WO2016123560A1 (en) | 2015-01-30 | 2016-08-04 | Knowles Electronics, Llc | Contextual switching of microphones |
KR102371697B1 (ko) * | 2015-02-11 | 2022-03-08 | 삼성전자주식회사 | 음성 기능 운용 방법 및 이를 지원하는 전자 장치 |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
CN105338170A (zh) * | 2015-09-23 | 2016-02-17 | 广东小天才科技有限公司 | 一种滤除背景噪声的方法及装置 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
JP6755304B2 (ja) * | 2016-04-26 | 2020-09-16 | 株式会社ソニー・インタラクティブエンタテインメント | 情報処理装置 |
US9838737B2 (en) * | 2016-05-05 | 2017-12-05 | Google Inc. | Filtering wind noises in video content |
WO2017197312A2 (en) * | 2016-05-13 | 2017-11-16 | Bose Corporation | Processing speech from distributed microphones |
US10045130B2 (en) | 2016-05-25 | 2018-08-07 | Smartear, Inc. | In-ear utility device having voice recognition |
US20170347177A1 (en) | 2016-05-25 | 2017-11-30 | Smartear, Inc. | In-Ear Utility Device Having Sensors |
WO2017205558A1 (en) * | 2016-05-25 | 2017-11-30 | Smartear, Inc | In-ear utility device having dual microphones |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10891946B2 (en) | 2016-07-28 | 2021-01-12 | Red Hat, Inc. | Voice-controlled assistant volume control |
US10771631B2 (en) * | 2016-08-03 | 2020-09-08 | Dolby Laboratories Licensing Corporation | State-based endpoint conference interaction |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10945080B2 (en) | 2016-11-18 | 2021-03-09 | Stages Llc | Audio analysis and processing system |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10629200B2 (en) * | 2017-03-07 | 2020-04-21 | Salesboost, Llc | Voice analysis training system |
WO2018164304A1 (ko) * | 2017-03-10 | 2018-09-13 | 삼성전자 주식회사 | 잡음 환경의 통화 품질을 개선하는 방법 및 장치 |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10410634B2 (en) | 2017-05-18 | 2019-09-10 | Smartear, Inc. | Ear-borne audio device conversation recording and compressed data transmission |
US10235128B2 (en) * | 2017-05-19 | 2019-03-19 | Intel Corporation | Contextual sound filter |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10582285B2 (en) | 2017-09-30 | 2020-03-03 | Smartear, Inc. | Comfort tip with pressure relief valves and horn |
US10665234B2 (en) * | 2017-10-18 | 2020-05-26 | Motorola Mobility Llc | Detecting audio trigger phrases for a voice recognition session |
CN107945815B (zh) * | 2017-11-27 | 2021-09-07 | 歌尔科技有限公司 | 语音信号降噪方法及设备 |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10754611B2 (en) * | 2018-04-23 | 2020-08-25 | International Business Machines Corporation | Filtering sound based on desirability |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US11749293B2 (en) * | 2018-07-20 | 2023-09-05 | Sony Interactive Entertainment Inc. | Audio signal processing device |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
CN112201247A (zh) * | 2019-07-08 | 2021-01-08 | 北京地平线机器人技术研发有限公司 | 语音增强方法和装置、电子设备和存储介质 |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
KR20210091003A (ko) * | 2020-01-13 | 2021-07-21 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
KR20210121472A (ko) * | 2020-03-30 | 2021-10-08 | 엘지전자 주식회사 | 인공지능 기반의 음질개선 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11697301B2 (en) * | 2020-11-10 | 2023-07-11 | Baysoft LLC | Remotely programmable wearable device |
CN112309426A (zh) * | 2020-11-24 | 2021-02-02 | 北京达佳互联信息技术有限公司 | 语音处理模型训练方法及装置和语音处理方法及装置 |
US11741983B2 (en) * | 2021-01-13 | 2023-08-29 | Qualcomm Incorporated | Selective suppression of noises in a sound signal |
US11645037B2 (en) * | 2021-01-27 | 2023-05-09 | Dell Products L.P. | Adjusting audio volume and quality of near end and far end talkers |
WO2022211504A1 (en) * | 2021-03-31 | 2022-10-06 | Samsung Electronics Co., Ltd. | Method and electronic device for suppressing noise portion from media event |
CN117157707A (zh) * | 2021-04-13 | 2023-12-01 | 谷歌有限责任公司 | 移动设备辅助的主动噪声控制 |
US20230410824A1 (en) * | 2022-05-31 | 2023-12-21 | Sony Interactive Entertainment LLC | Systems and methods for automated customized voice filtering |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0558312A1 (en) * | 1992-02-27 | 1993-09-01 | Central Institute For The Deaf | Adaptive noise reduction circuit for a sound reproduction system |
US6463128B1 (en) * | 1999-09-29 | 2002-10-08 | Denso Corporation | Adjustable coding detection in a portable telephone |
CN1640191A (zh) * | 2002-07-12 | 2005-07-13 | 唯听助听器公司 | 助听器和提高语言清晰度的方法 |
US20060282264A1 (en) * | 2005-06-09 | 2006-12-14 | Bellsouth Intellectual Property Corporation | Methods and systems for providing noise filtering using speech recognition |
US20080165980A1 (en) * | 2007-01-04 | 2008-07-10 | Sound Id | Personalized sound system hearing profile selection process |
Family Cites Families (307)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4759070A (en) | 1986-05-27 | 1988-07-19 | Voroba Technologies Associates | Patient controlled master hearing aid |
US4974191A (en) | 1987-07-31 | 1990-11-27 | Syntellect Software Inc. | Adaptive natural language computer interface system |
US5282265A (en) | 1988-10-04 | 1994-01-25 | Canon Kabushiki Kaisha | Knowledge information processing system |
SE466029B (sv) | 1989-03-06 | 1991-12-02 | Ibm Svenska Ab | Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem |
US5128672A (en) | 1990-10-30 | 1992-07-07 | Apple Computer, Inc. | Dynamic predictive keyboard |
US5303406A (en) | 1991-04-29 | 1994-04-12 | Motorola, Inc. | Noise squelch circuit with adaptive noise shaping |
US5903454A (en) | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
US6081750A (en) | 1991-12-23 | 2000-06-27 | Hoffberg; Steven Mark | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US5434777A (en) | 1992-05-27 | 1995-07-18 | Apple Computer, Inc. | Method and apparatus for processing natural language |
JPH0619965A (ja) | 1992-07-01 | 1994-01-28 | Canon Inc | 自然言語処理装置 |
CA2091658A1 (en) | 1993-03-15 | 1994-09-16 | Matthew Lennig | Method and apparatus for automation of directory assistance using speech recognition |
JPH0869470A (ja) | 1994-06-21 | 1996-03-12 | Canon Inc | 自然言語処理装置及びその方法 |
US5682539A (en) | 1994-09-29 | 1997-10-28 | Conrad; Donovan | Anticipated meaning natural language interface |
US5577241A (en) | 1994-12-07 | 1996-11-19 | Excite, Inc. | Information retrieval system and method with implementation extensible query architecture |
US5748974A (en) | 1994-12-13 | 1998-05-05 | International Business Machines Corporation | Multimodal natural language interface for cross-application tasks |
US5794050A (en) | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
JP3284832B2 (ja) | 1995-06-22 | 2002-05-20 | セイコーエプソン株式会社 | 音声認識対話処理方法および音声認識対話装置 |
WO1997010586A1 (en) | 1995-09-14 | 1997-03-20 | Ericsson Inc. | System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions |
US5987404A (en) | 1996-01-29 | 1999-11-16 | International Business Machines Corporation | Statistical natural language understanding using hidden clumpings |
US5826261A (en) | 1996-05-10 | 1998-10-20 | Spencer; Graham | System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query |
US5727950A (en) | 1996-05-22 | 1998-03-17 | Netsage Corporation | Agent based instruction system and method |
US5966533A (en) | 1996-06-11 | 1999-10-12 | Excite, Inc. | Method and system for dynamically synthesizing a computer program by differentially resolving atoms based on user context data |
US5915249A (en) | 1996-06-14 | 1999-06-22 | Excite, Inc. | System and method for accelerated query evaluation of very large full-text databases |
US6181935B1 (en) | 1996-09-27 | 2001-01-30 | Software.Com, Inc. | Mobility extended telephone application programming interface and method of use |
US5836771A (en) | 1996-12-02 | 1998-11-17 | Ho; Chi Fai | Learning method and system based on questioning |
US6665639B2 (en) | 1996-12-06 | 2003-12-16 | Sensory, Inc. | Speech recognition in consumer electronic products |
US6904110B2 (en) * | 1997-07-31 | 2005-06-07 | Francois Trans | Channel equalization system and method |
US5895466A (en) | 1997-08-19 | 1999-04-20 | At&T Corp | Automated natural language understanding customer service system |
US6404876B1 (en) | 1997-09-25 | 2002-06-11 | Gte Intelligent Network Services Incorporated | System and method for voice activated dialing and routing under open access network control |
DE69712485T2 (de) | 1997-10-23 | 2002-12-12 | Sony Int Europe Gmbh | Sprachschnittstelle für ein Hausnetzwerk |
US5970446A (en) * | 1997-11-25 | 1999-10-19 | At&T Corp | Selective noise/channel/coding models and recognizers for automatic speech recognition |
US6233559B1 (en) | 1998-04-01 | 2001-05-15 | Motorola, Inc. | Speech control of multiple applications using applets |
US6088731A (en) | 1998-04-24 | 2000-07-11 | Associative Computing, Inc. | Intelligent assistant for use with a local computer and with the internet |
US6144938A (en) | 1998-05-01 | 2000-11-07 | Sun Microsystems, Inc. | Voice user interface with personality |
US7711672B2 (en) | 1998-05-28 | 2010-05-04 | Lawrence Au | Semantic network methods to disambiguate natural language meaning |
US20070094222A1 (en) | 1998-05-28 | 2007-04-26 | Lawrence Au | Method and system for using voice input for performing network functions |
US6144958A (en) | 1998-07-15 | 2000-11-07 | Amazon.Com, Inc. | System and method for correcting spelling errors in search queries |
US6434524B1 (en) | 1998-09-09 | 2002-08-13 | One Voice Technologies, Inc. | Object interactive user interface using speech recognition and natural language processing |
US6499013B1 (en) | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
US6792082B1 (en) | 1998-09-11 | 2004-09-14 | Comverse Ltd. | Voice mail system with personal assistant provisioning |
DE29825146U1 (de) | 1998-09-11 | 2005-08-18 | Püllen, Rainer | Teilnehmereinheit und System für einen Multimediadienst |
US6317831B1 (en) | 1998-09-21 | 2001-11-13 | Openwave Systems Inc. | Method and apparatus for establishing a secure connection over a one-way data path |
US7137126B1 (en) | 1998-10-02 | 2006-11-14 | International Business Machines Corporation | Conversational computing via conversational virtual machine |
GB9821969D0 (en) | 1998-10-08 | 1998-12-02 | Canon Kk | Apparatus and method for processing natural language |
US6928614B1 (en) | 1998-10-13 | 2005-08-09 | Visteon Global Technologies, Inc. | Mobile office with speech recognition |
US6453292B2 (en) | 1998-10-28 | 2002-09-17 | International Business Machines Corporation | Command boundary identifier for conversational natural language |
US6321092B1 (en) | 1998-11-03 | 2001-11-20 | Signal Soft Corporation | Multiple input data management for wireless location-based applications |
US6446076B1 (en) | 1998-11-12 | 2002-09-03 | Accenture Llp. | Voice interactive web-based agent system responsive to a user location for prioritizing and formatting information |
US6246981B1 (en) | 1998-11-25 | 2001-06-12 | International Business Machines Corporation | Natural language task-oriented dialog manager and method |
US7881936B2 (en) | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US6757718B1 (en) | 1999-01-05 | 2004-06-29 | Sri International | Mobile navigation of network-based electronic information using spoken input |
US6523061B1 (en) | 1999-01-05 | 2003-02-18 | Sri International, Inc. | System, method, and article of manufacture for agent-based navigation in a speech-based data navigation system |
US6851115B1 (en) | 1999-01-05 | 2005-02-01 | Sri International | Software-based architecture for communication and cooperation among distributed electronic agents |
US7036128B1 (en) | 1999-01-05 | 2006-04-25 | Sri International Offices | Using a community of distributed electronic agents to support a highly mobile, ambient computing environment |
US6513063B1 (en) | 1999-01-05 | 2003-01-28 | Sri International | Accessing network-based electronic information through scripted online interfaces using spoken input |
US6742021B1 (en) | 1999-01-05 | 2004-05-25 | Sri International, Inc. | Navigating network-based electronic information using spoken input with multimodal error feedback |
US7966078B2 (en) * | 1999-02-01 | 2011-06-21 | Steven Hoffberg | Network media appliance system and method |
US6928404B1 (en) | 1999-03-17 | 2005-08-09 | International Business Machines Corporation | System and methods for acoustic and language modeling for automatic speech recognition with large vocabularies |
US6647260B2 (en) | 1999-04-09 | 2003-11-11 | Openwave Systems Inc. | Method and system facilitating web based provisioning of two-way mobile communications devices |
US6598039B1 (en) | 1999-06-08 | 2003-07-22 | Albert-Inc. S.A. | Natural language interface for searching database |
US6421672B1 (en) | 1999-07-27 | 2002-07-16 | Verizon Services Corp. | Apparatus for and method of disambiguation of directory listing searches utilizing multiple selectable secondary search keys |
US6601026B2 (en) | 1999-09-17 | 2003-07-29 | Discern Communications, Inc. | Information retrieval by natural language querying |
US7020685B1 (en) | 1999-10-08 | 2006-03-28 | Openwave Systems Inc. | Method and apparatus for providing internet content to SMS-based wireless devices |
AU8030300A (en) | 1999-10-19 | 2001-04-30 | Sony Electronics Inc. | Natural language interface control system |
US6807574B1 (en) | 1999-10-22 | 2004-10-19 | Tellme Networks, Inc. | Method and apparatus for content personalization over a telephone interface |
JP2001125896A (ja) | 1999-10-26 | 2001-05-11 | Victor Co Of Japan Ltd | 自然言語対話システム |
US7310600B1 (en) | 1999-10-28 | 2007-12-18 | Canon Kabushiki Kaisha | Language recognition using a similarity measure |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6633846B1 (en) | 1999-11-12 | 2003-10-14 | Phoenix Solutions, Inc. | Distributed realtime speech recognition system |
US6615172B1 (en) | 1999-11-12 | 2003-09-02 | Phoenix Solutions, Inc. | Intelligent query engine for processing voice based queries |
US6665640B1 (en) | 1999-11-12 | 2003-12-16 | Phoenix Solutions, Inc. | Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US7050977B1 (en) | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US6532446B1 (en) | 1999-11-24 | 2003-03-11 | Openwave Systems Inc. | Server based speech recognition user interface for wireless devices |
US6526395B1 (en) | 1999-12-31 | 2003-02-25 | Intel Corporation | Application of personality models and interaction with synthetic characters in a computing system |
US6895558B1 (en) | 2000-02-11 | 2005-05-17 | Microsoft Corporation | Multi-access mode electronic personal assistant |
US6606388B1 (en) | 2000-02-17 | 2003-08-12 | Arboretum Systems, Inc. | Method and system for enhancing audio signals |
US6895380B2 (en) | 2000-03-02 | 2005-05-17 | Electro Standards Laboratories | Voice actuation with contextual learning for intelligent machine control |
US6466654B1 (en) | 2000-03-06 | 2002-10-15 | Avaya Technology Corp. | Personal virtual assistant with semantic tagging |
EP1275042A2 (en) | 2000-03-06 | 2003-01-15 | Kanisa Inc. | A system and method for providing an intelligent multi-step dialog with a user |
US6757362B1 (en) | 2000-03-06 | 2004-06-29 | Avaya Technology Corp. | Personal virtual assistant |
GB2366009B (en) | 2000-03-22 | 2004-07-21 | Canon Kk | Natural language machine interface |
US7177798B2 (en) | 2000-04-07 | 2007-02-13 | Rensselaer Polytechnic Institute | Natural language interface using constrained intermediate dictionary of results |
US6810379B1 (en) | 2000-04-24 | 2004-10-26 | Sensory, Inc. | Client/server architecture for text-to-speech synthesis |
US8463912B2 (en) * | 2000-05-23 | 2013-06-11 | Media Farm, Inc. | Remote displays in mobile communication networks |
US6691111B2 (en) | 2000-06-30 | 2004-02-10 | Research In Motion Limited | System and method for implementing a natural language user interface |
JP3949356B2 (ja) | 2000-07-12 | 2007-07-25 | 三菱電機株式会社 | 音声対話システム |
US7139709B2 (en) | 2000-07-20 | 2006-11-21 | Microsoft Corporation | Middleware layer between speech related applications and engines |
US20060143007A1 (en) | 2000-07-24 | 2006-06-29 | Koh V E | User interaction with voice information services |
JP2002041276A (ja) | 2000-07-24 | 2002-02-08 | Sony Corp | 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体 |
US7092928B1 (en) | 2000-07-31 | 2006-08-15 | Quantum Leap Research, Inc. | Intelligent portal engine |
US6778951B1 (en) | 2000-08-09 | 2004-08-17 | Concerto Software, Inc. | Information retrieval method with natural language interface |
AU2001295080A1 (en) | 2000-09-29 | 2002-04-08 | Professorq, Inc. | Natural-language voice-activated personal assistant |
US7219058B1 (en) * | 2000-10-13 | 2007-05-15 | At&T Corp. | System and method for processing speech recognition results |
GB2386724A (en) * | 2000-10-16 | 2003-09-24 | Tangis Corp | Dynamically determining appropriate computer interfaces |
JP4244514B2 (ja) * | 2000-10-23 | 2009-03-25 | セイコーエプソン株式会社 | 音声認識方法および音声認識装置 |
US6832194B1 (en) | 2000-10-26 | 2004-12-14 | Sensory, Incorporated | Audio recognition peripheral system |
US7027974B1 (en) | 2000-10-27 | 2006-04-11 | Science Applications International Corporation | Ontology-based parser for natural language processing |
US20020072816A1 (en) * | 2000-12-07 | 2002-06-13 | Yoav Shdema | Audio system |
US7257537B2 (en) | 2001-01-12 | 2007-08-14 | International Business Machines Corporation | Method and apparatus for performing dialog management in a computer conversational interface |
US6964023B2 (en) | 2001-02-05 | 2005-11-08 | International Business Machines Corporation | System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input |
US7290039B1 (en) | 2001-02-27 | 2007-10-30 | Microsoft Corporation | Intent based processing |
US7216073B2 (en) | 2001-03-13 | 2007-05-08 | Intelligate, Ltd. | Dynamic natural language understanding |
US6996531B2 (en) | 2001-03-30 | 2006-02-07 | Comverse Ltd. | Automated database assistance using a telephone for a speech based or text based multimedia communication mode |
US7085722B2 (en) | 2001-05-14 | 2006-08-01 | Sony Computer Entertainment America Inc. | System and method for menu-driven voice control of characters in a game environment |
US20020194003A1 (en) | 2001-06-05 | 2002-12-19 | Mozer Todd F. | Client-server security system and method |
US7139722B2 (en) | 2001-06-27 | 2006-11-21 | Bellsouth Intellectual Property Corporation | Location and time sensitive wireless calendaring |
US6604059B2 (en) | 2001-07-10 | 2003-08-05 | Koninklijke Philips Electronics N.V. | Predictive calendar |
US20030033153A1 (en) | 2001-08-08 | 2003-02-13 | Apple Computer, Inc. | Microphone elements for a computing system |
US7987151B2 (en) | 2001-08-10 | 2011-07-26 | General Dynamics Advanced Info Systems, Inc. | Apparatus and method for problem solving using intelligent agents |
US6813491B1 (en) | 2001-08-31 | 2004-11-02 | Openwave Systems Inc. | Method and apparatus for adapting settings of wireless communication devices in accordance with user proximity |
US7403938B2 (en) | 2001-09-24 | 2008-07-22 | Iac Search & Media, Inc. | Natural language query processing |
US6985865B1 (en) | 2001-09-26 | 2006-01-10 | Sprint Spectrum L.P. | Method and system for enhanced response to voice commands in a voice command platform |
US6650735B2 (en) | 2001-09-27 | 2003-11-18 | Microsoft Corporation | Integrated voice access to a variety of personal information services |
US7324947B2 (en) | 2001-10-03 | 2008-01-29 | Promptu Systems Corporation | Global speech user interface |
US7167832B2 (en) | 2001-10-15 | 2007-01-23 | At&T Corp. | Method for dialog management |
TW541517B (en) | 2001-12-25 | 2003-07-11 | Univ Nat Cheng Kung | Speech recognition system |
US7197460B1 (en) | 2002-04-23 | 2007-03-27 | At&T Corp. | System for handling frequently asked questions in a natural language dialog service |
US7546382B2 (en) | 2002-05-28 | 2009-06-09 | International Business Machines Corporation | Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms |
US7398209B2 (en) | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7299033B2 (en) | 2002-06-28 | 2007-11-20 | Openwave Systems Inc. | Domain-based management of distribution of digital content from multiple suppliers to multiple wireless services subscribers |
US7233790B2 (en) | 2002-06-28 | 2007-06-19 | Openwave Systems, Inc. | Device capability based discovery, packaging and provisioning of content for wireless mobile devices |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
US8947347B2 (en) * | 2003-08-27 | 2015-02-03 | Sony Computer Entertainment Inc. | Controlling actions in a video game unit |
US7467087B1 (en) | 2002-10-10 | 2008-12-16 | Gillick Laurence S | Training and using pronunciation guessers in speech recognition |
WO2004047076A1 (ja) * | 2002-11-21 | 2004-06-03 | Matsushita Electric Industrial Co., Ltd. | 標準モデル作成装置及び標準モデル作成方法 |
AU2003293071A1 (en) | 2002-11-22 | 2004-06-18 | Roy Rosser | Autonomous response engine |
US7684985B2 (en) | 2002-12-10 | 2010-03-23 | Richard Dominach | Techniques for disambiguating speech input using multimodal interfaces |
US7386449B2 (en) | 2002-12-11 | 2008-06-10 | Voice Enabling Systems Technology Inc. | Knowledge-based flexible natural speech dialogue system |
US7191127B2 (en) * | 2002-12-23 | 2007-03-13 | Motorola, Inc. | System and method for speech enhancement |
US7956766B2 (en) | 2003-01-06 | 2011-06-07 | Panasonic Corporation | Apparatus operating system |
US7529671B2 (en) | 2003-03-04 | 2009-05-05 | Microsoft Corporation | Block synchronous decoding |
US6980949B2 (en) | 2003-03-14 | 2005-12-27 | Sonum Technologies, Inc. | Natural language processor |
US7496498B2 (en) | 2003-03-24 | 2009-02-24 | Microsoft Corporation | Front-end architecture for a multi-lingual text-to-speech system |
US7519186B2 (en) * | 2003-04-25 | 2009-04-14 | Microsoft Corporation | Noise reduction systems and methods for voice applications |
US7200559B2 (en) | 2003-05-29 | 2007-04-03 | Microsoft Corporation | Semantic object synchronous understanding implemented with speech application language tags |
US7720683B1 (en) | 2003-06-13 | 2010-05-18 | Sensory, Inc. | Method and apparatus of specifying and performing speech recognition operations |
US7559026B2 (en) | 2003-06-20 | 2009-07-07 | Apple Inc. | Video conferencing system having focus control |
US7475010B2 (en) | 2003-09-03 | 2009-01-06 | Lingospot, Inc. | Adaptive and scalable method for resolving natural language ambiguities |
US7418392B1 (en) | 2003-09-25 | 2008-08-26 | Sensory, Inc. | System and method for controlling the operation of a device by voice commands |
WO2005041170A1 (en) | 2003-10-24 | 2005-05-06 | Nokia Corpration | Noise-dependent postfiltering |
DE602004016681D1 (de) | 2003-12-05 | 2008-10-30 | Kenwood Corp | Audioeinrichtungs-steuereinrichtung, audioeinrichtungs-steuerverfahren und programm |
WO2005059895A1 (en) | 2003-12-16 | 2005-06-30 | Loquendo S.P.A. | Text-to-speech method and system, computer program product therefor |
DE602004017955D1 (de) | 2004-01-29 | 2009-01-08 | Daimler Ag | Verfahren und System zur Sprachdialogschnittstelle |
US7693715B2 (en) | 2004-03-10 | 2010-04-06 | Microsoft Corporation | Generating large units of graphonemes with mutual information criterion for letter to sound conversion |
US7711129B2 (en) | 2004-03-11 | 2010-05-04 | Apple Inc. | Method and system for approximating graphic equalizers using dynamic filter order reduction |
US7409337B1 (en) | 2004-03-30 | 2008-08-05 | Microsoft Corporation | Natural language processing interface |
US7496512B2 (en) | 2004-04-13 | 2009-02-24 | Microsoft Corporation | Refining of segmental boundaries in speech waveforms using contextual-dependent models |
US7627461B2 (en) | 2004-05-25 | 2009-12-01 | Chevron U.S.A. Inc. | Method for field scale production optimization by enhancing the allocation of well flow rates |
US8095364B2 (en) | 2004-06-02 | 2012-01-10 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US7720674B2 (en) | 2004-06-29 | 2010-05-18 | Sap Ag | Systems and methods for processing natural language queries |
TWI252049B (en) | 2004-07-23 | 2006-03-21 | Inventec Corp | Sound control system and method |
US7725318B2 (en) | 2004-07-30 | 2010-05-25 | Nice Systems Inc. | System and method for improving the accuracy of audio searching |
US20060067535A1 (en) | 2004-09-27 | 2006-03-30 | Michael Culbert | Method and system for automatically equalizing multiple loudspeakers |
US20060067536A1 (en) | 2004-09-27 | 2006-03-30 | Michael Culbert | Method and system for time synchronizing multiple loudspeakers |
US7716056B2 (en) | 2004-09-27 | 2010-05-11 | Robert Bosch Corporation | Method and system for interactive conversational dialogue for cognitively overloaded device users |
US8107401B2 (en) | 2004-09-30 | 2012-01-31 | Avaya Inc. | Method and apparatus for providing a virtual assistant to a communication participant |
US7702500B2 (en) | 2004-11-24 | 2010-04-20 | Blaedow Karen R | Method and apparatus for determining the meaning of natural language |
US7376645B2 (en) | 2004-11-29 | 2008-05-20 | The Intellection Group, Inc. | Multimodal natural language query system and architecture for processing voice and proximity-based queries |
US8214214B2 (en) | 2004-12-03 | 2012-07-03 | Phoenix Solutions, Inc. | Emotion detection device and method for use in distributed systems |
US20060122834A1 (en) | 2004-12-03 | 2006-06-08 | Bennett Ian M | Emotion detection device & method for use in distributed systems |
US7636657B2 (en) | 2004-12-09 | 2009-12-22 | Microsoft Corporation | Method and apparatus for automatic grammar generation from data entries |
US7593782B2 (en) | 2005-01-07 | 2009-09-22 | Apple Inc. | Highly portable media device |
US7873654B2 (en) | 2005-01-24 | 2011-01-18 | The Intellection Group, Inc. | Multimodal natural language query system for processing and analyzing voice and proximity-based queries |
US7508373B2 (en) | 2005-01-28 | 2009-03-24 | Microsoft Corporation | Form factor and input method for language input |
GB0502259D0 (en) | 2005-02-03 | 2005-03-09 | British Telecomm | Document searching tool and method |
US7634413B1 (en) | 2005-02-25 | 2009-12-15 | Apple Inc. | Bitrate constrained variable bitrate audio encoding |
US7676026B1 (en) | 2005-03-08 | 2010-03-09 | Baxtech Asia Pte Ltd | Desktop telephony system |
US7925525B2 (en) | 2005-03-25 | 2011-04-12 | Microsoft Corporation | Smart reminders |
US7664558B2 (en) | 2005-04-01 | 2010-02-16 | Apple Inc. | Efficient techniques for modifying audio playback rates |
KR100586556B1 (ko) | 2005-04-01 | 2006-06-08 | 주식회사 하이닉스반도체 | 반도체 장치의 프리차지 전압공급회로 |
US7627481B1 (en) | 2005-04-19 | 2009-12-01 | Apple Inc. | Adapting masking thresholds for encoding a low frequency transient signal in audio data |
WO2006129967A1 (en) | 2005-05-30 | 2006-12-07 | Daumsoft, Inc. | Conversation system and method using conversational agent |
US8041570B2 (en) | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
US8300841B2 (en) | 2005-06-03 | 2012-10-30 | Apple Inc. | Techniques for presenting sound effects on a portable media player |
US8024195B2 (en) | 2005-06-27 | 2011-09-20 | Sensory, Inc. | Systems and methods of performing speech recognition using historical information |
US7826945B2 (en) | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
US7613264B2 (en) | 2005-07-26 | 2009-11-03 | Lsi Corporation | Flexible sampling-rate encoder |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US20070073726A1 (en) | 2005-08-05 | 2007-03-29 | Klein Eric N Jr | System and method for queuing purchase transactions |
US7620549B2 (en) | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
US8265939B2 (en) | 2005-08-31 | 2012-09-11 | Nuance Communications, Inc. | Hierarchical methods and apparatus for extracting user intent from spoken utterances |
US7634409B2 (en) | 2005-08-31 | 2009-12-15 | Voicebox Technologies, Inc. | Dynamic speech sharpening |
WO2007028128A2 (en) * | 2005-09-01 | 2007-03-08 | Vishal Dhawan | Voice application network platform |
EP1760696B1 (en) * | 2005-09-03 | 2016-02-03 | GN ReSound A/S | Method and apparatus for improved estimation of non-stationary noise for speech enhancement |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7930168B2 (en) | 2005-10-04 | 2011-04-19 | Robert Bosch Gmbh | Natural language processing of disfluent sentences |
US20070083467A1 (en) | 2005-10-10 | 2007-04-12 | Apple Computer, Inc. | Partial encryption techniques for media data |
US8620667B2 (en) | 2005-10-17 | 2013-12-31 | Microsoft Corporation | Flexible speech-activated command and control |
US7707032B2 (en) | 2005-10-20 | 2010-04-27 | National Cheng Kung University | Method and system for matching speech data |
US20070185926A1 (en) | 2005-11-28 | 2007-08-09 | Anand Prahlad | Systems and methods for classifying and transferring information in a storage network |
KR100810500B1 (ko) | 2005-12-08 | 2008-03-07 | 한국전자통신연구원 | 대화형 음성 인터페이스 시스템에서의 사용자 편의성증대 방법 |
DE102005061365A1 (de) | 2005-12-21 | 2007-06-28 | Siemens Ag | Verfahren zur Ansteuerung zumindest einer ersten und zweiten Hintergrundapplikation über ein universelles Sprachdialogsystem |
US7599918B2 (en) | 2005-12-29 | 2009-10-06 | Microsoft Corporation | Dynamic search with implicit user intention mining |
US7673238B2 (en) | 2006-01-05 | 2010-03-02 | Apple Inc. | Portable media device with video acceleration capabilities |
US20070174188A1 (en) | 2006-01-25 | 2007-07-26 | Fish Robert D | Electronic marketplace that facilitates transactions between consolidated buyers and/or sellers |
IL174107A0 (en) | 2006-02-01 | 2006-08-01 | Grois Dan | Method and system for advertising by means of a search engine over a data network |
KR100764174B1 (ko) | 2006-03-03 | 2007-10-08 | 삼성전자주식회사 | 음성 대화 서비스 장치 및 방법 |
US7752152B2 (en) | 2006-03-17 | 2010-07-06 | Microsoft Corporation | Using predictive user models for language modeling on a personal device with user behavior models based on statistical modeling |
JP4734155B2 (ja) | 2006-03-24 | 2011-07-27 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識プログラム |
US7707027B2 (en) | 2006-04-13 | 2010-04-27 | Nuance Communications, Inc. | Identification and rejection of meaningless input during natural language classification |
US8423347B2 (en) | 2006-06-06 | 2013-04-16 | Microsoft Corporation | Natural language personal information management |
US7483894B2 (en) | 2006-06-07 | 2009-01-27 | Platformation Technologies, Inc | Methods and apparatus for entity search |
US20100257160A1 (en) | 2006-06-07 | 2010-10-07 | Yu Cao | Methods & apparatus for searching with awareness of different types of information |
US7523108B2 (en) | 2006-06-07 | 2009-04-21 | Platformation, Inc. | Methods and apparatus for searching with awareness of geography and languages |
US20070291108A1 (en) * | 2006-06-16 | 2007-12-20 | Ericsson, Inc. | Conference layout control and control protocol |
US20070294263A1 (en) * | 2006-06-16 | 2007-12-20 | Ericsson, Inc. | Associating independent multimedia sources into a conference call |
KR100776800B1 (ko) | 2006-06-16 | 2007-11-19 | 한국전자통신연구원 | 지능형 가제트를 이용한 맞춤형 서비스 제공 방법 및시스템 |
US7548895B2 (en) | 2006-06-30 | 2009-06-16 | Microsoft Corporation | Communication-prompted user assistance |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8036766B2 (en) | 2006-09-11 | 2011-10-11 | Apple Inc. | Intelligent audio mixing among media playback and at least one other non-playback application |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US20080129520A1 (en) | 2006-12-01 | 2008-06-05 | Apple Computer, Inc. | Electronic device with enhanced audio feedback |
US8493330B2 (en) | 2007-01-03 | 2013-07-23 | Apple Inc. | Individual channel phase delay scheme |
KR100883657B1 (ko) | 2007-01-26 | 2009-02-18 | 삼성전자주식회사 | 음성 인식 기반의 음악 검색 방법 및 장치 |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US7822608B2 (en) | 2007-02-27 | 2010-10-26 | Nuance Communications, Inc. | Disambiguating a speech recognition grammar in a multimodal application |
US7801729B2 (en) | 2007-03-13 | 2010-09-21 | Sensory, Inc. | Using multiple attributes to create a voice search playlist |
US8219406B2 (en) | 2007-03-15 | 2012-07-10 | Microsoft Corporation | Speech-centric multimodal user interface design in mobile technology |
JP2008236448A (ja) | 2007-03-22 | 2008-10-02 | Clarion Co Ltd | 音声信号処理装置、ハンズフリー通話装置、音声信号処理方法および制御プログラム |
JP2008271481A (ja) * | 2007-03-27 | 2008-11-06 | Brother Ind Ltd | 電話装置 |
US7809610B2 (en) | 2007-04-09 | 2010-10-05 | Platformation, Inc. | Methods and apparatus for freshness and completeness of information |
US20080253577A1 (en) | 2007-04-13 | 2008-10-16 | Apple Inc. | Multi-channel sound panner |
US7983915B2 (en) | 2007-04-30 | 2011-07-19 | Sonic Foundry, Inc. | Audio content search engine |
US8055708B2 (en) | 2007-06-01 | 2011-11-08 | Microsoft Corporation | Multimedia spaces |
US8204238B2 (en) | 2007-06-08 | 2012-06-19 | Sensory, Inc | Systems and methods of sonic communication |
KR20080109322A (ko) | 2007-06-12 | 2008-12-17 | 엘지전자 주식회사 | 사용자의 직관적 의도 파악에 따른 서비스 제공 방법 및장치 |
US8190627B2 (en) | 2007-06-28 | 2012-05-29 | Microsoft Corporation | Machine assisted query formulation |
US8041438B2 (en) | 2007-06-28 | 2011-10-18 | Apple Inc. | Data-driven media management within an electronic device |
US7861008B2 (en) | 2007-06-28 | 2010-12-28 | Apple Inc. | Media management and routing within an electronic device |
US9794605B2 (en) | 2007-06-28 | 2017-10-17 | Apple Inc. | Using time-stamped event entries to facilitate synchronizing data streams |
US9632561B2 (en) | 2007-06-28 | 2017-04-25 | Apple Inc. | Power-gating media decoders to reduce power consumption |
US8019606B2 (en) | 2007-06-29 | 2011-09-13 | Microsoft Corporation | Identification and selection of a software application via speech |
US8306235B2 (en) | 2007-07-17 | 2012-11-06 | Apple Inc. | Method and apparatus for using a sound sensor to adjust the audio output for a device |
JP2009036999A (ja) | 2007-08-01 | 2009-02-19 | Infocom Corp | コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体 |
US8190359B2 (en) | 2007-08-31 | 2012-05-29 | Proxpro, Inc. | Situation-aware personal information management for a mobile device |
US8683197B2 (en) | 2007-09-04 | 2014-03-25 | Apple Inc. | Method and apparatus for providing seamless resumption of video playback |
US20090058823A1 (en) | 2007-09-04 | 2009-03-05 | Apple Inc. | Virtual Keyboards in Multi-Language Environment |
KR100920267B1 (ko) | 2007-09-17 | 2009-10-05 | 한국전자통신연구원 | 음성 대화 분석 시스템 및 그 방법 |
US8706476B2 (en) | 2007-09-18 | 2014-04-22 | Ariadne Genomics, Inc. | Natural language processing method by analyzing primitive sentences, logical clauses, clause types and verbal blocks |
US8069051B2 (en) | 2007-09-25 | 2011-11-29 | Apple Inc. | Zero-gap playback using predictive mixing |
US8515095B2 (en) | 2007-10-04 | 2013-08-20 | Apple Inc. | Reducing annoyance by managing the acoustic noise produced by a device |
US8462959B2 (en) | 2007-10-04 | 2013-06-11 | Apple Inc. | Managing acoustic noise produced by a device |
US8165886B1 (en) | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US8036901B2 (en) | 2007-10-05 | 2011-10-11 | Sensory, Incorporated | Systems and methods of performing speech recognition using sensory inputs of human position |
US20090112677A1 (en) | 2007-10-24 | 2009-04-30 | Rhett Randolph L | Method for automatically developing suggested optimal work schedules from unsorted group and individual task lists |
US7840447B2 (en) | 2007-10-30 | 2010-11-23 | Leonard Kleinrock | Pricing and auctioning of bundled items among multiple sellers and buyers |
US7983997B2 (en) | 2007-11-02 | 2011-07-19 | Florida Institute For Human And Machine Cognition, Inc. | Interactive complex task teaching system that allows for natural language input, recognizes a user's intent, and automatically performs tasks in document object model (DOM) nodes |
US8112280B2 (en) | 2007-11-19 | 2012-02-07 | Sensory, Inc. | Systems and methods of performing speech recognition with barge-in for use in a bluetooth system |
US7805286B2 (en) * | 2007-11-30 | 2010-09-28 | Bose Corporation | System and method for sound system simulation |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US8219407B1 (en) | 2007-12-27 | 2012-07-10 | Great Northern Research, LLC | Method for processing the output of a speech recognizer |
US8138896B2 (en) | 2007-12-31 | 2012-03-20 | Apple Inc. | Tactile feedback in an electronic device |
KR101334066B1 (ko) | 2008-02-11 | 2013-11-29 | 이점식 | 진화하는 사이버 로봇 시스템 및 그 제공 방법 |
US8099289B2 (en) | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
EP2243303A1 (en) * | 2008-02-20 | 2010-10-27 | Koninklijke Philips Electronics N.V. | Audio device and method of operation therefor |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
US8121837B2 (en) * | 2008-04-24 | 2012-02-21 | Nuance Communications, Inc. | Adjusting a speech engine for a mobile computing device based on background noise |
US8082148B2 (en) * | 2008-04-24 | 2011-12-20 | Nuance Communications, Inc. | Testing a grammar used in speech recognition for reliability in a plurality of operating environments having different background noise |
US8285344B2 (en) | 2008-05-21 | 2012-10-09 | DP Technlogies, Inc. | Method and apparatus for adjusting audio for a user environment |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8423288B2 (en) | 2009-11-30 | 2013-04-16 | Apple Inc. | Dynamic alerts for calendar events |
US8166019B1 (en) | 2008-07-21 | 2012-04-24 | Sprint Communications Company L.P. | Providing suggested actions in response to textual communications |
US8041848B2 (en) | 2008-08-04 | 2011-10-18 | Apple Inc. | Media processing method and device |
US8098262B2 (en) | 2008-09-05 | 2012-01-17 | Apple Inc. | Arbitrary fractional pixel movement |
US8380959B2 (en) | 2008-09-05 | 2013-02-19 | Apple Inc. | Memory management system and method |
US20100063825A1 (en) | 2008-09-05 | 2010-03-11 | Apple Inc. | Systems and Methods for Memory Management and Crossfading in an Electronic Device |
US9077526B2 (en) | 2008-09-30 | 2015-07-07 | Apple Inc. | Method and system for ensuring sequential playback of digital media |
US8401178B2 (en) | 2008-09-30 | 2013-03-19 | Apple Inc. | Multiple microphone switching and configuration |
US9200913B2 (en) | 2008-10-07 | 2015-12-01 | Telecommunication Systems, Inc. | User interface for predictive traffic |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
JP5911796B2 (ja) | 2009-04-30 | 2016-04-27 | サムスン エレクトロニクス カンパニー リミテッド | マルチモーダル情報を用いるユーザ意図推論装置及び方法 |
KR101581883B1 (ko) | 2009-04-30 | 2016-01-11 | 삼성전자주식회사 | 모션 정보를 이용하는 음성 검출 장치 및 방법 |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
KR101562792B1 (ko) | 2009-06-10 | 2015-10-23 | 삼성전자주식회사 | 목표 예측 인터페이스 제공 장치 및 그 방법 |
US8527278B2 (en) | 2009-06-29 | 2013-09-03 | Abraham Ben David | Intelligent home automation |
US8321527B2 (en) | 2009-09-10 | 2012-11-27 | Tribal Brands | System and method for tracking user location and associated activity and responsively providing mobile device updates |
KR20110036385A (ko) | 2009-10-01 | 2011-04-07 | 삼성전자주식회사 | 사용자 의도 분석 장치 및 방법 |
US20110099507A1 (en) | 2009-10-28 | 2011-04-28 | Google Inc. | Displaying a collection of interactive elements that trigger actions directed to an item |
US9197736B2 (en) | 2009-12-31 | 2015-11-24 | Digimarc Corporation | Intuitive computing methods and systems |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
WO2011059997A1 (en) | 2009-11-10 | 2011-05-19 | Voicebox Technologies, Inc. | System and method for providing a natural language content dedication service |
US8712759B2 (en) | 2009-11-13 | 2014-04-29 | Clausal Computing Oy | Specializing disambiguation of a natural language expression |
KR101960835B1 (ko) | 2009-11-24 | 2019-03-21 | 삼성전자주식회사 | 대화 로봇을 이용한 일정 관리 시스템 및 그 방법 |
US8396888B2 (en) | 2009-12-04 | 2013-03-12 | Google Inc. | Location-based searching using a search area that corresponds to a geographical location of a computing device |
KR101622111B1 (ko) | 2009-12-11 | 2016-05-18 | 삼성전자 주식회사 | 대화 시스템 및 그의 대화 방법 |
US8494852B2 (en) | 2010-01-05 | 2013-07-23 | Google Inc. | Word-level correction of speech input |
US8334842B2 (en) | 2010-01-15 | 2012-12-18 | Microsoft Corporation | Recognizing user intent in motion capture system |
US8626511B2 (en) | 2010-01-22 | 2014-01-07 | Google Inc. | Multi-dimensional disambiguation of voice commands |
US20110218855A1 (en) | 2010-03-03 | 2011-09-08 | Platformation, Inc. | Offering Promotions Based on Query Analysis |
KR101369810B1 (ko) | 2010-04-09 | 2014-03-05 | 이초강 | 로봇을 위한 경험적 상황인식 방법을 실행하는 프로그램을 기록한 컴퓨터 판독가능한 기록 매체. |
US8265928B2 (en) | 2010-04-14 | 2012-09-11 | Google Inc. | Geotagged environmental audio for enhanced speech recognition accuracy |
US20110279368A1 (en) | 2010-05-12 | 2011-11-17 | Microsoft Corporation | Inferring user intent to engage a motion capture system |
US8694313B2 (en) | 2010-05-19 | 2014-04-08 | Google Inc. | Disambiguation of contact information using historical data |
US8522283B2 (en) | 2010-05-20 | 2013-08-27 | Google Inc. | Television remote control data transfer |
US8468012B2 (en) | 2010-05-26 | 2013-06-18 | Google Inc. | Acoustic model adaptation using geographic information |
US8639516B2 (en) | 2010-06-04 | 2014-01-28 | Apple Inc. | User-specific noise suppression for voice quality improvements |
US20110306426A1 (en) | 2010-06-10 | 2011-12-15 | Microsoft Corporation | Activity Participation Based On User Intent |
US8234111B2 (en) | 2010-06-14 | 2012-07-31 | Google Inc. | Speech and noise models for speech recognition |
US8411874B2 (en) | 2010-06-30 | 2013-04-02 | Google Inc. | Removing noise from audio |
US8775156B2 (en) | 2010-08-05 | 2014-07-08 | Google Inc. | Translating languages in response to device motion |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
US8473289B2 (en) | 2010-08-06 | 2013-06-25 | Google Inc. | Disambiguating input based on context |
JP2014520297A (ja) | 2011-04-25 | 2014-08-21 | ベベオ,インク. | 高度な個人的時刻表アシスタントのためのシステムよび方法 |
-
2010
- 2010-06-04 US US12/794,643 patent/US8639516B2/en active Active
-
2011
- 2011-05-18 KR KR1020127030410A patent/KR101520162B1/ko active IP Right Grant
- 2011-05-18 CN CN201180021126.1A patent/CN102859592B/zh active Active
- 2011-05-18 AU AU2011261756A patent/AU2011261756B2/en active Active
- 2011-05-18 WO PCT/US2011/037014 patent/WO2011152993A1/en active Application Filing
- 2011-05-18 JP JP2013513202A patent/JP2013527499A/ja active Pending
- 2011-05-18 EP EP11727351.6A patent/EP2577658B1/en active Active
-
2014
- 2014-01-27 US US14/165,523 patent/US10446167B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0558312A1 (en) * | 1992-02-27 | 1993-09-01 | Central Institute For The Deaf | Adaptive noise reduction circuit for a sound reproduction system |
US6463128B1 (en) * | 1999-09-29 | 2002-10-08 | Denso Corporation | Adjustable coding detection in a portable telephone |
CN1640191A (zh) * | 2002-07-12 | 2005-07-13 | 唯听助听器公司 | 助听器和提高语言清晰度的方法 |
US20060282264A1 (en) * | 2005-06-09 | 2006-12-14 | Bellsouth Intellectual Property Corporation | Methods and systems for providing noise filtering using speech recognition |
US20080165980A1 (en) * | 2007-01-04 | 2008-07-10 | Sound Id | Personalized sound system hearing profile selection process |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014161299A1 (zh) * | 2013-08-15 | 2014-10-09 | 中兴通讯股份有限公司 | 一种语音质量处理的方法及装置 |
CN103594092A (zh) * | 2013-11-25 | 2014-02-19 | 广东欧珀移动通信有限公司 | 一种单麦克风语音降噪方法和装置 |
CN106062661A (zh) * | 2014-03-31 | 2016-10-26 | 英特尔公司 | 用于常开常听的语音识别系统的位置感知功率管理方案 |
US10133332B2 (en) | 2014-03-31 | 2018-11-20 | Intel Corporation | Location aware power management scheme for always-on-always-listen voice recognition system |
CN106165383A (zh) * | 2014-05-12 | 2016-11-23 | 英特尔公司 | 远端上下文相关的预处理 |
CN106878533A (zh) * | 2015-12-10 | 2017-06-20 | 北京奇虎科技有限公司 | 一种移动终端的通信方法和装置 |
CN106453760A (zh) * | 2016-10-11 | 2017-02-22 | 努比亚技术有限公司 | 一种改善环境噪声的方法及终端 |
CN109905794A (zh) * | 2019-03-06 | 2019-06-18 | 中国人民解放军联勤保障部队第九八八医院 | 基于战场应用的自适应智能化防护耳塞的数据分析系统 |
WO2021093380A1 (zh) * | 2019-11-13 | 2021-05-20 | 苏宁云计算有限公司 | 一种噪声处理方法、装置、系统 |
CN111986689A (zh) * | 2020-07-30 | 2020-11-24 | 维沃移动通信有限公司 | 音频播放方法、音频播放装置和电子设备 |
WO2022022536A1 (zh) * | 2020-07-30 | 2022-02-03 | 维沃移动通信有限公司 | 音频播放方法、音频播放装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
AU2011261756B2 (en) | 2014-09-04 |
AU2011261756A1 (en) | 2012-11-01 |
US20110300806A1 (en) | 2011-12-08 |
KR20130012073A (ko) | 2013-01-31 |
EP2577658B1 (en) | 2016-11-02 |
WO2011152993A1 (en) | 2011-12-08 |
US10446167B2 (en) | 2019-10-15 |
KR101520162B1 (ko) | 2015-05-13 |
JP2013527499A (ja) | 2013-06-27 |
US8639516B2 (en) | 2014-01-28 |
EP2577658A1 (en) | 2013-04-10 |
US20140142935A1 (en) | 2014-05-22 |
CN102859592B (zh) | 2014-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102859592B (zh) | 用于语音质量改进的用户特定的噪声抑制 | |
CN103945062B (zh) | 一种用户终端的音量调节方法、装置及终端 | |
CN108605073B (zh) | 声音信号处理的方法、终端和耳机 | |
CN108449493B (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 | |
CN107509153B (zh) | 声音播放器件的检测方法、装置、存储介质及终端 | |
CN101569093A (zh) | 响应于不同的噪声环境经由用户优选的音频设置来动态地获悉用户的响应 | |
US20090323925A1 (en) | System and Method for Telephone Based Noise Cancellation | |
CN103886731B (zh) | 一种噪声控制方法及设备 | |
CN103886857B (zh) | 一种噪声控制方法及设备 | |
CN107580113A (zh) | 提示方法、装置、存储介质及终端 | |
CN105280195A (zh) | 语音信号的处理方法及装置 | |
CN108172237B (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 | |
CN108449503B (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 | |
CN108449506A (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 | |
CN108418968B (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 | |
CN108512625A (zh) | 摄像头的抗干扰方法、移动终端及存储介质 | |
CN108449499B (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 | |
US20080255827A1 (en) | Voice Conversion Training and Data Collection | |
CN108449497A (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 | |
CN108449492B (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 | |
JP2007512767A (ja) | 雑音信号の音響計測基準に基づき呼出信号を生成する方法及びデバイス | |
CN110489571A (zh) | 音频处理方法和装置、电子设备、计算机可读存储介质 | |
US20210110838A1 (en) | Acoustic aware voice user interface | |
CN108449498B (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 | |
CN108449501B (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |