CN102859592A - 用于语音质量改进的用户特定的噪声抑制 - Google Patents

用于语音质量改进的用户特定的噪声抑制 Download PDF

Info

Publication number
CN102859592A
CN102859592A CN2011800211261A CN201180021126A CN102859592A CN 102859592 A CN102859592 A CN 102859592A CN 2011800211261 A CN2011800211261 A CN 2011800211261A CN 201180021126 A CN201180021126 A CN 201180021126A CN 102859592 A CN102859592 A CN 102859592A
Authority
CN
China
Prior art keywords
user
squelch
electronic installation
parameter
sound signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800211261A
Other languages
English (en)
Other versions
CN102859592B (zh
Inventor
阿拉姆·林达尔
巴蒂斯特·皮埃尔·帕基耶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Apple Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44276060&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN102859592(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Apple Computer Inc filed Critical Apple Computer Inc
Publication of CN102859592A publication Critical patent/CN102859592A/zh
Application granted granted Critical
Publication of CN102859592B publication Critical patent/CN102859592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Abstract

本发明提供用于用户特定的噪声抑制的系统、方法及装置。举例来说,当在使用电子装置(10)的与语音有关的特征时,所述电子装置(10)可能会接收到包含用户语音的音频信号。因为此时例如环境声音(60)等噪声也可能会被所述电子装置(10)接收,所以电子装置(10)可以抑制所述音频信号中的此噪声。确切地说,所述电子装置(10)可以经由用户特定的噪声抑制参数抑制所述音频信号中的噪声同时实质上保留用户语音。这些用户特定的噪声抑制参数可以至少部分地基于用户噪声抑制偏好或用户语音简档或其组合。

Description

用于语音质量改进的用户特定的噪声抑制
技术领域
背景技术
本发明大体上涉及用于噪声抑制的技术,且更确切地说涉及用于用户特定的噪声抑制的技术。
本部分意在向读者介绍可能与下文描述及/或主张的本发明的各个方面有关的技术的各个方面。相信本论述有助于为读者提供背景技术资料,便于更好地理解本发明的各个方面。因此,应当理解这些陈述要在此意义上理解,而并不是承认现有技术。
许多电子装置使用与语音有关的特征,其涉及记录及/或传输用户的语音。举例来说,语音备忘录记录特征可以记录用户所说的语音备忘录。类似地,电子装置的电话特征可以将用户的语音传输到另一个电子装置。然而,当电子装置获得用户的语音时,可以同时获得环境声音或背景噪声。这些环境声音可能会让用户的语音模糊不清,而且在有些情况下,会妨碍电子装置的与语音有关的特征正常运行。
为了在使用与语音有关的特征时减少环境声音的影响,电子装置可以应用各种噪声抑制方案。装置制造商可以对此些噪声抑制方案进行编程,使其根据经计算会被大多数用户良好接收的某些预定通用参数来操作。然而,某些语音可能不太适合这些通用噪声抑制参数。此外,一些用户可能偏爱更强或更弱的噪声抑制。
发明内容
下文阐述本文中揭示的某些实施例的概述。应当理解,呈现这些方面只是为了向读者提供对这些特定实施例的简要概述,并且这些方面并不希望限制本发明的范围。实际上,本发明可以涵盖下文可能未阐述的多个方面。
本发明的实施例涉及用于用户特定的噪声抑制的系统、方法及装置。举例来说,当在使用电子装置的与语音有关的特征时,电子装置可能会接收到包含用户语音的音频信号。因为此时例如环境声音等噪声也可能会被电子装置接收,所以电子装置可以抑制音频信号中的此噪声。确切地说,电子装置经由用户特定的噪声抑制参数可以抑制音频信号中的噪声,同时实质上保留用户语音。这些用户特定的噪声抑制参数可以至少部分地基于用户噪声抑制偏好或用户语音简档或其组合。
附图说明
在阅读了下文的具体实施方式且在参阅图式之后,可以更好地理解本发明的各个方面,在图式中:
图1是根据实施例的能够执行本文中揭示的技术的电子装置的框图;
图2是表示图1的电子装置的一个实施例的手持装置的示意图;
图3是表示根据一实施例可以使用图1的电子装置的与语音有关的特征的各种场合的示意性框图;
图4是根据一实施例可以在图1的电子装置中发生的噪声抑制的框图;
图5是表示根据一实施例的用户特定的噪声抑制参数的框图;
图6是描述用于在图1的电子装置中应用用户特定的噪声抑制参数的方法的实施例的流程图;
图7是根据一实施例在图2的手持装置被激活时起始语音训练序列的示意图;
图8是根据一实施例用于使用图2的手持装置选择起始语音训练系列的一系列屏幕的示意图;
图9是描述用于经由语音训练序列确定用户特定的噪声抑制参数的方法的实施例的流程图;
图10及11是根据一实施例的用于获得用于语音训练的用户语音样本的方式的示意图;
图12是说明根据一实施例在语音训练序列期间获得噪声抑制用户偏好的方式的示意图;
图13是描述用于在语音训练序列期间获得噪声抑制用户偏好的方法的实施例的流程图;
图14是描述用于执行语音训练序列的另一方法的实施例的流程图;
图15是描述用于获得高信噪比(SNR)用户语音样本的方法的实施例的流程图;
图16是描述用于经由分析用户语音样本来确定用户特定的噪声抑制参数的方法的实施例的流程图;
图17是描述根据一实施例在执行图16的方法时可以考虑的用户语音样本的特性的因数图;
图18是表示根据一实施例可以在图2的手持装置上显示以经由用户可选设置来获得用户特定的噪声参数的一系列屏幕的示意图;
图19是根据一实施例用于在使用手持装置的与语音有关的特征时实时获得用户特定的噪声抑制参数的图2的手持装置上的屏幕的示意图;
图20及21是表示根据一实施例的可形成用户特定的噪声抑制参数的各种子参数的示意图;
图22是描述用于基于检测到的环境声音来应用用户特定的参数的某些子参数的方法的实施例的流程图;
图23是描述用于基于电子装置的使用场合来应用噪声抑制参数的某些子参数的方法的实施例的流程图;
图24是表示根据一实施例可用于图23的方法的各种装置场合因数的因数图;
图25是描述用于获得用户语音简档的方法的实施例的流程图;
图26是描述用于基于用户语音简档应用噪声抑制的方法的实施例的流程图;
图27到29是描绘根据一实施例基于用户语音简档执行音频信号的噪声抑制的方式的图表;
图30是描述用于经由涉及预先记录的语音的语音训练序列获得用户特定的噪声抑制参数的方法的实施例的流程图;
图31是描述用于向从另一电子装置接收的音频应用用户特定的噪声抑制参数的方法的实施例的流程图;
图32是描述根据一实施例用于基于第一电子装置的用户特定的噪声参数使另一电子装置参与噪声抑制的方法的实施例的流程图;及
图33是根据一实施例用于基于与另一电子装置相关联的用户特定的噪声抑制参数对两个电子装置执行噪声抑制的系统的示意性框图。
具体实施方式
下文将描述一个或一个以上特定实施例。为了提供对这些实施例的简要描述,说明书中未描述实际实施方案的所有特征。应当理解,在研发任何此实际实施方案时,如在任何工程或设计项目中,必须进行许多实施方案特定的决策来实现研发人员的特定目标,例如符合与系统有关的及与商业有关的约束,这些决策可能在实施方案之间有所不同。此外,应当理解,此研发努力可能复杂而且耗时,但是仍然将是受益于本发明的所属领域的技术人员的设计、制作及制造的例行任务。
当前实施例涉及抑制与电子装置的与语音有关的特征相关联的音频信号中的噪声。此与语音有关的特征可包含例如语音备忘录记录特征、视频记录特征、电话特征及/或语音命令特征,其中的每一者可涉及包含用户的语音的音频信号。然而,除了用户的语音之外,音频信号还可包含在使用与语音有关的特征时存在的环境声音。由于这些环境声音可能会使用户的语音模糊不清,所以电子装置可以对音频信号应用噪声抑制以过滤掉环境声音,同时保留用户的语音。
根据当前实施例的噪声抑制不是采用在制造装置时编程的通用噪声抑制参数,而是可以涉及可能是电子装置的用户特有的用户特定的噪声抑制参数。这些用户特定的噪声抑制参数可以通过语音训练、基于用户的语音简档及/或基于手动选择的用户设置来确定。当基于用户特定的参数而不是通用参数发生噪声抑制时,经过噪声抑制的信号的声音可能更令用户满意。这些用户特定的噪声抑制参数可以用于任何与语音有关的特征,并且可以配合自动增益控制(AGC)及/或均衡(EQ)调谐来使用。
如上所述,可以使用语音训练序列来确定用户特定的噪声抑制参数。在此语音训练序列中,电子装置可以对与一个或一个以上干扰因素(例如,模拟环境声音,例如起皱的纸、白噪声、七嘴八舌的人等等)混合的用户的语音样本应用不同的噪声抑制参数。此后,用户可以指示哪些噪声抑制参数产生最优选的声音。基于用户的反馈,电子装置可以形成及存储用户特定的噪声抑制参数,用于稍后在使用电子装置的与语音有关的特征时使用。
另外或替代地,可通过电子装置依据用户的语音的特性来自动确定用户特定的噪声抑制参数。不同用户的语音可具有各种不同特性,包含不同的平均频率、不同的频率可变性及/或不同的区分的声音。此外,可以知道某些噪声抑制参数对于某些语音特性更加有效地操作。因此,根据特定本发明的某些实施例的电子装置可基于此些用户语音特性来确定用户特定的噪声抑制参数。在一些实施例中,用户可通过例如选择高/中/低噪声抑制强度选择器或指示电子装置上的当前呼叫质量来手动设置噪声抑制参数。
当已经确定了用户特定的参数时,电子装置可以抑制可能在使用与语音有关的特征时听到的各种类型的环境声音。在某些实施例中,电子装置可分析环境声音的特点,并且应用预期因此抑制当前环境声音的用户特定的噪声抑制参数。在另一实施例中,电子装置可以基于正在使用电子装置的当前场合来应用某些用户特定的噪声抑制参数。
在某些实施例中,电子装置可以基于与用户相关联的用户语音简档来执行针对用户定制的噪声抑制。此后,电子装置可以更加有效地在正在使用与语音有关的特征时将环境声音与音频信号隔离,因为电子装置大体上可能预期音频信号的哪些组成部分对应于用户的语音。举例来说,电子装置可以放大音频信号的与用户语音简档相关联的组成部分,同时抑制音频信号的不与用户语音简档相关联的组成部分。
还可以使用用户特定的噪声抑制参数来抑制音频信号中含有电子装置接收到的不是用户语音的语音的噪声。举例来说,当将电子装置用于电话或聊天特征时,电子装置可以对来自与用户对应的人的音频信号采用用户特定的噪声抑制参数。由于此音频信号先前可能已经被发送装置处理,所以此噪声抑制可以相对微弱。在某些实施例中,电子装置可以将用户特定的噪声抑制参数发射到发送装置,使得发送装置可以相应地修改其噪声抑制参数。同样,两个电子装置可以系统地起作用,以根据彼此的用户特定的噪声抑制参数来抑制传出的音频信号中的噪声。
鉴于前述内容,下文提供对用于执行当前揭示的技术的合适电子装置的总体描述。确切地说,图1是描绘适合与本技术一起使用的电子装置中可能存在的各种组件的框图。图2表示合适的电子装置的一个实例,如所说明,此电子装置可以是具有噪声抑制能力的手持电子装置。
首先转向图1,用于执行当前揭示的技术的电子装置10可以尤其包含:一个或一个以上处理器12、存储器14、非易失性存储装置16、显示器18、噪声抑制20、位置感测电路22、输入/输出(I/O)接口24、网络接口26、图像捕获电路28、加速计/磁力计30以及麦克风32。图1所示的各种功能块可以包含硬件元件(包含电路)、软件元件(包含存储在计算机可读媒体上的计算机代码)或硬件元件与软件元件两者的组合。应进一步注意,图1只是特定实施方案的一个实例,并且意在说明电子装置10中可以存在的类型的组件。
举例来说,电子装置10可以表示图2中描绘的手持装置或类似装置的框图。此外或替代地,电子装置10可以表示具有某些特性的电子装置的系统。举例来说,第一电子装置可以包含至少一麦克风32,其可向第二电子装置提供音频,第二电子装置包含处理器12及其它数据处理电路。应注意,数据处理电路可以完全或部分地体现为软件、固件、硬件或其任何组合。此外,数据处理电路可以是单个内含式处理模块,或者可以完全或部分地并入到电子装置10内的任何其它元件内。数据处理电路还可以部分地体现在电子装置10内,并且部分地体现在有线或无线地连接到装置10的另一电子装置内。最后,数据处理电路可以完全实施在有线或无线地连接到装置10的另一装置内。作为一非限制性实例,数据处理电路可以体现在与装置10连接的头戴耳机内。
在图1的电子装置10中,处理器12及/或其它数据处理电路可以可操作地与存储器14及非易失性存储器16耦合以执行用于实施当前揭示的技术的各种算法。由处理器12执行的此些程序或指令可以存储在任何合适的制造品中,所述制造品包含一个或一个以上至少共同存储指令或例程的有形的计算机可读媒体,例如存储器14及非易失性存储装置16。此外,在此计算机程序产品上编码的程序(例如,操作系统)还可以包含可以由处理器12执行以使得电子装置10能够提供各种功能性(包含本文中描述的功能性)的指令。显示器18可以是触摸屏显示器,其可以使得用户能够与电子装置10的用户接口交互。
可以通过例如处理器12等数据处理电路或者通过专用于对电子装置10处理的音频信号执行某种噪声抑制的电路执行。举例来说,可以通过基带集成电路(IC)(例如英飞凌公司制造的基带IC)基于外部提供的噪声抑制参数来执行噪声抑制20。此外或替代地,噪声抑制20可以在电话音频增强集成电路(IC)中执行,此电话音频增强IC经配置以基于外部提供的噪声抑制参数来执行噪声抑制,例如听众公司(Audience)制造的电话音频增强IC。这些噪声抑制IC可以至少部分地基于某些噪声抑制参数来操作。改变此些噪声抑制参数可以改变噪声抑制20的输出。
位置感测电路22可以表示用于确定电子装置10的相对或绝对位置的装置能力。举例来说,位置感测电路22可以表示全球定位系统(GPS)电路、用于基于紧接的无线网络(例如局域Wi-Fi网络)来估计位置的算法等等。I/O接口24可以使电子装置10能够与各种其它电子装置介接,与网络接口26一样。举例来说,网络接口26可以包含用于个域网(PAN)(例如蓝牙网络)的接口、用于局域网(LAN)(例如802.11x Wi-Fi网络)的接口及/或用于广域网(WAN)(例如3G蜂窝式网络)的接口。通过网络接口26,电子装置10可以与包含麦克风32的无线头戴耳机介接。图像捕获装置28可以实现图像及/或视频捕获,且加速计/磁力计30可以观测电子装置10的移动及/或相对定向。
当配合电子装置10的与语音有关的特征(例如电话特征或语音识别特征)采用时,麦克风32可以获得用户的语音的音频信号。虽然除了用户的语音以外还可能在音频信号中获得环境声音,但是噪声抑制20可以处理音频信号以基于某些用户特定的噪声抑制参数来排除大部分环境声音。如下文更详细描述,所述用户特定的噪声抑制参数可以通过语音训练、基于用户的语音简档及/或基于手动选择的用户设置来确定。
图2描绘表示电子装置10的一个实施例的手持装置34。举例来说,手持装置34可以表示便携式电话、媒体播放器、个人数据管理器、手持式游戏平台或此些装置的任何组合。举例来说,手持装置34可以是可从加利福尼亚州库珀蒂诺市的苹果公司购得的
Figure BDA00002313179900061
型号。
手持装置34可以包含罩壳36,以保护内部组件免受物理损害,并且屏蔽内部组件免受电磁干扰。罩壳36可以围绕显示器18,显示器18可以显示指示符图标38。指示符图标38尤其可以指示蜂窝信号强度、蓝牙连接及/或电池寿命。I/O接口24可以穿过罩壳36开口,并且举例来说可以包含来自苹果公司的用于连接到外部装置的专有I/O端口。如图2中指示,手持装置34的反面可以包含图像捕获电路28。
用户输入结构40、42、44及46配合显示器18可以允许用户控制手持装置34。举例来说,输入结构40可以将手持装置34激活或去激活,输入结构42可以将用户接口20导航到主屏幕、用户可配置的应用程序屏幕及/或激活手持装置34的语音识别特征,输入结构44可以提供音量控制,且输入结构46可以在振动模式与响铃模式之间来回切换。麦克风32可以获得用于各种与语音有关的特征的用户的语音,且扬声器48可以实现音频回放及/或某些电话能力。头戴受话器输入50可以提供与外部扬声器及/或头戴受话器的连接。
如图2中说明,有线头戴耳机52可以经由头戴受话器输入50而连接到手持装置34。有线头戴耳机52可以包含两个扬声器48及一个麦克风32。麦克风32可以使得用户能够用与位于手持装置34上的麦克风32相同的方式对手持装置34中说话。在一些实施例中,靠近麦克风32的按钮可以致使麦克风32唤醒及/或可以致使手持装置34的与语音有关的特征激活。无线头戴耳机54可以经由网络接口26的无线接口(例如,蓝牙接口)类似地连接到手持装置34。与有线头戴耳机52相同,无线头戴耳机54也可以包含扬声器48及麦克风32。此外,在一些实施例中,靠近麦克风32的按钮可以致使麦克风32唤醒及/或可以致使手持装置34的与语音有关的特征激活。此外或替代地,独立麦克风32(未图示)(其可能没有集成扬声器48)可以经由头戴受话器输入50或经由网络接口26中的一者与手持装置34介接。
用户可能会在具有各种环境声音的各种场合中使用电子装置10的与语音有关的特征(例如语音识别特征或电话特征)。图3说明许多此些场合56,其中电子装置10(描绘为手持装置34)可能会在执行与语音有关的特征时获得用户语音音频信号58及环境声音60。举例来说,电子装置10的与语音有关的特征可以例如包含语音识别特征、语音备忘录记录特征、视频记录特征及/或电话特征。与语音有关的特征可以实施在电子装置10上,在由处理器12或其它处理器实施的软件中,及/或可以实施在专用硬件中。
当用户说出语音音频信号58时,此信号可能会进入电子装置10的麦克风32。然而,在大约相同时间,环境声音60还可进入麦克风32。环境声音60可依据正在使用电子装置10的场合56来改变。可以使用与语音有关的特征的各种场合56可以包含在家62、在办公室64、在健身馆66、在繁忙的街道上68、在车上70、在体育赛事中72、在饭店74及在派对76上,等等。应当理解,在繁忙的街道68上发生的典型的环境声音60可能与在家里62或在车上70发生的典型环境声音60有很大区别。
环境声音60的特点可能在场合56与场合56之间有所不同。如下文详细描述,电子装置10可以至少部分地基于用户特定的噪声抑制参数来执行噪声抑制20以过滤环境声音60。在一些实施例中,这些用户特定的噪声抑制参数可以经由语音训练来确定,在所述语音训练中,可以在包含用户语音样本及各种干扰因素(模拟环境声音)的音频信号上测试各种不同的噪声抑制参数。语音训练中采用的干扰因素可以经过选择以模拟在某些场合56中发现的环境声音60。此外,所述场合56中的每一者可以在某些位置及时间发生,具有电子装置10的变化的运动及环境光的量,且/或具有语音信号58及环境声音60的各种音量级别。因此,电子装置10可以使用用户特定的噪声抑制参数来过滤环境声音60,所述参数是针对某些场合56定制的,例如基于时间、位置、运动、环境光及/或音量级别等而确定。
图4是用于在使用电子装置10的与语音有关的特征时在电子装置10上执行噪声抑制20的技术80的示意性框图。在图4的技术80中,与语音有关的特征涉及用户与另一个人之间的双向通信,并且可以在使用电子装置10的电话或聊天特征时发生。然而,应当理解,电子装置10也可以在未发生双向通信时对通过电子装置的麦克风32或网络接口26接收的音频信号执行噪声抑制20。
在噪声抑制技术80中,电子装置10的麦克风32可以获得用户语音信号58及背景中存在的环境声音60。在进入噪声抑制20之前,可以通过编解码器82对此第一音频信号进行编码。在噪声抑制20中,可以对第一音频信号应用发射噪声抑制(TX NS)84。可以通过某些噪声抑制参数(说明为发射噪声抑制(TX NS)参数86)来定义噪声抑制20的发生方式,举例来说,所述参数是由处理器12、存储器14或非易失性存储装置16提供的。如下文更详细论述,TX NS参数86可以是由处理器12确定的用户特定的噪声抑制参数,并且针对电子装置10的用户及/或场合56而定制。在标号84处执行了噪声抑制20之后,可以通过网络接口26将所得信号传递到上行链路88。
网络接口26的下行链路90可以从另一装置(例如,另一电话)接收语音信号。可以在噪声抑制20中对此传入信号应用某些噪声接收器噪声抑制(RX NS)92。可以通过某些噪声抑制参数(说明为接收噪声抑制(RX NS)参数94)来定义此噪声抑制20的发生方式,举例来说,所述参数是由处理器12、存储器14或非易失性存储装置16提供的。由于在离开发送装置之前,传入音频信号先前可能已经经过处理来进行噪声抑制,所以可以将RX NS参数94选择成没有TX NS参数86强。可以通过编解码器82对所得的经过噪声抑制的信号进行解码,并且将其输出到电子装置10的接收器电路及/或扬声器48。
TX NS参数86及/或RX NS参数94可能是电子装置10的用户特有的。也就是说,如图5的图100所示,可以从针对电子装置10的用户定制的用户特定的噪声抑制参数102中选出TX NS参数86及RX NS参数94。可以用各种方式来获得这些用户特定的噪声抑制参数102,例如通过语音训练104、基于用户语音简档106,及/或基于用户可选设置108,如下文更详细描述。
语音训练104可以允许电子装置10通过测试与各种干扰因素或模拟背景噪声组合的各种噪声抑制参数来确定用户特定的噪声抑制参数102。下文参照图7到14更详细地论述用于执行此语音训练104的某些实施例。此外或替代地,电子装置10可以基于用户语音简档106来确定用户特定的噪声抑制参数102,所述用户语音简档106可以考虑用户的语音的特定特性,如下文参照图15到17更详细论述。此外或替代地,用户可以通过某些用户设置108来指示对用户特定的噪声抑制参数102的偏好,如下文参照图18及19更详细论述。举例来说,此些用户可选设置可以包含噪声抑制强度(例如,低/中/高)选择器及/或实时用户反馈选择器,以提供关于用户的实时语音质量的用户反馈。
一般来说,电子装置10可以在电子装置的与语音有关的特征正在使用时采用用户特定的噪声抑制参数102(例如,可以基于用户特定的噪声抑制参数102来选择TX NS参数86及RX NS参数94)。在某些实施例中,电子装置10可以基于对当前正在使用与语音有关的特征的用户的识别来在噪声抑制20期间应用某些用户特定的噪声抑制参数102。举例来说,此情形可以在其他家庭成员使用电子装置10时发生。家庭的每一成员可以代表有时候可以使用电子装置10的与语音有关的特征的用户。在此些多用户状况下,电子装置10可以查实是否存在与所述用户相关联的用户特定的噪声抑制参数102。
举例来说,图6说明在已经识别了用户时用于应用某些用户特定的噪声抑制参数102的流程图110。流程图110可以在用户正在使用电子装置10的与语音有关的特征时开始(框112)。在实施与语音有关的特征时,电子装置10可以接收音频信号,此音频信号包含用户语音信号58及环境声音60。根据所述音频信号,电子装置10大体上可以确定用户的语音的某些特性且/或可以从用户语音信号58中识别出用户语音简档(框114)。如下文论述,用户语音简档可以表示识别与用户的语音相关联的某些特性的信息。
如果在框114处检测到的语音简档不与同用户特定的噪声抑制参数102相关联的任何已知用户匹配(框116),则电子装置10可以应用某些默认噪声抑制参数来进行噪声抑制20(框118)。然而,如果在框114中检测到的语音简档不与电子装置10的已知用户匹配,且电子装置10当前存储与所述用户相关联的用户特定的噪声抑制参数102,则电子装置10可以替代地应用相关联的用户特定的噪声抑制参数102(框120)。
如上所述,可以基于语音训练序列104来确定用户特定的噪声抑制参数102。在电子装置10的一实施例(例如手持装置34)的激活阶段130期间,可以将对此语音训练序列104的起始作为选项向用户呈现,如图7所示。一般来说,此激活阶段130可以在手持装置34首次加入蜂窝式网络或者经由通信电缆134首次连接到计算机或其它电子装置132时发生。在此激活阶段130期间,手持装置34或计算机或其它装置132可以提供起始语音训练的提示136。在选择了所述提示之后,用户即刻可以起始语音训练104。
此外或替代地,语音训练序列104可以在用户选择电子装置10的设置时开始,此设置致使电子装置10进入语音训练模式。如图8所示,手持装置34的主屏140可以包含用户可选按钮142,所述按钮在被选择时致使手持装置34显示设置屏幕144。当用户选择在设置屏幕144上标记为“电话”的用户可选按钮146时,手持装置34可以显示电话设置屏幕148。电话设置屏幕148尤其可以包含标记为“语音训练”的用户可选按钮150。当用户选择语音训练按钮150时,语音训练104序列可以开始。
图9的流程图160表示用于执行语音训练104的方法的一个实施例。流程图160可以在电子装置10提示用户在某些干扰因素(例如,模拟环境声音)在背景中播放时说话的时候开始(框162)。举例来说,可以要求用户在某些干扰因素(例如摇滚乐、七嘴八舌的人、起皱的纸等等)正在计算机或其它电子装置132上或在电子装置10的扬声器48上大声播放时说某个单词或短语。在此些干扰因素正在播放时,电子装置10可以读取用户的语音的样本(框164)。在一些实施例中,在播放各种干扰因素时框162及164可以重复来获得包含用户的语音及一个或一个以上干扰因素两者的若干测试音频信号。
为了确定用户最偏好哪些噪声抑制参数,电子装置10可以在从用户请求反馈之前将噪声抑制20应用于测试音频信号时交替地应用某些测试噪声抑制参数。举例来说,电子装置10可以在经由扬声器48将音频输出给用户之前,向包含用户的语音样本及一个或一个以上干扰因素的测试音频信号应用第一组测试噪声抑制参数,此处标记为“A”(框166)。接下来,电子装置10可以在经由扬声器48将音频输出给用户之前,向用户的语音样本应用另一组测试噪声抑制参数,此处标记为“B”(框168)。用户接着可以决定用户偏好电子装置10输出的两个音频信号中的哪一者(例如,通过选择电子装置10的显示器18上的“A”或“B”)(框170)。
电子装置10可以用各种测试噪声抑制参数及用各种干扰因素来重复框166到170的动作,每次都知道关于用户的噪声抑制偏好的更多情况,直到已经获得了合适的用户噪声抑制偏好数据组为止(决策框172)。因此,电子装置10可以测试实际上应用于含有用户的语音以及某些常见环境声音的音频信号的各种噪声抑制参数的合意性。在一些实施例中,通过框166到170的每次重复,电子装置10可以通过逐渐改变某些噪声抑制参数(例如,逐渐增加或减少噪声抑制强度)直到用户的噪声抑制偏好已经稳定下来为止来“调谐”测试噪声抑制参数。在其它实施例中,电子装置10可以在每次重复框166到170时测试不同类型的噪声抑制参数(例如,在一次重复时测试噪声抑制强度,在另一次重复时测试某些频率的噪声抑制,等等)。在任何情况下,框166到170可以一直重复到已经获得了所需数目的用户偏好为止(决策框172)。
基于在框170处获得的所指示的用户偏好,电子装置10可以形成用户特定的噪声抑制参数102(框174)。举例来说,电子装置10可以在框166到170的重复已经稳定下来时,基于框170的用户反馈来到达优选的用户特定的噪声抑制参数组102。在另一实例中,如果框166到170的重复各自测试特定的噪声抑制参数组,则电子装置10可以基于所指示的对特定参数的偏好来形成复杂的用户特定的噪声抑制参数组。用户特定的噪声抑制参数102可以存储在电子装置10的存储器14或非易失性存储装置16中(框176),用于在同一用户稍后使用电子装置10的与语音有关的特征时进行噪声抑制。
图10到13涉及电子装置10可以实施图9的流程图160的特定方式。确切地说,图10及11涉及图9的流程图160的框162及164,且图12及13A-B涉及框166到172。转向图10,双装置语音记录系统180包含计算机或其它电子装置132及手持装置34。在一些实施例中,手持装置34可以通过通信电缆134或经由无线通信(例如,802.1lxWi-Fi WLAN或蓝牙PAN)加入计算机或其它电子装置132。在系统180的操作期间,计算机或其它电子装置132可以提示用户在背景中播放各种干扰因素182中的一者或一者以上时说一个单词或短语。举例来说,此些干扰因素182可以包含起皱的纸184、七嘴八舌的人186、白噪声188、摇滚乐190及/或马路噪声192的声音。举例来说,干扰因素182可以另外或替代地包含在各种场合56中通常遇到的其它噪声,例如上文参照图3论述的噪声。从计算机或其它电子装置132大声播放的这些干扰因素182可以在用户提供用户语音样本194的同时被手持装置34的麦克风32拾取。以此方式,手持装置34可以获得包含干扰因素182及用户语音样本194两者的测试音频信号。
在由图11的单装置语音记录系统200表示的另一实施例中,手持装置34可以同时既输出干扰因素182又记录用户语音样本194。如图11所示,手持装置34可以提示用户说一个单词或短语用于用户语音样本194。同时,手持装置34的扬声器48可以输出一个或一个以上干扰因素182。手持装置34的麦克风32接着可以在没有计算机或其它电子装置132的情况下记录测试音频信号,此信号包含当前播放的干扰因素182及用户语音样本194两者。
对应于框166到170,图12说明用于基于应用于测试音频信号的噪声抑制参数的选择来确定用户的噪声抑制偏好的实施例。确切地说,此处表示为手持装置34的电子装置10可以向包含用户语音样本194及至少一个干扰因素182两者的测试音频信号应用第一组噪声抑制参数(“A”)。手持装置34可以输出所得的经过噪声抑制的音频信号(标号212)。手持装置34还可在输出所得的经过噪声抑制的音频信号之前向测试音频信号应用第二组噪声抑制参数(“B”)(标号214)。
当用户已经听到将两组噪声抑制参数“A”及“B”应用于测试音频信号的结果时,手持装置34可以例如问用户“您偏好A还是B?”(编号216)。用户接着可以基于输出的经过噪声抑制的信号来指示噪声抑制偏好。举例来说,用户可以经由手持装置34上的屏幕218来选择第一经过噪声抑制的音频信号(“A”)或第二经过噪声抑制的音频信号(“B”)。在一些实施例中,用户可以例如通过大声说“A”或“B”来用其它方式指示偏好。
电子装置10可以用各种方式确定对特定噪声抑制参数的用户偏好。图13的流程图220表示用于执行图9的流程图160的框166到172的方法的一个实施例。流程图220可以在电子装置10应用一组噪声抑制参数(出于示范性目的,标记为“A”及“B”)时开始。如果用户偏好噪声抑制参数“A”(决策框224),电子装置10接下来可以应用新的噪声抑制参数组,所述参数出于类似说明目的被标记为“C”及“D”(框226)。在某些实施例中,噪声抑制参数“C”及“D”可以是噪声抑制参数“A”的变化形式。如果用户偏好噪声抑制参数“C”(决策框228),则电子装置可以将噪声抑制参数设置成“A”与“C”的组合(框230)。如果用户偏好噪声抑制参数“D”(决策框228),则电子装置可以将用户特定的噪声抑制参数设置成噪声抑制参数“A”与“D”的组合(框232)。
如果在框222之后,用户偏好噪声抑制参数“B”(决策框224),则电子装置10可以应用新的噪声抑制参数“C”及“D”(框234)。在某些实施例中,新的噪声抑制参数“C”及“D”可以是噪声抑制参数“B”的变化形式。如果用户偏好噪声抑制参数“C”(决策框236),则电子装置10可以将用户特定的噪声抑制参数设置成“B”与“C”的组合(框238)。否则,如果用户偏好噪声抑制参数“D”(决策框236),则电子装置10可以将用户特定的噪声抑制参数设置成“B”与“D”的组合(框240)。应当了解,仅将流程图220呈现为执行图9的流程图160的框166到172的一种方式。因此,应当理解,可以测试多得多的噪声抑制参数,并且可以结合某些干扰因素来具体测试此些参数(例如,在某些实施例中,可以针对分别包含干扰因素182中的每一者的测试音频信号来重复流程图220)。
可以用其它方式来执行语音训练序列104。举例来说,在图14的流程图250表示的一个实施例中,首先可以在未在背景中播放任何干扰因素182的情况下获得用户语音样本194(框252)。一般来说,可以在具有非常少的环境声音60的位置(例如,静噪房间)中获得此用户语音样本194,使得用户语音样本194具有相对高的信噪比(SNR)。此后,电子装置10可以将用户语音样本194与各种干扰因素182用电子方式混合(框254)。因此,电子装置10可以使用单个用户语音样本194产生具有各种干扰因素182的一个或一个以上测试音频信号。
此后,电子装置10可以确定用户最偏好哪些噪声抑制参数来确定用户特定的噪声抑制参数102。以与图9的框166到170类似的方式,电子装置10可以交替地向在框254处获得的测试音频信号应用某些测试噪声抑制参数以计量用户偏好(框256-260)。电子装置10可以用各种测试噪声抑制参数及用各种干扰因素来重复框256到260的动作,每次都知道关于用户的噪声抑制偏好的更多情况,直到已经获得了合适的用户噪声抑制偏好数据组为止(决策框262)。因此,电子装置10可以测试应用于含有用户的语音以及某些常见环境声音的测试音频信号的各种噪声抑制参数的合意性。
与图9的框174类似,电子装置10可以形成用户特定的噪声抑制参数102(框264)。用户特定的噪声抑制参数102可以存储在电子装置10的存储器14或非易失性存储装置16中(框266),以在同一用户稍后使用电子装置10的与语音有关的特征时进行噪声抑制。
如上所述,本发明的某些实施例可以涉及在干扰因素182未在背景中大声播放的情况下获得用户语音样本194。在一些实施例中,电子装置10可在用户第一次在不打断用户的情况下在静噪设置中使用电子装置10的与语音有关的特征时获得此用户语音样本194。如图15的流程图270中所表示,在一些实施例中,在电子装置10首次检测到含有用户的语音的音频的足够高的信噪比(SNR)时,电子装置10可以获得此用户语音样本194。
图15的流程图270可以在用户正在使用电子装置10的与语音有关的特征时开始(框272)。为了查实用户的身份,电子装置10可以基于麦克风32检测到的音频信号来检测用户的语音简档(框274)。如果在框274中检测到的语音简档表示电子装置的已知用户的语音的语音简档(决策框276),则电子装置10可以应用与所述用户相关联的用户特定的噪声抑制参数102(框278)。如果用户的身份是未知的(决策框276),则电子装置10可以首先应用默认噪声抑制参数(框280)。
电子装置10可以在使用与语音有关的特征时评估麦克风32接收到的音频信号的当前信噪比(SNR)(框282)。如果SNR足够高(例如,高于预设阈值),则电子装置10可以从麦克风32接收的音频中获得用户语音样本194(框286)。如果SNR不够高(例如,低于阈值)(决策框284),则电子装置10可以继续应用默认噪声抑制参数(框280),继续至少周期性地重新评估SNR。以此方式获得的用户语音样本194可以稍后用于语音训练序列104中,如上文参照图14所论述。在其它实施例中,电子装置10可以采用此用户语音样本194来基于用户语音样本194本身来确定用户特定的噪声抑制参数102。
具体来说,除了语音训练序列104之外,还可以基于与用户语音样本194相关联的某些特性来确定用户指定的噪声抑制参数102。举例来说,图16表示用于基于此些用户语音特性来确定用户特定的噪声抑制参数102的流程图290。当电子装置10获得用户语音样本194时,可以开始流程图290(框292)。用户语音样本可以例如根据图15的流程图270来获得,或者可以在电子装置10提示用户说特定单词或短语时获得。电子装置接下来可以分析与用户语音样本相关联的某些特性(框294)。
基于与用户语音样本194相关联的各种特性,电子装置10可以确定用户特定的噪声抑制参数102(框296)。举例来说,如图17的语音特性图300所示,用户语音样本194可以包含各种语音样本特性302。此些特性302可以尤其包含用户语音样本194的平均频率304、用户语音样本194的频率的可变性306、与用户语音样本194相关联的常见话音声音308、用户语音样本194的频率范围310、用户语音样本的频率中的共振峰位置312,及/或用户语音样本194的动态范围314。这些特性可能会出现,是因为不同用户可能具有不同的话音模式。也就是说,用户的语音的高度或深度、用户说话时的口音及/或口齿不清等等可以被纳入考虑范围,只要它们改变了话音的可测量特点,例如特性302。
如上所述,还可以通过直接选择用户设置108来确定用户特定的噪声抑制参数102。一个此实例在图18中作为用于手持装置32的用户设置屏幕序列320出现。当电子装置10显示一包含设置按钮142的主屏140时,可以开始屏幕序列320。选择设置按钮142可以致使手持装置34显示设置屏幕144。选择设置屏幕144上的标记为“电话”的用户可选按钮146,可以致使手持装置34显示电话设置屏幕148,其可以包含各种用户可选按钮,其中的一者可以是标记为“噪声抑制”的用户可选按钮322。
当用户选择用户可选按钮322时,手持装置34可以显示噪声抑制选择屏幕324。通过噪声抑制选择屏幕324,用户可以选择噪声抑制强度。举例来说,用户可以经由选择轮盘326来选择噪声抑制是应当高、中还是低强度。选择较高的噪声抑制强度可能会产生抑制接收到的音频信号中的较多环境声音60但是可能也抑制较多用户58的语音的用户特定的噪声抑制参数102。选择较低的噪声抑制强度可能会产生准许接收到的音频信号中保留较多环境声音60但是也准许保留较多用户58的语音的用户特定的噪声抑制参数102。
在其它实施例中,用户可以在使用电子装置10的与语音有关的特征时实时调整用户特定的噪声抑制参数102。举例来说,如图19的可以在手持装置34上显示的进行中的呼叫屏幕330中所见,用户可以提供语音电话呼叫质量反馈332的测量值。在某些实施例中,可以通过若干可选星级334来表示反馈以指示呼叫质量。如果用户选择的星级334的数目较高,则可以理解用户对当前用户特定的噪声抑制参数102感到满意,且因此电子装置10可能不改变噪声抑制参数。另一方面,如果所选星级334的数目较低,则电子装置10可以改变用户特定的噪声抑制参数102,直到星级334的数目增加,从而指示用户满意为止。此外或替代地,进行中的呼叫屏幕330可以包含实时用户可选噪声抑制强度设置,例如上文参照图18揭示的设置。
在某些实施例中,可以与某些干扰因素182及/或某些场合60相关联地确定用户特定的噪声抑制参数102的子组。如图20的参数图340说明,用户特定的噪声抑制参数102可以基于特定干扰因素182划分成子组。举例来说,用户特定的噪声抑制参数102可以包含干扰因素特定的参数344-352,所述参数可以表示经过选择以从还包含用户58的语音的音频信号中过滤与干扰因素182相关联的某些环境声音60的噪声抑制参数。应当理解,用户特定的噪声抑制参数102可以包含较多或较少的干扰因素特定的参数。举例来说,如果在语音训练104期间测试了不同的干扰因素182,则用户特定的噪声抑制参数102可以包含不同的干扰因素特定的参数。
可以在确定用户特定的噪声抑制参数102时确定干扰因素特定的参数344-352。举例来说,在语音训练104期间,电子装置10可以使用包含各种干扰因素182的测试音频信号来测试多个噪声抑制参数。依据与每一干扰因素182的噪声抑制相关的用户偏好,电子装置可以确定干扰因素特定的参数344-352。举例来说,电子装置可以基于包含起皱的纸干扰因素184的测试音频信号来确定用于起皱的纸的参数344。如下文所述,在特定例子中,参数图340的干扰因素特定的参数可以稍后被重新调用,例如当在存在某些环境声音60及/或在某些场合56中使用电子装置10时。
此外或替代地,可以相对于可以使用电子装置10的与语音有关的特征的某些场合56来定义用户特定的噪声抑制参数102的子组。举例来说,如图21所示的参数图360所表示,可以基于可最好地使用噪声抑制参数的场合56,将用户特定的噪声抑制参数102划分成子组。举例来说,用户特定的噪声抑制参数102可以包含场合特定的参数364-378,其表示经选择以过滤可能与特定场合56相关联的某些环境声音60的噪声抑制参数。应当理解,用户特定的噪声抑制参数102可以包含较多或较少的场合特定的参数。举例来说,如下文论述,电子装置10可能能够识别各种场合56,其中的每一者可以具有特定的预期的环境声音60。因此,用户特定的噪声抑制参数102可以包含不同的场合特定的参数以抑制可识别的场合56中的每一者中的噪声。
与干扰因素特定的参数344-352一样,可以在确定用户特定的噪声抑制参数102时确定场合特定的参数364-378。举一个实例,在语音训练104期间,电子装置10可以使用包含各种干扰因素182的测试音频信号来测试多个噪声抑制参数。依据与每一干扰因素182的噪声抑制相关的用户偏好,电子装置10可以确定场合特定的参数364-378。
电子装置10可以基于场合特定的参数364到378中的每一者的场合56与一个或一个以上干扰因素182之间的关系来确定场合特定的参数364到378。具体来说,应当注意,电子装置10可以识别的场合56中的每一者可以与一个或一个以上特定的干扰因素182相关联。举例来说,在车上70的场合56可能主要与一个干扰因素182(即,马路噪声192)相关联。因此,在车上的场合特定的参数376可以基于与包含马路噪声192的测试音频信号有关的用户偏好。类似地,体育赛事72的场合56可能与若干干扰因素182(例如七嘴八舌的人186、白噪声188及摇滚乐190)相关联。因此,用于体育赛事的场合特定的参数368可以基于与包含七嘴八舌的人186、白噪声188及摇滚乐190的测试音频信号有关的用户偏好的组合。可以对此组合进行加权以更加偏重考虑预期与场合56的环境声音60更加密切地匹配的干扰因素182。
如上所述,可以在有或没有语音训练104的情况下,基于用户语音样本194的特性来确定用户特定的噪声抑制参数102(例如,如上文参照图16及17所述)。在此些状况下,电子装置10可以另外或替代地自动(例如,没有用户提示)确定干扰因素特定的参数344-352及/或场合特定的参数364-378。可以基于应用于用户语音样本194及某些干扰因素182时此些噪声抑制参数的预期性能来确定这些噪声抑制参数344-352及/或363-378。
当在使用电子装置10的与语音有关的特征时,电子装置10可以使用干扰因素特定的参数344-352及/或场合特定的参数364-378针对用户及环境声音60的特点两者来定制噪声抑制20。具体来说,图22说明用于基于环境声音60的评估的特点来选择及应用干扰因素特定的参数344-352的方法的实施例。图23说明用于基于识别出的使用电子装置10的场合56来选择及应用场合特定的参数364-378的方法的实施例。
转向图22,用于选择及应用干扰因素特定的参数344-352的流程图380可以在使用电子装置10的与语音有关的特征时开始(框382)。接下来,电子装置10可以确定其麦克风32接收到的环境声音60的特点(框384)。在一些实施例中,电子装置10可以例如基于音量级别(例如,用户的语音58一般可能大于环境声音60)及/或频率(例如,环境声音60可能会在与用户的语音58相关联的频率范围外部发生)来区分环境声音60与用户的语音58。
环境声音60的特点可能类似于干扰因素182中的一者或一者以上。因此,在一些实施例中,电子装置10可以应用干扰因素特定的参数344-352中与环境声音60最密切地匹配的一个参数(框386)。举例来说,对于在饭店74的场合56,麦克风32检测到的环境声音60可能与七嘴八舌的人186最密切地匹配。电子装置10因此可以在检测到此些环境声音60时应用干扰因素特定的参数346。在其它实施例中,电子装置10可以应用干扰因素特定的参数344-352中与环境声音60最密切地匹配的几个参数。可以基于环境声音60与对应干扰因素182的相似度来对这几个干扰因素特定的参数344-352进行加权。举例来说,体育赛事72的场合56可能具有类似于几个干扰因素182(例如七嘴八舌的人186、白噪声188及摇滚乐190)的环境声音60。当检测到此些环境声音60时,电子装置10可以与每一者与环境声音60的相似度成比例地应用几个相关联的干扰因素特定的参数346、348及/或350。
以类似的方式,电子装置10可以基于识别出的使用电子装置10的场合56来选择及应用场合特定的参数364-378。转向图23,用于进行此操作的流程图390可以在使用电子装置10的与语音有关的特征时开始(框392)。接下来,电子装置10可以确定正在使用电子装置10的当前场合56(框394)。具体来说,电子装置10可以考虑各种装置场合因素(下文参照图24更详细论述)。基于经确定在使用电子装置10的场合56,电子装置10可以应用场合特定的参数364-378中的相关联的一者(框396)。
如图24的装置场合因数图400所示,电子装置10可以考虑各种装置场合因数402来识别正在使用电子装置10的当前场合56。可以单独或结合各种实施例考虑这些装置场合因数402,并且在一些情况下可以对装置场合因数402进行加权。也就是说,可以在确定场合56时给更加可能正确地预测当前场合56的装置场合因数402更大的加权,而可以给不太可能正确地预测当前场合56的装置场合因数402更小的加权。
举例来说,装置场合因数402中的第一因数404可以是电子装置10的麦克风32检测到的环境声音60的特点。由于环境声音60的特点可能与场合56有关,所以电子装置10可以至少部分地基于此分析来确定场合56。
装置场合因数402中的第二因数406可以是当前日期或一天中的时间。在一些实施例中,电子装置10可以将当前日期及/或时间与电子装置10的日历特征比较以确定场合。举例来说,如果日历特征指示用户预期在用餐,则第二特征406可以偏重于确定场合56是饭店74。在另一实例中,由于早晨或傍晚用户可能在赶路,所以在此些时间第二因数406可以偏重于确定场合56是车上70。
装置场合因数402中的第三因数408可以是电子装置10的当前位置,其可通过位置感测电路22来确定。使用第三因数408,电子装置10可以在确定场合56时,例如通过将当前位置与电子装置10的地图特征中的已知位置(例如,饭店74或办公室64)或电子装置10通常所在的位置(其可例如指示办公室64或家里62)比较来考虑其当前位置。
装置场合因数402中的第四因数410可以是例如经由电子装置的图像捕获电路28在电子装置10周围检测到的环境光的量。举例来说,大量环境光可以与某些位于户外的场合56(例如,繁忙的街道68)相关联。在此些状况下,因数410可以偏重于位于户外的场合56。相比之下,较低量的环境光可以与某些位于室内(例如,在家62)的场合56相关联,在此情况下,因数410可以偏重于此室内场合56。
装置场合因数402中的第五因数412可以是电子装置10的检测到的运动。可以基于加速计及/或磁力计30及/或基于位置感测电路22确定的随时间的位置变化来检测此运动。运动可以用各种方式来暗示给定场合56。举例来说,当检测到电子装置10在非常快速地移动(例如,比每小时20英里快)时,因数412可以偏重于电子装置10处在车上70或类似形式的交通工具中。当电子装置10在随机移动时,因数412可以偏重于电子装置10的用户可能在四处移动的场合(例如,在健身馆66或派对76)。当电子装置10大部分时间固定的时候,因数412可以偏重于用户一段时间内坐在一个位置上的场合56(例如,办公室64或饭店74)。
装置场合因数402中的第六因数414可以是与另一装置(例如,蓝牙手持机)的连接。举例来说,与车载免提电话系统的蓝牙连接可以致使第六因数414偏重于确定场合56是在车上70。
在一些实施例中,电子装置10可以基于与电子装置10的给定用户相关联的用户语音简档来确定用户特定的噪声抑制参数102。所得的用户特定的噪声抑制参数102可以致使噪声抑制20将看起来不与用户语音简档相关联且因此可以被理解为可能是噪声的环境声音60隔离。图25到29与此些技术有关。
如图25所示,用于获得用户语音简档的流程图420可以在电子装置10获得语音样本时开始(框422)。此语音样本可以用上文所述的方式中的任一者来获得。电子装置10可以分析语音样本的某些特性,例如上文参照图论述的那些特性(框424)。可以将特定特性量化及存储为用户的语音简档(框426)。可以采用所确定的用户语音简档来针对用户的语音定制噪声抑制20,如下所述。此外,用户语音简档可以使得电子装置10能够识别何时特定用户在使用电子装置10的与语音有关的特征,例如上文参照图15所述。
使用此语音简档,电子装置10可以用最适用于所述用户的语音的方式来执行噪声抑制20。在一个实施例中,如图26的流程图430所表示,电子装置10可以抑制音频信号的更可能对应于环境声音60而不是用户的语音58的频率,同时增强更可能对应于语音信号58的频率。流程图430可以在用户正在使用电子装置10的与语音有关的特征时开始(框432)。电子装置10可以将接收到的包含用户语音信号58及环境声音60两者的音频信号与同当前对电子装置10中说话的用户相关联的用户语音简档比较(框434)。为了针对用户的语音来定制噪声抑制20,电子装置可以用抑制音频信号的不与用户语音简档相关联的频率的方式且通过放大音频信号的与用户语音简档相关联的频率来执行噪声抑制20(框436)。
图27到29展示了进行此操作的一种方式,其表示将音频信号、用户语音简档及传出的经过噪声抑制的信号建模的曲线图。转向图27,曲线图440表示已经在使用与语音有关的特征时被接收到电子装置10的麦克风32中并且被变换到频率域中的音频信号。纵坐标442表示音频信号的频率的量值,且横坐标444表示音频信号的各种离散频率分量。应当理解,可以采用任何合适的变换(例如,快速傅立叶变换(FFT))将音频信号变换到频率域中。类似地,可以将音频信号划分成任何合适数目的离散频率分量(例如,40、128、256等)。
相比之下,图28的曲线图450是将与用户语音简档的频率建模的曲线图。纵坐标452表示用户语音简档的频率的量值,且横坐标454表示用户语音简档的离散频率分量。将图27的音频信号曲线图440与图28的用户语音简档曲线图450比较,可以看出建模的音频信号包含通常不与用户语音简档相关联的频率范围。也就是说,建模的音频信号除了用户的语音之外可能还包含其它环境声音60。
根据此比较,当电子装置10实施噪声抑制20时,其可以确定或选择用户特定的噪声抑制参数102,使得曲线图440的音频信号的对应于曲线图450的用户语音简档的频率的频率大体上被放大,而其它频率大体上被抑制。通过图29的曲线图460将此所得的经过噪声抑制的音频信号建模。曲线图460的纵坐标462表示经过噪声抑制的音频信号的频率的量值,且横坐标464表示经过噪声抑制的信号的离散频率分量。曲线图460的经过放大的部分466大体上对应于在用户语音简档中发现的频率。相比之下,曲线图460的经过抑制的部分468对应于经过噪声抑制的信号的不与曲线图450的用户简档相关联的频率。在一些实施例中,可以将较大量的噪声抑制应用于不与曲线图450的用户语音简档相关联的频率,而可以将较少量的噪声抑制应用于部分466,此部分可以被放大或者可以不被放大。
上文的论述大体上集中于确定用于对传出的音频信号执行噪声抑制20的TX NS 84的用户特定的噪声抑制参数102,如图4所示。然而,如上所述,用户特定的噪声抑制参数102也可以用于对来自另一装置的传入音频信号执行RX NS 92。由于此来自另一装置的传入音频信号将不包含用户自己的语音,所以在某些实施例中,可以基于除了几个干扰因素182之外还涉及几个测试语音的语音训练104来确定用户特定的噪声抑制参数102。
举例来说,如图30的流程图470呈现,电子装置10可以经由涉及预先记录的或模拟的语音及模拟干扰因素182的语音训练104来确定用户特定的噪声抑制参数102。语音训练104的此实施例可以涉及包含各种差值语音及干扰因素182的测试音频信号。流程图470可以在用户起始语音训练104时开始(框472)。电子装置10不是只基于用户自己的语音来执行语音训练104,而是可以对含有各种语音的各种测试音频信号应用各种噪声抑制参数,在某些实施例中所述语音中的一者可以是用户的语音(框474)。此后,电子装置10可以查实用户对于对各种测试音频信号测试的不同噪声抑制参数的偏好。应当理解,可以用与图9的框166-170类似的方式实施框474。
基于在框474处来自用户的反馈,电子装置10可以形成用户特定的噪声抑制参数102(框476)。基于图30的流程图470形成的用户特定的参数102可能非常适合于应用于接收到的音频信号(例如,用于形成RX NS参数94,如图4所示)。确切地说,当电子装置10被“近端”用户用作电话与“远端”用户说话时,接收到的音频信号将包含不同的语音。因此,如图31的流程图480所示,依据从远端用户接收到的音频信号中的远端用户的语音的特点,可以将使用例如参照图30所述的技术的技术来确定的用户特定的噪声抑制参数102应用于所述音频信号。
流程图480可以在电子装置10的与语音有关的特征(例如,电话或聊天特征)正在使用且在从另一电子装置10接收到包含远端用户的语音的音频信号时开始(框482)。随后,电子装置10可以确定音频信号中的远端用户的语音的特点(框484)。举例来说,进行此操作可能必须将接收到的音频信号中的远端用户的语音与在语音训练104(当如上文参照图30论述执行时)期间测试的某些其它语音比较。接下来,电子装置10可以应用对应于其它语音中最类似于最终用户的语音的一个语音的用户特定的噪声抑制参数102(框486)。
总地来说,当第一电子装置10在双向通信期间从第二电子装置10时接收到含有远端用户的语音的音频信号时,可能在第二电子装置10中已经处理了此音频信号以进行噪声抑制。根据某些实施例,第二电子装置10中的此噪声抑制可以针对第一电子装置10的近端用户而定制,如图32的流程图490所述。流程图490可以在第一电子装置10(例如,图33的手持装置34A)正在或即将开始从第二电子装置10(例如,手持装置34B)接收远端用户的语音的音频信号时开始(框492)。第一电子装置10可以将先前由近端用户确定的用户特定的噪声抑制参数102发射到第二电子装置10(框494)。此后,第二电子装置10可以对传出音频信号中的远端用户的语音的噪声抑制应用那些用户特定的噪声抑制参数102(框496)。因此,包含从第二电子装置10发射到第一电子装置10的远端用户的语音的音频信号可以具有第一电子装置10的近端用户偏好的噪声抑制特性。
可以使用两个电子装置10系统地采用图32的上述技术,所述电子装置说明为图33的系统500,包含具有类似的噪声抑制能力的手持装置34A及34B。当近端用户及远端用户分别通过网络(例如,使用电话或聊天特征)将手持装置34A及34B用于相互通信时,手持装置34A及34B可以交换与其相应用户相关联的用户特定的噪声抑制参数102(框504及506)。也就是说,手持装置34B可以接收与手持装置34A的近端用户相关联的用户特定的噪声抑制参数102。同样,手持装置34A可以接收与手持装置34B的远端用户相关联的用户特定的噪声抑制参数102。此后,手持装置34A可以基于远端用户的用户特定的噪声抑制参数102对近端用户的音频信号执行噪声抑制20。同样,手持装置34B可以基于近端用户的用户特定的噪声抑制参数102对远端用户的音频信号执行噪声抑制20。以此方式,手持装置34A及34B的相应用户可以听到来自另一方的噪声抑制与其相应偏好匹配的音频信号。
已经举例展示了上述特定实施例,且应当理解,这些实施例可以得到各种修改及替代形式。应进一步理解,权利要求书并不意图限于所揭示的特定形式,而是涵盖所有属于本发明的精神及范围内的修改、等效物及替代形式。

Claims (25)

1.一种方法,其包括:
在使用电子装置的与语音有关的特征时在所述电子装置中接收包含用户语音的音频信号;以及
使用所述电子装置至少部分地基于用户特定的噪声抑制参数来抑制所述音频信号中的噪声同时实质上保留所述用户语音,其中所述用户特定的噪声抑制参数至少部分是基于用户噪声抑制偏好或用户语音简档或其组合。
2.根据权利要求1所述的方法,其中所述用户噪声抑制偏好至少部分是基于用户噪声抑制训练序列。
3.根据权利要求2所述的方法,其中所述用户噪声抑制训练序列包括在已经对测试音频信号测试了噪声抑制参数且将所述噪声抑制参数回放给所述用户之后在所述电子装置中接收用户对偏好的噪声参数的选择。
4.根据权利要求2所述的方法,其中所述用户噪声抑制训练序列包括测试应用于包含用户语音样本及至少一个干扰因素的测试音频信号的噪声抑制参数。
5.根据权利要求1所述的方法,其中所述用户噪声抑制偏好至少部分是基于用户选择的噪声抑制设置。
6.根据权利要求5所述的方法,其中所述用户选择的噪声抑制设置包括噪声抑制强度设置。
7.根据权利要求5所述的方法,其中所述用户选择的噪声抑制设置可以在使用所述电子装置的所述与语音有关的特征时由用户实时选择。
8.根据权利要求1所述的方法,其中所述用户特定的噪声抑制参数至少部分地通过放大与所述用户语音简档相关联的频率来抑制所述音频信号中的噪声同时实质上保留所述用户语音。
9.根据权利要求1所述的方法,其中所述用户特定的噪声抑制参数至少部分地通过抑制不与所述用户语音简档相关联的频率来抑制所述音频信号中的噪声同时实质上保留所述用户语音。
10.一种制造品,其包括:
一个或一个以上有形的机器可读的存储媒体,其上面编码有用于由处理器执行的指令,所述指令包括:
用以确定包含用户语音样本及至少一个干扰因素的测试音频信号的指令;
用以至少部分地基于第一噪声抑制参数对所述测试音频信号应用噪声抑制以获得第一经过噪声抑制的音频信号的指令;
用以致使所述第一经过噪声抑制的音频信号被输出到扬声器的指令;
用以至少部分地基于第二噪声抑制参数对所述测试音频信号应用噪声抑制以获得第二经过噪声抑制的音频信号的指令;
用以致使所述第二经过噪声抑制的音频信号被输出到所述扬声器的指令;
用于获得对所述第一经过噪声抑制的音频信号或所述第二经过噪声抑制的音频信号的用户偏好的指示的指令;以及
用以依据对所述第一经过噪声抑制的信号或所述第二经过噪声抑制的信号的所述用户偏好的所述指示至少部分地基于所述第一噪声抑制参数或所述第二噪声抑制参数来确定用户特定的噪声抑制参数的指令,其中所述用户特定的噪声抑制参数经配置以在使用所述电子装置的与语音有关的特征时抑制噪声。
11.根据权利要求10所述的制造品,其中所述用以确定所述测试音频信号的指令包括用以在所述干扰因素正在所述扬声器上大声播放时使用麦克风记录所述用户语音样本的指令。
12.根据权利要求10所述的制造品,其中所述用以确定所述测试音频信号的指令包括用以在所述干扰因素正在另一装置上大声播放时使用麦克风记录所述用户语音样本的指令。
13.根据权利要求10所述的制造品,其中所述用以确定所述测试音频信号的指令包括用以使用麦克风记录所述用户语音样本且用电子方式将所述用户语音样本与所述干扰因素混合的指令。
14.根据权利要求10所述的制造品,其包括:
用以至少部分地基于第三噪声抑制参数对所述测试音频信号应用噪声抑制以获得第三经过噪声抑制的音频信号的指令;
用以致使所述第三经过噪声抑制的音频信号被输出到所述扬声器的指令;
用以至少部分地基于第四噪声抑制参数对所述测试音频信号应用噪声抑制以获得第四经过噪声抑制的音频信号的指令;
用以致使所述第四经过噪声抑制的音频信号被输出到所述扬声器的指令;
用以获得对所述第三经过噪声抑制的音频信号或所述第四经过噪声抑制的音频信号的用户偏好的指示的指令;以及
用以依据对所述第三经过噪声抑制的音频信号或所述第四经过噪声抑制的音频信号的所述用户偏好的所述指示至少部分地基于所述第一噪声抑制参数、所述第二噪声抑制参数、所述第三噪声抑制参数或所述第四噪声抑制参数或其组合来确定所述用户特定的噪声抑制参数的指令。
15.根据权利要求14所述的制造品,其包括用以至少部分地基于对所述第一经过噪声抑制的音频信号或所述第二经过噪声抑制的音频信号的所述用户偏好来确定所述第三噪声抑制参数及所述第四噪声抑制参数的指令。
16.一种电子装置,其包括:
麦克风,其经配置以获得包含用户语音及环境声音的音频信号;
噪声抑制电路,其经配置以至少部分地基于用户及场合特定的噪声抑制参数对所述音频信号应用噪声抑制,以抑制所述音频信号的所述环境声音;
存储器,其经配置以存储至少部分地基于对应用于用户语音样本及多个干扰因素的噪声抑制参数的测试而确定的多个噪声抑制参数;以及
数据处理电路,其经配置以通过确定所述电子装置的当前使用场合及选择所述多个噪声抑制参数中的至少一者来将所述用户及场合特定的噪声抑制参数提供到所述噪声抑制电路,其中所述多个噪声抑制参数中的所述至少一者是至少部分地基于对应用于所述用户语音样本及所述多个干扰因素中的至少一者的噪声抑制参数的测试而确定的,其中所述多个干扰因素中的所述至少一者与所述当前使用场合相关联。
17.根据权利要求16所述的电子装置,其中所述数据处理电路经配置以通过分析所述音频信号的所述环境声音来确定所述电子装置的所述当前使用场合且通过确定所述多个干扰因素中的哪一些与所述环境声音类似来确定所述多个干扰因素中与所述当前使用场合相关联的所述至少一者。
18.根据权利要求16所述的电子装置,其中所述数据处理电路经配置以至少部分地基于以下内容来确定所述电子装置的所述当前使用场合:来自所述电子装置的内部时钟的日期或时间或其组合、来自所述电子装置的位置感测电路的位置、来自所述电子装置的图像捕获电路的环境光的量、来自所述电子装置的运动感测电路的所述电子装置的运动、与另一电子装置的连接或来自所述麦克风的所述环境声音的音量或其任何组合,且其中所述数据处理电路经配置以通过确定所述多个干扰因素中的哪一些类似于所述确定的使用场合中的预期环境声音来确定所述多个干扰因素中与所述当前使用场合相关联的所述至少一者。
19.一种电子装置,其包括:
麦克风,其经配置以获得包含用户语音及环境声音的音频信号;
噪声抑制电路,其经配置以至少部分地基于用户特定的噪声抑制参数对所述音频信号应用噪声抑制,以抑制所述音频信号的所述环境声音;以及
数据处理电路,其经配置以提供所述用户特定的噪声抑制参数,其中所述数据处理电路经配置以至少部分地基于与所述用户语音相关联的用户语音简档来确定所述用户特定的噪声抑制参数。
20.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以至少部分地基于用户语音样本来确定所述用户语音简档,其中所述麦克风经配置以在所述电子装置的激活周期期间获得所述用户语音样本。
21.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以至少部分地基于用户语音样本来确定所述用户语音简档,其中所述麦克风经配置以通过监视在使用所述电子装置的与语音有关的特征时获得的另一音频信号的信噪比且在所述另一音频信号的所述信噪比超过阈值时记录所述另一音频信号来获得所述用户语音样本。
22.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以确定所述用户语音是否对应于已知用户,且在所述用户语音对应于所述已知用户时,重新调用与所述用户语音相关联的所述用户语音简档。
23.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以确定所述用户语音是否对应于已知用户,且在所述用户语音不对应于所述已知用户时,通过获得用户语音样本及至少部分地基于所述用户语音样本来确定与所述用户语音相关联的所述用户语音简档而确定所述用户语音简档。
24.一种系统,其包括:
第一电子装置,其经配置以从与所述第一电子装置相关联的麦克风获得第一用户语音信号,将所述第一用户语音信号提供到第二电子装置,且从所述第二电子装置接收第二用户噪声抑制参数,其中所述第一电子装置经配置以在将所述第一用户语音信号提供到所述第二电子装置之前至少部分地基于所述第二用户噪声抑制参数对所述第一用户语音信号应用噪声抑制。
25.根据权利要求24所述的系统,其中所述第一电子装置经配置以将第一用户噪声抑制参数提供到所述第二电子装置且从所述第二电子装置接收第二用户语音信号,其中在所述第一电子装置接收到所述第二用户语音信号之前,已经至少部分地基于所述第一用户噪声抑制参数对所述第二用户语音信号应用噪声抑制。
CN201180021126.1A 2010-06-04 2011-05-18 用于语音质量改进的用户特定的噪声抑制 Active CN102859592B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/794,643 2010-06-04
US12/794,643 US8639516B2 (en) 2010-06-04 2010-06-04 User-specific noise suppression for voice quality improvements
PCT/US2011/037014 WO2011152993A1 (en) 2010-06-04 2011-05-18 User-specific noise suppression for voice quality improvements

Publications (2)

Publication Number Publication Date
CN102859592A true CN102859592A (zh) 2013-01-02
CN102859592B CN102859592B (zh) 2014-08-13

Family

ID=44276060

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180021126.1A Active CN102859592B (zh) 2010-06-04 2011-05-18 用于语音质量改进的用户特定的噪声抑制

Country Status (7)

Country Link
US (2) US8639516B2 (zh)
EP (1) EP2577658B1 (zh)
JP (1) JP2013527499A (zh)
KR (1) KR101520162B1 (zh)
CN (1) CN102859592B (zh)
AU (1) AU2011261756B2 (zh)
WO (1) WO2011152993A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103594092A (zh) * 2013-11-25 2014-02-19 广东欧珀移动通信有限公司 一种单麦克风语音降噪方法和装置
WO2014161299A1 (zh) * 2013-08-15 2014-10-09 中兴通讯股份有限公司 一种语音质量处理的方法及装置
CN106062661A (zh) * 2014-03-31 2016-10-26 英特尔公司 用于常开常听的语音识别系统的位置感知功率管理方案
CN106165383A (zh) * 2014-05-12 2016-11-23 英特尔公司 远端上下文相关的预处理
CN106453760A (zh) * 2016-10-11 2017-02-22 努比亚技术有限公司 一种改善环境噪声的方法及终端
CN106878533A (zh) * 2015-12-10 2017-06-20 北京奇虎科技有限公司 一种移动终端的通信方法和装置
CN109905794A (zh) * 2019-03-06 2019-06-18 中国人民解放军联勤保障部队第九八八医院 基于战场应用的自适应智能化防护耳塞的数据分析系统
CN111986689A (zh) * 2020-07-30 2020-11-24 维沃移动通信有限公司 音频播放方法、音频播放装置和电子设备
WO2021093380A1 (zh) * 2019-11-13 2021-05-20 苏宁云计算有限公司 一种噪声处理方法、装置、系统

Families Citing this family (195)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
EP2453979B1 (en) * 2009-07-17 2019-07-24 Implantica Patent Ltd. A system for voice control of a medical implant
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9634855B2 (en) 2010-05-13 2017-04-25 Alexander Poltorak Electronic personal interactive device that determines topics of interest using a conversational agent
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
CN102479024A (zh) * 2010-11-24 2012-05-30 国基电子(上海)有限公司 手持装置及其用户界面构建方法
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
WO2013115768A1 (en) * 2012-01-30 2013-08-08 Hewlett-Packard Development Company , L.P. Monitor an event that produces a noise received by a microphone
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9184791B2 (en) 2012-03-15 2015-11-10 Blackberry Limited Selective adaptive audio cancellation algorithm configuration
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
WO2014062859A1 (en) * 2012-10-16 2014-04-24 Audiologicall, Ltd. Audio signal manipulation for speech enhancement before sound reproduction
US9357165B2 (en) * 2012-11-16 2016-05-31 At&T Intellectual Property I, Lp Method and apparatus for providing video conferencing
WO2014081408A1 (en) 2012-11-20 2014-05-30 Unify Gmbh & Co. Kg Method, device, and system for audio data processing
US9251804B2 (en) * 2012-11-21 2016-02-02 Empire Technology Development Llc Speech recognition
JP6314837B2 (ja) * 2013-01-15 2018-04-25 ソニー株式会社 記憶制御装置、再生制御装置および記録媒体
KR102516577B1 (ko) 2013-02-07 2023-04-03 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9344815B2 (en) 2013-02-11 2016-05-17 Symphonic Audio Technologies Corp. Method for augmenting hearing
US9344793B2 (en) 2013-02-11 2016-05-17 Symphonic Audio Technologies Corp. Audio apparatus and methods
US9319019B2 (en) 2013-02-11 2016-04-19 Symphonic Audio Technologies Corp. Method for augmenting a listening experience
US20140278392A1 (en) * 2013-03-12 2014-09-18 Motorola Mobility Llc Method and Apparatus for Pre-Processing Audio Signals
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9293140B2 (en) * 2013-03-15 2016-03-22 Broadcom Corporation Speaker-identification-assisted speech processing systems and methods
US9269368B2 (en) * 2013-03-15 2016-02-23 Broadcom Corporation Speaker-identification-assisted uplink speech processing systems and methods
US9520138B2 (en) * 2013-03-15 2016-12-13 Broadcom Corporation Adaptive modulation filtering for spectral feature enhancement
US20140278418A1 (en) * 2013-03-15 2014-09-18 Broadcom Corporation Speaker-identification-assisted downlink speech processing systems and methods
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9626963B2 (en) * 2013-04-30 2017-04-18 Paypal, Inc. System and method of improving speech recognition using context
US9083782B2 (en) 2013-05-08 2015-07-14 Blackberry Limited Dual beamform audio echo reduction
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
ES2615877T3 (es) 2013-06-25 2017-06-08 Telefonaktiebolaget Lm Ericsson (Publ) Métodos, nodos de red, programas de ordenador y productos de programa de ordenador para gestionar el tratamiento de un flujo continuo de audio
DK2835985T3 (en) * 2013-08-08 2017-08-07 Oticon As Hearing aid and feedback reduction method
WO2015026859A1 (en) * 2013-08-19 2015-02-26 Symphonic Audio Technologies Corp. Audio apparatus and methods
US9392353B2 (en) * 2013-10-18 2016-07-12 Plantronics, Inc. Headset interview mode
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9578161B2 (en) * 2013-12-13 2017-02-21 Nxp B.V. Method for metadata-based collaborative voice processing for voice communication
US9466310B2 (en) * 2013-12-20 2016-10-11 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Compensating for identifiable background content in a speech recognition device
KR20150117114A (ko) 2014-04-09 2015-10-19 한국전자통신연구원 잡음 제거 장치 및 방법
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9904851B2 (en) * 2014-06-11 2018-02-27 At&T Intellectual Property I, L.P. Exploiting visual information for enhancing audio signals via source separation and beamforming
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
DE102014009689A1 (de) * 2014-06-30 2015-12-31 Airbus Operations Gmbh Intelligentes Soundsystem/-modul zur Kabinenkommunikation
JP6381062B2 (ja) 2014-07-28 2018-08-29 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 通信デバイスのための音声信号を処理するための方法及びデバイス
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9530408B2 (en) 2014-10-31 2016-12-27 At&T Intellectual Property I, L.P. Acoustic environment recognizer for optimal speech processing
US10609475B2 (en) 2014-12-05 2020-03-31 Stages Llc Active noise control and customized audio system
WO2016123560A1 (en) 2015-01-30 2016-08-04 Knowles Electronics, Llc Contextual switching of microphones
KR102371697B1 (ko) * 2015-02-11 2022-03-08 삼성전자주식회사 음성 기능 운용 방법 및 이를 지원하는 전자 장치
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
CN105338170A (zh) * 2015-09-23 2016-02-17 广东小天才科技有限公司 一种滤除背景噪声的方法及装置
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
JP6755304B2 (ja) * 2016-04-26 2020-09-16 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置
US9838737B2 (en) * 2016-05-05 2017-12-05 Google Inc. Filtering wind noises in video content
WO2017197312A2 (en) * 2016-05-13 2017-11-16 Bose Corporation Processing speech from distributed microphones
US10045130B2 (en) 2016-05-25 2018-08-07 Smartear, Inc. In-ear utility device having voice recognition
US20170347177A1 (en) 2016-05-25 2017-11-30 Smartear, Inc. In-Ear Utility Device Having Sensors
WO2017205558A1 (en) * 2016-05-25 2017-11-30 Smartear, Inc In-ear utility device having dual microphones
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10891946B2 (en) 2016-07-28 2021-01-12 Red Hat, Inc. Voice-controlled assistant volume control
US10771631B2 (en) * 2016-08-03 2020-09-08 Dolby Laboratories Licensing Corporation State-based endpoint conference interaction
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10945080B2 (en) 2016-11-18 2021-03-09 Stages Llc Audio analysis and processing system
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10629200B2 (en) * 2017-03-07 2020-04-21 Salesboost, Llc Voice analysis training system
WO2018164304A1 (ko) * 2017-03-10 2018-09-13 삼성전자 주식회사 잡음 환경의 통화 품질을 개선하는 방법 및 장치
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10410634B2 (en) 2017-05-18 2019-09-10 Smartear, Inc. Ear-borne audio device conversation recording and compressed data transmission
US10235128B2 (en) * 2017-05-19 2019-03-19 Intel Corporation Contextual sound filter
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10582285B2 (en) 2017-09-30 2020-03-03 Smartear, Inc. Comfort tip with pressure relief valves and horn
US10665234B2 (en) * 2017-10-18 2020-05-26 Motorola Mobility Llc Detecting audio trigger phrases for a voice recognition session
CN107945815B (zh) * 2017-11-27 2021-09-07 歌尔科技有限公司 语音信号降噪方法及设备
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10754611B2 (en) * 2018-04-23 2020-08-25 International Business Machines Corporation Filtering sound based on desirability
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11749293B2 (en) * 2018-07-20 2023-09-05 Sony Interactive Entertainment Inc. Audio signal processing device
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN112201247A (zh) * 2019-07-08 2021-01-08 北京地平线机器人技术研发有限公司 语音增强方法和装置、电子设备和存储介质
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
KR20210091003A (ko) * 2020-01-13 2021-07-21 삼성전자주식회사 전자 장치 및 그 제어 방법
KR20210121472A (ko) * 2020-03-30 2021-10-08 엘지전자 주식회사 인공지능 기반의 음질개선
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US11697301B2 (en) * 2020-11-10 2023-07-11 Baysoft LLC Remotely programmable wearable device
CN112309426A (zh) * 2020-11-24 2021-02-02 北京达佳互联信息技术有限公司 语音处理模型训练方法及装置和语音处理方法及装置
US11741983B2 (en) * 2021-01-13 2023-08-29 Qualcomm Incorporated Selective suppression of noises in a sound signal
US11645037B2 (en) * 2021-01-27 2023-05-09 Dell Products L.P. Adjusting audio volume and quality of near end and far end talkers
WO2022211504A1 (en) * 2021-03-31 2022-10-06 Samsung Electronics Co., Ltd. Method and electronic device for suppressing noise portion from media event
CN117157707A (zh) * 2021-04-13 2023-12-01 谷歌有限责任公司 移动设备辅助的主动噪声控制
US20230410824A1 (en) * 2022-05-31 2023-12-21 Sony Interactive Entertainment LLC Systems and methods for automated customized voice filtering

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0558312A1 (en) * 1992-02-27 1993-09-01 Central Institute For The Deaf Adaptive noise reduction circuit for a sound reproduction system
US6463128B1 (en) * 1999-09-29 2002-10-08 Denso Corporation Adjustable coding detection in a portable telephone
CN1640191A (zh) * 2002-07-12 2005-07-13 唯听助听器公司 助听器和提高语言清晰度的方法
US20060282264A1 (en) * 2005-06-09 2006-12-14 Bellsouth Intellectual Property Corporation Methods and systems for providing noise filtering using speech recognition
US20080165980A1 (en) * 2007-01-04 2008-07-10 Sound Id Personalized sound system hearing profile selection process

Family Cites Families (307)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4759070A (en) 1986-05-27 1988-07-19 Voroba Technologies Associates Patient controlled master hearing aid
US4974191A (en) 1987-07-31 1990-11-27 Syntellect Software Inc. Adaptive natural language computer interface system
US5282265A (en) 1988-10-04 1994-01-25 Canon Kabushiki Kaisha Knowledge information processing system
SE466029B (sv) 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
US5128672A (en) 1990-10-30 1992-07-07 Apple Computer, Inc. Dynamic predictive keyboard
US5303406A (en) 1991-04-29 1994-04-12 Motorola, Inc. Noise squelch circuit with adaptive noise shaping
US5903454A (en) 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US6081750A (en) 1991-12-23 2000-06-27 Hoffberg; Steven Mark Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US5434777A (en) 1992-05-27 1995-07-18 Apple Computer, Inc. Method and apparatus for processing natural language
JPH0619965A (ja) 1992-07-01 1994-01-28 Canon Inc 自然言語処理装置
CA2091658A1 (en) 1993-03-15 1994-09-16 Matthew Lennig Method and apparatus for automation of directory assistance using speech recognition
JPH0869470A (ja) 1994-06-21 1996-03-12 Canon Inc 自然言語処理装置及びその方法
US5682539A (en) 1994-09-29 1997-10-28 Conrad; Donovan Anticipated meaning natural language interface
US5577241A (en) 1994-12-07 1996-11-19 Excite, Inc. Information retrieval system and method with implementation extensible query architecture
US5748974A (en) 1994-12-13 1998-05-05 International Business Machines Corporation Multimodal natural language interface for cross-application tasks
US5794050A (en) 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
JP3284832B2 (ja) 1995-06-22 2002-05-20 セイコーエプソン株式会社 音声認識対話処理方法および音声認識対話装置
WO1997010586A1 (en) 1995-09-14 1997-03-20 Ericsson Inc. System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions
US5987404A (en) 1996-01-29 1999-11-16 International Business Machines Corporation Statistical natural language understanding using hidden clumpings
US5826261A (en) 1996-05-10 1998-10-20 Spencer; Graham System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query
US5727950A (en) 1996-05-22 1998-03-17 Netsage Corporation Agent based instruction system and method
US5966533A (en) 1996-06-11 1999-10-12 Excite, Inc. Method and system for dynamically synthesizing a computer program by differentially resolving atoms based on user context data
US5915249A (en) 1996-06-14 1999-06-22 Excite, Inc. System and method for accelerated query evaluation of very large full-text databases
US6181935B1 (en) 1996-09-27 2001-01-30 Software.Com, Inc. Mobility extended telephone application programming interface and method of use
US5836771A (en) 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
US6665639B2 (en) 1996-12-06 2003-12-16 Sensory, Inc. Speech recognition in consumer electronic products
US6904110B2 (en) * 1997-07-31 2005-06-07 Francois Trans Channel equalization system and method
US5895466A (en) 1997-08-19 1999-04-20 At&T Corp Automated natural language understanding customer service system
US6404876B1 (en) 1997-09-25 2002-06-11 Gte Intelligent Network Services Incorporated System and method for voice activated dialing and routing under open access network control
DE69712485T2 (de) 1997-10-23 2002-12-12 Sony Int Europe Gmbh Sprachschnittstelle für ein Hausnetzwerk
US5970446A (en) * 1997-11-25 1999-10-19 At&T Corp Selective noise/channel/coding models and recognizers for automatic speech recognition
US6233559B1 (en) 1998-04-01 2001-05-15 Motorola, Inc. Speech control of multiple applications using applets
US6088731A (en) 1998-04-24 2000-07-11 Associative Computing, Inc. Intelligent assistant for use with a local computer and with the internet
US6144938A (en) 1998-05-01 2000-11-07 Sun Microsystems, Inc. Voice user interface with personality
US7711672B2 (en) 1998-05-28 2010-05-04 Lawrence Au Semantic network methods to disambiguate natural language meaning
US20070094222A1 (en) 1998-05-28 2007-04-26 Lawrence Au Method and system for using voice input for performing network functions
US6144958A (en) 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6434524B1 (en) 1998-09-09 2002-08-13 One Voice Technologies, Inc. Object interactive user interface using speech recognition and natural language processing
US6499013B1 (en) 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
US6792082B1 (en) 1998-09-11 2004-09-14 Comverse Ltd. Voice mail system with personal assistant provisioning
DE29825146U1 (de) 1998-09-11 2005-08-18 Püllen, Rainer Teilnehmereinheit und System für einen Multimediadienst
US6317831B1 (en) 1998-09-21 2001-11-13 Openwave Systems Inc. Method and apparatus for establishing a secure connection over a one-way data path
US7137126B1 (en) 1998-10-02 2006-11-14 International Business Machines Corporation Conversational computing via conversational virtual machine
GB9821969D0 (en) 1998-10-08 1998-12-02 Canon Kk Apparatus and method for processing natural language
US6928614B1 (en) 1998-10-13 2005-08-09 Visteon Global Technologies, Inc. Mobile office with speech recognition
US6453292B2 (en) 1998-10-28 2002-09-17 International Business Machines Corporation Command boundary identifier for conversational natural language
US6321092B1 (en) 1998-11-03 2001-11-20 Signal Soft Corporation Multiple input data management for wireless location-based applications
US6446076B1 (en) 1998-11-12 2002-09-03 Accenture Llp. Voice interactive web-based agent system responsive to a user location for prioritizing and formatting information
US6246981B1 (en) 1998-11-25 2001-06-12 International Business Machines Corporation Natural language task-oriented dialog manager and method
US7881936B2 (en) 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US6757718B1 (en) 1999-01-05 2004-06-29 Sri International Mobile navigation of network-based electronic information using spoken input
US6523061B1 (en) 1999-01-05 2003-02-18 Sri International, Inc. System, method, and article of manufacture for agent-based navigation in a speech-based data navigation system
US6851115B1 (en) 1999-01-05 2005-02-01 Sri International Software-based architecture for communication and cooperation among distributed electronic agents
US7036128B1 (en) 1999-01-05 2006-04-25 Sri International Offices Using a community of distributed electronic agents to support a highly mobile, ambient computing environment
US6513063B1 (en) 1999-01-05 2003-01-28 Sri International Accessing network-based electronic information through scripted online interfaces using spoken input
US6742021B1 (en) 1999-01-05 2004-05-25 Sri International, Inc. Navigating network-based electronic information using spoken input with multimodal error feedback
US7966078B2 (en) * 1999-02-01 2011-06-21 Steven Hoffberg Network media appliance system and method
US6928404B1 (en) 1999-03-17 2005-08-09 International Business Machines Corporation System and methods for acoustic and language modeling for automatic speech recognition with large vocabularies
US6647260B2 (en) 1999-04-09 2003-11-11 Openwave Systems Inc. Method and system facilitating web based provisioning of two-way mobile communications devices
US6598039B1 (en) 1999-06-08 2003-07-22 Albert-Inc. S.A. Natural language interface for searching database
US6421672B1 (en) 1999-07-27 2002-07-16 Verizon Services Corp. Apparatus for and method of disambiguation of directory listing searches utilizing multiple selectable secondary search keys
US6601026B2 (en) 1999-09-17 2003-07-29 Discern Communications, Inc. Information retrieval by natural language querying
US7020685B1 (en) 1999-10-08 2006-03-28 Openwave Systems Inc. Method and apparatus for providing internet content to SMS-based wireless devices
AU8030300A (en) 1999-10-19 2001-04-30 Sony Electronics Inc. Natural language interface control system
US6807574B1 (en) 1999-10-22 2004-10-19 Tellme Networks, Inc. Method and apparatus for content personalization over a telephone interface
JP2001125896A (ja) 1999-10-26 2001-05-11 Victor Co Of Japan Ltd 自然言語対話システム
US7310600B1 (en) 1999-10-28 2007-12-18 Canon Kabushiki Kaisha Language recognition using a similarity measure
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US6633846B1 (en) 1999-11-12 2003-10-14 Phoenix Solutions, Inc. Distributed realtime speech recognition system
US6615172B1 (en) 1999-11-12 2003-09-02 Phoenix Solutions, Inc. Intelligent query engine for processing voice based queries
US6665640B1 (en) 1999-11-12 2003-12-16 Phoenix Solutions, Inc. Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7050977B1 (en) 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US6532446B1 (en) 1999-11-24 2003-03-11 Openwave Systems Inc. Server based speech recognition user interface for wireless devices
US6526395B1 (en) 1999-12-31 2003-02-25 Intel Corporation Application of personality models and interaction with synthetic characters in a computing system
US6895558B1 (en) 2000-02-11 2005-05-17 Microsoft Corporation Multi-access mode electronic personal assistant
US6606388B1 (en) 2000-02-17 2003-08-12 Arboretum Systems, Inc. Method and system for enhancing audio signals
US6895380B2 (en) 2000-03-02 2005-05-17 Electro Standards Laboratories Voice actuation with contextual learning for intelligent machine control
US6466654B1 (en) 2000-03-06 2002-10-15 Avaya Technology Corp. Personal virtual assistant with semantic tagging
EP1275042A2 (en) 2000-03-06 2003-01-15 Kanisa Inc. A system and method for providing an intelligent multi-step dialog with a user
US6757362B1 (en) 2000-03-06 2004-06-29 Avaya Technology Corp. Personal virtual assistant
GB2366009B (en) 2000-03-22 2004-07-21 Canon Kk Natural language machine interface
US7177798B2 (en) 2000-04-07 2007-02-13 Rensselaer Polytechnic Institute Natural language interface using constrained intermediate dictionary of results
US6810379B1 (en) 2000-04-24 2004-10-26 Sensory, Inc. Client/server architecture for text-to-speech synthesis
US8463912B2 (en) * 2000-05-23 2013-06-11 Media Farm, Inc. Remote displays in mobile communication networks
US6691111B2 (en) 2000-06-30 2004-02-10 Research In Motion Limited System and method for implementing a natural language user interface
JP3949356B2 (ja) 2000-07-12 2007-07-25 三菱電機株式会社 音声対話システム
US7139709B2 (en) 2000-07-20 2006-11-21 Microsoft Corporation Middleware layer between speech related applications and engines
US20060143007A1 (en) 2000-07-24 2006-06-29 Koh V E User interaction with voice information services
JP2002041276A (ja) 2000-07-24 2002-02-08 Sony Corp 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体
US7092928B1 (en) 2000-07-31 2006-08-15 Quantum Leap Research, Inc. Intelligent portal engine
US6778951B1 (en) 2000-08-09 2004-08-17 Concerto Software, Inc. Information retrieval method with natural language interface
AU2001295080A1 (en) 2000-09-29 2002-04-08 Professorq, Inc. Natural-language voice-activated personal assistant
US7219058B1 (en) * 2000-10-13 2007-05-15 At&T Corp. System and method for processing speech recognition results
GB2386724A (en) * 2000-10-16 2003-09-24 Tangis Corp Dynamically determining appropriate computer interfaces
JP4244514B2 (ja) * 2000-10-23 2009-03-25 セイコーエプソン株式会社 音声認識方法および音声認識装置
US6832194B1 (en) 2000-10-26 2004-12-14 Sensory, Incorporated Audio recognition peripheral system
US7027974B1 (en) 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US20020072816A1 (en) * 2000-12-07 2002-06-13 Yoav Shdema Audio system
US7257537B2 (en) 2001-01-12 2007-08-14 International Business Machines Corporation Method and apparatus for performing dialog management in a computer conversational interface
US6964023B2 (en) 2001-02-05 2005-11-08 International Business Machines Corporation System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input
US7290039B1 (en) 2001-02-27 2007-10-30 Microsoft Corporation Intent based processing
US7216073B2 (en) 2001-03-13 2007-05-08 Intelligate, Ltd. Dynamic natural language understanding
US6996531B2 (en) 2001-03-30 2006-02-07 Comverse Ltd. Automated database assistance using a telephone for a speech based or text based multimedia communication mode
US7085722B2 (en) 2001-05-14 2006-08-01 Sony Computer Entertainment America Inc. System and method for menu-driven voice control of characters in a game environment
US20020194003A1 (en) 2001-06-05 2002-12-19 Mozer Todd F. Client-server security system and method
US7139722B2 (en) 2001-06-27 2006-11-21 Bellsouth Intellectual Property Corporation Location and time sensitive wireless calendaring
US6604059B2 (en) 2001-07-10 2003-08-05 Koninklijke Philips Electronics N.V. Predictive calendar
US20030033153A1 (en) 2001-08-08 2003-02-13 Apple Computer, Inc. Microphone elements for a computing system
US7987151B2 (en) 2001-08-10 2011-07-26 General Dynamics Advanced Info Systems, Inc. Apparatus and method for problem solving using intelligent agents
US6813491B1 (en) 2001-08-31 2004-11-02 Openwave Systems Inc. Method and apparatus for adapting settings of wireless communication devices in accordance with user proximity
US7403938B2 (en) 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
US6985865B1 (en) 2001-09-26 2006-01-10 Sprint Spectrum L.P. Method and system for enhanced response to voice commands in a voice command platform
US6650735B2 (en) 2001-09-27 2003-11-18 Microsoft Corporation Integrated voice access to a variety of personal information services
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
US7167832B2 (en) 2001-10-15 2007-01-23 At&T Corp. Method for dialog management
TW541517B (en) 2001-12-25 2003-07-11 Univ Nat Cheng Kung Speech recognition system
US7197460B1 (en) 2002-04-23 2007-03-27 At&T Corp. System for handling frequently asked questions in a natural language dialog service
US7546382B2 (en) 2002-05-28 2009-06-09 International Business Machines Corporation Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms
US7398209B2 (en) 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7299033B2 (en) 2002-06-28 2007-11-20 Openwave Systems Inc. Domain-based management of distribution of digital content from multiple suppliers to multiple wireless services subscribers
US7233790B2 (en) 2002-06-28 2007-06-19 Openwave Systems, Inc. Device capability based discovery, packaging and provisioning of content for wireless mobile devices
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
US8947347B2 (en) * 2003-08-27 2015-02-03 Sony Computer Entertainment Inc. Controlling actions in a video game unit
US7467087B1 (en) 2002-10-10 2008-12-16 Gillick Laurence S Training and using pronunciation guessers in speech recognition
WO2004047076A1 (ja) * 2002-11-21 2004-06-03 Matsushita Electric Industrial Co., Ltd. 標準モデル作成装置及び標準モデル作成方法
AU2003293071A1 (en) 2002-11-22 2004-06-18 Roy Rosser Autonomous response engine
US7684985B2 (en) 2002-12-10 2010-03-23 Richard Dominach Techniques for disambiguating speech input using multimodal interfaces
US7386449B2 (en) 2002-12-11 2008-06-10 Voice Enabling Systems Technology Inc. Knowledge-based flexible natural speech dialogue system
US7191127B2 (en) * 2002-12-23 2007-03-13 Motorola, Inc. System and method for speech enhancement
US7956766B2 (en) 2003-01-06 2011-06-07 Panasonic Corporation Apparatus operating system
US7529671B2 (en) 2003-03-04 2009-05-05 Microsoft Corporation Block synchronous decoding
US6980949B2 (en) 2003-03-14 2005-12-27 Sonum Technologies, Inc. Natural language processor
US7496498B2 (en) 2003-03-24 2009-02-24 Microsoft Corporation Front-end architecture for a multi-lingual text-to-speech system
US7519186B2 (en) * 2003-04-25 2009-04-14 Microsoft Corporation Noise reduction systems and methods for voice applications
US7200559B2 (en) 2003-05-29 2007-04-03 Microsoft Corporation Semantic object synchronous understanding implemented with speech application language tags
US7720683B1 (en) 2003-06-13 2010-05-18 Sensory, Inc. Method and apparatus of specifying and performing speech recognition operations
US7559026B2 (en) 2003-06-20 2009-07-07 Apple Inc. Video conferencing system having focus control
US7475010B2 (en) 2003-09-03 2009-01-06 Lingospot, Inc. Adaptive and scalable method for resolving natural language ambiguities
US7418392B1 (en) 2003-09-25 2008-08-26 Sensory, Inc. System and method for controlling the operation of a device by voice commands
WO2005041170A1 (en) 2003-10-24 2005-05-06 Nokia Corpration Noise-dependent postfiltering
DE602004016681D1 (de) 2003-12-05 2008-10-30 Kenwood Corp Audioeinrichtungs-steuereinrichtung, audioeinrichtungs-steuerverfahren und programm
WO2005059895A1 (en) 2003-12-16 2005-06-30 Loquendo S.P.A. Text-to-speech method and system, computer program product therefor
DE602004017955D1 (de) 2004-01-29 2009-01-08 Daimler Ag Verfahren und System zur Sprachdialogschnittstelle
US7693715B2 (en) 2004-03-10 2010-04-06 Microsoft Corporation Generating large units of graphonemes with mutual information criterion for letter to sound conversion
US7711129B2 (en) 2004-03-11 2010-05-04 Apple Inc. Method and system for approximating graphic equalizers using dynamic filter order reduction
US7409337B1 (en) 2004-03-30 2008-08-05 Microsoft Corporation Natural language processing interface
US7496512B2 (en) 2004-04-13 2009-02-24 Microsoft Corporation Refining of segmental boundaries in speech waveforms using contextual-dependent models
US7627461B2 (en) 2004-05-25 2009-12-01 Chevron U.S.A. Inc. Method for field scale production optimization by enhancing the allocation of well flow rates
US8095364B2 (en) 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7720674B2 (en) 2004-06-29 2010-05-18 Sap Ag Systems and methods for processing natural language queries
TWI252049B (en) 2004-07-23 2006-03-21 Inventec Corp Sound control system and method
US7725318B2 (en) 2004-07-30 2010-05-25 Nice Systems Inc. System and method for improving the accuracy of audio searching
US20060067535A1 (en) 2004-09-27 2006-03-30 Michael Culbert Method and system for automatically equalizing multiple loudspeakers
US20060067536A1 (en) 2004-09-27 2006-03-30 Michael Culbert Method and system for time synchronizing multiple loudspeakers
US7716056B2 (en) 2004-09-27 2010-05-11 Robert Bosch Corporation Method and system for interactive conversational dialogue for cognitively overloaded device users
US8107401B2 (en) 2004-09-30 2012-01-31 Avaya Inc. Method and apparatus for providing a virtual assistant to a communication participant
US7702500B2 (en) 2004-11-24 2010-04-20 Blaedow Karen R Method and apparatus for determining the meaning of natural language
US7376645B2 (en) 2004-11-29 2008-05-20 The Intellection Group, Inc. Multimodal natural language query system and architecture for processing voice and proximity-based queries
US8214214B2 (en) 2004-12-03 2012-07-03 Phoenix Solutions, Inc. Emotion detection device and method for use in distributed systems
US20060122834A1 (en) 2004-12-03 2006-06-08 Bennett Ian M Emotion detection device & method for use in distributed systems
US7636657B2 (en) 2004-12-09 2009-12-22 Microsoft Corporation Method and apparatus for automatic grammar generation from data entries
US7593782B2 (en) 2005-01-07 2009-09-22 Apple Inc. Highly portable media device
US7873654B2 (en) 2005-01-24 2011-01-18 The Intellection Group, Inc. Multimodal natural language query system for processing and analyzing voice and proximity-based queries
US7508373B2 (en) 2005-01-28 2009-03-24 Microsoft Corporation Form factor and input method for language input
GB0502259D0 (en) 2005-02-03 2005-03-09 British Telecomm Document searching tool and method
US7634413B1 (en) 2005-02-25 2009-12-15 Apple Inc. Bitrate constrained variable bitrate audio encoding
US7676026B1 (en) 2005-03-08 2010-03-09 Baxtech Asia Pte Ltd Desktop telephony system
US7925525B2 (en) 2005-03-25 2011-04-12 Microsoft Corporation Smart reminders
US7664558B2 (en) 2005-04-01 2010-02-16 Apple Inc. Efficient techniques for modifying audio playback rates
KR100586556B1 (ko) 2005-04-01 2006-06-08 주식회사 하이닉스반도체 반도체 장치의 프리차지 전압공급회로
US7627481B1 (en) 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
WO2006129967A1 (en) 2005-05-30 2006-12-07 Daumsoft, Inc. Conversation system and method using conversational agent
US8041570B2 (en) 2005-05-31 2011-10-18 Robert Bosch Corporation Dialogue management using scripts
US8300841B2 (en) 2005-06-03 2012-10-30 Apple Inc. Techniques for presenting sound effects on a portable media player
US8024195B2 (en) 2005-06-27 2011-09-20 Sensory, Inc. Systems and methods of performing speech recognition using historical information
US7826945B2 (en) 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
US7613264B2 (en) 2005-07-26 2009-11-03 Lsi Corporation Flexible sampling-rate encoder
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US20070073726A1 (en) 2005-08-05 2007-03-29 Klein Eric N Jr System and method for queuing purchase transactions
US7620549B2 (en) 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
US8265939B2 (en) 2005-08-31 2012-09-11 Nuance Communications, Inc. Hierarchical methods and apparatus for extracting user intent from spoken utterances
US7634409B2 (en) 2005-08-31 2009-12-15 Voicebox Technologies, Inc. Dynamic speech sharpening
WO2007028128A2 (en) * 2005-09-01 2007-03-08 Vishal Dhawan Voice application network platform
EP1760696B1 (en) * 2005-09-03 2016-02-03 GN ReSound A/S Method and apparatus for improved estimation of non-stationary noise for speech enhancement
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7930168B2 (en) 2005-10-04 2011-04-19 Robert Bosch Gmbh Natural language processing of disfluent sentences
US20070083467A1 (en) 2005-10-10 2007-04-12 Apple Computer, Inc. Partial encryption techniques for media data
US8620667B2 (en) 2005-10-17 2013-12-31 Microsoft Corporation Flexible speech-activated command and control
US7707032B2 (en) 2005-10-20 2010-04-27 National Cheng Kung University Method and system for matching speech data
US20070185926A1 (en) 2005-11-28 2007-08-09 Anand Prahlad Systems and methods for classifying and transferring information in a storage network
KR100810500B1 (ko) 2005-12-08 2008-03-07 한국전자통신연구원 대화형 음성 인터페이스 시스템에서의 사용자 편의성증대 방법
DE102005061365A1 (de) 2005-12-21 2007-06-28 Siemens Ag Verfahren zur Ansteuerung zumindest einer ersten und zweiten Hintergrundapplikation über ein universelles Sprachdialogsystem
US7599918B2 (en) 2005-12-29 2009-10-06 Microsoft Corporation Dynamic search with implicit user intention mining
US7673238B2 (en) 2006-01-05 2010-03-02 Apple Inc. Portable media device with video acceleration capabilities
US20070174188A1 (en) 2006-01-25 2007-07-26 Fish Robert D Electronic marketplace that facilitates transactions between consolidated buyers and/or sellers
IL174107A0 (en) 2006-02-01 2006-08-01 Grois Dan Method and system for advertising by means of a search engine over a data network
KR100764174B1 (ko) 2006-03-03 2007-10-08 삼성전자주식회사 음성 대화 서비스 장치 및 방법
US7752152B2 (en) 2006-03-17 2010-07-06 Microsoft Corporation Using predictive user models for language modeling on a personal device with user behavior models based on statistical modeling
JP4734155B2 (ja) 2006-03-24 2011-07-27 株式会社東芝 音声認識装置、音声認識方法および音声認識プログラム
US7707027B2 (en) 2006-04-13 2010-04-27 Nuance Communications, Inc. Identification and rejection of meaningless input during natural language classification
US8423347B2 (en) 2006-06-06 2013-04-16 Microsoft Corporation Natural language personal information management
US7483894B2 (en) 2006-06-07 2009-01-27 Platformation Technologies, Inc Methods and apparatus for entity search
US20100257160A1 (en) 2006-06-07 2010-10-07 Yu Cao Methods & apparatus for searching with awareness of different types of information
US7523108B2 (en) 2006-06-07 2009-04-21 Platformation, Inc. Methods and apparatus for searching with awareness of geography and languages
US20070291108A1 (en) * 2006-06-16 2007-12-20 Ericsson, Inc. Conference layout control and control protocol
US20070294263A1 (en) * 2006-06-16 2007-12-20 Ericsson, Inc. Associating independent multimedia sources into a conference call
KR100776800B1 (ko) 2006-06-16 2007-11-19 한국전자통신연구원 지능형 가제트를 이용한 맞춤형 서비스 제공 방법 및시스템
US7548895B2 (en) 2006-06-30 2009-06-16 Microsoft Corporation Communication-prompted user assistance
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8036766B2 (en) 2006-09-11 2011-10-11 Apple Inc. Intelligent audio mixing among media playback and at least one other non-playback application
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US20080129520A1 (en) 2006-12-01 2008-06-05 Apple Computer, Inc. Electronic device with enhanced audio feedback
US8493330B2 (en) 2007-01-03 2013-07-23 Apple Inc. Individual channel phase delay scheme
KR100883657B1 (ko) 2007-01-26 2009-02-18 삼성전자주식회사 음성 인식 기반의 음악 검색 방법 및 장치
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US7822608B2 (en) 2007-02-27 2010-10-26 Nuance Communications, Inc. Disambiguating a speech recognition grammar in a multimodal application
US7801729B2 (en) 2007-03-13 2010-09-21 Sensory, Inc. Using multiple attributes to create a voice search playlist
US8219406B2 (en) 2007-03-15 2012-07-10 Microsoft Corporation Speech-centric multimodal user interface design in mobile technology
JP2008236448A (ja) 2007-03-22 2008-10-02 Clarion Co Ltd 音声信号処理装置、ハンズフリー通話装置、音声信号処理方法および制御プログラム
JP2008271481A (ja) * 2007-03-27 2008-11-06 Brother Ind Ltd 電話装置
US7809610B2 (en) 2007-04-09 2010-10-05 Platformation, Inc. Methods and apparatus for freshness and completeness of information
US20080253577A1 (en) 2007-04-13 2008-10-16 Apple Inc. Multi-channel sound panner
US7983915B2 (en) 2007-04-30 2011-07-19 Sonic Foundry, Inc. Audio content search engine
US8055708B2 (en) 2007-06-01 2011-11-08 Microsoft Corporation Multimedia spaces
US8204238B2 (en) 2007-06-08 2012-06-19 Sensory, Inc Systems and methods of sonic communication
KR20080109322A (ko) 2007-06-12 2008-12-17 엘지전자 주식회사 사용자의 직관적 의도 파악에 따른 서비스 제공 방법 및장치
US8190627B2 (en) 2007-06-28 2012-05-29 Microsoft Corporation Machine assisted query formulation
US8041438B2 (en) 2007-06-28 2011-10-18 Apple Inc. Data-driven media management within an electronic device
US7861008B2 (en) 2007-06-28 2010-12-28 Apple Inc. Media management and routing within an electronic device
US9794605B2 (en) 2007-06-28 2017-10-17 Apple Inc. Using time-stamped event entries to facilitate synchronizing data streams
US9632561B2 (en) 2007-06-28 2017-04-25 Apple Inc. Power-gating media decoders to reduce power consumption
US8019606B2 (en) 2007-06-29 2011-09-13 Microsoft Corporation Identification and selection of a software application via speech
US8306235B2 (en) 2007-07-17 2012-11-06 Apple Inc. Method and apparatus for using a sound sensor to adjust the audio output for a device
JP2009036999A (ja) 2007-08-01 2009-02-19 Infocom Corp コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体
US8190359B2 (en) 2007-08-31 2012-05-29 Proxpro, Inc. Situation-aware personal information management for a mobile device
US8683197B2 (en) 2007-09-04 2014-03-25 Apple Inc. Method and apparatus for providing seamless resumption of video playback
US20090058823A1 (en) 2007-09-04 2009-03-05 Apple Inc. Virtual Keyboards in Multi-Language Environment
KR100920267B1 (ko) 2007-09-17 2009-10-05 한국전자통신연구원 음성 대화 분석 시스템 및 그 방법
US8706476B2 (en) 2007-09-18 2014-04-22 Ariadne Genomics, Inc. Natural language processing method by analyzing primitive sentences, logical clauses, clause types and verbal blocks
US8069051B2 (en) 2007-09-25 2011-11-29 Apple Inc. Zero-gap playback using predictive mixing
US8515095B2 (en) 2007-10-04 2013-08-20 Apple Inc. Reducing annoyance by managing the acoustic noise produced by a device
US8462959B2 (en) 2007-10-04 2013-06-11 Apple Inc. Managing acoustic noise produced by a device
US8165886B1 (en) 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US8036901B2 (en) 2007-10-05 2011-10-11 Sensory, Incorporated Systems and methods of performing speech recognition using sensory inputs of human position
US20090112677A1 (en) 2007-10-24 2009-04-30 Rhett Randolph L Method for automatically developing suggested optimal work schedules from unsorted group and individual task lists
US7840447B2 (en) 2007-10-30 2010-11-23 Leonard Kleinrock Pricing and auctioning of bundled items among multiple sellers and buyers
US7983997B2 (en) 2007-11-02 2011-07-19 Florida Institute For Human And Machine Cognition, Inc. Interactive complex task teaching system that allows for natural language input, recognizes a user's intent, and automatically performs tasks in document object model (DOM) nodes
US8112280B2 (en) 2007-11-19 2012-02-07 Sensory, Inc. Systems and methods of performing speech recognition with barge-in for use in a bluetooth system
US7805286B2 (en) * 2007-11-30 2010-09-28 Bose Corporation System and method for sound system simulation
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US8219407B1 (en) 2007-12-27 2012-07-10 Great Northern Research, LLC Method for processing the output of a speech recognizer
US8138896B2 (en) 2007-12-31 2012-03-20 Apple Inc. Tactile feedback in an electronic device
KR101334066B1 (ko) 2008-02-11 2013-11-29 이점식 진화하는 사이버 로봇 시스템 및 그 제공 방법
US8099289B2 (en) 2008-02-13 2012-01-17 Sensory, Inc. Voice interface and search for electronic devices including bluetooth headsets and remote systems
EP2243303A1 (en) * 2008-02-20 2010-10-27 Koninklijke Philips Electronics N.V. Audio device and method of operation therefor
US20090253457A1 (en) 2008-04-04 2009-10-08 Apple Inc. Audio signal processing for certification enhancement in a handheld wireless communications device
US8121837B2 (en) * 2008-04-24 2012-02-21 Nuance Communications, Inc. Adjusting a speech engine for a mobile computing device based on background noise
US8082148B2 (en) * 2008-04-24 2011-12-20 Nuance Communications, Inc. Testing a grammar used in speech recognition for reliability in a plurality of operating environments having different background noise
US8285344B2 (en) 2008-05-21 2012-10-09 DP Technlogies, Inc. Method and apparatus for adjusting audio for a user environment
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8423288B2 (en) 2009-11-30 2013-04-16 Apple Inc. Dynamic alerts for calendar events
US8166019B1 (en) 2008-07-21 2012-04-24 Sprint Communications Company L.P. Providing suggested actions in response to textual communications
US8041848B2 (en) 2008-08-04 2011-10-18 Apple Inc. Media processing method and device
US8098262B2 (en) 2008-09-05 2012-01-17 Apple Inc. Arbitrary fractional pixel movement
US8380959B2 (en) 2008-09-05 2013-02-19 Apple Inc. Memory management system and method
US20100063825A1 (en) 2008-09-05 2010-03-11 Apple Inc. Systems and Methods for Memory Management and Crossfading in an Electronic Device
US9077526B2 (en) 2008-09-30 2015-07-07 Apple Inc. Method and system for ensuring sequential playback of digital media
US8401178B2 (en) 2008-09-30 2013-03-19 Apple Inc. Multiple microphone switching and configuration
US9200913B2 (en) 2008-10-07 2015-12-01 Telecommunication Systems, Inc. User interface for predictive traffic
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
JP5911796B2 (ja) 2009-04-30 2016-04-27 サムスン エレクトロニクス カンパニー リミテッド マルチモーダル情報を用いるユーザ意図推論装置及び方法
KR101581883B1 (ko) 2009-04-30 2016-01-11 삼성전자주식회사 모션 정보를 이용하는 음성 검출 장치 및 방법
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
KR101562792B1 (ko) 2009-06-10 2015-10-23 삼성전자주식회사 목표 예측 인터페이스 제공 장치 및 그 방법
US8527278B2 (en) 2009-06-29 2013-09-03 Abraham Ben David Intelligent home automation
US8321527B2 (en) 2009-09-10 2012-11-27 Tribal Brands System and method for tracking user location and associated activity and responsively providing mobile device updates
KR20110036385A (ko) 2009-10-01 2011-04-07 삼성전자주식회사 사용자 의도 분석 장치 및 방법
US20110099507A1 (en) 2009-10-28 2011-04-28 Google Inc. Displaying a collection of interactive elements that trigger actions directed to an item
US9197736B2 (en) 2009-12-31 2015-11-24 Digimarc Corporation Intuitive computing methods and systems
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
WO2011059997A1 (en) 2009-11-10 2011-05-19 Voicebox Technologies, Inc. System and method for providing a natural language content dedication service
US8712759B2 (en) 2009-11-13 2014-04-29 Clausal Computing Oy Specializing disambiguation of a natural language expression
KR101960835B1 (ko) 2009-11-24 2019-03-21 삼성전자주식회사 대화 로봇을 이용한 일정 관리 시스템 및 그 방법
US8396888B2 (en) 2009-12-04 2013-03-12 Google Inc. Location-based searching using a search area that corresponds to a geographical location of a computing device
KR101622111B1 (ko) 2009-12-11 2016-05-18 삼성전자 주식회사 대화 시스템 및 그의 대화 방법
US8494852B2 (en) 2010-01-05 2013-07-23 Google Inc. Word-level correction of speech input
US8334842B2 (en) 2010-01-15 2012-12-18 Microsoft Corporation Recognizing user intent in motion capture system
US8626511B2 (en) 2010-01-22 2014-01-07 Google Inc. Multi-dimensional disambiguation of voice commands
US20110218855A1 (en) 2010-03-03 2011-09-08 Platformation, Inc. Offering Promotions Based on Query Analysis
KR101369810B1 (ko) 2010-04-09 2014-03-05 이초강 로봇을 위한 경험적 상황인식 방법을 실행하는 프로그램을 기록한 컴퓨터 판독가능한 기록 매체.
US8265928B2 (en) 2010-04-14 2012-09-11 Google Inc. Geotagged environmental audio for enhanced speech recognition accuracy
US20110279368A1 (en) 2010-05-12 2011-11-17 Microsoft Corporation Inferring user intent to engage a motion capture system
US8694313B2 (en) 2010-05-19 2014-04-08 Google Inc. Disambiguation of contact information using historical data
US8522283B2 (en) 2010-05-20 2013-08-27 Google Inc. Television remote control data transfer
US8468012B2 (en) 2010-05-26 2013-06-18 Google Inc. Acoustic model adaptation using geographic information
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
US20110306426A1 (en) 2010-06-10 2011-12-15 Microsoft Corporation Activity Participation Based On User Intent
US8234111B2 (en) 2010-06-14 2012-07-31 Google Inc. Speech and noise models for speech recognition
US8411874B2 (en) 2010-06-30 2013-04-02 Google Inc. Removing noise from audio
US8775156B2 (en) 2010-08-05 2014-07-08 Google Inc. Translating languages in response to device motion
US8359020B2 (en) 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
US8473289B2 (en) 2010-08-06 2013-06-25 Google Inc. Disambiguating input based on context
JP2014520297A (ja) 2011-04-25 2014-08-21 ベベオ,インク. 高度な個人的時刻表アシスタントのためのシステムよび方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0558312A1 (en) * 1992-02-27 1993-09-01 Central Institute For The Deaf Adaptive noise reduction circuit for a sound reproduction system
US6463128B1 (en) * 1999-09-29 2002-10-08 Denso Corporation Adjustable coding detection in a portable telephone
CN1640191A (zh) * 2002-07-12 2005-07-13 唯听助听器公司 助听器和提高语言清晰度的方法
US20060282264A1 (en) * 2005-06-09 2006-12-14 Bellsouth Intellectual Property Corporation Methods and systems for providing noise filtering using speech recognition
US20080165980A1 (en) * 2007-01-04 2008-07-10 Sound Id Personalized sound system hearing profile selection process

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014161299A1 (zh) * 2013-08-15 2014-10-09 中兴通讯股份有限公司 一种语音质量处理的方法及装置
CN103594092A (zh) * 2013-11-25 2014-02-19 广东欧珀移动通信有限公司 一种单麦克风语音降噪方法和装置
CN106062661A (zh) * 2014-03-31 2016-10-26 英特尔公司 用于常开常听的语音识别系统的位置感知功率管理方案
US10133332B2 (en) 2014-03-31 2018-11-20 Intel Corporation Location aware power management scheme for always-on-always-listen voice recognition system
CN106165383A (zh) * 2014-05-12 2016-11-23 英特尔公司 远端上下文相关的预处理
CN106878533A (zh) * 2015-12-10 2017-06-20 北京奇虎科技有限公司 一种移动终端的通信方法和装置
CN106453760A (zh) * 2016-10-11 2017-02-22 努比亚技术有限公司 一种改善环境噪声的方法及终端
CN109905794A (zh) * 2019-03-06 2019-06-18 中国人民解放军联勤保障部队第九八八医院 基于战场应用的自适应智能化防护耳塞的数据分析系统
WO2021093380A1 (zh) * 2019-11-13 2021-05-20 苏宁云计算有限公司 一种噪声处理方法、装置、系统
CN111986689A (zh) * 2020-07-30 2020-11-24 维沃移动通信有限公司 音频播放方法、音频播放装置和电子设备
WO2022022536A1 (zh) * 2020-07-30 2022-02-03 维沃移动通信有限公司 音频播放方法、音频播放装置和电子设备

Also Published As

Publication number Publication date
AU2011261756B2 (en) 2014-09-04
AU2011261756A1 (en) 2012-11-01
US20110300806A1 (en) 2011-12-08
KR20130012073A (ko) 2013-01-31
EP2577658B1 (en) 2016-11-02
WO2011152993A1 (en) 2011-12-08
US10446167B2 (en) 2019-10-15
KR101520162B1 (ko) 2015-05-13
JP2013527499A (ja) 2013-06-27
US8639516B2 (en) 2014-01-28
EP2577658A1 (en) 2013-04-10
US20140142935A1 (en) 2014-05-22
CN102859592B (zh) 2014-08-13

Similar Documents

Publication Publication Date Title
CN102859592B (zh) 用于语音质量改进的用户特定的噪声抑制
CN103945062B (zh) 一种用户终端的音量调节方法、装置及终端
CN108605073B (zh) 声音信号处理的方法、终端和耳机
CN108449493B (zh) 语音通话数据处理方法、装置、存储介质及移动终端
CN107509153B (zh) 声音播放器件的检测方法、装置、存储介质及终端
CN101569093A (zh) 响应于不同的噪声环境经由用户优选的音频设置来动态地获悉用户的响应
US20090323925A1 (en) System and Method for Telephone Based Noise Cancellation
CN103886731B (zh) 一种噪声控制方法及设备
CN103886857B (zh) 一种噪声控制方法及设备
CN107580113A (zh) 提示方法、装置、存储介质及终端
CN105280195A (zh) 语音信号的处理方法及装置
CN108172237B (zh) 语音通话数据处理方法、装置、存储介质及移动终端
CN108449503B (zh) 语音通话数据处理方法、装置、存储介质及移动终端
CN108449506A (zh) 语音通话数据处理方法、装置、存储介质及移动终端
CN108418968B (zh) 语音通话数据处理方法、装置、存储介质及移动终端
CN108512625A (zh) 摄像头的抗干扰方法、移动终端及存储介质
CN108449499B (zh) 语音通话数据处理方法、装置、存储介质及移动终端
US20080255827A1 (en) Voice Conversion Training and Data Collection
CN108449497A (zh) 语音通话数据处理方法、装置、存储介质及移动终端
CN108449492B (zh) 语音通话数据处理方法、装置、存储介质及移动终端
JP2007512767A (ja) 雑音信号の音響計測基準に基づき呼出信号を生成する方法及びデバイス
CN110489571A (zh) 音频处理方法和装置、电子设备、计算机可读存储介质
US20210110838A1 (en) Acoustic aware voice user interface
CN108449498B (zh) 语音通话数据处理方法、装置、存储介质及移动终端
CN108449501B (zh) 语音通话数据处理方法、装置、存储介质及移动终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant