CN1531692B - 用于处理大量字符的高效整理元素结构 - Google Patents

用于处理大量字符的高效整理元素结构 Download PDF

Info

Publication number
CN1531692B
CN1531692B CN02809865.XA CN02809865A CN1531692B CN 1531692 B CN1531692 B CN 1531692B CN 02809865 A CN02809865 A CN 02809865A CN 1531692 B CN1531692 B CN 1531692B
Authority
CN
China
Prior art keywords
weighted value
value
character
arrangement element
weighting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN02809865.XA
Other languages
English (en)
Other versions
CN1531692A (zh
Inventor
C-L·何
J·杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oracle America Inc
Original Assignee
Oracle America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oracle America Inc filed Critical Oracle America Inc
Publication of CN1531692A publication Critical patent/CN1531692A/zh
Application granted granted Critical
Publication of CN1531692B publication Critical patent/CN1531692B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/02Comparing digital values
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
    • G06F7/24Sorting, i.e. extracting data from one or more carriers, rearranging the data in numerical or other ordered sequence, and rerecording the sorted data on the original carrier or on a different carrier or set of carriers sorting methods in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2207/00Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F2207/02Indexing scheme relating to groups G06F7/02 - G06F7/026
    • G06F2207/025String search, i.e. pattern matching, e.g. find identical word or best match in a string
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting

Abstract

本发明的一个实施例提供了一个便于使用可支持大量字符的整理元素的系统。该系统接收整理元素并且从整理元素内的第一加权字段中读取第一加权值。如果第一加权值属于预定的一组值,那么系统从整理元素内的第二加权字段和第三加权字段中读取第一加权值的附加部分。另一方面,如果第一加权值不在预定的一组值内,那么系统从第二加权字段中读取第二加权值,并且从第三加权字段中读取第三加权值。

Description

用于处理大量字符的高效整理元素结构
背景
技术领域
本发明涉及对数据库系统中的数据进行索引和分类的处理。更具体地说,本发明涉及一种可提供一种高效整理元素结构从而对大量字符的分类权值进行编码的方法和设备。
背景技术
在开发数据库系统的过程中所面临的一个挑战就是要支持不同语言的分类。例如,一些数据库允许日本客户将分类方法指定为“日语”,而法国客户将分类方法指定为“法语”。然而,随着互联网技术的全球应用,对于公司而言,为其软件提供多种语言能力以便拓展其全球性的业务变得越来越重要。
因为存储在数据库中的数据越来越多语言变化,因此数据库用户对使用一种适用于大多数语言的分类法越来越感兴趣。
不幸的是,在多种语言的分类中存在成千上万的不同字符,这导致了在执行多种语言的分类过程中所涉及的数据结构耗用大量的内存。此外,在不降低性能的情况下很难压缩这些数据结构。
通常通过将字符串转换成相应的整理元素串(这些串也被称为分类关键字)、然后比较这些整理元素串以执行分类操作从而实现了多种语言的分类。该转换处理通常是通过查找整理加权表中的字符而完成的,该整理加权表包含有每个字符的相应整理加权值。
统一码学术学会(Unicode Consortium)发布的第10号统一码技术报告(Unicode Technical Report No.10)规定了整理元素结构,该结构包括16位第一加权值以及其后的8位第二加权值及8位第三加权值。第一加权值标识一字符,同时第二加权值规定了该字符的重音,而第三加权值规定了该字符的格信息(并且可能与标点有关)。例如,第一加权值可能规定一字符是“a”,同时第二加权值规定该字符具有一重音而第三加权值规定该字符是大写字母
Figure B02809865XD00022
值得注意的是比较功能通常是首先对第一加权值进行比较。如果第一加权值匹配,那么比较功能比较第二加权值。如果第一和第二加权值均匹配,则比较功能比较第三加权值。
值得注意的是第10号统一码技术报告所规定的16位第一加权值仅可编码65,536个不同字符。然而,提供65,536个以字符已变得必要。这可以通过将第一加权值的大小增加到32位(4字节)而实现。然而,将第一加权值的大小从16位增加到32位有下述几个缺点:(1)需要更多的内存来建立语言索引以支持32位的第一加权值;(2)对语言索引的访问时间增加了;(3)需要更多的内存来存储整理元素串;以及(4)需要更多的计算操作来对分类关键字进行比较。
需要有这样一咱方法和设备,其运用可对大量字符进行处理的高效整理元素结构,而不会存在上述问题。
发明内容
本发明的一个实施例提出了一个便于运用可支持大量字符的整理元素的系统。该系统通过接收整理元素并从整理元素内的第一加权字段中读取第一加权值而工作。如果第一加权值属于一组预定值,则该系统从整理元素内的第二加权字段和第三加权字段中读取第一加权值的附加部分。另一方面,如果第一加权值不在该组预定值内,那么该系统从第二加权字段中读取第二加权值,并且从第三加权字段内读取第三加权值。
在本发明的一个实施例中,如果第一加权值属于一组预定值,那么系统将第二加权值设置为第二缺省值,并且将第三加权值设置为第三缺省值。
在本发明的一个实施例中,整理元素遵守统一的字符编码标准。
在本发明的一个实施例中,第一加权值标识一字符。另外,第二加权值规定该字符的重音,并且第三加权值规定该字符的格信息。
在本发明的一个实施例中,除非第一加权字段内的值属于预定的一组值,在此情况下第一加权字段占据了整理元素的所有4个字节,否则的话,整理元素的大小是4个字节,其中第一加权字段是2个字节,第二加权字段是1个字节且第三加权字段是1个字节。
在本发明的一个实施例中,第一加权值的该组预定值包括16进制值0xFFF0-0xFFFF。
在本发明的一个实施例中,整理元素取自一整理加权表,该表用于将字符映射到整理加权值以便建立字符串间的次序。
在该实施例的一种变化形式中,所述系统通过读取字符串中的每个字符并从整理加权表中查找每个字符的相应整理元素而为一字符串另外构造了一分类关键字。该系统随后将每个字符的相应整理元素添加到该分类关键字上。值得注意的是如果该分类关键字与一个数据库中的某一记录相关,那么该分类关键字可以用于构造该数据库的语言索引。
附图说明
图1给出了根据本发明一实施例的具有一数据库的计算机系统;
图2给出了根据本发明一实施例的整理元素的可选结构;
图3A说明如何根据本发明一实施例来生成分类关键字;
图3B是一个流程图,说明根据本发明一实施例来生成分类关键字的过程;
图4是一个流程图,说明根据本发明一实施例来读取一整理元素的过程。
具体实施方式
下述说明可使任何本领域技术人员制作并使用本发明,并在这方面提供了一种特定应用及其要求。对于本领域技术人员来说对于所公开的实施例做出各种修改将显而易见,并且在不脱离本发明精神和范围的情况下,这里所说明的一般原理适用于其他实施例和应用。因此,本发明将并不局限于所示实施例,而是适合与这里所公开的原理及特征相一致的最宽范围。
在下述说明中所描述的数据结构和代码通常存储在计算机可读介质中,该计算机可读介质可以是任一种计算机系统所使用的可存储代码和/或数据的设备或介质。这包括但是并不局限于诸如磁盘驱动器、磁带、CDs(高密度磁盘)及DVDs(数字化视频光盘)以及包含在传输介质中的计算机指令信号(利用或未利用载波来对信号进行调制)。例如,传输介质可以包括诸如互联网这样的通信网。
计算机系统
图1给出了根据本发明一实施例的计算机系统102,其具有数据库104。计算机系统102通常可包括任一类型的计算机系统,此任一类型的计算机系统包括但是并不局限于基于微处理器的计算机系统、大型机、数字信号处理器、便携式计算机、个人管理器、设备控制器、以及设备内的计算引擎。
数据库104可包括将数据存储在非易失性存储器中的任一类系统。这又包括但不局限于基于磁、光、及磁光存储装置的系统以及基于闪速存储器和/或后备电池存储器的存储装置。数据库104包括一个由记录集的集合所组成的数据文件106,该记录集是按照插入顺序存储的。数据文件106可通过诸如索引108的一个或多个索引加以引用,该索引108规定了记录在数据文件106中的顺序。这种顺序通常是通过对数据文件106中的相关目标栏进行分类而确定的。为使该分类满足某一特定的语言分类次序,首先通过查找整理加权表110中的字符而将该目标栏中的每个字符串转换成分类关键字。值得注意的是,整理加权表110仅仅是包含有每个可能字符的整理元素的一个数组。
整理元素的结构
图2给出了根据本发明一实施例的整理元素204的可选结构。如图2所示,整理元素204通过查找整理加权表110而产生。
在所示的实施例中,整理元素204占用了数据的4个字节,并且可具有两种格式中的一种。在第一种格式中,整理元素204的头两个字节包含第一加权字段206,同时第三字节包含第二加权字段208并且第四字节包含第三加权字段210。
在第二种格式中,整理元素204的头两个字节包含范围为0xFFF0-0xFFFF的预定值。该预定值表面整理元素204的第三和第四字节包含第一加权字段的扩展部分而不是第二和第三加权值。在这种情况下,将第二和第三加权值设置为缺省值。
值得注意的是第二种格式支持超过1,000,000个不同的字符,这是因为在整理元素204的第一和第二字节中,16个可能的数值0xFFF0-0xFFF中的每一个均与整理元素204的第三和第四字节中的16位或者说65,536个可能数值相对应。
还应该注意的是可将第二和第三加权值设置为缺省值,这是因为标识符大于65,536的新字符是中日韩(CJK)字符,主要是Han和Hangul Jamo字符,而在Han/Hangul Jamo字符之间不存在重音和格的差异。此外,即使在亚洲远东地区,人们也总是将基于拉丁语系的字母和数字符号排列在CJK字符之前。
生成分类关键字
图3A图示了怎样根据本发明一实施例来生成分类关键字。在图3A中,通过在整理加权表110中查找单个字符而逐字符地将字符串302转换成包括由分类关键字304构成的整理元素(加权)串。
图3B给出了根据本发明一实施例来生成分类关键字304的处理流程图。对于字符串302中的每个字符202而言,系统读取字符202(步骤306),并在整理加权表中查找字符202的整理元素204(步骤308)。此后系统将整理元素204添加到分类关键字304上(步骤310)。
读取整理元素
图4给出了根据本发明一实施例来读取一整理元素的处理流程图。在分类处理或需要在分类关键字之间进行比较的某种其他操作过程中,该系统开始接收整理元素204(步骤402)。接下来,系统确定整理元素204的头两个(较高序位)字节是否包含一个大于或等于0xFFF0的预定值(步骤404)。如果是,系统即使第一加权值占用整理元素204的所有四个字节,并且将第二和第三加权值设置为缺省值(步骤406)。
如果整理元素204的头两个字节不包含预定值,则系统将第一加权值设定为整理元素204的第一和第二字节。这是通过将整理元素204向右移动16位并随后将留存的两个字节作为第一加权值而实现的。接下来,将整理元素204的第三字节(次于最低序位)取作第二加权值。这是通过将整理元素204向右移动8位并将留存字的最低序位字节作为第二加权值而实现的。最后,将整理元素204的第四字节(最低序位)取作第三加权值(步骤408)。
对本发明实施例的以上描述仅仅是为了说明和描述的目的。它们并不是详尽的或是要将本发明局限于这里所公开的形式。因此,本领域熟练技术人员很显然可做出多种修改和变化。此外,上述所公开的内容并不仅限于本发明。本发明的范围是由所附权利要求来确定的。

Claims (12)

1.一种使用整理元素的方法,所述整理元素支持存储在存储设备中的多个字符,所述方法包括:
接收和所述多个字符相关的所述整理元素;
从所述整理元素内的第一加权字段中读取第一加权值;
如果第一加权值属于预定的一组值,那么从所述整理元素内的第二加权字段和第三加权字段中读取第一加权值的附加部分,将第二加权值设置为第二二缺省值以及将第三加权值设置为第三缺省值;并且
如果第一加权值不在所述预定的一组值内,那么从所述整理元素内的第二加权字段中读取第二加权值,并且从所述整理元素内的第三加权字段中读取第三加权值;
其中如果第一加权字段内的值属于所述预定的一组值,那么第一加权字段占据所述整理元素的所有4个字节,否则的话,所述整理元素的大小是4个字节,其中第一加权字段是2个字节,第二加权字段是1个字节而且第三加权字段是1个字节;以及
其中第一加权值标识一字符;第二加权值规定该字符的重音;第三加权值规定该字符的格信息。
2.根据权利要求1的方法,其中所述整理元素的结构遵守第10号统一码技术报告的规定。
3.根据权利要求1的方法,其中对于第一加权值,所述预定的一组值包括16进位数值0xFFF0-0xFFFF。
4.根据权利要求1的方法,其中所述整理元素取自一整理加权表,该表用于将字符映射到整理加权值以便建立字符串间的次序。
5.根据权利要求4的方法,其进一步包括通过下列步骤来为一字符串构造一分类关键字:
读取该字符串中的每个字符;
从所述整理加权表中查找每个字符的相应整理元素;并且
将所述每个字符的相应整理元素添加到所述分类关键字上。
6.根据权利要求5的方法,
其中所述分类关键字与一数据库中的记录相关;并且
其中所述分类关键字被用于构造所述数据库的语言索引。
7.一种使用整理元素的设备,所述整理元素支持存储在存储设备中的多个字符,所述设备包括:
一接收装置,用于接收和所述多个字符相关的所述整理元素;
一分配装置,用于从所述整理元素内的第一加权字段中读取第一加权值;
其中如果第一加权值属于预定的一组值,那么所述分配装置被设定为从所述整理元素内的第二加权字段和第三加权字段中读取第一加权值的附加部分,将第二加权值设置为第二缺省值以及将第三加权值设置为第三缺省值;并且
其中如果第一加权值不在所述预定的一组值内,那么所述分配装置被设定为从所述整理元素内的第二加权字段中读取第二加权值,并且从所述整理元素内的第三加权字段中读取第三加权值;
其中如果第一加权字段内的值属于所述预定的一组值,那么第一加权字段占据所述整理元素的所有4个字节,否则的话,所述整理元素的大小是4个字节,其中第一加权字段是2个字节,第二加权字段是1个字节而且第三加权字段是1个字节;以及
其中第一加权值标识一字符;第二加权值规定该字符的重音;第三加权值规定该字符的格信息。
8.根据权利要求7的设备,其中所述整理元素的结构遵守第10号统一码技术报告的规定。
9.根据权利要求7的设备,其中对于第一加权值,所述一组预定值包括16进位数值0xFFF0-0xFFFF。
10.根据权利要求7的设备,其中所述整理元素取自一整理加权表,该表用于将字符映射到整理加权值以便建立字符串间的顺序。
11.根据权利要求10的设备,其进一步包括一关键字构造装置,用以为一字符串构造一分类关键字,其中该关键字构造装置被设定为:
读取该字符串中的每个字符;
从所述整理加权表中查找每个字符的相应整理元素;并且
将所述每个字符的相应整理元素添加到所述分类关键字上。
12.根据权利要求11的设备,
其中所述分类关键字与一数据库中的记录相关;并且
其中所述分类关键字被用于构造所述数据库的语言索引。
CN02809865.XA 2001-05-31 2002-05-22 用于处理大量字符的高效整理元素结构 Expired - Lifetime CN1531692B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/872,552 US6877003B2 (en) 2001-05-31 2001-05-31 Efficient collation element structure for handling large numbers of characters
US09/872,552 2001-05-31
PCT/US2002/016186 WO2002097674A2 (en) 2001-05-31 2002-05-22 Efficient collation element structure for handling large numbers of characters

Publications (2)

Publication Number Publication Date
CN1531692A CN1531692A (zh) 2004-09-22
CN1531692B true CN1531692B (zh) 2010-12-08

Family

ID=25359815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN02809865.XA Expired - Lifetime CN1531692B (zh) 2001-05-31 2002-05-22 用于处理大量字符的高效整理元素结构

Country Status (5)

Country Link
US (1) US6877003B2 (zh)
JP (1) JP4685348B2 (zh)
CN (1) CN1531692B (zh)
AU (1) AU2002311984A1 (zh)
WO (1) WO2002097674A2 (zh)

Families Citing this family (126)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
CA2390849A1 (en) * 2002-06-18 2003-12-18 Ibm Canada Limited-Ibm Canada Limitee System and method for sorting data
US7359905B2 (en) * 2003-06-24 2008-04-15 Microsoft Corporation Resource classification and prioritization system
US7941311B2 (en) * 2003-10-22 2011-05-10 Microsoft Corporation System and method for linguistic collation
US7676476B2 (en) * 2004-08-25 2010-03-09 Microsoft Corporation Data types with incorporated collation information
US20060101015A1 (en) * 2004-11-05 2006-05-11 Microsoft Corporation Automated collation creation
US20060212449A1 (en) * 2005-03-21 2006-09-21 Novy Alon R J Method and apparatus for generating relevance-sensitive collation keys
CN100393071C (zh) * 2005-06-30 2008-06-04 杭州华三通信技术有限公司 配置访问控制列表的方法及其应用
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8620662B2 (en) * 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
JP5391583B2 (ja) * 2008-05-29 2014-01-15 富士通株式会社 検索装置、生成装置、プログラム、検索方法および生成方法
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US8140517B2 (en) * 2009-04-06 2012-03-20 International Business Machines Corporation Database query optimization using weight mapping to qualify an index
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US9509757B2 (en) * 2011-06-30 2016-11-29 Google Inc. Parallel sorting key generation
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
JP5367179B1 (ja) * 2012-09-20 2013-12-11 株式会社東芝 データ処理装置、データ管理システム、データ処理方法およびプログラム
JP2016508007A (ja) 2013-02-07 2016-03-10 アップル インコーポレイテッド デジタルアシスタントのためのボイストリガ
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
WO2014200728A1 (en) 2013-06-09 2014-12-18 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101809808B1 (ko) 2013-06-13 2017-12-15 애플 인크. 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
CN106471570B (zh) 2014-05-30 2019-10-01 苹果公司 多命令单一话语输入方法
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5485373A (en) * 1993-03-25 1996-01-16 Taligent, Inc. Language-sensitive text searching system with modified Boyer-Moore process
US5675818A (en) * 1995-06-12 1997-10-07 Borland International, Inc. System and methods for improved sorting with national language support

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1265623A (en) * 1987-06-11 1990-02-06 Eddy Lee Method of facilitating computer sorting
CA1280215C (en) * 1987-09-28 1991-02-12 Eddy Lee Multilingual ordered data retrieval system
US5551018A (en) * 1993-02-02 1996-08-27 Borland International, Inc. Method of storing national language support text by presorting followed by insertion sorting
US5440482A (en) * 1993-03-25 1995-08-08 Taligent, Inc. Forward and reverse Boyer-Moore string searching of multilingual text having a defined collation order
US5873111A (en) * 1996-05-10 1999-02-16 Apple Computer, Inc. Method and system for collation in a processing system of a variety of distinct sets of information
US6381616B1 (en) * 1999-03-24 2002-04-30 Microsoft Corporation System and method for speeding up heterogeneous data access using predicate conversion

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5485373A (en) * 1993-03-25 1996-01-16 Taligent, Inc. Language-sensitive text searching system with modified Boyer-Moore process
US5675818A (en) * 1995-06-12 1997-10-07 Borland International, Inc. System and methods for improved sorting with national language support

Also Published As

Publication number Publication date
WO2002097674A2 (en) 2002-12-05
WO2002097674A3 (en) 2004-02-19
CN1531692A (zh) 2004-09-22
JP4685348B2 (ja) 2011-05-18
JP2005517221A (ja) 2005-06-09
US20020184251A1 (en) 2002-12-05
US6877003B2 (en) 2005-04-05
AU2002311984A1 (en) 2002-12-09

Similar Documents

Publication Publication Date Title
CN1531692B (zh) 用于处理大量字符的高效整理元素结构
US8301437B2 (en) Tokenization platform
US8255398B2 (en) Compression of sorted value indexes using common prefixes
JP3318834B2 (ja) データファイルシステム及びデータ検索方法
US20090094262A1 (en) Automatic Generation Of Ontologies Using Word Affinities
US8266150B1 (en) Scalable document signature search engine
CN101178726B (zh) 数据文件解归档的方法和系统
JPS60134945A (ja) データベース処理方法
CN102867049B (zh) 一种基于单词查找树实现的汉语拼音快速分词方法
US7765219B2 (en) Sort digits as number collation in server
CN104572685B (zh) 数据排序方法
KR20180129001A (ko) 다언어 특질 투영된 개체 공간 기반 개체 요약본 생성 방법 및 시스템
CN102646123A (zh) 多模式匹配方法、装置和设备
CN108984626B (zh) 一种数据处理方法、装置及服务器
US8682900B2 (en) System, method and computer program product for documents retrieval
CN111339042A (zh) 数据的操作处理方法、系统及调度服务器
Okada et al. An efficient substring search method by using delayed keyword extraction
JP2001344553A (ja) 特徴ベクトルのデータ空間のインデクシング方法
JPH04340163A (ja) キーワード検索方式
CN101930451B (zh) 用于存储高效地搜索至少一个询问数据元素的方法和装置
JP2535629B2 (ja) 検索システムの入力文字列正規化方式
JPH10240741A (ja) 木構造型データの管理方法
CN115408491B (zh) 一种历史数据的文本检索方法及系统
CN115809248B (zh) 数据查询方法和装置以及存储介质
Lin Cat: An execution model for concurrent full text search

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20101208

CX01 Expiry of patent term