CN103678481A - 用于搜索记分的方法和设备 - Google Patents

用于搜索记分的方法和设备 Download PDF

Info

Publication number
CN103678481A
CN103678481A CN201310495397.1A CN201310495397A CN103678481A CN 103678481 A CN103678481 A CN 103678481A CN 201310495397 A CN201310495397 A CN 201310495397A CN 103678481 A CN103678481 A CN 103678481A
Authority
CN
China
Prior art keywords
score
search
sale
document
product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310495397.1A
Other languages
English (en)
Other versions
CN103678481B (zh
Inventor
王学军
布赖恩·埃克坦
文卡特·潘查帕克森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vigor Investment Company Limited
Original Assignee
Yahoo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Inc filed Critical Yahoo Inc
Publication of CN103678481A publication Critical patent/CN103678481A/zh
Application granted granted Critical
Publication of CN103678481B publication Critical patent/CN103678481B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

本发明涉及用于搜索记分的方法和设备。用于生成具有较高相关性的搜索结果的方法和设备。本发明利用了以下事实:用户对每个给定搜索词语的选择往往会覆盖来自若干个商家的若干个产品,并且所有结果都是与搜索词语非常相关的。在一个实施例中,这些结果被用于判定每个搜索词语的商家的顺序。通过获知用户的选择,尤其是从购买和/或点击信息(310)中获知用户的选择,比起仅限文本相关的产品来,高度相关并且最受欢迎的产品可以被分配以更高的得分或等级(350)。

Description

用于搜索记分的方法和设备
本申请是申请日为2004年9月30日,申请号为200480030053.2,名称为“用于搜索记分的方法和设备”的发明专利申请的分案申请。
技术领域
本发明涉及用于对搜索结果进行记分或分级的方法和设备。更具体而言,本发明涉及基于事务和/或点击记录的记分方法。
背景技术
随着因特网上大量信息的增殖,通常,如果不首先花大量时间来仔细察看许多不相关搜索结果就很难搜索和定位相关信息。根据所寻求的材料,用户常常由于必须查看许多无关紧要的搜索结果而感到受挫。
记分或分级是搜索中的核心问题之一,例如在购物/产品搜索中尤其如此。如果搜索不能在搜索结果列表的顶部处提供最相关的文档,则这通常被称为不相关(irrelevant)。比起常规web搜索来,对于诸如购物/产品搜索这样的搜索,用户往往具有更高的相关性(relevancy)要求,因为他们的目标不仅仅是找到一个相关结果。它们常常希望看到最相关的产品,并且希望能够在不同产品和不同商家之家进行比较。
基于纯文本相关性的记分是若干搜索技术的基础。基本思想是找到匹配文档标题、描述和其他字段的文本。可以添加额外的细化,例如向某些字段(比如标题)提供更高的权重、向短语匹配提供更高的权重等等。但是,所有这些纯文本相关性记分方法都有生成最相关的搜索结果的问题,因为它们不能精确地确定用户想要搜索什么。
例如,在纯文本相关性搜索中,当搜索词语“computer(计算机)”时,具有像“Sony VAIO FX340”这样的标题的文档不会被视为良好的文本匹配,因为标题不包含词语“computer”,而具有像“computer case(计算机壳)”这样的标题的文档却会被视为良好的匹配。这个示例证明了对computer的搜索很可能会产生具有许多不相关项目的搜索结果。
即使在所有结果都被认为是相关的时,仍然优选向更受欢迎的产品提供更高的得分或等级。但是,纯文本相关性搜索将不能提供这种重要区别。
因此,本领域中需要一种提供具有更高相关性的搜索结果的方法和设备。
发明内容
在一个实施例中,本发明提供了一种用于生成具有更高相关性的搜索结果的方法和设备。例如,本发明提供了一种为购物/产品搜索生成具有更高相关性的搜索结果的方法和设备。
本发明的一个前提是:用户通过购买和/或点击其所喜爱的产品,从而针对受欢迎的搜索词语广播了其关于最喜爱的产品的偏好。当用户在购买/产品搜索站点中搜索一个词语时,虽然该站点可能返回许多不相关的结果,但是许多用户可以就通过选择其所感兴趣的结果(即相关结果)来过滤掉不相关的结果。这在用户确实从搜索结果列表中购买产品时尤其精确,从而不仅指示了搜索词语的结果的相关性,还指示了所购买的产品的价格的相关性和/或销售所购买的产品的商家的相关性。
本发明利用了以下事实:用户对每个给定搜索词语的选择往往会覆盖来自若干个商家的若干个产品,并且所有结果都是与搜索词语非常相关的。在一个实施例中,这些结果被用于判定每个搜索词语的商家的顺序。通过获知用户的选择,尤其是从购买和/或点击信息中获知用户的选择,比起仅限文本相关的产品来,高度相关并且最受欢迎的产品可以被分配以更高的得分或等级。
附图说明
通过参考附图,从以下对本发明的优选实施例的详细描述中更好地理解前述和其他方面和优点,附图中:
图1是示出本发明的记分系统的框图;
图2示出应用本记分方法来影响搜索结果中的文档的列出顺序的关系;
图3示出用于生成多个产品的热得分(hotscore)的方法的流程图;
图4示出用于对销售和点击数据进行预处理的方法的流程图;
图5示出用于计算配置参数α的方法的流程图;
图6示出本发明的用于生成热得分的方法的流程图;
图7示出本发明的用于调整热得分的方法的流程图;以及
图8示出本发明的用于调整热得分的第二方法的流程图。
具体实施方式
图1是示出本发明的记分系统100的框图。记分系统100的任务是为根据搜索词语生成的搜索结果集合内的文档(例如产品)记分。
更具体而言,图1示出与网络(例如因特网102)交互的记分系统100,在该因特网102中,多个用户105被允许进行搜索。搜索通常由输入一个或多个搜索词语的用户所触发,所述搜索词语例如是“laptopcomputer”、“DVD”、“gas grill”等等。搜索可以包括对用户所需的产品和服务的搜索。产品和服务可以由维护记分系统100的实体提供,所述实体例如是操作一个提供大量产品和服务的网站的公司,例如Walmart之类的。或者,产品和服务可以由多个商家107提供,其中记分系统100是由第三方部署的,并且其任务只是生成与用户所提供的搜索词语相关联的搜索结果,例如搜索引擎应用。总之,本发明的记分系统100并不局限于其部署方式。
在一个实施例中,记分系统100是用通用计算机或任何其他硬件等同物来实现的。更具体而言,记分系统100包括处理器(CPU)110、存储器120(例如随机访问存储器(RAM)和/或只读存储器(ROM))、记分引擎或应用122、搜索引擎或应用124、跟踪引擎或应用126以及各种输入/输出设备130(例如:存储设备(包括但不限于磁带驱动器、软盘驱动器、硬盘驱动器或紧致盘驱动器)、接收器、发送器、扬声器、显示器、输出端口、用户输入设备(例如键盘、小键盘、鼠标等等)或者用于捕捉语音命令的麦克风)。
应当理解,记分引擎或应用122、搜索引擎或应用124和跟踪引擎或应用126可以被实现为经由通信信道耦合到CPU110的物理设备或系统。或者,记分引擎或应用122、搜索引擎或应用124和跟踪引擎或应用126可以由一个或多个软件应用(或者甚至软件和硬件的组合,例如利用专用集成电路(ASIC))代表,其中软件从存储介质(例如磁或光驱动器或盘)被加载到计算机的存储器120中并被CPU所操作。这样,本发明的记分引擎或应用122、搜索引擎或应用124和跟踪引擎或应用126(包括相关联的数据结构)可以被存储在计算机可读介质上,例如RAM存储器、磁或光驱动器或盘等等。
总之,记分系统被设计以解决对提高搜索相关性的紧迫需求。本发明利用了以下事实:用户通过购买或点击其所喜爱的产品,从而针对受欢迎的搜索词语公开了其关于最喜爱的产品的偏好。当用户在购物/产品搜索站点搜索词语时,站点常会返回许多不相关的结果,而且这些不相关的结果甚至处于顶部结果位置。通常,用户只是过滤掉错误结果,而只选择其所感兴趣的结果,即相关的结果。当用户实际购买了从搜索结果中选择出的产品时,搜索结果的相关性被有效地证实。即,当用户决定购买产品时,则在产品的价格和/或销售产品的商家的上下文内,他或她选择的产品必然是与搜索词语高度相关的。
已经确定,如果跟踪数据量充分大,则用户关于每个给定的搜索词语的选择往往会覆盖来自若干个商家的若干个产品,并且所有结果都与搜索词语非常相关。通过获知和应用用户的选择,尤其是来自购买和/或点击的选择,比起仅限文本相关的产品来,高度相关的产品可以被分配以更高的得分/等级。这种新颖的方法将会对搜索词语产生高度相关的搜索结果。实际上,可以应用额外的细化或规范化(normalization),例如针对每个搜索词语的商家排序。这些可选的调整在下文中进一步描述。
在本发明的一个实施例中,响应于搜索词语分配给产品的基于用户购买和/或点击信息的得分被称为“热得分”。这个热得分可以被搜索引擎用于响应于搜索词语产生搜索结果。应当注意,当前的热得分可以被用作生成搜索结果时的主导(权重更重)参数,或者用于为当前采用其他参数作为主导参数的搜索引擎提供补充,所述其他参数例如是付费收录(paidinclusion)、付费赞助、文本相关性。
图2示出应用本记分方法来以较大的相关性影响搜索结果集合中的文档列表的关系。图2示出响应于特定搜索词语而生成并提供给用户的第一结果集合220。在该示例中,搜索结果集合中的项目被广泛地定义为文档,其中在购物的场景内,文档应当是产品或产品-商家对。但是,文档想要广泛地包括网站、文本文档、图像等等。
图2示出通过跟踪第一搜索结果集合内的各种文档的购买和/或点击210来跟踪用户对第一结果集合220的响应。该购买和/或点击信息被跟踪,然后被记分过程230用来生成多个得分(热得分)240,其中每个得分与文档之一相关联。热得分240又可选地被另一记分系统250用来响应于生成第一结果集合的同一搜索词语生成第二搜索结果集合260,所述记分系统250可以结合文本得分252和其他得分254(例如付费收录得分)来应用热得分。图2示出热得分的应用现在已经影响了文档的排序,并且还可能影响第二结果集合中文档的添加或删除,从而在第二搜索结果集合中提供更好的相关性。
在一个实施例中,对于每个搜索词语,本发明跟踪每个用户点击并最终购买的商家/产品对。更详细的信息也被跟踪,其中包括当点击/购买发生时产品在搜索结果中的位置、这种行为发生的时间以及当这种行为发生时产品被分配的部门。
图3示出用于生成多个产品的热得分的示例性方法300的流程图。方法300开始于步骤305中,并且进行到步骤310。
在步骤310中,方法300根据特定搜索词语对每个产品的销售和/或点击数据进行预处理。例如,本发明为每个元组<k,p,t>生成数据,其中k是搜索词语,p是产品,t是类型。即,方法300将会生成Ck,p,t,该Ck,p,t是在“tp”时间段中发生的针对搜索词语k的t类事件的计数或数目。t类事件可以定义特定类型的购买事件和/或点击事件(例如,对来自优选卖方的产品的购买或对搜索结果上的文档的点击)。多个示例性类型事件在下文中公开。
具体而言,对于可以在配置文件中定义和调节的给定时间范围,每个搜索词语的所有商家/产品-id对被分类成不同类型,并且被基于Ck,p,t计数。此外,消除低置信度的结果。低置信度的结果可以包括兜售信息(spamming)结果和分散的结果。分散的结果是在给定阈值下重复的结果,例如偶然被访问而实质上并不指示链接的相关性的链接。
在步骤320中,方法300可选地对数据进行规范化以考虑到时间和/或位置。具体而言,已观察到,产品在搜索结果集合中的位置“越高”,它被用户点击/购买的概率就越高。更具体而言,还观察到,点击很受位置影响(例如位置较高的产品常被“点击”),而购买则略受位置影响(例如,购买者只被相关产品的位置略微影响)。从而,用户可以点击位置较高的产品,但是最后却可能由于相关性而购买被列在低得多的位置处的产品。
搜索结果集合中的第一顶部位置被视为位于搜索结果集合内的最高位置。为了找到更相关的结果,基于点击/购买发生时的位置来规范化商家/产品-id对的置信度。例如,对结果集合内位置非常低的文档的购买或点击将会指示该文档与搜索词语的高度相关性。
可选地,可以对数据进行规范化以考虑到时间(“出现时间”或“发生时间”)。即,文档的销售和/或点击离目前有多长时间。虽然商家/产品-id对的“发生时间”不应当影响该对的相关性,但是它确实有可能或者潜在地影响市场中的新趋势。捕捉这个趋势并且总将最受欢迎的结果显示在第一位是本记分发明的目标之一。换言之,可以按考虑到产品的受欢迎度或“时间相关性”的顺序来列出相关产品。可以部署用于位置和时间规范化的各种规范化函数。
在步骤330中,方法300计算配置参数α。更具体而言,方法300为每个<k,t>对计算αk,p,MAX和αk,p,MIN。配置参数被用于定义不同类型的购买和/或点击的影响。例如,通过商店(例如被视为非优选的小型商家)进行的购买不同于通过目录(例如被视为优选的大型商家)进行的购买。类似地,通过“优选商家”进行的购买不同于向“一般商家”进行的购买。这些区别对于本记分系统的操作者是很重要的,因为这种与购买和点击类型有关的信息可以被用于进一步细化搜索结果的相关性,如下所述。
在步骤340中,方法300基于购买和/或点击信息为针对每个搜索词语的每个产品生成得分(热得分)。这个得分可以以下文进一步公开的多种不同方法来生成。即,可以应用不同的规则以与公司的策略相对应。从而,在一个规则中计算出的商家/产品-id对的热得分可能不同于在第二规则中计算出的。
在步骤350中,方法300查询是否有必要调整热得分。具体而言,可以任选地应用调整,以考虑到不同的知识,例如关于搜索词语的特定知识、关于商家-产品对的性能的知识、关于购买者行为的知识、关于购买者年龄的知识、关于购买者性别的知识等等。如果这种知识可用,则可以相应的调整热得分。
例如,可以基于受欢迎的搜索词语来对热得分做出调整。对于包含在知识库中的某些受欢迎的搜索词语,本发明可以向搜索词语添加销售信息。例如,在一个实施例中,搜索词语“dell”可以被翻译成“manufacturer=Dell”,其中本发明可以将关于“manufacturer=Dell”的所有销售信息应用到搜索词语“dell”。
或者,可以基于用户对有关搜索词语的行为来对热得分做出调整。用户对有关搜索的行为可以帮助创建一般搜索词语与和它有关的较窄的搜索词语之间的实际联系。即,这将会帮助用户使其搜索缩小到一般搜索词语上。在一个实施例中,本发明将商家/产品对的有关搜索词语的热得分添加到一般搜索词语,从而扩展了覆盖范围。
或者,如果数据指示正在执行商家-产品对的匹配,则可以对热得分做出调整,即调整热得分以降低不正确的或不受欢迎的文档的得分的影响。例如,在热得分被分配给商家-产品对之后,本发明继续对结果进行估计。性能不佳的对被假定为是搜索结果集合的错误选择的文档或不受欢迎的文档,从而其热得分将会被降低。例如,搜索结果可以提供多个相关文档(例如与搜索词语高度相关的商家-产品对),但是由于种种原因,购买者对商家-产品对中的特定子集不感兴趣。在这种情形下,这种相关的、但却不受欢迎的产品对被“惩罚”,从而使它们将会具有较低的、甚至负的热得分。
返回步骤350,如果对查询的回答是否定的,则方法300在步骤375中结束。如果对查询的回答是肯定的,则方法300进行到步骤360,在该步骤中热得分被调整。
在步骤370中,方法300查询是否有必要对热得分进行额外的调整。如果对查询的回答是肯定的,则方法300进行到步骤360,在该步骤中热得分再次被调整。如果对查询的回答是否定的,则方法300在步骤375中结束。
一旦热得分被生成,搜索引擎124就可以立即应用热得分以影响购物/产品搜索。在一个实施例中,利用当前的热得分实时地(on the fly)调整基于任何搜索方法的搜索记分。例如,当用户键入搜索词语时,购物/产品搜索系统将会向搜索引擎发出具有热得分提高比率的搜索。这个比率可以非常高,这意味着所有具有热得分的产品都将会在那些没有热得分的产品的前面。它也可以非常低,这意味着热得分只会最低限度地影响搜索结果的顺序。
图4示出用于对销售和点击数据进行预处理的方法400的流程图。方法400开始于步骤405中,并且进行到步骤410。
在步骤410中,方法400查询点击信息是否是关于产品的实际销售的。如果对查询的回答是肯定的,则方法400进行到步骤492,在该步骤中原始点击信息被使用。即,产品的销售就搜索结果的相关性而言提供了最高的置信度。从而,与销售相关联的点击信息被保留并使用。如果对查询的回答是否定的,则方法400进行到步骤420。
在步骤420中,方法400查询点击信息是否低于预定阈值。如果对查询的回答是肯定的,则方法400进行到步骤430。如果对查询的回答是否定的,则方法400进行到步骤494,在该步骤中点击信息被丢弃。即,步骤420的意图是去除错误的点击数据,例如人为地增加对搜索结果内的特定文档的访问的泛滥式攻击。
在步骤430中,方法400查询点击信息是否来自受信站点。如果对查询的回答是肯定的,则方法400进行到步骤492,在该步骤中原始点击信息被使用。即,来自受信站点的产品的点击信息就搜索结果的相关性而言提供了一些置信度。从而,点击信息被保留和使用。如果对查询的回答是否定的,则方法400进行到步骤440。
在步骤440中,方法400查询来自特定IP地址的点击信息是否多于来自其他IP地址的点击信息。换言之,从统计上而言,与特定IP地址相关联的点击信息与来自其他IP地址的点击信息相比是否反常地高。如果对查询的回答是肯定的,则方法400进行到步骤450,在该步骤中来自特定IP地址的点击信息被丢弃。即,来自特定IP地址的点击信息是可疑的。如果对查询的回答是否定的,则方法400进行到步骤460。
在步骤460中,方法400查询点击和页面查看速率是否远高于平均比率。如果对查询的回答是肯定的,则方法400进行到步骤470,在该步骤中点击信息被丢弃。即,如果点击和页面查看的速率或频率非常高,即用户点击一个文档然后立即点击另一个文档,而花在查看最初点击的页面的时间却非常少,则点击信息是可疑的。如果对查询的回答是否定的,则方法400进行到步骤480。
在步骤480中,方法400查询搜索结果集合内的文档的点击数目是否远高于关于同一搜索词语的同一搜索结果集合中的其他文档的点击数目。例如,如果搜索结果集合内的一个特定文档被重复访问的次数远高于同一搜索结果集合中的其他文档,则点击信息是可疑的。前提是以下情况是非常反常的:用户重复点击某个文档的频率远高于点击同一搜索结果中的其他文档的频率。如果对查询的回答是否定的,则方法400进行到步骤492,在该步骤中原始点击信息被使用。
如果对查询的回答是肯定的,则方法400进行到步骤490,在该步骤中点击信息的平均被使用。方法400在步骤495中结束。
图5示出用于计算类型的配置参数α的方法500的流程图。更具体而言,方法500为每个<k,t>对计算αk,p,MAX和αk,p,MIN。配置参数被用于描述不同类型的购买和/或点击的影响。方法500开始于步骤505中,并且进行到步骤510。
在步骤510中,方法500选择元组<k,t>,其中k是搜索词语,t是类型。然后在步骤520中,方法500为<k,t>选择Ck,p,t,其中k是搜索词语,p是产品,t是类型。即,Ck,p,t是在某个时间段中发生的关于产品p、针对搜索词语k的t类事件的计数或数目。
在步骤530中,方法500计算配置参数α。更具体而言,α可以被表达为:
αk,t,MIN=mt   (方程1)
αk,t,MAX=mt/MAX(Ck,1,t,Ck,2,t,....,Ck,n,t)   (方程2)其中mt是t类事件的基本得分,如下表1和2所示,这两个表是基于两个不同的业务要求来定义的。应当注意,对于每个t类事件,可以采用方程1和方程2中的“min(最小)”或“max(最大)”函数中的任何一个,如下所示。
类型 mt
最小优选商家销售: 150
最小有关搜索优选商家销售: 120
最大优选商家点击: 100
最大非优选(商店)销售: 80
最小目录销售: 600
最小有关搜索目录销售: 500
最小映射目录销售: 550
最小有关搜索映射目录销售: 450
最大映射目录点击: 160
最小基于知识的销售: 580
表1
类型 mt
最小优选商家销售: 110
最小有关搜索优选商家销售: 105
最大优选商家点击: 100
最大非优选(商店)销售: 105
最小目录销售: 600
最小有关搜索目录销售: 500
最小映射目录销售: 550
最小有关搜索映射目录销售: 450
最大映射目录点击: 160
最小基于知识的销售: 550
表2
应当注意,分配给各种类型的销售和点击的值mt可以被调整以针对特定实现方式。以下类型定义如下:
优选商家销售被定义为通过优选商家进行的销售。将商家定义为优选商家的标准是应用特定的,例如,向搜索实体付费的商家可以被视为优选商家。
有关搜索优选商家销售被定义为这样的销售:该销售是利用与搜索词语有关但包括优选商家的名称的搜索词语进行的。为了说明,假设有两个搜索词语:“digital camera”和“Sony digital camera”。对来自从搜索词语“Sony digital camera”生成的搜索结果的产品“A”的购买将会导致表1所示的120的mt被添加到产品“A”的得分,而对来自从搜索词语“digital camera”生成的搜索结果的产品“A”的购买将会导致表1所示的150的mt被添加到产品“A”的得分。这种方法将较窄的搜索“Sonydigital camera”与更宽、更一般化的搜索词语“digital camera”联系起来。
优选商家点击被定义为对与优选商家相关联的搜索结果集合内的文档的点击。
非优选销售被定义为通过非优选商家(例如小型商家)进行的销售。将商家定义为非优选商家的标准是应用特定的,例如,向搜索实体提供很少费用或者不提供费用的小型商家可以被视为非优选商家。
目录销售被定义为利用目录页面或产品指南页面进行的销售。目录页面被定义为特定产品的显示页面,其显示以下信息中的一种或多种:商家列表、商家-价格对(例如以特定价格许诺销售产品的商家)的列表、产品评论列表、产品描述等等。从该目录页面进行的购买被假定为与搜索词语高度相关。
有关目录销售被定义为利用有关目录页面或产品指南页面进行的销售。为了说明,假设有两个两个搜索词语:“digital camera”和“Sonydigital camera”。对来自从搜索词语“Sony digital camera”生成的目录页面的产品“A”的购买将会导致表1所示的500的mt被添加到针对搜索词语“digital camera”的产品“A”的得分,而对来自从搜索词语“digitalcamera”生成的目录页面的产品“A”的购买将会导致表1所示的600的mt被添加到产品“A”的得分。
映射目录销售被定义为与映射的目录页面或产品指南页面相关联的销售。即,购买不是从目录页面进行的,而是直接经由商家的页面进行的。例如,特定搜索词语的搜索结果包含多个目录页面和多个商家页面。用户随后选择访问特定商家页面,于是直接通过商家进行产品购买。从而,检测到产品购买是直接从特定商家进行的,并且如果系统还检测到所购买的产品被“映射”到特定目录页面或产品指南页面,则购买信息将会导致表1所示的550的mt被添加到目录页面得分。应当注意,为文档广泛生成热得分,其中文档可以包括产品、商家-产品对或目录页面。向相关目录页面分配高得分是合乎需要的,这是因为用户被提供以许诺销售同一产品的商家的比较。换言之,在目录页面中购买产品是理想的购物环境,其中高热得分的分配将会导致目录页面被频繁地提供给用户。
有关搜索映射目录销售被定义为与有关映射目录页面或有关映射产品指南页面相关联的销售。
映射目录点击被定义为对可被映射到目录页面或产品指南页面的商家页面的点击。即,该点击不是对目录页面做出的,而是直接对商家的页面做出的。例如,特定搜索词语的搜索结果包含多个目录页面和多个商家页面。用户随后选择为了某个产品而点击特定商家页面。如果系统还检测到被点击的产品被“映射”到特定目录页面或产品指南页面,则点击信息将会导致表1所示的160的mt被添加到目录页面的得分。
基于知识的销售被定义为利用基于关于搜索词语的某些知识而调整的结果进行的销售。例如,如果搜索词语是“sony”,则搜索词语被调整为“brand=Sony”。来自这种搜索结果的产品的销售将会导致被购买的产品接收表1所示的580的mt
返回图5,在步骤540中,方法500查询是否已经例如根据以上所示的方程2计算了所有Ck,p,t。如果对查询的回答是否定的,则方法500返回步骤520。如果对查询的回答是肯定的,则方法500进行到步骤550。
在步骤550中,方法500查询是否所有元组<k,t>都已经被总结。如果对查询的回答是否定的,则方法500返回步骤510。如果对查询的回答是肯定的,则在步骤555中方法500结束。
图6示出了本发明的用于生成热得分的方法600的流程图。方法600开始于步骤605中,并且进行到步骤610。
在步骤610中,方法600任选地查询特定配置是否已被选择用于生成热得分。即在一个实施例中,可以部署多个配置或规则来针对不同的系统需求。例如,某些系统可能赞成热得分的使用,从而导致MAX配置被选择,其中热得分将会对搜索结果集合中列出的文档有很大影响。或者,某些系统可能希望减轻热得分的使用,从而导致MIN配置被选择,其中热得分对搜索结果集合中列出的文档的影响将会较小。
但是,如果没有设想多个配置,则可以省略步骤610,并且选择标准配置。如果对查询的回答是否定的,则方法600进行到步骤615,在该步骤中选择配置。如果对查询的回答是肯定的,则方法600进行到步骤620。
在步骤620中,方法600选择元组<k,p>,其中k是搜索词语,p是产品。然后,在步骤630中,方法600选择类型t。
在步骤640中,方法600查询<k,p,t>的Ck,p,t是否存在,其中k是搜索词语,p是产品,t是类型。Ck,p,t是在某个时间段中发生的关于产品p、针对搜索词语k的t类事件的计数或数目。如果对查询的回答是否定的,则方法600返回步骤630,在该步骤中另一类型被选择。如果对查询的回答是肯定的,则方法600进行到步骤650。
在步骤650中,方法600根据所选择的配置计算配置因子α。在一个实施例中,对于搜索词语k,商家/产品对p的热得分被定义为:
Hotscorek,p=∑(αk,t,T(t)Ck,p,t)   (方程3)其中Ck,p,t是关于产品p、针对搜索词语k的t类事件的发生次数。αk,t,T(t)是在以上方程2和方程3中定义的配置因子。
在一个实施例中,可以定义T(t)函数,例如,其中T(t)可以是MAX函数或MIN函数。这些函数的值的示例在以上表1或表2中示出。T(t)函数的值可以在记分系统的配置中预先定义。虽然本发明公开了两个配置函数MAX和MIN,但是本发明并不局限于此。即,可以部署任何数目的配置以针对特定记分系统的需求。
在步骤660中,方法600查询是否所有类型t都已经被处理。如果对查询的回答是否定的,则方法600返回步骤630,在该步骤中另一个类型被选择。如果对查询的回答是肯定的,则方法600进行到步骤670,在该步骤中方程3被用于生成所选择的元组<k,p>的热得分。
在步骤680中,方法600查询是否所有元组<k,p>都已经被处理。如果对查询的回答是否定的,则方法600返回步骤620,在该步骤中另一个元组被选择。如果对查询的回答是肯定的,则在步骤685中方法600结束。
在一个实施例中,当前热得分被用于现有搜索记分系统中。为了说明,对于搜索词语t、商家/产品对p按下式获得scorek,p
Scorek,p=BTk,p+H(hotscorek,p)+OBk,p   (方程4)其中BTk,p是产品p针对搜索词语k获得的基本文本相关性得分,hotscorek,p是p针对搜索词语k的热得分,H是用于调整搜索记分系统的热得分的使用函数(如果必要的话),OBk,p是搜索词语k的其他可选提高性得分之和。应当注意,H是描述热得分应当如何被用于整个得分中的函数,如下所述。
可以采用许多种规范化函数。以下给出各种类型的函数。
在一个实施例中,利用如下“影响因子”来规范化原始热得分:
H(hotscorek,p)=hotscorek,p*af   (方程5)其中af被称为影响因子,它可以被定义如下:
af=standard_hotscore/standard_score_for_hotscore_in_whole score
                                             (方程6)
该函数选择热得分中的得分作为标准,并且选择整体得分中的得分作为热得分部分的标准得分。然后通过使用影响因子将热得分应用到整体记分中。在这种方法中,对于热得分的使用没有上限或下限。从而,置信度非常高的产品可以被保证拥有高等级。
在第二实施例中,可以按下式来规范化热得分:
如果hotscorek,p=0,则H(hotscorek,p)=0;
否则,       (方程7)
H(hk,p)=HL+(HU–HL)*(hk,p–MIN(hk,1,hk,2,...,hk,n)/MAX(hk,1,hk,2,...,hk,n)–MIN(hk,1,hk,2,...,hk,n))
其中HL是总得分中热得分的下限,HU是总得分中热得分的上限。函数H判定热得分在搜索记分中的作用有多重要。HU定义热得分在得分中的最大影响,HL定义热得分在得分中的最小影响。
一种极端的方案是为HU和HL赋予非常大的值,从而使得热得分将会主导整个得分。或者,另一个极端是为HU和HL赋予非常小的值,从而使得热得分只影响具有相同的方程4的BTk,p和OBk,p的产品的等级。前一种方法适用于闭合系统,其中所有事务信息都可用。对于其中只有某些销售信息可用的开放系统,仅向HU赋予较高的值以使得置信度高的热得分主导得分,而置信度低的热得分只起非常有限的作用,并且与其他记分影响相混合,则将会是更加适当的。
在第三实施例中,可以对热得分进行位置规范化。具体而言,令ACi为位置i处的所有点击数目,Ck,p,i为位置i处针对搜索词语k的产品p的点击数目,NCk,p,i为规范化后的位置i处针对搜索词语k的产品p的点击数目,从而:
NCk,p,i=Ck,p,i*AC0/ACi   (方程8)其中ACo/ACi被称为位置i的常规提高因子。为了抑制对搜索结果集合内的位置很高的文档的点击的影响,本方法可以将ACi限制到某个数字,例如AC30,从而使得对高位置一次错误点击不会不成比例地影响整个记分系统。
此外,由于在不同的时间<k,p>对的点击位置可能不同,因此通过计算给定时间段中<k,p>的平均点击位置来确定i。
该函数将一个<k,p>对的一个位置上的点击数目与平均点击数目相比较。只有那些优于正常点击率的才能在规范化后拥有较高的数字,即它实际上将Ck,p,0/Ck,p,i与AC0/ACi相比较。从而,这种方法将会使自提高(self-boosting)的概率最小化。应当注意,同样的函数也可以被应用到销售位置规范化。
在第四实施例中,可以对热得分进行时间规范化。具体而言,令E为事件发生的次数,NE为事件的规范化次数,age为事件发生距离当前时间的天数,ff为“遗忘因子”,即系统倾向于遗忘某个事件的比率。遗忘因子被定义在配置文件中,以便本系统可以相应的调节它。E的规范化如下:
NE=E*(1–ff)age,(0<=age<=n)   (方程9)方程9中的“age”的上限(n)可以被调整以满足特定应用或不同产品的需求。
图7示出本发明的用于基于知识参数调整热得分的方法700的流程图。方法700开始于步骤705中,并且进行到步骤710。
在步骤710中,方法700从知识库中选择搜索词语k。即,取得知识KNk。例如,如果搜索词语是“dell”,则知识KNk可以被表达为“manufacturer=Dell”。
在步骤720中,方法700查询是否存在关于知识KNk的应用的配置因子或规则。例如,配置因子可以规定所Dell产品的热得分都被调整以考虑到所有Dell产品的销售。或者,配置因子可以规定所有Dell计算机产品的热得分都被调整以考虑到所有Dell计算机产品的销售,等等。如果对查询的回答是否定的,则方法700返回步骤710,并且另一个搜索词语被选择。如果对查询的回答是肯定的,则方法700进行到步骤730。
在步骤730中,方法700取得与每个产品的知识KNk有关的所有销售信息(PKNk1),...,(PKNkn)。例如,收集关于桌面型计算机、笔记本电脑、PDA、打印机、监视器、扬声器等的销售信息。下面可以应用这种信息。
在步骤740中,方法700可以任选应用如上所述的时间和位置规范化。
在步骤750中,方法700从步骤730中所述的产品中选择产品p。例如,Dell桌面型计算机被选择。
在步骤760中,方法700基于步骤720中所述的配置因子或规则调整hotscorek,p。例如,Dell桌面型计算机的热得分被调整,从而使得Dell笔记本电脑的销售信息被用于提高Dell桌面型计算机的热得分。这种调整之所以合理可能因为是Dell是优选商家,或者存在关于优选Dell笔记本电脑的购买者也会优选Dell桌面型计算机的知识。这样一来,可以利用特定的知识来进一步细化热得分。
在步骤770中,方法700查询是否已经调整了所有有关产品。如果对查询的回答是否定的,则方法700返回步骤750,并且另一个产品被选择。如果对查询的回答是肯定的,则方法700进行到步骤780。
在步骤780中,方法700查询是否所有有关知识都已经被处理。如果对查询的回答是否定的,则方法700返回步骤710,并且另一个搜索词语被选择。如果对查询的回答是肯定的,则在步骤785中方法700结束。
图8示出本发明的用于基于有关较窄搜索来调整热得分的方法800的流程图。方法800开始于步骤805中,并且进行到步骤810。
在步骤810中,方法800查询是否存在关于有关较窄搜索的应用的配置因子或规则。例如,搜索词语“computer with SDRAM”将会被视为“computer”的较窄的搜索词语。如果对查询的回答是否定的,则在步骤890中方法800结束。如果对查询的回答是肯定的,则方法800进行到步骤820。
在步骤820中,方法800选择搜索词语k。在步骤830中,方法800又选择有关较窄搜索词语k1
在步骤840中,方法800查询是否存在与有关较窄搜索词语k1相关联的销售和/或点击信息。例如,方法800可以确定是否存在任何与搜索词语“computer with SDRAM”相关联的销售信息。如果对查询的回答是否定的,则方法800返回步骤830,并且另一个有关搜索词语kn被选择。如果对查询的回答是肯定的,则方法800进行到步骤850。
在步骤850中,方法800查询有关搜索词语的销售信息是否大于某个阈值。换言之,方法800确定销售信息是否可以可靠地用于调整搜索词语k的热得分。在一个实施例中,在实际应用销售信息以影响更宽、更一般化的搜索词语之前,验证存在针对有关较窄搜索词语的大量销售可能是比较谨慎的。从而,如果对查询的回答是否定的,则方法800返回步骤830,并且另一个有关搜索词语kn被选择。如果对查询的回答是肯定的,则方法800进行到步骤860。
在步骤860中,方法800从得自搜索词语k的搜索结果集合中列出的产品中选择热得分。接下来,根据与搜索词语ki相关联的销售和/或点击信息调整hotscorek,p。实际上,可以直接根据hotscoreki,p来调整hotscorek,p
在步骤870中,方法800查询是否来自从搜索词语k得出的搜索结果集合的产品的所有热得分都已经被调整。如果对查询的回答是否定的,则方法800返回步骤860,并且另一个产品被选择。如果对查询的回答是肯定的,则方法800进行到步骤880。
在步骤880中,方法800查询是否所有有关较窄搜索词语都已经被处理。如果对查询的回答是否定的,则方法800返回步骤830,并且另一个搜索词语被选择。如果对查询的回答是肯定的,则方法800进行到步骤885。
在步骤885中,方法800查询是否所有一般搜索词语都已经被处理。如果对查询的回答是否定的,则方法800返回步骤820,并且另一个一般搜索词语被选择。如果对查询的回答是肯定的,则在步骤890中方法800结束。
应当注意,上述公开内容在购物场境中描述了本发明。但是,本领域的技术人员将会意识到,本发明并不局限于此。即,在一个实施例中,本发明可以被实现为用于一般搜索,例如根据点击信息生成得分。
虽然以上已经描述了各种实施例,但是应当理解,它们只是示例性而不是限制性的。从而,优选实施例的广度和范围不应当由任何上述示例性实施例所限,而应当仅根据以下权利要求及其等同物来限定。

Claims (28)

1.一种搜索结果处理方法,包括:
收集与文档相关联的销售信息,其中所述文档被列在响应搜索词语的搜索结果集合内
根据所述销售信息并考虑所述文档在所述搜索结果集合的列出顺序内的位置,将所述文档与搜索结果集合内的其他文档进行比较,确定相关影响;
根据所述相关影响,生成所述文档的得分;
使用该得分影响之后的搜索的响应。
2.如权利要求1所述的方法,其特征在于:
所述之后的搜索使用所述搜索词语,所述之后的搜索的响应包括一个搜索结果集合,所述搜索结果集合中文档的顺序被所述得分影响。
3.如权利要求1所述的方法,还包括以下步骤:
调整所述得分以考虑到时间的流逝。
4.如权利要求1所述的方法,还包括以下步骤:
调整所述得分以考虑到关于所述文档的特定知识。
5.如权利要求1所述的方法,还包括以下步骤:
调整所述得分以考虑到关于所述搜索词语的特定知识。
6.如权利要求1所述的方法,还包括以下步骤:
结合文本相关性得分、付费收录得分或付费赞助得分来应用所述得分。
7.如权利要求1所述的方法,其中,所述文档是产品。
8.如权利要求1所述的方法,其中,所述文档是目录页面。
9.如权利要求8所述的方法,其中,所述目录页面代表产品显示页面,该产品显示页面显示许诺销售所述产品的多个商家。
10.如权利要求9所述的方法,其中,所述目录页面还显示所述多个商家关于所述产品的价格信息。
11.如权利要求1所述的方法,其中,所述生成所述文档的得分的步骤中,根据至少一个销售类型生成所述文档的得分。
12.如权利要求11所述的方法,其中,所述至少一个销售类型包括代表通过优选商家进行的销售的优选商家销售类型。
13.如权利要求11所述的方法,其中,所述至少一个销售类型包括代表通过非优选商家进行的销售的非优选商家销售类型。
14.如权利要求11所述的方法,其中,所述至少一个销售类型包括代表来自有关搜索的通过优选商家进行的销售的有关搜索优选商家销售类型。
15.如权利要求11所述的方法,其中,所述至少一个销售类型包括代表利用目录页面进行的销售的目录销售类型。
16.如权利要求15所述的方法,其中,所述目录页面代表产品显示页面,该产品显示页面显示许诺销售所述产品的多个商家。
17.如权利要求11所述的方法,其中,所述至少一个销售类型包括代表来自有关搜索的利用目录页面进行的销售的有关搜索目录销售类型。
18.如权利要求11所述的方法,其中,所述至少一个销售类型包括代表与目录页面相关联的产品的销售的映射目录销售类型。
19.如权利要求11所述的方法,其中,所述至少一个销售类型包括代表来自有关搜索的与目录页面相关联的产品的销售的有关搜索映射目录销售类型。
20.如权利要求11所述的方法,还包括以下步骤:
为所述至少一个销售类型中的每一个计算配置参数,其中所述得分是根据所述配置参数和所述至少一个销售类型生成的。
21.如权利要求20所述的方法,其中,所述得分是根据下式生成的:
Hotscorek,p=∑(αk,t,T(t)Ck,p,t)
其中,Ck,p,t是关于所述文档p、针对所述搜索词语k的所述至少一个销售类型t的发生的数目,αk,t,T(t)是所述配置参数。
22.如权利要求1所述的方法,其中,所述生成所述文档的得分,还包括配置选择步骤,通过选择的配置生成所述文档的得分。
23.如权利要求1所述的方法,其中,所述销售信息包括至少一个与所述搜索词语相关的商家/商品标识对,返回的搜索结果集合中的每个商家/商品标识与商品被购买的结果相关。
24.如权利要求23所述的方法,还包括以下步骤:
将所述商家/商品标识对分类为至少一个类型,并且清除低信用的商家/商品标识对。
25.如权利要求1所述的方法,其中,所述生成所述文档的得分包括从多个公式中选择一个得分策略的公式计算得分,所述多个公式中的每个公式彻重于不同的得分策略。
26.一种用于生成文档的得分的设备,所述设备用于:
收集与文档相关联的销售信息,其中所述文档被列在响应搜索词语的搜索结果集合内;
根据所述销售信息并考虑所述文档在所述搜索结果集合的列出顺序内的位置,将所述文档与搜索结果集合内的其他文档进行比较,确定相关影响;
根据相关影响,生成所述文档的得分。
27.如权利要求26所述的搜索结果处理设备,所述设备还用于:
使用该得分影响之后的搜索的响应。
28.如权利要求27所述的搜索结果处理设备,其中,
所述之后的搜索使用所述搜索词语,所述之后的搜索的响应包括一个搜索结果集合,所述搜索结果集合中文档的顺序被所述得分影响。
CN201310495397.1A 2003-09-30 2004-09-30 用于搜索记分的方法和设备 Active CN103678481B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/675,234 2003-09-30
US10/675,234 US7130819B2 (en) 2003-09-30 2003-09-30 Method and computer readable medium for search scoring
CNA2004800300532A CN1890684A (zh) 2003-09-30 2004-09-30 用于搜索记分的方法和设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800300532A Division CN1890684A (zh) 2003-09-30 2004-09-30 用于搜索记分的方法和设备

Publications (2)

Publication Number Publication Date
CN103678481A true CN103678481A (zh) 2014-03-26
CN103678481B CN103678481B (zh) 2018-04-17

Family

ID=34377090

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201310495397.1A Active CN103678481B (zh) 2003-09-30 2004-09-30 用于搜索记分的方法和设备
CNA2004800300532A Pending CN1890684A (zh) 2003-09-30 2004-09-30 用于搜索记分的方法和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNA2004800300532A Pending CN1890684A (zh) 2003-09-30 2004-09-30 用于搜索记分的方法和设备

Country Status (6)

Country Link
US (2) US7130819B2 (zh)
EP (1) EP1668591A4 (zh)
JP (1) JP4754493B2 (zh)
KR (2) KR101117339B1 (zh)
CN (2) CN103678481B (zh)
WO (1) WO2005033890A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016107455A1 (zh) * 2014-12-29 2016-07-07 阿里巴巴集团控股有限公司 一种信息匹配处理方法和装置
CN108536709A (zh) * 2017-03-03 2018-09-14 北京明略软件系统有限公司 一种搜索优化方法及装置

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505984B1 (en) 2002-12-09 2009-03-17 Google Inc. Systems and methods for information extraction
US7836391B2 (en) * 2003-06-10 2010-11-16 Google Inc. Document search engine including highlighting of confident results
US7401072B2 (en) * 2003-06-10 2008-07-15 Google Inc. Named URL entry
US8006197B1 (en) 2003-09-29 2011-08-23 Google Inc. Method and apparatus for output of search results
US7130819B2 (en) * 2003-09-30 2006-10-31 Yahoo! Inc. Method and computer readable medium for search scoring
US7844589B2 (en) * 2003-11-18 2010-11-30 Yahoo! Inc. Method and apparatus for performing a search
US7634472B2 (en) * 2003-12-01 2009-12-15 Yahoo! Inc. Click-through re-ranking of images and other data
US7836038B2 (en) * 2003-12-10 2010-11-16 Google Inc. Methods and systems for information extraction
US8954420B1 (en) 2003-12-31 2015-02-10 Google Inc. Methods and systems for improving a search ranking using article information
US7953631B1 (en) * 2003-12-31 2011-05-31 Microsoft Corporation Paid inclusion listing enhancement
US7647300B2 (en) * 2004-01-26 2010-01-12 Google Inc. Methods and systems for output of search results
US9104689B2 (en) * 2004-03-17 2015-08-11 International Business Machines Corporation Method for synchronizing documents for disconnected operation
US8161053B1 (en) 2004-03-31 2012-04-17 Google Inc. Methods and systems for eliminating duplicate events
US8386728B1 (en) 2004-03-31 2013-02-26 Google Inc. Methods and systems for prioritizing a crawl
US7536382B2 (en) 2004-03-31 2009-05-19 Google Inc. Query rewriting with entity detection
US7333976B1 (en) * 2004-03-31 2008-02-19 Google Inc. Methods and systems for processing contact information
US7996419B2 (en) * 2004-03-31 2011-08-09 Google Inc. Query rewriting with entity detection
US8346777B1 (en) 2004-03-31 2013-01-01 Google Inc. Systems and methods for selectively storing event data
US7519581B2 (en) * 2004-04-30 2009-04-14 Yahoo! Inc. Method and apparatus for performing a search
US20060069675A1 (en) * 2004-09-30 2006-03-30 Ogilvie John W Search tools and techniques
US7945585B1 (en) * 2005-10-13 2011-05-17 Hewlett-Packard Development Company, L.P. Method and system for improving targeted data delivery
KR100776697B1 (ko) 2006-01-05 2007-11-16 주식회사 인터파크지마켓 고객 구매행동 분석에 기반한 지능화된 상품 검색 방법 및 시스템
US7769751B1 (en) * 2006-01-17 2010-08-03 Google Inc. Method and apparatus for classifying documents based on user inputs
US8055639B2 (en) * 2006-08-18 2011-11-08 Realnetworks, Inc. System and method for offering complementary products / services
KR100867081B1 (ko) * 2006-09-14 2008-11-04 엔에이치엔(주) 도서 검색에 이용되는 문서 스코어를 생성하는 방법 및상기 방법을 수행하는 시스템
US7996393B1 (en) 2006-09-29 2011-08-09 Google Inc. Keywords associated with document categories
JP4660453B2 (ja) * 2006-11-13 2011-03-30 昭和電工株式会社 窒化ガリウム系化合物半導体発光素子
US20080162475A1 (en) * 2007-01-03 2008-07-03 Meggs Anthony F Click-fraud detection method
US20080186810A1 (en) * 2007-02-06 2008-08-07 Kumaran O R Senthil System and Method for Audiovisual Content Search
US7685200B2 (en) * 2007-03-01 2010-03-23 Microsoft Corp Ranking and suggesting candidate objects
US20080249798A1 (en) * 2007-04-04 2008-10-09 Atul Tulshibagwale Method and System of Ranking Web Content
US9239835B1 (en) * 2007-04-24 2016-01-19 Wal-Mart Stores, Inc. Providing information to modules
US7860870B2 (en) * 2007-05-31 2010-12-28 Yahoo! Inc. Detection of abnormal user click activity in a search results page
US7761471B1 (en) 2007-10-16 2010-07-20 Jpmorgan Chase Bank, N.A. Document management techniques to account for user-specific patterns in document metadata
US8099417B2 (en) * 2007-12-12 2012-01-17 Microsoft Corporation Semi-supervised part-of-speech tagging
US8170349B2 (en) * 2008-03-18 2012-05-01 Yahoo! Inc. Graphical rating conversion
US8694887B2 (en) 2008-03-26 2014-04-08 Yahoo! Inc. Dynamic contextual shortcuts
US20090254454A1 (en) * 2008-04-08 2009-10-08 Mohit Gupta Method and system for providing online automobile service comparison, service ranking, expenses comparison, price matching and purchasing the desired services. Based on provisional application 60912189 filed on April 17, 2007 and ID 1688557
KR101099309B1 (ko) * 2009-07-07 2011-12-26 이정갑 상품 대결 방법 및 그를 위한 시스템 서버
US8639567B2 (en) 2010-03-19 2014-01-28 Visa U.S.A. Inc. Systems and methods to identify differences in spending patterns
US8738418B2 (en) 2010-03-19 2014-05-27 Visa U.S.A. Inc. Systems and methods to enhance search data with transaction based data
JP2013527953A (ja) * 2010-04-08 2013-07-04 ガブ リ,ジョン 商品対決方法及びそのためのシステム
US20110295684A1 (en) * 2010-06-01 2011-12-01 Jeong Gab Lee Method and server for managing advertisements
KR101024672B1 (ko) * 2010-06-01 2011-03-25 이정갑 광고 관리 방법 및 광고 관리 서버
EP2407897A1 (en) 2010-07-12 2012-01-18 Accenture Global Services Limited Device for determining internet activity
US20120036399A1 (en) * 2010-08-09 2012-02-09 Massively Parallel Technologies, Inc. System And Method For Automated Software Application Development
KR101130423B1 (ko) * 2010-08-16 2012-03-27 이정갑 광고 제공 방법 및 광고 제공 서버
KR101109974B1 (ko) * 2010-08-16 2012-02-24 이정갑 광고 관리 방법 및 광고 관리 서버
KR101109990B1 (ko) * 2010-08-16 2012-02-16 이정갑 광고 관리 방법 및 이를 위한 이동 통신 단말기
KR101109825B1 (ko) * 2010-08-16 2012-02-13 이정갑 검색 광고 제공 방법 및 검색 광고 제공 서버
US9262513B2 (en) * 2011-06-24 2016-02-16 Alibaba Group Holding Limited Search method and apparatus
CN102841904B (zh) 2011-06-24 2016-05-04 阿里巴巴集团控股有限公司 一种搜索方法及设备
CN103092856B (zh) * 2011-10-31 2015-09-23 阿里巴巴集团控股有限公司 搜索结果排序方法及设备、搜索方法及设备
US9280595B2 (en) * 2012-08-30 2016-03-08 Apple Inc. Application query conversion
KR101453623B1 (ko) * 2012-12-26 2014-10-28 한양대학교 산학협력단 추천 시스템에서 유저의 검색 키워드를 이용한 아이템 선호도 추론 방법 및 시스템
CN104252456B (zh) * 2013-06-25 2018-10-09 阿里巴巴集团控股有限公司 一种权重估计方法、装置及系统
CN103440306A (zh) * 2013-08-23 2013-12-11 百度在线网络技术(北京)有限公司 一种搜索结果的展现方法及装置
WO2015027380A1 (en) * 2013-08-26 2015-03-05 Google Inc. In-market classification for online content item placement campaigns
US11244349B2 (en) * 2015-12-29 2022-02-08 Ebay Inc. Methods and apparatus for detection of spam publication

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030065595A1 (en) * 2001-10-02 2003-04-03 Anglum Timothy J. Customer identification system & method
CN1428690A (zh) * 2001-09-26 2003-07-09 奥弗图尔服务公司 用于搜索结果列表中提供地点和价格保护的系统的自动广告商通知
US20030135490A1 (en) * 2002-01-15 2003-07-17 Barrett Michael E. Enhanced popularity ranking

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822527A (en) * 1990-05-04 1998-10-13 Digital Equipment Corporation Method and apparatus for information stream filtration using tagged information access and action registration
ATE189325T1 (de) * 1990-10-05 2000-02-15 Microsoft Corp System und verfahren für informationsauffindung
US5555346A (en) * 1991-10-04 1996-09-10 Beyond Corporated Event-driven rule-based messaging system
US5283856A (en) * 1991-10-04 1994-02-01 Beyond, Inc. Event-driven rule-based messaging system
US5467268A (en) * 1994-02-25 1995-11-14 Minnesota Mining And Manufacturing Company Method for resource assignment and scheduling
US5590269A (en) * 1994-04-22 1996-12-31 Minnesota Mining & Manufacturing Company Resource assignment system providing mixed-initiative user interface updates
US5724567A (en) * 1994-04-25 1998-03-03 Apple Computer, Inc. System for directing relevance-ranked data objects to computer users
US5706497A (en) * 1994-08-15 1998-01-06 Nec Research Institute, Inc. Document retrieval using fuzzy-logic inference
US6029195A (en) * 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
US5619648A (en) * 1994-11-30 1997-04-08 Lucent Technologies Inc. Message filtering techniques
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US5717913A (en) * 1995-01-03 1998-02-10 University Of Central Florida Method for detecting and extracting text data using database schemas
US5799304A (en) * 1995-01-03 1998-08-25 Intel Corporation Information evaluation
JP3455790B2 (ja) * 1995-06-30 2003-10-14 富士通株式会社 情報検索に利用するノウハウ管理装置
US5649186A (en) * 1995-08-07 1997-07-15 Silicon Graphics Incorporated System and method for a computer-based dynamic information clipping service
US5640553A (en) * 1995-09-15 1997-06-17 Infonautics Corporation Relevance normalization for documents retrieved from an information retrieval system in response to a query
US5867799A (en) * 1996-04-04 1999-02-02 Lang; Andrew K. Information system and method for filtering a massive flow of information entities to meet user information classification needs
US5826022A (en) * 1996-04-05 1998-10-20 Sun Microsystems, Inc. Method and apparatus for receiving electronic mail
US5819269A (en) * 1996-06-21 1998-10-06 Robert G. Uomini Dynamic subgrouping in a news network
US5987460A (en) * 1996-07-05 1999-11-16 Hitachi, Ltd. Document retrieval-assisting method and system for the same and document retrieval service using the same with document frequency and term frequency
US6119114A (en) * 1996-09-17 2000-09-12 Smadja; Frank Method and apparatus for dynamic relevance ranking
US6072942A (en) * 1996-09-18 2000-06-06 Secure Computing Corporation System and method of electronic mail filtering using interconnected nodes
US5909679A (en) * 1996-11-08 1999-06-01 At&T Corp Knowledge-based moderator for electronic mail help lists
US5899992A (en) * 1997-02-14 1999-05-04 International Business Machines Corporation Scalable set oriented classifier
US6006222A (en) * 1997-04-25 1999-12-21 Culliss; Gary Method for organizing information
US5870744A (en) * 1997-06-30 1999-02-09 Intel Corporation Virtual people networking
JP3087694B2 (ja) * 1997-07-15 2000-09-11 日本電気株式会社 情報検索装置及びプログラムを記録した機械読み取り可能な記録媒体
US6182068B1 (en) * 1997-08-01 2001-01-30 Ask Jeeves, Inc. Personalized search methods
US6249805B1 (en) * 1997-08-12 2001-06-19 Micron Electronics, Inc. Method and system for filtering unauthorized electronic mail messages
US20010014868A1 (en) * 1997-12-05 2001-08-16 Frederick Herz System for the automatic determination of customized prices and promotions
US6052709A (en) * 1997-12-23 2000-04-18 Bright Light Technologies, Inc. Apparatus and method for controlling delivery of unsolicited electronic mail
US5999932A (en) * 1998-01-13 1999-12-07 Bright Light Technologies, Inc. System and method for filtering unsolicited electronic mail messages using data matching and heuristic processing
EP1062602B8 (en) * 1998-02-13 2018-06-13 Oath Inc. Search engine using sales and revenue to weight search results
US7124129B2 (en) * 1998-03-03 2006-10-17 A9.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6321221B1 (en) * 1998-07-17 2001-11-20 Net Perceptions, Inc. System, method and article of manufacture for increasing the user value of recommendations
US6366910B1 (en) * 1998-12-07 2002-04-02 Amazon.Com, Inc. Method and system for generation of hierarchical search results
US6189002B1 (en) * 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
US6266692B1 (en) * 1999-01-04 2001-07-24 International Business Machines Corporation Method for blocking all unwanted e-mail (SPAM) using a header-based password
US6466970B1 (en) * 1999-01-27 2002-10-15 International Business Machines Corporation System and method for collecting and analyzing information about content requested in a network (World Wide Web) environment
US6393423B1 (en) * 1999-04-08 2002-05-21 James Francis Goedken Apparatus and methods for electronic information exchange
WO2000065509A2 (en) * 1999-04-22 2000-11-02 Qode.Com, Inc. System and method for providing electronic information upon receipt of a scanned bar code
US6269361B1 (en) * 1999-05-28 2001-07-31 Goto.Com System and method for influencing a position on a search result list generated by a computer network search engine
US6571238B1 (en) * 1999-06-11 2003-05-27 Abuzz Technologies, Inc. System for regulating flow of information to user by using time dependent function to adjust relevancy threshold
US6578025B1 (en) * 1999-06-11 2003-06-10 Abuzz Technologies, Inc. Method and apparatus for distributing information to users
US6546390B1 (en) * 1999-06-11 2003-04-08 Abuzz Technologies, Inc. Method and apparatus for evaluating relevancy of messages to users
US6499052B1 (en) * 1999-08-11 2002-12-24 Yahoo! Inc. Electronic commerce system for referencing remote commerce sites at a local commerce site
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
EP1240605A4 (en) * 1999-12-08 2006-09-27 Amazon Com Inc SYSTEM AND METHOD FOR LOCATING AND PRESENTING OFFERS OF ACCESSIBLE PRODUCTS ON THE INTERNET
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
WO2001042880A2 (en) * 1999-12-10 2001-06-14 Amazon.Com, Inc. Search query refinement using related search phrases
US6480837B1 (en) * 1999-12-16 2002-11-12 International Business Machines Corporation Method, system, and program for ordering search results using a popularity weighting
US6546388B1 (en) * 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6701314B1 (en) * 2000-01-21 2004-03-02 Science Applications International Corporation System and method for cataloguing digital information for searching and retrieval
US6704727B1 (en) * 2000-01-31 2004-03-09 Overture Services, Inc. Method and system for generating a set of search terms
JP2002032408A (ja) 2000-05-09 2002-01-31 Yutaka Nishimura 商品情報提供方法及び商品情報提供システム並びに検索システム。
JP4552291B2 (ja) 2000-08-23 2010-09-29 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US7925967B2 (en) * 2000-11-21 2011-04-12 Aol Inc. Metadata quality improvement
US20030014331A1 (en) * 2001-05-08 2003-01-16 Simons Erik Neal Affiliate marketing search facility for ranking merchants and recording referral commissions to affiliate sites based upon users' on-line activity
US6792414B2 (en) * 2001-10-19 2004-09-14 Microsoft Corporation Generalized keyword matching for keyword based searching over relational databases
US20030216930A1 (en) * 2002-05-16 2003-11-20 Dunham Carl A. Cost-per-action search engine system, method and apparatus
US7606798B2 (en) * 2003-09-22 2009-10-20 Google Inc. Methods and systems for improving a search ranking using location awareness
US7693827B2 (en) * 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
US7130819B2 (en) * 2003-09-30 2006-10-31 Yahoo! Inc. Method and computer readable medium for search scoring
US7346629B2 (en) * 2003-10-09 2008-03-18 Yahoo! Inc. Systems and methods for search processing using superunits

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1428690A (zh) * 2001-09-26 2003-07-09 奥弗图尔服务公司 用于搜索结果列表中提供地点和价格保护的系统的自动广告商通知
US20030065595A1 (en) * 2001-10-02 2003-04-03 Anglum Timothy J. Customer identification system & method
US20030135490A1 (en) * 2002-01-15 2003-07-17 Barrett Michael E. Enhanced popularity ranking

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
常璐等: "搜索引擎的几种常用排序算法", 《图书情报工作》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016107455A1 (zh) * 2014-12-29 2016-07-07 阿里巴巴集团控股有限公司 一种信息匹配处理方法和装置
CN105808541A (zh) * 2014-12-29 2016-07-27 阿里巴巴集团控股有限公司 一种信息匹配处理方法和装置
CN105808541B (zh) * 2014-12-29 2019-11-08 阿里巴巴集团控股有限公司 一种信息匹配处理方法和装置
CN108536709A (zh) * 2017-03-03 2018-09-14 北京明略软件系统有限公司 一种搜索优化方法及装置
CN108536709B (zh) * 2017-03-03 2021-04-30 北京明略软件系统有限公司 一种搜索优化方法及装置

Also Published As

Publication number Publication date
US7130819B2 (en) 2006-10-31
EP1668591A2 (en) 2006-06-14
WO2005033890A3 (en) 2005-12-08
US7840442B2 (en) 2010-11-23
JP2007507808A (ja) 2007-03-29
KR101117339B1 (ko) 2012-03-07
WO2005033890A2 (en) 2005-04-14
CN1890684A (zh) 2007-01-03
KR20080040055A (ko) 2008-05-07
CN103678481B (zh) 2018-04-17
KR20060095553A (ko) 2006-08-31
EP1668591A4 (en) 2009-04-22
KR100883463B1 (ko) 2009-02-16
US20070016491A1 (en) 2007-01-18
WO2005033890A8 (en) 2006-08-10
US20050071255A1 (en) 2005-03-31
JP4754493B2 (ja) 2011-08-24

Similar Documents

Publication Publication Date Title
CN103678481A (zh) 用于搜索记分的方法和设备
US7519581B2 (en) Method and apparatus for performing a search
US10846775B1 (en) Identifying item recommendations through recognized navigational patterns
Abdollahpouri et al. Managing popularity bias in recommender systems with personalized re-ranking
US20200151232A1 (en) Enhanced seller-oriented search results
US9201963B2 (en) Method and apparatus for performing a search
US7831474B2 (en) System and method for associating an unvalued search term with a valued search term
US8015065B2 (en) Systems and methods for assigning monetary values to search terms
US8131601B2 (en) Method of providing customized information of commodity for on-line shopping mall users
US8417573B2 (en) Sponsored listing recommendation engine
US20030126095A1 (en) Context-aware market-making service
US8239287B1 (en) System for detecting probabilistic associations between items
JP2013541082A (ja) 商品推薦
KR100889230B1 (ko) 쇼핑몰 상품 검색 서비스 시스템 및 방법
WO2013009556A1 (en) Search-aware conditional bidding on advertisement display
WO2001037193A1 (en) System, method, and article of manufacture for recommending items to users based on user preferences
CN111400587B (zh) 用户分类方法、装置、电子设备和存储介质
Desikan et al. Web mining for business computing
WO2002019200A1 (en) Method and apparatus for custom-made electrical commercial transaction
CN101615277B (zh) 一种统计数据的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: ADVANCED ACTIVE INVESTMENTS LIMITED

Free format text: FORMER OWNER: YAHOO CORP.

Effective date: 20140418

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140418

Address after: Virgin Islands Luo Decheng

Applicant after: Vigor Investment Company Limited

Address before: American California

Applicant before: Yahoo Corp.

REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1194506

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1194506

Country of ref document: HK