CN102110135A - 信息处理装置、估计关联度的方法和程序 - Google Patents

信息处理装置、估计关联度的方法和程序 Download PDF

Info

Publication number
CN102110135A
CN102110135A CN2010106150432A CN201010615043A CN102110135A CN 102110135 A CN102110135 A CN 102110135A CN 2010106150432 A CN2010106150432 A CN 2010106150432A CN 201010615043 A CN201010615043 A CN 201010615043A CN 102110135 A CN102110135 A CN 102110135A
Authority
CN
China
Prior art keywords
information
association
information word
user
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010106150432A
Other languages
English (en)
Other versions
CN102110135B (zh
Inventor
萩原丈博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN102110135A publication Critical patent/CN102110135A/zh
Application granted granted Critical
Publication of CN102110135B publication Critical patent/CN102110135B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Abstract

本发明公开了一种信息处理装置、估计关联度的方法和程序。根据本发明的信息处理装置包括:存储单元,其存储定义多个信息元的信息元数据;信息获取单元,其从可通过通信网络访问的信息源获取彼此具有参考关系的信息集;分类单元,其将通过所述信息获取单元获取的所述信息集中包括的信息分类成对应于通过所述信息元数据定义的信息元的第一类信息和除了所述第一类信息之外的第二类信息;以及估计单元,其基于所述信息集中的所述第一类信息和所述第二类信息之间的参考关系,估计分别对应于两个或更多所述第一类信息的信息元之间的关联度。

Description

信息处理装置、估计关联度的方法和程序
技术领域
本发明涉及信息处理装置、估计关联度的方法和程序。
背景技术
随着信息和通信技术的近来发展,通过网络向用户提供各种信息如音乐、视频、电子书、新闻文章、产品信息或事件信息。用于个人用户从如此众多的信息中寻找适合于该用户的信息的典型技术之一是用户通过他/她自己进行搜索的技术,另一种是系统为用户推荐适当信息的技术。
用于用户通过他/她自己进行搜索的一种技术是关键词搜索。然而,关键词搜索具有如下缺点:对于操作没有键盘的终端装置的用户而言,输入关键词很麻烦。进一步,在关键词搜索的情况下,因为使用出现在用户脑海中的关键词来进行搜索,所以用户找到可用信息或意外的新颖信息的可能性低。用于用户通过他/她自己进行搜索的另一种技术是种类(genre)搜索。在种类搜索的情况下,通过相继选择预定义的分级种类来进行搜索。然而,向存在于网络上的各种信息人工分配足够的种类并不容易。
在被称为推荐技术的系统推荐适合于用户的信息的技术中,在许多情况下,根据用户的行为比如查看的信息或购买的内容而将用户的偏好定义为得分,并且推荐适合于用户偏好的信息。例如,日本待审专利公布第2004-355340号和第2006-251866号提议不仅推荐适合于用户偏好的内容,而且还展示推荐给用户的原因。
发明内容
一般而言,关于将信息与信息相关联存在大量各种各样的观点。因此,将有限种的种类分配给极多种的信息以便满足许多用户并不容易。进一步,在基于被定义为固定矢量空间中的得分的用户偏好来进行推荐的情况下,因为仅从对应于矢量空间的观点来选择将要推荐的信息,所以很可能仅推荐用户预料之内(不新颖)的信息。进一步,敢于向用户推荐出乎意料的信息提出了如下问题:难以说服用户为什么推荐该信息。
另一方面,如果可以实现灵活地提取多种观点以将信息与信息相关联,并且使用提取的观点用于通过用户或推荐进行的信息搜索,则能够将用户导航至令人惊讶的信息并充分说服用户。
考虑到上述情况,希望提供一种新颖和改进的信息处理装置、估计关联度的方法和程序,其可以提取多种观点以将信息与信息相关联,并且利用所述观点用于信息搜索或推荐。
根据本发明的实施例,提供了一种信息处理装置,该信息处理装置包括:存储单元,其存储定义多个信息元的信息元数据;信息获取单元,其从可通过通信网络访问的信息源获取彼此具有参考关系的信息集;分类单元,其将通过所述信息获取单元获取的所述信息集中包括的信息分类成对应于通过所述信息元数据定义的信息元的第一类信息和除了所述第一类信息之外的第二类信息;以及估计单元,其基于所述信息集中的所述第一类信息和所述第二类信息之间的参考关系,估计分别对应于两个或更多所述第一类信息的信息元之间的关联度。
在这种配置中,从可通过通信网络访问的信息源获取第一类信息和第二类信息。第一类信息对应于通过信息元数据定义的信息元。信息元数据例如可以定义将要用于信息搜索或推荐的每个信息。进一步,第二类信息被视为如下信息,该信息表示很可能连接两个或更多信息元的观点。基于第一类信息和第二类信息之间的参考关系,估计单元估计可以用于各种目的如信息搜索或推荐的两个或更多信息元之间的关联度。
基于信息集中的第一类信息和第二类信息之间的参考关系,估计单元可以进一步确定分别对应于两个或更多第一类信息的信息元之间的关联类型。
估计单元可以相对于信息集中的每个信息计数从第一类信息至第二类信息的参考数目和从第二类信息至第一类信息的参考数目中的至少一个,并且基于针对共同的第二类信息而计数的参考数目来计算分别对应于参考了共同的第二类信息或者从共同的第二类信息被参考的两个或更多第一类信息的信息元之间的关联度。
估计单元可以根据共同的第二类信息确定分别对应于两个或更多第一类信息的信息元之间的关联类型。
信息处理装置可以进一步包括:屏幕控制单元,其输出信息元显示屏,该信息元显示屏显示在通过估计单元进行的估计的结果中彼此相关联的两个信息元以便彼此相邻。
信息元显示屏可以是如下屏幕,其中,在一个信息元被选择的状态下,相邻于所选信息元显示的另一个信息元可由用户选择。
屏幕控制单元可以在信息元显示屏上将由用户选择的信息元相继布置在第一方向上,并且将与由用户最近选择的信息元相关联的多个信息元布置在不同于第一方向的第二方向上,而且布置在第二方向上的每个信息元可以由用户选择。
屏幕控制单元可以在信息元显示屏上在彼此相邻显示的两个信息元附近显示这两个信息元之间的关联类型。
屏幕控制单元可以在信息元显示屏上仅显示在通过估计单元进行的估计的结果中具有一定关联度的信息元当中属于给定类别的信息元。
信息处理装置可以进一步包括:推荐单元,其当用户查看第一内容和第二内容时,向所述用户推荐根据对应于所述第一内容和所述第二内容的信息元之间的关联类型而选择的别的内容。
信息处理装置可以进一步包括:分析单元,其当用户查看一系列信息元时,通过使用所述一系列信息元中包括的彼此相关联的信息元之间的关联度来确定所述用户的偏好。信息处理装置可以进一步包括:推荐单元,其向用户推荐基于通过分析单元确定的用户偏好而选择的内容。
信息处理装置可以进一步包括:推荐单元,其向用户推荐基于用户查看的信息元而选择的内容,并且根据对应于所述内容的信息元和作为选择所述内容的基础的信息元之间的关联类型,向用户展示推荐所述内容的原因。
信息处理装置可以进一步包括:推荐单元,其向用户推荐从具有对应于多个信息元当中一个或多个信息元的属性的内容中根据用户的行为历史而选择的内容,并且根据对应于所选内容的属性的信息元和另一个信息元之间的关联类型,向用户展示推荐所选内容的原因。
这样的另一个信息元是对应于作为选择所述内容的基础的另一个内容的属性的信息元。
这样的另一个信息元是对应于用户的用户偏好的属性的信息元。
由信息元数据定义的多个信息元可以包括对应于音乐内容的信息元,并且信息处理装置可以进一步包括:播放单元,其相继播放对应于通过估计单元进行的估计的结果中的彼此相关联的信息元的音乐内容。
根据本发明的另一个实施例,提供了一种通过使用信息处理装置来估计信息元之间的关联度的方法,所述信息处理装置包括存储定义多个信息元的信息元数据的存储单元,所述方法包括以下步骤:从可通过通信网络访问的信息源获取彼此具有参考关系的信息集;将从所述信息源获取的所述信息集中包括的信息分类成对应于通过所述信息元数据定义的信息元的第一类信息和除了所述第一类信息之外的第二类信息;以及基于所述信息集中的所述第一类信息和所述第二类信息之间的参考关系,估计分别对应于两个或更多所述第一类信息的信息元之间的关联度。
根据本发明的另一个实施例,提供了一种使控制信息处理装置的计算机起到如下装置的作用的程序,所述信息处理装置包括存储定义多个信息元的信息元数据的存储单元,所述装置包括:信息获取单元,其从可通过通信网络访问的信息源获取彼此具有参考关系的信息集;分类单元,其将通过所述信息获取单元获取的所述信息集中包括的信息分类成对应于通过所述信息元数据定义的信息元的第一类信息和除了所述第一类信息之外的第二类信息;以及估计单元,其基于所述信息集中的所述第一类信息和所述第二类信息之间的参考关系,估计分别对应于两个或更多所述第一类信息的信息元之间的关联度。
根据上面描述的本发明的实施例,可以提供一种信息处理装置、估计关联度的方法和程序,其可以提取多种观点以将信息与信息相关联,并且利用所述观点用于信息搜索或推荐。
附图说明
图1是示出根据一个实施例的信息处理系统的概况的示意图。
图2是示出根据一个实施例的信息处理装置的配置例子的框图。
图3是示出根据一个实施例的信息元数据的例子的说明图。
图4A是用于说明根据一个实施例的分类单元所进行的信息分类的例子的说明图。
图4B是用于说明根据一个实施例的分类单元所进行的信息分类的另一个例子的说明图。
图5是用于说明根据一个实施例的对参考数目进行计数的基本规则的说明图。
图6A是示出与对共同关联类信息的参考数目相关的数据的例子的说明图。
图6B是示出与来自共同关联类信息的参考数目相关的数据的例子的说明图。
图6C是用于说明根据图6A和6B中的数据的例子存储参考数目的计数结果的第一表格的说明图。
图6D是用于说明根据图6A和6B中的数据的例子存储参考数目的计数结果的第二表格的说明图。
图7是用于说明存储朝向/来自节点类信息的参考数目的计数结果的第三表格的说明图。
图8是示出针对基于参考数目的计数结果而计算的每个关联类信息的信息元之间的关联度的例子的说明图。
图9是示出根据一个实施例的可以通过估计单元来确定的信息元之间的关联类型的例子的说明图。
图10是示出根据一个实施例的通过估计单元计算的信息元之间的关联度的例子的说明图。
图11是示出根据一个实施例的信息元显示屏的例子的说明图。
图12A是用于说明根据第一用户输入的图11所示的信息元显示屏的变化的说明图。
图12B是用于说明根据第二用户输入的图11所示的信息元显示屏的变化的说明图。
图12C是用于说明根据第三用户输入的图11所示的信息元显示屏的变化的说明图。
图13是用于说明根据一个实施例的推荐单元所进行的推荐过程的例子的说明图。
图14是用于说明根据一个实施例的分析单元所进行的用户偏好分析过程的例子的第一说明图。
图15是用于说明根据一个实施例的分析单元所进行的用户偏好分析过程的例子的第二说明图。
图16是示出根据一个实施例的通过推荐单元在上面展示推荐原因的推荐屏幕的例子的说明图。
图17是用于说明根据一个实施例的通过推荐单元确定推荐原因的过程的第一替换例子的说明图。
图18是用于说明根据一个实施例的通过推荐单元确定推荐原因的过程的第二替换例子的说明图。
图19是示出根据第一应用例子的信息处理装置的配置例子的框图。
图20是示出根据第二应用例子的信息处理装置的配置例子的框图。
图21是示出通用计算机的配置例子的框图。
具体实施方式
在下文中,将参考附图详细地描述本发明的优选实施例。注意,在这个说明书和附图中,具有基本上相同功能和结构的结构元件用相同的标号来指示,并且省略这些结构元件的重复说明。
将以如下顺序在下文中描述本发明的优选实施例:
1.信息处理系统概述
2.根据实施例的信息处理装置的示例配置
2-1.关联度估计
2-2.导航
2-3.对推荐的应用
3.其它应用例子
3-1.音乐的回放
3-2.位置信息的使用
4.硬件配置
5.总结
<1.信息处理系统概述>
参考图1在下文中描述可以对其应用本发明的一个实施例的信息处理系统。图1是示出根据本发明的一个实施例的信息处理系统1的概况的示意图。参考图1,信息处理系统1包括信息处理装置100和终端装置200。信息处理装置100通过通信网络3连接到终端装置200。
通信网络3是在信息处理装置100和终端装置200之间进行连接的通信网络。通信网络3可以是任意通信网络如因特网、因特网协议-虚拟专用网络(IP-VPN)、租用线路、局域网(LAN)或广域网(WAN)。通信网络3可以是有线或无线的。进一步,信息处理装置100可以通过通信网络3访问包括一个或多个服务器5a、5b等等的信息源5。
服务器5a和5b是可以通过通信网络3从信息处理装置100进行访问的服务器装置。每个服务器例如可以是网络服务器,其响应于来自信息处理装置100的请求而传送网络页面。代替地,每个服务器例如可以是内容服务器、数据库服务器或日志服务器等等。
信息处理装置100是用于从服务器5a或5b获取信息集并且通过使用该信息集来估计信息元之间的关联度的装置。取决于信息处理装置100所提供的服务的目的来定义通过信息处理装置100来估计其关联度的信息元。例如,当目的是要通过数字广播来引导电视节目时,可以将节目名称或演员名称定义为信息元。进一步,当目的是要提供音乐内容时,可以将艺术家名称或音乐标题等定义为信息元。彼此具有参考关系的信息的集合被选择作为由信息处理装置100使用的信息集。例如,在从网络服务器提供的一组网络页面中,通过网络页面之间的链接来给出参考关系。进一步,在从内容服务器提供的电子节目指南(EPG)中,通过表示节目指南、演员或种类的信息之间的链接来给出参考关系。进而,在从日志服务器提供的电子商务(EC)站点的服务日志中,通过用户的查看历史等在用户和产品信息之间给出参考关系。信息处理装置100基于这样的信息集中的参考关系来估计信息元之间的关联度。进一步,在这个实施例中,信息处理装置100为用户提供图形用户接口(GUI)以搜索信息元。信息处理装置100例如可以是如图1所示的通用计算机。代替地,信息处理装置100例如可以是安装在家用网络等中的数字家用电器。
终端装置200是由用户操作的装置,并且终端装置200在其显示器上显示从信息处理装置100提供的GUI。这样一来,用户就可以在通过信息处理装置100进行的导航的支持下搜索信息元。进一步,终端装置200在其显示器上显示由信息处理装置100推荐的信息元。终端装置200例如可以是任意终端装置如个人计算机(PC)、蜂窝电话、个人数字助理(PDA)或游戏终端。
<2.根据实施例的信息处理装置的示例配置>
下面描述根据实施例的信息处理装置100的配置的例子。图2是示出信息处理装置100的配置例子的框图。参考图2,信息处理装置100包括信息获取单元110、存储单元120、分类单元130、估计单元140、关联度数据库(DB)150、屏幕控制单元160、推荐单元170、分析单元180和偏好DB 190。
[2-1.关联度估计]
在图2所示的信息处理装置100的组成部分当中,信息获取单元110、存储单元120、分类单元130和估计单元140主要涉及信息元之间的关联度的估计。
(信息获取单元)
信息获取单元110从可通过通信网络3访问的信息源5中获取彼此具有参考关系的信息集。通过信息获取单元110获取的信息集可以是如上所述相互链接的一组网络页面、EPG或服务日志等。信息获取单元110将获取的信息集输出到分类单元130。
(存储单元)
通过使用存储介质如硬盘或半导体存储器,存储单元120预先存储定义多个信息元的信息元数据。信息元数据根据服务的目的定义多个信息元。例如,通过信息元数据定义的信息元可以包括个人的名称如电视节目的演员名称或与音乐内容相关联的艺术家名称以及内容的名称如电视节目的节目名称或音乐标题。
图3是示出根据实施例的存储单元120中存储的信息元数据的例子的说明图。参考图3,示出了具有两个数据项“信息元”和“类别”的信息元数据122。信息元数据122的“信息元”是表示每个信息元的字符串。“类别”指示每个信息元的类型。在图3的例子中,列在左侧的信息元属于“个人”类别。另一方面,列在右侧的信息元属于“内容”类别。这样一来,这个例子的信息元数据就涉及个人正本(master)和内容正本。信息元数据用于通过分类单元130(下一步描述)进行的信息分类。进一步,信息元的类别还可以用于在信息元显示屏上显示信息元(稍后描述)。
(分类单元)
分类单元130将通过信息获取单元110获取的信息集中包括的每个信息分类成对应于信息元数据所定义的信息元的第一类信息和除了第一类信息之外的第二类信息。在以下描述中,第一类被称为节点类,而第二类则被称为关联类。
节点类是用于与信息元数据所定义的信息元相对应的信息的类。例如,描述通过图3所示的信息元数据122定义的每个个人或每个内容的信息可以是节点类的信息。另一方面,关联类则是用于除了节点类信息之外的信息的类。特别地,描述除了通过图3所示的信息元数据122定义的个人和内容之外的事物的信息可以是关联类的信息。关联类信息具有与节点类信息的参考关系,从而表示了分别对应于两个或更多节点类信息的信息元之间的关联性。
图4A是用于说明根据实施例的分类单元130所进行的信息分类的例子的说明图。在图4A的左侧,示出了包括通过信息获取单元110从网络服务器获取的一组网络页面的信息集112a。例如,假定信息集112a中包括的每个网络页面具有与网络页面的描述相关的标题。分类单元130针对信息元数据所定义的“信息元”检查每个网络页面的标题,并且将具有匹配“信息元”的标题的网络页面分类成节点类,而将具有不匹配“信息元”的标题的网络页面分类成关联类。例如,参考图4A的右侧,网络页面134a和网络页面134b被分类成节点类的信息132。网络页面134a描述个人(“演员A”)。进一步,网络页面134b描述内容(“电影B”)。进一步,网络页面138a和网络页面138b被分类成关联类的信息136。网络页面138a描述奖赏(“奖赏A”)。进一步,网络页面138b描述城市(“城市B”)。如上所述,信息彼此具有参考关系。在图4A的例子中,网络页面134a具有用于参考网络页面138a的链接。进一步,网络页面138b具有用于参考网络页面134b的链接。
图4B是用于说明根据实施例的分类单元130所进行的信息分类的另一个例子的说明图。在图4B的左侧,示出了包括通过信息获取单元110从日志服务器获取的服务日志的信息集112b。例如,假定信息集112b中包括的服务日志表示每个用户的行为历史如内容查看或购买。分类单元130针对信息元数据所定义的“信息元”检查服务日志的每个条目中包括的内容名称。然后,分类单元130将与具有匹配“信息元”的内容名称的内容相关的信息分类成节点类,并将与已查看或购买了该内容的用户相关的信息分类成关联类。例如,参考图4B的右侧,节点类的信息133包括与三个内容(“项目A”、“项目B”和“项目C”)相关的信息。进一步,关联类的信息包括与两个用户(“用户U1”和“用户U2”)相关的信息。每个用户信息具有对每个内容信息的参考关系(查看、购买等)。
分类单元130如上所述将信息集中包括的每个信息分类成节点类信息和关联类信息,并且将节点类信息和关联类信息输出到估计单元140。
(估计单元)
基于分类单元130所分类的节点类信息和关联类信息之间的参考关系,估计单元140估计分别对应于两个或更多节点类信息的信息元之间的关联度。进一步,估计单元140还基于该参考关系来确定分别对应于两个或更多节点类信息的信息元之间的关联类型。
通过估计单元140估计关联度的过程大致分成两个步骤。第一步骤是对参考的数目进行计数。第二步骤是基于计数的参考数目来计算关联度。
(1)对参考的数目进行计数
估计单元140首先相对于信息集中的每个信息计数从节点类信息至关联类信息的参考数目和从关联类信息至节点类信息的参考数目。图5是用于说明根据实施例的通过估计单元140对参考数目进行计数的基本规则的说明图。在图5的左侧的栏中,从节点类至关联类的参考和从关联类至节点类的参考被示出为在两个类型方向上的参考。
从节点类至关联类的参考当集中在节点类信息时是出站(outbound)参考,当集中在关联类信息时是入站(inbound)参考。当估计单元140在信息集中检测从节点类至关联类的参考时,估计单元140累计关于节点类信息NX的出站参考的数目Rn_out(NX),并且还累计关于关联类信息AY的入站参考的数目Ra_in(AY)。
进一步,从关联类至节点类的参考当集中在节点类信息时是入站参考,当集中在关联类信息时是出站参考。当估计单元140在信息集中检测从关联类至节点类的参考时,估计单元140累计关于节点类信息NX的入站参考的数目Rn_in(NX),并且还累计关于关联类信息AY的出站参考的数目Ra_out(AY)。
注意,当在图5所示的两个类型方向上的参考当中仅存在一个方向上的参考时,可以省略对另一个方向上的参考的计数。例如,当如图4B所示的例子中那样仅存在从关联类信息至节点类信息的参考时,仅计数关于节点类信息NX的入站参考的数目Rn_in(NX)和关于关联类信息AY的出站参考的数目Ra_out(AY)。
根据上述规则,估计单元140相对于信息集中的每个信息计数从节点类信息至关联类信息的参考数目和从关联类信息至节点类信息的参考数目中的至少一个。
在下文中参考图6A至6D和图7使用特定例子描述通过估计单元140进行的对参考数目的计数。
首先,如图6A所示,估计单元140相对于每个关联类信息计数入站参考的数目Ra_in()。例如,关联类信息A1被从节点类信息N1和N2参考,并且Ra_in(A1)=2。进一步,关联类信息A2被从节点类信息N1、N2和N4参考,并且Ra_in(A2)=3。进而,关联类信息A3被从节点类信息N1、N3和N4参考,并且Ra_in(A3)=3。另外,关联类信息A4被从节点类信息N3和N4以及两个其它节点类信息参考,并且Ra_in(A4)=4。
进一步,如图6B所示,估计单元140相对于每个关联类信息计数出站参考的数目Ra_out()。例如,关联类信息A1参考节点类信息N2和N3以及另一个节点类信息,并且Ra_out(A1)=3。进一步,关联类信息A2参考节点类信息N1和N2,并且Ra_out(A2)=2。进而,关联类信息A3参考节点类信息N3和N4,并且Ra_out(A3)=2。另外,关联类信息A4参考节点类信息N2、N3和N4以及另一个节点类信息,并且Ra_out(A4)=4。
下一步,如图6C所示,针对参考共同关联类信息的节点类信息与该共同关联类信息的每个组合,估计单元140在表格142a上列举关联类信息的入站参考数目Ra_in()和出站参考数目Ra_out()。例如,在图6A中,节点类信息N1和N2参考共同的关联类信息A1。因此,表格142a包含了针对信息N1、A1和N2的组合的条目Ra_in(A1)=2和Ra_out(A1)=3。进一步,节点类信息N1和N3参考共同的关联类信息A3。因此,表格142a包含了针对信息N1、A3和N3的组合的条目Ra_in(A3)=3和Ra_out(A3)=2。以同样的方式,估计单元140还列举了针对其它组合的关联类信息的参考数目Ra_in()和Ra_out()。
进一步,如图6D所示,针对被从共同关联类信息参考的节点类信息与该共同关联类信息的每个组合,估计单元140在表格142b上列举关联类信息的入站参考数目Ra_in()和出站参考数目Ra_out()。例如,在图6B中,节点类信息N1和N2被从共同的关联类信息A2参考。因此,表格142b包含了针对信息N1、A2和N2的组合的条目Ra_out(A2)=2和Ra_in(A2)=3。进一步,节点类信息N2和N3被从共同的关联类信息A1参考。因此,表格142b包含了针对信息N2、A1和N3的组合的条目Ra_out(A1)=3和Ra_in(A1)=2。以同样的方式,估计单元140还列举了针对其它组合的关联类信息的参考数目Ra_out()和Ra_in()。
注意,当在图5所示的两个类型方向上的参考当中仅存在一个方向上的参考时,可以不生成表格142a或表格142b中的任何一个。进一步,在以下描述中,表格142a中的入站参考数目用Ra1_in()来指示,而表格142b中的入站参考数目则用Ra2_in()来指示,从而在它们之间进行区别。进一步,表格142a中的出站参考数目用Ra1_out()来指示,而表格142b中的出站参考数目则用Ra2_out()来指示,从而在它们之间进行区别。
然后,如图7所示,估计单元140在表格144上列举每个节点类信息的入站参考数目Rn_in()和出站参考数目Rn_out()。例如,参考图7,表格144包含了针对信息N1至N4的入站和出站参考数目的总共八个值。具体地,Rn_in(N1)=1,Rn_out(N1)=4,Rn_in(N2)=3,Rn_out(N2)=2,Rn_in(N3)=3,Rn_out(N3)=2,Rn_in(N4)=2,并且Rn_out(N4)=4。
(关联度计算)
基于那些计数的结果,估计单元140计算分别对应于两个或更多节点类信息的信息元之间的关联度。估计单元140首先相对于每个共同关联类信息计算信息元之间的关联度。假定分别对应于针对共同关联类信息Ak的节点类信息Ni和Nj的信息元之间的关联度为DA(Ni,Nj,Ak),例如可以通过以下表达式来计算DA(Ni,Nj,Ak)。
表达式(1):
DA ( Ni , Nj , Ak ) = ( R n _ in ( Ni ) R n _ out ( Ni ) + R n _ in ( Nj ) R n _ out ( Nj ) ) ( w i R a 1 _ in ( Ak ) R a 1 _ out ( Ak ) + w 2 R a 2 _ in ( Ak ) R a 2 _ out ( Ak ) )
注意,取决于对朝向关联类信息的参考和来自关联类信息的参考中的哪一个给予更大的重要性,预先设置表达式(1)中的加权因数w1和w2的值。进一步,当在表格142a中不存在(Ni,Nj,Ak)的组合时,用加权因数w1=0来计算表达式(1)。同样地,当在表格142b中不存在(Ni,Nj,Ak)的组合时,用加权因数w2=0来计算表达式(1)。
表达式(1)右手侧的第一部分表示的是,当两个节点类信息并不大量参考其它信息但这两个节点类信息被从其它信息大量参考时,关联度计算得较高。进一步,表达式(1)右手侧的第二部分表示的是,当共同关联类信息并不大量参考其它信息但这个共同关联类信息被从其它信息大量参考时,关联度计算得较高。使用这样的计算关联度的表达式,可以减少链接收集网络页面对关联度估计的影响,并且增强网络页面之间的较强参考关系(例如当对应于少数链接之一时)对关联度估计的贡献。
上面描述的表达式(1)只是个例子。估计单元140例如可以使用以下表达式(2)或(3)而不是表达式(1)来计算关联度DA(Ni,Nj,Ak)。进一步,估计单元140可以根据表达式(1)至(3)中的任何一个来计算试验性的关联度,然后将每个计算的值除以它们的最大值,从而计算归一化的关联度。进一步,估计单元140可以使用试验性的关联度的偏差作为最后的关联度。
表达式(2):
DA ( Ni , Nj , Ak ) = ( R n _ in ( Ni ) + R n _ in ( Nj ) R n _ out ( Ni ) + R n _ out ( Nj ) ) ( w 1 R a 1 _ in ( Ak ) R a 1 _ out ( Ak ) + w 2 R a 2 _ in ( Ak ) R a 2 _ out ( Ak ) )
表达式(3):
DA ( Ni , Nj , Ak ) = w 1 R a 1 _ in ( Ak ) R n _ out ( Ni ) + R n _ out ( Nj ) + w 2 R a 2 _ out ( Ak ) R n _ in ( Ni ) + R n _ in ( Nj )
图8是示出针对基于参考数目的计数结果而计算的每个关联类信息的关联度的例子的说明图。基于图6C、6D和7所示的计数结果,根据表达式(1)计算图8所示的关联度的值。假定表达式(1)中的加权因数w1和w2的值都设置为1。
在图8的例子中,分别对应于针对信息A1的信息N1和N2的信息元之间的关联度被计算为DA(N1,N2,A1)=(1/4+3/2)×(2/3+0)=1.17。进一步,分别对应于针对信息A2的信息N1和N2的信息元之间的关联度被计算为DA(N1,N2,A2)=(1/4+3/2)×(0+3/2)=2.63。以同样的方式,估计单元140还针对其它组合计算关联度。
注意,当在图5所示的两个类型方向上的参考当中仅存在一个方向上的参考时,可以使用其它表达式来计算针对每个关联类信息的信息元之间的关联度。例如,当仅存在从节点类信息至关联类信息的参考时,可以使用以下表达式(4)至(6)中的任何一个(或者归一化值、它们的偏差等等)。
表达式(4):
DA ( Ni , Nj , Ak ) = w 1 R a 1 _ in ( Ak ) ( R n _ out ( Ni ) + R n _ out ( Nj ) )
表达式(5):
DA ( Ni , Nj , Ak ) = w 1 R a 1 _ in ( Ak ) &CenterDot; ( 1 R n _ out ( Ni ) + 1 R n _ out ( Nj ) )
表达式(6):
DA ( Ni , Nj , Ak ) = w 1 R a 1 _ in ( Ak )
如从图8的说明中理解的那样,在这个实施例中,针对与两个或更多相应节点类信息具有参考关系的每个关联类信息来计算信息元之间的关联度。因此,可以认为在一个信息元和另一个信息元之间存在多个类型的关联,并且针对所述多个类型的关联中的每一个计算关联度。关联的类型对应于将某个信息元所指示的概念与另一个信息元所指示的概念相关联的观点。作为简单的例子,演员A(的概念)和演员B(的概念)可以通过共同工作的观点而相关联,并且还可以通过共同出生年(例如1930年)的观点而相关联。根据实施例的信息处理装置100从被表达为所谓的集体智慧的信息集中提取这样的多个类型的关联(观点),并从而获得与对于用户而言出乎意料(令人惊讶)的概念之间的关联有关的关联的类型与程度。
这样一来,估计单元140就可以基于上面描述的参考关系确定分别对应于两个或更多节点类信息的信息元之间的关联(观点)类型。图9是示出根据实施例的可以通过估计单元140来确定的信息元之间的关联类型的例子的说明图。参考图9,节点类信息N1和N2具有与关联类信息A1和A2的参考关系。节点类信息N1对应于个人“T.Hanks”的信息元。节点类信息N2对应于个人“C.Eastwood”的信息元。估计单元140计算针对关联类信息A1的个人“T.Hanks”和个人“C.Eastwood”之间的关联度为1.17。进一步,估计单元140根据关联类信息A1确定关联类型。具体地,例如当关联类信息A1是网络页面并且该网络页面具有标题“加利福尼亚州”时,“加利福尼亚州”可以被确定为关联类型。进一步,针对关联类信息A2的个人“T.Hanks”和个人“C.Eastwood”之间的关联度为2.63。例如当关联类信息A2是网络页面并且该网络页面具有标题“奥斯卡奖”时,“奥斯卡奖”可以被确定为关联类型。作为另一个例子,当关联类信息是服务日志中的用户信息时,用户信息的属性值中之一可以被确定为关联类型。
进一步,通过集成针对每个共同关联类信息计算的信息元之间的关联度,估计单元140计算针对多个关联类信息的信息元之间的关联度。在以下描述中,针对多个关联类信息的信息元之间的关联度被称为集成关联度。
图10是示出根据实施例的通过估计单元140计算的集成关联度的例子的说明图。在图10的左侧示出图8所示的表格146。进一步,在图10的右侧示出存储了根据表格146中包含的数字值计算的集成关联度的表格148。
例如,节点类信息N1和N2之间的集成关联度被计算为3.80,其为节点类信息N1和N2之间的针对关联类信息A1的关联度(=1.17)和针对关联类信息A2的关联度(=2.63)之和。同样地,节点类信息N3和N4之间的集成关联度被计算为8.33。注意,集成关联度可以被归一化或被计算为偏差,就像针对每个关联类信息的关联度一样。
估计单元140将如上面那样计算的信息元之间的关联度、每个关联的类型和集成关联度输出到关联度DB 150。
(关联度DB)
通过使用存储介质如硬盘或半导体存储器,关联度DB 150存储通过估计单元140进行的估计的结果,亦即信息元之间的关联度、每个关联的类型和集成关联度。然后,响应于来自屏幕控制单元160、推荐单元170或分析单元180(稍后描述)的请求,关联度DB 150输出存储的数据。
[2-2.导航]
在下文中描述作为(作为通过估计单元140进行的估计的结果而存储在关联度DB 150中的)信息元之间的关联度、每个关联的类型和集成关联度的应用的例子而由用户进行的信息元搜索的导航。在图2所示的信息处理装置100的组成部分当中,屏幕控制单元160主要涉及根据实施例的导航。
(屏幕控制单元)
屏幕控制单元160创建信息元显示屏,其扮演所谓的导航的角色,用于通过使用关联度DB 150中存储的信息元之间的关联度来支持由用户进行的信息元搜索。具体地,屏幕控制单元160首先显示彼此相关联的两个信息元,以便它们在信息元显示屏上彼此相邻。用户相继选择信息元显示屏上显示的信息元,并从而跟踪彼此相关联的信息元(它们在关联度DB150中具有一定的关联度)。
图11是示出根据实施例的作为由屏幕控制单元160创建的信息元显示屏的例子的信息元显示屏162的说明图。
在图11中,在信息元显示屏162的中央示出当前选择的信息元(在下文中被称为最新选择元)164。进一步,在屏幕的X方向上的相邻于最新选择元的位置示出与最新选择元164相关联的信息元(在下文中被称为选择候选元)165。选择候选元165是在最新选择元164被选择的状态下相邻于最新选择元164显示的并且用户可以下一步选择的信息元。
进一步,屏幕控制单元160在信息元显示屏162上在彼此相邻显示的最新选择元164和选择候选元165附近显示这两个信息元之间的关联类型。在图11的例子中,在最新选择元164和选择候选元165之间的部分之上示出显示三个关联类型的关联显示区168。例如,根据最新选择元164和选择候选元165之间每个类型的关联度的水平,可以加亮关联显示区168中显示的关联类型。在图11的例子中,作为“T.Hanks”和“C.Eastwood”之间的关联类型,“奥斯卡奖”以最大尺寸显示在关联显示区168中。进一步,“加利福尼亚州”和“电影A”作为“T.Hanks”和“C.Eastwood”之间的关联类型而显示在关联显示区168中。根据关联度DB150中的关联度的水平(例如关联度中的前3个、1.0或更高的关联度等等)来选择关联显示区168中显示的关联类型。
图12A至12C是用于说明当在(在其显示器上显示图11所示的信息元显示屏162的)终端装置200中检测到任何用户输入时信息元显示屏162的显示变化的说明图。
例如,假定当显示图11所示的信息元显示屏162时,用户通过用户输入(例如按压“↑”按钮、向上点击等)而指引向上移动。然后,屏幕改变成图12A所示的信息元显示屏162a。在信息元显示屏162a上,已成为前选择候选元165的“C.Eastwood”在Y方向上移动,并且显示成为新的选择候选元165的“J.Reno”。进一步,在关联显示区168中显示“达芬奇密码”、“嗜好A”和“日本”作为“T.Hanks”和“J.Reno”之间的关联类型。
进一步,假定当显示图11所示的信息元显示屏162时,用户通过用户输入(例如按压“→”按钮、向右点击等)而指引向右移动。然后,屏幕改变成图12B所示的信息元显示屏162b。在信息元显示屏162b上,已成为前最新选择元164的“T.Hanks”在X方向上向后移动,并且显示成为新的最新选择元164的“C.Eastwood”。进一步,选择候选元165也变成“T.S.Connery”。进而,在关联显示区168中显示“西部”、“1930”和“电影B”作为“C.Eastwood”和“T.S.Connery”之间的关联类型。
进而,假定当显示图11所示的信息元显示屏162时,用户进行用户输入如按压回车键或者敲击屏幕上的给定位置。然后,屏幕改变成图12C所示的信息元显示屏162c。在信息元显示屏162c上,在那个时间点成为最新选择元164的“T.Hanks”和成为选择候选元165的“C.Eastwood”被放大,并且示出显示那些元素之间的关联细节的详细关联显示区169。在详细关联显示区169中,额外显示了未曾在信息元显示屏162的关联显示区168中显示的多个关联类型(通常是具有较低关联度的关联类型)。在详细关联显示区169中,可以进一步显示关联度的值。注意,当用户按压回车键或取消键等时,信息元显示屏162c可以变回到信息元显示屏162。
如上所述,屏幕控制单元160在信息元显示屏上将用户所选择的信息元相继布置在第一方向上(例如X方向)。用户可以通过以下来搜索信息元:通过沿着第一方向移动或滚动,跟踪彼此相关联的信息元。进一步,在不同于第一方向的第二方向(例如Y方向)上,屏幕控制单元160显示与用户最近所选择的信息元(亦即最新选择元)相关联的多个信息元。通过沿着第二方向移动或滚动布置在第二方向上的信息元,用户可以选择新的感兴趣的信息元。在那时,通过检查关联显示区中显示的关联类型,用户可以掌握最新选择元和选择候选元以什么观点彼此相关联,并从而理解为什么显示选择候选元的原因。
这样的用户界面向用户提供了基于相互关联知识的信息搜索的新方式,这不同于关键词搜索或种类搜索。进一步,因为不存在对用于信息搜索的字符输入的需要,所以可以在没有键盘的终端装置中很好地采用该用户界面,从而提高了这样的终端装置的用户的便利性。
注意,布置在第二方向上的信息元是在关联度DB 150中与最新选择元具有关联性的信息元。例如,根据与最新选择元的集成关联度的水平,可以按顺序在第二方向上布置信息元。进一步,当集成关联度高时,可以加亮该信息元。
进一步,屏幕控制单元160可以在信息元显示屏上仅显示属于特定类别的信息元。例如,通过在信息元显示屏上仅显示属于“个人”类别的信息元,信息元显示屏可以用作个人搜索屏幕。进一步,通过在信息元显示屏上仅显示属于“内容”类别的信息元,信息元显示屏可以用作内容搜索屏幕。在这种情况下,屏幕控制单元160可以提供用户界面,用于切换将要在信息元显示屏上显示的信息元的类别。
[2-3.对推荐的应用]
在下文中描述作为(作为通过估计单元140进行的估计的结果而存储在关联度DB 150中的)信息元之间的关联度、每个关联的类型和集成关联度的应用的另一个例子的向用户推荐信息元。在图2所示的信息处理装置100的组成部分当中,推荐单元170、分析单元180和偏好DB 190主要涉及根据实施例的推荐。
(推荐单元)
推荐单元170从可以通过信息处理装置100提供给用户的内容中选择将要推荐给用户的内容,并且在屏幕控制单元160所创建的屏幕上显示与所选内容相关联的信息。
(1)使用关联的推荐
推荐单元170可以通过使用存储在关联度DB 150中的信息元之间的关联度或关联类型来选择将要推荐的内容。例如,当用户查看第一内容和第二内容时,推荐单元170可以根据对应于第一内容和第二内容的信息元之间的关联类型来选择将要推荐的内容。
图13是用于说明根据实施例的通过推荐单元170进行的根据信息元之间的关联类型的推荐过程的例子的说明图。在图13的例子中,假定信息处理装置100提供如下服务:用户可以查看与音乐内容相关的信息并收听或购买音乐内容。进一步假定对应于信息处理装置100所提供的音乐内容的信息元由信息元数据定义,并且通过估计单元140来估计信息元之间的关联度。
参考图13的左侧,示出了用户U1的行为历史。行为历史表明用户U1已查看了第一内容N11,然后查看了第二内容N12。基于这样的行为历史,推荐单元170从关联度DB 150中获取对应于第一内容N11和第二内容N12的信息元之间的关联类型。例如,对应于第一内容N11和第二内容N12的信息元之间的关联类型是“种类A”、“曲调B”等等。然后,推荐单元170选择具有相同或相似关联类型的第三和第四内容。例如,推荐单元170可以选择具有“种类A”和“曲调B”的关联类型的第三内容N13和第四内容N14。在从屏幕控制单元160向终端装置200输出的屏幕上,推荐单元170向用户推荐用这种方式选择的第三内容N13和第四内容N14。
注意,推荐单元170可以通过使用在以前部分中描述的信息元显示屏来向用户推荐内容。例如,在信息元显示屏显示属于“内容”类别的信息元的情况下,当用户指定显示在关联显示区中的任何关联类型时,推荐单元170可以选择具有指定关联类型的另一个内容并将该内容推荐给用户。进一步,推荐单元170可以向用户自动地推荐具有与最新选择元和选择候选元相同或相似的关联类型的内容。
(2)用户偏好的分析
大多数的普通推荐技术通过使用用户偏好来进行推荐,用户偏好是通过根据用户的行为历史而对每个用户的偏好进行打分(用数值形式表示)来获得的。例如,被称为合作过滤的推荐算法比较不同用户之间的用户偏好,并且将具有相似偏好的用户过去已查看过的内容设置为将要推荐的内容。进一步,被称为基于内容过滤的推荐算法比较属于共同矢量空间的内容属性和用户偏好,并且将接近于用户偏好的内容设置为将要推荐的内容。这样一来,对于增强推荐的有效性而言很重要的一点就是,尽可能精确地以用户偏好的得分反映用户的实际偏好。
考虑到上述情况,在这个实施例中,信息处理装置100的分析单元180通过使用关联度DB 150中存储的通过估计单元140进行的估计的结果以数值形式来表示用户偏好,从而获得有效的用户偏好。例如,当用户查看一系列信息元时,分析单元180通过使用该系列信息元中包括的彼此相关联的信息元之间的关联度来确定用户偏好。
图14和15是用于说明根据实施例的通过分析单元180进行的用户偏好分析过程的例子的说明图。参考图14,示出了用户U1的另一个行为历史。行为历史表明用户U1已在信息元显示屏或别的屏幕上相继选择(或查看)了内容N21、N22、N23和N24。基于这样的行为历史,分析单元180从关联度DB 150中获取分别对应于内容N21和N22、内容N22和N23以及内容N23和N24的信息元之间的关联类型和关联度。例如,对应于内容N21和N22的信息元之间的关联类型(关联度)为A21(1.0)、A22(0.8)等等。同样地,对应于内容N22和N23的信息元之间的关联类型(关联度)为A22(1.0)、A23(0.5)等等。对应于内容N23和N24的信息元之间的关联类型(关联度)为A22(0.3)、A24(0.2)等等。
参考图15,通过针对相同的关联类型将图14所示的分析单元180所获取的关联度相加在一起来确定用户U1的用户偏好。这样一来,用户U1的用户偏好就形成了如下矢量,该矢量包含关联类型A21、A22、A23和A24作为元素。在图14的例子中,用户U1的用户偏好被确定为(A21,A22,A23,A24)=(1.0,2.1,0.5,0.2)。注意,分析单元180可以根据新近的行为历史向关联度分配权重,然后针对相同的关联类型将关联度相加在一起,而不是简单地针对相同的关联类型将关联度相加在一起。分析单元180将以这种方式确定的用户偏好输出到偏好DB 190。
(偏好DB)
通过使用存储介质如硬盘或半导体存储器,偏好DB 190存储通过分析单元180确定的用户偏好。然后,响应于来自推荐单元170的请求,偏好DB 190输出存储的用户偏好。
基于偏好DB 190中累积的用户偏好,例如根据诸如已知的合作过滤或基于内容的过滤之类的技术,推荐单元170可以选择将要向用户推荐的内容。同样在这种情况下,因为使用上述关联度而基于分析单元180所确定的用户偏好来选择内容,所以可以有效地向用户推荐用户难以预料的内容。注意,因为没有预先限制以数值形式在其中表示用户偏好的矢量空间的维度,所以通过分析单元180确定的用户偏好可以是稀疏矢量,该稀疏矢量具有仅针对具有极高维度的矢量空间中的有限元素的值。在这种情况下,优选的是,通过使用已知的技术如概率潜在语义分析(PLSA)或潜在狄利克雷(Dirichlet)分配(LDA)来压缩矢量,然后确定用户偏好之间的或者用户偏好和内容属性之间的相似度。
(3)推荐原因展示
进一步,根据实施例,根据对应于将要推荐的内容的信息元和作为内容选择基础的信息元之间的关联类型,推荐单元170可以向用户展示内容推荐的原因。
图16是示出根据实施例的作为通过推荐单元170在上面展示推荐原因的屏幕的例子的推荐屏幕174的说明图。参考图16,在推荐屏幕174上推荐内容N31。进一步,在推荐屏幕174的底部,放置了推荐水平显示域176a和推荐原因显示域176b。假定内容N31例如是基于用户过去已查看过的信息元而由推荐单元170选择的内容。在这种情况下,推荐单元170可以从关联度DB 150中获取对应于内容N31的信息元和过去查看的信息元之间的集成关联度,并且根据该集成关联度设置推荐水平显示域176a的推荐水平。例如,当集成关联度高时,可以将推荐水平设置为高。注意,当从关联度DB 150中获取的集成关联度落在预定阈值之下时,推荐单元170可以改变将要推荐的内容。进一步,推荐单元170可以从关联度DB 150中获取对应于内容N31的信息元和过去查看的信息元之间的关联类型,并且在推荐原因显示域176b中展示该关联类型作为推荐原因。
注意,通过推荐单元170进行的确定推荐原因的过程不限于上述例子。图17和18分别示出了通过推荐单元170进行的确定推荐原因的过程的其它例子。
图17是用于说明通过推荐单元170进行的确定推荐原因的过程的第一替换例子的说明图。假定在这个例子中,从信息处理装置100提供的服务所掌握的内容具有对应于信息元定义数据所定义的多个信息元中的一个或多个信息元的属性。进一步假定推荐单元170例如通过使用诸如基于内容的过滤之类的技术根据用户的行为历史中包括的内容来选择将要向用户推荐的内容。
在这种情况下,推荐单元170根据对应于将要推荐的所选内容的属性的信息元和对应于用作推荐基础的内容的属性的另一个信息元之间的关联类型来确定推荐原因。在图17的例子中,将要推荐的内容C1具有属性N51和N52。进一步,作为推荐基础的内容C2具有属性N53、N54和N55。进一步,在关联度DB 150的表格146中存储针对对应于那些内容的属性的信息元之间的每个关联类型的关联度。推荐单元170从表格146中获取针对每个关联类型的关联度,并且确定具有高关联度的关联类型作为推荐原因以展示给用户。在图17的例子中,因为对应于内容C1的属性N52的信息元和对应于内容C2的属性N55的信息元之间的关联类型A4指示最高的关联度2.0,所以关联类型A4被选择作为第一推荐原因。进一步,根据关联度的水平,关联类型A1被确定作为第二推荐原因,并且关联类型A2被确定作为第三推荐原因。
图18是用于说明通过推荐单元170进行的确定推荐原因的过程的第二替换例子的说明图。假定在这个例子中,使用从信息处理装置100提供的服务的用户的用户偏好也具有对应于信息元定义数据所定义的多个信息元中的一个或多个信息元的属性。
在这种情况下,推荐单元170根据对应于将要推荐的所选内容的属性的信息元和对应于将要推荐的用户的用户偏好的属性的另一个信息元之间的关联类型来确定推荐原因。在图18的例子中,将要推荐的内容C1具有属性N51和N52。进一步,将要推荐的用户U1的用户偏好具有属性N61、N62和N63。进一步,在关联度DB 150的表格146中存储针对对应于内容的属性和用户偏好的属性的信息元之间的每个关联类型的关联度。推荐单元170从表格146中获取针对每个关联类型的关联度,并且确定具有高关联度的关联类型作为推荐原因以展示给用户。在图18的例子中,因为针对关联类型A3的关联度之和(0.6+2.0=2.6)最高,所以关联类型A3被选择作为第一推荐原因。进一步,根据关联度的水平,关联类型A2被确定作为第二推荐原因,并且关联类型A1被确定作为第三推荐原因。
推荐单元170在参考图16描述的推荐屏幕174上或别的屏幕上向用户展示以这种方式确定的推荐原因。用户从而可以知道为什么信息处理装置100推荐该内容。结果,即使当推荐出乎意料的内容时,也可以说服用户关于推荐的原因,并且用户可以针对被推荐的内容更加容易地决定其行为(查看、购买、忽略等等)。
<3.其它应用例子>
[3-1.音乐的回放]
上面描述的信息处理装置100所估计的信息元之间的关联度和关联类型可以用于各种应用。作为第一例子,在下文中描述对音乐回放的应用。
图19是示出根据第一应用例子的信息处理装置300的配置例子的框图。参考图19,信息处理装置300包括关联度DB 150、屏幕控制单元360和播放单元362。例如假定针对对应于音乐内容的信息元而估计的关联度和关联类型存储在关联度DB 150中。
(屏幕控制单元)
屏幕控制单元360创建信息元显示屏,用于支持通过使用关联度DB150中存储的信息元之间的关联度而由用户进行音乐内容的搜索。屏幕控制单元360所创建的信息元显示屏可以是类似于稍早前参考图11描述的信息元显示屏162的屏幕。然而,该信息元显示屏显示对应于音乐内容的信息元。
(播放单元)
播放单元362播放在信息元显示屏上由用户选择的音乐内容,亦即被示出为最新选择元的音乐内容。例如,当用户通过操作终端装置200的用户界面而选择一系列音乐内容时,播放单元362可以相继播放该系列音乐内容。通过这样的播放音乐内容的方法,用户可以通过相继选择彼此相关联的音乐内容而如频道切换(zapping)一样享受音乐。因为从对应于所谓的集体智慧的信息集中提取音乐内容之间的关联性,所以获得了诸如用户遇到令人惊讶(并且使人信服)的音乐内容的可能性增加之类的优点。
进一步,播放单元362可以通过使用关联度DB 150中存储的信息元之间的关联度来自动创建音乐内容的播放列表,并且根据该列表相继播放音乐内容。同样在这种情况下,获得了将要播放的音乐内容可以既令人惊讶又使人信服的优点。
[3-2.位置信息的使用]
图20是示出根据第二应用例子的信息处理装置400的配置例子的框图。参考图20,信息处理装置400包括关联度DB 150、屏幕控制单元160、位置获取单元468和推荐单元470。假定在关联度DB 150中存储针对对应于地球上的位置(纬度和经度)或地名的信息元以及对应于给定内容的信息元而估计的关联度和关联类型。通过将与地理信息网站中的特定地点相链接的网络页面(例如商店的主页等)设置为用于估计关联度的目标,可以获得与对应于地球上的位置的信息元相关的关联度。
(位置获取单元)
位置获取单元468从终端装置200获取通过终端装置200使用GPS获得的终端装置200的位置数据。然后,位置获取单元468将获取的位置数据输出到推荐单元470。
(推荐单元)
推荐单元470从可以通过信息处理装置400向用户提供的内容中选择将要推荐给用户的内容,并且在屏幕控制单元160所创建的屏幕上显示与所选内容相关联的信息。此时,推荐单元470选择在关联度DB 150中与从位置获取单元468供应的位置数据(或对应于位置数据的地名)有关联的内容作为将要推荐的内容。通过这样的推荐方法,例如当用户携带终端装置200旅行时,对应于用户位置的内容就被推荐。因为基于从对应于所谓的集体智慧的信息集中提取的关联度来选择以这种方式推荐的内容,所以其可以是对于用户而言令人惊讶(并且使人信服)的内容。
注意,可以将播放单元添加到信息处理装置400中,以便通过播放单元来播放根据用户的位置而选择的音乐内容。从而可以自动地播放与用户的位置具有高关联度的音乐内容。
<4.硬件配置>
通过上面描述的信息处理装置100、300和400进行的每个过程都可以例如被实施为可在图21所示的通用计算机上执行的软件。在图21中,中央处理单元(CPU)902控制通用计算机的总体操作。在只读存储器(ROM)904中,存储描述每个过程的程序或数据。在随机存取存储器(RAM)906中,临时存储将要由CPU 902在执行过程时使用的程序或数据等。
CPU 902、ROM 904和RAM 906通过总线910彼此连接。进一步,输入/输出接口912连接到总线910。输入/输出接口912是用于将CPU 902、ROM 904和RAM 906与输入装置920、输出装置922、存储装置924、通信装置926和驱动器930相连接的接口。
输入装置920接收例如从用户通过输入装置如按钮、开关、控制杆、鼠标或键盘而输入的指令或信息。输出装置922例如通过显示装置如阴极射线管(CRT)、液晶显示器或有机发光二极管(OLED)或者音频输出装置如扬声器向用户输出信息。
存储装置924例如包括硬盘驱动器或半导体存储器等,并且存储程序、数据等等。通信装置926通过通信网络执行通信过程。驱动器930根据需要安装在通用计算机上,并且例如将可移动介质932装载到驱动器930。
<5.总结>
上面参考图1至21描述了本发明的一个实施例及其替换例子。根据实施例,基于对应于作为信息搜索或推荐的目标的信息元的节点类信息和很可能连接两个或更多信息元的关联类信息之间的参考关系,估计信息元之间的关联度。从而可以相对于用集体智慧描述的多种观点自动地估计诸如内容像个人、音乐或视频或者地球上的位置之类的各种信息元之间的关联性。然后可以利用相对于这样的多种观点估计的关联度和关联类型用于信息搜索或推荐。
进一步,根据实施例的信息元显示屏基于相互关联知识提供了新颖的用户界面,这不同于关键词搜索或种类搜索。通过选择用户感兴趣的信息元或关联类型,这样的用户界面使得用户能够跟踪各种信息元。进一步,因为可以在没有键盘的终端装置中采用该用户界面,所以可以提高这样的终端装置的用户的便利性。
进而,因为根据实施例的推荐单元根据上面描述的信息元之间的关联度来推荐内容,所以用户可以找到基于用集体智慧描述的多种观点而推荐的内容。因为同时可以展示推荐原因,所以将要推荐的内容可以既令人惊讶又使人信服。进一步,使用根据实施例的分析单元,可以获得用户偏好,其准确反映了基于用集体智慧描述的多种观点的实际用户偏好。
尽管上面参考附图详细地描述了本发明的优选实施例,但是本发明不限于此。本领域技术人员应当理解的是,取决于设计需要和其它因素,可以发生各种修改、组合、再组合和变更,它们都处在所附权利要求或其等价物的范围之内。
本申请包含与2009年12月25日向日本专利局申请的日本优先权专利申请JP 2009-296065中公开的主题相关的主题,该专利申请的整体内容通过引用结合于此。

Claims (19)

1.一种信息处理装置,包括:
存储单元,其存储定义多个信息元的信息元数据;
信息获取单元,其从可通过通信网络访问的信息源获取彼此具有参考关系的信息集;
分类单元,其将通过所述信息获取单元获取的所述信息集中包括的信息分类成对应于通过所述信息元数据定义的信息元的第一类信息和除了所述第一类信息之外的第二类信息;以及
估计单元,其基于所述信息集中的所述第一类信息和所述第二类信息之间的参考关系,估计分别对应于两个或更多所述第一类信息的信息元之间的关联度。
2.根据权利要求1所述的信息处理装置,其中,基于所述信息集中的所述第一类信息和所述第二类信息之间的参考关系,所述估计单元进一步确定分别对应于两个或更多所述第一类信息的信息元之间的关联类型。
3.根据权利要求2所述的信息处理装置,其中,所述估计单元相对于所述信息集中的每个信息计数从所述第一类信息至所述第二类信息的参考数目和从所述第二类信息至所述第一类信息的参考数目中的至少一个,并且基于针对共同的第二类信息而计数的参考数目来计算分别对应于参考了共同的第二类信息或者从共同的第二类信息被参考的两个或更多所述第一类信息的信息元之间的关联度。
4.根据权利要求3所述的信息处理装置,其中,所述估计单元根据共同的第二类信息确定分别对应于两个或更多所述第一类信息的信息元之间的关联类型。
5.根据权利要求1所述的信息处理装置,进一步包括:
屏幕控制单元,其输出信息元显示屏,该信息元显示屏显示在通过所述估计单元进行的估计的结果中彼此相关联的两个信息元以便彼此相邻。
6.根据权利要求5所述的信息处理装置,其中,所述信息元显示屏是如下屏幕,其中,在一个信息元被选择的状态下,相邻于所选信息元显示的另一个信息元可由用户选择。
7.根据权利要求6所述的信息处理装置,其中,所述屏幕控制单元在所述信息元显示屏上将由用户选择的信息元相继布置在第一方向上,并将与由用户最近选择的信息元相关联的多个信息元布置在不同于所述第一方向的第二方向上,并且
布置在所述第二方向上的每个信息元可由用户选择。
8.根据权利要求5所述的信息处理装置,其中,所述屏幕控制单元在所述信息元显示屏上在彼此相邻显示的所述两个信息元附近显示所述两个信息元之间的关联类型。
9.根据权利要求5所述的信息处理装置,其中,所述屏幕控制单元在所述信息元显示屏上仅显示在通过所述估计单元进行的估计的结果中具有一定关联度的信息元当中属于给定类别的信息元。
10.根据权利要求2所述的信息处理装置,进一步包括:
推荐单元,其当用户查看第一内容和第二内容时,向所述用户推荐根据对应于所述第一内容和所述第二内容的信息元之间的关联类型而选择的别的内容。
11.根据权利要求6所述的信息处理装置,进一步包括:
分析单元,其当用户查看一系列信息元时,通过使用所述一系列信息元中包括的彼此相关联的信息元之间的关联度来确定所述用户的偏好。
12.根据权利要求11所述的信息处理装置,进一步包括:
推荐单元,其向所述用户推荐基于通过所述分析单元确定的用户偏好而选择的内容。
13.根据权利要求2所述的信息处理装置,进一步包括:
推荐单元,其向用户推荐基于所述用户查看的信息元而选择的内容,并且根据对应于所述内容的信息元和作为选择所述内容的基础的信息元之间的关联类型,向所述用户展示推荐所述内容的原因。
14.根据权利要求2所述的信息处理装置,进一步包括:
推荐单元,其向用户推荐从具有对应于多个信息元当中一个或多个信息元的属性的内容中根据所述用户的行为历史而选择的内容,并且根据对应于所选内容的属性的信息元和另一个信息元之间的关联类型,向所述用户展示推荐所选内容的原因。
15.根据权利要求14所述的信息处理装置,其中,所述另一个信息元是对应于作为选择所述内容的基础的另一个内容的属性的信息元。
16.根据权利要求14所述的信息处理装置,其中,所述另一个信息元是对应于所述用户的用户偏好的属性的信息元。
17.根据权利要求1所述的信息处理装置,其中,由所述信息元数据定义的多个信息元包括对应于音乐内容的信息元,并且
所述信息处理装置进一步包括:播放单元,其相继播放对应于通过所述估计单元进行的估计的结果中的彼此相关联的信息元的音乐内容。
18.一种通过使用信息处理装置来估计信息元之间的关联度的方法,所述信息处理装置包括存储定义多个信息元的信息元数据的存储单元,所述方法包括以下步骤:
从可通过通信网络访问的信息源获取彼此具有参考关系的信息集;
将从所述信息源获取的所述信息集中包括的信息分类成对应于通过所述信息元数据定义的信息元的第一类信息和除了所述第一类信息之外的第二类信息;以及
基于所述信息集中的所述第一类信息和所述第二类信息之间的参考关系,估计分别对应于两个或更多所述第一类信息的信息元之间的关联度。
19.一种使控制信息处理装置的计算机起到如下装置的作用的程序,所述信息处理装置包括存储定义多个信息元的信息元数据的存储单元,所述装置包括:
信息获取单元,其从可通过通信网络访问的信息源获取彼此具有参考关系的信息集;
分类单元,其将通过所述信息获取单元获取的所述信息集中包括的信息分类成对应于通过所述信息元数据定义的信息元的第一类信息和除了所述第一类信息之外的第二类信息;以及
估计单元,其基于所述信息集中的所述第一类信息和所述第二类信息之间的参考关系,估计分别对应于两个或更多所述第一类信息的信息元之间的关联度。
CN201010615043.2A 2009-12-25 2010-12-17 使用信息处理装置估计信息元之间的关联度的系统和方法 Expired - Fee Related CN102110135B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009296065A JP2011138197A (ja) 2009-12-25 2009-12-25 情報処理装置、関連度評価方法及びプログラム
JP2009-296065 2009-12-25

Publications (2)

Publication Number Publication Date
CN102110135A true CN102110135A (zh) 2011-06-29
CN102110135B CN102110135B (zh) 2014-05-07

Family

ID=44174296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010615043.2A Expired - Fee Related CN102110135B (zh) 2009-12-25 2010-12-17 使用信息处理装置估计信息元之间的关联度的系统和方法

Country Status (3)

Country Link
US (1) US20110161323A1 (zh)
JP (1) JP2011138197A (zh)
CN (1) CN102110135B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015139458A1 (zh) * 2014-03-17 2015-09-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN107305490A (zh) * 2016-04-22 2017-10-31 中国移动通信集团湖南有限公司 一种元数据分组方法及装置
CN107866071A (zh) * 2017-11-03 2018-04-03 杭州电魂网络科技股份有限公司 游戏角色推荐方法和装置

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8036979B1 (en) 2006-10-05 2011-10-11 Experian Information Solutions, Inc. System and method for generating a finance attribute from tradeline data
US8606626B1 (en) 2007-01-31 2013-12-10 Experian Information Solutions, Inc. Systems and methods for providing a direct marketing campaign planning environment
US8606666B1 (en) 2007-01-31 2013-12-10 Experian Information Solutions, Inc. System and method for providing an aggregation tool
US9158775B1 (en) 2010-12-18 2015-10-13 Google Inc. Scoring stream items in real time
US8996549B2 (en) * 2011-10-11 2015-03-31 Microsoft Technology Licensing, Llc Recommending data based on user and data attributes
JP2013097700A (ja) 2011-11-04 2013-05-20 Sony Corp 情報処理装置、情報処理方法及びプログラム
US10659422B2 (en) 2012-04-30 2020-05-19 Brightedge Technologies, Inc. Content management systems
DE112013002259T5 (de) * 2012-04-30 2015-03-05 Brightedge Technologies, Inc. Integration von Informationen dritter Parteien
KR102160844B1 (ko) 2013-02-25 2020-09-28 패트릭 순-시옹 링크 연관 분석 시스템들 및 방법들
US10102536B1 (en) 2013-11-15 2018-10-16 Experian Information Solutions, Inc. Micro-geographic aggregation system
US10262362B1 (en) 2014-02-14 2019-04-16 Experian Information Solutions, Inc. Automatic generation of code for attributes
CN104866515A (zh) * 2014-02-23 2015-08-26 祁勇 一种分类发布和接收社交网络内容的方法
US9576030B1 (en) 2014-05-07 2017-02-21 Consumerinfo.Com, Inc. Keeping up with the joneses
US10445152B1 (en) 2014-12-19 2019-10-15 Experian Information Solutions, Inc. Systems and methods for dynamic report generation based on automatic modeling of complex data structures
US11126674B2 (en) * 2015-04-30 2021-09-21 Paypal, Inc. Soft recommendations
US10678894B2 (en) 2016-08-24 2020-06-09 Experian Information Solutions, Inc. Disambiguation and authentication of device users

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355340A (ja) * 2003-05-29 2004-12-16 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
CN1692354A (zh) * 2002-05-16 2005-11-02 索尼株式会社 信息管理系统、信息处理设备、信息处理方法、信息处理程序、和存储介质
CN1823334A (zh) * 2003-05-14 2006-08-23 塞利布罗斯有限公司 搜索引擎方法及装置
JP2006251866A (ja) * 2005-03-08 2006-09-21 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6704686B2 (en) * 1999-02-08 2004-03-09 Geoffrey M. Jacquez Method for measuring a degree of association for dimensionally referenced data
US5855011A (en) * 1996-09-13 1998-12-29 Tatsuoka; Curtis M. Method for classifying test subjects in knowledge and functionality states
US6185560B1 (en) * 1998-04-15 2001-02-06 Sungard Eprocess Intelligance Inc. System for automatically organizing data in accordance with pattern hierarchies therein
DE19960372A1 (de) * 1999-12-14 2001-06-21 Definiens Ag Verfahren zur Verarbeitung von Datenstrukturen
US7271804B2 (en) * 2002-02-25 2007-09-18 Attenex Corporation System and method for arranging concept clusters in thematic relationships in a two-dimensional visual display area
US7188107B2 (en) * 2002-03-06 2007-03-06 Infoglide Software Corporation System and method for classification of documents
US8069175B2 (en) * 2002-04-10 2011-11-29 Google Inc. Delegating authority to evaluate content
US7069259B2 (en) * 2002-06-28 2006-06-27 Microsoft Corporation Multi-attribute specification of preferences about people, priorities and privacy for guiding messaging and communications
US7225184B2 (en) * 2003-07-18 2007-05-29 Overture Services, Inc. Disambiguation of search phrases using interpretation clusters
EP1563416A1 (en) * 2003-09-02 2005-08-17 Infoglide Software Corporation System and method for classification of documents
US8346770B2 (en) * 2003-09-22 2013-01-01 Google Inc. Systems and methods for clustering search results
US7587064B2 (en) * 2004-02-03 2009-09-08 Hrl Laboratories, Llc Active learning system for object fingerprinting
US7428530B2 (en) * 2004-07-01 2008-09-23 Microsoft Corporation Dispersing search engine results by using page category information
US20060195442A1 (en) * 2005-02-03 2006-08-31 Cone Julian M Network promotional system and method
US7636730B2 (en) * 2005-04-29 2009-12-22 Battelle Memorial Research Document clustering methods, document cluster label disambiguation methods, document clustering apparatuses, and articles of manufacture
US7756855B2 (en) * 2006-10-11 2010-07-13 Collarity, Inc. Search phrase refinement by search term replacement
US7856446B2 (en) * 2005-12-27 2010-12-21 Baynote, Inc. Method and apparatus for determining usefulness of a digital asset
US7644373B2 (en) * 2006-01-23 2010-01-05 Microsoft Corporation User interface for viewing clusters of images
US7725451B2 (en) * 2006-01-23 2010-05-25 Microsoft Corporation Generating clusters of images for search results
US7447684B2 (en) * 2006-04-13 2008-11-04 International Business Machines Corporation Determining searchable criteria of network resources based on a commonality of content
WO2008045981A2 (en) * 2006-10-10 2008-04-17 Secondspace, Inc. Virtual network of real-world entities
US8024332B2 (en) * 2008-08-04 2011-09-20 Microsoft Corporation Clustering question search results based on topic and focus
US8041715B2 (en) * 2009-03-24 2011-10-18 Yahoo! Inc. Sponsored search results re-ranking based on linking associations
JP4852119B2 (ja) * 2009-03-25 2012-01-11 株式会社東芝 データ表示装置、データ表示方法、データ表示プログラム
US10013489B2 (en) * 2009-08-12 2018-07-03 Oath Inc. System and method for providing recommendations
US20110037766A1 (en) * 2009-08-17 2011-02-17 Nexidia Inc. Cluster map display
WO2012075335A2 (en) * 2010-12-01 2012-06-07 Google Inc. Recommendations based on topic clusters

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1692354A (zh) * 2002-05-16 2005-11-02 索尼株式会社 信息管理系统、信息处理设备、信息处理方法、信息处理程序、和存储介质
CN1823334A (zh) * 2003-05-14 2006-08-23 塞利布罗斯有限公司 搜索引擎方法及装置
JP2004355340A (ja) * 2003-05-29 2004-12-16 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
JP2006251866A (ja) * 2005-03-08 2006-09-21 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015139458A1 (zh) * 2014-03-17 2015-09-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN107305490A (zh) * 2016-04-22 2017-10-31 中国移动通信集团湖南有限公司 一种元数据分组方法及装置
CN107866071A (zh) * 2017-11-03 2018-04-03 杭州电魂网络科技股份有限公司 游戏角色推荐方法和装置

Also Published As

Publication number Publication date
US20110161323A1 (en) 2011-06-30
JP2011138197A (ja) 2011-07-14
CN102110135B (zh) 2014-05-07

Similar Documents

Publication Publication Date Title
CN102110135B (zh) 使用信息处理装置估计信息元之间的关联度的系统和方法
KR102008000B1 (ko) 매체 프로그램들 사이의 유사성 계산
KR101941757B1 (ko) 콘텐츠 자동 추천
US10146775B2 (en) Apparatus, system and method for string disambiguation and entity ranking
US20130290306A1 (en) Recommendation engine
CN106407420B (zh) 一种多媒体资源的推荐方法及系统
US20160026727A1 (en) Generating additional content
US20100306192A1 (en) Method and system for a search engine for user generated content (ugc)
WO2011034475A1 (en) Method and apparatus for executing a recommendation
CN103279513A (zh) 产生内容标签的方法、提供多媒体内容信息的方法及装置
US8838580B2 (en) Method and system for providing keyword ranking using common affix
EP2537272A1 (en) Method for providing a recommendation to a user
WO2014176220A1 (en) Determining media consumption preferences
CN109753601A (zh) 推荐信息点击率确定方法、装置及电子设备
KR101873339B1 (ko) 관심사 및 콘텐츠를 제공하는 방법 및 시스템
Bergamaschi et al. Comparing topic models for a movie recommendation system
JP2004362019A (ja) 情報推薦装置、情報推薦方法、情報推薦プログラム及び記録媒体
CN108140034B (zh) 使用主题模型基于接收的词项选择内容项目
US10546027B1 (en) Data search queries for descriptive semantics extracted from item reviews
CN104506895B (zh) 视频归类方法
Mirhasani et al. Alleviation of cold start in movie recommendation systems using sentiment analysis of multi-modal social networks
Hölbling et al. Content-based tag generation to enable a tag-based collaborative tv-recommendation system.
Kawamae Real time recommendations from connoisseurs
CN113127750B (zh) 信息列表生成方法及装置、存储介质、电子设备
WO2008143407A1 (en) Method and system for providing keyword ranking using common affix

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140507

CF01 Termination of patent right due to non-payment of annual fee