CN1722102A - 根据其他计算机系统的配置来排除计算机系统错误配置的方法和系统 - Google Patents

根据其他计算机系统的配置来排除计算机系统错误配置的方法和系统 Download PDF

Info

Publication number
CN1722102A
CN1722102A CNA2005100519226A CN200510051922A CN1722102A CN 1722102 A CN1722102 A CN 1722102A CN A2005100519226 A CNA2005100519226 A CN A2005100519226A CN 200510051922 A CN200510051922 A CN 200510051922A CN 1722102 A CN1722102 A CN 1722102A
Authority
CN
China
Prior art keywords
value
configuration parameter
suspection
sample
assembly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005100519226A
Other languages
English (en)
Other versions
CN1722102B (zh
Inventor
C·E·威保斯基
J·H·王
J·C·普拉特
R·张
Y·陈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1722102A publication Critical patent/CN1722102A/zh
Application granted granted Critical
Publication of CN1722102B publication Critical patent/CN1722102B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0866Checking the configuration
    • H04L41/0869Validating the configuration within one network element
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence

Abstract

提供了一种依据来自其他计算机系统的配置参数的分析来识别引起不希望状态而出故障的“病态”计算机系统的配置参数的方法和系统。在一个实施例中,当病态计算机系统出现不希望状态时,排除故障系统收集由“病态”应用程序使用的“怀疑”配置参数的“怀疑”值。该排除故障系统随后将怀疑值与从样本计算机系统中检索到的怀疑配置参数的样本值进行比较。该排除故障系统使用该比较以识别可能引起应用程序出现不希望状态而发生故障的一个或更多怀疑配置参数。

Description

根据其他计算机系统的配置来排除计算机系统错误配置的方法和系统
与本申请相关的参照文献
本申请要求美国临时申请号60/545,799,2004年2月19日提交,名为“友好故障排除网络:面向隐私保密、自动排除故障”(FRIENDSTROUBLESHOOTING NETWORK:TOWARDS PRIVACY-PRESERVING,AUTOMATIC TROUBLESHOOTING)和美国临时申请号60/547,608,2004年2月24日提交的,名为“根据其他计算机系统的配置来排除计算机系统错误配置的方法和系统”(METHOD AND SYSTEM FOR TROUBLESHOOTINGA MISCONFIGURATION OF A COMPUTER SYSTEM BASED ONCONFIGURATIONS OF OTHER COMPUTER SYSTEMS)的权利,在此将它们引入作为参考。
技术领域
本发明所讨论的技术通常涉及对配置参数进行识别,所述参数具有导致不希望的状态的值。
背景技术
对于个人计算机的用户来说,有越来越多的具有各种特性的应用程序(例如计算机软件)可以使用。用户可以通过指定各种配置参数,对这些应用程序的操作进行定制以符合他们的需要。例如,一种浏览器程序可以具有一种配置参数,该参数提供一个网页URL,以便在该浏览器无论何时启动时,都能够最先显示该网页(即“主页”)。该浏览器应用程序还可以具有一些配置参数,这些配置参数能够识别需要被调用以处理特定内容类型(例如“JPEG”文件)的程序,以及指定当该应用程序连接到各种服务器时要使用的密码。这些配置参数的值可以存储在应用程序特定配置文件中,例如UNIX资源文件或存储在中心注册处,例如Windows注册文件。该用于应用程序的应用程序特定配置文件可以具有指定该应用程序的内部格式。通过中心注册处,许多不同的应用程序可以共享同一配置参数。这些应用程序访问这些文件以检索它们的配置参数值。
如果某些配置参数具有不正确的值,那么,这些应用程序可能出现不希望的状态。例如,如果主页配置参数的值设定的不正确,那么当浏览器应用程序启动,它就会出现不希望的状态,不会显示主页或显示错误的主页。如果配置参数错误地指示了要调用某一文本编辑器来处理图形文件,那么,该不希望的状态将是对图形内容的不正确显示。
由于应用程序的复杂性以及它们大量的配置参数,因此,在排除引起出现不希望状态的错误配置参数的故障时,是非常耗时的。绝大多数的个人计算机用户在执行这种排除故障操作时存在困难。因此,用户通常依靠技术支持人员来协助故障排除。这种故障排除不仅昂贵,而且由于用户不能很有效地使用出现不希望状态的应用程序,因此,将给用户带来显著的生产率损失。
通常,技术支持人员使用特别方法来排除配置问题故障。因为某些中心注册处存储了超过200,000个配置参数,而且,某些计算机系统具有超过100,000个文件,从处理类似问题中获取经验知识的技术人员需要对发生故障的配置参数缩小范围。该特定方法需要耗费大量时间,并且如果是具有不正确值的配置参数的组合,则将耗费更加长的时间。在某些情况下,技术支持人员将这些配置参数值与该应用程序的“理想”值作比较。这对于识别应用程序使用的配置参数来说是很困难的,并且这种识别需要应用程序特定知识。而且,由于存在大量的配置参数以及对于每个配置参数有大量可能的值,许多这种配置参数并不具有“理想”值。这样,技术支持人员还是需要再次审查与理想值不同的应用程序的这些值。
需要能自动识别引起应用程序出现不希望状态的故障配置参数。还需要在识别出所述配置参数之后,识别该配置参数的合适值。
发明内容
提供了一种用于识别出现某种状态的组件(例如应用程序或硬件设备)的可能原因的方法和系统。系统收集会引起某种状态的配置信息(例如,应用程序的配置参数)的值,并且从其他存在该组件的地方(例如,其他具有同样应用程序的计算机系统)检索该配置信息的值。所收集到的值可以用于所有的配置信息或配置信息的子集,该子集在出现某种状态时被该组件实际访问过。该系统随后在所收集的值和所检索的值上执行统计分析,以确定哪种配置信息可能引起该组件的这种状态。
附图说明
图1是说明在一实施例中排除故障系统的组件的框图。
图2是说明在一实施例中追踪函数处理的流程图。
图3是说明在另一实施例中追踪函数处理的流程图。
图4是说明在一实施例中处理排除故障引擎的流程图。
图5是说明在一实施例中规范化(canonicalize)组件处理的流程图。
图6是说明在一实施例中识别样本集组件处理的流程图。
图7是说明在一实施例中排列怀疑对象组件处理的流程图。
图8是说明排除故障引擎的结果的显示页。
具体实施方式
提供了一种根据对于其他计算机系统的配置参数的分析以识别“病态”计算机系统的配置参数的方法和系统,该“病态”计算机系统引起了不希望状态的故障。在一个实施例中,一种排除故障系统收集当病态计算机系统出现不希望状态时“病态”应用程序所使用的“怀疑”配置参数中的“怀疑”值。该排除故障系统随后将怀疑值与样本计算机系统中检索出的该怀疑配置参数的样本值进行比较,所述样本计算机系统可以是对等的计算机系统。该排除故障系统使用该比较来识别一个或更多可能引起应用程序出现不希望状态的怀疑配置参数。例如,如果怀疑配置参数具有一个值,指示需要使用不同的文本编辑器来处理图形文件,而对应的用于所有样本计算机系统的样本值指示应使用某个图片编辑器时,则该怀疑配置参数可能出现故障,引起图形文件的不正确显示。特别是如果所有其他怀疑配置参数对于病态计算机系统和样本计算机系统来说都相同的时候,上面的情况就尤其真实。当识别可能故障的怀疑配置参数时,该排除故障系统可以对样本值应用各种统计分析技术。例如,可应用贝叶斯规则对每个怀疑配置参数推导出指示故障似然性的概率。一旦识别出可能故障的怀疑配置参数,该排除故障系统就能依据对样本值的分析来识别可能的正确值。这样,该样本系统可以认为是使用“典型”样本值作为故障配置参数的“理想”值。通过这种方法,该排除故障系统可以迅速且自动识别出可能故障的配置参数并提供正确的样本值。
在一个实施例中,该排除故障系统通过监视当应用程序出现不希望状态时所述应用程序的执行来识别出怀疑配置参数。可以使用一个追踪程序来跟踪应用程序对存储在该应用程序配置文件或中心注册处的配置参数的访问。该追踪程序将应用程序所访问的配置参数及其对应的值记录在日志中。被记录的配置参数被认为是“怀疑”配置参数,因为它们是应用程序出现不希望状态时,正被应用程序使用的参数。该追踪程序可以在病态计算机系统上执行,并且将其日志提供给识别出故障的怀疑配置参数的排除故障系统。
该排除故障系统可以在收集病态计算机系统的怀疑值之前或之后从样本计算机系统中检索出配置参数的样本值。这些样本计算机系统可以是“对等”计算机系统,它们以某些方式而相关。例如,对等计算机系统可以是在公司的局域网中的用户计算机集合或共享公共特征(例如,由销售代表使用)的子集。如果样本值是在收集怀疑值之前被检索到时,排除故障系统将把样本值存储在配置数据库中。对于每个对等计算机系统,该配置数据库可以具有含有从该计算机系统中检索到的每个配置参数的值的条目。另外,该排除故障系统可以对哪个对等计算机系统具有哪些安装的应用程序的索引进行维护。该排除故障系统使用该索引以迅速挑选出具有安装病态应用程序的这些对等计算机系统作为样本计算机系统。该排除故障系统在其进行的分析中使用怀疑配置参数的样板值。当样本值是在收集怀疑值之前被检索到时,需要检索并存储可以被排除故障的许多不同应用程序的配置参数值。另外,这些样本值需要周期性被检索以反映样本计算机系统的当时的(then-current)配置。
如果在收集怀疑值之后检索样本值,那么,该排除故障系统可以将值的检索限制在追踪程序所识别的怀疑配置参数中进行。由于检索是在分析时进行,样本值代表了怀疑配置参数的当时值。为了加快对样本值的检索,该排除故障系统对哪个对等计算机系统安装有病态应用程序的索引进行维护。该排除故障系统可以使用该索引来识别出安装了病态应用程序的那些对等计算机系统,并仅从这些计算机系统中检索出怀疑配置参数的值。
在一个实施例中,排除故障系统可以对各种配置参数进行预处理,以将它们以规范或标准的形式放置。一些配置参数具有系统特定(例如,对每个对等计算机系统都不相同)的名称或值。这种系统特定配置参数可以包括密码参数、用户名/ID参数、机器名参数、设备ID参数等等。这种排除故障系统可以设定这些参数中的每个参数为规范形式,例如对于用户名参数为“用户名”。或者,当执行其分析时,所述排除故障系统可以简单地忽略所述系统特定配置参数。其他配置参数可以具有需要被标准化的值。例如,具有URL作为其值的配置参数可以是不区分大小写的,在这种情况,排除故障系统可以将这些值标准化为标准体以协助识别哪些值是相同的(即,引用相同的资源)。作为另一实例,在单引号的一个数值(例如‘1’)和在双引号中的值(“1”)对于应用程序来说可以表示同一状态。在这种情况下,所述排除故障系统可以将所有双引号替换为单引号,以标准化所述值。排除故障系统可以以规范或标准形式来同时放置怀疑值和样本值。
本领域技术人员了解可以用许多数学分析技术来识别故障配置参数。这些技术可以包括最近邻分析、贝叶斯网络、神经网络、决策树、支持向量机器(support vector machine)等等。在一个实施例中,该排除故障系统如下所详述的使用贝叶斯规则来计算每个怀疑配置参数产生故障的概率。
图1是说明一个实施例中排除故障系统的组件的框图。该排除故障系统110通过通信链路130连接到计算机系统120。该排除故障系统包括排除故障引擎111、规范化组件112、识别样本集组件113以及排列怀疑对象组件114。该排除故障系统还包括配置数据库115。每个对等计算机系统包括一个或更多应用程序121、配置数据存储器122以及追踪程序123。在操作中,当识别病态应用程序时,在该计算机系统上运行追踪程序以将应用程序从配置数据存储器中访问的怀疑配置参数记录到日志中。追踪程序随后将该日志通过通信链路130提供给排除故障系统。当排除故障系统接收怀疑配置参数以及它们的值时,它就调用排除故障引擎。该排除故障引擎调用规范化组件以用规范形式放置系统特定配置参数值,而以标准形式放置其他配置参数值。随后,该排除故障引擎调用识别样本集组件。该识别样本集组件对对等计算机系统进行识别,其怀疑配置参数的值被用于识别故障怀疑配置参数。该识别样本集组件可以使用索引来识别哪些对等计算机系统安装了病态应用程序,并且因而适合被选为样本计算机系统。如上所述,识别样本集组件可以从配置数据库中检索样本值,或可以从一些样本计算机系统动态检索样本值。在检索到样本值之后,排除故障引擎调用排列怀疑对象组件。排列怀疑对象组件执行贝叶斯规则分析以计算每个怀疑配置参数出故障的概率,并随后依据所述概率来排列怀疑对象列表。排名最先的配置参数被认为是最有可能出故障。
可以在其上实现所述排除故障系统的计算设备包括中央处理单元、存储器、输入设备(例如键盘和指示设备),输出设备(例如显示装置),以及存储装置(例如盘驱动器)。存储器和存储装置是含有实现所述排除故障系统的指令的计算机可读媒体。另外,可以通过数据传输媒体,例如通信链路上的信号,来存储或发送数据结构和消息结构。可以使用各种通信链路,例如因特网、局域网、广域网或点对点拨号连接。
图1说明了其中实现排除故障系统的适合的操作环境的实例。该操作环境只是对合适的操作环境的示例,而非要将排除故障系统使用和功能范围局限于此。其他可以使用的合适的熟知计算系统、环境和配置可以包括个人计算机、服务器计算机、手持或膝上设备、多处理器系统、基于微处理器的系统、可编程消费电子设备、网络PC、迷你计算机、大型机、包含上述任意系统或设备的分布计算环境,等等。
该排除故障系统可以在由一个或更多计算机或其他设备执行的计算机可执行指令(例如程序模块)的一般环境内进行描述。通常,程序模块包括可以执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。典型地,可以如在各实施例中所需来组合和分布程序模块的功能性。术语“应用程序”是指任意类型的执行软件,例如驱动程序、核心模式代码、操作系统、系统实用程序、网站服务器、数据库服务器等等。可以由每个对等计算机系统或由中央排除故障计算机系统来执行所述排除故障系统的各种功能,或者在对等计算机系统和中央排除故障系统之间分布这些功能。
                                                 表1
  名字   怀疑对象   样本1   样本2   样本3   样本4   样本5
  .jpg/contentType   image/jpeg   image/jpeg   image/jpeg   image/jpeg   image/jpeg   image/jpeg
  .htc/contentType   null   text/x-comp   text/x-comp   text/x-comp   text/x-comp   text/x-comp
  url-visited   yahoo   hotmail   Nytimes   SFGate   google   friendster
表1说明了排除故障情况的示例。该表示出各种怀疑配置参数的怀疑值和样本值。追踪程序将应用程序出现不希望状态时的怀疑配置参数和它们的怀疑值记录在日志中。在该示例中,追踪程序将三个配置参数识别为怀疑(例如.jpg/contentType)。该排除故障系统对于每个怀疑配置参数从5个样本计算机系统中检索样本值。对样本值的分析指示出最可能故障的配置参数是表中的第二个配置参数(即.htc/contentType)。该配置参数的所有样本值都是相同的(即“text/x-comp”),但它们与怀疑值(“null”)并不相同。因此,可以假设该第二配置参数的怀疑值是不正确的。因为第一配置参数的怀疑值和所有样本值都相同,因此,怀疑值可能是正确的。而且,由于第三配置参数的怀疑值和所有样本值都完全不同,因此,很难从样本值来断定其怀疑值的正确性。除了识别出第二配置参数可能出故障外,正确值可以推测作为公共样本值(即“text/x-comp”)。
表1说明两种不同类型的配置参数:配置状态和操作状态。第一和第二参数是配置状态,而第三参数是操作状态。操作状态参数具有通常由应用程序自身设定的值,并且包括时标、使用计数、高速缓冲、随机数生成器的种子、窗口位置、最近使用的相关信息等等。操作状态参数通常由用户设定以控制应用程序的操作,并且比操作状态参数更可能出现应用程序不希望状态的故障。
            表2
  N   样本计算机系统的数目
  t   怀疑配置参数的数目
  i   怀疑配置参数下标(从1到t)
  V   怀疑配置参数的值
  c   怀疑配置参数的可能值的数目
  m  匹配怀疑值的样本值的数目
  P(S)  怀疑配置参数出故障的先验概率(即病态为“S”)
  P(H)  怀疑配置参数不出故障的先验概率(即健康为“H”)
  P(S|V)  故障的怀疑配置参数具有值V的概率
  P(V|S)  具有值V的怀疑配置参数出故障的概率
  P(V|H)  具有值V的怀疑配置参数不出故障的概率
在一个实施例中,排除故障系统使用贝叶斯规则来计算每个怀疑配置参数出故障的概率。该贝叶斯规则可以如下表示:
P ( S | V ) = P ( V | S ) P ( S ) P ( V | S ) P ( S ) + P ( V | H ) P ( H ) . . . ( 1 )
表2含有公式中所使用的项的描述。为了简化公式,怀疑配置参数的下标i被从公式中忽略(例如,Pi(S|Vi)表示为P(S|V))。如果仅存在一个故障怀疑配置参数,并且所有的怀疑配置参数正在出故障的先验概率相等,那么:
P ( S ) = 1 t . . . ( 2 )
P ( H ) = 1 - 1 t . . . ( 3 )
如果一个怀疑配置参数的所有可能值具有相等的正在出故障的先验概率,那么:
P ( V | S ) = 1 c . . . ( 4 )
作为示例,如果一个配置参数可以具有红、绿或蓝这些值,那么,它具有三个唯一的样本值。该排除故障系统可以通过对怀疑配置参数的唯一样本值数目进行计数(如果出现空值也包含其中)并对在样本集中没有出现的所有可能值加1来计算基数。在这个示例中,基数是4(即3+1)。这样,公式4的先验概率是1/4。
怀疑配置参数的怀疑值没有出故障的概率可以从这些样本值中推导出来。特别地,可以假设该概率是该怀疑值在样本值中出现的次数除以样本值的数目。下面的公式给出了这种概率的最大似然率:
P ( V | H ) = m N . . . ( 5 )
将公式(2)-(5)代入公式(1),产生下述公式:
P ( S | V ) = N N + cm ( t - 1 ) . . . ( 6 )
然而,当限制样本计算机系统的数目时,最大似然率可能具有不希望的属性。例如,在样本值中没有值匹配V,那么,m=0且P(S|V)=1,这表示不能证明能完全确认。例如,在表1中,最大似然率指示了第二和第三配置参数是完全且同等可信为都出故障。当样本数目很小时,概率的贝叶斯估计可能更加合适。贝叶斯估计使用在审查样本值之前的P(V|H)的先验估计,并且产生审查样本值之后的后验估计。因此,P(V|H)不可能是0或1。
如果假设P(V|H)是对于所有可能值V的多项式,该多项式具有参数pj。每个pj是值Vj出现的概率,且
∑pj=1                                                        (7)
这些概率具有先验和后验值pj,可以以Dirichlet分布来表示。Dirichlet分布与多项式共轭。就是说对多项式的查验(obervation)与先验Dirichlet的结合产生了后验Dirichlet。
Dirichlet分布的特征在于计数向量nj,它对应于每个值Vj的可能计数的数目。为了执行P(V|H)的贝叶斯估计,使用反映与各值Vj似然率有关的先验置信的先验计数组n’j。可以收集来自样本值的每个唯一值的计数mj,并且后验Dirichlet的均值产生了下述公式的后验估值:
P ( V j | H ) = m j + n j , N + Σ j n j , . . . ( 8 )
由于仅怀疑值需要该概率,mj可以用m来代替,m是匹配怀疑条目的样本数目。而且,如果假设所有值Vj具有相同先验概率,那么,n’j可以由某些值n代替,并且总和∑jn’j可以由cn代替。这些假设会产生下述公式:
P ( S | V ) = N + cn N + cnt + cm ( t - 1 ) . . . ( 9 )
参数n与控制(overwhelm)先验值并从所估计的pj为1/c的概率中去除估计的P(V|H)概率所需要的样本值成比例。所述参数n指示了先验值的强度。换句话说,n越高,样本值中的置信度就越低。N越高,导致先验值越强,这就需要越多的证据(即样本)来改变所述后验值。如果为先验值选择n=1(等价于平先验值(flat prior),那么所有的多项式值pj同等类似于先验值。这称为“无信息”先验。
图2和图3是说明一个实施例中配置参数检索函数和追踪函数处理的流程图。图2说明了由病态应用程序调用以从配置数据存储器中检索配置参数值的函数处理的流程图。向该函数传递要检索的配置参数的标识符。在框201,该函数在配置数据存储器中定位所标识的配置参数的条目。在决策框202,如果定位了条目,就在框203继续函数,否则,在框204继续函数。在框203,该函数检索所标识配置参数的值。在框204,该函数调用追踪函数,传送配置参数标识和所检索到的值。如果没有定位到配置参数,该值就为null。该函数随后向病态应用程序返回检索到的值。该函数可以作为配置数据存储器的应用程序编程接口的一部分来实现。
图3是说明一个实施例中追踪函数处理的流程图。向该函数传递配置参数标识符和其值。该函数将所传送的标识符和值记录在日志中。在框301,该函数将所检索到的配置参数数目递增。在一个实施例中,该函数可以为每个配置参数只记录一个值。如果病态应用程序多次访问同一配置参数,该函数将记录最后配置参数和其值对。在这种情况,该函数将需要检查到配置参数的副本访问,并且仅当没有发现副本时,再递增配置参数的数目。在框302,该函数存储怀疑配置参数的标识符。在框303,该函数存储怀疑配置参数值并返回。
图4-7是说明在一个实施例中排除故障系统处理的流程图。图4是说明在一个实施例中排除故障引擎处理的流程图。排除故障引擎从驻留有病态应用程序的病态计算机系统中接收怀疑配置参数的值。在框401,该引擎调用规范组件传送怀疑配置参数的标识符和它们的值。在框402,引擎调用识别样本集组件传送病态应用程序的标识符和怀疑配置参数的标识符,并接收返回的样本值。在框403,引擎调用排列怀疑对象组件传送怀疑值和样本值,并根据每个怀疑值出故障的概率接收怀疑值的排列。该排列怀疑对象组件根据公式9计算概率。该引擎随后完成。
图5是说明在一个实施例中规范组件处理的流程图。向该组件传送怀疑配置参数标识符及它们的值,该组件对系统特定配置参数的怀疑值进行规范化。该组件还可以适用于对怀疑值进行标准化。在框501,该组件对怀疑配置参数阵列初始化下标。在框502-507,该组件循环处理每个怀疑配置参数。在框502,该组件选择下一怀疑配置参数。在框503,如果所有的怀疑配置参数都已经被选择,那么,该组件返回,否则,该组件在框504继续。在框504,该组件选择下一系统特定配置参数。在决策框505,如果所有的系统特定配置参数已经被选择,那么该组件循环到步骤502以选择下一怀疑配置参数,否则,该组件在框506继续。在框506,如果所选择的系统特定配置参数与所选择的怀疑配置参数相同,那么在框507继续该组件,否则该组件循环到框504以选择下一系统特定配置参数。在框507,该组件将所选择系统特定配置参数的值设定为用于该选择系统特定配置参数的规范化值,并随后循环到框502以选择下一怀疑配置参数。
图6是说明一个实施例中识别样本集组件处理的流程图。向该组件传送病态应用程序的指示和怀疑配置参数。在该实施例中,组件对样本配置数据库进行访问,所述样本配置数据库含有从对等计算机系统中预先检索出的样本值。作为检索处理的一部分,该排除故障系统可以以规范或标准形式放置样本值,例如,使用图5的规范化组件。在框601,该组件对样本计算机系统的下标进行初始化。在框602-607,该组件循环识别样本计算机系统直到识别到所指定的数目。在框602,该组件从样本配置数据库中选择下一对等计算机系统。在决策框603,如果所有对等计算机系统已经被选择,那么该组件返回没有找到足够的样本计算机系统的指示,否则,该组件在框604继续。在决策框604,如果在所选择的对等计算机系统上安装有病态应用程序,那么它就是样本计算机系统,并且在框605继续,否则,组件循环到框602以选择下一对等计算机系统。在框605,该组件将已经识别的样本计算机系统的下标进行递增。在框606,该组件检索所选择对等计算机系统的每个怀疑配置参数的样本值。在决策框607,如果识别到足够的样本计算机系统,那么该组件就返回样本值,否则,组件循环到框602以选择下一对等计算机系统。
图7是说明一个实施例中排列怀疑对象组件处理的流程图。向该组件传送怀疑值和样本值。该组件返回每个怀疑配置参数出故障的概率,并返回具有最高概率的配置参数的可能正确值的指示。在框701-708,该组件循环选择每个怀疑配置参数,并计算它出故障的概率。在框701,该组件选择下一怀疑配置参数i。在框702,如果所有怀疑配置参数已经被选择,那么该组件就返回,否则,该组件在框703继续。在框703,该组件在所选择怀疑配置参数的样本中对不同值ci的数目进行计数。该排除故障系统可以在从对等计算机系统中检索到配置参数时计算和存储该计数。在框704,该组件设定可以从病态计算机系统接收到的怀疑配置参数的数目t。在框705中,该组件设定可以从识别样本集组件中获得的样本的数目N。在框706中,该组件设定匹配怀疑值mij的所选怀疑配置参数的样本值的数目。该排除故障系统还计算并存储从对等计算机系统中检索到的每个配置参数的每个样本值的出现数目。在框707,该组件设定系统在样本中具有的置信度n的指示符。在框708,该组件使用公式9计算怀疑配置参数的概率P(S|V),并且循环到框701以选择下一怀疑配置参数。
图8是说明排除故障引擎结果的显示页。该显示页可以由病态计算机系统显示来帮助用户修正故障的配置参数。该显示页包括表801,该表为每个怀疑配置参数设置一行。每个行包括怀疑配置参数标识、该怀疑配置参数出故障的概率、该怀疑配置参数的怀疑值,以及可能正确的样本值。这些样本值可以是最普遍的样本值。该显示页还包括按钮802,用于更新怀疑配置参数的值。当用户为一个或更多怀疑配置参数选择样本值并随后选择更新按钮,该系统就改变病态计算机系统上配置数据存储器中怀疑配置参数的值为所选值。随后,用户可以执行应用程序以确定是否其还存在不希望状态。如果是,用户可以选择重置按钮803以将怀疑配置参数重置回它们的怀疑值。用户可以对怀疑配置参数及其值的各种组合重复这种处理,直到应用程序不再出现不希望的状态。
本领域的技术人员可以理解,虽然该排除故障系统的特定实施例已经出于说明的目的被描述,但在不背离本发明的精神和范畴的情况下,还可以做出许多修改。该排除故障系统还可以用于识别硬件配置问题。例如,如果对等计算机系统包括具有配置参数的专用信号处理硬件,那么,对于出现不希望状态的计算机系统的这些配置参数的怀疑值可以如上所述与样本值进行比较。而且,该排除故障系统可以用于具有多个配置参数的环境中,例如,为电视机顶盒、蜂窝电话、汽车等进行设定。排除故障系统的技术还可以用于识别引起某种状态的信息,这种状态可以是希望的也可以是不希望的。例如,应用程序的执行可能对其运行的计算机系统的整体配置产生不利的影响。作为一个示例,不希望的状态可能由于丢失的操作系统组件、过期驱动程序、不充足的主存储器、与用户的交互、URL参数、API参数等等所引起。排除故障系统技术就可以用于对从样本系统收集的这种信息进行分析以识别出该状态的起因。该技术还可以用于识别希望状态的起因。例如,复杂的系统可能具有数百个具有不同的会影响其状态的可能值的“参数”。在这种情况下,要预知参数值中每个可能组合的状态是不切实际的。然而,一旦识别出希望状态,该技术就能用于识别可能引起所需状态的参数及其值,这种识别是通过将其与不出现该状态的样本集(或甚至与出现该状态的样本)进行比较来实现。所描述的技术涉及美国临时申请号60/545,799(代理摘要号41826.8015US),名为“友好排除故障网络:面向隐私保密、自动排除故障”(FRIENDS TROUBLESHOOTING NETWORK:TOWARDS PRIVACY-PRESERVING,AUTOMATIC TROUBLESHOOTING),2004年2月19日提交,和美国临时申请号60/547,607(代理记录号41826.8015US1)名为“根据可信关系从计算机系统收集信息的方法和系统”(METHODAND SYSTEM FOR COLLECTING INFORMATION FROM COMPUTERSYSTEM BASED ON A TRUSTED RELATIONSHIP),2004年2月24日提交,在此将它们引入作为参考。这些申请描述了可以用于检索样本配置参数值的技术。因此,本发明并不局限于此,而是由所附权利要求所限定。

Claims (39)

1.一种在计算机系统中用于识别可能引起组件出现不希望状态的配置参数的方法,所述方法包括:
收集该组件的怀疑配置参数的怀疑值;
提供样本组件的怀疑配置参数的样本值;以及
将怀疑值和样本值进行比较以识别其怀疑值可能引起该组件出现不希望状态的怀疑配置参数。
2.如权利要求1所述的方法,其特征在于,所述比较包括计算每个怀疑配置参数的概率。
3.如权利要求1所述的方法,其特征在于,在出现不希望状态的组件执行期间收集所述怀疑值。
4.如权利要求1所述的方法,其特征在于,提供样本值包括从每个样本组件中检索怀疑配置参数的样本值。
5.如权利要求4所述的方法,其特征在于,样本值的检索是在收集怀疑值之前执行,其中对包含所述怀疑配置参数的配置参数检索所述样本值。
6.如权利要求4所述的方法,其特征在于,样本值的检索是在收集所述怀疑值之后执行。
7.如权利要求6所述的方法,其特征在于,所述样本值是从安装有该组件的样本计算机系统中检索的。
8.如权利要求7所述的方法,其特征在于,维护一索引,该索引指示了安装有该组件的计算机系统。
9.如权利要求1所述的方法,其特征在于,所述收集包括运行程序,所述程序截取并记录该组件对配置数据存储器的访问。
10.如权利要求9所述的方法,其特征在于,所述配置数据存储器是注册文件。
11.如权利要求9所述的方法,其特征在于,所述配置数据存储器是资源文件。
12.如权利要求1所述的方法,其特征在于,系统特定的配置参数的值以规范形式放置。
13.如权利要求1所述的方法,其特征在于,配置参数的值以标准形式放置。
14.如权利要求1所述的方法,其特征在于,所述组件是硬件设备。
15.如权利要求1所述的方法,其特征在于,还包括在收集所述怀疑值之前聚集所述样本值以便于与所述怀疑值比较。
16.如权利要求15所述的方法,其特征在于,所述聚集包括对每个怀疑配置参数的不同样本值的数目进行计数。
17.如权利要求16所述的方法,其特征在于,所述聚集包括对各自具有不同值的样本组件的数目进行计数。
18.如权利要求1所述的方法,其特征在于,还包括识别出样本配置参数的可能正确值,所述配置参数被识别为可能引起组件出现不希望状态。
19.如权利要求18所述的方法,其特征在于,所述可能正确样本值是最常见的值。
20.如权利要求18所述的方法,其特征在于,还包含将被识别为可能引起组件出现不希望状态的怀疑配置参数的怀疑值改变成经识别的可能正确值。
21.如权利要求18所述的方法,其特征在于,还包括向用户呈现可能引起组件出现不希望状态的怀疑配置参数的可能正确值的指示。
22.如权利要求18所述的方法,其特征在于,还包括向用户呈现可能引起组件出现不希望状态的怀疑配置参数的排列。
23.一种用于存储计算机系统的配置参数的值的方法,其特征在于,所述方法包括:
从计算机系统检索配置参数的样本值;以及
依据配置参数的样本值生成集合值。
24.如权利要求23所述的方法,其特征在于,所述经检索的样本值和集合值可存储在数据存储器中。
25.如权利要求23所述的方法,其特征在于,经检索的样本值以标准形式放置。
26.如权利要求23所述的方法,其特征在于,通过对每个配置参数的不同样本值的数目进行计数来生成集合值。
27.如权利要求26所述的方法,其特征在于,通过对各自具有不同样本值的计算机系统的数目进行计数来生成集合值。
28.如权利要求23所述的方法,其特征在于,每个配置参数与应用程序相关,而每个计算机系统具有一个或更多的应用程序且包括生成一索引,所述索引将每个应用程序映射到与该应用程序相关的计算机系统。
29.一种计算机可读媒体,包括用于通过下述方法来控制计算机系统来识别出现特定状态的组件起因的指令,所述方法包括下述步骤:
收集所述组件一实例的怀疑信息的怀疑值;
提供所述怀疑信息的样本值,所述样本值是从该组件其他实例中收集;以及
依据所述样本值的分析,对其怀疑值可能引起特定状态的怀疑信息进行识别。
30.如权利要求29所述的计算机可读媒体,其特征在于,所述组件是应用程序,并且所述信息是所述应用程序的配置参数。
31.如权利要求30所述的计算机可读媒体,其特征在于,所述收集包括执行出现所述特定状态的应用程序实例,并记录对所述应用程序配置参数的访问。
32.如权利要求31所述的计算机可读媒体,其特征在于,所述状态是不希望状态。
33.如权利要求30所述的计算机可读媒体,其特征在于,所述分析包括计算每个怀疑配置参数会引起所述特定状态的概率。
34.如权利要求33所述的计算机可读媒体,其特征在于,所述概率是依据贝叶斯规则来计算。
35.如权利要求30所述的计算机可读媒体,其特征在于,还包括改变经识别的配置参数的怀疑值,并执行所述应用程序实例。
36.如权利要求29所述的计算机可读媒体,其特征在于,所述分析包括计算每个怀疑值会引起所述特定状态的概率。
37.一种用于识别引起不希望状态的应用程序的配置参数的计算机系统,包括:
怀疑配置参数的怀疑值的数据存储器,当出现不希望状态时,所述怀疑值是从所述应用程序的执行中收集的;
怀疑参数的样本值饿数据存储器,所述样本值是从其他应用程序的实例中收集的;以及
用于依据所述样本值的分析来识别具有可能引起所述不希望状态的怀疑值的怀疑参数的装置。
38.如权利要求37所述的计算机系统,其特征在于,所述分析包括计算每个怀疑参数引起不希望状态的概率。
39.如权利要求38所述的计算机系统,其特征在于,所述概率依据贝叶斯规则来计算。
CN2005100519226A 2004-02-19 2005-02-18 根据其他计算机系统的配置来排除计算机系统错误配置的方法和系统 Expired - Fee Related CN1722102B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US54579904P 2004-02-19 2004-02-19
US60/545,799 2004-02-19
US54760804P 2004-02-24 2004-02-24
US60/547,608 2004-02-24
US10/918,786 2004-08-13
US10/918,786 US7584382B2 (en) 2004-02-19 2004-08-13 Method and system for troubleshooting a misconfiguration of a computer system based on configurations of other computer systems

Publications (2)

Publication Number Publication Date
CN1722102A true CN1722102A (zh) 2006-01-18
CN1722102B CN1722102B (zh) 2010-04-28

Family

ID=34714397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005100519226A Expired - Fee Related CN1722102B (zh) 2004-02-19 2005-02-18 根据其他计算机系统的配置来排除计算机系统错误配置的方法和系统

Country Status (5)

Country Link
US (2) US7584382B2 (zh)
EP (1) EP1566734A3 (zh)
JP (2) JP4942939B2 (zh)
KR (1) KR101114093B1 (zh)
CN (1) CN1722102B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103907093A (zh) * 2011-10-31 2014-07-02 国际商业机器公司 基于诊断历史的故障检测
CN101535960B (zh) * 2006-09-29 2014-12-03 罗伯特.博世有限公司 用于故障管理的方法和装置
CN112805642A (zh) * 2018-08-07 2021-05-14 西门子股份公司 用于远程管理工业机器的配置的系统和方法

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1557074A4 (en) 2002-10-22 2010-01-13 Sullivan Jason ROBUST ADJUSTABLE COMPUTER PROCESSING SYSTEM
JP2006512691A (ja) 2002-10-22 2006-04-13 アイシス テクノロジーズ 改善された熱放散特性を有する非周辺処理制御モジュール
KR101499826B1 (ko) 2002-10-22 2015-03-10 제이슨 에이. 설리반 맞춤형 로버스트 컴퓨팅 시스템, 처리 제어 유닛, 및 무선 컴퓨팅 네트워크 장치
US20040199828A1 (en) * 2003-04-01 2004-10-07 International Business Machines Corporation Method and apparatus for tracing troubleshooting events for aiding technical assistance
US7392295B2 (en) * 2004-02-19 2008-06-24 Microsoft Corporation Method and system for collecting information from computer systems based on a trusted relationship
US7584382B2 (en) * 2004-02-19 2009-09-01 Microsoft Corporation Method and system for troubleshooting a misconfiguration of a computer system based on configurations of other computer systems
US20060047793A1 (en) * 2004-08-31 2006-03-02 Ibm Corporation Method for configuring computing devices using reference groups
US20060112126A1 (en) * 2004-11-16 2006-05-25 Carlos Soto Automatic screen pop showing troubleshooting information
US7614046B2 (en) * 2004-11-24 2009-11-03 Microsoft Corporation Method and system for analyzing the impact of a software update
US7624377B2 (en) * 2005-01-04 2009-11-24 Sap Ag Methods relating to configuration of software
US8234485B2 (en) * 2005-01-04 2012-07-31 Sap Ag Method relating to rule-regulated software configuration
US20060195750A1 (en) * 2005-02-25 2006-08-31 Oracle International Corporation Simplifying Troubleshooting of Errors in Configurable Parameter Values Associated with Computer Supported Business-flows
US7805752B2 (en) * 2005-11-09 2010-09-28 Symantec Corporation Dynamic endpoint compliance policy configuration
US7584182B2 (en) * 2005-12-19 2009-09-01 Microsoft Corporation Determining cardinality of a parameter using hash values
US7856100B2 (en) * 2005-12-19 2010-12-21 Microsoft Corporation Privacy-preserving data aggregation using homomorphic encryption
US7743123B2 (en) * 2005-12-19 2010-06-22 Microsoft Corporation Aggregating information from a cluster of peers
JP2007241533A (ja) * 2006-03-07 2007-09-20 Oki Electric Ind Co Ltd システム構成情報比較装置およびコンピュータプログラム
US8239915B1 (en) * 2006-06-30 2012-08-07 Symantec Corporation Endpoint management using trust rating data
EP1909173B1 (en) * 2006-10-06 2010-02-24 Hewlett-Packard Development Company, L.P. Management of data of settings in an operating system of a computer
EP1918817A1 (en) * 2006-10-31 2008-05-07 Hewlett-Packard Development Company, L.P. Software failure analysis
US7840854B2 (en) * 2006-12-01 2010-11-23 Ntt Docomo, Inc. Apparatus and associated methods for diagnosing configuration faults
US8117486B2 (en) * 2007-04-10 2012-02-14 Xerox Corporation Method and system for detecting an anomalous networked device
US8171347B2 (en) * 2007-07-11 2012-05-01 Oracle America, Inc. Method and apparatus for troubleshooting a computer system
US8019987B2 (en) * 2008-02-11 2011-09-13 International Business Machines Corporation System configuration analysis
US20090271663A1 (en) * 2008-04-24 2009-10-29 Vining Robert G Providing detailed program state information for error analysis
CN101650670B (zh) * 2008-08-14 2013-01-09 鸿富锦精密工业(深圳)有限公司 可共享应用程序配置参数的电子系统及其方法
JP5237034B2 (ja) * 2008-09-30 2013-07-17 株式会社日立製作所 イベント情報取得外のit装置を対象とする根本原因解析方法、装置、プログラム。
US8726391B1 (en) 2008-10-10 2014-05-13 Symantec Corporation Scheduling malware signature updates in relation to threat awareness and environmental safety
US20100229022A1 (en) * 2009-03-03 2010-09-09 Microsoft Corporation Common troubleshooting framework
JP5274652B2 (ja) * 2009-03-30 2013-08-28 株式会社日立製作所 原因分析構成変更のための方法および装置
DE102009043286A1 (de) * 2009-09-29 2011-03-31 Abb Technology Ag Verfahren und Vorrichtung zur Überprüfung der Konfigurierung eines Computersystems
TW201128539A (en) * 2010-02-03 2011-08-16 Jmicron Technology Corp Method for setting operating frequency of memory card and related card reader
IT1397985B1 (it) * 2010-02-08 2013-02-04 Prima Ind Spa Procedimento di monitoraggio della qualità di processi di lavorazione laser e relativo sistema
US8458525B2 (en) * 2010-03-19 2013-06-04 Hamilton Sundstrand Space Systems International, Inc. Bayesian approach to identifying sub-module failure
US8219854B2 (en) * 2010-03-24 2012-07-10 Microsoft Corporation Validating configuration of distributed applications
US20110307746A1 (en) * 2010-06-07 2011-12-15 Sullivan Jason A Systems and Methods for Intelligent and Flexible Management and Monitoring of Computer Systems
US20110314138A1 (en) * 2010-06-21 2011-12-22 Hitachi, Ltd. Method and apparatus for cause analysis configuration change
JP5533466B2 (ja) * 2010-09-07 2014-06-25 日本電気株式会社 パラメタ管理装置、パラメタ管理方法およびパラメタ管理プログラム
US20120117227A1 (en) * 2010-11-10 2012-05-10 Sony Corporation Method and apparatus for obtaining feedback from a device
US8862938B2 (en) * 2011-04-18 2014-10-14 General Electric Company System, method, and apparatus for resolving errors in a system
WO2013042182A1 (ja) * 2011-09-20 2013-03-28 株式会社日立製作所 リスク判定方法及びリスク判定サーバ
US9003222B2 (en) 2011-09-30 2015-04-07 International Business Machines Corporation Configuration fault localization in shared resource environments
US20150084433A1 (en) * 2013-09-23 2015-03-26 Linkez Technologies Private LimitedHubli Standalone power cord to automate electrical appliances for home automation
US20160342453A1 (en) * 2015-05-20 2016-11-24 Wanclouds, Inc. System and methods for anomaly detection
JP6351545B2 (ja) * 2015-06-09 2018-07-04 三菱電機株式会社 パラメータ管理装置およびパラメータ管理プログラム
US9639411B2 (en) 2015-07-24 2017-05-02 Bank Of America Corporation Impact notification system
US10511489B2 (en) * 2015-09-30 2019-12-17 Hitachi, Ltd. Storage operational management service providing apparatus, storage operational management service providing method, and storage operational management system
US10133587B2 (en) 2015-10-28 2018-11-20 International Business Machines Corporation Generating component pages to render in a configuration page in a graphical user interface to configure a computing resource
JP6528669B2 (ja) * 2015-12-14 2019-06-12 富士通株式会社 予兆検知プログラム、装置、及び方法
US10176034B2 (en) 2016-02-16 2019-01-08 International Business Machines Corporation Event relationship analysis in fault management
JP6696252B2 (ja) * 2016-03-24 2020-05-20 富士ゼロックス株式会社 通信プログラム、通信装置及び情報処理装置
US10230579B2 (en) * 2016-04-28 2019-03-12 Netapp, Inc. Techniques for computer system configuration analysis
US10255369B2 (en) * 2016-07-20 2019-04-09 Oath Inc. Device identification for multiple device IDS
US10749748B2 (en) 2017-03-23 2020-08-18 International Business Machines Corporation Ranking health and compliance check findings in a data storage environment
US10802904B2 (en) 2017-05-16 2020-10-13 Apple Inc. Techniques for repairing an inoperable auxiliary device using another device
CN108600704A (zh) * 2018-05-08 2018-09-28 深圳市智汇牛科技有限公司 一种自动厨房领域的监控系统架构
DE102020202897A1 (de) 2020-03-06 2021-09-09 Siemens Mobility GmbH Verfahren zur Überprüfung eines Istzustands elektronischer Komponenten
KR20220138710A (ko) 2021-04-06 2022-10-13 제트정보기술(주) 시스템을 유지 관리하는 방법 및 장치

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9302225D0 (en) * 1993-02-05 1993-03-24 Int Computers Ltd Data processing system
US5996075A (en) 1995-11-02 1999-11-30 Sun Microsystems, Inc. Method and apparatus for reliable disk fencing in a multicomputer system
US5892903A (en) * 1996-09-12 1999-04-06 Internet Security Systems, Inc. Method and apparatus for detecting and identifying security vulnerabilities in an open network computer communication system
US5867714A (en) * 1996-10-31 1999-02-02 Ncr Corporation System and method for distributing configuration-dependent software revisions to a computer system
US5822743A (en) * 1997-04-08 1998-10-13 1215627 Ontario Inc. Knowledge-based information retrieval system
US6047332A (en) 1997-06-30 2000-04-04 Sun Microsystems, Inc. Global file system-based system and method for rendering devices on a cluster globally visible
JPH11134018A (ja) * 1997-10-31 1999-05-21 Nec Corp 診断装置及びプログラムを記録した機械読み取り可能な記録媒体
US6084877A (en) 1997-12-18 2000-07-04 Advanced Micro Devices, Inc. Network switch port configured for generating an index key for a network switch routing table using a programmable hash function
US6108800A (en) * 1998-02-10 2000-08-22 Hewlett-Packard Company Method and apparatus for analyzing the performance of an information system
US6473659B1 (en) * 1998-04-10 2002-10-29 General Electric Company System and method for integrating a plurality of diagnostic related information
JP2000339188A (ja) * 1999-05-27 2000-12-08 Harness Syst Tech Res Ltd プログラム実行異常検出装置
US6880107B1 (en) * 1999-07-29 2005-04-12 International Business Machines Corporation Software configuration monitor
US6704752B1 (en) 1999-10-12 2004-03-09 Cisco Technology, Inc. Method and system for executing, tracking and restoring temporary router configuration change using a centralized database
US6671811B1 (en) * 1999-10-25 2003-12-30 Visa Internation Service Association Features generation for use in computer network intrusion detection
US6615367B1 (en) * 1999-10-28 2003-09-02 General Electric Company Method and apparatus for diagnosing difficult to diagnose faults in a complex system
DE1111550T1 (de) * 1999-12-23 2002-04-18 Abb Ab Vaesteraas Verfahren und Vorrichtung zur Überwachung des Betriebszustandes einer einzelnen Maschine
WO2001065330A2 (en) 2000-03-03 2001-09-07 Sanctum Ltd. System for determining web application vulnerabilities
US6691249B1 (en) * 2000-03-22 2004-02-10 Agilent Technologies, Inc. Probabilistic diagnosis, in particular for embedded and remote applications
US6738811B1 (en) * 2000-03-31 2004-05-18 Supermicro Computer, Inc. Method and architecture for monitoring the health of servers across data networks
HUP0301759A2 (en) * 2000-04-19 2003-08-28 Teradyne Inc Pc configuration fault analysis
US6862696B1 (en) * 2000-05-03 2005-03-01 Cigital System and method for software certification
US6990606B2 (en) * 2000-07-28 2006-01-24 International Business Machines Corporation Cascading failover of a data management application for shared disk file systems in loosely coupled node clusters
US7002993B1 (en) 2000-08-18 2006-02-21 Juniper Networks, Inc. Method and apparatus providing media aggregation in a packet-switched network
AU2001293080A1 (en) * 2000-09-28 2002-04-15 Symantec Corporation System and method for analyzing protocol streams for a security-related event
US6970943B1 (en) 2000-10-11 2005-11-29 Nortel Networks Limited Routing architecture including a compute plane configured for high-speed processing of packets to provide application layer support
JP4608789B2 (ja) 2001-02-27 2011-01-12 日本電気株式会社 マルチアクセス通信システム及びデータ送受信装置
GB2372670B (en) 2001-02-27 2003-01-08 3Com Corp Optimisation of network configuration
US7203729B2 (en) 2001-04-20 2007-04-10 Motorola Inc. Method and apparatus for a communication network with nodes capable of selective cluster head operation
US6895534B2 (en) * 2001-04-23 2005-05-17 Hewlett-Packard Development Company, L.P. Systems and methods for providing automated diagnostic services for a cluster computer system
US20020169738A1 (en) * 2001-05-10 2002-11-14 Giel Peter Van Method and system for auditing an enterprise configuration
US6763482B2 (en) * 2001-06-19 2004-07-13 Xerox Corporation Printer diagnostics method
JP3579834B2 (ja) * 2001-06-29 2004-10-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 管理可能なネットワークにおける事前対策オンライン診断
WO2003009140A2 (en) 2001-07-20 2003-01-30 Altaworks Corporation System and method for adaptive threshold determination for performance metrics
US6990602B1 (en) * 2001-08-23 2006-01-24 Unisys Corporation Method for diagnosing hardware configuration in a clustered system
US7003514B2 (en) 2001-09-13 2006-02-21 International Business Machines Corporation Method and apparatus for restricting a fan-out search in a peer-to-peer network based on accessibility of nodes
JP2003114811A (ja) * 2001-10-05 2003-04-18 Nec Corp 自動障害復旧方法及びシステム並びに装置とプログラム
US6768721B1 (en) 2001-10-26 2004-07-27 Networks Associates Technology, Inc. Method and apparatus for monitoring different channels in an IEEE 802.11 wireless LAN
DE60130902T2 (de) * 2001-11-23 2008-07-17 Protegrity Research & Development Verfahren zum Erkennen des Eindringens in ein Datenbanksystem
US7225343B1 (en) * 2002-01-25 2007-05-29 The Trustees Of Columbia University In The City Of New York System and methods for adaptive model generation for detecting intrusions in computer systems
US7320035B2 (en) * 2002-03-01 2008-01-15 Sun Microsystems, Inc. Object mutation determination for incremental state saves
US7209932B2 (en) 2002-03-25 2007-04-24 International Business Machines Corporation Method, system, and program for allocating tasks to a plurality of processors
US7359962B2 (en) * 2002-04-30 2008-04-15 3Com Corporation Network security system integration
US20030225899A1 (en) 2002-05-28 2003-12-04 Murphy Walter Vincent Enhancing system performance using a network-based multi-processing technique
JP2003345628A (ja) * 2002-05-29 2003-12-05 Hitachi Ltd 障害調査資料採取方法及びその実施システム並びにその処理プログラム
US20030237017A1 (en) * 2002-06-24 2003-12-25 Jibbe Mahmoud Khaled Component fault isolation in a storage area network
US20040019878A1 (en) * 2002-07-23 2004-01-29 Sreekrishna Kotnur Software tool to detect and restore damaged or lost software components
US7487543B2 (en) * 2002-07-23 2009-02-03 International Business Machines Corporation Method and apparatus for the automatic determination of potentially worm-like behavior of a program
US7171469B2 (en) 2002-09-16 2007-01-30 Network Appliance, Inc. Apparatus and method for storing data in a proxy cache in a network
US7386839B1 (en) * 2002-11-06 2008-06-10 Valery Golender System and method for troubleshooting software configuration problems using application tracing
US7058861B1 (en) * 2002-12-31 2006-06-06 Sprint Communications Company Llp Network model audit and reconciliation using state analysis
KR100427143B1 (ko) 2003-01-17 2004-04-14 엔에이치엔(주) 스트리밍 데이터 전송 및 다운로드 방법
CN100593313C (zh) 2003-02-28 2010-03-03 飞思卡尔半导体公司 用于无线网络中的动态聚集的方法和系统
US7246156B2 (en) * 2003-06-09 2007-07-17 Industrial Defender, Inc. Method and computer program product for monitoring an industrial network
US20040260678A1 (en) * 2003-06-18 2004-12-23 Microsoft Corporation State based configuration failure detection using checkpoint comparison
US7506305B2 (en) * 2003-07-14 2009-03-17 Microsoft Corporation Dynamic contextual helper user interface
US7325185B1 (en) * 2003-08-04 2008-01-29 Symantec Corporation Host-based detection and prevention of malicious code propagation
US7134008B2 (en) * 2003-09-04 2006-11-07 Sun Microsystems, Inc. Utility for configuring and verifying data sources
US7103874B2 (en) 2003-10-23 2006-09-05 Microsoft Corporation Model-based management of computer systems and distributed applications
US7441011B2 (en) 2003-10-23 2008-10-21 Microsoft Corporation Truth on client persistent caching
US7117312B1 (en) 2003-11-17 2006-10-03 Sun Microsystems, Inc. Mechanism and method employing a plurality of hash functions for cache snoop filtering
US7430598B2 (en) * 2003-11-25 2008-09-30 Microsoft Corporation Systems and methods for health monitor alert management for networked systems
FR2863127A1 (fr) * 2003-12-02 2005-06-03 Canon Kk Procedes et dispositifs pour la delivrance asynchrone de donnees numeriques
US7765592B2 (en) * 2004-01-10 2010-07-27 Microsoft Corporation Changed file identification, software conflict resolution and unwanted file removal
US7584382B2 (en) 2004-02-19 2009-09-01 Microsoft Corporation Method and system for troubleshooting a misconfiguration of a computer system based on configurations of other computer systems
US7392295B2 (en) 2004-02-19 2008-06-24 Microsoft Corporation Method and system for collecting information from computer systems based on a trusted relationship
US7694022B2 (en) 2004-02-24 2010-04-06 Microsoft Corporation Method and system for filtering communications to prevent exploitation of a software vulnerability
US7614046B2 (en) 2004-11-24 2009-11-03 Microsoft Corporation Method and system for analyzing the impact of a software update
JP2007025906A (ja) * 2005-07-13 2007-02-01 Konica Minolta Business Technologies Inc インストール支援方法、ワークフロー作成支援方法
US7804773B2 (en) 2005-10-25 2010-09-28 At&T Intellectual Property I, L.P. System and method of managing data flow in a network
US7743123B2 (en) 2005-12-19 2010-06-22 Microsoft Corporation Aggregating information from a cluster of peers
US7856100B2 (en) * 2005-12-19 2010-12-21 Microsoft Corporation Privacy-preserving data aggregation using homomorphic encryption
US7584182B2 (en) * 2005-12-19 2009-09-01 Microsoft Corporation Determining cardinality of a parameter using hash values

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101535960B (zh) * 2006-09-29 2014-12-03 罗伯特.博世有限公司 用于故障管理的方法和装置
CN103907093A (zh) * 2011-10-31 2014-07-02 国际商业机器公司 基于诊断历史的故障检测
CN103907093B (zh) * 2011-10-31 2017-02-22 国际商业机器公司 用于检测系统中的故障的方法和系统
CN112805642A (zh) * 2018-08-07 2021-05-14 西门子股份公司 用于远程管理工业机器的配置的系统和方法

Also Published As

Publication number Publication date
EP1566734A3 (en) 2007-09-05
EP1566734A2 (en) 2005-08-24
JP2005251191A (ja) 2005-09-15
US20050188268A1 (en) 2005-08-25
JP2011258230A (ja) 2011-12-22
JP4942939B2 (ja) 2012-05-30
US7584382B2 (en) 2009-09-01
KR20060042100A (ko) 2006-05-12
US20070300103A1 (en) 2007-12-27
KR101114093B1 (ko) 2012-02-21
US7890807B2 (en) 2011-02-15
CN1722102B (zh) 2010-04-28

Similar Documents

Publication Publication Date Title
CN1722102B (zh) 根据其他计算机系统的配置来排除计算机系统错误配置的方法和系统
US10650034B2 (en) Categorizing users based on similarity of posed questions, answers and supporting evidence
US11539578B2 (en) Generating actionable alert messages for resolving incidents in an information technology environment
US8943039B1 (en) Centralized web-based software solution for search engine optimization
US8972379B1 (en) Centralized web-based software solution for search engine optimization
US10880273B2 (en) Secure electronic messaging system
US8473495B2 (en) Centralized web-based software solution for search engine optimization
US20190095510A1 (en) Low-latency streaming analytics
US20170221080A1 (en) Brand Analysis
US7421429B2 (en) Generate blog context ranking using track-back weight, context weight and, cumulative comment weight
US20070100993A1 (en) Assessment of Click or Traffic Quality
US20080005069A1 (en) Entity-specific search model
US9646047B2 (en) Efficient extraction of intelligence from web data
CN1752960A (zh) 用于创建知识互换概况文件的方法、系统和装置
US11809455B2 (en) Automatically generating user segments
US8909768B1 (en) Monitoring of metrics to identify abnormalities in a large scale distributed computing environment
Zhang Ordering new conditional residual lifetimes of k-out-of-n systems
Hawwash et al. Mining and tracking evolving web user trends from large web server logs
US20100251270A1 (en) Selective Mobile Metering
Chau et al. A framework for locating and analyzing hate groups in blogs
US11714698B1 (en) System and method for machine-learning based alert prioritization
US9582575B2 (en) Systems and methods for linking items to a matter
Tomlinson et al. Targeted Training for Multi-organization Recommendation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100428

Termination date: 20140218