DE10208959B4 - Method and device for detecting and evaluating information stored in a computer network - Google Patents

Method and device for detecting and evaluating information stored in a computer network Download PDF

Info

Publication number
DE10208959B4
DE10208959B4 DE10208959A DE10208959A DE10208959B4 DE 10208959 B4 DE10208959 B4 DE 10208959B4 DE 10208959 A DE10208959 A DE 10208959A DE 10208959 A DE10208959 A DE 10208959A DE 10208959 B4 DE10208959 B4 DE 10208959B4
Authority
DE
Germany
Prior art keywords
web server
service machine
information
user
converter unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE10208959A
Other languages
German (de)
Other versions
DE10208959A1 (en
Inventor
Peter Schneider
Hannes Prokoph
Michael Walbrach
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EQUERO FUTURE NET TECHNOLOGIES
EQUERO FUTURE NET TECHNOLOGIES AG
Original Assignee
EQUERO FUTURE NET TECHNOLOGIES
EQUERO FUTURE NET TECHNOLOGIES AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EQUERO FUTURE NET TECHNOLOGIES, EQUERO FUTURE NET TECHNOLOGIES AG filed Critical EQUERO FUTURE NET TECHNOLOGIES
Priority to DE10208959A priority Critical patent/DE10208959B4/en
Publication of DE10208959A1 publication Critical patent/DE10208959A1/en
Application granted granted Critical
Publication of DE10208959B4 publication Critical patent/DE10208959B4/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

Verfahren zur Erfassung und Auswertung von in einem Rechnernetzwerk statisch und/oder dynamisch abgelegten Informationen, bei dem eine Servicemaschine (3) mit wenigstens einem Webserver (5) jeweils unter Zwischenschaltung einer Konvertereinheit (4) in Datenverbindung tritt, wobei zumindest folgende Schritte durchlaufen werden;
– benutzer- und/oder ereignisabhängige Generierung einer Anfrage von der Servicemaschine (3) an wenigstens einen der angeschlossenen Webserver (5),
– wobei die Webserver (5) vor der ersten Anfrage jeweils mittels einer Protokolliereinheit zur Aufzeichnung und Beschreibung einer zum Zweck des Anschlusses dieses Webservers (5) geführten Kommunikation an die Servicemaschine angeschlossen werden,
– Konvertierung der Anfrage mittels der Konvertereinheit (4) in eine für den jeweils angesprochenen Webserver (5) kompatible Fragesyntax,
– Empfang der von dem bzw. den jeweiligen Webserver (5) bzw. Webservern (5) gelieferten Antwort,
– Konvertierung der Antwort mittels der Konvertereinheit (4) in ein für die Servicemaschine (3) geeignetes Format,
– Extraktion der nachgefragten Daten,...
Method for detecting and evaluating information stored statically and / or dynamically in a computer network, in which a service machine (3) with at least one web server (5) in each case with the interposition of a converter unit (4) in data connection, wherein at least the following steps are passed;
User-dependent and / or event-dependent generation of a request from the service machine (3) to at least one of the connected web servers (5),
- wherein the web server (5) before the first request in each case by means of a logging unit for recording and description of a run for the purpose of connecting this web server (5) communication are connected to the service machine,
Conversion of the request by means of the converter unit (4) into a query syntax compatible with the respectively addressed web server (5),
Receipt of the response delivered by the respective web server (5) or web servers (5),
Conversion of the response by means of the converter unit (4) into a format suitable for the service machine (3),
- Extraction of the requested data, ...

Figure 00000001
Figure 00000001

Description

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Erfassung und Auswertung von in einem Rechnernetzwerk abgelegten Informationen.The The invention relates to a method and a device for detection and evaluation of information stored in a computer network.

Hierzu ist es aus der DE 199 39 625 A1 , wie auch aus der DE 100 59 861 A1 vorbekannt, Informationen aus dem Internet von einer oder mehrer Internet-Datenquellen, wie etwa Internet-Datenbanken und/oder Web-Sites zu beschaffen. Beiden Lösungen ist gemein, dass die im Wege einer oder mehrerer Internet-Abfragen beschafften Daten, auf ein ein einheitliches Format umgesetzt werden um die Vergleichbarkeit herzustellen und bedarfsweise auch weiter etwa derart aufbereitet werden, dass sie in einer übersichtlichen Tabelle dargestellt sind oder dass redundante Informationen aussortiert werden.For this it is from the DE 199 39 625 A1 , as well as from the DE 100 59 861 A1 Previously, to obtain information from the Internet from one or more Internet data sources, such as Internet databases and / or Web sites. Both solutions have in common that the data obtained by way of one or more Internet queries are converted to a uniform format to produce comparability and, if necessary, further processed in such a way that they are presented in a clear table or redundant information be sorted out.

Auch aus der DE 100 55 684 A1 ist Verfahren zur Erstellung von personenspezifischen Datenausgaben bekannt, bei dem mittels eines autonomen oder vom Benutzer kontrollierten Computerprogramms auf in einem Netzwerk wie dem Internet verteil abgelegte Daten zugegriffen wird und diese Daten je nach Benutzbedürfnis kombiniert, konvertiert und ggf. weiter aufbereitet werden.Also from the DE 100 55 684 A1 A method for creating person-specific data output is known in which by means of an autonomous or user-controlled computer program distributed on a network such as the Internet data is accessed and these data combined according to user needs, converted and possibly further processed.

Alle vorbekannten Verfahren bieten dem Nutzer einen erheblichen Mehrwert, durch die weitgehend selbsttätige und ggf. benutzerindividuelle Aufbereitung der beschafften Information.All previously known methods offer the user considerable added value, by the largely automatic and possibly user-specific processing of the information obtained.

Was dabei weitgehend verkannt wird ist, dass zunehmend auch ein Datenquellen-spezifischer Zugriff erforderlich, da in der Regel relevante Daten, wie etwa Produktdaten nicht im Wege eines einfachen HTTP-Requests und einer entsprechenden Response beschafft werden könne, sondern hierzu in der Regel eine Session mit entsprechender Session-ID und ähnliches mehr erforderlich ist. Dies gilt umso mehr in Verbindung mit der zunehmenden Verbreitung von dynamisch generierten Websites.What is largely misconceived that increasingly a data source-specific access required, since usually relevant data, such as product data not by way of a simple HTTP request and a corresponding one Response could be obtained but this usually a session with the appropriate session ID and similar more is needed. This is even more true in connection with the increasing distribution of dynamically generated websites.

In den letzten Jahren hat, besonders durch das Internet, aber auch durch die Verwirklichung von ausgedehnten Intranets, beispielsweise in großen Firmen, eine Veränderung der digitalen Welt dahingehend statt gefunden, dass Rechner heute im Wesentlichen als vernetzte Systeme verstanden werden müssen. Durch die Vernetzung einer unübersehbaren Vielzahl von Rechnern ist auch die in einem derartigen Netzwerk abgelegte und angehäufte Informationsmenge in ihrem Umfang sowie ihrer Ordnung nach völlig unübersichtlich. Insbesondere dem Internet als weitgehend anarchisch und chaotisch aufgebautes Rechnernetzwerk fehlt es – technisch notwendig – an einer Strukturierung der in diesem Netzwerk enthaltenen Information. Es gibt daher eine Reihe von Portalen und Dienstanbietern, die versuchen, das Arbeiten in derartigen Netzwerken in Form von Suchmaschinen oder durch strukturierte Eingangsportale zu erleichtern. Dabei ermitteln die Suchmaschinen an Hand vorgegebener Regeln auf Grund von Benutzeranfragen die etwa in Frage kommenden URL-Adressen. In einfachster Ausgestaltung wird eine Volltextsuche im Internet durchgeführt. Derartige Maschinen haben den Nachteil, in der Informationsbeschaffung relativ langsam und in der Ergebnisqualität stark von den jeweiligen Suchbegriffen abhängig zu sein. Eine Verbesserung kann dadurch erreicht werden, dass zumindest zusätzlich auch die Metatags der Homepages – also quasi die Inhaltsangaben der Seiten – ausgewertet werden oder eigene Datenbanken mit einer entsprechenden Indizierung der Seiten angelegt und ausgewertet werden. Die Qualität des Suchergebnisses hängt bei diesen Suchmaschinen stark von der Qualität, insbesondere der Aktualität, dieser Datenbank ab.In the last few years, especially through the internet, as well through the realization of extended intranets, for example in big companies, a change to the digital world to the effect that computers found today essentially must be understood as networked systems. By the networking of a highly visible Variety of computers is also in such a network discarded and accumulated Amount of information in its scope and order after completely confusing. In particular, the Internet as largely anarchic and chaotic built-up computer network is missing - technically necessary - at one Structuring the information contained in this network. It Therefore, there are a number of portals and service providers trying to do that Working in such networks in the form of search engines or to facilitate through structured entrance portals. Determine the search engines based on given rules based on user requests the possible URL addresses. In the simplest embodiment a full-text search is carried out on the Internet. Such machines have the disadvantage in obtaining information relatively slowly and in the quality of the result strongly dependent on the respective search terms. An improvement can be achieved by at least additionally the meta tags of the Homepages - so quasi the contents of the pages - are evaluated or own databases created and evaluated with a corresponding indexing of the pages become. The quality of the search result depends in these search engines strong on the quality, especially the timeliness, this Database.

In abermals verbesserter Ausgestaltung bemühen sich derartige Portale sogar darum, dem Benutzer die Auswertung, insbesondere vergleichende Auswertung, von Websites abzunehmen. In diesem Zusammenhang sind insbesondere preisvergleichende Systeme bekannt geworden. Allen Systemen ist gemein, dass aus der Informationsflut der in einem Rechnernetzwerk vorhandenen Informationen sogenannte Meta-Informationen geschaffen werden, die zum Aufbau einer geordneten, hierarchischen Struktur der in dem Rechnernetzwerk vorhandenen Informationen in einer eigenen Datenbank dienen. Unter Meta-Informationen versteht man Informationen, die andere Informationen beschreiben, bewerten oder zusammenfassen.In Once again improved such portals endeavor even the user, the evaluation, in particular comparative evaluation, from websites. In this context, in particular Preisvergleichende systems become known. All systems is mean that from the flood of information in a computer network existing information so-called meta-information is created, the Structure of an ordered, hierarchical structure of the computer network existing information in a separate database. Under meta-information is information that describes other information rate or summarize.

Dadurch, dass die fraglichen Informationen mit einem Rechner beschafft werden, liegt es nahe, zu versuchen, diese umfangreichen Auswertungen und Vergleichsarbeiten auch von einem Rechner durchführen zu lassen. Derart weitgehend selbsttätige Vergleiche werden in erster Linie dadurch erschwert, dass die meisten Informationen nur schwer vergleichbar sind. So besteht beispielsweise beim Vergleich von Mobilfunktarifen das Problem, dass diese derart unterschiedlich ausgestaltet sind, dass sie sich einem Vergleich weitgehend entziehen. Die Schaffung von derart intelligenten Vergleichssystemen muss somit als die Anlage von sogenannten Expertensystemen verstanden werden, die mit zum Teil aufwendigen Algorithmen, etwa der Fuzzy-Logic, versuchen, durch selbsttätige Vergleichsaufgaben einen echten Mehrwert für die jeweiligen Benutzer zu schaffen. Es handelt sich damit weitgehend um die Stellung sogenannter „Künstlicher Intelligenz".Thereby, that the information in question is procured with a computer, it seems obvious to try these extensive evaluations and Comparative work also be carried out by a computer. So largely automatic Comparisons are made more difficult by the fact that most Information is difficult to compare. For example, there is when comparing mobile phone tare the problem that this is so They are different in that they are a comparison largely withdraw. The creation of such intelligent comparison systems must therefore be understood as the installation of so-called expert systems which try to use sometimes elaborate algorithms, such as fuzzy logic, by automatic Comparative tasks to create a real added value for the respective users. It is thus largely the position of so-called "artificial Intelligence".

In einfachster Ausgestaltung ist aus der EP 0807291 B1 ein Informationszugriff-System bekannt, mit dem zu einer aus dem Rechnernetzwerk bezogenen Informationsmenge Meta-Informationen erzeugt werden, die dann mittels einer Vergleichsvorrichtung analysiert und weiter ausgewertet werden. Sehr oft gehen derartige Systeme, wie auch in diesem Beispiel, davon aus, dass Ihnen die nachgefragten Datenlieferanten, oftmals Content-Provider genannt, beispielsweise aufgrund eines eigenen Verkaufsinteresses die gewünschten Daten in einem vorgegebenen Format selbst liefern. Die ansonsten bestehenden Anschlussproblematik die aus der Ein- und Anbindung unterschiedlicher Datenstrukturen resultiert, entfällt dann.In the simplest embodiment is from the EP 0807291 B1 an information access system known Meta information is generated with the amount of information related to the computer network, which is then analyzed by means of a comparison device and further evaluated. Very often, such systems assume, as in this example, that the requested data providers, often called content providers, for example, due to their own sales interest to deliver the desired data in a given format itself. The otherwise existing connection problem resulting from the integration and connection of different data structures, then deleted.

In weiterer Ausgestaltung kann gemäß der WO 98/57272 A1 aus den empfangenen Informationen ein Meta-Lexikon erzeugt und in echten Datenbankanwendungen durch die Ablage in einer SQL-Sprache zugänglich gemacht werden.In Further embodiment may according to WO 98/57272 A1 generates a meta-lexicon from the received information and in real database applications by storing in a SQL language accessible be made.

Grundsätzlich besteht bei derartigen Datenbankanwendungen das Problem, aus den empfangenen Informationen die relevanten Informationen zu extrahieren. Die Lösung ist insbesondere dadurch erschwert, dass die im Zusammenhang mit einer Benutzeranfrage anzusprechenden Internet-Portale vollkommen unterschiedlich aufgebaut sein können und meist keine Meta-Informationen enthalten. Vor der Auswertung der eigentlichen Informationen ist somit meistens eine Analyse der angesprochenen Internetseiten und insbesondere deren Aufbau erforderlich, um auf Grund des charakteristischen Aufbaus beispielsweise Preisinformationen beschaffen zu können.Basically exists In such database applications, the problem is the one received Information to extract the relevant information. The solution is particular made difficult by the fact that in connection with a User request to respond to Internet portals completely different can be constructed and usually no meta-information included. Before the evaluation of the actual information is thus usually an analysis of the addressed Websites and in particular their structure required to Reason of the characteristic structure, for example price information to be able to procure.

Hier zu ist beispielsweise aus der JP 2000172722 A ein heuristisches Verfahren zur Extraktion von Preisinformationen aus HTML-Dokumenten vorbekannt.Here For example, from JP 2000172722 A is a heuristic Method for extracting price information from HTML documents previously known.

Aus der EP 0774722 A1 ist ein System zur Erstellung von Homepages bekannt, deren Datenstruktur nach Daten des Inhalts und der Gestaltung der Seite aufgeschlüsselt sind. Auch hier wird unterstellt, dass die jeweiligen Betreiber der anzufragenden bzw. zu vergleichenden Portale die hierzu benötigten Meta-Informationen mehr oder minder von sich aus bereitstellen.From the EP 0774722 A1 is a system for creating homepages whose data structure is broken down by data of the content and the design of the page. Here, too, it is assumed that the respective operators of the portals to be requested or compared provide the meta-information required for this more or less independently.

Die vorstehend erläuterte, komplexe Möglichkeit zur Extraktion der gewünschten Informationen aus der jeweils angesprochenen Datenmenge wird dadurch weiter erschwert, dass insbesondere die für derartige Vergleichsoperationen relevanten, mächtigen Portale zunehmend dynamisch Websites generieren.The explained above, complex possibility to extract the desired Information from the respective volume of data is thereby further complicates that in particular for such comparison operations relevant, powerful Portals increasingly generate websites dynamically.

Hierunter ist nicht etwa nur die Verwendung von DHTML-Seiten zu verstehen. DHTML, also dynamisches HTML, erlaubt es, eine Internetseite derart zu programmieren, dass sich die Elemente dieser Seite während der Anzeige dynamisch ändern. Dynamische Webseiten in diesem Sinne wären also Webseiten, die sich während der Anzeige der Seite verändern.this includes is not just about using DHTML pages. DHTML, so dynamic HTML, allows to program a website in such a way that the elements of this page are during change the ad dynamically. Dynamic websites in this sense would be websites that are while change the display of the page.

Unter „echt" dynamischen Webseiten werden jedoch solche Seiten verstanden, die erst zum Anforderungszeitpunkt generiert und dann an den Benutzer übermittelt werden. Es versteht sich von selbst, dass die Auswertung von dynamischen Webseiten oder sogenannten „Deep-Websites" zu Vergleichszwecken eine noch weitergehende Herausforderung darstellt als die Analyse statischer Seiten.Under "real" dynamic websites However, such pages are understood that only at the time of request generated and then transmitted to the user. It understands itself by that evaluation of dynamic web pages or so-called "deep websites" for comparison purposes an even greater challenge than the analysis static pages.

Hierzu ist es aus der US 6,055,522 A bekannt, dynamische Inhalte von Webseiten zuerst in sogenannte gekapselte, statische HTML-Seiten umzuwandeln, um dann über die entsprechend vereinfachten, statischen Seiten die zu Vergleichszwecken erforderlichen Analysen durchzuführen.For this it is from the US 6,055,522 A It is known to first convert dynamic contents of web pages into so-called encapsulated, static HTML pages in order then to carry out the analyzes required for comparative purposes via the correspondingly simplified, static pages.

Ausgehend von diesem Stand der Technik liegt der Erfindung die Aufgabe zu Grunde, ein verfahren und eine Vorrichtung zur Informationsbeschaffung und Auswertung aus einem Rechnernetzwerk zu schaffen, damit sowohl die Verbindung mit statisch, wie auch dynamisch abgelegten Informationen einsetzbar ist.outgoing from this prior art, the invention is the object of Basics, a method and a device for obtaining information and to create evaluation from a computer network so that both the connection can be used with static as well as dynamically stored information is.

Die Lösung dieser Aufgabe gelingt durch ein Verfahren oder eine Vorrichtung gemäß Anspruch 1 oder 14. Vorteilhafte Ausgestaltungen des erfindungsgemäßen Verfahrens ergeben sich aus den Merkmalen der Ansprüche 2 bis 13.The solution This object is achieved by a method or a device according to claim 1 or 14. Advantageous embodiments of the method according to the invention result from the features of claims 2 to 13.

Dadurch, dass zwischen eine Servicemaschine zur Generierung von zulässigen Anfragen an angeschlossene Webserver und zur Auswertung der von diesen Webservern bezogenen Informationen eine Konvertereinheit zur Erzeugung der für den jeweils angesprochenen Webserver geeigneten serverspezifischen Fragesyntax und zur ebenfalls serverspezifischen Umsetzung der vom Webserver bezogenen Antworten geschaltet ist, kann zunächst gleichzeitig mit verschiedenen Servern unterschiedlichen Aufbaus kommuniziert werden und die von diesen Servern bezogene Informationen ggf. einer weiteren Auswertung, – etwa zu Vergleichszwecken – zugeführt werden.Thereby, that between a service engine to generate allowable requests to connected web servers and to the evaluation of these web servers related information, a converter unit for generating the for the each addressed web server appropriate server-specific query syntax and the server-specific implementation of the web server Switched answers can be connected simultaneously with different Servers of different construction are communicated and those of These servers related information, if necessary, a further evaluation, - about For comparison purposes - be supplied.

Hierzu werden vor der ersten Betriebsaufnahme die relevanten Webserver an die Konvertereinheit mittels einer Protokolliereinheit angeschlossen. Dies geschieht dadurch, dass händisch oder selbsttätig in Form von Testabfragen mit den jeweiligen Webservern kommuniziert wird. Diese Testsitzung wird mit der Protokolliereinheit vollständig aufgezeichnet und zur Bestimmung der in Verbindung mit diesem Webserver zulässigen und erforderlichen Fragesyntax ausgewertet. Bei dieser Gelegenheit werden auch etwa erforderliche Kommunikationsabläufe, wie etwa der Empfang und das Senden von Cookies, Benutzer-ID's und ähnliches protokolliert und zur späteren selbsttätigen Abfrage dieses Servers entsprechend angelegt. In der Konvertereinheit werden anschließend die für jeden angeschlossenen Webserver zulässige Fragesyntax und sonstige Erfordernisse in Form eines Regelwerkes zur Übersetzung der Benutzeranfragen in die jeweilig zulässige Fragesyntax angelegt.For this purpose, the relevant web servers are connected to the converter unit by means of a logging unit prior to the first start of operation. This is done by manually or automatically communicating with the respective web servers in the form of test queries. This test session will be complete with the logging unit drawn and evaluated to determine the permissible and required in connection with this web server query syntax. On this occasion, any required communication processes, such as the reception and sending of cookies, user IDs and the like are logged and created accordingly for later automatic query of this server. In the converter unit, the query syntax and other requirements that are permissible for each connected web server are then created in the form of a set of rules for translating the user requests into the appropriate query syntax.

In vorteilhafter Ausgestaltung wird ein spezieller Proxyserver als Protokolliereinheit eingesetzt. Die Benutzung von Proxyservern ist insbesondere in Verbindung mit einem Webbrowser, wie er zur Kommunikation mit dem anzuschließenden Webserver üblicherweise eingesetzt wird, von Vorteil.In Advantageous embodiment is a special proxy server as Logging unit used. The use of proxy servers is especially in conjunction with a web browser, as he communicates with the to be connected Web server usually is used, beneficial.

In einer möglichen konkreten Ausgestaltung wird hierzu für jeden Webserver eine sogenannte Konfigurationsdatei, vorzugsweise ein XML-Dokument erzeugt. Diese Konfigurationsdatei ermöglicht nach Art einer Frageschablone die Generierung der zulässigen Benutzeranfragen und enthält die ansonsten etwa zusätzlichen Informationen zur Durchführung der etwa erforderlichen Kommunikationsabläufe. Ferner wird für die von dem jeweils angesprochenen Webserver bezogenen Informationen eine Decoderdatei, vorzugsweise ein XSL-Stylesheet, zur Umsetzung der empfangenen Informationen angelegt.In a possible In this case, for each web server, a concrete configuration will be a so-called configuration file. preferably generates an XML document. This configuration file allows for Type of question template the generation of allowable user requests and contains the otherwise about additional Information about the implementation the required communication processes. Furthermore, for the of the respective web server related information a decoder file, preferably an XSL stylesheet, created to implement the received information.

Vor der ersten Inbetriebnahme des Systems steht somit eine Lernphase. In vorteilhafter Ausgestaltung wird hierzu zum Aufbau der Konfigurations- und Decoderdateien ein HTTPS-Proxyserver zur Erzeugung der Konfigurationsdatei sowie zur Erzeugung der Decoderdatei ein Werkzeug mit graphischer Oberfläche eingesetzt, die beide in der Konvertereinheit abgelegt werden.In front The first commissioning of the system is thus a learning phase. In an advantageous embodiment, this is the structure of the configuration and Decoder files an HTTPS proxy server to generate the configuration file and to generate the decoder file a tool with graphical interface used, both in the converter unit are stored.

Einmal so angeschlossen, können im Weiteren die von dem Webserver bezogenen Angaben weitgehend selbsttätig beschafft und der weiteren Auswertung zugeführt werden.once so connected, can furthermore, the information obtained from the web server largely procured automatically and be supplied for further evaluation.

Dabei können entweder zeit- oder ereignisgesteuert aus der Servicedatenbank oder auf Grund von Benutzeranfragen von der Servicemaschine Anfragen bezogen werden.there can either time- or event-driven from the service database or based on user requests from the service machine requests be obtained.

In vorteilhafter Ausgestaltung werden hierzu zunächst die Anfragen ausgewertet. Dabei wird erst ermittelt, welche relevanten Informationen zu beschaffen sind und anhand dieser Informationen die für die nachgefragten Informationen möglicherweise relevanten Webserver aus der Menge der angeschlossenen Webserver ausgewählt und gegebenenfalls, wie oben erläutert, von der Servicemaschine angewählt.In Advantageous embodiment, the requests are first evaluated for this purpose. It first determines which relevant information to obtain are and for the requested information possibly relevant Web server selected from the set of connected web servers and optionally, as explained above, selected by the service machine.

Die auf Grund dieser Abfrage dann von den angesprochenen Webservern bezogenen Informationen werden in eine geeignete Baumstruktur, vorzugsweise in ein XML-Format, umgesetzt. Das XML-Format hat den Vorteil, dass es weitgehend betriebssystemunabhängig weiteren Auswertungen zugeführt werden kann. Im Übrigen gilt die Verwendung von XML-Dokumenten im Vergleich zu alternativen Datenformaten als zukunftsorientiert, weil es sich dabei wohl um den kommenden Internet-Standard handelt.The on the basis of this query then from the addressed web servers related information is in a suitable tree structure, preferably in an XML format, implemented. The XML format has the advantage that It largely independent of operating system further evaluations supplied can be. Furthermore applies the use of XML documents compared to alternative data formats as future-oriented, because it is probably about the coming Internet standard.

Die von dem Server bezogenen Informationen werden mittels eines der Konvertereinheit angehörenden Parsers eingelesen, wobei etwaige HTML-Fehler korrigiert und anschließend in die erwähnte Baumstruktur, etwa eines XML-Dokuments überführt werden. Mittels der Decoderdatei kann die Syntax des bezogenen HTML-Codes analysiert und hierdurch die relevanten Informationen erkannt, markiert und extrahiert werden. Nach diesem weiteren Auswertungsschritt wird eine Antwortdatei in Form eines XML-Formats erzeugt, das vorzugsweise nur die relevanten Informationen enthält. Die Extraktion der relevanten Informationen ist zum einen für den Umfang der zu speichernden Daten sinnvoll und erleichtert zum anderen die Weiterverarbeitung der bezogenen Information.The Information obtained from the server is determined by means of one of Belonging to converter unit Parsers read, correcting any HTML errors and then in the mentioned Tree structure, such as an XML document to be transferred. By means of the decoder file can analyze the syntax of the referenced HTML code and thereby the relevant information is recognized, marked and extracted. After this further evaluation step, an answer file in Form of an XML format, preferably only the relevant ones Contains information. The extraction of the relevant information is on the one hand for the scope the data to be stored makes sense and facilitates the other Further processing of the information received.

Die auf diese Weise beschafften, aufbereiteten Informationen werden demnach überwiegend selbsttätig ausgewertet und in eine entsprechende Datenbank gestellt. Alternativ können im Falle eines gescheiterten Vergleichs oder Beschaffungsversuches Fehlermeldungen generiert oder Folgeanfragen erzeugt werden. Darüber hinaus erzeugt die Servermaschine eine Antwortanzeige für den Benutzer, vorzugsweise als HTML-Tabelle und/oder in Form einer JSP-Seite. The In this way, procured, processed information will be Accordingly, evaluated mainly automatically and placed in a corresponding database. Alternatively, in the Case of failed settlement or procurement attempt Error messages are generated or follow-up queries are generated. Furthermore The server machine generates a reply message for the user, preferably as an HTML table and / or in the form of a JSP page.

In vorteilhafter Ausgestaltung kommunizieren die Benutzer über einen Browser mit der erfindungsgemäßen Servicemaschine. Dies ist schon deshalb sinnvoll, weil somit keine umständliche Zusatzsoftware beim Benutzer installiert werden muss. Die Existenz eines Browsers kann bei in einem Netzwerk betriebenen Rechner mit einiger Sicherheit vorausgesetzt werden.In Advantageous embodiment, the users communicate via a Browser with the service machine according to the invention. This makes sense, because it is not complicated Additional software must be installed at the user. The existence a browser can work with a network-powered computer certain security.

Um mit der Servicemaschine kommunizieren zu können, kann dem Benutzer ein Plugin geliefert werden, das im Wesentlichen Informationen über die an die Servicemaschine angeschlossenen Webserver enthält. Dadurch, dass anstelle einer Zusatzsoftware lediglich ein Plugin benötigt wird, ist die vom Benutzer aufzuspielende und zu beziehende Datenmenge gering. Die Handhabung von Plugins hat sich in Verbindung mit Browsern bewährt.To be able to communicate with the service machine, the user can be provided with a plug-in which essentially contains information about the web servers connected to the service machine. The fact that only one plug-in is needed instead of additional software is the data to be recorded and retrieved by the user small amount. The handling of plugins has proven itself in conjunction with browsers.

In vorteilhafter Ausgestaltung erkennt das Plugin dann, wenn mit dem Browser ein an die Servicemaschine angeschlossenes Webportal vom Benutzer besucht wird und informiert den Benutzer hierüber beispielsweise durch ein Pop-Up-Fenster. Die an dieses Webportal gerichtete Benutzeranfrage kann bedarfsweise zu Vergleichszwecken, zur Beschaffung weiterer Informationen oder zur Aktivierung von weiteren oder zusätzlichen Diensten an die Servicemaschine übermittelt werden, wenn der Benutzer dies wünscht. Die Servicemaschine kann in vorteilhafter Ausgestaltung die gewünschten Aktionen durchführen und beispielsweise zusätzliche Informationen zur Verfügung stellen. Das bedeutet, dass der Benutzer sein Benutzerverhalten in keiner Weise ändern muss und lediglich eine wertvolle Zusatzdienstleistung über das erwähnte Plugin angeboten wird.In advantageous embodiment recognizes the plugin when with the Browser connected to the service machine web portal from User is visited and informs the user about this, for example through a pop-up window. The user request directed to this web portal may be required for comparative purposes, to obtain further information or for activating additional or additional services to the service machine if the user so desires. The service machine can in an advantageous embodiment, the desired Perform actions and for example additional Information available put. That means the user is user behavior in no way change must and only a valuable additional service over the mentioned Plugin is offered.

Die erfindungsgemäße Vorrichtung umfasst somit im Wesentlichen die Servicemaschine und die Konvertereinheit, die gemäß den vorstehenden Erläuterungen in einem oder mehreren angeschlossenen Webservern auf Grund von Benutzeranfragen oder weitgehend selbsttätig – etwa zeitgesteuert – kommunizieren sowie eine Protokolliereinheit zum Anschluss von anzusprechenden Webservern.The inventive device essentially comprises the service machine and the converter unit, those according to the above Explanations in one or more connected web servers due to User requests or largely autonomously - such as time-controlled - communicate and a logging unit for connecting to be addressed Web servers.

Die Erfindung wird nachstehend anhand eines in der Zeichnung nur schematisch dargestellten Ausführungsbeispieles näher erläutert. Es zeigen:The Invention will be described below with reference to a in the drawing only schematically illustrated embodiment explained in more detail. It demonstrate:

1 ein Prinzip-Schaubild zum Datenaustausch, 1 a schematic diagram for data exchange,

2 eine detailliertere Übersicht eines Verfahrens und einer Vorrichtung zur Informationsbeschaffung und Auswertung. 2 a more detailed overview of a method and a device for information acquisition and evaluation.

Gemäß 1 kann eine Vielzahl von Benutzern 1 über ein Internet-Portal 2 einer Servicemaschine 3 über eine entsprechende Konvertereinheit 4 mit einem oder einer Vielzahl von Webservern 5 zum Zweck der Informationsbeschaffung in Datenverbindung treten. Dabei umfasst die Servicemaschine 3 einen Servicerechner 6 zum Betrieb der Servicemaschine 3, sowie eine Servicedatenbank 7 zur Ablage und Auswertung der von den angeschlossenen Webservern 5 beschafften Informationen oder zur weitgehend selbsttätigen Beschaffung weiterer Informationen. Die Webserver 5 werden in der Regel ihrerseits mit Datenbanken, vorzugsweise Produktdatenbanken 8, betrieben. In einfachster Ausgestaltung umfassen die Produktdatenbanken 8 die von dem jeweiligen Webserver 5 angebotenen Produkte in Verbindung mit einer Preisinformation. Die Webserver 5 können über Internet-Portale 2 betrieben werden, die in Verbindung mit gegebenenfalls mächtigen Produktdatenbanken 8 oft dynamisch aufgebaut sind. Hierunter sind Webseiten zu verstehen, die sich erst bei deren Anwahl und in Abhängigkeit von der jeweiligen Benutzeranfrage aufbauen.According to 1 can be a lot of users 1 via an internet portal 2 a service machine 3 via a corresponding converter unit 4 with one or a variety of web servers 5 connect to data for the purpose of obtaining information. This includes the service machine 3 a service computer 6 for operating the service machine 3 , as well as a service database 7 for storage and evaluation of the connected web servers 5 information obtained or for largely self-procuring further information. The web server 5 are usually in turn with databases, preferably product databases 8th , operated. In the simplest embodiment, the product databases include 8th from the respective web server 5 offered products in connection with a price information. The web server 5 can via internet portals 2 operated in conjunction with potentially powerful product databases 8th are often built dynamically. This includes websites that only build up when they are dialed and depending on the user's request.

In dem vorliegenden Ausführungsbeispiel kommunizieren sowohl die Benutzer 1 mit der Servicemaschine 3 wie auch die Servicemaschine 3 mit den angeschlossenen Webservern 5 über das Internet.In the present embodiment, both the users communicate 1 with the service machine 3 as well as the service machine 3 with the connected webservers 5 over the internet.

Grundsätzlich müssen die einzelnen Webserver 5 zunächst an die Servicemaschine 3 angeschlossen werden. Hierzu werden über die Servicemaschine 3 zunächst mögliche und übliche Testabfragen händisch oder halbautomatisch generiert. Die gesamte Sitzung mit den Testfragen wird über einen HTTPS-Proxyserver aufgezeichnet. Das Protokoll muss entweder händisch oder selbsttätig ausgewertet werden. Dabei wird die Cookie-Verwaltung des angesprochenen Webservers 5 etwaiger Session-ID's oder sonstige User-Tracking-Methoden analysiert. Es wird beispielsweise auch überprüft, ob der angesprochene Webserver 5 mit einer SSL-Verschlüsselung über das HTTPS-Protokoll kommuniziert. An Hand der Analyse und des Protokolls wird eine sogenannte Konfigurationsdatei erzeugt. Es handelt sich dabei um ein XML-Dokument, das im Wesentlichen eine Schablone der zulässigen Kommunikation darstellt. Dadurch, dass als Datenaustauschformat der kommende Internet-Standard XML, beziehungsweise XSL, genutzt wird, kann die Konvertereinheit 4 ohne weiteres in Verbindung mit allen denkbaren Datenbank- und Softwaresystemen eingesetzt werden.Basically, the individual web servers have to 5 first to the service machine 3 be connected. To do this, the service machine 3 first possible and usual test queries manually or semi-automatically generated. The entire session with the test questions is recorded via an HTTPS proxy server. The protocol must be evaluated either manually or automatically. This is the cookie management of the addressed web server 5 any session IDs or other user tracking methods analyzed. It is also checked, for example, whether the addressed web server 5 communicates with SSL encryption over the HTTPS protocol. On the basis of the analysis and the protocol, a so-called configuration file is generated. It is an XML document that essentially represents a template of acceptable communication. The fact that the coming Internet standard XML, or XSL, is used as the data exchange format allows the converter unit 4 readily be used in conjunction with all conceivable database and software systems.

Darüber hinaus werden auch die von dem Webserver 5 erhaltenen Informationen der weiteren Auswertung zugänglich gemacht. Hierzu wird in der Konvertereinheit 4 eine Decoderdatei angelegt. Es handelt sich dabei um eine XSl-Stylesheet, die mittels eines XSL-Werkzeuges mit einer grafischen Oberfläche auf Grund der mit dem Proxyserver oder einer sonstig geeigneten Protokolliereinheit protokollierten Kommunikation angelegt wird.In addition, those are also from the web server 5 obtained information for further evaluation. This is done in the converter unit 4 a decoder file created. It is an XSl style sheet that is created using an XSL tool with a graphical interface based on communication logged with the proxy server or other suitable logging unit.

Wenn auf diese Weise die Webserver 5 an die Konvertereinheit 4 angeschlossen sind, ist die Servicemaschine 3 im Wesentlichen betriebsfähig.If in this way the web server 5 to the converter unit 4 connected, is the service machine 3 essentially operable.

Anhand der detaillierteren Darstellungen in 2 soll nun am Beispiel einer üblichen Benutzeranfrage 10 das System erläutert werden. Im vorliegenden Beispiel handelt es sich dabei um einen sogenannten Metakauf-Agenten, der beispielsweise für Preisvergleiche eingesetzt werden kann.Based on the more detailed illustrations in 2 will now be the example of a usual user request 10 the system will be explained. In the present example, this is a so-called meta-ticket agent that can be used, for example, for price comparisons.

Wie auf den ersten Blick aus 2 ersichtlich, existiert zu jedem angeschlossenen Webserver 5 eine Konvertereinheit 4. Die Konvertereinheit 4 kann somit als Adapter oder Interface für die Webserver 5 zum Anschluss an die Servicemaschine 3 aufgefasst werden. Die Konvertereinheit 4 kann als Hardwareeinheit oder als vorzugsweise skalierbares Softwaremodul realisiert sein.As at first glance 2 can be seen, exists for every connected web server 5 a converter unit 4 , The converter unit 4 can thus be used as an adapter or interface for the web server 5 for connection to the service machine 3 be understood. The converter unit 4 can be implemented as a hardware unit or as a preferably scalable software module.

Nachstehend wird die Bearbeitung einer Benutzeranfrage wie folgt, erläutert:
In einem ersten Schritt wird das Internet-Portal 2 von einem Benutzer angewählt und hierbei über ein geeignetes HTML-Dokument die für eine etwaige Anfrage oder sonstige Dienstleistung erforderlichen Benutzerangaben 10 beschafft. Auf Grund dieser Benutzerangaben 10 generiert dann die Servicemaschine 3 eine abgewandelte Anfrage 12 an die Konvertereinheit 4. Alternativ kann die Servicemaschine 3 zeitgesteuert oder aufgrund des Eintritts von überwachten Ereignissen eine Datenbankanfrage 11 aus der Servicedatenbank 7 beziehen und aufgrund dessen eine abgewandelte Anfrage 12 an die Konvertereinheit 4 absetzen. In beiden Fällen ermittelt die Servicemaschine 3 aufgrund der Anfragen 10 oder 11, welche Webserver 5 von der Anfrage 10 oder 11 betroffen sein könnten und erzeugt dann eine um diese Informationen ergänzte oder abgewandelte Anfrage 12 und reicht diese an die Konvertereinheit 4 weiter.
The following explains how to process a user request as follows:
In a first step, the Internet portal 2 selected by a user and this via a suitable HTML document the user information required for any request or other service 10 procured. Based on this user information 10 then generates the service machine 3 a modified request 12 to the converter unit 4 , Alternatively, the service machine 3 Timed or due to the occurrence of monitored events, a database request 11 from the service database 7 and therefore a modified request 12 to the converter unit 4 drop. In both cases, the service machine determines 3 due to the requests 10 or 11 which web server 5 from the request 10 or 11 could be affected and then generates a request supplemented or modified by this information 12 and hands these to the converter unit 4 further.

Die Konvertereinheit 4 setzt dann auf Grund der in der Konvertereinheit 4 angelegten Konfigurationsdatei die abgewandelte Datenbankanfrage 11 in eine korrekte Fragesyntax für alle betroffenen Webserver 5 um.The converter unit 4 then sets due to the in the converter unit 4 created configuration file the modified database request 11 in a correct query syntax for all affected web servers 5 around.

Eine entsprechend korrigierte Abfrage 13 wird dann an die ausgewählten, angeschlossenen Webserver 5 übermittelt.An appropriately corrected query 13 will then be sent to the selected, connected web server 5 transmitted.

Auf Grund dieser entsprechend korrigierten Abfrage 13 wird dann von den betroffenen Webserver 5 die jeweiligen Produktdatenbanken 8 mit einer Produktnachfrage 14 angesprochen. Auf Grund dieser Produktnachfrage 14 liefern die Produktdatenbanken 8 etwa gewünschte Produktinformationen 15 an die betroffenen Webserver 5. Die Webserver 5 setzen die von den Produktdatenbanken 8 jeweils gelieferte Produktinformationen 15 jeweils in einen HTML-Response 16 um. Der HTML-Response 16 wird in der Konvertereinheit 4 mittels eines Parsers gelesen und dabei etwaige Strukturfehler im HTML-Response 16 korrigiert. Das Ergebnis des Parsens ist ein jeweils ein XML-Dokument 17, das anschließend mit einer als Decoderdatei in der Konvertereinheit 4 abgelegten XSL-Stylesheet decodiert wird. Auf Grund dieser Transformation liegt anschließend jeweils ein XML-Dokument 17 in einer zur Weiterverarbeitung geeigneten Baumstruktur vor, die sämtlich an die Servicemaschine 3 übermittelt werden. Die XML-Dokumente 17 enthalten lediglich noch die für die Beantwortung der Anfrage 10 oder 11 relevanten Informationen. Diese Informationen werden mittels des Servicerechners 6 der Servicemaschine 3 ausgewertet, analysiert und interpretiert. Dabei werden zur Abspeicherung geeignete Datenstrukturen mit den gefundenen Ergebnissen erzeugt, gegebenenfalls Folgeanfragen aus der Servicedatenbank 7 bezogen oder im Fehlerfalle Fehlermeldung erzeugt und über das Internet-Portal 2 ausgegeben. Die Ergebnisse der Benutzeranfrage 11 werden anschließend in der Servicedatenbank 7 als Datenbankinformation 20 abgelegt und parallel als HTML-Tabelle 21 über das Internet-Portal 2 angezeigt. Anstelle der erwähnten HTML-Tabelle 21 könnten auch JSP-Seiten zur Anzeige gelangen beziehungsweise an den Benutzer 1 übermittelt werden. Dabei ist weder die Ablage der bezoogenen Informationen in der Servicedatenbank 7 noch die Ausgabe der Ergebnisse an den Benutzer zwingend. Die Informationen können auch jeder denkbaren Weiterverabeitung zugeführt oder ggf. sogar gelöscht werdenDue to this appropriately corrected query 13 will then be affected by the web server 5 the respective product databases 8th with a product demand 14 addressed. Due to this product demand 14 deliver the product databases 8th about desired product information 15 to the affected web server 5 , The web server 5 put those from the product databases 8th each delivered product information 15 each in an HTML response 16 around. The HTML response 16 will be in the converter unit 4 read using a parser and thereby any structural errors in the HTML response 16 corrected. The result of parsing is one XML document at a time 17 , then with a decoder file in the converter unit 4 stored XSL stylesheet is decoded. As a result of this transformation, there is an XML document 17 in a suitable for further processing tree structure, all to the service machine 3 be transmitted. The XML documents 17 contain only those for answering the request 10 or 11 relevant information. This information is provided by the service computer 6 the service machine 3 evaluated, analyzed and interpreted. In this case, suitable data structures for the storage are generated with the results found, possibly subsequent requests from the service database 7 or, in the case of an error, the error message is generated and via the Internet portal 2 output. The results of the user request 11 will then be in the service database 7 as database information 20 filed and parallel as an HTML table 21 via the internet portal 2 displayed. Instead of the mentioned HTML table 21 JSP pages could also be displayed or sent to the user 1 be transmitted. Neither is the storage of the related information in the service database 7 still compelling the output of the results to the user. The information can also be supplied to any conceivable further processing or possibly even deleted

Vorstehend ist somit die Beantwortung einer Benutzeranfrage beschrieben, die zu einem Produkt- beziehungsweise Preisvergleich bei verschiedenen Webservern 5 aufbereitet und bearbeitet wird. Die auf diese Weise erzeugten beziehungsweise beschafften Daten werden beispielsweise in einer Servicedatenbank 7 abgelegt oder an den Benutzer 1 in einem geeigneten Format übergeben.The above therefore describes the answering of a user request, which leads to a product or price comparison on different web servers 5 prepared and processed. The data generated or obtained in this way, for example, in a service database 7 filed or to the user 1 in a suitable format.

Hiermit steht ein Werkzeug zur Informationsbeschaffung und -verwertung bereit, das in mehrfacher Hinsicht bezüglich des Bedienkomforts der technischen Möglichkeiten bislang so nicht vorhanden war. Zum einen können statische oder dynamische Webseiten angesprochen werden, indem die entsprechende unterschiedliche Kommunikations-Struktur über einen Protokolliereinheit analysiert werden, zum anderen eine weitgehend selbsttätige Auswertung der von den Webservern 5 bezogenen Daten durch eine entsprechende Parser-Analyse geleistet werden.This is a tool for information acquisition and utilization ready, which was so far not available in many respects regarding the ease of use of the technical possibilities. On the one hand static or dynamic web pages can be addressed by analyzing the corresponding different communication structure via a logging unit, on the other hand a largely automatic evaluation of the web servers 5 related data by an appropriate parser analysis.

11
Benutzeruser
22
Internet-PortalInternet Portal
33
Servicemaschineservice engine
44
Konvertereinheitconverter unit
55
WebserverWeb Server
66
Servicerechnerservice computer
77
ServicedatenbankService database
88th
ProduktdatenbankProduct Database
1010
Benutzerangabenuser information
1111
DatenbankanfrageDatabase query
1212
abgewandelte Anfragemodified inquiry
1313
korrigierte Abfragecorrected query
1414
Produktnachfrageproduct demand
1515
ProduktinformationProduct Information
1616
HTML-ResponseHTML Response
1717
XML-DokumentXML document
2020
DatenbankinformationDatabase Information
2121
HTML-TabelleHTML table

Claims (14)

Verfahren zur Erfassung und Auswertung von in einem Rechnernetzwerk statisch und/oder dynamisch abgelegten Informationen, bei dem eine Servicemaschine (3) mit wenigstens einem Webserver (5) jeweils unter Zwischenschaltung einer Konvertereinheit (4) in Datenverbindung tritt, wobei zumindest folgende Schritte durchlaufen werden; – benutzer- und/oder ereignisabhängige Generierung einer Anfrage von der Servicemaschine (3) an wenigstens einen der angeschlossenen Webserver (5), – wobei die Webserver (5) vor der ersten Anfrage jeweils mittels einer Protokolliereinheit zur Aufzeichnung und Beschreibung einer zum Zweck des Anschlusses dieses Webservers (5) geführten Kommunikation an die Servicemaschine angeschlossen werden, – Konvertierung der Anfrage mittels der Konvertereinheit (4) in eine für den jeweils angesprochenen Webserver (5) kompatible Fragesyntax, – Empfang der von dem bzw. den jeweiligen Webserver (5) bzw. Webservern (5) gelieferten Antwort, – Konvertierung der Antwort mittels der Konvertereinheit (4) in ein für die Servicemaschine (3) geeignetes Format, – Extraktion der nachgefragten Daten, – Weiterverarbeitung dieser Daten (20), insbesondere durch deren Einpflegen in eine Servicedatenbank (7), Auswertung dieser Daten oder Erzeugung und Ausgabe einer Benutzerantwort (21).Method for detecting and evaluating information stored statically and / or dynamically in a computer network, in which a service machine ( 3 ) with at least one web server ( 5 ) each with the interposition of a converter unit ( 4 ) is in data connection, wherein at least the following steps are passed; User-dependent and / or event-dependent generation of a request from the service machine ( 3 ) to at least one of the connected web servers ( 5 ), - whereby the web servers ( 5 ) prior to the first request, in each case by means of a logging unit for recording and describing a purpose for the purpose of connecting this web server ( 5 ) are connected to the service machine, - conversion of the request by means of the converter unit ( 4 ) into a respective web server ( 5 ) compatible query syntax, - reception by the respective web server ( 5 ) or web servers ( 5 ), - conversion of the response by means of the converter unit ( 4 ) in one for the service machine ( 3 ) suitable format, - extraction of the requested data, - further processing of this data ( 20 ), in particular by their inclusion in a service database ( 7 ), Evaluation of this data or generation and output of a user response ( 21 ). Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Webserver (5) vor der ersten selbsttätigen Abfrage dadurch an die Servicemaschine (3) angeschlossen werden, daß ein oder mehrere Testabfragen mittels eines Proxyservers, protokolliert und anschließend dieses Protokoll zur Bestimmung einer zulässigen Fragesyntax ausgewertet wird.Method according to Claim 1, characterized in that the web servers ( 5 ) before the first automatic query thereby to the service machine ( 3 ), that one or more test queries are logged by means of a proxy server, and then this protocol is evaluated to determine a permissible query syntax. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß in der Konvertereinheit (4) eine für jeden angeschlossenen Webserver (5) zulässige Fragesyntax, sowie ein Regelwerk zur Übersetzung der Anfragen in die jeweilig zulässige Fragesyntax angelegt wird.Method according to claim 2, characterized in that in the converter unit ( 4 ) one for each connected web server ( 5 ) as well as a set of rules for translating the queries into the appropriate query syntax. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß zum Anschluß eines jeden Webservers (5) zumindest eine Konfigurationsdatei, die zumindest die zulässigen Suchanfragen nach Art einer Frageschablone sowie gegebenenfalls eine Beschreibung der zur Initierung einer Benutzersitzung mit dem jeweiligen Webserver (5) erforderlichen Routinen und/oder gegebenenfalls eine erforderliche Parameterabbildung sowie wenigstens eine Decoderdatei zur Umsetzung der vom Webserver (5) gelie ferten Informationen, in der Konvertereinheit (4) erzeugt und abgelegt wird.Method according to claim 3, characterized in that for the connection of each web server ( 5 ) at least one configuration file containing at least the permissible search queries in the manner of a question template and optionally a description of the initiation of a user session with the respective web server ( 5 ) required routines and / or possibly a required parameter mapping and at least one decoder file for the implementation of the web server ( 5 ) supplied information, in the converter unit ( 4 ) is generated and stored. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß in die Servicemaschine (3) mit einem XSL-Werkzeug mit graphischer Oberfläche zur Erzeugung je einer Decoderdatei für die angeschlossenen Webserver (5) versehen ist.Method according to claim 4, characterized in that in the service machine ( 3 ) with an XSL tool with graphical user interface for creating one decoder file each for the connected web server ( 5 ) is provided. Verfahren nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß ereignis- und/oder zeitgesteuert eine Anfrage an einen oder mehrere Webserver (5) in folgenden Schritten generiert wird; – Bezug einer Datenbankfrage (11) aus der Servicedatenbank (7) von der Servicemaschine (3), – Auswahl der auf Grund der Datenbankanfrage (11) anzusprechenden Webserver (5), – Umsetzung dieser Datenbankanfrage (11) in ein für die jeweils anzusprechenden Webserver (5) kompatible Fragesyntax mittels der entsprechenden serverspezifischen Konfigurationsdateien, die in der Konvertereinheit (4) abgelegt sind.Method according to one or more of the preceding claims, characterized in that an event and / or time-controlled request to one or more web servers ( 5 ) is generated in the following steps; - Reference to a database question ( 11 ) from the service database ( 7 ) from the service machine ( 3 ), - Selection based on the database request ( 11 ) to be addressed web server ( 5 ), - implementation of this database request ( 11 ) into a web server to be addressed ( 5 ) compatible query syntax using the appropriate server-specific configuration files stored in the converter unit ( 4 ) are stored. Verfahren nach einem oder mehreren der vorhergehenden Ansprüche 1 bis 6, dadurch gekennzeichnet, daß Benutzerangaben (10), die mittels eines Formulars vom Benutzer erhoben werden, eine Anfrage an einen oder mehrere Webserver (5) in folgenden Schritten generiert wird; – Auswertung der Benutzerangaben (10), – Auswahl der auf Grund der Benutzerangaben (10) anzusprechenden Webserver (5), – Umsetzung der Benutzerangaben (10) in eine für die jeweils anzusprechenden Webserver (5) kompatible Fragesyntax mittels entsprechend serverspezifischen Konfigurationsdateien, die in der Konvertereinheit (4) abgelegt sind.Method according to one or more of the preceding claims 1 to 6, characterized in that user data ( 10 ), which are collected by the user by means of a form, send a request to one or more web servers ( 5 ) is generated in the following steps; - Evaluation of user information ( 10 ), - selection based on user information ( 10 ) to be addressed web server ( 5 ), - implementation of user information ( 10 ) into a web server to be addressed ( 5 ) compatible query syntax by means of corresponding server-specific configuration files which are stored in the converter unit ( 4 ) are stored. Verfahren nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Konvertereinheit (4), die von den angesprochenen Webservern (5) rückübermittelten Antworten empfängt und mittels entsprechender, serverspezifischer Decoderdateien jeweils in eine für die Servicemaschine (3) geeignete Baumstruktur umsetzt und an die Servicemaschine (3) zur Anzeige und/oder weiteren Auswertung übermittelt.Method according to one or more of the preceding claims, characterized in that the converter unit ( 4 ), which are addressed by the addressed Web servers ( 5 ) and, by means of corresponding server-specific decoder files, in each case into one for the service machine ( 3 ) converts suitable tree structure and to the service machine ( 3 ) for display and / or further evaluation. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß die vorliegenden Anfragen und/oder Antworten mittels eines Parsers eingelesen werden, wobei zunächst etwaige Syntaxfehler im vorliegenden Code erkannt und korrigiert werden und anschließend vom Parser ein Dokument in einer Baumstruktur übergeben wird, dessen Syntax mittels eines XSL-Stylesheets analysiert und dessen gegebenenfalls relevante Informationen erkannt, markiert und/oder extrahiert werden und hierdurch eine Anfrage- und/oder Antwort-Datei erzeugt wird, das zumindest annähernd nur relevanten Informationen zu einer etwaigen Weiterverarbeitung und/oder Ausgabe enthält.Method according to Claim 8, characterized in that the present inquiries and / or responses are read in by means of a parser, whereby any syntax errors in the present code are first recognized and corrected, and then a document in a tree is sent by the parser structure whose syntax is analyzed by means of an XSL stylesheet and whose possibly relevant information is recognized, marked and / or extracted and thereby a request and / or response file is generated which at least approximately only relevant information to any further processing and / or edition contains. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die vorliegenden Antworten, vorzugsweise selbsttätig, von der Servicemaschine (3) ausgewertet und in Abhängigkeit von dieser Auswertung die Antworten in die Servicedatenbank (7) gestellt, Fehlermeldungen generiert, Folgeanfragen erzeugt und/oder zur Anzeige gebracht werden.Method according to one of the preceding claims, characterized in that the present responses, preferably automatically, from the service machine ( 3 ) and, depending on this evaluation, the responses to the service database ( 7 ), generate error messages, generate subsequent requests and / or be displayed. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß die Antworten als HTML-Tabelle (21) und/oder JSP-Seiten zur Anzeige gebracht werden.Method according to claim 10, characterized in that the answers are provided as an HTML table ( 21 ) and / or JSP pages. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Benutzer (1) über einen Browser mit der Servicemaschine (3) kommunizieren und der Browser benutzerseitig hierzu um ein Plugin erweiterbar ist, wobei der Plugin im Wesentlichen zur Erkennung der an die Servicemaschine (3) jeweils angeschlossenen Webserver (5) dient.Method according to one of the preceding claims, characterized in that the users ( 1 ) via a browser with the service machine ( 3 ) and the browser can be expanded by a plugin on the user side, the plugin essentially being used to identify the service machine ( 3 ) each connected web server ( 5 ) serves. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß dem Benutzer (1) mittels des Plugins bei der Anwahl eines an die Servicemaschine (3) angeschlossenen Webservers (5) an Hand der von ihm an diesen Webserver (5) gerichteten Anfragen die Beschaffung von Vergleichsinformation von den weiteren an die Servicemaschine (3) angeschlossenen Webservern (5) oder sonstige Zusatzdienste angeboten werden.Method according to claim 12, characterized in that the user ( 1 ) by means of the plug-in when selecting one to the service machine ( 3 ) connected web server ( 5 ) on the basis of which to this web server ( 5 ) queries the procurement of comparative information from the other to the service machine ( 3 ) connected web servers ( 5 ) or other additional services. Vorrichtung zur Erfassung und Auswertung von einem Rechnernetzwerk statisch und/oder dynamisch abgelegten Informationen mit – einer Servicemaschine (3), • die mit wenigstens einem Webserver (5) in Datenverbindung tritt, wobei zwischen dieser Servicemaschine (3) und dem jeweils angesprochenen Webserver (5) eine Konvertereinheit (4) geschaltet ist, • wobei die Servicemaschine (3) einen mit dem Internet und/oder Intranet verschalteten Servicerechner (6) mit einer Servicedatenbank (7) zur Generierung von Anfragen (11) sowie zur Speicherung von beschafften Informationen, – sowie ein Interface zur Aufnahme der Benutzerangaben (10) umfaßt und – mit einer Konvertereinheit (4), • die bedarfsweise ein integraler Bestandteil der Servicemaschine (3) ist, • in der zu jedem angeschlossenen Webserver (5) je eine Decoderdatei zur Generierung von abgewandelten Anfragen (12) und je eine Decoderdatei und • ein Parser zur Auswertung und Umsetzung der von den jeweils angesprochenen Webservern (5) erhaltenen Antworten, inbesondere der HTML-Responses (16), abgelegt ist, • wobei die jeweils angesprochenen Webserver (5) ein Kunden-Portal mit einer angeschlossenen Produktdatenbank (8) umfassen, – wobei mittels einer Protokolliereinheit zur Aufzeichnung und Auswertung einer ersten Anschlußsitzung zwischen der Servicemaschine (3) und einem jeden Webserver (5) die jeweiligen Webserver (5) an die Servicemaschine (3) angeschlossen worden sind.Device for detecting and evaluating statically and / or dynamically stored information from a computer network with - a service machine ( 3 ), • with at least one web server ( 5 ) is in data connection, wherein between this service machine ( 3 ) and the respectively addressed web server ( 5 ) a converter unit ( 4 ), wherein the service machine ( 3 ) a service computer connected to the Internet and / or intranet ( 6 ) with a service database ( 7 ) for generating requests ( 11 ) as well as for the storage of acquired information, - as well as an interface for recording the user data ( 10 ) and - with a converter unit ( 4 ), Which, if necessary, form an integral part of the service machine ( 3 ), • in the connected web server ( 5 ) one decoder file each for generating modified requests ( 12 ) and one decoder file each and • a parser for the evaluation and implementation of the respective web servers ( 5 ), in particular the HTML responses ( 16 ), whereby the respective addressed web server ( 5 ) a customer portal with an attached product database ( 8th ), wherein - by means of a logging unit for recording and evaluating a first connection session between the service machine ( 3 ) and every web server ( 5 ) the respective web server ( 5 ) to the service machine ( 3 ) have been connected.
DE10208959A 2002-02-28 2002-02-28 Method and device for detecting and evaluating information stored in a computer network Expired - Fee Related DE10208959B4 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE10208959A DE10208959B4 (en) 2002-02-28 2002-02-28 Method and device for detecting and evaluating information stored in a computer network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10208959A DE10208959B4 (en) 2002-02-28 2002-02-28 Method and device for detecting and evaluating information stored in a computer network

Publications (2)

Publication Number Publication Date
DE10208959A1 DE10208959A1 (en) 2003-09-18
DE10208959B4 true DE10208959B4 (en) 2006-10-12

Family

ID=27762547

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10208959A Expired - Fee Related DE10208959B4 (en) 2002-02-28 2002-02-28 Method and device for detecting and evaluating information stored in a computer network

Country Status (1)

Country Link
DE (1) DE10208959B4 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005024635A1 (en) * 2005-05-30 2006-12-07 Siemens Ag Method for content-specific search in data networks

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0774722A2 (en) * 1995-11-17 1997-05-21 Microsoft Corporation Information retrieval system
WO1998057272A1 (en) * 1997-06-12 1998-12-17 Guillaume Martin Device for data analysis and organisation
EP0807291B1 (en) * 1995-01-23 2000-01-05 BRITISH TELECOMMUNICATIONS public limited company Methods and/or systems for accessing information
US6055522A (en) * 1996-01-29 2000-04-25 Futuretense, Inc. Automatic page converter for dynamic content distributed publishing system
JP2000172722A (en) * 1998-12-01 2000-06-23 Korea Electronics Telecommun Method and system for product information automatic indexing of on-line store
DE19939625A1 (en) * 1999-08-20 2001-02-22 Nokia Mobile Phones Ltd Method of retrieving information from an information network
DE10055684A1 (en) * 1999-11-03 2001-05-23 Kidata Ag Computer system for creating personalized data outputs composes derived information individually for user by interpreting instructions based on control language
DE10059861A1 (en) * 2000-11-30 2002-06-20 Rancon Multi Media Gmbh & Co K Collection of data from a number of external, particularly Internet, sources relating to a specific interest area, in which a program controls automatic updating of data from external sources in a central database

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0807291B1 (en) * 1995-01-23 2000-01-05 BRITISH TELECOMMUNICATIONS public limited company Methods and/or systems for accessing information
EP0774722A2 (en) * 1995-11-17 1997-05-21 Microsoft Corporation Information retrieval system
US6055522A (en) * 1996-01-29 2000-04-25 Futuretense, Inc. Automatic page converter for dynamic content distributed publishing system
WO1998057272A1 (en) * 1997-06-12 1998-12-17 Guillaume Martin Device for data analysis and organisation
JP2000172722A (en) * 1998-12-01 2000-06-23 Korea Electronics Telecommun Method and system for product information automatic indexing of on-line store
DE19939625A1 (en) * 1999-08-20 2001-02-22 Nokia Mobile Phones Ltd Method of retrieving information from an information network
DE10055684A1 (en) * 1999-11-03 2001-05-23 Kidata Ag Computer system for creating personalized data outputs composes derived information individually for user by interpreting instructions based on control language
DE10059861A1 (en) * 2000-11-30 2002-06-20 Rancon Multi Media Gmbh & Co K Collection of data from a number of external, particularly Internet, sources relating to a specific interest area, in which a program controls automatic updating of data from external sources in a central database

Also Published As

Publication number Publication date
DE10208959A1 (en) 2003-09-18

Similar Documents

Publication Publication Date Title
DE60028561T2 (en) PROVIDE SUPPORT FOR CUSTOMER SERVICES WHICH OBTAIN DATA FROM SOURCES OF DATA WHICH THE DATA SOURCES DO NOT NEED TO SUPPORT THE FORMATS REQUIRED BY THE CUSTOMER
DE69832406T2 (en) COMBINED INTERNET AND DATA ACCESS SYSTEM
DE69838262T2 (en) GENERAL USER AUTHENTICATION FOR NETWORK CALCULATOR
DE69937249T2 (en) SYSTEM AND METHOD FOR ANALYZING A WEBSERVER LOGBOOK
DE60114999T2 (en) MONITORING AND INTERACTION WITH NETWORK SERVICES
DE60118487T2 (en) Communication system based on WDSL language
DE69832786T2 (en) DEVICE AND METHOD FOR IDENTIFYING CLIENTS THAT ACCESS NETWORK SITES
EP1436677B1 (en) Method for implementing an operating and observation system for field devices
DE10048940A1 (en) Production of document contents by transcoding with Java (RTM) server pages
DE10051021A1 (en) Access provision method for web server, involves grouping web pages which contain static link addresses in accordance with unchanged web pages
DE10135136A1 (en) Secure information transmission method for sensitive data stores information in secure database in processing space which is not accessible to user
DE10132038A1 (en) Automation system and process for plant visualization
DE102004057029A1 (en) System and method for reporting potential problem solutions to a service provider
DE10208959B4 (en) Method and device for detecting and evaluating information stored in a computer network
DE19813883B4 (en) Method, computer program product and document management system for accessing Internet information for closed user groups
WO2012017056A1 (en) Method and apparatus for automatically processing data in a cell format
DE10393809B4 (en) Computer-implemented method for processing information exchanged between a client and a server
DE10290696T5 (en) Method and system for wireless access to a user's computer
EP2807812B1 (en) Method and system for synchronizing program masks
DE19814348A1 (en) System and method for communication with various electronic archive systems
DE10319887B4 (en) A method of aligning a database displayed on a client computing device with a source database stored on a server computing device
DE602004010022T2 (en) Insertion of help into a response to a demand for a virtual office
WO2002069184A2 (en) Method for searching for data, taking into account the moment of availability of said data in a distributed system
EP3454290A1 (en) Data exchange between different applications/clients
EP1316865A1 (en) Automation service system

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee