DE4015905C2

DE4015905C2 - Sprachanalyseeinrichtung, -verfahren und -programm

Info

Publication number: DE4015905C2
Application number: DE4015905A
Authority: DE
Inventors: Hideo Ito
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1989-05-18
Filing date: 1990-05-17
Publication date: 2003-04-30
Anticipated expiration: 2010-05-18
Also published as: DE4015905A1; US5029085A; JPH02302876A; JP2963463B2

Description

Die Erfindung betrifft eine Sprachanalyseeinrichtung (im folgenden auch "Dialog- Analyseeinrichtung" oder "Dialog-Analysesystem" genannt), welche insbesondere bei einer maschinellen Übersetzungseinrichtung, einem Dialogsystem für natürliche Sprache u. a. anwendbar ist.

Das in der japanischen Patentanmeldung Nr. 140 582-1984 (JP 59-140 582 A) beschriebene "National- Sprachen-Übersetzungs-Stützungssystem" bezieht sich auf ein maschinelles Übersetzungssystem, welches Information liefert, um den Übersetzungsprozess vor der Durchführung einer Syntax-Analyse zu unterstützen. Dieses System verwendet Information, welche vorgesehen ist, um eingegebene Sätze zu übersetzen. In einem solchen maschinellen Übersetzungssystem ist die Information, welche der Benutzer zu liefern hat, entsprechend dem eingegebenen Satz verschieden. Folglich muss der Benutzer verstehen, welche Art Information vorzusehen und zu liefern ist, und muss sie dann auswählen. Dies stellt eine große Belastung für den Benutzer dar. Diese Art eines maschinellen Übersetzungssystems wird als ein "redaktionelles Vorbearbeitungs"-System bezeichnet.

Die in der japanischen Patentanmeldung Nr. 101 365-1983 (JP 58-101 365 A) beschriebene "Text-Anzeige- und Korrektureinrichtung in einem maschinellen Übersetzungssystem" bezieht sich auf ein maschinelles Übersetzungssystem, in welchem der Satz zuerst erzeugt wird, und der eingegebene Originalsatz und der entsprechende übersetzte Satz von dem Benutzer in vorherbe stimmten Einheiten verglichen werden, und der Benutzer dann den übersetzten Satz in diesen Einheiten korrigiert.

Außerdem wird in dem "maschinellen Übersetzungssystem", das in der japanischen Patentanmeldung Nr. 271 060-1986 (JP 62-271 060 A) beschrie ben ist, der übersetzte Satz, welcher dem eingegebenen Ori ginalsatz entspricht, zuerst erzeugt, und wenn der Benutzer einen anderen übersetzten Satz anfordert, wird eine Rück übersetzung mit Hilfe des einen Kandidaten aus einem Satz syntaktischer Kandidatenbeziehungen durchgeführt, welche ver wendet werden könnten, und welche die höchste Wahrschein lichkeit (Auswertungsmenge) haben, richtig zu sein. Ferner ist in der vorstehend angeführten japanischen Patentanmel dung Nr. 271 060-1986 auch ein "maschinelles Übersetzungs system" beschrieben. In diesem Übersetzungssystem wird der übersetzte Satz, welcher dem eingegebenen Originalsatz ent spricht, zuerst vorgesehen, und wenn der Benutzer entschei det, daß ein Fehler in diesem übersetzten Satz vorhanden ist, bestimmt der Benutzer die Modifizierklausel des eingegebe nen Originalsatzes, und es werden modifizierte Kandidaten- Klauseln vorgesehen. Dann wählt und bestimmt der Benutzer die modifizierte Kandidatenklausel, welche am geeignesten ist, aus einer Liste modifizierter Klauseln aus, welche für den Benutzer vorgesehen sind. Bei diesem System wird eine Rückübersetzung mit Hilfe der modifizierten Klausel durchge führt, welche entsprechend der Modifizier-Klausel des einge benen Originalsatzes spezifiziert wurde. Diese maschinellen Übersetzungssysteme werden als "nachträgliche Bearbeitungs"- Systeme bezeichnet.

In solchen "nachträglichen Bearbeitungs-"Systeme ist es schwierig, eine vollständige, automatische Analyse mit Hilfe der derzeit akuellen Technik durchzuführen. Folglich muß der Benutzer jeweils eine Entscheidung treffen, ob der mittels des Systems übersetzte Satz richtig oder unrichtig ist, und muß die Korrektur des übersetzten Satzes durchführen, wenn er falsch ist. Diese Arbeit stellt für den Benutzer ein großes Arbeitspensum dar.

Bei dem in der japanischen Patentanmeldung Nr. 18 073-1986 (JP 61-18 073 A) beschriebenen "Korrektur-Verfahren" wird ein Analyse-Baum graph als Ergebnis einer Analyse des eingegebenen Original satzes dargestellt, und der Benutzer verwendet dann Grund befehle, um den Analyse-Baumgraphen zu korrigieren, welcher dargestellt wird.

Außerdem drückt in dem "Steuerverfahren für eine Anzeige und Korrektur von syntaktischen Analyseergebnissen", wel ches in der japanischen Patentanmeldung Nr. 278 970-1986 (JP 61-278 970 A) beschrieben ist, das System einen Analyse-Baumgraphen in einem kleinen Raumbereich als das Analyseergebnis des ein gegebenen Satzes aus, und das System erhält dann Korrektu ren, welche der Benutzer an diesem Analyse-Baumgraphen vor nimmt. Diese Art von Systeme werden als "Zwischen-Aufberei tungs-"Systeme bezeichnet.

In solchen "Zwischen-Aufbereitungs-"Systemen ist die Bedeu tung der Analyseergebnisse, wie beispielsweise eines Ana lyse-Baumgraphen u. ä., für einen Durchschnittsbenutzer, wel cher den Mechanismus des Betriebs nicht versteht, schwierig zu verstehen. Außerdem muß der Benutzer nicht nur die Korrek tur einer Fehleranalyse durchführen, sondern er muß auch die Richtigkeit oder Unrichtigkeit von korrekten Analyse-Ergeb nisse beurteilen. Dies stellt eine große Belastung für den Benutzer dar. Das "menschliche Interventionsverfahren für Fragen unbestimmbarer Bedeutung in einer maschinellen Über setzung", wie es in der japanischen Patentanmeldung Nr. 132 270-1092 (JP 57-132 270 A) beschrieben ist, betrifft ein maschinelles Über setzungssystem. In diesem maschinellen Übersetzungssystem werden syntaktische Strukturen, für welche die Bedeutung nicht bestimmt werden kann, angezeigt, und es wird dem Be nutzer Information dargestellt, um die Bedeutung zu bestim men, und die gegebene Information wird dann für die Übersetzung verwendet. Eine solche Art eines maschinellen Über setzungssystems wird als ein maschinelles "Dialog"-Über setzungssystem bezeichnet. Wenn viele Sätze übersetzt wer den müssen, wird die Anzahl an Bedeutungen, welche nicht be stimmt werden kann, ziemlich groß, und das Versorgen des Be nutzers mit Information, die erforderlich ist, um die Be deutung zu bestimmen, ist unter praktischen Gesichtspunkten unrealistisch. Folglich sollte die Menge an unbestimmbaren Bedeutungen berücksichtigt werden, und es sollte die syntak tische Struktur, welche Information von dem Benutzer erfor dert, ausgewählt werden.

Ferner betrifft das "Übersetzungsverfahren", welches in den japanischen Patentanmeldungen Nr. 80 362-1986 (JP 61-80 362 A) und Nr. 90 269- 1986 (JP 61-90 269 A) beschrieben ist, maschinelle Übersetzungssysteme. In diesen maschinellen Übersetzungssystemen wird die Syntax des eingegebenen Originalsatzes durchgeführt, und die Beziehun gen für die Strukturelemente, welche die Analyseergebnisse bilden, werden dem Benutzer präsentiert. Der Benutzer über prüft dann diese Analyseergebnisse, und wenn der Benutzer entscheidet, daß eine Beziehung unrichtig ist, spezifiziert der Benutzer eine richtige Beziehung, und das System führt dann entsprechend dieser Spezifikation eine Rückübersetzung durch.

Wenn viele Sätze zu übersetzen sind, wird die Anzahl Bezie hungen für die Strukturelemente so groß, daß es unter prak tischen Gesichtspunkten für den Benutzer nicht mehr länger realistisch ist, über die Richtigkeit oder Unrichtigkeit aller dieser Beziehungen zu entscheiden. Folglich sollte die Anzahl Entscheidungen, welche der Benutzer zu treffen hat, nur auf vage Beziehungen und unklare Teile u. ä. beschränt werden.

Die in der japanischen Patentanmeldung Nr. 290 976-1986 (JP 62-290 976 A) beschriebene "Übersetzungs-Stützeinrichtung" betrifft eben falls ein maschinelles Übersetzungssystem. Wenn in dem Pro zeß, bei welchem der eingegebene Originalsatz analysiert wird, einen vagen oder unklaren Teil erzeugt, wird eine Frage und Antwort zwischen dem Benutzer und dem System ge wechselt, und die dabei erhaltene Information wird verwen det, um mit der Analyse fortzufahren. In einem solchen Fall ist dann die Belastung des Benutzers geringer, wenn der Be nutzer in einer leicht zu verstehenden Weise und entsprechend der Art und dem Inhalt eines vagen oder unklaren Teils ge fragt wird, so daß der Benutzer schnell antworten kann.

Wenn viele Sätze zu übersetzen sind, nimmt die Anzahl die ser vagen oder unklaren Teile beträchtlich zu, und es ist eine große Belastung für den Benutzer, für alle diese Teile entsprechende Entscheidungen zu treffen. Folglich sollte die Befragung nur für die Einzelheiten durchgeführt werden, für welche ein großer Unbestimmtheitsgrad oder fehlende Klarheit vorliegt.

Ferner betrifft das "Detektions- oder Feststellverfahren für vage Modifizier-Beziehungen", welches in der japanischen Patentanmeldung Nr. 98 072-1988 (JP 63-98 072 A) beschrieben ist, ein Dialog- System für natürliche Sprache. In diesem System wird eine Analyse für den fraglichen Satz durchgeführt, es werden vage Modifizier-Beziehungen festgestellt, und alle möglichen Modi fizier-Beziehungen werden dem Benutzer präsentiert, welcher dann eine Auswahl trifft. Dann wird die Modifizier-Bezie hung, welche von dem Benutzer gewählt wird, dazu verwendet, eine korrekte Analyse durchzuführen. Die vage Modifizier-Be ziehung wird mit Hilfe von vagen Modifizier-Mustern bestimmt, welche in dem System gespeichert werden.

Wenn eine große Anzahl Sätze zu übersetzen ist, wird die An zahl an solchen vagen Modifizier-Beziehungen ziemlich groß, und es wird eine große Belastung für den Benutzer, für alle diese Beziehungen Entscheidungen zu treffen. Außerdem gibt es viele Arten von Unbestimmtheiten, welche ein Satz haben kann, und es ist schwierig, Muster für alle diese Arten von Beziehungen zu haben.

Aus "automatische Spracheingabe und Sprachausgabe" von Klaus Sieckert erschienen im Verlag Markt & Technik, Seiten 367 bis 390, ist die Erkennung von Wortketten mit Syntax bekannt. Die dort beschriebene Erkennung betrifft insbesondere die akustische Kennung, die durch Einschränkung der denkbaren Wortkombinationen deutlich verbessert werden soll.

Aus DE 37 23 078 A1 ist ein Verfahren zur Erkennung von zusammenhängend gesprochenen Wörtern bekannt. Diese Druckschrift bezieht sich auf die Analyse gesprochener Sprache. Zur Erkennung von Worten in der gesprochenen Sprache werden Audiosprachsignale mit gespeicherten Audioreferenzwerten verglichen.

Aus DE 37 33 674 A1 ist ein Sprachanalysator bekannt. Dieser erlaubt die Erkennung von Wortkombinationen und Sätzen.

Aus EP 0 118 187 A1 ist ein System zum Verstehen natürlicher Sprache bekannt, das Menü basiert ist. Dieses System stellt ein Hilfesystem zum Programmieren von Computern dar. Die Computerbefehle werden in natürlicher Sprache eingegeben und das System schlägt alle Möglichkeiten für Wörter vor, die bei einer gegebenen Situation noch im Einklang mit den strikten Vorgaben einer Programmiersprache gebracht werden können.

Die Technik für eine Sprachanalayse ist noch nicht ausge reift, und eine vollständige und automatische Analyse ist schwierig zu haben. Es gibt grundsätzlich zwei Methoden zur Lösung dieses Problems. Bei der einen Methode wird (1) die Anzahl von Analyseobjekten begrenzt, und bei der zweiten Methode wird (2) der Analyse-Automatisierungsgrad begrenzt. Die Erfindung betrifft die zuletzt angegebene Methode. Zum Begrenzen des Automatisierungsgrades gibt es wieder vier Verfahren, welche für die jeweiligen Arten von Übersetzungs verfahren die folgenden sind:

1. (2)-1 Eine vorherige Aufbereitung oder Redigierung: In die sem Fall führt der Benutzer eine vorherige Aufbereitung oder Redigierung für die Originalsätze durch, um sie dadurch in eine Form zu bringen, in welcher sie von dem System analy siert werden kann.
2. (2)-2 Nachträgliche Aufbereitung: In einem Prozeß, welcher maschinelle Übersetzungs- und Sprachanalyseergebnisse be nutzt, hat der Benutzer für eine Verarbeitung die endgül tigen Ergebnisse des Systems zu korrigieren.
3. (2)-3 Bei einer Zwischen-Aufbereitung hat der Benutzer eine Korrektur der Sprachergebnisse des Systems selbst durchzu führen.
4. (2)-4 Bei einem Dialog-System hat der Benutzer die Analyse zu kooperieren und durchzuführen.

Die vorliegende Erfindung bezieht sich auf diese vierte Me thode. Die Schwierigkeit bei der Methode (1) besteht darin, daß es schwierig ist, zu bestätigen, ob der Originalsatz, welcher zu analysieren ist, in den Grenzbereichen liegt oder nicht. Die Schwierigkeiten bei (2)-1 bis (2)-3 sind vorste hend bereits beschrieben, und diese Schwierigkeit ist nicht bei (2)-4 anzutreffen. Die Schwierigkeiten mit der herkömm lichen Technologie für (2)-4 sind bereits beschrieben worden, jedoch ist die übliche Schwierigkeit die, daß "die Gesamtan zahl an Teilen, welche von dem System nicht bestimmt werden können, größer wird, wenn viele Sätze zu übersetzen sind". Es ist unrealistisch, daß ein Benutzer dies alles aushält.

Aufgabe der Erfindung ist es eine Sprachanalyseeinrichtung bereitzustellen, die schnell und effektiv die Sprache unter Einsatz technischer Mittel analysiert. Weiter soll ein entsprechendes Verfahren geschaffen werden und ein Programm, das ein derartiges Verfahren ausführt.

Vorstehende Aufgabe wird durch die Gegenstände der Ansprüche 1, 16 und 31 gelöst. Vorteilhafte Weiterbildungen gehen aus den Unteransprüchen hervor.

Vorteilhaft wird eine Dialog-Analyseeinrichtung für natürliche Sprache geschaffen, bei welcher die Nachteile des vorerwähnten Systems, Verfahrens und der Einrichtungen beseitigt sind. Vorteilhaft wird ein Dialog-Analysesystem für natürliche Sprache geschaffen, bei welchem die Häufigkeit einer Unterstützung durch den Benutzer dadurch verringert wird, dass der Analyse-Schwierigkeitsgrad von dem System geschätzt wird, und entsprechend diesem Schwierigkeitsgrad die Objekte oder Gegenstände begrenzt werden, bei welchen eine Unterstützung durch den Benutzer erforderlich wird. Außerdem ist eine Unterstützung seitens des Benutzers ohne Bedeutung, wenn nicht die korrekte Analyse- Auslegungsrate verbessert wird. Das heißt, sollten Analyseergebnisse dieselben sein, wie diejenigen, welche aufgrund einer Beurteilung von dem System selbst durchgeführt worden sind und ohne eine Unterstützung seitens des Benutzers erhalten würden, dann würde irgendeine Unterstützung seitens des Benutzers sinnlos sein. Ein weiteres Ziel der Erfindung ist es daher, ein Dialog-Analyse-System für natürliche Sprache zu schaffen, bei welchem eine Verbesserung in einem Analyseverhältnis, das durch eine Unterstützung seitens des Benutzers erhalten worden ist, immer maximal wird, so dass die Anzahl an solchen sinnlosen Unterstützungen verringert werden kann.

Außerdem ist es nicht notwendigerweise richtig, das der Analyse-Nutzeffekt eines Systems konstant ist. Er kann mit Hilfe von Wörterbuch-Regeln und Grammatik verbessert werden. Ein drittes Ziel der Erfindung ist es daher, ein Dialog-Analyse-System für natürliche Sprache zu schaffen, bei welchem die Analyseleistung verbessert wird, und gleichzeitig die Belastung für den Benutzer leichter gemacht wird, so dass die Belastung des Benutzers auf einem entsprechenden Wert gehalten wird.

Obwohl es wünschenswert ist, dass das Analyseverhältnis 100% ist, ist dies nicht unbedingt notwendig. Wenn beispielsweise die erfindungsgemäße Einrichtung in einem Übersetzungssystem verwendet wird, ergeben sich keine Schwierigkeiten, wenn das Analyse-Verhältnis etwa 80% ist. Ein weiteres Ziel der Erfindung ist es daher, ein Dialog- Analysesystem für natürliche Sprache zu schaffen, welches die Anzahl Mal steuern kann, bei welchen eine Unterstützung von dem Benutzer erforderlich ist, so dass in Übereinstimmung mit dem von dem Benutzer geforderten Analyse-Verhältnis liegt, und folglich der Benutzer die Benutzer-Belastung entsprechend einstellen kann. Bei dem erfindungsgemäßen Dialog-Analogsystem für natürliche Sprache ist dies dadurch erreicht, dass die Dialog-Einrichtung eine Bestimmungseinrichtung aufweist, um die Anzahl Mal der Dialog-Wechselwirkung mit dem Benutzer festzustellen und zu bestimmen.

Nachfolgend wird die Erfindung anhand von bevorzugten Ausführungsformen unter Bezugnahme auf die anliegenden Zeichnungen im einzelnen dargestellt. Es zeigen:

Fig. 1 ein Blockdiagramm, anhand welchem eine Ausführungsform einer Dialog- Analyseeinrichtung für natürliche Sprache gemäß der Erfindung beschrieben wird;

Fig. 2 ein Flussdiagramm, anhand welchem die Arbeitsweise einer Dialog- Analyseeinrichtung für natürliche Sprache gemäß der Erfindung beschrieben wird;

Fig. 3 ein Flussdiagramm, welches die Arbeitsweise einer anderen Ausführungsform eines Dialog-Analysesystems für natürliche Sprache gemäß der Erfindung wiedergibt, und

Fig. 4 ein Flußdiagramm der Arbeitsweise noch einer wei teren Ausführungsform einer Dialog-Analyseeinrich tung für natürliche Sprache gemäß der Erfindung.

Nachstehend wird eine Grundkonfiguration eines Dialog- Analysesystems für natürliche Sprache gemäß der Er findung beschrieben. Über eine Eingabeeinheit 1 wird die Information des eingegebenen Originalsatzes eingegeben, um eine Sprachanalyse durchzuführen. Diese Eingabeeinheit 1 weist beispielsweise eine Tastatur und einen optischen Zei chenleser (OCR) auf. Eine Verarbeitungseinheit 100 weist als Funktionsblöcke einen Feststellblock 2 für alle Bezie hungen, einen Feststellblock 6 für bestimmte Beziehungen, einen Beschränkungs-Anwendungsblock 7, einen Auswerteblock 8, einen Dialogblock 9 und einen Bevorzugungsblock 10 auf. Die Verarbeitungseinheit 100 ist im allgemeinen aus Rechner einheiten gebildet, und jeder der vorstehend beschriebenen Funktionsblöcke ist durch Rechner-Hardware und -Software realisiert. Ein Wörterbuch 4 enthält Teile von Sprachwörtern, Idioms und Satz(teil)-Bedeutungen. Eine Grammatik 5 hat die Modifizier-(Verbindungs-)Beziehungen für jedes der Worte, der Wortkombinationen und Satz(teile), usw. Das Wörterbuch 4 und die Grammatik 5 sind durch einen Speicher gebildet, und die Information des vorstehend beschriebenen Wörterbuchs und der Grammatik sind in dem Speicher gespeichert. Eine Be ziehungs-Speichereinheit 3 speichert die Modifizier-Bezie hung für jedes der Worte, Idioms und Satzteile u. ä., welche durch die Bearbeitung der Verarbeitungseinheit 100 erhalten worden sind. Diese Beziehungs-Speichereinheit 3 ist durch einen Speicher gebildet. Die Information für die Modifizier- Beziehung, welche in dieser Beziehungs-Speichereinheit 3 gespeichert ist, wird für maschinelle Übersetzung u. ä. ver wendet. Eine Anzeigeeinheit 11 weist ein CRT-Display und eine LCD-Display-Einheit u. ä. auf. Diese Anzeigeinheit 11 stellt die Ergebnisse der verschiedenen Verarbeitungsarten dar, welche von der Verarbeitungseinheit 100 durchgeführt worden sind. Außerdem ist die Eingabeeinheit 1 auch ein Dialog-Interface für den Benutzer. Der Benutzer liefert von der Eingabeeinheit 1 aus notwendige Information an die Verarbeitungseinheit 100.

Die spezifische Verarbeitung für jeden der Blöcke in der Verarbeitungseinheit 100 wird später beschrieben. Im fol genden wird die Arbeitsweise einer Dialog-Analyseeinheit für natürliche Sprache, welche die vorstehend beschriebene Konfiguration hat, anhand des in Fig. 2 dargestellten Fluß diagramms beschrieben.

Ein Benutzer gibt beispielsweise von der Eingabeeinheit 1 den folgenden englischen Satz ein:
"Zeit verfliegt heute wie ein Pfeil".

Wenn dies eingegeben wird, wird beim Schritt 101 eine Ver arbeitung mittels des Feststellblocks 2 für alle Beziehun gen durchgeführt. Der Block 2 teilt den von der Eingabeein heit 1 aus eingegebenen Originalsatz in eine Anzahl Worte auf. In diesem Fall sind es von den syntaktischen Einheiten des Satzes her sechs Worte. Diese Worte sind "Zeit", "ver fliegt", "heute", "wie", "ein" und "Pfeil". Diese Worte sind Knoten. Dann liefert der Feststellblock 2 passende Wort-Vo kabular-Informationen, welche in dem Wörterbuch 4 gespeichert ist. Für jedes Wort wird beispielsweise die Vokabular-Infor mation gegeben, welche in Tabelle 1 dargestellt ist. In die sem Fall sind die Wort-Vokabular-Informationen die Kandida ten für den Sprachteil jedes Wortes.

Tabelle 1

Wort
Kandidaten-Sprachteil
Zeit	Hauptwort, Verb
verfliegt	Hauptwort, Verb
heute	Adverb
wie	Verb, Präposition
ein	Artikel
Pfeil	Hauptwort

Dann verwendet der Feststellblock 2 für alle Beziehungen die vorstehend beschriebene Vokabular-Information für jedes Wort und die Modifizierfaktor-modifizierte Beziehung, welche in der Grammatik 5 gspeichert ist, um alle möglichen Modifi zierfaktor-modifizierten Beziehungen für jedes Wort zu erzeugen, und speichert dann diese erzeugten Modifizierfaktor-modifi zierten Beziehungen in der Beziehungsspeichereinheit 3.

Die Modifizierfaktor-modifizierten Beziehungen und die Be ziehungsnamen sind in Tabelle 2 aufgeführt.

Tabelle 2

In den in Tabelle 2 wiedergegebenen 12 Beziehungstypen (1) bis (12) sind die Beziehungen (1) und (2) dieselbe, Modifi zierfaktor-modifizierte Beziehung (Zeit → verfliegt), aber die Beziehungsnamen (1) und (2) sind verschieden. Dasselbe gilt für die Beziehung (8) und (9). Die Modifizierfaktor- modifzierten Beziehungen in Tabelle 2 werden folgendermaßen angegeben:

Beispielsweise hat das Wort "wie" die Möglichkeit die zwei Worte "Zeit" und "verfliegt" zu modifizieren. Außerdem hat das Wort "heute" die Möglichkeit, die drei Worte "Zeit", "verfliegt" und "wie" zu modifizieren. Beim Schritt 102, welcher auf den Schritt 101 folgt, wird die Verarbeitung durch den Feststellblock 6 für bestimmte Beziehungen durch geführt.

Der Feststellblock 6 überprüft die 12 Arten von Modifizier faktor-modifizierte Beziehungsinformation (1) bis (12), wel che in der Beziehungsspeichereinheit 3 gespeichert worden ist, und stellt dann diese Modifizierfaktor-modifizierten Beziehungen fest, bei welchen bereits bestimmt worden ist, daß sie nicht von anderen Beziehungen abhängig sind. Dann werden der Beziehungs-Information Verwendbarkeits-Markierun gen ("bestimmte, festgelegte" Markierungen) gegeben. In dem in Tabelle 2 wiedergegebenen Beispiel ist die Beziehung-In formation (7) (ein → Pfeil) als eine Modifizierfaktor- modifizierte Beziehung festgestellt, welche bereits bestimmt worden ist. Das heißt, das Wort "ein" hat nur die Möglich keit, zu dem Wort "Pfeil" in Beziehung gebracht zu werden. Diese Beziehung wird nicht durch andere Beziehungen beein flußt.

Nach dem Schritt 102 wird dann die Verarbeitung von Schritt 103 durch den Beschränkungs-Anwendungsblock 7 durchgeführt. In allgemeinen Worten, die folgenden Beschränkungen werden in praktisch allen Fällen festgesetzt.

A) Modifizierte Einheit: Dies ist üblicherweise nur ein Wort oder ein Satzteil, welcher durch jedes Wort oder jeden Satzteil u. ä. modifiziert wird,
B) Nicht-Kreuzen von Modififzierfaktor-modifizierte Bezie hung: In dem Satz ist ein Wort zwischen den Worten, welche durch eine Modifizierfaktor-modifizierte Beziehung verbunden sind, nicht durch die Modifizierfaktor-modifzierte Bezie hung zu einem Wort außerhalb der verbundenen Worte verbun den.

Diese Einschränkungen erzeugen Exclusivität zwischen den Modifzierfaktor-modifzierten Beziehungen. Wenn beispiels weise eine der Beziehungen zwischen Worten (a) und (b) und zwischen (a) und (c) (wobei c = b ist) richtig ist, ist die andere Beziehung infolge der Modifizierfaktor-Einheit (d. h. von Exclusivität) falsch. Wenn beispielsweise in den in Ta belle 2 wiedergegebenen 12 Beziehungen die Beziehungsinforma tion (5) (wie → verfliegt) richtig ist, dann ist die Bezie hungs-Information (6) (wie → Zeit) falsch (die oben angege bene Regel (A)). Wenn die Beziehungs-Information (6) (wie → Zeit) richtig ist, dann ist die Beziehungs-Information (11) (heute → verfliegt) falsch (die oben angeführte Regel (B)).

Eine bestimmte Modifizierfaktor-modifzierte Beziehung wird durch eine Verarbeitungsart festgesetzt; wenn dies gilt, werden alle die Modifizierfaktor-modifzierten Beziehungen, welche infolge der oben beschriebenen Beschränkungen aus schließlich sind, aus diesen Modifizierfaktor-modifzierten Beziehungen gestrichen. Diese Art einer Verarbeitung wird als eine Beschränkungs-Anwendung bezeichnet. In der Bezie hungs-Speichereinheit 3 werden der festgesetzten Beziehungs information Festsetzungs- oder Bestimmungs-Markierungen gege ben. Wenn folglich der Beschränkungs-Anwendungsblock 7 für diese Beziehungs-Information in der Beziehungs-Speicherein heit 3 sucht und eine Bestimmungs-Markierung feststellt, wird die Beschränkungs-Anwendungsverarbeitung für die Be ziehungs-Information durchgeführt, welcher Bestimmungs-Mar kierungen gegeben worden sind.

In einer Ausführungsform gemäß der Erfindung gibt es nach einer Verarbeitung durch den Feststellblock 2 für alle Be ziehungen drei Möglichkeiten, die Modifizierfaktor-modifi zierten Beziehungen zu bestimmen. Dies sind folgende:

1. Bei der Verarbeitung für die Feststellung der bestimm ten Beziehung: Wie oben beschrieben, gilt dies, wenn die Modifizierfaktor-modifizierte Beziehung bereits von Anfang an bestimmt ist.
2. In der Spezifikation durch den Benutzer: Dies gilt, wenn die Modifizierfaktor-modifzierte Beziehung durch Dialog- Spezifizierung durch den Benutzer mit Hilfe einer später noch zu beschreibenden Methode spezifiziert wird.
3. Bei der Bevorzugung durch das System: Die Bevorzugung wird später beschrieben.

In der Ausführungsform sind diese Festsetzungen gemacht und dann wird immer die Beschränkungs-Anwendung durchge führt. Hierdurch wird der größte Vorteil der Bestimmungs- oder Festsetzungsinformation erhalten. Hierbei ist wichtig, daß, selbst wenn die Modifizierfaktor-modifizierte Bezie hung durch die Beschränkungs-Anwendung gestrichen wird, die Beschränkungen, die vorstehend beschrieben worden sind, beinahe sicher festgesetzt werden, und so eine korrekte Modifzierfaktor-modifizierte Beziehung nicht irrtümlich gelöscht wird. Folglich sind in dieser Ausführungsform der Erfindung die Möglichkeit zum Streichen einer richtigen Ant wort nur in dem Fall (3) vorhanden, bei welchem die Bevorzu gung durch das System durchgeführt wird. Das heißt, nur die festgesetzte Beziehungsfeststellung und die Beschränkungs- Anwendung werden vor der Dialog-Wechselwirkung durchgeführt, und die Bevorzugung durch das System wird nicht durchgeführt, bis die Dialog-Wechselwirkung beendet ist, so daß dadurch garantiert ist, daß eine Dialogwechselwirkung, die immer eine richtige Antwort einschließt, durchgeführt wird.

Die Verarbeitung beim Schritt 104, welche nach der Beschrän kungs-Anwendungs-Verarbeitung des Schrittes 103 durchgeführt wird, ist die Bewertung. Diese Verarbeitung wird von dem Bewerteblock 8 durchgeführt. Bei dieser Verarbeitung wer den Bewertungen an alle die Modifizierfakor-modifizierten Beziehungen gegeben, welche bei der Verarbeitung für die Beschränkungs-Anwendung nicht gestrichen worden sind. Unter schiede in den Bewertungen zwischen Modifizierfaktor-modi fizierten Beziehungen müssen irgendeine Bedeutung haben.

Das heißt, in Fällen, in welchen es zwei Modifizierfaktor- modifizierte Beziehungen gibt, welche exclusiv sind, und es dann schwieriger ist, zu bestimmen, welche von den zwei der richtige ist, muß sich dies in einem kleineren Absolutwert der Differenz zwichen den zwei Bewertungen widerspiegeln. Bei dieser Ausführungsform gemäß der Erfindung wird die modifzierte Wahrscheinlichkeit (d. h. die Wahrscheinlichkeit, daß das Wort durch ein anderes Wort modifiziert wird) als das Ergebnis verwendet, welches dieser Bedingung genügt.

Verfahren zum Bestimmen der modifizierten Wahrscheinlichkeit

Im allgemeinen wird die Modifizierfaktor-modifizierte Grammatik mit Hilfe eines Modifizierer-Wortattributs, eines modifizierten Wortattributs und eines Beziehungsnamens ausgedrückt. Die nachstehend angeführten Modifzierfaktor- modifizierten Größen werden angenommen:
Modifizierfaktor-modifizierte Grammatik: k
Modifizierer-Wortattribut: A1
Modifizierer-Wortattribut: A2
Beziehungsname: Etikett (Marke).

Dann wird angenommen, daß die Grammatik k die Modifizier faktor-modifzierte Beziehung zwischen den Wortpaaren a und b erzeugt.

Folglich ist, wenn
die Wahrscheinlichkeit, daß die modifizierte Grammatik k festgelegt ist: P1 ist
die Wahrscheinlichkeit, daß das Wort a den Attributwert A1 hat: P2 ist,
die Wahrscheinlichkeit, daß Wort e den Attributwert A2 hat: P3 ist,
die Bewertung s(a, b, k) der Modifizierfaktor-modifizier ten Beziehung für das Wort-Paar a und b durch die Grammatik k:

(wobei Wi eine Konstante und

ist)

Wenn eine Anzahl der Modifizierfaktor-modifizierten Grund begriffe dieselbe modifizierte Beziehung erzeugen, kann die Beziehung mit dem größten Wert verwendet werden. Außerdem drückt in der vorstehenden Gleichung Wi die Bedeutung jeder der Wahrscheinlichkeit aus. Folglich ist es notwendig, daß Wi einen angemessenen Wert für jede Grammatik, bzw. jeden Grundbegriff festlegt.

Auf diese Weise werden die vorstehenden Auswertungen für alle die Kandidaten-Worte bestimmt, welche Wort a modi fizieren können. Dann werden, wenn die Auswertungen für die Modifizierfaktor-modifizierten Beziehungen des Wort paars a, b ausgedrückt werden, die Auswertungen folgender maßen berechnet:

In dieser Berechnung ist, wenn W1 = 1 und W2 = W3 = 0 ist, nur die Wahrscheinlichkeit P1 der Modifizierfaktor-modifi zierten Grammatik die Bewertung (score).

Die Wahrscheinlichkeit der Modifizierfaktor-modifzierten Grammatik kann mit Hilfe der Anzahl Mal, daß die Modifi zierfaktor-modifizierte Grammatik ohne weiteres bei einem Wortpaar angewendet worden ist, und mit Hilfe der Anzahl Mal ohne weiteres berechnet werden, daß die Modifizierfaktor- modifizierte Grammatik richtig ist. Die Berechnung für die Wahrscheinlichkeit eines bestimmten Wortes mit einem Attributwert wird auf dieselbe Weise berechnet. Wenn diese Einrichtung verwendet wird, werden Daten, welche zu dieser Anzahl von Anwendungen und zu der Anzahl korrekter Antworten Beziehung haben, gespeichert und es wird die erneute Möglich keits-Berechnung durchgeführt, so daß die Genauigkeit der Wahrscheinlichkeit jedesmal erhöht wird, wenn die Verarbei tung durchgeführt wird. Ein Lernen wird folglich auf diese Weise für das System durchgeführt.

Außerdem ist der Wert W ein Konstante, wie beispielsweise eine normierte Konstante und der Wert für W wird jedesmal dann erneuert, wenn eine Beziehungs-Information durch die Anwendung der Beschränkungen gelöscht worden ist, und die Aus- bzw. Bewertung wieder berechnet wird, daß immer eine geeignetere Bewertung erhalten wird. Ebenso kann sich in der vorstehend beschriebenen Berechnung durch ein genaues Bestimmen und Verwenden von W1, W2, W3 und P2 sowie P3 der Typ (die Art Wort, aus welchem es gebildet wird, usw.) eines Modifzierer-Wortes und der Typ eines modifizierten Wortes in der Bewertung widerspiegeln. Wenn die Verarbeitung für die Bewertung beendet ist, wird beim Schritt 105 und 106 die Beurteilungsverarbeitung durchgeführt, und dann wird beim Schritt 107 die Dialog-Wechselwirkung durchgeführt.

Bei dieser Dialog-Wechselwirkung werden die Modifizierfaktor- modifizierten Beziehungen durch eine Dialog-Wechselwirkung (Frage und Antwort) zwischen dem Benutzer und dem System bestimmt. Bei dieser Dialog-Wechselwirkung werden Fragen und Antworten von dem Benutzer an das System über die Eingabe einheit 1 durchgeführt, und die Fragen/Antworten von dem System an den Benutzer werden über die Anzeigeeinheit 11 durchgeführt. Diese Dialog-Wechselwirkung wird mittels des Dialog-Blocks 9 und mit Hilfe der folgenden Prozedur durch geführt.

1. Es werden Gruppen mit Elementen von Beziehungs-Informa tionen gebildet, welche sich gegenseitig ausschließen.
2. Paare der höchsten Bewertung werden für jedes Bewer tungspaar bestimmt, und dann werden die Gruppen in der Reihenfolge von Gruppen mit abnehmenden Bewertungsunter schieden sortiert.
3. Der Unterschied der Bewertungen wird für jedes Be wertungspaar und dann für die Gruppen mit abnehmenden Be wertungsunterschieden bestimmt.
4. An der Spitze der Gruppen, welche so, wie beschrieben ist, sortiert werden, wird, wenn diese Bewertungsdifferenz kleiner als eine vorherbestimmte Konstante X ist, dann ent schieden, ob es schwierig ist, die Modifizierfaktor-modi fizierte Beziehung zu bestimmen, und die Beziehungs-Informa tion dieser Gruppe wird dann ein Kandidat für eine Dialog- Wechselwirkung.
5. Das Wort, d. h. das modifizierte Wort bezüglich des Modifizierer-Worts in der Beziehungsinformation, welches der Kandidat für eine Dialog-Wechselwirkung geworden ist, wird dem Benutzer zugeführt. Dann wird, wenn der Benutzer eine Antwort gibt, dieser Beziehungs-Information (der Modifizier faktor-modifzierten Beziehung), welcher dieser Antwort ent spricht, eine Bestimmungs-Markierung gegeben.
6. Wenn eine Bestimmungs-Markierung der Beziehungsinfor mation entsprechend der Antwort von dem Benutzer gegeben worden ist, wird die verarbeitete Gruppe an der Spitze der sortierten Gruppen gestrichen. Die Verarbeitung geht dann auf die Beschränkungs-Anwendungsverarbeitung des Schrittes 103 zurück.

Auf diese Weise wird die Verarbeitungsschleife, Dialog- Wechselwirkung → Beschränkungs-Anwendung → Bewertung - Dialog-Wechselwirkung, wiederholt. Die Verarbeitung in dieser Schleife dauert an, bis einer der zwei folgenden Bedingungen genügt ist, und dann wird zu der Bevorzugungs Verarbeitung des Schrittes 108 übergegangen.

Abschlußbedingung 1: Ist der Bewertungsunterschied der Gruppe an der Spitze der sortieren Gruppen größer als ein Wert x. Diese Abschlußbedingung 1 wird bei der Verarbeitung für den Schritt 105 angewendet, um zu beurteilen, ob es ein Gegenstand zu der Frage ist oder nicht.

Abschlußbedingung 2: Wenn der Wert einer Dialog-Wechselwir kung (die Anzahl Fragen), die sich insoweit auf den Satz be ziehen, gleich einem vorherbestimmten Wert Y ist. Diese Ab schlußbedingung 2 wird bei der Verarbeitung des Schrittes 106 angewendet, um zu beurteilen, ob die Anzahl Fragen einen Wert für einen oberen Grenzwert erreicht hat oder nicht.

Die vorstehend beschriebene Verarbeitung hat folgende Be deutung:
Im Hinblick auf den Benutzer, welcher alle die Modifizier faktor-modifizierten Beziehungen durch die Dialog-Wechsel wirkung bestimmt, wird dann die Verarbeitung für eine An zahl von n Worten mit (n - 1) Fragen und Antworten been det. Wenn jedoch viele Sätze zu analysieren sind, stellt diese eine große Belastung für den Benutzer dar. Folglich wird der Schwierigkeitsgrad des Systems, entsprechend wel chem die Beziehungs-Information ausgewählt wird, bestimmt, und die Dialog-Wechselwirkung wird in der Reihenfolge die ser Beziehungs-Informationen durchgeführt, für welche der Schwierigkeitsgrad am größten ist, so daß die Belastung für den Benutzer entsprechend erleichtert werden kann. Der Schwierigkeitsgrad sollte, wenn das System die Beziehungs- Information auswählt, vorteilhafterweise in einfacher Weise bestimmt werden.

Bei dieser Ausführungsform gemäß der Erfindung wird zu der Bestimmung des Schwierigkeitsgrads der Unterschied zwischen der höchsten Bewertung und der nächsthöchsten Bewertung für die Modifizierfaktor-modifizierte Beziehung verwendet, welche zu den Worten in der Gruppe Beziehung hat, welche ausschließliche Modifizierfaktor-modifizierte Beziehungen aufweist. Dieser Bewertungsunterschied wird leicht bestimmt und darüber hinaus auch bei der Verarbeitung für die Bevor zugung verwendet, was später noch beschrieben wird. Darüber hinaus kann durch die Dialogwechselwirkungsgruppen, welche durch die Kleinheit des Bewertungsunterschieds geordnet sind, die Verbesserung des Analyseverhältnisses infolge ei ner Benutzerunterstützung immer auf dem Höhepunkt sein.

Nur durch Durchführen einer Dialog-Wechselwirkung, wenn der Bewertungsunterschied kleiner als eine vorherbestimmte Kon stante X ist, ist die Dialog-Wechselwirkung begrenzt, so daß die Systemeffizienz verbessert ist, und die Anzahl an Möglichkeiten einer Dialog-Wechselwirkung wird reduziert, so daß die Belastung für den Benutzer automatisch geringer wird. Das bedeutet, daß es möglich ist, die Beanspruchung des Benutzers immer in einem angemessenen Rahmen zu halten. Dies ist aus den folgenden Gründen möglich. Die Effizienz einer Systemanalyse ist immer durch das Vorsehen von Wörter büchern, Grammatik und anderen Datenarten und auch durch den Lernprozeß verbessert. Die Steigerung der Effizient der Systemanalyse spiegelt sich in der Bewertungsgenauigkeit wider. Das heißt, durch ein Verbessern des Analyseverhält nisses werden die Unterschiede zwischen den Bewertungen grö ßer und es wird dadurch leichter, die richtige Antwort aus zuwählen. Außerdem werden die Bewertungen zuverlässiger, je größer der Unterschied ist, und der Wert der Konstanten X kann ebenfalls bei einem größeren Wert festgelegt werden, so daß die Anzahl Fragen für eine Dialog-Wechselwirkung weiter verringert werden kann.

Da die Konstante Y als der obere Grenzwert für die Anzahl Fragen festgesetzt werden kann, und da der Wert dieser Kon stanten Y von dem Benutzer beliebig eingestellt werden kann, ist es für den Benutzer möglich, die Benutzer-Beanspruchung auf einen entsprechenden Wert einzustellen. Das heißt, der Wert der Konstanten Y muß umso höher eingestellt werden, je höher die geforderte Qualität von Analyeergebnissen ist.

Durch diese Verarbeitung werden die Worte bestimmt, die mo difiziert werden und hierzu werden die Bewertungen verwen det, die jedem der durch Kandidaten modifizierten Worte ge geben werden, welche noch nicht ihre bestimmten Modifizier faktoren haben. Diese Bestimmung wird durch die Verarbei tung für die Bevorzugung bei dem Schritt 108 durchgeführt.

Diese Verarbeitung für die Bevorzugung wird mittels des Bevorzugungsblockes 10 in der Verarbeitungseinheit 100 und mit Hilfe der folgenden Prozedur durchgeführt.

1. Es wird eine Methode angewendet, um ein Stück einer Antwort-Beziehungsinformation aus den Beziehungsinformations- Kandidaten auszuwählen.
2. Eine Bestimmungs-Marke wird dieser Beziehungsinforma tion gegeben, welche als die Antwort ausgewählt wurde.
3. Beim Schritt 109 wird dann beurteilt, ob alle Beziehungs information bestimmt worden ist oder nicht, und es wird dann beim Schritt 110 für die Beschränkungs-Anwendung fortgefah ren, welche bereits beschrieben worden ist.

Dann wird die Bewertungsverarbeitung, die vorstehend be schrieben worden ist, durchgeführt (Schritt 111), und mit der Verarbeitung wird auf die Prioritäts-Auswertungsver arbeitung (Schritt 108) zurückgegangen. Auf diese Weise wird die Schleife, Bevorzugung (Schritt 108) → Beschränkungs- Anwendung (Schritt 110) → Bewertung (Schritt 111) → Bevorzugung (Schritt 108) wiederholt, bis die gesamt Ver arbeitung für eine Analyse beendet ist.

In diesem Fall wird die Auswahl der Beziehungsinformation der Antwort entsprechend der folgenden Prozedur durchge führt. Auf dieselbe Weise wie bei der vorstehend beschrie benen Dialog-Wechselwirkung wird die höchste Bewertung und die nächst-höchste Bewertung für jede der Gruppen von Be ziehungs-Information bestimmt, welche exclusiv sind. Dann wird bei den Gruppen eine Auswahlverarbeitung durchgeführt, wobei mit der Gruppe begonnen wird, für welche der Bewer tungsunterschied am höchsten ist. Bei dieser Auswahlverar beitung wird die Beziehungsinformation, welche die höchste Bewertung hat, als die Antwort ausgewählt. Wenn die Bezie hungsinformation bestimmt ist, d. h. wenn das Wort, nämlich das modifizierte Wort bestimmt ist, gibt es die Möglichkeit, daß ein Wort, welches garnicht zu modifizieren ist, vorkom men kann; in Fällen, wie diesen, es dann notwendig, eine Rückführung durchzuführen.

Auf diese Weise wird das Bewertungsmerkmal der Bestimmung der Beziehungsinformation, was leichter ist, je größer der Bewertungsunterschied ist, dazu verwendet, um das richtige Antwortverhältnis des Systems zu erhöhen.

Wenn diese Verarbeitung beendet ist, hat die Beziehungs speichereinheit 3 die Beziehungsinformation, welche die Bestimmungs-Markierungen gehabt hat, um sie dann als end gültige Analyseergebnisse zu setzen. Im Falle des Bei spiels in Tabelle 2 werden die Bestimmungs-Markierungen der Beziehungsinformationen (1), (5), (7), (9), und (11) gegeben. Diese Modifizierfaktor-modifizierten Beziehungen sind folgende:

Zusätzlich werden die Verarbeitungsvorgänge für die andere Bevorzugung dann als nächstes geprüft. Die Verarbeitung für die nächste Bevorzugung wird, wie in Fig. 4 dargestellt, in dem letzten Schritt 120 durchgeführt, nachdem die Ver arbeitung für die Feststellung aller Beziehungen (Schritt 101), die Feststellung einer bestimmten Beziehung (Schritt 102), die Beschränkungs-Anwendung (Schritt 103), die Bewer tung (Schritt 104) und die Dialog-Wechselwirkung (Schritt 107) usw. beendet sind. Alle möglichen Modifizierfaktor- modifizierten Bedingungen werden als Kandidaten bezüglich aller Worte erzeugt, für welche Modifizierfaktor-modifizierte Beziehungen nicht bestimmt werden. Gruppen von Kandidaten, für welche ausschließliche Modifizierfaktor-modifizierte Beziehungen entsprechend den vorstehend beschriebenen Be schränkungen nicht vorhanden sind, werden erzeugt. In jeder Gruppe wird die Gesamtsumme von Bewertungen der Kandidaten berechnet. Die Gesamtsumme dieser Bewertungen wird als die Kandidaten-Gruppenbewertung bezeichnet. Von diesen mögli chen Modifizierfaktor-modifizierten Kandidaten-Gruppen wird nur die Kandidaten-Gruppe genommen, welche die höchste Kandidaten-Gruppenbewertung hat, und die Modifizierfaktor- modifizierten Beziehungen (Kandidaten) einschließlich dieser Gruppe werden alle bestimmt.

Beim Schritt 120 für die in Fig. 3 dargestellte Bevorzu gung ist ein lokaler Gesichtspunkt (d. h. die Bestimmung des Wortes, welches durch ein einziges Wort modifiziert wor den ist) nicht in die Verarbeitung beim Schritt 108 für die Bevorzugungs-Verarbeitung der Fig. 1 aufgenommen worden, und die Auswahl wird dann unter einem umfassenden Gesichts punkt durchgeführt. Folglich kann eine hohe Beurteilungs genauigkeit durch das System erwartet werden.

Im folgenden werden Ergänzungsfunktionen beschrieben. In Sätzen, welche viele Worte haben, gibt es viele mögliche Modifizierfaktor-modifizierte Beziehungen. Wenn eine Anzahl Sätze analysiert werden, wird die Verarbeitung in die Ver arbeitung durch die Schritte 101 bis 104 und in die übrige Verarbeitung aufgeteilt, und die Ergebnisse der vorherigen Verarbeitung wird dann in einer entsprechenden Speicherein heit bereitgehalten. Wenn die vorherige Verarbeitung für alle Sätze beendet ist, wird die restliche Verarbeitung durchgeführt, wobei die Verarbeitungsergebnisse bei der vorherigen Verarbeitung abgerufen werden. Hierdurch kann dann der Benutzer die Dialog-Wechselwirkung auf eine Sitzung konzentrieren, so daß Zeit bezüglich der Dialog-Wechsel wirkung eingespart ist.

Eine Verarbeitung, wie diese, ist im einzelnen in Fig. 4 wiedergegeben. In Fig. 4 wird beim Schritt 111 ein Satz aus einer Anzahl Sätze extrahiert, und dann wird die vor her beschriebene Feststellung aller Beziehungen (Schritt 101), die Festellung einer bestimmten Beziehung (Schritt 102), die Beschränkungs-Anwendung (Schritt 103) und die Bewertung (Schritt 104) bezüglich des extrahierten Satzes durchgeführt. Dann werden beim Schritt 112 die Bewertungs ergebnisse in einer entsprechenden Speichereinheit zurück gehalten. Diese Verarbeitung wird dann für alle Sätze durchgeführt. Wenn dann beim Schritt 104 entschieden wird, daß die Verarbeitung für den letzten Satz beendet ist, wird auf den Schritt 112 übergegangen, bei welchem die Er gebnisse der vorherigen Bewertung für einen Satz aus der Speichereinheit gelesen werden, und diese Bewertungsergeb nisse werden dann als Basis für die Durchführung der bereits früher beschriebenen Dialog-Wechselwirkung (Schritt 107) verwendet. Dann wird die Verarbeitung für die Beschränkungs- Anwendung (Schritt 115) und die Bewertung (Schritt 116) durchgeführt. Wenn beim Schritt 105 entschieden wird, daß es keinen Gegenstand für eine Befragung gibt, oder wenn beim Schritt 106 entschieden wird, daß der obere Grenzwert für die Anzahl Fragen erreicht worden ist, dann wird die Be vorzugung durchgeführt. Diese Verarbeitung wird auf der Basis der Bewertungsergebnisse für alle Sätze durchgeführt, welche in der Speichereinheit gespeichert worden sind, und endet, wenn die Analyse für alle Sätze beendet ist.

Es ist erwünscht, daß der Benutzer frei wählen kann, ob die in Fig. 4 dargestellte Verarbeitung oder die Verarbeitung anzuwenden ist, welche in einer der Fig. 2 und 3 dargestellt ist. Diese Wahl der Verarbeitungsform kann ohne weiteres mittels des Systems durchgeführt werden, indem der Benutzer vor Beginn einer Verarbeitung fragt, ob die in Fig. 4 dar gestellte Verarbeitung oder die Verarbeitung, welche in ei ner der Fig. 2 oder 3 dargestellt ist, anzuwenden ist. Die Analyseeinrichtung für natürliche Sprache gemäß der Erfin dung kann als eine Sprachanalyseeinheit in verschiedenen An wendungsformen verwendet werden. Die Erfindung ist nicht auf die Anwendungsarten beschränkt, welche hier beschrieben worden sind, sondern es kann auch eine synergetische Wir kung erzeugt werden, wenn die Erfindung in einem maschi nellen Übersetzungssystem verwendet wird. Im allgemeinen ist in maschinellen Übersetzungssystemen das Analyse- Fehlerverhältnis höher als das Übertragungsfehler-Verhält nis. Folglich ist es effizient, die Unterstützung des Be nutzers hinsichtlich der Analyse hervorzuheben. Zusätzlich kann die Qualität der Übersetzungsergebnisse durch Verbessern des Analyse-Verhältnisses verbessert werden, selbst wenn der Benutzer nur eine Kenntnis von der Sprache des Original textes hat und wenig Kenntnis von der Sprache des über setzten Textes.

In der vorstehend beschriebenen Ausführungsform sind die Worte, welche den Gegenstand der Analyse bilden, Wort der englischen Sprache, und die syntaktischen Einheiten sind Worte. Die Erfindung ist jedoch nicht auf Worte als die syntaktischen Einheiten beschränkt, sondern es können auch Wortkombinationen verwendet werden. Außerdem können die syntaktischen Einheiten in Worte wie |go| |ing| aufge teilt werden, welche das Wort |going| sind, nachdem es ge teilt worden ist. Ferner können im Falle der japanischen Sprache Satzteile oder -glieder als die syntaktischen Ein heiten verwendet werden.

Wie aus der vorstehenden Beschreibung zu ersehen ist, können mit der Erfindung die folgenden Wirkungen erzielt werden. Es kann die Häufigkeit einer Unterstützung durch den Benutzer dadurch verringert werden, daß zuerst der Analyse-Schwierig keitsgrad durch das System geschätzt wird, und entsprechend diesem Schwierigkeitsgrad dann die Objekte beschränkt werden, für welche eine Unterstützung durch den Benutzer erforder lich ist. Ferner kann leicht die Wahrscheinlichkeit berech net werden und die Bedienungsperson kann intuitiv Entschei dungen treffen, indem ein Vergleich mit anderen willkürli chen Bewertungen vorgenommen wird. Schließlich können Bewer tungen entsprechend der Knotentypen berechnet werden.

Durch automatisches Verringern der Beanspruchung des Be nutzers entsprechend der Verbesserung des Analyse-Leistungs vermögens der Einrichtung kann die Belastung des Benutzers auf einem konstanten Wert gehalten werden. Ferner kann der Benutzer die Benutzerbeanspruchung auf einem entsprechenden Niveau einstellen. Es kann im Maximum für eine Unterstützung (eine Dialog-Wechselwirkung) verwendet werden. Ferner kann immer garantiert werden, daß eine richtige Antwort in dem Objekt- oder Gegenstands-Kandidaten enthalten ist, mit wel chem der Benutzer befragt wird. Auch kann eine entsprechende Bewertung gegeben werden, indem sich vorherige Analysener gebnisse in der Bewertung widerspiegeln.

Es kann auch die Art der Bewertung verwendet werden, da der Unterschied eine Bedeutung hat (wobei eine der Alternativen verhältnismäßig leichter durchzuführen ist, wenn der Unter schied groß ist), und folglich kann das korrekte Analyse-Ver hältnis für die Beurteilungen des Systems vergrößert wer den, und folglich können korrekte System-Beurteilungen er halten werden.

Indem die Bewertungen in geeignetere Werte gebracht werden, kann das Analyse-Verhältnis erhöht werden und die Belastung für den Benutzer geringer werden. Auch kann für den Be nutzer die Stapel-(Batch)Zeit verkürzt werden. Darüber hinaus kann der Benutzer eine entsprechende Stapelzeit wählen, indem die Benutzungsform entsprechend der Menge an zu analysierenden Sätzen gewählt wird.

Im allgemeinen ist in maschinellen Übersetzungssystemen das unrichtige Analyseverhältnis höher als das unrichtige Übersetzungsverhältnis. Folglich ist es effizient, die Un terstützung bezüglich des Analyseteils zu betonen. Zusätz lich kann auch die Qualität der Übersetzungsergebnisse durch Verbessern des Analyseverhältnisses erhöht werden, selbst wenn der Benutzer nur eine Kenntnis der Sprache der Origi nalsätze und nicht der übersetzten Sätze hat.

Claims

1. Sprachanalyseeinrichtung vom Dialogtyp mit:

a) einer Satzeingabeeinrichtung (1), die der Eingabe eines zu analysierenden Textes in einer Sprache dient, wobei ein Satz des Textes aus syntaktischen Einheiten besteht,
b) einer Wörterbucheinrichtung (4), in der syntaktische Einheiten gespeichert sind, und der Attribute für syntaktische Einheiten entnehmbar sind,
c) einer Grammatikeinrichtung (5), die die für die Sprache des Textes möglichen linguisti schen Beziehungen zwischen syntaktischen Einheiten, denen jeweils ein Attribut zuge ordnet ist, bereitstellt, wobei der Inhalt der Wörterbucheinrichtung (4) und der Gram matikeinrichtung (5) in einem Speicher gespeichert ist,
d) einer Feststelleinrichtung (2), die mittels der Wörterbucheinrichtung den Satz in syntak tische Einheiten aufteilt und für jede syntaktische Einheit mögliche Attribute feststellt und mittels der Grammatikeinrichtung anhand der als möglich erkannten Attribute alle möglichen linguistischen Beziehungen zwischen den Attributen, die jeweils einer syn taktischen Einheit zugeordnet sind, feststellt, wobei jede auf diese Weise festgestellte mögliche linguistische Beziehung zwischen den syntaktischen Einheiten des Satzes eine Kandidatenbeziehung darstellt, die möglicherweise korrekt ist, und
e) einer Dialog-Auswahleinrichtung (9) mit der im Dialog mit einem Benutzer, wenn für eine syntaktische Einheit mehr als eine Kandidatenbeziehung möglich ist, eine korrekte Beziehung aus den Kandidatenbeziehungen ausgewählt werden kann,

gekennzeichnet durch

a) einen Bewertungsblock (8), der die Kandidatenbeziehungen dahingehend bewertet, ob sie eine höhere oder geringere Wahrscheinlichkeit haben, korrekt zu sein, und durch
b) eine Bevorzugungs-Analyseeinrichtung (10), die, wenn für mehrere Kandidatenbezie hungen keine klärende Auswahl durch die Dialog-Auswahleinrichtung getroffen wurde, die durch den Bewertungsblock als wahrscheinlichste bewertete Kandidatenbeziehung als korrekt auswählt.

2. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 1, dadurch gekennzeichnet, dass die Wahrscheinlichkeit, dass eine Kandidatenbeziehung korrekt ist, unter Rückgriff auf die gespeicherten vorangegangenen Dialogauswählvorgänge und deren statistische Auswertung bestimmt wird.

3. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 2 oder 1, dadurch gekenn zeichnet, dass jeder syntaktischen Einheit eines Paars von syntaktischen Einheiten ein mögli ches Attribut zugeordnet wird und eine mögliche linguistische Beziehung diesem Paar zugeord net wird, um so eine Kandidatenbeziehung zu bilden, wobei die Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, dadurch bestimmt wird, dass die Wahrscheinlichkeit bestimmt wird, dass eine syntaktische Einheit des Paares die andere syntaktische Einheit des Paares durch die linguistische Beziehung modifiziert.

4. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 3, dadurch gekennzeichnet, dass die Wahrscheinlichkeit bestimmt wird, indem jeder syntaktischen Einheit des Paares eine statistische Wahrscheinlichkeit zugewiesen wird, mit der das für sie ausgewählte Attribut korrekt ist, und der linguistischen Beziehung eine statistische Wahrscheinlichkeit zugewiesen wird, mit der diese korrekt ist, wobei zur Bestimmung der Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, die drei Wahrscheinlichkeiten miteinander multipliziert werden.

5. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 4, dadurch gekennzeichnet, dass nur die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, für die Bestim mung der Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, verwendet wird, wobei die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, mit Hilfe der gespeicherten Anzahl, wie häufig sie angewendet wurde, und der gespeicherten Anzahl wie häufig sie durch die Dialog-Auswahleinrichtung als korrekt bestimmt wurde, statistisch berech net wird.

6. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 1 bis Anspruch 5, gekenn zeichnet durch einen Beschränkungsanwendungsblock (7), der nach der Bestimmung einer Kandidatenbeziehung als korrekt, die zu der korrekten Kandidatenbeziehung exklusiven Kandidatenbeziehungen, die dann nicht korrekt sein können, aussortiert.

7. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 6, dadurch gekennzeichnet, dass die verbliebenen, nicht aussortierten Kandidatenbeziehungen erneut bewertet werden.

8. Sprachanalyseeinrichtung vom Dialogtyp nach den Ansprüchen 1 bis 7, dadurch gekennzeichnet, dass, wenn eine vorbestimmte Anzahl von Dialog-Auswahlvorgängen über schritten wird, die verbliebenen, noch zu klärenden Kandidatenbeziehungen durch die Bevorzu gungs-Analyseeinrichtung ausgewählt werden.

9. Sprachanalyseeinrichtung vom Dialogtyp nach den Ansprüchen 1 bis 8, gekennzeichnet durch eine erste Gruppenbildungseinrichtung, die zueinander exklusiven Kandidatenbeziehun gen, von denen nur eine korrekt sein kann, in einer Gruppe zusammenfasst.

10. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 9, dadurch gekennzeichnet, dass diejenige Gruppe mit dem größten Wahrscheinlichkeitsunterschied zwischen der wahr scheinlichsten Kandidatenbeziehung und der zweit-wahrscheinlichsten Kandidatenbeziehung untersucht wird, ob der Wahrscheinlichkeitsunterschied unter einer vorbestimmten Konstante liegt, und wenn dies der Fall ist, so wird die Gruppe zur Entscheidung durch den Benutzer der Dialog-Auswahleinrichtung zugeführt, so dass der Benutzer die korrekte Beziehung auswählen kann, aber ist dies nicht der Fall, so wird eine korrekte Kandidatenbeziehung durch die Bevor zugungs-Analyseeinrichtung ausgewählt.

11. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 10, gekennzeichnet durch eine zweite Gruppenbildungseinrichtung, die diejenigen Kandidatenbeziehungen, die nicht mittels der Dialog-Auswahleinrichtung als korrekt oder unkorrekt erkannt wurden, in Gruppen zusam menfasst, wobei in jeder Gruppe nur eine Kandidatenbeziehung korrekt sein kann, wobei durch die Bevorzugungs-Analyseeinrichtung aus der Gruppe mit dem größten Bewertungsunterschied zwischen den wahrscheinlichsten und zweit-wahrscheinlichsten Kandidatenbeziehung, diejenige Kandidatenbeziehung als korrekt ausgewählt wird, die mit der größten Wahrscheinlichkeit bewertet wurde.

12. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 10, gekennzeichnet durch eine dritte Gruppenbildungseinrichtung, die die mittels der durch die Dialog-Auswahleinrichtung als korrekt oder unkorrekt erkannten Kandidatenbeziehungen in Gruppen zusammenfasst, wobei die Kandidatenbeziehungen einer Gruppe sich einander nicht ausschließen, so dass, wenn eine Kandidatenbeziehung der Gruppe korrekt ist, alle Kandidatenbeziehungen der Gruppe korrekt sind, wobei die Bevorzugungs-Analyseeinrichtung diejenige Gruppe als korrekt auswählt, bei der die Summe der Wahrscheinlichkeiten der Kandidatenbeziehungen der Gruppe am höchsten ist.

13. Sprachanalyseeinrichtung nach einem der vorhergehenden Ansprüche, dadurch gekenn zeichnet, dass eine syntaktische Einheit ein Wort, eine Gruppe von Wörtern, eine Wortwurzel oder eine Wortendung oder ein Wortpräfix oder ein Satzteil oder ein Satzglied ist.

14. Sprachanalyseeinrichtung nach einem der vorhergehenden Ansprüche, dadurch gekenn zeichnet, dass die syntaktischen Einheiten Wörter sind, und die Attribute Wortarten sind.

15. Sprachanalyseeinrichtung nach einem der vorhergehenden Ansprüche, dadurch gekenn zeichnet, dass die linguistischen Beziehungen Grammatikregeln sind, die die Beziehungen zwischen Wörtern einer bestimmten Wortart betreffen.

16. Sprachanalyseverfahren vom Dialogtyp, das mittels Hard- und Software durchgeführt wird, mit:

a) einem Satzeingabeschritt, der der Eingabe eines zu analysierenden Textes in einer Sprache dient, wobei ein Satz des Textes aus syntaktischen Einheiten besteht,
b) einem Wörterbuchschritt, bei dem aus einem gespeicherten Wörterbuch, in dem syntak tische Einheiten gespeichert sind, Attribute für syntaktische Einheiten entnommen wer den,
c) einem Grammatikschritt, bei dem auf gespeicherte, für die Sprache des Textes mögliche linguistische Beziehungen zwischen syntaktischen Einheiten, denen jeweils ein Attribut zugeordnet ist, zugegriffen wird,
d) einem Feststellschritt, bei dem mittels des Wörterbuchschrittes der Satz in syntaktische Einheiten aufgeteilt wird und für jede syntaktische Einheit mögliche Attribute festge stellt werden und mittels des Grammatikschrittes anhand der als möglich erkannten Att ribute alle möglichen linguistischen Beziehungen zwischen den Attributen, die jeweils einer syntaktischen Einheit zugeordnet sind, festgestellt werden, wobei jede auf diese Weise festgestellte mögliche linguistische Beziehung zwischen den syntaktischen Ein heiten des Satzes eine Kandidatenbeziehung darstellt, die möglicherweise korrekt ist, und
e) einem Dialog-Auswahlschritt, bei dem im Dialog mit einem Benutzer, wenn für eine syntaktische Einheit mehr als eine Kandidatenbeziehung möglich ist, eine korrekte Be ziehung aus den Kandidatenbeziehungen über eine Eingabeeinheit ausgewählt werden kann,

gekennzeichnet durch

a) einen Bewertungsschritt, der die Kandidatenbeziehungen dahingehend bewertet, ob sie eine höhere oder geringere Wahrscheinlichkeit haben, korrekt zu sein, und durch
b) einen Bevorzugungs-Analyseschritt, bei dem, wenn für mehrere Kandidatenbeziehungen keine klärende Auswahl durch die Dialog-Auswahleinrichtung getroffen wurde, die durch den Bewertungsschritt als wahrscheinlichste bewertete Kandidatenbeziehung als korrekt ausgewählt wird.

17. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 16, dadurch gekennzeichnet, dass die Wahrscheinlichkeit, dass eine Kandidatenbeziehung korrekt ist, unter Rückgriff auf die gespeicherten vorangegangenen Dialogauswählvorgänge und deren statische Auswertung bestimmt wird.

18. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 16 oder 17, dadurch gekenn zeichnet, dass jeder syntaktischen Einheit eines Paars von syntaktischen Einheiten ein mögli ches Attribut zugeordnet wird und eine mögliche linguistische Beziehung diesem Paar zugeord net wird, um so eine Kandidatenbeziehung zu bilden, wobei die Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, dadurch bestimmt wird, dass die Wahrscheinlichkeit bestimmt wird, dass eine syntaktische Einheit des Paares die andere syntaktische Einheit des Paares durch die linguistische Beziehung modifiziert.

19. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 18, dadurch gekennzeichnet, dass die Wahrscheinlichkeit bestimmt wird, indem jeder syntaktischen Einheit des Paares eine statistische Wahrscheinlichkeit zugewiesen wird, mit der das für sie ausgewählte Attribut korrekt ist, und der linguistischen Beziehung eine statistische Wahrscheinlichkeit zugewiesen wird, mit der diese korrekt ist, wobei zur Bestimmung der Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, die drei Wahrscheinlichkeiten miteinander multipliziert werden.

20. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 19, dadurch gekennzeichnet, dass nur die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, für die Bestim mung der Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, verwendet wird, wobei die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, mit Hilfe der gespeicherten Anzahl, wie häufig sie angewendet wurde, und der gespeicherten Anzahl wie häufig sie durch den Dialog-Auswahlschritt als korrekt bestimmt wurde, statistisch berechnet wird.

21. Sprachanalyseverfahren vom Dialogtyp nach den Ansprüchen 16 bis 20, gekennzeichnet durch einen Beschränkungsanwendungsschritt (7), der nach der Bestimmung einer Kandidaten beziehung als korrekt, die zu der korrekten Kandidatenbeziehung exklusiven Kandidatenbezie hungen, die dann nicht korrekt sein können, aussortiert.

22. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 21, dadurch gekennzeichnet, dass die verbliebenen, nicht aussortierten Kandidatenbeziehungen erneut bewertet werden.

23. Sprachanalyseverfahren vom Dialogtyp nach den Ansprüchen 16 bis 22, dadurch gekennzeichnet, dass, wenn eine vorbestimmte Anzahl von Dialog-Auswahlvorgängen über schritten wird, die verbliebenen, noch zu klärenden Kandidatenbeziehungen durch den Bevor zugungs-Analyseschritt ausgewählt werden.

24. Sprachanalyseverfahren vom Dialogtyp nach den Ansprüchen 16 bis 23, gekennzeichnet durch einen ersten Gruppenbildungsschritt, der zueinander exklusiven Kandidatenbeziehungen, von denen nur eine korrekt sein kann, in einer Gruppe zusammenfasst.

25. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 24, dadurch gekennzeichnet, dass diejenige Gruppe mit dem größten Wahrscheinlichkeitsunterschied zwischen der wahr scheinlichsten Kandidatenbeziehung und der zweit-wahrscheinlichsten Kandidatenbeziehung untersucht wird, ob der Wahrscheinlichkeitsunterschied unter einer vorbestimmten Konstante liegt, und wenn dies der Fall ist, so wird die Gruppe zur Entscheidung durch den Benutzer im Dialog-Auswahlschritt zugeführt, so dass der Benutzer die korrekte Beziehung auswählen kann, aber ist dies nicht der Fall, so wird eine korrekte Kandidatenbeziehung durch den Bevorzu gungs-Analyseschritt ausgewählt.

26. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 25, gekennzeichnet durch einen zweiten Gruppenbildungsschritt, der diejenigen Kandidatenbeziehungen, die nicht mittels dem Dialog-Auswahlschritt als korrekt oder unkorrekt erkannt wurden, in Gruppen zusammenfasst, wobei in jeder Gruppe nur eine Kandidatenbeziehung korrekt sein kann, wobei durch den Bevorzugungs-Analyseschritt aus der Gruppe mit dem größten Bewertungsunterschied zwischen den wahrscheinlichsten und zweit-wahrscheinlichsten Kandidatenbeziehung, diejenige Kandi datenbeziehung als korrekt ausgewählt wird, die mit der größten Wahrscheinlichkeit bewertet wurde.

27. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 25, gekennzeichnet durch einen dritten Gruppenbildungsschritt, der die mittels der durch die Dialog-Auswahleinrichtung als korrekt oder unkorrekt erkannten Kandidatenbeziehungen in Gruppen zusammenfasst, wobei die Kandidatenbeziehungen einer Gruppe sich einander nicht ausschließen, so dass, wenn eine Kandidatenbeziehung der Gruppe korrekt ist, alle Kandidatenbeziehungen der Gruppe korrekt sind, wobei die Bevorzugungs-Analyseeinrichtung diejenige Gruppe als korrekt auswählt, bei der die Summe der Wahrscheinlichkeiten der Kandidatenbeziehungen der Gruppe am höchsten ist.

28. Sprachanalyseverfahren nach Anspruch 16 bis 27, dadurch gekennzeichnet, dass eine syntaktische Einheit ein Wort, eine Gruppe von Wörtern, eine Wortwurzel oder eine Worten dung oder ein Wortpräfix oder ein Satzteil oder ein Satzglied ist.

29. Sprachanalyseverfahren nach Anspruch 16 bis 28, dadurch gekennzeichnet, dass die syntaktischen Einheiten Wörter sind, und die Attribute Wortarten sind.

30. Sprachanalyseverfahren nach Anspruch 16 bis 29, dadurch gekennzeichnet, dass die linguistischen Beziehungen Grammatikregeln sind, die die Beziehungen zwischen Wörtern einer bestimmten Wortart betreffen.

31. Programm, das, wenn es auf einem Computer läuft oder in einem Computer geladen wird, den Computer veranlasst, das Verfahren nach einem der Ansprüche 16 bis 27 durchzu führen.