DE4015905C2 - Sprachanalyseeinrichtung, -verfahren und -programm - Google Patents

Sprachanalyseeinrichtung, -verfahren und -programm

Info

Publication number
DE4015905C2
DE4015905C2 DE4015905A DE4015905A DE4015905C2 DE 4015905 C2 DE4015905 C2 DE 4015905C2 DE 4015905 A DE4015905 A DE 4015905A DE 4015905 A DE4015905 A DE 4015905A DE 4015905 C2 DE4015905 C2 DE 4015905C2
Authority
DE
Germany
Prior art keywords
correct
relationship
candidate
relationships
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE4015905A
Other languages
English (en)
Other versions
DE4015905A1 (de
Inventor
Hideo Ito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of DE4015905A1 publication Critical patent/DE4015905A1/de
Application granted granted Critical
Publication of DE4015905C2 publication Critical patent/DE4015905C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks

Description

Die Erfindung betrifft eine Sprachanalyseeinrichtung (im folgenden auch "Dialog- Analyseeinrichtung" oder "Dialog-Analysesystem" genannt), welche insbesondere bei einer maschinellen Übersetzungseinrichtung, einem Dialogsystem für natürliche Sprache u. a. anwendbar ist.
Das in der japanischen Patentanmeldung Nr. 140 582-1984 (JP 59-140 582 A) beschriebene "National- Sprachen-Übersetzungs-Stützungssystem" bezieht sich auf ein maschinelles Übersetzungssystem, welches Information liefert, um den Übersetzungsprozess vor der Durchführung einer Syntax-Analyse zu unterstützen. Dieses System verwendet Information, welche vorgesehen ist, um eingegebene Sätze zu übersetzen. In einem solchen maschinellen Übersetzungssystem ist die Information, welche der Benutzer zu liefern hat, entsprechend dem eingegebenen Satz verschieden. Folglich muss der Benutzer verstehen, welche Art Information vorzusehen und zu liefern ist, und muss sie dann auswählen. Dies stellt eine große Belastung für den Benutzer dar. Diese Art eines maschinellen Übersetzungssystems wird als ein "redaktionelles Vorbearbeitungs"-System bezeichnet.
Die in der japanischen Patentanmeldung Nr. 101 365-1983 (JP 58-101 365 A) beschriebene "Text-Anzeige- und Korrektureinrichtung in einem maschinellen Übersetzungssystem" bezieht sich auf ein maschinelles Übersetzungssystem, in welchem der Satz zuerst erzeugt wird, und der eingegebene Originalsatz und der entsprechende übersetzte Satz von dem Benutzer in vorherbe­ stimmten Einheiten verglichen werden, und der Benutzer dann den übersetzten Satz in diesen Einheiten korrigiert.
Außerdem wird in dem "maschinellen Übersetzungssystem", das in der japanischen Patentanmeldung Nr. 271 060-1986 (JP 62-271 060 A) beschrie­ ben ist, der übersetzte Satz, welcher dem eingegebenen Ori­ ginalsatz entspricht, zuerst erzeugt, und wenn der Benutzer einen anderen übersetzten Satz anfordert, wird eine Rück­ übersetzung mit Hilfe des einen Kandidaten aus einem Satz syntaktischer Kandidatenbeziehungen durchgeführt, welche ver­ wendet werden könnten, und welche die höchste Wahrschein­ lichkeit (Auswertungsmenge) haben, richtig zu sein. Ferner ist in der vorstehend angeführten japanischen Patentanmel­ dung Nr. 271 060-1986 auch ein "maschinelles Übersetzungs­ system" beschrieben. In diesem Übersetzungssystem wird der übersetzte Satz, welcher dem eingegebenen Originalsatz ent­ spricht, zuerst vorgesehen, und wenn der Benutzer entschei­ det, daß ein Fehler in diesem übersetzten Satz vorhanden ist, bestimmt der Benutzer die Modifizierklausel des eingegebe­ nen Originalsatzes, und es werden modifizierte Kandidaten- Klauseln vorgesehen. Dann wählt und bestimmt der Benutzer die modifizierte Kandidatenklausel, welche am geeignesten ist, aus einer Liste modifizierter Klauseln aus, welche für den Benutzer vorgesehen sind. Bei diesem System wird eine Rückübersetzung mit Hilfe der modifizierten Klausel durchge­ führt, welche entsprechend der Modifizier-Klausel des einge­ benen Originalsatzes spezifiziert wurde. Diese maschinellen Übersetzungssysteme werden als "nachträgliche Bearbeitungs"- Systeme bezeichnet.
In solchen "nachträglichen Bearbeitungs-"Systeme ist es schwierig, eine vollständige, automatische Analyse mit Hilfe der derzeit akuellen Technik durchzuführen. Folglich muß der Benutzer jeweils eine Entscheidung treffen, ob der mittels des Systems übersetzte Satz richtig oder unrichtig ist, und muß die Korrektur des übersetzten Satzes durchführen, wenn er falsch ist. Diese Arbeit stellt für den Benutzer ein großes Arbeitspensum dar.
Bei dem in der japanischen Patentanmeldung Nr. 18 073-1986 (JP 61-18 073 A) beschriebenen "Korrektur-Verfahren" wird ein Analyse-Baum­ graph als Ergebnis einer Analyse des eingegebenen Original­ satzes dargestellt, und der Benutzer verwendet dann Grund­ befehle, um den Analyse-Baumgraphen zu korrigieren, welcher dargestellt wird.
Außerdem drückt in dem "Steuerverfahren für eine Anzeige und Korrektur von syntaktischen Analyseergebnissen", wel­ ches in der japanischen Patentanmeldung Nr. 278 970-1986 (JP 61-278 970 A) beschrieben ist, das System einen Analyse-Baumgraphen in einem kleinen Raumbereich als das Analyseergebnis des ein­ gegebenen Satzes aus, und das System erhält dann Korrektu­ ren, welche der Benutzer an diesem Analyse-Baumgraphen vor­ nimmt. Diese Art von Systeme werden als "Zwischen-Aufberei­ tungs-"Systeme bezeichnet.
In solchen "Zwischen-Aufbereitungs-"Systemen ist die Bedeu­ tung der Analyseergebnisse, wie beispielsweise eines Ana­ lyse-Baumgraphen u. ä., für einen Durchschnittsbenutzer, wel­ cher den Mechanismus des Betriebs nicht versteht, schwierig zu verstehen. Außerdem muß der Benutzer nicht nur die Korrek­ tur einer Fehleranalyse durchführen, sondern er muß auch die Richtigkeit oder Unrichtigkeit von korrekten Analyse-Ergeb­ nisse beurteilen. Dies stellt eine große Belastung für den Benutzer dar. Das "menschliche Interventionsverfahren für Fragen unbestimmbarer Bedeutung in einer maschinellen Über­ setzung", wie es in der japanischen Patentanmeldung Nr. 132 270-1092 (JP 57-132 270 A) beschrieben ist, betrifft ein maschinelles Über­ setzungssystem. In diesem maschinellen Übersetzungssystem werden syntaktische Strukturen, für welche die Bedeutung nicht bestimmt werden kann, angezeigt, und es wird dem Be­ nutzer Information dargestellt, um die Bedeutung zu bestim­ men, und die gegebene Information wird dann für die Übersetzung verwendet. Eine solche Art eines maschinellen Über­ setzungssystems wird als ein maschinelles "Dialog"-Über­ setzungssystem bezeichnet. Wenn viele Sätze übersetzt wer­ den müssen, wird die Anzahl an Bedeutungen, welche nicht be­ stimmt werden kann, ziemlich groß, und das Versorgen des Be­ nutzers mit Information, die erforderlich ist, um die Be­ deutung zu bestimmen, ist unter praktischen Gesichtspunkten unrealistisch. Folglich sollte die Menge an unbestimmbaren Bedeutungen berücksichtigt werden, und es sollte die syntak­ tische Struktur, welche Information von dem Benutzer erfor­ dert, ausgewählt werden.
Ferner betrifft das "Übersetzungsverfahren", welches in den japanischen Patentanmeldungen Nr. 80 362-1986 (JP 61-80 362 A) und Nr. 90 269- 1986 (JP 61-90 269 A) beschrieben ist, maschinelle Übersetzungssysteme. In diesen maschinellen Übersetzungssystemen wird die Syntax des eingegebenen Originalsatzes durchgeführt, und die Beziehun­ gen für die Strukturelemente, welche die Analyseergebnisse bilden, werden dem Benutzer präsentiert. Der Benutzer über­ prüft dann diese Analyseergebnisse, und wenn der Benutzer entscheidet, daß eine Beziehung unrichtig ist, spezifiziert der Benutzer eine richtige Beziehung, und das System führt dann entsprechend dieser Spezifikation eine Rückübersetzung durch.
Wenn viele Sätze zu übersetzen sind, wird die Anzahl Bezie­ hungen für die Strukturelemente so groß, daß es unter prak­ tischen Gesichtspunkten für den Benutzer nicht mehr länger realistisch ist, über die Richtigkeit oder Unrichtigkeit aller dieser Beziehungen zu entscheiden. Folglich sollte die Anzahl Entscheidungen, welche der Benutzer zu treffen hat, nur auf vage Beziehungen und unklare Teile u. ä. beschränt werden.
Die in der japanischen Patentanmeldung Nr. 290 976-1986 (JP 62-290 976 A) beschriebene "Übersetzungs-Stützeinrichtung" betrifft eben­ falls ein maschinelles Übersetzungssystem. Wenn in dem Pro­ zeß, bei welchem der eingegebene Originalsatz analysiert wird, einen vagen oder unklaren Teil erzeugt, wird eine Frage und Antwort zwischen dem Benutzer und dem System ge­ wechselt, und die dabei erhaltene Information wird verwen­ det, um mit der Analyse fortzufahren. In einem solchen Fall ist dann die Belastung des Benutzers geringer, wenn der Be­ nutzer in einer leicht zu verstehenden Weise und entsprechend der Art und dem Inhalt eines vagen oder unklaren Teils ge­ fragt wird, so daß der Benutzer schnell antworten kann.
Wenn viele Sätze zu übersetzen sind, nimmt die Anzahl die­ ser vagen oder unklaren Teile beträchtlich zu, und es ist eine große Belastung für den Benutzer, für alle diese Teile entsprechende Entscheidungen zu treffen. Folglich sollte die Befragung nur für die Einzelheiten durchgeführt werden, für welche ein großer Unbestimmtheitsgrad oder fehlende Klarheit vorliegt.
Ferner betrifft das "Detektions- oder Feststellverfahren für vage Modifizier-Beziehungen", welches in der japanischen Patentanmeldung Nr. 98 072-1988 (JP 63-98 072 A) beschrieben ist, ein Dialog- System für natürliche Sprache. In diesem System wird eine Analyse für den fraglichen Satz durchgeführt, es werden vage Modifizier-Beziehungen festgestellt, und alle möglichen Modi­ fizier-Beziehungen werden dem Benutzer präsentiert, welcher dann eine Auswahl trifft. Dann wird die Modifizier-Bezie­ hung, welche von dem Benutzer gewählt wird, dazu verwendet, eine korrekte Analyse durchzuführen. Die vage Modifizier-Be­ ziehung wird mit Hilfe von vagen Modifizier-Mustern bestimmt, welche in dem System gespeichert werden.
Wenn eine große Anzahl Sätze zu übersetzen ist, wird die An­ zahl an solchen vagen Modifizier-Beziehungen ziemlich groß, und es wird eine große Belastung für den Benutzer, für alle diese Beziehungen Entscheidungen zu treffen. Außerdem gibt es viele Arten von Unbestimmtheiten, welche ein Satz haben kann, und es ist schwierig, Muster für alle diese Arten von Beziehungen zu haben.
Aus "automatische Spracheingabe und Sprachausgabe" von Klaus Sieckert erschienen im Verlag Markt & Technik, Seiten 367 bis 390, ist die Erkennung von Wortketten mit Syntax bekannt. Die dort beschriebene Erkennung betrifft insbesondere die akustische Kennung, die durch Einschränkung der denkbaren Wortkombinationen deutlich verbessert werden soll.
Aus DE 37 23 078 A1 ist ein Verfahren zur Erkennung von zusammenhängend gesprochenen Wörtern bekannt. Diese Druckschrift bezieht sich auf die Analyse gesprochener Sprache. Zur Erkennung von Worten in der gesprochenen Sprache werden Audiosprachsignale mit gespeicherten Audioreferenzwerten verglichen.
Aus DE 37 33 674 A1 ist ein Sprachanalysator bekannt. Dieser erlaubt die Erkennung von Wortkombinationen und Sätzen.
Aus EP 0 118 187 A1 ist ein System zum Verstehen natürlicher Sprache bekannt, das Menü basiert ist. Dieses System stellt ein Hilfesystem zum Programmieren von Computern dar. Die Computerbefehle werden in natürlicher Sprache eingegeben und das System schlägt alle Möglichkeiten für Wörter vor, die bei einer gegebenen Situation noch im Einklang mit den strikten Vorgaben einer Programmiersprache gebracht werden können.
Die Technik für eine Sprachanalayse ist noch nicht ausge­ reift, und eine vollständige und automatische Analyse ist schwierig zu haben. Es gibt grundsätzlich zwei Methoden zur Lösung dieses Problems. Bei der einen Methode wird (1) die Anzahl von Analyseobjekten begrenzt, und bei der zweiten Methode wird (2) der Analyse-Automatisierungsgrad begrenzt. Die Erfindung betrifft die zuletzt angegebene Methode. Zum Begrenzen des Automatisierungsgrades gibt es wieder vier Verfahren, welche für die jeweiligen Arten von Übersetzungs­ verfahren die folgenden sind:
  • 1. (2)-1 Eine vorherige Aufbereitung oder Redigierung: In die­ sem Fall führt der Benutzer eine vorherige Aufbereitung oder Redigierung für die Originalsätze durch, um sie dadurch in eine Form zu bringen, in welcher sie von dem System analy­ siert werden kann.
  • 2. (2)-2 Nachträgliche Aufbereitung: In einem Prozeß, welcher maschinelle Übersetzungs- und Sprachanalyseergebnisse be­ nutzt, hat der Benutzer für eine Verarbeitung die endgül­ tigen Ergebnisse des Systems zu korrigieren.
  • 3. (2)-3 Bei einer Zwischen-Aufbereitung hat der Benutzer eine Korrektur der Sprachergebnisse des Systems selbst durchzu­ führen.
  • 4. (2)-4 Bei einem Dialog-System hat der Benutzer die Analyse zu kooperieren und durchzuführen.
Die vorliegende Erfindung bezieht sich auf diese vierte Me­ thode. Die Schwierigkeit bei der Methode (1) besteht darin, daß es schwierig ist, zu bestätigen, ob der Originalsatz, welcher zu analysieren ist, in den Grenzbereichen liegt oder nicht. Die Schwierigkeiten bei (2)-1 bis (2)-3 sind vorste­ hend bereits beschrieben, und diese Schwierigkeit ist nicht bei (2)-4 anzutreffen. Die Schwierigkeiten mit der herkömm­ lichen Technologie für (2)-4 sind bereits beschrieben worden, jedoch ist die übliche Schwierigkeit die, daß "die Gesamtan­ zahl an Teilen, welche von dem System nicht bestimmt werden können, größer wird, wenn viele Sätze zu übersetzen sind". Es ist unrealistisch, daß ein Benutzer dies alles aushält.
Aufgabe der Erfindung ist es eine Sprachanalyseeinrichtung bereitzustellen, die schnell und effektiv die Sprache unter Einsatz technischer Mittel analysiert. Weiter soll ein entsprechendes Verfahren geschaffen werden und ein Programm, das ein derartiges Verfahren ausführt.
Vorstehende Aufgabe wird durch die Gegenstände der Ansprüche 1, 16 und 31 gelöst. Vorteilhafte Weiterbildungen gehen aus den Unteransprüchen hervor.
Vorteilhaft wird eine Dialog-Analyseeinrichtung für natürliche Sprache geschaffen, bei welcher die Nachteile des vorerwähnten Systems, Verfahrens und der Einrichtungen beseitigt sind. Vorteilhaft wird ein Dialog-Analysesystem für natürliche Sprache geschaffen, bei welchem die Häufigkeit einer Unterstützung durch den Benutzer dadurch verringert wird, dass der Analyse-Schwierigkeitsgrad von dem System geschätzt wird, und entsprechend diesem Schwierigkeitsgrad die Objekte oder Gegenstände begrenzt werden, bei welchen eine Unterstützung durch den Benutzer erforderlich wird. Außerdem ist eine Unterstützung seitens des Benutzers ohne Bedeutung, wenn nicht die korrekte Analyse- Auslegungsrate verbessert wird. Das heißt, sollten Analyseergebnisse dieselben sein, wie diejenigen, welche aufgrund einer Beurteilung von dem System selbst durchgeführt worden sind und ohne eine Unterstützung seitens des Benutzers erhalten würden, dann würde irgendeine Unterstützung seitens des Benutzers sinnlos sein. Ein weiteres Ziel der Erfindung ist es daher, ein Dialog-Analyse-System für natürliche Sprache zu schaffen, bei welchem eine Verbesserung in einem Analyseverhältnis, das durch eine Unterstützung seitens des Benutzers erhalten worden ist, immer maximal wird, so dass die Anzahl an solchen sinnlosen Unterstützungen verringert werden kann.
Außerdem ist es nicht notwendigerweise richtig, das der Analyse-Nutzeffekt eines Systems konstant ist. Er kann mit Hilfe von Wörterbuch-Regeln und Grammatik verbessert werden. Ein drittes Ziel der Erfindung ist es daher, ein Dialog-Analyse-System für natürliche Sprache zu schaffen, bei welchem die Analyseleistung verbessert wird, und gleichzeitig die Belastung für den Benutzer leichter gemacht wird, so dass die Belastung des Benutzers auf einem entsprechenden Wert gehalten wird.
Obwohl es wünschenswert ist, dass das Analyseverhältnis 100% ist, ist dies nicht unbedingt notwendig. Wenn beispielsweise die erfindungsgemäße Einrichtung in einem Übersetzungssystem verwendet wird, ergeben sich keine Schwierigkeiten, wenn das Analyse-Verhältnis etwa 80% ist. Ein weiteres Ziel der Erfindung ist es daher, ein Dialog- Analysesystem für natürliche Sprache zu schaffen, welches die Anzahl Mal steuern kann, bei welchen eine Unterstützung von dem Benutzer erforderlich ist, so dass in Übereinstimmung mit dem von dem Benutzer geforderten Analyse-Verhältnis liegt, und folglich der Benutzer die Benutzer-Belastung entsprechend einstellen kann. Bei dem erfindungsgemäßen Dialog-Analogsystem für natürliche Sprache ist dies dadurch erreicht, dass die Dialog-Einrichtung eine Bestimmungseinrichtung aufweist, um die Anzahl Mal der Dialog-Wechselwirkung mit dem Benutzer festzustellen und zu bestimmen.
Nachfolgend wird die Erfindung anhand von bevorzugten Ausführungsformen unter Bezugnahme auf die anliegenden Zeichnungen im einzelnen dargestellt. Es zeigen:
Fig. 1 ein Blockdiagramm, anhand welchem eine Ausführungsform einer Dialog- Analyseeinrichtung für natürliche Sprache gemäß der Erfindung beschrieben wird;
Fig. 2 ein Flussdiagramm, anhand welchem die Arbeitsweise einer Dialog- Analyseeinrichtung für natürliche Sprache gemäß der Erfindung beschrieben wird;
Fig. 3 ein Flussdiagramm, welches die Arbeitsweise einer anderen Ausführungsform eines Dialog-Analysesystems für natürliche Sprache gemäß der Erfindung wiedergibt, und
Fig. 4 ein Flußdiagramm der Arbeitsweise noch einer wei­ teren Ausführungsform einer Dialog-Analyseeinrich­ tung für natürliche Sprache gemäß der Erfindung.
Nachstehend wird eine Grundkonfiguration eines Dialog- Analysesystems für natürliche Sprache gemäß der Er­ findung beschrieben. Über eine Eingabeeinheit 1 wird die Information des eingegebenen Originalsatzes eingegeben, um eine Sprachanalyse durchzuführen. Diese Eingabeeinheit 1 weist beispielsweise eine Tastatur und einen optischen Zei­ chenleser (OCR) auf. Eine Verarbeitungseinheit 100 weist als Funktionsblöcke einen Feststellblock 2 für alle Bezie­ hungen, einen Feststellblock 6 für bestimmte Beziehungen, einen Beschränkungs-Anwendungsblock 7, einen Auswerteblock 8, einen Dialogblock 9 und einen Bevorzugungsblock 10 auf. Die Verarbeitungseinheit 100 ist im allgemeinen aus Rechner­ einheiten gebildet, und jeder der vorstehend beschriebenen Funktionsblöcke ist durch Rechner-Hardware und -Software realisiert. Ein Wörterbuch 4 enthält Teile von Sprachwörtern, Idioms und Satz(teil)-Bedeutungen. Eine Grammatik 5 hat die Modifizier-(Verbindungs-)Beziehungen für jedes der Worte, der Wortkombinationen und Satz(teile), usw. Das Wörterbuch 4 und die Grammatik 5 sind durch einen Speicher gebildet, und die Information des vorstehend beschriebenen Wörterbuchs und der Grammatik sind in dem Speicher gespeichert. Eine Be­ ziehungs-Speichereinheit 3 speichert die Modifizier-Bezie­ hung für jedes der Worte, Idioms und Satzteile u. ä., welche durch die Bearbeitung der Verarbeitungseinheit 100 erhalten worden sind. Diese Beziehungs-Speichereinheit 3 ist durch einen Speicher gebildet. Die Information für die Modifizier- Beziehung, welche in dieser Beziehungs-Speichereinheit 3 gespeichert ist, wird für maschinelle Übersetzung u. ä. ver­ wendet. Eine Anzeigeeinheit 11 weist ein CRT-Display und eine LCD-Display-Einheit u. ä. auf. Diese Anzeigeinheit 11 stellt die Ergebnisse der verschiedenen Verarbeitungsarten dar, welche von der Verarbeitungseinheit 100 durchgeführt worden sind. Außerdem ist die Eingabeeinheit 1 auch ein Dialog-Interface für den Benutzer. Der Benutzer liefert von der Eingabeeinheit 1 aus notwendige Information an die Verarbeitungseinheit 100.
Die spezifische Verarbeitung für jeden der Blöcke in der Verarbeitungseinheit 100 wird später beschrieben. Im fol­ genden wird die Arbeitsweise einer Dialog-Analyseeinheit für natürliche Sprache, welche die vorstehend beschriebene Konfiguration hat, anhand des in Fig. 2 dargestellten Fluß­ diagramms beschrieben.
Ein Benutzer gibt beispielsweise von der Eingabeeinheit 1 den folgenden englischen Satz ein:
"Zeit verfliegt heute wie ein Pfeil".
Wenn dies eingegeben wird, wird beim Schritt 101 eine Ver­ arbeitung mittels des Feststellblocks 2 für alle Beziehun­ gen durchgeführt. Der Block 2 teilt den von der Eingabeein­ heit 1 aus eingegebenen Originalsatz in eine Anzahl Worte auf. In diesem Fall sind es von den syntaktischen Einheiten des Satzes her sechs Worte. Diese Worte sind "Zeit", "ver­ fliegt", "heute", "wie", "ein" und "Pfeil". Diese Worte sind Knoten. Dann liefert der Feststellblock 2 passende Wort-Vo­ kabular-Informationen, welche in dem Wörterbuch 4 gespeichert ist. Für jedes Wort wird beispielsweise die Vokabular-Infor­ mation gegeben, welche in Tabelle 1 dargestellt ist. In die­ sem Fall sind die Wort-Vokabular-Informationen die Kandida­ ten für den Sprachteil jedes Wortes.
Tabelle 1
Wort
Kandidaten-Sprachteil
Zeit Hauptwort, Verb
verfliegt Hauptwort, Verb
heute Adverb
wie Verb, Präposition
ein Artikel
Pfeil Hauptwort
Dann verwendet der Feststellblock 2 für alle Beziehungen die vorstehend beschriebene Vokabular-Information für jedes Wort und die Modifizierfaktor-modifizierte Beziehung, welche in der Grammatik 5 gspeichert ist, um alle möglichen Modifi­ zierfaktor-modifizierten Beziehungen für jedes Wort zu erzeugen, und speichert dann diese erzeugten Modifizierfaktor-modifi­ zierten Beziehungen in der Beziehungsspeichereinheit 3.
Die Modifizierfaktor-modifizierten Beziehungen und die Be­ ziehungsnamen sind in Tabelle 2 aufgeführt.
Tabelle 2
In den in Tabelle 2 wiedergegebenen 12 Beziehungstypen (1) bis (12) sind die Beziehungen (1) und (2) dieselbe, Modifi­ zierfaktor-modifizierte Beziehung (Zeit → verfliegt), aber die Beziehungsnamen (1) und (2) sind verschieden. Dasselbe gilt für die Beziehung (8) und (9). Die Modifizierfaktor- modifzierten Beziehungen in Tabelle 2 werden folgendermaßen angegeben:
Beispielsweise hat das Wort "wie" die Möglichkeit die zwei Worte "Zeit" und "verfliegt" zu modifizieren. Außerdem hat das Wort "heute" die Möglichkeit, die drei Worte "Zeit", "verfliegt" und "wie" zu modifizieren. Beim Schritt 102, welcher auf den Schritt 101 folgt, wird die Verarbeitung durch den Feststellblock 6 für bestimmte Beziehungen durch­ geführt.
Der Feststellblock 6 überprüft die 12 Arten von Modifizier­ faktor-modifizierte Beziehungsinformation (1) bis (12), wel­ che in der Beziehungsspeichereinheit 3 gespeichert worden ist, und stellt dann diese Modifizierfaktor-modifizierten Beziehungen fest, bei welchen bereits bestimmt worden ist, daß sie nicht von anderen Beziehungen abhängig sind. Dann werden der Beziehungs-Information Verwendbarkeits-Markierun­ gen ("bestimmte, festgelegte" Markierungen) gegeben. In dem in Tabelle 2 wiedergegebenen Beispiel ist die Beziehung-In­ formation (7) (ein → Pfeil) als eine Modifizierfaktor- modifizierte Beziehung festgestellt, welche bereits bestimmt worden ist. Das heißt, das Wort "ein" hat nur die Möglich­ keit, zu dem Wort "Pfeil" in Beziehung gebracht zu werden. Diese Beziehung wird nicht durch andere Beziehungen beein­ flußt.
Nach dem Schritt 102 wird dann die Verarbeitung von Schritt 103 durch den Beschränkungs-Anwendungsblock 7 durchgeführt. In allgemeinen Worten, die folgenden Beschränkungen werden in praktisch allen Fällen festgesetzt.
  • A) Modifizierte Einheit: Dies ist üblicherweise nur ein Wort oder ein Satzteil, welcher durch jedes Wort oder jeden Satzteil u. ä. modifiziert wird,
  • B) Nicht-Kreuzen von Modififzierfaktor-modifizierte Bezie­ hung: In dem Satz ist ein Wort zwischen den Worten, welche durch eine Modifizierfaktor-modifizierte Beziehung verbunden sind, nicht durch die Modifizierfaktor-modifzierte Bezie­ hung zu einem Wort außerhalb der verbundenen Worte verbun­ den.
Diese Einschränkungen erzeugen Exclusivität zwischen den Modifzierfaktor-modifzierten Beziehungen. Wenn beispiels­ weise eine der Beziehungen zwischen Worten (a) und (b) und zwischen (a) und (c) (wobei c = b ist) richtig ist, ist die andere Beziehung infolge der Modifizierfaktor-Einheit (d. h. von Exclusivität) falsch. Wenn beispielsweise in den in Ta­ belle 2 wiedergegebenen 12 Beziehungen die Beziehungsinforma­ tion (5) (wie → verfliegt) richtig ist, dann ist die Bezie­ hungs-Information (6) (wie → Zeit) falsch (die oben angege­ bene Regel (A)). Wenn die Beziehungs-Information (6) (wie → Zeit) richtig ist, dann ist die Beziehungs-Information (11) (heute → verfliegt) falsch (die oben angeführte Regel (B)).
Eine bestimmte Modifizierfaktor-modifzierte Beziehung wird durch eine Verarbeitungsart festgesetzt; wenn dies gilt, werden alle die Modifizierfaktor-modifzierten Beziehungen, welche infolge der oben beschriebenen Beschränkungen aus­ schließlich sind, aus diesen Modifizierfaktor-modifzierten Beziehungen gestrichen. Diese Art einer Verarbeitung wird als eine Beschränkungs-Anwendung bezeichnet. In der Bezie­ hungs-Speichereinheit 3 werden der festgesetzten Beziehungs­ information Festsetzungs- oder Bestimmungs-Markierungen gege­ ben. Wenn folglich der Beschränkungs-Anwendungsblock 7 für diese Beziehungs-Information in der Beziehungs-Speicherein­ heit 3 sucht und eine Bestimmungs-Markierung feststellt, wird die Beschränkungs-Anwendungsverarbeitung für die Be­ ziehungs-Information durchgeführt, welcher Bestimmungs-Mar­ kierungen gegeben worden sind.
In einer Ausführungsform gemäß der Erfindung gibt es nach einer Verarbeitung durch den Feststellblock 2 für alle Be­ ziehungen drei Möglichkeiten, die Modifizierfaktor-modifi­ zierten Beziehungen zu bestimmen. Dies sind folgende:
  • 1. Bei der Verarbeitung für die Feststellung der bestimm­ ten Beziehung: Wie oben beschrieben, gilt dies, wenn die Modifizierfaktor-modifizierte Beziehung bereits von Anfang an bestimmt ist.
  • 2. In der Spezifikation durch den Benutzer: Dies gilt, wenn die Modifizierfaktor-modifzierte Beziehung durch Dialog- Spezifizierung durch den Benutzer mit Hilfe einer später noch zu beschreibenden Methode spezifiziert wird.
  • 3. Bei der Bevorzugung durch das System: Die Bevorzugung wird später beschrieben.
In der Ausführungsform sind diese Festsetzungen gemacht und dann wird immer die Beschränkungs-Anwendung durchge­ führt. Hierdurch wird der größte Vorteil der Bestimmungs- oder Festsetzungsinformation erhalten. Hierbei ist wichtig, daß, selbst wenn die Modifizierfaktor-modifizierte Bezie­ hung durch die Beschränkungs-Anwendung gestrichen wird, die Beschränkungen, die vorstehend beschrieben worden sind, beinahe sicher festgesetzt werden, und so eine korrekte Modifzierfaktor-modifizierte Beziehung nicht irrtümlich gelöscht wird. Folglich sind in dieser Ausführungsform der Erfindung die Möglichkeit zum Streichen einer richtigen Ant­ wort nur in dem Fall (3) vorhanden, bei welchem die Bevorzu­ gung durch das System durchgeführt wird. Das heißt, nur die festgesetzte Beziehungsfeststellung und die Beschränkungs- Anwendung werden vor der Dialog-Wechselwirkung durchgeführt, und die Bevorzugung durch das System wird nicht durchgeführt, bis die Dialog-Wechselwirkung beendet ist, so daß dadurch garantiert ist, daß eine Dialogwechselwirkung, die immer eine richtige Antwort einschließt, durchgeführt wird.
Die Verarbeitung beim Schritt 104, welche nach der Beschrän­ kungs-Anwendungs-Verarbeitung des Schrittes 103 durchgeführt wird, ist die Bewertung. Diese Verarbeitung wird von dem Bewerteblock 8 durchgeführt. Bei dieser Verarbeitung wer­ den Bewertungen an alle die Modifizierfakor-modifizierten Beziehungen gegeben, welche bei der Verarbeitung für die Beschränkungs-Anwendung nicht gestrichen worden sind. Unter­ schiede in den Bewertungen zwischen Modifizierfaktor-modi­ fizierten Beziehungen müssen irgendeine Bedeutung haben.
Das heißt, in Fällen, in welchen es zwei Modifizierfaktor- modifizierte Beziehungen gibt, welche exclusiv sind, und es dann schwieriger ist, zu bestimmen, welche von den zwei der richtige ist, muß sich dies in einem kleineren Absolutwert der Differenz zwichen den zwei Bewertungen widerspiegeln. Bei dieser Ausführungsform gemäß der Erfindung wird die modifzierte Wahrscheinlichkeit (d. h. die Wahrscheinlichkeit, daß das Wort durch ein anderes Wort modifiziert wird) als das Ergebnis verwendet, welches dieser Bedingung genügt.
Verfahren zum Bestimmen der modifizierten Wahrscheinlichkeit
Im allgemeinen wird die Modifizierfaktor-modifizierte Grammatik mit Hilfe eines Modifizierer-Wortattributs, eines modifizierten Wortattributs und eines Beziehungsnamens ausgedrückt. Die nachstehend angeführten Modifzierfaktor- modifizierten Größen werden angenommen:
Modifizierfaktor-modifizierte Grammatik: k
Modifizierer-Wortattribut: A1
Modifizierer-Wortattribut: A2
Beziehungsname: Etikett (Marke).
Dann wird angenommen, daß die Grammatik k die Modifizier­ faktor-modifzierte Beziehung zwischen den Wortpaaren a und b erzeugt.
Folglich ist, wenn
die Wahrscheinlichkeit, daß die modifizierte Grammatik k festgelegt ist: P1 ist
die Wahrscheinlichkeit, daß das Wort a den Attributwert A1 hat: P2 ist,
die Wahrscheinlichkeit, daß Wort e den Attributwert A2 hat: P3 ist,
die Bewertung s(a, b, k) der Modifizierfaktor-modifizier­ ten Beziehung für das Wort-Paar a und b durch die Grammatik k:
(wobei Wi eine Konstante und
ist)
Wenn eine Anzahl der Modifizierfaktor-modifizierten Grund­ begriffe dieselbe modifizierte Beziehung erzeugen, kann die Beziehung mit dem größten Wert verwendet werden. Außerdem drückt in der vorstehenden Gleichung Wi die Bedeutung jeder der Wahrscheinlichkeit aus. Folglich ist es notwendig, daß Wi einen angemessenen Wert für jede Grammatik, bzw. jeden Grundbegriff festlegt.
Auf diese Weise werden die vorstehenden Auswertungen für alle die Kandidaten-Worte bestimmt, welche Wort a modi­ fizieren können. Dann werden, wenn die Auswertungen für die Modifizierfaktor-modifizierten Beziehungen des Wort­ paars a, b ausgedrückt werden, die Auswertungen folgender­ maßen berechnet:
In dieser Berechnung ist, wenn W1 = 1 und W2 = W3 = 0 ist, nur die Wahrscheinlichkeit P1 der Modifizierfaktor-modifi­ zierten Grammatik die Bewertung (score).
Die Wahrscheinlichkeit der Modifizierfaktor-modifzierten Grammatik kann mit Hilfe der Anzahl Mal, daß die Modifi­ zierfaktor-modifizierte Grammatik ohne weiteres bei einem Wortpaar angewendet worden ist, und mit Hilfe der Anzahl Mal ohne weiteres berechnet werden, daß die Modifizierfaktor- modifizierte Grammatik richtig ist. Die Berechnung für die Wahrscheinlichkeit eines bestimmten Wortes mit einem Attributwert wird auf dieselbe Weise berechnet. Wenn diese Einrichtung verwendet wird, werden Daten, welche zu dieser Anzahl von Anwendungen und zu der Anzahl korrekter Antworten Beziehung haben, gespeichert und es wird die erneute Möglich­ keits-Berechnung durchgeführt, so daß die Genauigkeit der Wahrscheinlichkeit jedesmal erhöht wird, wenn die Verarbei­ tung durchgeführt wird. Ein Lernen wird folglich auf diese Weise für das System durchgeführt.
Außerdem ist der Wert W ein Konstante, wie beispielsweise eine normierte Konstante und der Wert für W wird jedesmal dann erneuert, wenn eine Beziehungs-Information durch die Anwendung der Beschränkungen gelöscht worden ist, und die Aus- bzw. Bewertung wieder berechnet wird, daß immer eine geeignetere Bewertung erhalten wird. Ebenso kann sich in der vorstehend beschriebenen Berechnung durch ein genaues Bestimmen und Verwenden von W1, W2, W3 und P2 sowie P3 der Typ (die Art Wort, aus welchem es gebildet wird, usw.) eines Modifzierer-Wortes und der Typ eines modifizierten Wortes in der Bewertung widerspiegeln. Wenn die Verarbeitung für die Bewertung beendet ist, wird beim Schritt 105 und 106 die Beurteilungsverarbeitung durchgeführt, und dann wird beim Schritt 107 die Dialog-Wechselwirkung durchgeführt.
Bei dieser Dialog-Wechselwirkung werden die Modifizierfaktor- modifizierten Beziehungen durch eine Dialog-Wechselwirkung (Frage und Antwort) zwischen dem Benutzer und dem System bestimmt. Bei dieser Dialog-Wechselwirkung werden Fragen und Antworten von dem Benutzer an das System über die Eingabe­ einheit 1 durchgeführt, und die Fragen/Antworten von dem System an den Benutzer werden über die Anzeigeeinheit 11 durchgeführt. Diese Dialog-Wechselwirkung wird mittels des Dialog-Blocks 9 und mit Hilfe der folgenden Prozedur durch­ geführt.
  • 1. Es werden Gruppen mit Elementen von Beziehungs-Informa­ tionen gebildet, welche sich gegenseitig ausschließen.
  • 2. Paare der höchsten Bewertung werden für jedes Bewer­ tungspaar bestimmt, und dann werden die Gruppen in der Reihenfolge von Gruppen mit abnehmenden Bewertungsunter­ schieden sortiert.
  • 3. Der Unterschied der Bewertungen wird für jedes Be­ wertungspaar und dann für die Gruppen mit abnehmenden Be­ wertungsunterschieden bestimmt.
  • 4. An der Spitze der Gruppen, welche so, wie beschrieben ist, sortiert werden, wird, wenn diese Bewertungsdifferenz kleiner als eine vorherbestimmte Konstante X ist, dann ent­ schieden, ob es schwierig ist, die Modifizierfaktor-modi­ fizierte Beziehung zu bestimmen, und die Beziehungs-Informa­ tion dieser Gruppe wird dann ein Kandidat für eine Dialog- Wechselwirkung.
  • 5. Das Wort, d. h. das modifizierte Wort bezüglich des Modifizierer-Worts in der Beziehungsinformation, welches der Kandidat für eine Dialog-Wechselwirkung geworden ist, wird dem Benutzer zugeführt. Dann wird, wenn der Benutzer eine Antwort gibt, dieser Beziehungs-Information (der Modifizier­ faktor-modifzierten Beziehung), welcher dieser Antwort ent­ spricht, eine Bestimmungs-Markierung gegeben.
  • 6. Wenn eine Bestimmungs-Markierung der Beziehungsinfor­ mation entsprechend der Antwort von dem Benutzer gegeben worden ist, wird die verarbeitete Gruppe an der Spitze der sortierten Gruppen gestrichen. Die Verarbeitung geht dann auf die Beschränkungs-Anwendungsverarbeitung des Schrittes 103 zurück.
Auf diese Weise wird die Verarbeitungsschleife, Dialog- Wechselwirkung → Beschränkungs-Anwendung → Bewertung - Dialog-Wechselwirkung, wiederholt. Die Verarbeitung in dieser Schleife dauert an, bis einer der zwei folgenden Bedingungen genügt ist, und dann wird zu der Bevorzugungs­ Verarbeitung des Schrittes 108 übergegangen.
Abschlußbedingung 1: Ist der Bewertungsunterschied der Gruppe an der Spitze der sortieren Gruppen größer als ein Wert x. Diese Abschlußbedingung 1 wird bei der Verarbeitung für den Schritt 105 angewendet, um zu beurteilen, ob es ein Gegenstand zu der Frage ist oder nicht.
Abschlußbedingung 2: Wenn der Wert einer Dialog-Wechselwir­ kung (die Anzahl Fragen), die sich insoweit auf den Satz be­ ziehen, gleich einem vorherbestimmten Wert Y ist. Diese Ab­ schlußbedingung 2 wird bei der Verarbeitung des Schrittes 106 angewendet, um zu beurteilen, ob die Anzahl Fragen einen Wert für einen oberen Grenzwert erreicht hat oder nicht.
Die vorstehend beschriebene Verarbeitung hat folgende Be­ deutung:
Im Hinblick auf den Benutzer, welcher alle die Modifizier­ faktor-modifizierten Beziehungen durch die Dialog-Wechsel­ wirkung bestimmt, wird dann die Verarbeitung für eine An­ zahl von n Worten mit (n - 1) Fragen und Antworten been­ det. Wenn jedoch viele Sätze zu analysieren sind, stellt diese eine große Belastung für den Benutzer dar. Folglich wird der Schwierigkeitsgrad des Systems, entsprechend wel­ chem die Beziehungs-Information ausgewählt wird, bestimmt, und die Dialog-Wechselwirkung wird in der Reihenfolge die­ ser Beziehungs-Informationen durchgeführt, für welche der Schwierigkeitsgrad am größten ist, so daß die Belastung für den Benutzer entsprechend erleichtert werden kann. Der Schwierigkeitsgrad sollte, wenn das System die Beziehungs- Information auswählt, vorteilhafterweise in einfacher Weise bestimmt werden.
Bei dieser Ausführungsform gemäß der Erfindung wird zu der Bestimmung des Schwierigkeitsgrads der Unterschied zwischen der höchsten Bewertung und der nächsthöchsten Bewertung für die Modifizierfaktor-modifizierte Beziehung verwendet, welche zu den Worten in der Gruppe Beziehung hat, welche ausschließliche Modifizierfaktor-modifizierte Beziehungen aufweist. Dieser Bewertungsunterschied wird leicht bestimmt und darüber hinaus auch bei der Verarbeitung für die Bevor­ zugung verwendet, was später noch beschrieben wird. Darüber hinaus kann durch die Dialogwechselwirkungsgruppen, welche durch die Kleinheit des Bewertungsunterschieds geordnet sind, die Verbesserung des Analyseverhältnisses infolge ei­ ner Benutzerunterstützung immer auf dem Höhepunkt sein.
Nur durch Durchführen einer Dialog-Wechselwirkung, wenn der Bewertungsunterschied kleiner als eine vorherbestimmte Kon­ stante X ist, ist die Dialog-Wechselwirkung begrenzt, so daß die Systemeffizienz verbessert ist, und die Anzahl an Möglichkeiten einer Dialog-Wechselwirkung wird reduziert, so daß die Belastung für den Benutzer automatisch geringer wird. Das bedeutet, daß es möglich ist, die Beanspruchung des Benutzers immer in einem angemessenen Rahmen zu halten. Dies ist aus den folgenden Gründen möglich. Die Effizienz einer Systemanalyse ist immer durch das Vorsehen von Wörter­ büchern, Grammatik und anderen Datenarten und auch durch den Lernprozeß verbessert. Die Steigerung der Effizient der Systemanalyse spiegelt sich in der Bewertungsgenauigkeit wider. Das heißt, durch ein Verbessern des Analyseverhält­ nisses werden die Unterschiede zwischen den Bewertungen grö­ ßer und es wird dadurch leichter, die richtige Antwort aus­ zuwählen. Außerdem werden die Bewertungen zuverlässiger, je größer der Unterschied ist, und der Wert der Konstanten X kann ebenfalls bei einem größeren Wert festgelegt werden, so daß die Anzahl Fragen für eine Dialog-Wechselwirkung weiter verringert werden kann.
Da die Konstante Y als der obere Grenzwert für die Anzahl Fragen festgesetzt werden kann, und da der Wert dieser Kon­ stanten Y von dem Benutzer beliebig eingestellt werden kann, ist es für den Benutzer möglich, die Benutzer-Beanspruchung auf einen entsprechenden Wert einzustellen. Das heißt, der Wert der Konstanten Y muß umso höher eingestellt werden, je höher die geforderte Qualität von Analyeergebnissen ist.
Durch diese Verarbeitung werden die Worte bestimmt, die mo­ difiziert werden und hierzu werden die Bewertungen verwen­ det, die jedem der durch Kandidaten modifizierten Worte ge­ geben werden, welche noch nicht ihre bestimmten Modifizier­ faktoren haben. Diese Bestimmung wird durch die Verarbei­ tung für die Bevorzugung bei dem Schritt 108 durchgeführt.
Diese Verarbeitung für die Bevorzugung wird mittels des Bevorzugungsblockes 10 in der Verarbeitungseinheit 100 und mit Hilfe der folgenden Prozedur durchgeführt.
  • 1. Es wird eine Methode angewendet, um ein Stück einer Antwort-Beziehungsinformation aus den Beziehungsinformations- Kandidaten auszuwählen.
  • 2. Eine Bestimmungs-Marke wird dieser Beziehungsinforma­ tion gegeben, welche als die Antwort ausgewählt wurde.
  • 3. Beim Schritt 109 wird dann beurteilt, ob alle Beziehungs­ information bestimmt worden ist oder nicht, und es wird dann beim Schritt 110 für die Beschränkungs-Anwendung fortgefah­ ren, welche bereits beschrieben worden ist.
Dann wird die Bewertungsverarbeitung, die vorstehend be­ schrieben worden ist, durchgeführt (Schritt 111), und mit der Verarbeitung wird auf die Prioritäts-Auswertungsver­ arbeitung (Schritt 108) zurückgegangen. Auf diese Weise wird die Schleife, Bevorzugung (Schritt 108) → Beschränkungs- Anwendung (Schritt 110) → Bewertung (Schritt 111) → Bevorzugung (Schritt 108) wiederholt, bis die gesamt Ver­ arbeitung für eine Analyse beendet ist.
In diesem Fall wird die Auswahl der Beziehungsinformation der Antwort entsprechend der folgenden Prozedur durchge­ führt. Auf dieselbe Weise wie bei der vorstehend beschrie­ benen Dialog-Wechselwirkung wird die höchste Bewertung und die nächst-höchste Bewertung für jede der Gruppen von Be­ ziehungs-Information bestimmt, welche exclusiv sind. Dann wird bei den Gruppen eine Auswahlverarbeitung durchgeführt, wobei mit der Gruppe begonnen wird, für welche der Bewer­ tungsunterschied am höchsten ist. Bei dieser Auswahlverar­ beitung wird die Beziehungsinformation, welche die höchste Bewertung hat, als die Antwort ausgewählt. Wenn die Bezie­ hungsinformation bestimmt ist, d. h. wenn das Wort, nämlich das modifizierte Wort bestimmt ist, gibt es die Möglichkeit, daß ein Wort, welches garnicht zu modifizieren ist, vorkom­ men kann; in Fällen, wie diesen, es dann notwendig, eine Rückführung durchzuführen.
Auf diese Weise wird das Bewertungsmerkmal der Bestimmung der Beziehungsinformation, was leichter ist, je größer der Bewertungsunterschied ist, dazu verwendet, um das richtige Antwortverhältnis des Systems zu erhöhen.
Wenn diese Verarbeitung beendet ist, hat die Beziehungs­ speichereinheit 3 die Beziehungsinformation, welche die Bestimmungs-Markierungen gehabt hat, um sie dann als end­ gültige Analyseergebnisse zu setzen. Im Falle des Bei­ spiels in Tabelle 2 werden die Bestimmungs-Markierungen der Beziehungsinformationen (1), (5), (7), (9), und (11) gegeben. Diese Modifizierfaktor-modifizierten Beziehungen sind folgende:
Zusätzlich werden die Verarbeitungsvorgänge für die andere Bevorzugung dann als nächstes geprüft. Die Verarbeitung für die nächste Bevorzugung wird, wie in Fig. 4 dargestellt, in dem letzten Schritt 120 durchgeführt, nachdem die Ver­ arbeitung für die Feststellung aller Beziehungen (Schritt 101), die Feststellung einer bestimmten Beziehung (Schritt 102), die Beschränkungs-Anwendung (Schritt 103), die Bewer­ tung (Schritt 104) und die Dialog-Wechselwirkung (Schritt 107) usw. beendet sind. Alle möglichen Modifizierfaktor- modifizierten Bedingungen werden als Kandidaten bezüglich aller Worte erzeugt, für welche Modifizierfaktor-modifizierte Beziehungen nicht bestimmt werden. Gruppen von Kandidaten, für welche ausschließliche Modifizierfaktor-modifizierte Beziehungen entsprechend den vorstehend beschriebenen Be­ schränkungen nicht vorhanden sind, werden erzeugt. In jeder Gruppe wird die Gesamtsumme von Bewertungen der Kandidaten berechnet. Die Gesamtsumme dieser Bewertungen wird als die Kandidaten-Gruppenbewertung bezeichnet. Von diesen mögli­ chen Modifizierfaktor-modifizierten Kandidaten-Gruppen wird nur die Kandidaten-Gruppe genommen, welche die höchste Kandidaten-Gruppenbewertung hat, und die Modifizierfaktor- modifizierten Beziehungen (Kandidaten) einschließlich dieser Gruppe werden alle bestimmt.
Beim Schritt 120 für die in Fig. 3 dargestellte Bevorzu­ gung ist ein lokaler Gesichtspunkt (d. h. die Bestimmung des Wortes, welches durch ein einziges Wort modifiziert wor­ den ist) nicht in die Verarbeitung beim Schritt 108 für die Bevorzugungs-Verarbeitung der Fig. 1 aufgenommen worden, und die Auswahl wird dann unter einem umfassenden Gesichts­ punkt durchgeführt. Folglich kann eine hohe Beurteilungs­ genauigkeit durch das System erwartet werden.
Im folgenden werden Ergänzungsfunktionen beschrieben. In Sätzen, welche viele Worte haben, gibt es viele mögliche Modifizierfaktor-modifizierte Beziehungen. Wenn eine Anzahl Sätze analysiert werden, wird die Verarbeitung in die Ver­ arbeitung durch die Schritte 101 bis 104 und in die übrige Verarbeitung aufgeteilt, und die Ergebnisse der vorherigen Verarbeitung wird dann in einer entsprechenden Speicherein­ heit bereitgehalten. Wenn die vorherige Verarbeitung für alle Sätze beendet ist, wird die restliche Verarbeitung durchgeführt, wobei die Verarbeitungsergebnisse bei der vorherigen Verarbeitung abgerufen werden. Hierdurch kann dann der Benutzer die Dialog-Wechselwirkung auf eine Sitzung konzentrieren, so daß Zeit bezüglich der Dialog-Wechsel­ wirkung eingespart ist.
Eine Verarbeitung, wie diese, ist im einzelnen in Fig. 4 wiedergegeben. In Fig. 4 wird beim Schritt 111 ein Satz aus einer Anzahl Sätze extrahiert, und dann wird die vor­ her beschriebene Feststellung aller Beziehungen (Schritt 101), die Festellung einer bestimmten Beziehung (Schritt 102), die Beschränkungs-Anwendung (Schritt 103) und die Bewertung (Schritt 104) bezüglich des extrahierten Satzes durchgeführt. Dann werden beim Schritt 112 die Bewertungs­ ergebnisse in einer entsprechenden Speichereinheit zurück­ gehalten. Diese Verarbeitung wird dann für alle Sätze durchgeführt. Wenn dann beim Schritt 104 entschieden wird, daß die Verarbeitung für den letzten Satz beendet ist, wird auf den Schritt 112 übergegangen, bei welchem die Er­ gebnisse der vorherigen Bewertung für einen Satz aus der Speichereinheit gelesen werden, und diese Bewertungsergeb­ nisse werden dann als Basis für die Durchführung der bereits früher beschriebenen Dialog-Wechselwirkung (Schritt 107) verwendet. Dann wird die Verarbeitung für die Beschränkungs- Anwendung (Schritt 115) und die Bewertung (Schritt 116) durchgeführt. Wenn beim Schritt 105 entschieden wird, daß es keinen Gegenstand für eine Befragung gibt, oder wenn beim Schritt 106 entschieden wird, daß der obere Grenzwert für die Anzahl Fragen erreicht worden ist, dann wird die Be­ vorzugung durchgeführt. Diese Verarbeitung wird auf der Basis der Bewertungsergebnisse für alle Sätze durchgeführt, welche in der Speichereinheit gespeichert worden sind, und endet, wenn die Analyse für alle Sätze beendet ist.
Es ist erwünscht, daß der Benutzer frei wählen kann, ob die in Fig. 4 dargestellte Verarbeitung oder die Verarbeitung anzuwenden ist, welche in einer der Fig. 2 und 3 dargestellt ist. Diese Wahl der Verarbeitungsform kann ohne weiteres mittels des Systems durchgeführt werden, indem der Benutzer vor Beginn einer Verarbeitung fragt, ob die in Fig. 4 dar­ gestellte Verarbeitung oder die Verarbeitung, welche in ei­ ner der Fig. 2 oder 3 dargestellt ist, anzuwenden ist. Die Analyseeinrichtung für natürliche Sprache gemäß der Erfin­ dung kann als eine Sprachanalyseeinheit in verschiedenen An­ wendungsformen verwendet werden. Die Erfindung ist nicht auf die Anwendungsarten beschränkt, welche hier beschrieben worden sind, sondern es kann auch eine synergetische Wir­ kung erzeugt werden, wenn die Erfindung in einem maschi­ nellen Übersetzungssystem verwendet wird. Im allgemeinen ist in maschinellen Übersetzungssystemen das Analyse- Fehlerverhältnis höher als das Übertragungsfehler-Verhält­ nis. Folglich ist es effizient, die Unterstützung des Be­ nutzers hinsichtlich der Analyse hervorzuheben. Zusätzlich kann die Qualität der Übersetzungsergebnisse durch Verbessern des Analyse-Verhältnisses verbessert werden, selbst wenn der Benutzer nur eine Kenntnis von der Sprache des Original­ textes hat und wenig Kenntnis von der Sprache des über­ setzten Textes.
In der vorstehend beschriebenen Ausführungsform sind die Worte, welche den Gegenstand der Analyse bilden, Wort der englischen Sprache, und die syntaktischen Einheiten sind Worte. Die Erfindung ist jedoch nicht auf Worte als die syntaktischen Einheiten beschränkt, sondern es können auch Wortkombinationen verwendet werden. Außerdem können die syntaktischen Einheiten in Worte wie |go| |ing| aufge­ teilt werden, welche das Wort |going| sind, nachdem es ge­ teilt worden ist. Ferner können im Falle der japanischen Sprache Satzteile oder -glieder als die syntaktischen Ein­ heiten verwendet werden.
Wie aus der vorstehenden Beschreibung zu ersehen ist, können mit der Erfindung die folgenden Wirkungen erzielt werden. Es kann die Häufigkeit einer Unterstützung durch den Benutzer dadurch verringert werden, daß zuerst der Analyse-Schwierig­ keitsgrad durch das System geschätzt wird, und entsprechend diesem Schwierigkeitsgrad dann die Objekte beschränkt werden, für welche eine Unterstützung durch den Benutzer erforder­ lich ist. Ferner kann leicht die Wahrscheinlichkeit berech­ net werden und die Bedienungsperson kann intuitiv Entschei­ dungen treffen, indem ein Vergleich mit anderen willkürli­ chen Bewertungen vorgenommen wird. Schließlich können Bewer­ tungen entsprechend der Knotentypen berechnet werden.
Durch automatisches Verringern der Beanspruchung des Be­ nutzers entsprechend der Verbesserung des Analyse-Leistungs­ vermögens der Einrichtung kann die Belastung des Benutzers auf einem konstanten Wert gehalten werden. Ferner kann der Benutzer die Benutzerbeanspruchung auf einem entsprechenden Niveau einstellen. Es kann im Maximum für eine Unterstützung (eine Dialog-Wechselwirkung) verwendet werden. Ferner kann immer garantiert werden, daß eine richtige Antwort in dem Objekt- oder Gegenstands-Kandidaten enthalten ist, mit wel­ chem der Benutzer befragt wird. Auch kann eine entsprechende Bewertung gegeben werden, indem sich vorherige Analysener­ gebnisse in der Bewertung widerspiegeln.
Es kann auch die Art der Bewertung verwendet werden, da der Unterschied eine Bedeutung hat (wobei eine der Alternativen verhältnismäßig leichter durchzuführen ist, wenn der Unter­ schied groß ist), und folglich kann das korrekte Analyse-Ver­ hältnis für die Beurteilungen des Systems vergrößert wer­ den, und folglich können korrekte System-Beurteilungen er­ halten werden.
Indem die Bewertungen in geeignetere Werte gebracht werden, kann das Analyse-Verhältnis erhöht werden und die Belastung für den Benutzer geringer werden. Auch kann für den Be­ nutzer die Stapel-(Batch)Zeit verkürzt werden. Darüber hinaus kann der Benutzer eine entsprechende Stapelzeit wählen, indem die Benutzungsform entsprechend der Menge an zu analysierenden Sätzen gewählt wird.
Im allgemeinen ist in maschinellen Übersetzungssystemen das unrichtige Analyseverhältnis höher als das unrichtige Übersetzungsverhältnis. Folglich ist es effizient, die Un­ terstützung bezüglich des Analyseteils zu betonen. Zusätz­ lich kann auch die Qualität der Übersetzungsergebnisse durch Verbessern des Analyseverhältnisses erhöht werden, selbst wenn der Benutzer nur eine Kenntnis der Sprache der Origi­ nalsätze und nicht der übersetzten Sätze hat.

Claims (31)

1. Sprachanalyseeinrichtung vom Dialogtyp mit:
  • a) einer Satzeingabeeinrichtung (1), die der Eingabe eines zu analysierenden Textes in einer Sprache dient, wobei ein Satz des Textes aus syntaktischen Einheiten besteht,
  • b) einer Wörterbucheinrichtung (4), in der syntaktische Einheiten gespeichert sind, und der Attribute für syntaktische Einheiten entnehmbar sind,
  • c) einer Grammatikeinrichtung (5), die die für die Sprache des Textes möglichen linguisti­ schen Beziehungen zwischen syntaktischen Einheiten, denen jeweils ein Attribut zuge­ ordnet ist, bereitstellt, wobei der Inhalt der Wörterbucheinrichtung (4) und der Gram­ matikeinrichtung (5) in einem Speicher gespeichert ist,
  • d) einer Feststelleinrichtung (2), die mittels der Wörterbucheinrichtung den Satz in syntak­ tische Einheiten aufteilt und für jede syntaktische Einheit mögliche Attribute feststellt und mittels der Grammatikeinrichtung anhand der als möglich erkannten Attribute alle möglichen linguistischen Beziehungen zwischen den Attributen, die jeweils einer syn­ taktischen Einheit zugeordnet sind, feststellt, wobei jede auf diese Weise festgestellte mögliche linguistische Beziehung zwischen den syntaktischen Einheiten des Satzes eine Kandidatenbeziehung darstellt, die möglicherweise korrekt ist, und
  • e) einer Dialog-Auswahleinrichtung (9) mit der im Dialog mit einem Benutzer, wenn für eine syntaktische Einheit mehr als eine Kandidatenbeziehung möglich ist, eine korrekte Beziehung aus den Kandidatenbeziehungen ausgewählt werden kann,
gekennzeichnet durch
  • a) einen Bewertungsblock (8), der die Kandidatenbeziehungen dahingehend bewertet, ob sie eine höhere oder geringere Wahrscheinlichkeit haben, korrekt zu sein, und durch
  • b) eine Bevorzugungs-Analyseeinrichtung (10), die, wenn für mehrere Kandidatenbezie­ hungen keine klärende Auswahl durch die Dialog-Auswahleinrichtung getroffen wurde, die durch den Bewertungsblock als wahrscheinlichste bewertete Kandidatenbeziehung als korrekt auswählt.
2. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 1, dadurch gekennzeichnet, dass die Wahrscheinlichkeit, dass eine Kandidatenbeziehung korrekt ist, unter Rückgriff auf die gespeicherten vorangegangenen Dialogauswählvorgänge und deren statistische Auswertung bestimmt wird.
3. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 2 oder 1, dadurch gekenn­ zeichnet, dass jeder syntaktischen Einheit eines Paars von syntaktischen Einheiten ein mögli­ ches Attribut zugeordnet wird und eine mögliche linguistische Beziehung diesem Paar zugeord­ net wird, um so eine Kandidatenbeziehung zu bilden, wobei die Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, dadurch bestimmt wird, dass die Wahrscheinlichkeit bestimmt wird, dass eine syntaktische Einheit des Paares die andere syntaktische Einheit des Paares durch die linguistische Beziehung modifiziert.
4. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 3, dadurch gekennzeichnet, dass die Wahrscheinlichkeit bestimmt wird, indem jeder syntaktischen Einheit des Paares eine statistische Wahrscheinlichkeit zugewiesen wird, mit der das für sie ausgewählte Attribut korrekt ist, und der linguistischen Beziehung eine statistische Wahrscheinlichkeit zugewiesen wird, mit der diese korrekt ist, wobei zur Bestimmung der Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, die drei Wahrscheinlichkeiten miteinander multipliziert werden.
5. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 4, dadurch gekennzeichnet, dass nur die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, für die Bestim­ mung der Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, verwendet wird, wobei die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, mit Hilfe der gespeicherten Anzahl, wie häufig sie angewendet wurde, und der gespeicherten Anzahl wie häufig sie durch die Dialog-Auswahleinrichtung als korrekt bestimmt wurde, statistisch berech­ net wird.
6. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 1 bis Anspruch 5, gekenn­ zeichnet durch einen Beschränkungsanwendungsblock (7), der nach der Bestimmung einer Kandidatenbeziehung als korrekt, die zu der korrekten Kandidatenbeziehung exklusiven Kandidatenbeziehungen, die dann nicht korrekt sein können, aussortiert.
7. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 6, dadurch gekennzeichnet, dass die verbliebenen, nicht aussortierten Kandidatenbeziehungen erneut bewertet werden.
8. Sprachanalyseeinrichtung vom Dialogtyp nach den Ansprüchen 1 bis 7, dadurch gekennzeichnet, dass, wenn eine vorbestimmte Anzahl von Dialog-Auswahlvorgängen über­ schritten wird, die verbliebenen, noch zu klärenden Kandidatenbeziehungen durch die Bevorzu­ gungs-Analyseeinrichtung ausgewählt werden.
9. Sprachanalyseeinrichtung vom Dialogtyp nach den Ansprüchen 1 bis 8, gekennzeichnet durch eine erste Gruppenbildungseinrichtung, die zueinander exklusiven Kandidatenbeziehun­ gen, von denen nur eine korrekt sein kann, in einer Gruppe zusammenfasst.
10. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 9, dadurch gekennzeichnet, dass diejenige Gruppe mit dem größten Wahrscheinlichkeitsunterschied zwischen der wahr­ scheinlichsten Kandidatenbeziehung und der zweit-wahrscheinlichsten Kandidatenbeziehung untersucht wird, ob der Wahrscheinlichkeitsunterschied unter einer vorbestimmten Konstante liegt, und wenn dies der Fall ist, so wird die Gruppe zur Entscheidung durch den Benutzer der Dialog-Auswahleinrichtung zugeführt, so dass der Benutzer die korrekte Beziehung auswählen kann, aber ist dies nicht der Fall, so wird eine korrekte Kandidatenbeziehung durch die Bevor­ zugungs-Analyseeinrichtung ausgewählt.
11. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 10, gekennzeichnet durch eine zweite Gruppenbildungseinrichtung, die diejenigen Kandidatenbeziehungen, die nicht mittels der Dialog-Auswahleinrichtung als korrekt oder unkorrekt erkannt wurden, in Gruppen zusam­ menfasst, wobei in jeder Gruppe nur eine Kandidatenbeziehung korrekt sein kann, wobei durch die Bevorzugungs-Analyseeinrichtung aus der Gruppe mit dem größten Bewertungsunterschied zwischen den wahrscheinlichsten und zweit-wahrscheinlichsten Kandidatenbeziehung, diejenige Kandidatenbeziehung als korrekt ausgewählt wird, die mit der größten Wahrscheinlichkeit bewertet wurde.
12. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 10, gekennzeichnet durch eine dritte Gruppenbildungseinrichtung, die die mittels der durch die Dialog-Auswahleinrichtung als korrekt oder unkorrekt erkannten Kandidatenbeziehungen in Gruppen zusammenfasst, wobei die Kandidatenbeziehungen einer Gruppe sich einander nicht ausschließen, so dass, wenn eine Kandidatenbeziehung der Gruppe korrekt ist, alle Kandidatenbeziehungen der Gruppe korrekt sind, wobei die Bevorzugungs-Analyseeinrichtung diejenige Gruppe als korrekt auswählt, bei der die Summe der Wahrscheinlichkeiten der Kandidatenbeziehungen der Gruppe am höchsten ist.
13. Sprachanalyseeinrichtung nach einem der vorhergehenden Ansprüche, dadurch gekenn­ zeichnet, dass eine syntaktische Einheit ein Wort, eine Gruppe von Wörtern, eine Wortwurzel oder eine Wortendung oder ein Wortpräfix oder ein Satzteil oder ein Satzglied ist.
14. Sprachanalyseeinrichtung nach einem der vorhergehenden Ansprüche, dadurch gekenn­ zeichnet, dass die syntaktischen Einheiten Wörter sind, und die Attribute Wortarten sind.
15. Sprachanalyseeinrichtung nach einem der vorhergehenden Ansprüche, dadurch gekenn­ zeichnet, dass die linguistischen Beziehungen Grammatikregeln sind, die die Beziehungen zwischen Wörtern einer bestimmten Wortart betreffen.
16. Sprachanalyseverfahren vom Dialogtyp, das mittels Hard- und Software durchgeführt wird, mit:
  • a) einem Satzeingabeschritt, der der Eingabe eines zu analysierenden Textes in einer Sprache dient, wobei ein Satz des Textes aus syntaktischen Einheiten besteht,
  • b) einem Wörterbuchschritt, bei dem aus einem gespeicherten Wörterbuch, in dem syntak­ tische Einheiten gespeichert sind, Attribute für syntaktische Einheiten entnommen wer­ den,
  • c) einem Grammatikschritt, bei dem auf gespeicherte, für die Sprache des Textes mögliche linguistische Beziehungen zwischen syntaktischen Einheiten, denen jeweils ein Attribut zugeordnet ist, zugegriffen wird,
  • d) einem Feststellschritt, bei dem mittels des Wörterbuchschrittes der Satz in syntaktische Einheiten aufgeteilt wird und für jede syntaktische Einheit mögliche Attribute festge­ stellt werden und mittels des Grammatikschrittes anhand der als möglich erkannten Att­ ribute alle möglichen linguistischen Beziehungen zwischen den Attributen, die jeweils einer syntaktischen Einheit zugeordnet sind, festgestellt werden, wobei jede auf diese Weise festgestellte mögliche linguistische Beziehung zwischen den syntaktischen Ein­ heiten des Satzes eine Kandidatenbeziehung darstellt, die möglicherweise korrekt ist, und
  • e) einem Dialog-Auswahlschritt, bei dem im Dialog mit einem Benutzer, wenn für eine syntaktische Einheit mehr als eine Kandidatenbeziehung möglich ist, eine korrekte Be­ ziehung aus den Kandidatenbeziehungen über eine Eingabeeinheit ausgewählt werden kann,
gekennzeichnet durch
  • a) einen Bewertungsschritt, der die Kandidatenbeziehungen dahingehend bewertet, ob sie eine höhere oder geringere Wahrscheinlichkeit haben, korrekt zu sein, und durch
  • b) einen Bevorzugungs-Analyseschritt, bei dem, wenn für mehrere Kandidatenbeziehungen keine klärende Auswahl durch die Dialog-Auswahleinrichtung getroffen wurde, die durch den Bewertungsschritt als wahrscheinlichste bewertete Kandidatenbeziehung als korrekt ausgewählt wird.
17. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 16, dadurch gekennzeichnet, dass die Wahrscheinlichkeit, dass eine Kandidatenbeziehung korrekt ist, unter Rückgriff auf die gespeicherten vorangegangenen Dialogauswählvorgänge und deren statische Auswertung bestimmt wird.
18. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 16 oder 17, dadurch gekenn­ zeichnet, dass jeder syntaktischen Einheit eines Paars von syntaktischen Einheiten ein mögli­ ches Attribut zugeordnet wird und eine mögliche linguistische Beziehung diesem Paar zugeord­ net wird, um so eine Kandidatenbeziehung zu bilden, wobei die Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, dadurch bestimmt wird, dass die Wahrscheinlichkeit bestimmt wird, dass eine syntaktische Einheit des Paares die andere syntaktische Einheit des Paares durch die linguistische Beziehung modifiziert.
19. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 18, dadurch gekennzeichnet, dass die Wahrscheinlichkeit bestimmt wird, indem jeder syntaktischen Einheit des Paares eine statistische Wahrscheinlichkeit zugewiesen wird, mit der das für sie ausgewählte Attribut korrekt ist, und der linguistischen Beziehung eine statistische Wahrscheinlichkeit zugewiesen wird, mit der diese korrekt ist, wobei zur Bestimmung der Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, die drei Wahrscheinlichkeiten miteinander multipliziert werden.
20. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 19, dadurch gekennzeichnet, dass nur die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, für die Bestim­ mung der Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, verwendet wird, wobei die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, mit Hilfe der gespeicherten Anzahl, wie häufig sie angewendet wurde, und der gespeicherten Anzahl wie häufig sie durch den Dialog-Auswahlschritt als korrekt bestimmt wurde, statistisch berechnet wird.
21. Sprachanalyseverfahren vom Dialogtyp nach den Ansprüchen 16 bis 20, gekennzeichnet durch einen Beschränkungsanwendungsschritt (7), der nach der Bestimmung einer Kandidaten­ beziehung als korrekt, die zu der korrekten Kandidatenbeziehung exklusiven Kandidatenbezie­ hungen, die dann nicht korrekt sein können, aussortiert.
22. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 21, dadurch gekennzeichnet, dass die verbliebenen, nicht aussortierten Kandidatenbeziehungen erneut bewertet werden.
23. Sprachanalyseverfahren vom Dialogtyp nach den Ansprüchen 16 bis 22, dadurch gekennzeichnet, dass, wenn eine vorbestimmte Anzahl von Dialog-Auswahlvorgängen über­ schritten wird, die verbliebenen, noch zu klärenden Kandidatenbeziehungen durch den Bevor­ zugungs-Analyseschritt ausgewählt werden.
24. Sprachanalyseverfahren vom Dialogtyp nach den Ansprüchen 16 bis 23, gekennzeichnet durch einen ersten Gruppenbildungsschritt, der zueinander exklusiven Kandidatenbeziehungen, von denen nur eine korrekt sein kann, in einer Gruppe zusammenfasst.
25. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 24, dadurch gekennzeichnet, dass diejenige Gruppe mit dem größten Wahrscheinlichkeitsunterschied zwischen der wahr­ scheinlichsten Kandidatenbeziehung und der zweit-wahrscheinlichsten Kandidatenbeziehung untersucht wird, ob der Wahrscheinlichkeitsunterschied unter einer vorbestimmten Konstante liegt, und wenn dies der Fall ist, so wird die Gruppe zur Entscheidung durch den Benutzer im Dialog-Auswahlschritt zugeführt, so dass der Benutzer die korrekte Beziehung auswählen kann, aber ist dies nicht der Fall, so wird eine korrekte Kandidatenbeziehung durch den Bevorzu­ gungs-Analyseschritt ausgewählt.
26. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 25, gekennzeichnet durch einen zweiten Gruppenbildungsschritt, der diejenigen Kandidatenbeziehungen, die nicht mittels dem Dialog-Auswahlschritt als korrekt oder unkorrekt erkannt wurden, in Gruppen zusammenfasst, wobei in jeder Gruppe nur eine Kandidatenbeziehung korrekt sein kann, wobei durch den Bevorzugungs-Analyseschritt aus der Gruppe mit dem größten Bewertungsunterschied zwischen den wahrscheinlichsten und zweit-wahrscheinlichsten Kandidatenbeziehung, diejenige Kandi­ datenbeziehung als korrekt ausgewählt wird, die mit der größten Wahrscheinlichkeit bewertet wurde.
27. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 25, gekennzeichnet durch einen dritten Gruppenbildungsschritt, der die mittels der durch die Dialog-Auswahleinrichtung als korrekt oder unkorrekt erkannten Kandidatenbeziehungen in Gruppen zusammenfasst, wobei die Kandidatenbeziehungen einer Gruppe sich einander nicht ausschließen, so dass, wenn eine Kandidatenbeziehung der Gruppe korrekt ist, alle Kandidatenbeziehungen der Gruppe korrekt sind, wobei die Bevorzugungs-Analyseeinrichtung diejenige Gruppe als korrekt auswählt, bei der die Summe der Wahrscheinlichkeiten der Kandidatenbeziehungen der Gruppe am höchsten ist.
28. Sprachanalyseverfahren nach Anspruch 16 bis 27, dadurch gekennzeichnet, dass eine syntaktische Einheit ein Wort, eine Gruppe von Wörtern, eine Wortwurzel oder eine Worten­ dung oder ein Wortpräfix oder ein Satzteil oder ein Satzglied ist.
29. Sprachanalyseverfahren nach Anspruch 16 bis 28, dadurch gekennzeichnet, dass die syntaktischen Einheiten Wörter sind, und die Attribute Wortarten sind.
30. Sprachanalyseverfahren nach Anspruch 16 bis 29, dadurch gekennzeichnet, dass die linguistischen Beziehungen Grammatikregeln sind, die die Beziehungen zwischen Wörtern einer bestimmten Wortart betreffen.
31. Programm, das, wenn es auf einem Computer läuft oder in einem Computer geladen wird, den Computer veranlasst, das Verfahren nach einem der Ansprüche 16 bis 27 durchzu­ führen.
DE4015905A 1989-05-18 1990-05-17 Sprachanalyseeinrichtung, -verfahren und -programm Expired - Fee Related DE4015905C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1124891A JP2963463B2 (ja) 1989-05-18 1989-05-18 対話型言語解析装置

Publications (2)

Publication Number Publication Date
DE4015905A1 DE4015905A1 (de) 1990-11-22
DE4015905C2 true DE4015905C2 (de) 2003-04-30

Family

ID=14896663

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4015905A Expired - Fee Related DE4015905C2 (de) 1989-05-18 1990-05-17 Sprachanalyseeinrichtung, -verfahren und -programm

Country Status (3)

Country Link
US (1) US5029085A (de)
JP (1) JP2963463B2 (de)
DE (1) DE4015905C2 (de)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04287278A (ja) * 1991-03-18 1992-10-12 Nec Corp 機械翻訳装置
US6760695B1 (en) 1992-08-31 2004-07-06 Logovista Corporation Automated natural language processing
US6278967B1 (en) 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
US5528491A (en) * 1992-08-31 1996-06-18 Language Engineering Corporation Apparatus and method for automated natural language translation
US5987170A (en) * 1992-09-28 1999-11-16 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing
US6041141A (en) * 1992-09-28 2000-03-21 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
US5454106A (en) * 1993-05-17 1995-09-26 International Business Machines Corporation Database retrieval system using natural language for presenting understood components of an ambiguous query on a user interface
JP3339741B2 (ja) * 1994-01-13 2002-10-28 株式会社リコー 言語解析装置
JPH0816596A (ja) * 1994-06-29 1996-01-19 Nec Corp 機械翻訳装置
US6339754B1 (en) 1995-02-14 2002-01-15 America Online, Inc. System for automated translation of speech
US6292769B1 (en) 1995-02-14 2001-09-18 America Online, Inc. System for automated translation of speech
US5715466A (en) * 1995-02-14 1998-02-03 Compuserve Incorporated System for parallel foreign language communication over a computer network
US5721938A (en) * 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
US5987404A (en) * 1996-01-29 1999-11-16 International Business Machines Corporation Statistical natural language understanding using hidden clumpings
US5870700A (en) * 1996-04-01 1999-02-09 Dts Software, Inc. Brazilian Portuguese grammar checker
US6470306B1 (en) 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
US6035267A (en) * 1996-09-26 2000-03-07 Mitsubishi Denki Kabushiki Kaisha Interactive processing apparatus having natural language interfacing capability, utilizing goal frames, and judging action feasibility
US6161082A (en) * 1997-11-18 2000-12-12 At&T Corp Network based language translation system
DE19937490B4 (de) * 1999-08-07 2018-11-29 Volkswagen Ag Verfahren und Vorrichtung zur Eingabe von Steuerungsbefehlen für Komfortgeräte, insbesondere in Kraftfahrzeugen
JP4465564B2 (ja) * 2000-02-28 2010-05-19 ソニー株式会社 音声認識装置および音声認識方法、並びに記録媒体
US6996518B2 (en) * 2001-01-03 2006-02-07 International Business Machines Corporation Method and apparatus for automated measurement of quality for machine translation
US7729918B2 (en) * 2001-03-14 2010-06-01 At&T Intellectual Property Ii, Lp Trainable sentence planning system
WO2002073453A1 (en) * 2001-03-14 2002-09-19 At & T Corp. A trainable sentence planning system
US7574362B2 (en) 2001-03-14 2009-08-11 At&T Intellectual Property Ii, L.P. Method for automated sentence planning in a task classification system
US7920682B2 (en) * 2001-08-21 2011-04-05 Byrne William J Dynamic interactive voice interface
JP4947861B2 (ja) * 2001-09-25 2012-06-06 キヤノン株式会社 自然言語処理装置およびその制御方法ならびにプログラム
US20030172067A1 (en) * 2002-03-07 2003-09-11 Eytan Adar System and method for harvesting community knowledge
US20030217106A1 (en) 2002-03-25 2003-11-20 Eytan Adar System and method for profiling clients within a system for harvesting community knowledge
US20030115062A1 (en) * 2002-10-29 2003-06-19 Walker Marilyn A. Method for automated sentence planning
US20060247912A1 (en) * 2005-04-27 2006-11-02 Microsoft Corporation Metric for evaluating systems that produce text
US20080167876A1 (en) * 2007-01-04 2008-07-10 International Business Machines Corporation Methods and computer program products for providing paraphrasing in a text-to-speech system
CA2675208A1 (en) * 2007-01-10 2008-07-17 National Research Council Of Canada Means and method for automatic post-editing of translations
US20110035210A1 (en) * 2009-08-10 2011-02-10 Benjamin Rosenfeld Conditional random fields (crf)-based relation extraction system
DE202016000135U1 (de) 2016-01-08 2016-02-02 Markus Robens System zum kooperativen Verbessern von Sprachkenntnissen unter Zuhilfenahme von Terminologie-Datenbanken
US11354501B2 (en) * 2019-08-02 2022-06-07 Spectacles LLC Definition retrieval and display

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57132270A (en) * 1981-02-09 1982-08-16 Yoshio Hida Human intervening method for factor of failure in decision on meaning by machine translation
JPS58101365A (ja) * 1981-12-14 1983-06-16 Hitachi Ltd 機械翻訳システム
JPS59140582A (ja) * 1983-01-31 1984-08-11 Hitachi Ltd 自然言語翻訳援助方式
EP0118187A1 (de) * 1983-01-28 1984-09-12 Texas Instruments Incorporated Menü-gestütztes, natürliche Sprache verstehendes System
JPS6118073A (ja) * 1984-07-04 1986-01-25 Hitachi Ltd 校正方式
JPS6180362A (ja) * 1984-09-26 1986-04-23 Sharp Corp 翻訳装置
JPS6190269A (ja) * 1984-10-08 1986-05-08 Sharp Corp 翻訳方式
JPS61278970A (ja) * 1985-06-03 1986-12-09 Hitachi Ltd 自然言語処理装置における構文解析結果の表示及び校正のための制御方法
JPS62271060A (ja) * 1986-05-20 1987-11-25 Toshiba Corp 機械翻訳システム
JPS62290976A (ja) * 1986-06-11 1987-12-17 Hitachi Ltd 翻訳支援装置
DE3733674A1 (de) * 1986-10-03 1988-04-21 Ricoh Kk Sprachanalysator
JPS6398072A (ja) * 1986-10-15 1988-04-28 Hitachi Ltd 曖昧修飾関係検出方式
DE3723078A1 (de) * 1987-07-11 1989-01-19 Philips Patentverwaltung Verfahren zur erkennung von zusammenhaengend gesprochenen woertern

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6084667A (ja) * 1983-10-17 1985-05-14 Mitsubishi Electric Corp 文章組立装置
JPS62203273A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム
JPS62271061A (ja) * 1986-05-20 1987-11-25 Toshiba Corp 機械翻訳システム
US4864502A (en) * 1987-10-07 1989-09-05 Houghton Mifflin Company Sentence analyzer
US4914590A (en) * 1988-05-18 1990-04-03 Emhart Industries, Inc. Natural language understanding system

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57132270A (en) * 1981-02-09 1982-08-16 Yoshio Hida Human intervening method for factor of failure in decision on meaning by machine translation
JPS58101365A (ja) * 1981-12-14 1983-06-16 Hitachi Ltd 機械翻訳システム
EP0118187A1 (de) * 1983-01-28 1984-09-12 Texas Instruments Incorporated Menü-gestütztes, natürliche Sprache verstehendes System
JPS59140582A (ja) * 1983-01-31 1984-08-11 Hitachi Ltd 自然言語翻訳援助方式
JPS6118073A (ja) * 1984-07-04 1986-01-25 Hitachi Ltd 校正方式
JPS6180362A (ja) * 1984-09-26 1986-04-23 Sharp Corp 翻訳装置
JPS6190269A (ja) * 1984-10-08 1986-05-08 Sharp Corp 翻訳方式
JPS61278970A (ja) * 1985-06-03 1986-12-09 Hitachi Ltd 自然言語処理装置における構文解析結果の表示及び校正のための制御方法
JPS62271060A (ja) * 1986-05-20 1987-11-25 Toshiba Corp 機械翻訳システム
JPS62290976A (ja) * 1986-06-11 1987-12-17 Hitachi Ltd 翻訳支援装置
DE3733674A1 (de) * 1986-10-03 1988-04-21 Ricoh Kk Sprachanalysator
JPS6398072A (ja) * 1986-10-15 1988-04-28 Hitachi Ltd 曖昧修飾関係検出方式
DE3723078A1 (de) * 1987-07-11 1989-01-19 Philips Patentverwaltung Verfahren zur erkennung von zusammenhaengend gesprochenen woertern

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SICKERT, Klaus: "Automatische Spracheingabe und Sprachausgabe", Verlag Markt & Technik, Haar bei München 1983, S. 367-390 *

Also Published As

Publication number Publication date
DE4015905A1 (de) 1990-11-22
US5029085A (en) 1991-07-02
JPH02302876A (ja) 1990-12-14
JP2963463B2 (ja) 1999-10-18

Similar Documents

Publication Publication Date Title
DE4015905C2 (de) Sprachanalyseeinrichtung, -verfahren und -programm
DE69530816T2 (de) Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis
DE3317325C2 (de)
DE69814589T2 (de) Spracherkennung unter verwendung mehrerer spracherkenner
DE19952769B4 (de) Suchmaschine und Verfahren zum Abrufen von Informationen mit Abfragen in natürlicher Sprache
DE60032846T2 (de) Verfahren und System zur Anbietung von Alternativen für von stochastischen Eingabequellen abgeleitete Texte
DE19709968C2 (de) Verfahren und System zum Übersetzen eines Dokumentes
DE60004862T2 (de) Automatische bestimmung der genauigkeit eines aussprachewörterbuchs in einem spracherkennungssystem
DE60201262T2 (de) Hierarchische sprachmodelle
DE602005000308T2 (de) Vorrichtung für sprachgesteuerte Anwendungen
DE112014005354T5 (de) Dialog-management-system und dialog-management-verfahren
DE3615972A1 (de) Zweisprachiges uebersetzungssystem mit eigen-intelligenz
DE3616011A1 (de) Uebersetzungsgeraet
EP0968478A1 (de) Verfahren zur automatischen generierung einer zusammenfassung von einem text durch einen rechner
DE69819690T2 (de) Spracherkennungsvorrichtung unter verwendung eines befehlslexikons
DE19922974A1 (de) Verfahren und Vorrichtung zur Bearbeitung eines Dokuments
DE60123153T2 (de) Sprachgesteuertes Browsersystem
DE10008502C2 (de) Anapher-Analysevorrichtung mit Vorgängerkandidatenzurückweisungseinrichtung unter Verwendung eines Kandidatenzurückweisungsentscheidungsbaums
DE60006479T2 (de) Verfahren und Gerät zur Analyse eines Denksystems
DE19849855C1 (de) Verfahren zur automatischen Generierung einer textlichen Äußerung aus einer Bedeutungsrepräsentation durch ein Computersystem
DE102020215954A1 (de) Dialogsystem und verfahren zum steuern desselben
DE102009006857A1 (de) Verfahren zum automatischen Klassifizieren eines Textes durch ein Computersystem
DE112021006602T5 (de) Verfeinern von abfrage-erzeugungsmustern
DE60126948T2 (de) Interaktive dialoge
EP1240775B1 (de) Kommunikationssystem und verfahren zum bereitstellen eines internet-zugangs über ein telefon

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection
8170 Reinstatement of the former position
8304 Grant after examination procedure
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee