DE4015905C2 - Sprachanalyseeinrichtung, -verfahren und -programm - Google Patents
Sprachanalyseeinrichtung, -verfahren und -programmInfo
- Publication number
- DE4015905C2 DE4015905C2 DE4015905A DE4015905A DE4015905C2 DE 4015905 C2 DE4015905 C2 DE 4015905C2 DE 4015905 A DE4015905 A DE 4015905A DE 4015905 A DE4015905 A DE 4015905A DE 4015905 C2 DE4015905 C2 DE 4015905C2
- Authority
- DE
- Germany
- Prior art keywords
- correct
- relationship
- candidate
- relationships
- dialogue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/193—Formal grammars, e.g. finite state automata, context free grammars or word networks
Description
Die Erfindung betrifft eine Sprachanalyseeinrichtung (im folgenden auch "Dialog-
Analyseeinrichtung" oder "Dialog-Analysesystem" genannt), welche insbesondere bei einer
maschinellen Übersetzungseinrichtung, einem Dialogsystem für natürliche Sprache u. a.
anwendbar ist.
Das in der japanischen Patentanmeldung Nr. 140 582-1984 (JP 59-140 582 A) beschriebene "National-
Sprachen-Übersetzungs-Stützungssystem" bezieht sich auf ein maschinelles
Übersetzungssystem, welches Information liefert, um den Übersetzungsprozess vor der
Durchführung einer Syntax-Analyse zu unterstützen. Dieses System verwendet Information,
welche vorgesehen ist, um eingegebene Sätze zu übersetzen. In einem solchen maschinellen
Übersetzungssystem ist die Information, welche der Benutzer zu liefern hat, entsprechend
dem eingegebenen Satz verschieden. Folglich muss der Benutzer verstehen, welche Art
Information vorzusehen und zu liefern ist, und muss sie dann auswählen. Dies stellt eine
große Belastung für den Benutzer dar. Diese Art eines maschinellen Übersetzungssystems
wird als ein "redaktionelles Vorbearbeitungs"-System bezeichnet.
Die in der japanischen Patentanmeldung Nr. 101 365-1983 (JP 58-101 365 A) beschriebene "Text-Anzeige-
und Korrektureinrichtung in einem maschinellen Übersetzungssystem" bezieht sich auf ein
maschinelles Übersetzungssystem, in welchem der Satz zuerst erzeugt wird, und der
eingegebene Originalsatz und der entsprechende
übersetzte Satz von dem Benutzer in vorherbe
stimmten Einheiten verglichen werden, und der Benutzer dann
den übersetzten Satz in diesen Einheiten korrigiert.
Außerdem wird in dem "maschinellen Übersetzungssystem", das
in der japanischen Patentanmeldung Nr. 271 060-1986 (JP 62-271 060 A) beschrie
ben ist, der übersetzte Satz, welcher dem eingegebenen Ori
ginalsatz entspricht, zuerst erzeugt, und wenn der Benutzer
einen anderen übersetzten Satz anfordert, wird eine Rück
übersetzung mit Hilfe des einen Kandidaten aus einem Satz
syntaktischer Kandidatenbeziehungen durchgeführt, welche ver
wendet werden könnten, und welche die höchste Wahrschein
lichkeit (Auswertungsmenge) haben, richtig zu sein. Ferner
ist in der vorstehend angeführten japanischen Patentanmel
dung Nr. 271 060-1986 auch ein "maschinelles Übersetzungs
system" beschrieben. In diesem Übersetzungssystem wird der
übersetzte Satz, welcher dem eingegebenen Originalsatz ent
spricht, zuerst vorgesehen, und wenn der Benutzer entschei
det, daß ein Fehler in diesem übersetzten Satz vorhanden ist,
bestimmt der Benutzer die Modifizierklausel des eingegebe
nen Originalsatzes, und es werden modifizierte Kandidaten-
Klauseln vorgesehen. Dann wählt und bestimmt der Benutzer
die modifizierte Kandidatenklausel, welche am geeignesten
ist, aus einer Liste modifizierter Klauseln aus, welche für
den Benutzer vorgesehen sind. Bei diesem System wird eine
Rückübersetzung mit Hilfe der modifizierten Klausel durchge
führt, welche entsprechend der Modifizier-Klausel des einge
benen Originalsatzes spezifiziert wurde. Diese maschinellen
Übersetzungssysteme werden als "nachträgliche Bearbeitungs"-
Systeme bezeichnet.
In solchen "nachträglichen Bearbeitungs-"Systeme ist es
schwierig, eine vollständige, automatische Analyse mit Hilfe
der derzeit akuellen Technik durchzuführen. Folglich muß der
Benutzer jeweils eine Entscheidung treffen, ob der mittels
des Systems übersetzte Satz richtig oder unrichtig ist, und
muß die Korrektur des übersetzten Satzes durchführen, wenn
er falsch ist. Diese Arbeit stellt für den Benutzer ein
großes Arbeitspensum dar.
Bei dem in der japanischen Patentanmeldung Nr. 18 073-1986 (JP 61-18 073 A)
beschriebenen "Korrektur-Verfahren" wird ein Analyse-Baum
graph als Ergebnis einer Analyse des eingegebenen Original
satzes dargestellt, und der Benutzer verwendet dann Grund
befehle, um den Analyse-Baumgraphen zu korrigieren, welcher
dargestellt wird.
Außerdem drückt in dem "Steuerverfahren für eine Anzeige
und Korrektur von syntaktischen Analyseergebnissen", wel
ches in der japanischen Patentanmeldung Nr. 278 970-1986 (JP 61-278 970 A)
beschrieben ist, das System einen Analyse-Baumgraphen in
einem kleinen Raumbereich als das Analyseergebnis des ein
gegebenen Satzes aus, und das System erhält dann Korrektu
ren, welche der Benutzer an diesem Analyse-Baumgraphen vor
nimmt. Diese Art von Systeme werden als "Zwischen-Aufberei
tungs-"Systeme bezeichnet.
In solchen "Zwischen-Aufbereitungs-"Systemen ist die Bedeu
tung der Analyseergebnisse, wie beispielsweise eines Ana
lyse-Baumgraphen u. ä., für einen Durchschnittsbenutzer, wel
cher den Mechanismus des Betriebs nicht versteht, schwierig
zu verstehen. Außerdem muß der Benutzer nicht nur die Korrek
tur einer Fehleranalyse durchführen, sondern er muß auch die
Richtigkeit oder Unrichtigkeit von korrekten Analyse-Ergeb
nisse beurteilen. Dies stellt eine große Belastung für den
Benutzer dar. Das "menschliche Interventionsverfahren für
Fragen unbestimmbarer Bedeutung in einer maschinellen Über
setzung", wie es in der japanischen Patentanmeldung Nr.
132 270-1092 (JP 57-132 270 A) beschrieben ist, betrifft ein maschinelles Über
setzungssystem. In diesem maschinellen Übersetzungssystem
werden syntaktische Strukturen, für welche die Bedeutung
nicht bestimmt werden kann, angezeigt, und es wird dem Be
nutzer Information dargestellt, um die Bedeutung zu bestim
men, und die gegebene Information wird dann für die Übersetzung
verwendet. Eine solche Art eines maschinellen Über
setzungssystems wird als ein maschinelles "Dialog"-Über
setzungssystem bezeichnet. Wenn viele Sätze übersetzt wer
den müssen, wird die Anzahl an Bedeutungen, welche nicht be
stimmt werden kann, ziemlich groß, und das Versorgen des Be
nutzers mit Information, die erforderlich ist, um die Be
deutung zu bestimmen, ist unter praktischen Gesichtspunkten
unrealistisch. Folglich sollte die Menge an unbestimmbaren
Bedeutungen berücksichtigt werden, und es sollte die syntak
tische Struktur, welche Information von dem Benutzer erfor
dert, ausgewählt werden.
Ferner betrifft das "Übersetzungsverfahren", welches in den
japanischen Patentanmeldungen Nr. 80 362-1986 (JP 61-80 362 A) und Nr. 90 269-
1986 (JP 61-90 269 A) beschrieben ist, maschinelle Übersetzungssysteme. In
diesen maschinellen Übersetzungssystemen wird die Syntax des
eingegebenen Originalsatzes durchgeführt, und die Beziehun
gen für die Strukturelemente, welche die Analyseergebnisse
bilden, werden dem Benutzer präsentiert. Der Benutzer über
prüft dann diese Analyseergebnisse, und wenn der Benutzer
entscheidet, daß eine Beziehung unrichtig ist, spezifiziert
der Benutzer eine richtige Beziehung, und das System führt
dann entsprechend dieser Spezifikation eine Rückübersetzung durch.
Wenn viele Sätze zu übersetzen sind, wird die Anzahl Bezie
hungen für die Strukturelemente so groß, daß es unter prak
tischen Gesichtspunkten für den Benutzer nicht mehr länger
realistisch ist, über die Richtigkeit oder Unrichtigkeit
aller dieser Beziehungen zu entscheiden. Folglich sollte die
Anzahl Entscheidungen, welche der Benutzer zu treffen hat,
nur auf vage Beziehungen und unklare Teile u. ä. beschränt
werden.
Die in der japanischen Patentanmeldung Nr. 290 976-1986 (JP 62-290 976 A)
beschriebene "Übersetzungs-Stützeinrichtung" betrifft eben
falls ein maschinelles Übersetzungssystem. Wenn in dem Pro
zeß, bei welchem der eingegebene Originalsatz analysiert
wird, einen vagen oder unklaren Teil erzeugt, wird eine
Frage und Antwort zwischen dem Benutzer und dem System ge
wechselt, und die dabei erhaltene Information wird verwen
det, um mit der Analyse fortzufahren. In einem solchen Fall
ist dann die Belastung des Benutzers geringer, wenn der Be
nutzer in einer leicht zu verstehenden Weise und entsprechend
der Art und dem Inhalt eines vagen oder unklaren Teils ge
fragt wird, so daß der Benutzer schnell antworten kann.
Wenn viele Sätze zu übersetzen sind, nimmt die Anzahl die
ser vagen oder unklaren Teile beträchtlich zu, und es ist
eine große Belastung für den Benutzer, für alle diese Teile
entsprechende Entscheidungen zu treffen. Folglich sollte
die Befragung nur für die Einzelheiten durchgeführt werden,
für welche ein großer Unbestimmtheitsgrad oder fehlende
Klarheit vorliegt.
Ferner betrifft das "Detektions- oder Feststellverfahren für
vage Modifizier-Beziehungen", welches in der japanischen
Patentanmeldung Nr. 98 072-1988 (JP 63-98 072 A) beschrieben ist, ein Dialog-
System für natürliche Sprache. In diesem System wird eine
Analyse für den fraglichen Satz durchgeführt, es werden vage
Modifizier-Beziehungen festgestellt, und alle möglichen Modi
fizier-Beziehungen werden dem Benutzer präsentiert, welcher
dann eine Auswahl trifft. Dann wird die Modifizier-Bezie
hung, welche von dem Benutzer gewählt wird, dazu verwendet,
eine korrekte Analyse durchzuführen. Die vage Modifizier-Be
ziehung wird mit Hilfe von vagen Modifizier-Mustern bestimmt,
welche in dem System gespeichert werden.
Wenn eine große Anzahl Sätze zu übersetzen ist, wird die An
zahl an solchen vagen Modifizier-Beziehungen ziemlich groß,
und es wird eine große Belastung für den Benutzer, für alle
diese Beziehungen Entscheidungen zu treffen. Außerdem gibt
es viele Arten von Unbestimmtheiten, welche ein Satz haben
kann, und es ist schwierig, Muster für alle diese Arten von
Beziehungen zu haben.
Aus "automatische Spracheingabe und Sprachausgabe" von Klaus Sieckert erschienen im
Verlag Markt & Technik, Seiten 367 bis 390, ist die Erkennung von Wortketten mit Syntax
bekannt. Die dort beschriebene Erkennung betrifft insbesondere die akustische Kennung, die
durch Einschränkung der denkbaren Wortkombinationen deutlich verbessert werden soll.
Aus DE 37 23 078 A1 ist ein Verfahren zur Erkennung von zusammenhängend
gesprochenen Wörtern bekannt. Diese Druckschrift bezieht sich auf die Analyse
gesprochener Sprache. Zur Erkennung von Worten in der gesprochenen Sprache werden
Audiosprachsignale mit gespeicherten Audioreferenzwerten verglichen.
Aus DE 37 33 674 A1 ist ein Sprachanalysator bekannt. Dieser erlaubt die Erkennung von
Wortkombinationen und Sätzen.
Aus EP 0 118 187 A1 ist ein System zum Verstehen natürlicher Sprache bekannt, das Menü
basiert ist. Dieses System stellt ein Hilfesystem zum Programmieren von Computern dar.
Die Computerbefehle werden in natürlicher Sprache eingegeben und das System schlägt alle
Möglichkeiten für Wörter vor, die bei einer gegebenen Situation noch im Einklang mit den
strikten Vorgaben einer Programmiersprache gebracht werden können.
Die Technik für eine Sprachanalayse ist noch nicht ausge
reift, und eine vollständige und automatische Analyse ist
schwierig zu haben. Es gibt grundsätzlich zwei Methoden zur
Lösung dieses Problems. Bei der einen Methode wird (1) die
Anzahl von Analyseobjekten begrenzt, und bei der zweiten
Methode wird (2) der Analyse-Automatisierungsgrad begrenzt.
Die Erfindung betrifft die zuletzt angegebene Methode. Zum
Begrenzen des Automatisierungsgrades gibt es wieder vier
Verfahren, welche für die jeweiligen Arten von Übersetzungs
verfahren die folgenden sind:
- 1. (2)-1 Eine vorherige Aufbereitung oder Redigierung: In die sem Fall führt der Benutzer eine vorherige Aufbereitung oder Redigierung für die Originalsätze durch, um sie dadurch in eine Form zu bringen, in welcher sie von dem System analy siert werden kann.
- 2. (2)-2 Nachträgliche Aufbereitung: In einem Prozeß, welcher maschinelle Übersetzungs- und Sprachanalyseergebnisse be nutzt, hat der Benutzer für eine Verarbeitung die endgül tigen Ergebnisse des Systems zu korrigieren.
- 3. (2)-3 Bei einer Zwischen-Aufbereitung hat der Benutzer eine Korrektur der Sprachergebnisse des Systems selbst durchzu führen.
- 4. (2)-4 Bei einem Dialog-System hat der Benutzer die Analyse zu kooperieren und durchzuführen.
Die vorliegende Erfindung bezieht sich auf diese vierte Me
thode. Die Schwierigkeit bei der Methode (1) besteht darin,
daß es schwierig ist, zu bestätigen, ob der Originalsatz,
welcher zu analysieren ist, in den Grenzbereichen liegt oder
nicht. Die Schwierigkeiten bei (2)-1 bis (2)-3 sind vorste
hend bereits beschrieben, und diese Schwierigkeit ist nicht
bei (2)-4 anzutreffen. Die Schwierigkeiten mit der herkömm
lichen Technologie für (2)-4 sind bereits beschrieben worden,
jedoch ist die übliche Schwierigkeit die, daß "die Gesamtan
zahl an Teilen, welche von dem System nicht bestimmt werden
können, größer wird, wenn viele Sätze zu übersetzen sind".
Es ist unrealistisch, daß ein Benutzer dies alles aushält.
Aufgabe der Erfindung ist es eine Sprachanalyseeinrichtung bereitzustellen, die schnell und
effektiv die Sprache unter Einsatz technischer Mittel analysiert. Weiter soll ein
entsprechendes Verfahren geschaffen werden und ein Programm, das ein derartiges
Verfahren ausführt.
Vorstehende Aufgabe wird durch die Gegenstände der Ansprüche 1, 16 und 31 gelöst.
Vorteilhafte Weiterbildungen gehen aus den Unteransprüchen hervor.
Vorteilhaft wird eine Dialog-Analyseeinrichtung für natürliche Sprache geschaffen, bei
welcher die Nachteile des vorerwähnten Systems, Verfahrens und der Einrichtungen
beseitigt sind. Vorteilhaft wird ein Dialog-Analysesystem für natürliche Sprache geschaffen,
bei welchem die Häufigkeit einer Unterstützung durch den Benutzer dadurch verringert
wird, dass der Analyse-Schwierigkeitsgrad von dem System geschätzt wird, und
entsprechend diesem Schwierigkeitsgrad die Objekte oder Gegenstände begrenzt werden,
bei welchen eine Unterstützung durch den Benutzer erforderlich wird. Außerdem ist eine
Unterstützung seitens des Benutzers ohne Bedeutung, wenn nicht die korrekte Analyse-
Auslegungsrate verbessert wird. Das heißt, sollten Analyseergebnisse dieselben sein, wie
diejenigen, welche aufgrund einer Beurteilung von dem System selbst durchgeführt worden
sind und ohne eine Unterstützung seitens des Benutzers erhalten würden, dann würde
irgendeine Unterstützung seitens des Benutzers sinnlos sein. Ein weiteres Ziel der Erfindung
ist es daher, ein Dialog-Analyse-System für natürliche Sprache zu schaffen, bei welchem
eine Verbesserung in einem Analyseverhältnis, das durch eine Unterstützung seitens des
Benutzers erhalten worden ist, immer maximal wird, so dass die Anzahl an solchen
sinnlosen Unterstützungen verringert werden kann.
Außerdem ist es nicht notwendigerweise richtig, das der Analyse-Nutzeffekt eines Systems
konstant ist. Er kann mit Hilfe von Wörterbuch-Regeln und Grammatik verbessert werden.
Ein drittes Ziel der Erfindung ist es daher, ein Dialog-Analyse-System für natürliche
Sprache zu schaffen, bei welchem die Analyseleistung verbessert wird, und gleichzeitig die
Belastung für den Benutzer leichter gemacht wird, so dass die Belastung des Benutzers auf
einem entsprechenden Wert gehalten wird.
Obwohl es wünschenswert ist, dass das Analyseverhältnis 100% ist, ist dies nicht unbedingt
notwendig. Wenn beispielsweise die erfindungsgemäße Einrichtung in einem
Übersetzungssystem verwendet wird, ergeben sich keine Schwierigkeiten, wenn das
Analyse-Verhältnis etwa 80% ist. Ein weiteres Ziel der Erfindung ist es daher, ein Dialog-
Analysesystem für natürliche Sprache zu schaffen, welches die Anzahl Mal steuern kann,
bei welchen eine Unterstützung von dem Benutzer erforderlich ist, so dass in
Übereinstimmung mit dem von dem Benutzer geforderten Analyse-Verhältnis liegt, und
folglich der Benutzer die Benutzer-Belastung entsprechend einstellen kann. Bei dem
erfindungsgemäßen Dialog-Analogsystem für natürliche Sprache ist dies dadurch erreicht,
dass die Dialog-Einrichtung eine Bestimmungseinrichtung aufweist, um die Anzahl Mal der
Dialog-Wechselwirkung mit dem Benutzer festzustellen und zu bestimmen.
Nachfolgend wird die Erfindung anhand von bevorzugten Ausführungsformen unter
Bezugnahme auf die anliegenden Zeichnungen im einzelnen dargestellt. Es zeigen:
Fig. 1 ein Blockdiagramm, anhand welchem eine Ausführungsform einer Dialog-
Analyseeinrichtung für natürliche Sprache gemäß der Erfindung beschrieben
wird;
Fig. 2 ein Flussdiagramm, anhand welchem die Arbeitsweise einer Dialog-
Analyseeinrichtung für natürliche Sprache gemäß der Erfindung beschrieben
wird;
Fig. 3 ein Flussdiagramm, welches die Arbeitsweise einer anderen Ausführungsform
eines Dialog-Analysesystems für natürliche Sprache gemäß der Erfindung
wiedergibt,
und
Fig. 4 ein Flußdiagramm der Arbeitsweise noch einer wei
teren Ausführungsform einer Dialog-Analyseeinrich
tung für natürliche Sprache gemäß der Erfindung.
Nachstehend wird eine Grundkonfiguration eines Dialog-
Analysesystems für natürliche Sprache gemäß der Er
findung beschrieben. Über eine Eingabeeinheit 1 wird die
Information des eingegebenen Originalsatzes eingegeben, um
eine Sprachanalyse durchzuführen. Diese Eingabeeinheit 1
weist beispielsweise eine Tastatur und einen optischen Zei
chenleser (OCR) auf. Eine Verarbeitungseinheit 100 weist
als Funktionsblöcke einen Feststellblock 2 für alle Bezie
hungen, einen Feststellblock 6 für bestimmte Beziehungen,
einen Beschränkungs-Anwendungsblock 7, einen Auswerteblock
8, einen Dialogblock 9 und einen Bevorzugungsblock 10 auf.
Die Verarbeitungseinheit 100 ist im allgemeinen aus Rechner
einheiten gebildet, und jeder der vorstehend beschriebenen
Funktionsblöcke ist durch Rechner-Hardware und -Software
realisiert. Ein Wörterbuch 4 enthält Teile von Sprachwörtern,
Idioms und Satz(teil)-Bedeutungen. Eine Grammatik 5 hat die
Modifizier-(Verbindungs-)Beziehungen für jedes der Worte,
der Wortkombinationen und Satz(teile), usw. Das Wörterbuch
4 und die Grammatik 5 sind durch einen Speicher gebildet,
und die Information des vorstehend beschriebenen Wörterbuchs
und der Grammatik sind in dem Speicher gespeichert. Eine Be
ziehungs-Speichereinheit 3 speichert die Modifizier-Bezie
hung für jedes der Worte, Idioms und Satzteile u. ä., welche
durch die Bearbeitung der Verarbeitungseinheit 100 erhalten
worden sind. Diese Beziehungs-Speichereinheit 3 ist durch
einen Speicher gebildet. Die Information für die Modifizier-
Beziehung, welche in dieser Beziehungs-Speichereinheit 3
gespeichert ist, wird für maschinelle Übersetzung u. ä. ver
wendet. Eine Anzeigeeinheit 11 weist ein CRT-Display und
eine LCD-Display-Einheit u. ä. auf. Diese Anzeigeinheit 11
stellt die Ergebnisse der verschiedenen Verarbeitungsarten
dar, welche von der Verarbeitungseinheit 100 durchgeführt
worden sind. Außerdem ist die Eingabeeinheit 1 auch ein
Dialog-Interface für den Benutzer. Der Benutzer liefert
von der Eingabeeinheit 1 aus notwendige Information an die
Verarbeitungseinheit 100.
Die spezifische Verarbeitung für jeden der Blöcke in der
Verarbeitungseinheit 100 wird später beschrieben. Im fol
genden wird die Arbeitsweise einer Dialog-Analyseeinheit
für natürliche Sprache, welche die vorstehend beschriebene
Konfiguration hat, anhand des in Fig. 2 dargestellten Fluß
diagramms beschrieben.
Ein Benutzer gibt beispielsweise von der Eingabeeinheit 1
den folgenden englischen Satz ein:
"Zeit verfliegt heute wie ein Pfeil".
"Zeit verfliegt heute wie ein Pfeil".
Wenn dies eingegeben wird, wird beim Schritt 101 eine Ver
arbeitung mittels des Feststellblocks 2 für alle Beziehun
gen durchgeführt. Der Block 2 teilt den von der Eingabeein
heit 1 aus eingegebenen Originalsatz in eine Anzahl Worte
auf. In diesem Fall sind es von den syntaktischen Einheiten
des Satzes her sechs Worte. Diese Worte sind "Zeit", "ver
fliegt", "heute", "wie", "ein" und "Pfeil". Diese Worte sind
Knoten. Dann liefert der Feststellblock 2 passende Wort-Vo
kabular-Informationen, welche in dem Wörterbuch 4 gespeichert
ist. Für jedes Wort wird beispielsweise die Vokabular-Infor
mation gegeben, welche in Tabelle 1 dargestellt ist. In die
sem Fall sind die Wort-Vokabular-Informationen die Kandida
ten für den Sprachteil jedes Wortes.
Wort | |
Kandidaten-Sprachteil | |
Zeit | Hauptwort, Verb |
verfliegt | Hauptwort, Verb |
heute | Adverb |
wie | Verb, Präposition |
ein | Artikel |
Pfeil | Hauptwort |
Dann verwendet der Feststellblock 2 für alle Beziehungen
die vorstehend beschriebene Vokabular-Information für jedes
Wort und die Modifizierfaktor-modifizierte Beziehung, welche
in der Grammatik 5 gspeichert ist, um alle möglichen Modifi
zierfaktor-modifizierten Beziehungen für jedes Wort zu erzeugen,
und speichert dann diese erzeugten Modifizierfaktor-modifi
zierten Beziehungen in der Beziehungsspeichereinheit 3.
Die Modifizierfaktor-modifizierten Beziehungen und die Be
ziehungsnamen sind in Tabelle 2 aufgeführt.
In den in Tabelle 2 wiedergegebenen 12 Beziehungstypen (1)
bis (12) sind die Beziehungen (1) und (2) dieselbe, Modifi
zierfaktor-modifizierte Beziehung (Zeit → verfliegt), aber
die Beziehungsnamen (1) und (2) sind verschieden. Dasselbe
gilt für die Beziehung (8) und (9). Die Modifizierfaktor-
modifzierten Beziehungen in Tabelle 2 werden folgendermaßen
angegeben:
Beispielsweise hat das Wort "wie" die Möglichkeit die zwei
Worte "Zeit" und "verfliegt" zu modifizieren. Außerdem hat
das Wort "heute" die Möglichkeit, die drei Worte "Zeit",
"verfliegt" und "wie" zu modifizieren. Beim Schritt 102,
welcher auf den Schritt 101 folgt, wird die Verarbeitung
durch den Feststellblock 6 für bestimmte Beziehungen durch
geführt.
Der Feststellblock 6 überprüft die 12 Arten von Modifizier
faktor-modifizierte Beziehungsinformation (1) bis (12), wel
che in der Beziehungsspeichereinheit 3 gespeichert worden
ist, und stellt dann diese Modifizierfaktor-modifizierten
Beziehungen fest, bei welchen bereits bestimmt worden ist,
daß sie nicht von anderen Beziehungen abhängig sind. Dann
werden der Beziehungs-Information Verwendbarkeits-Markierun
gen ("bestimmte, festgelegte" Markierungen) gegeben. In dem
in Tabelle 2 wiedergegebenen Beispiel ist die Beziehung-In
formation (7) (ein → Pfeil) als eine Modifizierfaktor-
modifizierte Beziehung festgestellt, welche bereits bestimmt
worden ist. Das heißt, das Wort "ein" hat nur die Möglich
keit, zu dem Wort "Pfeil" in Beziehung gebracht zu werden.
Diese Beziehung wird nicht durch andere Beziehungen beein
flußt.
Nach dem Schritt 102 wird dann die Verarbeitung von Schritt
103 durch den Beschränkungs-Anwendungsblock 7 durchgeführt.
In allgemeinen Worten, die folgenden Beschränkungen werden
in praktisch allen Fällen festgesetzt.
- A) Modifizierte Einheit: Dies ist üblicherweise nur ein Wort oder ein Satzteil, welcher durch jedes Wort oder jeden Satzteil u. ä. modifiziert wird,
- B) Nicht-Kreuzen von Modififzierfaktor-modifizierte Bezie hung: In dem Satz ist ein Wort zwischen den Worten, welche durch eine Modifizierfaktor-modifizierte Beziehung verbunden sind, nicht durch die Modifizierfaktor-modifzierte Bezie hung zu einem Wort außerhalb der verbundenen Worte verbun den.
Diese Einschränkungen erzeugen Exclusivität zwischen den
Modifzierfaktor-modifzierten Beziehungen. Wenn beispiels
weise eine der Beziehungen zwischen Worten (a) und (b) und
zwischen (a) und (c) (wobei c = b ist) richtig ist, ist die
andere Beziehung infolge der Modifizierfaktor-Einheit (d. h.
von Exclusivität) falsch. Wenn beispielsweise in den in Ta
belle 2 wiedergegebenen 12 Beziehungen die Beziehungsinforma
tion (5) (wie → verfliegt) richtig ist, dann ist die Bezie
hungs-Information (6) (wie → Zeit) falsch (die oben angege
bene Regel (A)). Wenn die Beziehungs-Information (6) (wie →
Zeit) richtig ist, dann ist die Beziehungs-Information
(11) (heute → verfliegt) falsch (die oben angeführte Regel
(B)).
Eine bestimmte Modifizierfaktor-modifzierte Beziehung wird
durch eine Verarbeitungsart festgesetzt; wenn dies gilt,
werden alle die Modifizierfaktor-modifzierten Beziehungen,
welche infolge der oben beschriebenen Beschränkungen aus
schließlich sind, aus diesen Modifizierfaktor-modifzierten
Beziehungen gestrichen. Diese Art einer Verarbeitung wird
als eine Beschränkungs-Anwendung bezeichnet. In der Bezie
hungs-Speichereinheit 3 werden der festgesetzten Beziehungs
information Festsetzungs- oder Bestimmungs-Markierungen gege
ben. Wenn folglich der Beschränkungs-Anwendungsblock 7 für
diese Beziehungs-Information in der Beziehungs-Speicherein
heit 3 sucht und eine Bestimmungs-Markierung feststellt,
wird die Beschränkungs-Anwendungsverarbeitung für die Be
ziehungs-Information durchgeführt, welcher Bestimmungs-Mar
kierungen gegeben worden sind.
In einer Ausführungsform gemäß der Erfindung gibt es nach
einer Verarbeitung durch den Feststellblock 2 für alle Be
ziehungen drei Möglichkeiten, die Modifizierfaktor-modifi
zierten Beziehungen zu bestimmen. Dies sind folgende:
- 1. Bei der Verarbeitung für die Feststellung der bestimm ten Beziehung: Wie oben beschrieben, gilt dies, wenn die Modifizierfaktor-modifizierte Beziehung bereits von Anfang an bestimmt ist.
- 2. In der Spezifikation durch den Benutzer: Dies gilt, wenn die Modifizierfaktor-modifzierte Beziehung durch Dialog- Spezifizierung durch den Benutzer mit Hilfe einer später noch zu beschreibenden Methode spezifiziert wird.
- 3. Bei der Bevorzugung durch das System: Die Bevorzugung wird später beschrieben.
In der Ausführungsform sind diese Festsetzungen gemacht
und dann wird immer die Beschränkungs-Anwendung durchge
führt. Hierdurch wird der größte Vorteil der Bestimmungs-
oder Festsetzungsinformation erhalten. Hierbei ist wichtig,
daß, selbst wenn die Modifizierfaktor-modifizierte Bezie
hung durch die Beschränkungs-Anwendung gestrichen wird,
die Beschränkungen, die vorstehend beschrieben worden sind,
beinahe sicher festgesetzt werden, und so eine korrekte
Modifzierfaktor-modifizierte Beziehung nicht irrtümlich
gelöscht wird. Folglich sind in dieser Ausführungsform der
Erfindung die Möglichkeit zum Streichen einer richtigen Ant
wort nur in dem Fall (3) vorhanden, bei welchem die Bevorzu
gung durch das System durchgeführt wird. Das heißt, nur die
festgesetzte Beziehungsfeststellung und die Beschränkungs-
Anwendung werden vor der Dialog-Wechselwirkung durchgeführt,
und die Bevorzugung durch das System wird nicht durchgeführt,
bis die Dialog-Wechselwirkung beendet ist, so daß dadurch
garantiert ist, daß eine Dialogwechselwirkung, die immer
eine richtige Antwort einschließt, durchgeführt wird.
Die Verarbeitung beim Schritt 104, welche nach der Beschrän
kungs-Anwendungs-Verarbeitung des Schrittes 103 durchgeführt
wird, ist die Bewertung. Diese Verarbeitung wird von dem
Bewerteblock 8 durchgeführt. Bei dieser Verarbeitung wer
den Bewertungen an alle die Modifizierfakor-modifizierten
Beziehungen gegeben, welche bei der Verarbeitung für die
Beschränkungs-Anwendung nicht gestrichen worden sind. Unter
schiede in den Bewertungen zwischen Modifizierfaktor-modi
fizierten Beziehungen müssen irgendeine Bedeutung haben.
Das heißt, in Fällen, in welchen es zwei Modifizierfaktor-
modifizierte Beziehungen gibt, welche exclusiv sind, und es
dann schwieriger ist, zu bestimmen, welche von den zwei der
richtige ist, muß sich dies in einem kleineren Absolutwert
der Differenz zwichen den zwei Bewertungen widerspiegeln.
Bei dieser Ausführungsform gemäß der Erfindung wird die
modifzierte Wahrscheinlichkeit (d. h. die Wahrscheinlichkeit,
daß das Wort durch ein anderes Wort modifiziert wird) als
das Ergebnis verwendet, welches dieser Bedingung genügt.
Im allgemeinen wird die Modifizierfaktor-modifizierte
Grammatik mit Hilfe eines Modifizierer-Wortattributs, eines
modifizierten Wortattributs und eines Beziehungsnamens
ausgedrückt. Die nachstehend angeführten Modifzierfaktor-
modifizierten Größen werden angenommen:
Modifizierfaktor-modifizierte Grammatik: k
Modifizierer-Wortattribut: A1
Modifizierer-Wortattribut: A2
Beziehungsname: Etikett (Marke).
Modifizierfaktor-modifizierte Grammatik: k
Modifizierer-Wortattribut: A1
Modifizierer-Wortattribut: A2
Beziehungsname: Etikett (Marke).
Dann wird angenommen, daß die Grammatik k die Modifizier
faktor-modifzierte Beziehung zwischen den Wortpaaren a und
b erzeugt.
Folglich ist, wenn
die Wahrscheinlichkeit, daß die modifizierte Grammatik k festgelegt ist: P1 ist
die Wahrscheinlichkeit, daß das Wort a den Attributwert A1 hat: P2 ist,
die Wahrscheinlichkeit, daß Wort e den Attributwert A2 hat: P3 ist,
die Bewertung s(a, b, k) der Modifizierfaktor-modifizier ten Beziehung für das Wort-Paar a und b durch die Grammatik k:
die Wahrscheinlichkeit, daß die modifizierte Grammatik k festgelegt ist: P1 ist
die Wahrscheinlichkeit, daß das Wort a den Attributwert A1 hat: P2 ist,
die Wahrscheinlichkeit, daß Wort e den Attributwert A2 hat: P3 ist,
die Bewertung s(a, b, k) der Modifizierfaktor-modifizier ten Beziehung für das Wort-Paar a und b durch die Grammatik k:
(wobei Wi eine Konstante und
ist)
Wenn eine Anzahl der Modifizierfaktor-modifizierten Grund
begriffe dieselbe modifizierte Beziehung erzeugen, kann die
Beziehung mit dem größten Wert verwendet werden. Außerdem
drückt in der vorstehenden Gleichung Wi die Bedeutung jeder
der Wahrscheinlichkeit aus. Folglich ist es notwendig, daß
Wi einen angemessenen Wert für jede Grammatik, bzw. jeden
Grundbegriff festlegt.
Auf diese Weise werden die vorstehenden Auswertungen für
alle die Kandidaten-Worte bestimmt, welche Wort a modi
fizieren können. Dann werden, wenn die Auswertungen für
die Modifizierfaktor-modifizierten Beziehungen des Wort
paars a, b ausgedrückt werden, die Auswertungen folgender
maßen berechnet:
In dieser Berechnung ist, wenn W1 = 1 und W2 = W3 = 0 ist,
nur die Wahrscheinlichkeit P1 der Modifizierfaktor-modifi
zierten Grammatik die Bewertung (score).
Die Wahrscheinlichkeit der Modifizierfaktor-modifzierten
Grammatik kann mit Hilfe der Anzahl Mal, daß die Modifi
zierfaktor-modifizierte Grammatik ohne weiteres bei einem
Wortpaar angewendet worden ist, und mit Hilfe der Anzahl
Mal ohne weiteres berechnet werden, daß die Modifizierfaktor-
modifizierte Grammatik richtig ist. Die Berechnung für
die Wahrscheinlichkeit eines bestimmten Wortes mit einem
Attributwert wird auf dieselbe Weise berechnet. Wenn diese
Einrichtung verwendet wird, werden Daten, welche zu dieser
Anzahl von Anwendungen und zu der Anzahl korrekter Antworten
Beziehung haben, gespeichert und es wird die erneute Möglich
keits-Berechnung durchgeführt, so daß die Genauigkeit der
Wahrscheinlichkeit jedesmal erhöht wird, wenn die Verarbei
tung durchgeführt wird. Ein Lernen wird folglich auf diese
Weise für das System durchgeführt.
Außerdem ist der Wert W ein Konstante, wie beispielsweise
eine normierte Konstante und der Wert für W wird jedesmal
dann erneuert, wenn eine Beziehungs-Information durch die
Anwendung der Beschränkungen gelöscht worden ist, und die
Aus- bzw. Bewertung wieder berechnet wird, daß immer eine
geeignetere Bewertung erhalten wird. Ebenso kann sich in
der vorstehend beschriebenen Berechnung durch ein genaues
Bestimmen und Verwenden von W1, W2, W3 und P2 sowie P3 der
Typ (die Art Wort, aus welchem es gebildet wird, usw.)
eines Modifzierer-Wortes und der Typ eines modifizierten
Wortes in der Bewertung widerspiegeln. Wenn die Verarbeitung
für die Bewertung beendet ist, wird beim Schritt 105 und
106 die Beurteilungsverarbeitung durchgeführt, und dann wird
beim Schritt 107 die Dialog-Wechselwirkung durchgeführt.
Bei dieser Dialog-Wechselwirkung werden die Modifizierfaktor-
modifizierten Beziehungen durch eine Dialog-Wechselwirkung
(Frage und Antwort) zwischen dem Benutzer und dem System
bestimmt. Bei dieser Dialog-Wechselwirkung werden Fragen und
Antworten von dem Benutzer an das System über die Eingabe
einheit 1 durchgeführt, und die Fragen/Antworten von dem
System an den Benutzer werden über die Anzeigeeinheit 11
durchgeführt. Diese Dialog-Wechselwirkung wird mittels des
Dialog-Blocks 9 und mit Hilfe der folgenden Prozedur durch
geführt.
- 1. Es werden Gruppen mit Elementen von Beziehungs-Informa tionen gebildet, welche sich gegenseitig ausschließen.
- 2. Paare der höchsten Bewertung werden für jedes Bewer tungspaar bestimmt, und dann werden die Gruppen in der Reihenfolge von Gruppen mit abnehmenden Bewertungsunter schieden sortiert.
- 3. Der Unterschied der Bewertungen wird für jedes Be wertungspaar und dann für die Gruppen mit abnehmenden Be wertungsunterschieden bestimmt.
- 4. An der Spitze der Gruppen, welche so, wie beschrieben ist, sortiert werden, wird, wenn diese Bewertungsdifferenz kleiner als eine vorherbestimmte Konstante X ist, dann ent schieden, ob es schwierig ist, die Modifizierfaktor-modi fizierte Beziehung zu bestimmen, und die Beziehungs-Informa tion dieser Gruppe wird dann ein Kandidat für eine Dialog- Wechselwirkung.
- 5. Das Wort, d. h. das modifizierte Wort bezüglich des Modifizierer-Worts in der Beziehungsinformation, welches der Kandidat für eine Dialog-Wechselwirkung geworden ist, wird dem Benutzer zugeführt. Dann wird, wenn der Benutzer eine Antwort gibt, dieser Beziehungs-Information (der Modifizier faktor-modifzierten Beziehung), welcher dieser Antwort ent spricht, eine Bestimmungs-Markierung gegeben.
- 6. Wenn eine Bestimmungs-Markierung der Beziehungsinfor mation entsprechend der Antwort von dem Benutzer gegeben worden ist, wird die verarbeitete Gruppe an der Spitze der sortierten Gruppen gestrichen. Die Verarbeitung geht dann auf die Beschränkungs-Anwendungsverarbeitung des Schrittes 103 zurück.
Auf diese Weise wird die Verarbeitungsschleife, Dialog-
Wechselwirkung → Beschränkungs-Anwendung → Bewertung -
Dialog-Wechselwirkung, wiederholt. Die Verarbeitung in
dieser Schleife dauert an, bis einer der zwei folgenden
Bedingungen genügt ist, und dann wird zu der Bevorzugungs
Verarbeitung des Schrittes 108 übergegangen.
Abschlußbedingung 1: Ist der Bewertungsunterschied der
Gruppe an der Spitze der sortieren Gruppen größer als ein
Wert x. Diese Abschlußbedingung 1 wird bei der Verarbeitung
für den Schritt 105 angewendet, um zu beurteilen, ob es ein
Gegenstand zu der Frage ist oder nicht.
Abschlußbedingung 2: Wenn der Wert einer Dialog-Wechselwir
kung (die Anzahl Fragen), die sich insoweit auf den Satz be
ziehen, gleich einem vorherbestimmten Wert Y ist. Diese Ab
schlußbedingung 2 wird bei der Verarbeitung des Schrittes
106 angewendet, um zu beurteilen, ob die Anzahl Fragen einen
Wert für einen oberen Grenzwert erreicht hat oder nicht.
Die vorstehend beschriebene Verarbeitung hat folgende Be
deutung:
Im Hinblick auf den Benutzer, welcher alle die Modifizier faktor-modifizierten Beziehungen durch die Dialog-Wechsel wirkung bestimmt, wird dann die Verarbeitung für eine An zahl von n Worten mit (n - 1) Fragen und Antworten been det. Wenn jedoch viele Sätze zu analysieren sind, stellt diese eine große Belastung für den Benutzer dar. Folglich wird der Schwierigkeitsgrad des Systems, entsprechend wel chem die Beziehungs-Information ausgewählt wird, bestimmt, und die Dialog-Wechselwirkung wird in der Reihenfolge die ser Beziehungs-Informationen durchgeführt, für welche der Schwierigkeitsgrad am größten ist, so daß die Belastung für den Benutzer entsprechend erleichtert werden kann. Der Schwierigkeitsgrad sollte, wenn das System die Beziehungs- Information auswählt, vorteilhafterweise in einfacher Weise bestimmt werden.
Im Hinblick auf den Benutzer, welcher alle die Modifizier faktor-modifizierten Beziehungen durch die Dialog-Wechsel wirkung bestimmt, wird dann die Verarbeitung für eine An zahl von n Worten mit (n - 1) Fragen und Antworten been det. Wenn jedoch viele Sätze zu analysieren sind, stellt diese eine große Belastung für den Benutzer dar. Folglich wird der Schwierigkeitsgrad des Systems, entsprechend wel chem die Beziehungs-Information ausgewählt wird, bestimmt, und die Dialog-Wechselwirkung wird in der Reihenfolge die ser Beziehungs-Informationen durchgeführt, für welche der Schwierigkeitsgrad am größten ist, so daß die Belastung für den Benutzer entsprechend erleichtert werden kann. Der Schwierigkeitsgrad sollte, wenn das System die Beziehungs- Information auswählt, vorteilhafterweise in einfacher Weise bestimmt werden.
Bei dieser Ausführungsform gemäß der Erfindung wird zu der
Bestimmung des Schwierigkeitsgrads der Unterschied zwischen
der höchsten Bewertung und der nächsthöchsten Bewertung für
die Modifizierfaktor-modifizierte Beziehung verwendet,
welche zu den Worten in der Gruppe Beziehung hat, welche
ausschließliche Modifizierfaktor-modifizierte Beziehungen
aufweist. Dieser Bewertungsunterschied wird leicht bestimmt
und darüber hinaus auch bei der Verarbeitung für die Bevor
zugung verwendet, was später noch beschrieben wird. Darüber
hinaus kann durch die Dialogwechselwirkungsgruppen, welche
durch die Kleinheit des Bewertungsunterschieds geordnet
sind, die Verbesserung des Analyseverhältnisses infolge ei
ner Benutzerunterstützung immer auf dem Höhepunkt sein.
Nur durch Durchführen einer Dialog-Wechselwirkung, wenn der
Bewertungsunterschied kleiner als eine vorherbestimmte Kon
stante X ist, ist die Dialog-Wechselwirkung begrenzt, so
daß die Systemeffizienz verbessert ist, und die Anzahl an
Möglichkeiten einer Dialog-Wechselwirkung wird reduziert,
so daß die Belastung für den Benutzer automatisch geringer
wird. Das bedeutet, daß es möglich ist, die Beanspruchung
des Benutzers immer in einem angemessenen Rahmen zu halten.
Dies ist aus den folgenden Gründen möglich. Die Effizienz
einer Systemanalyse ist immer durch das Vorsehen von Wörter
büchern, Grammatik und anderen Datenarten und auch durch den
Lernprozeß verbessert. Die Steigerung der Effizient der
Systemanalyse spiegelt sich in der Bewertungsgenauigkeit
wider. Das heißt, durch ein Verbessern des Analyseverhält
nisses werden die Unterschiede zwischen den Bewertungen grö
ßer und es wird dadurch leichter, die richtige Antwort aus
zuwählen. Außerdem werden die Bewertungen zuverlässiger,
je größer der Unterschied ist, und der Wert der Konstanten
X kann ebenfalls bei einem größeren Wert festgelegt werden,
so daß die Anzahl Fragen für eine Dialog-Wechselwirkung
weiter verringert werden kann.
Da die Konstante Y als der obere Grenzwert für die Anzahl
Fragen festgesetzt werden kann, und da der Wert dieser Kon
stanten Y von dem Benutzer beliebig eingestellt werden kann,
ist es für den Benutzer möglich, die Benutzer-Beanspruchung
auf einen entsprechenden Wert einzustellen. Das heißt, der
Wert der Konstanten Y muß umso höher eingestellt werden,
je höher die geforderte Qualität von Analyeergebnissen ist.
Durch diese Verarbeitung werden die Worte bestimmt, die mo
difiziert werden und hierzu werden die Bewertungen verwen
det, die jedem der durch Kandidaten modifizierten Worte ge
geben werden, welche noch nicht ihre bestimmten Modifizier
faktoren haben. Diese Bestimmung wird durch die Verarbei
tung für die Bevorzugung bei dem Schritt 108 durchgeführt.
Diese Verarbeitung für die Bevorzugung wird mittels des
Bevorzugungsblockes 10 in der Verarbeitungseinheit 100 und
mit Hilfe der folgenden Prozedur durchgeführt.
- 1. Es wird eine Methode angewendet, um ein Stück einer Antwort-Beziehungsinformation aus den Beziehungsinformations- Kandidaten auszuwählen.
- 2. Eine Bestimmungs-Marke wird dieser Beziehungsinforma tion gegeben, welche als die Antwort ausgewählt wurde.
- 3. Beim Schritt 109 wird dann beurteilt, ob alle Beziehungs information bestimmt worden ist oder nicht, und es wird dann beim Schritt 110 für die Beschränkungs-Anwendung fortgefah ren, welche bereits beschrieben worden ist.
Dann wird die Bewertungsverarbeitung, die vorstehend be
schrieben worden ist, durchgeführt (Schritt 111), und mit
der Verarbeitung wird auf die Prioritäts-Auswertungsver
arbeitung (Schritt 108) zurückgegangen. Auf diese Weise wird
die Schleife, Bevorzugung (Schritt 108) → Beschränkungs-
Anwendung (Schritt 110) → Bewertung (Schritt 111) →
Bevorzugung (Schritt 108) wiederholt, bis die gesamt Ver
arbeitung für eine Analyse beendet ist.
In diesem Fall wird die Auswahl der Beziehungsinformation
der Antwort entsprechend der folgenden Prozedur durchge
führt. Auf dieselbe Weise wie bei der vorstehend beschrie
benen Dialog-Wechselwirkung wird die höchste Bewertung und
die nächst-höchste Bewertung für jede der Gruppen von Be
ziehungs-Information bestimmt, welche exclusiv sind. Dann
wird bei den Gruppen eine Auswahlverarbeitung durchgeführt,
wobei mit der Gruppe begonnen wird, für welche der Bewer
tungsunterschied am höchsten ist. Bei dieser Auswahlverar
beitung wird die Beziehungsinformation, welche die höchste
Bewertung hat, als die Antwort ausgewählt. Wenn die Bezie
hungsinformation bestimmt ist, d. h. wenn das Wort, nämlich
das modifizierte Wort bestimmt ist, gibt es die Möglichkeit,
daß ein Wort, welches garnicht zu modifizieren ist, vorkom
men kann; in Fällen, wie diesen, es dann notwendig, eine
Rückführung durchzuführen.
Auf diese Weise wird das Bewertungsmerkmal der Bestimmung
der Beziehungsinformation, was leichter ist, je größer der
Bewertungsunterschied ist, dazu verwendet, um das richtige
Antwortverhältnis des Systems zu erhöhen.
Wenn diese Verarbeitung beendet ist, hat die Beziehungs
speichereinheit 3 die Beziehungsinformation, welche die
Bestimmungs-Markierungen gehabt hat, um sie dann als end
gültige Analyseergebnisse zu setzen. Im Falle des Bei
spiels in Tabelle 2 werden die Bestimmungs-Markierungen
der Beziehungsinformationen (1), (5), (7), (9), und (11)
gegeben. Diese Modifizierfaktor-modifizierten Beziehungen
sind folgende:
Zusätzlich werden die Verarbeitungsvorgänge für die andere
Bevorzugung dann als nächstes geprüft. Die Verarbeitung für
die nächste Bevorzugung wird, wie in Fig. 4 dargestellt,
in dem letzten Schritt 120 durchgeführt, nachdem die Ver
arbeitung für die Feststellung aller Beziehungen (Schritt
101), die Feststellung einer bestimmten Beziehung (Schritt
102), die Beschränkungs-Anwendung (Schritt 103), die Bewer
tung (Schritt 104) und die Dialog-Wechselwirkung (Schritt
107) usw. beendet sind. Alle möglichen Modifizierfaktor-
modifizierten Bedingungen werden als Kandidaten bezüglich
aller Worte erzeugt, für welche Modifizierfaktor-modifizierte
Beziehungen nicht bestimmt werden. Gruppen von Kandidaten,
für welche ausschließliche Modifizierfaktor-modifizierte
Beziehungen entsprechend den vorstehend beschriebenen Be
schränkungen nicht vorhanden sind, werden erzeugt. In jeder
Gruppe wird die Gesamtsumme von Bewertungen der Kandidaten
berechnet. Die Gesamtsumme dieser Bewertungen wird als die
Kandidaten-Gruppenbewertung bezeichnet. Von diesen mögli
chen Modifizierfaktor-modifizierten Kandidaten-Gruppen wird
nur die Kandidaten-Gruppe genommen, welche die höchste
Kandidaten-Gruppenbewertung hat, und die Modifizierfaktor-
modifizierten Beziehungen (Kandidaten) einschließlich dieser
Gruppe werden alle bestimmt.
Beim Schritt 120 für die in Fig. 3 dargestellte Bevorzu
gung ist ein lokaler Gesichtspunkt (d. h. die Bestimmung
des Wortes, welches durch ein einziges Wort modifiziert wor
den ist) nicht in die Verarbeitung beim Schritt 108 für
die Bevorzugungs-Verarbeitung der Fig. 1 aufgenommen worden,
und die Auswahl wird dann unter einem umfassenden Gesichts
punkt durchgeführt. Folglich kann eine hohe Beurteilungs
genauigkeit durch das System erwartet werden.
Im folgenden werden Ergänzungsfunktionen beschrieben. In
Sätzen, welche viele Worte haben, gibt es viele mögliche
Modifizierfaktor-modifizierte Beziehungen. Wenn eine Anzahl
Sätze analysiert werden, wird die Verarbeitung in die Ver
arbeitung durch die Schritte 101 bis 104 und in die übrige
Verarbeitung aufgeteilt, und die Ergebnisse der vorherigen
Verarbeitung wird dann in einer entsprechenden Speicherein
heit bereitgehalten. Wenn die vorherige Verarbeitung für
alle Sätze beendet ist, wird die restliche Verarbeitung
durchgeführt, wobei die Verarbeitungsergebnisse bei der
vorherigen Verarbeitung abgerufen werden. Hierdurch kann
dann der Benutzer die Dialog-Wechselwirkung auf eine Sitzung
konzentrieren, so daß Zeit bezüglich der Dialog-Wechsel
wirkung eingespart ist.
Eine Verarbeitung, wie diese, ist im einzelnen in Fig. 4
wiedergegeben. In Fig. 4 wird beim Schritt 111 ein Satz
aus einer Anzahl Sätze extrahiert, und dann wird die vor
her beschriebene Feststellung aller Beziehungen (Schritt
101), die Festellung einer bestimmten Beziehung (Schritt
102), die Beschränkungs-Anwendung (Schritt 103) und die
Bewertung (Schritt 104) bezüglich des extrahierten Satzes
durchgeführt. Dann werden beim Schritt 112 die Bewertungs
ergebnisse in einer entsprechenden Speichereinheit zurück
gehalten. Diese Verarbeitung wird dann für alle Sätze
durchgeführt. Wenn dann beim Schritt 104 entschieden wird,
daß die Verarbeitung für den letzten Satz beendet ist,
wird auf den Schritt 112 übergegangen, bei welchem die Er
gebnisse der vorherigen Bewertung für einen Satz aus der
Speichereinheit gelesen werden, und diese Bewertungsergeb
nisse werden dann als Basis für die Durchführung der bereits
früher beschriebenen Dialog-Wechselwirkung (Schritt 107)
verwendet. Dann wird die Verarbeitung für die Beschränkungs-
Anwendung (Schritt 115) und die Bewertung (Schritt 116)
durchgeführt. Wenn beim Schritt 105 entschieden wird, daß
es keinen Gegenstand für eine Befragung gibt, oder wenn beim
Schritt 106 entschieden wird, daß der obere Grenzwert für
die Anzahl Fragen erreicht worden ist, dann wird die Be
vorzugung durchgeführt. Diese Verarbeitung wird auf der
Basis der Bewertungsergebnisse für alle Sätze durchgeführt,
welche in der Speichereinheit gespeichert worden sind, und
endet, wenn die Analyse für alle Sätze beendet ist.
Es ist erwünscht, daß der Benutzer frei wählen kann, ob die
in Fig. 4 dargestellte Verarbeitung oder die Verarbeitung
anzuwenden ist, welche in einer der Fig. 2 und 3 dargestellt
ist. Diese Wahl der Verarbeitungsform kann ohne weiteres
mittels des Systems durchgeführt werden, indem der Benutzer
vor Beginn einer Verarbeitung fragt, ob die in Fig. 4 dar
gestellte Verarbeitung oder die Verarbeitung, welche in ei
ner der Fig. 2 oder 3 dargestellt ist, anzuwenden ist. Die
Analyseeinrichtung für natürliche Sprache gemäß der Erfin
dung kann als eine Sprachanalyseeinheit in verschiedenen An
wendungsformen verwendet werden. Die Erfindung ist nicht
auf die Anwendungsarten beschränkt, welche hier beschrieben
worden sind, sondern es kann auch eine synergetische Wir
kung erzeugt werden, wenn die Erfindung in einem maschi
nellen Übersetzungssystem verwendet wird. Im allgemeinen
ist in maschinellen Übersetzungssystemen das Analyse-
Fehlerverhältnis höher als das Übertragungsfehler-Verhält
nis. Folglich ist es effizient, die Unterstützung des Be
nutzers hinsichtlich der Analyse hervorzuheben. Zusätzlich
kann die Qualität der Übersetzungsergebnisse durch Verbessern
des Analyse-Verhältnisses verbessert werden, selbst wenn der
Benutzer nur eine Kenntnis von der Sprache des Original
textes hat und wenig Kenntnis von der Sprache des über
setzten Textes.
In der vorstehend beschriebenen Ausführungsform sind die
Worte, welche den Gegenstand der Analyse bilden, Wort der
englischen Sprache, und die syntaktischen Einheiten sind
Worte. Die Erfindung ist jedoch nicht auf Worte als die
syntaktischen Einheiten beschränkt, sondern es können auch
Wortkombinationen verwendet werden. Außerdem können die
syntaktischen Einheiten in Worte wie |go| |ing| aufge
teilt werden, welche das Wort |going| sind, nachdem es ge
teilt worden ist. Ferner können im Falle der japanischen
Sprache Satzteile oder -glieder als die syntaktischen Ein
heiten verwendet werden.
Wie aus der vorstehenden Beschreibung zu ersehen ist, können
mit der Erfindung die folgenden Wirkungen erzielt werden.
Es kann die Häufigkeit einer Unterstützung durch den Benutzer
dadurch verringert werden, daß zuerst der Analyse-Schwierig
keitsgrad durch das System geschätzt wird, und entsprechend
diesem Schwierigkeitsgrad dann die Objekte beschränkt werden,
für welche eine Unterstützung durch den Benutzer erforder
lich ist. Ferner kann leicht die Wahrscheinlichkeit berech
net werden und die Bedienungsperson kann intuitiv Entschei
dungen treffen, indem ein Vergleich mit anderen willkürli
chen Bewertungen vorgenommen wird. Schließlich können Bewer
tungen entsprechend der Knotentypen berechnet werden.
Durch automatisches Verringern der Beanspruchung des Be
nutzers entsprechend der Verbesserung des Analyse-Leistungs
vermögens der Einrichtung kann die Belastung des Benutzers
auf einem konstanten Wert gehalten werden. Ferner kann der
Benutzer die Benutzerbeanspruchung auf einem entsprechenden
Niveau einstellen. Es kann im Maximum für eine Unterstützung
(eine Dialog-Wechselwirkung) verwendet werden. Ferner kann
immer garantiert werden, daß eine richtige Antwort in dem
Objekt- oder Gegenstands-Kandidaten enthalten ist, mit wel
chem der Benutzer befragt wird. Auch kann eine entsprechende
Bewertung gegeben werden, indem sich vorherige Analysener
gebnisse in der Bewertung widerspiegeln.
Es kann auch die Art der Bewertung verwendet werden, da der
Unterschied eine Bedeutung hat (wobei eine der Alternativen
verhältnismäßig leichter durchzuführen ist, wenn der Unter
schied groß ist), und folglich kann das korrekte Analyse-Ver
hältnis für die Beurteilungen des Systems vergrößert wer
den, und folglich können korrekte System-Beurteilungen er
halten werden.
Indem die Bewertungen in geeignetere Werte gebracht werden,
kann das Analyse-Verhältnis erhöht werden und die Belastung
für den Benutzer geringer werden. Auch kann für den Be
nutzer die Stapel-(Batch)Zeit verkürzt werden. Darüber
hinaus kann der Benutzer eine entsprechende Stapelzeit
wählen, indem die Benutzungsform entsprechend der Menge an
zu analysierenden Sätzen gewählt wird.
Im allgemeinen ist in maschinellen Übersetzungssystemen
das unrichtige Analyseverhältnis höher als das unrichtige
Übersetzungsverhältnis. Folglich ist es effizient, die Un
terstützung bezüglich des Analyseteils zu betonen. Zusätz
lich kann auch die Qualität der Übersetzungsergebnisse durch
Verbessern des Analyseverhältnisses erhöht werden, selbst
wenn der Benutzer nur eine Kenntnis der Sprache der Origi
nalsätze und nicht der übersetzten Sätze hat.
Claims (31)
1. Sprachanalyseeinrichtung vom Dialogtyp mit:
- a) einer Satzeingabeeinrichtung (1), die der Eingabe eines zu analysierenden Textes in einer Sprache dient, wobei ein Satz des Textes aus syntaktischen Einheiten besteht,
- b) einer Wörterbucheinrichtung (4), in der syntaktische Einheiten gespeichert sind, und der Attribute für syntaktische Einheiten entnehmbar sind,
- c) einer Grammatikeinrichtung (5), die die für die Sprache des Textes möglichen linguisti schen Beziehungen zwischen syntaktischen Einheiten, denen jeweils ein Attribut zuge ordnet ist, bereitstellt, wobei der Inhalt der Wörterbucheinrichtung (4) und der Gram matikeinrichtung (5) in einem Speicher gespeichert ist,
- d) einer Feststelleinrichtung (2), die mittels der Wörterbucheinrichtung den Satz in syntak tische Einheiten aufteilt und für jede syntaktische Einheit mögliche Attribute feststellt und mittels der Grammatikeinrichtung anhand der als möglich erkannten Attribute alle möglichen linguistischen Beziehungen zwischen den Attributen, die jeweils einer syn taktischen Einheit zugeordnet sind, feststellt, wobei jede auf diese Weise festgestellte mögliche linguistische Beziehung zwischen den syntaktischen Einheiten des Satzes eine Kandidatenbeziehung darstellt, die möglicherweise korrekt ist, und
- e) einer Dialog-Auswahleinrichtung (9) mit der im Dialog mit einem Benutzer, wenn für eine syntaktische Einheit mehr als eine Kandidatenbeziehung möglich ist, eine korrekte Beziehung aus den Kandidatenbeziehungen ausgewählt werden kann,
- a) einen Bewertungsblock (8), der die Kandidatenbeziehungen dahingehend bewertet, ob sie eine höhere oder geringere Wahrscheinlichkeit haben, korrekt zu sein, und durch
- b) eine Bevorzugungs-Analyseeinrichtung (10), die, wenn für mehrere Kandidatenbezie hungen keine klärende Auswahl durch die Dialog-Auswahleinrichtung getroffen wurde, die durch den Bewertungsblock als wahrscheinlichste bewertete Kandidatenbeziehung als korrekt auswählt.
2. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 1, dadurch gekennzeichnet,
dass die Wahrscheinlichkeit, dass eine Kandidatenbeziehung korrekt ist, unter Rückgriff auf
die gespeicherten vorangegangenen Dialogauswählvorgänge und deren statistische Auswertung
bestimmt wird.
3. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 2 oder 1, dadurch gekenn
zeichnet, dass jeder syntaktischen Einheit eines Paars von syntaktischen Einheiten ein mögli
ches Attribut zugeordnet wird und eine mögliche linguistische Beziehung diesem Paar zugeord
net wird, um so eine Kandidatenbeziehung zu bilden, wobei die Wahrscheinlichkeit, dass die
Kandidatenbeziehung korrekt ist, dadurch bestimmt wird, dass die Wahrscheinlichkeit bestimmt
wird, dass eine syntaktische Einheit des Paares die andere syntaktische Einheit des Paares durch
die linguistische Beziehung modifiziert.
4. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 3, dadurch gekennzeichnet,
dass die Wahrscheinlichkeit bestimmt wird, indem jeder syntaktischen Einheit des Paares eine
statistische Wahrscheinlichkeit zugewiesen wird, mit der das für sie ausgewählte Attribut
korrekt ist, und der linguistischen Beziehung eine statistische Wahrscheinlichkeit zugewiesen
wird, mit der diese korrekt ist, wobei zur Bestimmung der Wahrscheinlichkeit, dass die
Kandidatenbeziehung korrekt ist, die drei Wahrscheinlichkeiten miteinander multipliziert
werden.
5. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 4, dadurch gekennzeichnet,
dass nur die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, für die Bestim
mung der Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, verwendet wird,
wobei die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, mit Hilfe der
gespeicherten Anzahl, wie häufig sie angewendet wurde, und der gespeicherten Anzahl wie
häufig sie durch die Dialog-Auswahleinrichtung als korrekt bestimmt wurde, statistisch berech
net wird.
6. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 1 bis Anspruch 5, gekenn
zeichnet durch einen Beschränkungsanwendungsblock (7), der nach der Bestimmung einer
Kandidatenbeziehung als korrekt, die zu der korrekten Kandidatenbeziehung exklusiven
Kandidatenbeziehungen, die dann nicht korrekt sein können, aussortiert.
7. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 6, dadurch gekennzeichnet,
dass die verbliebenen, nicht aussortierten Kandidatenbeziehungen erneut bewertet werden.
8. Sprachanalyseeinrichtung vom Dialogtyp nach den Ansprüchen 1 bis 7, dadurch
gekennzeichnet, dass, wenn eine vorbestimmte Anzahl von Dialog-Auswahlvorgängen über
schritten wird, die verbliebenen, noch zu klärenden Kandidatenbeziehungen durch die Bevorzu
gungs-Analyseeinrichtung ausgewählt werden.
9. Sprachanalyseeinrichtung vom Dialogtyp nach den Ansprüchen 1 bis 8, gekennzeichnet
durch eine erste Gruppenbildungseinrichtung, die zueinander exklusiven Kandidatenbeziehun
gen, von denen nur eine korrekt sein kann, in einer Gruppe zusammenfasst.
10. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 9, dadurch gekennzeichnet,
dass diejenige Gruppe mit dem größten Wahrscheinlichkeitsunterschied zwischen der wahr
scheinlichsten Kandidatenbeziehung und der zweit-wahrscheinlichsten Kandidatenbeziehung
untersucht wird, ob der Wahrscheinlichkeitsunterschied unter einer vorbestimmten Konstante
liegt, und wenn dies der Fall ist, so wird die Gruppe zur Entscheidung durch den Benutzer der
Dialog-Auswahleinrichtung zugeführt, so dass der Benutzer die korrekte Beziehung auswählen
kann, aber ist dies nicht der Fall, so wird eine korrekte Kandidatenbeziehung durch die Bevor
zugungs-Analyseeinrichtung ausgewählt.
11. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 10, gekennzeichnet durch eine
zweite Gruppenbildungseinrichtung, die diejenigen Kandidatenbeziehungen, die nicht mittels
der Dialog-Auswahleinrichtung als korrekt oder unkorrekt erkannt wurden, in Gruppen zusam
menfasst, wobei in jeder Gruppe nur eine Kandidatenbeziehung korrekt sein kann, wobei durch
die Bevorzugungs-Analyseeinrichtung aus der Gruppe mit dem größten Bewertungsunterschied
zwischen den wahrscheinlichsten und zweit-wahrscheinlichsten Kandidatenbeziehung, diejenige
Kandidatenbeziehung als korrekt ausgewählt wird, die mit der größten Wahrscheinlichkeit
bewertet wurde.
12. Sprachanalyseeinrichtung vom Dialogtyp nach Anspruch 10, gekennzeichnet durch eine
dritte Gruppenbildungseinrichtung, die die mittels der durch die Dialog-Auswahleinrichtung
als korrekt oder unkorrekt erkannten Kandidatenbeziehungen in Gruppen zusammenfasst, wobei
die Kandidatenbeziehungen einer Gruppe sich einander nicht ausschließen, so dass, wenn eine
Kandidatenbeziehung der Gruppe korrekt ist, alle Kandidatenbeziehungen der Gruppe korrekt
sind, wobei die Bevorzugungs-Analyseeinrichtung diejenige Gruppe als korrekt auswählt, bei
der die Summe der Wahrscheinlichkeiten der Kandidatenbeziehungen der Gruppe am höchsten
ist.
13. Sprachanalyseeinrichtung nach einem der vorhergehenden Ansprüche, dadurch gekenn
zeichnet, dass eine syntaktische Einheit ein Wort, eine Gruppe von Wörtern, eine Wortwurzel
oder eine Wortendung oder ein Wortpräfix oder ein Satzteil oder ein Satzglied ist.
14. Sprachanalyseeinrichtung nach einem der vorhergehenden Ansprüche, dadurch gekenn
zeichnet, dass die syntaktischen Einheiten Wörter sind, und die Attribute Wortarten sind.
15. Sprachanalyseeinrichtung nach einem der vorhergehenden Ansprüche, dadurch gekenn
zeichnet, dass die linguistischen Beziehungen Grammatikregeln sind, die die Beziehungen
zwischen Wörtern einer bestimmten Wortart betreffen.
16. Sprachanalyseverfahren vom Dialogtyp, das mittels Hard- und Software durchgeführt
wird, mit:
- a) einem Satzeingabeschritt, der der Eingabe eines zu analysierenden Textes in einer Sprache dient, wobei ein Satz des Textes aus syntaktischen Einheiten besteht,
- b) einem Wörterbuchschritt, bei dem aus einem gespeicherten Wörterbuch, in dem syntak tische Einheiten gespeichert sind, Attribute für syntaktische Einheiten entnommen wer den,
- c) einem Grammatikschritt, bei dem auf gespeicherte, für die Sprache des Textes mögliche linguistische Beziehungen zwischen syntaktischen Einheiten, denen jeweils ein Attribut zugeordnet ist, zugegriffen wird,
- d) einem Feststellschritt, bei dem mittels des Wörterbuchschrittes der Satz in syntaktische Einheiten aufgeteilt wird und für jede syntaktische Einheit mögliche Attribute festge stellt werden und mittels des Grammatikschrittes anhand der als möglich erkannten Att ribute alle möglichen linguistischen Beziehungen zwischen den Attributen, die jeweils einer syntaktischen Einheit zugeordnet sind, festgestellt werden, wobei jede auf diese Weise festgestellte mögliche linguistische Beziehung zwischen den syntaktischen Ein heiten des Satzes eine Kandidatenbeziehung darstellt, die möglicherweise korrekt ist, und
- e) einem Dialog-Auswahlschritt, bei dem im Dialog mit einem Benutzer, wenn für eine syntaktische Einheit mehr als eine Kandidatenbeziehung möglich ist, eine korrekte Be ziehung aus den Kandidatenbeziehungen über eine Eingabeeinheit ausgewählt werden kann,
- a) einen Bewertungsschritt, der die Kandidatenbeziehungen dahingehend bewertet, ob sie eine höhere oder geringere Wahrscheinlichkeit haben, korrekt zu sein, und durch
- b) einen Bevorzugungs-Analyseschritt, bei dem, wenn für mehrere Kandidatenbeziehungen keine klärende Auswahl durch die Dialog-Auswahleinrichtung getroffen wurde, die durch den Bewertungsschritt als wahrscheinlichste bewertete Kandidatenbeziehung als korrekt ausgewählt wird.
17. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 16, dadurch gekennzeichnet,
dass die Wahrscheinlichkeit, dass eine Kandidatenbeziehung korrekt ist, unter Rückgriff auf
die gespeicherten vorangegangenen Dialogauswählvorgänge und deren statische Auswertung
bestimmt wird.
18. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 16 oder 17, dadurch gekenn
zeichnet, dass jeder syntaktischen Einheit eines Paars von syntaktischen Einheiten ein mögli
ches Attribut zugeordnet wird und eine mögliche linguistische Beziehung diesem Paar zugeord
net wird, um so eine Kandidatenbeziehung zu bilden, wobei die Wahrscheinlichkeit, dass die
Kandidatenbeziehung korrekt ist, dadurch bestimmt wird, dass die Wahrscheinlichkeit bestimmt
wird, dass eine syntaktische Einheit des Paares die andere syntaktische Einheit des Paares durch
die linguistische Beziehung modifiziert.
19. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 18, dadurch gekennzeichnet,
dass die Wahrscheinlichkeit bestimmt wird, indem jeder syntaktischen Einheit des Paares eine
statistische Wahrscheinlichkeit zugewiesen wird, mit der das für sie ausgewählte Attribut
korrekt ist, und der linguistischen Beziehung eine statistische Wahrscheinlichkeit zugewiesen
wird, mit der diese korrekt ist, wobei zur Bestimmung der Wahrscheinlichkeit, dass die
Kandidatenbeziehung korrekt ist, die drei Wahrscheinlichkeiten miteinander multipliziert
werden.
20. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 19, dadurch gekennzeichnet,
dass nur die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, für die Bestim
mung der Wahrscheinlichkeit, dass die Kandidatenbeziehung korrekt ist, verwendet wird,
wobei die Wahrscheinlichkeit, dass die linguistische Beziehung korrekt ist, mit Hilfe der
gespeicherten Anzahl, wie häufig sie angewendet wurde, und der gespeicherten Anzahl wie
häufig sie durch den Dialog-Auswahlschritt als korrekt bestimmt wurde, statistisch berechnet
wird.
21. Sprachanalyseverfahren vom Dialogtyp nach den Ansprüchen 16 bis 20, gekennzeichnet
durch einen Beschränkungsanwendungsschritt (7), der nach der Bestimmung einer Kandidaten
beziehung als korrekt, die zu der korrekten Kandidatenbeziehung exklusiven Kandidatenbezie
hungen, die dann nicht korrekt sein können, aussortiert.
22. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 21, dadurch gekennzeichnet,
dass die verbliebenen, nicht aussortierten Kandidatenbeziehungen erneut bewertet werden.
23. Sprachanalyseverfahren vom Dialogtyp nach den Ansprüchen 16 bis 22, dadurch
gekennzeichnet, dass, wenn eine vorbestimmte Anzahl von Dialog-Auswahlvorgängen über
schritten wird, die verbliebenen, noch zu klärenden Kandidatenbeziehungen durch den Bevor
zugungs-Analyseschritt ausgewählt werden.
24. Sprachanalyseverfahren vom Dialogtyp nach den Ansprüchen 16 bis 23, gekennzeichnet
durch einen ersten Gruppenbildungsschritt, der zueinander exklusiven Kandidatenbeziehungen,
von denen nur eine korrekt sein kann, in einer Gruppe zusammenfasst.
25. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 24, dadurch gekennzeichnet,
dass diejenige Gruppe mit dem größten Wahrscheinlichkeitsunterschied zwischen der wahr
scheinlichsten Kandidatenbeziehung und der zweit-wahrscheinlichsten Kandidatenbeziehung
untersucht wird, ob der Wahrscheinlichkeitsunterschied unter einer vorbestimmten Konstante
liegt, und wenn dies der Fall ist, so wird die Gruppe zur Entscheidung durch den Benutzer im
Dialog-Auswahlschritt zugeführt, so dass der Benutzer die korrekte Beziehung auswählen kann,
aber ist dies nicht der Fall, so wird eine korrekte Kandidatenbeziehung durch den Bevorzu
gungs-Analyseschritt ausgewählt.
26. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 25, gekennzeichnet durch einen
zweiten Gruppenbildungsschritt, der diejenigen Kandidatenbeziehungen, die nicht mittels dem
Dialog-Auswahlschritt als korrekt oder unkorrekt erkannt wurden, in Gruppen zusammenfasst,
wobei in jeder Gruppe nur eine Kandidatenbeziehung korrekt sein kann, wobei durch den
Bevorzugungs-Analyseschritt aus der Gruppe mit dem größten Bewertungsunterschied zwischen
den wahrscheinlichsten und zweit-wahrscheinlichsten Kandidatenbeziehung, diejenige Kandi
datenbeziehung als korrekt ausgewählt wird, die mit der größten Wahrscheinlichkeit bewertet
wurde.
27. Sprachanalyseverfahren vom Dialogtyp nach Anspruch 25, gekennzeichnet durch einen
dritten Gruppenbildungsschritt, der die mittels der durch die Dialog-Auswahleinrichtung als
korrekt oder unkorrekt erkannten Kandidatenbeziehungen in Gruppen zusammenfasst, wobei
die Kandidatenbeziehungen einer Gruppe sich einander nicht ausschließen, so dass, wenn eine
Kandidatenbeziehung der Gruppe korrekt ist, alle Kandidatenbeziehungen der Gruppe korrekt
sind, wobei die Bevorzugungs-Analyseeinrichtung diejenige Gruppe als korrekt auswählt, bei
der die Summe der Wahrscheinlichkeiten der Kandidatenbeziehungen der Gruppe am höchsten
ist.
28. Sprachanalyseverfahren nach Anspruch 16 bis 27, dadurch gekennzeichnet, dass eine
syntaktische Einheit ein Wort, eine Gruppe von Wörtern, eine Wortwurzel oder eine Worten
dung oder ein Wortpräfix oder ein Satzteil oder ein Satzglied ist.
29. Sprachanalyseverfahren nach Anspruch 16 bis 28, dadurch gekennzeichnet, dass die
syntaktischen Einheiten Wörter sind, und die Attribute Wortarten sind.
30. Sprachanalyseverfahren nach Anspruch 16 bis 29, dadurch gekennzeichnet, dass die
linguistischen Beziehungen Grammatikregeln sind, die die Beziehungen zwischen Wörtern einer
bestimmten Wortart betreffen.
31. Programm, das, wenn es auf einem Computer läuft oder in einem Computer geladen
wird, den Computer veranlasst, das Verfahren nach einem der Ansprüche 16 bis 27 durchzu
führen.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1124891A JP2963463B2 (ja) | 1989-05-18 | 1989-05-18 | 対話型言語解析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE4015905A1 DE4015905A1 (de) | 1990-11-22 |
DE4015905C2 true DE4015905C2 (de) | 2003-04-30 |
Family
ID=14896663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE4015905A Expired - Fee Related DE4015905C2 (de) | 1989-05-18 | 1990-05-17 | Sprachanalyseeinrichtung, -verfahren und -programm |
Country Status (3)
Country | Link |
---|---|
US (1) | US5029085A (de) |
JP (1) | JP2963463B2 (de) |
DE (1) | DE4015905C2 (de) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04287278A (ja) * | 1991-03-18 | 1992-10-12 | Nec Corp | 機械翻訳装置 |
US5528491A (en) * | 1992-08-31 | 1996-06-18 | Language Engineering Corporation | Apparatus and method for automated natural language translation |
US6760695B1 (en) | 1992-08-31 | 2004-07-06 | Logovista Corporation | Automated natural language processing |
US6278967B1 (en) | 1992-08-31 | 2001-08-21 | Logovista Corporation | Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis |
US5987170A (en) * | 1992-09-28 | 1999-11-16 | Matsushita Electric Industrial Co., Ltd. | Character recognition machine utilizing language processing |
US6041141A (en) * | 1992-09-28 | 2000-03-21 | Matsushita Electric Industrial Co., Ltd. | Character recognition machine utilizing language processing |
US5675815A (en) * | 1992-11-09 | 1997-10-07 | Ricoh Company, Ltd. | Language conversion system and text creating system using such |
US5454106A (en) * | 1993-05-17 | 1995-09-26 | International Business Machines Corporation | Database retrieval system using natural language for presenting understood components of an ambiguous query on a user interface |
JP3339741B2 (ja) * | 1994-01-13 | 2002-10-28 | 株式会社リコー | 言語解析装置 |
JPH0816596A (ja) * | 1994-06-29 | 1996-01-19 | Nec Corp | 機械翻訳装置 |
US5715466A (en) * | 1995-02-14 | 1998-02-03 | Compuserve Incorporated | System for parallel foreign language communication over a computer network |
US6339754B1 (en) | 1995-02-14 | 2002-01-15 | America Online, Inc. | System for automated translation of speech |
US6292769B1 (en) | 1995-02-14 | 2001-09-18 | America Online, Inc. | System for automated translation of speech |
US5721938A (en) * | 1995-06-07 | 1998-02-24 | Stuckey; Barbara K. | Method and device for parsing and analyzing natural language sentences and text |
US5987404A (en) * | 1996-01-29 | 1999-11-16 | International Business Machines Corporation | Statistical natural language understanding using hidden clumpings |
US5870700A (en) * | 1996-04-01 | 1999-02-09 | Dts Software, Inc. | Brazilian Portuguese grammar checker |
US6470306B1 (en) | 1996-04-23 | 2002-10-22 | Logovista Corporation | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens |
EP0863466A4 (de) * | 1996-09-26 | 2005-07-20 | Mitsubishi Electric Corp | Interaktiver prozessor |
US6161082A (en) * | 1997-11-18 | 2000-12-12 | At&T Corp | Network based language translation system |
DE19937490B4 (de) * | 1999-08-07 | 2018-11-29 | Volkswagen Ag | Verfahren und Vorrichtung zur Eingabe von Steuerungsbefehlen für Komfortgeräte, insbesondere in Kraftfahrzeugen |
JP4465564B2 (ja) * | 2000-02-28 | 2010-05-19 | ソニー株式会社 | 音声認識装置および音声認識方法、並びに記録媒体 |
US6996518B2 (en) * | 2001-01-03 | 2006-02-07 | International Business Machines Corporation | Method and apparatus for automated measurement of quality for machine translation |
WO2002073449A1 (en) | 2001-03-14 | 2002-09-19 | At & T Corp. | Automated sentence planning in a task classification system |
US7574362B2 (en) * | 2001-03-14 | 2009-08-11 | At&T Intellectual Property Ii, L.P. | Method for automated sentence planning in a task classification system |
US7729918B2 (en) * | 2001-03-14 | 2010-06-01 | At&T Intellectual Property Ii, Lp | Trainable sentence planning system |
US7920682B2 (en) * | 2001-08-21 | 2011-04-05 | Byrne William J | Dynamic interactive voice interface |
JP4947861B2 (ja) * | 2001-09-25 | 2012-06-06 | キヤノン株式会社 | 自然言語処理装置およびその制御方法ならびにプログラム |
US20030172067A1 (en) * | 2002-03-07 | 2003-09-11 | Eytan Adar | System and method for harvesting community knowledge |
US20030217106A1 (en) | 2002-03-25 | 2003-11-20 | Eytan Adar | System and method for profiling clients within a system for harvesting community knowledge |
US20030115062A1 (en) * | 2002-10-29 | 2003-06-19 | Walker Marilyn A. | Method for automated sentence planning |
US20060247912A1 (en) * | 2005-04-27 | 2006-11-02 | Microsoft Corporation | Metric for evaluating systems that produce text |
US20080167876A1 (en) * | 2007-01-04 | 2008-07-10 | International Business Machines Corporation | Methods and computer program products for providing paraphrasing in a text-to-speech system |
EP2109832A4 (de) * | 2007-01-10 | 2010-05-12 | Ca Nat Research Council | Mittel und verfahren zur automatischen nachbearbeitung von übersetzungen |
US20110035210A1 (en) * | 2009-08-10 | 2011-02-10 | Benjamin Rosenfeld | Conditional random fields (crf)-based relation extraction system |
DE202016000135U1 (de) | 2016-01-08 | 2016-02-02 | Markus Robens | System zum kooperativen Verbessern von Sprachkenntnissen unter Zuhilfenahme von Terminologie-Datenbanken |
US11354501B2 (en) | 2019-08-02 | 2022-06-07 | Spectacles LLC | Definition retrieval and display |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57132270A (en) * | 1981-02-09 | 1982-08-16 | Yoshio Hida | Human intervening method for factor of failure in decision on meaning by machine translation |
JPS58101365A (ja) * | 1981-12-14 | 1983-06-16 | Hitachi Ltd | 機械翻訳システム |
JPS59140582A (ja) * | 1983-01-31 | 1984-08-11 | Hitachi Ltd | 自然言語翻訳援助方式 |
EP0118187A1 (de) * | 1983-01-28 | 1984-09-12 | Texas Instruments Incorporated | Menü-gestütztes, natürliche Sprache verstehendes System |
JPS6118073A (ja) * | 1984-07-04 | 1986-01-25 | Hitachi Ltd | 校正方式 |
JPS6180362A (ja) * | 1984-09-26 | 1986-04-23 | Sharp Corp | 翻訳装置 |
JPS6190269A (ja) * | 1984-10-08 | 1986-05-08 | Sharp Corp | 翻訳方式 |
JPS61278970A (ja) * | 1985-06-03 | 1986-12-09 | Hitachi Ltd | 自然言語処理装置における構文解析結果の表示及び校正のための制御方法 |
JPS62271060A (ja) * | 1986-05-20 | 1987-11-25 | Toshiba Corp | 機械翻訳システム |
JPS62290976A (ja) * | 1986-06-11 | 1987-12-17 | Hitachi Ltd | 翻訳支援装置 |
DE3733674A1 (de) * | 1986-10-03 | 1988-04-21 | Ricoh Kk | Sprachanalysator |
JPS6398072A (ja) * | 1986-10-15 | 1988-04-28 | Hitachi Ltd | 曖昧修飾関係検出方式 |
DE3723078A1 (de) * | 1987-07-11 | 1989-01-19 | Philips Patentverwaltung | Verfahren zur erkennung von zusammenhaengend gesprochenen woertern |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6084667A (ja) * | 1983-10-17 | 1985-05-14 | Mitsubishi Electric Corp | 文章組立装置 |
JPS62203273A (ja) * | 1986-03-04 | 1987-09-07 | Toshiba Corp | 機械翻訳システム |
JPS62271061A (ja) * | 1986-05-20 | 1987-11-25 | Toshiba Corp | 機械翻訳システム |
US4864502A (en) * | 1987-10-07 | 1989-09-05 | Houghton Mifflin Company | Sentence analyzer |
US4914590A (en) * | 1988-05-18 | 1990-04-03 | Emhart Industries, Inc. | Natural language understanding system |
-
1989
- 1989-05-18 JP JP1124891A patent/JP2963463B2/ja not_active Expired - Fee Related
-
1990
- 1990-05-10 US US07/521,559 patent/US5029085A/en not_active Expired - Fee Related
- 1990-05-17 DE DE4015905A patent/DE4015905C2/de not_active Expired - Fee Related
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57132270A (en) * | 1981-02-09 | 1982-08-16 | Yoshio Hida | Human intervening method for factor of failure in decision on meaning by machine translation |
JPS58101365A (ja) * | 1981-12-14 | 1983-06-16 | Hitachi Ltd | 機械翻訳システム |
EP0118187A1 (de) * | 1983-01-28 | 1984-09-12 | Texas Instruments Incorporated | Menü-gestütztes, natürliche Sprache verstehendes System |
JPS59140582A (ja) * | 1983-01-31 | 1984-08-11 | Hitachi Ltd | 自然言語翻訳援助方式 |
JPS6118073A (ja) * | 1984-07-04 | 1986-01-25 | Hitachi Ltd | 校正方式 |
JPS6180362A (ja) * | 1984-09-26 | 1986-04-23 | Sharp Corp | 翻訳装置 |
JPS6190269A (ja) * | 1984-10-08 | 1986-05-08 | Sharp Corp | 翻訳方式 |
JPS61278970A (ja) * | 1985-06-03 | 1986-12-09 | Hitachi Ltd | 自然言語処理装置における構文解析結果の表示及び校正のための制御方法 |
JPS62271060A (ja) * | 1986-05-20 | 1987-11-25 | Toshiba Corp | 機械翻訳システム |
JPS62290976A (ja) * | 1986-06-11 | 1987-12-17 | Hitachi Ltd | 翻訳支援装置 |
DE3733674A1 (de) * | 1986-10-03 | 1988-04-21 | Ricoh Kk | Sprachanalysator |
JPS6398072A (ja) * | 1986-10-15 | 1988-04-28 | Hitachi Ltd | 曖昧修飾関係検出方式 |
DE3723078A1 (de) * | 1987-07-11 | 1989-01-19 | Philips Patentverwaltung | Verfahren zur erkennung von zusammenhaengend gesprochenen woertern |
Non-Patent Citations (1)
Title |
---|
SICKERT, Klaus: "Automatische Spracheingabe und Sprachausgabe", Verlag Markt & Technik, Haar bei München 1983, S. 367-390 * |
Also Published As
Publication number | Publication date |
---|---|
JP2963463B2 (ja) | 1999-10-18 |
DE4015905A1 (de) | 1990-11-22 |
US5029085A (en) | 1991-07-02 |
JPH02302876A (ja) | 1990-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE4015905C2 (de) | Sprachanalyseeinrichtung, -verfahren und -programm | |
DE69530816T2 (de) | Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis | |
DE3317325C2 (de) | ||
DE69814589T2 (de) | Spracherkennung unter verwendung mehrerer spracherkenner | |
DE19952769B4 (de) | Suchmaschine und Verfahren zum Abrufen von Informationen mit Abfragen in natürlicher Sprache | |
DE60032846T2 (de) | Verfahren und System zur Anbietung von Alternativen für von stochastischen Eingabequellen abgeleitete Texte | |
DE19709968C2 (de) | Verfahren und System zum Übersetzen eines Dokumentes | |
DE60004862T2 (de) | Automatische bestimmung der genauigkeit eines aussprachewörterbuchs in einem spracherkennungssystem | |
DE60201262T2 (de) | Hierarchische sprachmodelle | |
DE602005000308T2 (de) | Vorrichtung für sprachgesteuerte Anwendungen | |
DE112014005354T5 (de) | Dialog-management-system und dialog-management-verfahren | |
DE3615972A1 (de) | Zweisprachiges uebersetzungssystem mit eigen-intelligenz | |
DE3616011A1 (de) | Uebersetzungsgeraet | |
WO1998041930A1 (de) | Verfahren zur automatischen generierung einer zusammenfassung von einem text durch einen rechner | |
DE69819690T2 (de) | Spracherkennungsvorrichtung unter verwendung eines befehlslexikons | |
DE19922974A1 (de) | Verfahren und Vorrichtung zur Bearbeitung eines Dokuments | |
DE60123153T2 (de) | Sprachgesteuertes Browsersystem | |
DE10008502C2 (de) | Anapher-Analysevorrichtung mit Vorgängerkandidatenzurückweisungseinrichtung unter Verwendung eines Kandidatenzurückweisungsentscheidungsbaums | |
DE60006479T2 (de) | Verfahren und Gerät zur Analyse eines Denksystems | |
DE19849855C1 (de) | Verfahren zur automatischen Generierung einer textlichen Äußerung aus einer Bedeutungsrepräsentation durch ein Computersystem | |
DE102020215954A1 (de) | Dialogsystem und verfahren zum steuern desselben | |
DE102009006857A1 (de) | Verfahren zum automatischen Klassifizieren eines Textes durch ein Computersystem | |
DE112021006602T5 (de) | Verfeinern von abfrage-erzeugungsmustern | |
DE60126948T2 (de) | Interaktive dialoge | |
EP1240775B1 (de) | Kommunikationssystem und verfahren zum bereitstellen eines internet-zugangs über ein telefon |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8131 | Rejection | ||
8170 | Reinstatement of the former position | ||
8304 | Grant after examination procedure | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |