DE19615437C1 - Video recorder programming method - Google Patents

Video recorder programming method

Info

Publication number
DE19615437C1
DE19615437C1 DE1996115437 DE19615437A DE19615437C1 DE 19615437 C1 DE19615437 C1 DE 19615437C1 DE 1996115437 DE1996115437 DE 1996115437 DE 19615437 A DE19615437 A DE 19615437A DE 19615437 C1 DE19615437 C1 DE 19615437C1
Authority
DE
Germany
Prior art keywords
video recorder
speech
program
database
programming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE1996115437
Other languages
German (de)
Inventor
Alexander Prof Dr Waibel
Ivica Rogina
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universitaet Karlsruhe
Original Assignee
Universitaet Karlsruhe
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universitaet Karlsruhe filed Critical Universitaet Karlsruhe
Priority to DE1996115437 priority Critical patent/DE19615437C1/en
Application granted granted Critical
Publication of DE19615437C1 publication Critical patent/DE19615437C1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning

Abstract

The method involves generating the video recorder (1) programming information from the external speech and an internal database. The control signals are natural, spontaneously spoken speech signals received by a continuous speech detector. A parser operated in conjunction with the detector to analyse, extract and categorise the speech signals into case frames. The internal database is dynamically determined. A dialogue is conducted to resolve the ambiguities and repetitions, and to perform modifications. The dynamic determination of the database involves dynamically updating the television programme.

Description

Die Erfindung betrifft ein Verfahren und eine Einrichtung zur Programmierung eines Videorecorders.The invention relates to a method and a device for programming a VCR.

Eine der häufigsten Klagen von Videorecorderbesitzern ist diejenige, daß es sehr schwierig ist, zu verstehen, wie ein Videorecorder zu programmieren ist. Die Problematik wird auch dadurch sichtbar, daß Methoden, die das Programmieren erleichtern, gesucht werden. Durchgesetzt hat sich zum Beispiel das SHOWVIEW Verfahren, das das Programmieren einer Sendung auf das Abtippen einer Ziffernfolge aus einer Fernsehzeitschrift beschränkt. Alternative Varianten dieser Methode bieten die Möglichkeit, mit Hilfe eines Handscanners sog. Barcodes aus Fernsehzeitschriften einzulesen. Das Verfahren hat allerdings die Nachteile, daß eine Fernsehzeitschrift mit SHOWVIEW Codes vorhanden sein muß, und daß in naher Zukunft, wenn hunderte von Sendern verfügbar sein werden, keine Zeitschrift mehr alle benötigten SHOWVIEW Codes enthalten wird. Außerdem hat sich SHOWVIEW in anderen Ländern außer Deutschland noch nicht durchgesetzt. Ein weiterer Nachteil dieser Methode ist die mangelnde Flexibilität bei unvorhergesehenen Programmänderungen. So ist es schwierig, den SHOWVIEW Code für eine gerade ins Programm auf genommene Sondersendung zu erhalten. One of the most common complaints from VCR owners is that it's very difficult to understand how to program a video recorder. The The problem also becomes apparent when methods, that make programming easier. For example, the SHOWVIEW has prevailed Procedure for programming a program on the Typing a sequence of digits from a TV magazine limited. Alternative variants this method offer the possibility of using a Hand scanners so-called barcodes from television magazines read in. However, the process has the disadvantages that a television magazine with SHOWVIEW codes must exist, and that in the near future, if hundreds of channels will be available, none Magazine more all required SHOWVIEW codes is included. Besides, SHOWVIEW has been in others Countries other than Germany have not yet been implemented. On Another disadvantage of this method is the lack of it Flexibility in the event of unforeseen program changes. So it is difficult to get the SHOWVIEW code straight to receive a special program recorded in the program.  

Es besteht auch bereits die Möglichkeit, Fernsteuerungen per Sprache zu bedienen. So sind z. B. aus der AT-PS 376 538 Fernsteuerungen bekannt, die mit Sprachanalysatoren gekoppelt sind und bestimmte Worte als Steuerbefehle erkennen und entsprechend umsetzen können. Bei diesen Sprachanalysatoren handelt es sich jedoch um 1 : 1-Einzelworterkenner, die ausschließlich die ihnen bekannten (zuvor eingespeisten) Worte aufnehmen und umsetzen, unabhängig davon, in welchem Zusammenhang sie gesprochen wurden. Das hat unter anderem den Nachteil, daß Steuerbefehle ausgelöst werden können, ohne daß dies vom Benutzer beabsichtigt war, allein deshalb, weil in einem beliebigen Gespräch, das im Empfangsbereich des Sprachanalysators stattgefunden hat, ein entsprechendes Wort gefallen. Zur Beseitigung dieses Nachteils wird in der AT-PS 376 538 vorgeschlagen, den Sprachanalysator mit einem Mikrophon zu koppeln, das eine sehr eng begrenzte Reichweite hat und praktisch nur solche Worte aufnimmt, die gezielt in das Mikrophon hineingesprochen werden.There is also the possibility Operate remote controls by voice. So z. B. known from AT-PS 376 538 remote controls with Speech analyzers are coupled and certain words recognize them as control commands and implement them accordingly can. These are speech analyzers however, by 1: 1 single word recognizers, the only the words known to them (previously fed in) record and implement, regardless of which Context they were spoken to. That has under another disadvantage that control commands are triggered can be done without the user's intention was simply because in any conversation, that in the reception area of the speech analyzer a corresponding word has been given. To eliminate this disadvantage is in the AT-PS 376 538 proposed using the speech analyzer to pair a microphone that is a very narrowly limited Has reach and practically only takes up such words that are specifically spoken into the microphone.

Die EP 0 496 492 A1 beschreibt ebenfalls einen Videorecorder, der durch Sprachsignale gesteuert wird, wobei auch hier als Sprachsignal nicht die natürliche, spontan gesprochene Umgangssprache verwendet werden kann, sondern konkrete, vorbestimmte Einzelwort- Instruktionen wie z. B.: "no", "yes", "return" oder "stop" gegeben werden müssen. Unklare oder falsche Sprachsignale werden nicht verstanden und im Zweifel ignoriert.EP 0 496 492 A1 also describes one VCR controlled by voice signals although the natural, spontaneously spoken slang can be used can, but concrete, predetermined single-word Instructions such as For example: "no", "yes", "return" or must be given "stop". Unclear or wrong Speech signals are not understood and in doubt ignored.

Alle diese sprachgesteuerten Fernsteuerungen haben den Nachteil, daß der mit ihnen gekoppelte Sprachanalysator keine kontinuierliche Sprache erkennt, und daß überhaupt nur solche Einzelworte bzw. -sprachsignale erkannt werden, die zuvor in eine konstante Datenbank eingespeist wurden.All of these voice-operated remote controls have that Disadvantage that the speech analyzer coupled with them does not recognize continuous speech, and that only such single words or speech signals at all  be recognized previously in a constant database were fed.

Der vorliegenden Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur Programmierung eines Videorecorders bereitzustellen, das möglichst ergonomisch ist und mit dem die genannten Nachteile der im Stand der Technik bekannten Verfahren vermieden sind.The present invention is based on the object a method of programming a VCR provide that is as ergonomic as possible and with which the disadvantages mentioned in the prior art known methods are avoided.

Eine Lösung dieser Aufgabe besteht in einem Verfahren der eingangs genannten Art, bei dem die Programmierinformation auf der Grundlage eines externen Sprachsignals und einer internen Datenbasis (Datenvorrat) generiert wird, wobei die Steuersignale natürliche, spontan gesprochene Sprachsignale sind, die von einem Kontinuierliche-Sprache-Erkenner und einem damit zusammenwirkenden Parser aufgenommen, analysiert, extrahiert und in "case-frames" kategorisiert werden,wobei die interne Datenbasis (der Datenvorrat) dynamisch festgelegt wird, wobei eine Dialogführung zur Auflösung von Ambiquitäten, Widersprüchen und für Modifikationsvorschläge vorgesehen ist, und wobei die dynamische Festlegung der Datenbasis durch die dynamische Aktualisierung des Fernsehprogramms erfolgt.One solution to this problem is a procedure of the type mentioned, in which the Programming information based on an external Voice signal and an internal database (Data pool) is generated, the control signals are natural, spontaneously spoken speech signals that of a continuous language recognizer and one the parser interacting with it was recorded, analyzed, extracted and categorized into "case frames" the internal database (the data pool) is determined dynamically, with a dialog guide to Resolution of ambiquities, contradictions and for Modification proposals are provided, and the dynamic definition of the database by the dynamic update of the television program takes place.

Mit diesem Verfahren ist es erstmals möglich, einen Videorecorder dadurch zu programmieren, daß ihm der entsprechende Programmwunsch bzw. Befehl einfach mittels Sprachsignalen gesagt wird, z. B. mit natürlicher Sprache und zwar in der Art: "Nimm die Tagesschau im Ersten auf". Insbesondere Menschen die mit den technischen Erfordernissen der herkömmlichen Programmierverfahren überfordert sind, wie z. B. alte Menschen, kranke Menschen und Kinder, können so mit Hilfe des erfindungsgemäßen Verfahrens ohne irgendwelche technischen Vorkenntnisse und ohne besondere Einarbeitung einen Videorecorder zur Aufnahme von Fernsehsendungen beliebig programmieren. Es ist keine Tastatur mehr erforderlich, auch keine Zeitschrift mit ShowView Codes und auch kein Trainieren eines Einzelkommandoerkenners.With this procedure it is possible for the first time to To program VCRs that the corresponding program request or command simply is said by means of voice signals, e.g. B. with natural language in the way: "Take that Tagesschau in the first on ". Especially people who with the technical requirements of conventional Programming methods are overwhelmed, such. B. old People, sick people and children can do so Help of the method according to the invention without any previous technical knowledge and without  special training to record a video recorder program TV programs as you like. It is no more keyboard needed, neither Magazine with ShowView codes and no training a single command recognizer.

Das Spracherkennungsvokabular wird dynamisch festgelegt, und zwar im Fall der Programmierung für die Aufzeichnung von Fernsehsendungen beispielsweise durch die Fernsehprogrammdatenbasis. The speech recognition vocabulary is becoming dynamic set, in the case of programming for the Recording of television programs, for example, by the television program database.  

Die Erfindung betrifft auch eine Einrichtung zur Programmierung eines über eine Fernbedienung bedienbaren Videorecorder auf der Grundlage des vorgenannten erfindungsgemäßen Verfahrens. Diese Einrichtung umfaßt einen Prozessor (Datenverarbeitungs­ einrichtung) zur Bereitstellung der internen Datenbasis, einen Sprach-Erkenner, der mit dem Prozessor gekoppelt ist und der über ein Mikrophon gesteuert werden kann, und eine Steuerkarte, die einerseits ebenfalls mit dem Prozessor und andererseits unmittelbar mit der Fernbedienung und mittelbar mit dem Videorecorder so verbunden ist, daß Sprachsignale, die über den Sprach-Decoder zugeleitet werden, im Prozessor den entsprechenden Programmsignalen zugeordnet und ausgelesen werden, und die dann ihrerseits über die Fernbedienung den Videorecorder entsprechend pro­ grammieren.The invention also relates to a device for Programming one using a remote control operable video recorder based on the aforementioned method according to the invention. This Device comprises a processor (data processing facility) to provide internal Database, a speech recognizer that works with the Processor is coupled and via a microphone can be controlled, and a control card that on the one hand also with the processor and on the other hand directly with the remote control and indirectly with the VCR is connected so that voice signals that are passed through the voice decoder in the processor assigned to the corresponding program signals and be read out, and then in turn via the Remote control the video recorder accordingly pro gramming.

Mit dieser Einrichtung ist es möglich, Programmierdialoge direkt mit dem Videorecorder zu führen. Der Videorecorder erhält die notwendigen Informationen bezüglich des aktuell zur Verfügung stehenden Fernsehprogramms entweder von Videotexten von Disketten oder von CD-Rom-Disks oder über ein Modem aus einer Mailbox oder dem Internet mit Hilfe des Prozessors, der vorzugsweise in einem PC (Personalcomputer) oder in einem (gegebenenfalls reduzierten) Notebook-PC installiert ist. Im Fall von Videotexten als Informationsquelle sollte der Videorecorder mit dem Prozessor über einen Videotext- Umwandler funktional verbunden sein. Es ist ferner möglich mit einem Standard-Videorecorder (ohne integriertem Notebook) mittels programmierbarer Fernbedienung zu arbeiten. With this facility it is possible Programming dialogs directly with the video recorder to lead. The video recorder receives the necessary ones Information regarding the currently available standing television program either from teletext by Diskettes or from CD-Rom discs or via a modem a mailbox or the Internet using the Processor, preferably in a PC (Personal computer) or in one (if applicable reduced) Notebook PC is installed. In case of Teletext as a source of information should VCR with the processor via a teletext Converter be functionally connected. It is further possible with a standard video recorder (without integrated notebook) by means of programmable Remote control to work.  

Aus dem erhaltenen Informationsvorrat werden die von dem gesprochenen Befehl bzw. Wunsch betroffenen Daten herausgesucht und zur Programmierung eingesetzt.The information received from the the spoken command or request affected data selected and used for programming.

Um gegebenenfalls unklare Befehlseingaben klarzustellen, ist bei einer bevorzugten Ausführungsform der Erfindung vorgesehen, den Sprach-Erkenner zusätzlich mit einem Lautsprecher zu koppeln, so daß aufgetretene Unklarheiten vom Prozessor in eine entsprechende Frage umgewandelt werden können, die dann über den Lautsprecher in Form einer gesprochenen Rückfrage angegeben wird.To possibly unclear command inputs Clarifying is one of the preferred ones Embodiment of the invention provided the Speech recognizer additionally with a loudspeaker couple so that any ambiguities from the processor can be converted into a corresponding question which then over the speaker in the form of a spoken query is specified.

Die Erfindung wird im folgenden anhand von in der Zeichnung dargestellten Ausführungsbeispielen und anhand von Funktionsbeispielen näher erläutert. Es zeigt:The invention is described below with reference to in the Drawing illustrated embodiments and explained in more detail using functional examples. It shows:

Fig. 1 einen funktionalen Schemaaufbau einer erfindungsgemäßen Einrichtung zum Programmieren eines Videorecorders, und Fig. 1 is a functional schematic construction of a device according to the invention for programming a video recorder, and

Fig. 2 eine etwas detailliertere bzw. integrierte Funktionsdarstellung der Einrichtung zum Programmieren eines Videorecorders nach Fig. 1 FIG. 2 shows a somewhat more detailed or integrated functional representation of the device for programming a video recorder according to FIG. 1

Die in Fig. 1 dargestellte Einrichtung umfaßt einen handelsüblichen Notebook-PC 6 mit mindestens drei Schnittstellen 5, 9, 11, und einer Hauptplatine, die mit einem ausreichend starken Prozessor, beispielsweise einem 486 DX-Prozessor, und einem RAM-Arbeitsspeicher (mit mindestens 8 MB) ausgerüstet ist. Der Notebook-PC 6 umfaßt ferner einen Festplattenspeicher mit einer Speicherkapazität von beispielsweise 40 MB, eine Soundkarte (Sprach-Ausgabe) 12 mit einem Auflösevermögen von beispielsweise 8 Bit oder 16 Bit einschließlich einem dazugehörigen Softwaretreiber und Meß-Steuer-/Regelkarte(n) 3 einschließlich zugehöriger Treiber zum Bedienen von mehreren (mindestens 15) Schalter (9 V, 100 mA). Als Steuer-/ Regelkarte 3 kann ein einfaches steuerbares Transistor- Array verwendet werden.The device shown in Fig. 1 comprises a commercially available notebook PC 6 with at least three interfaces 5 , 9 , 11 , and a main board with a sufficiently strong processor, for example a 486 DX processor, and a RAM memory (with at least 8 MB). The notebook PC 6 also includes a hard disk memory with a storage capacity of, for example, 40 MB, a sound card (voice output) 12 with a resolution of, for example, 8 bits or 16 bits, including an associated software driver and measurement control / control card (s) 3 including associated driver for operating several (at least 15) switches (9 V, 100 mA). A simple controllable transistor array can be used as the control card 3 .

An die Soundkarte 12 ist über Kabel 13 ein Mikrophon 14 angeschlossen, das die Sprachbefehle empfängt und weiterleitet.A microphone 14 is connected to the sound card 12 via cable 13 and receives and forwards the voice commands.

In dem Notebook PC 6 ist ein Spracherkennungsmodul implementiert. Zum Trainieren dieses Sprachmoduls kann ein semikontinuierliches "Hidden Markov Modell" verwendet werden, das auf Speicherverbrauch und Laufzeitverhalten optimiert ist. Das Vokabular sollte mindestens die Uhrzeiten und Datumsangaben, sowie die häufigsten Steuerwörter umfassen, und beispielsweise im Bereich zwischen 300 und 500 Wörtern liegen. Als Grammatik wird vorzugsweise eine Standard "Bigramm- Grammatik" eingesetzt. Die Trainingsdaten können zunächst beschränkt sein und die Erkennung kann sprecherabhängig erfolgen. Um eine sprecherunabhängige Erkennung zu erreichen, können Sprachaufnahmen von vielen verschiedenen Sprechern gesammelt und eingegeben werden. Die Funktionalität des Spracherkenners kann Off-Line (also ohne Anschluß an einen Videorecorder oder eine Fernsteuerung) ausgewertet und optimiert werden. Für den Anfang wird nur eine kleine abgelesene Datenbasis von einem Sprecher benötigt.A speech recognition module is implemented in the notebook PC 6 . A semi-continuous "Hidden Markov Model" can be used to train this language module, which is optimized for memory consumption and runtime behavior. The vocabulary should include at least the times and dates, as well as the most common control words, and should be between 300 and 500 words, for example. A standard "bigram grammar" is preferably used as the grammar. The training data can initially be limited and the recognition can take place depending on the speaker. In order to achieve speaker-independent recognition, voice recordings from many different speakers can be collected and entered. The functionality of the speech recognizer can be evaluated and optimized off-line (i.e. without connection to a video recorder or remote control). To begin with, only a small, read database from a speaker is required.

In dem Notebook-PC 6 ist außerdem ein einfacher Parser implementiert. Der Parser ist vorzugsweise semantisch basiert und in der Lage, aus einem gesprochenen Satz die Anfangs- und Endzeiten eines Aufnahmewunsches zu extrahieren. Außerdem erkennt er die häufigsten Recorderbedienungen (Bandspulen, Wiedergabe etc.). Die Ausgabe des Parsers erfolgt in einem Format, das von der Software, die die Steuer-/Regelkarte 3 steuert, gelesen werden kann.A simple parser is also implemented in the notebook PC 6 . The parser is preferably based on semantics and is able to extract the start and end times of a recording request from a spoken sentence. It also recognizes the most common recorder operations (reels, playback, etc.). The parser is output in a format that can be read by the software that controls the control card 3 .

Die Software für die Steuerung der Steuer-/Regelkarte 3 ist ebenfalls in dem Notebook-PC 6 implementiert. Diese Software ist in der Lage, die Ausgaben des Parsers in Steuersignale für die Steuer-/Regelkarte 3, die an die Fernbedienung 2 angeschlossen ist, zu übersetzen. Sie ist von der Art des verwendeten Videorecorders 1 bzw. von dessen Infrarot-Fernbedienung 2 abhängig.The software for controlling the control card 3 is also implemented in the notebook PC 6 . This software is able to translate the outputs of the parser into control signals for the control card 3 , which is connected to the remote control 2 . It depends on the type of video recorder 1 used or on its infrared remote control 2 .

Das Notebook PC 6 ist mit einer Infrarot-Fernbedienung 2 eines handelsüblichen Videorecorders 1 verbunden, indem die Schalter der einzelnen Tasten innerhalb des Fernbedienungsgehäuses mit Kabeln 4 verbunden sind, die wiederum mit der Steuer-/Regelkarte 3 verbunden sind. Auf diese Art ist es möglich, jede beliebige Tastenfolge auf der Fernbedienung 2 auszulösen. Über die Software können nun die Funktionen des Videorecorders 1 direkt angesprochen werden. (Die Bedienung des Videorecorders 1 kann auch direkt über eine IR-Diode erfolgen).The notebook PC 6 is connected to an infrared remote control 2 of a commercially available video recorder 1 by the switches of the individual buttons within the remote control housing being connected with cables 4 , which in turn are connected to the control card 3 . In this way it is possible to trigger any key sequence on the remote control 2 . The functions of the video recorder 1 can now be addressed directly via the software. (The video recorder 1 can also be operated directly via an IR diode).

Das Gesamtsystem kann dadurch evaluiert und optimiert werden, daß Sätze zum Programmieren des Videorecorders 1 in das Mikrophon 14 gesprochen werden, wobei die Funktionalität und das Zusammenarbeiten aller Komponenten ausgewertet und eventuelle Schwachstellen behoben werden.The overall system can be evaluated and optimized in that sentences for programming the video recorder 1 are spoken into the microphone 14 , the functionality and the cooperation of all components being evaluated and any weak points being remedied.

An den Notebook-PC 6 ist ein handelsüblicher Videotextdecoder 7 angeschlossen, der über ein Koaxialkabel 10 an den Ausgang 8 des Videorecorders 1 angeschlossen ist. So ist es möglich, Videotextseiten zu empfangen und auszulesen. Über die Fernbedienung 2 kann der Tuner 17 (Fig. 2) des Videorecorders 1 auf verschiedene Programme geschaltet werden, so daß Videotextselten von verschiedenen Sendern empfangen werden können.A commercially available teletext decoder 7 is connected to the notebook PC 6 and is connected to the output 8 of the video recorder 1 via a coaxial cable 10 . It is possible to receive and read teletext pages. Via the remote control 2 , the tuner 17 ( Fig. 2) of the video recorder 1 can be switched to different programs, so that teletext can be received by different stations.

In den Videorecorder 1 wird die Software für das Auslesen der Videotextseiten implementiert. Die Software kann auf das Lesen von standardisierten Seiten der üblichen Fernsehkanäle, beispielsweise des ARD/ZDF Videotextes, beschränkt sein. Ebensogut kann diese Software (videotextgesteuert) modifizierbar und an sich verändernde Standards verschiedener Videotextanbieter anpaßbar sein.The software for reading out the teletext pages is implemented in the video recorder 1 . The software can be limited to reading standardized pages of the usual television channels, for example the ARD / ZDF teletext. This software can also be modified (teletext controlled) and adapted to changing standards of different teletext providers.

In den Videorecorder 1 wird außerdem ein sehr einfaches Datenbankmodul implementiert, das die aus dem Videotext ausgelesenen Sendungen und ihre Zeiten verwaltet. Die Software kann darauf beschränkt sein, nur die Start- und Endzeiten, das Programm, sowie den Titel der Sendung zu speichern. Ebensogut kann eine Software verwendet werden, die in der Lage ist, noch weitere Informationen zur Sendung zu speichern, wie z. B. Namen von Darstellern, Titel von Einzelthemen einer Reportage, oder ähnliche Daten, die sich gezielt aus dem Videotext herauslesen lassen. Als Ausblick sei hier angemerkt, daß viele Sender die Möglichkeit bieten, einzelne Videotextseiten für Werbezwecke zu mieten. Ein speziell für den sprachgesteuerten Videorecorder vorbereitetes und über Videotext gesendetes Programmagazin, in dem die benötigten Daten vereinheitlicht und leicht aus lesbar sind, würde sich als besonders geeignete Informationsquelle für die erfindungsgemäße Einrichtung anbieten. In the video recorder 1 , a very simple database module is also implemented, which manages the programs read from the teletext and their times. The software can be limited to storing only the start and end times, the program and the title of the program. Software can also be used which is capable of storing further information about the program, such as. B. names of actors, titles of individual topics of a report, or similar data that can be read specifically from the teletext. As a view, it should be noted here that many broadcasters offer the possibility of renting individual teletext pages for advertising purposes. A program magazine specially prepared for the voice-controlled video recorder and sent via teletext, in which the required data is standardized and easily readable, would be a particularly suitable source of information for the device according to the invention.

Eine weitere, vorteilhafte Alternative wäre die Verteilung der Fernsehprogramminformationen über Computer-Disketten (oder auch CD-Rom Disks). Wie bereits erwähnt ist es auch möglich die Fernsehprogramminformationen von einer Mailbox oder vom Internet abzurufen. Das Lesegerät für das Programmagazin sollte Teil des Videorecorders 1 sein, d. h. der Videorecorder 1 wäre in diesem Fall mit einem Disketten- oder CD-Rom Laufwerk auszustatten (vergleiche Fig. 2: Bezugszeichen 21). Es ist aber auch möglich, die betreffenden Laufwerke in dem Notebook-PC 6 zu installieren und über handelsübliche Schnittstellen mit dem Videorecorder 1 zu koppeln.Another advantageous alternative would be the distribution of television program information via computer disks (or CD-Rom disks). As already mentioned, it is also possible to access the television program information from a mailbox or from the Internet. The reader for the program magazine should be part of the video recorder 1 , ie the video recorder 1 would in this case be equipped with a diskette or CD-ROM drive (see FIG. 2: reference number 21 ). However, it is also possible to install the relevant drives in the notebook PC 6 and to couple them to the video recorder 1 via commercially available interfaces.

Die aus den Videotextseiten entnommenen Informationen bzw. Daten können direkt auf der Festplatte des Notebook-PC 6 abgelegt und von dort gelesen werden.The information or data taken from the teletext pages can be stored directly on the hard disk of the notebook PC 6 and read from there.

Um die zur Programmierung benötigten Kommandos aus den Videotextseiten zu lesen und um die Parameter des Erkenners zu modifizieren ist ein Videotext­ steuerinterface zwischen Spracherkenner und der Videotextlesesoftware implementiert. Das Interface bzw. diese Software kann auf die Anpassung des Vokabulars und der Bigramm-Grammatik beschränkt sein. Ebensogut kann eine Software verwendet werden, die alle anderen Parameter beeinflussen kann oder sogar den gesamten Erkenner durch eine neuere verbesserte Version austauschen kann - beispielsweise nach Art der Softwareverteilung über Videotext in Form des VIDEODAT Verfahrens.In order to use the commands required for programming from the To read teletext pages and to adjust the parameters of the Modifying recognizer is a teletext control interface between speech recognizer and the Teletext reading software implemented. The interface or this software can be adapted to the Vocabulary and bigram grammar may be limited. Software can be used just as well, all can affect other parameters or even the entire recognizer through a newer improved version can exchange - for example by the type of Software distribution via teletext in the form of VIDEODAT Procedure.

Das Gesamtsystem kann dadurch evaluiert und optimiert werden, daß ein Tester Kommandos spricht, zu deren Ausführung es nötig ist, die videotexterzeugte Datenbank zu befragen und dann Programmiersequenzen (zum Beispiel über die Fernbedienung 2) an den Videorecorder 1 zu schicken, und daß anschließend alle Komponenten und ihre Zusammenarbeit ausgewertet und gegebenenfalls verändert werden. Es ist auch denkbar die Programmiersequenzen direkt über eine IR(Infrarot)- Diode an den Videorecorder 1 zu schicken.The overall system can be evaluated and optimized in that a tester speaks commands, for the execution of which it is necessary to consult the teletext-generated database and then to send programming sequences (for example via the remote control 2 ) to the video recorder 1 , and then all components and their cooperation will be evaluated and changed if necessary. It is also conceivable to send the programming sequences directly to the video recorder 1 via an IR (infrared) diode.

Um dem Benutzer zu bestätigen, daß sein Kommando korrekt verstanden wurde, und um ihm gegebenenfalls Gelegenheit zu geben, ein Mißverständnis aufzulösen und das falsch verstandene Kommando zu wiederholen, ist eine Feedback-Anzeige, entweder optisch über ein Display oder akustisch über eine Sprachausgabe vermittels Sprachsyntheseprogramm und Lautsprecher 16 vorgesehen. Im Fall der Erfindungsvariante mit Sprachausgabe ist auf dem Notebook PC 6 ein Sprachsyntheseprogramme installiert und der Ausgang der Soundkarte 12 ist mit einem einfachen Lautsprecher 16 verbunden. In dem Notebook-PC 6 kann zusätzlich ein Dialogmodul implementiert sein, das eine einfache Dialogführung zwischen Benutzer und Videorecorder ermöglicht, beispielsweise eine Bestätigung der verstandenen Kommandos, d. h. eine Ausgabe der Art: "Ich werde die Sendung im ersten Programm von 20:15 Uhr bis 21:00 Uhr aufzeichnen" oder auch kompliziertere Dialoge, in deren Verlauf Unklarheiten ("Welche Tagesschau meinen Sie?") im Dialog mit dem Benutzer aufgelöst werden, Fehlprogrammierungen erkannt werden ("Morgen kommt kein Western."), Vorschläge gemacht werden ("Sie sollten dafür eine Kassette mit längerer Spieldauer einlegen."), und so weiter.In order to confirm to the user that his command has been understood correctly and, if necessary, to give him the opportunity to resolve a misunderstanding and to repeat the misunderstood command, there is a feedback display, either optically via a display or acoustically via a speech output using the speech synthesis program and speakers 16 are provided. In the case of the variant of the invention with speech output, a speech synthesis program is installed on the notebook PC 6 and the output of the sound card 12 is connected to a simple loudspeaker 16 . A dialog module can also be implemented in the notebook PC 6 , which enables simple dialog guidance between the user and the video recorder, for example a confirmation of the commands understood, ie an output of the type: "I will start the program in the first program from 8:15 pm to 21:00 o'clock record "or more complicated dialogues, in the course of which ambiguities (" Which day show do you mean? ") Are resolved in the dialog with the user, incorrect programming is recognized (" Tomorrow no Western. "), Suggestions are made For this you should insert a cassette with a longer playing time. "), And so on.

Das Interface zwischen der Videotexteinheit und dem restlichen Programm kann eine einfache Standard- Kommandooberfläche (Shell) umfassen oder auch erweitert sein, wobei im Prinzip die gesamte Software verändert werden kann.The interface between the teletext unit and the remaining program can be a simple standard Command surface (shell) include or expanded  be, in principle, the entire software changes can be.

Zur Erweiterung der Dialogführung ist das Datenbankmodul so aufzubauen bzw. zu programmieren, daß es in den Anfragen Unklarheiten und Fehler erkennt und diese im Dialog mit dem Benutzer beseitigt. Die Bigramm-Grammatik wird entsprechend dem aktuellen Dialogzustand adaptiert, d. h. die aktuell zu erwartenden Worte des Benutzers werden mit einer höheren Wahrscheinlichkeit erkannt als die nicht zu erwartenden.This is to expand the dialogue management To set up or program the database module that it recognizes ambiguities and errors in the requests and eliminated them in dialog with the user. The Bigram grammar is updated according to the current one Dialog state adapted, d. H. the currently too expected words of the user are marked with a recognized higher probability than that not expecting.

Zum Aufbau einer Datensammlung für eine sprecherunabhängige Erkennung werden sog. Trainingsdaten gesammelt, d. h. Sprechproben von zahlreichen (unter Umständen mehreren hundert) verschiedenen Personen, um eine ausreichende Bandbreite von verschiedenen Stimmen und Sprechstilen zusammenzutragen. Die Sprechproben sollten die Form von Programmieranweisungen für einen Videorecorder zum Aufzeichnen von Fernsehsendungen haben.To build a data collection for a speaker-independent recognition are so-called Training data collected, d. H. Speech samples from numerous (possibly several hundred) different people to have a sufficient range of different voices and speaking styles to collect. The speech samples should take the form of Programming instructions for a video recorder for Have recordings of television programs.

Die somit erhaltenen Sprechproben werden transkribiert, d. h. der genaue Inhalt des Gesagten wird in eine geeignete Computersprache übersetzt, und ein sprecherunabhängiger Spracherkenner wird mit diesen Daten trainiert. Es wird eine solche Worterkennungsrate anzustreben sein, daß der Erkenner stets versteht, was gesagt wurde um den Videorecorder korrekt anzusteuern.The speech samples thus obtained are transcribed, d. H. the exact content of what is said is appropriate computer language translated, and a speaker-independent speech recognizer becomes with these Data trained. There will be such a word recognition rate to be striven for so that the recognizer always understands what was said to control the video recorder correctly.

Die in Fig. 1 beschriebene prototyp-ähnliche Einrichtung kann unter Umständen auch als externes Zusatzgerät ausgeführt werden. The prototype-like device described in FIG. 1 can also be designed as an external additional device under certain circumstances.

In Fig. 2 ist eine Variante der erfindungsgemäßen Einrichtung dargestellt, bei der der Notebook-PC 6, der Videotext-Decoder 7 und der Videorecorder 1 zu einer baulichen Einheit in einem einzigen Gehäuse 15 zusammengefaßt sind.In FIG. 2 a variant of the device according to the invention is shown in which the notebook PC 6, the teletext decoder 7 and the video recorder 1 are combined to form a structural unit in a single housing 15.

Das Gehäuse 15 enthält einen modifizierten reduzierten Notebook-PC 6′ (ohne Display, Gehäuse, Tastatur und Akku) mit Hauptplatine inklusive Prozessor, Festspeicherplatte RAM Arbeitsspeicher und Schnittstellen 5, 9, 11, 20. Außerdem kann ein Diskettenlaufwerk (Floppy-Drive) 21 vorgesehen sein. Dieser Notebook-PC 6′ ist über eine Schnittstelle 11 mit einer Soundkarte 12 verbunden. An die Soundkarte 12 ist ein Mikrophon 14 zum Empfang von akustischen Sprachsignalen, ein Lautsprecher 16 zur Ausgabe von Sprachsynthesen und ein Infrarot-Sprachsignalempfänger 29 zum Empfang von Sprachsignalen einer Fernbedienung 2 angeschlossen.The housing 15 contains a modified reduced notebook PC 6 '(without display, housing, keyboard and battery) with the main board including processor, hard disk RAM working memory and interfaces 5 , 9 , 11 , 20th In addition, a floppy drive 21 can be provided. This notebook PC 6 'is connected via an interface 11 to a sound card 12 . A microphone 14 for receiving acoustic voice signals, a loudspeaker 16 for outputting voice synthesis and an infrared voice signal receiver 29 for receiving voice signals from a remote control 2 are connected to the sound card 12 .

Über eine zweite Schnittstelle 5 ist der Notebook-PC 6′ mit einer Steuer-/Regelkarte 3, beispielsweise in Form eines einfachen Transistor-Schaltarrays zur Erzeugung der Signale für einen Videorecorder­ steuereinheit 22 verbunden. Die Signale werden über die Anschlußkabel 24 von der Steuer-/Regelkarte 3 an die Videorecorder-Steuereinheit 22 geleitet. An die Videorecorder-Steuereinheit 22 ist ein Videorecorder- Fernsehtuner 17 angeschlossen, der wiederum über den Tunerausgang 18 und Anschlußkabel 10 mit einem Videotext-Decoder 7 gekoppelt ist. Der Videotext- Decoder 7 ist über die Schnittstelle 9 mit dem Notebook-PC 6′ verbunden.Via a second interface 5 , the notebook PC 6 'is connected to a control / regulating card 3 , for example in the form of a simple transistor switching array for generating the signals for a video recorder control unit 22 . The signals are routed via the connecting cable 24 from the control card 3 to the video recorder control unit 22 . A video recorder television tuner 17 is connected to the video recorder control unit 22 , which in turn is coupled to a teletext decoder 7 via the tuner output 18 and connecting cable 10 . The teletext decoder 7 is connected via the interface 9 to the notebook PC 6 '.

Über einen Recorderausgang 8 kann die erfindungsgemäße Einrichtung an ein Fernsehgerät angeschlossen werden. The device according to the invention can be connected to a television set via a recorder output 8 .

Um die Videorecorder-Steuereinheit 22 über Infrarotsignale von Ferne zu bedienen, ist zum einen ein Infrarotsteuersignalempfänger 28 vorgesehen, der über Verbindungskabel 23 an die Videorecorder­ steuereinheit 22 angeschlossen ist, und zum anderen ein Infrarotsprachsignalempfänger 29, der mit der Soundkarte 12 verbunden ist.In order to operate the video recorder control unit 22 remotely via infrared signals, an infrared control signal receiver 28 is provided on the one hand, which is connected to the video recorder control unit 22 via connecting cable 23 , and on the other hand an infrared voice signal receiver 29 which is connected to the sound card 12 .

Die Fernbedienung 2 umfaßt gemäß Fig. 2 vorzugsweise ein Mikrophon 30 zum Empfang von Sprachsignalen, eine Sprachübertragungseinheit 27, sowie einen Infrarot- Sprachsignalsender 25 und einen Infrarot- Steuersignalsender 26, die die empfangenen und weitergeleiteten Signale an den Sprachsignalempfänger 29 der Soundkarte 12 bzw. an den Steuersignalempfänger 28 der Videorecorder-Steuereinheit 22 senden. Mit dieser Fernbedienung 2 ist es möglich, die Sprache, die in das Mikrophon 30 gesprochen wird, ähnlich wie bei kabellosen Kopfhörern bzw. Lautsprechern per Infrarotsignal an den Videorecorder zu schicken, von dem sie empfangen und so behandelt wird, als käme sie aus dem am Videorecorder 1 angebauten Mikrophon 14. Ggf. ist eine leicht modifizierte Signalvorverarbeitung nötig, um die unterschiedlichen Kanaleigenschaften der Mikrophone 14, 30 zu berücksichtigen.The remote control 2 includes as shown in FIG. 2, preferably a microphone 30 for receiving speech signals, a voice transmission unit 27, and an infrared voice signal transmitter 25 and an infrared control signal transmitter 26, the received and relayed signals to the voice signal receiver 29 of the sound card 12 and to send the control signal receiver 28 of the video recorder control unit 22 . With this remote control 2 , it is possible to send the speech that is spoken into the microphone 30 , similar to wireless headphones or loudspeakers, to the video recorder via infrared signal, from which it is received and treated as if it came from the Video recorder 1 attached microphone 14 . Possibly. a slightly modified signal preprocessing is necessary to take into account the different channel properties of the microphones 14 , 30 .

An dem Notebook-PC 6′ ist eine serielle Schnittstelle 19, vorgesehen, die an einen Schnittstellenanschluß 20 aus dem Gehäuse 15 herausführt. Über diese Schnittstelle 20 ist es möglich, den Notebook-PC 6 direkt zu bedienen, beispielsweise im Zuge einer Wartung oder Reparatur, oder um weitere Geräte daran anzuschließen, beispielsweise einen Haushaltssteuercomputer, der in natürlicher Sprache per Telefon bedienbar ist.On the notebook PC 6 ', a serial interface 19 is provided, which leads out of the housing 15 to an interface connection 20 . Via this interface 20 it is possible to operate the notebook PC 6 directly, for example in the course of maintenance or repair, or to connect further devices to it, for example a household control computer which can be operated in natural language by telephone.

Das Diskettenlaufwerk 21 bietet dem Benutzer die Möglichkeit, selbst Software-Updates (auch ohne Videotext) durchzuführen. Unter der Voraussetzung, daß eine "Fernsehzeitschrift" für sprachprogrammierbare Videorecorder auf Diskette existiert, könnte auf den Videotextteil verzichtet werden, was insbesondere dort von Vorteil ist, wo kein einheitlicher Videotext gesendet wird (wie z. B. in den USA).The floppy disk drive 21 offers the user the possibility to carry out software updates themselves (even without teletext). Provided that there is a "television magazine" for voice programmable video recorders on diskette, the teletext part could be dispensed with, which is particularly advantageous where no uniform teletext is broadcast (such as in the USA).

Die vorgesehene Software für die erfindungsgemäße Einrichtung umfaßt die folgenden Komponenten:The software provided for the invention Setup includes the following components:

  • - Das Spracherkennungsmodul zur Echtzeiterkennung kontinuierlicher sprecherunabhängiger Sprache, basierend auf "Hidden Markov"-Modellen und einer Bigramm-Grammatik und einem semantischen Parser.- The voice recognition module for real-time recognition continuous speaker-independent language, based on "Hidden Markov" models and one Bigram grammar and a semantic parser.
  • - Ein Datenbankmodul, das das aktuelle Fernsehprogramm verwaltet. Das Fernsehprogramm kann von einer Diskette oder über Videotext bezogen werden. Bei der Datenbank handelt es sich natürlich nicht um eine generische Datenbank mit eigenem Programmiergerüst. Es ist nur eine einfache Verwaltung einer relativ kleinen Menge an Daten vorgesehen.- A database module that shows the current television program managed. The television program can be from one Diskette or teletext. In the Of course, the database is not one generic database with its own programming framework. It's just a simple management of a relative small amount of data.
  • - Ein Videotextlesemodul zum "Verstehen" der Videotextseiten. Die Regeln, wie Videotextseiten zu verstehen sind, können über selbst erstellte Seiten zusammen mit anderen Kommandos an das gesamte Gerät verschickt werden.- A teletext reading module to "understand" the Teletext pages. The rules of how to view teletext pages can understand through self-made pages together with other commands to the entire device be sent.
  • - Ein Steuerprogramm für das Schalterarray, das an die Architektur und die vorhandenen Fähigkeiten des Videorecorders angepaßt ist, beziehungsweise für den Fall, daß ein handelsüblicher Videorecorder über Fernbedienung bedient wird, ein Programm zur Steuerung dieser Fernbedienung.- A control program for the switch array that is sent to the Architecture and the existing skills of  VCR is adapted, or for the Case that a commercially available VCR over Remote control is operated, a program for Control this remote.
  • - Ein Quasi-Betriebssystem, also ein Programm, das dafür zuständig ist, Kommandos von Videotextseiten oder vom Diskettenlaufwerk (Floppy-Disk) oder von der herausgeführten Seriellen Schnittstelle zu verstehen und auszuführen. Über dieses Betriebssystem ist es möglich, Einfluß auf die gesamte Software und die gespeicherten Daten (Parameter des Spracherkenners) Einfluß zu nehmen.- A quasi operating system, that is, a program that is responsible for commands from teletext pages or from the floppy disk drive or from to the serial interface understand and execute. About this It is possible to influence the operating system entire software and the stored data (Parameters of the speech recognizer).
Funktionsbeispiel 1Function example 1

Der Benutzer spricht seinen Programmierwunsch, z. B. "Ich möchte die Tagesschau aufgenommen haben", in ein Mikrophon, das z. B. in einer Fernbedienung für den Videorecorder 1 eingebaut ist. Die Sprachsignale werden über den Infrarotsender 25 der Fernbedienung 2 zum Videorecorder 1 übertragen. Dort werden sie empfangen und von einer Soundkarte 12 digitalisiert. Die Soundkarte 12 ist mit der Hauptplatine eines (gegebenenfalls reduzierten) Notebook-PC 6 verbunden. Der Notebook-PC 6 umfaßt im allgemeinen eine kleine Festplatte zur Speicherung der Spracherkennungs-/ Datenbank- und Programmiersoftware, einen Prozessor, einen RAM Hauptspeicher, ein Diskettenlaufwerk 21 und einen Videotext-Decoder 7; er kann außerdem mit einer Tastatur, einem Bildschirm, und einer eigenen Energieversorgung ausgestattet sein. Im vorliegenden Fall ist davon auszugehen, daß in der bevorzugten Ausbaustufe alle Teile im Notebook-PC 6 integriert sind.The user speaks his programming request, e.g. B. "I would like to have the Tagesschau", in a microphone that z. B. is installed in a remote control for the VCR 1 . The voice signals are transmitted to the video recorder 1 via the infrared transmitter 25 of the remote control 2 . There they are received and digitized by a sound card 12 . The sound card 12 is connected to the main board of a (possibly reduced) notebook PC 6 . The notebook PC 6 generally comprises a small hard disk for storing the speech recognition / database and programming software, a processor, a RAM main memory, a floppy disk drive 21 and a teletext decoder 7 ; it can also be equipped with a keyboard, a screen and its own power supply. In the present case it can be assumed that all parts are integrated in the notebook PC 6 in the preferred configuration.

Auf dem Notebook-PC 6 läuft ständig ein Spracherkennungsprogramm das die über die Soundkarte 12 ankommenden Sprachsignale erkennt und übersetzt (transkribiert).A speech recognition program which recognizes and translates (transcribed) the speech signals arriving via the sound card 12 is constantly running on the notebook PC 6 .

Dieses Erkennungsprogramm kann nur Worte erkennen, die in seinem Vokabular gespeichert sind.This recognition program can only recognize words that are stored in his vocabulary.

Dieses Vokabular besteht aus einem permanent vorhandenen Wortschatz solcher Wörter, die regelmäßig im Alltag verwendet werden und die für die Programmierung eines Videorecorders 1 von Bedeutung sind, sowie einem dynamischen Wortschatz, der zusätzliche Wörter enthält, die aus dem jeweils aktuellen Fernsehprogramm entnommen werden.This vocabulary consists of a permanently available vocabulary of such words that are used regularly in everyday life and that are important for programming a video recorder 1 , and a dynamic vocabulary that contains additional words that are taken from the current television program.

Das Vokabular beider Wortschätze kann dadurch erweitert werden, daß das gewünschte Wort zusammen mit seiner phonetischen Umschreibung in das Aussprachelexikon des Spracherkenners eingetragen wird. Ebensogut können nicht mehr benötigte Wörter aus dem Vokabular entfernt werden.This can expand the vocabulary of both vocabulary that the word you want along with his phonetic description in the pronunciation dictionary of the Speech recognizer is entered. Can as well Words no longer required removed from the vocabulary will.

Das Spracherkennungsprogramm erzeugt eine Hypothese, d. h. eine Folge von Wörtern, die in dem Sprachsignal erkannt wird, und liefert diese Hypothese an ein semantisches Parsermodul, d. h. ein Programm, das eine lexikalische Analyse durchführt und aus der erkannten Wortsequenz die zum Programmieren relevante Information extrahiert. Zusätzlich zur Hypothese können auch eine oder mehrere Alternativhypothesen ausgegeben werden, die dann in Erwägung gezogen werden, wenn die erste Hypothese nicht verwertbar ist, beispielsweise weil die Benutzeranweisung nicht korrekt war oder weil der Wunsch des Benutzers nicht korrekt erfüllt werden kann.The speech recognition program creates a hypothesis d. H. a sequence of words in the speech signal is recognized, and delivers this hypothesis to semantic parser module, d. H. a program that a carries out lexical analysis and from the recognized Word sequence the information relevant for programming extracted. In addition to the hypothesis, a or several alternative hypotheses are output, which will be considered when the first Hypothesis is not usable, for example because the  User instruction was incorrect or because of The user's request cannot be fulfilled correctly.

Die vom Parsermodul extrahierten Informationen können Fragen zum Fernsehprogramm sein, Fragen zum Zustand des Videorecorders, Aufforderungen zur Aufnahme einer oder mehrerer Sendungen, Kommandos zum Steuern der Bandfunktionen. Der Parser erkennt, um was für eine Art von Information es sich handelt und füllt sog. semantische "Case-Frames" mit den entsprechenden Wörtern aus der Hypothese.The information extracted by the parser module can Questions about the television program, questions about the state of the VCRs, prompts to record one or several programs, commands to control the Band functions. The parser recognizes what type of information it is about and fills so-called semantic "case frames" with the corresponding ones Words from the hypothesis.

Aus den gefüllten "Case-Frames" wird ein Zugriffskommando auf das Datenbankmodul, das das aktuelle Fernsehprogramm verwaltet, generiert. Mit diesem Zugriffskommando wird beispielsweise angefragt, wie der vollständige Titel der betreffenden Sendung lautet, wann sie beginnt und endet, und in welchem Programm sie gesendet wird.The filled "case frames" become one Access command to the database module that the current television program managed, generated. With this access command is requested, for example, like the full title of the show in question is when it starts and ends, and in which Program it is sent.

Wenn die Anfrage bei der Datenbank ergibt, daß die gegebene Information zur Programmierung ausreicht, wird dem Benutzer mit Hilfe einer Sprachsyntheseeinheit über den eingebauten Lautsprecher eine Bestätigung der Art "Ich nehme die Tagesschau von 20:00 Uhr bis 20:15 in der ARD auf" gegeben.If the query to the database shows that the given information is sufficient for programming, becomes the user with the help of a speech synthesis unit A confirmation of the Art "I take the daily news from 8:00 p.m. to 8:15 p.m. given in the ARD on ".

Ergibt die Anfrage jedoch, daß die gegebene Information nicht ausreicht oder unzulässig ist, kann eine Art Dialog geführt werden, indem eine Ausgabe der Art "Heute kommt keine Tagesschau" oder "Welche Tagesschau meinen Sie, die um 20:00 Uhr oder die um 22:00 Uhr" erzeugt wird.However, the request reveals that the information given is insufficient or inadmissible, a kind Dialogue is carried out by an edition of Art "There is no daily news today" or "Which daily news do you mean those at 8:00 p.m. or those at 10:00 p.m. " is produced.

In der Datenbank liegen die Daten zu einer Sendung bereits in einem maschinenlesbaren Format vor, d. h. der Prozessor kann die betreffenden Daten übernehmen und die zum Programmieren des Videorecorders 1 benötigten Signale direkt daraus berechnen. Die eigentliche Programmierung erfolgt über eine Steuer-/Regelkarte 3, deren Funktionalität vom verwendeten Videorecorder 1 abhängt. In den allermeisten Fällen wird ein Transistor-Schaltarray, das an die Steuerleitungen des Videorecorders 1 angeschlossen ist, genügen, um Steuersignale direkt an die Steuereinheit des Videorecorders 1 zu schicken. Die Software für die Bedienung der Steuer-/Regelkarte 3 ist ebenfalls vom verwendeten Videorecorder 1 abhängig.The data for a program are already available in the database in a machine-readable format, ie the processor can take over the relevant data and calculate the signals required for programming the video recorder 1 directly therefrom. The actual programming takes place via a control card 3 , the functionality of which depends on the video recorder 1 used . In the vast majority of cases, a transistor switching array which is connected to the control lines of the video recorder 1 will suffice to send control signals directly to the control unit of the video recorder 1 . The software for operating the control card 3 is also dependent on the video recorder 1 used .

In der Datenbank sind zu jeder Sendung die wichtigsten Informationen gespeichert. Dazu gehören Anfangs- und Endzeiten, Fernsehkanalnummern, Titel, Namen der Hauptdarsteller oder Regisseure etc., Stichworte über den Inhalt der Sendung, Bezeichnung der Art der Sendung (Nachrichten, Krimi, etc.).The most important for each shipment are in the database Information saved. This includes initial and End times, TV channel numbers, titles, names of the Leading actors or directors etc., keywords about the content of the shipment, description of the type of shipment (News, crime, etc.).

Die Datenbank wird ständig aktualisiert, so daß das aktuelle Fernsehprogramm und das der folgenden Tage oder Wochen vorhanden ist. Die Aktualisierung erfolgt entweder durch das Lesen einer Floppy-Disk, die der Benutzer z. B. am Kiosk oder im Zeitschriftenhandel kaufen kann, oder automatisch über Videotext.The database is constantly updated so that the current television program and that of the following days or weeks. The update takes place either by reading a floppy disk that the User z. B. at the kiosk or in newsagents can buy, or automatically via teletext.

Im Fall einer Aktualisierung über Videotext wird der Tuner des Videorecorders 1 auf das Programm eingestellt, auf dem die benötigten Videotextseiten, aus denen herausgelesen werden soll, gesendet werden. Der Videotext-Decoder 7 wandelt die Videotextseiten in maschinenlesbare Texte um, entnimmt Informationen über das aktuelle Fernsehprogramm und führt diese Daten der betreffenden Datenbank zur Speicherung zu. Dabei wird der dynamische Wortschatz (Vokabular und Bigramm- Grammatik) des Spracherkenners modifiziert und aktualisiert, so daß Programmierkommandos wie beispielsweise "nimm den Hitchcock auf" erkannt werden, ohne daß sich das Wort "Hitchcock" im permanenten Wortschatz des Spracherkennungsprogramms befinden muß.In the case of an update via teletext, the tuner of the video recorder 1 is set to the program on which the required teletext pages from which information is to be read are sent. The teletext decoder 7 converts the teletext pages into machine-readable texts, takes information about the current television program and feeds this data to the relevant database for storage. The dynamic vocabulary (vocabulary and bigram grammar) of the speech recognizer is modified and updated so that programming commands such as "record the Hitchcock" are recognized without the word "Hitchcock" having to be in the permanent vocabulary of the speech recognition program.

Prinzipiell ist es möglich, über Videotext jeden Teil der Software auszutauschen oder zu aktualisieren.In principle, it is possible to teletext every part replace or update the software.

BezugszeichenlisteReference list

1 Videorecorder
2 Fernbedienung
3 Steuer- und Regelkarte
4 Kabelverbindung Steuerkarte-Fernbedienung
5 Schnittstelle Regelkarte
6 Notebook PC
7 Videotext-Decoder
8 Videoausgang des Recorders
9 Schnittstelle Decoder
10 Koaxialkabel
11 Schnitt stelle Soundkarte
12 Soundkarte
13 Kabel zum Mikrophon
14 Mikrophon
15 Gehäuse
16 Lautsprecher
17 Fernsehtuner des Videorecorders
18 Tunerausgang des Videotextdecoder
19 Serielle Schnittstelle des Notebooks
20 Schnittstellenanschluß
21 Diskettenlaufwerk
22 Steuereinheit des Videorecorders
23 Verbindungskabel
24 Anschluß der Regelkarte
25 Infrarot Sprachsignalsender
26 Infrarot Steuersignalsender
27 Sprachübertragungseinheit
28 Infrarot-Steuersignalempfänger
29 Infrarot-Sprachsignalempfänger
30 Mikrophon
1 video recorder
2 remote control
3 control card
4 Control card-remote control cable connection
5 Control card interface
6 notebook PC
7 Teletext decoders
8 Video output of the recorder
9 Interface decoder
10 coaxial cables
11 Interface sound card
12 sound card
13 cables to the microphone
14 microphone
15 housing
16 speakers
17 VCR TV tuner
18 Tuner output of the teletext decoder
19 Serial interface of the notebook
20 interface connection
21 floppy disk drive
22 Control unit of the video recorder
23 connecting cables
24 Connection of the control card
25 infrared voice signal transmitter
26 Infrared control signal transmitter
27 voice transmission unit
28 Infrared control signal receiver
29 Infrared voice signal receivers
30 microphone

Claims (6)

1. Verfahren zur Programmierung eines Videorecorders, bei dem die Programmierinformation auf der Grundlage eines externen Sprachsignals und einer internen Datenbasis (Datenvorrat) generiert wird, wobei die Steuersignale natürliche, spontan gesprochene Sprachsignale sind, die von einem Kontinuierliche-Sprache-Erkenner und einem damit zusammenwirkenden Parser aufgenommen, analysiert, extrahiert und in "case-frames" kategorisiert werden, wobei die interne Datenbasis (der Datenvorrat) dynamisch festgelegt wird, wobei eine Dialogführung zur Auflösung von Ambiquitäten, Widersprüchen und für Modifikationsvorschläge vorgesehen ist, und wobei die dynamische Festlegung der Datenbasis durch die dynamische Aktualisierung des Fernsehprogramms erfolgt.1. procedure for programming a video recorder, where the programming information on the Basis of an external speech signal and one internal database (data supply) is generated, the control signals being natural, spontaneous spoken speech signals are from one Continuous language recognizer and one with it interacting parser recorded, analyzed, extracted and categorized into "case frames" will, where the internal database (the data pool) is determined dynamically, with a dialog to resolve ambiquities, contradictions and is provided for modification proposals, and being the dynamic definition of the database by dynamically updating the TV program takes place. 2. Einrichtung zur Programmierung eines Videorecorders auf der Grundlage des Verfahrens nach Anspruch 1, dadurch gekennzeichnet,
daß zur Bereitstellung der internen Datenbasis ein Prozessor (Datenverarbeitungseinrichtung) vorgese­ hen ist, der einerseits mit einem über ein Mikrophon steuerbaren kontinuierlichen Sprach-Erkenner gekoppelt ist, und der andererseits über eine Steuer-/Regelkarte mit dem Videorecorder verbunden ist,
so daß den über den kontinuierlichen Sprach- Erkenner zugeleiteten Sprachsignalen diesen zugeordnete Programmsignale im Prozessor ausgelesen werden, die ihrerseits den Videorecorder entsprechend programmieren.
2. Device for programming a video recorder on the basis of the method according to claim 1, characterized in that
that to provide the internal database, a processor (data processing device) is provided which, on the one hand, is coupled to a continuous speech recognizer that can be controlled by a microphone, and, on the other hand, is connected to the video recorder via a control card,
so that the speech signals supplied via the continuous speech recognizer are read out in the processor associated program signals which in turn program the video recorder accordingly.
3. Einrichtung nach Anspruch 2, dadurch gekennzeichnet, daß eine Anzeige von Informationen über die Programmdatenbasis und andere Statusinformationen auf dem TV-Gerät des Videorecorders vorgesehen ist.3. Device according to claim 2, characterized, that display information about the Program database and other status information is provided on the TV of the video recorder. 4. Einrichtung nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß der Sprach-Erkenner zusätzlich mit einem Laut­ sprecher gekoppelt ist.4. Device according to claim 2 or 3, characterized, that the speech recognizer additionally with a sound speaker is coupled. 5. Einrichtung nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, daß der Videorecorder und der Prozessor über einen Videotext-Umwandler funktional miteinander verbunden sind.5. Device according to one of claims 2 to 4, characterized, that the VCR and the processor have one Teletext converters functionally with each other are connected. 6. Einrichtung nach einem der Ansprüche 2 bis 5, gekennzeichnet durch ihre Verwendung in Verbindung mit einem über eine Fernbedienung bedienbaren Videorecorder.6. Device according to one of claims 2 to 5, characterized by their use in conjunction with a remote control VCR.
DE1996115437 1996-04-19 1996-04-19 Video recorder programming method Expired - Fee Related DE19615437C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE1996115437 DE19615437C1 (en) 1996-04-19 1996-04-19 Video recorder programming method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE1996115437 DE19615437C1 (en) 1996-04-19 1996-04-19 Video recorder programming method

Publications (1)

Publication Number Publication Date
DE19615437C1 true DE19615437C1 (en) 1997-07-31

Family

ID=7791708

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1996115437 Expired - Fee Related DE19615437C1 (en) 1996-04-19 1996-04-19 Video recorder programming method

Country Status (1)

Country Link
DE (1) DE19615437C1 (en)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19801746A1 (en) * 1998-01-20 1999-07-22 T Angewandte System Technik Ma System for control or operation of sensors and switches or appliances using acoustic or modulated signals with at least one microphone for reception and further communication of acoustic and/or spoken commands
EP1037463A2 (en) * 1999-03-15 2000-09-20 Matsushita Electric Industrial Co., Ltd. Voice activated controller for recording and retrieving audio/video programs
DE19937490A1 (en) * 1999-08-07 2001-04-19 Volkswagen Ag Input of control commands to a road vehicle system has a speech recognition system linked to a data base
WO2001098855A2 (en) * 2000-06-23 2001-12-27 Deutsche Telekom Ag Method for adjusting the parameters of function references in dialog systems
EP1196748A1 (en) * 1999-07-23 2002-04-17 Intervoice Limited Partnership System and method to facilitate speech enabled user interfaces
EP1199706A2 (en) * 2000-10-18 2002-04-24 Saymore Speech Operated Systems GmbH Method for unambiguous analysis of a spoken command
DE10050360A1 (en) * 2000-10-11 2002-04-25 Siemens Ag Administering/establishing services in switched system involves defined vocabulary specified in additional network dialog device for recognizing voice input originating in user station
WO2002037472A2 (en) * 2000-10-30 2002-05-10 Koninklijke Philips Electronics N.V. User interface for the administration of an external database
DE10136953B4 (en) * 2001-07-28 2004-02-05 Loewe Opta Gmbh Device for checking the settings, default settings and / or status messages of a device component in a multi-part audio / video system
DE19740079B4 (en) * 1997-09-12 2004-07-01 Ciburski, Guido Method for remote control of video recorders from the Internet
EP1079371B1 (en) * 1999-08-26 2005-11-02 Matsushita Electric Industrial Co., Ltd. Speech based remote control
US9021538B2 (en) 1998-07-14 2015-04-28 Rovi Guides, Inc. Client-server based interactive guide with server recording
US9071872B2 (en) 2003-01-30 2015-06-30 Rovi Guides, Inc. Interactive television systems with digital video recording and adjustable reminders
US9100686B2 (en) 1998-09-17 2015-08-04 Rovi Guides, Inc. Electronic program guide with digital storage
US9125169B2 (en) 2011-12-23 2015-09-01 Rovi Guides, Inc. Methods and systems for performing actions based on location-based rules
US9294799B2 (en) 2000-10-11 2016-03-22 Rovi Guides, Inc. Systems and methods for providing storage of data on servers in an on-demand media delivery system
US10063934B2 (en) 2008-11-25 2018-08-28 Rovi Technologies Corporation Reducing unicast session duration with restart TV

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT376538B (en) * 1977-12-14 1984-11-26 Ruppertsberg Siegfried R REMOTE CONTROL FOR CONTROLLING, SWITCHING ON AND SWITCHING VARIABLES AND FIXED DEVICE FUNCTIONS AND FUNCTION SIZES IN MESSAGE TECHNICAL DEVICES
EP0496492A1 (en) * 1991-01-12 1992-07-29 Sony Corporation Control apparatus for electronic equipment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT376538B (en) * 1977-12-14 1984-11-26 Ruppertsberg Siegfried R REMOTE CONTROL FOR CONTROLLING, SWITCHING ON AND SWITCHING VARIABLES AND FIXED DEVICE FUNCTIONS AND FUNCTION SIZES IN MESSAGE TECHNICAL DEVICES
EP0496492A1 (en) * 1991-01-12 1992-07-29 Sony Corporation Control apparatus for electronic equipment

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
DELLER, John R. *
ENGESSER, Hermann (Hrsg.), CLAUS, Volker, SCHWILL,Andreas (Bearb.): Duden "Informatik", Mannheim, Dudenverlag, 1988, S.73 u. 589-591 ISBN 3-411- 02421-6 *
GUMM, Heinz-Peter, SOMMER, Manfred: Einführung in die Informatik, 1.Aufl., Bonn, Addison-Wesley (Deutschland) GmbH, 1994, S.413-415 ISBN 3-89319- 574-2 *
HANSEN, John H.L.: Discrete-Time Processing of Speech Signals *
In: Funkschau, 1993, H. 24, S. 28 u. 29 *
New York, Macmillan Publishing Company, 1993, S. 601-622 ISBN 0-02-328301-7 *
Philips Voice Commander *
PROAKIS, John G. *

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19740079B4 (en) * 1997-09-12 2004-07-01 Ciburski, Guido Method for remote control of video recorders from the Internet
DE19801746A1 (en) * 1998-01-20 1999-07-22 T Angewandte System Technik Ma System for control or operation of sensors and switches or appliances using acoustic or modulated signals with at least one microphone for reception and further communication of acoustic and/or spoken commands
US9154843B2 (en) 1998-07-14 2015-10-06 Rovi Guides, Inc. Client-server based interactive guide with server recording
US9055319B2 (en) 1998-07-14 2015-06-09 Rovi Guides, Inc. Interactive guide with recording
US9055318B2 (en) 1998-07-14 2015-06-09 Rovi Guides, Inc. Client-server based interactive guide with server storage
US9021538B2 (en) 1998-07-14 2015-04-28 Rovi Guides, Inc. Client-server based interactive guide with server recording
US10075746B2 (en) 1998-07-14 2018-09-11 Rovi Guides, Inc. Client-server based interactive television guide with server recording
US9232254B2 (en) 1998-07-14 2016-01-05 Rovi Guides, Inc. Client-server based interactive television guide with server recording
US9118948B2 (en) 1998-07-14 2015-08-25 Rovi Guides, Inc. Client-server based interactive guide with server recording
US9226006B2 (en) 1998-07-14 2015-12-29 Rovi Guides, Inc. Client-server based interactive guide with server recording
US9106947B2 (en) 1998-09-17 2015-08-11 Rovi Guides, Inc. Electronic program guide with digital storage
US9363553B2 (en) 1998-09-17 2016-06-07 Rovi Guides, Inc. Electronic program guide with digital storage
US9237371B2 (en) 1998-09-17 2016-01-12 Rovi Guides, Inc. Electronic program guide with digital storage
US9100686B2 (en) 1998-09-17 2015-08-04 Rovi Guides, Inc. Electronic program guide with digital storage
EP1037463A3 (en) * 1999-03-15 2002-09-25 Matsushita Electric Industrial Co., Ltd. Voice activated controller for recording and retrieving audio/video programs
EP1037463A2 (en) * 1999-03-15 2000-09-20 Matsushita Electric Industrial Co., Ltd. Voice activated controller for recording and retrieving audio/video programs
EP1196748A1 (en) * 1999-07-23 2002-04-17 Intervoice Limited Partnership System and method to facilitate speech enabled user interfaces
EP1196748A4 (en) * 1999-07-23 2004-06-23 Intervoice Lp System and method to facilitate speech enabled user interfaces
DE19937490A1 (en) * 1999-08-07 2001-04-19 Volkswagen Ag Input of control commands to a road vehicle system has a speech recognition system linked to a data base
DE19937490B4 (en) 1999-08-07 2018-11-29 Volkswagen Ag Method and device for inputting control commands for comfort devices, in particular in motor vehicles
EP1079371B1 (en) * 1999-08-26 2005-11-02 Matsushita Electric Industrial Co., Ltd. Speech based remote control
DE10030713A1 (en) * 2000-06-23 2002-01-03 Deutsche Telekom Ag Procedure for setting parameters of function calls in dialog systems
WO2001098855A2 (en) * 2000-06-23 2001-12-27 Deutsche Telekom Ag Method for adjusting the parameters of function references in dialog systems
WO2001098855A3 (en) * 2000-06-23 2002-12-05 Deutsche Telekom Ag Method for adjusting the parameters of function references in dialog systems
DE10050360A1 (en) * 2000-10-11 2002-04-25 Siemens Ag Administering/establishing services in switched system involves defined vocabulary specified in additional network dialog device for recognizing voice input originating in user station
DE10050360B4 (en) * 2000-10-11 2004-12-09 Siemens Ag Method activation and / or deactivation of services in a switching system
US9294799B2 (en) 2000-10-11 2016-03-22 Rovi Guides, Inc. Systems and methods for providing storage of data on servers in an on-demand media delivery system
EP1199706A3 (en) * 2000-10-18 2004-01-07 Saymore Speech Operated Systems GmbH Method for unambiguous analysis of a spoken command
DE10051794C2 (en) * 2000-10-18 2003-04-17 Saymore Speech Operated System Method for uniquely assigning a command and method for voice control
DE10051794A1 (en) * 2000-10-18 2002-05-02 S O S Systems Gmbh Method for uniquely assigning a command and method for voice control
EP1199706A2 (en) * 2000-10-18 2002-04-24 Saymore Speech Operated Systems GmbH Method for unambiguous analysis of a spoken command
WO2002037472A2 (en) * 2000-10-30 2002-05-10 Koninklijke Philips Electronics N.V. User interface for the administration of an external database
WO2002037472A3 (en) * 2000-10-30 2002-08-15 Koninkl Philips Electronics Nv User interface for the administration of an external database
DE10136953B4 (en) * 2001-07-28 2004-02-05 Loewe Opta Gmbh Device for checking the settings, default settings and / or status messages of a device component in a multi-part audio / video system
US9071872B2 (en) 2003-01-30 2015-06-30 Rovi Guides, Inc. Interactive television systems with digital video recording and adjustable reminders
US9369741B2 (en) 2003-01-30 2016-06-14 Rovi Guides, Inc. Interactive television systems with digital video recording and adjustable reminders
US10063934B2 (en) 2008-11-25 2018-08-28 Rovi Technologies Corporation Reducing unicast session duration with restart TV
US9125169B2 (en) 2011-12-23 2015-09-01 Rovi Guides, Inc. Methods and systems for performing actions based on location-based rules

Similar Documents

Publication Publication Date Title
DE19615437C1 (en) Video recorder programming method
DE60005422T2 (en) Automatically search for audio channels by comparing user-spoken words in subtitle text or audio content for interactive television
DE69923379T2 (en) Non-interactive registration for speech recognition
DE69834553T2 (en) ADVANCED VOICE RECOGNITION SYSTEM WITH AN AUDIO FEEDBACK
DE60222093T2 (en) METHOD, MODULE, DEVICE AND VOICE RECOGNITION SERVER
DE60123747T2 (en) Speech recognition based subtitling system
DE60217579T2 (en) Automatic control of domestic appliances by means of natural language recognition
DE60012065T2 (en) Method and apparatus for television channel selection using speech understanding
DE60318544T2 (en) Language model for speech recognition
DE60005326T2 (en) DETECTION UNITS WITH COMPLEMENTARY LANGUAGE MODELS
DE69822296T2 (en) PATTERN RECOGNITION IN A DISTRIBUTED SYSTEM
DE69914131T2 (en) Position handling in speech recognition
DE3910467C2 (en) Method and device for generating reports
DE69814589T2 (en) VOICE RECOGNITION USING MULTIPLE VOICE KNOWLEDGE
EP1282112B1 (en) Method of supporting proofreading of a recognized text in a speech to text system with playback speed adapted to confidence of recognition
DE60125397T2 (en) LANGUAGE-DEPENDENT VOTING BASED USER INTERFACE
DE19510083C2 (en) Method and arrangement for speech recognition in languages containing word composites
DE10040214A1 (en) Intelligent correction of dictated speech entered into a computer system uses comparison with word lists
DE60316912T2 (en) Method for speech recognition
EP1927980A2 (en) Method for classifying spoken language in spoken dialogue systems
DE69819690T2 (en) LANGUAGE RECOGNITION USING A COMMAND LIKE
DE102006006069A1 (en) A distributed speech processing system and method for outputting an intermediate signal thereof
EP3010014B1 (en) Method for interpretation of automatic speech recognition
DE112006000322T5 (en) Audio recognition system for generating response audio using extracted audio data
DE60026366T2 (en) SPEECH RECOGNITION WITH A COMPLEMENTARY LANGUAGE MODEL FOR TYPICAL ERRORS IN THE LANGUAGE DIALOGUE

Legal Events

Date Code Title Description
8100 Publication of the examined application without publication of unexamined application
D1 Grant (no unexamined application published) patent law 81
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee