DE1258472B - Arrangement for changing the basic tone, the speaking speed and the timbre of speech signals analyzed according to the vocoder principle - Google Patents

Arrangement for changing the basic tone, the speaking speed and the timbre of speech signals analyzed according to the vocoder principle

Info

Publication number
DE1258472B
DE1258472B DEJ29117A DEJ0029117A DE1258472B DE 1258472 B DE1258472 B DE 1258472B DE J29117 A DEJ29117 A DE J29117A DE J0029117 A DEJ0029117 A DE J0029117A DE 1258472 B DE1258472 B DE 1258472B
Authority
DE
Germany
Prior art keywords
output
input
circuit
contact
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DEJ29117A
Other languages
German (de)
Inventor
Dipl-Ing Dr Kurt Bandat
Dipl-Ing Dr Ernst Rothauser
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE1258472B publication Critical patent/DE1258472B/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility

Description

Anordnung zur Veränderung des Grundtones, der Sprechgeschwindigkeit und der Klangfarbe von nach dem Vocoderprinzip analysierten Sprachsignalen Die Erfindung betrifft eine Anordnung zur wahlweisen Veränderung des Grundtones, der Sprechgeschwindigkeit und der Klangfarbe von nach dem Prinzip des impulserregten Kanalvocoders analysierten Sprachsignalen. Beim Kanalvocoder mit Impulsanregung werden bekanntlich aus dem Eingangssprachsignal zwei Funktionen, nämlich eine Spektrumfunktion und eine Anregungsfunktion abgeleitet.Arrangement for changing the basic tone, the speed of speech and the timbre of speech signals analyzed according to the vocoder principle. The invention relates to an arrangement for the optional change of the fundamental tone, the speed of speech and the timbre of analyzed according to the principle of the pulse-excited channel vocoder Speech signals. In the case of the channel vocoder with impulse excitation, the Input speech signal has two functions, namely a spectrum function and an excitation function derived.

Um den Grundton bei gleichbleibender Klangfarbe der Sprache zu variieren, ist es notwendig, die Grundfrequenz der Anregung einschließlich ihrer Oberwellen in der Frequenz zu variieren, wobei es ferner nötig ist, auch die Spektrumwerte zu tieferen oder höheren Frequenzen hin zu verschieben.In order to vary the fundamental tone while maintaining the same timbre of speech, it is necessary to determine the fundamental frequency of the excitation including its harmonics to vary in frequency, and it is also necessary to also use the spectrum values to shift to lower or higher frequencies.

Eine alleinige Veränderung des Sprachspektrums bewirkt vor allem eine Änderung des Klangeindrucks der Sprache, die sich bei Beibehaltung der ursprünglichen Grundfrequenz als eine andere Klangfarbe darstellt.A mere change in the language spectrum causes above all one Change in the sound impression of the language, which changes while maintaining the original Represents fundamental frequency as a different timbre.

Bei einer Änderung nur der Grundfrequenz ergibt sich ebenfalls eine veränderte Klangfarbe, da nun das ursprüngliche Verhältnis der Grundfrequenz zu ihren Oberwellen gestört ist.If only the basic frequency is changed, there is also one changed timbre, since now the original ratio of the fundamental frequency to their harmonics is disturbed.

Ähnliche Probleme ergeben sich bei einer Änderung der Artikulationsgeschwindigkeit, die, wenn sie allein vorgenommen wird, ebenfalls eine Änderung der Klangfarbe und der Tonhöhe hervorruft. Soll die Artikulations- oder Sprechgeschwindigkeit ohne diese Nebenerscheinungen geändert werden können, müssen besondere Maßnahmen getroffen werden. Die Aufgabe der Erfindung besteht nun darin, eine Anordnung anzugeben, mit deren Hilfe es möglich ist, wahlweise die Höhe des Grundtones, die Sprechgeschwindigkeit und die Klangfarbe der Sprache zu variieren.Similar problems arise when changing the articulation speed, which, if done alone, also changes the timbre and the pitch evokes. Should the articulation or speaking speed be without these side effects can be changed, special measures must be taken will. The object of the invention is to provide an arrangement with the help of which it is possible, optionally the height of the fundamental tone, the speaking speed and to vary the timbre of the language.

Für eine Anordnung zur wahlweisen Veränderung des Grundtones, der Sprechgeschwindigkeit und der Klangfarbe von nach dem Prinzip des impulserregten Kanalvocoders analysierten Sprachsignalen besteht die Erfindung darin, daß zur Veränderung des Grundtones in den Anregungskanal eine Modifizierschaltung eingeschaltet ist, welche den digitalen Wert des Abstandes jeweils zweier aufeinanderfolgender Nulldurchgänge einer Richtung der Sprachgrundwelle kennzeichnender Impulse (Anregungsimpulse) numerisch verändert, daß zur Veränderung der Sprechgeschwindigkeit im Anregungskanal Mittel vorgesehen sind, die aus der Reihe der ankommenden Anregungsimpulse wahlweise jeden n-ten nicht oder jeden n-ten in einem Intervall mehrmals überträgt, und daß zur Veränderung der Klangfarbe Mittel vorgesehen sind, welche die in digataler Form vorliegenden Abtastwerte der Spektrumkanäle für jeden Kanal in Abhängigkeit von seinen Nachbarkanälen numerisch verändern.For an arrangement for the optional change of the fundamental tone, the Speech speed and the timbre of according to the principle of the impulse-excited Channel vocoders analyzed speech signals, the invention is that to change of the fundamental tone in the excitation channel a modifying circuit is switched on, which is the digital value of the distance between two consecutive zero crossings a direction of the speech fundamental wave characterizing impulses (excitation impulses) numerically changed that means for changing the speed of speech in the excitation channel are provided, each of the series of incoming excitation pulses optionally n-th does not transmit or every n-th transmits several times in an interval, and that for Change of timbre means are provided, which are in digatal form present samples of the spectrum channels for each channel as a function of change its neighboring channels numerically.

Die im vorhergehenden Absatz erwähnten Veränderungen der Sprache können sowohl für sich allein als auch in Kombination vorgenommen werden, wobei die Kombination immer dann gewählt werden wird, wenn z. B. der Grundton ohne Veränderung der Klangfarbe oder die Sprechgeschwindigkeit ohne Veränderung des Grundtones und der Klangfarbe verändert werden soll.The language changes mentioned in the previous paragraph can can be made both on its own and in combination, with the combination will always be chosen if z. B. the fundamental without changing the timbre or the speed of speech without changing the fundamental tone and timbre should be changed.

Die Erfindung ist überall dort mit guten Resultaten anwendbar, wo beispielsweise Daten aus elektronischen Datenverarbeitungsanlagen in gesprochener Form ausgegeben werden sollen, wie z. B. Angaben über Börsenkurse oder Sitzplatzreservierungen, und wo Daten über die Sprache, z. B. die Werte der momentanen Energie in den einzelnen Spektrumkanälen oder die Angaben über die Anregungsfunktion, in digitaler Form z. B. als Impulscodegruppen oder als Gruppen von impulsamplitudenmodulierten Signalen gespeichert sind. Durch diese Variation, besonders der Höhe des Grundtones und der Sprechgeschwindigkeit, kann einmal erreicht werden, daß die übertragung der gesprochenen Ausgabedaten (Veränderung der Frequenz des Grundtones) besser an einen übertragungskanal angepaßt werden kann und zum anderen (Veränderung der Sprechgeschwindigkeit ), .daß die Ausgabegeschwindigkeit der gesprochenen Daten beeinflußt wird.The invention is applicable wherever with good results for example, data from electronic data processing systems in spoken form Form are to be output, such as B. Information on stock exchange prices or seat reservations, and where data about the language, e.g. B. the values of the momentary energy in the individual Spectrum channels or the information about the excitation function, in digital form z. B. as pulse code groups or as groups of pulse amplitude modulated signals are stored. Because of this variation, especially the pitch of the root and the Speech speed, can be achieved once that the transmission of the spoken Output data (change in the frequency of the fundamental tone) better to a transmission channel can be adjusted and on the other hand (change in the rate of speech ), .that the output speed of the spoken data is influenced.

Die Erfindung wird an Hand eines durch Zeichnungen erläuterten Ausführungsbeispiels näher beschrieben. Es zeigt F i g. 1 das Blockschaltbild einer Anordnung zur Veränderung des Grundtones, der Klangfarbe und der Sprechgeschwindigkeit von Sprachsignalen, F i g. 2 eine Darstellung der zeitlichen Verschiebung der Energiewerte in den einzelnen Spektrumkanälen, F i g. 3 eine Analogdarstellung der Kanalwerte der Spektrumkanäle an verschiedenen Punkten der Anordnung und F i g. 4 das Blockschaltbild eines erweiterten Anregungskanals.The invention is illustrated by means of an exemplary embodiment illustrated by drawings described in more detail. It shows F i g. 1 shows the block diagram of an arrangement for changing the basic tone, the timbre and the speaking speed of speech signals, F i g. 2 a representation of the time shift of the energy values in the individual Spectrum channels, FIG. 3 shows an analog representation of the channel values of the spectrum channels at various points in the arrangement and FIG. 4 the block diagram of an extended Excitation channel.

Die Anordnung nach der F i g. 1 analysiert das Spektrum des Sprachsignals s (t) in bekannter Weise durch die einzelnen Frequenzbänder abgestimmte Bandpässe BP, bis BP., die vorzugsweise logarithmisch ausgelegt sind, so daß jeder Bandpaß ein gleiches Intervall im Spektrumbereich durchläßt, sowie durch je Kanal K1 bis K5 nachgeschaltete Gleichrichter G1 bis G5 und durch Tiefpaßfilter LP, bis LP.., die den Momentanwert der Energien in den einzelnen Frequenzbändern, die sogenannten Kanalwerte, ermitteln. Diese Kanalwerte A bis E werden, wie in F i g. 1 dargestellt, durch einen SchalterAS abgetastet und die Analoggrößen der Kanalwerte in einem Analog-Digital-Wandler ADW in Digitalgrößen, vorzugsweise in binäre parallele Darstellung umgewandelt. Die am Ausgang des Wandlers ADW parallel vorliegenden Werte werden dann durch einen weiteren Abtaster PSWi in Serienwerte umgesetzt.The arrangement according to FIG. 1 analyzes the spectrum of the speech signal s (t) in a known manner through the individual frequency bands matched bandpass filters BP to BP, which are preferably designed logarithmically so that each bandpass filter allows an equal interval in the spectrum to pass through, as well as downstream channels K1 to K5 Rectifiers G1 to G5 and low-pass filters LP to LP .., which determine the instantaneous value of the energies in the individual frequency bands, the so-called channel values. These channel values A to E are, as in FIG. 1, scanned by a switch AS, and the analog quantities of the channel values are converted into digital quantities, preferably in binary parallel representation, in an analog-to-digital converter ADW. The values present in parallel at the output of the converter ADW are then converted into series values by a further scanner PSWi.

Da die einzelnen Kanalwerte dieser Seriendarstellung kein Kennzeichen über den Kanal mitführen, aus dem sie abgeleitet wurden, ist die Zuordnung eines Kanalwertes zu seinem Frequenzband nur durch das zeitliche Auftreten dieser Werte möglich. In dem in F i g. 1 und 2 dargestellten Beispiel werden die fünf Kanäle K1 bis K5 nacheinander in Zeitintervallen k1 bis k, abgetastet und hierbei die Werte A bis E abgeleitet. In. den einzelnen Zeilen der F i g. 2 sind die Kanalwerte A bis E an den entsprechend bezeichneten Schaltungspunkten der Anordnung gemäß F i g. 1 in Abhängigkeit von der Zeit t eingetragen. Der Wert, der im Zeitintervall Ici am Punkt (e) auftritt, wird von den folgenden Einrichtungen als Wert des Frequenzbandes des Kanals K1 aufgefaßt. In der dargestellten Anordnung ist angenommen, daß ein Kanalwert durch eine vier Bit lange Codegruppe dargestellt ist und durch ein Verzögerungselement DL (4T)1 um vier Bit verzögert wird. Die gezeichnete Anordnungvon zweiVerzögerungselementenDL (4 T)1 und DL (4 T)2 mit dem Schalter S erlaubt für den Ausgang (d) bzw. (eN) bis (eT) [F i g. 3] eine Verschiebung der Kanalwerte um einen Kanal nach links oder rechts, also zu tieferen oder höheren Frequenzen, und zwar in Schaltstellung H nach höheren und in Schaltstellung T nach tieferen Frequenzen, während die mittlere Schaltstellung N der Normallage entspricht. Sollte um mehrere Kanäle verschoben werden, wären in analoger Weise entsprechend mehr Verzögerungselemente DL (4 T)i vorzusehen. Die nach dem Schalter S gezeichnete Anordnung erlaubt die Beeinflussung eines Kanalwertes in Abhängigkeit von den Nachbarkanalwerten. Die in den Punkten (d) und (f) abgenommenen Nachbarkanalwerte des Kanalwertes am Abgriff (e) zwischen den Verzögerungselementen DL (4 T), und DL (4 11 werden in den Schaltkreisen Mult(n)1, Mult(n)2 mit einem Faktor n < 1 multipliziert und in dem Schaltkreis Addi addiert. Dieser Summenwert (f.,) wird dann entweder zum Kanalwert addiert oder vom Kanalwert subtrahiert (Add2 bzw. Subi). Der resultierende Wert, d. h. die Summe oder Differenz, wird noch mit einem Ausgleichsfaktor F1 bzw. F2 multipliziert.Since the individual channel values in this series display do not carry an identifier about the channel from which they were derived, the assignment of a channel value to its frequency band is only possible through the occurrence of these values over time. In the one shown in FIG. 1 and 2, the five channels K1 to K5 are scanned one after the other at time intervals k1 to k and the values A to E are derived. In. the individual lines of FIG. 2 are the channel values A to E at the correspondingly designated circuit points of the arrangement according to FIG. 1 entered as a function of time t. The value which occurs in the time interval Ici at point (e) is interpreted by the following devices as the value of the frequency band of channel K1. In the arrangement shown, it is assumed that a channel value is represented by a four-bit long code group and is delayed by four bits by a delay element DL (4T) 1. The illustrated arrangement of two delay elements DL (4 T) 1 and DL (4 T) 2 with the switch S allows for the output (d) or (eN) to (eT) [Fig. 3] a shift of the channel values by one channel to the left or right, ie to lower or higher frequencies, namely in switch position H to higher and in switch position T to lower frequencies, while the middle switch position N corresponds to the normal position. If a shift should take place by several channels, correspondingly more delay elements DL (4 T) i would have to be provided in an analogous manner. The arrangement shown after the switch S allows a channel value to be influenced as a function of the adjacent channel values. The adjacent channel values of the channel value at the tap (e) between the delay elements DL (4 T) and DL (4 11) taken in points (d) and (f) are converted into Mult (n) 1, Mult (n) 2 in the circuits multiplied by a factor n <1 and added in the circuit Addi. This sum value (f.,) is then either added to the channel value or subtracted from the channel value (Add2 or Subi). The resulting value, ie the sum or difference, is also added with multiplied by a compensation factor F1 or F2.

Die Wirkung dieser Anordnung ist besser aus F i g. 3 ersichtlich. Zur besseren Übersicht werden die Kanalwerte A bis E hier durch Analoggrößen dargestellt. Das Diagramm 1 zeigt die ursprünglichen Kanalwerte A, B, C, D und E, die in zeitlicher Aufeinanderfolge an dem Abgriff (e) der aus einzelnen Verzögerungsgliedern DL (4 T)i bestehenden Verzögerungskette auftreten.The effect of this arrangement is better from FIG. 3 can be seen. For a better overview, the channel values A to E are represented here by analog values. Diagram 1 shows the original channel values A, B, C, D and E which occur in chronological succession at the tap (e) of the delay chain consisting of individual delay elements DL (4 T) i.

Die unter 2 und 3 dargestellten Diagramme zeigen die in zeitlicher Folge an den Abgriffen (d) und (f) auftretenden und mit dem Faktor n = 0,25 multiplizierten Werte.The diagrams shown under 2 and 3 show the values occurring in chronological order at taps (d) and (f) and multiplied by the factor n = 0.25.

Das Diagramm 3 a stellt dann die Werte (f") nach der Addition in dem Schaltkreis Addi dar. Die so entstandene Summe der modifizierten Nachbarkanalwerte des am Abgriff (e) auftretenden Kanalwertes wird entweder zu diesem addiert (Add2) oder von diesem subtrahiert (Subi). Die beiden alternativen Werte werden dann noch mit einem Ausgleichsfaktor multipliziert und an den Ausgängen (i) oder (4 zur weiteren Verarbeitung bereitgestellt.Diagram 3 a then shows the values (f ") after the addition in the Addi circuit. The resulting sum of the modified adjacent channel values of the channel value occurring at tap (e) is either added to this (Add2) or subtracted from it (Subi The two alternative values are then still with a compensation factor multiplied and made available at the outputs (i) or (4 for further processing.

Diese numerische Veränderung des Spektrums ist in den Diagrammen 4 und 5 der F i g. 3 dargestellt, wobei in 4 die Subtraktion der Werte von 1 und 3 a mit nachfolgender Multiplikation mit dem Faktor F., = 2 und in 5 die Addition der Werte von 1 und 3 a mit nachfolgender Multiplikation mit dem Faktor Fi = 3 gezeigt ist. Die wegen ihrer geringen Größe vernachlässigten Randwerte, z. B. der erste und letzte Wert von 3 a, werden für die weitere Verarbeitung der Sprachsignale nicht mehr berücksichtigt. Man sieht, wie in 4 eine relative Anhebung oder in 5 eine relative Absenkung der Spitzenwerte bei etwa gleichbleibender Spektrumsfläche erreicht wird. Die Multiplikation der Kanalwerte ist ein leicht realisierbarer Vorgang. Für die gewählte binäre Kanalwertdarstellung und den Faktor n = 0,25 ist es lediglich eine binäre Verschiebung der Werte um 2 T mit Nachziehung binärer Nullen für Mult(ra)1.2. In analoger Weise sind durch Verzögerung und Addition die Faktoren F1 und F., je nach Wahl der Werte für n exakt darstellbar oder approximierbar.This numerical change in the spectrum is shown in Diagrams 4 and 5 of FIG. 3, where in FIG. 4 the subtraction of the values from 1 and 3 a with subsequent multiplication by the factor F., = 2 and in 5 the addition of the values of 1 and 3 a with subsequent multiplication by the factor Fi = 3 is. The marginal values neglected because of their small size, e.g. B. the first and last value of 3 a, are not used for further processing of the voice signals more considered. One sees, as in FIG. 4, a relative increase or in FIG. 5 a relative one Lowering of the peak values is achieved with approximately the same spectrum area. The multiplication of the channel values is an easy process. For the selected binary channel value representation and the factor n = 0.25, it is only one binary shift of the values by 2 T with trailing binary zeros for Mult (ra) 1.2. In an analogous way, the factors F1 and F., depending on the delay and addition depending on the choice of the values for n can be exactly represented or approximated.

Die zweite aus dem Sprachsignal s (t) abgeleitete Funktion ist die Anregungsfunktion Ko, die in bekannter Weise (vgl. F i g.1) aus den Nulldurchgängen der Sprachgrundwelle in dem Schaltkreis ND abgeleitet wird und aus in dem Schaltkreis PF geeignet geformten Impulsen besteht, deren Folgefrequenz gleich der Sprachgrundfrequenz ist. Ein Zähler Z, der von einem festen Taktgenerator TG weitergeschaltet wird, wandelt die Abstände aufeinanderfolgender Impulse in Binärzahlen, die in einem Parallel-Serien-Wandler PSW2 in Seriendarstellung umgesetzt werden. Bis zu diesem Punkt entspricht die Anordnung des An- reg ungskanals dem bereits bekanntgewordenen Stand der Technik. Soll nun eine resultierende Anregung zur Erzeugung eines Sprachsignals mit längerer oder kürzerer Sprechdauer ohne Beeinflussung der Grundtonhöhe dienen, so müssen zusätzliche Anregungswerte erzeugt oder abgeleitete Werte eliminiert werden. Soll der Grundton geändert werden, so müssen die Meßwerte der Anregungsimpulse modifiziert werden. Diese Änderung des Grundtones ist einerseits durch numerische Multiplikation in einem Multiplikator Mult(n)3 in F i g. 1 oder andererseits durch eine Variation der Frequenz des Taktgenerators TG (VTG in F i g. 4) möglich. Die in beiden Fällen resultierende Änderung der Artikulationsgeschwindigkeit (das Analogon hierzu wäre ein schneller oder langsamer ablaufendes Tonband) muß durch Einsetzen oder Auslassen von Anregungsimpulsen kompensiert werden.The second function derived from the speech signal s (t) is the excitation function Ko, which is derived in a known manner (see FIG. 1) from the zero crossings of the fundamental speech wave in the circuit ND and consists of appropriately shaped pulses in the circuit PF whose repetition frequency is equal to the basic speech frequency. A counter Z, which is switched on by a fixed clock generator TG, converts the intervals between successive pulses into binary numbers, which are converted into series representation in a parallel-to-series converter PSW2. Up to this point the arrangement of the arrival corresponding to the reg ungskanals already become known prior art. If a resulting excitation is now to be used to generate a speech signal with a longer or shorter speaking duration without influencing the basic pitch, additional excitation values must be generated or derived values must be eliminated. If the fundamental tone is to be changed, the measured values of the excitation pulses must be modified. This change in the fundamental tone is on the one hand through numerical multiplication in a multiplier Mult (n) 3 in FIG. 1 or, on the other hand, by varying the frequency of the clock generator TG (VTG in FIG. 4). The change in articulation speed resulting in both cases (the analogue would be a faster or slower running tape) must be compensated for by inserting or leaving excitation pulses.

Die F i g. 1 zeigt in Blockform eine Anordnung zur Änderung der Sprechgeschwindigkeit. Die mit PZC bezeichnete Schaltung kann wahlweise und in regelmäßigen Abständen Impulse aus dem Schaltkreis PF unterdrücken oder wiederholen. Die mit AT bezeichnete Schaltung sorgt für die taktmäßige Abgabe der Impulse.The F i g. 1 shows in block form an arrangement for changing the rate of speech. The circuit labeled PZC can selectively and at regular intervals pulses suppress or repeat from the circuit PF. The circuit labeled AT ensures the timed delivery of the impulses.

Eine mögliche Ausführungsform für die .Schaltung PZC der F i g. 1 ist in F i g. 4 enthalten.One possible embodiment for the .Schaltung PZC of FIG. 1 is in Fig. 4 included.

Die vom Impulsformer PF abgegebene Impulsserie wird vom Drehschalter Si bei jedem Umlauf, beispielsweise durch Abtrennung eines Kontaktes von der Kontaktbank, um einen Impuls reduziert, vom Drehschalter S2 durch Verdoppelung eines Impulses, beispielsweise durch die Verzögerung in der Schaltung DLY2 und die ODER-Schaltung O, um einen Impuls vermehrt. Die Schalter selbst werden von jedem Impuls der Impulsserie über eine an den Impulsformer PF angeschlossene Drehschaltersteuerung DS um einen Schritt weitergeschaltet. Jeder Impuls, der die Abtaststeuerung ATS über den Schalter % mit den Schaltstellungen T, N, H erreicht, löst eine einmalige Abtastung des vorzugsweise binären Wertes im Zähler Z aus. Der betrachtete Impuls der Serie, der in DLYI verzögert wird, setzt danach den Zähler über seinen Eingang Y auf 0 zurück, und ein neuer Zählvorgang beginnt. Die numerische Beeinflussung der Zählerwerte erfolgt durch Änderung des den Zähler steuernden Taktgenerators VTG. Der in Paralleldarstellung vorliegende binäre Wert des Zählers Z wird durch den Schalter PSW3 in Seriendarstellung umgewandelt und zum Speicher SP übertragen.The pulse series emitted by the pulse shaper PF is reduced by one pulse by the rotary switch Si with each revolution, for example by separating a contact from the contact bank, and by the rotary switch S2 by doubling a pulse, for example by the delay in the circuit DLY2 and the OR circuit O , increased by one pulse. The switches themselves are switched one step further by each pulse of the pulse series via a rotary switch control DS connected to the pulse generator PF. Each pulse that reaches the sampling control ATS via the switch% with the switch positions T, N, H triggers a single sampling of the preferably binary value in the counter Z. The considered pulse of the series, which is delayed in DLYI, then resets the counter to 0 via its input Y, and a new counting process begins. The counter values are numerically influenced by changing the clock generator VTG that controls the counter. The parallel display of the binary value of the counter Z is converted into a series display by the switch PSW3 and transferred to the memory SP.

Die beschriebene Anordnung zur Analyse und Modifizierung der Spektrums- und Anregungsfunktion liefert an ihren Ausgängen (e), (i), (l) und CA (F i g. 1) digitale Signale für den Spektrumcode und den Anregungscode, die das modifizierte Sprachsignal repräsentieren. Wenn die Modifizierung keine Änderung der Artikulationsgeschwindigkeit beinhaltet, kann aus dem Code direkt Sprache generiert werden. Bei einer Modifizierung der Artikulationsgeschwindigkeit dagegen muß ein digitaler Speicher SP (F i g. 4) verwendet werden, der in der Lage ist, die durch die verschiedenen Zeitmaßstäbe resultierende Differenz des Datenflusses der Codegenerierung und der Sprachsignalregenerierung zu puffern.The described arrangement for analyzing and modifying the spectrum and excitation function supplies digital signals for the spectrum code and the excitation code, which represent the modified speech signal , at its outputs (e), (i), (l) and CA (FIG. 1) . If the modification does not include a change in the articulation speed, speech can be generated directly from the code. If the articulation speed is modified, however, a digital memory SP (FIG. 4) must be used which is able to buffer the difference in the data flow of the code generation and the speech signal regeneration resulting from the different time scales.

Claims (4)

Patentansprüche: 1. Anordnung zur wahlweisen Veränderung des Grundtones, der Sprechgeschwindigkeit und der Klangfarbe von nach dem Prinzip des impulserregten Kanalvocoders analysierten Sprachsignalen, dadurch gekennzeichnet, daß zur Veränderung des Grundtones in den Anregungskanal (K, in F i g. 1) eine Modifizierschaltung [Mult (n)3] eingeschaltet ist, welche den digitalen Wert des Abstandes jeweils zweier aufeinanderfolgende Nulldurchgänge einer Richtung der Sprachgrundwelle kennzeichnender Impulse (Anregungsimpulse) numerisch verändert, daß zur Veränderung der Sprechgeschwindigkeit im Anregungskanal Mittel (PZC) vorgesehen sind, die aus der Reihe der ankommenden Anregungsimpulse wahlweise jeden h-ten nicht oder jeden n-ten in einem Intervall mehrmals überträgt, und daß zur Veränderung der Klangfarbe Mittel [DL (4T)1 bis DL (4T)4, S, Mult (n)l, " Addl, 2, Subl, F1 und F2] vorgesehen sind, welche die in digitaler Form vorliegenden Abtastwerte der Spektrumkanäle (K1 bis K5) für jeden Kanal in Abhängigkeit von seinen Nachbarkanälen numerisch verändern (F i g. 1 und 3). Claims: 1. Arrangement for the optional change of the fundamental tone, the speaking speed and the timbre of speech signals analyzed according to the principle of the pulse-excited channel vocoder, characterized in that a modifying circuit [ Mult (n) 3] is switched on, which numerically changes the digital value of the distance between two consecutive zero crossings of a direction of the speech fundamental wave characterizing pulses (excitation pulses) that means (PZC) are provided for changing the speech speed in the excitation channel, which are from the series of incoming excitation pulses either every h-th not or every n-th in an interval several times, and that means [DL (4T) 1 to DL (4T) 4, S, Mult (n) l, "Addl, 2, Subl, F1 and F2] are provided which contain the samples of the spectrum channels (K1 to K5) for each Ka nal numerically depending on its neighboring channels (Fig. 1 and 3). 2. Abänderung der Anordnung nach Anspruch 1, dadurch gekennzeichnet, daß zur Veränderung des Grundtones ein im Anregungskanal (K, in F i g. 4) in bekannter Weise vorgesehener digitaler Zähler (Z) von einem Impulsgenerator (VTG) mit wahlweise variabler Impulsfolgefrequenz gesteuert wird, wodurch der digitale Wert der Sprachanregung numerisch modifiziert wird. 2. Modification of the arrangement according to claim 1, characterized in that that to change the fundamental tone in the excitation channel (K, in Fig. 4) in known Way provided digital counter (Z) from a pulse generator (VTG) with optional variable pulse repetition rate is controlled, increasing the digital value of the speech stimulus is modified numerically. 3. Anordnung nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß zur Veränderung der Sprechgeschwindigkeit im Anregungskanal (K, in F i g. 4) im Anschluß an einen Impulsformer (PF) eine Verzögerungsschaltung (DLYI) folgt, deren Ausgang mit dem Nullstelleingang (r) eines Zählers (Z) verbunden ist, daß eine Drehschaltersteuerung (DS) vorgesehen ist, die an den Impulsformer angeschlossen ist und bei jedem Impuls zwei Drehschalter (Sf, S2) um einen Schritt weiterschaltet, deren Kontaktbänke ebenfalls an den Impulsformer derart angeschaltet sind, daß bei dem einen Schalter (S) ein Kontakt in seiner Leitungsführung zur Kontaktbank unterbrochen ist und bei dem anderen (S2) ein zusätzlicher Kontakt vorgesehen ist, der zu dem Ausgang einer ODER-Schaltung (O) führt, deren einer Eingang mit der Kontaktbank und deren anderer Eingang an eine weitere Verzögerungsschaltung (DLY2) führt, die mit ihrem Eingang ebenfalls an der Kontaktbank liegt, daß ferner ein weiterer Schalter (S5) vorgesehen ist, dessen erster Kontakt an dem Ausgang des einen Drehschalters (Sf), dessen zweiter Kontakt an der Kontaktbank und dessen dritter Kontakt am Ausgang des anderen Drehschalters (S2) liegt, und daß der Ausgang des weiteren Schalters (S5) mit einer Abtaststeuerung (ATS) zur Steuerung eines dem Zähler (Z) folgenden Parallel-Serien-Wandlers (PSW3) verbunden ist. 3. Arrangement according to claim 1 or 2, characterized in that to change the speech rate in the excitation channel (K, in F i g. 4) in connection with a pulse shaper (PF) a delay circuit (DLYI) follows, the output of which is connected to the zero input ( r) a counter (Z) is connected that a rotary switch control (DS) is provided, which is connected to the pulse shaper and advances two rotary switches (Sf, S2) by one step with each pulse, the contact banks of which are also connected to the pulse shaper in this way that in one switch (S ) a contact in its wiring to the contact bank is interrupted and in the other (S2) an additional contact is provided which leads to the output of an OR circuit (O), one input of which with the contact bank and the other input of which leads to a further delay circuit (DLY2), the input of which is also connected to the contact bank, that a further switch (S5) is also provided, de ssen first contact at the output of a rotary switch (Sf), whose second contact is on the contact bank and whose third contact is at the output of the other rotary switch (S2), and that the output of the further switch (S5) with a scanning control (ATS) for Control of a parallel-serial converter (PSW3) following the counter (Z) is connected. 4. Anordnung nach Anspruch 1, dadurch gekennzeichnet, daß zur Veränderung der Klangfarbe einem im Spektrumkanal vorgesehenen Analog-Digital-Wandler (ADW in F i g. 1) ein Parallel-Serien-Wandler (PSWl) folgt, dessen Ausgang mit einer aus einzelnen Verzögerungsstrecken [DL(4T)1 bis DL(4T)4] mit zwischengeschalteten Abgriffen [(b), (c), (d), (e)] versehenen Verzögerungskette verbunden ist, deren Eingang [(a)] und deren erster und zweiter Abgriff [(b), (c)] auf die Kontakte (T, N, H) eines Wählschalters (S) gelegt sind, dessen Ausgang mit dem dritten Abgriff [(d)] verbunden ist, der seinerseits zu einer Multiplizierschaltung [Mult (n)2] führt, daß weiterhin der vierte Abgriff [(e)] sowohl mit dem ersten Eingang einer Addierschaltung (Add2) als auch mit dem ersten Eingang einer Subtrahierschaltung (Sub1) verbunden ist, wobei der jeweils übrige Eingang der Addier- und der Subtrahierschaltung mit dem Ausgang einer weiteren Addierschaltung (Addi) verbunden ist, deren einer Eingang zu dem Ausgang der schon erwähnten Multiplizierschaltung [Malt (yz),] und deren anderer Eingang zu dem Ausgang einer anderen Multiplizierschaltung [Mult (n)1] führt, deren Eingang mit dem Ausgang [(f)] der Verzögerungskette verbunden ist, und daß der Ausgang der ersteren Addierschaltung (Add2) mit dem Eingang einer ersten Korrekturstufe (F) und der Ausgang der Subtrahierschaltung (Subi) mit dem Eingang einer zweiten Korrekturstufe (F2) zusammengeschaltet ist, so daß an den Ausgängen der Korrekturstufen die variierten .Spektrumcodes auftreten.4. Arrangement according to claim 1, characterized in that for changing the timbre of an analog-to-digital converter (ADW in F i g. 1) provided in the spectrum channel is followed by a parallel-to-serial converter (PSWl), the output of which with one of individual Delay lines [DL (4T) 1 to DL (4T) 4] with intermediate taps [(b), (c), (d), (e)] provided delay chain is connected, whose input [(a)] and whose first and second tap [(b), (c)] are placed on the contacts (T, N, H) of a selector switch (S), the output of which is connected to the third tap [(d)], which in turn becomes a multiplier circuit [Mult (n) 2] leads to the fact that the fourth tap [(e)] is connected both to the first input of an adding circuit (Add2) and to the first input of a subtracting circuit (Sub1), the remaining input being the adding and the subtracting circuit is connected to the output of a further adding circuit (Addi), one input of which leads to the output ng of the already mentioned multiplier circuit [Malt (yz),] and its other input leads to the output of another multiplier circuit [Mult (n) 1], the input of which is connected to the output [(f)] of the delay chain, and that the output the former adding circuit (Add2) is interconnected with the input of a first correction stage (F) and the output of the subtraction circuit (Subi) with the input of a second correction stage (F2), so that the varied spectrum codes occur at the outputs of the correction stages.
DEJ29117A 1964-10-16 1965-10-02 Arrangement for changing the basic tone, the speaking speed and the timbre of speech signals analyzed according to the vocoder principle Withdrawn DE1258472B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
AT1258472X 1964-10-16

Publications (1)

Publication Number Publication Date
DE1258472B true DE1258472B (en) 1968-01-11

Family

ID=3687875

Family Applications (1)

Application Number Title Priority Date Filing Date
DEJ29117A Withdrawn DE1258472B (en) 1964-10-16 1965-10-02 Arrangement for changing the basic tone, the speaking speed and the timbre of speech signals analyzed according to the vocoder principle

Country Status (1)

Country Link
DE (1) DE1258472B (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8570328B2 (en) 2000-12-12 2013-10-29 Epl Holdings, Llc Modifying temporal sequence presentation data based on a calculated cumulative rendition period

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8570328B2 (en) 2000-12-12 2013-10-29 Epl Holdings, Llc Modifying temporal sequence presentation data based on a calculated cumulative rendition period
US8797329B2 (en) 2000-12-12 2014-08-05 Epl Holdings, Llc Associating buffers with temporal sequence presentation data
US9035954B2 (en) 2000-12-12 2015-05-19 Virentem Ventures, Llc Enhancing a rendering system to distinguish presentation time from data time

Similar Documents

Publication Publication Date Title
DE2210649C3 (en) Communication system with binary multi-level code converter and multi-level binary code converter
DE2524497C3 (en) Method and circuit arrangement for speech synthesis
DE2536585C3 (en) Arrangement for statistical signal analysis
DE2023570C2 (en) Single sideband modulation system
DE2536673A1 (en) PHASE FILTER
DE2530380A1 (en) VOICE SYNTHETIZER SYSTEM
DE2125230B2 (en) Method and circuit arrangement for the modifying processing of digital information signal sequences
DE2433075B2 (en) ARRANGEMENT FOR FREQUENCY SYNTHESIS
DE1938804C3 (en) Numerical frequency receiving device
DE2724347A1 (en) DELTA MODULATOR WITH A QUANTIZING COMPARATOR
DE2644478A1 (en) DIFFERENTIAL PHASE TOUCH MODULATOR
DE1149745B (en) Pulse code messaging system
DE2523625A1 (en) DIGITAL FILTER
DE2850555C2 (en)
DE1258472B (en) Arrangement for changing the basic tone, the speaking speed and the timbre of speech signals analyzed according to the vocoder principle
DE2111838B2 (en) AUTOMATICALLY SELF-ADJUSTING DAMPING EQUIPMENT
DE3046772C2 (en) Clock generator
DE2060375C3 (en) Receiver for frequency-shifted signals
DE3335026C2 (en)
DE2051589A1 (en) Arrangement for the synthesis of a signal
DE3303516C2 (en) Method and device for frequency conversion of a digital input signal
DE3342739C2 (en) A / D and D / A conversion
EP0676887B1 (en) Method for generating a digital sinus signal with a predetermined sampling rate and circuit for the implementation of the method
DE2319986C3 (en) Digital-to-analog converter
DE2834751C2 (en)

Legal Events

Date Code Title Description
E77 Valid patent as to the heymanns-index 1977
EHJ Ceased/non-payment of the annual fee