WO2002021091A1

WO2002021091A1 - Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit

Info

Publication number: WO2002021091A1
Application number: PCT/JP2001/007630
Authority: WO
Inventors: Koji Yoshida; Fumitada Itakura
Original assignee: Matsushita Communication Industrial Co., Ltd.; Nagoya University
Priority date: 2000-09-06
Filing date: 2001-09-04
Publication date: 2002-03-14
Also published as: EP1258715A4; US6934650B2; EP1258715A1; US20020165681A1; JP2002156999A; JP3670217B2; AU2001282616A1; EP1258715B1

Description

明細書雑音信号分析装置、雑音信号合成装置、雑音信号分析方法および雑音信号合成方法技術分野

本発明は、音声信号に重畳されている背景雑音信号の分析および合成を行う雑音信号の分析 ·合成装置に関し、また、この分析 '合成装置を用いて音声信号の符号化を行う音声符号化装置に関する。背景技術

移動通信や音声蓄積の分野においては、電波や記憶媒体の有効利用のために、音声情報を圧縮して低いビットレ一トで符号化する音声符号化装置が用いられている。このような音声符号化装置における従来の技術として、 ITU-T勧告の G .729 AnnexB ("A silence compression scheme for G.729 optimized for terminals conforming to Recommendation V.70") の D T X (Discontinuous Transmission)制御付きの CS— ACELP符号化方式がある。

図 1は、従来の D T X制御付き C S— A C E L P符号化方式を採用した符号化装置の構成を示すプロック図である。図 1において、入力音声信号は、有音 /無音判定器 11、 CS— ACELP音声符号器 12および無音区間符号器 1 3に入力される。まず、有音 Z無音判定器 1 1において、入力音声信号が有音区間か無音区間（背景雑音のみの区間）かの判定が行われる。

有音/無音判定器 11により有音と判定された場合には、 CS— ACELP 音声符号器 12では、有音区間に対する音声符号化が行われる。有音区間の符号化データは、 DTX制御および多重化器 14に出力される。

一方、有音/無音判定器 11により無音と判定された場合には、無音区間符号器 13では、無音区間に対する雑音信号の符号ィ匕が行われる。この無音区間符号器 1 3においては、入力音声信号を用いて、有音区間の符号化におけるものと同様の L P C係数、および、入力音声信号の L P C予測残差エネルギーが算出され、これらが無音区間の符号化デ一夕として D T X制御および多重化器 1 4に出力される。ただし、無音区間の符号化データは、入力信号の特性（L P C係数やエネルギー）に所定の変化が検出された区間において間欠的に送信されるものである。

D T X制御および多重化器 1 4では、有音/無音判定器 1 1、 C S - A C E L P音声符号器 1 2および無音区間符号器 1 3の出力を用いて、送信データとして送信すべきデ一夕が、制御および多重化された後、送信データとして出力される。

上記のような従来の音声符号化装置においては、入力音声信号における有音区間についてのみ、 C S— A C E L P音声符号器を用いて符号化を行い、入力音声信号における無音区間（雑音のみの区間）については、専用の無音区間符号器を用いて音声符号器より少ないビット数でかつ間欠的に符号化を行うことにより、伝送する信号の平均ビットレートを低減できる効果がある。しかしながら、上記従来の音声符号化方式においては、以下に示すような要因により、送信側装置により符号化されたデータを受信する受信側装置では、無音区間中の雑音信号に対する復号信号の品質が劣化するという問題がある。すなわち、まず第 1の要因として、送信側装置における無音区間符号器（雑音信号の分析 ·符号化部）が、音声符号器と同様な信号モデル（短区間（10〜50ms 程度）毎に A R型の合成フィル夕（L P C合成フィル夕）を雑音信号で駆動することで復号信号を生成する）により符号化を行っていることが挙げられる。第 2の要因として、受信側装置は、送信側装置において入力雑音信号を間欠的に分析することにより得られた符号化デ一夕を用いて、雑音を合成（生成）していることが挙げられる。

発明の開示

本発明の目的は、背景雑音信号を聴感的に高い品質で合成できる雑音信号合成装置を提供することである。

この目的は、雑音信号を統計的モデルで表現することである。具体的には、ある統計的分布に従う振幅スぺクトル時系列で表され、かつ、その振幅スぺクトル時系列の継続時間長が別の統計的分布に従う複数の定常雑音モデルを用いて、その定常雑音モデル間を統計的に遷移するスペトル系列として雑音信号を表現する。

図面の簡単な説明

図 1は、従来の D T X制御付き C S— A C E L P符号化方式を採用した符号化装置の構成を示すプロック図

図 2は、本発明の実施の形態 1にかかる雑音信号分析装置の構成を示すプロック図、

図 3は、本発明の実施の形態 1にかかる雑音信号合成装置の構成を示すプロヅク図、

図 4は、本発明の実施の形態 1にかかる雑音信号分析装置の動作を示すフ口一図、

図 5は、本発明の実施の形態 1にかかる雑音信号合成装置の動作を示すフ口一図、

図 6は、本発明の実施の形態 2にかかる音声符号化装置の構成を示すプロック図、

図 7は、本発明の実施の形態 2にかかる音声復号装置の構成を示すプロック図、

図 8は、本発明の実施の形態 2にかかる音声符号化装置の動作を示すフロー図、

図 9は、本発明の実施の形態 2にかかる音声復号装置の動作を示すフロー図、図 1 0は、本発明の実施の形態 3にかかる雑音信号分析装置の構成を示すブロック図、

図 1 1は、本発明の実施の形態 3にかかるスペクトルモデルパラメ一夕算出 ·量子化部の構成を示すブロック図、

図 1 2は、本発明の実施の形態 3にかかる雑音信号合成装置の構成を示すブロック図

図 1 3は、本発明の実施の形態 3にかかる雑音信号分析装置の動作を示すフ口一図、

図 1 4は、本発明の実施の形態 3にかかるスぺクトルモデルパラメ一夕算出 ·量子化部の動作を示すフロー図、

図 1 5は、本発明の実施の形態 3にかかる雑音信号合成装置の動作を示すフ口一図、

図 1 6は、本発明の実施の形態 4にかかる音声符号化装置の構成を示すプロック図、

図 1 7は、本発明の実施の形態 4にかかる音声復号装置の構成を示すブロック図、

図 1 8は、本発明の実施の形態 4にかかる音声符号化装置の動作を示すフロ —図、

図 1 9は、本発明の実施の形態 4にかかる音声復号装置の動作を示すフロー図である。発明を実施するための最良の形態

以下、本発明の実施の形態について、図面を用いて説明する。

(実施の形態 1 )

本発明においては、雑音信号を統計的なモデルで表現する。すなわち、ある統計的分布に従う振幅スペクトル時系列で表され、かつ、その振幅スペクトル時系列の継続時間長がある統計的分布に従う複数の定常雑音モデルを用いて、その定常雑音モデル間を統計的に遷移するスぺクトル系列として雑音信号をより具体的には、定常雑音スペクトルを、スペクトルモデル数 Μ個の振幅スベクトル時系列 {Si(n)} (n=l，. . . ，Li, i二 1，. . . ,M)で表現する。ここで、 Liは、各々の振幅スぺクトル時系列 {Si(n)}の継続時間長（ここでは、フレ一ム数を単位とする）を示す。また、 { S i (n)}および Liは各々正規分布で表される統計的分布に従うものとする。そして、そのスペクトル時系列モデル { S i (n)}間を遷移確率 p(i,j) ( i, =l, . . . ,Μ)で遷移するスペクトル系列として背景雑音を表現する。

図 2は、本発明の実施の形態 1にかかる雑音信号分析装置の構成を示すプロック図である。図 2に示す雑音信号分析装置において、窓かけ部 1 0 1は、一定区間（以下「フレーム」という。）毎に入力された第 mフレーム（BF0, 1，2，. . . ) に対する入力雑音信号 x (j) (j=0，. . . ，N-1; N:分析長）に対して、ハニング窓等による窓かけを行う。 F F T (高速フーリエ変換）部 1 0 2は、窓かけがなされた入力雑音信号を周波数スぺクトルに変換して、第 mフレームの入力振幅スぺクトル X(m)を算出する。

スぺクトルモデル系列算出部 1 0 4は、スぺクトルモデル言 3憶部 1 0 3に蓄えられているスペクトルモデル S i ( i=l，. . . ,Μ)に関するモデル情報を用いて、入力雑音信号の振幅スペクトル系列 {X(m)} (m=0, l,2，. . . )に対応するスペクトルモデル番号系列 {index(m)} (l≤index(m)≤M， DF0，1,2, . . . ) を算出する。ここで、スペクトルモデル S i (i=l，. . . ,Μ)に関するモデル情報は、 S iの統計パラメ一夕である平均振幅 Sav— iおよび標準偏差 Sdv_iを含むものである。これらは、予め学習により用意しておくことが可能である。また、対応するスぺクトルモデル番号系列の算出は、入力振幅スぺクトル X(m) からの距離が最も小さい平均振幅 Sav— iを有するスぺクトルモデル S iの番号 iを求めることにより、なされる。

継続長モデル ·遷移確率算出部 1 0 5は、スぺクトルモデル系列算出部 1 0 4により得られたスペクトルモデル番号系列 {index(m)}を用いて、 S i各々に対する継続フレーム数 Liに関する統計パラメ一夕（Liの平均値 Lav— iおよび標準偏差値 Ldv_i) および S i間の遷移確率 p( i,j)を算出し、それらを入力雑音信号に対するモデルパラメ一夕として出力する。なお、これらのモデルパラメ一夕は、ある一定期間毎あるいは任意の間隔で算出 '伝送される。

図 3は、本発明の実施の形態 1にかかる雑音信号合成装置の構成を示すプロック図である。図 3に示す雑音信号合成装置において、遷移系列生成部 201 は、図 2に示した雑音信号分析装置により得られたモデルパラメ一夕（Liの平均値 Lav— i, 標準偏差値 Ldv_iおよび S i間の遷移確率 p(i,j)) のうち S i間の遷移確率 P(i,j)を用いて、スぺクトルモデル S iの遷移がその与えられた遷移確率 p(i，j)となるようなスぺクトルモデル番号遷移系列 {index，（l)} (1≤ index'(l)≤M₃ 1=0,1,2，. . . ) を生起させる。

スぺクトル生成部 205は、遷移系列生成部 201により得られたモデル番号 index'(l)、および、スペクトルモデル記憶部 202に保持されているスぺクトルモデル S i (i=l，. . . ，M)に関するモデル情報（S iの平均振幅 Sav_i および標準偏差 Sdv—i)を用いて、次式で示される index'(l)に対する振幅スぺクトル時系列 {X'(n)}を生成する。

{X'(n)} = {S _index'₍₁)(n)}, n二 1,2,. . . ,L 一（1)

ここで、 S i _uは、 i=index'(l)に対する平均振幅 Sav_i、標準偏差 Sdv—i を有する正規分布に従うものとし、また継続フレーム数 Lは、継続長制御部 2 03において、雑音信号分析装置から出力されたスぺクトルモデル S iに対する継続フレーム数 Liの統計モデルパラメ一夕（Liの平均値 Lav— i, 標準偏差値 Ldv_i) を用いて、 i=index'(l)に対する平均値 Lav_i、標準偏差 Ldv— iを有する正規分布に従うように制御されたものである。

さらに、スぺクトル生成部 205は、上記の方法により、遷移系列 {index'(l)} に沿って生成した所定の時間長（フレーム数）の振幅スぺクトル時系列に対して、乱数位相生成部 204により生成された乱数位相を与えて、スぺクトル時系列を作成する。なお、スぺクトル生成部 205において、生成された振幅スぺクトル時系列に対してスぺクトルが滑らかに変化するよう平滑化を行ってもよい。 I F F T (逆高速フーリエ変換）部 2 0 6は、スペクトル生成部 2 0 5により生成されたスぺクトル時系列を時間領域の波形に変換する。重ね合わせ加算部 2 0 7は、フレーム間の信号の重ね合わせ加算を行うことにより、最終的な合成雑音信号を出力する。

次いで、上記構成を有する雑音信号分析装置および雑音信号合成装置の動作について、さらに図 4および図 5を参照して説明する。図 4は、本発明の実施の形態 1にかかる雑音信号分析装置の動作を示すフロー図である。図 5は、本発明の実施の形態 1にかかる雑音信号合成装置の動作を示すフロー図である。まず、本実施の形態にかかる雑音信号分析装置の動作について、図 4を参照して説明する。まず、工程（以下「S T」という。） 3 0 1において、フレーム毎の雑音信号 x(j) (j=0，. . . ,Ν-1; Ν:分析長）が、窓かけ部 1 0 1に入力される。 S T 3 0 2において、第 mフレ一ム（IIF0，1，2，. . . )に対する入力雑音信号に対してハニング窓等による窓かけが、窓かけ部 1 0 1によりなされる。 S T 3 0 3において、窓かけがなされた入力雑音信号は、 F F T部 1 0 2 により、 F F T (高速フーリエ変換）がなされて、周波数スペクトルに変換される。これにより、第 mフレームの入力振幅スペクトル X n)が算出される。

S T 3 0 4において、スペクトルモデル系列算出部 1 0 4により、スぺクトルモデル S i ( i=l，. . . ，M)に関するモデル情報を用いて、入力雑音信号の振幅スペクトル系列 {X(m)} (m=0, l,2，. . . )に対応するスペクトルモデル番号系列 {index(m) } (l≤index(m)≤M₅ IIF0，1,2, . . . ) が算出される。ここで、スペクトルモデル S i (i=l，. . . ，M)に関するモデル情報は、 S iの統計パラメ一夕である平均振幅 Sav— iおよび標準偏差 Sdv— iを含むものである。これらは、予め学習により用意しておくことが可能なものである。また、対応するスぺクトルモデル番号系列の算出は、入力振幅スぺクトル X(m)からの距離が最も小さい平均振幅 Sav— iを有するスぺクトルモデル S iの番号 iを求めることにより、なされる。以上の S T 3 0 1〜S T 3 0 4の処理がフレーム単位で行われる。 . S T 305では、 S T 304で得られたスぺクトルモデル番号系列 {index(m)}を用いて、継続長モデル ·遷移確率算出部 105により、 S i各々に対する継続フレーム数 Liに関する統計パラメ一夕（Liの平均値 Lav— iおよび標準偏差値 Ldv_i)および S i間の遷移確率 p(i，j)が算出される。 ST30 6において、これらは、入力雑音信号に対するモデルパラメ一夕として出力される。なお、これらのモデルパラメ一夕は、ある一定期間毎あるいは任意の間隔で算出 ·伝送される。

本実施の形態にかかる雑音信号合成装置の動作について、図 5を参照して説明する。まず、 ST401において、雑音信号分析装置により得られたモデルパラメ一夕（Liの平均値 Lav— i, 標準偏差値 Ldv_iおよび S i間の遷移確率 P(i, )) が、遷移系列生成部 201および継続長制御部 203に入力される。

ST 402において、入力されたモデルパラメ一夕のうち S i間の遷移確率 P(i,j)を用いて、遷移系列生成部 201により、スペクトルモデル S iの遷移がその与えられた遷移確率 p(i，j)となるようなスぺクトルモデル番号遷移系列 {index'(l)} (l≤index'(l)≤M, 1=0,1,2" . . ) が生起される。

次に、 ST403において、入力されたモデルパラメ一夕のうちスペクトルモデル S iに対する継続フレーム数 Liの統計モデルパラメ一夕（Liの平均値 Lav_i，標準偏差値 Ldv_i)を用いて、 i二 index'(l)に対して平均値 Lav_i、標準偏差 Ldv— iを有する正規分布に従うように制御された継続フレーム数 Lが、継続長制御部 203により生成される。また、 S T 404において、乱数位相生成部 204により乱数位相が生成される。

S T 405において、 S T 402で得られたモデル番号 index，（l)および予め用意されているスペクトルモデル S i (i=l，. . . ，M)に関するモデル情報 (S iの平均振幅 Sav— iおよび標準偏差 Sdv— i) を用いて、スぺクトル生成部 205により、（1)式で示した index，（l)に対する振幅スぺクトル時系列 (n)} が生成される。なお、生成された振幅スぺクトル時系列に対してスぺクトルが滑らかに変化するよう平滑化を行っても良い。ここで、 S _index'(_uは、 i=index'(l)に対する平均振幅 Sav— i、標準偏差 Sdv— i を有する正規分布に従うものとし、継続フレーム数 Lは、 S T 4 0 4において生成されたものである。

さらに、遷移系列 {index'( l)}に沿って生成した所定の時間長（フレーム数）の振幅スぺクトル時系列に対して、 S T 4 0 4により生成された乱数位相が与えられて、スペクトル時系列が作成される。

S T 4 0 6において、作成されたスぺクトル時系列は、 I F F T部 2 0 6により時間領域の波形に変換された後、 S T 4 0 7において、重ね合わせ加算部 2 0 7によりフレーム間の信号の重ね合わせ加算が行われる。 S T 4 0 8において、重ね合わせ加算された信号が最終的な合成雑音信号として出力される。このように、本実施の形態においては、背景雑音信号を統計的モデルで表現している。すなわち、雑音信号分析装置（送信側装置）において、雑音信号を用いて、雑音信号スぺクトルのスぺクトル変化を含めた統計的情報（統計モデルパラメ一夕）を生成し、生成した情報を雑音信号合成装置（受信側装置）に送信している。また、雑音信号合成装置（受信側装置）においては、雑音信号分析装置（送信側装置）から送信された上記情報（統計モデルパラメ一夕）を用いて、雑音信号を合成している。これにより、雑音信号合成装置（受信側装置）においては、間欠的に分析された雑音信号のスペクトルではなく、雑音信号スぺクトルのスぺクトル変化を含めた統計的情報を用いて、雑音信号を合成することができるので、聴感的に劣化の少ない雑音信号を合成することができる。

なお、本実施の形態では、図 2および図 3に示す構成の雑音信号分析装置 - 合成装置、および図 4および図 5に示す雑音信号分析方法'合成方法を用いて、上記に示した内容で説明したが、本発明の主旨に逸脱することなく別の実現手段にて実現することも可能である。たとえば、上記実施の形態では、スぺクトルモデル情報として、スペクトル Sの統計モデル（Sの平均と標準偏差）は予め学習により用意したものとして説明したが、入力雑音信号に対して実時間的に学習する、または L P C係数等別のスぺクトル表現パラメ一夕で量子化して合成側に伝送する形態にすることもできる。また、スペクトル継続長の統計パラメ一夕（Lの平均 Lav,標準偏差 Ldv)やスぺクトルモデル S i間の統計遷移パラメ一夕を予めパターン化しておき、その中から適切なものを、ある一定期間中の入力雑音信号に対して選択して伝送し、それに基づき合成することも可能である。

(実施の形態 2 )

本実施の形態では、実施の形態 1で説明した雑音信号分析装置を用いて音声符号化装置を実現し、また、実施の形態 1で説明した雑音信号合成装置を用いて音声復号装置を実現する場合について説明する。

まず、本実施の形態にかかる音声符号化装置について、図 6を参照して説明する。図 6は、本発明の実施の形態 2にかかる音声符号化装置の構成を示すブロック図である。図 6において、入力音声信号は、有音 Z無音判定器 5 0 1、音声符号器 5 0 2および雑音信号符号器 5 0 3に入力される。

有音 Z無音判定器 5 0 1は、入力音声信号に対して有音区間か無音区間（雑音のみの区間）かを判定しその判定結果を出力する。有音/無音判定器 5 0 1 は、任意のものでよく、一般には、入力信号のパヮ、スペクトルやピヅチ周期などの複数のパラメ一夕の瞬時量または変化量等を用いて判定を行うものである。

音声符号器 5 0 2は、有音無音判定器 5 0 1による判定結果が有音である場合に、入力音声信号に対して音声符号化を行いその符号化デ一夕を、 D T X 制御および多重化器 5 0 4に出力する。この音声符号器 5 0 2は、有音区間用の符号器であり、音声を高能率に符号化する任意の符号器である。

雑音信号符号器 5 0 3は、有音/無音判定器 5 0 1による判定結果が無音である場合に、入力音声信号に対して雑音信号の符号化を行い入力雑音信号に対するモデルパラメ一夕を出力する。この雑音信号符号器 5 0 3は、実施の形態 1で説明した雑音信号分析装置（図 2参照）に対して、出力モデルパラメ一夕を量子化 ·符号化した符号化パラメ一夕を出力する構成を付加したものである _c

D T X制御および多重化器 5 0 4は、有音/無音判定器 5 0 1、音声符号器 5 0 2および雑音信号符号器 5 0 3からの出力を用いて送信デ一夕として送信すべき情報の制御と送信情報の多重化を行い、送信デ一夕を出力する。次に、本発明の実施の形態 2にかかる音声復号装置について、図 7を参照して説明する。図 7は、本発明の実施の形態 2にかかる音声復号装置の構成を示すブロック図である。図 7において、図 6に示した音声符号化装置により送信された送信データは、受信データとして分離および D T X制御器 6 0 1に入力される。

分離および D T X制御器 6 0 1は、受信データを、音声復号および雑音生成に必要な、音声符号化データまたは雑音モデル符号化パラメ一夕および有音 Z 無音判定フラグに分離する。

音声復号器 6 0 2は、前記有音/無音判定フラグが有音区間を示す場合に、前記音声符号化デ一夕を用いて音声復号を行い復号音声を出力する。雑音信号復号器 6 0 3は、前記有音/無音判定フラグが無音区間を示す場合に、前記雑音モデル符号化パラメ一夕を用いて雑音信号の生成を行い、雑音信号を出力する。この雑音信号復号器 6 0 3は、実施の形態 1で説明した雑音信号合成装置 (図 2 ) に対して、入力されたモデル符号化パラメ一夕を各々のモデルパラメ —夕に復号する構成を付加したものである。

出力切り替え器 6 0 4は、音声復号器 6 0 2の出力と雑音信号復号器 6 0 3 の出力を、有音/無音判定フラグの結果に応じて切り替えて出力し、出力信号とする。

次に、上記構成を有する音声符号化装置および音声復号装置の動作について説明する。まず、音声符号化装置の動作について、図 8を参照して説明する。図 8は、本発明の実施の形態 2にかかる音声符号化装置の動作を示すフロー図である。

まず、 S T 7 0 1において、フレーム毎の音声信号が入力され、 S T 7 0 2 において、入力音声信号に対して有音区間か無音区間（雑音のみの区間）かが判定されその判定結果が出力される。この有音 Z無音判定は任意の方法でよく、一般には、入力信号のパヮ、スペクトルやピッチ周期などの複数のパラメ一夕の瞬時量または変化量等を用いて判定が行われる。

S T 7 0 2における有音 Z無音判定結果が有音である場合には、 S T 7 0 3 において入力音声信号に対する音声符号化が行われ、その符号化デ一夕が出力される。この音声符号化処理は有音区間用の符号化で、音声を高能率に符号化する任意の方法でよい。

一方、前記有音/無音判定結果が無音である場合には、 S T 7 0 4において、入力音声信号に対する雑音信号の符号化が行われ、入力雑音信号に対するモデルパラメ一夕が出力される。この雑音信号符号化は、実施の形態 1にて説明した雑音信号の分析方法に対して、出力モデルパラメ一夕を量子化 ·符号化した符号化パラメ一夕を出力する工程を追加したものである。

S T 7 0 5において、前記有音/無音判定結果、音声符号化および雑音信号符号化からの出力を用いて送信デ一夕として送信すべき情報の制御（D T X制御）と送信情報の多重化が行われ、 S T 7 0 6において送信データとして出力される。

次に、音声復号装置の動作について、図 9を参照して説明する。図 9は、本発明の実施の形態 2にかかる音声復号装置の動作を示すフロー図である。まず、 S T 8 0 1において、符号化側で入力信号に対して符号化された送信データが受信データとして入力される。 S T 8 0 2において、受信デ一夕は、音声復号および雑音生成に必要な、音声符号化データまたは雑音モデル符号化パラメ一夕および有音/無音判定フラグに分離される。

前記有音/無音判定フラグが有音区間を示す場合には、 S T 8 0 4において前記音声符号化データを用いて音声復号が行われ、復号音声が出力される。一方、前記有音/無音判定フラグが無音区間を示す場合には、 S T 8 0 5において前記維音モデル符号化パラメ一夕を用いて雑音信号の生成が行われ、雑音信号が出力される。この雑音信号復号処理は、実施の形態 1で説明した雑音信号の合成方法に対して、入力されたモデル符号化パラメ一夕を各々のモデルパラメ一夕に復号する工程を追加したものである。

S T 8 0 6において、有音/無音判定フラグの結果に応じて S T 8 0 4における音声復号または S T 8 0 5における雑音信号復号の出力が、復号信号として出力される。

このように、本実施の形態によれば、有音区間では音声信号を高品質で符号化できる音声符号化で、無音区間では聴感的に劣化が少ない雑音信号分析装置および合成装置を用いて雑音信号の符号ィヒおよび復号を行うことにより、背景雑音環境下においても高品質な符号化を行える。また、実際の周囲騒音下での雑音信号の統計的な特性は比較的長期間（例えば数秒〜十数秒）に渡り一定であることが想定されることから、モデルパラメ一夕の伝送周期もその程度の長期間周期で良いため、復号側に伝送すべき雑音信号のモデルパラメ一夕の情報量は少なくて済み、効率的な伝送を実現することができる。

(実施の形態 3 )

図 1 0は、本発明の実施の形態 3にかかる雑音信号分析装置の構成を示すブロック図である。

本実施の形態においても、実施の形態 1と同様、定常雑音スペクトルをある継続時間長（フレーム数） Liからなる M個の振幅スペクトル時系列 { S i (n) } (n=l，. . . , Li, i=l，. . . ,M)で表現（{ S i (η) }および Li は各々正規分布に従うものとする）し、そのスペクトル時系列モデル { S i (n) }間を遷移確率 p( i, j) ( i，j=l，. . . ,Μ)で遷移するスペクトル系列として背景雑音を表現する。

図 1 0に示す雑音信号分析装置において、窓かけ部 9 0 1は、一定区間（以下「フレーム」という。 ) 毎に入力された第 mフレーム（IFO , 1, 2，. . . )に対する入力雑音信号 x(j) (j=0₅ . . . ₃N-1 ; N:分析長）に対して、ハニング窓等による窓かけを行う。 F F T (高速フーリエ変換）部 9 0 2は、窓かけがなされた入力雑音信号を周波数スぺクトルに変換して、第 mフレームの入力振幅スぺクトル X(m)を算出する。スぺクトルモデルパラメ一夕算出'量子化部 9 0 3は、入力雑音信号の振幅スペクトル系列 {X(m)} (m-0₅ l₃2₅ . . . ) を一定フレーム数の区間、または何らかの指標により適応的に定められたフレーム数からなる区間を、モデル化を行う単位区間（モデル化区間）として区切り、そのモデル化区間におけるスペクトルモデルパラメ一夕の算出および量子化を行い、スペクトルモデルパラメ一夕の量子化インデクスを出力すると共に、入力雑音信号の振幅スぺクトル系列 {X(m) }に対応するスぺクトルモデル番号系列 {index(m) } (l≤index(m)≤M, m=mk₃mk+l,mk+2₅ . . . ,mk+N丽- 1; mkは当該モデル化区間の先頭フレーム番号、 ΝΙΈΜはモデル化区間のフレーム数）を出力する。ここで、スペクトルモデルパラメ一夕とは、スペクトルモデル S i ( i=l，. . . ，M)の統計パラメ一夕である平均振幅 Sav— iおよび標準偏差 Sdv— i を含むものである。このスぺクトルモデルパラメ一夕算出 ·量子化部 9 0 3の構成については、図 1 1により詳細に説明する。

継続長モデル ·遷移確率算出 ·量子化部 9 0 4は、スぺクトルモデルパラメ一夕算出 ·量子化部 9 0 3により得られたモデル化区間のスぺクトルモデル番号系列 {index(m) }を用いて、 S i各々に対する継続フレーム数 Li に関する統計パラメ一夕 (継続長モデルパラメ一夕) (Liの平均値 Lav— iおよび標準偏差値 Ldv— i) および Si- Sj間の遷移確率 p( i, j)を算出 '量子化し、それらの量子化インデクスを出力する。量子化方法は任意であるが、 Lav— i、 Ldv_i、および P( i, j )の各要素を各々スカラ量子化してもよい。

以上の、スペクトルモデルパラメ一夕、継続長モデルパラメ一夕および遷移確率パラメ一夕の量子化ィンデクスを、モデル化区間の入力雑音信号の統計モデルパラメ一夕量子化ィンデクスとして出力する。

図 1 1は、図 1 0のスペクトルモデルパラメ一夕算出 '量子化部 9 0 3の詳細構成を示すブロック図である。本実施例におけるスぺクトルモデルパラメ一夕算出 ·量子化部 9 0 3は、予め用意した雑音信号を表す振幅スぺクトルの代表べクトル集合の中から、入力雑音のモデル化区間における入力振幅スぺクトル時系列を表すのに適切な代表べクトルをモデル数（=M) 個選択し、それをベースにスぺクトルモデルパラメ一夕を算出 ·量子化する。

まず、モデル化区間内のフレーム単位の入力振幅スペクトル X(m) (m=mk₃mk+l,mk+2₃ . . . ,mk+NFRM- 1)に対して、パヮ算出部 1 0 0 1で算出されたパヮ値を用いて、パヮ正規化部 1 0 0 2でパヮの正規化を行う。そして、そのパヮ正規化された入力振幅スぺクトルに対して、クラス夕化部 1 0 0 4において、雑音スぺクトル代表べクトル記憶部 1 0 0 3の各代表べクトルをクラス夕中心とするクラス夕化（べクトル量子化）を行い、各入カスペクトルがどのクラス夕に所属するかの情報を出力する。ここで、雑音スペクトル代表べクトル記憶部 1 0 0 3には、代表的な雑音信号の振幅スぺクトルを代表べクトルとして予め学習により作成し、記憶しているもので、代表ベクトルの数は雑音モデル数 (M)以上とする。そして、クラス夕別平均スぺクトル算出部 1 0 0 5 において、クラス夕化部 1 0 0 4で得られた所属するクラス夕（代表べクトル）番号の系列に対して、モデル化区間で所属頻度の高い上位 M個のクラス夕（対応する代表べクトルを Ci(i=l,2, ...,M)とする）を選択し、その各クラス夕に所属する入力雑音振幅スぺクトルの平均スぺクトルをクラスタ毎に算出し、それらをスぺクトルモデルの平均振幅スぺクトル Sav_i( i=l,2，...，M)とする。また、入力雑音信号の振幅スぺクトル系列 {X(m)}に対するスぺクトルモデル番号系列 {index(m) } (1≤ index(m)≤M₃ nFmk，mk+l ₅ mk+2， . . . ₃mk+NFRM-l) をあわせて出力する。この番号系列は、クラスタ化部 1 0 0 4で得られた所属するクラス夕（代表ベクトル）番号の系列をべ一スに，上位 M個のクラス夕に属す番号系列として生成する。すなわち、上位 M個のクラス夕に属さないフレームに対しては、任意の方法（例えば、再度のクラス夕化や前フレームのクラス夕番号に置換するなど）で上記 M個のクラス夕の番号に対応付けるか、またはそのフレームは系列から削除するなどを行う。次に、モデル化区間平均パヮ量子化部 1 0 0 6において、パヮ算出部 1 0 0 1で算出されたフレーム毎のパヮ値を、モデル化区間全体で平均し、その平均パヮに対してスカラ量子化など任意の方法で量子化を行い、パワインデクスおよびモデル化区間平均パヮ値（量子化値） Eを出力する。そして、誤差スペクトル 'パヮ補正値量子化部 1 0 0 7において、 Sav_iを（2)式のように、対応する代表ベクトル Ci, Ciからの誤差スぺクトル di，モデル化区間平均パヮ Eおよび各スぺクトルモデル別の Eに対するパヮ補正値 eiで表し、 di, eiをスカラ量子化等任意の方法で量子化する。

Sav_i = sqrt(E) -ei - (Ci+di ) ( i=l, ... ,M) - (2) ここで、誤差スペクトル diの量子化は、 diを複数の帯域に分割し、帯域毎に各帯域の平均値のスカラ量子化を行う構成としてもよい。以上、クラス夕別平均スぺクトル算出部 1 0 0 5で得られた M個の代表べクトルインデクス、誤差スぺクトル ·パヮ補正値量子化部 1 0 0 7で得られた、誤差スぺクトル量子化ィンデクスおよびパヮ補正値量子化ィンデクス、モデル区間平均パヮ量子化部 1◦ 0 6で得られたパヮ量子化インデクスを、スぺクトルモデルパラメ一夕の量子化ィンデクスとして出力する。

なお、スぺクトルモデルパラメ一夕のうち標準偏差 Sdv—iは、雑音スぺクトル代表ベクトル学習時に得られる Ci に対するクラス夕内標準偏差値をそのまま使用する。この値に関しては雑音スぺクトル代表べクトル記憶部に予め記憶させておくことで、量子化インデクスの出力は不要である。また、クラス夕別平均スぺクトル算出部 1 0 0 5で、平均スぺクトル算出時に、クラス夕内の標準偏差も算出し、その量子化を行ってもよい。この場合は、その量子化インデクスをスぺクトルモデルパラメ一夕の量子化ィンデクスの一部として出力する。

なお、上記実施の形態では、誤差スペクトルの量子化を帯域別のスカラ量子化により説明したが、全帯域のぺクトル量子化等他の方法で量子化することも可能である。また、パヮ情報をモデル化区間の平均パヮとモデル別の平均パヮに対する補正値により表現した構成を説明したが、モデル別のパヮのみでの表現や、モデル化区間の平均パヮで全モデルのパヮを代表するようにしてもよい。次に、図 12は、本発明の実施の形態 3にかかる雑音信号合成装置の構成を示すプロック図である。図 12に示す雑音信号合成装置において、まず遷移系列生成部 1 101にて、図 10に示した雑音信号分析装置により得られた統計モデルパラメ一夕量子化ィンデクスのうち、 Si-Sj間の遷移確率 p(i，の量子化インデクスを用いて遷移確率 p(i，j)を復号し、スぺクトルモデル S iの遷移が与えられた遷移確率 p(i,j)となるようなスぺクトルモデル番号遷移系列 {index'(l)} (l≤index'(l)≤M₅ 1=0,1,2,. . · ) を生起させる。次に、スぺクトルモデルパラメ一夕復号部 1 103においてスぺクトルモデルパラメ一夕の量子化ィンデクスからスぺクトルモデル S iの統計パラメ一夕である平均振幅 Sav— iおよび標準偏差 Sdv— i(i=l，. . . ,Μ)を復号する。ここで、平均振幅 Sav—iの復号は、符号化装置のスぺクトルパラメ一夕算出 ·量子化部 90 3で得られた量子化インデクスおよび、スぺクトルモデルパラメ一夕復号部 1 103内に備えられた符号化側と同一の雑音スぺクトル代表べクトル記憶部内の代表ベクトルを用い、（2)式に基き復号する。また、標準偏差 Sdv—i に関しては、符号化装置にて雑音スぺクトル代表べクトル学習時に得られる Ci に対するクラス夕内標準偏差値をそのまま使用した場合には、該当する値を雑音スぺクトル代表べクトル記憶部 1003から得ることで復号する。そして、スぺクトル生成部 1105は、遷移系列生成部 1101により得られたモデル番号 index'(l)、および、スぺクトルモデルパラメ一夕復号部 1103で得られたスペクトルモデル S i (i=l₃. . . ,Μ)に関するモデル情報（S iの平均振幅 Sav_iおよび標準偏差 Sdv_i) を用いて、次式で示される index'(l)に対する振幅スぺクトル時系列 {X'(n)}を生成する。

{X'(n)} ={S _index'₍₁₎(n)}， n=l,2" . . ,1 -(3)

ここで、 S _index'₍₁₎は、 i二 index'(l)に対する平均振幅 Sav_i、標準偏差 Sdv— i を有する正規分布に従うものとし、また継続フレーム数 Lは、継続長制御部 1 102において、雑音信号分析装置から出力されたスぺクトルモデル S iに対する継続フレーム数 Liの統計モデルパラメ一夕の量子化インデクスからの復号値（Liの平均値 Lav_i, 標準偏差値 Ldv— i) を用いて、 i=index'(l)に対する平均値 Lav_i、標準偏差 Ldv— iを有する正規分布に従うように制御されたものである。

さらに、スぺクトル生成部 1 1 0 5は、上記の方法により、遷移系列 {index'(l)}に沿って生成した所定の時間長（二当該モデル化区間のフレーム数 NFRM) の振幅スぺクトル時系列に対して、乱数位相生成部 1 1 0 4により生成された乱数位相を与えて、スペクトル時系列を作成する。なお、スペクトル生成部 1 1 0 5において、生成された振幅スぺクトル時系列に対してスぺクトルが滑らかに変化するよう平滑化を行つてもよい。

I F F T (逆高速フーリエ変換）部 1 1 0 6は、スぺクトル生成部 1 1 0 5 により作成されたスぺクトル時系列を時間領域の波形に変換する。重ね合わせ加算部 1 1 0 7は、フレーム間の信号の重ね合わせ加算を行うことにより、最終的な合成雑音信号を出力する。

次いで、上記構成を有する雑音信号分析装置および雑音信号合成装置の動作について、さらに図 1 3〜図 1 5を参照して説明する。

まず、本実施の形態にかかる雑音信号分析装置の動作について、図 1 3を参照して説明する。まず、工程（以下「S T」という。） 1 2 0 1において、フレーム毎の雑音信号 x(j) (j=0₅ . . . ，N- 1; N:分析長）が、窓かけ部 9 0 1 に入力される。 S T 1 2 0 2において、第 mフレーム（nF0, l,2, . . . )に対する入力雑音信号に対してハニング窓等による窓かけが、窓かけ部 9 0 1によりなされる。次に、 S T 1 2 0 3において、窓かけがなされた入力雑音信号に対して、 F F T部 9 0 2により F F T (高速フーリエ変換）がなされて周波数スぺクトルに変換される。これにより第 m フレームの入力振幅スぺクトル X(m) が算出される。 S T 1 2 0 4において、スペクトルモデルパラメ一夕算出 -量子化部 9 0 3 により、入力雑音信号の振幅スぺクトル系列 {X(iii)} (m二 0, 1, 2, . . . ：)を一定フレーム数の区間、または何らかの指標により適応的に定められたフレーム数からなる区間をモデル化を行う単位区間（モデル化区間）として区切り、そのモデル化区間におけるスペクトルモデルパラメ一夕の算出および量子化が行われ、スぺクトルモデルパラメ一夕の量子化インデクスが出力されると共に、入力雑音信号の振幅スぺクトル系列 {X(m)}に対応するスぺクトルモデル番号系列 {index(m) } ( 1 ≤ index(m) ≤ M, m= mk,mk+l，mk+2, . . . ,mk+NFR -l; mkは当該モデル化区間の先頭フレーム番号、はモデル化区間のフレーム数）が出力される。ここで、スペクトルモデルパラメ一夕とは、スペクトルモデル S i ( i=l₅ . . . ,Μ)の統計パラメ一夕である平均振幅 Sav— iおよび標準偏差 Sdv— iを含むものである。この S T 1 2 0 4におけるスぺクトルモデルパラメ一夕算出 '量子化部 9 0 3の動作については、図 1 4により詳細に説明する。

次に、 S T 1 2 0 5において、継続長モデル ·遷移確率算出 ·量子化部 9 0 4により、 S T 1 2 0 4にて得られたモデル化区間のスぺクトルモデル番号系列 {index(m)}を用いて、 S i各々に対する継続フレーム数 Li に関する統計パラメ一夕（継続長モデルパラメ一夕）（Li の平均値 Lav_iおよび標準偏差値 Ldv_i) および Si-Sj間の遷移確率 p( i, j)が算出 ·量子化され、それらの量子化インデクスが出力される。量子化方法は任意であるが、 Lav— i、 Ldv_i および P( i, j)の各要素を各々スカラ量子化してもよい。

そして、 S T 1 2 0 6において、以上の、スぺクトルモデルパラメ一夕、継続長モデルパラメ一夕および遷移確率パラメ一夕の量子化ィンデクスが、モデル化区間の入力雑音信号の統計モデルパラメ一夕量子化ィンデクスとして出力される。

図 1 4は、図 1 3の S T 1 2 0 4におけるスぺクトルモデルパラメ一夕算出 -量子化部 9 0 3の詳細動作を示すフロー図である。本実施例におけるスぺクトルモデルパラメ一夕算出 ·量子化部 9 0 3は、予め用意した雑音信号を表す振幅スぺクトルの代表べクトル集合の中から、入力雑音のモデル化区間における入力振幅スぺクトル時系列を表すのに適切な代表べクトルをモデル数（= M)個選択し、それをベースにスぺクトルモデルパラメ一夕を算出 ·量子化する。

まず、 S T 1 3 0 1において、モデル化区間内のフレーム単位の入力振幅スベクトル X(m) (m= mk，mk+l，mk+2，. . . ,mk+NF - 1)が入力される。そして、 S T 1 3 0 2において、入力振幅スぺクトルに対して、パヮ算出部 1 0 0 1により当該フレームのパヮが算出され、 S T 1 3 0 3において、パヮ算出部 1 0 0 1で算出されたパヮ値を用いて、パヮ正規ィ匕部 1 0 0 2によりパヮの正規ィ匕が行われる。次に、 S T 1 3 0 4において、そのパヮ正規化された入力振幅スぺクトルに対して、クラス夕化部 1 0 0 4により、雑音スペクトル代表べクトル記憶部 1 0 0 3の各代表べクトルをクラス夕中心とするクラス夕化（ぺクトル量子化）が行われ、各入力スペクトルがどのクラス夕に所属するかの情報が出力される。そして、 S T 1 3 0 5において、クラス夕別平均スペクトル算出部 1 0 0 5により、クラス夕化部 1 0 0 4で得られた所属するクラス夕（代表ベクトル）番号の系列に対して、モデル化区間で所属頻度の高い上位 M個のクラス夕（対応する代表ベクトルを Ci(i=l，2，...，M)とする）が選択される。その各クラス夕に所属する入力雑音振幅スぺクトルの平均スぺクトルがクラス夕毎に算出され、それらをスぺクトルモデルの平均振幅スぺクトル Sav— i( i=l,2, ...，M)とする。また、入力雑音信号の振幅スペクトル系列 {X(m)} に対するスペクトルモデル番号系列 {index(m)} ( 1≤ index(m)≤ M, m= mk,mk+l,mk+2₅ . . . ₃mk+NFRM-l) があわせて出力される。この番号系列は、クラス夕化部 1◦ 0 4で得られた所属するクラス夕（代表ベクトル）番号の系列をベースに、上位 M個のクラス夕に属する番号系列として生成される。すなわち、上位 M個のクラス夕に属さないフレームに対しては、任意の方法（例えば、再度のクラス夕化や前フレームのクラス夕番号に置換するなど）で上記 M 個のクラス夕の番号に対応付けるか、またはそのフレームは系列から削除するなどが行われる。次に、 S T 1 3 0 6において、モデル化区間平均パヮ量子ィ匕部 1 0 0 6により、パヮ算出部 1 0 0 1で算出されたフレーム毎のパヮ値が、モデル化区間全体で平均され、その平均パヮに対してスカラ量子化など任意の方法で量子化が行われ、パワインデクスおよびモデル化区間平均パヮ値（量子化値） Eが出力される。そして、 S T 1 3 0 7において、誤差スぺクトル 'パヮ補正値量子化部 1 0 0 7により、（2)式に示すように、対応する代表べクトル Ci, Ciからの誤差スペクトル di、モデル化区間平均パヮ Eおよび各スぺクトルモデル別の Eに対するパヮ補正値 eiで表された Sav— iに対して、 di, ei がスカラ量子化等任意の方法で量子化される。

ここで、誤差スペクトル diの量子化は、 diを複数の帯域に分割し、帯域毎に各帯域の平均値をスカラ量子化を行うようにしてもよい。そして、 S T 1 3 0 8において、上記、 S T 1 3 0 5にて得られた M個の代表べクトルインデクス、 S T 1 3 0 7にて得られた誤差スぺクトル量子化ィンデクス、および、ノヮ補正値量子化ィンデクス、 S T 1 3 0 6にて得られたパヮ量子化ィンデクスが、スぺクトルモデルパラメ一夕の量子化ィンデクスとして出力される。なお、スぺクトルモデルパラメ一夕のうち標準偏差 Sdv— iは、雑音スぺクトル代表ベクトル学習時に得られる Ci に対するクラス夕内標準偏差値がそのまま使用される。この値に関しては雑音スぺクトル代表べクトル記憶部に予め記憶させておくことで、量子化インデクスの出力は不要である。また、 S T 1 3 0 5において、クラス夕別平均スぺクトル算出部 1 0 0 5による平均スぺクトル算出時にクラス夕内の標準偏差も算出し、その量子化を行ってもよい。この場合は、その量子化インデクスが、スペクトルモデルパラメ一夕の量子化インデクスの一部として出力される。

なお、上記実施の形態では、誤差スペクトルの量子化を帯域別のスカラ量子化により説明したが、全帯域のべクトル量子化等他の方法で量子化することも可能である。また、パヮ情報をモデル化区間の平均パヮとモデル別の平均パヮに対する補正値により表現した構成を説明したが、モデル別のパヮのみでの表現や、モデル化区間の平均パヮで全モデルのパヮを代表するようにしてもよい。次に、本実施の形態にかかる雑音信号合成装置の動作について、図 1 5を参照して説明する。まず、 S T 1 4 0 1において、雑音信号分析装置により得られた統計モデルパラメ一夕の各量子化インデクスが入力される。そして、 S T 1 4 0 2において、スぺクトルモデルパラメ一夕復号部 1 1 0 3によりスぺクトルモデルパラメ一夕の量子化ィンデクスからスぺクトルモデル S iの統計ノラメ一夕である平均振幅 Sav— iおよび標準偏差 Sdv— i(i=l，. . . ，M)を復号する。次に、 S T 1 4 0 3において、遷移系列生成部 1 1 0 1により、 Si-Sj 間の遷移確率 P(i，の量子化インデクスを用いて遷移確率 P( i,j)が復号され、スぺクトルモデル S iの遷移が与えられた遷移確率 p( i，となるようなスぺクトルモデル番号遷移系列 {index，（l)} (l≤index'(l)≤M₅ 1=0, 1,2，. . . ) が生起される。

次に、 S T 1 4 0 4において、スペクトルモデル S iに対する継続フレーム数 Liの統計モデルパラメ一夕の量子化ィンデクスからの復号値（Liの平均値 Lav_i，標準偏差値 Ldv— i) を用いて、 i=inde (1)に対して平均値 Lav_i、標準偏差 Ldv_iを有する正規分布に従うように制御された継続フレーム数 Lが、継続長制御部 1 1 0 2により生成される。また、 S T 1 4 0 5において、乱数位相生成部 1 1 0 4により乱数位相が生成される。

そして、 S T 1 4 0 6において、スぺクトル生成部 1 1 0 5により、 S T 1 4 0 3において得られたモデル番号 index'(l)、および、 S T 1 4 0 2において得られたスペクトルモデル S i ( i=l，. . . ,Μ)に関するモデル情報（S i の平均振幅 Sav— iおよび標準偏差 Sdv_i)を用いて、（3)式で示される index'(l) に対する振幅スぺクトル時系列 {X'(n) }が生成される。

ここで、 S _index'_u)は、 i=index，( l)に対する平均振幅 Sav— i、標準偏差 Sdv— i を有する正規分布に従うものとし、また継続フレーム数 Lは、 S T 1 4 0 4において生成されたものである。なお、生成された振幅スペクトル時系列に対してスペクトルが滑らかに変化するよう平滑ィ匕を行ってもよい。さらに、遷移系列 {index'(l)}に沿って生成した所定の時間長（=当該モデル化区間のフレーム数 NFRM)の振幅スぺクトル時系列に対して、 S T 1 4 0 5において生成された乱数位相を与えて、スペクトル時系列を作成する。 S T 1 4 0 7において、 I F F T部 1 1 0 6により、作成されたスぺクトル時系列が時間領域の波形に変換された後、 S T 1 4 0 8において、重ね合わせ加算部 1 1 0 7によりフレーム間の信号の重ね合わせ加算が行なわれる。 S T 1 4 0 9において、重ね合わせ加算された信号が最終的な合成雑音信号として出力される。

このように、本実施の形態においては、背景雑音信号を統計的モデルで表現している。すなわち、雑音信号分析装置（送信側装置）において、雑音信号を用いて、雑音信号スぺクトルのスぺクトル変化を含めた統計的情報（統計モデルパラメ一夕）を生成し、生成した情報を雑音信号合成装置（受信側装置）に送信している。また、雑音信号合成装置（受信側装置）においては、雑音信号分析装置（送信側装置）から送信された上記情報（統計モデルパラメ一夕）を用いて、雑音信号を合成している。これにより、雑音信号合成装置（受信側装置）においては、間欠的に分析された雑音信号のスペクトルではなく、雑音信号スぺクトルのスぺクトル変化を含めた統計的情報を用いて、雑音信号を合成することができるので、聴感的に劣化の少ない雑音信号を合成することができる。また、実際の周囲騒音下での雑音信号の統計的な特性は比較的長期間（例えば数秒〜十数秒）に渡り一定であることが想定されることから、モデルパラメータの伝送周期もその程度の長期間周期で良いため、復号側に伝送すべき雑音信号のモデルパラメ一夕の情報量は少なくて済み、効率的な伝送を実現できる。

(実施の形態 4 )

本実施の形態では、実施の形態 3で説明した雑音信号分析装置を用いて音声符号化装置を実現し、また、実施の形態 3で説明した雑音信号合成装置を用いて音声復号装置を実現する場合について説明する。

まず、本実施の形態にかかる音声符号化装置について、図 1 6を参照して説明する。図 1 6は、本発明の実施の形態 4にかかる音声符号化装置の構成を示すプロック図である。図 1 6において、入力音声信号は、有音/無音判定器 1 5 0 1、音声符号器 1 5 0 2および雑音信号符号器 1 5 0 3に入力される。有音/無音判定器 1 5 0 1は、入力音声信号に対して有音区間か無音区間 (雑音のみの区間）かを判定しその判定結果を出力する。有音/無音判定器 1 5 0 1は、任意のものでよく、一般には、入力信号のパヮ、スぺクトルゃピヅチ周期などの複数のパラメ一夕の瞬時量または変化量等を用いて判定を行うものである。

音声符号器 1 5 0 2は、有音/無音判定器 1 5 0 1による判定結果が有音である場合に、入力音声信号に対して音声符号化を行い、その符号化データを D T X制御および多重化器 1 5 0 4に出力する。この音声符号器 1 5 0 2は、有音区間用の符号器であり、音声を高能率に符号化する任意の符号器である。雑音信号符号器 1 5 0 3は、有音/無音判定器 1 5 0 1による判定結果が無音である場合に、入力音声信号に対して雑音信号の符号化を行い入力雑音信号に対する統計モデルパラメ一夕の量子化ィンデクスを符号化データとして出力する。この雑音符号器 1 5 0 3として、実施の形態 3で説明した雑音分析装置（図 1 0 )を用いる。

D T X制御および多重化器 1 5 0 4は、有音 Z無音判定器 1 5 0 1、音声符号器 1 5 0 2および雑音信号符号器 1 5 0 3からの出力を用いて送信データとして送信すべき情報の制御と送信情報の多重化を行い、送信データを出力する。

次に、本発明の実施の形態 4にかかる音声復号装置について、図 1 7を参照して説明する。図 1 7は、本発明の実施の形態 4にかかる音声復号装置の構成を示すプロック図である。図 1 7において、図 1 6に示した音声符号化装置により送信された送信データは、受信デ一夕として分離および D T X制御器 1 6 0 1に入力される。

分離および D T X制御器 1 6 0 1は、受信データを音声復号および雑音生成に必要な音声符号化データ、または雑音モデル符号化パラメ一夕、および有音ノ無音判定フラグに分離する。音声復号器 1 6 0 2は、前記有音/無音判定フラグが有音区間を示す場合に、前記音声符号^！デ一夕を用いて音声復号を行い復号音声を出力する。雑音信号復号器 1 6 0 3は、前記有音/無音判定フラグが無音区間を示す場合に、前記雑音モデル符号化パラメ一夕を用いて雑音信号の生成を行い、雑音信号を出力する。この雑音信号復号器 1 6 0 3として、実施の形態 3で説明した雑音信号合成装置（図 1 2 ) を用いる。

出力切り替え器 1 6 0 4は、音声復号器 1 6 0 2の出力と雑音信号復号器 1 6 0 3の出力を、有音/無音判定フラグの結果に応じて切り替えて出力し、出力信号とする。

次に、上記構成を有する音声符号化装置および音声復号装置の動作について説明する。まず、音声符号化装置の動作について、図 1 8を参照して説明する。図 1 8は、本発明の実施の形態 4にかかる音声符号化装置の動作を示すフロー図である。

まず、 S T 1 7 0 1において、フレーム毎の音声信号が入力され、 S T 1 7 0 2、において、入力音声信号に対して有音区間か無音区間（雑音のみの区間）かが判定されその判定結果が出力される。この有音/無音判定は任意の方法でよく、一般には、入力信号のパヮ、スペクトルやピッチ周期などの複数のパラメータの瞬時量または変化量等を用いて判定が行われる。

S T 1 7 0 2における有音 Z無音判定結果が有音である場合には、 S T 1 7 0 3において入力音声信号に対する音声符号化が行われ、その符号化データが出力される。この音声符号化処理は有音区間用の符号化で、音声を高能率に符号化する任意の方法でよい。

一方、前記有音/無音判定結果が無音である場合には、 S T 1 7 0 4において、入力音声信号に対する雑音信号の符号化が行われ、入力雑音信号に対するモデルパラメ一夕が出力される。この雑音信号符号化として、実施の形態 3にて説明した雑音信号の分析方法を用いる。

S T 1 7 0 5において、前記有音 Z無音判定結果、音声符号化および雑音信号符号化からの出力を用いて送信デ一夕として送信すべき情報の制御 ( D T X 制御）と送信情報の多重化が行われ、 S T 1 7 0 6において送信データとして出力される。

次に、音声復号装置の動作について、図 1 9を参照して説明する。図 1 9は、本発明の実施の形態 4にかかる音声復号装置の動作を示すフロー図である。まず、 S T 1 8 0 1において、符号化側で入力信号に対して符号化され送信されたデータが受信データとして受信される。 S T 1 8 0 2において、受信デ一夕は、音声復号および雑音生成に必要な音声符号化データ、または雑音モデル符号化パラメ一夕、および有音 Z無音判定フラグに分離される。

前記有音/無音判定フラグが有音区間を示す場合には、 S T 1 8 0 4において前記音声符号化デ一夕を用いて音声復号が行われ、復号音声が出力される。 —方、前記有音 Z無音判定フラグが無音区間を示す場合には、 S T 1 8 0 5において前記雑音モデル符号化パラメ一夕を用いて雑音信号の生成が行われ、雑音信号が出力される。この雑音信号復号処理として、実施の形態 4で説明した雑音信号の合成方法を用いる。

S T 1 8 0 6において、有音 Z無音判定フラグの結果に応じて S T 1 8 0 4 における音声復号または S T 1 8 0 5における雑音信号復号の出力が、復号信号として出力される。

なお、上記実施の形態においては、復号信号の出力を有音区間と無音区間で復号音声信号と合成雑音信号の切り替えで出力されるものとして説明したが、別の形態として、無音区間で合成した雑音信号を有音区間においても復号音声信号に加算して出力するようにしてもよい。さらに、音声符号化側で雑音信号を含む入力音声信号を、雑音信号と雑音を含まない音声信号とに分離する手段を設けて、分離後の音声信号および雑音信号を符号化したデータを用いて、復号側で無音区間で合成した雑音信号を、上記と同様に有音区間においても復号音声信号に加算して出力するようにしてもよい。

このように、本実施の形態によれば、有音区間では音声信号を高品質で符号化できる音声符号化を、無音区間では聴感的に劣化が少ない雑音信号分析装置および合成装置を用いて雑音信号の符号化および復号を行うことにより、背景雑音環境下においても高品質な符号化を行える。また、実際の周囲騒音下での雑音信号の統計的な特性は比較的長期間（例えば数秒〜十数秒）に渡り一定であることが想定されることから、モデルパラメ一夕の伝送周期もその程度の長期間周期で良いため、復号側に伝送すべき雑音信号のモデルパラメ一夕の情報量は少なくて済み、効率的な伝送を実現できる。

なお、上記実施の形態 1および 3で説明した雑音信号分析装置および雑音信号合成装置によりなされる処理、ならびに、上記実施の形態 2および 4で説明した音声符号化装置および音声復号装置によりなされる処理をソフトウエア (プログラム）により実現し、このソフトウェア（プログラム）を、コンビュ一夕により読み取ることが可能な記録媒体に格納することが可能である。以上の説明から明らかなように、本発明によれば、雑音信号を統計的モデルで表現することにより、聴感的に劣化の少ない雑音信号を合成することができる。

本明細書は、 2 0 0 0年 9月 6日出願の特願 2 0 0 0— 2 7 0 5 8 8、 2 0 0 1年 3月 1 3日出願の特願 2 0 0 1 - 0 7 0 1 4 8に基づくものである。この内容をここに含めておく。産業上の利用可能性

本発明は、音声信号に重畳されている背景雑音信号の分析および合成を行う雑音信号の分析 ·合成装置に関し、また、この分析 ·合成装置を用いて音声信号の符号化を行う音声符号化装置に好適である。

Claims

請求の範囲

1 . ある統計的分布に従う振幅スペクトル時系列で表され、かつ、その振幅スぺクトル時系列の継続時間長が別の統計的分布に従う複数の定常雑音モデルを生成する生成手段と、前記複数の定常雑音モデル間を統計的に遷移するスぺクトル系列として雑音信号を処理する処理手段と、を具備する雑音信号分析装

2 . 雑音信号を周波数領域の信号に変換して、前記雑音信号のスぺクトルを算出する周波数変換手段と、定常雑音モデルのスぺクトルに関する複数のモデル情報を記憶する記憶手段と、前記複数のモデル情報のうち、所定の条件に基づいて、前記雑音信号のスぺクトルに対応するモデル情報を選択する選択手段と、選択されたモデル情報の時間的な系列を用いて定常雑音モデルに関する統計パラメ一夕と複数の定常雑音モデル間を遷移する確率である遷移確率情報を生成する情報生成手段と、を具備する雑音信号分析装置。

3 . 請求の範囲 2に記載の雑音信号分析装置により生成された統計パラメ一夕と遷移確率情報を用いて、雑音信号を生成する雑音信号生成手段を具備する雑

4 . 複数の定常雑音モデル間を遷移する確率である遷移確率情報を用いて、定常雑音モデルの遷移系列に関する情報を生成する遷移系列生成手段と、定常雑音モデルに関する統計パラメ一夕を用いて、定常雑音モデルの継続時間長を算出する継続時間長算出手段と、定常雑音モデルのスぺクトルに関するモデル情報を記憶する記憶手段と、乱数位相を生成する乱数位相生成手段と、生成された前記定常雑音モデルの遷移系列に関する情報、算出された前記継続時間長、記憶された前記定常雑音モデルのスペクトルに関するモデル情報、および、生成された乱数位相を用いて、スぺクトル時系列を生成するスぺクトル生成手段と、生成されたスぺクトルを時間領域の信号に変換する逆周波数変換手段と、を具備する請求の範囲 3に記載の雑音信号合成装置。

5 . 請求の範囲 2に記載の雑音信号分析装置を用いて、音声信号の無音区間における雑音信号の符号化を行う音声符号化装置。

6 . 請求の範囲 3に記載の雑音信号合成装置を用いて、音声信号の無音区間における雑音信号の復号を行う音声復号装置。

7 . 雑音信号を周波数領域の信号に変換して、前記雑音信号のスぺクトルを算出する周波数変換手段と、定常雑音モデルの振幅スぺクトル時系列に関する統計パラメ一夕であるスぺクトルモデルパラメ一夕の算出と量子化を行い、量子化ィンデクスを出力するスぺクトルモデルパラメ一夕算出 ·量子化手段と、前記定常雑音モデルの振幅スぺクトル時系列の継続時間長に関する統計パラメ一夕および複数の定常雑音モデル間を遷移する確率である遷移確率情報の算出と量子化を行い、量子化ィンデクスを出力する継続長モデル ·遷移確率算出 ·量子化手段と、を具備する雑音信号分析装置。

8 . スぺクトルモデルパラメ一夕算出 ·量子化手段は、周波数変換手段により得られた入力雑音信号の振幅スぺクトルに対してパヮの正規化を行うパヮ正規化手段と、雑音信号を表す振幅スぺクトルの代表べクトルの集合を記憶する記憶手段と、前記パヮ正規化手段により得られたパヮ正規ィヒ振幅スぺクトルに対して、前記記憶手段に記憶されている代表べクトル集合を用いてクラス夕化を行うクラス夕化手段と、入力雑音信号のモデル化区間単位で選択頻度の高い上位複数個のクラス夕を選択し、それらの選択されたクラス夕に属する入力振幅スぺクトルの平均スぺクトルをクラス夕毎に算出するクラス夕別平均スぺクトル算出手段と、入力雑音信号のモデル化区間の平均パヮを算出し、その量子化を行うモデル化区間平均パヮ量子化手段と、前記クラスタ別平均スぺクトル算出手段により得られたクラス夕別平均スぺクトルおよびモデル化区間平均パヮ量子化手段により得られた量子化されたモデル化区間平均パヮを用いて、クラス夕毎の誤差スぺクトルとモデル化区間平均パヮに対するパヮ補正値の量子化を行う、誤差スぺクトル ·パヮ補正値量子化手段と、を具備する請求の範囲 7に記載の雑音信号分析装置。

9 . 請求の範囲 7に記載の雑音信号分析装置により生成された量子化ィンデクスを用いて、雑音信号を生成する雑音信号生成手段を具備する雑音信号合成装

1 0 .複数の定常雑音モデル間を遷移する確率である遷移確率情報の量子化ィンデクスを用いて、定常雑音モデルの遷移系列に関する情報を生成する遷移系列生成手段と、継続時間長に関する統計パラメ一夕の量子化インデクスを用いて、定常雑音モデルの継続時間長を算出する継続時間長算出手段と、スぺクトルモデルパラメ一夕の量子化ィンデクスを用いて前記スぺクトルモデルパラメータを復号するスぺクトルモデルパラメ一夕復号手段と、乱数位相を生成する乱数位相生成手段と、生成された前記定常雑音モデルの遷移系列に関する情報、算出された前記継続時間長、前記スぺクトルモデルパラメ一夕、および、生成された乱数位相を用いて、スぺクトル時系列を生成するスぺクトル生成手段と、生成されたスぺクトルを時間領域の信号に変換する逆周波数変換手段と、を具備する請求の範囲 9に記載の雑音信号合成装置。

1 1 . 請求の範囲 7に記載の雑音信号分析装置を用いて、音声信号の無音区間における雑音信号の符号化を行う音声符号化装置。

1 2 . 請求の範囲 9に記載の雑音信号合成装置を用いて、音声信号の無音区間における雑音信号の復号を行う音声復号装置。

1 3 . 雑音信号を周波数領域の信号に変換して、前記雑音信号のスぺクトルを算出する周波数変換工程と、定常雑音モデルのスぺクトルに関する複数のモデル情報を記憶する記憶工程と、前記複数のモデル情報のうち、所定の条件に基づいて、前記雑音信号のスぺクトルに対応するモデル情報を選択する選択工程と、選択されたモデル情報の時間的な系列を用いて定常雑音モデルに関する統計パラメ一夕と複数の定常雑音モデル間を遷移する確率である遷移確率情報を生成する情報生成工程と、を具備する雑音信号分析方法。

1 4 .請求の範囲 1 3に記載の雑音信号分析方法により生成された複数の定常雑音モデル間を遷移する確率である遷移確率情報を用いて、定常雑音モデルの遷移系列に関する情報を生成する遷移系列生成工程と、定常雑音モデルに関する統計パラメ一夕を用いて、定常雑音モデルの継続時間長を算出する継続時間長算出工程と、定常雑音モデルのスぺクトルに関するモデル情報を記憶する記憶工程と、乱数位相を生成する乱数位相生成工程と、生成された前記定常雑音モデルの遷移系列に関する情報、算出された前記継続時間長、記憶された前記定常雑音モデルのスペクトルに関するモデル情報、および、生成された乱数位相を用いて、スペクトル時系列を生成するスペクトル生成工程と、生成されたスぺクトルを時間領域の信号に変換する逆周波数変換工程と、を具備する雑音信号合成方法。

1 5 . 雑音信号を周波数領域の信号に変換して、前記雑音信号のスぺクトルを算出する周波数変換工程と、定常雑音モデルの振幅スぺクトル時系列に関する統計パラメ一夕であるスぺクトルモデルパラメ一夕の算出と量子化を行い、量子化ィンデクスを出力するスぺクトルモデルパラメ一夕算出 ·量子化工程と、前記定常雑音モデルの振幅スぺクトル時系列の継続時間長に関する統計パラメ一夕および複数の定常雑音モデル間を遷移する確率である遷移確率情報の算出と量子化を行い、量子化ィンデクスを出力する継続長モデル ·遷移確率算出 ·量子化工程と、を具備する雑音信号分析方法。

1 6 . スぺクトルモデルパラメ一夕算出 ·量子化工程は、周波数変換工程により得られた入力雑音信号の振幅スぺクトルに対してパヮの正規ィ匕を行うパヮ正規化工程と、雑音信号を表す振幅スぺクトルの代表べクトルの集合を記憶する記憶工程と、前記パヮ正規化工程により得られたパヮ正規化振幅スぺクトルに対して、前記記憶工程により記憶されている代表べクトル集合を用いてクラス夕化を行うクラス夕化工程と、入力雑音信号のモデル化区間単位で選択頻度の高い上位複数個のクラスタを選択し、それらの選択されたクラスタに属する入力振幅スぺクトルの平均スぺクトルをクラス夕毎に算出するクラスタ別平均スペクトル算出工程と、入力雑音信号のモデル化区間の平均パヮを算出し、その量子化を行うモデル化区間平均パヮ量子化工程と、前記クラス夕別平均スぺクトル算出工程により得られたクラスタ別平均スぺクトルおよびモデル化区間平均パヮ量子化工程により得られた量子化されたモデル化区間平均パヮを用いて、クラス夕毎の誤差スぺクトルとモデル化区間平均パヮに対するパヮ補正値の量子化を行う、誤差スペクトル ·パヮ補正値量子化工程と、を具備する請求の範囲 1 5に記載の、雑音信号分析方法。

1 7 . 請求の範囲 1 5に記載の雑音信号分析方法により生成された複数の定常雑音モデル間を遷移する確率である遷移確率情報の量子化ィンデクスを用いて、定常雑音モデルの遷移系列に関する情報を生成する遷移系列生成工程と、継続時間長に関する統計パラメ一夕の量子化ィンデクスを用いて、定常雑音モデルの,継続時間長を算出する継続時間長算出工程と、スぺクトルモデルパラメ一夕の量子化インデクスを用いて前記スぺクトルモデルパラメ一夕を復号するスぺクトルモデルパラメ一夕復号工程と、乱数位相を生成する乱数位相生成工程と、生成された前記定常雑音モデルの遷移系列に関する情報、算出された前記継続時間長、前記スペクトルモデルパラメ一夕、および、生成された乱数位相を用いて、スペクトル時系列を生成するスペクトル生成工程と、生成されたスぺクトルを時間領域の信号に変換する逆周波数変換工程と、を具備する雑音信号合成方法。

1 8 . コンピュータを、雑音信号を周波数領域の信号に変換して、前記雑音信号のスぺクトルを算出する周波数変換手段、定常雑音モデルのスぺクトルに関する複数のモデル情報を記憶する記憶手段、前記複数のモデル情報のうち、所定の条件に基づいて前記雑音信号のスぺクトルに対応するモデル情報を選択する選択手段、選択されたモデル情報の時間的な系列を用いて定常雑音モデルに関する統計パラメ一夕と複数の定常雑音モデル間を遷移する確率である確率情報を生成する情報生成手段として機能させるためのプログラム。

1 9 . コンピュータを、複数の定常雑音モデル間を遷移する確率である確率情報を用いて、定常雑音モデルの遷移系列に関する情報を生成する遷移系列生成手段、定常雑音モデルに関する統計パラメ一夕を用いて、定常雑音モデルの継続時間長を算出する継続時間長算出手段、定常雑音モデルのスぺクトルに関するモデル情報を記憶する記憶手段、乱数位相を生成する乱数位相生成手段、生成された前記定常雑音モデルの遷移系列に関する情報、算出された前記継続時間長、記憶された前記定常雑音モデルのスぺクトルに関するモデル情報、および、生成された乱数位相を用いて、スぺクトル時系列を生成するスぺクトル生成手段、生成されたスぺクトルを時間領域の信号に変換する逆周波数変換手段として機能させるためのプログラム。