CN1247415A

CN1247415A - 声音编码方式、声音编码装置、以及数据记录媒体

Info

Publication number: CN1247415A
Application number: CN99111099A
Authority: CN
Inventors: 河原荣治
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1998-06-15
Filing date: 1999-06-15
Publication date: 2000-03-15
Anticipated expiration: 2019-06-15
Also published as: EP0966109A3; DE69924922T2; DE69924922D1; CN1327619C; EP0966109A2; KR20000006157A; US6697775B2; US6393393B1; EP0966109B1; US20020138259A1; KR100548891B1

Abstract

对于把数字音频信号分割在多个频带并在各个频带进行编码的方式,本发明提供一种不用控制计算机的CPU处理能力以及其他应用的CPU占有率即可实现实时的声音不间歇的高音质编码数据的制作的声音编码方式。本发明对分割在多个频带的数字音频信号的各频带生成比特分配信息的比特分配装置,具有根据所定听觉心理模型使用信号对掩码比值的关系进行高效率比特分配的方法,以及进行低负荷比特分配的方法,根据编码装置可能占有的CPU处理量信息,转换比特分配装置,进行编码。

Description

声音编码方式、声音编码装置、以及数据记录媒体

本发明涉及声音编码方式、声音编码装置、以及数据存储媒体，特别是涉及在MPEG(Motion Picture Experts Group)方式中使用次能带编码方式的声音编码方式、声音编码装置、以及存储用于实行上述声音编码方式的程序的数据存储媒体。

近年来，由于计算机的多媒体化和互连网络的普及，在计算机(以下称PC)上，通过软件使重放MPEG等的动画和声音的环境更加完备，扩大了MPEG等的编码数据的利用范围。

但是，制作编码数据的编码器仍然主要采用了高价的硬件。当用软件制作编码数据时，由于更花费对作为编码对象的动画和声音的重放时间的实际时间的几倍的处理时间来进行编码，需要很多时间和操作，因此未能广泛普及。

特别是对于一般计算机用户，为了能廉价简单地制成编码数据，希望通过软件处理，实现实时地制成编码数据。

以下对已有的声音编码方式的例子进行说明。图11是对于声音的编码数据格式，采用了ISO/IEC11172-3的标准化MPEG音频编码器的方框图。

在图11中，输入的数字音频信号在次能带分析装置202中被分割为32个频率成分，对于各次能带信号，在比例因数提取装置203中计算比例因数，使操作范围一致。另外，输入的数字音频信号在FFT装置204中进行高速傅里叶变换(FFT：Fast Fourier Transform)，利用这个结果，通过听觉心理分析装置205，根据利用了人的听觉特性的听觉心理模型，采用信号掩码比(SMR)值的关系模型，由比特分配装置206决定对各次能带信号的比特分配数。根据对各次能带信号的比特分配数，通过量化/编码装置207对各次能带信号进行量化/编码。经辅助信息编码装置208使已编码的标题信息和辅助信息合在一起，再通过位流形成装置209形成位流并输出。

这种已有的声音编码方式由于是利用各频带电功率的不均进行各频带(次能带)的编码的编码方式，因此能控制利用了听觉心理模型的各次能带信号的比特分配的音质。由于把存储媒体作为利用目的而被标准化，只适合于编码数据的高音质化，而不适合实时的编码，因此控制音质的听觉心理模型将形成非常大的运算量。

已有的声音编码方式以及声音编码装置其结构如上所述，适合于制成以存储媒体作为对象的高音质编码数据，但由于听觉心理模型的利用还必须有很多的处理能力，因此对于用软件处理来说，用现有的CPU能力在PC上进行实时处理是不适当的。而且，即使在装载了可实时处理的高性能CPU的PC上运行时，由于其他应用的CPU占有率变大时，实时处理恐怕也是不可能的，其结果是存在发生声音间歇的可能性的问题。

本发明解决了以上问题，提供了一种不受计算机的CPU处理能力以及其他应用的CPU占有率的影响、能够通过软件处理实现实时的没有声音间歇的高音质编码数据制作的声音编码方式、声音编码装置，以及存储了用于实行上述编码程序的数据存储媒体。

本发明方案1的声音编码方式是一种把数字音频信号分割在多个频带，在每个频带进行编码的声音编码方式，生成对应于上述被分割的各频带的比特分配信息，具有多个处理量不同的比特分配装置，根据来自外部的控制信息，从上述多个比特分配装置中，选用所定的比特分配装置进行处理，转换使用的比特分配装置即可实行比特分配和编码。

本发明方案2的声音编码方式是：在上述方案1记载的声音编码方式中，来自外部的控制信息采用表示进行编码处理可能占有的中央演算处理装置处理量的负荷值，根据该负荷值在上述中央演算处理装置进行编码处理时，参照预先存储的用各比特分配装置进行编码时的各处理量的数据表，进行上述比特分配装置的选择，以便不超过上述编码处理可能占有的中央演算处理装置的处理量。

本发明方案3的声音编码方式是：在上述方案2记载的声音编码方式中，上述负荷值采用来自监视进行编码处理可能占有的上述中央演算处理装置的处理量的监视装置的处理量控制信息。

本发明方案4的声音编码方式是：在上述方案1记载的声音编码方式中，上述比特分配装置的比特分配处理采用可实现编码数据高音质化的进行高效率比特分配的高效率比特分配方法，以及采用与上述高效率比特分配方法相比较处理量少的低负荷进行比特分配的低负荷比特分配方法进行处理。

本发明方案5的声音编码方式是：在上述方案1记载的声音编码方式中，以对音频信号进行解码的可能最小单位的帧单位，进行上述编码时使用的比特分配装置的转换。

本发明方案6的声音编码方式是：在上述方案1记载的声音编码方式中，把分割在多个频带的各频带的次能带信号分成由各予定个数的次能带信号组成的组，对各组进行独立的比特分配处理，生成各频带的比特分配信息。

本发明方案7的声音编码方式是：在上述方案6记载的声音编码方式中，上述组划分时的，组数或组内的频率轴方向连续的次能带信号数是根据来自上述外部的控制信息指定的数或根据来自上述监视装置的处理量控制信息指定的数而变化的。

本发明方案8的声音编码方式是：在上述方案7记载的声音编码方式中，以对音频信号进行解码的可能最小单位的帧单位，进行上述次能带信号数的变更处理。

本发明方案9的声音编码方式是：在上述方案8记载的声音编码方式中，在上述组的划分时，至少设置一个不进行比特分配的组。

本发明方案10的声音编码方式是：在上述方案6记载的声音编码方式中，根据上述次能带信号的组划分，对于划分到属于低频带组的次能带信号，采用可实现编码数据高音质化的高效率比特分配方法，对组内的次能带信号进行比特分配，另一方面，对于划分到属于高频带组的次能带信号，采用与高效率比特分配方法相比较处理量少的低负荷比特分配处理，对组内的次能带信号进行比特分配。

本发明方案11的声音编码方式是：在上述方案6记载的声音编码方式中，设置决定相对于各组独立的比特分配装置的分配可能比特数的分配可能比特演算装置，按各组对全部组的比例，采用根据各组的频带特性的加权值，对各组独立的比特分配装置，分配相对于全部组的分配可能比特数。

本发明方案12的声音编码方式是：在上述方案11记载的声音编码方式中，把根据各组的各频带特性的加权值作为根据各频带所定最小可听临界值的加权值。

本发明方案13的声音编码方式是：在上述方案11记载的声音编码方式中，把根据各组的各频带特性的加权值作为根据对输入数字音频信号进行次能带分析得到的各组各频带的次能带信号电平的加权值。

本发明方案14的声音编码方式是：在上述方案11记载的声音编码方式中，把根据各组的各频带特性的加权值作为根据对输入数字音频信号进行线性变换得到的各组频谱信号电平的加权值。

本发明方案15的声音编码方式是：在上述方案6记载的声音编码方式中，对各组的信号电平在所定临界值以上的高电平信号，采用可实现编码数据高音质化的高效率比特分配方法进行比特分配，对各组的信号电平在所定临界值以下的低电平信号，采用与上述高效率比特分配方法比较处理量少的低负荷比特分配方法进行比特分配。

本发明方案16的声音编码方式是：在上述方案15记载的声音编码方式中，把上述各组的信号电平作为对输入数字音频信号进行次能带分析得到的次能带信号电平。

本发明方案17的声音编码方式是：在上述方案15记载的声音编码方式中，把上述各组的信号电平作为对输入数字音频信号进行线性变换得到的频谱信号电平。

本发明方案18的声音编码方式是：在上述方案15记载的声音编码方式中，把上述各组的信号电平作为所定各频带的最小可听临界值。

本发明方案19的声音编码方式是：在上述方案4、10、15中任一项记载的声音编码方式中，可实现上述编码数据高音质化的高效率比特分配处理是根据所定听觉心理模型使用与信号对掩码比值的关系进行的比特分配处理，此外，与上述高效率比特分配处理相比较处理量少的低负荷比特分配处理是对在多个频带分割的信号电平附加各频带所定最小可听临界值进行的比特分配处理。

本发明方案20的声音编码方式是：在上述方案19记载的声音编码方式中，听觉心理模型是由MPEG(Motion Picture Experts Group)指定的听觉心理模型。

本发明方案21记载的声音编码方式是：在上述方案5或方案8记载的声音编码方式中，对上述音频信号进行解码的可能最小单位的帧是由MPEG(Motion Picture Experts Group)指定的帧。

本发明方案22记载的声音编码方式是：在上述方案1记载的声音编码方式中，上述比特分配装置对于分割的各频带，根据所定听觉心理模型输出的信息，生成比特分配信息，在N(N＝1，2，3…)帧中再1次根据从上述所定听觉心理模型输出的信息生成比特分配信息，对于未生成上述比特分配信息的帧，根据上述听觉心理模型输出的信息和上述已分割的各频带的信号信息，生成比特分配信息，进行编码。

本发明方案23记载的声音编码方式是：在上述方案1记载的声音编码方式中，具有可阶段性控制处理量的听觉心理模型，根据来自外部的控制信息，进行上述听觉心理模型的处理量控制，用所定处理量的听觉心理模型进行处理，生成各频带的比特分配信息。

本发明方案24记载的声音编码方式是：在上述方案1记载的声音编码方式中，具有多个各处理量不同的听觉心理模型，根据来自外部的控制信息，在上述多个听觉心理模型中，用所定的听觉心理模型进行处理，转换使用的听觉心理模型，即可生成各频带的比特分配信息。

本发明方案25记载的声音编码方式是把数字音频信号分割在多个频带，生成对应于已分割的各频带的比特分配信息，以所定位速度的传送作为目的，进行各频带编码的声音编码方式，控制在编码数据流中插入数据的帧的比特分配范围，对编码音频数据量进行可变控制。

本发明方案26记载的声音编码方式是：在上述方案25记载的声音编码方式中，根据来自外部的控制信息，以帧为单位控制比特分配范围，对编码音频数据量进行可变控制。

本发明方案27的声音编码方式是：在上述方案26记载的声音编码方式中，作为来自上述外部的控制信息，采用来自监视附加数据的缓冲器的监视装置的数据量控制信息。

本发明方案28的声音编码方式是：在上述方案1记载的声音编码方式中，根据实行编码处理的中央演算处理装置的性能，在编码处理工作前的初始化时，向外部输出多个比特分配装置或多个听觉心理模型的各处理负荷值信息。

本发明方案29的声音编码方式是：在上述方案28记载的声音编码方式中，作为向外部输出的信息的多个比特分配装置或多个听觉心理模型的各处理负荷值信息，按降序或升序输出。

本发明方案30的声音编码方式在使用相同的中央演算处理装置进行图像信号、声音信号编码处理的声音编码方式中，是用不同的多个演算量进行编码的，用变更上述声音信号或图像信号的编码演算量，控制在上述中央演算处理装置上处理的全部演算量。

本发明方案31的声音编码方式在使用同一个中央演算处理装置进行图像信号、声音信号编码处理的声音编码方式中，是用演算量不同的多个编码方式进行编码的，以变更上述声音信号编码的编码方式，控制在上述中央演算处理装置上处理的全部演算量。

本发明方案32的声音编码方式是：在上述方案30或31记载的声音编码方式中，根据来自外部的控制信息进行上述中央演算处理装置上的处理的控制。

本发明方案33的声音编码方式是对数字音频信号进行时间/频率变换、用生成的量化信息进行编码的声音编码方式，具有各演算量不同的多个量化信息算出装置，根据来自外部的控制信息，从上述多个量化信息算出装置中，选择所定的量化信息算出装置进行处理，转换使用的量化信息算出装置，算出量化信息进行编码。

本发明方案34记载的声音编码装置是使用上述方案1至方案33中任一项记载的声音编码方式进行声音编码的编码装置。

本发明方案35记载的记录媒体记录了上述方案1至方案33中任一项记载的声音编码方式的步骤。

图1是为了实现采用本发明实施例1的声音编码方式的声音编码装置，使用专用计算机的整体系统构成方框图。

图2是构成上述实施例1的声音编码装置的编码器构成方框图。

图3是构成上述编码器的高频带编码处理装置的详细构成方框图。

图4是表示构成上述实施例1的声音编码装置的编码器更详细结构的方框图。

图5是表示在上述实施例1的声音编码方式中使用的对各组比特分配处理一例的模式图。

图6是表示在上述实施例1的声音编码方式中使用的对各组比特分配处理另一例的模式图。

图7是表示说明构成上述实施例1的声音编码装置的编码器的编码工作的流程图。

图8是表示在上述实施例1的声音编码方式中使用的对各组比特分配处理的采用阈值进行处理实例的模式图。

图9是表示构成本发明上述实施例1的声音编码装置的编码器变形例的详细结构的方框图。

图10是表示采用本发明实施例2的数据存储媒体及使用该存储媒体构成声音编码装置结构的方框图。

图11是表示构成已有的声音编码装置的编码器结构的方框图。

图12是构成本发明实施例3的声音编码装置的低频带编码处理装置的详细结构图。

图13是说明上述实施例3的声音编码装置的低频带编码时各帧的听觉心理模型的状态图。

图14是构成本发明实施例4的声音编码装置的低频带编码处理装置的详细结构图。

图15是表示采用上述实施例4的声音编码装置的比特分配处理一例的图。

图16是表示构成本发明实施例5的声音编码装置的编码器结构的方框图。

图17是表示对声音信号和图像信号进行处理时的编码器结构的方框图。

图18是表示在进行时间/频率变换方式编码的编码处理装置的编码处理中适用于本发明情况结构的方框图。

下面参照附图对本发明实施例的声音编码方式、声音编码装置进行说明。

实施例1

这里，对把输入信号分割为多个频率成分利用各频带电力的不均在各频带(次能带)进行编码的编码方式的情况进行说明。图1是使用专用计算机(下称PC)作为上述编码方式的声音编码装置时的系统整体概念图。图中，1是可从摄像机17和话筒19等外部机器输入数据的所谓多媒体型PC，具有存储各种数据及程序的存储容量大的固定式记录媒体的硬盘驱动器(HDD)11，以及与HDD11进行程序和数据等输入输出的存储容量较小的装卸自如的存储媒体的PD驱动器12a、FD驱动器12b，上述HDD存储的程序根据中央演算处理装置(CPU)14的命令，在由适宜的随机存取存储器(RAM)构成的存储器13上读出并实行。为了取入外部机器摄像机17、话筒19的图像、声音，内装着各种视频接收插件16、拾音插件18。具有上述结构的PC1通过内部数据总线15，与各装置连接。

图2是为了实现由图1所示PC1进行声音编码处理的声音编码装置的编码器20的方框构成图，实际上是通过在存储器13上读出来自HD11的程序来实现的。图2中，21是监视CPU14的负荷状态的CPU负荷监视信息，22是根据CPU负荷监视信息21控制低频带编码处理装置23和高频带编码处理装置24工作的编码装置控制装置。25是把上述2个编码处理装置23、24的输出作为各个流信号的位流形成处理装置。26是根据用户的指定，输入到上述编码装置控制装置22的编码方式指定信号。

图2的低频带编码处理装置23采用图11已有例的结构。高频带编码处理装置24的结构如图3所示，与图11的例子一样，利用各频带电力的不均，采用在各频带(次能带)进行编码的编码方式，但对利用听觉心理模型的各次能带信号不进行比特分配，作为其代替装置，设置频带输出适合的比特分配装置304，在每个次能带信号的比例因数上进行基于人的听觉特性的加权，以更高音质和低负荷处理为第1目的，形成演算量少的结构。

为了排除向特定频带的过度集中的比特分配，在比特分配时进行根据各频带的加权调整。

图4是表示图2所示编码器20详细结构的方框图，101是编码器，由后述的次能带分析装置102、比例因数提取装置103、FFT装置104、听觉心理分析装置105、量化/编码装置106、辅助信息编码装置107、位流形成装置108、频带输出适合的比特分配装置109、听觉心理模型比特分配装置110、组划分装置111、比特分配处理控制装置112、分配可能比特演算装置113构成。

上述次能带解析装置102把输入的数字音频信号分割为32个频率成分。比例因数提取装置103计算各次能带信号的比例因数，并使各次能带工作范围一致。组划分装置111把上述已分割的32个频率成分分割为由来自外部的控制信息的处理量控制信息121指定的组数。在本实施例1中，如图5所示，组数为3，作为使各组为在频率轴方向连续的次能带信号，组的划分是：0-15次能带的低频带组A，16-29次能带的高频带组B、以及未进行比特分配的30-31次能带的无效组C。上述处理量控制信息121包含CPU负荷监视信息21和编码方式设定信号26的信息。在本实施例1中，作为把比特分配到上述各次能带组的比特分配装置，在对人的耳朵灵敏度好的低频带，根据由MPEG指定的听觉心理模型，利用与信号对掩码比值的关系，使用高效率进行比特分配的听觉心理模型比特分配装置110，在对人的耳朵灵敏度比较低的高频带，在来自比例因数提取装置103的比例因数信息中加入预先设定的各频带的最小可听临界值，使用与听觉心理模型比特分配方法相比较可低负荷进行比特分配的频率输出适合的比特分配装置109。

为了在进行听觉心理模型比特分配的0-15次能带的低频带组A，对输入的数字音频信号进行必要的听觉心理分析，比特分配处理控制装置112控制FFT装置104，以便利用FFT(高速傅里叶变换)装置104进行高速傅里叶变换。利用其变换结果，听觉心理分析装置105根据利用了人的听觉特性的听觉心理模型，推导出信号对掩码比(SMR)值的关系模型。

分配可能比特演算装置113根据抽样频率和编码的位速度值，演算全部确定组的分配可能比特数，再按照作为比特分配对象的各组对全部组的比例，利用根据各组的各频带特性的加权，演算各组独立的比特分配装置的分配可能比特数。在本实施例1中，对于听觉心理模型比特分配装置110以及频带输出适合比特分配装置113，考虑比例·因数·标引值以及低频带/高频带的领域比，根据全部分配可能比特数，决定向两装置110、113的分配可能比特数。也就是说，实际上，根据由比例因数提取装置103求出的各比例·因数·标引值scf_index[i]，如以下公式1、公式2所示，算出两领域内的scf_index[i]的相加值V_psy、V_non。

[公式1]

Vpsy = Σ_{i = 0}^{psy_end - 1} scf_indx [i]

[公式2]

Vnon = Σ_{i = psy_end}^{subband_end} scf_indx [i]

这里，

psy_end＝16：进行听觉心理模型比特分配的次能带数

subbovnd_end＝30：全比特分配次能带数

在对人的耳朵灵敏度好的低频带，为了分配更多的比特，对Vpsy进行加权，

Vpsy＝Vpsy*0.75可根据下式求出听觉心理模型比特分配可能数psy_num以及频带输出适合比特分配可能数non_num。

Vnon＝Vnon*psy-ratio

psy_num＝all_alloc_num*Vnon/(Vpsy+Vnon)

non_num＝all_alloc_num-psy_num

这里，

all_alloc_num：全部的分配可能比特数

psy_ratio：psy_end/(subband_end-psy_end)

在每个组的分配可能比特数的范围内(psy-num，non-num)，听觉心理模型比特分配装置110利用来自听觉心理分析装置105的SMR值的有关模型，对低频带组A的0-15次能带进行比特分配。另一方面，在频带输出适合的比特分配装置109中对高频带组B的16-29次能带进行比特分配。对无效组C的30-31次能带，由于是作为无效的次能带，所以不进行比特分配。

根据对由这些比特分配装置决定的各次能带信号的比特分配数，在量化/编码装置106中对各次能带信号进行量化/编码，通过辅助信息编码装置107，使已编码的标题信息和辅助信息一起在位流形成装置108中形成并输出位流。

在来自处理量控制信息121的信息是使编码处理量减少的信息的情况下，如图6所示，使作为处理量多的听觉心理模型比特分配装置110的比特分配对象的0-15次能带低频带组A的频带宽度，减少为0-7次能带低频带组A’，反之，使作为处理量少的频带输出适合的比特分配装置109的比特分配对象的频带宽度，增加为8-29次能带低频带组B’。考虑了编码处理量减少的最终形态是把频带输出适合的比特分配装置109的比特分配对象作为0-29次能带组，控制处理量。这时，实质上听觉心理模型比特分配装置110不工作，因此，FFT装置104以及听觉心理分析装置105也不工作。

在来自处理量控制信息121的信息是谋求编码数据的高音质化的信息的情况下，高效率(高音质)的比特分配使作为可能的听觉心理模型比特分配装置110的比特分配对象的频带宽度增加。考虑了高音质的最终形态是把听觉心理模型比特分配装置110的比特分配对象作为0-29次能带组。

本实施例中，如上所述是以解码音频信号的可能最小单位的帧为单位，进行次能带组的增减和比特分配装置的转换，即可实时控制编码处理量。

下面参照图7说明本实施例1的声音编码装置的全部工作流程。首先，采用图7(a)所示的结构，为了认识各编码器(23，24)的处理负荷，在各编码器的各模式(作为比特分配对象的频带宽度的变化)，通过对所定时间的空数据进行编码，CPU负荷监视部700把各模式的CPU负荷值存储在数据表701中。

当抽样(数据)输入时，在图7(b)的步骤S70，进行次能带分析并分割为32个频率成分，接着在步骤S71计算各次能带信号的比例因数。

在步骤S72，进行有否CPU负荷检出数据的判定，这里工作开始后没有CPU负荷检出数据，因此进入步骤S74，进行可实现最高音质声音重放的通常的组划分，进入步骤S75后，进行听觉心理模型比特分配处理。在步骤S76进行量化/编码处理，在步骤S79位流形成后一系列处理结束，在处理结束时，把输入的所定数抽样的编码需要的时间通知CPU负荷监视部700，即可检出现在的CPU负荷。

在下一次处理时，在步骤S72，CPU负荷检出被判定为“有”，而在步骤S73，检出的CPU负荷被判定为不可能实时编码时，进入步骤S77，参照数据表701选择最适合的模式(组划分)，在步骤S78并用频带比特分配处理，在步骤S75分别按所定比例进行听觉心理模型比特分配处理，进入步骤S76进行量化/编码处理，在步骤S79，形成采用这些编码数据的位流。

对本实施例1的分配可能比特演算装置113的演算，考虑到比例·因数·标引值以及低频带、高频带的领域比，就演算各组独立的比特分配装置的分配可能比特数，但代替比例·因数·标引值的可以是属于来自FTT装置104的各组的频谱信号电平，也可以是在各频带预先设定的最小可听临界值。

在编码器101的内部设置监视CPU处理量的CPU负荷监视装置700，根据控制本实施例1的编码器101处理的信息，使编码器101的运行不超出CPU的处理能力，这种信息也可以是用户输入的外部控制信息。根据用户的输入，可按照用户的喜好进行使音质、画质优先的编码处理。

作为实施例1的编码器101的比特分配装置，在对人的耳朵灵敏度好的低频带，采用高效率进行比特分配的听觉心理模型比特分配装置110，在高频带，固定采用以低负荷进行比特分配的频带输出适合的比特分配装置109，但是根据比例因数提取装置103的信号，当各组的次能带信号电平在预先设定的各频带的临界值以下时，也就是说如图8所示，在低频带作为编码数据有意义的信号比高频带少时，不必按照频带固定采用比特分配装置，在高频带也可以采用听觉心理模型比特分配装置110。

如图9所示，也可以不根据比例因数提取装置103的信号，对各组的次能带信号电平与阈值进行比较判断，而把比比例因数提取装置103的信号的分辨率(频率的)高的来自FFT装置104的信号输入到比特分配处理控制装置112，对各组的次能带信号电平与预先设定的各频带的阈值进行比较判断。

实施例2

下面说明本发明实施例2的数据记录媒体。

通过把实现上述实施例1所示的声音编码装置或编码方法的编码程序记录在软盘等数据存储媒体上，即可在独立的计算机系统中简单实施本发明各实施例所示的处理。

图10是用存储了上述编码程序的软盘，由计算机系统实施上述实施例1的编码处理的说明图。

图10(a)表示从软盘正面看到的外观、断面构造以及软盘本体，图10(b)表示该软盘本体的物理格式。

上述软盘FD是把上述软盘盘体D收容在软盘盒FC内的结构，在该软盘盘体D的表面形成了从外周向内周的同心园状的多个磁道Tr，各磁道Tr在角度方向被分割成16个区段Se。因此，存储了上述程序的软盘FD是在上述软盘本体D的分配领域(区段)Se上，记录了上述程序的数据。

图10(C)表示在软盘FD上程序的记录，以及使用软盘FD上存储的程序进行声音编码处理的构成。

把上述程序记录在软盘FD上的情况是通过软盘驱动器FDD把来自计算机系统Cs的上述程序数据写入软盘FD。按照软盘FD记录的程序，在计算机系统Cs中构筑上述声音编码装置的情况是通过软盘驱动器FDD从软盘FD上读出程序，再装入计算机系统Cs。

在上述说明中是采用软盘作为数据记录媒体的，然而使用光盘也与上述软盘的情况一样通过软件进行声音编码处理。记录媒体不仅限于上述光盘和软盘，IC卡、ROM盒式磁带等也可以记录程序，采用这些记录媒体也与使用上述软盘的情况一样，可通过软件实施声音编码处理。

实施例3

下面参照附图说明本实施例3的声音编码方式、声音编码装置。图2所示的高频带编码处理装置24采用图3所示的结构。低频带编码处理装置23的结构如图12所示，与图11所示同样，利用各频带电力的不均，采用在各频带(次能带)进行编码的编码方式，但对仅利用了所定听觉心理模型分析装置的各次能带信号不进行比特分配，而是新设置处理量少的简单听觉心理模型部分4062，按照根据前帧输出的听觉心理模型部分4061的掩蔽阈值和该帧的频带分割信号生成的比特分配信息进行比特分配。

图12是表示图2所示低频带编码处理装置23详细结构的方框图，401是编码器，由后述的次通带分析装置402、比例因数提取装置403、比特分配处理控制装置404、FFT处理装置405、听觉心理分析装置406、听觉心理模型比特分配装置407、量化/编码装置408、辅助信息编码装置409、位流形成装置410构成。

下面说明其工作。

上述次能带分析装置402把输入的数字音频信号分割为32个频率成分。比例因数提取装置403计算各次能带信号的比例因数，使各次能带的工作范围一致。FFT处理装置405对输入的数字音频信号进行高速傅里叶变换。听觉心理分析装置406由MPEG指定的通常听觉心理模型部分4061以及与上述通常听觉心理模型部分4061相比较处理量少的上述简易听觉心理模型部分4062组成，各模型算出信号对掩码比。

上述通常听觉心理模型部分4061根据下述公式3算出各次能带信号的信号对掩码比，上述简单听觉心理模型部分4062，如下述公式4所示，并不对相应的帧算出各次能带的最小掩蔽·电平，而是采用由上述通常听觉心理模型部4061算出的最近前帧的最小掩蔽·电平，声压是采用由相应帧的比例因数提取装置403提取的比例·因数值，算出信号掩码比。

[公式3]

SMR_sb(n)＝L_sb(n)-LT_min(n) db这里，

L_sb(n)：各次能带的奢压

LT_min(n)：各次能带的最小掩蔽·电平[公式4]

SMR_sb(n)＝L_sb(n)-LT_min(n) db这里，

Lsb(n)＝20·log(scf_max(n)·32768-10) dbscf_max(n)：相应帧的各次能带的比例·因数值LT_min(n)：由最近的上述通常听觉心理模型部4061算出的各次能带的最小掩蔽·电平

比特分配处理控制装置404以处理量控制信息121的信息为基础，在本实施例3，如图13所示，N为3，对可实现低负荷处理的上述简单听觉心理模型部4062和可输出能实现高音质化的最适合比特分配信息的上述通常听觉心理模型部4061，在某帧进行一次控制，以及对FFT处理装置405是否进行实施高速傅里叶变换的控制。例如，在图13的状态，当作为处理量控制信息121的信息即在编码处理中分出的CPU占有率下降的信息被上述比特分配处理控制装置404得知后，为了多使用处理量小的上述简单听觉心理模型部分4062，应使N值变大。当上述比特分配处理控制装置404得到可进一步使用编码处理中分出的CPU占有率的信息时，为了多使用可实现高音质化的上述通常听觉心理模型部分4061，应使N值变小。由此可实现处理量的控制。

听觉心理模型比特分配装置407根据来自上述比特分配处理控制装置404的信息的信号对掩码比的关系，对由上述次能带分析装置402分割的各次能带信号进行比特分配。由量化/编码装置408进行各次能带信号的量化及编码，并与来自辅助信息编码装置409的辅助数据一起，经位流形成装置410形成并输出位流。

本实施例3中，由于在N帧以一次的比例进行比特分配，则可减少时间轴方向的CPU负荷。

若把编码器401作为图2所示低频带编码处理装置23，则不仅适用于低频带信号，也适用于全频带信号。

实施例4

下面参照附图说明实施例4的声音编码方式、声音编码装置。图14与图11所示相同，都是利用各频带电压的不均，采用在各频带(次能带)进行编码的编码方式，但不同的是在输出位流中具有附加音频数据以外的外部数据的功能。上述外部数据可以是图像数据和文本数据。

图14所示的编码器501由后述的次能带分析装置502、比例因数提取装置503、FFT处理装置504、听觉心理分析装置505、比特分配装置506、量化/编码装置507、辅助信息编码装置508、位流形成装置509、比特分配处理控制装置510、附加数据编码装置511构成。

下面说明其工作。

上述次能带分析装置502把输入的数字音频信号分割为32个频率成分。比例因数提取装置503计算各次能带的比例因数，使各次能带工作范围一致。FFT处理装置504对输入的数字音频信号进行高速傅里叶变换。听觉心理分析装置505根据由MPEG指定的听觉心理模型，算出信号对掩码比。

比特分配处理控制装置510监视暂时存储输出位流中附加数据的附加数据缓冲器512，以由是否有附加数据的判断或附加数据是否溢出的判断所产生的分配范围控制信息513为基础，对比特分配装置506指定进行比特分配的范围。

例如，当附加数据缓冲器512中没有数据时，如图15所示，对次能带0-29进行比特分配。这时，若全部分配可能比特数为100，则次能带0-15分配80比特，次能带16-29分配20比特。

在附加数据缓冲器512写入外部数据，即附加数据存在的情况下，则分配范围控制信息513为插入附加数据的指示，比特分配处理控制装置510接到指示后，在本实施例4中，例如次能带0-15分配80比特，而本来应该分配的次能带16-29不再进行比特分配，剩余的20比特作为数据的附加比特数而被分配。对于未进行比特分配的次能带16以后的次能带，为了减少处理量，也可以不进行该范围的FFT处理以及听觉心理分析。

对于进行了上述比特分配的次能带，通过量化/编码装置507进行量化及编码，来自辅助信息编码装置508的辅助数据与作为MPEG未定标数据的被编码的附加数据一起，通过位流形成装置509形成并输出位流。

根据本实施例4，当以一定位速度进行传送时，根据音频数据以外的附加数据量，控制编码时的比特分配范围，使编码的音频数据量可变，以便在编码数据流中插入附加数据，由于在剩余频带中可重叠各种数据，则能有效利用频带。

由比特分配处理控制装置510实行的比特分配范围控制，是以帧单位进行的，该比特分配范围也可以根据附加数据缓冲器512的数据量而变化。

通过上述这些处理，即使在附加数据插入时也不损害比特分配范围内的音质，可以实时地进行数据插入量的控制。

实施例5

下面参照附图说明本发明实施例5的声音编码方式、声音编码装置。图16是采用本实施例5的声音编码方式的声音编码装置的编码器构成方框图，图中与图2相同的符号表示相同或相当的部分，160-162是可各自独立的工作的编码处理装置A-C，163是存储各编码处理装置A-C的处理负荷值信息的处理负荷值存储缓冲器，164是把作为抽样的数据供给上述各编码处理装置A-C的抽样数据缓冲器。

下面说明其工作。在进行编码处理前的初始化时，首先，把抽样数据缓冲器164中存储的所定抽样数据供给各编码处理装置A-C，再把由此产生的编码处理装置A-C或听觉心理模型的处理负荷值存储在处理负荷值存储缓冲器163中。

上述处理负荷值是按升序或降序输出的，可迅速选择与装置中使用的CPU性能相称的编码处理装置，用该编码处理装置进行编码处理。

编码处理的内容与实施例1相同，予以省略。

根据本实施例，在编码处理前的初始化时，使用抽样数据起动各编码处理装置，取得此时的负荷值，由于选用了与使用的CPU的处理能力适应的编码处理装置，因此减少了CPU的负荷，可进行最适当的编码处理。

在以上各实施例中，作为声音编码装置，举例说明了使用PC实现的结构，但是对于例如采用VTR摄像机和DVD编码器等机器的组合的场合，也能适用。

在以上各实施例中，仅对声音进行了处理，在处理声音和图像的情况下，如图17所示，在图2的结构中，输入了与声音信号不同的图像信号，设置了图像编码处理装置170和声音编码处理装置171，代替低频带编码处理装置和高频带编码处理装置，还设置了系统流处理装置172，代替位流形成处理装置，它们是可以对应的。采用上述结构，根据来自外部的控制信息，使用上述各实施例已经说明的方法，边变更声音编码的演算量，边转换演算量不同的多个声音编码方式，即可控制CPU的全部演算量。另外，也可以根据应编码声音信号的量，改变编码图像信号的处理量。

除了进行次能带方式的编码的MPEG1以外，对于进行时间/频率变换的MPEG2、AAC、Dolby、AC-3、ATRAC(MD)等的编码方式，如图18所示，用演算量不同的第1量子信息算出装置181和第2量了信息算出装置182代替有关编码处理的各装置，由量子装置控制装置180选择使用它们，处理量子信息以代替编码信息，同样也是可以对应的。

如上所述，本发明方案1的声音编码方式是一种把数字音频信号分割在多个频带，在每个频带进行编码的声音编码方式，由于生成对应于上述被分割的各频带的比特分配信息，具有多个处理量不同的比特分配装置，根据来自外部的控制信息，从上述多个比特分配装置中，选用所定的比特分配装置进行处理，转换使用的比特分配装置，即可实行比特分配和实行编码，因此具有如下效果：可经常选择使用最适当处理量的比特分配装置，可在不超过运转状态所占有的CPU处理量的情况下进行编码，在实时编码时对输入信号不会有不恰当的处理，即对重放声音来说，可进行声音不间歇编码。

根据本发明方案2的声音编码方法，由于采用表示进行编码处理可能占有的中央演算处理装置的处理量的负荷值，作为来自外部的控制信息，根据上述负荷值，在上述中央演算处理装置上的编码处理中，采用各比特分配装置，参照预先存储了进行编码时的各处理量的数据表，进行上述比特分配装置的选择，以使不超过上述编码处理可能占有的中央演算处理装置的处理量，因此具有如下效果：中央演算处理装置不接受超过通常运行能力的要求，因此可流畅地进行全系统的控制。

根据本发明方案3的声音编码方式，由于在上述方案2记载的声音编码方式中，作为上述负荷值，采用来自监视进行编码处理可能占有的上述中央演算处理装置的处理量的监视装置的处理量控制信息，因此具有如下效果：在可能占有的中央演算处理装置的最高性能范围内，选择最适当处理量的比特分配装置，在实时编码时对输入信号不会有不恰当的处理，即对重放声音来说，可进行声音不间歇编码。

根据本发明方案4的声音编码方式，由于在上述方案1记载的声音编码方式中，作为上述比特分配装置的比特分配处理，采用可实现编码数据高音质化的进行高效率比特分配的高效率比特分配方法，以及采用与上述高效率比特分配方法相比较，处理量少的低负荷进行比特分配的低负荷比特分配方法进行处理，因此具有如下效果：编码器可适当转换以便使编码数据的高音质化优先或者使编码处理的低负荷性比音质优先，以实现编码。

根据本发明方案5的声音编码方式，由于在上述方案1记载的声音编码方式中，以对音频信号进行解码的可能最小单位的帧单位，进行上述编码时使用的比特分配装置的转换，因此具有如下效果：在实时编码时，既使在运行的CPU上共有该CPU的其他用途的CPU占有率突然增大的情况下，在帧单位时间也可以追随编码处理占有的CPU处理量，能实时控制音质和处理量。

根据本发明方案6的声音编码方式，由于在上述方案1记载的声音编码方式中，把分割在多个频带的各频带的次能带信号分成由各予定个数的次能带信号组成的组，对各组进行独立的比特分配处理，生成各频带的比特分配信息，因此具有如下效果：选择适合各频带特性的比特分配处理，以进行编码。

根据本发明方案7的声音编码方式，由于是在上述方案6记载的声音编码方式中，上述组划分是可变的，组数或组内的频率轴方向连续的次能带信号数是根据来自上述外部的控制信息指定的数或根据来自上述监视装置的处理量控制信息指定的数，因此具有以下效果：可以根据CPU的使用状况，动态地进行组的划分。

根据本发明方案8的声音编码方式，由于在上述方案7记载的声音编码方式中，以对音频信号进行解码的可能最小单位的帧单位，进行上述次能带信号数的变更处理，因此具有如下效果：可以更精细地进行比特分配方式的变更，实现高精度的编码器。

根据本发明方案9的声音编码方式，由于在方案8记载的声音编码方式中，在上述组的划分时，至少设置一个不进行比特分配的组，因此具有如下效果：以对音频信号进行解码的可能最小单位的帧单位，将组数或组内频率轴方向连续的次能带信号数，变更为由外部控制信息指定的数或由监视装置的处理量控制信息指定的数，则可以不必对属于未进行比特分配的组的频带信号进行编码处理，同时，可把应分配在属于未进行比特分配的组的频率的比特，分配在进行比特分配的其他组的频带，其结果是可控制编码处理占有的CPU处理量，并提高进行比特分配的其他组的频率的音质。

根据本发明方案10的声音编码方式，由于在上述方案6记载的声音编码方式中，根据上述次能带信号的组划分，对于划分到属于低频带组的次能带信号，采用可实现编码数据高音质化的高效率比特分配方法，对组内的次能带信号进行比特分配，另一方面，对于划分到属于高频带组的次能带信号，采用与上述高效率比特分配方法相比较处理量少的低负荷比特分配处理，对组内的次能带信号进行比特分配，因此具有如下效果：在对人的耳朵灵敏度好的低频带，可达到编码数据的高音质化，而在对人的耳朵灵敏度不好的高频带，采用处理量优先的低负荷比特分配，因此可进行使全部处理量减少的编码。

根据本发明方案11的声音编码方式，由于在上述方案6记载的编码方式中，设置决定相对于各组独立的比特分配装置的分配可能比特数的分配可能比特演算装置，按各组对全部组的比例，采用根据各组频带特性的加权值，对各组独立的比特分配装置，分配相对于全部组的分配可能比特数，因此具有以下效果：可以相对于输入信号或各频带特性，为了实现考虑了听觉特性的编码数据高音质，可进行最适合组的比特分配装置的比特分配可能的编码。

根据本发明方案12的声音编码方式，由于在上述方案11记录的声音编码方式中，把根据各组的各频带特性的加权值作为根据各频带所定最小可听临界值的加权值，因此具有如下效果：可进行对人的听觉有效的比特分配处理。

根据本发明方案13的声音编码方式，由于在上述方案11记载的声音编码方式中，把根据各组的各频带特性的加权值作为根据对输入数字音频信号进行次能带分析得到的各组各频带的次能带信号电平的加权值，因此具有如下效果：可进行有效的比特分配处理。

本发明方案14的声音编码方式，由于在上述方案11记载的声音编码方式中，把根据各组的各频带特性加权值作为根据对输入数字音频信号进行线性变换得到的各组频谱信号电平的加权值，因此具有如下效果：可进行有效的比特分配处理。

根据本发明方案15的声音编码方式，由于在上述方案6记载的声音编码方式中，对各组的信号电平在所定临界值以上的高电平信号，采用可实现编码数据高音质化的高效率比特分配方法进行比特分配，对各组的信号电平在所定临界值以下的低电平信号，采用与上述高效率比特分配方法比较处理量少的低负荷比特分配方法进行比特分配，因此具有如下效果：对于与其他频带比较，编码数据是不太重要的信号，不分出处理负荷，可进行实现编码数据高音质化的编码。

根据本发明方案16的声音编码方式，由于在上述方案15记载的声音编码方式中，把上述各组的信号电平作为对输入数字音频信号进行次能带分析得到的次能带信号电平，因此具有如下效果：可进行有效的比特分配处理。

根据本发明方案17的声音编码方式，由于在上述方案15记载的声音编码方式中，把上述各组的信号电平作为对输入数字音频信号进行线性变换得到的频谱信号电平，因此具有如下效果：可进行有效的比特分配处理。

根据本发明方案18的声音编码方式，由于在上述方案15记载的声音编码方式中，把上述各组的信号电平作为所定各频带的最小可听临界值，因此具有如下效果：可进行对人的听觉有效的比特分配处理。

根据本发明方案19的声音编码方式，由于在上述方案4、10、15中任一项记载的声音编码方式中，可实现上述编码数据高音质化的高效率比特分配处理是根据所定听觉心理模型，使用与信号对掩码比值的关系进行的比特分配处理，此外，与上述高效率比特分配处理相比较处理量少的低负荷比特分配处理是对在多个频带分割的信号电平附加各频带所定最小可听临界值进行的比特分配处理，因此具有如下效果：全部在人的耳朵听到的范围，不损害音质，可减轻系统的处理量。

根据本发明方案20的声音编码方式，由于在上述方案19记载的声音编码方式中，上述听觉心理模型是由MPEG指定的听觉心理模型，因此具有如下效果：即使采用MPEG(Motion Picture Experts Group)的声音编码处理，也可得到上述同样的效果。

本发明方案21的声音编码方式，由于在上述方案5或方案8记载的声音编码方式中，对上述音频信号进行解码的可能最小单位的帧是由MPEG(MotionPicture Experts Group)指定的帧，因此具有如下效果：即使采用MPEG的声音编码处理，也可得到上述同样的效果。

根据本发明方案22的声音编码方式，由于在上述方案1记载的声音编码方式中，上述比特分配装置对于分割的各频带，根据所定听觉心理模型输出的信息，生成比特分配信息，在N(N＝1，2，3…)帧中再1次根据从上述所定听觉心理模型输出的信息生成比特分配信息，对于未生成上述比特分配信息的帧，根据上述听觉心理模型输出的信息和上述已分割的各频带的信号信息，生成比特分配信息，进行编码，因此具有如下效果：可以减少时间轴方向的CPU负荷。

根据本发明方案23的声音编码方式，由于在上述方案1记载的声音编码方式中，具有可阶段性控制处理量的听觉心理模型，根据来自外部的控制信息，进行上述听觉心理模型的处理量控制，用所定处理量的听觉心理模型进行处理，生成各频带的比特分配信息，因此具有如下效果：可进行加进了听觉效果的CPU负荷控制。

根据本发明方案24的声音编码方式，由于在上述方案1记载的声音编码方式中，具有多个各处理量不同的听觉心理模型，根据来自外部的控制信息，从上述多个听觉心理模型中，用所定的听觉心理模型进行处理，转换使用的听觉心理模型，即可生成各频带的比特分配信息，因此具有如下效果：可更简单地进行加进了听觉效果的CPU负荷控制。

根据本发明方案25的声音编码方式，由于是把数字音频信号分割在多个频带，生成对应于已分割的各频带的比特分配信息，以所定位速度的传送作为目的，进行各频带编码的声音编码方式，控制在编码数据流中插入数据的帧的比特分配范围，对编码音频数据量进行可变控制，因此具有如下效果：随着CPU处理的负荷变为一定，可在剩余频带重叠各种数据，以有效利用频带。

根据本发明方案26的声音编码方式，由于在上述方案25记载的声音编码方式中，根据来自外部的控制信息，以帧为单位控制比特分配范围，对编码音频数据量进行可变控制，因此具有如下效果：可以更有效地减少CPU的处理负荷。

根据本发明方案27的声音编码方式，由于在上述方案26记载的声音编码方式中，作为来自上述外部的控制信息，采用来自监视附加数据的缓冲器的监视装置的数据量控制信息，因此具有如下效果：可优先重叠负荷数据。

根据本发明方案28的声音编码方式，由于在上述方案1记载的声音编码方式中，根据实行编码处理的中央演算处理装置的性能，在编码处理工作前的初始化时，向外部输出多个比特分配装置或多个听觉心理模型的各处理负荷值信息，因此具有如下效果：实际上在进行编码前，即可取得有关使用的CPU性能的信息，可以有效地减少CPU的处理负荷。

根据本发明方案29的声音编码方式，由于在上述方案28记载的声音编码方式中，作为向外部输出的信息的多个比特分配装置或多个听觉心理模型的各处理负荷值信息，按降序或升序输出，因此具有如下效果：可迅速进行编码处理装置的选择。

根据本发明方案30的声音编码方式，由于在使用相同的中央演算处理装置进行图像信号、声音信号编码处理的声音编码方式中，用不同的多个演算量进行编码，用变更上述声音信号或图像信号的编码演算量，控制在上述中央演算处理装置上处理的全部演算量，因此具有如下效果：即使在对声音和图像信号进行编码中，也能进行CPU的负荷处理。

根据本发明方案31的声音编码方式，由于在使用同一个中央演算处理装置进行图像信号、声音信号编码处理的声音编码方式中，用演算量不同的多个编码方式进行编码，以变更上述声音信号编码的编码方式，控制在上述中央演算处理装置上处理的全部演算量，因此具有如下效果：即使在对声音和图像信号进行编码，也能进行CPU的负荷处理。

根据本发明方案32的声音编码方式，由于在上述方案30或31记载的声音编码方式中，根据来自外部的控制信息进行上述中央演算处理装置上的处理的控制，因此具有如下效果：可以有效地减少CPU的处理负荷。

根据本发明方案33的声音编码方式，由于是对数字音频信号进行时间/频率变换、用生成的量化信息进行编码的声音编码方式，具有各演算量不同的多个量化信息算出装置，根据来自外部的控制信息，从上述多个量化信息算出装置中，选择所定的量化信息算出装置进行处理，转换使用的量化信息算出装置，算出量化信息进行编码，因此具有如下效果：即使在进行时间/频率变换方式编码的编码处理装置中，也可以减少CPU的处理负荷。

根据本发明方案34的声音编码装置，由于使用上述方案1至方案33中任一项记载的声音编码方式进行声音编码，因此具有如下效果：对于装入了该声音编码方式的VTR摄像机等机器，也可以得到上述同样的效果。

本发明方案35的记录媒体，由于记录了上述方案1至方案33中任一项记载的声音编码方式的步骤，因此具有如下效果：使用该存储媒体，把该声音编码方式装入装置，可以得到上述同样的效果。

Claims

1.一种声音编码方式，是把数字音频信号分割在多个频带，在每个频带进行编码的声音编码方式，其特征在于：

生成对应于上述被分割的各频带的比特分配信息，具有多个各自处理量不同的比特分配装置；

根据来自外部的控制信息，从上述多个比特分配装置中，采用所定的比特分配装置进行处理那样地转换使用的比特分配装置，实行比特分配后进行编码。

2.如权利要求1所述的声音编码方式，其特征在于：

作为上述来自外部的控制信息，采用表示进行编码处理可能占有的中央演算处理装置处理量的负荷值；

根据上述负荷值，在上述中央演算处理装置上进行编码处理时，参照预先存储的用各比特分配装置进行编码时的各处理量的数据表，进行上述比特分配装置的选择，以便不超过上述编码处理可能占有的中央演算处理装置的处理量。

3.如权利要求2所述的声音编码方式，其特征在于：

作为上述负荷值，采用来自监视进行编码处理可能占有的上述中央演算处理装置的处理量的监视装置的处理量控制信息。

4.如权利要求1所述的声音编码方式，其特征在于：

上述比特分配装置的比特分配处理是：

采用可实现编码数据高音质化的高效率地进行比特分配的高效率比特分配方法的处理；

采用与上述高效率比特分配方法的处理相比较，以处理量少的低负荷进行比特分配的低负荷比特分配分法的处理。

5.如权利要求1所述的声音编码方式，其特征在于：

以对音频信号进行解码的可能最小单位的帧单位，进行上述编码时使用的比特分配装置的转换。

6.如权利要求1所述的声音编码方式，其特征在于：

把分割在多个频带的各频带的次能带信号分成由各预定个数的次能带信号组成的组，对各组进行独立的比特分配处理，生成各频带的比特分配信息。

7.如权利要求6所述的声音编码方式，其特征在于：

上述组划分是可变的，其组数或在组内的频率轴方向连续的次能带信号数是根据来自上述外部的控制信息指定的数或根据来自上述监视装置的处理量控制信息指定的数。

8.如权利要求7所述的声音编码方式，其特征在于：

以对音频信号进行解码的可能最小单位的帧单位，进行上述次能带信号的数的变更处理。

9.如权利要求8所述的声音编码方式，其特征在于：

在上述组划分时，至少设置一个不进行比特分配的组。

10.如权利要求6所述的声音编码方式，其特征在于：

根据上述次能带信号的组划分，对于划分到属于低频带组的次能带信号，采用进行能实现编码数据高音质化的高效率比特分配的处理，对组内的次能带信号进行比特分配，另一方面，对于划分到属于高频带组的次能带信号，采用与高效率比特分配处理相比较处理量少的低负荷比特分配处理，对组内的次能带信号进行比特分配。

11.如权利要求6所述的声音编码方式，其特征在于：

对于各组独立的比特分配装置，设置决定分配可能比特数的分配可能比特演算装置，按各组对全部组的比例，采用根据各组的各频带特性的加权值，对各组独立的比特分配装置，分配相对于全部组的分配可能比特数。

12.如权利要求11所述的声音编码方式，其特征在于：

把根据各组的各频带特性的加权值作为根据各频带所定最小可听临界值的加权值。

13.如权利要求11所述的声音编码方式，其特征在于：

把根据各组的各频带特性的加权值作为根据对输入数字音频信号进行次能带分析得到的各组各频带的次能带信号电平的加权值。

14.如权利要求11所述的声音编码方式，其特征在于：

把根据各组的各频带特性的加权值作为根据对输入数字音频信号进行线性变换得到的各组频谱信号电平的加权值。

15.如权利要求6所述的声音编码方式，其特征在于：

对各组的信号电平在所定临界值以上的高电平信号，采用可实现编码数据高音质化的高效率比特分配方法进行比特分配；

对各组的信号电平在所定临界值以下的低电平信号，采用与上述高效率比特分配方法比较处理量少的低负荷比特分配方法进行比特分配。

16.如权利要求15所述的声音编码方式，其特征在于：

把上述各组的信号电平作为对输入数字音频信号进行次能带分析得到的次能带信号电平。

17.如权利要求15所述的声音编码方式，其特征在于：

把上述各组的信号电平作为对输入数字音频信号进行线性变换得到的频谱信号电平。

18.如权利要求15所述的声音编码方式，其特征在于：

把上述各组的信号电平作为所定各频带的最小可听临界值。

19.如权利要求4、10、15中任一项所述的声音编码方式，其特征在于：

可实现上述编码数据高音质化的高效率比特分配处理是根据所定听觉心理模型，使用与信号对掩码比值的关系进行的比特分配处理；

与上述高效率比特分配处理相比较处理量少的低负荷比特分配处理是在多个频带分割的信号电平上附加各频带所定最小可听临界值进行的比特分配处理。

20.如权利要求19所述的声音编码方式，其特征在于：

上述听觉心理模型是由MPEG(Motion Picture Experts Group)指定的听觉心理模型。

21.如权利要求5或权利要求8所述的声音编码方式，其特征在于：

对上述音频信号进行解码的可能最小单位的帧是由MPEG(Motion PictureExperts Group)指定的帧。

22.如权利要求1所述的声音编码方式，其特征在于：

上述比特分配装置对于已分割的各频带，根据所定听觉心理模型输出的信息，生成比特分配信息；

N(N＝1，2，3…)帧中再1次根据从上述所定听觉心理模型输出的信息生成比特分配信息；

对于未生成上述比特分配信息的帧，根据上述听觉心理模型输出的信息和上述已分割的各频带的信号信息，生成比特分配信息，进行编码。

23.如权利要求1所述的声音编码方式，其特征在于：

具有可阶段性控制处理量的听觉心理模型；

根据来自外部的控制信息，进行上述听觉心理模型的处理量控制，用所定处理量的听觉心理模型进行处理，生成各频带的比特分配信息。

24.如权利要求1所述的声音编码方式，其特征在于：

具有多个各处理量不同的听觉心理模型；

根据来自外部的控制信息，转换使用的听觉心理模型，即可生成各频带的比特分配信息，以便从上述多个听觉心理模型中，用所定的听觉心理模型进行处理。

25.一种声音编码方式，是把数字音频信号分割在多个频带，生成对应于已分割的各频带的比特分配信息，以所定位速度的传送为目的，在各频带进行编码的声音编码方式，其特征在于：

对于在编码数据流中插入数据的帧，控制比特分配范围，对编码音频数据量进行可变控制。

26.如权利要求25所述的声音编码方式，其特征在于：

根据来自外部的控制信息，以帧为单位控制比特分配范围，对编码音频数据量进行可变控制。

27.如权利要求26所述的声音编码方式，其特征在于：

作为来自上述外部的控制信息，采用来自监视附加数据的缓冲器的监视装置的数据量控制信息。

28.如权利要求1所述的声音编码方式，其特征在于：

根据实行编码处理的中央演算处理装置的性能，在编码处理工作前的初始化时，向外部输出多个比特分配装置或多个听觉心理模型的各处理负荷值信息。

29.如权利要求28所述的声音编码方式，其特征在于：

作为向外部输出的信息的多个比特分配装置或多个听觉心理模型的各处理负荷值信息，按降序或升序输出。

30.一种声音编码方式，是使用同样中央演算处理装置进行图像信号、声音信号编码处理的声音编码方式中，其特征在于：

用不同的多个演算量进行编码；

用变更上述声音信号或图像信号的编码演算量，控制在上述中央演算处理装置上处理的全部演算量。

31.一种声音编码方式，是使用同样中央演算处理装置进行图像信号、声音信号编码处理的声音编码方式，其特征在于：

用演算量不同的多个编码方式进行编码；

以变更上述声音信号编码的编码方式，控制在上述中央演算处理装置上处理的全部演算量。

32.如权利要求30或31所述的声音编码方式，其特征在于：

根据来自外部的控制信息进行上述中央演算处理装置上的处理的控制。

33.一种声音编码方式，是对数字音频信号进行时间/频率变换、用生成的量化信息进行编码的声音编码方式，其特征在于：

具有各演算量不同的多个量化信息算出装置；

根据来自外部的控制信息，转换使用的量化信息算出装置，算出量化信息进行编码，以便从上述多个量化信息算出装置中，选择所定的量化信息算出装置进行处理。

34.一种声音编码装置，其特征在于：

使用上述权利要求1至权利要求33中任一项所述的声音编码方式进行声音编码。

35.一种数据记录媒体，其特征在于：

记录了上述权利要求1至权利要求33的任一项所述的声音编码方式的步骤。