WO1998043423A1 - Procede et dispositif generant un flux d'acheminement et dispositif de transmission de programme - Google Patents

Procede et dispositif generant un flux d'acheminement et dispositif de transmission de programme Download PDF

Info

Publication number
WO1998043423A1
WO1998043423A1 PCT/JP1998/001336 JP9801336W WO9843423A1 WO 1998043423 A1 WO1998043423 A1 WO 1998043423A1 JP 9801336 W JP9801336 W JP 9801336W WO 9843423 A1 WO9843423 A1 WO 9843423A1
Authority
WO
WIPO (PCT)
Prior art keywords
stream
video
data
audio
transport
Prior art date
Application number
PCT/JP1998/001336
Other languages
English (en)
French (fr)
Inventor
Satoshi Miyazawa
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to US09/194,264 priority Critical patent/US6542518B1/en
Publication of WO1998043423A1 publication Critical patent/WO1998043423A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2401Monitoring of the client buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • H04N21/23655Statistical multiplexing, e.g. by controlling the encoder to alter its bitrate to optimize the bandwidth utilization
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams

Definitions

  • the present invention relates to a transport generation apparatus and method for multiplexing video data and audio data to generate an MPEG transport stream, and a program transmission apparatus for transmitting a plurality of programs.
  • DVB Digital Video Broadcasting
  • Yoichichi Tsuba in around 1993, proposed the MPEG2 standard. It is currently the de facto standard in digital broadcasting based on.
  • the transmission method first encodes video data and audio data included in a program to be transmitted, and generates an encoded video stream and an encoded audio stream. Next, the encoded video stream and audio stream are converted into a transport stream for transmission.
  • This one transport stream is a stream composed of data obtained by multiplexing an encoded video stream and an encoded video stream.
  • a multiplexing device having a multiplexing function has been developed.
  • This conventional multiplexing device multiplexes the video stream and the audio stream using an asynchronous multiplexing period that is not related to the frame period of the video stream and the frame synchronization of the audio stream.
  • a conventional multiplexing apparatus performs a multiplexing process on a video stream having 33 msec as one video frame period and an audio stream having 24 msec as one audio frame period.
  • a multiplexing process for multiplexing a video stream and an audio stream is performed using the video frame period, for example.
  • the multiplexing method of the multiplexing device includes, in a first video frame period, an encoded video stream V 1 encoded during a first video frame period; Multiplexes the coded audio streams A1 and A2 coded during the first video frame period, and in the second video frame period, encodes the coded audio streams A1 and A2 during the second video frame period; The multiplexed video stream V2 and the coded audio streams A1 and A2 coded during the first video frame period are similarly multiplexed. , Repeat. As a result, as can be understood from FIG.
  • the data amount of the first transport stream generated in the first video frame period is relatively large, and the data amount generated in the second video frame period is relatively large.
  • the data amount of the obtained second transformer T2 becomes relatively small. That is, the amount of data of the transport stream generated during one video frame generated by the conventional multiplexing process is It differs for each video frame period.
  • an STD (System Target Decoder) buffer for a decoder provided in a receiving device for receiving a video stream and an audio stream is broken.
  • This STD buffer is a virtual buffer used to describe the transport stream decoding and transport stream semantics.
  • step S100 during the first video frame period, the coded video stream V1 output from the video encoder and the coded audio streams A1 and A2 output from the audio encoder are received.
  • step S101 during the first video frame period, before actually multiplexing the coded video stream V1 and the audio streams A1 and A2 to generate the first transport stream T1
  • one multiplexing schedule for multiplexing the video stream V1 and the audio streams A1 and A2 is planned.
  • step S102 the multiplicity determined in step S101 is determined.
  • the transport stream is generated based on the decoding schedule and the transport stream is transmitted to the decoding device, it is simulated whether the video STD buffer and the audio STD buffer on the decoder side do not fail.
  • step SI03 it is determined whether or not the video STD buffer and the audio STD buffer on the decoder side do not fail as a result of the simulation. If it is determined that both the video STD buffer and the audio STD buffer on the decoder side do not fail, the process proceeds to the next step S104.
  • step S104 the coded video stream V1 and the audio streams A1 and A2 are actually multiplexed according to the multiplexing schedule planned in step S101.
  • step S105 a first transport stream T1 is generated from the multiplexed stream.
  • step S103 if it is determined that the video STD buffer and the audio STD buffer on the decoder side fail as a result of the simulation in step S103, the process returns to step S101 and returns to step S101.
  • a multiplexing schedule different from the multiplexing schedule previously planned is planned. That is, the processing of steps S101, S102 and S103 is repeated until the result of step S103 is determined to be "YES".
  • step S106 n is incremented to generate a transport stream T2 in the second video frame period, and the process returns to step S100.
  • a process of planning a new multiplexing scheduling and performing a scheduling corresponding to the scheduling is performed by a video frame. Required every period. This is because, as explained in FIG. 13, the amount of encoded video data multiplexed during one video frame period and the encoded audio data multiplexed. This is because the amount of data in the stream is completely different between individual video frame periods.
  • the present invention has been made in view of such a conventional problem, and aims to generate a transport stream in which the STD buffer on the decoding device side does not fail without delay in real time. is there.
  • the transport stream generating apparatus of the present invention is capable of controlling the amount of data of the encoded video stream multiplexed in one video frame period and the amount of encoded audio stream data multiplexed in a predetermined period. But I try to keep it almost constant. Also, the data amount of the transport stream generated during one video frame period is set to be substantially constant in any video frame period. You.
  • the transport stream output from the transport stream generation device has a constant data amount in any frame period. Therefore, the transport stream generation device of the present invention includes a decoder. There is no need to perform simulation for each frame to determine whether or not the STD buffer fails. As a result, the transport stream generating apparatus of the present invention can generate a transport stream at a higher speed than a conventional apparatus requiring simulation, and furthermore, the transport stream can be generated in real time. Can be generated.
  • the transport stream generation device of the present invention is configured to multiply an encoded video stream and an encoded audio stream based on a target video encoding rate and a target audio encoding rate. Is generated. Also, when the coded video stream and the coded audio stream are multiplexed in accordance with the created schedule data and transmitted as a transport stream to the decoding device, the SDT of the decoding device is used. This data is used for multiplexing so that the buffer does not fail. Therefore, the transport stream generating apparatus of the present invention generates such schedule data, and performs multiplexing processing according to the schedule data in all video frame periods, thereby facilitating the decoding apparatus. This prevents the SDT buffer from breaking down. In other words, the transport stream generation device of the present invention plans a new schedule for each video frame, as in the conventional device, and further simulates each video frame according to the planned schedule. Complex There is no need to perform any processing.
  • the transport stream generation device of the present invention provides a data stream of a coded video stream multiplexed in one video frame period and a data amount of a coded audio stream multiplexed in a predetermined period.
  • this schedule data is generated such that the data amount of the transport stream generated during one video frame period is substantially constant during any video frame period. are doing. That is, the transport stream generating device of the present invention can perform multiplexing processing in real time only by performing multiplexing processing according to the schedule data so that the decoder STD buffer does not fail.
  • the invention of claim 1 according to the present invention is directed to a transport stream generating apparatus for generating a transport stream for transmitting source video data and source audio data,
  • the source video data is encoded based on the specified video encoding rate to generate an encoded video stream
  • the source audio data is encoded based on the specified audio encoding rate to produce an encoded audio stream.
  • Multiplexing means for multiplexing the coded video stream and the coded audio stream at predetermined time intervals
  • a transport stream generating means for generating a transport stream from a multiplexed stream in which a video stream and an audio stream are multiplexed;
  • Encoding means such that the data amount of the coded video stream multiplexed in the predetermined period and the data amount of the coded audio stream multiplexed in the predetermined period are substantially constant in any predetermined period.
  • Multiplexing And a control means for controlling the transport stream generating means.
  • the invention according to claim 11 is a transport stream generating apparatus for generating a transport stream for transmitting source video data and source audio data
  • the source video data is encoded based on the specified video encoding rate to generate an encoded video stream
  • the source audio data is encoded based on the specified audio encoding rate to encode an audio stream.
  • Multiplexing means for multiplexing the coded video stream and the coded audio stream at predetermined intervals
  • a transport stream generating means for generating a transport stream from a multiplexed stream in which a video stream and an audio stream are multiplexed
  • the data rate of the coded video stream multiplexed as the transport stream in the specified period and the data rate of the coded video stream multiplexed in the specified period are set to be substantially constant in any specified period.
  • An invention according to claim 21 is a transport stream generating apparatus for generating a transport stream for transmitting source video data and source audio data
  • Multiplexing means for multiplexing the coded video stream and the coded audio stream every predetermined period
  • a transport stream generating means for generating a transport stream from a multiplexed stream in which a video stream and an audio stream are multiplexed;
  • Transport stream characterized by comprising encoding means, multiplexing means and control means for controlling the transport stream generating means so that the data rate of the transport stream is constant in any given period. It is a generating device.
  • An invention according to claim 22 is a transport stream generating apparatus for generating a transport stream for transmitting source video data and source audio data
  • Coding means for coding the source video data based on the specified video coding rate and coding the source video data based on the specified audio coding rate
  • Transport stream generating means for generating a transport stream by multiplexing the coded video stream and the coded audio stream every predetermined period
  • Control means for controlling the transport stream generating means so as to perform multiplexing processing according to the multiplexing schedule in any given period;
  • a transport stream generation device comprising: The invention according to claim 23 is a transport stream generating method for generating a transport stream from source video data and source audio data,
  • the amount of data of the coded video stream to be multiplexed is substantially constant for any given period, and the amount of data of the coded audio stream to be multiplexed is substantially constant for any given period. Then, at predetermined time intervals, the coded video stream and the coded audio stream are multiplexed,
  • a transport stream generation method characterized by generating a transport stream from a stream in which an encoded video stream and an encoded audio stream are multiplexed.
  • the invention of claim 33 is a transport stream generating method for generating a transport stream from source video data and source audio data
  • the source video data is encoded based on the specified video encoding rate, and the source video data is encoded based on the specified audio encoding rate.
  • the data rate of the coded video stream to be multiplexed is substantially constant for any given period, and the data rate of the coded audio stream to be multiplexed is substantially constant for any given period. Then, at predetermined intervals, the coded video stream and the coded audio stream are multiplexed.
  • This is a transport stream generation method characterized by generating a transport stream from a stream in which an encoded video stream and an encoded audio stream are multiplexed.
  • the invention according to claim 3 is a transport stream generating method for generating a transport stream for transmitting source video data and source audio data
  • the source video data is encoded based on the specified video encoding rate, and the source video data is encoded based on the specified audio encoding rate.
  • the invention according to claim 35 is a transport stream generation method for generating a transport stream for transmitting source video data and source audio data
  • the coded video stream and the coded audio stream are multiplexed so that the multiplexing process according to the multiplexing schedule is performed.
  • the transport stream generation method according to claim 36 wherein the source video data and the source audio data are encoded, and the encoded encoded video stream and the encoded encoded audio stream are encoded.
  • a transport stream generation method for outputting as a transport stream
  • the amount of encoded video stream data to be multiplexed and the encoded audio stream data to be multiplexed during one video frame period are determined.
  • a multiplexing schedule for multiplexing the coded video stream and the coded audio stream is determined.
  • the coded video stream and coding are performed using the multiplexing cage module in any video frame period.
  • This is a transport stream generation method characterized by outputting a transport stream by multiplexing an audio stream.
  • the invention according to claim 37 is a program transmission device for transmitting a plurality of programs
  • the video stream and audio stream included in each program are encoded, and the encoded video stream and encoded low-order stream are multiplexed and output as a transport stream.
  • a plurality of encoding devices are encoded, and the encoded video stream and encoded low-order stream are multiplexed and output as a transport stream.
  • a multiplexer for multiplexing a plurality of transport streams output from the plurality of encoders
  • a controller for controlling a plurality of encoding devices and multiplexing devices.
  • a basic schedule for multiplexing the coded video stream and the coded audio stream during one video frame period is generated,
  • a program transmission device characterized by generating a transport stream.
  • the invention according to claim 38 is a program transmission device for transmitting a plurality of programs
  • a multiplexer for multiplexing a plurality of transport streams output from the plurality of encoders
  • a controller for controlling a plurality of encoding devices and a multiplexing device, Each of the encoding devices
  • a multiplexing schedule for multiplexing the coded video stream and the coded audio stream is determined based on the data amount of the coded video stream to be multiplexed and the data amount of the coded audio stream to be multiplexed.
  • the coded video stream and the audio stream are multiplexed in the processing unit of the predetermined multiplexing processing period
  • the coded video stream is multiplexed using the multiplexing schedule in each of the predetermined multiplexing processing periods.
  • FIG. 1 is a block diagram showing a system on the transmitting side of digital satellite broadcasting to which the present invention can be applied
  • FIG. 2 is a block diagram of an encoder system of the transmitting side system
  • FIG. 3 is a transport system according to the present invention.
  • FIG. 4 is a block diagram of an example of a video encoder
  • FIG. 5 is a block diagram of an example of an audio encoder
  • FIG. 6 is a schematic diagram of stream generation.
  • FIG. 7 is a schematic diagram showing a configuration of a PES header
  • FIG. 8 is a schematic diagram showing a configuration of a TS header
  • FIG. 9 is a schematic diagram showing a configuration of a transport stream.
  • FIG. 10 is a flowchart for explaining the transport generation processing
  • FIG. 11A and 11B are flow charts for explaining the details of the transport stream generation processing.
  • Fig. 12 shows the tiger
  • FIG. 13 is a timing chart of the conventional transport stream generation processing
  • FIG. 14 is a timing chart of the conventional transport stream generation processing. It is a flowchart used.
  • FIG. 1 schematically shows a digital satellite broadcasting system to which the present invention can be applied.
  • the transmitting side is equipped with video and audio (AV) information storage devices such as archiver 1 and server 2.
  • AV video and audio
  • a VTR cart machine is used as the archiver 1
  • an AV server including a hard disk is used as the server 2.
  • the AV information from the archiver 1 and the server 2 is supplied to the routing switcher 3 and the AV information is switched.
  • the output information of the routing switcher 3 is supplied to the encoding system 4.
  • the encoding system 4 includes a video encoder and an audio encoder for compressing video information and audio information according to MPEG 2, a data multiplexing unit for multiplexing each encoded output and header information for system control, and a plurality of channels.
  • the stream from the encoding system 4 is supplied to a modulator, for example, a QSK (Quadrature Phase Shift Keying) modulator 5.
  • a decoder 6 similar to that on the receiving side is provided, and a monitor output is obtained from the decoder 6.
  • the modulation output from the QSK modulator 5 is supplied to the transmission antenna 8 via the up-converter 7 and transmitted from the transmission antenna 8 to the communication satellite 11.
  • encoding system 4 video information, audio information, etc.
  • multiplexing of multiple channels is performed. Thereby, programs of a plurality of channels can be multiplexed in one frequency bandwidth.
  • FIG. 1 shows a case where six channels are multiplexed.
  • the archiver 1, the server 2, and the encoding system 4 of the transmitting system are connected by a LAN 9 such as an ethernet.
  • the operation of the transmitting system is managed by the computers 10a, 10b, 10c connected to the LAN 9.
  • the digital satellite broadcast program distributed by the communication satellite 11 is received by the home receiving system 12.
  • the receiving system 12 includes a set-top box 14 connected to a receiving antenna 13 and a television receiver 15.
  • the set-top box 14 includes a QPSK demodulation unit, an error correction circuit, a descrambling circuit, a video decoder, an audio decoder, and the like, corresponding to the configuration on the transmission side.
  • the decoded video data, audio data, and additional data are reproduced on the television receiver.
  • FIG. 2 is an example of the configuration of the encoding system 4.
  • 2 1,, 2 12,..., 2 1 ⁇ indicate the transport stream generator of each channel of the ⁇ channel.
  • Each of the transport stream generators is supplied with video data, audio data, and private data (additional data), and encodes these data using the MPEG2.
  • a target encoding video rate for example, a rate according to the content of a program
  • Transponder one toss tri Ichimu generating apparatus 2 1 a plurality of channels,, 2 1 2,. ..., the output data of the 2 1 n is multiplexed by the data multiplexing unit 22.
  • the encoding unit 22 includes a transmission line encoding unit for scrambling, error correction encoding, and the like.
  • the output of the data multiplexing section 22 is output to the QSK modulation section.
  • the data multiplexing section 22 includes an EPG (Electronic Program Guide) system, a CA (Conditional Access) system 23 for each channel. Information is provided.
  • the encoding system 4 is managed by a computer 25 connected via a LAN 24 such as Ethernet.
  • Transport stream generator 2 1! , 2 12,..., And 2 1 n have, for example, the configuration shown in FIG.
  • reference numeral 31 denotes a video encoder
  • 32 denotes an audio encoder.
  • An encoder may be provided to encode subtitle data accompanying movie video data. Encoded subtitle data has a significantly smaller amount of data than encoded video data or encoded audio data, and is transmitted to the CPU path even if it is transmitted via the CPU bus. There is no problem because it has no effect.
  • the video encoder 31 compresses and encodes video data input from an external device such as a switcher (see FIG. 1) by, for example, the MPEG2 method.
  • the video elementary stream from the video encoder 31 is supplied to an encoder FIFO (First In First Out) buffer 33 as a buffer memory.
  • FIFO First In First Out
  • the audio encoder 32 compresses and encodes audio data input from an external device using, for example, the MPEG2 method, generates an audio stream having an equal data amount for each audio frame of a predetermined length, and generates an encoder. Output to FI FO buffer 34.
  • MP EG 2 In audio layer 2, 1152 samples are encoded and decoded as one audio frame.
  • the sampling frequency can be 48 kHz, 44.1 kHz, 32 kHz or any other frequency. Therefore, one audio frame is 24 ms and 26. Iras, 36 ms, corresponding to each sampling frequency.
  • the transmission rate of the audio elementary stream from the audio encoder 32 is also a fixed rate, for example, 384 k [bit / s].
  • a RAM 35 is provided as a memory for private data.
  • the streams output from the encoders F1-0 buffers 33 and 34 and the RAM 35 are supplied to input terminals a, b and c of a multiplexer 36 represented by a switch circuit, respectively.
  • the stream selected by the multiplexer 36 is supplied to one input terminal d of a multiplexer 37 represented by a switch circuit.
  • the stream selected by the multiplexer 37 is output as the transport stream TS via the FIFO buffer 38.
  • the transport stream generating device shown in FIG. 3 includes a CPU 39, a RAM 40 connected to the CPU 39 via a CPU bus, for controlling the multiplexing of the elementary stream. 41, data size counting interfaces 42 and 43, an Ethernet interface 44, and a serial interface 45 are provided. Private data 1 and private data 2 are supplied on the CPU bus via the Ethernet interface 44 and the serial interface 45. Private data is subtitles, additional audio information, text information, user data, and so on.
  • the multiplexer 36 selects one of the input terminals a, b, and c according to the control of the control signal from the CPU 39, and selects one of these input terminals. Select one of the elementary streams input to each of the children.
  • the multiplexer 37 to which the stream multiplexed by the multiplexer 36 is supplied is also controlled by the control signal from the CPU 39.
  • the multiplexer 36 does not select any of the input terminals a, b, and c when there is no elementary stream to be input to any of the input terminals, or when stuffing processing is performed.
  • Output blank data (consecutive logical 1 or 0).
  • the multiplexer 37 selects one of the input terminals d and e according to the control of the control signal, and outputs the elementary stream from the input terminal d and the header data (TS packet header or PES packet) from the input terminal e. Header) is multiplexed and output to the FIFO buffer 38.
  • the FIFO buffer 38 buffers the data stream multiplexed by the multiplexer 37, and external equipment such as a multiplexing unit for multiplexing streams of a plurality of channels as a transport stream TS (not shown). ) Output to.
  • the transport stream from the multiplexer 37 may be output to a storage device such as a hard disk device or a magneto-optical disk device for recording.
  • the data size interfaces 42 and 43 count the data size of each frame or field of the video stream and audio stream input from the video encoder 31 and the audio encoder 32, and transmit the data size via the CPU bus. Supplied to CPU 39. Since the data amount of the private stream is known by the CPU 39, the data size No face is required.
  • the data size is counted by the counters built in each of the data size interfaces 42 and 43.
  • the data size is calculated by detecting the data size of each elementary stream output from the video encoder 31 and the audio encoder 32 by the data size interface 42 and 43 itself. It is also possible by doing.
  • the Ethernet interface 44 receives the private data 2 input via a LAN (not shown) such as an Ethernet, and outputs the same to the CPU 39 via the CPU bus.
  • the serial interface 45 receives, for example, serial private data 1 input from a computer and outputs it to the CPU 39 via the CPU bus.
  • the CPU 39 is composed of, for example, a microphone processor, an R ⁇ ⁇ ⁇ ⁇ ⁇ M for storing programs, and their peripheral circuits, and controls the transport stream generator so that the transport stream generator performs desired operations. I do. Specifically, the CPU 39 supplies a target video encoding rate to a bit rate control circuit of the video encoder 31, for example.
  • CPU 3 9 the control data by using the control data stored in the R AM 4 0, PCR (program clock reference) ⁇ Da flop station Fi one containing information field and PES (Packetized Elementary Strea ra ) Generate the contents of the packet header.
  • the generated header is stored in the processing RAM 41 and then output through the input terminal e of the multiplexer 37 and its output terminal.
  • the elementary stream is multiplexed by the multiplexer 36, and the multiplexer 3 7 adds a header to the PES bucket header and TS bucket.
  • the transport stream generator shown in Fig. 3 converts both elementary streams into PES buckets and TS buckets.
  • the CPU 39 stores the data size input from the data size interfaces 42 and 43, the Ethernet interface 44 and the serial interface 45, and the remaining recording capacity of the encoder FIFO buffers 33 and 34 (buffer remaining). The number of elementary streams to be multiplexed, the amount of multiplexed data for each elementary stream, and the like.
  • the processing RAM 40 is used when the CPU 39 performs the processing described above.
  • the header generated by the CPU 39 is stored in the RAM 40, output from the RAM 40 to the input terminal e of the multiplexer 37, and inserted into the transport stream.
  • the CPU 39 processes the data of the encoded data amount read from the data size interfaces 42 and 43, and the private data input via the Ethernet interface 44 or the serial interface 45. Is temporarily stored in the RAM 40 for use by the CPU 39.
  • values such as a multiplexed residual data amount frame-bit remain which are used in a process of determining a multiplexed data amount in the CPU 39 described later are also stored and held in the processing RAM 40.
  • the control data RAM 41 is a memory for storing control data related to the processing of the CPU 39.
  • Control data and schedule data related to the creation of header data are stored.
  • the video encoder 31 has the configuration shown in FIG. That is, a subtraction circuit 51 that calculates the difference between the input video data and the local decoded video data, a DCT circuit 52 that performs DCT conversion on the output of the subtraction circuit 51, and a coefficient data from the DCT circuit 52 are quantized.
  • a buffer memory 55 is provided.
  • Information on the amount of data generated by the variable length coding circuit 54 is supplied to the bit rate control circuit 56, and the quantization scale is controlled. Thereby, the amount of generated data is controlled.
  • a local decoding unit including an inverse quantization circuit 57, an inverse DCT circuit 58, an addition circuit 59, and a frame memory 60 is provided.
  • a motion detection unit is provided, and the motion detection unit detects a motion vector in macroblock units. Based on this motion vector, the frame memory 60 is controlled to perform motion compensation.
  • an intra-coded (Intra) picture which is an intra-coded picture
  • a P (Predictive) picture which is an inter-frame forward predictive-coded picture
  • a B (Bidirectionally predictive) picture which is a bidirectional predicted picture.
  • macroblocks there are three types of macroblocks. In other words, an intra-coded (Intra) macroblock, a forward (Fward) interframe prediction macroblock that predicts the future from the past, and a backward (Backwrd) interframe prediction macroblock that predicts the past from the future And an interpolative macroblock that predicts from both front and rear directions is there.
  • All macroblocks in an I-picture are intra-coded MAC blocks.
  • the P picture includes an intra-frame coded macro block and a forward inter-frame prediction macro block.
  • the B picture includes all four types of macroblocks described above. Local decoding data is formed according to these macroblock types, and the difference is calculated in the subtraction circuit 51 in the case of predictive coding, and the difference is calculated in the case of intra-frame coding. And the input video data appears at the output of the subtraction circuit 51.
  • the CPU 39 of the above-described transport stream generating device supplies the target data amount video—rate—target to the bit rate control circuit 56 of the video encoder 31.
  • the bit rate control circuit 56 determines the amount of data after compression encoding based on the data amount of the video elementary stream actually generated by the variable length coding circuit 54, and sets the set target data amount vi deo. — Control the quantization circuit 53 so that it is equal to the rate— target.
  • the audio encoder 32 includes a subband analysis filter bank (SAFB) 61, a linear quantization circuit 62, a bit compression circuit 63, and an FFT (Fast Fourier Transfer) circuit 64.
  • SAFB subband analysis filter bank
  • FFT Fast Fourier Transfer
  • a subband analysis filter bank 61
  • a linear quantization circuit 62 a linear quantization circuit 62
  • a bit compression circuit 63 a bit compression circuit 63
  • FFT Fast Fourier Transfer
  • the audio encoder 32 compresses and encodes the audio data input from the external device according to the MPEG 2 method, generates an audio stream, and sends the audio stream to the encoder FIFO buffer 34 and the data size interface 4 3. Output.
  • the transport stream generating device multiplexes the video elementary stream, the audio elementary stream, and the private elementary stream,
  • the stream will be described.
  • a stream conversion method for generating a transport stream from an encoded video stream will be described.
  • the video stream and the audio stream perform the same stream conversion, only the conversion of the video stream will be described here.
  • the source video data is encoded by the MPEG-2 method
  • several video frames are defined as one GOP (Group Of Picture), and the source video data is It is designed to be compressed and encoded.
  • at least one of the GOP pictures is an I picture
  • the remaining pictures are P or B pictures.
  • An I-picture is a picture that has been compression-coded by intra-frame coding
  • a P-picture is a picture that has been compression-coded by I-frame or inter-frame predictive coding from another P-picture
  • a B-picture is , Are pictures that have been compression-coded by bidirectional inter-frame predictive coding from the preceding and following pictures.
  • the amount of data of the coded video stream coded based on the MPEG 2 standard differs depending on the type of picture such as an I picture, a B picture, and a P picture. At the same time, it differs depending on whether or not there is motion compensation. Therefore, the data amount of the encoded video stream output from the video encoder during one video frame period is not always constant.
  • This encoded video stream is generally called an elementary lease stream (ES).
  • the coded video streams V1, V2, V3 and V4 are packetized by adding a header at the beginning of the stream, as shown in Fig. 6. .
  • this PES bucket is divided into 184 bytes, and is converted to a transport packet for transmission by adding a transport packet header (TS header) of 4 bytes at the beginning. Is done.
  • TS header transport packet header
  • the PES packet includes a 24-bit packet start code indicating the start of the PES packet and the type of stream data contained in the actual data portion of the PES packet (for example, 8 [bit] stream ID indicating the type of video or audio, etc., 16 [bit] bucket length indicating the length of the data that follows, and code data indicating the value “10”
  • a flag control section that stores various flag information, an 8-bit PES header length that indicates the data length of the conditional 'coding section, and playback time information called a PTS (Presentation Time Stamp) It consists of a variable-length conditional coding unit that stores time management information for decoding, called DTS (Decoding Time Stamp), or stuffing bytes for data amount adjustment.
  • DTS Decoding Time Stamp
  • the TS packet is composed of a 4-byte TS header section and a payload section in which 184 bytes of actual data are recorded.
  • the TS header has an 8 [bit] synchronization byte indicating the start of a TS packet, an error indicator (error 'indicator) indicating the presence or absence of a bit error in the packet, and a PES packet head.
  • This TS packet A unit start indication part that indicates whether the TS packet is present in the packet, a transport packet priority part that indicates the importance of this TS packet, and
  • the PID section stores the bucket identification information PID indicating the type of the stream data contained in the payload section of the TS bucket, and the stream data contained in the erase section has scrambled data.
  • the adaptation field portion includes an adaptation field length indicating the length of the adaptation field portion
  • a discontinuity indicator that indicates whether or not the time information has been reset in the TS stream of the same stream following the TS bucket, and whether or not this TS packet is an entry point for random access.
  • a stream priority display that indicates whether or not a significant part of the stream data is stored in the payload of this TS packet, and flag information about the conditional coding.
  • a flag control unit to be stored and reference time information called PCR (Program Clock Reference) or reference time information called OPCR (Original Program Clock Reference), or splice / countdown etc.
  • Conditional coding section where information is stored and stuffing byte section to adjust data volume It constituted by.
  • FIG. 9 shows a transport stream generated by multiplexing an encoded video stream, an encoded audio stream, and other data using a multiplexing schedule that is a feature of the present invention.
  • This transport stream consists of PAT (Program Association Table) data, PMT (Program Map Table) data, PCR (Program Clock Reference) data, coded video stream, coded audio stream, private data and It is composed of multiple transport packets for transmitting NULL data and the like.
  • PAT Program Association Table
  • PMT Program Map Table
  • PCR Program Clock Reference
  • the PMT is information indicating the bucket identification information P ID of the TS bucket in which the video stream and the audio stream constituting the program are stored.
  • the video stream with the program number ⁇ X '' is transmitted as a TS packet with the packet identification information PID of ⁇ XV
  • the audio stream is transmitted as the TS packet with the packet identification information PID ⁇ XA.
  • the PMT manages the bucket identification information PID “XV” and “XA”, so that the transport packet through which the video stream and audio stream of program number “X” are transmitted Can be identified.
  • the PMT consists of an 8-bit table ID, a 1-bit section 'section syntax indicator, 2 Bit “0” Reserved data, 12-bit section length, 16-bit program number, 2-bit reserved, 5-bit Version number, 1-bit current next indicator, 8-bit section number, 8-bit last section number, 3-bit Reserved, 13-bit Program Clock Reference (PCR) and PID (PCR PID), 4-bit reserved (reserved), 12-bit program information length (program info length), Descriptor of several bits, stream of 8 bits ⁇ ⁇ ⁇ type (stream type), reserved of 3 bits (reserved), 13-bit elementary PID (elementary PID), 4-bit Saab (reserved) 1 2 bit ES information length (ES info length), and a data number bits of descriptor (descriptor) and 3 2-bit CRC (CRC). Therefore, even if user data of several 10 bytes is described in the descriptor, the data size of the PMT is about 25 bytes.
  • PCR Program Clock Reference
  • PID
  • the PAT Program Association Table
  • P ID bucket identification information P ID of a TS bucket in which a PMT generated for each program is stored.
  • the PAT is an 8-bit table ID (Identifier) that indicates the type of table specified in MPEG 2, a 1-bit section 'syntax indicator, 1-bit' 0 'data, 2-bit reserve, 1 2-bit section length, 16-bit transport stream (TS) ID, 2-bit reserve, 5-bit version number, 1-bit current next indicator, 8-bit section number, 8-bit last section number, 16-bit program number, 3-bit reserve, 13-bit network PID, or 13-bit program map pID and 32-bit CRC (Cyclic Red undancy Check). Therefore, the data size of this PAT is about 16 bytes.
  • PCR Program Clock Reference
  • STC System Time Clock
  • Private data is any user data that is not specified in MPEG2, and is generally a unique EPG (Electric Program Guide) assigned to each individual producer. Data and caption data are transmitted as this private data. These private data are data consisting of several bytes or tens of bytes, similar to PAT, PMT and CRC data.
  • Null data is dummy data inserted so that the transmission rate of the transport stream transmitted during one video frame is always constant.Similar to private data, several bytes are used. Or it is data consisting of tens of pites.
  • the transport stream described in FIG. 9 is based on the target video encoding rate (target—video one rate [bit / s]) supplied from the computer 25 to the video encoder 31. [bit / s] and the target audio encoding rate (target — audiop—rate [bit / s]) supplied from the computer 25 to the audio encoder 32 is 384 K [bit / s] And the transport stream generated based on the multiplexing schedule data generated in that case. is there.
  • schedule data for multiplexing important data into one video frame period Before performing the multiplexing process of the PCR, PAT, PMT, coded video stream, coded audio stream, and private data described above, It is characterized by generating schedule data for multiplexing important data into one video frame period.
  • the schedule data for multiplexing described here means that during one video frame, several transport packets are used to transmit these various data, and these individual data are transmitted. Is used to define the number of the transport bucket to use.
  • a specific method for generating the multiplexed schedule data will be described. First, in order to generate the multiplex schedule data, the number of transport packets transmitted in one video frame period must be obtained. The method for determining the number of transport buckets will be described below.
  • PAT data, PMT data, and CRC data are data of several bytes to several tens of bytes, so they must exceed 184 bytes or more, which is the basic unit of one transport bucket. No. Therefore, in the transport generation device of the present invention, each transport packet used for transmitting the PAT data, the PMT data, and the PCR data is defined as one transport packet.
  • NULL data like PAT data, PMT data, and PCR data, can be from several bytes to several tens of bytes. Is the basic unit of one transport packet.
  • the transport stream generation device of the present invention uses the transport packet used to transmit these private data and NULL data so that the user can transmit any number of private data. , Each of which is defined as two transport packets.
  • the number of transport buckets required to transmit the coded video stream is determined.
  • target video encoding rate target—video—rate [bit / s]
  • 4 M bit / s
  • the target video coding rate (target — Video —rate [bit / s]) is 4M [bit / s]
  • the amount of encoded video stream data output from the video encoder 31 in one video frame period size one frame — video [ byte]
  • the encoded video stream of 16668.35 bytes is output from the video encoder 31 and the output stream is supplied to the encoder FIFO buffer 33. .
  • the coded video stream can be read out from the FIFO buffer 33 for buffering the coded stream only in units of 1 byte, 0.35 bytes per video frame is used.
  • Data remains in the encoder FIFO buffer 33. That is, for one video frame period, a stream of 1666.83.35 bytes is supplied to the encoder FIFO buffer 33, and the encoder FIFO buffer 33 is supplied with a stream of 166683 bytes.
  • this encoder FIFO buffer 33 determines whether to output 166 683 bytes of coded video data or 166 334 bytes of coded video data.
  • the encoded video stream of 16 6 8 4 bytes output from the video encoder 3 1 during one video frame period is represented by s ize-frame one video [byte]
  • the encoded video stream output from the encoder FIFO buffer 33 provided at the output stage of the video encoder 24 during one video frame period is equal to 1 666 3 bytes or 1 666 8 4 In either case, the encoded video stream is transmitted using 90 transport buckets.
  • the number of transport buckets required to transmit the coded audio stream is determined.
  • the target audio rate (bits / s) power supplied from the computer 25 to the audio encoder 32 The case of 3 8 4 K [bit / s] will be described as an example.
  • the frame frequency (frame-frequency [Hz]) of the video stream of the NTSC system is S, 1/2 9/97 [Hz]
  • the target audio encoding rate (target — audio one rate [bit] / s]) is 384 K [bit / s]
  • the data size (size) of the coded audio stream output from the encoder of the audio encoder 32 during one video frame period One frame one audio [byte])
  • an encoded audio stream of 161.6.16 bytes is output from the audio encoder 32, and is buffered in the encoder FIFO buffer 34.
  • the encoder FIFO buffer 33 since the encoded audio stream can be read from the encoder FIFO buffer 3 only in units of one byte, 0.60 per video frame can be read. 16-byte data remains in the encoder FIFO buffer 34. That is, 0.616 bytes of remaining data are accumulated in the encoder FIFO buffer 34 for each video frame, and as a result, the encoder FIFO buffer 34 overflows.
  • the encoder FIFO buffer 34 for buffering the encoded audio stream is left in the encoder FIF buffer 34 so as not to overflow. According to the remaining data, it is determined whether to output 1601 bytes of audio encoded data or 1602 bytes of data for each video frame.
  • the number of transport packets required to transmit the 1601 bytes of coded audio stream is determined. Since the size of the data transmitted as one transport bucket is 184 bytes, the encoded audio stream of 1601 bytes is size. _ Frame-audio [byte]
  • this 1601-byte coded audio stream can be transmitted using eight transport buckets.
  • this 162-byte coded audio stream is transmitted using eight transport packets, as in the case of the 1601-bit coded audio stream. be able to. That is, regardless of whether the encoded audio stream output from the audio encoder 32 during one video frame period is 1601 bytes or 1602 bytes, the encoded audio stream is And transmitted using eight transport packets. In addition, based on the above formula, when the coded audio stream of 1601 or 1602 bits output during one video frame period is transmitted using eight transport buckets, , 129 bytes or 130 bytes of audio data will remain in the encoder FIFO buffer 34 without transmission. In the transport stream generating apparatus of the present invention, the remaining 129 bytes or 130 bytes of audio data is transmitted in the next video frame period.
  • the coding is performed.
  • the size of the transport packet required to transmit the video stream is 90 packets, and the size of the transport packet required to transmit the coded audio stream is 8 packets .
  • an additional field such as a 19-byte PES header or an adaptation field of a TS packet header is used.
  • the amount of video stream and audio stream data converted to the transport stream is reduced by the encoded video stream and encoding format when output from the video encoder 31 and the audio encoder 32. -This will be larger than the amount of data in the downstream stream.
  • the transport stream generation device of the present invention The target video coding rate and the target audio coding rate supplied from the computer 25 are 4 M [bit / s] and 384 K [bit / s], considering that the data increases.
  • the size of the transport packet required to transmit the coded video stream is 91 packets
  • the size of the transport packet required to transmit the coded audio stream is As can be understood from the above description, the target video encoding rate supplied from the computer 25 and the target video encoding rate are used to transmit the PCR data during one video frame period.
  • Number of transport packets required, number of transport packets required to transmit PAT data, number of transport packets required to transmit PMT data The number of transport buckets, the number of transport buckets needed to carry the coded video stream, the number of transport packets needed to carry the coded audio stream, and the private data The number of transport buckets required for transmission can be determined.
  • the target video coding rate and the target audio coding rate supplied from the computer 25 are 4 M [bit / s] and 384 K [bit / s].
  • Means that the number of transport packets required to transmit the coded video stream is “91”, and the number of transport packets required to transmit the coded audio stream is ⁇ 9 ”.
  • the number of transport packets for transmitting PCR, PAT, and PMT data is 1 each, and the number of transport packets required for transmitting private data and NULL data is respectively "2". Therefore, the total number of transport packets contained in one transport stream transmitted during one video frame period (tolal — size— frara e one transport) is
  • the above example is an example in which the target video encoding rate and the target audio encoding rate supplied from the computer 25 are specified as 4M [bit / s] and 384K [bit / s].
  • the transport generation apparatus of the present invention is not limited to the specified target video coding rate and target video coding rate, but includes any values of the target video coding rate and the target audio coding rate.
  • a rate may be specified. In that case, the number of transport buckets required to transmit the coded video stream and the number of transport buckets required to transmit the coded audio stream are different from the above example. The only difference is.
  • one transport bucket of CRC data, PAT data and PMT data, nine transport buckets of encoded video stream, and nine transport buckets of encoded audio stream, respectively. 2 explain how to multiplex private data and NULL data of the transport bucket.
  • the transport stream generating apparatus of the present invention includes PAT data, PMT data, PCR data, coded video stream, coded audio stream, private data, and NULL data in that order.
  • the transport stream is generated by multiplexing the data. Specifically, as shown in Fig. 9, of the 107 transport streams, the first transport packet is used as a transport packet for transmitting PAT data.
  • the second transport packet is used as a transport packet for transmitting PMT data
  • the third transport packet is used as a transport packet for transmitting PCR data.
  • the next four to forty-ninth transport buckets are used to carry about half of the data in the coded video stream, and the fifty-fifth to fifty-fourth transport buckets are used for coded audio streams. It is used to transmit about half of the data.
  • the 55th transport packet is used to transmit half of the private data, and the 56th transport packet transmits half the NULL data. Used for.
  • the 57th to 101st transport buckets are used to carry the data of the other half of the coded video stream, and the 107th to 105th transport buckets are used. Is used to transmit the data of the other half of the coded audio stream.
  • the transport packet No. 106 is used for transmitting the remaining half of the private data, and the transport packet No. 107 is used for transmitting the other half of the NULL data. Is used to transmit data.
  • the CPU 39 multiplexes PAT data, PMT data, PCR data, coded video stream, coded audio stream, private data, and NULL data.
  • the schedule data which is a feature of the present invention is generated.
  • this cage yule data consists of 107 transport streams.
  • PAT data, PMT data, and PCR data are transmitted as the first, second, and third transport packets, respectively, and the coded video stream is transmitted as the next, fourth to forty-ninth transport packets. About 50% of the stream, and about half of the encoded audio stream as the 50th to 54th transport packets, and the private data as the 55th and 55th transport packets.
  • the PAT data, PMT data, PCR data, coded video stream, coded audio stream, private data and NULL data are transmitted in this order.
  • the transport stream of the present invention is not limited to this transmission order.
  • the transmission order of the PCR data and the PAT data may be reversed, or the transmission order of the coded video stream and the coded audio stream may be reversed.
  • the coded video stream Arm and the encoded audio stream force was to be transmitted in two s, in order to more decoder video buffer and decoder audio buffer is Ku difficulty collapsed and three times and four times the number of divisions You can set it.
  • step S10 the CPU 39 resets the frame variable “n” to “1”.
  • the frame variable “n” is a variable representing the frame number.
  • step S 11 the CPU 39 sends the target video encoding rate (target—video—rate [bit / s]) from the computer 25 and the audio encoding rate (target—audio—rate [bit / s]).
  • the target video encoding rate is data assigned to each encoding device for encoding video data included in each program.
  • the target video coding rate is set so that a relatively high coding rate is assigned to a video program with high motion and a relatively low coding rate is assigned to a video program with low motion. This is statistically calculated according to the complexity of the video data. Since the audio coding rate is a fixed rate selected from a plurality of coding rates standardized in advance, the user cannot set an arbitrary rate without permission.
  • step S12 the CPU 39 multiplexes the coded video stream and the coded video stream based on the specified target video coding rate and target audio coding rate.
  • the schedule data includes PAT data and PMT data as the first, second and third transport packets out of 107 transport streams.
  • the CRC data respectively, to transmit about half of the encoded video stream as the fourth to 49th transport packets, and to encode as the 50th to 54th transport packets.
  • Approximately half of the data stream is transmitted, half of the private data is transmitted as the fifth transport packet, and half of the null data is transmitted as the fifth transport packet. And transmit the other half of the encoded video stream as the 57th to 101st transport packets.
  • the second half of the encoded audio stream is transmitted as a transport bucket from 02 to the 105th half, and the other half of the private data is transmitted as a 106th transport bucket. This is data for performing multiplexing control of transmitting the other half of NULL data as the 107th transport packet.
  • the CPU 39 stores the generated schedule data in the RAM 41 for control data.
  • step S13 the CPU 39 generates a transport stream in which the encoded video stream and the encoded audio stream are multiplexed according to the schedule data created in step S12, and generates the transport stream. Simulation of how data remaining in the video STD buffer and audio STD buffer on the decoder side transitions when is transmitted to the encoder side.
  • step S14 the CPU 242 uses the video STD buffer at the decoder side based on the simulation result performed in step S13. It is determined whether both the audio and audio STD buffers do not fail. If it is determined that both the video STD buffer and the audio STD buffer do not fail when multiplexing is performed according to this multiplexing schedule, the process proceeds to step S15.
  • step S14 if it is determined that the video STD buffer or the audio STD buffer on the decoder side fails as a result of the simulation in step S14, the process returns to step S12, and the multiplexing schedule data created earlier is returned. Multiplexed schedule data different from the above is created. For example, as shown in Fig. 9, the previously planned multiplex schedule data is used to multiplex the coded video stream and the coded audio stream into two in one transport stream. In this case, another newly created multiplexing schedule data may be data for multiplexing the coded video stream and the coded audio stream so as to be divided into three. The processes of steps S12, S13 and S14 are repeated until the result of step S14 is determined to be "YE S".
  • step S15 the CPU 39 determines whether or not the user has designated an encoding process for encoding the source video data and the source audio data.
  • step S16 the CPU 39 transmits the CRC data, PAT data, PMT data, coded video stream, coded audio stream, and private data according to the schedule data stored in RAM 41. Performs multiplexing processing for multiplexing data and NULL data.
  • step S17 the CPU 39 stores the CRC data, the PAT data, the PMT data, the coded video stream, and the coded audio stream.
  • a transport stream is generated from a stream in which various data such as data, private data, and NULL data are multiplexed.
  • step S18 the CPU 39 increments the frame variable "n", returns to step S16, and performs processing for the next video frame period.
  • the CPU 39 generates multiplexing schedule data (step S12) before actually performing the multiplexing process (step S16), and based on the multiplexing schedule data, generates each video.
  • Each circuit is controlled so that multiplexing processing (step S16) and transport generation processing (step S17) are performed for each frame. Therefore, the transport stream generating apparatus of the present invention does not need to generate a multiplexing schedule for each video frame period unlike the conventional apparatus, and generates multiplexing schedule data only once. I have. As a result, the processing time for generating the transport stream can be dramatically improved, and the live video program can be transmitted without delay.
  • step S16 the multiplexing process (step S16) of the flowchart of FIG. 10 will be described in more detail with reference to the flowchart of FIG. Fig. 11 is divided into Fig. 11A and Fig. 11B because of the drawing space.
  • FIG. 11 is a flowchart for explaining step S16 in more detail.
  • step S1600 the division variable "i" is set to "1".
  • the division variable is data indicating how many times the coded video stream and the coded audio stream are divided during one video frame period.
  • the split variable “i” is “2”.
  • the CPU 39 causes the third transport bucket to output the PAT data, the PMT data, and the CRC data in accordance with the schedule data stored in the RAM 41.
  • the terminal of the multiplexer 36 is switched to c for a period corresponding to the transport bucket of (c). That is, by performing such switching, PAT data is multiplexed during the period corresponding to the first transport packet, and PMT data is multiplexed during the period corresponding to the second transport packet. In the period corresponding to the third transport packet, the PCR data is multiplexed.
  • step S1602 the CPU 39 converts the amount of data per field (field—bit per size [bit]) of the encoded video stream encoded by the video encoder 31 into a video encoder. 3 1 via interface 4 2
  • step S1603 the CPU 39 obtains the total amount of data buffered in the encoder FIFO buffer 33. Specifically, as a result of the encoder FIFO buffer 33 buffering the encoded video stream during the nth frame period (current frame period) of the video encoder 31, the totality of the encoder FIFO buffer 33 is obtained. Find out how much data amount has become. n— During one frame period (past frame period), if the amount of video data remaining in the encoder FIFO buffer 3 3 is frame —bit —remain [bit], then the encoder FIFO buffer 3 The total data amount of 3 is calculated as fram e —bit one total [bit]
  • step SI604 the CPU 39 causes the fourth transformer to output the coded video stream to be output as the fourth to ninth transport buckets according to the schedule data stored in the RAM 41.
  • the terminal of the multiplexer 36 is switched to a for a period corresponding to the 49th transport bucket from the port bucket. That is, by performing the switching in this way, the encoded video data is output from the encoder FIFO buffer 33 over a period corresponding to the 49th transport packet to the 49th transport packet.
  • step S165 the CPU 39 calculates the amount of remaining encoded video data remaining in the encoder FIFO buffer 33. Since the encoded video data buffered in the encoder FIFO buffer 33 was read out by the processing in step S1604, the amount of remaining encoded video data remaining in the encoder FIFO buffer 33 frame —Bit —remain [bit] is decreasing. Therefore, the data amount of the remaining encoded video data, frame—bit—remain [bit] is:
  • step SI606 CPU 39 sets audio encoder 3
  • the data amount per field (field—bit—size [bit]) of the encoded audio stream encoded by 2 is received from the audio encoder 32 via the interface.
  • step S 1607 the CPU 39 sets the total amount of the encoder FIFO buffer 34 as a result of the audio encoder 32 buffering the encoded audio stream by the encoder FIFO buffer 34 during the n-frame period. Find out how much data has been reached. If the data amount of the remaining audio data remaining in the encoder FIFO buffer 34 during the n — 1 frame period (past frame period) is frame-bit—remain [bit], the data in the encoder FIFO buffer 34 Total audio data frame per bit—total [bit] is frame—bit one total [bit]
  • step SI608 the CPU 39 causes the 50th transformer to output the encoded audio stream to be output as the 50th to 54th transport packets according to the schedule data stored in the RAM 41.
  • the terminal of the multiplexer 36 is switched to b. In other words, by performing the switching in this manner, the encoded audio stream is output from the encoder FIFO buffer 34 over a period corresponding to the 50th transport packet to the 54th transport packet. .
  • step S1609 the CPU 39 obtains the data amount frame — bit —remain [bit] of the remaining encoded audio data remaining in the encoder FIFO buffer.
  • the data amount of the remaining audio data remaining in the encoder FIFO buffer is reduced. Therefore, the amount of data of this residual coding streamer frame one bit —remain [bit] is
  • step SI610 the CPU 39 causes the multiplexer 3 to output private data in accordance with the schedule data stored in the RAM 41 for a period corresponding to the 55th transport bucket.
  • Switch terminal 6 to c In other words, by performing switching in this way, private data is multiplexed during a period corresponding to the 55th transport bucket.
  • step S1611 the CPU 39 outputs the NULL data in accordance with the schedule data stored in the RAM 41 so that the multiplexer 39 outputs the NULL data during the period corresponding to the 56th transport packet.
  • the terminal to c. That is, by performing such switching, NULL data is multiplexed in a period corresponding to the 56th transport packet.
  • NULL data By multiplexing, the data amount of the transport stream becomes constant in each video frame.
  • step S1612 the CPU 39 outputs the coded video stream to be output as the 57th to 101st transport packets according to the schedule data stored in the RAM 41. Then, the terminal of the multiplexer 36 is switched to a for a period corresponding to the transport packet No. 101 from the transport packet No. 57. In other words, by performing the switching in this manner, the encoded video data is output from the encoder FIFO buffer 33 over a period corresponding to the 57th transport bucket to the 101st transport bucket. Is done. Note that the size of the encoded video data output from the encoder FIFO buffer 33 during the period corresponding to the 57th transport packet to the 101st transport packet out—video—size [bit] is
  • step S1663 the CPU 39 newly updates the data frame-bit-remain [bit] indicating the data amount of the remaining encoded video data remaining in the encoder FIFO buffer 33. Because the coded video data buffered in the encoder FIFO buffer 33 was read out by the processing in step S1612, the data of the remaining coded video data remaining in the encoder FIFO buffer 33 was read. This is because the amount fram e —bit —remain [bit] decreases. Before performing the processing in step S 1 6 1 2, the remaining code remaining in encoder FIF ⁇ buffer 3 3 3 The data amount of the coded video data is obtained by the data amount frame —bit —remain [bit] of the remaining coded video data remaining in the encoder FIFO buffer 33 obtained in step S165. Therefore, the data amount of this newly updated residual encoded video data frame — bit t remain [bit] is
  • the CPU 39 outputs the encoded audio stream to be output as the transport packets from the 102nd to the 105th according to the schedule data stored in the RAM 41.
  • the terminal of the multiplexer 36 is switched to b during the period corresponding to the transport packet No. 102 from the transport packet No. 102. That is, by performing the switching in this way, the encoded audio data is output from the encoder FIFO buffer 34 over a period corresponding to the transport bucket No. 102 to the transport bucket No. 105. .
  • the size of the encoded audio data output from the encoder FIFO buffer 34 out one audio one size [bit]
  • step S1615 the CPU 39 indicates the amount of remaining encoded audio data remaining in the encoder FIFO buffer 34. ame —bit —remain Update [bit] newly. Because the coded audio data buffered in the encoder FIFO buffer 34 was read out by the processing in step S1614, the data amount of the remaining audio data remaining in the encoder FIF ⁇ buffer 34 fr arae —bit —remain [bit] is reduced. The amount of remaining encoded video data remaining in the encoder FI FO buffer 34 before performing the processing in step SI 6 1 4 remains in the encoder FI FO buffer 34 obtained in step S 16 09. Since the amount of remaining encoded audio data is determined by frame —bit —remain [bit], as a result, the data amount of this newly updated residual encoded audio data i'rarae one oit one remain [bit]
  • step SI 616 the CPU 39 sets the period corresponding to the 106th transport bucket so as to output the remaining private data according to the schedule data stored in the RAM 41.
  • the terminal of the multiplexer 36 is switched to c. That is, by performing switching in this way, the remaining private data is multiplexed during the period corresponding to the 106th transport packet.
  • step S1617 the CPU 39 outputs the remaining NULL data in accordance with the schedule data stored in the RAM 41, and outputs the remaining NULL data for a period corresponding to the 107th transport bucket. Switch the terminal of the multiplexer 36 to c. In other words, by performing switching in this way, the 107th transport bucket can be handled. During the corresponding period, the remaining NULL data is multiplexed. Thus, by multiplexing NULL data, the data amount of the transport stream becomes constant in each video frame.
  • step S1618 the division variable i is incremented, and the flow advances to step S1619.
  • step S1619 if the division variable i has the specified number of divisions, the process returns to step S17. If the division variable i has not reached the specified number of divisions, the process returns to step S1662. Return.
  • a method for generating a transport stream based on the multiplexing schedule will be conceptually described with reference to an example shown in FIG.
  • the encoded video stream output from the video encoder 31 may be multiplexed as a single transport stream.
  • the first coded video stream generated during the first video frame period is composed of a 6771-bit first stream portion V1-1-1 and a 6624-bit bitstream.
  • the second stream part and the remaining third stream part are multiplexed by being divided into V1_3.
  • the reason why the size of the first stream part V1-1—1 is set to 6771 bits is based on the scheduling data described above. — 1 for transmission using the first 46 transport packets (6771 2 bits) of the first half of the first transport stream T1.
  • the reason why the size of the second stream portion V1-2 is set to 626 bits is that, based on this scheduling data, the second stream portion V1—2 is divided into the last 45 transport packets (6624 bits) of the first transport stream T1. This is because transmission is performed using
  • the first transport stream for transmitting the video stream of the first transport stream T1 is composed of a first stream portion V1-1 and a second stream portion V1.
  • the transport bucket of the first transport stream T1 cannot be used to transmit the third stream portion V1-3 because it is used to transmit the first stream stream V1-3.
  • the third stream portion V1-3 is not transmitted as the first transport stream T1, but is transmitted as the second transport stream T1. Transmission is performed using some of the 46 transport buckets in the first half of 2.
  • the first stream portion V 2-1 of the second video frame period is combined with the third stream portion V 1 -3 of the first video frame period to form a second transport stream. Transmitted using the first 46 transport buckets of T2. That is, in the second video frame period, the third stream portion remaining in the encoder FIFO buffer 33 without being transmitted in the immediately preceding video frame period (the first video frame period). Combining the data size of V1-3 with the data size of the first stream portion V2-1 newly stored in the buffer during the second video frame period yields just 67712 bits. Become. Similarly, the second stream portion V 2-2 of the second video frame period and the first stream portion V 3-1 of the third video frame period are connected to the second video portion V 2-1. It is transmitted using the last 45 transport buckets of the transport stream.
  • the audio encoder The first coded audio stream output from the first stream part A1_1 of 736 bits is divided into the remaining second stream part A1_2. Transmitted separately.
  • the reason why the size of the first stream portion A1-1 is set to 7360 bits is that the first stream portion A1-1 is based on the scheduling data described above. This is because transmission is performed using the first five transport buckets (7360 bits) of the first transport stream T1.
  • First transport stream The first five transport packets of the nine transport buckets for transmitting the audio stream of T1 are the first stream part A1-1— The remaining second stream portion A1-2 is transmitted using the latter five transport buckets.
  • the first stream portion A2-1 of the second audio frame is composed of the last five transformers in the same manner as the second stream portion A1-2, which is the rest of the first audio frame. Transmit using a port packet. Therefore, the data amount of the second stream portion A1-2, which is the rest of the first audio frame, and the data amount of the first stream portion A2-1, which is the second audio frame. When combined, the data volume of four transport packets (to 588 bits) is obtained.
  • the second stream portion A2—2 of the second audio frame the first and second stream portions A3-1—A3_2 of the third audio frame.
  • the first and second stream portions A4-1 and A4-2 of the fourth audio frame use one of the transport buckets of the transport stream in the same manner. I try to transmit.
  • the transport stream generation device of the present invention By creating schedule data to be used in common for each video frame, and using the cage rule data, the data amount of the coded video stream and the data amount of the coded audio stream multiplexed in the video frame period Is constant. Therefore, it is not necessary to perform a simulation for checking whether or not the STD buffer overflows for each frame as in the related art, so that the program can be multiplexed in real time.
  • the transport stream generating apparatus is capable of controlling the amount of data of an encoded video stream multiplexed in one video frame period and the amount of data of an encoded audio stream multiplexed in a predetermined period. It is almost constant during the period. Also
  • the data amount of the transport stream generated in one video frame period is set to be substantially constant in any video frame period.
  • the transport stream output from the transport stream generation device has a constant data amount in any frame period. Therefore, the transport stream generation device of the present invention includes a decoder STD buffer. There is no need to perform a simulation for each frame to determine whether or not a failure occurs. As a result, the transport stream generation device of the present invention can generate a transport stream at a higher speed than a device that requires a conventional simulation, and can generate the transport stream in real time. Can be generated.
  • the transport stream generation device of the present invention may be configured to multiplex a coded video stream and a coded audio stream based on a target video coding rate and a target audio coding rate. Skewed Yule data for duplication is generated. Also, when the coded video stream and the coded audio stream are multiplexed according to the created schedule data and transmitted as a transport stream to the decoding device, the SDT buffer of the decoding device fails. This is the data for performing multiplexing processing so that it does not occur. Therefore, the transport stream generating apparatus of the present invention generates such schedule data, and performs multiplexing processing according to the schedule data in all video frame periods, thereby facilitating the decoding apparatus. This prevents the SDT buffer from breaking down. In other words, the transport stream generation device of the present invention plans a new schedule for each video frame, as in the conventional device, and further performs a simulation for each video frame in accordance with the planned schedule. There is no need to perform complicated processing such as
  • the transport stream generation device of the present invention is capable of reducing the data amount of the coded video stream multiplexed in one video frame period and the data amount of the coded audio stream multiplexed in a predetermined period.
  • this schedule data is generated so that the data amount of the transport stream generated during one video frame period is substantially constant during any video frame period. . That is, the transport stream generating device of the present invention can perform multiplexing processing in real time only by performing multiplexing processing according to the schedule data so that the decoder STD buffer does not fail.

Description

明 細 書
トランスポートス トリーム生成装置おょぴその方法、 並びにプログ ラム伝送装置
技術分野
本発明は、 ビデオデータおよびオーディオデータを多重化し、 M P E Gの トランスポートス トリームを生成する トランスポート生成装置 およびその方法、 並びに複数のプログラムを伝送するプログラム伝送 装置に関する。
背景技術
近年、 M P E G 2による圧縮画像信号の伝送を採用したデジタル衛 星放送システムやケーブル放送システムが提案され、 全世界において それらのシステムが導入されつつある。 これらの放送業界の中で、 1 9 9 3年頃にョ一口ツバにおいて提案された次世代の放送方式の開発 および標準化を目的とした組織 D V B (Digital Video Broadcasting) が提案した D V B規格は、 M P E G 2をベースとしたデジタル放送に おいて現時点のデファク トスタンダートとなっている。
この D V B規格における伝送方法は、 まず、 伝送すべきプログラム に含まれるビデオデータおよびオーディオデータを符号化し、 符号化 されたビデオス ト リームおよび符号化されたオーディオス ト リームを 生成する。 次に、 この符号化されビデオス ト リームおよびオーディオ ス トリームを伝送するために、 トランスポートス トリームという形態 に変換する。 この 1つの トランスポートス ト リームとは、 符号化ビデ ォス トリームと符号化ォ一ディォス トリームを多重化したデータから 構成されるス ト リームのことである。
このような符号化ビデオス トリ一ムと符号化オーディオス トリーム が多重化された トランスポー トス トリームを生成するために、 符号化 機能おょぴ多重化機能を有した多重化装置が開発されている。 この従 来の多重化装置は、 ビデオス トリ一ムのフレーム周期とオーディオス トリームのフレーム同期に共に関係のない非同期の多重化周期を使用 して、 ビデオス トリームとオーディオス トリームとを多重化している 例えば、 第 1 3図のように、 従来の多重化装置は、 3 3 m s e cを 1ビデオフレーム周期とするビデオス トリームと、 2 4 m s e cを 1 オーディオフレーム周期とするオーディオストリームとを多重化処理 する際に、 この例えば、 ビデオフレーム周期を使用して、 ビデオス ト リームとオーディオストリームを多重化する多重化処理を行なってい た。
第 1 3図を参照して、 この従来の多重化処理について説明する。 第 1 3図に示されるように、 多重化装置の多重化処理方法は、 第 1のビ デォフレーム周期においては、 第 1のビデオフレーム期間中に符号化 された符号化ビデオス ト リーム V 1 と、 第 1のビデオフレーム期間中 に符号化された符号化オーディオス トリーム A 1および A 2を多重化 し、 第 2のビデオフレーム周期においては、 第 2のビデオフレーム期 間中に符号化された符号化ビデオス トリーム V 2と、 第 1のビデオフ レーム期間中に符号化された符号化オーディオス トリーム A 1および A 2を多重化し、 以下同じようにこのよ うな多重化処理を各ビデオフ レーム周期毎に、 繰り返していく。 その結果、 第 1 3図から理解でき るように、 第 1のビデオフレーム周期に生成された第 1のトランスポ 一トス トリームのデータ量は比較的大きく、 第 2のビデオビデオフレ ーム周期に生成された第 2の トランス T 2のデータ量は比較的小さい くなる。 つまり、 従来の多重化処理によって生成された 1 ビデオフレ ーム期間中に生成されたトランスポートストリームのデータ量は、 各 ビデオフレーム期間毎に異なっている。
このよ うな多重化処理方法を採用している従来の多重化装置は、 ビ デォス トリームおよびオーディオス トリームを受信するための受信装 置に設けられた復号器用の S T D (System Target Decoder) バッファ が破綻しないようなトランスポートス トリームを生成するためには、 各々のビデオフレーム期間において多重化のシュミ レーションと必要 とする。 この S T Dバッファは、 トランスポー トス ト リームの復号処 理およびトランスポートス トリームのセマンティクスを記述するため に使用される仮想的バッファである。
以下に従来のトランスポー トス ト リームの生成処理について、 第 1 4図のフローチヤ一トを参照して説明する。
ステップ S 1 0 0において、 第 1のビデオフレーム期間に、 ビデオ 符号器から出力された符号化ビデオス トリーム V 1およびオーディオ 符号器から出力された符号化オーディオス トリーム A 1および A 2を 受け取る。
ステップ S 1 0 1において、 第 1のビデオフレーム期間において、 実際に符号化ビデオス トリーム V 1およびオーディオス トリーム A 1 および A 2を多重化して第 1 の トランスポー トス ト リーム T 1 を生成 する前に、 まず、 ビデオス ト リーム V 1 とオーディオス ト リーム A 1 および A 2を多重化するための 1つの多重化スケジュールを計画する ステップ S 1 0 2において、 ステップ S 1 0 1において決定した多 重化スケジュールに基いて トランスポートス トリーム生成し、 そのト ランスポートス トリ一ムを復号化装置に伝送した場合に、 復号器側の ビデオ S T Dバッファおよびオーディオ S T Dバッファが破綻しない か否かをシュミ レーションする。 ステップ S I 03では、 このシュ ミ レーシヨ ンの結果、 復号器側の ビデオ S T Dバッファおょぴオーディォ S TDバッファが破綻しない か否かを判断する。 復号器側のビデオ S TDバッファおよびオーディ ォ S TDバッファが共に破綻しないと判断されると、 次のステップ S 1 04に進む。
ステップ S 1 04では、 ステップ S 1 0 1において計画した多重化 スケジュールに従って実際に、 符号化ビデオス トリーム V 1 とオーデ ィォス ト リーム A 1および A 2を多重化する。
ステップ S 1 0 5では、 多重化されたス トリームから第 1のトラン スポー トス ト リーム T 1を生成する。
一方、 ステップ S 1 0 3のシュミ レーショ ンの結果、 復号器側のビ デォ S T Dバッファおよびオーディォ S TDバッファが破綻すると判 断されると、 ステップ S 1 0 1に戻り、 ステップ S 1 0 1において、 先に計画した多重化スケジュールとは異なる別の多重化スケージユー ルを計画する。 つまり、 テツプ S 1 0 3結果が、 「YE S」 と判断さ れるまで、 このステップ S 1 0 1、 S 1 02および S 1 0 3の処理を 繰り返す。
ステップ S 1 06では、 第 2のビデオフレーム周期における トラン スポートス トリーム T 2を生成するために、 nをイ ンク リ メ ントして ステップ S 1 00に戻る。
この第 1 4図によって示された従来のトランスポート生成処理のフ ローから理解できるように、 新たな多重化スケジユーリングを計画し 、 そのスケジューリングに対応したシユミレーシヨンを行うという処 理が、 ビデオフレーム期間毎に必要であった。 なぜなら、 第 1 3図に おいて説明したように、 1つのビデオフレーム期間中に多重化される 符号化ビデオデータのデ一タ量および多重化される符号化オーディオ ス トリームのデータ量は、 個々のビデオフレーム期間の間で全く異な るからである。
さらに、 このシュミ レーシヨン処理は、 ビデオ S T Dバッファおよ びオーディオ S T Dバッファが破綻するか否かを仮想的的に判断しな ければいけないので、 このシュミ レーシヨ ンのアルゴリ ズムが非常に 複雑になり、 このシュミ レーションを行なうために多大の処理時間を 要していた。
以上のように、 従来の装置では、 トランスポートス ト リーム処理に 多大の演算時間が必要とされていたので、 供給されたプログラムをリ アルタイムで多重化伝送できないと問題があった。 特に、 近年提案さ れているようなデジタル衛星放送やデジタル地上波放送などにおいて は、 スポーツ等のライブプログラムをリアルタイムで伝送することが 要求されている。 しかし、 このような従来の装置における トランスポ 一ト生成アルゴリズムでは、 このようなライブプログラムをリアルタ ィム伝送することが特に困難であった。
発明の開示
本発明は、 このような従来の問題に鑑みてなされた発明であって、 復号装置側の S T Dバッファが破綻しないようなトランスポートス ト リームを、 リアルタイムで遅延なく生成することを目的とした発明で ある。
本発明のトランスポートス トリーム生成装置は、 1 ビデオフレーム 期間に多重化される符号化ビデオス トリームのデータ量および所定期 間に多重化される符号化オーディオス トリームのデータ量のそれぞれ 力 どのビデオフレーム期間でも略一定となるようにしている。 また 、 1 ビデオフレーム期間に生成されたトランスポー トス ト リームのデ —タ量が、 どのビデオフレーム期間でも略一定となるようにされてい る。
よって、 この トランスポー トス ト リーム生成装置から出力される ト ランスポー トス ト リームは、 どのフレーム期間においても一定のデ一 タ量となるので、 本発明のトランスポートス ト リーム生成装置は、 復 号器 S T Dバッファが破綻するか否かを判断するためのシュミレーシ ヨンを各フレーム毎に行なう必要がない。 その結果、 本発明のトラン スポー トス ト リーム生成装置は、 従来のシュミ レーショ ンを必要とす る装置に比較して高速にトランスポートス トリームを生成することが でき、 また、 さらにリアルタイムでトランスポートス トリームを生成 することができる。
また、 本発明のトランスポー トス ト リーム生成装置は、 目標ビデオ 符号化レートおよび目標オーディオ符号化レートに基いて、 符号化さ れたビデオス トリームおよび符号化されたオーディオス トリームを多 重化するためのスケージユールデータを生成するようにしている。 ま た、 このスケジュールデータは、 この作成されたスケジュールデータ に従って、 符号化ビデオス ト リームおよび符号化オーディオス ト リー ムを多重化し、 トランスポー トス ト リームとして復号装置に伝送した 場合、 復号装置の S D Tバッファが破綻しないように、 多重化処理を おこなうためのデータとなっている。 よって、 本発明のトランスポー トス トリーム生成装置は、 このようなスケジュールデータを生成し、 全てのビデオフレーム期間において、 このスケジュールデータに従つ た多重化処理を行なうことによって、 容易に、 復号装置の S D Tバッ ファが破綻することを防止している。 つまり、 本発明のトランスポー トス ト リーム生成装置は、 従来の装置のように、 各ビデオフレーム毎 に新たなスケジュールを計画し、 さらに各ビデオフレーム毎にその計 画したスケジュールに応じてシュミ レーシヨンをするといった複雑な 処理を行なう必要が一切ない。
また、 本発明のトランスポートス トリーム生成装置は、 1 ビデオフ レーム期間に多重化される符号化ビデオス ト リームのデータ量および 所定期間に多重化される符号化オーディオス ト リームのデータ量のそ れぞれが、 どのビデオフレーム期間でも略一定となり、 また、 1 ビデ オフレーム期間に生成された トランスポー トス ト リームのデータ量が 、 どのビデオフレーム期間でも略一定となるように、 このスケジユー ルデータを生成している。 つまり、 本発明のトランスポートス トリー ム生成装置は、 このスケジュールデータに従って多重化処理を行なう だけで、 リアルタイムで、 復号器 S T Dバッファが破綻しないような 多重化処理を行なうことができる。
この発明による請求項 1の発明は、 ソースビデオデータおよぴソー スオーディオデータを伝送するためのトランスポートス トリームを生 成するためのトランスポートス トリーム生成装置において、
指定されたビデオ符号化レート基いて、 ソースビデオデータを符号 化して符号化ビデオトリームを生成すると共に、 指定されたオーディ ォ符号化レートに基いてソースオーディオデータを符号化して符号化 オーディオス ト リームを生成する符号化手段と、
所定期間毎に、 符号化ビデオス トリームと符号化オーディオス ト リー ムを多重化する多重化手段と、
ビデオス トリームおよびオーディオス トリームが多重化された多重 化ス ト リームから トランスポー トス ト リームを生成する トランスポー トス トリーム生成手段と、
所定期間に多重化される符号化ビデオス トリームのデータ量および 所定期間に多重化される符号化オーディオス トリームのデータ量のそ れぞれが、 どの所定期間でも略一定となるように符号化手段、 多重化 手段およびトランスポートス トリーム生成手段を制御する制御手段と を備えたトランスポートス トリーム生成装置である。
請求項 1 1 の発明は、 ソースビデオデータおょぴソースオーディオ データを伝送するためのトランスポートス トリームを生成するための トランスポートス トリーム生成装置において、
指定されたビデオ符号化レート基いて、 ソースビデオデータを符号 化して符号化ビデオトリームを生成すると共に、 指定されたオーディ ォ符号化レートに基いてソースオーディォデータを符号化して符号化 オーディオス トリームを生成する符号化手段と、
所定期間毎に、 符号化ビデオス トリームと符号化オーディオス トリ一 ムを多重化する多重化手段と、
ビデオス トリームおよびオーディォス トリームが多重化された多重 化ス トリームから トランスポートス トリームを生成する トランスポー トストリーム生成手段と
所定期間にトランスポートス トリームとして多重化される符号化ビデ ォス トリームのデータレートおよび所定期間に多重化される符号化ォ 一ディォス トリームのデータレートが、 どの所定期間でも略一定レー トとなるように符号化手段、 多重化手段およびトランスポートストリ ーム生成手段を制御する制御手段とを備えたことを特徴とするトラン スポートス トリーム生成装置である。
請求項 2 1の発明は、 ソースビデオデータおよびソースオーディオ データを伝送するためのトランスポートス トリームを生成するための トランスポートストリーム生成装置において、
指定されたビデオ符号化レート基いて、 ソースビデオデータを符号 化して符号化ビデオトリームを生成すると共に、 指定されたオーディ ォ符号化レートに基いてソースオーディオデータを符号化して符号化 オーディオス トリ一ムを生成する符号化手段と、
所定期間毎に、 符号化ビデオス トリームと符号化オーディオス トリ ームを多重化する多重化手段と、
ビデオス トリームおよびオーディオス トリームが多重化された多重 化ス ト リームから トランスポートス トリームを生成する トランスポー トス トリーム生成手段と、
トランスポートス トリームのデータレートがどの所定期間において も一定となるように、 符号化手段、 多重化手段およびトランスポート ス トリーム生成手段を制御する制御手段とを備えたことを特徴とする トランスポートス ト リーム生成装置である。
請求項 2 2の発明は、 ソースビデオデータおよびソースオーディオ データを伝送するためのトランスポ一トス トリームを生成するための トランスポー トス ト リーム生成装置において、
指定されたビデオ符号化レート基いてソースビデオデータを符号化 しすると共に、 指定されたオーディオ符号化レートに基いてソースォ 一ディォデータを符号化する符号化手段と、
所定期間毎に符号化ビデオス トリームと符号化オーディオス トリー ムとを多重化することによって、 トランスポー トス ト リームを生成す る トランスポー トス トリーム生成手段と、
指定されたビデオ符号化レートおよび指定されたオーディオ符号化 レ一 トに基いて、 符号化されたビデオス ト リームおよび符号化された オーディオス トリームを多重化するためのスケージユールを生成する 手段を備え、 どの所定期間においても、 この多重化スケジュールに従 つた多重化処理を行なうようにトランスポートス トリーム生成手段を 制御する制御手段と
を備えたことを特徴とする トランスポートス トリーム生成装置である 請求項 2 3の発明は、 ソースビデオデータおよびソースオーディオ データから トランスポートス トリームを生成するための トランスポー トス ト リーム生成方法において、
指定されたビデオ符号化レート基いて、 ソースビデオデータを符号 化しすると共に、 指定されたオーディオ符号化レートに基いてソース オーディオデータを符号化し、
多重化される符号化ビデオス トリームのデータ量がどの所定期間で も略一定量であって、 且つ、 多重化される符号化オーディオス トリー ムのデータ量がどの所定期間でも略一定量となるように、 所定期間毎 に、 符号化ビデオス トリームと符号化オーディオス トリームを多重化 し、
符号化ビデオス トリームおよび符号化オーディオス トリ一ムが多重 化されたス トリームから トランスポートス トリームを生成することを 特徴とする トランスポートス トリーム生成方法である。
請求項 3 3の発明は、 ソースビデオデータおよびソースオーディオ データから トランスポ一トス トリームを生成するための トランスポー トス ト リ一ム生成方法において、
指定されたビデオ符号化レート基いて、 ソースビデオデータを符号 化すると共に、 指定されたオーディオ符号化レートに基いてソースォ 一ディォデータを符号化し、
多重化される符号化ビデオス トリームのデータレートがどの所定期 間でも略一定レートであって、 且つ、 多重化される符号化オーディオ ス トリームのデータレートが、 どの所定期間でも略一定レートとなる ように、 所定期間毎に、 符号化ビデオス ト リームと符号化オーディオ ス トリ一ムを多重化し、 符号化ビデオス トリームおょぴ符号化オーディオス トリームが多重 化されたトリームから トランスポートス トリームを生成することを特 徴とする トランスポートス トリーム生成方法である。
請求項 3 の発明は、 ソースビデオデータおよびソースオーディオ データを伝送するためのトランスポートス トリームを生成するための トランスポートス トリーム生成方法において、
指定されたビデオ符号化レート基いて、 ソースビデオデータを符号 化すると共に、 指定されたオーディオ符号化レートに基いてソースォ 一ディォデータを符号化し、
トランスポートス トリームのデータレートがどの所定期間においても 一定レートとなるように、 所定期間毎に符号化ビデオス トリームおよ び符号化オーディオス トリームとを多重化することによって、 略一定 レートのトランスポートス トリームを生成することを特徴とする トラ ンスポートス ト リーム生成方法である。
請求項 3 5の発明は、 ソースビデオデータおよびソースオーディオ データを伝送するためのトランスポートス トリームを生成するための 'トランスポートス トリーム生成方法において、
指定されたビデオ符号化レートおよび指定されたオーディオ符号化 レートに基いて、 符号化されたビデオス ト リ一ムおよび符号化された オーディオス トリームを多重化するためのスケージユールを生成し、 指定されたビデオ符号化レート基いてソースビデオデータを符号化 すると共に、 指定されたオーディオ符号化レートに基いてソースォー ディォデータを符号化し、
どの所定期間においても、 この多重化スケジュールに従った多重化 処理を行なうように、 符号化ビデオス ト リームと符号化オーディオス トリームとを多重化することによって、 トランスポートス ト リームを 生成することを特徴とする トランスポートス トリーム生成方法である 請求項 3 6の発明は、 ソースビデオデータおよびソースオーディオ データを符号化し、 符号化した符号化ビデオス トリームおよび符号化 した符号化オーディオス トリームをトランスポートス トリームと して 出力するためのトランスポートス トリーム生成方法において、
指定された目標ビデオ符号化レ一トおよび目標オーディオ符号化レ 一トに基いて、 1 ビデオフレーム期間中に多重化すべき符号化ビデオ ス トリームのデータ量と多重化すべき符号化オーディオス トリームの データ量を決定し、
多重化すべき符号化ビデオス トリームのデータ量と多重化すべき符 号化オーディオス トリームのデータ量に基いて、 符号化ビデオス トリ —ムと符号化オーディオス トリームを多重化するための多重化スケジ ユールを決定し、
所定の多重化処理期間の処理単位で符号化ビデオス トリームとォー ディォス トリームを多重化処理する際に、 どのビデオフレーム期間に おいても、 多重化スケージユールを使用して符号化ビデオス トリーム と符号化オーディオス トリームを多重化することによってトランスポ 一トス ト リームを出力することを特徴とする トランスポートス ト リー ム生成方法である。
請求項 3 7の発明は、 複数のプログラムを伝送するプログラム伝送 装置において、
プログラム伝送装置は、
各々のプログラムに含まれるビデオス ト リームおよびオーディオス トリームを符号化し、 符号化されたビデオス ト リームおよび符号化ォ 一ディォス トリームを多重化してトランスポートス トリームと して出 力する複数の符号化装置と、
複数の符号化装置から出力された複数のトランスポー トス ト リーム を多重化する多重化装置と、
複数の符号化装置および多重化装置をコント ロールするコントロー ラとから構成され、
符号化装置の各々は、
コントローラから指定されたビデオ符号化レートおよびオーディオ 符号化レートに基いて、 1 ビデオフレーム期間中における符号化ビデ ォス トリームと符号化オーディオス トリームとを多重化するための基 本スケジュールを生成し、
フレーム単位で符号化ビデオス トリームとオーディオス トリームを 多重化する際に、 各々のフレーム周期において、 符号器バッファのシ ユミ レーショ ンを行なわずに、 基本スケージユールに従った多重化処 理を行なうことによって、 トランスポートス トリームを生成すること を特徴とするプログラム伝送装置である。
請求項 3 8の発明は、 複数のプログラムを伝送するプログラム伝送 装置において、
プログラム伝送装置は、
各々のプログラムに含まれるビデオス トリームおよびオーディオス トリームを符号化し、 符号化されたビデオス トリームおよび符号化ォ 一ディォス トリームを多重化して トランスポートス トリームと して出 力する複数の符号化装置と、
複数の符号化装置から出力された複数のトランスポートス ト リーム を多重化する多重化装置と、
複数の符号化装置および多重化装置をコントロ一ルするコントロ一 ラとから構成され、 符号化装置の各々は、
指定されたビデオ符号化レ一トおよびオーディオ符号化レートに基 いて、 所定の多重化処理間中に多重化すべき符号化ビデオス トリーム のデータ量と多重化すべき符号化オーディオス トリームのデータ量を 決定し、
多重化すべき符号化ビデオス トリームのデータ量と多重化すべき符 号化オーディオス トリームのデータ量に基いて、 符号化ビデオス トリ ームと符号化オーディオス トリームを多重化するための多重化スケジ ユールを決定し、
所定の多重化処理期間の処理単位で符号化ビデオス トリームとォー ディォス トリームを多重化処理する際に、 各々の所定の多重化処理期 間において、 多重化スケ一ジュールを使用して符号化ビデオス トリー ムと符号化オーディオス トリームを多重化する多重化処理を行なうこ とを特徴とするプログラム伝送装置である。
図面の簡単な説明
第 1図は、 この発明が適用できるディジタル衛星放送の送信側のシ ステムを示すブロック図、 第 2図は、 送信側システムのエンコーダシ ステムのブロック図、 第 3図は、 この発明による トランスポートス ト リーム生成装置の一実施形態のブロック図、 第 4図は、 ビデオェンコ ーダの一例のブロック図、 第 5図は、 オーディオエンコーダの一例の ブロック図、 第 6図は、 ス トリーム生成の概略を示す略線図、 第 7図 は、 P E Sヘッダの構成を示す略線図、 第 8図は、 T Sヘッダの構成 を示す略線図、 第 9図は、 トランスポートス トリームの構成を示す略 線図、 第 1 0図はトランスポート生成処理を説明するためのフロ一チ ヤート、 第 1 1図 Aおよび第 1 1図 Bは、 トランスポー トス ト リーム 生成処理の詳細を説明するためのフローチヤ一ト、 第 1 2図は、 トラ ンスポ一トス トリームの生成処理のタイミングチヤ一ト、 第 1 3図は 、 従来のトランスポートス トリーム生成処理の説明に用いるタイミン グチャート、 第 1 4図は、 従来のトランスポートス ト リーム生成処理 の説明に用いるフローチャートである。
発明を実施するための最良の形態
第 1図は、 本発明を適用できるディジタル衛星放送システムの概略 を示す。 送信側には、 アーカイバ 1、 サーバ 2等のビデオ、 オーディ ォ (A V ) 情報蓄積装置が備えられる。 具体的には、 アーカイバ 1 と して、 V T Rのカートマシンが使用され、 サーバ 2 として、 ハードデ イスクからなる A Vサーバが使用される。 また、 これらのアーカイバ 1およびサーバ 2からの A V情報がルーティングスィッチャ 3に供給 され、 A V情報のスイ ッチングがなされる。 ル一ティ ングスィ ッチャ 3の出力情報が符号化システム 4に供給される。
符号化システム 4は、 ビデオ情報およびオーディオ情報を M P E G 2によりそれぞれ圧縮するビデオエンコーダ、 オーディオエンコーダ と、 各符号化出力とシステム制御用のヘッダ情報とを多重化するデー タ多重化部と、 複数チャンネルのス トリームを多重化する多重化部と 、 多重化部からの トランスポートス トリームに対してスクランブル処 理、 エラー訂正符号化処理を行う伝送路符号化部とを含む。 符号化シ ステム 4からのス トリームが変調部例えば Q S K (Quadrature Phase Shift Keying) 変調部 5に供給される。 これと共に、 受信側のものと 同様の復号器 6が設けられ、 復号器 6からモニタ用出力を得るように なされる。
Q S K変調部 5からの変調出力がァップコンバータ 7を介して送信 アンテナ 8に供給され、 送信アンテナ 8から通信衛星 1 1に対して送 信される。 符号化システム 4では、 ビデオ情報、 オーディオ情報等の 多重化と共に、 複数チャンネルの多重化も行われる。 それによつて、 一つの周波数帯域幅に複数チャンネルの番組を多重化できる。 第 1図 は、 6チャンネルを多重化する場合を示している。
送信側システムのアーカイバ 1、 サーバ 2、 符号化システム 4は、 イーサネッ ト(ether- net) 等の L A N 9により結合されている。 そし て、 LAN 9に結合されたコンピュータ 1 0 a、 1 0 b、 1 0 cによ つて、 送信側システムの運用が管理される。
通信衛星 1 1により配信されるディジタル衛星放送の番組は、 家庭 の受信システム 1 2によって受信される。 受信システム 1 2には、 受 信アンテナ 1 3と接続されたセッ ト トップボックス 1 4およびテレビ ジョ ン受信機 1 5が含まれる。
セッ ト トップボックス 1 4内には、 送信側の構成と対応して、 QP S K復調部、 エラー訂正回路、 デスクランブル回路、 ビデオデコーダ 、 オーディオデコーダ等が含まれている。 復号されたビデオデータ、 オーディオデータ、 付加的データがテレビジョ ン受信機にて再生され る。
第 2図は、 符号化システム 4の構成の一例である。 2 1 , 、 2 12 、 · . · 、 2 1 η は、 ηチャンネノレの各チャンネノレの トランスポー ト ス トリーム生成装置を示す。 各トランスポートス トリーム生成装置は 、 ビデオデータ、 オーディオデータ、 プライベートデータ (付加的デ ータ) が供給され、 これらのデータを MP E G 2によって符号化する 。 ビデオデータを符号化する時に、 コンピュータ 2 5からの目標符号 化ビデオレート (例えば番組の内容に応じたレート) が与えられ、 そ れに応じて、 符号化レートが制御可能とされている。 複数チャンネル の トランスポ一トス トリ一ム生成装置 2 1 , 、 2 12 、 . · · 、 2 1 n の出力データがデータ多重化部 22にて多重化される。 データ多重 化部 22は、 スクランブル、 エラー訂正符号化等の伝送路符号化部を 含む。 データ多重化部 2 2の出力が Q S K変調部に対して出力される データ多重化部 2 2には、 各チャンネル毎に E P G (Electronic Pr ograra Guide)システム、 C A (Conditional Access)システム 23力 ら の情報が供給される。 符号化システム 4は、 イーサネッ ト等の LAN 24を介して結合されたコンピュータ 2 5によって管理される。
トランスポー トス ト リーム生成装置 2 1! 、 2 12 、 · · ·、 2 1 n のそれぞれは、 例えば第 3図に示す構成とされている。 簡単のため に以下の説明では、 1チャンネル分のデータを多重化する例について 説明する。 第 3図において、 3 1がビデオエンコーダ、 3 2がオーデ ィォエンコーダである。 映画のビデオデータに付随するサブタイ トル データを符号化するエンコーダを設けることもある。 ェンコ一ド済み サブタイ トルデータは、 エンコード済みのビデオデータあるいはェン コード済みのオーディオデータに比べ、 データ量が極端に少なく、 C PUバスを介して伝送しても、 C PUパスのデータ トラフィックに影 響を与えないので、 問題が生じることはない。
ビデオエンコーダ 3 1は、 スィ ッチャ等の外部機器 (第 1図参照) から入力される映像データを、 例えば MP EG 2方式により圧縮符号 化する。 ビデオエンコーダ 3 1からのビデオエレメンタリス トリーム がバッファメモリ と しての符号器 F I F O (First In First Out)バッ ファ 3 3に供給される。
オーディオエンコーダ 3 2は、 外部機器から入力されるオーディオ デ一タを、 例えば MP EG 2方式により圧縮符号化し、 所定の長さの オーディオフレームごとに等しいデータ量のオーディオス トリームを 生成し、 符号器 F I FOバッファ 34に対して出力する。 MP EG 2 オーディオのレイヤー 2では、 1 1 52サンプルを 1オーディオフレ ームとして符号化、 復号がなされる。 サンプリング周波数としては、 4 8 kHz, 44. 1 kHz, 3 2 k Hzまたはその他の周波数を使用でき る。 従って、 各サンプリ ング周波数に対応して、 1オーディオフレー ムが 24ms、 26. Iras, 36msとなる。 オーディオエンコーダ 3 2 からのオーディオエレメンタリス トリームの伝送レートも固定レート 例えば 3 84 k [bit/s] である。
また、 プライべ一トデータ用のメモリ として RAM 3 5が設けられ ている。 符号器 F 1 ?0バッファ 3 3、 34および RAM3 5から出 力されるス ト リームがスィツチ回路で表されるマルチプレクサ 3 6の 入力端子 a、 b、 cにそれぞれ供給される。 マルチプレクサ 36で選 択されたス トリームがスィツチ回路で表されたマルチプレクサ 3 7の 一方の入力端子 dに供給される。 マルチプレクサ 3 7で選択されたス トリームが F I FOバッファ 38を介してトランスポートス トリーム T Sとして出力される。
第 3図に示すトランスポートス トリーム生成装置は、 エレメ ンタリ ス ト リームの多重化の制御のために、 C PU 3 9と、 この C PU 3 9 と C PUバスを介して結合された R AM40、 4 1 と、 データサイズ 計数用インタ一フェース 42、 43と、 イーサネッ トインターフエ一 ス 44、 シリアルインターフェース 45とが設けられている。 イーサ ネッ トィンタ一フェース 44およびシリァルインターフェ一ス 4 5を 介してプライべ一トデータ 1およびプライべ一トデータ 2が C PUバ ス上に供給される。 プライベートデータは、 サブタイ トル、 付加ォー ディォ情報、 テキス ト情報、 ユーザデータ等である。
マルチプレクサ 3 6は、 C P U 3 9からのコントロール信号の制御 に従って、 入力端子 a , b, cのいずれかを選択し、 これらの入力端 子のそれぞれに入力されるエレメンタリス トリームのいずれかを選択 する。 マルチプレクサ 3 6で多重化されたス トリームが供給されるマ ルチプレクサ 37も、 C PU 3 9からのコントロール信号で制御され る。
なお、 マルチプレクサ 3 6は、 入力端子のいずれにも入力されるェ レメンタリス トリームがない場合、 あるいは、 スタッフイング処理を 行う場合等は、 入力端子 a , b, cのいずれをも選択せず、 所定のブ ランクデータ (連続した論理値 1または 0) を出力する。
マルチプレクサ 3 7は、 コントロール信号の制御に従って、 入力端 子 d, eのいずれかを選択し、 入力端子 dからのエレメンタリス トリ ームと、 入力端子 eからのヘッダデータ (T Sパケッ トヘッダまたは P E Sパケッ トヘッダ) を選択して多重化し、 F I FOバッファ 38 に対して出力する。
F I F Oバッファ 3 8は、 マルチプレクサ 3 7が多重化したデ一タ ス トリームをバッファリングし、 トランスポートス トリーム T Sとし て複数チヤンネルのス トリームを多重化するための多重化部等の外部 機器 (図示せず) に対して出力する。
必要に応じて、 マルチプレクサ 3 7からのトランスポートス トリー ムを、 ハードディスク装置、 光磁気ディスク装置等の蓄積装置に出力 して、 記録するようにしても良い。
データサイズインターフェース 42および 43は、 ビデオェンコ一 ダ 3 1およびオーディオエンコーダ 3 2から入力されるビデオス ト リ ームおよびオーディオス ト リームのフレームまたはフィールドごとの データサイズを計数し、 C PUバスを介して C PU 3 9に対して供給 する。 プライベートス ト リームのデータ量は、 C PU 3 9が分かって いるので、 プライべ一トス ト リームに関してのデータサイズインタ一 フェースは不要である。
なお、 データサイズの計数は、 データサイズインターフェース 4 2 、 4 3ののそれぞれに内蔵されたカウンタにより行われる。 また、 デ ータサイズの計数は、 ビデオエンコーダ 3 1およびオーディオェンコ ーダ 3 2が出力する各エレメ ンタ リ ス ト リームのフレームごとのデー タサイズを、 データサイズインターフェース 4 2および 4 3自身が検 出することによっても可能である。
イーサネッ トインターフェース 4 4は、 イーサネッ ト等の L A N ( 図示せず) を介して入力されてく るプライべ一トデータ 2を受け入れ 、 C P Uバスを介して C P U 3 9に対して出力する。 シリアルインタ 一フェース 4 5は、 例えばコンピュータから入力されるシリアル形式 のプライべ一トデータ 1を受け入れ、 C P Uバスを介して C P U 3 9 に対して出力する。
C P U 3 9は、 例えば、 マイク口プロセッサおよびプログラム格納 用の R〇Mおよびこれらの周辺回路から構成され、 トランスポートス トリーム生成装置が所望の動作を行うように、 トランスポートス トリ ーム生成装置を制御する。 具体的には、 C P U 3 9は、 例えばビデオ エンコーダ 3 1のビッ ト レー ト制御回路に対して目標ビデオ符号化レ 一トを供給する。
また、 C P U 3 9は、 制御データ用 R AM 4 0に記憶された制御デ ータを用いて、 P C R (program clock reference)の情報を含むァダ プテーションフィ一ルドおよび P E S (Packetized Elementary Strea ra)パケッ トヘッダの内容を生成する。 生成されたヘッダは、 処理用 R A M 4 1に記憶された後、 マルチプレクサ 3 7の入力端子 eおよびそ の出力端子を介して出力される。 このように、 マルチプレクサ 3 6に よって、 エレメンタ リス ト リームの多重化がされ、 マルチプレクサ 3 7によって P E Sバケツ トヘッダおよび T Sバケツ トへッダが付加さ れる。 その結果、 第 3図のトランスポートス トリーム生成装置は、 ェ レメンタリス トリームから P E Sバケツ トと T Sバケツ トへの変換の 両者を行っている。
また、 C PU 3 9は、 データサイズインターフェース 4 2および 4 3、 イーサネッ トインタ一フェース 44、 シリアルインターフェース 45から入力されるデータサイズ、 および符号器 F I FOバッファ 3 3、 34の残り記録容量 (バッファ残量) などに基づいて、 多重化す るエレメ ンタ リ ス トリームの順番、 各エレメンタ リス トリームの多重 化データ量などを決定し、 その決定に基づいてマルチプレクサ 36、
3 7を制御する。 この時に多重化のタイミング調整なども行う。
処理用 RAM 40は、 上述したような処理を C PU 3 9が行う際に
、 取り扱うデータ量等を記憶するメモリである。 具体的には、 例えば
C P U 3 9で生成されたヘッダがこの RAM 40に記憶され、 この R AM40からマルチプレクサ 3 7の入力端子 eに対して出力され、 ト ランスポー トス ト リーム上に挿入される。
また, C P U 3 9がデータサイズインターフェース 4 2、 4 3等力 ら読み込んだ符号化データ量のデータや、 イーサネッ トインターフエ ース 44またはシリアルインターフェース 4 5を介して入力されたプ ライべートデータ等が処理用 RAM40に一旦記憶され、 C PU 3 9 における処理に供される。
また、 後述する C P U 3 9における多重化データ量の決定の処理に 用いられる多重化残存データ量 frame— bit 一 remain などの値も処 理用 R AM40に記憶され、 保持される。
制御データ用 RAM 4 1は、 C P U 3 9の処理にかかわる制御用デ ータを記憶するメモリである。 制御データ用 RAM 4 1には、 例えば ヘッダデータの作成に関連する制御データ、 スケジュールデータ等が 記憶される。
ビデオエンコーダ 3 1は、 第 4図に示す構成とされている。 すなわ ち、 入力ビデオデータとローカル復号ビデオデータの差分を演算する 減算回路 5 1 と、 減算回路 5 1の出力を D C T変換する D C T回路 5 2と、 DCT回路 5 2からの係数データを量子化する量子化回路 5 3 と、 量子化回路 5 3の出力を可変長符号化 (VL C) する可変長符号 化回路 54と、 可変長符号化回路 54の一定レー トの出力として取り 出すためのバッファメモリ 5 5 とが設けられる。 可変長符号化回路 5 4の発生データ量の情報がビッ ト レート制御回路 5 6に供給され、 量 子化スケールが制御される。 それによつて、 発生データ量の制御がな される。 また、 逆量子化回路 5 7、 逆 DCT回路 5 8、 加算回路 5 9 およびフレームメモリ 6 0からなるローカル復号部が設けられる。
さらに、 図示を省略されているが、 動き検出部が設けられ、 動き検 出部によって、 マクロブロック単位の動きベク トルが検出される。 こ の動きべク トルに基づいて、 フレームメモリ 6 0が制御され、 動き補 償がなされる。
なお、 MP EGの場合では、 ピクチャタイプが 3種類ある。 すなわ ち、 フレーム内符号化画像である I (Intra) ピクチャと、 フレーム間 前方向予測符号化画像である P (Predictive)ピクチャと、 双方向予測 画像である B (Bidirectionally predictive)ピクチャとがある。 この ピクチャタイプと同様に、 マクロブロックタイプが 3種類ある。 すな わち、 フレーム内符号化(Intra) マクロブロックと、 過去から未来を 予測する前方向(Foward)フレーム間予測マクロブロックと、 未来から 過去を予測する後方向(Backwrd) フレーム間予測マクロブロックと、 前後両方向から予測する内挿的(Interpolative) マクロブロックとが ある。
I ピクチャ内の全てのマクロブロックは、 フレーム内符号化マク口 ブロックである。 また、 Pピクチャ内には、 フレーム内符号化マクロ ブロックと前方向フレーム間予測マクロブロックとが含まれる。 Bピ クチャ内には、 上述した 4種類の全てのタイプのマクロブロックが含 まれる。 これらのマクロブロックタイプに応じて、 ローカル復号デ一 タが形成され、 また、 予測符号化の場合に、 減算回路 5 1において差 分が演算され、 フレーム内符号化の場合では、 差分が演算されず、 入 力ビデオデータが減算回路 5 1の出力に現れる。
上述したトランスポートス トリーム生成装置の C P U 3 9は、 ビデ ォエンコーダ 3 1 のビッ トレート制御回路 5 6に対して目標データ量 video— rate— targetを供給する。 ビッ トレート制御回路 5 6は、 可 変長符号化回路 5 4が実際に生成したビデオエレメンタリス ト リーム のデータ量に基づいて、 圧縮符号化後のデータ量が、 設定された目標 データ量 vi deo— rate— targetと等しくなるように量子化回路 5 3を 制御する。
オーディオエンコーダ 3 2は、 第 5図に示すように、 サブバン ド分 析フィルタバンク (S A F B ) 6 1、 線形量子化回路 6 2、 ビッ ト圧 縮回路 6 3、 F F T (Fast Fourier Transfer ) 回路 6 4、 心理聴覚 モデル 6 5、 動的ビッ ト割り当て回路 6 6、 スケールファクタ選択情 報記憶回路 6 7、 スケールファクタ抽出回路 6 8、 サイ ド情報符号化 回路 6 9およびビッ トス トリーム生成回路 7 0から構成される。 オーディオエンコーダ 3 2は、 外部機器から入力されたオーディオ データを、 M P E G 2方式により圧縮符号化し、 オーディオス トリー ムを生成し、 符号器 F I F Oバッファ 3 4およびデータサイズィンタ 一フェース 4 3に対して出力する。 上述した本発明の一実施例において、 トランスポートストリーム生 成装置は、 ビデオエレメンタリス トリーム、 オーディオエレメンタリ ス トリームおよびプライべ一トエレメンタリス トリームを多重化し、
M P E G 2のトランスポートストリームを生成する。 この多重化処理 について以下に説明する。
最初にス ト リームについて説明する。 ここでは、 符号化されたビデ ォストリームからトランスポートストリームを生成するためのストリ ーム変換方法について説明する。 但し、 ビデオス トリームとオーディ ォス ト リームとは同じス トリーム変換を行なっているので、 ここでは ビデオス ト リームの変換についてのみ説明する。
第 6図に示すように、 ソースビデオデータを、 M P E G 2方式によ つて符号化する場合には、 数枚のビデオフレームを 1 G O P (Group Of Picture) として定義し、 G O P単位でソースビデオデータを圧縮 符号化するようになされている。 その際、 G O Pのピクチャのうち少 なく とも 1つを I ピクチャとし、 残るピクチャを P又は Bピクチャと している。 I ピクチャとは、 フレーム内符号化により圧縮符号化した ピクチャであり、 Pピクチャとは I ピクチャ又は他の Pピクチャから のフレーム間予測符号化により圧縮符号化したピクチャであり、 Bピ クチャとは、 前後のピクチャからの双方向フレーム間予測符号化によ り圧縮符号化したピクチャである。
第 6図に示すように、 M P E G 2の規格に基いて符号化された符号 化ビデオス トリ一ムのデータ量は、 各ビデオフレームが I ピクチャ、 Bピクチャ、 Pピクチャ等のピクチャタイプに応じて異なると共に、 動き補償の有無に応じても異なってくる。 従って、 1 ビデオフレーム 期間にビデオエンコーダから出力される符号化ビデオス トリ一ムのデ ータ量は、 必ずしも一定ではない。 この符号化された符号化ビデオス トリームは、 一般にはエレメンタ リース ト リーム (E S) と呼ばれる。 この符号化ビデオス ト リーム V 1、 V 2、 V 3および V 4は、 第 6図に示すように、 その先頭にへッ ダを付加することにより P E S (Packetized Elementary Stream) パ ケッ ト化される。
さらにこの P E Sバケツ トのデータは、 1 84バイ ト毎に分割され 、 その先頭に 4 [byte] のトランスポートパケッ トヘッダ (T Sへッ ダ) を付加することにより伝送用のトランスポートバケツ トに変換さ れる。
第 7図に示すように、 P E Sパケッ トは、 P E Sパケッ トの開始を 示す 24 〔bit 〕 のパケッ ト開始コードと、 P E Sパケッ トの実デー タ部分に収容されるス トリームデータの種別 (例えばビデオや音声等 の種別) を示す 8 [bit 〕 のス ト リーム I Dと、 以降に続くデータの 長さを示す 1 6 [bit 〕 のバケツ ト長と、 値 「 1 0」 を示すコードデ ータと、 各種フラグ情報が格納されるフラグ制御部と、 コンディショ ナル ' コーディング部のデータの長さを示す 8 [bit の P E Sへッ ダ長と、 P T S (Presentation Time Stamp ) と呼ばれる再生出力の 時間情報や DT S (Decoding Time Stamp ) と呼ばれる復号時の時刻 管理情報、 或いはデータ量調整のためのスタッフイングバイ ト等が格 納される可変長のコンデショナル · コーディング部とによって構成さ れる。
第 8図に示すように、 T Sパケッ トは、 4バイ トの T Sヘッダ部と 、 1 84バイ トの実データが記録されるペイロード部とから構成され る。 T Sヘッダ部は、 T Sパケッ トの開始を示す 8 [bit 〕 の同期バ イ トと、 パケッ ト内におけるビッ トエラーの有無を示す誤り表示部 ( エラー ' インジケータ部) と、 P E Sパケッ トの先頭がこの T Sパケ ッ ト内に存在するか否かを示すュニッ ト開始表示部と、 この T Sパケ ッ トの重要度を示すトランスポート ·パケッ ト · プライオリティ部と
、 この T Sバケツ トのペイロード部に収容されているス トリ一ムデー タの種別を示すバケツ ト識別情報 P I Dが格納される P I D部と、 ぺ イロ一ド部に収容されるス トリームデータにスクランブルが施されて いるか否かを示すスクランブル制御部と、 この T Sバケツ ト内にァダ プテーション · フィールド部およびペイロード部が存在するか否かを 示すァダプテーシヨン · フィールド制御部と、 同じバケツ ト識別情報 P I Dを持つ T Sバケツ トが途中で棄却されたか否かを示す巡回力ゥ ンタ情報が格納される巡回カウンタ部と、 各種制御情報が格納される ァダプテーシヨン · フィールド部とによって構成される。
またァダプテーション · フィールド部は、 当該ァダプテーション · フィール ド部の長さを示すァダプテーション · フィールド長と、 この
T Sバケツ トに続く同じス ト リームの T Sパケッ トで時間情報がリセ ッ トされているか否かを示す不連続表示部と、 この T Sパケッ トがラ ンダム · アクセスのエントリーポイントであるか否かを示すランダム ァクセス表示部と、 この T Sパケッ トのペイロー ド部にス ト リームデ ータの重要部分が格納されているか否かを示すス トリーム優先表示部 と、 コンディショナル · コーディング部に関するフラグ情報が格納さ れるフラグ制御部と、 P C R (Program Clock Reference ) と呼ばれ る基準時間情報や O P C R (Original Program Clock Reference) と 呼ばれる基準時間情報、 或いはデータの差し替え点までの指標を示す スプライス · カウントダウン等の情報が格納されるコンデイショナル • コーディング部と、 データ量調整のためのスタッフイングバイ ト部 とによって構成される。 次に、 第 9図を参照して、 本発明の トランスポートス トリーム生成 装置において使用されている トランスポートス トリームの構造につい て説明する。
この第 9図は、 本発明の特徴となる多重化スケジュールを使用して 、 符号化ビデオス トリーム、 符号化オーディオス トリームをおよびそ の他のデータを多重化することによって生成されたトランスポ一トス トリームを示した図である。 このトランスポートス トリームは、 PA T (Program Association Table ) つ—タ、 PMT (Program Map Ta ble ) データ、 P CR (Program Clock Reference ) データ、 符号化 ビデオス トリーム、 符号化オーディオス トリーム、 プライベートデー タおよび NU L Lデータ等を伝送するための複数のトランスポートパ ケッ トから構成されている。
まず、 このトランスポートス ト リームとして伝送される各種のデー タについて説明する。
PMT (Program Map Table ) は、 プログラムを構成するビデオス トリームおよびオーディオス トリームがそれぞれ格納されている T S バケツ トのバケツ ト識別情報 P I Dを示す情報である。.例えばプログ ラム番号 「X」 のビデオス ト リームはパケッ ト識別情報 P I Dが 「X V」 の T Sパケッ トとして伝送され、 オーディオス トリームは、 パケ ッ ト識別情報 P I Dが 「XA」 の T Sパケッ トとして伝送されるので 、 PMTによって、 そのバケツ ト識別情報 P I D 「XV」 および 「X A」 を管理しておく ことによって、 プログラム番号 「X」 のビデオス トリームおよびオーディオス トリームが伝送されたトランスポートパ ケッ トを識別することができる。
PMTは、 8ビッ トのテーブル I D (table ID) 、 1 ビッ トのセク シヨン ' シンタクスインジケータ (section syntax indicator) 、 2 ビッ トの 「0」 リザーブ (reserved) データ、 1 2ビッ トのセクショ ン長 (section length) 、 1 6ビッ 卜のプログラム番号 (program nu raber) 、 2ビッ トのリザーブ (reserved) 、 5ビッ トのバージョン番 号 (version number) 、 1 ビッ トのカレント · ネクス トインジケータ (current next indicator) 、 8ビッ 卜のセクション番号 (section number) 、 8ビッ 卜の最終セクション番号 (last section number ) 、 3ビッ トのリザーブ (reserved) 、 1 3ビッ トの P CR (Program Clock Reference ) および P I D (PCR PID ) 、 4ビッ トのリザーブ (reserved) 、 1 2ビッ 卜のプログラム情報長 (program info lengt h ) 、 数ビッ トのディスクリプタ (descriptor) 、 8ビッ トのス トリ —ム ♦ タイプ (stream type ) 、 3ビッ 卜のリザーブ (reserved) 、 1 3ビッ トのエレメンタリ P I D (elementary PID) 、 4ビッ トのリ ザーブ (reserved) 、 1 2ビッ トの E S情報長 (ES info length) 、 数ビッ トのディスク リプタ (descriptor) および 3 2ビッ トの CRC (CRC ) のデータから構成される。 従って、 ディスクリプタに数 1 0 バイ トのユーザデータを記述したとしても、 PMTのデータサイズは 2 5バイ ト程度となる。
PAT (Program Association Table ) は、 各プログラム毎に生成 された PMTが格納されている T Sバケツ トのバケツ ト識別情報 P I Dを示す情報である。
PATは、 MP EG 2で規定されたテーブルの種別を示す 8ビッ ト のテーブル I D (Identifier) 、 1 ビッ トのセクション ' シンタクス ィンジケータ、 1 ビッ トの 「 0」 データ、 2ビッ トのリザーブ、 1 2 ビッ トのセクション長、 1 6 ビッ トの トランスポートス トリーム ( T S) I D、 2ビッ トのリザーブ、 5ビッ トのバージョン番号、 1 ビッ トのカレント · ネクス トインジケータ、 8ビッ トのセクション番号、 8ビッ トの最終セクション番号、 1 6 ビッ トのプログラム番号、 3 ビ ッ トのリザーブ、 1 3ビッ 卜のネッ トワーク P I D、 又は 1 3ビッ ト のプログラム · マップ p I Dおよび 3 2ビッ トの C R C (Cyclic Red undancy Check ) から構成されている。 従って、 この PATのデータ サイズは 1 6バイ ト程度となる。
P CR (Program Clock Reference ) とは、 時刻基準となる S T C (System Time Clock ) の値を符号器側で意図したタイミングにセッ トするための情報であって、 実データ 4 2ビッ トを含む 6バイ トのデ ータから構成される。
プライベートデータとは、 MP E G 2においては特に規定されてい ない、 任意のユーザーデータであって、 一般的には、 個々のプロダラ に対して付与された固有の E P G (エレク トリ ックプログラムガイ ド ) データや字幕データ等がこのプライべ一トデータとして伝送される 。 これらのプライベートデータは、 PAT、 PMTおよび P CRデー タと同じように数パイ ト又は数十バイ トから成るデータである。
NU L Lデータとは、 1 ビデオフレーム期間中に伝送される トラン スポ一トス トリームの伝送レートが常に一定になるように、 挿入され るダミーデータであって、 プライベートデータと同じように、 数バイ ト又は数十パイ 卜から成るデータである。
なお、 この第 9図に記載されたトランスポートス トリームは、 コン ピュータ 2 5からビデオェンコーダ 3 1に供給された目標ビデオ符号 化レート ( target —video 一 rate [bit/s]) 力 S 4 M [bit/s]であつ て、 コンピュータ 2 5からオーディオエンコーダ 3 2に供給された目 標オーディオ符号化レート ( target — audiop— rate [bit/s]) が 3 84 K [bit/s] の場合の例であって、 その場合に生成された多重化 スケジュールデータに基いて生成されたトランスポートス トリームで ある。
次に、 本発明の特徴であるこの多重化スケジュールデータの生成方 法について、 第 9図を参照して説明する。
本発明のトランスポートス トリーム生成装置は、 先に説明した P C R、 PAT、 PMT、 符号化ビデオス ト リーム、 符号化オーディオス トリームおよびプライべ一トデータの多重化処理を行なう前に、 まず 、 これらの様々なデータを 1 ビデオフレーム期間に多重化するための スケジュールデータを生成することが特徴である。 ここで述べた多重 化のためのスケジュールデータとは、 1 ビデオフレーム期間に、 これ らのさまざまなデータを伝送するためにいくつのトランスポ一トパケ ッ トを使用し、 これらの個々のデータを伝送するために何番めのトラ ンスポ一トバケツ トを使用するかを定義するためのデータである。 以下に、 この多重化シュケジュールデータを生成する具体的な方法 について説明する。 まず、 この多重化スケジュールデータを生成す るためには、 1 ビデオフレーム期間に伝送される トランスポー トパケ ッ トの数を求めなければいけない。 以下にこの トランスポートバケツ トの数を求めるための方法について説明する。
先に説明したように、 PATデータ、 PMTデータ、 P CRデータ は、 数バイ トから数十バイ トのデータであるので、 1 トランスポート バケツ トの基本単位である 1 84バイ ト以上を超えることなない。 従 つて、 本発明のトランスポート生成装置では、 これらの PATデータ 、 PMTデータ、 P C Rデータを伝送するために使用される トランス ポートパケッ トを、 それぞれ 1 トランスポートパケッ トとして定義し ている。
また、 プライベートデータおょぴ NUL Lデータは、 PATデータ 、 PMTデータ、 P C Rデータと同じように、 数バイ トから数十バイ トのデータであるので、 1 トランスポートパケッ トの基本単位である
1 8 4バイ ト以上を超えることなない。 従って、 これらのプライべ一 トデータおよび NU L Lデータを伝送するために使用される トランス ポートバケツ トは、 それぞれ 1 トランスポートバケツ トで十分である 。 しかし、 本発明のトランスポートス トリーム生成装置は、 ユーザが 任意の多くのプライべ一トデータを伝送できるように、 これらのブラ ィペートデータおよび NUL Lデータを伝送するために使用される ト ランスポートパケッ トを、 それぞれ 2 トランスポートパケッ トとして 定義している。
次に符号化ビデオス トリームを伝送するために必要なトランスポー トバケツトの数を求める。
コンピュータ 2 5からビデオエンコーダ 3 1に供給された目標ビデ ォ符号化レート (target— video —rate [bit/s]) 、 4 M[bit/s] である場合を例にあげて説明する。
NT S C方式のビデオス トリ一ムのフレーム周波数 (frame ― fre quency [Hz] ) は、 1ノ 2 9. 9 7 [Hz]であるので、 コンピュータ 2 5から供給された目標ビデオ符号化レート (target— video —rate [ bit/s]) が 4M [bit/s]である場合には、 1ビデオフレーム期間にビ デォエンコーダ 3 1から出力される符号化ビデオス トリームのデータ 量 (size一 frame ― video [byte] ) は、
size一 frame 一 video [byte]
= target― video 一 rate [bit/ s] X frame ― frequency [Hz] / 8 [bit]
= 4 0 0 0 0 0 0/2 9. 9 7/8
= 1 6 6 8 3. 3 5 [byte]
である。 つまり、 1 ビデオフレーム期間あたり、 ビデオエンコーダ 3 1から 1 6 6 8 3 . 3 5バイ トの符号化ビデオス ト リームが出力され、 この 出力されたス トリームが符号器 F I F Oバッファ 3 3に供給される。 しかし、 符号化ス トリームをバッファリングするための F I F Oバッ ファ 3 3からは、 1バイ ト単位でしか符号化ビデオス ト リームを読み 出すことができないので、 1ビデオフレームあたり、 0 . 3 5バイ ト データが符号器 F I F Oバッファ 3 3に残ってしまう。 つまり、 1 ビ デォフレーム期間あたり、 この符号器 F I F Oバッファ 3 3には 1 6 6 8 3 . 3 5バイ トのス ト リームが供給され、 この符号器 F I F Oバ ッファ 3 3から 1 6 6 8 3バイ トのデータが読み出されるので、 1 ビ デォフレーム毎に 0 . 3 5バイ トの残存データが蓄積され、 結果的に 、 この符号器 F I F Oバッファ 3 3がオーバーフローしてしまう。 本発明のトランスポートス トリーム生成装置では、 この符号器 F I F Oバッファ 3 3がオーバ一フローしないように、 符号器 F I F Oバ ッファ 3 3に残った残存データに応じて、 各ビデオフレーム毎に、 こ の符号器 F I F Oバッファ 3 3から 1 6 6 8 3バイ トの符号化ビデオ データを出力するか 1 6 6 3 4バイ トの符号化ビデオデータを出力す るかを決定している。
次に、 この 1 6 6 8 3バイ トのデータの符号化ビデオス ト リームを 伝送するためには、 どのく らいの数のトランスポートパケッ トを必要 とするかを求める。 1つのトランスポートパケッ トには、 1 8 4パイ トのデータが入るので、 1 ビデオフレーム期間にビデオエンコーダ 3 1から出力された 1 6 6 8 3バイ トの符号化ビデオス トリ一ムのデ一 タ苴 size一 frame ― video [byte]は、
size― rrame ― video [bytej
= 1 6 6 8 3 [byte] = 1 8 4 [byte] X 9 0 [packet] + 1 2 3 [byte] と表わすことができる。 つまり、 この式から、 1 ビデオフレーム期間 中に出力された 1 6 6 8 3バイ トの符号化ビデオス トリームを伝送す るためには、 9 0個のトランスポートバケツ トが必要であることが理 解できる。
同じように、 この 1 6 6 8 4パイ トのデータの符号化ビデオス トリ ームを伝送するためには、 どのく らいの数のトランスポートバケツ ト を必要とするかを求める。 1 ビデオフレーム期間にビデオエンコーダ 3 1から出力された 1 6 6 8 4バイ トの符号化ビデオス トリームは、 s ize― frame 一 video [byte]
= 1 6 6 8 4 [byte]
= 1 8 4 [byte] X 9 0 [packet] + 1 2 4 [byte] と表わすことができる。 つまり、 この式から、 1 ビデオフレーム期間 中に出力された 1 6 6 8 4バイ トの符号化ビデオス トリームを伝送す るためには、 1 6 6 8 3バイ トの符号化ビデオス ト リームを伝送する ときと同じように、 9 0個のトランスポートバケツ トが必要であるこ とが理解できる。
つまり、 1 ビデオフレーム期間中にビデオエンコーダ 2 4の出力段 に設けられた符号器 F I F Oバッファ 3 3から出力された符号化ビデ ォス トリームが、 1 6 6 8 3バイ ト又は 1 6 6 8 4パイ トのいずれの 場合であっても、 符号化ビデオス トリームは、 9 0個の トランスポー トバケツ トを使用して伝送される。
次に符号化オーディオス トリームを伝送するために必要なトランス ポートバケツ トの数を求める。
コンピュータ 2 5からオーディオエンコーダ 3 2に供給された目標 オーディオ符号化レート ( target audio rate [bi t/s] ) 力 、 3 8 4 K [bit/s]である場合を例にあげて説明する。
NT S C方式のビデオス トリームのフレーム周波数 (frame ― fre quency [Hz] ) 力 S、 1 / 2 9. 9 7 [Hz] であるので、 目標オーディ ォ符号化レー ト ( target —audio 一 rate [bit/s]) が、 3 8 4 K [ bit/s]である場合には、 1ビデオフレーム期間にオーディオェンコ一 ダ 3 2の符号器から出力される符号化オーディオス トリームのデータ 直 (size一 frame 一 audio [byte] ) は、
size一 rrame ― audio [byte」
= target一 audio ― rate [bit/s] X frame一 frequency [Hz] Z8 [ bit]
- 3 8 4 0 0 0 / 2 9. 9 7 / 8
= 1 6 0 1 . 6 0 1 6 [byte]
である。
つまり、 1ビデオフレームあたり、 オーディオエンコーダ 3 2から 1 6 0 1 . 6 0 1 6バイ トの符号化オーディオス ト リームが出力され 、 符号器 F I F Oバッファ 3 4にバッファ リ ングされる。 しかし、 符 号器 F I F Oバッファ 3 3と同じように、 符号器 F I F Oバッファ 3 からは、 1バイ ト単位でしか符号化オーディオストリームを読み出 すことができないので、 1ビデオフレームあたり、 0. 6 0 1 6バイ トデータが符号器 F I F Oバッファ 3 4に残ってしまう。 つまり、 こ の符号器 F I F Oバッファ 3 4に 1 ビデオフレーム毎に 0. 6 0 1 6 バイ 卜の残存データが蓄積され、 結果的に、 この符号器 F I F Oバッ ファ 3 4がオーバーフローしてしまう。
本発明のトランスポ一トス トリーム生成装置では、 符号化オーディ ォス ト リームをバッファリングするための符号器 F I F Oバッファ 3 4がオーバーフローしないように、 符号器 F I F〇バッファ 3 4に残 つた残存データに応じて、 各ビデオフレーム毎に、 1 6 0 1バイ トの オーディオ符号化データを出力するか 1 6 0 2バイ トのデータを出力 するかを決定している。
次に、 1 6 0 1バイ トの符号化オーディォス トリームを伝送するた めには、 何個のトランスポートパケッ トが必要であるかを求める。 1 トランスポートバケツ トとして伝送されるデータのサイズは、 1 8 4 バイ トであるので、 1 6 0 1バイ トの符号化オーディオス トリームは size. _ frame ― audio [byte]
= 1 6 0 1 [byte]
= 1 8 4 [byte] X 8 [packet] + 1 2 9 [byte] と表わすことができる。 従って、 この 1 6 0 1バイ トの符号化オーデ ィォス トリームは、 8個のトランスポートバケツ トを使用して伝送す ることができる。
同じように、 1 6 0 2バイ トの符号化オーディオス ト リームを伝送 するためには、 何個のトランスポートパケッ トが必要であるかを求め る。 1 トランスポートパケッ トとして伝送されるデータのサイズは、 1 8 4バイ トであるので、 1 6 0 1バイ トの符号化オーディオス トリ ームは、
size― frame 一 audio [byte]
= 1 6 0 2 [byte]
= 1 8 4 [byte] X 8 [packet] + 1 3 0 [byte] と表わすことができる。 従って、 この 1 6 0 2バイ トの符号化オーデ ィォス ト リームは、 1 6 0 1パイ トの符号化オーディオス トリームの 時と同じように、 8個のトランスポートパケッ トを使用して伝送する ことができる。 つまり、 1ビデオフレーム期間中にオーディオエンコーダ 3 2から 出力された符号化オーディオス トリームが、 1 6 0 1バイ ト又は 1 6 0 2バイ トのいずれの場合であっても、 符号化オーディオストリーム は、 8個のトランスポートパケッ トを使用して伝送される。 なお、 上式に基いて、 1 ビデオフレーム期間中に出力された 1 6 0 1又は 1 6 0 2パイ トの符号化オーディオス トリームを 8個のトランスポート バケツトを使用して伝送した場合には、 1 2 9パイ ト又は 1 3 0バイ 卜のオーディオデータが伝送ざれずに符号器 F I F Oバッファ 3 4に 残ることになる。 本発明のトランスポートス トリーム生成装置では、 この残った 1 2 9バイ ト又は 1 3 0バイ トのオーディオデータは、 次 のビデオフレーム期間に伝送されるようにしている。
以上の説明から、 コンピュータ 2 5から供給された目標ビデオ符号 化レートおよび目標オーディオ符号化レートが、 4 M [bit/s]および 3 8 4 K [bit/s] である場合には、 符号化ビデオス ト リームを伝送る ために必要なトランスポートパケッ トのサイズは、 9 0パケッ トであ つて、 符号化オーディオス トリームを伝送するために必要なトランス ポートパケッ トのサイズは、 8パケッ トである。
しかし、 D B V規格では、 符号化されたビデオス ト リームおよび符 号化オーディオストリ一ムをトランスポートストリームに変換する際 に、 1 9バイ トの P E Sヘッダや T Sパケッ トヘッダのァダプテーシ ョンブイールド等の付加的な情報が追加されるので、 トランスポート ス トリームに変換されたビデオス トリームおよびオーディオス トリー ムのデータ量は、 ビデオエンコーダ 3 1およびオーディオエンコーダ 3 2から出力されたときの符号化ビデオストリームおよび符号化ォー ディォス ト リームのデータ量より増えることになる。
本発明のトランスポー トス トリーム生成装置は、 これらの付加情報 によってデータが増加ることを考慮して、 コンピュータ 2 5から供給 された目標ビデオ符号化レートおよび目標オーディオ符号化レートが 、 4 M [bit/s]および 3 8 4 K [bit/s] である場合には、 符号化ビデ ォス トリームを伝送るために必要なトランスポートバケツ トのサイズ を、 9 1パケッ トとし、 符号化オーディオス ト リームを伝送するため に必要なトランスポートパケッ トのサイズを、 9パケッ トとしている 以上の説明から理解できるように、 コンピュータ 2 5から供給され た目標ビデオ符号化レートおよび目標ビデオ符号化レートから、 1 ビ デォフレーム期間中に、 P C Rデータを伝送するために必要なトラン スポートパケッ トの数、 P A Tデータを伝送するために必要なトラン スポートバケツ トの数、 P M Tデータを伝送するために必要なトラン スポートバケツ トの数、 符号化ビデオス トリームを伝送するために必 要な トランスポー トバケツ トの数、 符号化オーディオス トリームを伝 送するために必要なトランスポー トパケッ トの数、 およびプライベー トデータを伝送するために必要なトランスポー トバケツ トの数を決定 することができる。
以上の説明から理解できるように、 コンピュータ 2 5から供給され た目標ビデオ符号化レートおよび目標オーディオ符号化レートが、 4 M [bit/s]および 3 8 4 K [bit/s] である場合には、 符号化ビデオス トリームを伝送するために必要なトランスポートバケツ ト数は 「 9 1 」 であって、 符号化オーディオス ト リームを伝送するために必要なト ランスポートパケッ ト数は Γ 9」 であって、 P C R、 P A Tおよび P M Tデータを伝送するためのトランスポ一トバケツ ト数は、 それぞれ 「 1」 であって、 プライベートデータおよび N U L Lデータを伝送す るために必要な トランスポートパケッ ト数はそれぞれ 「 2」 である。 従って、 1 ビデオフレーム期間中に伝送される 1 トランスポートス ト リームに含まれる総トランスポー トパケッ ト数 (tolal — size— frara e 一 transport)は、
tolal 一 size— frame 一 transport = 1 + 1 + 1 + 9 1 + 9 + 2 + 2
= 1 0 7
となる。
なお、 上述した例は、 コンピュータ 2 5から供給された目標ビデオ 符号化レートおよび目標オーディオ符号化レートカ 4M [bit/s]およ び 3 8 4 K[bit/s] と指定された例であって、 本発明のトランスポ一 ト生成装置は、 この指定された目標ビデオ符号化レートおよび目標ォ 一ディォ符号化レートに限らず、 どのような値を有する目標ビデオ符 号化レートおよび目標オーディオ符号化レートが指定されても良い。 その場合には、 上述した例に対して、 符号化ビデオス ト リームを伝送 するために必要なトランスポートバケツ ト数と、 符号化オーディオス トリ一ムと伝送するために必要な トランスポートバケツ ト数とが異な つてくるだけである。
次に、 それぞれ 1 トランスポートバケツ トの P CRデータ、 PAT データおょぴ PMTデータ、 9 1 トランスポー トバケツ トの符号化ビ デォス ト リーム、 9 トランスポー トバケツ トの符号化オーディオス ト リーム、 それぞれ 2 トランスポートバケツ トのプライべ一トデータお よび NU L Lデータを、 どのように多重化するかを説明する。
本発明のトランスポー トス ト リーム生成装置は、 PATデータ、 P MTデータ、 P CRデータ、 符号化ビデオス ト リーム、 符号化オーデ ィォス ト リーム、 プライべ一トデータおよび NU L Lデータの順で、 それらのデータを多重化することによって、 トランスポー トス トリー ムを生成している。 具体的には、 第 9図のように、 1 0 7個のトランスポートス トリー ムのうち、 第 1のトランスポートパケッ トは、 PATデータを伝送す るためのトランスポートバケツ トと して使用し、 第 2のトランスポー トバケツ トは、 PMTデータを伝送するためのトランスポー トバケツ トとして使用し、 第 3のトランスポー トパケッ トは、 P CRデータを 伝送するためのトランスポートパケッ トとして使用する。 次の、 第 4 から第 49 トランスポートバケツ トは、 符号化ビデオス トリ一ムの約 半分のデータを伝送するために使用し、 第 50から第 54の トランス ポートバケツ トは、 符号化オーディオス トリームの約半分のデータを 伝送するために使用している。 また、 第 5 5のトランスポートバケツ トは、 プライべ一トデータの半分のデータを伝送するために使用し、 第 5 6のトランスポートパケッ トは、 NUL Lデータの半分のデ一タ を伝送するために使用している。
同じように、 第 5 7から第 1 0 1のトランスポートバケツ トは、 符 号化ビデオス トリームの残り半分のデータを伝送するために使用し、 第 1 0 2から第 1 05の トランスポートバケツ トは、 符号化オーディ ォス トリームの残り半分のデータを伝送するために使用している。 ま た、 第 1 06のトランスポートバケツ トは、 プライべ一トデータの残 り半分のデータを伝送するために使用し、 第 1 0 7のトランスポート パケッ トは、 NUL Lデータの残り半分のデータを伝送するために使 用している。
C PU 3 9は、 この第 9図のように、 PATデータ、 PMTデータ 、 P CRデータ、 符号化ビデオス ト リーム、 符号化オーディオス ト リ ーム、 プライベートデータおよび NU L Lデータが多重化されるよう に、 本発明の特徴であるスケジュールデータを生成する。 つまり、 こ のスケージユールデータとは、 1 0 7個のトランスポー トス ト リーム のうち、 第 1、 第 2および第 3のトランスポートパケッ トとして、 P ATデータ、 PMTデータおよび P CRデータをそれぞれ伝送し、 次 の、 第 4から第 49 トランスポートバケツ トとして、 符号化ビデオス トリームの約半分のデータを伝送し、 第 50から第 54のトランスポ ートパケッ トとして、 符号化オーディオス ト リームの約半分のデータ を伝送し、 第 5 5のトランスポートパケッ トとして、 プライべ一トデ ータの半分のデータを伝送し、 第 5 6のトランスポートパケッ トとし て、 NUL Lデータの半分のデータを伝送し、 第 5 7から第 1 0 1の トランスポートパケッ トとして、 符号化ビデオス トリームの残り半分 のデータを伝送すし、 第 1 02から第 1 05のトランスポートバケツ トとして、 符号化オーディオス トリ一ムの残り半分のデータを伝送し 、 第 1 06のトランスポートパケッ トとして、 プライべ一トデータの 残り半分のデータを伝送し、 第 1 0 7のトランスポートパケッ トとし て、 NUL Lデータの残り半分のデータを伝送するという多重化制御 を行なうためのデータである。
なお、 符号化ビデオス トリームと符号化オーディオス トリームを、 1 ビデオフレーム期間に対応する トランスポートス トリームにおいて 、 2回に分割して伝送している理由は、 復号器ビデオバッファおよび 復号器オーディオバッファを破綻しにく くするためである。
また、 第 9図に示ししたように、 PATデータ、 PMTデータ、 P CRデータ、 符号化ビデオス ト リーム、 符号化オーディオス ト リーム 、 プライべ一トデータおよび NUL Lデータをこの順で伝送するよう にしたが、 本発明のトランスポー トス ト リームは、 この伝送順に限ら れるものではない。 例えば、 P C Rデータと PATデータの伝送順が 逆であっても良いし、 符号化ビデオス ト リームと符号化オーディオス トリ一ムの伝送順が逆であってもよい。 また、 符号化ビデオス トリー ムと符号化オーディオストリームを 2回に分けて伝送するようにした 力 s、 より復号器ビデオバッファおよび復号器オーディオバッファがを 破綻しにく くするために、 分割回数を 3回および 4回に設定しても良 レ、。
次に、 第 1 0図のフローを参照して、 トランスポー トス ト リーム生 成処理の C PU 3 9の動作に関して説明する。
ステップ S 1 0において、 C PU 3 9は、 フレーム変数 「 n」 を 「 1」 にリセッ トする。 このフレーム変数 「n」 は、 フレームの番号を 表わす変数である。
ステップ S 1 1おいて、 C PU 3 9は、 コンピュータ 2 5から目標 ビデオ符号化レート ( target —video —rate [bit/s]) と、 オーデ ィォ符号化レート ( target —audio —rate [bit/s]) を受け取る。 この目標ビデオ符号化レートは、 各プログラムに含まれるビデオデー タを符号化するための各符号化装置に対してそれぞれ割当てられるデ ータである。 この目標ビデオ符号化レートは、 動きの多いビデオプロ グラムには比較的高い符号化レートが割当てられ、 動きの少ないビデ ォプログラムには比較的低い符号化レー卜が割当てられるように、 各 プログラムのビデオデータの複雑度 (Difficulty) に応じて統計的に 算出されたデータである。 オーディオ符号化レートは、 予め規格化さ れた複数の符号化レートから選択された固定のレー トであるので、 ュ 一ザが任意のレ一 トを勝手に設定することはできない。 次に、 ステ ップ S 1 2において、 C PU 3 9は、 指定された目標ビデオ符号化レ 一トおよび目標オーディオ符号化レートに基いて、 符号化ビデオスト リームと符号化ビデオス トリームとを多重化するための多重化スケジ ユールデータを生成する。 目標ビデオ符号化レートおよび目標オーデ ィォ符号化レートが 4M [bit/s]および 3 84 K[bit/s] である場合 を例にあげて説明したように、 このスケージュ一ルデータとは、 1 0 7個のトランスポートス ト リームのうち、 第 1、 第 2および第 3のト ランスポートパケッ トとして、 PATデータ、 PMTデータおよび P CRデータをそれぞれ伝送し、 次の、 第 4から第 49 トランスポー ト バケツ トとして、 符号化ビデオス トリームの約半分のデータを伝送し 、 第 50から第 54のトランスポートパケッ トとして、 符号化オーデ ィォス トリームの約半分のデータを伝送し、 第 5 5のトランスポート パケッ トとして、 プライベートデータの半分のデータを伝送し、 第 5 6のトランスポートパケッ トとして、 NU L Lデータの半分のデータ を伝送し、 第 5 7から第 1 0 1のトランスポー トパケッ トとして、 符 号化ビデオス トリームの残り半分のデータを伝送すし、 第 1 02から 第 1 0 5のトランスポートバケツ トとして、 符号化オーディオス トリ ームの残り半分のデータを伝送し、 第 1 06の トランスポートバケツ トとして、 プライベートデータの残り半分のデータを伝送し、 第 1 0 7のトランスポートパケッ トとして、 NU L Lデータの残り半分のデ ータを伝送するという多重化制御を行なうためのデータである。
C PU 3 9は、 この生成されたスケジュールデータを、 制御データ 用の R AM4 1に記憶する。
ステップ S 1 3では、 C PU 3 9は、 ステップ S 1 2において作成 されたスケジュールデータに従って、 符号化ビデオス ト リームおよび 符号化オーディオス トリームを多重化したトランスポートス トリーム を生成し、 このトランスポートス トリームを符号器側に伝送した場合 に、 復号器側のビデオ S T Dバッファおよぴオーディォ S T Dパッフ ァに残ったデータがどのように推移するかをシュミレーションする。 ステップ S 1 4では、 C PU 24 2は、 ステップ S 1 3によって行 われたシュミ レショ ン結果に基いて、 復号器側のビデオ S TDバッフ ァおよびオーデ オ S TDバッファ共に破綻しないか否かを判断する 。 この多重化スケジュールに従って多重化したときに、 ビデオ S TD ノくッファおよびオーディォ S T Dバッファ共に破綻しないと判断され ると、 ステップ S 1 5に進む。
一方、 ステップ S 14のシユミ レーシヨ ンの結果、 復号器側のビデ ォ S TDバッファ又はオーディオ S TDバッファが破綻すると判断さ れると、 ステップ S 1 2に戻り、 先に作成された多重化スケジュール データとは異なる別の多重化スケ一ジュールデータを作成する。 例え ば、 先に計画した多重化スケジュールデータが、 第 9図のように、 1 トランスポートス ト リーム内において符号化ビデオス ト リームと符号 化オーディオス トリームを 2分割するように多重化するためのデータ であったとすると、 新たに作成する別の多重化スケジュールデータは 、 符号化ビデオス トリームと符号化オーディオス トリームを 3分割す るように多重化するためのデータであってもよい。 ステップ S 1 4の 結果が、 「YE S」 と判断されるまで、 このステップ S 1 2、 S 1 3 および S 1 4の処理を繰り返す。
ステップ S 1 5では、 C PU 3 9は、 ユーザからソースビデオデ一 タおよびソースオーディオデータを符号化する符号化処理が指定され たか否かを判断する。
ステップ S 1 6では、 C PU 3 9は、 R AM 4 1に記憶されたスケ ジュールデータに従って、 P CRデータ、 PATデータ、 PMTデー タ、 符号化ビデオス トリーム、 符号化オーディォス トリ一ム、 プライ ベートデータおよび NU L Lデータを多重化するための多重化処理を 行なう。
ステップ S 1 7では、 C PU 3 9は、 P CRデータ、 PATデータ 、 PMTデータ、 符号化ビデオス トリーム、 符号化オーディオス トリ —ム、 プライべ一トデータおよび N U L Lデータ等の様々なデータが 多重化されたス トリームから トランスポートス トリームを生成する。 ステップ S 1 8では、 C P U 3 9は、 フレーム変数 「n」 をインク リメントして、 ステップ S 1 6に戻り、 次のビデオフレーム期間に関 する処理を行なう。
つまり、 C P U 3 9は、 実際に多重化処理 (ステップ S 1 6 ) を行 なう前に、 多重化スケジュールデータを生成 (ステップ S 1 2 ) し、 その多重化スケジュールデータに基いて、 各ビデオフレーム毎に多重 化処理 (ステップ S 1 6 ) およびトランスポート生成処理 (ステップ S 1 7 ) を行なうように各回路を制御している。 よって、 本発明のト ランスポートス トリーム生成装置は、 従来の装置のように各ビデオフ レーム期間毎に多重化のためのスケジュールを生成する必要は無く、 多重化スケジュールデータを一度だけ生成するようにしている。 その 結果、 トランスポートス トリームを生成するための処理時間を飛躍的 に向上させることができ、 ライブビデオプログラムを遅延無く伝送す ることが可能になった。
次に、 第 1 0図のフローチャートの多重化処理 (ステップ S 1 6 ) について、 第 1 1図のフローチャートを参照してより詳しく説明する 。 第 1 1図は、 作図スペースの関係で、 第 1 1図 Aおよび第 1 1図 B に分割されている。 この第 1 1図は、 このステップ S 1 6をより詳し く説明するためのフローチヤ一トである。
ステップ S 1 6 0 0では、 分割変数 「 i」 を 「 1」 にセッ トする。 この分割変数とは、 1 ビデオフレーム期間に、 符号化ビデオス トリー ムおよび符号化オーディオス トリームを何回分割するかを示すための データである。 第 9図に示した例は、 この分割変数 「 i」 は 「 2」 で ある。 ステップ S I 6 0 1では、 C PU 3 9は、 RAM 4 1に記憶された スケジュールデータに従って、 PATデータ、 PMTデータおよび P CRデータをそれぞれ出力するように、 第 1の トランスポートバケツ トから第 3の トランスポー トバケツ トに対応する期間、 マルチプレク サ 3 6の端子を cに切り換える。 つまり、 このようにスイッチングす ることによって、 第 1のトランスポートバケツ 卜に対応する期間には 、 PATデータが多重化され、 第 2のトランスポートパケッ トに対応 する期間には、 PMTデータが多重化され、 第 3のトランスポートパ ケッ トに対応する期間には、 P CRデータが多重化される。
ステップ S 1 60 2では、 C PU 3 9は、 ビデオエンコーダ 3 1に よって符号化された符号化ビデオス ト リームの、 1フィールドあたり のデータ量 (field —bit 一 size [bit] ) を、 ビデオエンコーダ 3 1 からインターフェース 4 2を介して受け取る。
ステップ S 1 60 3では、 C P U 3 9は、 符号器 F I F Oバッファ 3 3にバッファリングされている トータルのデータ量を求める。 具体 的には、 ビデオエンコーダ 3 1力 nフレーム期間 (現在フレーム期 間) において、 符号器 F I FOバッファ 3 3が符号化ビデオス トリー ムをバッファ リングした結果、 符号器 F I FOバッファ 3 3のトータ ルのデータ量がどれだけになつたかを求める。 n— 1フレーム期間 ( 過去フレーム期間) において、 符号器 F I FOバッファ 3 3に残って いた残存ビデオデータのデータ量を frame —bit —remain [bit]とす ると、 この符号器 F I FOバッファ 3 3のトータルのデータ量を fram e —bit 一 total [bit] は、
frame 一 bit ― total [bit]
= field― bit ― size [bit] X 2 + frame― bit 一 remain [bit] となる。 ステップ S I 6 04では、 C PU 3 9は、 RAM 4 1に記憶された スケジュールデータに従って、 第 4から第 4 9 トランスポートバケツ トとして出力する符号化ビデオス トリームを出力するように、 第 4の トランスポートバケツ トから第 4 9のトランスポートバケツ トに対応 する期間、 マルチプレクサ 3 6の端子を aに切り換える。 つまり、 こ のようにスィツチングすることによって、 第 4のトランスポートパケ ッ トから第 4 9のトランスポートバケツ トに対応する期間にわたって 、 符号器 F I F Oバッファ 3 3から符号化ビデオデータが出力される 。 なお、 この第 4の トランスポー トパケッ トから第 4 9の トランスポ 一トバケツ トに対応する期間に、 符号器 F I FOバッファ 3 3から出 力された符号化ビデオデータのサイズ out —video —size [bit]は、 out 一 video 一 size [bit] = 4 6ノヽ0ケッ ト X 1 8 4ノ ィ ト X 8 ビッ h
= 6 77 1 2ビッ ト
となる。
ステップ S 1 6 0 5では、 C PU 3 9は、 符号器 F I F Oバッファ 3 3に残っている残存符号化ビデオデータのデータ量を算出する。 ス テツプ S 1 6 04の処理によって符号器 F I F Oバッファ 3 3にバッ ファリングされていた符号化ビデオデータを読み出したので、 符号器 F I F Oバッファ 3 3に残っている残存符号化ビデオデータのデータ 量 frame —bit —remain [bit]は減少している。 従って、 この残存符 号化ビデオデータのデータ量 frame —bit —remain [bit]は、 frame ― bit 一 remain [bit」
= frame一 bit ― total [bit] ― out ― video 一 size [bit] となる。
ステップ S I 6 0 6では、 C P U 3 9は、 オーディオエンコーダ 3 2によって符号化された符号化オーディオス トリームの、 1フィール ドあたりのデータ量 (field —bit —size [bit]) を、 オーディオェ ンコーダ 3 2からインターフェースを介して受け取る。
ステップ S 1 60 7では、 C PU 3 9は、 オーディオエンコーダ 3 2が nフレーム期間において、 符号器 F I FOバッファ 34が符号化 オーディオス トリームをバッファリ ングした結果、 符号器 F I F Oバ ッファ 34のトータルのデータ量がどれだけになつたかを求める。 n _ 1フレーム期間 (過去フレーム期間) において、 符号器 F I FOパ ッファ 34に残っていた残存オーディオデータのデータ量を frame ― bit —remain [bit]とすると、 この符号器 F I F Oバッファ 34の ト 一タルのオーディオデータ量 frame 一 bit —total [bit] は、 frame ― bit 一 total [bit]
= field 一 bit 一 size [bit] X 2 + frame一 bit ― remain [bit] となる。
ステップ S I 608では、 C PU 3 9は、 RAM 4 1に記憶された スケジュールデータに従って、 第 50から第 54 トランスポートパケ ッ トとして出力する符号化オーディォス ト リームを出力するように、 第 50の トランスポー トバケツ トから第 54の トランスボー トバケツ トに対応する期間、 マルチプレクサ 36の端子を bに切り換える。 つ まり、 このようにスイッチングすることによって、 第 50のトランス ポートパケッ トから第 54のトランスポートバケツ トに対応する期間 にわたつて、 符号器 F I FOバッファ 34から符号化オーディオス ト リームが出力される。 なお、 この第 50のトランスポートパケッ トか ら第 54の トランスポー トバケツ トに対応する期間に、 符号器 F I F Oバッファ 34から出力された符号化オーディオデータのサイズ out audio size [Dit]は、 out 一 audio —size [bit] = 5ノ ケッ ト X 1 84ノくィ ト X 8ビッ ト
= 736 0ビッ ト
となる。
ステップ S 1 609では、 C PU 3 9は、 符号器 F I FOバッファ 34に残っている残存符号化オーディォデータのデータ量 frame — bi t —remain [bit]を求める。 ステップ S 1 608の処理によって符号 器 F I FOバッファ 34にバッファリングされていた符号化オーディ ォデータを読み出した結果、 符号器 F I FOバッファに残存している 残存オーディオデータのデータ量が減る。 従って、 この残存符号化ォ 一ティオアータのデータ量 frame 一 bit —remain [bit]は、
frame ― bit 一 remain [bit]
= rrarae― it 一 total [bit] ― out ― audio ― size [bit] となる。
ステップ S I 6 1 0では、 CPU 3 9は、 RAM 4 1に記憶された スケジュールデータに従って、 プライべ一トデータをそれぞれ出力す るように、 第 55のトランスポートバケツ トに対応する期間、 マルチ プレクサ 3 6の端子を cに切り換える。 つまり、 このようにスィッチ ングすることによって、 第 5 5のトランスポートバケツ トに対応する 期間には、 プライベートデータが多重化される。
ステップ S 1 6 1 1では、 C P U 39は、 RAM 4 1に記憶された スケジュールデータに従って、 NU L Lデータをそれぞれ出力するよ うに、 第 5 6のトランスポートパケッ トに対応する期間、 マルチプレ クサ 36の端子を cに切り換える。 つまり、 このようにスイッチング することによって、 第 56のトランスポートパケッ トに対応する期間 には、 NU L Lデータが多重化される。 このように、 NUL Lデータ を多重化することによって、 トランスポートス トリームのデータ量は 、 各ビデオフレームにおいて一定となる。
ステップ S 1 6 1 2では、 C PU 3 9は、 RAM 4 1に記憶された スケジュールデータに従って、 第 5 7から第 1 0 1 トランスポートパ ケッ トとして出力する符号化ビデオス ト リームを出力するように、 第 5 7のトランスポートパケッ トから 1 0 1のトランスポートバケツ ト に対応する期間、 マルチプレクサ 3 6の端子を aに切り換える。 つま り、 このようにスイッチングすることによって、 第 5 7のトランスポ ートバケツ トから第 1 0 1の トランスポー トバケツ トに対応する期間 にわたつて、 符号器 F I FOバッファ 3 3から符号化ビデオデータが 出力される。 なお、 この第 5 7のトランスポートパケッ トから第 1 0 1の トランスポートバケツ トに対応する期間に、 符号器 F I FOパッ ファ 3 3から出力された符号化ビデオデータのサイズ out —video ― size [bit]は、
out —video —size [bit] = 45ノ ケッ ト X 1 84バイ ト X 8ビッ 卜
= 6 6 240ビッ ト
となる。
ステップ S 1 6 1 3では、 C P U 3 9は、 符号器 F I F Oバッファ 3 3に残っている残存符号化ビデオデータのデータ量を表わすデータ frame —bit —remain [bit]を新たに更新する。 なぜなら、 ステップ S 1 6 1 2の処理によって符号器 F I FOバッファ 3 3にバッファリ ングされていた符号化ビデオデータを読み出したので、 符号器 F I F Oバッファ 3 3に残っている残存符号化ビデオデータのデータ量 fram e —bit —remain [bit]が減少するからである。 ステップ S 1 6 1 2 の処理を行なう前に符号器 F I F〇バッファ 3 3に残っていた残存符 号化ビデオデータのデータ量は、 ステップ S 1 6 0 5において求めた 符号器 F I FOバッファ 3 3に残っている残存符号化ビデオデータの データ量 frame —bit —remain [bit]によって求められているので、 この新しく更新される残存符号化ビデオデータのデータ量 frame — bi t 一 remain [bit]は、
irame ― bit —remain [bit]
= frame一 bit ― remain [bit]― out 一 video ― size [bit] となる。
ステップ S I 6 1 4では、 C PU 3 9は、 RAM 4 1に記憶された スケジュールデータに従って、 第 1 0 2から第 1 0 5のトランスポー トパケッ トとして出力する符号化オーディオス トリームを出力するよ うに、 第 1 0 2の トランスポー トパケッ トから第 1 0 5の トランスポ 一トバケツ トに対応する期間、 マルチプレクサ 3 6の端子を bに切り 換える。 つまり、 このようにスイッチングすることによって、 第 1 0 2の トランスポートバケツ トから第 1 0 5の トランスポートバケツ ト に対応する期間にわたって、 符号器 F I F Oバッファ 3 4から符号化 オーディオデータが出力される。 なお、 この第 1 0 2の トランスポー トバケツ トから第 1 0 5のトランスポートバケツ トに対応する期間に 、 符号器 F I FOバッファ 3 4から出力された符号化オーディオデー タのサイズ out 一 audio 一 size [bit]は、
out 一 audio 一 size [bit] = 4パケッ ト x l 84バイ ト X 8ビッ ト
= 5 8 8 8 ビッ ト
となる。
ステップ S 1 6 1 5では、 C P U 3 9は、 符号器 F I F Oバッファ 3 4に残っている残存符号化オーディオデータのデータ量を表わす ame —bit —remain [bit]を新たに更新する。 なぜなら、 ステップ S 1 6 1 4の処理によって符号器 F I FOバッファ 34にバッファリン グされていた符号化オーディオデータを読み出したので、 符号器 F I F〇バッファ 34に残存している残存オーディオデータのデータ量 fr arae —bit —remain [bit]が減するからである。 ステップ S I 6 1 4 の処理を行なう前に符号器 F I FOバッファ 34に残っていた残存符 号化ビデオデータのデータ量は、 ステップ S 1 6 0 9において求めた 符号器 F I FOバッファ 3 4に残っている残存符号化オーディオデー タのデータ量 frame —bit —remain [bit]によって求められているの で、 その結果、 この新たに更新される残存符号化オーディオデータの データ量 i'rarae 一 oit 一 remain [bit]は、
frame 一 bit 一 remain [bit]
= frame― bit ― total [bit] 一 out ― audio 一 size [bit] となる。
ステップ S I 6 1 6では、 C PU 3 9は、 RAM 4 1に記憶された スケジュールデータに従って、 残りのプライべ一トデータをそれぞれ 出力するように、 第 1 0 6の トランスポートバケツ トに対応する期間 において、 マルチプレクサ 3 6の端子を cに切り換える。 つまり、 こ のようにスィツチングすることによって、 第 1 0 6のトランスポート パケッ トに対応する期間には、 残りのプライベートデータが多重化さ れる。
ステップ S 1 6 1 7では、 C P U 3 9は、 RAM 4 1に記憶された スケジュールデータに従って、 残りの NU L Lデータをそれぞれ出力 するように、 第 1 0 7のトランスポートバケツ トに対応する期間、 マ ルチプレクサ 3 6の端子を cに切り換える。 つまり、 このようにスィ ツチングすることによって、 第 1 0 7のトランスポートバケツ トに対 応する期間には、 残りの N U L Lデータが多重化される。 このように 、 N U L Lデータを多重化することによって、 トランスポートス トリ ームのデータ量は、 各ビデオフレームにおいて一定となる。
ステップ S 1 6 1 8では、 分割変数 i をインク リ メ ン ト して、 ステ ップ S 1 6 1 9に進む。
ステップ S 1 6 1 9では、 分割変数 iが指定された分割回数である ときには、 ステップ S 1 7に戻り、 分割変数 iがまだ指定された分割 回数に至らないときには、 ステップ S 1 6 1 2に戻る。 第 1 2図に示された例を参照して、 この多重化スケジュールに基い たトランスポートス トリームの生成方法を概念的に説明する。
ビデオエンコーダ 3 1から出力された符号化ビデオス トリ一ムのデ ータ量が多い場合には、 その符号化ビデオス ト リームは、 1つの トラ ンスポ一 トス ト リームと して多重化されるのでは無い。 例えば、 第 1 のビデオフレーム期間に生成された第 1の符号化ビデオス トリームは 、 6 7 7 1 2 ビッ トの第 1のス ト リーム部分 V 1— 1 と、 6 6 2 4 0 ビッ トの第 2のス ト リーム部分と、 その残りの第 3のス ト リーム部分 に V 1 _ 3に分けられて多重化処理される。 第 1のス ト リーム部分 V 1— 1のサイズが 6 7 7 1 2ビッ トとされた理由は、 先に説明したス ケジユーリングデータに基いて、 この第 1のス ト リーム部分 V 1— 1 を、 第 1 の トランスポー トス ト リーム T 1の前半の 4 6個の トランス ポートパケッ ト (6 7 7 1 2ビッ ト) を使用して伝送するためである 。 また、 同じように、 第 2のス ト リーム部分 V 1— 2のサイズが 6 6 2 4 0ビッ トとされた理由は、 このスケジユーリングデータに基いて 、 この第 2のス ト リーム部分 V 1— 2を、 第 1の トランスポー トス ト リーム T 1の後半の 4 5個の トランスポー トパケッ ト ( 6 6 2 4 0 ビ ッ ト) を使用して伝送するためである。
第 1のトランスポートス トリ リーム T 1のビデオストリームを伝送 するための 9 1個の トランスポ一 トス ト リームは、 第 1のス ト リ一ム 部分 V 1— 1および第 2のス トリーム部分 V 1 一 2を伝送するために 使用されるので、 第 3のス ト リーム部分 V 1— 3を伝送するために第 1の トランスポー トス ト リーム T 1 の トランスポー トバケツ トは使用 することができない。 本発明のトランスポートス トリーム生成装置で は、 この第 3のス ト リーム部分 V 1— 3第 1の トランスポー トス ト リ —ム T 1 として伝送するのでは無く、 第 2のトランスポートストリー ム T 2の前半の 4 6個のトランスポートバケツ トの幾つかを使用して 伝送するようにしている。
また、 第 2のビデオフレーム期間の第 1 のス トリーム部分 V 2— 1 は、 第 1のビデオフレーム期間の第 3のストリーム部分 V 1 — 3と一 緒に、 第 2の トランスポ一 トス ト リーム T 2の前半の 4 6個の トラン スポートバケツ トを使用して伝送される。 つまり、 第 2のビデオフレ ーム期間において、 1つ前のビデオフレーム期間 (第 1のビデオフレ ーム期間) に伝送されずに符号器 F I F Oバッファ 3 3に残っていた 、 第 3のス ト リーム部分 V 1— 3のデータサイズと、 第 2のビデオフ レーム期間においてバッファに新しく記憶された第 1のス トリーム部 分 V 2 - 1のデータサイズを合わせると、 丁度、 6 7 7 1 2ビッ トと なる。 同じようにして、 第 2のビデオフレーム期間の第 2のス トリ ーム部分 V 2— 2と第 3のビデオフレーム期間の第 1のス ト リーム部 分 V 3— 1 とを、 第 2のトランスポートストリームの後半の 4 5個の トランスポートバケツ トを使用して伝送する。
次に、 オーディオス ト リームに関して説明する。
まず、 第 1 のオーディオフレーム期間中にオーディオエンコーダか ら出力された第 1 の符号化オーディオス ト リームは、 7 3 6 0 ビッ ト の第 1のス ト リーム部分 A 1 _ 1 と、 残りの第 2のス ト リーム部分 A 1 _ 2とに分けられて伝送される。 第 1 のス ト リーム部分 A 1— 1 の サイズが 7 3 6 0ビッ トとされた理由は、 先に説明したスケジユーリ ングデータに基いて、 この第 1 のス トリーム部分 A 1— 1を、 第 1 の トランスポー トス ト リーム T 1 の前半の 5個の トランスポー トバケツ ト (7 3 6 0ビッ ト) を使用して伝送するためである。
第 1のトランスポートス トリ リーム T 1のオーディオス トリームを 伝送するための 9個のトランスポートバケツ トのうちの前半の 5個の トランスポー トパケッ トは、 第 1 のス ト リーム部分 A 1— 1を伝送す るために使用されるので、 残りの第 2のス トリーム部分 A 1— 2は、 後半の 5個のトランスポートバケツ トを使用して伝送される。
また、 第 2のオーディオフレームの第 1のス トリーム部分 A 2 - 1 は、 第 1 のオーディオフレームの残りである第 2のス トリーム部分 A 1— 2 と同じように、 後半の 5個のトランスポートパケッ トを使用し て伝送する。 従って、 第 1のオーディオフレームの残りである第 2の ス ト リ一ム部分 A 1— 2のデータ量と、 第 2のオーディオフレームの 第 1のス トリ一ム部分 A 2— 1のデータ量を合わせると、 4個の トラ ンスポートパケッ トのデータ量 (5 8 8ビッ トに) になる。
同じように、 第 2のオーディオフレームの第 2のス ト リーム部分 A 2— 2、 第 3のオーディオフレームの第 1およぴ第 2のス ト リーム部 分 A 3— 1 、 A 3 _ 2、 第 4のオーディオフレームの第 1および第 2 のス ト リーム部分 A 4— 1 、 A 4— 2についても、 同じようにトラン スポ一 トス ト リームのいずれかの トランスポー トバケツ トを使用して 伝送するようにしている。
以上のように、 、 本発明のトランスポートス トリーム生成装置は、 各ビデオフレームにおいて共通で使用するスケジュールデータを作成 し、 そのスケージユールデ一タを使用することによって、 ビデオフレ ーム周期において多重化される符号化ビデオス トリームのデータ量お よび符号化オーディオス トリームのデータ量は一定となる。 よって、 従来のように各フレーム毎に S T Dバッファがオーバフローするか否 かをチェックするシユミ レーションを行なわなくて良いので、 リアル タイムにプログラムを多重化することができる。
本発明のトランスポートス トリーム生成装置は、 1 ビデオフレーム 期間に多重化される符号化ビデオス トリームのデータ量および所定期 間に多重化される符号化オーディオス トリームのデータ量のそれぞれ カ 、 どのビデオフレーム期間でも略一定となるようにしている。 また
、 1 ビデオフレーム期間に生成されたトランスポ一トス トリ一ムのデ ータ量が、 どのビデオフレーム期間でも略一定となるようにされてい る。
よって、 この トランスポー トス ト リーム生成装置から出力される ト ランスポートス トリームは、 どのフレーム期間においても一定のデー タ量となるので、 本発明のトランスポートス トリーム生成装置は、 復 号器 S T Dバッファが破綻するか否かを判断するためのシュミ レーシ ヨンを各フレーム毎に行なう必要がない。 その結果、 本発明のトラン スポートス トリーム生成装置は、 従来のシュミ レ一ションを必要とす る装置に比較して高速にトランスポートス トリームを生成することが でき、 また、 さらにリアルタイムでトランスポートス トリームを生成 することができる。
また、 本発明のトランスポ一トス トリーム生成装置は、 目標ビデオ 符号化レートおよび目標オーディオ符号化レートに基いて、 符号化さ れたビデオス トリームおよび符号化されたオーディオス トリ一ムを多 重化するためのスケージユールデータを生成するようにしている。 ま た、 このスケジュールデータは、 この作成されたスケジュールデータ に従って、 符号化ビデオス トリームおよび符号化オーディオス トリー ムを多重化し、 トランスポートス ト リームとして復号装置に伝送した 場合、 復号装置の S D Tバッファが破綻しないように、 多重化処理を おこなうためのデータとなっている。 よって、 本発明のトランスポー トス トリーム生成装置は、 このようなスケジュールデータを生成し、 全てのビデオフレーム期間において、 このスケジュールデータに従つ た多重化処理を行なうことによって、 容易に、 復号装置の S D Tバッ ファが破綻することを防止している。 つまり、 本発明のトランスポー トス ト リーム生成装置は、 従来の装置のように、 各ビデオフレーム毎 に新たなスケジュールを計画し、 さらに各ビデオフレーム毎にその計 画したスケジュールに応じてシュミ レーションをするといった複雑な 処理を行なう必要が一切ない。
また、 本発明のトランスポートス ト リーム生成装置は、 1 ビデオフ レーム期間に多重化される符号化ビデオス トリームのデータ量および 所定期間に多重化される符号化オーディオス トリームのデータ量のそ れぞれが、 どのビデオフレーム期間でも略一定となり、 また、 1 ビデ オフレーム期間に生成されたトランスポートス トリームのデータ量が 、 どのビデオフレーム期間でも略一定となるように、 このスケジユー ルデータを生成している。 つまり、 本発明のトランスポートス トリー ム生成装置は、 このスケジュールデータに従って多重化処理を行なう だけで、 リアルタイムで、 復号器 S T Dバッファが破綻しないような 多重化処理を行なうことができる。

Claims

請求の範囲
1 . ソースビデオデータおよびソースオーディオデータを伝送するた めの トランスポー トス ト リームを生成するための トランスポー トス ト リ一ム生成装置において、
指定されたビデオ符号化レート基いて、 上記ソースビデオデータを 符号化して符号化ビデオトリームを生成すると共に、 指定されたォー ディォ符号化レートに基いて上記ソースオーディォデータを符号化し て符号化オーディオス トリームを生成する符号化手段と、
所定期間毎に、 上記符号化ビデオス トリームと上記符号化オーディオ ス トリームを多重化する多重化手段と、
上記ビデオストリームおよび上記オーディオストリームが多重化さ れた多重化ス トリームから上記トランスポートス トリームを生成する トランスポートストリーム生成手段と、
上記所定期間に多重化される上記符号化ビデオストリームのデータ 量および上記所定期間に多重化される上記符号化オーディオス ト リー ムのデータ量のそれぞれが、 どの所定期間でも略一定となるように上 記符号化手段、 上記多重化手段および上記トランスポー トス ト リーム 生成手段を制御する制御手段とを備えたトランスポートス トリーム生 成装置。
2 . 請求項 1記載のトランスポー トス ト リーム生成装置において、 上記制御手段は、
上記指定されたビデオ符号化レートおよび上記指定されたオーディ ォ符号化レートに基いて、 上記符号化されたビデオストリームおよび 上記符号化されたオーディオス トリームを多重化するためのスケージ ユールを生成する手段を備え、 どの所定期間においても、 この多重化 スケジュールに従った多重化処理を行なうように上記多重化手段およ び上記トランスポートス トリーム生成手段を制御することを特徴とす る トランスポー トス ト リーム生成装置。
3 . 請求項 2記載のトランスポートス トリーム生成装置において、 上記スケジュールは、 上記符号化ビデオストリームおよび上記符号 化オーディオストリームをどの順で伝送するかを定義するためのデー タであって、 所定期間に伝送される トランスポートとして、 どの程度 の上記符号化ビデオス トリームおよび上記符号化オーディオストリー ムを伝送するかを定義するためのデータであることを特徴とする トラ ンスポートストリーム生成装置。
4 . 請求項 2記載のトランスポー トス ト リーム生成装置において、 上記スケジュールは、 上記所定期間に伝送される トランスポートと して伝送される上記符号化ビデオス トリームおよび上記符号化オーデ ィォス トリームのデータ量を定義するためのデータであることを特徴 とする トランスポー トス ト リーム生成装置。
5 . 請求項 2記載のトランスポー トス ト リーム生成装置において、 上記所定期間は、 1ビデオフレーム期間であって、
上記制御手段は、
上記指定されたビデオ符号化レートに基いて、 上記 1ビデオフレー ム期間に伝送されるべき符号化ビデオス トリームのデータ量を演算し 、 上記指定されたオーディオ符号化レートに基いて、 上記 1ビデオフ レーム期間に伝送されるべき符号化オーディオストリームのデータ量 を演算し、 上記演算した符号化ビデオストリームのデータ量および上 記演算した符号化オーディオス ト リームのデータ量に基いて、 上記ス ケジュールを生成することを特徴とする トランスポートス トリーム生 成装置。
6 . 請求項 2記載のトランスポートス ト リーム生成装置において、 上記所定期間は、 1 ビデオフレーム期間であって、 上記制御手段は、
上記指定されたビデオ符号化レ一トに基いて、 上記符号化ビデオス トリームを伝送するために必要なトランスポートバケツ ト数を演算し 、 上記指定されたオーディオ符号化レートに基いて、 上記符号化ォー ディォス トリームを伝送するために必要なトランスポートパケッ ト数 を演算し、 上記符号化ビデオス トリームに対する トランスポートパケ ッ ト数および上記符号化オーディオストリームに対する トランスポー トバケツ ト数に基いて、 上記スケジュールを生成することを特徴とす る トランスポー トス ト リーム生成装置。
7 . 請求項 2記載のトランスポートストリーム生成装置において、 上記制御手段は、
上記所定期間毎に、 上記スケジュールによって定義されたデータ量 となるように、 上記符号化ビデオス トリームおよび上記符号化オーデ ィォス トリ一ムを多重化することを特徴とする トランスポートス トリ ーム生成装置。
8 . 請求項 2記載のトランスポー トス トリーム生成装置において、 上記符号化手段から出力された符号化ビデオス トリームをバッファ するためのビデオ符号器バッファ手段と、
上記符号化手段から出力された符号化オーディオストリームをバッ ファするオーディオ符号器バッファ手段とをさらに備え、
上記制御手段は、
n - 1番めのビデオフレーム期間の符号化ビデオス トリームのうち n— 1番めのトランスポー トス ト リームとして伝送されずに符号器バ ッファに残った残存デ一タ量と、 n番めのビデオフレーム期間の符号 化ビデオストリ一ムとして上記符号化手段から出力された符号化ビデ ォストリ一ムのデータ量とを累算した累算データ量が、 上記スケジュ ールによって定義された 1 トランスポ一 トス ト リームにおける符号化 ビデオス トリームのデータ量より多い場合には、
上記 n— 1番めのビデオフレーム期間の残存データと、 n番めのビ デオフレーム期間の符号化ビデオストリームの前半部分のデータとを 、 n番めのビデオフレーム期間に対応したトランスポー トス ト リーム として多重化し、
n番めのビデオフレーム期間の符号化ビデオス トリームの残りの部 分のデータを、 n + 1番めのビデオフレーム期間に対応したトランス ポートス ト リームとして多重化するように上記多重化手段およびトラ ンスポートス トリーム生成手段を制御することを特徴とする トランス ポートス トリーム生成装置。
9 . 請求項 2記載のトランスポートストリーム生成装置において、 上記符号化手段から出力された符号化ビデオス トリームをバッファ するためのビデオ符号器バッファ手段と、
上記符号化手段から出力された符号化オーディオストリームをバッ ファするオーディオ符号器バッファ手段とをさらに備え、
上記制御手段は、
過去ビデオフレーム期間における トランスポートストリーム生成処 理の結果上記ビデオ符号器バッファから読み出されずに残ったビデオ データのデータ量と、 現在ビデオフレーム期間において上記符号化手 段から出力された符号化ビデオストリームのデータ量とに基いて、 現 在ビデオフレーム期間において上記ビデオ符号器バッファから読み出 されるデータ量を制御し、
過去ビデオフレーム期間における トランスポートス トリーム生成処 理の結果上記オーディオ符号器バッファから読み出されずに残ったォ —ディォデータのデータ量と、 現在ビデオフレーム期間において上記 符号化手段から出力された符号化オーディオストリームのデータ量と に基いて、 現在ビデオフレーム期間において上記オーディオ符号器バ ッファから読み出すデータ量を制御することを特徴とする トランスポ 一トス ト リ一ム生成装置。
1 0 . 請求項 1記載のトランスポートストリーム生成装置において、 上記所定期間は、 1 ビデオフレームであって、
上記制御手段は、 どのビデオフレーム期間においても、 生成される トランスポーとストリームのデータレートが略一定となるように上記 多重化手段およびトランスポートス トリーム生成手段を制御すること によって、 各ビデオフレーム毎における復号器バッファにおけるバッ ファ残量のシュミ レーション処理を行なわずに、 復号器バッファの破 綻を防止するようにしたことを特徴とする トランスポートス トリーム 生成装置。
1 1 . ソースビデオデータおよびソースオーディオデータを伝送する ためのトランスポートス トリームを生成するためのトランスポートス トリーム生成装置において、
指定されたビデオ符号化レート基いて、 上記ソースビデオデータを 符号化して符号化ビデオトリームを生成すると共に、 指定されたォー ディォ符号化レートに基いて上記ソースオーディオデータを符号化し て符号化オーディオス トリームを生成する符号化手段と、
所定期間毎に、 上記符号化ビデオス トリームと上記符号化オーディオ ス トリームを多重化する多重化手段と、
上記ビデオストリームおよび上記オーディオス トリ一ムが多重化さ れた多重化ス トリームから上記トランスポートス トリームを生成する トランスポー トス トリーム生成手段と 上記所定期間にトランスポ一トス ト リームとして多重化される上記符 号化ビデオス ト リームのデータレー トおよび上記所定期間に多重化さ れる上記符号化オーディオス トリ一ムのデータレートが、 どの所定期 間でも略一定レートとなるように上記符号化手段、 上記多重化手段お よび上記トランスポートス トリーム生成手段を制御する制御手段とを 備えたことを特徴とする トランスポー トス ト リーム生成装置。
1 2 . 請求項 1 1記載のトランスポートス ト リーム生成装置において 上記制御手段は、
上記指定されたビデオ符号化レートおよび上記指定されたオーディ ォ符号化レ一トに基いて、 上記符号化されたビデオストリームおよび 上記符号化されたオーディオス トリームを多重化するためのスケージ ユールを生成する手段を備え、 どの所定期間においても、 この多重化 スケジュールに従った多重化処理を行なうように上記多重化手段およ び上記トランスポートストリーム生成手段を制御することを特徴とす る トランスポートス ト リーム生成装置。
1 3 . 請求項 1 2記載のトランスポートス トリーム生成装置において 上記スケジュールは、 上記符号化ビデオストリームおよび上記符号 化オーディオス トリームをどの順で伝送するかを定義するためのデー タであって、 所定期間に伝送される トランスポートとして、 どの程度 の上記符号化ビデオス ト リームおよび上記符号化オーディオス ト リー ムを伝送するかを定義するためのデータであることを特徴とするトラ ンスポ一トストリ一ム生成装置。
1 4 . 請求項 1 2記載のトランスポー トス ト リーム生成装置において 上記スケジュールは、 上記所定期間に伝送される トランスポートと して伝送される上記符号化ビデオストリームおよび上記符号化オーデ ィォストリームのデータ量を定義するためのデータであることを特徴 とする トランスポー トス ト リ一ム生成装置。
1 5 . 請求項 1 2記載のトランスポートストリーム生成装置において 上記所定期間は、 1ビデオフレーム期間であって、
上記制御手段は、
上記指定されたビデオ符号化レートに基いて、 上記 1 ビデオフレー ム期間に伝送されるべき符号化ビデオストリームのデータ量を演算し 、 上記指定されたオーディオ符号化レートに基いて、 上記 1ビデオフ レーム期間に伝送されるべき符号化オーディオス トリームのデータ量 を演算し、 上記演算した符号化ビデオス トリームのデータ量および上 記演算した符号化オーディオストリームのデータ量に基いて、 上記ス ケジュールを生成することを特徴とする トランスポートス トリーム生 成装置。
1 6 . 請求項 1 2記載のトランスポートス トリーム生成装置において 上記所定期間は、 1 ビデオフレーム期間であって、
上記制御手段は、
上記指定されたビデオ符号化レートに基いて、 上記符号化ビデオス トリームを伝送するために必要なトランスポートバケツ ト数を演算し 、 上記指定されたオーディオ符号化レートに基いて、 上記符号化ォー ディォス トリームを伝送するために必要なトランスポートバケツ ト数 を演算し、 上記符号化ビデオス ト リームに対する トランスポー トパケ ッ ト数および上記符号化オーディオス トリームに対する トランスポー トパケッ ト数に基いて、 上記スケジュールを生成することを特徴とす る トランスポー トス ト リーム生成装置。
1 7 . 請求項 1 2記載のトランスポートストリーム生成装置において 上記制御手段は、
上記所定期間毎に、 上記スケジュールによって定義されたデータ量 となるように、 上記符号化ビデオス トリームおよび上記符号化オーデ ィォストリームを多重化することを特徴とする トランスポートス トリ ーム生成装置。
1 8 . 請求項 1 2記載のトランスポートス ト リーム生成装置において 上記符号化手段から出力された符号化ビデオス トリームをバッファ するためのビデオ符号器バッファ手段と、
上記符号化手段から出力された符号化オーディオス トリームをバッ ファするオーディオ符号器バッファ手段とをさらに備え、
上記制御手段は、
n - 1番めのビデオフレーム期間の符号化ビデオス トリームのうち n—1番めの トランスポー トス ト リームとして伝送されずに符号器バ ッファに残った残存データ量と、 n番めのビデオフレーム期間の符号 化ビデオストリームとして上記符号化手段から出力された符号化ビデ ォストリームのデータ量とを累算した累算データ量が、 上記スケジュ ールによって定義された 1 トランスポートス トリームにおける符号化 ビデオストリームのデータ量より多い場合には、
上記 n— 1番めのビデオフレーム期間の残存データと、 n番めのビ デオフレーム期間の符号化ビデオス トリームの前半部分のデータとを 、 n番めのビデオフレーム期間に対応したトランスポー トス ト リーム として多重化し、
n番めのビデオフレーム期間の符号化ビデオス トリ一ムの残りの部 分のデータを、 n + 1番めのビデオフレーム期間に対応したトランス ポートス ト リームとして多重化するように上記多重化手段およびトラ ンスポートス トリーム生成手段を制御することを特徴とする トランス ポートス トリーム生成装置。
1 9 . 請求項 1 2記載のトランスポートス トリーム生成装置において 上記符号化手段から出力された符号化ビデオス トリームをバッファ するためのビデオ符号器バッファ手段と、
上記符号化手段から出力された符号化オーディオストリームをバッ ファするオーディオ符号器バッファ手段とをさらに備え、
上記制御手段は、
過去ビデオフレーム期間における トランスポートストリーム生成処 理の結果上記ビデオ符号器バッファから読み出されずに残ったビデオ データのデータ量と、 現在ビデオフレーム期間において上記符号化手 段から出力された符号化ビデオス ト リームのデータ量とに基いて、 現 在ビデオフレーム期間において上記ビデオ符号器バッファから読み出 されるデータ量を制御し、
過去ビデオフレーム期間における トランスポートストリーム生成処 理の結果上記オーディオ符号器バップアから読み出されずに残ったォ 一ディォデータのデータ量と、 現在ビデオフレーム期間において上記 符号化手段から出力された符号化オーディオス ト リームのデータ量と に基いて、 現在ビデオフレーム期間において上記オーディオ符号器バ ッファから読み出すデータ量を制御することを特徴とする トランスポ 一トス ト リーム生成装置。
2 0 . 請求項 1 1記載のトランスポートス トリーム生成装置において 上記所定期間は、 1ビデオフレームであって、
上記制御手段は、 どのビデオフレーム期間においても、 生成される トランスポーとストリームのデータレートが略一定となるように上記 多重化手段およびトランスポートス トリーム生成手段を制御すること によって、 各ビデオフレーム毎における復号器バッファにおけるパッ ファ残量のシュミレーション処理を行なわずに、 復号器バッファの破 綻を防止するようにしたことを特徴とする トランスポー トス ト リーム 生成装置。
2 1 . ソースビデオデータおよびソースオーディオデータを伝送する ためのトランスポートス トリームを生成するためのトランスポートス トリーム生成装置において、
指定されたビデオ符号化レート基いて、 上記ソースビデオデータを 符号化して符号化ビデオトリ一ムを生成すると共に、 指定されたォー ディォ符号化レートに基いて上記ソースオーディオデータを符号化し て符号化ォ一ディォス トリームを生成する符号化手段と、
所定期間毎に、 上記符号化ビデオス トリームと上記符号化オーディ ォス トリームを多重化する多重化手段と、
上記ビデオス トリームおよび上記オーディオス トリームが多重化さ れた多重化ス トリームから上記トランスポートス トリームを生成する トランスポー トス ト リーム生成手段と、
上記トランスポー トス ト リームのデータ レー トがどの所定期間にお いても一定となるように、 上記符号化手段、 上記多重化手段および上 記トランスポー トス トリーム生成手段を制御する制御手段とを備えた ことを特徴とする トランスポー トス ト リーム生成装置。
2 2 . ソースビデオデータおよびソースオーディオデータを伝送する ための トランスポートス ト リームを生成するための トランスポートス トリーム生成装置において、
指定されたビデオ符号化レート基いて上記ソースビデオデータを符 号化しすると共に、 指定されたオーディオ符号化レートに基いて上記 ソースオーディオデータを符号化する符号化手段と、
所定期間毎に上記符号化ビデオス トリームと上記符号化オーディオ ス トリームとを多重化することによって、 上記トランスポートス トリ ームを生成する トランスポートス トリーム生成手段と、
上記指定されたビデオ符号化レートおよび上記指定されたオーディ ォ符号化レートに基いて、 符号化されたビデオス トリームおよび符号 化されたオーディオス トリームを多重化するためのスケージユールを 生成する手段を備え、 どの所定期間においても、 この多重化スケジュ ールに従った多重化処理を行なうように上記トランスポートス トリー ム生成手段を制御する制御手段と
を備えたことを特徴とする トランスポートス トリーム生成装置。
2 3 . ソースビデオデ一タおよびソースオーディオデータから トラン スポートス トリ一ムを生成するためのトランスポートス トリーム生成 方法において、
指定されたビデオ符号化レート基いて、 上記ソースビデオデータを 符号化しすると共に、 指定されたオーディオ符号化レー卜に基いて上 記ソースオーディオデータを符号化し、
多重化される上記符号化ビデオス トリームのデータ量がどの所定期 間でも略一定量であって、 且つ、 多重化される符号化オーディオス ト リームのデータ量がどの所定期間でも略一定量となるように、 上記所 定期間毎に、 上記上記符号化ビデオス トリームと上記符号化オーディ ォス ト リームを多重化し、
上記符号化ビデオス トリームおよび上記符号化オーディオス トリー ムが多重化されたス ト リームから上記トランスポートス ト リームを生 成することを特徴とする トランスポートス トリ一ム生成方法。
2 4 . 請求項 2 3記載のトランスポートス トリーム生成方法において 上記指定されたビデオ符号化レートおよび上記指定されたオーディ ォ符号化レートに基いて、 上記符号化されたビデオス トリームおよび 上記符号化されたオーディオス トリームを多重化するためのスケージ ユールを生成し、
どの所定期間においても、 この多重化スケジュールに従つた多重化 処理を行なうことを特徴とする トランスポートス トリーム生成方法。
2 5 . 請求項 2 4記載のトランスポートス トリーム生成方法において 上記スケジュールは、 上記符号化ビデオス トリームおよび上記符号 化オーディオス トリ一ムをどの順で伝送するかを定義するためのデー タであって、 所定期間に伝送される トランスポー トとして、 どの程度 の上記符号化ビデオス ト リームおよび上記符号化オーディオス ト リー ムを伝送するかを定義するためのデータであることを特徴とする トラ ンスポートス トリーム生成方法。
2 6 . 請求項 2 4記載のトランスポートス トリーム生成方法において 上記スケジュールは、 上記所定期間に伝送される トランスポートと して伝送される上記符号化ビデオス トリームおよび上記符号化オーデ ィォス トリ一ムのデータ量を定義するためのデータであることを特徴 とする トランスポー トス ト リーム生成方法。
2 7 . 請求項 2 4記載のトランスポートス トリーム生成方法において 上記所定期間は、 1 ビデオフレーム期間であって、
上記指定されたビデオ符号化レートに基いて、 上記 1 ビデオフレー ム期間に伝送されるべき符号化ビデオス トリームのデータ量を演算し 、 上記指定されたオーディオ符号化レートに基いて、 上記 1 ビデオフ レーム期間に伝送されるべき符号化オーディオス トリームのデータ量 を演算し、 上記演算した符号化ビデオス トリームのデータ量および上 記演算した符号化オーディオス ト リームのデータ量に基いて、 上記ス ケジュールを生成することを特徴とする トランスポートス ト リーム生 成方法。
2 8 . 請求項 2 4記載のトランスポートス トリーム生成方法において 上記所定期間は、 1 ビデオフレーム期間であって、
上記指定されたビデオ符号化レートに基いて、 上記符号化ビデオス トリームを伝送するために必要なトランスポートバケツ ト数を演算し 、 上記指定されたオーディオ符号化レートに基いて、 上記符号化ォー ディォス トリームを伝送するために必要なトランスポートバケツ ト数 を演算し、 上記符号化ビデオス トリームに対する トランスポートパケ ッ ト数および上記符号化オーディオス トリームに対する トランスポー トバケツ ト数に基いて、 上記スケジュールを生成することを特徴とす る トランスポートス トリ一ム生成方法。
2 9 . 請求項 2 4記載のトランスポートス ト リーム生成方法において 上記所定期間毎に、 上記スケジュールによって定義されたデータ量 となるように、 上記符号化ビデオス トリームおよび上記符号化オーデ ィォス トリ一ムを多重化することを特徴とする トランスポートス トリ ーム生成方法。
3 0 . 請求項 2 4記載のトランスポ一トス トリーム生成方法において 、
上記所定期間は、 1 ビデオフレーム期間であって、
n— 1番めのビデオフレーム期間の符号化ビデオス トリームのうち n— 1番めのトランスポートス ト リームとして伝送されずに符号器バ ッファに残った残存データ量と、 n番めのビデオフレーム期間の符号 化ビデオス トリームとして符号化された符号化ビデオス トリ一ムのデ ータ量とを累算した累算データ量が、 上記スケジュールによって定義 された 1 トランスポートス トリームにおける符号化ビデオス トリーム のデータ量より多い場合には、
上記 n— 1番めのビデオフレーム期間の残存データと、 n番めのビ デオフレーム期間の符号化ビデオス トリームの 1部分のデータとを、 n番めのビデオフレーム期間に対応したトランスポートス トリームと して多重化し、
n番めのビデオフレーム期間の符号化ビデオス ト リ一ムの残りの部 分のデータを、 n + 1番めのビデオフレーム期間に対応したトランス ポートス ト リームとして多重化することを特徴とする トランスポート ス トリーム生成方法。
3 1 . 請求項 2 4記載の トランスポートス トリーム生成方法において 上記所定期間は、 1 ビデオフレーム期間であって、
過去ビデオフレーム期間における トランスポートス トリーム生成処 理の結果、 ビデオ符号器バッファから読み出されずに残ったビデオデ ータのデータ量と、 現在ビデオフレーム期間において符号化された符 号化ビデオス トリームのデータ量とに基いて、 現在ビデオフレ一ム期 間において上記ビデオ符号器バッファから読み出されるデータ量を制 御し、
過去ビデオフレーム期間における トランスポートス トリーム生成処理 の結果、 オーディオ符号器バッファから読み出されずに残ったオーデ ィォデータのデータ量と、 現在ビデオフレーム期間において上記符号 化手段から出力された符号化オーディオストリームのデータ量とに基 いて、 現在ビデオフレーム期間において上記オーディオ符号器バッフ ァから読み出すデータ量を制御することを特徴とする トランスポー ト ス ト リ一ム生成方法。
3 2 . 請求項 2 3記載のトランスポートス トリーム生成方法において 上記所定期間は、 1ビデオフレームであって、
どのビデオフレーム期間においても、 生成される トランスポ一とス トリームのデータレートが略一定となるように上記多重化手段および トランスポートス トリーム生成手段を制御することによって、 各ビデ オフレーム毎における復号器バッファにおけるバッファ残量のシュミ レーション処理を行なわずに、 復号器バッファの破綻を防止するよう にしたことを特徴とする トランスポートストリーム生成方法。
3 3 . ソースビデオデータおょぴソースオーディオデータからトラン スポー トス ト リームを生成するための トランスポー トス ト リーム生成 方法において、
指定されたビデオ符号化レート基いて、 上記ソースビデオデータを 符号化すると共に、 指定されたオーディオ符号化レートに基いて上記 ソースオーディオデータを符号化し、 多重化される上記符号化ビデオストリームのデータレートがどの所 定期間でも略一定レートであって、 且つ、 多重化される符号化オーデ ィォス トリームのデータレートが、 どの所定期間でも略一定レートと なるように、 上記所定期間毎に、 上記上記符号化ビデオス ト リームと 上記符号化オーディオス トリームを多重化し、
上記符号化ビデオストリームおよび上記符号化オーディオストリー ムが多重化されたトリームから上記トランスポートス トリームを生成 することを特徴とする トランスポー トス トリーム生成方法。
3 4 . ソースビデオデータおよびソースオーディオデータを伝送する ための トランスポー トス ト リームを生成するための トランスポー トス トリーム生成方法において、
指定されたビデオ符号化レート基いて、 上記ソースビデオデータを 符号化すると共に、 指定されたオーディオ符号化レートに基いて上記 ソースオーディォデータを符号化し、
上記トランスポートス ト リームのデータレー トがどの所定期間におい ても一定レートとなるように、 上記所定期間毎に上記符号化ビデオス トリームおよび上記符号化オーディオス トリ一ムとを多重化すること によって、 略一定レー トの トランスポートストリームを生成すること を特徴とする トランスポー トス ト リーム生成方法。
3 5 . ソースビデオデータおよびソースオーディオデータを伝送する ための トランスポー トス ト リームを生成するための トランスポー トス トリーム生成方法において、
指定されたビデオ符号化レートおよび指定されたオーディオ符号化 レートに基いて、 符号化されたビデオス トリームおよび符号化された オーディオス ト リームを多重化するためのスケージユールを生成し、 上記指定されたビデオ符号化レ一ト基いて上記ソースビデオデータ を符号化すると共に、 上記指定されたオーディオ符号化レートに基い て上記ソースオーディオデータを符号化し、
どの所定期間においても、 この多重化スケジュールに従った多重化 処理を行なうように、 上記符号化ビデオス トリームと上記符号化ォー ディォストリームとを多重化することによって、 上記トランスポート ストリームを生成することを特徴とする トランスポー トス ト リーム生 成方法。
3 6 . ソースビデオデータおよびソースオーディオデータを符号化し 、 符号化した符号化ビデオス トリームおよび符号化した符号化オーデ ィォス ト リームをトランスポートス トリームとして出力するためのト ランスポートストリーム生成方法において、
指定された目標ビデオ符号化レートおよび目標オーディオ符号化レ 一トに基いて、 1ビデオフレーム期間中に多重化すべき符号化ビデオ ス ト リームのデータ量と多重化すべき符号化オーディオス ト リームの データ量を決定し、
上記多重化すべき符号化ビデオス トリームのデータ量と上記多重化 すべき符号化オーディオストリームのデータ量に基いて、 上記符号化 ビデオス トリームと上記符号化オーディオス トリームを多重化するた めの多重化スケジュールを決定し、
上記所定の多重化処理期間の処理単位で上記符号化ビデオストリ一 ムと上記オーディオス トリームを多重化処理する際に、 どのビデオフ レーム期間においても、 上記多重化スケージユールを使用して上記符 号化ビデオストリームと上記符号化オーディオストリームを多重化す ることによって上記トランスポートストリームを出力することを特徴 とする トランスポ一トス ト リーム生成方法。
3 7 . 複数のプログラムを伝送するプログラム伝送装置において、 上記プログラム伝送装置は、
各々のプログラムに含まれるビデオス ト リームおよびオーディオス ト リームを符号化し、 符号化されたビデオス ト リームおよび符号化ォ 一ディォス トリームを多重化してトランスポートストリームとして出 力する複数の符号化装置と、
上記複数の符号化装置から出力された複数のトランスポートストリ ームを多重化する多重化装置と、
上記複数の符号化装置および上記多重化装置をコントロールするコ ントローラとから構成され、
上記符号化装置の各々は、
コントローラから指定されたビデオ符号化レートおよびオーディオ 符号化レートに基いて、 1 ビデオフレーム期間中における符号化ビデ ォストリームと符号化オーディオス トリームとを多重化するための基 本スケジュールを生成し、
上記フレーム単位で上記符号化ビデオス トリームと上記オーディオ ス ト リームを多重化する際に、 各々のフレーム周期において、 符号器 バッファのシユミレーションを行なわずに、 上記基本スケージユール に従った多重化処理を行なうことによって、 上記トランスポートスト リームを生成することを特徴とするプログラム伝送装置。
3 8 . 複数のプログラムを伝送するプログラム伝送装置において、 上記プログラム伝送装置は、
各々のプログラムに含まれるビデオストリームおよびオーディオス トリームを符号化し、 符号化されたビデオストリームおよび符号化ォ 一ディォス トリームを多重化してトランスポートス ト リームとして出 力する複数の符号化装置と、
上記複数の符号化装置から出力された複数のトランスポートス トリ ームを多重化する多重化装置と、
上記複数の符号化装置および上記多重化装置をコントロールするコ ン トローラとから構成され、
上記符号化装置の各々は、
指定されたビデオ符号化レートおよびオーディオ符号化レートに基 いて、 所定の多重化処理間中に多重化すべき符号化ビデオス トリーム のデータ量と多重化すべき符号化オーディオス トリームのデータ量を 決定し、
上記多重化すべき符号化ビデオストリームのデータ量と上記多重化 すべき符号化オーディオス ト リームのデータ量に基いて、 上記符号化 ビデオス トリームと上記符号化オーディォス トリームを多重化するた めの多重化スケジュールを決定し、
上記所定の多重化処理期間の処理単位で上記符号化ビデオストリー ムと上記オーディオストリームを多重化処理する際に、 各々の所定の 多重化処理期間において、 上記多重化スケ一ジュールを使用して上記 符号化ビデオス トリームと上記符号化オーディオス トリームを多重化 する多重化処理を行なうことを特徴とするプログラム伝送装置。
PCT/JP1998/001336 1997-03-25 1998-03-25 Procede et dispositif generant un flux d'acheminement et dispositif de transmission de programme WO1998043423A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US09/194,264 US6542518B1 (en) 1997-03-25 1998-03-25 Transport stream generating device and method, and program transmission device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP9/71833 1997-03-25
JP7183397 1997-03-25

Publications (1)

Publication Number Publication Date
WO1998043423A1 true WO1998043423A1 (fr) 1998-10-01

Family

ID=13471952

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1998/001336 WO1998043423A1 (fr) 1997-03-25 1998-03-25 Procede et dispositif generant un flux d'acheminement et dispositif de transmission de programme

Country Status (2)

Country Link
US (1) US6542518B1 (ja)
WO (1) WO1998043423A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001045439A (ja) * 1999-05-27 2001-02-16 Sony Corp 記録装置および方法、再生装置および方法、並びに記録媒体
US7499471B2 (en) 2004-01-30 2009-03-03 Samsung Electronics Co., Ltd. Time division multiplexing frame for multiplexing different synchronous signals and method for transmitting and receiving the same
JP2010109529A (ja) * 2008-10-29 2010-05-13 Renesas Technology Corp 多重化制御装置
WO2010103635A1 (ja) * 2009-03-11 2010-09-16 富士通株式会社 データ送信装置、データ送信プログラムおよびデータ送受信システム
US8014452B2 (en) 2002-11-26 2011-09-06 International Business Machines Corporation Format conversion circuit
US8031743B2 (en) 2006-10-31 2011-10-04 Panasonic Corporation Apparatuses and method for multiplexing elementary streams based on a multiplexing pattern indicating an order of types of data to be multiplexed
US8676363B2 (en) 2009-03-26 2014-03-18 Sony Corporation Information processing apparatus, audio signal processing method, and program product

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9286294B2 (en) 1992-12-09 2016-03-15 Comcast Ip Holdings I, Llc Video and digital multimedia aggregator content suggestion engine
US7168084B1 (en) 1992-12-09 2007-01-23 Sedna Patent Services, Llc Method and apparatus for targeting virtual objects
US5619501A (en) * 1994-04-22 1997-04-08 Thomson Consumer Electronics, Inc. Conditional access filter as for a packet video signal inverse transport system
DE69926689T2 (de) * 1998-06-18 2006-06-08 Sony Corp. Vorrichtung und Methode zur Übertragung von Information, Vorrichtung und Methode zum Empfang von Information, Vorrichtung zur Bereitstellung eines computerlesbaren Programms und Fernsehübertragungssystem
BR9912385A (pt) 1998-07-23 2002-01-15 Diva Systems Corp Interface de usuário gerada em um extremo de cabeça, guia de programa interativo, e, processos de geração e distribuição de uma interface de usuário, e de interação com um guia de programa interativo
US6754905B2 (en) 1998-07-23 2004-06-22 Diva Systems Corporation Data structure and methods for providing an interactive program guide
US9924234B2 (en) 1998-07-23 2018-03-20 Comcast Ip Holdings I, Llc Data structure and methods for providing an interactive program
EP1021048A3 (en) * 1999-01-14 2002-10-02 Kabushiki Kaisha Toshiba Digital video recording system and its recording medium
US7010032B1 (en) * 1999-03-12 2006-03-07 Kabushiki Kaisha Toshiba Moving image coding apparatus and decoding apparatus
US20040161032A1 (en) * 1999-04-06 2004-08-19 Amir Morad System and method for video and audio encoding on a single chip
US7096487B1 (en) 1999-10-27 2006-08-22 Sedna Patent Services, Llc Apparatus and method for combining realtime and non-realtime encoded content
US6754271B1 (en) * 1999-04-15 2004-06-22 Diva Systems Corporation Temporal slice persistence method and apparatus for delivery of interactive program guide
US6904610B1 (en) 1999-04-15 2005-06-07 Sedna Patent Services, Llc Server-centric customized interactive program guide in an interactive television environment
EP1063796A3 (en) * 1999-06-11 2005-07-13 Matsushita Electric Industrial Co., Ltd. Digital broadcasting apparatus for the transmission of additional information with a digital broadcast with adjustment of the bitrates of additional information data items
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
US7088725B1 (en) * 1999-06-30 2006-08-08 Sony Corporation Method and apparatus for transcoding, and medium
KR100376578B1 (ko) * 1999-08-12 2003-03-17 엘지전자 주식회사 디지털 데이터 스트림 기록방법 및 그에 따른 표현제어정보 제공방법
US7106946B1 (en) * 1999-09-28 2006-09-12 Sony Corporation Transport stream processing device, and associated methodology of generating and aligning source data packets in a physical data structure
CA2388606C (en) 1999-10-27 2009-12-29 Diva Systems Corporation Picture-in-picture and multiple video streams using slice-based encoding
US7134133B1 (en) * 1999-11-08 2006-11-07 Gateway Inc. Method, system, and software for creating and utilizing broadcast electronic program guide templates
EP1936999B1 (en) * 2000-01-10 2016-12-21 Koninklijke Philips N.V. Method of setting a system time clock at the start of an MPEG sequence
JP2001308811A (ja) * 2000-04-18 2001-11-02 Mitsubishi Electric Corp メディアデータ符号化多重化装置、メディアデータ符号化多重化システムおよびメディアデータ符号化多重化方法
US6909722B1 (en) * 2000-07-07 2005-06-21 Qualcomm, Incorporated Method and apparatus for proportionately multiplexing data streams onto one data stream
KR100470025B1 (ko) * 2001-06-15 2005-02-04 엘지전자 주식회사 디지털 데이터 스트림 기록장치 및 방법과, 그에 따른기록매체
KR100900449B1 (ko) * 2001-06-21 2009-06-02 엘지전자 주식회사 디지털 방송 데이터 기록/재생장치 및 방법
KR100793201B1 (ko) * 2001-06-21 2008-01-10 엘지전자 주식회사 디지털 방송 데이터 기록/재생장치 및 방법
US7793326B2 (en) 2001-08-03 2010-09-07 Comcast Ip Holdings I, Llc Video and digital multimedia aggregator
US7908628B2 (en) 2001-08-03 2011-03-15 Comcast Ip Holdings I, Llc Video and digital multimedia aggregator content coding and formatting
US7710996B1 (en) * 2002-08-27 2010-05-04 Juniper Networks, Inc. Programmable systems and methods for weighted round robin arbitration
US7472199B1 (en) * 2003-03-28 2008-12-30 Qualcomm Incorporated System and method for receiving data at a first rate and adapting the data for being transported at a second rate
JP4102264B2 (ja) * 2003-07-18 2008-06-18 株式会社東芝 デジタルav情報記録媒体とこの媒体を用いる記録/再生方法および記録/再生装置
WO2006047722A2 (en) * 2004-10-27 2006-05-04 Eg Technology, Inc. Decentralized method for generating an mpeg-2 multiprogram transport stream
WO2006083824A2 (en) * 2005-02-01 2006-08-10 Texas Instruments Incorporated Random access in avs-m video bitstreams
US20060271990A1 (en) 2005-05-18 2006-11-30 Rodriguez Arturo A Higher picture rate HD encoding and transmission with legacy HD backward compatibility
JP4758997B2 (ja) * 2005-10-27 2011-08-31 パナソニック株式会社 トランスポートストリーム生成装置およびこれを備えた記録装置、並びにトランスポートストリーム生成方法
US8996587B2 (en) 2007-02-15 2015-03-31 International Business Machines Corporation Method and apparatus for automatically structuring free form hetergeneous data
US8108413B2 (en) * 2007-02-15 2012-01-31 International Business Machines Corporation Method and apparatus for automatically discovering features in free form heterogeneous data
JP4389947B2 (ja) * 2007-02-19 2009-12-24 ソニー株式会社 記録再生装置、データ処理装置、再生方法及びデータ処理方法
US8457214B2 (en) 2007-09-10 2013-06-04 Cisco Technology, Inc. Video compositing of an arbitrary number of source streams using flexible macroblock ordering
US20110302334A1 (en) * 2010-06-07 2011-12-08 Lakshmi Kantha Reddy Ponnatota Flow Control in Real-Time Transmission of Non-Uniform Data Rate Encoded Video Over a Universal Serial Bus
US9154813B2 (en) 2011-06-09 2015-10-06 Comcast Cable Communications, Llc Multiple video content in a composite video stream
JP6642016B2 (ja) * 2016-01-12 2020-02-05 船井電機株式会社 配信装置および情報機器
US10567703B2 (en) 2017-06-05 2020-02-18 Cisco Technology, Inc. High frame rate video compatible with existing receivers and amenable to video decoder implementation

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05227520A (ja) * 1992-02-14 1993-09-03 Hitachi Ltd 画像圧縮符号化装置
JPH06181524A (ja) * 1992-12-14 1994-06-28 Matsushita Electric Ind Co Ltd 符号化伝送装置
JPH06311497A (ja) * 1993-04-21 1994-11-04 Matsushita Electric Ind Co Ltd 映像信号符号化装置
JPH06343158A (ja) * 1993-03-31 1994-12-13 Sony Corp データ多重化装置、データ多重化方法及びデータ記録 媒体
JPH08256329A (ja) * 1994-09-29 1996-10-01 Cselt Spa (Cent Stud E Lab Telecomun) Mpeg1規格により符号化された音声映像信号ストリームの多重化方法
JPH0955765A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd スタッフ情報量制御方式

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5561466A (en) * 1993-06-23 1996-10-01 Nec Corporation Video and audio data multiplexing into ATM cells with no dummy cell used and ATM cell demultiplexing
KR0136460B1 (ko) * 1994-12-24 1998-05-15 이헌조 가변비트율 부호화 장치의 데이타 인터리빙방법
JPH0955935A (ja) * 1995-08-15 1997-02-25 Nippon Steel Corp 画像および音声符号化装置
BR9610270A (pt) * 1995-08-16 1999-07-06 Starguide Digital Networks Inc Alocação dinâmica de largura de faixa para transmissão de sinais de audio e um sinal de vídeo
US6172988B1 (en) * 1996-01-31 2001-01-09 Tiernan Communications, Inc. Method for universal messaging and multiplexing of video, audio, and data streams
US6157674A (en) * 1996-03-21 2000-12-05 Sony Corporation Audio and video data transmitting apparatus, system, and method thereof
US5918020A (en) * 1997-02-28 1999-06-29 International Business Machines Corporation Data processing system and method for pacing information transfers in a communications network

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05227520A (ja) * 1992-02-14 1993-09-03 Hitachi Ltd 画像圧縮符号化装置
JPH06181524A (ja) * 1992-12-14 1994-06-28 Matsushita Electric Ind Co Ltd 符号化伝送装置
JPH06343158A (ja) * 1993-03-31 1994-12-13 Sony Corp データ多重化装置、データ多重化方法及びデータ記録 媒体
JPH06311497A (ja) * 1993-04-21 1994-11-04 Matsushita Electric Ind Co Ltd 映像信号符号化装置
JPH08256329A (ja) * 1994-09-29 1996-10-01 Cselt Spa (Cent Stud E Lab Telecomun) Mpeg1規格により符号化された音声映像信号ストリームの多重化方法
JPH0955765A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd スタッフ情報量制御方式

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001045439A (ja) * 1999-05-27 2001-02-16 Sony Corp 記録装置および方法、再生装置および方法、並びに記録媒体
US8014452B2 (en) 2002-11-26 2011-09-06 International Business Machines Corporation Format conversion circuit
US7499471B2 (en) 2004-01-30 2009-03-03 Samsung Electronics Co., Ltd. Time division multiplexing frame for multiplexing different synchronous signals and method for transmitting and receiving the same
US8031743B2 (en) 2006-10-31 2011-10-04 Panasonic Corporation Apparatuses and method for multiplexing elementary streams based on a multiplexing pattern indicating an order of types of data to be multiplexed
JP2010109529A (ja) * 2008-10-29 2010-05-13 Renesas Technology Corp 多重化制御装置
WO2010103635A1 (ja) * 2009-03-11 2010-09-16 富士通株式会社 データ送信装置、データ送信プログラムおよびデータ送受信システム
JP5234172B2 (ja) * 2009-03-11 2013-07-10 富士通株式会社 データ送信装置、データ送信プログラムおよびデータ送受信システム
US9100672B2 (en) 2009-03-11 2015-08-04 Fujitsu Limited Data transmitting device and data transmitting and receiving system
US8676363B2 (en) 2009-03-26 2014-03-18 Sony Corporation Information processing apparatus, audio signal processing method, and program product

Also Published As

Publication number Publication date
US6542518B1 (en) 2003-04-01

Similar Documents

Publication Publication Date Title
WO1998043423A1 (fr) Procede et dispositif generant un flux d'acheminement et dispositif de transmission de programme
US7551672B1 (en) Encoding system and method, decoding system and method, multiplexing apparatus and method, and display system and method
KR100420740B1 (ko) 인코딩 장치, 인코딩 방법, 디코딩 장치, 디코딩 방법,코딩 시스템, 코딩 방법
EP0944249B1 (en) Encoded stream splicing device and method, and an encoded stream generating device and method
US6034731A (en) MPEG frame processing method and apparatus
US7379497B2 (en) Encoded data outputting apparatus and method
US20030043923A1 (en) System and method for transcoding multiple channels of compressed video streams using a self-contained data unit
WO2001039505A2 (en) Method and apparatus of transmitting and receiving variable bit rate streams
US20030103765A1 (en) MPEG recording apparatus, recording medium and transmission method
JPH09312656A (ja) 伝送装置およびその方法
JP2002171529A (ja) 映像符号化装置及び方法、記録媒体、並びに復号化装置
JP2823806B2 (ja) 画像復号装置
KR0180174B1 (ko) Mpeg2 pat의 역패킷화기
KR100189351B1 (ko) Mpeg2 디코더에서 정보테이블의 갱신처리회로
JP2000228768A (ja) デジタル信号伝送装置および方法、並びに提供媒体
JP3584460B2 (ja) ビットストリーム変換装置および方法、並びに提供媒体
JP2000228769A (ja) デジタル信号伝送装置および方法、デジタル信号受信装置および方法、並びに提供媒体
JP3686264B2 (ja) 動画像伝送システムにおけるオーディオ信号伝送方法およびその符号化装置ならびに復号装置
Balakrishnan et al. Rate and buffer regulation in a video encoder for seamless splicing
JP2002290363A (ja) データ多重化伝送方法及びその装置
JP2004328771A (ja) エンコーディング装置及び方法、デコーディング装置及び方法、並びに記録媒体
JP2006109513A (ja) 符号化装置および方法、並びに記録媒体

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

WWE Wipo information: entry into national phase

Ref document number: 09194264

Country of ref document: US

ENP Entry into the national phase

Ref country code: US

Ref document number: 1998 194264

Date of ref document: 19981216

Kind code of ref document: A

Format of ref document f/p: F