CN1993700A - 用于混合压缩数字位流的方法及装置 - Google Patents

用于混合压缩数字位流的方法及装置 Download PDF

Info

Publication number
CN1993700A
CN1993700A CNA2005800261072A CN200580026107A CN1993700A CN 1993700 A CN1993700 A CN 1993700A CN A2005800261072 A CNA2005800261072 A CN A2005800261072A CN 200580026107 A CN200580026107 A CN 200580026107A CN 1993700 A CN1993700 A CN 1993700A
Authority
CN
China
Prior art keywords
coefficient set
mixing
data stream
transform coefficient
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800261072A
Other languages
English (en)
Other versions
CN1993700B (zh
Inventor
韦努戈帕尔·斯里尼瓦桑
约翰·C·派弗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TNC US Holdings Inc
Original Assignee
Nielsen Media Research LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nielsen Media Research LLC filed Critical Nielsen Media Research LLC
Publication of CN1993700A publication Critical patent/CN1993700A/zh
Application granted granted Critical
Publication of CN1993700B publication Critical patent/CN1993700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/265Mixing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/12Systems in which the television signal is transmitted via one channel or a plurality of parallel channels, the bandwidth of each channel being less than the bandwidth of the television signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00028Advanced audio coding [AAC]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00036AC-3, i.e. ATSC digital audio compression standard
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Abstract

本发明公开了用于混合(200)压缩数字位流(230)的方法、装置及制造品。本文公开的示例方法包括以下步骤:获取与第一压缩数字位流(220)相关联的帧;对该帧进行解包以获得多个原始变换系数集;以及修改所述多个原始变换系数集来将第二数字位流(210)与所述第一压缩数字位流(220)相混合。

Description

用于混合压缩数字位流的方法及装置
技术领域
本公开总体上涉及数字压缩,更具体地涉及用于混合压缩数字位流的方法及装置。
背景技术
在现代电视或无线电广播站中,通常采用压缩数字位流来承载用于发送的视频和/或音频数据。例如,在美国针对数字电视(DTV)广播的先进电视系统委员会(ATSC)标准采用运动图像专家组(MPEG)标准(例如,MPEG-1、MPEG-2、MPEG-3、MPEG-4等)来承载视频内容,并采用数字音频压缩标准(例如,公知为Dolby Digital的AC-3)来承载音频内容(即,ATSC标准:数字音频压缩(AC-3),A版,2001年8月)。AC-3压缩标准基于感知型数字音频编码技术,该技术在最小化可感知失真的同时减少再现原始音频信号所需的数据量。具体来说,AC-3压缩标准认识到,人耳在特定谱频率处无法觉察到小于这些谱频率处的掩蔽能量的频谱能量变化。掩蔽能量是音频片段的一特性,其取决于该音频片段的音调和类噪声特性。可采用不同的已知心理声学模型来确定特定谱频率处的掩蔽能量。此外,AC-3压缩标准提供了用于数字电视(DTV)、高清晰度电视(HDTV)、数字多功能盘(DVD)、数字线缆以及卫星传输的使得能够广播特殊声音效果(例如,环绕声)的多声道数字音频格式(例如,5.1声道格式)。
一些广播情形要求要与主音频服务(MAS)(其可与要广播的主电视或无线电节目相对应)混合的辅助音频服务(AAS),例如包含画外音材料的音频服务。AAS可源于实况音频,或者可按照模拟、非压缩数字格式或压缩数字格式来存储。将AAS与MAS混合通常包括衰减MAS并加入AAS,使得AAS可听得见,同时MAS仍处于较低但可感知的水平。
在传统的模拟广播中,混合两种音频源(例如,AAS和MAS)是相对简单的任务,涉及公知的衰减和放大电路。同样,混合两个非压缩数字音频流也是相对简单的任务,这是因为可采用公知的线性衰减和加法技术来混合非压缩数字样本。然而,当任一个音频源或两个音频源都提供压缩数字音频流时(如在全数字现代广播设备的情况下)混合两个音频源要复杂得多。在一些已知的系统中,混合一个或更多个压缩数字音频流要求对要混合的所有流进行解压缩。然后采用非压缩的数据流执行混合,接着对所得的混合数据流进行再压缩。然而,这种要求对源数字流进行解压缩并对混合数据流进行再压缩的方法并非理想的,因为再压缩是昂贵的操作,其由于众多的附加处理步骤而要求附加装置、造成附加音频延时、并且增加了潜在故障模式数。
附图说明
图1是用于图2中的示例混合装置的示例环境的框图。
图2是用在图1中的示例环境下的用来混合压缩数字位流的示例混合装置的框图。
图3描述了要利用图2中的示例混合装置处理的示例单声道压缩数字音频位流。
图4是例示了实现图2中的示例混合装置的示例方式的框图。
图5描述了通过图4中的示例混合装置对图3中的示例单声道压缩数字音频位流执行的示例操作序列。
图6描述了可用来实现图4中的示例混合装置的示例量化查找表。
图7描述了要由图4中的示例混合装置处理的示例多声道压缩数字音频位流。
图8描述了要通过图4中的示例混合装置对图7中的示例压缩数字音频位流执行的示例操作序列。
图9是表示要用来实现图4中的示例混合装置的示例处理的流程图。
图10是表示用于图9中的示例处理的第一示例修改处理的流程图。
图11是表示用于图9中的示例处理并适于对图3或图7中的示例压缩数字音频位流进行操作的第二示例修改处理的流程图。
图12描述了用在图1中的示例环境下的另选示例混合装置。
图13是表示可用来实现图12中的示例混合装置的示例处理的流程图。
图14A至图14B是表示对图13中的示例处理的示例改进的流程图。
图15是可用来实现图2中的示例混合装置的示例处理器系统的框图。
具体实施方式
总体上公开了用来对压缩数字位流进行组合的方法及装置。本文公开的方法及装置可用来在无需预先对压缩数字位流进行解压缩的情况下对该压缩数字位流进行组合。因此,本文公开的方法及装置无需对压缩数字位流进行多轮解压缩/压缩,多轮解压缩/压缩例如对于电视广播网络分支机构来说通常是不可接受的,这是因为多轮解压缩/压缩会严重劣化压缩数字位流提供的媒体内容的质量。尽管这里给出的示例关注对各自承载音频内容的两个数字位流的混合,但是所公开的方法和装置可更一般地应用于按照任意适当方式组合按照任意适当格式承载任意类型内容的任意数量的数字数据流。
例如,在广播之前,本文公开的方法和装置可用来对与根据数字音频压缩标准(例如,AC-3压缩标准)格式化的压缩主数字位流相关联的改进离散余弦变换(MDCT)系数集进行解包。可修改经解包的MDCT系数集的尾数来将辅助数字位流与主压缩数字位流相混合。可对所得经修改的MDCT系数再打包以形成用来传输到一个或更多个媒体消费点的压缩混合数字位流。按照这种方式,可将辅助数字位流直接与压缩版主数字位流相混合,而无需对压缩主数字位流进行解压缩并随后对混合数字位流进行再压缩。
参照图1,示例使用环境100例示了示例混合装置110在包括广播网络供应商120和服务于多个本地媒体消费点140的本地服务供应商130的广播系统中的操作。广播网络供应商120可以是能够向一个或更多个本地服务供应商130提供广播内容的任意类型的广播网络供应商。例如,广播网络供应商120可对与电视节目、广播节目、体育赛事、新闻广播等相对应的音频、视频和/或多媒体内容进行打包,以传输到本地服务供应商130用于随后传输到特定本地服务供应商130所服务的本地媒体消费点140。在很多情形下,广播网络供应商120生成的音频、视频和/或多媒体内容是适于广大听众消费的一般内容。在这种情况下,本地服务供应商130可剪辑广播网络供应商120提供的一般内容,以供与本地媒体消费点140相关联的特定本地听众进行消费。
本地服务供应商130例如可由任何服务供应商来实现,例如本地有线电视服务供应商、本地射频(RF)电视服务供应商、本地无线电广播供应商等。本地服务供应商130经由接收器150从广播网络供应商120接收广播内容。接收器150可由基于广播网络供应商120与本地服务供应商130之间的通信链路的任意适合类型的接收器来实现,例如卫星接收器、高速数字网络接收器等。另外,本地服务供应商130可生成要与接收器150接收到的广播内容相混合的本地内容160,例如用以剪辑广播内容以供与本地媒体消费点140相关联的特定本地听众进行消费。将经由接收器150接收到的广播内容和本地内容160施加给混合装置110,以生成混合广播内容用来经由发送器170广播到本地媒体消费点140。发送器170可采用适于本地服务供应商130的任意适合类型的发送器来实现,例如有线电视发送器、RF电视发送器、广播无线电发送器等。
尽管示例使用环境100将混合装置110示出为与本地服务供应商130相结合地进行操作以将来自广播网络供应商120的内容与本地内容160相混合,但是也可以采用其他使用环境。例如,可由广播网络供应商120使用混合装置110来混合来自多个源的内容,用以生成要提供给本地服务供应商130的广播内容。另外或另选的是,可由本地服务供应商130使用混合装置110来混合来自多个源的内容用以生成本地内容160。更一般的是,混合装置110可用在要将来自多个源的内容相混合以生成所得混合内容的任意情形下。
图2示出了示例混合装置200,该示例混合装置200被配置为将非压缩辅助数字位流210与压缩主数字位流220相混合以生成所得压缩混合数字位流230。可使用示例混合装置200来例如在如下情况下实现图1中的示例混合装置110:将本地内容160格式化为非压缩数字位流(例如,对应于非压缩辅助数字位流210),并将广播网络供应商120提供的广播内容格式化为压缩数字位流(例如,对应于压缩主数字位流220)。压缩主数字位流220例如可根据诸如AC-3压缩标准和/或MPEG-AAC压缩标准(可采用其中任一种来利用来自各个块的预定数量的数字化样本对音频信号块进行处理)的音频压缩标准来压缩。如下所述,可以以例如48千赫兹(kHz)的采样率来对压缩数字位流220的源(未示出)进行采样以形成音频块。
通常,音频压缩技术(例如基于AC-3压缩标准的音频压缩技术)采用交叠音频块和MDCT算法来将音频信号转换为压缩数字位流(例如,图2中的压缩主数字位流220)。可根据采样的音频信号的动态特性来使用两种不同的块尺寸(即,短块和长块)。例如,可采用AC-3短块来最小化音频信号的瞬态片段的预回声,并可采用AC-3长块来实现音频信号的非瞬态片段的高压缩增益。根据AC-3压缩标准,AC-3长块对应于512时域音频样本的块,而AC-3短块对应于256时域音频样本。基于用在AC-3压缩标准中的MDCT算法的交叠结构,在AC-3长块的情况下,通过将先前(旧)256时域样本块与当前(新)256时域样本块连接起来而获得512个时域样本,以生成512时域样本的音频块。然后采用MDCT算法来对AC-3长块进行变换以生成256个变换系数。根据同一标准,同样从一对连续时域样本音频块获得AC-3短块。然后采用MDCT算法来对AC-3短块进行变换以生成128个变换系数。然后对与两个相邻短块相对应的128个变换系数进行交织以生成一组256个变换系数。由此,对AC-3长块或AC-3短块的处理得到了相同数量的MDCT系数。作为另一示例,根据MPEG-AAC压缩标准,短块包含128个样本,而长块包含1024个样本。
图3例示了要由图2中的示例混合装置200处理为压缩主数字位流220的示例单声道压缩数字位流的格式300。格式300基于包括多个256样本时域音频块310(概括地示为A0、A1、A2、A3、A4和A5)的非压缩数字位流。MDCT算法处理音频块310以生成MDCT系数集320(通过示例的方式将其示出为MA0、MA1、MA2、MA3、MA4和MA5(其中MA5未示出))。例如,MDCT算法可处理音频块A0和A1以生成MDCT系数集MA0。将音频块A0和A1连接起来生成512样本音频块(例如,AC-3长块),采用MDCT算法对该512样本音频块进行MDCT变换以生成包含256个MDCT系数的MDCT系数集MA0。同样,可对音频块A1和A2进行处理以生成MDCT系数集MA1。由此,音频块A1是交叠音频块,因为其用来生成MDCT系数集MA0和MA1两者。按照类似的方式,采用MDCT算法来对音频块A2和A3进行变换以生成MDCT系数集MA2,对音频块A3和A4进行变换以生成MDCT系数集MA3,对音频块A4和A5进行变换以生成MDCT系数集MA4,等等。由此,音频块A2是用来生成MDCT系数集MA1和MA2的交叠音频块,音频块A3是用来生成MDCT系数集MA2和MA3的交叠音频块,音频块A4是用来生成MDCT系数集MA3和MA4的交叠音频块,等等。合起来说,将MDCT系数集320打包以形成图2中的压缩数字位流220。
图4例示了图2中的混合装置200的示例实现。在图4的示例中,混合装置200包括获取单元410、解包单元420、修改单元430以及再打包单元440。尽管下面根据AC-3压缩标准描述了混合装置200的操作,但是可将混合装置200实现为例如根据另外的和/或其他压缩标准(例如,MPEG-AAC压缩标准)进行操作。将利用图5的示例更详细描述混合装置200的操作。
获取单元410被配置为获取与压缩数字位流220(示于图2中)相关联的一个或更多个帧510(示于图5中),帧510的一部分通过示例的方式示出为图5中的帧A和帧B。如前所述,压缩数字位流220可以是根据AC-3标准压缩的数字位流(下文中称作“AC-3数据流”220)。尽管AC-3数据流220可包括多个声道,但是为了清晰起见,以下的示例将AC-3数据流220描述为仅包括一个声道。在AC-3数据流220中,各个帧510包括多个原始MDCT系数集520。根据AC-3压缩标准,例如,各个帧510包括六个原始MDCT系数集(即,六个“音频块”,其中各MDCT系数集对应于一AC-3音频块)。例如,帧A包括原始MDCT系数集MA0、MA1、MA2、MA3、MA4和MA5,帧B包括原始MDCT系数集MB0、MB1、MB2、MB3、MB4和MB5。
获取单元410还被配置为例如处理与各个帧510相关联的头信息,例如与AC-3数据流220相关联的声道数。尽管如上所述示例AC-3数据流220仅包括一个声道,但是下面将关于图7和图8来描述具有多个声道的示例压缩数字位流。
返回到图4和图5,解包单元420被配置为对原始MDCT系数集520进行解包来例如确定压缩信息,例如原始压缩处理的参数(即,音频压缩技术压缩音频信号或音频数据以形成压缩数字数据流220的方式)。例如,解包单元420可确定采用多少位来表示原始MDCT系数集520内的各个原始MDCT系数。另外,压缩参数可包括限制AC-3数据流220可修改的程度以确保经由AC-3数据流220传送的媒体内容质量级足够高的信息。混合装置200随后采用由解包单元420识别的压缩信息来将非压缩辅助数字位流210混合到AC-3数据流220中,从而确保按照与压缩主数字位流220中提供的压缩信息一致的方式来执行混合操作。
如在AC-3压缩标准中详细描述的,采用尾数和指数来表示各个原始MDCT系数。AC-3压缩标准采用能够减少表示各个原始MDCT系数所用的位数的技术。心理声学掩蔽是可被这些技术采用的一个因素。例如,在特定频率k处存在音频能量Ek(例如,声调)或者在特定频率k附近的频带上的扩展处存在音频能量Ek(例如,类噪声特性)都产生掩蔽效应。也就是说,如果在特定频率k处或在频率k附近的频带上的扩展处的频域能量的变化小于给定能量阈值ΔEk,则人耳不能感知该变化。因为人耳的这一特性,可以用与ΔEk有关的步长来量化与频率k相关联的MDCT系数mk,而不会造成给音频内容带来任何可感知的变化的风险。对于AC-3数据流220,用尾数Mk和指数Xk来表示各原始MDCT系数mk,使得mk=Mk.2-X k,其中2-X k表示系数mk的量化步长。用来表示原始MDCT系数集520中的各原始MDCT系数的尾数Mk的位数可基于在AC-3压缩标准中公布的已知量化查找表(例如,图6中的示例量化查找表600)来确定。在图6的示例中,量化查找表600提供了由四位数表示的MDCT系数的尾数码或位模式以及对应的尾数值。如下面详细描述的,尾数Mk可修改为表示将非压缩辅助数字位流210与AC-3数据流220相混合而得到的MDCT系数。
返回到图4和图5,修改单元430被配置为对各原始MDCT系数集520执行逆变换以生成时域音频块530,通过示例的方式将时域音频块530示出为TA0’,…,TA3”,TA4’,TA4”,TA5’,TA5”,TB0’,TB0”,TB1’,TB1”,…,以及TB5’(TA0”到TA3’以及TB2’到TB4”未示出)。修改单元430执行逆变换操作以生成与被连接起来以形成AC-3数据流220的原始MDCT系数集520的多个256样本时域音频块相关联的先前(旧)时域音频块集(其被表示为上撇号块)集和当前(新)时域音频块(其被表示为秒号块)集。例如,修改单元430对原始MDCT系数集MA5执行逆变换以生成时域块TA4”和TA5’,对原始MDCT系数集MB0执行逆变换以生成TA5”和TB0’,对原始MDCT系数集MB1执行逆变换以生成TB0”和TB1’,等等。然后,修改单元430生成重构的时域音频块540,其提供对被压缩以形成AC-3数据流220的原始时域音频块的重构。为了生成重构的时域音频块540,修改单元430可例如基于已知的Princen-Bradley时域混叠消除(TDAC)技术(如在Princen等人的“Analysis/Synthesis Filter Bank Design Based on Time Domain AliasingCancellation”,Institute of Electrical and Electronics Engineers(IEEE)Transactions on Acoustics,Speech and Signal Processing,Vol.ASSP-35,No.5,pp.1153-1161(1986)(在此通过引用并入其全部内容)中描述的)来相加时域音频块530。例如,修改单元430可通过采用Princen-Bradley TDAC技术来将上撇号时域音频块TA5’和秒号时域音频块TA5”相加,来重构图3中的时域音频块A5(对应于TA5R)。同样,修改单元430可通过采用Princen-Bradley TDAC技术来将上撇号音频块TB0’和秒号音频块TB0”相加,来重构时域音频块B0(对应于TB0R)。按照这种方式,对用来形成AC-3数据流220的原始时域音频块进行重构以使得非压缩辅助数字位流210能够被直接混合到AC-3数据流220中。
修改单元430还被配置为将非压缩辅助数字位流210混合到重构的时域音频块540中以生成混合时域音频块550,通过示例的方式将混合时域音频块550示出为TA0X、…、TA4X、TA5X、TB0X、TB1X、…、以及TB5X(块TA1X、TA2X、TA3X、TB2X、TB3X以及TB4X未示出)。修改单元430可通过将非压缩辅助数字位流210中包括的时域音频样本与所连接的重构时域音频块540中的对应时域音频样本相加来实现混合处理,以生成混合时域音频块550。另外,修改单元430可被配置为在相加操作之前,衰减非压缩辅助数字位流210和重构时域音频块540中的任一个或两者中的时域音频样本。例如,在AC-3数据流220对应于MAS且非压缩辅助数字位流210对应于AAS的情况下,修改单元430可被配置为在相加操作之前将与MAS相对应的重构时域音频块540中的时域样本衰减一衰减因数(例如,3dB到10dB)。这种衰减将使得AAS成为混合音频信号中的主导音频分量,但仍使得MAS按较低但可感知的级别被听到。
返回到图4和图5,基于混合时域音频块550,修改单元430生成中间混合MDCT系数集560,通过示例的方式将中间混合MDCT系数集560示出为MA0I、...、MA4I、MA5I、MB0I、...、以及MB5I(块MA1I、MA2I、MA3I、MB1I、MB2I、MB3I以及MB4I未示出)。根据上述示例,修改单元430基于混合时域音频块TA5X和TB0X生成中间混合MDCT系数集MA5I。具体来说,修改单元430将混合时域音频块TA5X和TB0X连接起来以形成512样本连接音频块,并将该512样本连接音频块转换为中间混合MDCT系数集MA5I,如下面将更详细描述的,可采用该中间混合MDCT系数集MA5I来修改原始MDCT系数集MA5以生成输出混合MDCT系数集MA5X。
原始MDCT系数集520与中间混合MDCT系数集560之差表示AC-3数据流220中与将非压缩辅助数字位流210与AC-3数据流220相混合对应的变化。因此,可以基于原始MDCT系数集520的格式并由此基于与原始MDCT系数集520相关联的压缩,生成输出混合MDCT系数集570,通过示例的方式将输出混合MDCT系数集570示出为MA0X、...、MA4X、MA5X、MB0X、...、以及MB5X(块MA1X、MA2X、MA3X、MB1X、MB2X、MB3X以及MB4X未示出)。例如,关于图6,修改单元430可采用与对应的原始MDCT系数集MA5相关联的指数以及基于对应的中间混合MDCT系数集MA5I的尾数,按照尾数及指数格式来表示混合MDCT系数集MA5X。此外,可采用与原始MDCT系数集520相对应的量化查找表(即,图6中的查找表600)来量化中间混合MDCT系数560的尾数值,以生成混合MDCT系数集570的MDCT系数的尾数值。本领域普通技术人员将认识到,由于在非压缩辅助数字位流210中的混合,故而得到的量化混合尾数值表示AC-3数据流220的变化或其增加。在该示例实施中,采用原始MDCT系数的指数来生成混合MDCT系数集570的对应混合MDCT系数。改变指数可能需要重新计算基本压缩信号表示,从而要求压缩信号经历真正的解压缩/压缩轮回。为了避免解压缩/压缩轮回,如果仅对尾数的修改不足以完全表示混合的与原始的MDCT系数之差,则适当地将受影响的MDCT尾数设置为最大或最小值。
转向图6,示例量化查找表600包括对-0.9333到+0.9333范围内的示例尾数Mk的十五级量化的尾数码和尾数值。尽管示例量化查找表600提供了与用四位表示的MDCT系数相关联的尾数信息,但是AC-3压缩标准提供了与每MDCT系数的其他适合位数相关联的量化查找表。为了例示修改单元430可生成特定混合MDCT系数的一个示例方式,考虑原始MDCT系数集MA5中包含的尾数为Mk的原始MDCT系数mk。假设原始尾数值Mk为-0.2666(即,-4/15)。采用量化查找表600,将与原始MDCT系数集MA5中的原始MDCT系数mk相对应的尾数码确定为0101。接着,假设混合MDCT系数集MA5X包括尾数值为XMk的混合MDCT系数xmk。此外,假设对应的中间混合MDCT系数集MA5I的中间尾数值为-0.4300,这处于尾数码0011与0100之间。换言之,在该示例中将非压缩辅助位流210与AC-3位流220相混合,得到原始尾数值-0.2666与混合尾数值-0.4300之间的差为-0.1667。
为了将非压缩辅助位流210与AC-3数据流220相混合,修改单元430可将混合MDCT系数集MA5X表示为对原始MDCT系数集MA5中的原始MDCT系数的修改。继续以上示例,因为与对应的混合MDCT系数xmk相关联的中间混合尾数处于尾数码0011与0100之间(因为与混合MDCT系数xmk相对应的中间尾数值为-0.4300),所以尾数码0011或尾数码0100可替代与MDCT系数mk相关联的尾数码0101来表示混合MDCT系数xmk。与尾数码0011相对应的尾数值为-0.5333(即,-8/15),与尾数码0100相对应的尾数值为-0.4(即,-6/15)。在该示例中,因为与尾数码0100相对应的尾数值-0.4最接近理想的中间混合尾数值-0.4300,所以修改单元430选择尾数码0100来表示混合MDCT系数xmk。结果,与混合MDCT系数xmk的混合尾数XMk相对应的新的尾数位模式0100代替原始尾数位模式0101。同样,可按照上述方式来修改原始MDCT系数集MA5中的各个原始MDCT系数,以生成混合MDCT系数集MA5X中的对应混合MDCI系数。此外,如果中间混合尾数值在尾数值的量化范围之外(即,大于0.9333或小于-0.9333),适当地选择正限1110或负限0000作为输出混合尾数码。另外,如上所讨论的,尽管可如上所述地修改与原始MDCT系数集中的各原始MDCT系数相关联的尾数码,但是在生成对应的混合MDCT系数时仍保持与原始MDCT系数相关联的指数不变。
返回到图4和图5,再打包单元440被配置为对与AC-3数据流220中的各个帧相关联的混合MDCT系数集570进行再打包以生成压缩混合数字位流230。具体来说,再打包单元440识别各原始MDCT系数集520在AC-3数据流220的帧内的位置,从而可基于修改所识别的原始MDCT系数集520来生成对应的混合MDCT系数集570。为了重建混合版的帧A,例如,再打包单元440可识别原始MDCT系数集MA0到MA5的位置并对其进行修改,以在对应的识别位置处生成对应的混合MDCT系数集MA0X到MA5X。采用本文描述的解包、修改以及再打包处理,AC-3数据流220在辅助数字位流210与其相混合的同时保持为压缩数字位流。因此,混合装置200无需另外的解压缩/压缩轮回(这可能劣化AC-3数据流220中的媒体内容的质量)而将辅助数字位流210与AC-3数据流220相混合。
为简便起见,关于图5描述了包括单个声道的AC-3数据流220。然而,如下关于图7和图8所描述的,本文描述的方法和装置可应用于具有与多个声道相关联的音频块(例如,5.1声道音频(即,五个全带宽声道和一个低频效果声道))的压缩数字数据流。在图7的示例中,非压缩数字位流格式700可包括多个音频块集710。各个音频块集710可包括与多个声道(例如,包括左前声道、中央声道、右前声道、左后声道、右后声道以及低频效果(LFT)声道(例如,超重低音炮声道))相关联的音频块720和730。例如,音频块集AUD0包括与左前声道相关联的音频块A0L、与中央声道相关联的音频块A0C、与右前声道相关联的音频块A0R、与左后声道相关联的音频块A0RL、与右后声道相关联的音频块A0RR、以及与LFE声道相关联的音频块A0LFE。类似地,音频块集AUD1包括与左前声道相关联的音频块A1L、与中央声道相关联的音频块A1C、与右前声道相关联的音频块A1R、与左后声道相关联的音频块A1RL、与右后声道相关联的音频块A1RR、以及与LFE声道相关联的音频块A1LFE。
可按照与上面关于图3所述的方式类似的方式来压缩音频块集710中与特定声道相关联的各个音频块。例如,可对图8中的与中央声道相关联的音频块810(其与图7中的中央声道相对应,且通过示例的方式示出为A0C、A1C、A2C、以及A3C、...、A5C(A4C未示出))进行变换,以生成与压缩中央声道数字位流800相关联的MDCT系数集820。如上所述,各个MDCT系数集820可从通过连接先前(旧)256样本音频块和当前(新)256样本音频块而形成的512样本音频块中得出。MDCT算法然后可处理时域音频块810(例如,A0C到A5C)以生成MDCT系数集(例如,M0C到M5C)。
在包括将AAS与和5.1声道音频相对应的MAS相混合的应用中,可以优选地将AAS数字位流与MAS 5.1声道音频位流的中央声道相混合。在这种情况下,压缩的中央声道数字位流800对应于图2中的压缩主数字位流220,并可采用图4中的混合装置200来将辅助数字位流210与压缩中央声道数字位流800相混合。混合装置200可按照与以上关于图5和图6描述的处理类似的方式来执行混合操作。例如,基于压缩中央声道数字位流800的MDCT系数集820,获取单元410如上所述地获取多个帧(未示出)以及与各个帧相关联的头信息。头信息包括与压缩中央声道数字位流800相关联的压缩信息。对于各个帧,解包单元420对原始MDCT系数集820进行解包以确定与原始MDCT系数集820相关联的压缩信息。例如,解包单元420可识别原始压缩处理表示各个原始MDCT系数集820中的各个原始MDCT系数的尾数所用的位数。可采用这种压缩信息来如以上关于图5和图6描述地将辅助数字位流210与压缩中央声道数字位流800相混合。修改单元430然后生成经逆变换的时域音频块830,通过示例的方式将其示出为TA0C”、TA1C’、TA1C”、TA2C’、TA2C”以及TA3C’。时域音频块830包括先前(旧)时域音频块(其表示为上撇号块)集和当前(新)时域音频块(其表示为秒号块)集。通过例如基于Princen-Bradley TDAC技术来将对应上撇号块和秒号块相加,可对被压缩以形成压缩中央声道数字位流800的原始时域音频块进行重构以形成重构时域音频块840。例如,修改单元430可将时域音频块TA1C’和TA1C”相加来重构时域音频块A1C(即,TA1CR)。同样,修改单元430可将时域音频块TA2C’和TA2C”相加来重构时域音频块A2C(即,TA2CR)。
为了将辅助数字位流210与压缩中央声道数字位流800相混合,修改单元430将辅助数字位流210与重构时域音频块840相混合以生成混合时域音频块850。例如,修改单元430可将辅助数字位流210混合到重构时域音频块TA1CR中以生成混合时域音频块TA1CX。
基于混合时域音频块850,修改单元430可生成混合MDCT系数集860。例如,修改单元430可将混合时域音频块TA1CX和TA2CX连接起来以生成与混合MDCT系数M1CX相对应的中间混合MDCT系数集M1CI(未示出)。如以上关于图5和图6所讨论的,修改单元430基于中间混合MDCT系数(未示出)修改原始MDCT系数集820来生成对应的混合MDCT系数集860。例如,修改单元430可采用混合MDCT系数集M1CI的理想值来修改MDCT系数集M1C的原始尾数以生成混合MDCT系数集M1CX。再打包单元440然后可对混合MDCT系数集860再打包以生成对应于将辅助数字位流210与压缩中央声道数字位流800相混合的压缩混合数字位流230。
图9到图11示出了表示用于实现图4中的示例混合装置200的示例处理的流程图。在这些示例中,流程图所表示的处理可以由可机读指令集来实现,该可机读指令集可包括由处理器(例如在下面关于图15讨论的示例计算机2000中示出的处理器2020)执行的一个或更多个程序。一个或更多个处理可以用存储在诸如CD-ROM、软盘、硬盘驱动器、DVD或与处理器2020相关联的存储器2030的有形介质上的软件来实现,但是本领域普通技术人员将容易理解,所述一个或更多个程序以及/或者其部分另选地可由除处理器2020以外的装置来执行,并且/或者可以以广为公知的方式用固件或专用硬件来实现。例如,混合装置200、获取单元410、解包单元420、修改单元430和/或再打包单元440中的任一个或全部可由软件、硬件和/或固件的任意组合来实现。此外,尽管参照图9到图11中例示的流程图描述了示例处理,但是本领域普通技术人员将容易理解,可另选地采用实现本文描述的示例方法和装置的很多其他方法。例如,参照图9到图11中例示的流程图,可改变块的执行顺序,并且/或者可对所描述的块的一部分进行改变、删除、组合和/或将其细分为多个块。
图9中示出了例示用以实现图4中的示例混合装置200的示例处理900的流程图。在图9的示例中,示例处理900开始于块905,在块905处获取装置410获取与图2中的非压缩辅助数字位流210(其对应于AAS)相关联的帧(以下在对图9到图11的描述中将其称为“非压缩AAS帧”)。接着,控制进行到块910,在块910处获取单元410获取与压缩主数字位流220(其对应于MAS)相关联的帧(以下在对图9到图11的描述中将其称作“压缩MAS帧”),例如图5中的帧A。获得的压缩MAS帧可包括通过交叠并连接多个音频块而形成的多个原始MDCT系数集。根据AC-3压缩标准,例如,压缩MAS帧可包括六个MDCT系数集(即,六个“音频块”,其中各MDCT系数集对应于一AC-S音频块),例如图5中的原始MDCT系数集520。在块910处获得压缩MAS帧之后,控制进行到块920,在块920处获取单元410还识别与压缩MAS帧相关联的头信息。例如,获取单元410可确定与对应于所获得MAS帧的压缩主数字位流220相关联的声道数。
然后控制进行到块930,在块930处解包单元420对包括在获得的压缩MAS帧中的多个原始MDCT系数集520进行解包,以确定与用来生成压缩MAS帧的原始压缩处理相关联的压缩信息。具体来说,解包单元420识别各原始MDCT系数集520中的各原始MDCT系数mk的尾数Mk和指数Xk。然后按照依照AC-3压缩标准的方式将原始MDCT系数的指数集合起来。解包单元420还确定用来表示各原始MDCT系数的尾数的位数,从而可采用AC-3压缩标准规定的适合量化查找表来如以上关于图6所述地修改多个原始MDCT系数集。然后控制进行到块940以实现修改处理,下面将关于图10对其进行更详细的描述。
如在图10中所例示的,修改处理940开始于块1010,在块1010处修改单元430对原始MDCT系数集520执行逆变换以生成诸如时域音频块530的经逆变换的时域音频块。具体来说,修改单元430生成与用来生成对应原始MDCT系数集的各256样本原始时域音频块530相关联的先前(旧)时域音频块(其例如表示为图5中的上撇号块)和当前(新)时域音频块(其表示为图5中的秒号块)。如以上关于图5所描述的,例如,修改单元430可从MDCT系数集MA5生成TA4”和TA5’、从MDCT系数集MB0生成TA5”和TB0’、并且从MDCT系数集MB1生成TB0”和TB1’。然后控制进行到块1020,在块1020处修改单元430基于例如Princen-Bradley TDAC技术对相应的旧块和新块进行相加来重构时域音频块,以生成重构的时域音频块,例如图5中的重构时域音频块540。根据以上示例,可将旧块TA5’和新块TA5”相加来重构时域音频块A5(即,经重构时域音频块TA5R),同时可将上撇号块TB0’和秒号块TB0”相加来重构时域音频块B0(即,经重构时域音频块TB0R)。
为了将在图9的块905处获得的非压缩AAS帧与在块910处获得的压缩MAS帧相混合,控制进行到块1040,在块1040处修改单元430将非压缩AAS帧与从压缩MAS帧得到的重构时域音频块相混合。例如,修改单元430可将来自非压缩AAS帧的样本加入到重构时域音频块TA5R中,以生成图5中的混合时域音频块TA5X。修改单元430还可在进行相加处理以生成混合时域音频块550之前,衰减与压缩MAS帧或非压缩AAS帧相对应的重构时域音频块中的任一个或两者。然后控制进行到块1050,在块1050处基于混合时域音频块550,修改单元430生成中间混合MDCT系数集,例如图5中的中间混合MDCT系数集560。如上所述,可采用两个混合时域音频块550(其中每一个块都包括256个样本)来生成中间混合MDCT系数集560。例如,可连接混合时域音频块TA5X和TB0X,然后用其来生成中间混合MDCT系数集MA5I。
接着,控制进行到块1060,在块1060处修改单元430基于修改与在图9的块910处获得的压缩MAS帧相对应的原始MDCT系数集520来确定输出混合MDCT系数集570。例如,基于在图9的块930处确定的并与和压缩MAS帧相对应的压缩数字数据流220相关联的压缩信息,修改单元430如以上关于图4至图6所描述地计算与混合MDCT系数集MA5X中的各混合MDCT系数相关联的尾数值。按照这种方式,修改单元430可修改原始MDCT系数集520,以确定表示对应于非压缩AAS帧的辅助数字位流210与对应于压缩MAS帧的压缩主数字位流220的混合的混合MDCT系数集570。根据以上示例,修改单元430可基于中间混合MDCT系数集MA5I来修改原始MDCT系数集MA5以确定混合MDCT系数集MA5X的表示。例如,修改单元430可用中间混合MDCT系数集MA5I中的对应中间混合MDCT系数的量化中间尾数来替代MDCT系数集MA5中的原始MDCT系数的尾数,以生成混合MDCT系数集MA5X中的混合MDCT系数。另选的是,修改单元430可计算与原始MDCT系数相关联的尾数码和与对应的中间混合MDCT系数相关联的尾数码之间的差,并基于该差修改原始MDCT系数以生成输出混合MDCT系数集。在另一情况下,在修改原始MDCT系数集以生成混合MDCT系数集之后,修改处理940结束并返回控制到图9中的块950。
返回到图9,在块950处再打包单元440对混合MDCT系数集570进行再打包以生成压缩混合数字位流230。再打包单元440识别MDCT系数集在帧内的位置,从而可在原始MDCT系数集的位置处代入混合MDCT系数集来重建该帧。然后控制进行到块955,在块955处再打包单元440输出所得再打包的帧以生成压缩混合数字位流230。然后,在块960处,如果混合装置200确定需要处理压缩主数字位流220的另外的帧,则控制返回到块910。然而如果已处理了压缩主数字位流220中的全部帧,则处理900结束。
如上所述,已知的混合技术通常将压缩主数字位流解压缩为非压缩时域样本、将辅助数字位流与非压缩主数字位流相混合、并且将混合时域样本再压缩为压缩混合数字位流。相对的是,在图9的示例处理900中,压缩主数字位流220在本文描述的示例解包、修改以及再打包处理期间保持为压缩。因此,无需另外的解压缩/压缩轮回(这可能劣化压缩混合数字位流230中的内容的质量),就可将辅助数字位流210混合到压缩主数字位流220中。
为了进一步例示图9和图10中的示例修改处理940,图11描述了AC-3数据帧修改处理940的详细流程图,该AC-3数据帧修改处理940用来修改MAS压缩数字位流220的AC-3数据帧以反映MAS数字位流220与AAS数字位流210的混合。示例AC-3数据帧修改处理940开始于块1110,混合装置200的解包单元420读取例如在图9的块930处确定的所获AC-3帧的压缩信息。接着,控制进行到块1120,在块1120处修改单元430将MDCT系数集计数初始化为零。在正在处理AC-3帧的情况下,各AC-3帧包括具有压缩域数据的六个MDCT系数集(例如,图5中的MA0、MA1、MA2、MA3、MA4和MA5,在AC-3标准中它们还公知为“音频块”)。因此,在块1130处,混合装置200的修改单元430确定MDCT系数集计数是否等于六。
如果在块1130处MDCT系数集计数还未等于六,从而表示至少一个以上的MDCT系数集需要进行处理,则控制进行到块1140和1150,在块1140和1150处修改单元430分别提取与对应于MAS压缩数字位流220的AC-3数据帧的原始MDCT系数相关联的指数和尾数(例如,以上关于图6描述的原始尾数Mk)。然后控制进行到块1154,在块1154处修改单元430根据以上图5和图6的示例并基于所提取的尾数和指数,来重构与MAS压缩数字位流220的AC-3数据帧相对应的时域音频块。接着,在块1158处,修改单元430将重构MAS时域音频块与AAS数字位流210的对应音频块相混合。修改单元430可在将对应块相加起来以执行混合处理之前,衰减重构MAS时域音频块或AAS时域音频块中的任一个或两者。需要进行衰减例如来得到MAS的音频内容与AAS的音频内容之间的理想音频幅值关系。在典型的情形下,MAS可被衰减3到10dB的因数,以使得AAS中包括的画外音内容可在MAS的音频内容外被听到。
接着,控制进行到块1160,在块1160处修改单元430计算与在块1158处生成的所得混合时域音频块相关联的新(中间)混合尾数值。然后控制进行到块1170,在块1170处修改单元430通过修改与和MAS压缩数字位流220相对应的AC-3数据帧的原始MDCT系数相关联的原始尾数来生成最终的混合尾数。例如,可通过基于与MAS压缩数字位流220的原始MDCT系数相关联的压缩信息对新混合尾数进行量化来确定最终混合尾数(但是限于与原始尾数的位表示相关联的范围内)。然后控制进行到块1180,在块1180处修改单元430将MDCT系数集计数递增1,控制返回到块1130。
尽管以上描述的图11的示例处理包括六个MDCT系数集(例如,MDCT系数集计数的阈值为六),但是相反可采用使用更多或更少MDCT系数集的处理。然而,在图11的示例中,如果在块1130处MDCT系数集计数等于六,则处理了全部MDCT系数集,使得完成了对当前帧的混合处理。然后控制进行到例如图9的块950以进行后续的处理。
图12描述了另选示例混合装置1200,该示例混合装置1200被配置为将压缩辅助数字位流1210与压缩主数字位流1220相混合以生成所得压缩混合数字位流1230。例如在将本地内容160格式化为压缩数字位流(例如,对应于压缩辅助数字位流1210)并且将广播网络供应商120提供的广播内容格式化为压缩数字位流(例如,对应于压缩主数字位流1220)的情况下,可采用图12中的示例混合装置1200来实现图1中的示例混合装置110。与对图2中的压缩主数字位流220一样,例如可根据诸如AC-3压缩标准和/或MPEG-AAC压缩标准(可采用其中的任一种来利用来自各块的预定数量的数字化样本对音频信号块进行处理)的音频压缩标准来对压缩主数字位流1220和压缩辅助位流1210进行压缩。可以以例如48千赫兹(kHz)的采样率来对压缩数字位流1210和1220的源(未示出)进行采样以形成如以上关于图3和图7的示例描述的音频块。
图13和图14A至图14B示出了表示用于实现图12的示例混合装置1200的示例处理的流程图。在这些示例中,流程图所表示的处理可以由可机读指令集来实现,该可机读指令集可包括由处理器(例如在下面关于图15讨论的示例计算机2000中示出的处理器2020)执行的一个或更多个程序。一个或更多个处理可以用存储在诸如CD-ROM、软盘、硬盘、DVD或与处理器2020相关联的存储器2030的有形介质上的软件来实现,但是本领域普通技术人员将容易理解,所述一个或更多个程序以及/或者其一部分另选地可由除处理器2020以外的装置来执行,并且/或者可以以广为人知的方式用固件或专用硬件来实现。例如,混合装置1200的全部或部分可由软件、硬件和/或固件的任意组合来实现。此外,尽管参照图13和图14A至图14B例示的流程图描述了示例处理,但是本领域普通技术人员将容易理解,可另选地采用实现本文描述的示例方法和装置的很多其他方法。例如,参照图13和图14A至图14B中例示的流程图,可改变块的执行顺序,并且/或者可对所描述的块的一部分进行改变、删除、组合和/或将其细分为多个块。
图13中示出了例示用以实现图12的示例混合装置1200的示例处理1300的流程图。如下面将更详细地描述的,为了在根据图13的示例的压缩域中将与压缩辅助数字位流1210相关联的AAS源和与压缩主数字位流1220相关联的MAS源相组合,在AAS有效期间,将与AAS相关联的压缩音频帧视为主要音频源。然后对MAS音频帧进行解包以获得其MDCT系数。在衰减(通常衰减10dB因数)之后,采用从包括在对应AAS帧中的压缩信息获得的步长对MAS MDCT系数进行重新量化。该量化得到AAS帧中的各MDCT系数的尾数变化值。实现对AAS帧中的AAS尾数的这些变化,得到将较低音量级处的MAS音频信号与AAS音频相混合。经修改的AAS帧然后成为输出压缩数字位流1230。在AAS具有相对窄频谱内容的情况下,通过如图14A至图14B所示在压缩之前将伪噪声信号加入到AAS音频信号中可容纳MAS音频信号的更宽频谱内容。伪噪声的加入使得编码处理(例如,其可通过AC-3编码器来执行)分配更多位来容纳伪噪声信号的更宽频谱内容,因而支持MAS音频信号的频谱内容。
尽管下面对图13的描述主要是针对AC-3压缩位流的,但是图13的示例以及本文描述的任何其他示例都可容易地应用于诸如MPEG-AAC的其他压缩技术。例如,图13总体地例示了包含在如下步骤中的操作:(1)对MAS压缩位流进行解包以生成各MAS“音频块”的MDCT系数(将其表示为AMAS);(2)对AAS压缩位流进行解包以生成各AAS“音频块”的MDCT系数(将其表示为BAAS);(3)将AMAS衰减一因数α以获得MDCT系数αAMAS;(4)通过修改BAAS的尾数来将BAAS和αAMAS相组合;以及(5)对经修改的帧进行再打包并将其输出。
转向图13,示例处理1300使得图12中的示例混合装置1200并行处理来自AAS的AC-3帧和来自MAS的AC-3帧,其中AAS对应于压缩辅助数字位流1210,而MAS对应于压缩主数字位流1220。在AAS的情况下,示例处理1300开始于块1304,在块1304处混合装置1200从压缩辅助数字位流1210获取压缩AAS帧。然后,在块1308处,混合装置1200对包含在压缩AAS帧中的AAS头信息进行解包,来例如确定压缩AAS帧中存在的音频声道数。控制进行到块1312,在块1312处混合装置1200重置表示AAS帧中的AAS MDCT系数集的个数的计数器。接着,在块1316处,混合装置1200确定是否处理了帧中的所有MDCT系数集,这在AC-3编码的情况下对应于六个MDCT系数集。
如果在块1316处混合装置1200确定还没有对所有的MDCT系数集进行处理(例如,在AC-3编码的情况下计数器不等于六),则控制进行到块1320和1324,在块1320和1324处,针对各AAS MDCT系数集(或者,等同地,针对各AAS“音频块”),对相关联的尾数和指数进行解包,并根据对应的经解包的指数来确定系数量化步长。可将各AAS MDCT系数的尾数的量化步长例如存储在存储器(例如,图15中的存储器2030)内的数据结构中。该数据结构还可包含帧中从AAS帧的开始到特定尾数位置的实际位计数。另外或另选的是,可将关于AAS帧对应于长块还是对应于短块的信息存储在该数据结构中。在完成了块1320和1324处的处理之后,控制进行到块1328,在块1328处混合装置1200修改被处理的AAS帧中的各AAS尾数,以反映AAS帧与对应的MAS帧的混合。下面将更详细地描述块1328处执行的处理。在完成了块1328处的处理之后,控制接着进行到块1332,在块1332处混合装置1200递增与AAS帧中的AAS MDCT系数集的个数相对应的计数器。然后控制返回到块1316。
在图13的示例中与AAS并行地被处理的MAS的情况下,示例处理1300开始于块1354,在块1354处混合装置1200从压缩主数字位流1220中获取压缩MAS帧。接着,在块1358处,混合装置1200对包括在压缩MAS帧中的MAS头信息进行解包,以例如确定压缩MAS帧中存在的音频声道的个数。控制进行到块1362,在块1362处混合装置1200重置表示MAS帧中的MAS MDCT系数集的个数的计数器。接着,在块1366处混合装置1200确定是否处理了帧中的所有MDCT系数集,这在AC-3编码的情况下对应于六个MDCT系数集。
如果在块1366处混合装置1200确定还没有对所有的MAS MDCT系数集进行处理(例如,在AC-3编码的情况下计数器不等于六),则控制进行到块1370,在块1370处对MAS帧进行解包以生成与各MASMDCT系数集(或者,等同地,各MAS“音频块”)相对应的MAS MDCT系数集。然后控制进行到块1374,在块1374处将MAS MDCT系数衰减一衰减因数(例如,3与10dB之间的因数)。控制进行到块1378,在块1378处通过将尾数值除以块1320处确定的并且与AAS帧中的对应频率指数相关联的适当量化步长,以确定各衰减MAS MDCT系数的尾数。在块1328处采用这些量化衰减MAS尾数来修改对应的AAS尾数,以反映MAS帧与AAS帧的混合。在完成了块1378处的处理之后,控制接着进行到块1382,在块1382处混合装置1200递增与MAS帧中的MAS MDCT系数集的个数相对应的计数器。然后控制返回到块1366。
然而如果在块1316和1366处混合装置1200分别确定处理了所获得的AAS和MAS帧的所有AAS MDCT系数和MAS MDCT系数,则控制随后进行到块1390,在块1390处混合装置120对经修改的AAS MDCT系数进行再打包以形成混合AC-3音频帧。然后控制进行到块1394,在块1394处混合装置1200输出要包含在压缩混合数字位流1230中的混合AC-3音频帧。
为了更好地理解图13中的示例处理1300执行的处理,考虑如下示例操作,其中以4位来表示在块1328处的AAS MDCT系数,这得到在-1.0到1.0范围内的15级量化的尾数。出于该示例的目的假设AAS MDCT系数的原始尾数值为-4.0/15=-0.2666。然后,根据图6中示出的示例AC-3量化查找表600,与原始AAS尾数相对应的位模式为0101(十进制数5)。接着,出于该示例的目的假设在块1378处确定的经衰减MAS尾数值等于-0.1634。该衰减的MAS尾数值造成对AAS尾数的相应变化,使得在块1328处确定中间(新)修改AAS尾数值等于-0.4300,其在量化查找表600中位于量化值-8/15=-0.5333与-6/15=-0.4之间。值-6/15最接近于中间修改AAS尾数值-0.4300,因此在块1328处选择位模式0100(十进制数4)来替代用于表示原始AAS尾数的原始码,以生成所得混合MDCT系数。
在以上示例中,如果在块1328处确定的中间修改尾数值位于可选尾数值范围以外(例如,在量化表600中的±14/15范围之外),则适当地由与可选尾数值的正限或负限相对应的位模式来表示由块1328输出的尾数。另选的是,可以改变指数来得到更小的所需尾数值,但是这种指数变化是所不希望的,因为这将需要重复包括掩蔽计算在内的整个编码/压缩算法。此外,由于将混合尾数值限于许可上限和下限范围内而造成的任何误差都可能对MAS的音频质量造成可以忽略的影响。具体来说,在画外音混合中,由于将MAS的音频级衰减到相对较低的值,所以由于对尾数值改变的强制限制导致的误差通常对音频质量具有相对可忽略的影响。
在一些情况下,AAS主要是频谱范围主要限于低频段的语音信号,由此可采用相对较少的位来表示更高频率分量。在这种情况下,例如主要是音乐并且较高频谱内容丰富的MAS可能由于AAS采用的量化处理而导致较高频谱能量的损失。图14A至图14B分别例示了改进处理1400和1450,它们可用来通过在压缩之前将已知的伪白噪声与时域AAS信号相混合来人工地提高AAS音频的频谱保真度。由于所加入的伪白噪声,AC-3编码器将在可用来表示MAS音频的较高频谱内容的较宽频谱范围上分配更多的尾数位,由此减少对音频质量的影响。在混合处理期间,可通过适当的减法处理来消除已知的伪白噪声的影响。
转向图14A,处理1400对时域AAS信号进行操作,并开始于块1404,在块1404处,处理1400确定要加入到时域AAS信号中的伪噪声时域样本。伪噪声样本可通过处理1400基于任何已知的伪噪声生成算法来生成,或者通过处理1400预先生成、存储在存储器(例如,图15中的存储器2030)中,并从该存储器中读取。可生成拥有频谱范围比由处理1400处理的时域AAS信号更宽的频谱特性的伪噪声样本。接着,在块1408处,处理1400将伪噪声时域样本加入到AAS时域样本中。最后,控制进行到块1412,在块1412处,处理1400对由将伪噪声时域样本加入到原始AAS时域信号中而得到的时域信号进行压缩。在处理了全部AAS时域样本后,处理1400结束。
转向图14B,将对图13中的示例处理1300的改进例示为要在处理1300的块1374和1378之间执行的块1450。块1450用来取消在图14A的示例处理1400的块1408处加入伪噪声时域样本的效果。在图14B中,在块1374处衰减了MAS MDCT系数之后,控制处理1300进行到块1450。在块1450处,作为由处理1300的块1378和1328执行的混合处理的一部分,从经衰减的MAS MDCT系数中减去伪噪声样本的影响以使得去除伪噪声。本领域普通技术人员将理解,可通过很多方式从经衰减的MASMDCT系数中减去伪噪声样本的影响。在一个示例中,可将已知的伪噪声时域样本存储在图12的混合装置1200中,使得混合装置可适当地对经时间对准的伪噪声样本进行MDCT变换,来生成要从经衰减的MASMDCT系数中减去的伪噪声MDCT系数。在另一示例中,混合装置1220可存储与伪噪声样本的平均频谱特性相对应的平均伪噪声MDCT系数集,由此缓解对实时计算伪噪声MDCT系数或实现时间对准以选择用于MDCT变换的适当伪噪声样本的需求。在任何情况下,在块1450处从MAS MDCT系数中减去伪噪声样本的影响之后,控制进行到块1378及其之后的块,以实现以上关于图13描述的混合处理。
图15是可用来实现本文所公开的方法和装置的示例处理器系统2000的框图。处理器系统2000可以是台式计算机、膝上型计算机、笔记本计算机、个人数字助理(PDA)、服务器、因特网设备或任何其他类型的计算设备。
图15中例示的处理器系统2000包括芯片组2010,芯片组2010包括存储器控制器2012和输入/输出(I/O)控制器2014。如广为公知的,芯片组通常提供存储器和I/O管理功能,以及可由处理器2020访问或使用的多个通用和/或专用寄存器、定时器等。采用一个或更多个处理器来实现处理器2020。在另选情况下,可采用其他处理技术来实现处理器2020。处理器2020包括缓冲存储器2022,该缓冲存储器2022可采用一级统一缓冲存储器(L1)、二级统一缓冲存储器(L2)、三级统一缓冲存储器(L3)、以及/或者任何其他适合存储数据的结构来实现。
常规上,存储器控制器2012执行如下功能:使得处理器2020能够经由总线2040访问包括易失性存储器2032和非易失性存储器2034的主存储器2030,并与之通信。易失性存储器2032可通过同步动态随机存取存储器(SDRAM)、动态随机存取存储器(DRAM)、RAMBUS动态随机存取存储器(RDRAM)、和/或任何其他类型的随机存取存储器设备来实现。非易失性存储器2034可使用闪存、只读存储器(ROM)、电子可擦写可编程只读存储器(EEPROM)、和/或任何其他理想类型的存储器设备来实现。
处理器系统2000还包括连接到总线2040的接口电路2050。该接口电路2050可采用诸如以太网接口、通用串行总线(USB)、第三代输入/输出接口(3GIO)接口、和/或任何其他适合类型接口的任何类型的已知接口标准来实现。
一个或更多个输入设备2060连接到接口电路2050。输入设备2060允许用户输入数据和命令到处理器2020中。例如,输入设备2060可由键盘、鼠标、触敏显示器、跟踪板、跟踪球、isopoint、和/或语音识别系统来实现。
一个或更多个输出设备2070也连接到接口电路2050。例如,输出设备2070可由媒体呈现设备(例如,发光显示器(LED)、液晶显示器(LCD)、阴极射线管(CRT)显示器、打印机和/或扬声器)来实现。接口电路2050由此通常除其他事物之外还包括图形驱动器卡。
处理器系统2000还包括一个或更多个大容量存储设备2080来存储软件和数据。这种大容量存储设备2080的示例包括软盘和驱动器、硬盘驱动器、光盘和驱动器、以及数字多功能盘(DVD)和驱动器。
接口电路2050还包括诸如调制解调器或网络接口卡的通信设备,以便于经由网络与外部计算机交换数据。处理器系统2000与网络之间的通信链接可以是任意类型的网络连接,例如以太网连接、数字用户线(DSL)、电话线、蜂窝式电话系统、同轴线缆等。
对输入设备2060、输出设备2070、大容量存储设备2080和/或网络的访问通常是由I/O控制器2014按照传统方式控制的。具体来说,I/O控制器2014执行以下功能,即,使得处理器2020能够经由总线2040和接口电路2050与输入设备2060、输出设备2070、大容量存储设备2080和/或网络进行通信。
尽管在处理器系统2000内将图15中示出的组件描述为分立的块,但也可将由这些块中的一些执行的功能集成在单个半导体电路内,或者可采用两个或更多个分立的集成电路来实现。例如,尽管在芯片组2010内将存储器控制器2012和I/O控制器2014描述为分立的块,但也可将存储器控制器2012和I/O控制器2014集成在单个半导体电路内。
本文公开的方法和装置尤其适用于按照AC-3标准执行的数字位流。然而,本文公开的方法和装置可应用于其他数字音频编码技术。
另外,尽管本公开是针对示例电视和无线电广播系统而做出的,但是应当理解,所公开的系统可容易地应用于很多其他媒体系统。因此,尽管本公开描述了示例系统和处理,但是所公开的示例也并非实现这种系统的唯一方式。
尽管本文描述了特定示例方法、装置及制造品,但是本专利的覆盖范围并不限于此。相反,本专利覆盖字面上或在等同原则下完全落入所附权利要求范围内的所有方法、装置及制造品。例如,尽管本公开描述了除了其他组件还包括在硬件上执行的软件的示例系统,但是应当注意,这种系统仅仅是例示性的,且不应被视为限制。具体来说,应当想到,所公开的硬件和软件组件中的任一个或全部可完全由专用硬件、完全由固件、完全由软件、或者由硬件、固件和/或软件的某种组合来实现。
本专利要求于2004年7月2提交的题为“压缩位流的混合系统及方法”且序列号为60/585115的美国临时申请和于2004年7月8日提交的题为“压缩位流的混合系统及方法”且序列号为60/586354的美国临时申请的优先权。本申请还涉及于2004年6月14日提交的题为“嵌入水印的方法及装置”的第PCT/US04/18953号国际专利申请。在此通过引用并入序列号为60/585115的美国临时申请、序列号为60/586354的美国临时申请和第PCT/US04/18953号国际专利申请的全部内容。

Claims (62)

1、一种用于将第一压缩数字位流与第二数字位流相混合的方法,该方法包括以下步骤:
获取与所述第一压缩数字位流相关联的帧;
对所述帧进行解包以获得多个原始变换系数集;以及
修改所述多个原始变换系数集以将所述第二数字位流与所述第一压缩数字位流相混合。
2、根据权利要求1所述的方法,其中,所述修改所述多个原始变换系数集的步骤包括:
确定与多个混合变换系数集之一的混合变换系数相关联的第一尾数码;并且
用与所述混合变换系数相关联的所述第一尾数码来代替与所述多个原始变换系数集之一的对应原始变换系数相关联的第二尾数码。
3、根据权利要求2所述的方法,其中,所述确定与多个混合变换系数集之一的混合变换系数相关联的第一尾数码的步骤包括:
确定与所述多个原始变换系数集之一的对应原始变换系数相关联的量化步长;
基于将和所述第一压缩数字位流相关联的元素与和所述第二数字位流相关联的元素相组合,来生成所述混合变换系数;
基于所述量化步长来对所述混合变换系数进行量化以生成量化尾数;并且
基于所述量化尾数来确定与所述混合变换系数相关联的所述第一尾数码。
4、根据权利要求3所述的方法,其中,所述量化步长基于与所述对应原始变换系数相关联的指数。
5、根据权利要求3所述的方法,其中,所述将和所述第一压缩数字位流相关联的元素与和所述第二数字位流相关联的元素相组合的步骤包括:将和所述第一压缩数字位流相关联的所述元素与和所述第二数字位流相关联的所述元素相加。
6、根据权利要求5所述的方法,该方法进一步包括以下步骤:在将所述第一压缩数字位流的所述元素和所述第二数字位流的所述元素相加之前,对所述第一压缩数字位流的所述元素或所述第二数字位流的所述元素中的至少一个进行衰减。
7、根据权利要求1所述的方法,其中,所述修改所述多个原始变换系数集的步骤包括:
基于所述多个原始变换系数集来生成多个时域音频块;
基于所述多个时域音频块来生成多个重构音频块;并且
基于所述多个重构音频块和所述第二数字位流来生成多个混合音频块。
8、根据权利要求7所述的方法,其中,所述基于所述多个时域音频块来生成多个重构音频块的步骤包括:基于第一时域音频块和第二时域音频块来生成重构时域音频块。
9、根据权利要求8所述的方法,其中,所述基于第一时域音频块和第二时域音频块生成重构时域音频块的步骤包括:将所述第一时域音频块与所述第二时域音频块相加。
10、根据权利要求1所述的方法,其中,所述修改多个变换系数集的步骤包括:基于多个混合变换系数集来修改所述多个原始变换系数集。
11、根据权利要求10所述的方法,该方法进一步包括:通过基于与所述第一压缩数字位流相关联的压缩信息确定与所述多个混合变换系数集中的每一个的混合变换系数相关联的尾数码,来生成多个混合系数集。
12、根据权利要求1所述的方法,其中,所述多个原始变换系数集中的每一个都包括一个或更多个改进离散余弦变换系数。
13、根据权利要求1所述的方法,其中,所述第一压缩数字位流是根据音频压缩标准进行压缩的。
14、根据权利要求1所述的方法,其中,所述获取与所述第一压缩数字位流相关联的帧的步骤包括:获取与多个音频声道中的至少一个相关联的音频块。
15、根据权利要求1所述的方法,其中,所述对所述帧进行解包以获得多个原始变换系数集的步骤包括:确定与所述第一压缩数字位流相关联的压缩信息。
16、根据权利要求1所述的方法,该方法进一步包括基于多个混合变换系数集对所述帧进行再打包。
17、根据权利要求1所述的方法,其中,所述第一压缩数字位流对应于主音频服务,所述第二数字位流对应于辅助音频服务。
18、根据权利要求1所述的方法,其中,所述第二数字位流是经压缩的。
19、根据权利要求18所述的方法,其中,在压缩之前将伪噪声信号加入到所述第二数字位流中。
20、根据权利要求19所述的方法,其中,所述修改所述多个原始变换系数集的步骤包括:
确定与多个伪噪声变换系数集之一的伪噪声变换系数相关联的第一尾数码;并且
基于所述第一尾数码修改与所述多个原始变换系数集之一的对应原始变换系数相关联的第二尾数码。
21、根据权利要求20所述的方法,其中,所述多个伪噪声变换系数集是基于所述伪噪声信号的平均频谱特性来确定的。
22、一种数据流混合装置,该数据流混合装置包括:
获取单元,用于获取与第一压缩数字数据流相关联的帧;
解包单元,用于对所述帧进行解包以获得多个原始变换系数集;以及
修改单元,用于修改所述多个原始变换系数集以将第二数字数据流与所述第一压缩数字数据流相混合。
23、根据权利要求22所述的数据流混合装置,其中,所述修改单元被配置为:
确定与多个混合变换系数集之一的混合变换系数相关联的第一尾数码;并且
用与所述混合变换系数相关联的所述第一尾数码来代替与所述多个变换系数集之一的对应原始变换系数相关联的第二尾数码。
24、根据权利要求23所述的数据流混合装置,其中,所述修改单元被配置为:
确定与所述多个原始变换系数集之一的对应原始变换系数相关联的量化步长;
基于和所述第一压缩数字数据流相关联的元素与和所述第二数字数据流相关联的元素的组合,来生成所述混合变换系数;
基于所述量化步长来对所述混合变换系数进行量化以生成量化尾数;并且
基于所述量化尾数来确定与所述混合变换系数相关联的所述第一尾数码。
25、根据权利要求24所述的数据流混合装置,其中,所述量化步长基于与所述对应原始变换系数相关联的指数。
26、根据权利要求24所述的数据流混合装置,其中,和所述第一压缩数字数据流相关联的元素与和所述第二数字数据流相关联的元素的组合包括:将和所述第一压缩数字数据流相关联的所述元素与和所述第二数字数据流相关联的所述元素相加。
27、根据权利要求26所述的数据流混合装置,其中,和所述第一压缩数字数据流相关联的元素与和所述第二数字数据流相关联的元素的组合进一步包括:在将和所述第一压缩数字数据流相关联的所述元素与和所述第二数字数据流相关联的所述元素相加之前,对和所述第一压缩数字数据流相关联的所述元素或和所述第二数字数据流相关联的所述元素中的至少一个进行衰减。
28、根据权利要求22所述的数据流混合装置,其中,所述修改单元被配置为:
基于所述多个原始变换系数集来生成多个时域音频块;
基于所述多个时域音频块来生成多个重构音频块;并且
基于所述多个重构音频块和所述第二数字数据流来生成多个混合音频块。
29、根据权利要求28所述的数据流混合装置,其中,所述修改单元被配置为:基于所述多个时域音频块中的第一时域音频块和第二时域音频块来生成所述多个重构音频块中的一重构时域音频块。
30、根据权利要求29所述的数据流混合装置,其中,所述修改单元被配置为:将所述第一时域音频块和所述第二时域音频块相加以生成重构时域音频块。
31、根据权利要求22所述的数据流混合装置,其中,所述修改单元被配置为基于多个混合变换系数集来修改所述多个原始变换系数集。
32、根据权利要求31所述的数据流混合装置,其中,所述修改单元进一步被配置为:基于所述第二数字数据流和与所述第一压缩数字数据流相关联的压缩信息,来生成所述多个混合变换系数集。
33、根据权利要求22所述的数据流混合装置,其中,所述多个原始变换系数集中的每一个都包括一个或更多个改进离散余弦变换系数。
34、根据权利要求22所述的数据流混合装置,其中,所述第一压缩数字数据流是根据音频压缩标准进行压缩的。
35、根据权利要求22所述的数据流混合装置,其中,所述获取单元被配置为获取与多个音频声道相关联的音频块。
36、根据权利要求22所述的数据流混合装置,其中,所述解包单元被配置为获得与所述第一压缩数字数据流相关联的压缩信息。
37、根据权利要求22所述的数据流混合装置,其中,所述第一压缩数字数据流与主音频服务相关联,所述第二数字数据流与辅助音频服务相关联。
38、根据权利要求22所述的数据流混合装置,该数据流混合装置进一步包括再打包单元,该再打包单元用于基于多个混合变换系数集对所述帧进行再打包。
39、一种存储有可机读指令的制造品,所述可机读指令在执行时使得机器进行以下操作:
获取与第一压缩数字位流相关联的帧;
对所述帧进行解包以获得多个原始变换系数集;以及
修改所述多个原始变换系数集以将第二数字位流与所述第一压缩数字位流相混合。
40、根据权利要求39所述的制造品,其中,所述指令在执行时使得所述机器通过以下步骤来修改所述多个原始变换系数集:
确定与多个混合变换系数集之一的混合变换系数相关联的第一尾数码;并且
用与所述混合变换系数相关联的所述第一尾数码来代替与所述多个原始变换系数集之一的对应原始变换系数相关联的第二尾数码。
41、根据权利要求40所述的制造品,其中,所述指令在执行时使得所述机器通过以下步骤来确定与所述多个混合变换系数集之一的混合变换系数相关联的第一尾数码:
确定与所述多个原始变换系数集之一的对应原始变换系数相关联的量化步长;
基于将和所述第一压缩数字位流相关联的元素与和所述第二数字位流相关联的元素相组合,来生成所述混合变换系数;
基于所述量化步长来对所述混合变换系数进行量化以生成量化尾数;并且
基于所述量化尾数来确定与所述混合变换系数相关联的第一尾数码。
42、根据权利要求39所述的制造品,其中,所述指令在执行时使得所述机器通过以下步骤来修改所述多个原始变换系数集:
基于所述多个原始变换系数集来生成多个时域音频块;
基于所述多个时域音频块来生成多个重构音频块;并且
基于所述多个重构音频块和所述第二数字位流来生成多个混合音频块。
43、根据权利要求39所述的制造品,其中,所述指令在执行时进一步使得所述机器执行以下操作:通过基于与所述第一压缩数字位流相关联的压缩信息确定与多个混合系数集中的每一个的混合变换系数相关联的尾数码,来生成所述多个混合系数集。
44、根据权利要求39所述的制造品,其中,所述指令在执行时进一步使得所述机器执行以下操作:通过获取与多个音频声道中的至少一个相关联的音频块,来获取与所述第一压缩数字位流相关联的帧。
45、根据权利要求39所述的制造品,其中,所述指令使得所述机器执行以下操作:通过识别与所述第一压缩数字位流相关联的压缩信息,对所述帧进行解包以获得所述多个原始变换系数集。
46、根据权利要求39所述的制造品,其中,所述指令在执行时进一步使得所述机器执行以下操作:基于多个混合变换系数集对所述帧进行再打包。
47、根据权利要求39所述的制造品,其中,所述第一压缩数字位流与主音频服务相关联,所述第二数字位流与辅助音频服务相关联。
48、一种用于混合数字数据流的系统,该系统包括:
第一源,用于提供第一压缩数字数据流;
第二源,用于提供第二数字数据流;以及
混合装置,用于无需对所述第一压缩数字数据流进行解压缩地将所述第二数字数据流与所述第一压缩数字数据流相混合。
49、根据权利要求48所述的系统,其中,所述第一压缩数字数据流包括多个变换系数。
50、根据权利要求49所述的系统,其中,所述混合装置被配置为基于所述第二数字数据流修改所述多个变换系数。
51、根据权利要求50所述的系统,其中,所述多个变换系数包括相应的多个原始尾数和原始指数,所述混合装置被配置为仅修改所述多个原始尾数以修改所述多个变换系数。
52、根据权利要求51所述的系统,其中,所述多个变换系数是多个原始变换系数,所述混合装置被配置为:通过基于所述第二数字数据流和与所述第一压缩数字数据流相关联的压缩信息确定多个混合变换系数,来修改所述多个原始变换系数。
53、根据权利要求52所述的系统,其中,所述压缩信息包括至少一个量化步长。
54、根据权利要求52所述的系统,其中,确定所述多个混合变换系数包括对与所述多个混合变换系数相关联的多个混合尾数进行量化。
55、根据权利要求54所述的系统,其中,所述混合装置被配置为:基于所述多个量化混合尾数和所述压缩信息来修改所述多个原始尾数。
56、根据权利要求48所述的系统,其中,所述第一压缩数字数据流是根据音频压缩标准来压缩的。
57、根据权利要求48所述的系统,其中,所述第一压缩数字数据流与主音频服务相关联,所述第二数字数据流与辅助数据服务相关联。
58、根据权利要求48所述的系统,其中,所述第二数字数据流是非压缩的。
59、一种用于将第一压缩数字数据流与第二数字数据流相组合的方法,该方法包括以下步骤:
获取与所述第一压缩数字数据流相关联的帧;
对所述帧进行解包以获得多个原始变换系数集;以及
修改所述多个原始变换系数集以将所述第二数字数据流与所述第一压缩数字数据流相组合。
60、根据权利要求59所述的方法,其中,所述组合包括混合,并且其中,所述修改所述多个原始变换系数集以将所述第二数字数据流与所述第一压缩数字数据流相组合的步骤包括:修改所述多个原始变换系数集以将所述第二数字数据流与所述第一压缩数字数据流相混合。
61、根据权利要求59所述的方法,其中,所述修改所述多个原始变换系数集的步骤包括:
确定与多个混合变换系数集之一的混合变换系数相关联的第一尾数码;并且
用与所述混合变换系数相关联的所述第一尾数码来代替与所述多个原始变换系数集之一的对应原始变换系数相关联的第二尾数码。
62、根据权利要求59所述的方法,其中,所述多个原始变换系数集中的每一个都包括一个或更多个改进离散余弦变换系数。
CN2005800261072A 2004-07-02 2005-06-29 用于进行压缩数字位流的混合的方法及装置 Active CN1993700B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US58511504P 2004-07-02 2004-07-02
US60/585,115 2004-07-02
US58635404P 2004-07-08 2004-07-08
US60/586,354 2004-07-08
PCT/US2005/023578 WO2006014362A1 (en) 2004-07-02 2005-06-29 Methods and apparatus for mixing compressed digital bit streams

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2011104605866A Division CN102592638A (zh) 2004-07-02 2005-06-29 用于进行压缩数字位流的混合的方法及装置

Publications (2)

Publication Number Publication Date
CN1993700A true CN1993700A (zh) 2007-07-04
CN1993700B CN1993700B (zh) 2012-03-14

Family

ID=35787402

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2011104605866A Pending CN102592638A (zh) 2004-07-02 2005-06-29 用于进行压缩数字位流的混合的方法及装置
CN2005800261072A Active CN1993700B (zh) 2004-07-02 2005-06-29 用于进行压缩数字位流的混合的方法及装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2011104605866A Pending CN102592638A (zh) 2004-07-02 2005-06-29 用于进行压缩数字位流的混合的方法及装置

Country Status (10)

Country Link
US (2) US8412363B2 (zh)
EP (1) EP1779297A4 (zh)
KR (1) KR101087588B1 (zh)
CN (2) CN102592638A (zh)
AU (1) AU2005270105B2 (zh)
CA (1) CA2572622A1 (zh)
HK (1) HK1106047A1 (zh)
MX (1) MX2007000076A (zh)
NZ (1) NZ552644A (zh)
WO (1) WO2006014362A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106464713A (zh) * 2014-05-02 2017-02-22 华为技术有限公司 用于分层压缩的系统和方法

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6614914B1 (en) 1995-05-08 2003-09-02 Digimarc Corporation Watermark embedder and reader
US6871180B1 (en) 1999-05-25 2005-03-22 Arbitron Inc. Decoding of information in audio signals
US7460684B2 (en) 2003-06-13 2008-12-02 Nielsen Media Research, Inc. Method and apparatus for embedding watermarks
US20070183507A1 (en) * 2004-02-19 2007-08-09 Koninklijke Philips Electronics N.V. Decoding scheme for variable block length signals
US8738763B2 (en) 2004-03-26 2014-05-27 The Nielsen Company (Us), Llc Research data gathering with a portable monitor and a stationary device
AU2005270105B2 (en) 2004-07-02 2011-03-31 Nielsen Media Research, Inc. Methods and apparatus for mixing compressed digital bit streams
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
CN101322344B (zh) 2005-10-21 2013-01-02 尼尔逊媒介研究股份有限公司 用于计量便携式媒体播放器的方法和装置
EP1964438B1 (en) * 2005-12-13 2010-02-17 Nxp B.V. Device for and method of processing an audio data stream
AU2006327157B2 (en) 2005-12-20 2013-03-07 Arbitron Inc. Methods and systems for conducting research operations
EP3010167B1 (en) 2006-03-27 2017-07-05 Nielsen Media Research, Inc. Methods and systems to meter media content presented on a wireless communication device
AU2007272440A1 (en) 2006-07-12 2008-01-17 Arbitron Inc. Methods and systems for compliance confirmation and incentives
EP2095560B1 (en) 2006-10-11 2015-09-09 The Nielsen Company (US), LLC Methods and apparatus for embedding codes in compressed audio data streams
EP2116051A2 (en) 2007-01-12 2009-11-11 ActiveVideo Networks, Inc. Mpeg objects and systems and methods for using mpeg objects
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
CA3144408C (en) 2007-01-25 2023-07-25 Arbitron Inc. Research data gathering
EP2212775A4 (en) 2007-10-06 2012-01-04 Fitzgerald Joan G COLLECTION OF RESEARCH DATA
AU2008347134A1 (en) 2007-12-31 2009-07-16 Arbitron, Inc. Survey data acquisition
US8930003B2 (en) 2007-12-31 2015-01-06 The Nielsen Company (Us), Llc Data capture bridge
KR101053161B1 (ko) * 2009-07-22 2011-08-02 주식회사 엠씨넥스 H.264/avc 압축 영역에서의 동영상 합성 방법 및 장치
US8194862B2 (en) 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
EP2628306B1 (en) 2010-10-14 2017-11-22 ActiveVideo Networks, Inc. Streaming digital video between video devices using a cable television system
EP2695388B1 (en) 2011-04-07 2017-06-07 ActiveVideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
US9332363B2 (en) 2011-12-30 2016-05-03 The Nielsen Company (Us), Llc System and method for determining meter presence utilizing ambient fingerprints
EP2815582B1 (en) 2012-01-09 2019-09-04 ActiveVideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
US9373335B2 (en) 2012-08-31 2016-06-21 Dolby Laboratories Licensing Corporation Processing audio objects in principal and supplementary encoded audio signals
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
US9325381B2 (en) 2013-03-15 2016-04-26 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to monitor mobile devices
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
EP3005712A1 (en) 2013-06-06 2016-04-13 ActiveVideo Networks, Inc. Overlay rendering of user interface onto source video
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
EP2830058A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP3123469B1 (en) * 2014-03-25 2018-04-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks

Family Cites Families (183)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4675750A (en) 1984-10-30 1987-06-23 Fuji Photo Film Co., Ltd. Video compression system
NL8901032A (nl) 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5532732A (en) 1988-12-23 1996-07-02 Gemstar Development Corporation Apparatus and methods for using compressed codes for monitoring television program viewing
US5319453A (en) 1989-06-22 1994-06-07 Airtrax Method and apparatus for video signal encoding, decoding and monitoring
EP0498617B1 (en) 1991-02-07 1998-05-06 Matsushita Electric Industrial Co., Ltd. Digital signal transmitting and reproducing method and apparatus therefor
EP0506394A2 (en) 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
US5349549A (en) 1991-09-30 1994-09-20 Sony Corporation Forward transform processing apparatus and inverse processing apparatus for modified discrete cosine transforms, and method of performing spectral and temporal analyses including simplified forward and inverse orthogonal transform processing
US5724091A (en) 1991-11-25 1998-03-03 Actv, Inc. Compressed digital data interactive program system
US5455630A (en) 1993-08-06 1995-10-03 Arthur D. Little Enterprises, Inc. Method and apparatus for inserting digital data in a blanking interval of an RF modulated video signal
US5493339A (en) 1993-01-21 1996-02-20 Scientific-Atlanta, Inc. System and method for transmitting a plurality of digital services including compressed imaging services and associated ancillary data services
US5745184A (en) 1993-08-20 1998-04-28 Thomson Consumer Electronics, Inc. Closed caption system for use with compressed digital video transmission
US5598228A (en) 1993-09-08 1997-01-28 Sony Corporation Channel selection in a digital television receiver
JPH07212712A (ja) 1993-10-29 1995-08-11 Eastman Kodak Co 階層的な画像記憶及び取出しシステムにおいてディジタル透かし模様を付加及び除去する方法及び装置
US5768426A (en) 1993-11-18 1998-06-16 Digimarc Corporation Graphics processing system employing embedded code signals
US5748783A (en) 1995-05-08 1998-05-05 Digimarc Corporation Method and apparatus for robust information coding
US6611607B1 (en) 1993-11-18 2003-08-26 Digimarc Corporation Integrating digital watermarks in multimedia content
US7720249B2 (en) 1993-11-18 2010-05-18 Digimarc Corporation Watermark embedder and reader
US5748763A (en) 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US6574350B1 (en) 1995-05-08 2003-06-03 Digimarc Corporation Digital watermarking employing both frail and robust watermarks
US5583562A (en) * 1993-12-03 1996-12-10 Scientific-Atlanta, Inc. System and method for transmitting a plurality of digital services including imaging services
EP0691052B1 (en) 1993-12-23 2002-10-30 Koninklijke Philips Electronics N.V. Method and apparatus for encoding multibit coded digital sound through subtracting adaptive dither, inserting buried channel bits and filtering, and encoding apparatus for use with this method
US5588022A (en) 1994-03-07 1996-12-24 Xetron Corp. Method and apparatus for AM compatible digital broadcasting
US5450490A (en) 1994-03-31 1995-09-12 The Arbitron Company Apparatus and methods for including codes in audio signals and decoding
PL183573B1 (pl) 1994-03-31 2002-06-28 Arbitron Co System do kodowania i system do dekodowania sygnału dźwiękowego
AU2390895A (en) 1994-04-20 1995-11-16 Shoot The Moon Products, Inc. Method and apparatus for nesting secondary signals within a television signal
DE4415288A1 (de) 1994-04-30 1995-11-02 Ant Nachrichtentech Verfahren zur Aufbereitung und Wiedergewinnung von Daten sowie Anordnung hierzu
US5539471A (en) 1994-05-03 1996-07-23 Microsoft Corporation System and method for inserting and recovering an add-on data signal for transmission with a video signal
US5621471A (en) 1994-05-03 1997-04-15 Microsoft Corporation System and method for inserting and recovering an add-on data signal for transmission with a video signal
US5574952A (en) 1994-05-11 1996-11-12 International Business Machines Corporation Data storage system and method for operating a disk controller including allocating disk space for compressed data
US5739864A (en) 1994-08-24 1998-04-14 Macrovision Corporation Apparatus for inserting blanked formatted fingerprint data (source ID, time/date) in to a video signal
KR0160668B1 (ko) 1994-12-30 1999-01-15 김광호 영상압축 비트스트림의 스타트코드 검출장치
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
US5600366A (en) 1995-03-22 1997-02-04 Npb Partners, Ltd. Methods and apparatus for digital advertisement insertion in video programming
US5727092A (en) 1995-05-17 1998-03-10 The Regents Of The University Of California Compression embedding
US5778102A (en) 1995-05-17 1998-07-07 The Regents Of The University Of California, Office Of Technology Transfer Compression embedding
US5778096A (en) 1995-06-12 1998-07-07 S3, Incorporated Decompression of MPEG compressed data in a computer system
JP3692164B2 (ja) 1995-06-20 2005-09-07 ユナイテッド・モジュール・コーポレーション Mpegデコーダ
JPH0969783A (ja) * 1995-08-31 1997-03-11 Nippon Steel Corp オーディオデータ符号化装置
EP0766468B1 (en) 1995-09-28 2006-05-03 Nec Corporation Method and system for inserting a spread spectrum watermark into multimedia data
US5867819A (en) 1995-09-29 1999-02-02 Nippon Steel Corporation Audio decoder
US5852800A (en) 1995-10-20 1998-12-22 Liquid Audio, Inc. Method and apparatus for user controlled modulation and mixing of digitally stored compressed data
JP3050781B2 (ja) * 1995-10-20 2000-06-12 日本碍子株式会社 被測定ガス中の所定ガス成分の測定方法及び測定装置
US5687191A (en) * 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
US5822432A (en) 1996-01-17 1998-10-13 The Dice Company Method for human-assisted random key generation and application for digital watermark system
US6512796B1 (en) 1996-03-04 2003-01-28 Douglas Sherwood Method and system for inserting and retrieving data in an audio signal
EP0875107B1 (de) 1996-03-07 1999-09-01 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
US5801782A (en) 1996-03-21 1998-09-01 Samsung Information Systems America Analog video encoder with metered closed caption data on digital video input interface
US5870754A (en) 1996-04-25 1999-02-09 Philips Electronics North America Corporation Video retrieval of MPEG compressed sequences using DC and motion signatures
US6229924B1 (en) 1996-05-16 2001-05-08 Digimarc Corporation Method and apparatus for watermarking video images
US6381341B1 (en) 1996-05-16 2002-04-30 Digimarc Corporation Watermark encoding method exploiting biases inherent in original signal
US6061793A (en) 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
US6069914A (en) 1996-09-19 2000-05-30 Nec Research Institute, Inc. Watermarking of image data using MPEG/JPEG coefficients
US5848155A (en) 1996-09-04 1998-12-08 Nec Research Institute, Inc. Spread spectrum watermark for embedded signalling
US5917830A (en) 1996-10-18 1999-06-29 General Instrument Corporation Splicing compressed packetized digital video streams
US5915027A (en) 1996-11-05 1999-06-22 Nec Research Institute Digital watermarking
JP3106985B2 (ja) 1996-12-25 2000-11-06 日本電気株式会社 電子すかし挿入装置及び検出装置
JP3349910B2 (ja) 1997-02-12 2002-11-25 日本電気株式会社 画像データエンコードシステム
CA2227381C (en) 1997-02-14 2001-05-29 Nec Corporation Image data encoding system and image inputting apparatus
AUPO521897A0 (en) 1997-02-20 1997-04-11 Telstra R & D Management Pty Ltd Invisible digital watermarks
JP3137022B2 (ja) 1997-02-24 2001-02-19 日本電気株式会社 動画像エンコード装置
US5982436A (en) 1997-03-28 1999-11-09 Philips Electronics North America Corp. Method for seamless splicing in a video encoder
JPH118753A (ja) 1997-06-18 1999-01-12 Nec Corp 電子透かし挿入装置
US6181711B1 (en) 1997-06-26 2001-01-30 Cisco Systems, Inc. System and method for transporting a compressed video and data bit stream over a communication channel
US6266419B1 (en) * 1997-07-03 2001-07-24 At&T Corp. Custom character-coding compression for encoding and watermarking media content
JP4045381B2 (ja) 1997-08-29 2008-02-13 ソニー株式会社 映像信号への付加情報の重畳方法および装置
JP4003096B2 (ja) 1997-09-01 2007-11-07 ソニー株式会社 映像信号への付加情報の重畳方法および重畳装置
US6208735B1 (en) 1997-09-10 2001-03-27 Nec Research Institute, Inc. Secure spread spectrum watermarking for multimedia data
US6330672B1 (en) 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
US6029045A (en) 1997-12-09 2000-02-22 Cogent Technology, Inc. System and method for inserting local content into programming content
US6373960B1 (en) 1998-01-06 2002-04-16 Pixel Tools Corporation Embedding watermarks into compressed video data
US6839674B1 (en) 1998-01-12 2005-01-04 Stmicroelectronics Asia Pacific Pte Limited Method and apparatus for spectral exponent reshaping in a transform coder for high quality audio
US6064748A (en) 1998-01-16 2000-05-16 Hewlett-Packard Company Method and apparatus for embedding and retrieving additional data in an encoded data stream
JP4232209B2 (ja) 1998-01-19 2009-03-04 ソニー株式会社 圧縮画像データの編集装置及び圧縮画像データの編集方法
JP3986150B2 (ja) 1998-01-27 2007-10-03 興和株式会社 一次元データへの電子透かし
JP3673664B2 (ja) 1998-01-30 2005-07-20 キヤノン株式会社 データ処理装置、データ処理方法及び記憶媒体
WO1999045704A2 (en) 1998-03-04 1999-09-10 Koninklijke Philips Electronics N.V. Watermark detection
US6389055B1 (en) 1998-03-30 2002-05-14 Lucent Technologies, Inc. Integrating digital data with perceptible signals
GB9807202D0 (en) 1998-04-03 1998-06-03 Nds Ltd A method and apparatus for processing compressed video data streams
JP3358532B2 (ja) 1998-04-27 2002-12-24 日本電気株式会社 電子すかしを利用した受信装置
JP3214554B2 (ja) 1998-05-06 2001-10-02 日本電気株式会社 電子透かしシステム及び電子透かし挿入装置と電子画像復調装置
JP3214555B2 (ja) 1998-05-06 2001-10-02 日本電気株式会社 電子透かし挿入装置
JP3201347B2 (ja) 1998-05-15 2001-08-20 日本電気株式会社 画像属性変更装置と電子透かし装置
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP3156667B2 (ja) 1998-06-01 2001-04-16 日本電気株式会社 電子透かし挿入システム、電子透かし特性表作成装置
WO1999063443A1 (en) 1998-06-01 1999-12-09 Datamark Technologies Pte Ltd. Methods for embedding image, audio and video watermarks in digital data
US6332194B1 (en) 1998-06-05 2001-12-18 Signafy, Inc. Method for data preparation and watermark insertion
US6154571A (en) 1998-06-24 2000-11-28 Nec Research Institute, Inc. Robust digital watermarking
US6272176B1 (en) 1998-07-16 2001-08-07 Nielsen Media Research, Inc. Broadcast encoding system and method
JP3266569B2 (ja) 1998-07-29 2002-03-18 日本電気株式会社 電子透かしデータによる画像属性変更システム
US7197156B1 (en) 1998-09-25 2007-03-27 Digimarc Corporation Method and apparatus for embedding auxiliary information within original data
US6345100B1 (en) 1998-10-14 2002-02-05 Liquid Audio, Inc. Robust watermark method and apparatus for digital signals
US6320965B1 (en) 1998-10-14 2001-11-20 Liquid Audio, Inc. Secure watermark method and apparatus for digital signals
US6219634B1 (en) 1998-10-14 2001-04-17 Liquid Audio, Inc. Efficient watermark method and apparatus for digital signals
US6209094B1 (en) 1998-10-14 2001-03-27 Liquid Audio Inc. Robust watermark method and apparatus for digital signals
ID25532A (id) 1998-10-29 2000-10-12 Koninkline Philips Electronics Penanaman data tambahan dalam sinyal informasi
US6215526B1 (en) 1998-11-06 2001-04-10 Tivo, Inc. Analog video tagging and encoding system
US20020087973A1 (en) 2000-12-28 2002-07-04 Hamilton Jeffrey S. Inserting local signals during MPEG channel changes
US6128736A (en) 1998-12-18 2000-10-03 Signafy, Inc. Method for inserting a watermark signal into data
US6442283B1 (en) 1999-01-11 2002-08-27 Digimarc Corporation Multimedia data embedding
JP3397157B2 (ja) 1999-01-13 2003-04-14 日本電気株式会社 電子透かし挿入システム
CA2260094C (en) 1999-01-19 2002-10-01 Nec Corporation A method for inserting and detecting electronic watermark data into a digital image and a device for the same
US7051351B2 (en) 1999-03-08 2006-05-23 Microsoft Corporation System and method of inserting advertisements into an information retrieval system display
US6442284B1 (en) 1999-03-19 2002-08-27 Digimarc Corporation Watermark detection utilizing regions with higher probability of success
US7216232B1 (en) 1999-04-20 2007-05-08 Nec Corporation Method and device for inserting and authenticating a digital signature in digital data
US6243481B1 (en) 1999-05-11 2001-06-05 Sony Corporation Of Japan Information embedding and retrieval method and apparatus
US6522769B1 (en) 1999-05-19 2003-02-18 Digimarc Corporation Reconfiguring a watermark detector
AUPQ289099A0 (en) * 1999-09-16 1999-10-07 Silverbrook Research Pty Ltd Method and apparatus for manipulating a bayer image
JP3407869B2 (ja) 1999-06-24 2003-05-19 日本電気株式会社 Dct係数に情報を挿入する方式及びその方法
US6687663B1 (en) 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
US7020285B1 (en) 1999-07-13 2006-03-28 Microsoft Corporation Stealthy audio watermarking
JP2001036723A (ja) 1999-07-16 2001-02-09 Sony Corp 著作権保護方法、情報信号伝送システム、情報信号出力装置、情報信号受信装置および情報信号記録媒体
JP2001045448A (ja) 1999-07-30 2001-02-16 Nec Corp ディジタルtv放送における映像データ同期方式
JP2001061052A (ja) 1999-08-20 2001-03-06 Nec Corp 電子すかしデータ挿入方法及びその装置と電子すかしデータ検出装置
US6768980B1 (en) 1999-09-03 2004-07-27 Thomas W. Meyer Method of and apparatus for high-bandwidth steganographic embedding of data in a series of digital signals or measurements such as taken from analog data streams or subsampled and/or transformed digital data
JP3654077B2 (ja) 1999-09-07 2005-06-02 日本電気株式会社 オンライン電子透かし検出システム、オンライン電子透かし検出方法、及びオンライン電子透かし検出用プログラムを記録した記録媒体
JP2001111808A (ja) 1999-10-05 2001-04-20 Nec Corp 電子すかしデータ挿入方式及び装置
DE69931932T2 (de) 1999-12-04 2007-05-31 Deutsche Thomson-Brandt Gmbh Verfahren und Vorrichtung zum Dekodieren und Einfügen eines Wasserzeichens in einen Datenstrom
US6700210B1 (en) 1999-12-06 2004-03-02 Micron Technology, Inc. Electronic assemblies containing bow resistant semiconductor packages
FR2802329B1 (fr) * 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
JP3507743B2 (ja) 1999-12-22 2004-03-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 圧縮オーディオデータへの電子透かし方法およびそのシステム
FR2803710B1 (fr) 2000-01-11 2002-03-22 Canon Kk Procede et dispositif d'insertion d'un signal de marquage dans une image
US6970127B2 (en) 2000-01-14 2005-11-29 Terayon Communication Systems, Inc. Remote control for wireless control of system and displaying of compressed video on a display on the remote
JP3567975B2 (ja) 2000-01-24 2004-09-22 日本電気株式会社 電子透かし検出・挿入装置
JP2001275115A (ja) 2000-03-23 2001-10-05 Nec Corp 電子すかしデータ挿入装置および検出装置
JP2001285607A (ja) 2000-03-29 2001-10-12 Nec Corp 電子透かし挿入器及び電子透かし検出器並びにそれらに用いる電子透かし挿入方法及び電子透かし検出方法
JP3630071B2 (ja) 2000-04-05 2005-03-16 日本電気株式会社 電子透かし検出器及びそれに用いる電子透かし検出方法
JP3921923B2 (ja) 2000-06-07 2007-05-30 日本電気株式会社 電子透かし挿入装置およびその方法
US6633654B2 (en) 2000-06-19 2003-10-14 Digimarc Corporation Perceptual modeling of media signals based on local contrast and directional edges
US6631198B1 (en) 2000-06-19 2003-10-07 Digimarc Corporation Perceptual modeling of media signals based on local contrast and directional edges
JP2002027224A (ja) 2000-07-05 2002-01-25 Nec Corp 電子透かし挿入・検出装置、方法及び記録媒体
US7006631B1 (en) 2000-07-12 2006-02-28 Packet Video Corporation Method and system for embedding binary data sequences into video bitstreams
WO2002015587A2 (en) 2000-08-16 2002-02-21 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
US6721439B1 (en) 2000-08-18 2004-04-13 Hewlett-Packard Development Company, L.P. Method and system of watermarking digital data using scaled bin encoding and maximum likelihood decoding
US6714683B1 (en) 2000-08-24 2004-03-30 Digimarc Corporation Wavelet based feature modulation watermarks and related applications
WO2002017214A2 (en) 2000-08-24 2002-02-28 Digimarc Corporation Watermarking recursive hashes into frequency domain regions and wavelet based feature modulation watermarks
US6674876B1 (en) 2000-09-14 2004-01-06 Digimarc Corporation Watermarking in the time-frequency domain
JP2002099213A (ja) 2000-09-21 2002-04-05 Nec Corp ディジタルコンテンツ生成装置及び再生装置
JP3587152B2 (ja) 2000-09-25 2004-11-10 日本電気株式会社 画像伝送システム及び方法並びに記録媒体
JP2002135713A (ja) 2000-10-26 2002-05-10 Nec Corp 画像データ処理装置および画像データ処理方法
WO2002039383A2 (en) 2000-11-07 2002-05-16 Koninklijke Philips Electronics N.V. Method and arrangement for embedding a watermark in an information signal
CN1237484C (zh) 2000-11-07 2006-01-18 皇家菲利浦电子有限公司 在信息信号中嵌入水印的方法和设备
JP3636061B2 (ja) 2000-11-08 2005-04-06 日本電気株式会社 データ挿入装置及びその方法
JP3503591B2 (ja) 2000-11-22 2004-03-08 日本電気株式会社 電子透かし挿入・検出システム及び電子透かし挿入方法並びに電子透かし検出方法
EP1215910A3 (en) 2000-12-07 2003-09-10 Sony United Kingdom Limited Watermarking
US6738744B2 (en) 2000-12-08 2004-05-18 Microsoft Corporation Watermark detection via cardinality-scaled correlation
WO2002049363A1 (en) 2000-12-15 2002-06-20 Agency For Science, Technology And Research Method and system of digital watermarking for compressed audio
US6856693B2 (en) 2000-12-22 2005-02-15 Nec Laboratories America, Inc. Watermarking with cone-forest detection regions
CN1212605C (zh) 2001-01-22 2005-07-27 卡纳斯数据株式会社 用于数字音频数据的编码方法和解码方法
PL361764A1 (en) 2001-01-23 2004-10-04 Koninklijke Philips Electronics N.V. Watermarking a compressed information signal
JP3614784B2 (ja) 2001-02-01 2005-01-26 松下電器産業株式会社 情報埋め込み装置、情報埋め込み方法、情報取り出し装置、および情報取り出し方法
JP4019303B2 (ja) 2001-02-02 2007-12-12 日本電気株式会社 電子透かしに含めた暗号鍵を用いた暗号化装置及び復号化装置並びにそれらの方法
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
JP4190742B2 (ja) 2001-02-09 2008-12-03 ソニー株式会社 信号処理装置及び方法
US20020147990A1 (en) 2001-04-10 2002-10-10 Koninklijke Philips Electronics N.V. System and method for inserting video and audio packets into a video transport stream
US6807528B1 (en) 2001-05-08 2004-10-19 Dolby Laboratories Licensing Corporation Adding data to a compressed data frame
CN1284135C (zh) 2001-05-08 2006-11-08 皇家菲利浦电子有限公司 在信息信号中嵌入和检测水印的方法和设备
EP1413143B1 (en) 2001-07-19 2006-05-03 Koninklijke Philips Electronics N.V. Processing a compressed media signal
US7075990B2 (en) 2001-08-28 2006-07-11 Sbc Properties, L.P. Method and system to improve the transport of compressed video data in real time
US7114071B1 (en) 2001-09-13 2006-09-26 Dts Canada, Ulc Method and apparatus for embedding digital watermarking into compressed multimedia signals
JP3977216B2 (ja) 2001-09-27 2007-09-19 キヤノン株式会社 情報処理装置及び方法及び情報処理プログラム及び記憶媒体
DE60204039T2 (de) 2001-11-02 2006-03-02 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur kodierung und dekodierung von audiosignalen
AUPR970601A0 (en) 2001-12-21 2002-01-24 Canon Kabushiki Kaisha Encoding information in a watermark
US6996249B2 (en) 2002-01-11 2006-02-07 Nec Laboratories America, Inc. Applying informed coding, informed embedding and perceptual shaping to design a robust, high-capacity watermark
US6707345B2 (en) 2002-01-14 2004-03-16 Ip-First, Llc Oscillator frequency variation mechanism
CN1276936C (zh) 2002-01-31 2006-09-27 大日本油墨化学工业株式会社 苯乙烯树脂组合物及其制备方法
US20030161469A1 (en) 2002-02-25 2003-08-28 Szeming Cheng Method and apparatus for embedding data in compressed audio data stream
US7047187B2 (en) 2002-02-27 2006-05-16 Matsushita Electric Industrial Co., Ltd. Method and apparatus for audio error concealment using data hiding
EP1561341A4 (en) 2002-10-23 2010-12-15 Nielsen Media Res Inc DEVICE AND METHOD FOR INSERTING DIGITAL DATA FOR USE WITH COMPRESSED AUDIO / VIDEO DATA
US6845360B2 (en) 2002-11-22 2005-01-18 Arbitron Inc. Encoding multiple messages in audio data and detecting same
US7809154B2 (en) 2003-03-07 2010-10-05 Technology, Patents & Licensing, Inc. Video entity recognition in compressed digital video streams
KR100624751B1 (ko) 2003-04-25 2006-09-19 (주)마크텍 영상에 워터마크를 삽입하는 방법 및 상기 방법을 이용한디지털 비디오 저장장치
US6901606B2 (en) 2003-05-20 2005-05-31 Nielsen Media Research, Inc. Method and apparatus for detecting time-compressed broadcast content
US7460684B2 (en) 2003-06-13 2008-12-02 Nielsen Media Research, Inc. Method and apparatus for embedding watermarks
WO2005002200A2 (en) 2003-06-13 2005-01-06 Nielsen Media Research, Inc. Methods and apparatus for embedding watermarks
GB2403634B (en) 2003-06-30 2006-11-29 Nokia Corp An audio encoder
US7206649B2 (en) 2003-07-15 2007-04-17 Microsoft Corporation Audio watermarking with dual watermarks
CN1856822A (zh) 2003-09-22 2006-11-01 皇家飞利浦电子股份有限公司 多媒体信号的水印标记
US20050062843A1 (en) 2003-09-22 2005-03-24 Bowers Richard D. Client-side audio mixing for conferencing
KR100595202B1 (ko) 2003-12-27 2006-06-30 엘지전자 주식회사 디지털 오디오 워터마크 삽입/검출 장치 및 방법
TWI404419B (zh) 2004-04-07 2013-08-01 Nielsen Media Res Inc 與壓縮過音頻/視頻資料一起使用之資料插入方法、系統、機器可讀取媒體及設備
AU2005270105B2 (en) 2004-07-02 2011-03-31 Nielsen Media Research, Inc. Methods and apparatus for mixing compressed digital bit streams
US20060239500A1 (en) 2005-04-20 2006-10-26 Meyer Thomas W Method of and apparatus for reversibly adding watermarking data to compressed digital media files
EP2095560B1 (en) 2006-10-11 2015-09-09 The Nielsen Company (US), LLC Methods and apparatus for embedding codes in compressed audio data streams

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106464713A (zh) * 2014-05-02 2017-02-22 华为技术有限公司 用于分层压缩的系统和方法
CN106464713B (zh) * 2014-05-02 2020-01-21 华为技术有限公司 用于分层压缩的系统和方法

Also Published As

Publication number Publication date
WO2006014362A1 (en) 2006-02-09
US20080253440A1 (en) 2008-10-16
EP1779297A1 (en) 2007-05-02
US8412363B2 (en) 2013-04-02
EP1779297A4 (en) 2010-07-28
HK1106047A1 (en) 2008-02-29
KR101087588B1 (ko) 2011-11-29
AU2005270105B2 (en) 2011-03-31
AU2005270105A1 (en) 2006-02-09
CN102592638A (zh) 2012-07-18
CA2572622A1 (en) 2006-02-09
NZ552644A (en) 2008-09-26
MX2007000076A (es) 2007-03-28
KR20070039123A (ko) 2007-04-11
US9191581B2 (en) 2015-11-17
CN1993700B (zh) 2012-03-14
US20130194507A1 (en) 2013-08-01

Similar Documents

Publication Publication Date Title
CN1993700B (zh) 用于进行压缩数字位流的混合的方法及装置
US9286903B2 (en) Methods and apparatus for embedding codes in compressed audio data streams
KR101707125B1 (ko) 효율적인 다운믹싱을 이용하는 오디오 디코더 및 디코딩 방법
KR102122137B1 (ko) 인코딩된 오디오 확장 메타데이터-기반 동적 범위 제어
US8386271B2 (en) Lossless and near lossless scalable audio codec
CN102047564B (zh) 将重叠变换因式分解成两个块变换
CN101950561B (zh) 水印嵌入方法和装置
AU2011203047B2 (en) Methods and Apparatus for Mixing Compressed Digital Bit Streams
CN103733256A (zh) 音频信号处理方法、音频编码设备、音频解码设备和采用所述方法的终端
ZA200700891B (en) Methods and apparatus for mixing compressed digital bit streams

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1106047

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1106047

Country of ref document: HK