具体实施方式
以下是一个用于搜索和记录包含不合需要的信号成分的媒体信道中的源材料的过程和装置,其中相同的源材料在相同的媒体信道或不同的媒体信道上被播送至少两次。该方法辨别需要的源材料和不合需要的源材料,如谈话、广告和失真。源材料的例子可以是音乐、电影或类似的东西。在本发明中采用在一个无线电播送中搜索和记录畅销歌曲作为说明性例子。要理解的是本发明不限于识别和记录畅销歌曲;它也可被用于电影、音乐电视和其他类型的源材料。搜索和记录可通过一个重复过程完成,该过程包括查找、比较和存储搜索关键字指示的来自将被记录的源材料的信号片段。
根据本发明,用户可通过使用本方法和装置,在任何时刻选择记录当前在媒体信道上播送到接收部件的源材料。在执行本发明的一种方法中,用户也可使源材料自动从媒体信道上被记录。装置将自动识别整个源材料或部分源材料的开始和结束,并将这些部分保存以便将来使用。
源材料的一个例子可以是一首在一个无线电信道上播送到一个收音机的畅销歌曲。通过使用此方法,用户不必再进行手工劳动,一段时间后就可获得存储在装置中的该畅销歌曲的高质量完整长度的版本。用户可以在播放歌曲的任何时刻仅通过按下一个按钮来开始记录其完整版本。通过使用本发明的方法,装置还可自动提取无线电播送中的音乐,并单独记录每首歌曲。从而使得装置用户拥有在无线电广播中播放的单首音乐的连续更新的列表。本发明为本发明的用户提供了至少两种获得音乐的独特方法。一种方法是在听到所需的歌曲时按下按钮,另一种方法是让装置自动记录全部歌曲并将它们保存在一个播放列表中。
在媒体信道上被发送到一个接收元件,如收音机、电视机、PC或类似装置的媒体信号,如无线电播送和电视播送,被临时存储在一个或多个缓冲存储器中。在本发明的装置的缓冲存储器中,较早存储的媒体信号将被最新播送的一个或多个信道的媒体信号连续替换。媒体信号可被用户访问,用户可激活装置。
通过这种连续缓冲和将媒体信号临时存储到一个或多个存储位置、缓冲存储器,并调整为诸如5天的临时存储期,则可能在某时刻注意到记录了完整的源材料,如下面详细说明的。甚至当用户在源材料播送末期才决定记录时,也可能进行记录。
当用户或装置指示要记录某个源材料时,在该时间点的媒体信号的一个片段或一个片段的表示可被选择为一个搜索关键字。搜索关键字也可以来自整个源材料。
装置也可保存被记录的媒体信号中搜索关键字周围充分长的部分;对于畅销歌曲,充分长度可以是激活时刻之前和之后的5分钟。此过程为用户提供了当时播送的源材料的整个播送。记录功能的激活可通过按下一个按钮、转动一个转轮或激活一个手柄或接收机上的其他任何部件完成。激活也可由装置自动完成。这种自动激活可被随机触发、周期触发或被播送的某种可识别的特征触发。在无线电播送中的音乐的例子中,此方法使装置能够自动建立已经在无线电广播中播放的音乐列表。音乐可像在普通CD播放器上那样存储,使用户可以一首接一首地收听歌曲。
激活时刻之前和之后的被记录部分的必要长度可通过估计该种类型的源材料的可能长度来确定。对于畅销歌曲,多数情况下激活时刻前后的5分钟应该是足够的。存储在存储器中的源材料的媒体信号播送可能包含不合需要的信号成分。例如,在无线电播送中,至少在歌曲开始或结束时,谈话打断音乐的情况是很常见的。虽然多数时候一段音乐在无线电广播中播放时,其大部分是在无打断的情况下播送的,但有时电台的音乐节目主持人甚至可能在音乐播放的中间打断。
另一个问题是不知道在存储的记录中源材料何时开始和结束。本发明提供了一种如何在一个连续的媒体信号中找到源材料的开始和结束的解决方法,例如在连续的无线电播送中找到歌曲的开始和结束的方法。如果装置自动激活,它可连续记录在无线电广播中重复的音乐,从而能够自动从无线电广播中保存歌曲。
图1说明了一个用于创建源材料的一个片段或该片段的一个表示的一个搜索关键字100的过程。媒体信号10可能是例如一段音乐12,它可能包含不合需要的信号成分102、104和其他在歌曲12前后的不合需要的片段103、105。在图1中所需的源材料12由粗线标记。片段12具有一个开始13和一个结束15。搜索关键字100可被用于检测相同的源材料(如相同的音乐)的先前的播送和将来的播送。检测可通过将搜索关键字的内容与存储在缓冲存储器中的或将来将被播送的媒体信号的片段进行匹配和比较来完成。检测所需源材料的先前或将来的播送可通过直接匹配搜索关键字实现。也可通过识别可能包含源材料的播送的片段然后以一种或多种方法和以一个或多个步骤检查这些部分以测试它们是否实际来自所需的源材料的过程实现。媒体信号10宜长于所需的源材料12,以确保整个源材料12最终被记录。
在保存部分媒体信号用于将来的比较时,媒体信号10应在搜索关键字前后延伸一段长度足够容纳整个源材料的时间。例如,多数流行音乐短于5分钟,并且由于记录激活可在播放该音乐的任何时刻发生,因此最好在激活时刻前后各保存5分钟,以确保捕捉了整段音乐。这样媒体信号10可为约10分钟。当然,可根据需要选择任何时间段。
当检测到搜索关键字100的第二次充分相同的实例时,在时域上与搜索关键字相连的信号片段被比较。通过它们自己之间的比较发现为充分相同的信号片段被识别为来自相同的源材料12。通过在第一信号片段和第二信号片段之间识别公共片段,可以找到公共部分的开始和结束,从而找到源材料的全部或部分的开始和结束。
如下文所说明的,本发明的重复过程通过复制同一源材料已经播送或将要播送的版本中的未被损坏的干净信号片段来逐步替换这些被损坏的片段102、104,从而把这些信号片段的破坏减少到最小。本发明一个重要假设是对于同一源材料的每次播送,所需源材料的接收是充分相同的,例如,一首歌曲每次在无线电广播播送时,其接收是接近相同的。而不合需要的信号片段,如谈话、广告和失真,在相同的歌曲每次被播放时通常是不同的。
图2显示了一个检测一个媒体信号20的第二片段的过程,该媒体信号20包含与片段10充分相同的部分从而能够被视为来自相同源材料,所述检测通过匹配搜索关键字100和搜索关键字的第二相同或接近相同的实例200。应注意媒体信号20在所需的源材料22开始处具有较短的被损坏片段202,该源材料具有一个开始24和一个结束26。但是,信号20具有与信号10的片段104相比相对较长的被损坏片段204。两个媒体信号相同的部分是107和109之间的时间,这些可被保存为公共片段。本发明的重复过程的一个目的是利用相对较短的失真片段202但忽略相对较长的片段204。
如上面所提到的,媒体信号宜连续的缓冲在缓冲存储器中。通过识别搜索关键字100与该搜索关键字相同或接近相同的第二实例200而检测到的媒体信号20还可通过将测试扩展到超越搜索关键字的范围(可能采用其他方法)来进一步测试其相似度。当给出足够证据表明它们来自相同的源材料时,片段20可被复制到一个存储器或者存储器中或者它的开始或结束点被存储。此操作可通过复制搜索关键字的第二实例200之前的足够长的片段和搜索关键字的第二实例200之后的足够长的片段来完成。此操作防止了该可能用于进一步处理以获得所需源材料的复本的信号片段在缓冲存储器被新的媒体信号再次填充时消失。在本发明的一个实施方式中,装置不是在存储器间移动媒体信号,而是将媒体信号存储在其原来的位置,并且在预定的时间内不覆盖它。
搜索关键字的识别和媒体信号的保存使得两个的媒体信号(即媒体信号10、20)被存储。媒体信号20与最初存储的媒体信号10比较。两个媒体信号10、20相同或接近相同的部分被看作不含有不符合需要的信号成分并因此被视作所需源材料的至少一部分。这可以是例如所需歌曲的一部分或全部,不包含干扰的谈话或广告。在这种情况下,信号10的片段106与信号20的片段206相同。公共片段将被保存以便将来使用,例如,以便将来收听。片段106、206前后的媒体信号10、20不匹配或相同的片段被假定为表示不合需要的信号成分。尤其地,片段106可被存储在存储器中并通过将来的重复添加,直到所需的整个源材料12已被存储在最终存储器中或达到一个终止阈值。这样,源材料12的片段106可用于播放,并且片段106具有一个识别的结束109和一个识别的开始107。
由于只有媒体信号中相同或充分相同的部分被识别,因此在片段106第一次被保存时,可能只有所需源材料12的较短的片段106被识别。如果用户幸运的话,他或她可能在第一次发现搜索关键字的第二实例时获得整个源材料,如整首歌曲。
在执行本发明的一个较简单的方法中,装置仅完成一次过程。第一次发现的包含搜索关键字的复本的公共片段被用作识别源材料的开始和结束。此过程在下面的图1和图2中说明。本发明的这个较简单的版本可能只将第一次识别的公共部分作为最终版本提供给装置用户,从而使用户找到整个源材料的机率较小。
为了增加找到整个源材料(如无线电广播上的整首歌曲12)的机率,上述过程被重复多次。这样,检测媒体信号、存储检测到的媒体信号在一个存储器中以及比较媒体信号以找出匹配的公共片段的步骤可继续。一个目的是通过将新匹配的片段添加到存储最终存储器中的信号片段106,来配对补充先前识别的媒体片段106的相同的媒体信号,从而检测到更多公共片段。此重复导致越来越长的公共片段106存储在最终存储器中。
图3说明了如何通过重复匹配媒体信号70的搜索关键字112、媒体信号80的片段703中的搜索关键字114和媒体信号90的片段705中的搜索关键字116这一过程而从中产生一个几乎完整且无损坏的源材料110。媒体信号70包含所需的源材料702,它具有一个开始704和一个结束706。应注意媒体信号70、80、90包含相同的源材料,搜索关键字112、114、116也是相同或接近相同的。片段118可被添加到存储在最终存储器中的公共片段中,因为信号80的片段120与信号90的片段122相同。同样地,片段124可被添加到存储在最终存储器中的公共片段中,因为媒体信号90的片段126与媒体信号70的片段128相同。如果开始点130和结束点132表示公共片段的开始和结束,则片段110几乎覆盖了整个源材料702。丢失的片段仅为信号片段702的开始704处的片段133和结束706处的片段135。过程可以以这种方式继续重复,直到已经记录了整个源材料。
为防止包括比较和添加过程的重复搜索过程永远继续,可设置终止阈值。这可以是预定的重复搜索过程的重复步骤数目。另一种替换方式可为使用媒体信号的一个已知和可识别的特征作为过程的终止。重复的终止也可在多个添加的公共片段的长度比某个值小时被触发,因为这种情况表明可能不会有更多源材料的片段被找到。也可设置为当不管进行了多少次相同源材料的识别都没有另外的公共片段被添加时被停止。
当一个公共片段第一次被发现时,该公共片段可被存储在一个最终存储器中,并准备被用户播放。这将为用户提供重复欣赏公共片段的选项,例如,通过将一个音乐再现装置连接到最终存储器重复欣赏一首歌曲。随着时间过去,可向每首歌曲添加歌曲的新的部分,从而为听众提供所需音乐的更长和更完整的版本。
在执行本发明的另一个较简单的方法中,装置完成上面说明的如图1和图2所示的识别过程,并完成如上面和图3所说明的重复过程,但装置不是将公共片段加在一起,而只是使用源材料的可能的最长的识别部分,即最长的公共片段,作为最终版本。本发明的这个较简单的版本使装置用户找出整个源材料机率较小,但此装置可能更容易开发。
图4说明了创建媒体信号30中的多个搜索关键字300、310、320的一个例子。此方法在媒体信号包含大量不合需要的信号成分时尤其有用。此方法增加了搜索关键字300、310、320中至少一个不包含不合需要的信号成分的机率。
在所说明的例子中,只有搜索关键字310不包含不合需要的信号成分,并能够当以后在存储器中发现源材料31或重新播送源材料31时与一个相同的搜索关键字匹配。搜索关键字300和320不太可能在以后的媒体信号中匹配,因为在以后的播送中不合需要的信号成分不太可能以完全相同的方式重复。过程可被设计为检测相同信号的补充片段对,以便通过将这些附加的公共片段添加到存储器中的公共片段来完成被识别的公共片段。
此方法提高了发现并识别在存储器中或下次播送的所需源材料的未损坏部分的机率。此方法还加速了发现和获得可接受长度的所需源材料31的过程。整个过程可以以上面说明的重复步骤重复。
图5显示了一个用于在匹配和检测到媒体信号40的第一个搜索关键字400之后创建媒体信号50的片段501中的搜索关键字500、510、520的过程。该过程通过将三个搜索关键字510、500和520与媒体信号60进行比较继续。搜索关键字520与搜索关键字620充分相同,从而表明片段间的一个匹配。如上文所指出的,媒体信号40、50、60可能包含相同的源材料,但三个不同的媒体信号具有不同量的干扰源材料的不合需要的信号成分,如谈话和广告。这提供了比较存储的三个至少包含部分相同源材料的版本40、50、60的机会。由于在搜索关键字400和搜索关键字500之间有匹配,因此第一公共片段402可保存在最终存储器中。上述重复将在使用搜索关键字发现其他公共片段时将公共片段添加到公共片段402之前和之后。
由于在搜索关键字400和搜索关键字500之间有匹配,媒体信号40被假定为与媒体信号50至少有一部分来自相同的源材料。不同之处在于两个信号均具有不同量的不合需要的信号成分。一个重要的特征是由于在搜索关键字520和搜索关键字620之间有匹配,因此媒体信号40、50被假定为与媒体信号60具有公共部分,从而这些媒体信号来自相同的源材料。这意味着媒体信号60的信号片段602与媒体信号40的片段404是充分相同的,从而此公共片段能被添加到最终存储器中的公共片段中。整个过程可以以上述重复步骤重复。
本发明的重复方法的一个目的是在最终存储器中获得源材料的一个不包含任何不合需要的信号片段(如谈话、广告、失真等)的完整长度版本。
在本发明的一个替换实施方式中,该方法借助于一个是源材料的一个选定片段或该片段的表示的搜索关键字来识别源材料,源材料是例如无线电广播中的畅销歌曲。例如,搜索关键字可表示所需的畅销歌曲的一个很短的片段或该片段的表示。所需的源材料可通过识别搜索关键字和媒体信号之间的相似度来识别。
有多种可能的方法可用来确定搜索关键字和媒体信号片段之间的相似程度。例如,当媒体信号的一个片段与相同的或其他的媒体信号的其他片段卷积时,可使用相关来获得表达两个有关片段间的相似程度的值。该值越大,则存在越高的相似度,从而它们来自相同的源材料的机率越高。
一般地,正确的匹配,即被调查的片段实际上来自取出搜索关键字的相同的源材料的相同的时间段时,相关过程中涉及的片段越长,则将产生比周围的错误时间段更清晰的具有更高的匹配值的模式,从而在相关过程中使用较长的片段是有利的。但是,较长的片段也需要较多的处理功率,因此对于可使用的片段长度有一个实际限制。
可使用其他方法确定媒体信号的片段之间的相似。在一种称为消去(cancellation)的方法中,搜索关键字正如在相关方法中一样是一个媒体信号的一个片段,然后它与媒体信号的其他片段进行比较。首先对将要对相似度进行比较的搜索关键字和媒体信号的片段的增益进行归一化以便他们具有几乎相同的增益。然后从来自一个片段的抽样中减去来自另一个片段的抽样,这些差的绝对值被加起来获得最终的消去值。如果片段是完全相同的,则得到的值将为零。在实际应用中,正确的匹配将产生非常低的消去值。此方法被称为消去是因为如果片段是相同的则它们将彼此消去,或者如果它们非常相似则将几乎彼此消去。
对于消去也和对于相关一样,在过程中涉及越长的片段则将产生越清晰的准确匹配。
在过程中使用较长的片段对上面提到的两个方法相关和消去都是有益的。由于由处理能力的限制引起的对于可使用的片段长度的实际限制,因此已设计出相关和消去的修改版本。这些方法只是不包含过程中的每个抽样,而是取每第N个抽样,其中N可以是1以及1以上的任何数字。N甚至可以不是一个固定的值,甚至可以在一个处理值的计算内的不同步骤之间发生变化。包含媒体信号的每第N个抽样的方法可被用于大多数其他用于识别搜索关键字和媒体信号的一个片段之间的相似性的方法。不同处理值的步骤序列不必相同。在每个处理值被计算时,应对搜索关键字和被调查的片段采用相同的步骤。这些新设计的方法被称为修改后的相关和修改后的消去。
这些修改后的方法在搜索匹配和搜索源材料的开始和结束时可给出非常清晰的结果,但不使用过程中的每个抽样的代价是偏离准确匹配的平均噪声水平将比包含所有抽样时的噪声水平高。
在执行本发明的一种方法中,装置可通过将归一化其各自的增益作为比较过程的一部分来解决以不同增益播送的媒体信号的比较问题。增益的归一化也可以作为记录媒体信号的过程的一部分来完成。如果用来确定搜索关键字和媒体信号之间的相似程度的比较方法为相关方法或其他任何结果依赖于信号链的增益的方法,则一个补偿增益变化的方法可用来归一化测量。有几种可能的方法,如在音频的情况下,使用无线电台经常使用的一种音频压缩机来防止发射机的过载,同时发出尽可能大的音响。
本发明的一个具有许多优点的特别方法是用感兴趣的片段中的抽样的绝对值之和来归一化被计算的相似值。此方法可以有效地消除不同的信号增益的影响,例如当一个DJ在两个不同的场合以不同的增益设置在混合控制台中播放相同的歌曲时。
当相关或修改后的相关被用作确定搜索关键字片段和媒体信号的片段之间的相似度的方法时,预先知道准确匹配时的相关值将为多高是有益的。由于考查的是由于来自相同源材料而几乎相同的媒体信号,因此可能预先知道准确匹配时预期的片段将是什么样子的。准确匹配必须与搜索关键字片段非常相似。因此,只要通过将搜索关键字片段与其本身相关并借助于搜索关键字片段的抽样的绝对值的移动平均来归一化所得的结果,就可能预先计算出准确匹配的预期的相关值。这个值可以被称为T值。当寻找可能为准确匹配的结果的相关值时,一个搜索标准可以是相关值与预期的T值接近。
T值的另一个用处在于试图确定相同源材料的记录质量时。当几个信号片段被发现确定为来自相同的源材料时,则可能使用T值指示有关其关于噪声、干扰和失真的相对质量的一些东西。如果不仅在准确匹配时计算媒体信号的T值,则部分或整个片段上的连续T值都被计算。此片段可以与来自相同源材料的另一片段相关并比较产生的相关值和相应的T值。这里必须注意的是要被比较的信号片段应在时间上对齐并在增益上归一化,并且在T值的计算中的抽样数目应该与相关中的抽样数目相同。如果片段是相同的,则先前计算的T值应与后来计算的相关值完全相等。由于假定两个片段都来自相同的源材料,因此任何对预期的T值的偏离都可能是由于某种不合需要的信号变化产生的。对预期的T值偏离越大,则片段之间的差异可能越大。也可假定如果相关值接近T值,则两个片段具有高质量,因为不太可能损坏两个片段的随机扰动是相同的。
可比较多个片段获得其相对质量的指示。对于三个片段,可比较片段1和2,然后1和3,最后2和3。这种确定媒体信号的片段的质量的方法可用于设置何时一个片段将被作为足够好的片段接受的标准,它还能用作选择具有相似质量的片段。后者在来自相同源材料的不同记录的片段被拼接在一起以形成源材料的较长的连续片段时是很重要的。在播放拼接成的较长的片段时,突然注意到质量的跳跃对用户而言可能是一种干扰。
当使用消去作为确定媒体信号的片段之间的相似度的方法时,则匹配时的预期值可能接近零。相似程度决定了消去值与零的距离。消去可用于确定何时片段是相似的,并且该方法也可以用于在片段被确定为来自相同的源材料时,确定片段之间的相对质量。虽然片段在增益上被归一化并且在时间上准确地对齐,但来自相同源材料的相同部分的两个片段被噪声和其他干扰污染得越多,则预期消去值将越多地偏离零。
在一个替换方式中,媒体信号的片段的搜索和匹配仅在可用数据的子集和/或该数据的变换上执行。这可以通过多种方法完成。或者装置在创建搜索关键字时仅使用组成该材料的抽样的小部分。另一种方法是装置可将媒体信号记录在两个或多个单独的文件中,一个或多个搜索文件和一个或多个用于将来使用(如用于播放)的文件。搜索文件可能是媒体信号的记录,但具有较低的带宽,或者可能是仅包含特定频率区间的文件。搜索文件也可以是记录的媒体信号的表示。搜索文件可用于创建搜索关键字,也可用于搜索搜索关键字的第二次出现。搜索文件也可以用于查找源材料的开始和结束。对于在无线电广播上播送的音乐,搜索文件可以是较低抽样率(如,6kHz)的媒体信号的单独记录。此搜索文件可用于创建搜索关键字和查找搜索关键字的其他出现以及查找源材料的开始和结束。然后此开始和结束信息可被用于在完整质量的记录中查找源材料的开始和结束。使用单独的搜索文件的一个原因是减小对处理功率的需要。
在执行本发明的另一种方法,装置创建一个搜索关键字并在存储在一个硬盘驱动器上的文件中搜索它。如果只有处理器速度足够快,则限制装置速度的因素是访问存储在硬盘驱动器上的媒体信号的速度。其缺点是硬盘驱动器必须被连续地访问,从而连续地耗用功率。在执行本发明的另一种方法中,装置将在播送媒体信号时连续创建多个搜索关键字,并同时搜索多个搜索关键字。由于搜索可在装置的RAM存储器中完全完成,因而此方法减少了访问来自最终的硬盘驱动器的信息的需要,从而节省了装置的功率。例如,通过从硬盘驱动器或播送中下载一小时音乐或搜索文件至RAM存储器上,并用多个搜索关键字搜索RAM存储器,则硬盘获得了休息,从而装置可节省电池功率,并且工作得更快。
在执行本发明的另一方法中,装置可以一种分级的方法执行信号片段的搜索和匹配,首先选出数个可能的匹配,然后用更精确的方法从可能的匹配中找出准确的匹配。例如,完成此方法的一种方法可为首先计算搜索关键字和媒体信号之间的相关,识别具有与搜索关键字足够高的相关的媒体信号的片段,在完成此操作后以另一种更精确的方法测试识别的片段。所述其他方法可为使用更长的搜索关键字或某种完全不同的方法。
用于查找源材料的复本的搜索关键字可以以不同的方法组成。在执行本发明的一种方法中,所使用的搜索关键字是媒体信号的较短的片段,如0.1-2秒长的片段。在执行本发明的另一种方法中,搜索关键字可为片段的一个表示,例如通过对该片段作一个数学变换或通过提取某些说明性特征。在执行本发明的另一种方法中,搜索关键字长得多,并且也可用来结合压缩或使用程序或算法说明一个媒体信号。不同类型的搜索关键字也可以结合在一起使用以便更好地查找所需的媒体信号。
在比较过程中也可以不只使用抽样,即媒体信号的瞬时幅度值,还可以为音乐编索引以便短的信号片段可被存储在该片段具有某些将该片段与其他音乐区别开来的特征的位置。例如,一首歌曲可能具有一个独特的鼓乐片段,只有一部分鼓乐片段被存储并与其他媒体信号比较,直到找到相同的鼓乐片段。一旦此鼓乐片段被再次播放,则该片段被存储在一个编入索引的存储器中,以便不必搜索整个存储器而只搜索存储器编入索引的部分。鼓乐片段可通过某种数学算法进行变换以便减少必要的存储要求或促进匹配。
在执行本发明的另一种方法,搜索和比较存储的搜索关键字与当前的媒体信号或记录的播送的步骤可通过连续搜索特定频率完成。例如,搜索关键字可能不包含整个频率寄存器,而只包含特定的预定频率。当用于无线电播送中的音乐时,搜索关键字可能仅包含30-31Hz和13000-13100Hz的频率。30-31Hz的信号可用于识别在一定时间间隔内的一定长度的歌曲中的相同的鼓声。类似地,13000-13100Hz信号可用于识别在特定时间间隔和长度中的相同的吉它声。因此搜索过程可通过只搜索无线电播送的30-31Hz信号来完成。当在存储器中发现在30-31Hz频率上的匹配信号时,则搜索和比较13000-13100Hz频率。如果媒体信号在13000-13100Hz频率具有相同的吉它声,则它被假定为相同的媒体信号。
与搜索整个频率范围相比,仅比较频率寄存器的特定部分可产生更佳的功率利用率。源材料的开始和结束也可通过比较少数频率发现。只要信号片段的被比较频率是充分相同的,则被比较的信号片段被认为是相同的。
搜索过程可能搜索媒体信号中识别被播送的源材料的嵌入码。例如,在数字无线电播送中,可能发送代码识别当前正在播放的音乐。某些CD包含识别每条磁轨的艺术家和歌曲的代码。这种编码信息可用于查找所需的歌曲。然后此信息可被一个过程所利用,用于查找歌曲的复本,定位其开始和结束,并剪切掉不合需要的信号成分。
为了快速查找源材料,例如在一个已经记录的无线电播送中查找一首歌曲,接收元件的存储能力至少必须能够存储2-3小时的播送。对于标准MP3格式的音乐,这是存储约100-200MB的音乐。存储器也可以大得多以便能够包含一段更长时间段中的多个不同的媒体信道。存储器也可以包含装置已发现的源材料的先前记录。
搜索过程可由用户在注意到其希望记录的源材料时触发,或由装置本身触发。当装置不被手动触发的搜索请求占用时,它可以自动创建搜索关键字并执行搜索以建立存储在存储器中的公共片段库或列表。这些已经在媒体信号中重复的公共片段的列表可于将来搜索或以后由用户播放。这种自动搜索在无线电台只播放有限数目的歌曲时尤其有用,例如一个播前40名的无线电台。对于具有更多种音乐的电台,需要搜索更大的缓冲存储器,以查找重复的歌曲,但只要一首歌曲被重复则装置将识别它并保存它。当用户希望记录一首歌曲时,装置可能已经进行了长时间的几次重复了,以便听众不必等待所有重复的完成就可获得整首歌曲。通过在已经识别和保存的源材料之中开始搜索过程,搜索可能快得多,因为所需的源材料可能早已经被装置识别和保存了。
在以下发明的一个版本中装置测试搜索关键字以确保其包含足够的有用信息。例如,如果装置本身已经自动生成一个搜索关键字,则如果它位于播送中间的无声部分,它可能没有任何作用。这也可能在手动触发搜索请求时发生。通过略微改变获得搜索关键字的方法,可使搜索关键字尽可能唯一。这可使找到搜索关键字的匹配的机率更大。
提高搜索关键字的质量的一种方法是测试几个接近激活时刻的可能的搜索关键字,并选择一个被认为最独特的搜索关键字,独特的意义是指对找到所需的匹配信号片段最有用。当搜索关键字在播送的无声时刻被触发时,提高搜索关键字的质量的另一种方法是将搜索关键字的取出移动到无声之前的时刻或之后的时刻。此方法使得装置能够获得包含更多信息的搜索关键字。
当搜索关键字已和媒体信号的另一片段进行比较,并且如某种设置的标准所指示,它们来自相同源材料的相同部分的可能性很大时,则可发生识别过程的第二步骤。如果这实际上是一个准确匹配,则可假定通过在两个片段中匹配时刻前后移动某段时间,并再执行新的比较,可能信号仍然非常相似从而仍然来自相同的源材料。在片段中的某点,相似度将低于某个水平,则可假定已达到相似片段的部分的端点。可以以相似的方法搜索另一端点。
端点搜索可以以多种方法执行。可通过在片段上连续移动测试直到达到被视为可接受的最低相似水平来测试片段,该点被确定为一个端点。也可能从先前的比较点跳开一段特定的时间并再次测试,如果仍然视为足够相似则重复此跳跃和测试直到相似水平低于某个点。然后可减小步长并逆转跳跃方向。此新点被测试并再次减小步长。如果现在片段被视为足够相似则变换新的跳步方向,或者如果片段被视为不足够相似则新的跳步方向不变。继续重复过程直到达到预定的最小步长,此点被视为端点。另一端点可通过相同的方法获得。
由于被比较的片段可能来自不同的媒体播放器,也可能在不同的时间点获得,因此其间可能有一定的速度差异。因此,不能假定当在片段中从先前比较的点跳开某个时间段时两个片段之间的比较可确切地在新的点指示最大的相似度。应在一个片段中的此点向前跳跃一段时间,然后从此点到理论点之后足够靠后的点之间执行比较,并注意在何处达到最高的相似度。更数学化的表达为,在一个片段中跳开时间tJUMP,并在另一片段中跳开tJUMP-M,其中M表示一个抽样数目。然后对后一片段中的tJUMP-M周围的部分和另一片段的tJUMP周围的相同长度的部分进行比较。然后减小M并重复此过程直到M达到一个特定值,通常为-M,此时过程终止。
通过假设装置容量和所涉及的其他可能影响记录速度的变量,可以确定tJUMP处预期的匹配位置周围的一个区间,该区间仍然因为充分接近而被接受,以表示该点处的片段仍然来自相同源材料,只要此点处的相似度也充分高。上述方法可被扩展以为我们提供另一种增加特定点处的片段来自相同源材料的概率的方法。第一种方法当然是根据某种方法计算相似度,如果该值比某个设定水平好,则它可能是一个准确匹配。第二种进一步确保此点的片段来自相同源材料的方法是注意实际达到最大相似度时与理论点在时域上的距离。例如,我们可以假设比较过程在此点之前的1000个抽样开始,继续到此点之后的1000个抽样,并且先前已确定准确匹配必须出现在理论点之前或之后的10个抽样之内。现在可以计算所有2000个可能的比较并注意在哪一点获得最佳值。
如果此值在离理论点10个抽样之内,则此点处的片段来自相同源材料的概率增加。两个不相关的片段在此20个抽样范围内将指示其最高相似度的概率为20/2000=0.01。可看到理论点周围的搜索范围越长,则越可以信任极限内的最大相似点。
在已在设定的极限内跳跃数步并发现足够的相似度时,可减小极限以备将来的跳跃。这是由于从一步到另一步与预期点的偏差可能是相同的,当已确定预期偏差是多少时,则可能在此偏差周围设定一个更窄的极限。装置容量和影响片段的记录速度的其他因素在短时间内不太可能变化。这两种方法,即测量相似程度和只接受在预期的时间点周围的某个时间限内具有最大相似度的点,可同时使用或单独使用。
在以下发明的一个版本中,方法还包括一个计数器,它对部分或完全检测到相同源材料的次数进行计数。也可以在识别到搜索关键字的第二次实例时计次数。本方法的一个应用是一首歌曲被播放的次数越多,最终获得的歌曲记录的质量较高以及几乎整首歌曲被记录的可能性越高。
在本发明的一个版本中,计数也可被用于生成源材料列表,该源材料列表根据源材料在某个时间段中在一个或多个媒体信道上被播放的次数排列。对于无线电广播,该方法可用于创建某个或多个无线电台上周播放最多的音乐的列表,并可根据该音乐的播放频率对其进行排名。
在本发明的一个版本中,该方法也可生成基于用户的选择和偏好的列表。用户在源材料被播放时识别它,激活装置从而该源材料可被自动保存在听众选择列表中。这可能是一个列表或多个对于不同源材料类型或用户的列表;例如,对于无线电广播,可能有一个硬摇滚列表,一个流行音乐列表以及装置的主要用户的一个朋友创建的一个列表。
在本发明的一个版本中,用户也可以对媒体信道进行分类以便在相同格式媒体信道上播放的源材料被保存在相同的列表或库中。例如,对于无线电广播,一个库可包含硬摇滚,它们来自用户知道会播放该类音乐的无线电台,另一个库用于来自该类无线电台的软音乐,依此类推。
在执行本发明的一个版本中,装置也可以识别何时某个源材料的播放频率较低并将这样的源材料从列表删除。例如,如果每次播放源材料之间的时间段超过指定时间,则源材料将被视为不那么流行从而从顶级列表中被删除。
如先前所指出的,本方法可删除特定的不合需要的信号成分,如广告。例如,本方法可删除短于一定时间段(如三十秒或一分钟)的公共片段,因为多数广告比所需的源材料短。装置可识别不合需要的信号成分并将它们保存在单独的列表中。
本方法还可删除被发现为在较长的时间段中相同的信号片段。完成此操作是为了删除重新播送的整个节目。例如,如果一个无线电播送与另一个播送有多于五至十分钟的时间都相同,则很可能不是一首歌曲,而是整个节目的重播,从而希望记录单首歌曲的用户对其是不敢兴趣的。这些时间参数可由用户调整,以便其既可用装置记录单独的源材料也可记录源材料集。
在本发明的一个版本中,装置也可以生成用户不希望接受到的材料列表。此操作可通过用户在播放不合需要的材料时激活按钮来完成。在无线电广播的情况中,此列表可包括广告、谈话、铃声等。然后这些信号片段可被存储在不合需要列表中,然后可以用来将这些片段从所需材料的列表中筛选出来。用户也可以将需要列表中的源材料标记为不合需要,从而使其以后不再被播放或呈现给用户。
在执行本发明的一种方法中,用户不会接受到直接播送而是一个稍微延迟的版本,以便装置有时间在不合需要的信号成分到达用户之前将其删除,并用需要的内容填充这些间隙。此操作可通过自动搜索播送中的不合需要的信号成分,并在检测到不合需要的信号成分改变延时以跳过该信号成分。这样最终可能创建大到足够用先前记录的需要的材料来填充的间隙,当它们的播放结束时,该源可被切换回到先前的节目。
装置也可以在遇到特定情况时自动更改媒体信道,如无电线台。例如,装置可在一定时间段(如每五分钟或每24小时)后更改无线电台。它也可以在一段时间后没有发现新歌曲时更改无线电台。更改到新的媒体信道可扩充可被发现的源材料数目。装置也可被编程以便在一个媒体信道上查找预定数目(如20个)的源材料,然后切换媒体信道在第二媒体信道上查找预定数目的不同的源材料。装置也可以在一个特定时间段后没有找到任何新的源材料时更改媒体信道,如在48小时内都没有找到新的源材料时更改。装置也可以在无法找到可识别的媒体信号时切换媒体信道,如播送出了问题或发射机未激活时。
装置也可以将来自多个媒体信道的信号存储在一个缓冲存储器中。搜索多个媒体信道可增加最终获得整个所需要的源材料(如一整首歌曲)的机率。
在使用本发明的一种方法,装置可重新开始重复过程以实现更高质量的源材料记录。例如,当记录来自无线电播送的音乐时,可能已经获得所需歌曲的非常短的一段或者它的质量比需要的低。在该种情况下,装置或使用激活部件的用户可启动一过程以从已经记录的源材料的公共片段中获得新的搜索关键字,这将引起在存储器或播送中对所需源材料的新搜索。
在本发明的另一个版本中,所述装置将连接到一个外部系统,以对所需源材料进行命名。此方法可由装置将所需源材料的一部分或来自所需源材料的搜索关键字发送到外部系统并获得识别该源材料的回复来实现。如果本方法用于无线电播送中的音乐,装置将连接到该系统并发送一段已记录的音乐以便识别。依次的,识别系统可将音乐的标题、艺术家或乐团发送到装置。这使用户不仅收听音乐而且得知标题并知道哪位艺术或乐团在播放。此识别可自动完成或由用户触发。
已记录的来自相同源材料的相同部分的媒体片段的质量,即与源材料的接近度,可通过利用对相同源材料的多个记录来提高。例如,如果装置发现三个媒体信号包含相同的源材料,则可通过用来自其他两个相同的因此被视为不含不合需要的信号成分的媒体信号的相应的片段取代不合需要的信号成分的片段来删除不合需要的信号成分。尤其地,如果第一媒体信号的某个片段与第二媒体信号的相同片段具有较低的相似度但第二片段和第三片段之间的相似度较高,则可设计本方法以便用第二或第三媒体信号的相应片段取代第一媒体信号的该片段。
搜索关键字可以以相似的方法运作,因为搜索关键字将只识别高于某个预定的相似值的片段。如果相似值设置得太高,则可能会有确实来自相同源材料的片段被搜索关键字遗漏的危险。如果相似值设置得太低,则错误的信号片段或来自正确源材料的播送质量较差的信号片段可能被选择。
当然,装置也可以被设置选择具有相等相似值的片段,而不是仅仅最大化音响质量,以避免某些音响片段非常清楚而其他的不是那么清楚。换句话说,一整首歌曲可具有一个较小的可接受的并且水平均匀分布的失真。
用在本发明的一个版本中的一个提高媒体信号质量的方法是将来自相同源材料的时间对齐的记录一个抽样一个抽样地加起来,并用参加相加过程的记录数去除得到的幅度值。所需信号不会被影响,因为在所有记录中它都是相同的。不合需要的信号成分,如噪声和失真,不会像需要的信号信息那样不受影响。噪声和其他相似类型的不合需要的信息,可被视为实际上或多或少是随机的,因此当两个具有相同的平均噪声水平的信号被加在一起时,平均噪声水平不会加倍。平均上,如果噪声信号具有相同的平均噪声水平,则得到的噪声水平的增加程度仅为加在一起的噪声信号的数目的平方根。当所需信号部分的幅度通过用参加过程的记录数去除幅度值来恢复时,平均噪声水平将减小到低于原来的记录的噪声水平。
当相同源材料的记录中的噪声水平的差异大于一定水平时,则实际上只选择最佳的记录而不要试图通过将记录加起来来提高质量比较好。除噪声和类似信号外的其他类型的不合需要的信号信息也可以用此方法减少。
如果只有相同源材料的两个记录,且它们的质量相差相当大,则很难说其中哪个是最佳或他们是否具有大致相同的质量。这种情况的一个解决办法是将两个记录加起来并将得到的幅度值除以2。可能其中一个记录比另一个好得多,最好是已经挑选出此记录,但如果不可能是挑选出的话,则处理过的版本将是最佳选择。
如果源材料片段来自无线电播送或来自其他易产生干扰的播送信道,则可从接收机中的信号强度获得一个可能的质量指标。较弱的接收一般包含更多噪声且失真度更大。其他接收到的信号的参数也可被测量并被用于给出所获得源材料的质量指标。
在以下发明的一个版本中,本发明的重复过程将新的无干扰的源材料片段添加到存储在存储器中的源材料片段中。装置可通过对两个片段的相似度执行一个数学计算来匹配两个将拼接在一起的片段,以便,例如,第一片段的末尾与第二片段的开始精确匹配,从而使得两个片段在时间上的放置是确切的。装置可测试不同的重叠,当相似度最高时,装置将两个片段合并在一起,以便用户可能不会注意到第一片段已经添加到第二片段中。
在以下发明的一个版本中,装置自动检查信号片段是否以颠倒的相位播送。具有颠倒相位的信号片段与以相反相位播放的信号片段相比可能具有负的相似性或相关性,虽然它们来自相同源材料的相同部分。装置可检查搜索关键字的正和负的相似度以便能够使用颠倒相位的信号片段。在以下发明的一个版本中,如果装置检测到媒体信号之一的相位颠倒,则装置可通过在将两个媒体信号合并在一起之前更改一个媒体信号的相位来自动进行调整。
要合并在一起的片段的抽样点可能没有对齐,使得合并时在最终合并后的片段中在交会点处可能出现不连续。为使要合并在一起的两个片段的过渡尽可能平滑,可在交会点附近一段有限时间内逐渐数学伸展或压缩一个或两个片段的信号,以便两个片段之间的合并能够在没有不连续的情况下发生。解决此不连续问题的另一种方法可为数学地移动一个或两个片段的抽样点,使过渡不会出现不连续。
媒体信号可为无线电播送、电视播送、计算机网络上的播送、计算机文件、已存储在装置上的文件或类似的东西。
媒体信道可为无线电或电视网络、移动电话网络、计算机网络或类似的东西。
接收部件可为收音机、电视机、VCR、个人计算机、移动电话或其他用于接收媒体信号的装置。
激活部件可为按钮、杠杆、计算机程度、算法、方向盘或类似的部件。也可以是声控、红外线或蓝牙连接,无线连接或这些部件的组合。
以上所有部件可为使用的以及编程的、自动化的或时间控制的激活部件。
播送中的不合需要的信号成分可能是无线电广播中的谈话者、DJ、VJ、电视人、读者或新闻或类似的人或物的语音。播送中的不合需要的信号成分也可能是由较弱的播送或由于其他任何打断或干扰的播送的原因引起的。
源材料可为一段音乐、一部电影、一个广告、一个电视节目、新闻、演讲、音响效果、电影效果或类似的事物。
检测部件可由一个用于频率滤波的LP滤波器、HP滤波器、BP滤波器、BS滤波器或激活和数字滤波器构造或一个计算机程序、一个处理器或一个算法组成。
重复部件可为例如一个计算机程序或一个算法。
最终存储器可为媒体信号播放器中的一个内部存储器。最终存储器也可为一个CD-R、迷你光碟、软盘、硬盘驱动器、磁带记录机、多媒体卡、压缩闪速卡或其他外部或内部存储器或以上各种的组合。最终存储器也可为一个外部或内部存储器的一部分或缓冲存储器的一部分。
播放部件可为一个CD播放器、迷你光碟播放器、盒式录音机、立体声装置、收音机、电视机、VCR、MP3播放器、PC、PDA或其他任何用于媒体播放的装置。
实现上述发明的目标的上述过程和装置既可包含软件也可包含硬件或包含二者的结合。
虽然已经根据首选构成和实施方式说明了本发明,但要理解可在不背离以下权利要求的精神和范围的情况下对其进行一定的替换和更改。