CN100545265C

CN100545265C - 鉴别和分析中度串联重复dna标记的物质和方法

Info

Publication number: CN100545265C
Application number: CNB998026964A
Authority: CN
Inventors: 詹姆斯·W·舒姆; 杰弗里·W·巴彻
Original assignee: Promega Corp
Current assignee: Promega Corp
Priority date: 1998-02-04
Filing date: 1999-02-04
Publication date: 2009-09-30
Anticipated expiration: 2019-02-04
Also published as: EP1058727A4; AU2656599A; EP1058727B1; EP2287308B1; ES2475416T3; JP2013143965A; JP2002502606A; CA2319111A1; US6767703B2; KR100691195B1; EP1058727A1; KR20010040624A; EP2287307B1; ATE486129T1; EP2287307A3; JP2009254388A; EP2287307A2; EP2287308A3; CN101857895A; WO1999040194A1

Abstract

本发明涉及鉴别和分析DNA中中度串联重复序列的物质和方法，其中中度串联重复(ITR)序列是DNA序列的一个区域，其含有至少一个串联出现至少两次的5-7个碱基重复单位。用本发明的物质和方法的特别优选的实施方案鉴别和分析了人类基因组中高多态ITR基因座的DNA标记。

Description

鉴别和分析中度串联重复DNA标记的物质和方法

相关申请的交叉参考

关于联邦资助的研究或开发的声明

本发明是在美国政府的支持下完成的，由国立健康研究院颁发的小企业发明研究资助号1-43-MH5294-01及1-43-MH5294-02资助。美国政府拥有本发明的某些权利。

发明领域

本发明一般涉及在基因组系统中鉴别和分析遗传标记。本发明特别涉及在DNA中，尤其是在基因组DNA中鉴别这样的基因座，其含有由于中度(5～7个碱基)序列重复数目变异而形成的长度多态性。本发明还涉及检测此多态基因座。本发明还涉及鉴别和区分个体的方法，其主要基于在该基因座扩增基因组DNA的产物的大小不同，其中中度串联重复序列数随个体不同而变化。

发明背景

DNA分型通常用于亲子鉴定，并用于确定马、狗及其它比赛动物的谱系。DNA分型还通常用于鉴别血液、唾液、精液及其它在犯罪场所发现的其它组织。目前所用的DNA分型法被设计为检测和分析已知在群体中以至少两种不同形式显现的DNA的一或多个区域的长度和/或序列中的差异。DNA分型还用于临床测定骨髓移植的成功或失败及特殊癌组织的存在与否。此变异长度和/或序列变异称为“多态性”。其中发生这种变异的DNA的任何区域(即“基因座”)称为“多态基因座”。大多数DNA分型技术使用至少一个含至少一个该多态基因座的“标记”。每个个体标记含有最终衍生自群体中单一个体基因组DNA的单一等位基因。本发明的方法和物质均设计为用于检测以长度变异为主要特征的DNA多态性的特定类别。

就长度或序列而言充分多态的遗传标记，很久以来被试图用于鉴定应用中，如亲权认定及鉴别收集的用于法医分析的组织样品。这种标记及分析该标记的方法的揭示与开发，在以往许多年已进行了几个阶段的开发。近年来，作为遗传标记的多态短串联重复(STRs)的揭示和开发已激发连锁图谱开发，致病基因的鉴别与鉴定及DNA分型的简化性和精确性的进程。术语“短串联重复”或“STR”指2～7个核苷酸长，在任何生物体的基因组DNA串联中完全或近乎完全串联重复的所有序列。例如见美国专利号5,364,759第4栏第58行中人基因组DNA的“短串联重复”的定义。

第一个鉴别的DNA变体标记是简单碱基取代，即简单序列多态性，其通常由Southern杂交分析检测。设计用于用放射活性探针分析限制性内切酶消化的DNA的这种标记的鉴别论述，参见Southern，E.M.(1975)，J.Mol.Biol.98(3)：503-507；Schumm，et al(1988)，American Journal of Human Geneties 42：143-159；及Wyman，A.andWhite，R.(1980)Proc.Natl.Acad.Sci.U.S.A.77：6754-6758。

第二代标记是大小变体，即长度多态性，尤其“串联重复可变数”(VNTR)标记(Nakamura Y.et al.(1987).Science 235：1616-1622；及美国专利4,963,663，授予White等(1990)；美国专利5,411,859，4,963,663的继续，授予White等(1995))和“小卫星”标记(Jeffreys et al.(1985a)，Nature 314：67-73；Jeffreys et al，(1985b)Nature 316：76-79；美国专利5,175,082，发明人Feffreys)。VNTR和小卫星标记均含有以串联方式重复的几个相同序列的区域。核心重复序列长度为10-70个碱基，较短的核心重复序列称为“小卫星”重复，较长重复称为VNTRs。人群中不同个体含有不同数量的这些重复。这些标记比碱基取代多态性具有更高的多态性，有时在单一遗传基因座上呈现接近40或更多个等位基因。但是，仍需要限制酶消化及随后的Southern杂交分析等繁琐方法检测及分析大多数这种标记。

接下来的进展包括聚合酶链反应(PCR)(美国专利4,683,203，Mullis，K.B.)技术与分析VNTR基因座(Kasai，K.et al.(1990)JournalForensic Science 35(5)：1196-1200)的联合。可扩增的VNTR基因座被发现，其可不需Southern转移而被检测。扩增产物通过琼脂糖或聚丙烯酰胺凝胶分离，并通过在扩增期间掺入放射活性或通过用银或溴化乙锭后染色而检测。但PCR只能用于可靠扩增相对小的DNA区段，即仅可靠扩增长度在3000个碱基之下的DNA区段。(Ponce，M.&Micol，L.(1992)NAR 20(3)：623；Decorte R.，et al.(1990)DNA Cell Biol，9(6)：461-469)。结果，仅开发了非常少的可扩增VNTRs，使它们作为不能进行连锁作图的一类。

对具有多态二核苷酸重复(Litt和Luty(1989)Am J.Hum Genet3(4)：599～605；Tautz，D.(1989)NAR 17：6463-6471；Weber和May(1989)Am J Hum Genet 44：388-396；德国专利DE 38 34 636C2，发明人Tautz，D；美国专利5,582,979，Weber，L.)及多态短串联重复(STR)(Edwards，A.等，(1991)Am.J.Hum.Genet，49：746-756；Hammond，H.A，等，(1994)Am.J.Hum.Genet.55：175-189；Fregeau C.J.和Fourney，R.M.(1993)BioTechniques 15(1)：100-119；Schumm，J.W.等，(1994)，第四届人类鉴定国际研讨会，1993，PP.177-178；美国专利5,364,759，Caskey等；德国专利DE 3834636C2，Tautz，D.)的多态标记的新近开发，已克服了许多以前方法的缺陷。含有二核苷酸或STR重复(意为包括2-7bp重复)的二类标记通常被称为“微卫星”标记。微卫星基因座通常被认为是最适用标记，其与可扩增VNTRs相似之处在于其等位基因可以基于长度变化而区分。但是，与VNTRs不同，这些基因座含有2，3，4或少见的5个碱基长的完全或不完全重复序列。它们展示出在单个基因座上从仅几个等位基因至超过40个等位基因。扩增方案可以设计为产生通常60～400碱基对长的小产物，且每个基因座的等位基因通常包含在少于50bp范围内。通过精心设计PCR引物，使得来自一个个体系统的所有潜在扩增产物不重迭同一凝胶中其它系统的等位基因范围，可在相同凝胶上同时电泳分析几个系统。

有三种明显缺点与微卫星基因座的使用相关。首先，伪带(stutter)假象的存在，即通常在扩增后可见除代表每个等位基因的主要片段之外的一或多个次要片段。此缺陷在二核苷酸重复基因座比三或四核苷酸重复标记基因座更明显(Edwards等，1991，Am.J.Hum.Genet.49：746-756；Edwards等，1992.Genomics 12：241-253；Weber & May，1989.Am.J.Hum.Genet.44：388-396)。这些假象的存在，推测得自称为重复滑动的DNA聚合酶相关的现象(Levinson & Gutman，1987，Mol.Biol.Evol.4(3)：203-221；Schlotterer & Tautz，1992.NAR20：211-215)，使解释基因座的等位基因含量变得复杂。在所有解释复杂化的同时，代表每个等位基因的主要和次要片段的存在尤其限制这些标记在法医分析中的效力，法医分析通常要求测定是否存在一个以上DNA样品来源。在本研究中阐述的许多标记代表一类新的与已知标记相比产生明显少的伪带假象的标记。

当前的STR和微卫星标记系统的第二个缺点涉及在单一凝胶中分离多个基因座的难度。此发生是由于在由本领域技术人员最常用于分离DNA片段的凝胶上部区域中，存在不同大小片段的空间堆积。本研究中所述的基于较长重复单位的标记的开发，扩展了这些凝胶的有用范围，使更多基因座可同时被分析。

第三个缺点是在本发明之前，只有少数人类基因组DNA的DNA基因座已在文献中阐述，每个这种基因座具有基于5～7个碱基重复变化的长度多态性。如见于Edward等，(1991)核酸研究19：4791；Chen等(1993)基因组15(3)：621-5；Harada等(1994)Am.J.Hum.Genet.55：175-189；Comings等(1995)，Genomics 29(2)：390-6；及UtahMarker Development Group(1995)，Am.J.Genet.57：619-628。在1995年，Jurka和Pethiyagoda发表的文章阐述了一项研究，其中他们用GenBank数据库测定在灵长类基因组中五聚和六聚串联重复的相对丰度及可变性(Jurka和Pethiyagoda(1995)J.Mol.Evol.40：120-126)。但是，可变性只是间接估计的，且个体基因座多态水平未证实。我们已开发了鉴别和分析含5～7个碱基重复的高多态重复的DNA基因座的物质和方法。

本发明的物质和方法被设计为用于鉴别和分析各类DNA的特定多态基因座，包括各种不同来源的单链和双链DNA。本发明阐述了对现有技术的明显改进，使用于连锁分析，犯罪审判，亲权认定及其它法医和医学用途方面的DNA分布分析的能力及精确性增加。

发明概述

因此，本发明一个目的在于提供鉴别和分析具有中度串联重复序列的DNA基因座的物质和方法，其中“中度串联重复序列”是DNA的一区域，其含有至少一个由串联重复至少2次的5，6或7个碱基的序列组成的重复单位。

本发明另一个目的在于提供鉴别中度串联重复DNA标记的物质和方法，当其用于分析或检测含中度串联重复的DNA样品的一或多个基因座时，很少产生假象。本发明的方法和物质优选用于鉴别和分析基因组DNA的基因座，每个基因座均含有多态中度串联重复序列。本发明的物质包括针对人基因组DNA的这种基因座的寡核苷酸引物和DNA标记。用本发明的方法检测的中度串联重复基因座，比用相似方法检测的许多已知基因座，包括短STR(即2，3或4个碱基DNA序列的串联重复)，呈现较少的假象。

本发明一特别目的是提供一种分析个体多态遗传基因座的方法和物质，其主要基于主要由于中度核苷酸串联重复的区域中，核酸重复单位数目的不同而引起的长度变化。本发明另一目的在于提供一种检测和分析基因组DNA的多态性基因座的方法，试剂盒及引物，该基因座含有中度串联重复多态性，包括五核苷酸串联重复多态性。

本发明的一实施方案是分离含有来自基因组DNA的中度串联重复序列的DNA片段的方法，包括(a)提供多个DNA片段，其中至少一个片段含有一中度串联重复序列：(b)提供一支持工具(means)，如：结合至少一个寡核苷酸的固定支持工具，该寡核苷酸含有互补于中度串联重复序列的一部分的核苷酸序列；(c)在一定条件下组合该多个DNA片段和支持工具，其中含中度重复序列的DNA片段和至少一个其它DNA片段与支持工具杂交。

本发明另一实施方案是一种检测基因组DNA中具有低伪带假象的多态中度串联重复序列的方法，包括(a)提供一DNA样品，其具有至少一个靶中度串联重复序列，(b)检测DNA样品中靶中度串联重复序列，其中观测到不超过1.1％的平均伪带假象。

检测具有低平均伪带假象百分率的靶中度串联重复DNA序列的方法，包括以下步骤：(a)提供具有至少一个靶中度串联重复序列的DNA样品，其中靶中度串联重复序列是含有至少一个重复单位的DNA区域，该重复单位由至少串联重复2次的5、6或7碱基对的序列组成；(b)将所述样品与一个寡核苷酸引物对接触，该引物对包含与所述含中度串联重复序列的DNA区域的侧翼序列互补的序列，所述样品与所述寡核苷酸引物对在使得所述含中度串联重复序列的DNA区域被扩增的条件下接触；以及(c)检测DNA样品中靶中度串联重复序列，其中观测到平均伪带假象百分率不超过2.4％。

本发明另一实施方案是用至少一个寡核苷酸引物扩增DNA样品中感兴趣的中度串联重复序列(后文中称为“靶”中度串联重复序列)，以检测DNA样品中靶中度串联重复序列的方法，其中寡核苷酸引物含有互补于并位于一DNA标记的一个区域侧翼的序列，该DNA标记在其序列中含有一中度串联重复序列(后文称为“模板中度串联重复序列”)，其中，此DNA标记具有选自SEQ ID NOS：1-43的序列。

本发明的另一实施方案是一检测DNA样品中至少一个靶中度串联重复序列的试剂盒，该试剂盒包括一容器，其具有至少一个寡核苷酸引物，用于扩增至少一个靶中度串联重复序列，其中此寡核苷酸引物的核苷酸序列互补于并位于双链DNA标记一个区域的一部分的侧翼，该双链DNA标记含有模板中度串联重复序列，其中该DNA标记具有选自SEQ ID NOS：1-43的序列。

本发明的另一实施方案是一寡核苷酸引物，其包含互补于双链DNA标记的一条链的位于模板中度串联重复序列侧翼的区域的序列，其中该DNA标记具有选自SEQ ID NOS：1-6和SEQ ID NOS：28-33的序列。

本发明的各个实施方案在人及其它生物体鉴别，法医分析，亲权认定，监测骨髓移植，连锁作图及检测遗传病及癌症等领域均有特殊用处。准确辨别不同个体少量组织在法医应用中是特别急需的，其中许多定罪(及宣判无罪)要依于DNA分型分析，包括STR基因座的分析。

本发明的其它目的，特点及优势通过以下实施本发明的最佳模式及附图将显而易见。

附图简要描述

图1是通过滤膜杂交富集中度串联重复方法的流程图。

图2是S159五核苷酸重复的电泳图。

图3是vWA四核苷酸重复的电泳图。

图4是G210五核苷酸重复的电泳图。

图5是D5S818四核苷酸重复的电泳图。

图6是S159五核苷酸重复伪带百分率的散射图。

图7是G210五核苷酸重复伪带百分率的散射图。

图8是D5S818四核苷酸重复伪带百分率的散射图。

图9是vWA四核苷酸重复伪带百分率的散射图。

图10是在经凝胶电泳分离后，S159五核苷酸重复的荧光标记的扩增片段的荧光成象扫描结果的激光打印图。

图11是在经凝胶电泳分离后，G210五核苷酸重复的荧光标记的扩增片段的荧光成象扫描结果的激光打印图。

附图不是必需成比例的，且本发明的某些特征可按比例放大或为清楚及简洁目的而以示意形式示出。

发明详述

本领域技术人员知晓在不偏离本文揭示的本发明范围及精神之下，对本发明可作各种替代及修改。

A.定义

本文所用术语“中度串联重复”或“ITR”指含有串联至少两次的5～7个碱基序列的DNA序列的一区域。术语ITR也包括这样的DNA区域，其中多于一个单一5～7碱基序列是串联重复的，或具有间插碱基，条件是至少一个该序列至少串联重复2次。在ITR内至少重复一次的每个序列本文称为“重复单位”。

“ITR多态性”指基因组DNA中的一个ITR，其主要由于每个染色体相同区域中重复单位数的不同而使个体群中的染色体长度变化。

根据本发明鉴别和分析的中度串联重复序列可被分为二类：完全的和不完全的。本文所用术语“完全的”ITR指含有至少串联重复二次的单一5～7个碱基重复单位的双链DNA区域，如(AAAAT)₁₂。术语“不完全的”ITR指含有至少二个串联完全重复单位个至少一个不完全重复单位的DNA区域，其中不完全重复单位由得自完全重复单位的序列中插入，缺失或取代1，2或3个碱基的DNA序列组成，如(AAAAT)₁₂(AAAAT)₅AAT(AAATT)₄。每个不完全ITR序列含有至少一个完全ITR序列。特别地，每个ITR序列，不管是完全的还是不完全的，均包括至少一个至少串联出现2次的重复单位序列，该重复单位序列可以公式(I)代表：

(A_wG_xT_yC_z)_n (I)

其中A，G，T代表可以是任何顺序的核苷酸；w，x，y和z代表序列中每个核苷酸的数目，并在0～7范围内，w+x+y+z的范围在5～7之间；n代表序列串联重复的次数，且至少为2。

“五核苷酸串联重复”指以上所定义的“中度串联重复”多态性的一亚类。除非特殊提及，术语“五核苷酸串联重复”包括完全ITRs，其中重复单位是5个碱基的序列，及不完全ITRs，其中至少一个重复单位是5个碱基重复。

“DNA标记”指含有一ITR序列的DNA片段，如含由扩增基因组DNA一区域产生的ITR序列的DNA片段。每个标记含有一最终衍生自一群体中的一个单独个体基因组DNA的一个单等位基因。

术语“基因座“指DNA的特殊区域。当用于阐述基因组DNA的区域时，“基因座”指染色体上的特定位置。就群体中的任何个体而言，相同基因组基因座在每对同源染色体上相同位点出现。每个这种染色体上相同基因座的DNA序列，或在源自相同的这种染色体的DNA的相同基因座的DNA序列，称为“等位基因”。

术语“多态性”指相同物种个体生物体组成的群体的基因组DNA中发现的在至少2个染色体上见到的基因座的等位基因的变化。术语“多态性”包括得自克隆入其它载体如DNA载体的染色体片段或另一种生物体的染色体DNA的相同基因座的DNA序列的变化。

本文所用术语“ITR侧翼序列”指相邻于含ITR的DNA序列一条链上的ITR的核苷酸序列。包括ITR侧翼序列作为其全部序列一部分的序列本身是侧翼序列。

术语“寡核苷酸引物”是一种分子，其含有3个以上脱氧核糖核苷酸或核糖核苷酸。尽管每个引物序列不需反映模板的精确序列，序列反映与模板的互补性越接近，则与模板结合越好。其精确长度和序列将依于许多因素，涉及寡核苷酸引物的最终功能及使用，包括温度，引物序列，及使用方法。本发明的每个寡核苷酸引物包含一互补于位于ITR序列侧翼的DNA标记序列的核酸序列。本发明的寡核苷酸引物当置于一定条件下时，能作为合成起始点，该条件是诱导互补于一核酸链的引物延伸产物的合成的条件。该条件可包括存在核苷酸和诱导剂如DNA聚合酶，合适温度及pH。在优选实施方案中，该引物是足够长的单链寡脱氧核糖核苷酸，以在存在诱导剂下引导从特定序列合成延伸产物。寡核苷酸引物的敏感性及特异性通过引物长度及所供DNA模板样品中序列的独特性确定。在本发明中，寡核苷酸引物通常大约15个碱基以上，且优选大约20～40个碱基长。

术语“寡核苷酸引物对”指一对引物，每个引物均含互补于位于相同ITR侧翼的双链DNA相反链的脱氧核糖核苷酸或核糖核苷酸的序列。本发明的每对寡核苷酸引物优选地选择用以检测单一ITR。尽管每对引物序列不需反映模板的精确序列，序列反映与模板的互补性越接近，与模板结合越好。

术语“延伸产物”指从寡核苷酸引物3’末端合成的核苷酸序列，其互补于寡核苷酸与之结合的链。

术语“寡核苷酸探针”指单链DNA或RNA分子，其包括互补于靶序列的一部分的序列，靶序列例如DNA样品的中度串联重复序列，其中互补性部分的长度足以使探针与靶序列杂交。

术语“伪带假象”指当检测靶DNA的一或多个分子时，观测到的特定类型的假象，其中靶DNA含有相同重复单位序列的串联重复，包括根据本发明检测和分析的靶中度串联重复序列。在通过长度如用凝胶电泳分离样品中所有DNA之后，检测到含任何该靶DNA样品时，每个靶DNA分子产生一主要信号(如在凝胶上的主要条带)；但在接近每个主要信号处可检测到次要信号。次要信号通常产生自DNA片段的检测，其由于靶DNA序列的一或多个重复单位的加入或缺失，而在长度上与靶DNA不同。伪带假象已归因于在DNA的体内和体外复制期间滑动链的错配。如参见Levinson和Gutman(1987)，Mol.Biol.Evol.，4(3)：203-221；及Schlotterer和Tautz(1992)，NucleicAcids Research 20(2)：211-215。当含有任何这种重复序列的DNA用如PCR扩增法体外扩增时，此假象尤为明显，这是由于样品存在的或聚合期间产生的任何次要片段随主要片段一起扩增。

术语“伪带假象百分率(％stutter artifact)”指在得自单一来源如单菌落细菌或基因组DNA的单一染色体的DNA样品中，观测的次要(即假象)信号幅度与主要(即靶)信号幅度的对比。伪带假象百分率可在未扩增的DNA上测定，但优选在至少一个靶中度串联重复序列扩增后测定。术语“平均伪带假象百分率(average％stutterartifact)”指在对一个群体至少20个等位基因的代表样品检测测定的伪带假象百分率平均而得。

术语“基因组DNA”指最终衍生自基因组DNA的任何DNA。该术语例如包括异源生物体中的克隆的DNA，整个基因组DNA，及部分基因组DNA(如单一分离的染色体的DNA)。

根据本发明检测或分离的DNA可以是单链或双链的。例如：适用于本发明的单链DNA可得自噬菌体、细菌或基因组DNA的片段。适用于本发明的双链DNA可得自一些含有具有中度串联重复序列的DNA的各种不同来源中的任一种，包括噬菌体文库，粘粒文库，和细菌基因组DNA或质粒DNA，及分离自任何真核生物的DNA，包括人基因组DNA。DNA优选得自人基因组DNA。可以使用任一不同来源的人基因组DNA，包括医学或法医样品如血液，精液，阴道拭物，组织，头发，唾液，尿液及体液混合物。该样品可以是新鲜的，陈旧的，干燥的和/或部分降解的。此样品可收集自犯罪现场。

B.分离含ITR的多态DNA标记的方法：

本发明的一实施方案是用杂交选择分离含ITR的DNA片段的方法。该方法包括以下步骤：(a)提供多个DNA片段，其中至少一个DNA片段含有ITR；(b)提供结合有至少一个寡核苷酸的支持工具，其中此寡核苷酸包括互补于中度串联重复序列一部分的核苷酸序列；(c)将所述的多个DNA片段与支持工具在一定条件下组合，其中包括任何含ITR序列的DNA片段的DNA片段与支持工具杂交。

此方法(a)步提供的多个DNA片段可通过任何含ITR的DNA样品片段化而得，但优选通过基因组DNA片段化而得，如见并入参考的《人类遗传学当前方案》(1994)，第2章：从基因组DNA构建小插入片段文库，p.2.2.1。制备(a)步所用的多个DNA片段的最优选方法可根据以下步骤进行：片段化DNA样品，从而产生DNA片段群，其中至少一个DNA片段含有ITR；将含有引导序列的接头与DNA片段群中每个DNA片段的至少一个末端连接；用含互补于引导序列的序列的寡核苷酸引物扩增每个接头连接的片段。不同的接头可连于每个片段的每个末端。但是，优选将单一接头连于每个末端，以使能用具有互补于接头引导序列的序列的单一寡核苷酸引物扩增。接头连接优选在有连接酶的情况下进行，如T4DNA连接酶。

可用任一工具产生本发明方法(a)步中提供的多个DNA片段，包括用超声处理或用至少一种限制酶片段化，当然只有双链DNA可用限制酶片段化。当限制酶用于片段化双链DNA样品时，其优选是具有4碱基对识别序列的限制酶，其留下单链的突出端，并且不切割DNA样品内感兴趣的ITR区。用于片段化双链DNA样品的优选限制酶包括MboI，AciI，BfaI，DpnII，HhaI，Hin PII，HpaII，MseI，Nla III，Sau 3AI，TaqI，Csp6I，和TaiI。

如上述产生的接头连接的DNA片段随后用扩增反应扩增，如PCR(美国专利4,683,202，Mullis，K.B.)，基于核酸序列的扩增(NASBA)(Kievits等(1991)J.Virol Merthods 35(3)：273-286)，连接介导的扩增(Volloch等(1994)，Nucleic Acids Res 22(13)：2507-2511)，链置换扩增(SDA)(Walker等(1992)PNAC 89(1)：392-396)，序列不依赖的单引物扩增(SISPA)(Reyes(1991)Mol CellProbes 5(6)：473-481)或连接酶链反应(美国专利5,686,272，授予Narshall等)。

在方法(b)步中提供的支持工具包括具有至少一个与其相结合的靶寡核苷酸的固定支持物。此固定支持物优选包括一能与寡核苷酸直接或间接偶联的物质，能与寡核苷酸直接偶联的合适物质包括硝基纤维素，尼龙，玻璃，二氧化硅，及乳胶。用于本方法这一优选实施方案的合适的固定支持物例如包括尼龙膜，用二氧化硅颗粒包埋的滤膜，玻璃珠，二氧化硅磁性颗粒，或含二氧化硅的树脂。通过与寡核苷酸结合的第一个偶联剂和与固定支持物表面结合的第二个偶联剂而能与寡核苷酸间接偶联的合适物质包括亲和素和链亲和素，或抗原及其抗体。

与固定支持物相结合的所述至少一个靶寡核苷酸包括互补于DNA片段中度串联重复序列一部分的核苷酸序列。术语“部分”指足够长的DNA片段的ITR区域中的核苷酸序列，当具有互补于该序列的序列的寡核苷酸与其接触时，发生杂交。“部分”优选至少20个碱基，更优选至少40个碱基长。靶寡核苷酸更优选具有(A_wG_xT_yC_z)_n公式特征的序列，其中A，G，T和C代表可以是任何顺序的核苷酸；w，x，y，z代表序列中每个核苷酸数目，范围在0～7，且w+x+y+z在5～7范围内；n代表序列串联重复的次数，且至少大约4次，更优选至少大约8次，最优选至少大约15次。

在本方法(c)步中，所述的多个DNA片段与支持工具在一定条件下组合，其中含ITR的DNA片段与支持工具杂交。当该多个片段是多个双链DNA片段时，此DNA在与支持工具杂交前变性。在与支持工具杂交前使双链DNA片段变性的合适方法包括将DNA暴露于足够高的使双链DNA变性的温度，或将DNA悬浮于变性溶液中。此DNA优选用含变性剂如碱(例如NaOH或KOH)的变性溶液变性。当用碱变性DNA片段时，所得混合物的pH优选调正至大约中性pH，优选通过在混合物中加入pH4.8的缓冲液而调正。

一旦DNA片段已与支持工具杂交，优选洗涤此支持工具以除去未杂交的DNA片段及任何存在于含有支持工具的溶液中，或在支持工具表面上的未杂交的其它物质。所用任何洗涤液优选配制成除去如此物质而不释放与支持工具杂交的DNA片段。

与支持工具杂交的DNA片段用加热或合适释放溶液，根据支持工具与DNA片段间结合性质，可从支持工具中释放。例如水或低盐水溶液如TE缓冲液(如10mM Tris-HCl，pH7.5，1mM EDTA)可用于释放与由二氧化硅组成的支持工具杂交的DNA片段。一旦从支持工具释放，此DNA片段可被处理以从存在于释放的DNA片段的所得混合物中的其它DNA片段中分离含ITR序列的DNA。附加处理步骤可包括根据上述方法再杂交和筛选，或克隆入DNA载体及筛选克隆的转化体。

图1图示了分离含ITR的DNA片段的方法的优选实施方案，其中制备DNA片段群，与支持工具杂交，扩增，克隆，并筛选含ITR的转化体。图1中图示的每个步骤均用罗马数字标记。步骤I示出用限制酶(2)消化的双链DNA(1)的分子，产生不同大小的DNA片段群(未示出)，其中至少一个包括靶ITR。步骤I和II间的箭头图示将接头(3)加入DNA片段群中以产生在两类不同DNA片段的末端具有接头(3)的接头连接的片段(8)，所述的两类不同DNA片段为具有靶ITR序列的片段(6)和没有靶序列的片段(4)。将具有互补于每个接头(3)的引导序列的序列的寡核苷酸引物(7)在第III步中加入DNA片段(8)群中，并通过PCR扩增该DNA片段(8)群，从而产生扩增的DNA片段(9)群。在第IV步中，将扩增的DNA片段(9)群置入具有杂交溶液(12)和结合有至少一个寡核苷酸的滤膜(10)的容器(15)中，该寡核苷酸具有互补于靶ITR序列的一部分的序列。杂交溶液促进含ITR序列的DNA片段与滤膜的杂交。在第V步，将滤膜(10)从容器(15)中除去，并从中释放与其杂交的DNA片段。在第VI步，再扩增所得富集的释放的片段群，使用第III步中扩增反应中使用的相同寡核苷酸引物。最后在第VII步将富集的扩增的DNA片段群的每个片段克隆入质粒载体(18)中。第VII步示出用具有靶ITR序列的片段(6)克隆的载体及用没有ITR序列的片段(4)克隆的载体。

C.检测具有低伪带多态ITR的方法

当根据本发明方法的这一具体实施方案检测具有靶ITR序列的DNA样品的该序列时，观测到最小伪带假象。观测的平均伪带假象优选不超过1.1％，更优选不超过0.9％。靶ITR序列可以是完全ITR或不完全ITR序列。检测的DNA样品优选是基因组DNA。

优选在DNA样品中ITR序列扩增后观测平均伪带假象。

D.引物、探针和标记

本发明还包括以下序列表中SEQ ID NOS：1～43所示的DNA标记，引物，其中每个引物的序列互补于位于由43个序列中的一个序列所示的DNA标记的ITR区侧翼的序列，及探针，其具有互补于43个标记之一的ITR区内所含序列的序列。实施例中实验鉴别的特别优选的引物列于下表1。

表1

标记SEQ IDNO	克隆号	引物SEQ IDNO	上链引物&下链引物
标记SEQ IDNO	克隆号	引物SEQ IDNO	上链引物&下链引物	1	C074	44	TGGCTCAGACACCTCATTG
		45	CACCACTGTATTCCCAGTTTG	1	C074	44	TGGCTCAGACACCTCATTG
		45	CACCACTGTATTCCCAGTTTG	2	C221	46	CACTTGCCATCCCTGCCACACA
		47	AGCGCACCCCCAATTTCCGGTAT	2	C221	46	CACTTGCCATCCCTGCCACACA
		47	AGCGCACCCCCAATTTCCGGTAT		C221	48	TGGGGACATGAACACACTTTGC
		49	GAGGCCCAGGACCAGATGAAAT		C221	48	TGGGGACATGAACACACTTTGC
		49	GAGGCCCAGGACCAGATGAAAT		C221	50	CACCTGTCAGGCAAGGCTTAAAC
		51	CAACACTGAGCGCTTTTAGGGACT		C221	50	CACCTGTCAGGCAAGGCTTAAAC
		51	CAACACTGAGCGCTTTTAGGGACT		C221	52	TCAGGCAAGGCTTAAACAGGGATA
		53	ACACTGAGCGCTTCTAGGGACTTC		C221	52	TCAGGCAAGGCTTAAACAGGGATA

标记SEQ IDNO	克隆号	引物SEQ IDNO	上链引物&下链引物
标记SEQ IDNO	克隆号	引物SEQ IDNO	上链引物&下链引物		C221	52	TCAGGCAAGGCTTAAACAGGGATA
		54	TGAGCGCTTCTAGGGACTTCTTCA		C221	52	TCAGGCAAGGCTTAAACAGGGATA
		54	TGAGCGCTTCTAGGGACTTCTTCA		C221	55	CCCTGCCCTACCCACTTG
		56	AGGCCCAGGACCAGATGA		C221	55	CCCTGCCCTACCCACTTG
		56	AGGCCCAGGACCAGATGA		C221	57	GCACCTGTCAGGCAAGGCTTAAAC
		58	CCAGCCATGAAGTGGCTGTGAG		C221	57	GCACCTGTCAGGCAAGGCTTAAAC
		58	CCAGCCATGAAGTGGCTGTGAG	3	C240	59	CCCGCTTCAAAGTTCCCAGTTC
		60	CCTCCCATTTCAGCCTCCTGA	3	C240	59	CCCGCTTCAAAGTTCCCAGTTC
		60	CCTCCCATTTCAGCCTCCTGA	4	C331	61	GTCTGCCACAGTGCTGGAAACTAA
		62	GCACCCCAGCCTAAGGCAATA	4	C331	61	GTCTGCCACAGTGCTGGAAACTAA
		62	GCACCCCAGCCTAAGGCAATA	5	C362	63	GCATGGCGGAAGAAACAA
		64	TGGCAACAGAGCGAGACTC	5	C362	63	GCATGGCGGAAGAAACAA
		64	TGGCAACAGAGCGAGACTC	6	C390	65	CCTGGGTGACAGCGAGAATCT
		66	TGTCCCTTGCCTTGTCTCACTAAA	6	C390	65	CCTGGGTGACAGCGAGAATCT
		66	TGTCCCTTGCCTTGTCTCACTAAA	7	G022	67	CAGCCTTGGTGACAGAGCAAA
		68	TGTGTTGAGGGTGGGGTACAT	7	G022	67	CAGCCTTGGTGACAGAGCAAA
		68	TGTGTTGAGGGTGGGGTACAT	8	G023	69	CCTGGGCAAGAGAGCAAG
		70	CACATCCCAAAACCACCCTAC	8	G023	69	CCTGGGCAAGAGAGCAAG
		70	CACATCCCAAAACCACCCTAC	9	G025	71	GCATTTCCCCTGCTTGTACT
		72	GATCACATTTGCTAACCACTTCTC	9	G025	71	GCATTTCCCCTGCTTGTACT
		72	GATCACATTTGCTAACCACTTCTC	10	G047	73	GGCAACATATCAAGACCCCCATCTCT
		74	GAAGCTGCCCCTCACCACTACATTTT	10	G047	73	GGCAACATATCAAGACCCCCATCTCT
		74	GAAGCTGCCCCTCACCACTACATTTT	11	G065	75	GATCACATTTGCTAACCACTTCTC
		76	TATAAATTACCCAGTCTCAGGAAG	11	G065	75	GATCACATTTGCTAACCACTTCTC
		76	TATAAATTACCCAGTCTCAGGAAG	12	G085	77	GTGATACAGCAAGCCTCATC
		78	AGAGACTCCTGGAAAGATAAAAGT	12	G085	77	GTGATACAGCAAGCCTCATC
		78	AGAGACTCCTGGAAAGATAAAAGT	13	G132	79	GTCTGGAGAACAGTGGCCCTTGT
		80	CAGGAAGCTGAGGCAGGAGAATCT	13	G132	79	GTCTGGAGAACAGTGGCCCTTGT
		80	CAGGAAGCTGAGGCAGGAGAATCT	14	G145	81	AAGGCTCCAGTGGGGTAT
		82	AAAACAAGGCAGTAGTCAATAAAG	14	G145	81	AAGGCTCCAGTGGGGTAT
		82	AAAACAAGGCAGTAGTCAATAAAG	15	G152	83	GGCATGAGAATCGCTTGAACCTG
		84	GGCCTCCATGATGTTTCCAATGAT	15	G152	83	GGCATGAGAATCGCTTGAACCTG
		84	GGCCTCCATGATGTTTCCAATGAT	16	G153	85	TCAGGAGGCATGAGAATCGCTTGA
		86	GGCCTCCATGATGTTTCCCAATGA	16	G153	85	TCAGGAGGCATGAGAATCGCTTGA
		86	GGCCTCCATGATGTTTCCCAATGA	17	G158	87	CTCGCCCTCTCCTATAAGCAGTTT
		88	GCAGAGATAATTTGGAGTGGGATG	17	G158	87	CTCGCCCTCTCCTATAAGCAGTTT
		88	GCAGAGATAATTTGGAGTGGGATG	18	G181	89	CTTGGGTGCCTGTAATCC
		90	GGTAGAGCTCCCCCATCT	18	G181	89	CTTGGGTGCCTGTAATCC
		90	GGTAGAGCTCCCCCATCT	19	G210	91	GCAGAATATTGGGGCTCATCAC

标记SEQ IDNO	克隆号	引物SEQ IDNO	上链引物&下链引物
标记SEQ IDNO	克隆号	引物SEQ IDNO	上链引物&下链引物	92	AAACAAGGAAAGGAGAGGAGAGGA
	G210	93	AAGGTTGTGGGATGACTACTACA	92	AAACAAGGAAAGGAGAGGAGAGGA
	G210	93	AAGGTTGTGGGATGACTACTACA	94	TGGTCAACACAGCAAGACATT
20	G212	95	TCCTGCCACCTGCTTGCTTTCT	94	TGGTCAACACAGCAAGACATT
20	G212	95	TCCTGCCACCTGCTTGCTTTCT	96	ATTGCACTCCAGCCTGGGTGATAC
21	G233	97	CGCTTGAGCCTTGGAGATTG	96	ATTGCACTCCAGCCTGGGTGATAC
21	G233	97	CGCTTGAGCCTTGGAGATTG	98	GAGCAGTCAGAATTCAGGAGTTGT
22	G234	99	TGGGCAACAAGAGCAAAACTCCAT	98	GAGCAGTCAGAATTCAGGAGTTGT
22	G234	99	TGGGCAACAAGAGCAAAACTCCAT	100	GGGACTTGGGCTGAGGGCTTTAC
23	G235	101	ATATCAATATCAGGCAGCCACAGG	100	GGGACTTGGGCTGAGGGCTTTAC
23	G235	101	ATATCAATATCAGGCAGCCACAGG	102	CCGTTTCAGAGCAGAGGTTTAGC
24	G331	103	TCTCATTGGTTTCAAAGAACTTA	102	CCGTTTCAGAGCAGAGGTTTAGC
24	G331	103	TCTCATTGGTTTCAAAGAACTTA	104	AGACTCCATCTCAAACAAAAGA
25	G405	105	TCATGTGCATGGAGCCTGGTTCAT	104	AGACTCCATCTCAAACAAAAGA
25	G405	105	TCATGTGCATGGAGCCTGGTTCAT	106	CCCAGCCTTGGCAAGAGTGAGGT
26	G475	107	GGCGACTGAGCAAGACTC	106	CCCAGCCTTGGCAAGAGTGAGGT
26	G475	107	GGCGACTGAGCAAGACTC	108	TTAAGCAAAGTAGCCTCAAACA
	G475	109	GGGCGACTGAGCAAGACTC	108	TTAAGCAAAGTAGCCTCAAACA
	G475	109	GGGCGACTGAGCAAGACTC	110	ACTCATTACCTTGCATGCATGATA
	G475	107	GGCGACTGAGCAAGACTC	110	ACTCATTACCTTGCATGCATGATA
	G475	107	GGCGACTGAGCAAGACTC	111	CATTACCTTGCATGCATGATA
27	G539	112	TGGGCAACAGAGTAAGACTCA	111	CATTACCTTGCATGCATGATA
27	G539	112	TGGGCAACAGAGTAAGACTCA	113	GTTCAGTACCGTTCACCTCTTTA
	G539	114	GTAAGACTCAGTCTCCAAAAAAAAAAAAAG	113	GTTCAGTACCGTTCACCTCTTTA
	G539	114	GTAAGACTCAGTCTCCAAAAAAAAAAAAAG	115	AGGAATGGTTTCTCTGTTAGTAAATGGT
28	S023	116	CAGCCTGGGCAACAAGAATGAAAC	115	AGGAATGGTTTCTCTGTTAGTAAATGGT
28	S023	116	CAGCCTGGGCAACAAGAATGAAAC	117	TGGCCCCTGCAGCGGAGTC
29	S071	118	GAATTCATTTGCGGAAAGATT	117	TGGCCCCTGCAGCGGAGTC
29	S071	118	GAATTCATTTGCGGAAAGATT	119	CTAGGGAGGCTGGAGTATTCA
30	S085	120	AGAGCAAGACCCCGTCTCAT	119	CTAGGGAGGCTGGAGTATTCA
30	S085	120	AGAGCAAGACCCCGTCTCAT	121	AGTCCATGGGCCTTTTAACA
31	S125	122	GAGAATCACTTGAACCCAGGAAG	121	AGTCCATGGGCCTTTTAACA
31	S125	122	GAGAATCACTTGAACCCAGGAAG	123	AGAACCAGCTGTTAGTTTCGTTGA
32	S132	124	GGTTGCAGTGAGCCGAGATAAGAGT	123	AGAACCAGCTGTTAGTTTCGTTGA
32	S132	124	GGTTGCAGTGAGCCGAGATAAGAGT	125	TGTGCCAGGAACCAGAAATTTACAG
33	S136	126	GGCCCAAGGTTACTTTTCAC	125	TGTGCCAGGAACCAGAAATTTACAG
33	S136	126	GGCCCAAGGTTACTTTTCAC	127	GGGCCACTGCACTCCT
34	S159	128	CATGGTGAGGCTGAAGTAGGAT	127	GGGCCACTGCACTCCT
34	S159	128	CATGGTGAGGCTGAAGTAGGAT	129	GTGGCGTGTCTTTTTACTTTCTTTA

标记SEQ IDNO	克隆号	引物SEQ IDNO	上链引物&下链引物
标记SEQ IDNO	克隆号	引物SEQ IDNO	上链引物&下链引物	35	S176	130	AGGCAGCCCAGGAACAAT
		131	CCAAGATAGCGGCCAAGATAGT	35	S176	130	AGGCAGCCCAGGAACAAT
		131	CCAAGATAGCGGCCAAGATAGT	36	S189	132	GAGGGCAGCTGGGATGTTACTCTT
		133	TGCCCTGTTTGGAGAACTGTAGGT	36	S189	132	GAGGGCAGCTGGGATGTTACTCTT
		133	TGCCCTGTTTGGAGAACTGTAGGT	37	S199	134	CTCCCCAGAAACAGATGTA
		135	GTGAGCCGAGATTGTATCAT	37	S199	134	CTCCCCAGAAACAGATGTA
		135	GTGAGCCGAGATTGTATCAT	38	S040	136	TCGGGGACAGGGCTTACTC
		137	ATCATTGTCGCTGCTACTTTATCG	38	S040	136	TCGGGGACAGGGCTTACTC
		137	ATCATTGTCGCTGCTACTTTATCG	39	S066	138	CTACTCTACCCCATTTCATTC
		139	GTAGAGTGGAGTGGATGAGA	39	S066	138	CTACTCTACCCCATTTCATTC
		139	GTAGAGTGGAGTGGATGAGA	40	S077	140	ATCAGGCAAAAACGAACAAAC
		141	CGGCATCCCAAAGTGAC	40	S077	140	ATCAGGCAAAAACGAACAAAC
		141	CGGCATCCCAAAGTGAC	41	S097	142	CAGAGAGGGCAGCACCTTGGACAG
		143	GGCTTCACCTGCTCCCGTTTCAG	41	S097	142	CAGAGAGGGCAGCACCTTGGACAG
		143	GGCTTCACCTGCTCCCGTTTCAG	42	S103	144	TCTGCCCATTCCCCAGCCTCTC
		145	TACCGCGTGGCATTCAAGCATAGC	42	S103	144	TCTGCCCATTCCCCAGCCTCTC
		145	TACCGCGTGGCATTCAAGCATAGC	43	S110	146	TCCAGTCTGGGTGACAAA
		147	CAATCCACTCCACTCCTCTA	43	S110	146	TCCAGTCTGGGTGACAAA

以下实施例是通过举例说明，而非以任何方法限制本发明。在实施例中，所有百分比如果针对固体则是重量百分比，如果针对液体则是体积百分比，除非特殊指出，所有温度是摄氏度。

实施例1：构建全基因组PCR文库

实施例1和以下实施例2中所用的特殊扩增及杂交选择技术，是对Armor，J.等，(1994)Hum Mol Genet 3(4)：599-605中所述选择方法的修改形式。

人基因组DNA是用标准苯酚：氯仿提取程序，从15个个体的集合全血中纯化的(人类遗传学当前方案(1994)，Gilber，J.编辑，附录)。

将大约100μg基因组DNA用5单位MboI限制酶/μgDNA在37℃切割16小时，随后用苯酚：氯仿提取，乙醇沉淀进行纯化，在100μlTE缓冲液中(10mM Tris-HCl，1mM EDTA，pH8.0)再悬浮，终浓度为大约1μg/μlDNA。

将在250-600bp范围的DNA片段在1％Seakem GTG(FMCBio Products，Rockland，Maine)制备琼脂糖凝胶上(15×29cm)，通过在100v凝胶电泳1.25小时而分离，并通过电洗脱回收(参考)，通过在A260测定吸收值对DNA定量，并在无菌超纯(nanopure)水中稀释至500ng/μl并储存在-20℃。

通过将等摩尔量的寡A(5’-GCG GTA CCC GGG AAG CTTGG-3’)和5’磷酸化的寡B(5’-GAT CCC AAG CTT CCC GGGTAC CGC-3’)退火至终浓度为1,000pmd/μl制备接头。将1μg大小选择的插入DNA(3.5pmol，平均大小为425bp)与13μg(875pmols)的接头(250∶1接头∶插入物摩尔比率)，用1～3单位的T4DNA连接酶在15℃连接16小时。通过凝胶电泳(1％Seakem GTG琼脂糖，1.5小时，100v)从原始片段中分离过量的接头和接头二聚体。通过电洗脱从凝胶中回收接头连接的DNA片段，并在50μl无菌水中再悬浮。

将具有连接接头的DNA(50ng)，在含有10μl 10×STR缓冲液(50mM KCl，100mM Tris-HCl，pH9.0，15mM MgCl₂，1％Trition X-100和2mM每种dNTP)，1μl Taq聚合酶(5U/μl)，和1μM寡A引物(10μl 10pmol/μl储存液)的100μl反应体积中用PCR进行扩增。在此反应中用作引物的“寡A”与上述用于装配MboI接头的“寡A”相同。循环条件是95℃1分钟，67℃1分钟，70℃2分钟，循环30次。通过用Centricon-100s微滤(向样品中加入2ml无菌水，并加载Centricon-100s，在2,000RPM旋转2分钟，倒置Centricon滤膜并在2000RPM旋转2分钟以回收DNA，在100μl无菌水中重悬浮)除去dNTPs，引物和引物二聚体。将5μl等份的所得PCR文库在1％琼脂糖凝胶上检验(1小时，100v)，以证实大小在250～600bp范围之间。

实施例2：通过杂交选择而富集五核苷酸重复

将根据实施例1产生的含有各种不同重复的全基因组PCR文库中的DNA片段，用不同的与固体支持物相结合的寡核苷酸混合物，通过杂交富集。将含有(AAAAX)_n五核苷酸重复的片段通过杂交选择而富集。此方法通过首先构建用于杂交选择的寡核苷酸而完成，该寡核苷酸由大约1000bp长的(AAAAC)_n，(AAAAG)_n和(AAAAT)_n串联组组成。将这些寡核苷酸固定在膜上，并与全基因组PCR文库杂交，以选择那些含有(AAAAX)_n重复的片段。

如下构建一组寡核苷酸：(a)合成5’磷酸化的30mer寡核苷酸(AAAAC)₆，(AAAAG)₆和(AAAAT)₆及其互补寡核苷酸(GTTTT)₆，(CTTTT)₆和(ATTTT)₆，并以1000pmol/μl浓度悬浮于超纯水中，(b)将等摩尔浓度(用10μl或10nmol或198μg)的具有互补序列的寡核苷酸组合，加热至65℃，15分钟，并在4℃放置12小时以互相退火，(c)然后将退火的寡核苷酸用每μgDNA 1Weiss单位的T4DNA连接酶在15℃彼此连接过夜，(d)在1％Seakem GTG琼脂糖上，根据大小选择≥200bp的多联体，(e)将连接DNA进行无引物PCR以延长串联组，(f)将表观大小超过1000bp的片段从1％琼脂糖中回收，并通过微滤纯化。测定在A260的吸光度，并在无菌超纯水中制备成1μg/μl储液。

然后将总计1ug的(AAAAC)₂₀₀，(AAAAG)₂₀₀或(AAAAT)₂₀₀寡核苷酸点在4mm×4mm尼龙HybondNfp滤膜上(Amersham LifeSciences，Inc.)用预杂交缓冲液振荡洗涤2次，每次30分钟，以除去弱结合的寡核苷酸，在空气中干燥，在1200μJoules进行UU交联结合DNA，然后在-20℃贮存。

全基因组PCR文库与上述获得的与尼龙滤膜结合的寡核苷酸的支持介质的杂交选择如下进行：(a)将滤膜在1ml预杂交缓冲液(1％BSA(SigmaB-4287)，1mM EDTA，pH8.0，7％(w/v)SDS，0.5MNa₂HPO₄)中，对于含有(AAAAC)_n和(AAAAG)_n序列的寡核苷酸的滤膜在40℃预杂交，对于含有(AAAAT)_n序列的寡核苷酸在37℃预杂交。20分钟后，除去缓冲液，并加入100μl新鲜预杂交缓冲液，(b)用碱(KOH，终浓度150mM)将全基因组PCR文库DNA(20μg)变性，通过加入0.25体积的1M Tris-HCl pH4.8中和，并加入含滤膜的缓冲液中。将所得反应混合物在37℃或40℃预杂交温度培养过夜，(c)用1ml洗涤缓冲液#1(40mM Na₂HPO₄，pH7.2，0.1％SDS)在40℃将(AAAAC)₂₀₀和(AAAAG)₂₀₀滤膜洗涤2次，及在室温振荡洗涤1次，每次15分钟。(AAAAT)₂₀₀滤膜用1ml洗涤缓冲液在37℃洗涤1次及在室温洗涤1次，(d)与每个滤膜结合的DNA，通过在100μl无菌纯水中加热至95℃5分钟而释出。在95℃将样品除去，以防止再退火。将滤膜剥离(stripped)，并通过在0.4M NaOH中在45℃保温30分钟，然后转移至0.1×SSC，0.1％SDS，0.2M Tris pH7.5中并再保温15分钟而再利用。将此膜印迹干燥并在-20℃贮存在密封管中。

实施例3克隆DNA片段的五核苷酸重复富集文库

将根据实施例2的富集五核苷酸重复的DNA片段群，通过PCR再扩增。然后将再扩增的片段克隆入质粒载体pGEM-3Zf(+)中，如下述。此方法通过将选择的插入物与pGEM载体连接，然后将环化的质粒转化入JM109E.Coli宿主中而进行。

插入物与载体的连接如下进行：(a)将5μl杂交选择的DNA在100μl反应体积中，用1XSTR缓冲液(50mM KCl，10mM Tris-HCl，pH9.0，1.5mM MgCl2，0.1％Triton X-100，和0.2mM每种dNTP)，1μlTaq聚合酶(5U/μl)，及1μM寡A引物(1μl 100pmol/μl储液)进行再扩增。循环条件是95℃1分钟，67℃1分钟，70℃2分钟；循环30次。(b)通过向100μl PCR反应物中加入11μl Promega限制酶10×缓冲液C，和2μl(8U/μl)MboI，在37℃将所得反应混合物保温过夜而用MboI消化再扩增的DNA，并通过在65℃将混合物保温20分钟加热灭活限制酶。(c)通过用BamHI(5U/μg)在37℃消化16小时，随后加入适量小牛小肠碱性磷酸酶10×缓冲液(Promega)和1μlCIAP(U/μl)并在37℃保温1小时，制备用于进行片段插入的pGEM-3Zf(+)载体(约20μg或10.6pmol)。通过加入0.5M EDTA至终浓度为0.02M而终止此反应。乙醇沉淀及以1g/μl重悬浮于TE缓冲液中，然后用苯酚提取。(d)最后，在室温将1μl用MboI切割的DNA(见b步)与1μl或200ng去磷酸化的pGEM 3Zf(+)(见c步)和1μlT4DNA连接酶(1～3U/μl)保温2小时，进行20μl插入物-载体连接。

最后，用Technical Bulletin#095所述Promega转化法，将10μl的插入物-载体连接反应转化入100μl JM109感受态细胞中。

实施例4通过菌落杂交选择含有(AAAAX)_n五核苷酸重复的小插入片段基因组文库

用Lightsmith II试剂和方法(见Promega Technical Bulletin#TM227)经菌落杂交筛选选择含有(AAAAX)_n五核苷酸重复的克隆，并通过与碱性磷酸酶辍合的探针杂交而显色。

将MagnaGraph尼龙膜(Micron Separations，Inc.Westboro，MA)置于含有细菌菌落的平板上，搁置3分钟，然后在干燥滤纸上印迹而将菌落DNA转移至膜上，接着将此膜转移到一系列含10％SDS托盘中，放置3分钟，然后转移至含5ml NaOH+30ml 5M NaCl+65mldH₂O的变性液中放置5分钟，然后转至由30ml 5M NaCl+25ml MTris-HCl，pH7.4+45ml dH₂O组成的中和溶液中放置5分钟，最后转至2XSSC中放置5分钟。然后将此膜在室温干燥30分钟，随后用

(Stratagene，La Jolla，CA)用1200ufoules UV交联。

借助于AP缀合的探针和化学发光物，检测含有具有(AAAAX)_n重复的克隆的菌落。将与AP缀合的探针杂交的滤膜在X线下曝光表明菌落含所需克隆。进行第二次杂交以证实初始结果。

检测程序利用Promega的Lightsmith II试剂盒(见PromegaBulletin#TM227关于程序的详述)。简而言之，所用检测程序由以下步骤组成：(a)在Quantum

封闭溶液(Promega Cat No F1021)中，将滤膜在56℃强力振荡培养45分钟，(b)到出封闭溶液，并每cm²含AP探针的膜加入0.05ml Quantum

高严格性杂交溶液(Promega Cat No F1231)，并在56℃强力振荡培养45分钟，(c)从滤膜中到出杂交/探针溶液，并用150～200ml在56℃预热15分钟的洗涤液#1(2×SSC，0.1％SDS)洗涤2次，(d)组合所有滤膜，并用洗涤液#2(1×SSC)在室温下洗涤1次，10分钟，(e)在200ml 100mM二乙醇胺，1mM MgCl₂中平衡印迹5分钟，(f)加入足够的0.25mM CDP-Star底物(Tropix Bedford，MA)，以饱和滤膜，然后在室温至少培养5分钟，(g)将底物饱和的滤膜置于杂交折叠器(folder)中的聚苯乙烯塑料片防护器上，并关上折叠器，(h)将含滤膜的杂交折叠器放在底片盒中，并将所含的滤膜曝光于X光胶片，(i)在曝光至少1小时之后，显色底片。

实施例5DNA测序和分析

一种简便的利用细胞裂解物制备测序模板的方法被开发出，以对实施例4中鉴别的可能含有带有至少一个(AAAAX)_n序列的插入物的大量克隆进行测序。此方法包括将菌落杂交分析中的阳性克隆转移至含200μl LB/Amp(100μl/ml)的无菌96孔微滴定平板中(Falconcat.#3072)，在250rpm，37℃培养过夜。接着，将过夜培养物分开，并用于三种不同方法，包括制备细胞裂解物，从第二次杂交中制备复制滤膜以证实初始发现，或制备甘油储液以长期贮存克隆。

取2μl过夜培养物并将其加入96孔反应平板(Perkin Elmer Cat#N801-0560)中的100μl无菌超纯水中，在9600热循环仪中加热至100℃4分钟，以产生细胞裂解物。然后冷却，冰冻，并在-20℃贮存直至使用。

经灼烧将96-针复制器灭菌，将此复制器蘸含过夜培养物的96孔平板中，印迹在LB/Amp(100ug/ml)平板上的137mm圆形尼龙膜(MagnaGraph，MSI)，在37℃将此膜培养过夜，从而制备复制滤膜以进行第二次杂交。

向每个孔中加入46μl 80％甘油，并将平板放在振荡培养器中，以250rpm振荡几分钟至混合，然后在-70℃贮存，以将剩余过夜培养物转变为甘油储液。

选择在二个菌落杂交分析中是阳性的所有克隆，并将细胞裂解物平板的相应克隆用于PCR扩增。用Qiagen QIAquick 96PCR纯化平板(cat#28180)纯化PCR反应产物，并用模板进行测序。将2μl细胞裂解物用于含有2μM M13-47正向引物(Promega cat，#Q560A)和2μM M13反向引物(Promega cat.#Q542A)，1×STR缓冲液和2.5单位Ampli Taq(Perkin Elmer)的50μl PCR反应中。在PE480热循环仪上使用以下循环曲线：在96℃/2分钟循环1次；在94℃/1分钟，56℃/分钟，70℃/1.5分钟循环10次；在90℃/1分钟，56℃/1分钟，70℃/1.5分钟循环20次；在4℃保持。根据生产者之建议用Qiagen QIAquick 96PCR纯化平板(cat.#28180)净化PCR反应产物，并回收入70μl Tris-HCl 10mM pH8.5，终浓度大约35ng/μl，并在-20℃贮存。

用ABI染料终止测序化学和ABI377测序仪进行DNA测序。用ABI染料终止试剂盒和生产商方案(Protocol P/N 402078)制备测序模板。将2μl或大约30～90ng纯化的PCR产物(上述)用作DNA模板进行测序反应。此测序反应包括8μl染料终止剂混合物，2μlDNA模板(35ng/μl)，4μl 0.8M M13-21正向引物，和6μl无菌超纯水，在GeneAmp PCR System 9600上循环测序循环曲线为：在96℃/10秒，50℃/5秒，60℃/4分钟循环25次，保持在4℃，在每个试管中加入50μl 95％乙醇和2μl 3M乙酸钠，pH4.6，用涡流混合，置于冰上10分钟，然后在最大速度离心30分钟，从而纯化延伸产物。将粒状沉淀用250μl 70％乙醇漂洗，真空离心约3分钟脱水，并在-20℃干燥贮存直至使用。然后将干燥的粒状沉淀再悬浮于6-9μl加样缓冲液中，然后在95℃变性2分钟，并在冰上贮存直至加样于凝胶上。

根据生产者之方案制备5％Long Ranger凝胶(FMC Bio Products，Rockland，ME)，并聚合2小时。将此凝胶在1000v预电泳45分钟。将加样缓冲液中的1.5μl模板加样于凝胶上，并在2×或4×条件下分别电泳3.5小时或7小时。

将产生自ABI 377测序仪的DNA序列数据进行编辑，以除去任何pGEM载体序列，然后置入局部数据库，该数据库是用遗传学计算机组Wisconsin软件包版本9.0(Madison WI)产生的，含有所有被评价克隆的序列信息。接着，测试克隆中是否存在五聚体重复，及其长度和序列模式。然后将那些含有5或更多个重复的克隆，用BLAST序列对比程序(Alargland et al；1990)比较，以鉴别复制的克隆和那些已存在于美国马里兰州Besthesda的国立生物信息中心的GenBank数据库中的克隆。一旦鉴别出独特的克隆，借助于寡聚物引物分析软件版本5.0(National Biosciences，Inc，Plymouth，MN)设计PCR引物。

实施例6筛选多态水平的克隆及测定染色体位置

在二个集合的DNA样品上进行初始多态性筛选，一个样品含有15个随机个体的人基因组DNA，另一个含有取自NIGMS人类遗传突变细胞贮存处(CEPH Collection DNA pool，cat.#NA 13431，CoriellCell Repositories，Camden，NJ)的54个CEPH个体的基因组DNA。荧光标记的PCR引物用于基因组DNA靶基因座的PCR扩增，并将PCR产物在聚丙烯酰胺凝胶上分离，并在荧光扫描仪上显色。将那些具有4个等位基因和50％杂合性的基因座随后用16个个体CEPH DNAs(102-1，102-2，884-1，884-2，1331-1，1331-2，1332-1，1332-2，1347-1，1347-2，1362-1，1362-2，1413-1，1413-2，1416-1，1416-2)测试，以测定初步杂合值。然后进一步分析相同基因座的数据，以确定等位基因数，等位基因频率和杂合值。(见表2)

将发现的含有五聚体重复序列并符合≥4个等位基因和≥50％杂合性的选择标准的克隆作图，以测定精确染色体位置(见表2)。有三种不同方法用于作图：(1)用代表单个人染色体的NIGMS组26个体细胞杂种(Coriell Cell Repositories，camden，NJ)进行体细胞杂种作图，以鉴别染色体起源，(2)利用GeneBridge 4RH组的93个RH克隆(Schuler et al；1996)进行辐射杂种作图的技术，和(3)标准减数连锁作图技术和8个取自CEPH同源参考组的家族(K102，K884，K1347，1362，1331，1332，1413，1416)并用CRI-MAP多点连锁程序(Lander&Green，1987)作图。

在对含有100个以上来自4种主要种族包括非洲人，白人，亚洲人和西班牙人的较大群体研究中，评价了16个CEPH个体中杂合值超过70％的克隆的基因型和等位基因出现频率。图10和11图示扩增自群体中24个不同个体基因组DNA样品中(DNA样品S02～S25)2个不同多态ITR基因座的等位基因迁移的广泛变化。用于此分析的引物对序列见上表1。用荧光标记的引物扩增每个五核苷酸重复基因座，随后在聚丙烯酰胺凝胶上分离，并经FMBIO II荧光扫描仪(Hitachi Software Engineering America，Ltd，San Francisco，CA)扫描显色，而产生凝胶图象。含有每个分析的基因座的大多数已知等位基因的等位梯包含在电泳凝胶两头的泳道中，即S01和S26泳道中。用于扩增每个基因座的引物对具有互补于分离自克隆S159或克隆G210的分离的DNA标记的序列至少一部分的序列，如以下实施例所示。此引物对序列选自上表1列出的克隆S159和G210引物对。

进行多态性筛选的PCR条件如下：25μl含大约200ng集合的DNA模板或25ng个体CEPH DNAs，1×STR缓冲液，1单位Taq聚合酶，和1μM相应引物对的反应物。用于扩增表2所列每个克隆的每个引物对序列见表1中所列。注意到每个引物以表1所列的SEQ ID NO表示。Perkin-Elmer Gene Amp PCR System 9600热循环仪(Perkin-Elmer Foster City，CA)的循环条件是：96℃1分钟，然后在94℃，30秒，68秒内缓升至60℃，保持30秒，50秒内缓升至70℃，保持45秒，循环10次，随后90℃30秒，60秒内缓升至60℃，保持30秒，50秒内缓升至70℃，保持45秒，60℃，30分钟循环20次。将2.5μl每个样品与2.5μl 2×溴酚蓝加样液混合以制备PCR样品，在95℃加热2分钟以变性，冰冻，然后将3μl每个样品在4％聚丙烯酰胺凝胶上，在40W电泳50分钟。将此PCR产物通过Hitachi FMBIO荧光扫描仪扫描显色，并用所附软件分析(FMBIO Analysis Version 6.0，Hitachi Software Engineering，San Francisco CA)

表2

SEQIDNO.	克隆号	GenBank登录号	观察到的最长ITR序列	观察到的等位基因号	％杂合性(白种人)	染色体位置
SEQIDNO.	克隆号	GenBank登录号	观察到的最长ITR序列	观察到的等位基因号	％杂合性(白种人)	染色体位置	1	C074	none	[TTTTG]<sub>9</sub>	6	75	1
2	C221	none	[GTTTT]<sub>13</sub>	7	78	9p	1	C074	none	[TTTTG]<sub>9</sub>	6	75	1
2	C221	none	[GTTTT]<sub>13</sub>	7	78	9p	3	C240	none	[CAAAA]<sub>7</sub>	4	42	NA
4	C331	none	[GTTTT]<sub>10</sub>	5	43	NA	3	C240	none	[CAAAA]<sub>7</sub>	4	42	NA
4	C331	none	[GTTTT]<sub>10</sub>	5	43	NA	5	C362	none	[6TTTT]<sub>5</sub>	4	62	4
6	C390	none	[CAAAA]<sub>7</sub>	5	56	NA	5	C362	none	[6TTTT]<sub>5</sub>	4	62	4
6	C390	none	[CAAAA]<sub>7</sub>	5	56	NA	7	G022	none	[AAAAG]<sub>6</sub>	4	63	2p
8	G023	none	[AAAAG]<sub>10</sub>	12	71	16q	7	G022	none	[AAAAG]<sub>6</sub>	4	63	2p
8	G023	none	[AAAAG]<sub>10</sub>	12	71	16q	9	G025	none	[AAAAG]<sub>6</sub>	12	86	1
10	G047	none	[AAAAG]<sub>9</sub>	5	86	2p	9	G025	none	[AAAAG]<sub>6</sub>	12	86	1
10	G047	none	[AAAAG]<sub>9</sub>	5	86	2p	11	G065	none	[TTTTC]<sub>6</sub>	13	100	1q
12	G085	none	[AAAAG]<sub>11</sub>	8	93	10q	11	G065	none	[TTTTC]<sub>6</sub>	13	100	1q
12	G085	none	[AAAAG]<sub>11</sub>	8	93	10q	13	G132	none	[CTTTT]<sub>15</sub>	12	100	4qter
14	G145	none	[AAAAG]<sub>13</sub>	8	33	NA	13	G132	none	[CTTTT]<sub>15</sub>	12	100	4qter
14	G145	none	[AAAAG]<sub>13</sub>	8	33	NA	15	G152	none	[AAAAG]<sub>6</sub>	5	87	8qter
16	G153	none	[AAAAG]<sub>6</sub>	5	88	8qter	15	G152	none	[AAAAG]<sub>6</sub>	5	87	8qter
16	G153	none	[AAAAG]<sub>6</sub>	5	88	8qter	17	G158	none	[AAAAG]<sub>5</sub>	8	75	5q
18	G181	none	[GAAAA]<sub>14</sub>	5	72	NA	17	G158	none	[AAAAG]<sub>5</sub>	8	75	5q
18	G181	none	[GAAAA]<sub>14</sub>	5	72	NA	19	G210	none	[CTTTT]<sub>6</sub>	9	56	8p
20	G212	none	[CTTTT]<sub>9</sub>	6	100	NA	19	G210	none	[CTTTT]<sub>6</sub>	9	56	8p
20	G212	none	[CTTTT]<sub>9</sub>	6	100	NA	21	G233	none	[AAAAG]<sub>8</sub>	12	50	10q

SEQIDNO.	克隆号	GenBank登录号	观察到的最长ITR序列	观察到的等位基因号	％杂合性(白种人)	染色体位置
SEQIDNO.	克隆号	GenBank登录号	观察到的最长ITR序列	观察到的等位基因号	％杂合性(白种人)	染色体位置	22	G234	none	[AAAAG]<sub>12</sub>	4	80	16qter
23	G235	none	[TTTTC]<sub>6</sub>	4	56	2p	22	G234	none	[AAAAG]<sub>12</sub>	4	80	16qter
23	G235	none	[TTTTC]<sub>6</sub>	4	56	2p	24	G331	none	[CTTTT]<sub>8</sub>	5	73	NA
25	G405	none	[CTTTT]<sub>6</sub>	10	80	NA	24	G331	none	[CTTTT]<sub>8</sub>	5	73	NA
25	G405	none	[CTTTT]<sub>6</sub>	10	80	NA	26	G475	none	[GAAAA]<sub>12</sub>	12	92	15q22.3
27	G539	none	[GAAAA]<sub>12</sub>	13	100	15q26.2	26	G475	none	[GAAAA]<sub>12</sub>	12	92	15q22.3
27	G539	none	[GAAAA]<sub>12</sub>	13	100	15q26.2	28	S023	×05367	[AAAAT]<sub>6</sub>	4	50	NA
29	S071	M90078	[AAAAT]<sub>8</sub>	4	56	6q26-27	28	S023	×05367	[AAAAT]<sub>6</sub>	4	50	NA
29	S071	M90078	[AAAAT]<sub>8</sub>	4	56	6q26-27	30	S085	U07000	[AAAAT]<sub>5</sub>	7	44	22q11
31	S125	Z73416	[AAAAT]<sub>13</sub>	5	64	22q11.2-qter	30	S085	U07000	[AAAAT]<sub>5</sub>	7	44	22q11
31	S125	Z73416	[AAAAT]<sub>13</sub>	5	64	22q11.2-qter	32	S132	Z83847	[AAAAT]<sub>10</sub>	8	69	22
33	S136	Z82250	[TTTTC]<sub>6</sub>	11	94	22q12-qter	32	S132	Z83847	[AAAAT]<sub>10</sub>	8	69	22
33	S136	Z82250	[TTTTC]<sub>6</sub>	11	94	22q12-qter	34	S159	AC000014	[GAAAA]<sub>9</sub>	12	72	21q22-qter
35	S176	AC000059	[GTTTT]<sub>9</sub>	4	56	7q21-7q22	34	S159	AC000014	[GAAAA]<sub>9</sub>	12	72	21q22-qter
35	S176	AC000059	[GTTTT]<sub>9</sub>	4	56	7q21-7q22	36	S189	Z54073	[AAAAC]<sub>8</sub>	5	69	22q11.2-qter
37	S199	Z84475	[GTTTT]<sub>7</sub>	4	75	6q21	36	S189	Z54073	[AAAAC]<sub>8</sub>	5	69	22q11.2-qter
37	S199	Z84475	[GTTTT]<sub>7</sub>	4	75	6q21	38	S040	X06583	[AGCCTGG]<sub>4</sub>	2	NA	NA
39	S066	M68516	[ACTCC]<sub>5</sub>	3	NA	NA	38	S040	X06583	[AGCCTGG]<sub>4</sub>	2	NA	NA
39	S066	M68516	[ACTCC]<sub>5</sub>	3	NA	NA	40	S077	M25718	[[AATAC]<sub>12</sub>	6	NA	NA
41	S097	Z21818	[CAGGCT]<sub>3</sub>	3	NA	NA	40	S077	M25718	[[AATAC]<sub>12</sub>	6	NA	NA
41	S097	Z21818	[CAGGCT]<sub>3</sub>	3	NA	NA	42	S103	X15949	[ATCCC]<sub>8</sub>	3	NA	NA
43	S110	X54108	[GGA(A/G)T]<sub>32</sub>	6	NA	NA	42	S103	X15949	[ATCCC]<sub>8</sub>	3	NA	NA

实施例7通过GenBank搜索鉴别短串联重复

鉴别串联重复序列的方法是：搜索国立生物信息中心(NCBI)GenBank中中度串联重复的存在与否。使用的一些方法包括用DNASTAR的Lasergene软件包，在CD-ROM上成批搜索GenBank入口，用遗传学计算机组Wisconsin软件包版本9.0(Madison，WI)成批搜索GenBank。

有4⁵＝1024个不同的五字母单词可从4个字母(A，C，G，T)组成，以产生所有可能的五聚体重复，且有4⁶＝4096和4⁷＝16384个不同六字母和七字母单词产生6碱基重复和7碱基重复。但是，由于二个互补链的等价(如AAAAT等价于ATTTT)，及环状置换的等价(如AATAA…等价于ATAAA…)，独特的重复基序数相对较少。在5碱基重复的情况下，这意味着如果除去单核苷酸重复A₅/T₅和C₅/G₅，有102类独特的五聚体重复。

所有具有至少3个连续拷贝的5，6和7碱基重复的独特组合，用于搜索GenBank人基因组数据库。所有含3个或更多重复拷贝或具有偶然碱基取代的拷贝的重复区被鉴别。用现存的序列数据，设计位于重复区侧翼的引物，靶基因座经PCR扩增，并如实施例6所述评价多态含量。

然后将含有用GenBank数据库信息装配的引物鉴别的序列的每个克隆，如实施例7中所述筛选重复序列含量。发现的含有ITR序列，即ITR标记的每个克隆的序列指定为SEQ ID NO：28～43之一。含有位于每个这种标记的ITR区侧翼的序列的引物的序列见表1。每个这种ITR标记序列特征分析结果见表2。

实施例8评价中度串联重复基因座的PCR假象(即伪带百分率)

本研究中所述的许多标记代表一类新的标记，其产生较少的已知为“伪带”的PCR假象，(见以上本发明详述的解释章节)。这些假象的产生发生在PCR扩增期间，可能是称为重复滑动的DNA聚合酶相的现象导致。(Levinson & Gutman，1987，Mol，Biol.Evol.4(3)：203-221；Schlotterer & Tautz，1992.NAR20：211-215)。重复滑动的最终结果是含有与真正等位基因不同数目重复单位的PCR产物的产生。如果在PCR期间发生足够量的滑动，扩增的产物将显示为主要和次要条带，主要条带相当于真正等位基因，而次要条带相当于含有较多或较少重复单位的产物。

为确定不同基因座伪带条带的数量，将6个ITR基因座(C221，G023，G025，G210，S159和本发明中未阐述的另外的ITR即S117)，和17个四核苷酸串联重复基因座(F13A01，THO1，TPOX，F13B，FESFPS，D7S820，CSF1PO，D13S317，D8S1179，D16S539，LPL，FGA，D5S818，D3S1358，D18S51，vWA和D21S11)的PCR扩增产物在ABI 377测序仪上电泳，并用GenScan软件(PE AppliedBiosystems，Foster City CA)分析。测定在25～40个研究的个体样品中每个基因座观测到的所有主要峰和次要峰的峰高，以相对荧光单位(RFU)表示。计算次要峰相对于主要真正等位基因峰中观测的RFU百分率，在五核苷酸重复中次要峰通常比真正等位基因少5bp，在四核苷酸重复中比真正等位基因少4bp(见表3)。

ITR基因座S159(图2)和G210(图3)，和四核苷酸重复基因座vWA(图4)和D5S818(图5)的ABI 377电泳图示出在ITR基因座伪带最小或无伪带，在四核苷酸重复基因座可清楚观察到伪带。特别地，图3中再产生的vWA四核苷酸重复基因座的电泳图中箭头14和15，和图5中再产生的D5S818四核苷酸重复基因座的电泳图中箭头16和17表示伪带假象。将那些明显的假象峰与示于图2的分离自克隆S159的DNA标记(即具有SEQ ID NO：34的序列的标记)和示于图4的分离自克隆G210的DNA标记(即具有SEQ ID NO：19的序列的标记)的五核苷酸重复的电泳图中渐消的小假象相对比。图2-5中再产生的特异电泳图是每个基因座观测的伪带最高发生率。

对所有基因座观测的伪带数量有一些可变性。通常的趋势是等位基因含有最高重复数(以碱基对大小而表明)呈现最高量伪带。示出的25-40个每个测试个体伪带百分值是散射图(图6，7，8和9)。

简而言之，“伪带”条带与真正等位基因条带的百分比，在大多数评价的ITR基因座中，与四核苷酸串联重复基因座相比明显较低。即使所用四核苷酸基因座代表当前已知的最佳此类标记，此结果也是确实的。例如，13个这种四核苷酸标记，包括一些下表3中阐述报道的具有高伪带百分率的四核苷酸标记，已被美国联邦调查局选择用于分析国立组合DNA指数系统(CODIS)的所有DNA样品，(Macivee，I.(1998)Profiles in DNA(3)：2)。

表3

基因座名称或克隆号	串联重复单位长度	平均伪带百分率	最高伪带百分率	最低伪带百分率	标准偏差	所分析的等位基因数量
基因座名称或克隆号	串联重复单位长度	平均伪带百分率	最高伪带百分率	最低伪带百分率	标准偏差	所分析的等位基因数量	Clone S159	5bp(ITR)	0.1	1.4	0.0	0.4	40.0
Clone G210	5bp(ITR)	0.6	3.2	0.0	0.9	30.0	Clone S159	5bp(ITR)	0.1	1.4	0.0	0.4	40.0
Clone G210	5bp(ITR)	0.6	3.2	0.0	0.9	30.0	Clone C221	5bp(ITR)	0.9	3.3	0.0	0.9	27.0
F13A01	4bp	1.2	9.7	0.0	2.5	34.0	Clone C221	5bp(ITR)	0.9	3.3	0.0	0.9	27.0
F13A01	4bp	1.2	9.7	0.0	2.5	34.0	TH01	4bp	1.7	5.2	0.0	1.7	34.0
Clone S117	5bp(ITR)	2.0	6.9	0.0	1.7	37.0	TH01	4bp	1.7	5.2	0.0	1.7	34.0
Clone S117	5bp(ITR)	2.0	6.9	0.0	1.7	37.0	Clone G023	5bp(ITR)	2.3	6.6	0.0	1.7	39.0
TPOX	4bp	2.4	5.6	0.0	1.8	34.0	Clone G023	5bp(ITR)	2.3	6.6	0.0	1.7	39.0
TPOX	4bp	2.4	5.6	0.0	1.8	34.0	F13B	4bp	2.6	7.7	0.0	1.7	31.0
FESFPS	4bp	3.6	10.0	0.0	2.3	34.0	F13B	4bp	2.6	7.7	0.0	1.7	31.0
FESFPS	4bp	3.6	10.0	0.0	2.3	34.0	D7S820	4bp	3.8	8.2	1.6	1.6	28.0
CSF1P0	4bp	4.1	9.5	0.0	2.5	31.0	D7S820	4bp	3.8	8.2	1.6	1.6	28.0
CSF1P0	4bp	4.1	9.5	0.0	2.5	31.0	Clone G025	5bp(ITR)	4.5	9.3	0.0	2.1	36.0
D13S317	4bp	4.7	7.5	1.7	1.5	26.0	Clone G025	5bp(ITR)	4.5	9.3	0.0	2.1	36.0
D13S317	4bp	4.7	7.5	1.7	1.5	26.0	D8S1179	4bp	5.0	8.3	2.4	1.6	27.0
D16S539	4bp	5.1	8.6	1.7	2.0	28.0	D8S1179	4bp	5.0	8.3	2.4	1.6	27.0
D16S539	4bp	5.1	8.6	1.7	2.0	28.0	LPL	4bp	5.4	15.0	1.7	3.1	29.0
FGA	4bp	5.5	11.6	3.0	1.7	36.0	LPL	4bp	5.4	15.0	1.7	3.1	29.0
FGA	4bp	5.5	11.6	3.0	1.7	36.0	D5S818	4bp	6.1	9.0	0.0	1.9	28.0
D3S1358	4bp	6.1	12.5	0.9	2.1	25.0	D5S818	4bp	6.1	9.0	0.0	1.9	28.0
D3S1358	4bp	6.1	12.5	0.9	2.1	25.0	D18S51	4bp	6.5	11.6	2.5	2.4	28.0
vWA	4bp	6.6	11.4	3.7	1.4	28.0	D18S51	4bp	6.5	11.6	2.5	2.4	28.0
vWA	4bp	6.6	11.4	3.7	1.4	28.0	D21S11	4bp	7.5	15.7	1.9	3.5	30.0

序列表

(1)一般信息：

(i)申请人：Schumm，James W.

(ii)发明名称：鉴别和分析中度串联重复DNA标记的物质和方法

(iii)序列数：147

(iv)通讯地址：

(A)收信人：普罗梅加公司

(B)街道：2800Woods Hollow Road

(C)城市：Madison

(D)州：Wisconsin

(E)国家：USA

(F)ZIP：53711-5399

(v)计算机可读形式：

(A)媒介类型：3.5英寸软盘，1.44Mb

(B)计算机：IBM PC兼容机

(C)操作系统：Windows NT4.0

(D)软件：WordPerfect 7.0(DOS文本格式)

(viii)律师/代理人信息：

(A)姓名：Grady J.Frenchick

(B)注册号：29,018

(C)卷号：8976.80

(ix)电讯信息：

(A)电话：(608)257-2281

(B)传真：(608)257-7643

(C)E-MAIL：gfrechick@mail.stroudlaw.com

(2)SEQ ID NO：1的信息：

(i)序列特征：

(A)长度：445bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(vii)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：C074

(viii)基因组中的位置

(A)染色体/区段：1

(xi)序列描述：SEQ ID NO：1：

GATCCTTTGC ACCCAGANAG AAGTAATTAT TTCAACACAG TTGGAACAGT 50

TAAAAAGATT TAAAATTTTC AAAAAAACAA TCATTTTCTC TTTTCTTTCT 100

GGCTCAGACA CCTCATTGCT TTCTGACTGA CCAAGGCGCA GCGCANTTTG 150

CAGCAGCCAT GGGGGTTCCA GAGATTCCTG GANAAAAACT GGTGACAGAN 200

AGAAACAAAA AGCGCCTGGA AAAAGATAAG CATGAAAAAG GTGCTCAGAA 250

AACAGATTGT CAAAAGTAAG TCTTACCTGT GGCTCGCATT ATTTGGGAGT 300

TATTAAAATA TGAAAGTTTG GCAAATACCC GGTTATCTAC AGTCCTTTNG 350

TTTNGTTTTG GTTTTGTTTA GTTTGGTTTT GTTTNGTTTN GTTTGACACG 400

GAATCTCTCT CTGTTGCCCA AACTGGGAAT ACAGTGGTGC CGATC 445

(2)SEQ ID NO：2的信息：

(i)序列特征：

(A)长度：411bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：C221

(viii)基因组中的位置

(A)染色体/区段：9p

(xi)序列描述：SEQ ID NO：2：

GATCACTTGC CATCCCTGCC ACACAGTTTC CTCCTCTGGA AACTGGGGGT 50

GATGACCCCT GCCCTACCCA CTTGTCATGG CATTGGGGAC ATGAACACAC 100

TTTGCACCTG TCAGGCAAGG CTTAAACAGG GATATGCACT GGTAATAGAA 150

AAGAGGGACT AAGTTTTGTT TTGTTTTGTT TTGTTTTGTT TTGTTTTGTT 200

TTGTTTTGTT TTGTTTTGTT TTGTTTTTCT GAAGAAGTCC CTAGAAGCGC 250

TCAGTGTTGG AATGCTCTCT TGTAGCAGTG GCGGCTGCTG CTGGTTCCGG 300

GTCAGATGCC GGAATTGGGG GTGCGCTTGG GTGCAGCTGC ATTTCATCTG 350

GTCCTGGGCC TCGGTCCTGG CTTGGAGAGG TGCAGCTCAC AGCCACTTCA 400

TGGCTGGGAT C 411

(2)SEQ ID NO：3的信息：

(i)序列特征：

(A)长度：354bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：C240

(xi)序列描述：SEQ ID NO：3：

GATCANCATG GGTTCTATCT GCCTGGCCCT TCACCCCCTA CTCAGGGCAG 50

CTCTGAATTG TCTNCCCCGC TTCAAAGTTC CCAGTTCAAC TTCTCCCTCT 100

GCCCAATCCT GTTTCCTTCT CTTCCACAGG TATTAATTTG GCCAGNTGCA 150

GTGGCTCATG CCTGTAATCT CAACTTTGGG AGGCCAAGGT GGGAGGATTG 200

CTTGANCCCA GAATTTTGAA ACCANCCTCT GAAACATANT GANACCCCTG 250

TCTCAAAACA AAACAAAACA AAACAAAACA AAACAAAAAC TANCCAGGCA 300

TGATGGTGTG TGCCTGTGGT CCCANCTATT CAGGAGGCTG AAATGGGAGG 350

ATC 353

(2)SEQ ID NO：4的信息：

(i)序列特征：

(A)长度：317bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：C331

(xi)序列描述：SEQ ID NO：4：

GACCGTGGAA NCCAAAAGTC TGCCTACCGC ATCTTAGTCC AGAGTTCCTG 50

TTTTTACTTC TTTTTGAAGG TCTGTGGATT CTTTATTTTC ATGGCACCTT 100

AGCAATACAT TTTAAAAGCT TGTTTTATTT TATTCAGCAT TTTGGTTATT 150

TCCATTGGAA NANTCATTCA GGGCGTTTAG TCTGCCACAG TGCTGGAAAC 200

TAAAGCTAGG ATTACATGTT TTGTTTTGTT TTGTTTTGTT TTGTTTTGTT 250

TTGTTTTGTT TTGTTTTGTG ACAGGGTCTT GCTCTATTGC CTTAGGCTGG 300

GGTGCAGTGT TGTGATC 317

(2)SEQ ID NO：5的信息：

(i)序列特征：

(A)长度：387bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：C362

(viii)基因组中的位置

(A)染色体/区段：4

(xi)序列描述：SEQ ID NO：5：

ACAGACTAAC AGAAAGAANA TCAGGTCGAC TTGCCTAAAA AGAGTGAGCT 150

AGGGAAAAGC ATGGCGGAAG AAACAANGTT GCTGAAAGCA ACTCTTATTT 200

TCTTGGCTTA GAAACCANNA AAATGCNTTT GGGTTTTATC TTAGCATAAT 250

GAAAAGACAT GTNANACTTC TGAACACGAA ATCTGACATG TTTTACAGAC 300

NTGTTTTACA TGGTTTTGTT TTGTTTNGTT TTGTTTTGGG ATGGAGTCTC 350

GCTCTGTTGC CANGCTGGGA GTGCAATGGT TGCGATC 387

(2)SEQ ID NO：6的信息：

(i)序列特征：

(A)长度：471bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：C390

(xi)序列描述：SEQ ID NO：6：

GATCACGAGG TCAGGAGATG GAGACCATCC TGGCTAACAT GGTGAAACCC 50

CGTCTCTACT AAAAATACCA AAAAATTAGC CGGGCATGGT GGCGGGCGCC 100

TGTAGTCCCA GCTACTCAGG AGGCTGAGGC AGGAGAATGG CGTGAACCCG 150

GGAGGCGGAG CTTGCAGTGA GCCGAGATTG CGCCACTGCG CTCCAGCCTG 200

GGTGACAGCG AGAATCTGTC TCAAAACATA ACAAAACAAA ACAAAACAAA 250

ACAAAACAAA ACAAAAAAGA TTTGGAATTA TGTAGGCAAA GTGGGAGAAA 300

GAGANGGACG AGGACTNAGG TAAAGATAAT ATGCAAAATA GAAAGAGCAN 350

GAAGGGGCAT GGATATGTGT AAATTCAAAG AAAGGCAAAG TGGCTGGTGC 400

ACAAAGAGTG AGGAGAGCAA NGNGTGAAAA TGACTTTAGT GAGACAAGGC 450

AAGGGACAAA TCATGAAAAA T 471

(2)SEQ ID NO：7的信息：

(i)序列特征：

(A)长度：367bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G022

(viii)基因组中的位置

(A)染色体/区段：2p

(xi)序列描述：SEQ ID NO：7：

GATCGCACCA CTGCACTCCA GCCTTGGTGA CAGAGCAAAA CTCNTTCTCC 50

AAAGAAAAGA AAAGAAAAGA AAAGAAAAGA AAAGAAAAAA AAAATCCATG 100

GTGAAAGTGA CGACAGTNGA GTAGGGGATG AGCTCAAAGC AAATGCATGC 150

ATGTNCCCCA CCCTCAACAC AAACACACAC ACACACACAC ACACACACAC 200

ACACACACAC ACACATACTT CTTTAGAGAT ATTTAGGTGT ATATATGCTA 250

ACTTAGGAAA CTTTAGAAAA CCTTGTTATG ATATTATTAG TCAAAAAATA 300

TTTAAGCCAC AGTTTCGCAA TTTTAAGATT GTACTACTGG TATCTGGAGT 350

ATCTGAATCT CTGGATC 367

(2)SEQ ID NO：8的信息：

(i)序列特征：

(A)长度：295bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G023

(viii)基因组中的位置

(A)染色体/区段：16q

(xi)序列描述：SEQ ID NO：8：

GATCACAGCA CTGCACTGCA GCCTGGGCAA GAGAGCAAGA CCCTCTCTCT 50

CAGGGAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA 100

AAGAAAAGAA AGGAAGGAAA GAGAGAGGAA GGAAGGAAGG AAGGTAAGAA 150

GGAAGGAAGG AAAGAAAGAA GGAAGGAAGG TAGGGTGGTT TTGGGATGTG 200

AAATGCTGTC AGTCAACAAA GAGCTATGAC CACAGGTGTC ACTGAGTAGC 250

AGGGGCAGCC CATCCTGCTC CCTAGCTGCA CTCACCCTGA AGATC 295

(2)SEQ ID NO：9的信息：

(i)序列特征：

(A)长度：361bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G025

(viii)基因组中的位置

(A)染色体/区段：1

(xi)序列描述：SEQ ID NO：9：

GATCTGATGG TTTCATAAGT GTCTGGCATT TCCCCTGCTT GTACTTCTCT 50

CCCCGGCTAC CGTGTGAAAA AGGTCCTTGC TTCCCCTTTG CCTTCCACCA 100

TGATTGTGAG CTTCCTGAGG CCTCCACAGA CATGTGGAAC TGTGAGTCAA 150

TTAAACTTCT TTCCTTTATA AATTACCCAG TCTCAGGAAG TTCTTTGTAG 200

CAGTGTGAGA ATGGAGGAAG AAAGAAAAAG AAAAAAAAGG AAAAGAAAAG 250

AAAAGAAAAG AAAAGAAAAG AAAGGAAGA AAGAAAGAAAG AAAGAAAGAA 300

AGAAAGAAAG AAAGAAAGAA AGAAAGAAAG AAAGAGAGAG AAGTGGTTAG 350

CAAATGTGAT C 361

(2)SEQ ID NO：10的信息：

(i)序列特征：

(A)长度：318bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G047

(viii)基因组中的位置

(A)染色体/区段：2p

(xi)序列描述：SEQ ID NO：10：

GATCACTTGA GGCCAGGGGT TCGAGGCCAG CCTGGGCAAC ATATCAAGAC 50

CCCCATCTCT ACATAAAAAG AAGAAGAAAC GAAAAGAAAA GAAAAGAAAA 100

GAAAAGAAAA GAAAAGAAAA GAAAAGAGTG GAAGAGTGCA GGAGCCGAGA 150

GGGAGAGAAA ATGTAGTGGT GAGGGGCAGC TTCTGGAAAG GCCCATACTA 200

CAGAGGGAGG AATCCTAATT CCTCACTATC TCTCTAACAT CAGGTAAGCA 250

TCTCATGATG CAGTTAGAAA GCACATTTCC TTCTTCAGTT TCCCCTCTGG 300

CTGTGTTGAC CCAGCCCA 318

(2)SEQ ID NO：11的信息：

(i)序列特征：

(A)长度：362bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G065

(viii)基因组中的位置

(A)染色体/区段：1q

(xi)序列描述：SEQ ID NO：11：

GATCACATTT GCTAACCACT TCTCTCTCTN TCTTTCTTTC TTTCTTTCTT 50

TCTTTCTTTC TNTCTTNCTT TCTTTCTTTC TATCTTCCTT TCTTTACTTT 100

NCTTTNCTNT TCTNTTCTAT TCCTTTANAT TTCTTTTTCT TTCTTTCTCC 150

ATTCTCACNC TGCTANAAAG AACTTCCTGA GACTGGGTAA TTTATANAGG 200

AAAGAAGTTT AATTGACTCA CAGTTCCACA TGTTTGTGGA GGCCTCAGGA 250

AACTTACAAT CNTGGTGGAA NGCAAAGGGG AANCAAGGAC CTTTTTCACA 300

CGGTAGCCGG GGAAATAATT ACAANCAGGG GAAATGCCAN ACACTTATGA 350

AACCATCAGA TC 362

(2)SEQ ID NO：12的信息：

(i)序列特征：

(A)长度：297bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G085

(viii)基因组中的位置

(A)染色体/区段：10q

(xi)序列描述：SEQ ID NO：12：

GATCATGTCA TTGCACTCCA GCCTGGGTGA TACAGCAAGC CTCATCGAAA 50

GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA 100

GAAAGGAAGA AAAGAAAACA AANAGATAGA AAGCAANCNN GTGGCNTGAG 150

AANTNAAATT CTTATAGGTA ACCTGGAGGA CTTTTATCTT TCCAGGAGTC 200

TCTCTCAATG CATTTAGACT CAACAANGAT TTCCTTTTCT CTTGTCTCTA 250

NAAANAAATG CATTTCCTCA AAANANTGGA GGTCANATTA TGTTANAGAT 300

GGGAGAATGC ACTGAGTTNC GCTGAANGA 329

(2)SEQ ID NO：13的信息：

(i)序列特征：

(A)长度：372bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G132

(viii)基因组中的位置

(A)染色体/区段：4qter

(xi)序列描述：SEQ ID NO：13：

GATCTACCAT TCTTGGGTCT GGAGAACAGT GGCCCTTGTT TCTTTTCTTT 50

TCTTTTCTTT TCTTTTCTTT TCTTTTCTTT TCTTTTCTTT CCTTTTCTTT 100

TCCTTTCCTT TCCTTTTCTT CTCTCTCTCC TTCTCTCTCT CTCTCTCTCT 150

CTCTCTCTCT CTCTCTCTCT CTCCCTCTCC CTTCCCTTCC CTTCCTTTCC 200

CTTCCTTTCC TTTCCTTTCA TTTTTTTTGA CATGGAGTTT CACTCTTGTC 250

ATCCAGGCTG GAGTACAGTA NTGTGATTTT GGCTCACTGC AACCTCTGCC 300

TCNTGGGTTC AAGAGATTCT CCTGCCTCAG CTTCCTGANT AGCTGGGATT 350

ACAGGTGCCT GCCACCATGC TT 372

(2)SEQ ID NO：14的信息：

(i)序列特征：

(A)长度：350bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G145.1

(xi)序列描述：SEQ ID NO：14：

GATCTCTTGA AGCCTCGCAN ATAAAGGCTC CAGTGGGGTA TGATTGCACC 50

ANTGCACTCC ANCCTGNGAN ACGGNAGAGA GATTCTGTCT CAAAAGAAAA 100

CAAAATAAAA GAAAANAAAA NAAAANAAAA TAAAANAAAA TANAAGAAAA 150

GAAAAGGATG CTTTAAAAAT NTGGCAAAAT GTNCCCTTTA TTGACTACTG 200

CCTTGTTTTA ATTTNCTCTA TTTNTCTATT TATTTTCTCA GTGTACTTTC 250

CCATNTNNCT TTNTCTCTTC CTTCTTTGAA AGTAATTCTT GGCCAGGCAT 300

GGTGGTTCAT GCCTATAATC TCANCACTTN AGGGGGCTNA AGCNGGAAGA 350

(2)SEQ ID NO：15的信息：

(i)序列特征：

(A)长度：372bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G152

(viii)基因组中的位置

(A)染色体/区段：8qter

(xi)序列描述：SEQ ID NO：15：

GACCACCTGA GGTCATGAGT TCCAGACCAG CCTGGCCAAC ATGGCAAAAC 50

CCCGTCTCTA CTAAAAATAC AAAAAATAGC CGGTGTGATG GTGGGTGCCT 100

GTAATCCCAG CTACTCAGGA GGCATGAGAA TCGCTTGAAC CTGGGAGGCG 150

GAGGTTGTAG TGAGCTGAGA TTGCGCCTCT GCACTCCAGC CTGAGTGATA 200

GAGTGAGACC CCATCTTGAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA 250

AAGAAATTCA TCATTGGGAA ACATCATGGA NGGCCGCNAC CAGTCAGGGG 300

AACATTTCCG AAAGCNANTT NTTCTTCCAA TGCCCTATGT TNCTTCCCCN 350

AAGCTTGCCA TTTTNAACCC TT 372

(2)SEQ ID NO：16的信息：

(i)序列特征：

(A)长度：361bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G153

(viii)基因组中的位置

(A)染色体/区段：8qter

(xi)序列描述：SEQ ID NO：16：

GACCACCTGA GGTCATGAGT TCCAGACCAG CCTGGCCAAC ATGGCAAAAC 50

CCCGTCTCTA CTAAAAATAC AAAAAATAGC CGGTGTGATG GTGGGTGCCT 100

GTAATCCCAG CTACTCAGGA GGCATGAGAA TCGCTTGAAC CTGGGAGGCG 150

GAGGTTGTAN TGAGCTGAGA TTGCGCCTCT GCACTCCAGC CTGAGTGATA 200

GAGTGAGACC CCATCTTGAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA 250

AGAANTTCNT CATTGGGAAA CATCATGGAG GCCGCAGCAN TCAGGGGAAC 300

ATTTCCGAAA GCNAGTTGTC NTTCCAATGC CCTATGTTNC TTCCCCNAAG 350

CNTGCCATTT T 361

(2)SEQ ID NO：17的信息：

(i)序列特征：

(A)长度：447bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G158

(viii)基因组中的位置

(A)染色体/区段：5q

(xi)序列描述：SEQ ID NO：17：

GATCGCCTGG GTACAGCAGG AAAGAAGGGG GCGGCCACGG CAAGGCAGCC 50

TCCGACTGCC CGGCGGGGGA NGCCGGCGGC GGCCCCTTCT CGCCCTCTCC 100

TATAAGCAGT TTTATAAGCT TCCTGAGACT ANAAAAGGAA AAGAAAAGAA 150

AAGAAAAGAA AAGAAAAATC AGTCTCTATT TTATATGCGT ATAATTTTTT 200

TTATATGCGT ATAATTTTTT TTTTAACCAA AAACTCNTTA TGGACAAAAC 250

AAACTACCAT CCCACTCCAA ATTATCTCTG CATCATGCTC ACAACCTCAG 300

CNCAAATTTC AATANAANTT TTATTGGGAT ATGTTTGGCT TCCATCAATT 350

GAAATTTCCC CTAATGAATA AAATTTCCTC CCGTTTTTTT GGTAAACATT 400

TCCCCTTGNA AGGCCCACCT AAAAATCNCC NGGNCTTTTT CCAAAGG 447

(2)SEQ ID NO：18的信息：

(i)序列特征：

(A)长度：415bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G181

(viii)基因组中的位置

(A)染色体/区段：

(B)图谱位置：

(C)单位：

(xi)序列描述：SEQ ID NO：18：

GATCCCAAGC TTCCCGGGTA CCGCGATCAC CTGAGGTCAG GAGTTCAAGA 50

CCAGCCTTCT CAACATGGCA AAACCTCATT TCTACTAAAA ATACAAAAAA 100

TTAGCTGGGC ATGGTCTTGG GTGCCTGTAA TCCCAGCTAC TCAGGAGGCT 150

GAGGCAGGAG AATGTCTTGA ACCCAGGAGG CGGTGGCTGC AGTGAGGCAA 200

NATTTTGCCA GTGTNCTCCA GCCTGGGTGA CAANANTGAA ACTCCGTCTG 250

AAAGAAAGAA AGAAAAAGAA AGAAAGGAAG GAAGGAAGGA AGGAAAGGGA 300

AGGAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA 350

AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA TNAGATGGGG GAGCTCTACC 400

GAACTGATTC CGATC 415

(2)SEQ ID NO：19的信息：

(i)序列特征：

(A)长度：444bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G210

(viii)基因组中的位置

(A)染色体/区段：8p

(xi)序列描述：SEQ ID NO：19：

GATCCTATCC TGACAAACTC AAGCAAATTC ACAAATACAA CCCTCTAGCC 50

GGCCCATGGC CTCCCTATTT GGGAGGAAAA AACTCAGTAT GATACTGTGA 100

CATATTTCAT TCATTATCTG TTAAGGTGAG CGTGGCAAAC CTGGCCGAAG 150

TGGCAGAATA TTGGGGCTCA TCACTTGGGG GAATGATTCA GGAGTGGCAT 200

CCTTCTGTGA CCTGTGACAG CCACTTAAGG TTGTGGGATG ACTACTACAA 250

AATCCCAAAT AAAGTATATC CTAAAGGCTT TCTTTTCTTT TCTTTTCTTT 300

TCTTTTCTTT TCTCTTCTCA TCTCTTGTCT TCTCTTCTTT TCTCCTCTCC 350

CCTCCCCTCC CATCCCCTCT CCTCTCCTCT CCTTTCCTTG TTTTAAAAAC 400

AATGTCTTGC TCTGTTGACC AGGCTGGAAT GCAGTTCTGT GATC 444

(2)SEQ ID NO：20的信息：

(i)序列特征：

(A)长度：321bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G212

(xi)序列描述：SEQ ID NO：20：

GATCTCCTTC AGTGTACTCA GTGCATTCTC CATCTCTTAC ATAATCTGAC 50

CTCCACTCTT CCTGGAAATG CATTTCTTTT TAGAGACAAG AGAAAAGGAA 100

ATCCTTGTTG AGTCTAAATG CATTGAGANA NACTCCTGGA AAGATAAAAG 150

TCCTCCAGGT TACCTTTAAN ACTTTCATTT CTCCTGCCAC CTGCTTGCTT 200

TCTCTCTCTT TCTTTTCTTT TCTTCCTTTC TTTTCTTTTC TTTTCTTTTC 250

TTTTCTTTTC TTTTCTTTTC TTTTCTTTCG ATGAGGCTTG CTGTATCACC 300

CAGGCTGGAG TGCAATGACA T 321

(2)SEQ ID NO：21的信息：

(i)序列特征：

(A)长度：329bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G233

(viii)基因组中的位置

(A)染色体/区段：10q

(xi)序列描述：SEQ ID NO：21：

GATCGCTTGA GCCTTGGAGA TTGAGGCTAC GGTGAGCTAT GATTGCACCA 50

CTGCACTCCA GCCTGGGTGA CAGAGTGAGA CCCTGGGAGA AAAAAAGAAA 100

GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GTCNTGACCT 150

TGGAAAAAAC CANAATTTCT GATGTTGTAC AACTCCTGAA TTCTGACTGC 200

TCTCTCCNCN GAAAGANGGA ATNNNTGNTC CTTGGAGGAT TCNTACTAAT 250

ATTCTTCGGT CNANACAAAA ACNTGACCTC NAGCCNAGAA AACAANATTN 300

NNCCNTTCCA TAGAAAAGTT CAGGGGACA 329

(2)SEQ ID NO：22的信息：

(i)序列特征：

(A)长度：412bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G234

(viii)基因组中的位置

(A)染色体/区段：16qter

(xi)序列描述：SEQ ID NO：22：

GGATCACGCC ATTGCACTCC ACTCTGGGCA ACAAGAGCAA AACTCCATCT 50

CAGAAAAAAA GAAAGAAAGA AAGAAAGAAA GAGAGAAAAG AAAACAGAAA 100

AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAC 150

CCNNCAGAAA GCCAAGGCAA TGGGAACAAG CTGGGGCAAG TGCCTGGAGG 200

TGTTGCTGGA AAGGCAGATA GGGCAGAGAG CACCTGGACT CTTCCAAAAC 250

ATATTAGCAT CATGGTAAAG CCCTCAGCCC AAGTCCCCCA GAACATAGCC 300

GTAGTCAACC AAGTTGAGAT TGATTACTAG CTTCCTGTNA CAAGGGAGAT 350

TATNCNCACA CAAGTGCCAT CTGCCTCTCC CTTCACCCAG CTTGAGTTTC 400

GCTTGTAGCA CT 412

(2)SEQ ID NO：23的信息：

(i)序列特征：

(A)长度：359bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G235

(viii)基因组中的位置

(A)染色体/区段：2p

(xi)序列描述：SEQ ID NO：23：

GATCACCAGG CCCCTGAGGA AGCAGCACAG AAAAACACAA ATAATATCAA 50

TATCAGGCAG CCACAGGGGA AACAATGGGG CATTTCTCCG TGCTACATGC 100

ATGCTGCTAT TGTTTCAAGG GCTGGGGAAT TAATTCCACT TATTTATTTA 150

AGGCGTGTCA ACTCACTGCC TAAACCTGTT TCAGTGTCAA AATGGATAAA 200

ACTTTTATGG CTCATAAAAT ANANCCATTC ATCTCAATGT TCTTTGTGGT 250

GGGTTTTCTT TTCTTTTCTT TTCTTTTCTT TTCTTTTTTC TTTTTTTTTC 300

TGGCATACTG AGCTAAACCT CTGCTCTGAA ACGGTTACAT CTGAACCCAT 350

TGCTGCTAT 359

(2)SEQ ID NO：24的信息：

(i)序列特征：

(A)长度：516bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G331

(xi)序列描述：SEQ ID NO：24：

GACTTTCCCA CCTTCTGATG TGGGCATTTA GTGCTATAAA TTTCCCTCTA 50

AACACTGCTT TAGCTGTGTC CCANAGATTC TGGTATGTTG TGTCTTTGTT 100

CTCATTGGTT TCAAAGAACT TATTTATTTC TGCCTTAATT TTGTTATTTA 150

CCCAGTAGTC ATTCAGGAGA AGGTAGTTCA GTTTCCATGT AGTTGTGAAG 200

TTTTGAGTGA GTTTCTTTCC TTTTCTTTTC TTTTCTTTTC TTTTCTTTTC 250

CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT 300

TTCTTTTGTT TGAGATGGAG TCTTACTCTG TCGCCAGTCT GGAGTGCAGT 350

GGTGTCATCT CAGCTCGCTG CAACCTCCGC CTCCTGGGTT CAANAAATTC 400

CTCTGCCTCA GCCTCCCAAG TAGCTGGGTT TACAGGCACA CACCACCACG 450

CCCAGCTAAT TTTTTGTATT TTANTAAAGA CAGGGTTTCA CCATGTTGAC 500

NAAAATGGTC TCGATC 516

(2)SEQ ID NO：25的信息：

(i)序列特征：

(A)长度：556bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G405

(xi)序列描述：SEQ ID NO：25：

GATCTCACAT TCTTCCTCAG AATTCTTCTT GTTACCTCTG CAAAATTTCA 50

TCCTTCAAAC TCAAAGCTCA TTATCTTTGG ACTCTGTGAC ACTCTTCTGA 100

TTCTCATATC ACTTCTTGAT TTTCCTGCAT TTCCTCACTA ACTCTCAGCT 150

CATAATCATA TAAAATCACT AAGACTCTTT TTATATTGTC ATGAAGCTCA 200

GGTATTTTCA CAGATTGAAC CATTTCCCTG TAGACAGCAA TGCTCAACAT 250

GAACCATTCA CATCCTTCTT CCAAAGCACA GACTCTTCTT GCCATCTGCG 300

TCATGCCCAT GCTCATGTGC ATGGAGCCTG GTTCATTATC TTCCAAAATC 350

AAGCTTCCCC CACTTGATTT CTCTTTTCTT TTCTTTCCTT TCCTTTCCTC 400

TTTTCCTTTT CCCTTTCCCT TTCCTTACCT TTCCTTTCCT TTCCTTTCCT 450

CTCCTCTTTT CTCTTTTCTT TTCTTTTCTT TTCTTTTCTT TTCCTTTCCT 500

TTCNTTTCTT TTATTTGCAC CTCACTCTTG CCAAGGCTGG GATGGCAGTA 550

ANCACG 556

(2)SEQ ID NO：26的信息：

(i)序列特征：

(A)长度：335bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G475

(viii)基因组中的位置

(A)染色体/区段：15q22.3

(xi)序列描述：SEQ ID NO：26：

GATCACGCCA TTGCACTCCA GCCTGGGCGA CTGAGCAAGA CTCAGTCTCA 50

AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA 100

AAGAAAAGAA AATTGTAAGG AGTTTTCTCA ATTAATAACC CAAATAAGAG 150

AATTCTTTCC ATGTATCAAT CATGATACTA AGCACTTTAC ACACATGTAT 200

GTTATGTAAT CATTATATCA TGCATGCAAG GTAATGAGTA TTATTTTCCT 250

CATTTTATAA AAGAGGAAAC TGATGTTTGA GGCTACTTTG CTTAAGACCG 300

CAGAACTAGC AAAGGAAAAG AGAAGTGAAT GTATC 335

(2)SEQ ID NO：27的信息：

(i)序列特征：

(A)长度：333bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：G539

(viii)基因组中的位置

(A)染色体/区段：15q26.2

(xi)序列描述：SEQ ID NO：27：

GATCGTGCCA CTGCACTCCA GCCTGGGCAA CAGAGTAAGA CTCAGTCTCC 50

AAAAAAAAAA AAAGAAAGAA AGAAAAAGAA AGAAAGAAAG AAAGAAAGAA 100

AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA 150

AAGAAAAGAA AAAGAAAAAG AAAAAATAAA GAGGTGAACG GTACTGAACA 200

GAAACTAAGA AGGCTGAGAG CCAACTCTGA GGTAACAGCT AGGAGCTGAA 250

GCAGGAAAGC TAAAATCTGC CCCAGTCCCA TTGCTGATAG ACTCACCATT 300

TACTAACAGA GAAACCATTC CTCCTTTTAG ATC 333

(2)SEQ ID NO：28的信息：

(i)序列特征：

(A)长度：1011bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：质粒，pGem3Zf(+)

(B)克隆：S023

(xi)序列描述：SEQ ID NO：28：

CTGTACTGAA TTACAGCCCC AAATCTGGGT CAACTGGGGA GAGACGACGA 50

GGATTAGGGT TCCAAGGTGA AACTGTGCCA TTGCGCTCCA GCCTGGGCAA 100

CAAGAATGAA ACTCTCTTAA AATAAAATAA AATAAAATAA AATAAAATAG 150

CCTAAGGATG CATTTCTCAG AACTTATCCC TGTTGTTCAA TGATGTGTGT 200

CTATACAGTG GGGCCATAAC TAAGACGTAT GTTGCCCAAG CTGGCAAGAT 250

AGCTCTGACC TTCTCTTGGG CCCCTCATTT CCCCCAAACA CAGGTTGTCT 300

GCAGTCTTGA CCAATGGCTG CCAGGGCATG GACTCCGCTG CAGGGGCCAG 350

TGGGAGGCCC CAGCTCAGGC AAAAGCACAG GCAGATATTT CAGGAGTCTG 400

CTAGGGCTGG CACTGAGGGC AGAGACAGAG GGGTCTCCCT GTCCTTTGGA 450

GAACCTCACG CTGCAGAAAT TCCAGACTGA ACCTTGATAC CGAGTAGGGG 500

AGGAGCTGTC TGCGGGTTTG AGCCTGCAGC AGGAGGAAGG ACGTGAACAT 550

TTTATCAGCT TCTGGTATGG CCTTGAGCTG GTAGTTATAA TCTTGGCCCT 600

GGTGGCCCAG GGCTACAGTC ATCCTAGCAG TCCCCGCTGA AGTGGAGCAG 650

GTACAGTCAC AGCTGTGGGG ACAGCAATGC TGGCCAAGGG TCTTCCCCCA 700

CGCTCAGTCC TGGTCAAAGG CTGCCAGACC TTTCTGAGTG CCCCCAGGGA 750

GGGGCTGGGG CGTCTCAGGG TGCCCACTGG CGAGGGAGCT GGCATCTCCA 800

CCCGCAGTCC TCGCCCCTTC AATGAGATCC CCTCTCCTGG TGACAATGGC 850

TGGCTAAACC TGTACCATTT CTGGAGGGAG ACGGGCACAC ACAAAGTCCA 900

CCTTCACCAT GTCCAGAATT TCCAGAAGTA TGGCCCGATT TACAGGTAAG 950

CCTGGCAGAG GGTGGGAGCC GAAGGACAGG GAGGAGGAGG GGACTGGGTA 100

OGCCCTGCTGT A 1011

(2)SEQ ID NO：29的信息：

(i)序列特征：

(A)长度：1011bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S071

(viii)基因组中的位置

(A)染色体/区段：6q26-27

(xi)序列描述：SEQ ID NO：29：

CTGTACTGAA TTACAGCCCC AAATCTGGGT CAACTGGGGA GAGACGACGA 50

GGATTAGGGT TCCAAGGTGA AACTGTGCCA TTGCGCTCCA GCCTGGGCAA 100

CAAGAATGAA ACTCTCTTAA AATAAAATAA AATAAAATAA AATAAAATAG 150

CCTAAGGATG CATTTCTCAG AACTTATCCC TGTTGTTCAA TGATGTGTGT 200

CTATACAGTG GGGCCATAAC TAAGACGTAT GTTGCCCAAG CTGGCAAGAT 250

AGCTCTGACC TTCTCTTGGG CCCCTCATTT CCCCCAAACA CAGGTTGTCT 300

GCAGTCTTGA CCAATGGCTG CCAGGGCATG GACTCCGCTG CAGGGGCCAG 350

TGGGAGGCCC CAGCTCAGGC AAAAGCACAG GCAGATATTT CAGGAGTCTG 400

CTAGGGCTGG CACTGAGGGC AGAGACAGAG GGGTCTCCCT GTCCTTTGGA 450

GAACCTCACG CTGCAGAAAT TCCAGACTGA ACCTTGATAC CGAGTAGGGG 500

AGGAGCTGTC TGCGGGTTTG AGCCTGCAGC AGGAGGAAGG ACGTGAACAT 550

TTTATCAGCT TCTGGTATGG CCTTGAGCTG GTAGTTATAA TCTTGGCCCT 600

GGTGGCCCAG GGCTACAGTC ATCCTAGCAG TCCCCGCTGA AGTGGAGCAG 650

GTACAGTCAC AGCTGTGGGG ACAGCAATGC TGGCCAAGGG TCTTCCCCCA 700

CGCTCAGTCC TGGTCAAAGG CTGCCAGACC TTTCTGAGTG CCCCCAGGGA 750

GGGGCTGGGG CGTCTCAGGG TGCCCACTGG CGAGGGAGCT GGCATCTCCA 800

CCCGCAGTCC TCGCCCCTTC AATGAGATCC CCTCTCCTGG TGACAATGGC 850

TGGCTAAACC TGTACCATTT CTGGAGGGAG ACGGGCACAC ACAAAGTCCA 900

CCTTCACCAT GTCCAGAATT TCCAGAAGTA TGGCCCGATT TACAGGTAAG 950

CCTGGCAGAG GGTGGGAGCC GAAGGACAGG GAGGAGGAGG GGACTGGGTA 1000

GCCCTGCTGT A 1011

(2)SEQ ID NO：30的信息：

(i)序列特征：

(A)长度：1000bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S085

(viii)基因组中的位置

(A)染色体/区段：22q11

(xi)序列描述：SEQ ID NO：30：

AGTCAAATGA CGGTCATAGT TTGGGTGATG GTCACGGCTC AGGTTCTTTT 50

TTACACGTGC TTGCTTTGGT TGTTGTTGTT GTTCTTTGTT TTCTTGAGGC 100

AGTATCTGGC TGTGTCTCCC AGGCTGGCGT GCAATGGCAG GATCATAGCT 150

CACTGCAACC TCAAACTCCT GGCTGAAGCA ATCTTTGTGC CCTAGCCTCC 200

CAAGTTGTTG GGATTACAGT CGTGCCCCAC CATGCCTGGC TAAGTTGTTT 250

TTTGTTTTTT GTTTTTTTTT TTTTTTTCGA GACAGAGTTT TGCTCTTGTT 300

GCCCAGGCCG GAGTGCAGTG GTGTGATCTT GGCTCTCTGC AACCTCCCGG 350

GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC AAAGTGATGG GATTACAGGC 400

CTGAGCCACT GTGCCTGGCC ACATGTGCTT TCCCATTCGG TCCTTGCAGC 450

AGATCTTTGA GAGAGCTCAT TTGACACTCA GGAGATGCTT CTCTAACCTG 500

CTCAGAATCA GGGCCCTGGG TATTCAGGGA GGTAGAGGGA GCAGACTGCA 550

AAGCCAGTCG TGCTCCCATC GCTCCCACTT CTCTCTCCCT CTCCATGTTT 600

TCTGTCTCCC CCACCCAGCC TAGGGCATTC CTCCCCCACA GTCCAGCCTG 650

CATCTGGCAC AGTGTCACTG CTCAGCCCAG GGATACTCAC AGCCTGGGTG 700

CCTGGCTCCT TTTTTCAGCT CATCAAACCA GGTAAAGGGA GGTTCAGATT 750

CTGCCAACCA TTGACTCAAT TCATCCAAAT CTTCAATCAC TGGAATCCTG 800

GGAGTGGCTG GATTTGAACC AGGACCTCTG AGTACTATTG CTAAGTAACT 850

GGGGGTCTCA GTGAAAGAGA GAAAAGAGCT GATAGGCCTC TTCCTGTGTT 900

ATCATGTCAG GCCATCTTTT GAAACTCTTT TCTGCAATGC TACTGAAGTA 950

TTTATGCACG TGACCTGTGC TCTTCTGTCA GTCTAGGGGT GCTGGCTGAG 1000

(2)SEQ ID NO：31的信息：

(i)序列特征：

(A)长度：1000bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：

(B)克隆：S125

(viii)基因组中的位置

(A)染色体/区段：22q11.2-qter

(xi)序列描述：SEQ ID NO：31：

AGTCAAATGA CGGTCATAGT TTGGGTGATG GTCACGGCTC AGGTTCTTTT 50

TTACACGTGC TTGCTTTGGT TGTTGTTGTT GTTCTTTGTT TTCTTGAGGC 100

AGTATCTGGC TGTGTCTCCC AGGCTGGCGT GCAATGGCAG GATCATAGCT 150

CACTGCAACC TCAAACTCCT GGCTGAAGCA ATCTTTGTGC CCTAGCCTCC 200

CAAGTTGTTG GGATTACAGT CGTGCCCCAC CATGCCTGGC TAAGTTGTTT 250

TTTGTTTTTT GTTTTTTTTT TTTTTTTCGA GACAGAGTTT TGCTCTTGTT 300

GCCCAGGCCG GAGTGCAGTG GTGTGATCTT GGCTCTCTGC AACCTCCCGG 350

GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC AAAGTGATGG GATTACAGGC 400

CTGAGCCACT GTGCCTGGCC ACATGTGCTT TCCCATTCGG TCCTTGCAGC 450

AGATCTTTGA GAGAGCTCAT TTGACACTCA GGAGATGCTT CTCTAACCTG 500

CTCAGAATCA GGGCCCTGGG TATTCAGGGA GGTAGAGGGA GCAGACTGCA 550

AAGCCAGTCG TGCTCCCATC GCTCCCACTT CTCTCTCCCT CTCCATGTTT 600

TCTGTCTCCC CCACCCAGCC TAGGGCATTC CTCCCCCACA GTCCAGCCTG 650

CATCTGGCAC AGTGTCACTG CTCAGCCCAG GGATACTCAC AGCCTGGGTG 700

CCTGGCTCCT TTTTTCAGCT CATCAAACCA GGTAAAGGGA GGTTCAGATT 750

CTGCCAACCA TTGACTCAAT TCATCCAAAT CTTCAATCAC TGGAATCCTG 800

GGAGTGGCTG GATTTGAACC AGGACCTCTG AGTACTATTG CTAAGTAACT 850

GGGGGTCTCA GTGAAAGAGA GAAAAGAGCT GATAGGCCTC TTCCTGTGTT 900

ATCATGTCAG GCCATCTTTT GAAACTCTTT TCTGCAATGC TACTGAAGTA 950

TTTATGCACG TGACCTGTGC TCTTCTGTCA GTCTAGGGGT GCTGGCTGAG 1000

(2)SEQ ID NO：32的信息：

(i)序列特征：

(A)长度：1000bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S132

(viii)基因组中的位置

(A)染色体/区段：22

(xi)序列描述：SEQ ID NO：32：

GGTGTGACCT TATCCTCTCT GAACCTCAGT TTCCTCATCC GTAAAATGAA 50

AAGCTGCTAG ATTGTTGTAA AAAAATTAAA TGGAATAGGC TAGGCGCGGT 100

GGCTCACGCC TGTAATCCCA GCACTTTAGA AGGTCGAAGA GGGTGGATCA 150

CTTGAGGTCA GGAGTTTTGA GACCAGCCTG GCCAACACGG TGAAACCCCA 200

TCTCTACTAA AAATAAAAAA TTAGCTNGGG TGCGGTGGCT CACACCTGTA 250

ATCCCAGCAC TTTGGGAGGC TGAGACGGGT GGATCACCTG AAGTCAGGAG 300

TTCAAGGCCA GCCTGGGCAA CATGGTGAAA CCACGTCTCT ACTAAAAATA 350

CAAAAATTAG CCAGGTGTGG TGGCACACGC CTGTAGTCCC AGCTACTTGG 400

GAGGCTGAGG CGGAAGAATC GCTTGAACCC AGTAGGCAGA GGTTGCAGTG 450

AGCCGAGATA AGAGTCACTG CACTCCAGCC TGGGTGACAG AGCAAGACTC 500

CCTCTCAGAA AATAAAATAA AATAAAATAA AATAAAATAA AATAAAATAA 550

AATAAAATTC TAAAAGGGCT GGCATTTGCC TAGCACTTAT ATGCCCAATA 600

AGTAATAGCT ATCAATATCC CCACCCCTAC CACTGTGCTG AAATTTAGTT 650

TCTTTTTGTC ACCCCCCATT AGACTTAAGG CAGAATTCTC ACCGTACTCC 700

TCTGTAAATT TCTGGTTCCT GGCACATAGT TGGGTCTCAG TGAAACATGG 750

TGAGTGAATG AGCAAATGCA AGGAATCTCC AGGCCATCTG GGAGCCCTCC 800

CAGGCGGGTG AGTTCGGGAA ACTCATAGTC TGTCCTCAAT GGCCCACTGA 850

AAGGTAGAGA GTTCTGGGTC CCACCTCCGC ACCCCCATCT CCTGACTCAC 900

TGCTGAAAAA TAAATAAATA AATAAAATAA CACTTATCCG GAGCCTCCCA 950

CATGCCTTGC CAGGACTGCA AGGAGCCCAG CAGAATGATG ACCGGCGTGC 1000

(2)SEQ ID NO：33的信息：

(i)序列特征：

(A)长度：1000bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S136

(viii)基因组中的位置

(A)染色体/区段：22q12-qter

(xi)序列描述：SEQ ID NO：33：

CCACTACATA TCCCATACAG GCTAATCAAC ATGTCAAAGT TCACACAGTT 50

ATTGTGTACC CCTGGGCTCA ATCTCAAGTG TTCTGGTTGG TCGTCCAAGG 100

TTACTTTTTT TTTTTTTTTT TTTTTTTTGA GATGGAGTCT TGCTCTGTTG 150

CCCAAGCTGG AGTGCAATGG CATGATCTTG GCTCACTGCA ACCTCCGCCT 200

CCTGGGTTCA AGGGATTCTC CTGCCTCAGC CTCCTGAGTA GTTGGGATTA 250

CAGGCATGCA CTACCATGCC TGGCTAATTT TTGTATTTTT AGTAGAGGTG 300

GAGTTTCTCC ATGTTGTTCA GGCTGGTCTT GAACTCCCAA CCTCAGGCAA 350

TCCACCTCGG CCTCCCAAAG TACTGGGGTT ACAGGCATGA GCCACTGCGC 400

CTGGCCCAAG GTTACTTTTC ACTACATCTT CCTACCTGTA TCACTTACTG 450

CCGTGTGTAT AACTTCCACA TTTTCTTTCT TTTCTTTTCT TTTCTTTTCT 500

TTTCTTTTCT TTCTTTTCTT TCTTTCTTTC TTTCTCTCTC TTTCTCTCTC 550

TCTTTCTCTC TGTCCCCTCC TTCCTTCTCC TTCCTTCTTC CTTCCTTCCT 600

TCCTTTCCTT CCTTCCTTCC TTCTTTCAAC ACAGAGTCTC ACTCTGTCAC 650

CTAGGCAGGA GTGCAGTGGC CCAGTCTCAG CTCACTGCAA CCTCCGCCTC 700

CTGGGCTCAA GCAATTCTCT CACCTCAGCC TCCCGAGTAG CTGGGATTAC 750

AGGCATGTGC CACCATACCC AGCTAATTTT TGTATTTTTA GTAGAGACGG 800

GATTTCACCA TATTTTCCAA GCTGGTCTCG AACTCCTGAC CTCAAGGGAT 850

CTGCCCGACT CAGCCTCCCA AACTGCTGGG ATCATAGGTG TGAGCCATCA 900

TGCTTGGCCC ACACTTTCTA TGTTAATCTA ATTTAGATGA TTTAATCTAT 950

ATACAGTTTC TATATTAATC TAATTTAGAT GACTTAATCT ATATACAACT 1000

(2)SEQ ID NO：34的信息：

(i)序列特征：

(A)长度：1000bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S159

(viii)基因组中的位置

(A)染色体/区段：21q22-qter

(xi)序列描述：SEQ ID NO：34：

AAACCCCGTC TCTACTAAAA ATACAAAAGT TAGTTGAGCA TGGTGGCACG 50

GGCCTGTAAT CCCACCTATA ATCCCACCTA CTCGGGAGGC TGAGGCAGGA 100

GAATCGCTTG AACCCAGGAT GGGGCGATTG CAGTGAGCCG AGATCGTGCC 150

ACTGCACTCC AGCCTGGGTG ACAGAGCGAG ACTCCATCTC AAAAAAAAAA 200

AAAAAAAACA GAATCATAGG CCAGGCACAG TGGCTAATTG TACCTTGGGA 250

GGCTGAGACG GGAGGATCGA GACCATCCTG GGCACCATAG TGAGACCCCA 300

TCTCTACAAA AAAAAAAAAA AATTTTTTTT AAATAGCCAG GCATGGTGAG 350

GCTGAAGTAG GATCACTTGA GCCTGGAAGG TCGAAGCTGA AGTGAGCCAT 400

GATCACACCA CTACACTCCA GCCTAGGTGA CAGAGCAAGA CACCATCTCA 450

AGAAAGAAAA AAAAGAAAGA AAAGAAAAGA AAAGAAAAGA AAAGAAAAGA 500

AAAGAAAAGA AAAAACGAAG GGGAAAAAAA GAGAATCATA AACATAAATG 550

TAAAATTTCT CAAAAAAATC GTTATGACCA TAGGTTAGGC AAATATTTCT 600

TAGATATCAC AAAATCATGA CCTATTAAAA AATAATAATA AAGTAAGTTT 650

CATCAAAACT TAAAAGTTCT ACTCTTCAAA AGATACCTTA TAAAGAAAGT 700

AAAAAGACAC GCCACAGGCT AAGAGAAAGT ACTTCTAATC ACATATCTAA 750

AAAAGGACTT GTGTCCAGAT TAAAGAATTC TTACACATCA ATAAGACAAC 800

CCAATTAAAA ATCGGCAAAA GATTTGAAGA GATATTTAAC CAAAGAAAAC 850

ATATAAATGT GTCCGGGCGC GATGGTAATC CCAGCACTTT GAGAGGCCGA 900

GGCAGGCGGA TCACTTGAGG TCAGGAGTTT AGGACCAGTC TGGCCAACAT 950

GGTGAAACCC TGTCTCTAAT AAAAATACAA AAATTAGCTG GGTGTGGTGG 1000

(2)SEQ ID NO：35的信息：

(i)序列特征：

(A)长度：1400bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S176

(viii)基因组中的位置

(A)染色体/区段：7q21-7q22

(xi)序列描述：SEQ ID NO：35：

CCATATGTTT GTTTCCTCTA CTACTGCTCC TCCCTGACCC TTAAGAAACA 50

CTGCCATAGA GCCCTACAGC TTGATGGGAG AAGTCCTATC CCTTAGGCAT 100

GGAAAGCTAT TAAGAATGTG AGAACTGTGT ATGAGGAAAC TAATTTAATA 150

ATTCCTTAGA ATGGAACCAG TTGAAAATTT CCAGCTCCAC AAACTGAAGT 200

GAAATCATTT TTTCTCCACT CCTTACTAGT AAATTTACTG TTCTATGTTA 250

AAAGAAAAAA AAAATCAACC AGCATTTAAA TTATGGCAAC CTAAAATGTG 300

TCCAGTATCT TAGAATAATT TCCCCACTGA CCTATTCCTC TGTAATAGTA 350

AAACATATAC ACAAATGTTT ATAGCTACAT TAGTCATAAT AGCCGAAAGG 400

TAAAAACAAC CCAAATGCCC ATCAACTAGA TAAATGTATT TAAAAAATAT 450

GACCCAGGCG AGGTGGCTCA GGCCTGTAAT CCCAGCACTT TAGGAGGCTG 500

AGGTGGGTGG ATGACCCAGG AGTTCAAGGC CAACCTGGTG AACATAGTGA 550

GACCCCATCT CTACAAAACT AAAAATAAAA AATTAGCCAG ATGTTGTGGT 600

GTACACCTGT AGTCCAAGCT ACTCAGGACG GTGAGGAAGG AAGATCACTT 650

GAGCCCGGGA GTTTGAGGCT GCAGTGAGCT ATGATCACAC CATGGCACTC 700

CAGCCTGGGC AAGAAAGTGA GACCAAATTA TTAAAAAAAA AAAAAAAAAA 750

AAAAAAAAAA AAAAAACAGA AGAAGAAGCA CTGATGCATA GGCCATGAAT 800

AAACTTTGTA AATATTATGC TAAGTAAAAG AAGCCAGAGA TGAAAATCAC 850

ATATTGTAAT TGTATGACTC CATGTGTTTT TTTAAAAAGG TCCACACAGA 900

AAAGCTATTA GTAGTTGCTC ACAGCTGGAA GGCAAGGAGG GCACGTAAGT 950

GGGTGATAGC TATAGGACAC AAGGATTATT TCTGAAATGA TGAAAATGTT 1000

CTAAAACCGT GGTAATGGTT TTACAACCCT GTGAATATAC TAAAAACTAC 1050

TGAATTGTAT ACTTAAAATG GGTGAATTAG ACGGCATATG AATTATATAT 1100

CAATAAAGGT ATTACCCAAG AAAAAGAATA CAGTATCTTC ATATTCTATA 1150

TTCTCCTCTC TTAGCTTTAC TCAGATTTCA CCTCTGTCCA GTCACCTTTC 1200

CACATTAACT CCAGGCAACT CCAAAAGTTA TTCTTCCTGC TTCATTCATC 1250

CCCCAAATAA ATTACATTCA CTACTGCGAA GATAACTGGC CAGAAACTCA 1300

ATTCCTGAAG TTCTGGCAAA TGGTTCCTAG ACTCCAAATG GAGCAGAATA 1350

ATTTGCAACT GGGCTTAAAC ACGATTGTCT TTTTTAAGGC ATCCTCAGTT 1400

(2)SEQ ID NO：36的信息：

(i)序列特征：

(A)长度：1250bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S189

(viii)基因组中的位置

(A)染色体/区段：22q11.2-qter

(xi)序列描述：SEQ ID NO：36：

GTTGCTCTGG CGATTCGCAA CTCGAAAATG ACACTTACTA TTCAGCTAGA 50

GATTAGAATC TCAAGCAGTA GGGCATTTTT TAATAAAAAA TTAAATTAAA 100

AATAGATTTG CCATTGTCTG CTTAATAAAA CTAGTAGCTC TGCTGGCTTA 150

GAGGGGAAAT AACATATTTC TTCGGATTTT TATATATTCA TCTGAGCAGT 200

GCTAAAAAAT AAAACAAAGT TACTAATATT CATATCTTGA GCAATTGTAC 250

ATTGCTTCTA ACTATACATT CAATCTCTCT GGCACATCCA CTGTGGCCCT 300

GAGCAGCCAG TACAGGCTCT TCTACCAAAA CGAAGCAAGC CACTCCAAAA 350

CCTGACGCGT GCAGGTGTCA CGAAACACCA GGTGCAGCTT GACAGATGTG 400

AGCCAAATAA GGAAACATTC AGCCCAGCAC TGCCCAACAG TCATGATGTA 450

TATTTTCTAC ATCTGTGCTC TAAAATATGG TGGCCACTAG CTGCAGGTGG 500

CTATTGAGAC TAAGGAACTG TATTTTTAAT TTTATTTCAT TTCAACTCAT 550

TTAAAGTAGC CACATGCCGC TAATGGCTAC TGATCTAGAG GGCAGCTGGG 600

ATGTTACTCT TGAGAATGTC TCCAGCATTT TACCTGTTGC TCTCTCTCAC 650

TCACATTTCC CATTCTAGCA CAAACAAAAC AAAACAAAAC AAAACAAAAC 700

AAAACAAAAC AAAACAAAAA AACCACAACA CCTACAGTTC TCCAAACAGG 750

GCATCTGTTT TGTTCCTCTG GGGGGGTCCT GTCTATGTTG TTCACGTGGC 800

CCTGGATTTC CATACTCCTA GCCTTCCTGG AAGACATCCT TTTCATCCTC 850

ACAACCCAAC CCAGGCTTTA TCTCTTCTGT GAAGCTGTCC TTGATTTTCC 900

GTTCTATCTT CCCTGCTTGT GAATGGGTCA GCTCTCCTTC CCCACCGCCC 950

TGTGCGTGTG AACATCTTTG TTCAGTATAC TGCAGTGGGT CGGGAGTATG 1000

TCCCTTCCAG ACTGGAAGGC AGAGAGGGTG GCTGTAAGGA TTGGCACTTT 1050

GGGCCAGGCA CAGTGCTCAT GCCTGTAATC CCAGCACTTT GGGAGGCTGA 1100

GGCAGGAGAA TCGCCCGACC CCAGGAGACA GAGTTTGCAG TGAGACGAGA 1150

TTGCACCACT GCACTCTAGC CTGAGGGATA GAGCAAGACT CCCTCTCAAA 1200

AAAATAAATA AATAAATAAA TAAATAAATA AAAATAAAAA ATTAAAGAGG 1250

(2)SEQ ID NO：37的信息：

(i)序列特征：

(A)长度：1200bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S199

(viii)基因组中的位置

(A)染色体/区段：6q21

(xi)序列描述：SEQ ID NO：37：

TTTCATGTTC ACAGATTGGA TTAATATTGT TAAACTGTCC ATACTACCCA 50

AAGCAATCCA TAGATTCAAT GCAACCCTGA TATAGTTTGA ATGTATGTAG 100

GCACCAAAAT CTCATGTTGA ACTTTAATCC CCAGTGTTGG AGGTGGAGCC 150

TGGTGTAAGA TGTTTAGATT ATGAAGGTGA ATCCCTCATG AACGGCTTGG 200

GCCATCTGCT TGGTGATAAG TGAGCTCTTG TTCTGAGTTC ACATGAGATA 250

CAGTCATTTA AAAGCCTGTG GTACCCAAAC TCTCTCTTGC TCTTGCTTCT 300

GTTCACGCCA TGTGATATAC CTGCTATCCT TTGCCTTTGC CTTCTGCCAT 350

GATTGGAAGC TTCCTGAGTC CTCCCCAGAA ACAGATGTAA CTATGCTTCC 400

TGTACAGCCT GCAGAACCAA GAACAAACTG AAACTCTTTT GTTATAAATT 450

GCCCAGGATT AGGTGGGTGT TTTGTTTTGT TTTGTTTTGT TTTGTTTTGT 500

TTTTTGAGAT GGAGTCTCGC TCTGTCTCCC AGGCTGGAGT GCAATGATAC 550

AATCTCGGCT CACTGCAACC TCCACCTCCC CGTTCAAGCA ATTCTCCTGC 600

CTCAGCCTCC TGAGTAGCTG GGATTACAGG CGCACGCCAT CATGCCCGGC 650

TAATTTTTGT ATTTTTAGTA GAGACGGGGT TTCACCACAT TGGTCAGGCT 700

GGTCTCGAAC TCCTGACCTC ATGATCCACC CGCCTTGGCC TCCCAAAGTG 750

CTGGGATTAC AGGCGTAAGC CACCATGCCC AGCCAGGTGG TTTTTTATAG 800

TAGTGCAAGA ATGGCCGAAT ACAAACCCCT ATCAAAATAC CAATGACATT 850

TGTCAGGGAC ATTTTTAAAA ATTCTGAAAT TTATATGGAA CCACAAAAGA 900

CCCAGAATAG CCAAAACTAA CCTGAGCAAA AAGAACAAAC CTGGAAGAAT 950

CACATTACCT GACTTCAAAG TGTACTACAG AGCTCTTATA ATCAAAACAT 1000

CATGGTACTA GCATAACAAC AGACACATAG ACCAATGGAA CACAATAGAG 1050

AACCCAGAAA CAAATCCATA CACCTACTGT GAACTCATTT TTGACAAAGG 1100

TGCCAAGAAC ATACATGGGA GAAAGGACAG TATCTCCAAA TAAATGGTGC 1150

TGAGAAAAGT GGATATACAT ATGCATAAGA ATGTAACTAG ACCCCTATCT 1200

(2)SEQ ID NO：38的信息：

(i)序列特征：

(A)长度：1000bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S040

(xi)序列描述：SEQ ID NO：38：

GCTGCAATAA ACACGGGAGT GTAGGTATCT TTAAAAGAAG GTGGTGATTT 1900

CATCTCTTCT GGGTATGTAT CCAAAATAGG GTCACTGTTG GGTTATAAGG 1950

TGGTTAGGTT TTGAATTTCT TTAGGAACCT CCATACTGTT TTCCATAATG 2000

GGTGCACCAA TCATCATTCC CACCAACAAT GTACAAGTGT TTTATTTTCT 2050

TCACACCCTC ATCAATATTT ATCTCTTGTC TTTTTTATAA TAGCCATCCT 2100

AAAGACTGTA AGGCGTTTTA TTTCTAATCT CAGATTTCAC TGTAGAAACA 2150

GTGATGACAC AGTCTCCAGC TTCCCTGTCT TTGTCTCTGG AGAAAAAAGC 2200

CACCCTGACT TGCAGGGCCA GTCAGTGTTA GCAGCTACTA AGCCTGGTAC 2250

CAGAAGAAAC CTGAGCGGGT TCCCAGGCTC CTCATCTATG GTACAGCCCT 2300

GATTTGTGAT AGTGGGTCGG GGACAGGGCT TACTCTCACC ATCGGCAGCC 2350

TGGAGCCTGG AGCCTGGAGA TTTGCACTTC ATCACTGTTA TCAGCATAGT 2400

AGTTGGTGTC CCATACTGAT TCGACATGCA ACAAAAACCT CCAGGAGACC 2450

TAAGGTGTTT ATTTGATTAT ACTACCTGCT TCCTTTTTAG TCATCTGATG 2500

TGGTGCTGCT CAGTTTTAGC ATCTCTGCTT TGATTGGAAA TTCTGAGGTT 2550

CTCAAAAGTA ATTCCTTATA ATATTTATAG TTTCACTCAT GGATTTTTTT 2600

CTCAGACCCA AATGTACAGC CAGGTTCAGG CACAATTTCA TGGTCAAGGC 2650

CATTGGATCA GACTCACATG AGTGGACGCC TCTAAAGGTC CTGGCCAGTG 2700

CGATAAAGTA GCAGCGACAA TGATAAAGAA GAAGAATTAG AAAGGCAGAA 2750

TTAAAGGTAT AACAATTCAC TGATGAAAGG ACTGTGTGGG GGAGAAATTT 2800

CTAATTGTCT ACACAGAAAT TATTAGAATT AATGAGATAC ATAGCAAATT 2850

(2)SEQ ID NO：39的信息：

(i)序列特征：

(A)长度：1050bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S066

(xi)序列描述：SEQ ID NO：39：

GGGGCCTAGC CCAGTTGGAG GGACAAGAGC TGGAAACTGG GTTCCTTAGG 50

GTGGTGCCAG AGTGGGCAGA GACCTCTGGG CAGCCCACGT CCAAGTCCAG 100

AGCAAGGGGA GGCTCATCCT AGAAAAGAGG CCAGAGGAGC CATAACCACC 150

ATTGTTCCTT GGGTTAAGGA GTCCTTTTTT AAAACCATCA AAACTAAGAA 200

TCCAGTGCAT TATGAATCCA AGGGGTGAGG CTCAGTGTGC CAATGCCCCA 250

GAACAGTCTA AGAAAGCTCC TTTTCCCTTT CCAGGCAGCT CGAGCTTTAC 300

CTTCCCAAAT TCTCCATTGA GGGCTCCTAT CAGCTGGAGA AAGTCCTCCC 350

CAGTCTGGGG ATCAGTAACG TCTTCACCTC CCATGCTGAT CTGTCCGGCA 400

TCAGCAACCA CTCAAATATC CAGGTGTCTG AGGTGGGTTC AGAAGCTCCT 450

ATGCATCTGC TTCCCAAGAT CTATTCTGTT CTATTCTTTC TATTCTACTC 500

TACCCCATTT CATTCCATTC CATTCCACTC AACTCCACTC CACTCCACTC 550

CACTCCAGTT CACTCTATTC AATTCCACTC CACTCCAGTT CACTCTATTC 600

AATTCCACTC CACTCCACTC CAGTTCACTC TATTCAGTTC CACTCCACTC 650

CACTCCACTC CACTCCAGTT CACTCTATTC CATTCCACTC CATTCCACTC 700

CTCCACTCCT CTCATCCACT CCACTCTACT CCTCCACTCC ACATCTCCAC 750

TCCACTCCTC CACTCCACTC CTCCACTCCA CTCATCCACT CCACTCCTCC 800

ACTCCACTCC TCCACTCCAC TCCTCCACTC CACTCCACTC ATCCACTCCA 850

CTCTTCCATT CCACTCCATT CCACTCCTCC ACTCCACTCT TCCACTCCAC 900

TCCATTCCAC TCCTCCACTC CACTCCACTC TATTCTATTC TATTCCATTC 950

CATTCTACTC TATTCTATTC CATTCCATTG CAGTCAACTC CACTCCACTC 1000

TCTACTATTC TATTCCACTC CTCTCCCCTC CACTCCATTC CATTGCAGTC 1050

(2)SEQ ID NO：40的信息：

(i)序列特征：

(A)长度：4580bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：

(B)克隆：S077

(xi)序列描述：SEQ ID NO：40：

GGATCCCAAT TCATTCCGGG CTGACACGCT CACTGGCAGG CGTCGGGCAT 50

CACCTAGCGG TCACTGTTAC TCTGAAAACG GAGGCCTCAC AGAGGAAGGG 100

AGCACCAGGC CGCCTGCGCA CAGCCTGGGG CAACTGTGTC TTCTCCACCG 150

CCCCCGCCCC CACCTCCAAG TTCCTCCCTC CCTTGTTGCC TAGGAAATCG 200

CCACTTTGAC GACCGGGTCT GATTGACCTT TGATCAGGCA AAAACGAACA 250

AACAGATAAA TAAATAAAAT AACACAAAAG TAACTAACTA AATAAAATAA 300

GTCAATACAA CCCATTACAA TACAATAAGA TACGATACGA TAGGATGCGA 350

TAGGATACGA TAGGATACAA TACAATAGGA TACGATACAA TACAATACAA 400

TACAATACAA TACAATACAA TACAATACAA TACAATACAA TACAATACGC 450

CGGGCGCGGT GGCTCATGCC TGTCATCCCG TCACTTTGGG ATGCCGAGGT 500

GGACGCATCA CCTGAAGTCG GGAGTTGGAG ACAAGCCCGA CCAACATGGA 550

GAAATCCCGT CTCAATTGAA AATACAAAAC TAGCCGGGCG CGGTGGCACA 600

TGCCTATAAT CCCAGCTGCT AGGAAGGCTG AGGCAGGAGA ATCGCTTGAA 650

CCTGGGAAGC GGAGGTTGCA GTGAGCCGAG ATTGCGCCAT CGCACTCCAG 700

TCTGAGCAAC AAGAGCGAAA CTCCGTCTCA AAAATAAATA CATAAATAAA 750

TACATACATA CATACATACA TACATACATA CATACATACA TAAATTAAAA 800

TAAATAAATA AAATAAAATA AATAAATGGG CCCTGCGCGG TGGCTCAAGC 850

CTGTCATCCC CTCACTTTGG GAGGCCAAGG CCGGTGGATC AAGAGGCGGT 900

CAGACCAACA GGGCCAGTAT GGTGAAACCC CGTCTCTACT CACAATACAC 950

AACATTAGCC GGGCGCTGTG CTGTGCTGTA CTGTCTGTAA TCCCAGCTAC 1000

(2)SEQ ID NO：41的信息：

(i)序列特征：

(A)长度：1000bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(A)文库：

(B)克隆：S097

(xi)序列描述：SEQ ID NO：41：

GGACATGAGG CTTCCCAGCC AACTGCAGGT GCACAACATA AATGTATCTG 50

CAAACAGACT GAGAGTAAAG CTGGGGGCAC AAACCTCAGC ACTGCCAGGA 100

CACACACCCT TCTCGTGGAT TCTGACTTTA TCTGACCCGG CCCACTGTCC 150

AGATCTTGTT GTGGGATTGG GACAAGGGAG GTCATAAAGC CTGTCCCCAG 200

GGCACTCTGT GTGAGCACAC GAGACCTCCC CACCCCCCCA CCGTTAGGTC 250

TCCACACATA GATCTGACCA TTAGGCATTG TGAGGAGGAC TCTAGCGCGG 300

GCTCAGGGAT CACACCAGAG AATCAGGTAC AGAGAGGAAG ACGGGGCTCG 350

AGGAGCTGAT GGATGACACA GAGCAGGGTT CCTGCAGTCC ACAGGTCCAG 400

CTCACCCTGG TGTAGGTGCC CCATCCCCCT GATCCAGGCA TCCCTGACAC 450

AGCTCCCTCC CGGAGCCTCC TCCCAGGTGA CACATCAGGG TCCCTCACTC 500

AAGCTGTCCA GAGAGGGCAG CACCTTGGAC AGCGCCCACC CCACTTCACT 550

CTTCCTCCCT CACAGGGCTC AGGGCTCAGG GCTCAAGTCT CAGAACAAAT 600

GGCAGAGGCC AGTGAGCCCA GAGATGGTGA CAGGGCAATG ATCCAGGGGC 650

AGCTGCCTGA AACGGGAGCA GGTGAAGCCA CAGATGGGAG AAGATGGTTC 700

AGGAAGAAAA ATCCAGGAAT GGGCAGGAGA GGAGAGGAGG ACACAGGCTC 750

TGTGGGGCTG CAGCCCAGGA TGGGACTAAG TGTGAAGACA TCTCAGCAGG 800

TGAGGCCAGG TCCCATGAAC AGAGAAGCAG CTCCCACCTC CCCTGATGCA 850

CGGACACACA GAGTGTGTGG TGCTGTGCCC CCAGAGTCGG GCTCTCCTGT 900

TCTGGTCCCC AGGGAGTGAG AAGTGAGGTT GACTTGTCCC TGCTCCTCTC 950

TGCTACCCCA ACATTCACCT TCTCCTCATG CCCCTCTCTC TCAAATATGA 1000

(2)SEQ ID NO：42的信息：

(i)序列特征：

(A)长度：1144bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S103

(xi)序列描述：SEQ ID NO：42：

CTCTGACTCT CCGCGGTGGT TGTTGGGGCT TCTTGGCTTT GTTTTGTTGT 50

TTGTTTGTAT TTTATTTTTT TCTCTCTGAC ACCTATTTTA GACAAATCTA 100

AGGGAAAAAG CCTTGACAAT AGAACATTGA TTGCTGTGTC CAACTCCAGT 150

ACCTGGAGCT TCTCTTTAAC TCAGGACTCC AGCCCATTGG TAGACGTGTG 200

TTTCTAGAGC CTGCTGGATC TCCCAGGGCT ACTCACTCAA GTTCAAGGAC 250

CAACAAGGGC AGTGGAGGTG CTGCATTGCC TGCGGTCAAG GCCAGCAAGG 300

TGGAGTGGAT GCCTCAGAAC GGACGAGATA ATGTGAACTA GCTGGAATTT 350

TTTATTCTTG TGAATATGTA CATAGGCAGC ACTAGCGACA TTGCAGTCTG 400

CTTCTGCACC TTATCTTAAA GCACTTACAG ATAGGCCTTC TTGTGATCTT 450

GCTCTATCTC ACAGCACACT CAGCACCCCC TTCTCTGCCC ATTCCCCAGC 500

CTCTCTTCCT ATCCCATCCC ATCCCATCCC ATCCCATCCC ATCCCATCCC 550

GCTCTTTTCC TACTTTTCCT TCCCTCAAAG CTTCCATTCC ACATCCGGAG 600

GAGAAGAAGG AAATGAATTT CTCTACAGAT GTCCCATTTT CAGACTGCTT 650

TAAAAAAAAT CCTTCTAATC TGCTATGCTT GAATGCCACG CGGTACAAAG 700

GAAAAAGTAT CATGGAAATA TTATGCAAAT TCCCAGATTT GAAGACAAAA 750

ATACTCTAAT TCTAACCAGA GCAAGCTTTT TTATTTTTTA TACAGGGGAA 800

TATTTTATTC AAGGTAAAAT TCTAAATAAA ATATAATTGT TTTTTATCTT 850

TTCTACAGCA AATTTATAAT TTTAAGATTC CTTTTCTTGT TTATCAGCAG 900

TTGTTATTAC ATCCTTGTGG CACATTTTTT TTTAATTTTG TAAAGGTGAA 1000

AAAAGCTTTT ATGAGCTCAT CTAGCAATCA GATTTTCCTG TGGA 1144

(2)SEQ ID NO：43的信息：

(i)序列特征：

(A)长度：1366bp

(B)类型：核酸

(C)链性：双链

(D)拓扑学：环状

(ii)分子类型：基因组DNA

(iii)假设：否

(iv)立即来源：

(B)克隆：S110

(xi)序列描述：SEQ ID NO：43：

GGAATTCAAT GGAATATAAC GAAATGGATA GGATCAGAAC GGAACAGAGC 50

GGAGTGGAGT TGAGTGGAGT GGATCGGAGT GCAGTGGAAA GGAATGGAAT 100

AGAATGGAAT GGAATGCAGT GGAGTGGAAT GGAATGAAGT GGAATGGAGT 150

TGAGTGGAGT GGATCGGAGT GCAGTGGAAA GGAATGGAAG AGAATGGAAT 200

GGAATGGAAT GCAGTGGACT GGAATGGAAT GGAGTGGAGT GGAGTGCAGT 250

GGGAATCGAG TGGAGTGGAG TGGAATGGAC TGGAATGGAA TGGATTGGAG 300

TGGAGTGCAG TGGAATCGAG TGGAGTGGAG TGGAATGGAG TAGAATGGAA 350

TGGAGTGGAG TGTAGTGGAA TGGAATGGAA TGGTGAATGA ATGTCAGCTA 400

AGATTGTGCA ACTGCATTCC AGTCTGGGTG ACAAAGTGAG ATCCAGTCGA 450

AGTAAAGGAA TGGAATGGAA TAGAGTAAAA TGGAATGGAA TGGTGTGGAG 500

TGGAATGGAA TGGAGAGGAA TGGAGTGGAG TGGAGTGGAG TGGAGTGGAA 550

TGGAGTGGAG TGGAATGGAG AGTGATGGAG AGGAATGGAA TGGAATGGAA 600

TGGAATGGAG TGGAATGGAA TGGAATGGAG TGGAATGGAA TGGAATGTAG 650

AGGAGTGGAG TGGATTGGAG TGGAGTGGAA TGGAGTGGAA TAGAGTGAAA 700

TTTAGTGGAG TGTAATGGAG TGGAGTGGAG TGGCAGTTGA GTGGCATGGA 750

TCAGGTGCAG TGGAATGGAA TGGAATGGAG TGGAGTGGAG AGGAGTGGAG 800

TGGAATCGAA TGGAATGGCA TGGAGTGGAG TGGAATGGAG TGGATTGGAA 850

TTGAATGCAG TGGAATGGAA TGCAATGGAG TGGAGTGGAG TGCAGTGGAG 900

TGGAGTGGAG GGGAATGGAA TGGAGTGGAG TAAAATGGTT TGGAATGGAG 950

TGGGGTGGAA TGGAGTGGGT TGGAATGGAG TGGAGTGGAG TAGAACGGAG 1000

TGATTGGGGT GGAATGGAAT AGAGTGGAAT GGAATGGAGT GGAGTGGAGT 1050

AGAACGGAGT GATTGGAGTG GAATGGAATA CAGTAGAGTG GAATGCAGTG 1100

GAGTGGAATG GAATGGAGTG GAGTGGCATG GAAAGGAATG GAGAGGAATG 1150

GAATGGAATG GAATGGAATG GAATGGAATG GAATGGAATG GAACGGTGAA 1200

ATAAAATGTG AGTTAAGATT GTGCCACTGC ATTGCAGTCT GGGGGACAGA 1250

GTGAGATACA GTCGAAATAA AGGAATGGAA GGGACTGGAG TAGAATGGAA 1300

TGGAATTGAG TGGAGTGGAA TGGAATGAAG TGGAGAGGAA TGGAATGGAG 1350

TGGAATGCAA TGGAGG 1366

(2)SEQ ID NO：44的信息：

(i)序列特征：

(A)长度：19

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：44：

TGGCTCAGAC ACCTCATTG 19

(2)SEQ ID NO：45的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：45：

CACCACTGTA TTCCCAGTTT G 21

(2)SEQ ID NO：46的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：46：

CACTTGCCAT CCCTGCCACA CA 22

(2)SEQ ID NO：47的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：47：

AGCGCACCCC CAATTTCCGG TAT 23

(2)SEQ ID NO：48的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：48：

TGGGGACATG AACACACTTT GC 22

(2)SEQ ID NO：49的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：49：

GAGGCCCAGG ACCAGATGAA AT 22

(2)SEQ ID NO：50的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：50：

CACCTGTCAG GCAAGGCTTA AAC 23

(2)SEQ ID NO：51的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：51：

CAACACTGAG CGCTTTTAGG GACT 24

(2)SEQ ID NO：52的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：52：

TCAGGCAAGG CTTAAACAGG GATA 24

(2)SEQ ID NO：53的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：53：

ACACTGAGCG CTTCTAGGGA CTTC 24

(2)SEQ ID NO：54的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：54：

TGAGCGCTTC TAGGGACTTC TTCA 24

(2)SEQ ID NO：55的信息：

(i)序列特征：

(A)长度：18

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：55：

CCCTGCCCTA CCCACTTG 18

(2)SEQ ID NO：56的信息：

(i)序列特征：

(A)长度：18

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：56：

AGGCCCAGGA CCAGATGA 18

(2)SEQ ID NO：57的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：57：

GCACCTGTCA GGCAAGGCTT AAAC 24

(2)SEQ ID NO：58的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：58：

CCAGCCATGA AGTGGCTGTG AG 22

(2)SEQ ID NO：59的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：59：

CCCGCTTCAA AGTTCCCAGT TC 22

(2)SEQ ID NO：60的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：60：

CCTCCCATTT CAGCCTCCTG A 21

(2)SEQ ID NO：61的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：61：

GTCTGCCACA GTGCTGGAAA CTAA 24

(2)SEQ ID NO：62的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：62：

GCACCCCAGC CTAAGGCAAT A 21

(2)SEQ ID NO：63的信息：

(i)序列特征：

(A)长度：18

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：63：

GCATGGCGGA AGAAACAA 18

(2)SEQ ID NO：64的信息：

(i)序列特征：

(A)长度：19

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：64：

TGGCAACAGA GCGAGACTC 19

(2)SEQ ID NO：65的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：65：

CCTGGGTGAC AGCGAGAATC T 21

(2)SEQ ID NO：66的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：66：

TGTCCCTTGC CTTGTCTCAC TAAA 24

(2)SEQ ID NO：67的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：67：

CAGCCTTGGT GACAGAGCAA A 21

(2)SEQ ID NO：68的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：68：

TGTGTTGAGG GTGGGGTACA T 21

(2)SEQ ID NO：69的信息：

(i)序列特征：

(A)长度：18

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：69：

CCTGGGCAAG AGAGCAAG 18

(2)SEQ ID NO：70的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：70：

CACATCCCAA AACCACCCTA C 21

(2)SEQ ID NO：71的信息：

(i)序列特征：

(A)长度：20

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：71：

GCATTTCCCC TGCTTGTACT 20

(2)SEQ ID NO：72的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：72：

GATCACATTT GCTAACCACT TCTC 24

(2)SEQ ID NO：73的信息：

(i)序列特征：

(A)长度：26

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：73：

GGCAACATAT CAAGACCCCC ATCTCT 26

(2)SEQ ID NO：74的信息：

(i)序列特征：

(A)长度：26

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：74：

GAAGCTGCCC CTCACCACTA CATTTT 26

(2)SEQ ID NO：75的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：75：

GATCACATTT GCTAACCACT TCTC 24

(2)SEQ ID NO：76的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：76：

TATAAATTAC CCAGTCTCAG GAAG 24

(2)SEQ ID NO：77的信息：

(i)序列特征：

(A)长度：20

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：77：

GTGATACAGC AAGCCTCATC 20

(2)SEQ ID NO：78的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：78：

AGAGACTCCT GGAAAGATAA AAGT 24

(2)SEQ ID NO：79的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：79：

GTCTGGAGAA CAGTGGCCCT TGT 23

(2)SEQ ID NO：80的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：80：

CAGGAAGCTG AGGCAGGAGA ATCT 24

(2)SEQ ID NO：81的信息：

(i)序列特征：

(A)长度：18

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：81：

AAGGCTCCAG TGGGGTAT 18

(2)SEQ ID NO：82的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：82：

AAAACAAGGC AGTAGTCAAT AAAG 24

(2)SEQ ID NO：83的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：83：

GGCATGAGAA TCGCTTGAAC CTG 23

(2)SEQ ID NO：84的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：84：

GGCCTCCATG ATGTTTCCAA TGAT 24

(2)SEQ ID NO：85的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：85：

TCAGGAGGCA TGAGAATCGC TTGA 24

(2)SEQ ID NO：86的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：86：

GGCCTCCATG ATGTTTCCCA ATGA 24

(2)SEQ ID NO：87的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：87：

CTCGCCCTCT CCTATAAGCA GTTT 24

(2)SEQ ID NO：88的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：88：

GCAGAGATAA TTTGGAGTGG GATG 24

(2)SEQ ID NO：89的信息：

(i)序列特征：

(A)长度：18

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：89：

CTTGGGTGCC TGTAATCC 18

(2)SEQ ID NO：90的信息：

(i)序列特征：

(A)长度：18

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：90：

GGTAGAGCTC CCCCATCT 18

(2)SEQ ID NO：91的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：91：

GCAGAATATT GGGGCTCATC AC 22

(2)SEQID NO：92的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：92：

AAACAAGGAA AGGAGAGGAG AGGA 24

(2)SEQ ID NO：93的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：93：

AAGGTTGTGG GATGACTACT ACA 23

(2)SEQ ID NO：94的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：94：

TGGTCAACAC AGCAAGACAT T 21

(2)SEQ ID NO：95的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：95：

TCCTGCCACC TGCTTGCTTT CT 22

(2)SEQ ID NO：96的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：96：

ATTGCACTCC AGCCTGGGTGA TAC 23

(2)SEQ ID NO：97的信息：

(i)序列特征：

(A)长度：20

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：97：

CGCTTGAGCC TTGGAGATTG 20

(2)SEQ ID NO：98的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：98：

GAGCAGTCAG AATTCAGGAG TTGT 24

(2)SEQ ID NO：99的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：99：

TGGGCAACAA GAGCAAAACT CCAT 24

(2)SEQ ID NO：100的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：100：

GGGACTTGGG CTGAGGGCTT TAC 23

(2)SEQ ID NO：101的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：101：

ATATCAATAT CAGGCAGCCA CAGG 24

(2)SEQ ID NO：102的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：102：

CCGTTTCAGA GCAGAGGTTT AGC 23

(2)SEQ ID NO：103的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：103：

TCTCATTGGT TTCAAAGAAC TTA 23

(2)SEQ ID NO：104的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：104：

AGACTCCATC TCAAACAAAA GA 23

(2)SEQ ID NO：105的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：105：

TCATGTGCAT GGAGCCTGGT TCAT 24

(2)SEQ ID NO：106的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：106：

CCCAGCCTTG GCAAGAGTGA GGT 23

(2)SEQ ID NO：107的信息：

(i)序列特征：

(A)长度：18

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：107：

GGCGACTGAG CAAGACTC 18

(2)SEQ ID NO：108的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：108：

TTAAGCAAAG TAGCCTCAAA CA 22

(2)SEQ ID NO：109的信息：

(i)序列特征：

(A)长度：19

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：109：

GGGCGACTGA GCAAGACTC 19

(2)SEQ ID NO：110的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：110：

ACTCATTACC TTGCATGCAT GATA 24

(2)SEQ ID NO：111的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：111：

CATTACCTTG CATGCATGAT A 21

(2)SEQ ID NO：112的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：112：

TGGGCAACAG AGTAAGACTC A 21

(2)SEQ ID NO：113的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：113：

GTTCAGTACC GTTCACCTCT TTA 23

(2)SEQ ID NO：114的信息：

(i)序列特征：

(A)长度：30

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：114：

GTAAGACTCA GTCTCCAAAA AAAAAAAAAG 30

(2)SEQ ID NO：115的信息：

(i)序列特征：

(A)长度：38

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：115：

AGGAATGGTT TCTCTGTTAG TAAATGGT 38

(2)SEQ ID NO：116的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：116：

CAGCCTGGGC AACAAGAATG AAAC 24

(2)SEQ ID NO：117的信息：

(i)序列特征：

(A)长度：19

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：117：

TGGCCCCTGC AGCGGAGTC 19

(2)SEQ ID NO：118的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：118：

GAATTCATTT GCGGAAAGAT T 21

(2)SEQ ID NO：119的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：119：

CTAGGGAGGC TGGAGTATTC A 21

(2)SEQ ID NO：120的信息：

(i)序列特征：

(A)长度：20

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：120：

AGAGCAAGAC CCCGTCTCAT 20

(2)SEQ ID NO：121的信息：

(i)序列特征：

(A)长度：20

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：121：

AGTCCATGGG CCTTTTAACA 20

(2)SEQ ID NO：122的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(ii)分子类型：寡核苷酸ssDNA

(iii)假设：否

(iv)立即来源：

(B)扩增的克隆：S125

(xi)序列描述：SEQ ID NO：122：

GAGAATCACT TGAACCCAGG AAG 23

(2)SEQ ID NO：123的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：123：

AGAACCAGCT GTTAGTTTCG TTGA 24

(2)SEQ ID NO：124的信息：

(i)序列特征：

(A)长度：25

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：124：

GGTTGCAGTG AGCCGAGATA AGAGT 25

(2)SEQ ID NO：125的信息：

(i)序列特征：

(A)长度：25

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：125：

TGTGCCAGGA ACCAGAAATT TACAG 25

(2)SEQ ID NO：126的信息：

(i)序列特征：

(A)长度：20

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：126：

GGCCCAAGGT TACTTTTCAC 20

(2)SEQ ID NO：127的信息：

(i)序列特征：

(A)长度：16

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：127：

GGGCCACTGC ACTCCT 16

(2)SEQ ID NO：128的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：128：

CATGGTGAGG CTGAAGTAGG AT 22

(2)SEQ ID NO：129的信息：

(i)序列特征：

(A)长度：25

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：129：

GTGGCGTGTC TTTTTACTTT CTTTA 25

(2)SEQ ID NO：130的信息：

(i)序列特征：

(A)长度：18

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：130：

AGGCAGCCCA GGAACAAT 18

(2)SEQ ID NO：131的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：131：

CCAAGATAGC GGCCAAGATA GT 22

(2)SEQ ID NO：132的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：132：

GAGGGCAGCT GGGATGTTAC TCTT 24

(2)SEQ ID NO：133的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：133：

TGCCCTGTTT GGAGAACTGT AGGT 24

(2)SEQ ID NO：134的信息：

(i)序列特征：

(A)长度：19

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：134：

CTCCCCAGAA ACAGATGTA 19

(2)SEQ ID NO：135的信息：

(i)序列特征：

(A)长度：20

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：135：

GTGAGCCGAG ATTGTATCAT 20

(2)SEQ ID NO：136的信息：

(i)序列特征：

(A)长度：19

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：136：

TCGGGGACAG GGCTTACTC 19

(2)SEQ ID NO：137的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：137：

ATCATTGTCG CTGCTACTTT ATCG 24

(2)SEQ ID NO：138的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：138：

CTACTCTACC CCATTTCATT C 21

(2)SEQ ID NO：139的信息：

(i)序列特征：

(A)长度：19

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：139：

GTAGAGTGGAG TGGATGAGA 19

(2)SEQ ID NO：140的信息：

(i)序列特征：

(A)长度：21

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：140：

ATCAGGCAAA AACGAACAAA C 21

(2)SEQ ID NO：141的信息：

(i)序列特征：

(A)长度：17

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：141：

CGGCATCCCA AAGTGAC 17

(2)SEQ ID NO：142的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：142：

CAGAGAGGGCA GCACCTTGGA CAG 23

(2)SEQ ID NO：143的信息：

(i)序列特征：

(A)长度：23

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：143：

GGCTTCACCT GCTCCCGTTT CAG 23

(2)SEQ ID NO：144的信息：

(i)序列特征：

(A)长度：22

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：144：

TCTGCCCATT CCCCAGCCTC TC 22

(2)SEQ ID NO：145的信息：

(i)序列特征：

(A)长度：24

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：145：

TACCGCGTGG CATTCAAGCA TAGC 24

(2)SEQ ID NO：146的信息：

(i)序列特征：

(A)长度：18

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：146：

TCCAGTCTGG GTGACAAA 18

(2)SEQ ID NO：147的信息：

(i)序列特征：

(A)长度：20

(B)类型：核酸

(C)链性：单链

(D)拓扑学：线性

(xi)序列描述：SEQ ID NO：147：

CAATCCACTC CACTCCTCTA 20

Claims

1.检测具有低平均伪带假象百分率的靶中度串联重复DNA序列的方法，包括以下步骤：

(a)含有至少一个靶中度串联重复序列的DNA样品，其中靶中度串联重复序列是含至少一个重复单位的DNA的区域，该重复单位由至少串联重复2次的5，6或7碱基对的序列组成；

(b)将所述样品与包含下述序列的寡核苷酸引物对接触，所述序列与侧接含有中度串联重复序列的DNA的区域的序列互补，在其中含有中度串联重复序列的DNA区域被扩增的条件下；

(c)检测DNA样品中的靶中度串联重复序列，其中观测到平均伪带假象不超过2.4％；

其中靶中度串联重复序列包含于一种DNA标记内，所述DNA标记包含选自如下一组的一个序列：SEQ ID NO：2，SEQ ID NO：8，SEQ ID NO：19，和SEQ ID NO：34。

2.一种检测DNA样品中至少一个靶中度串联重复序列的方法，其中靶中度串联重复序列是含至少一个重复单位的DNA样品的一区域，该重复单位由至少串联重复2次的5，6或7碱基对的序列组成，此方法包括以下步骤：

(a)提供至少一个寡核苷酸引物，该引物包括与DNA标记的含有模板中度串联重复序列的区域的侧翼序列互补的核苷酸序列，其中DNA标记具有选自如下一组的序列：SEQ ID NO：1，SEQ ID NO：2，SEQ ID NO：3，SEQ ID NO：4，SEQ ID NO：5，SEQ ID NO：6，SEQ ID NO：7，SEQ ID NO：8，SEQ ID NO：9，SEQ ID NO：10，SEQ ID NO：11，SEQ ID NO：12，SEQ ID NO：13，SEQ ID NO：14，SEQ ID NO：15，SEQ ID NO：16，SEQ ID NO：17，SEQ ID NO：18，SEQ ID NO；19，SEQ ID NO：20，SEQ ID NO：21，SEQ ID NO：22，SEQ ID NO：23，SEQ ID NO：24，SEQ ID NO：25，SEQ ID NO：26，SEQ ID NO：27，SEQ ID NO：28，SEQ ID NO：32，SEQ ID NO：33，SEQ ID NO：34，SEQ ID NO：36，SEQ ID NO：37，SEQ ID NO：38，SEQ ID NO：39，SEQ ID NO：40，SEQ ID NO：41，SEQ ID NO：42和SEQ ID NO：43；

(b)提供一含有靶中度串联重复序列的DNA样品；

(c)用所述的至少一个寡核苷酸引物扩增DNA样品的靶中度重复序列；和

(d)检测扩增的靶中度串联重复序列中的多态性。

3.权利要求2的方法，其中步骤(b)中提供的DNA样品是人基因组DNA样品。

4.权利要求2的方法，其中靶中度串联重复序列是完全中度串联重复。

5.权利要求2的方法，其中靶中度串联重复序列是不完全中度串联重复。

6.权利要求2的方法，其中步骤(a)中提供的寡核苷酸引物包括选自如下一组的序列：

SEQ ID NO：44和SEQ ID NO：45，当DNA标记序列是SEQ IDNO：1时；

SEQ ID NO：46，SEQ ID NO：47，SEQ ID NO：48，SEQ ID NO：49，SEQ ID NO：50，SEQ ID NO：51，SEQ ID NO：52，SEQ ID NO：53，SEQ ID NO：54，SEQ ID NO：55，SEQ ID NO：56，SEQ ID NO：57，SEQ ID NO：58，当DNA标记序列是SEQ ID NO：2时；

SEQ ID NO：59，SEQ ID NO：60，当DNA标记序列是SEQ IDNO：3时；

SEQ ID NO：61，SEQ ID NO：62，当DNA标记序列是SEQ IDNO：4时；

SEQ ID NO：63，SEQ ID NO：64，当DNA标记序列是SEQ IDNO：5时；

SEQ ID NO：65，SEQ ID NO：66，当DNA标记序列是SEQ IDNO：6时；

SEQ ID NO：67，SEQ ID NO：68，当DNA标记序列是SEQ IDNO：7时；

SEQ ID NO：69，SEQ ID NO：70，当DNA标记序列是SEQ IDNO：8时；

SEQ ID NO：71，SEQ ID NO：72，当DNA标记序列是SEQ IDNO：9时；

SEQ ID NO：73，SEQ ID NO：74，当DNA标记序列是SEQ IDNO：10时；

SEQ ID NO：75，SEQ ID NO：76，当DNA标记序列是SEQ IDNO：11时；

SEQ ID NO：77，SEQ ID NO：78，当DNA标记序列是SEQ IDNO：12时；

SEQ ID NO：79，SEQ ID NO：80，当DNA标记序列是SEQ IDNO：13时；

SEQ ID NO：81，SEQ ID NO：82，当DNA标记序列是SEQ IDNO：14时；

SEQ ID NO：83，SEQ ID NO：84，当DNA标记序列是SEQ IDNO：15时；

SEQ ID NO：85，SEQ ID NO：86，当DNA标记序列是SEQ IDNO：16时；

SEQ ID NO：87，SEQ ID NO：88，当DNA标记序列是SEQ IDNO：17时；

SEQ ID NO：89，SEQ ID NO：90，当DNA标记序列是SEQ IDNO：18时；

SEQ ID NO：91，SEQ ID NO：92，SEQ ID NO：93，SEQ ID NO：94，当DNA标记序列是SEQ ID NO：19时；

SEQ ID NO：95，SEQ ID NO：96，当DNA标记序列是SEQ IDNO：20时；

SEQ ID NO：97，SEQ ID NO：98，当DNA标记序列是SEQ IDNO：21时；

SEQ ID NO：99，SEQ ID NO：100，当DNA标记序列是SEQ IDNO：22时；

SEQ ID NO：101，SEQ ID NO：102，当DNA标记序列是SEQ IDNO：23时；

SEQ ID NO：103，SEQ ID NO：104，当DNA标记序列是SEQ IDNO：24时；

SEQ ID NO：105，SEQ ID NO：106，当DNA标记序列是SEQ IDNO：25时；

SEQ ID NO：107，SEQ ID NO：108，SEQ ID NO：109，SEQ IDNO：110，SEQ ID NO：111，当DNA标记序列是SEQ ID NO：26时；

SEQ ID NO：112，SEQ ID NO：113，SEQ ID NO：114，SEQ IDNO：115，当DNA标记序列是SEQ ID NO：27时；

SEQ ID NO：116，SEQ ID NO：117，当DNA标记序列是SEQ IDNO：28时；

SEQ ID NO：124，SEQ ID NO：125，当DNA标记序列是SEQ IDNO：32时；

SEQ ID NO：126，SEQ ID NO：127，当DNA标记序列是SEQ IDNO：33时；

SEQ ID NO：128，SEQ ID NO：129，当DNA标记序列是SEQ IDNO：34时；

SEQ ID NO：132，SEQ ID NO：133，当DNA标记序列是SEQ IDNO：36时；

SEQ ID NO：134，SEQ ID NO：135，当DNA标记序列是SEQ IDNO：37时；

SEQ ID NO：136，SEQ ID NO：137，当DNA标记序列是SEQ IDNO：38时；

SEQ ID NO：138，SEQ ID NO：139，当DNA标记序列是SEQ IDNO：39时；

SEQ ID NO：140，SEQ ID NO：141，当DNA标记序列是SEQ IDNO：40时；

SEQ ID NO：142，SEQ ID NO：143，当DNA标记序列是SEQ IDNO：41时；

SEQ ID NO：144，SEQ ID NO：145，当DNA标记序列是SEQ IDNO：42时；

SEQ ID NO：146，SEQ ID NO：147，当DNA标记序列是SEQ IDNO：43时。

7.一种检测DNA样品中至少一个靶中度串联重复序列的试剂盒，其中靶中度串联重复序列是DNA样品的一区域，其含有至少一个由至少串联重复2次的5，6或7碱基对的序列组成的重复单位，该试剂盒包括：

一种容器，其具有至少一个用于扩增所述至少一个靶中度串联重复序列的寡核苷酸引物，其中寡核苷酸引物包括与双链DNA标记的含有模板中度串联重复序列的区域的侧翼序列互补的核苷酸序列，该模板中度串联重复序列包括至少串联重复2次的重复单位，其中DNA标记具有选自如下一组的序列：SEQ ID NO：1，SEQ ID NO：2，SEQ ID NO：3，SEQ ID NO：4，SEQ ID NO：5，SEQ ID NO：6，SEQ ID NO：7，SEQ ID NO：8，SEQ ID NO：9，SEQ ID NO：10，SEQ ID NO：11，SEQ ID NO：12，SEQ ID NO：13，SEQ ID NO：14，SEQ ID NO：15，SEQ ID NO：16，SEQ ID NO：17，SEQ ID NO：18，SEQ ID NO；19，SEQ ID NO：20，SEQ ID NO：21，SEQ ID NO：22，SEQ ID NO：23，SEQ ID NO：24，SEQ ID NO：25，SEQ ID NO：26，SEQ ID NO：27，SEQ ID NO：28，SEQ ID NO：32，SEQ ID NO：33，SEQ ID NO：34，SEQ ID NO：36，SEQ ID NO：37，SEQ ID NO：38，SEQ ID NO：39，SEQ ID NO：40，SEQ ID NO：41，SEQ ID NO：42和SEQ ID NO：43。

8.一种寡核苷酸引物，其包括互补于双链DNA标记的一条链的位于模板中度串联重复序列的侧翼的序列，其中该模板中度串联重复序列是双链DNA标记的含有至少一个由至少串联重复2次的5、6或7碱基对序列组成的重复单位的区域，其中双链DNA标记序列选自如下一组：SEQ ID NO：1，SEQ ID NO：2，SEQ ID NO：3，SEQ ID NO：4，SEQ ID NO：5，SEQ ID NO：6，SEQ ID NO：7，SEQ ID NO：8，SEQ ID NO：9，SEQ ID NO：10，SEQ ID NO：11，SEQ ID NO：12，SEQ ID NO：13，SEQ ID NO：14，SEQ ID NO：15，SEQ ID NO：16，SEQ ID NO：17，SEQ ID NO：18，SEQ ID NO；19，SEQ ID NO：20，SEQ ID NO：21，SEQ ID NO：22，SEQ ID NO：23，SEQ ID NO：24，SEQ ID NO：25，SEQ ID NO：26和SEQ ID NO：27。

9.权利要求8的寡核苷酸引物，其中该寡核苷酸引物包括选自如下一组的序列：

SEQ ID NO：44和SEQ ID NO：45，当DNA标记序列是SEQ IDO：1时；

SEQ ID NO：59，SEQ ID NO：60，当DNA标记序列是SEQ IDNO：3时；

SEQ ID NO：61，SEQ ID NO：62，当DNA标记序列是SEQ IDNO：4时；

SEQ ID NO：63，SEQ ID NO：64，当DNA标记序列是SEQ IDNO：5时；

SEQ ID NO：65，SEQ ID NO：66，当DNA标记序列是SEQ IDNO：6时；

SEQ ID NO：67，SEQ ID NO：68，当DNA标记序列是SEQ IDNO：7时；

SEQ ID NO：69，SEQ ID NO：70，当DNA标记序列是SEQ IDNO：8时；

SEQ ID NO：71，SEQ ID NO：72，当DNA标记序列是SEQ IDNO：9时；

SEQ ID NO：73，SEQ ID NO：74，当DNA标记序列是SEQ IDNO：10时；

SEQ ID NO：75，SEQ ID NO：76，当DNA标记序列是SEQ IDNO：11时；

SEQ ID NO：77，SEQ ID NO：78，当DNA标记序列是SEQ IDNO：12时；

SEQ ID NO：79，SEQ ID NO：80，当DNA标记序列是SEQ IDNO：13时；

SEQ ID NO：81，SEQ ID NO：82，当DNA标记序列是SEQ IDNO：14时；

SEQ ID NO：83，SEQ ID NO：84，当DNA标记序列是SEQ IDNO：15时；

SEQ ID NO：85，SEQ ID NO：86，当DNA标记序列是SEQ IDNO：16时；

SEQ ID NO：87，SEQ ID NO：88，当DNA标记序列是SEQ IDNO：17时；

SEQ ID NO：89，SEQ ID NO：90，当DNA标记序列是SEQ IDNO：18时；

SEQ ID NO：95，SEQ ID NO：96，当DNA标记序列是SEQ IDNO：20时；

SEQ ID NO：97，SEQ ID NO：98，当DNA标记序列是SEQ IDNO：21时；

SEQ ID NO：99，SEQ ID NO：100，当DNA标记序列是SEQ IDNO：22时；

SEQ ID NO：101，SEQ ID NO：102，当DNA标记序列是SEQ IDNO：23时；

SEQ ID NO：103，SEQ ID NO：104，当DNA标记序列是SEQ IDNO：24时；

SEQ ID NO：105，SEQ ID NO：106，当DNA标记序列是SEQ IDNO：25时；

SEQ ID NO：112，SEQ ID NO：113，SEQ ID NO：114，SEQ IDNO：115，当DNA标记序列是SEQ ID NO：27时。