CN100545265C - 鉴别和分析中度串联重复dna标记的物质和方法 - Google Patents

鉴别和分析中度串联重复dna标记的物质和方法 Download PDF

Info

Publication number
CN100545265C
CN100545265C CNB998026964A CN99802696A CN100545265C CN 100545265 C CN100545265 C CN 100545265C CN B998026964 A CNB998026964 A CN B998026964A CN 99802696 A CN99802696 A CN 99802696A CN 100545265 C CN100545265 C CN 100545265C
Authority
CN
China
Prior art keywords
seq
sequence
dna
dna marker
idno
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB998026964A
Other languages
English (en)
Other versions
CN1290298A (zh
Inventor
詹姆斯·W·舒姆
杰弗里·W·巴彻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Promega Corp
Original Assignee
Promega Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Promega Corp filed Critical Promega Corp
Publication of CN1290298A publication Critical patent/CN1290298A/zh
Application granted granted Critical
Publication of CN100545265C publication Critical patent/CN100545265C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates

Abstract

本发明涉及鉴别和分析DNA中中度串联重复序列的物质和方法,其中中度串联重复(ITR)序列是DNA序列的一个区域,其含有至少一个串联出现至少两次的5-7个碱基重复单位。用本发明的物质和方法的特别优选的实施方案鉴别和分析了人类基因组中高多态ITR基因座的DNA标记。

Description

鉴别和分析中度串联重复DNA标记的物质和方法
相关申请的交叉参考
关于联邦资助的研究或开发的声明
本发明是在美国政府的支持下完成的,由国立健康研究院颁发的小企业发明研究资助号1-43-MH5294-01及1-43-MH5294-02资助。美国政府拥有本发明的某些权利。
发明领域
本发明一般涉及在基因组系统中鉴别和分析遗传标记。本发明特别涉及在DNA中,尤其是在基因组DNA中鉴别这样的基因座,其含有由于中度(5~7个碱基)序列重复数目变异而形成的长度多态性。本发明还涉及检测此多态基因座。本发明还涉及鉴别和区分个体的方法,其主要基于在该基因座扩增基因组DNA的产物的大小不同,其中中度串联重复序列数随个体不同而变化。
发明背景
DNA分型通常用于亲子鉴定,并用于确定马、狗及其它比赛动物的谱系。DNA分型还通常用于鉴别血液、唾液、精液及其它在犯罪场所发现的其它组织。目前所用的DNA分型法被设计为检测和分析已知在群体中以至少两种不同形式显现的DNA的一或多个区域的长度和/或序列中的差异。DNA分型还用于临床测定骨髓移植的成功或失败及特殊癌组织的存在与否。此变异长度和/或序列变异称为“多态性”。其中发生这种变异的DNA的任何区域(即“基因座”)称为“多态基因座”。大多数DNA分型技术使用至少一个含至少一个该多态基因座的“标记”。每个个体标记含有最终衍生自群体中单一个体基因组DNA的单一等位基因。本发明的方法和物质均设计为用于检测以长度变异为主要特征的DNA多态性的特定类别。
就长度或序列而言充分多态的遗传标记,很久以来被试图用于鉴定应用中,如亲权认定及鉴别收集的用于法医分析的组织样品。这种标记及分析该标记的方法的揭示与开发,在以往许多年已进行了几个阶段的开发。近年来,作为遗传标记的多态短串联重复(STRs)的揭示和开发已激发连锁图谱开发,致病基因的鉴别与鉴定及DNA分型的简化性和精确性的进程。术语“短串联重复”或“STR”指2~7个核苷酸长,在任何生物体的基因组DNA串联中完全或近乎完全串联重复的所有序列。例如见美国专利号5,364,759第4栏第58行中人基因组DNA的“短串联重复”的定义。
第一个鉴别的DNA变体标记是简单碱基取代,即简单序列多态性,其通常由Southern杂交分析检测。设计用于用放射活性探针分析限制性内切酶消化的DNA的这种标记的鉴别论述,参见Southern,E.M.(1975),J.Mol.Biol.98(3):503-507;Schumm,et al(1988),American Journal of Human Geneties 42:143-159;及Wyman,A.andWhite,R.(1980)Proc.Natl.Acad.Sci.U.S.A.77:6754-6758。
第二代标记是大小变体,即长度多态性,尤其“串联重复可变数”(VNTR)标记(Nakamura Y.et al.(1987).Science 235:1616-1622;及美国专利4,963,663,授予White等(1990);美国专利5,411,859,4,963,663的继续,授予White等(1995))和“小卫星”标记(Jeffreys et al.(1985a),Nature 314:67-73;Jeffreys et al,(1985b)Nature 316:76-79;美国专利5,175,082,发明人Feffreys)。VNTR和小卫星标记均含有以串联方式重复的几个相同序列的区域。核心重复序列长度为10-70个碱基,较短的核心重复序列称为“小卫星”重复,较长重复称为VNTRs。人群中不同个体含有不同数量的这些重复。这些标记比碱基取代多态性具有更高的多态性,有时在单一遗传基因座上呈现接近40或更多个等位基因。但是,仍需要限制酶消化及随后的Southern杂交分析等繁琐方法检测及分析大多数这种标记。
接下来的进展包括聚合酶链反应(PCR)(美国专利4,683,203,Mullis,K.B.)技术与分析VNTR基因座(Kasai,K.et al.(1990)JournalForensic Science 35(5):1196-1200)的联合。可扩增的VNTR基因座被发现,其可不需Southern转移而被检测。扩增产物通过琼脂糖或聚丙烯酰胺凝胶分离,并通过在扩增期间掺入放射活性或通过用银或溴化乙锭后染色而检测。但PCR只能用于可靠扩增相对小的DNA区段,即仅可靠扩增长度在3000个碱基之下的DNA区段。(Ponce,M.&Micol,L.(1992)NAR 20(3):623;Decorte R.,et al.(1990)DNA Cell Biol,9(6):461-469)。结果,仅开发了非常少的可扩增VNTRs,使它们作为不能进行连锁作图的一类。
对具有多态二核苷酸重复(Litt和Luty(1989)Am J.Hum Genet3(4):599~605;Tautz,D.(1989)NAR 17:6463-6471;Weber和May(1989)Am J Hum Genet 44:388-396;德国专利DE 38 34 636C2,发明人Tautz,D;美国专利5,582,979,Weber,L.)及多态短串联重复(STR)(Edwards,A.等,(1991)Am.J.Hum.Genet,49:746-756;Hammond,H.A,等,(1994)Am.J.Hum.Genet.55:175-189;Fregeau C.J.和Fourney,R.M.(1993)BioTechniques 15(1):100-119;Schumm,J.W.等,(1994),第四届人类鉴定国际研讨会,1993,PP.177-178;美国专利5,364,759,Caskey等;德国专利DE 3834636C2,Tautz,D.)的多态标记的新近开发,已克服了许多以前方法的缺陷。含有二核苷酸或STR重复(意为包括2-7bp重复)的二类标记通常被称为“微卫星”标记。微卫星基因座通常被认为是最适用标记,其与可扩增VNTRs相似之处在于其等位基因可以基于长度变化而区分。但是,与VNTRs不同,这些基因座含有2,3,4或少见的5个碱基长的完全或不完全重复序列。它们展示出在单个基因座上从仅几个等位基因至超过40个等位基因。扩增方案可以设计为产生通常60~400碱基对长的小产物,且每个基因座的等位基因通常包含在少于50bp范围内。通过精心设计PCR引物,使得来自一个个体系统的所有潜在扩增产物不重迭同一凝胶中其它系统的等位基因范围,可在相同凝胶上同时电泳分析几个系统。
有三种明显缺点与微卫星基因座的使用相关。首先,伪带(stutter)假象的存在,即通常在扩增后可见除代表每个等位基因的主要片段之外的一或多个次要片段。此缺陷在二核苷酸重复基因座比三或四核苷酸重复标记基因座更明显(Edwards等,1991,Am.J.Hum.Genet.49:746-756;Edwards等,1992.Genomics 12:241-253;Weber & May,1989.Am.J.Hum.Genet.44:388-396)。这些假象的存在,推测得自称为重复滑动的DNA聚合酶相关的现象(Levinson & Gutman,1987,Mol.Biol.Evol.4(3):203-221;Schlotterer & Tautz,1992.NAR20:211-215),使解释基因座的等位基因含量变得复杂。在所有解释复杂化的同时,代表每个等位基因的主要和次要片段的存在尤其限制这些标记在法医分析中的效力,法医分析通常要求测定是否存在一个以上DNA样品来源。在本研究中阐述的许多标记代表一类新的与已知标记相比产生明显少的伪带假象的标记。
当前的STR和微卫星标记系统的第二个缺点涉及在单一凝胶中分离多个基因座的难度。此发生是由于在由本领域技术人员最常用于分离DNA片段的凝胶上部区域中,存在不同大小片段的空间堆积。本研究中所述的基于较长重复单位的标记的开发,扩展了这些凝胶的有用范围,使更多基因座可同时被分析。
第三个缺点是在本发明之前,只有少数人类基因组DNA的DNA基因座已在文献中阐述,每个这种基因座具有基于5~7个碱基重复变化的长度多态性。如见于Edward等,(1991)核酸研究19:4791;Chen等(1993)基因组15(3):621-5;Harada等(1994)Am.J.Hum.Genet.55:175-189;Comings等(1995),Genomics 29(2):390-6;及UtahMarker Development Group(1995),Am.J.Genet.57:619-628。在1995年,Jurka和Pethiyagoda发表的文章阐述了一项研究,其中他们用GenBank数据库测定在灵长类基因组中五聚和六聚串联重复的相对丰度及可变性(Jurka和Pethiyagoda(1995)J.Mol.Evol.40:120-126)。但是,可变性只是间接估计的,且个体基因座多态水平未证实。我们已开发了鉴别和分析含5~7个碱基重复的高多态重复的DNA基因座的物质和方法。
本发明的物质和方法被设计为用于鉴别和分析各类DNA的特定多态基因座,包括各种不同来源的单链和双链DNA。本发明阐述了对现有技术的明显改进,使用于连锁分析,犯罪审判,亲权认定及其它法医和医学用途方面的DNA分布分析的能力及精确性增加。
发明概述
因此,本发明一个目的在于提供鉴别和分析具有中度串联重复序列的DNA基因座的物质和方法,其中“中度串联重复序列”是DNA的一区域,其含有至少一个由串联重复至少2次的5,6或7个碱基的序列组成的重复单位。
本发明另一个目的在于提供鉴别中度串联重复DNA标记的物质和方法,当其用于分析或检测含中度串联重复的DNA样品的一或多个基因座时,很少产生假象。本发明的方法和物质优选用于鉴别和分析基因组DNA的基因座,每个基因座均含有多态中度串联重复序列。本发明的物质包括针对人基因组DNA的这种基因座的寡核苷酸引物和DNA标记。用本发明的方法检测的中度串联重复基因座,比用相似方法检测的许多已知基因座,包括短STR(即2,3或4个碱基DNA序列的串联重复),呈现较少的假象。
本发明一特别目的是提供一种分析个体多态遗传基因座的方法和物质,其主要基于主要由于中度核苷酸串联重复的区域中,核酸重复单位数目的不同而引起的长度变化。本发明另一目的在于提供一种检测和分析基因组DNA的多态性基因座的方法,试剂盒及引物,该基因座含有中度串联重复多态性,包括五核苷酸串联重复多态性。
本发明的一实施方案是分离含有来自基因组DNA的中度串联重复序列的DNA片段的方法,包括(a)提供多个DNA片段,其中至少一个片段含有一中度串联重复序列:(b)提供一支持工具(means),如:结合至少一个寡核苷酸的固定支持工具,该寡核苷酸含有互补于中度串联重复序列的一部分的核苷酸序列;(c)在一定条件下组合该多个DNA片段和支持工具,其中含中度重复序列的DNA片段和至少一个其它DNA片段与支持工具杂交。
本发明另一实施方案是一种检测基因组DNA中具有低伪带假象的多态中度串联重复序列的方法,包括(a)提供一DNA样品,其具有至少一个靶中度串联重复序列,(b)检测DNA样品中靶中度串联重复序列,其中观测到不超过1.1%的平均伪带假象。
检测具有低平均伪带假象百分率的靶中度串联重复DNA序列的方法,包括以下步骤:(a)提供具有至少一个靶中度串联重复序列的DNA样品,其中靶中度串联重复序列是含有至少一个重复单位的DNA区域,该重复单位由至少串联重复2次的5、6或7碱基对的序列组成;(b)将所述样品与一个寡核苷酸引物对接触,该引物对包含与所述含中度串联重复序列的DNA区域的侧翼序列互补的序列,所述样品与所述寡核苷酸引物对在使得所述含中度串联重复序列的DNA区域被扩增的条件下接触;以及(c)检测DNA样品中靶中度串联重复序列,其中观测到平均伪带假象百分率不超过2.4%。
本发明另一实施方案是用至少一个寡核苷酸引物扩增DNA样品中感兴趣的中度串联重复序列(后文中称为“靶”中度串联重复序列),以检测DNA样品中靶中度串联重复序列的方法,其中寡核苷酸引物含有互补于并位于一DNA标记的一个区域侧翼的序列,该DNA标记在其序列中含有一中度串联重复序列(后文称为“模板中度串联重复序列”),其中,此DNA标记具有选自SEQ ID NOS:1-43的序列。
本发明的另一实施方案是一检测DNA样品中至少一个靶中度串联重复序列的试剂盒,该试剂盒包括一容器,其具有至少一个寡核苷酸引物,用于扩增至少一个靶中度串联重复序列,其中此寡核苷酸引物的核苷酸序列互补于并位于双链DNA标记一个区域的一部分的侧翼,该双链DNA标记含有模板中度串联重复序列,其中该DNA标记具有选自SEQ ID NOS:1-43的序列。
本发明的另一实施方案是一寡核苷酸引物,其包含互补于双链DNA标记的一条链的位于模板中度串联重复序列侧翼的区域的序列,其中该DNA标记具有选自SEQ ID NOS:1-6和SEQ ID NOS:28-33的序列。
本发明的各个实施方案在人及其它生物体鉴别,法医分析,亲权认定,监测骨髓移植,连锁作图及检测遗传病及癌症等领域均有特殊用处。准确辨别不同个体少量组织在法医应用中是特别急需的,其中许多定罪(及宣判无罪)要依于DNA分型分析,包括STR基因座的分析。
本发明的其它目的,特点及优势通过以下实施本发明的最佳模式及附图将显而易见。
附图简要描述
图1是通过滤膜杂交富集中度串联重复方法的流程图。
图2是S159五核苷酸重复的电泳图。
图3是vWA四核苷酸重复的电泳图。
图4是G210五核苷酸重复的电泳图。
图5是D5S818四核苷酸重复的电泳图。
图6是S159五核苷酸重复伪带百分率的散射图。
图7是G210五核苷酸重复伪带百分率的散射图。
图8是D5S818四核苷酸重复伪带百分率的散射图。
图9是vWA四核苷酸重复伪带百分率的散射图。
图10是在经凝胶电泳分离后,S159五核苷酸重复的荧光标记的扩增片段的荧光成象扫描结果的激光打印图。
图11是在经凝胶电泳分离后,G210五核苷酸重复的荧光标记的扩增片段的荧光成象扫描结果的激光打印图。
附图不是必需成比例的,且本发明的某些特征可按比例放大或为清楚及简洁目的而以示意形式示出。
发明详述
本领域技术人员知晓在不偏离本文揭示的本发明范围及精神之下,对本发明可作各种替代及修改。
A.定义
本文所用术语“中度串联重复”或“ITR”指含有串联至少两次的5~7个碱基序列的DNA序列的一区域。术语ITR也包括这样的DNA区域,其中多于一个单一5~7碱基序列是串联重复的,或具有间插碱基,条件是至少一个该序列至少串联重复2次。在ITR内至少重复一次的每个序列本文称为“重复单位”。
“ITR多态性”指基因组DNA中的一个ITR,其主要由于每个染色体相同区域中重复单位数的不同而使个体群中的染色体长度变化。
根据本发明鉴别和分析的中度串联重复序列可被分为二类:完全的和不完全的。本文所用术语“完全的”ITR指含有至少串联重复二次的单一5~7个碱基重复单位的双链DNA区域,如(AAAAT)12。术语“不完全的”ITR指含有至少二个串联完全重复单位个至少一个不完全重复单位的DNA区域,其中不完全重复单位由得自完全重复单位的序列中插入,缺失或取代1,2或3个碱基的DNA序列组成,如(AAAAT)12(AAAAT)5AAT(AAATT)4。每个不完全ITR序列含有至少一个完全ITR序列。特别地,每个ITR序列,不管是完全的还是不完全的,均包括至少一个至少串联出现2次的重复单位序列,该重复单位序列可以公式(I)代表:
(AwGxTyCz)n    (I)
其中A,G,T代表可以是任何顺序的核苷酸;w,x,y和z代表序列中每个核苷酸的数目,并在0~7范围内,w+x+y+z的范围在5~7之间;n代表序列串联重复的次数,且至少为2。
“五核苷酸串联重复”指以上所定义的“中度串联重复”多态性的一亚类。除非特殊提及,术语“五核苷酸串联重复”包括完全ITRs,其中重复单位是5个碱基的序列,及不完全ITRs,其中至少一个重复单位是5个碱基重复。
“DNA标记”指含有一ITR序列的DNA片段,如含由扩增基因组DNA一区域产生的ITR序列的DNA片段。每个标记含有一最终衍生自一群体中的一个单独个体基因组DNA的一个单等位基因。
术语“基因座“指DNA的特殊区域。当用于阐述基因组DNA的区域时,“基因座”指染色体上的特定位置。就群体中的任何个体而言,相同基因组基因座在每对同源染色体上相同位点出现。每个这种染色体上相同基因座的DNA序列,或在源自相同的这种染色体的DNA的相同基因座的DNA序列,称为“等位基因”。
术语“多态性”指相同物种个体生物体组成的群体的基因组DNA中发现的在至少2个染色体上见到的基因座的等位基因的变化。术语“多态性”包括得自克隆入其它载体如DNA载体的染色体片段或另一种生物体的染色体DNA的相同基因座的DNA序列的变化。
本文所用术语“ITR侧翼序列”指相邻于含ITR的DNA序列一条链上的ITR的核苷酸序列。包括ITR侧翼序列作为其全部序列一部分的序列本身是侧翼序列。
术语“寡核苷酸引物”是一种分子,其含有3个以上脱氧核糖核苷酸或核糖核苷酸。尽管每个引物序列不需反映模板的精确序列,序列反映与模板的互补性越接近,则与模板结合越好。其精确长度和序列将依于许多因素,涉及寡核苷酸引物的最终功能及使用,包括温度,引物序列,及使用方法。本发明的每个寡核苷酸引物包含一互补于位于ITR序列侧翼的DNA标记序列的核酸序列。本发明的寡核苷酸引物当置于一定条件下时,能作为合成起始点,该条件是诱导互补于一核酸链的引物延伸产物的合成的条件。该条件可包括存在核苷酸和诱导剂如DNA聚合酶,合适温度及pH。在优选实施方案中,该引物是足够长的单链寡脱氧核糖核苷酸,以在存在诱导剂下引导从特定序列合成延伸产物。寡核苷酸引物的敏感性及特异性通过引物长度及所供DNA模板样品中序列的独特性确定。在本发明中,寡核苷酸引物通常大约15个碱基以上,且优选大约20~40个碱基长。
术语“寡核苷酸引物对”指一对引物,每个引物均含互补于位于相同ITR侧翼的双链DNA相反链的脱氧核糖核苷酸或核糖核苷酸的序列。本发明的每对寡核苷酸引物优选地选择用以检测单一ITR。尽管每对引物序列不需反映模板的精确序列,序列反映与模板的互补性越接近,与模板结合越好。
术语“延伸产物”指从寡核苷酸引物3’末端合成的核苷酸序列,其互补于寡核苷酸与之结合的链。
术语“寡核苷酸探针”指单链DNA或RNA分子,其包括互补于靶序列的一部分的序列,靶序列例如DNA样品的中度串联重复序列,其中互补性部分的长度足以使探针与靶序列杂交。
术语“伪带假象”指当检测靶DNA的一或多个分子时,观测到的特定类型的假象,其中靶DNA含有相同重复单位序列的串联重复,包括根据本发明检测和分析的靶中度串联重复序列。在通过长度如用凝胶电泳分离样品中所有DNA之后,检测到含任何该靶DNA样品时,每个靶DNA分子产生一主要信号(如在凝胶上的主要条带);但在接近每个主要信号处可检测到次要信号。次要信号通常产生自DNA片段的检测,其由于靶DNA序列的一或多个重复单位的加入或缺失,而在长度上与靶DNA不同。伪带假象已归因于在DNA的体内和体外复制期间滑动链的错配。如参见Levinson和Gutman(1987),Mol.Biol.Evol.,4(3):203-221;及Schlotterer和Tautz(1992),NucleicAcids Research 20(2):211-215。当含有任何这种重复序列的DNA用如PCR扩增法体外扩增时,此假象尤为明显,这是由于样品存在的或聚合期间产生的任何次要片段随主要片段一起扩增。
术语“伪带假象百分率(%stutter artifact)”指在得自单一来源如单菌落细菌或基因组DNA的单一染色体的DNA样品中,观测的次要(即假象)信号幅度与主要(即靶)信号幅度的对比。伪带假象百分率可在未扩增的DNA上测定,但优选在至少一个靶中度串联重复序列扩增后测定。术语“平均伪带假象百分率(average%stutterartifact)”指在对一个群体至少20个等位基因的代表样品检测测定的伪带假象百分率平均而得。
术语“基因组DNA”指最终衍生自基因组DNA的任何DNA。该术语例如包括异源生物体中的克隆的DNA,整个基因组DNA,及部分基因组DNA(如单一分离的染色体的DNA)。
根据本发明检测或分离的DNA可以是单链或双链的。例如:适用于本发明的单链DNA可得自噬菌体、细菌或基因组DNA的片段。适用于本发明的双链DNA可得自一些含有具有中度串联重复序列的DNA的各种不同来源中的任一种,包括噬菌体文库,粘粒文库,和细菌基因组DNA或质粒DNA,及分离自任何真核生物的DNA,包括人基因组DNA。DNA优选得自人基因组DNA。可以使用任一不同来源的人基因组DNA,包括医学或法医样品如血液,精液,阴道拭物,组织,头发,唾液,尿液及体液混合物。该样品可以是新鲜的,陈旧的,干燥的和/或部分降解的。此样品可收集自犯罪现场。
B.分离含ITR的多态DNA标记的方法:
本发明的一实施方案是用杂交选择分离含ITR的DNA片段的方法。该方法包括以下步骤:(a)提供多个DNA片段,其中至少一个DNA片段含有ITR;(b)提供结合有至少一个寡核苷酸的支持工具,其中此寡核苷酸包括互补于中度串联重复序列一部分的核苷酸序列;(c)将所述的多个DNA片段与支持工具在一定条件下组合,其中包括任何含ITR序列的DNA片段的DNA片段与支持工具杂交。
此方法(a)步提供的多个DNA片段可通过任何含ITR的DNA样品片段化而得,但优选通过基因组DNA片段化而得,如见并入参考的《人类遗传学当前方案》(1994),第2章:从基因组DNA构建小插入片段文库,p.2.2.1。制备(a)步所用的多个DNA片段的最优选方法可根据以下步骤进行:片段化DNA样品,从而产生DNA片段群,其中至少一个DNA片段含有ITR;将含有引导序列的接头与DNA片段群中每个DNA片段的至少一个末端连接;用含互补于引导序列的序列的寡核苷酸引物扩增每个接头连接的片段。不同的接头可连于每个片段的每个末端。但是,优选将单一接头连于每个末端,以使能用具有互补于接头引导序列的序列的单一寡核苷酸引物扩增。接头连接优选在有连接酶的情况下进行,如T4DNA连接酶。
可用任一工具产生本发明方法(a)步中提供的多个DNA片段,包括用超声处理或用至少一种限制酶片段化,当然只有双链DNA可用限制酶片段化。当限制酶用于片段化双链DNA样品时,其优选是具有4碱基对识别序列的限制酶,其留下单链的突出端,并且不切割DNA样品内感兴趣的ITR区。用于片段化双链DNA样品的优选限制酶包括MboI,AciI,BfaI,DpnII,HhaI,Hin PII,HpaII,MseI,Nla III,Sau 3AI,TaqI,Csp6I,和TaiI。
如上述产生的接头连接的DNA片段随后用扩增反应扩增,如PCR(美国专利4,683,202,Mullis,K.B.),基于核酸序列的扩增(NASBA)(Kievits等(1991)J.Virol Merthods 35(3):273-286),连接介导的扩增(Volloch等(1994),Nucleic Acids Res 22(13):2507-2511),链置换扩增(SDA)(Walker等(1992)PNAC 89(1):392-396),序列不依赖的单引物扩增(SISPA)(Reyes(1991)Mol CellProbes 5(6):473-481)或连接酶链反应(美国专利5,686,272,授予Narshall等)。
在方法(b)步中提供的支持工具包括具有至少一个与其相结合的靶寡核苷酸的固定支持物。此固定支持物优选包括一能与寡核苷酸直接或间接偶联的物质,能与寡核苷酸直接偶联的合适物质包括硝基纤维素,尼龙,玻璃,二氧化硅,及乳胶。用于本方法这一优选实施方案的合适的固定支持物例如包括尼龙膜,用二氧化硅颗粒包埋的滤膜,玻璃珠,二氧化硅磁性颗粒,或含二氧化硅的树脂。通过与寡核苷酸结合的第一个偶联剂和与固定支持物表面结合的第二个偶联剂而能与寡核苷酸间接偶联的合适物质包括亲和素和链亲和素,或抗原及其抗体。
与固定支持物相结合的所述至少一个靶寡核苷酸包括互补于DNA片段中度串联重复序列一部分的核苷酸序列。术语“部分”指足够长的DNA片段的ITR区域中的核苷酸序列,当具有互补于该序列的序列的寡核苷酸与其接触时,发生杂交。“部分”优选至少20个碱基,更优选至少40个碱基长。靶寡核苷酸更优选具有(AwGxTyCz)n公式特征的序列,其中A,G,T和C代表可以是任何顺序的核苷酸;w,x,y,z代表序列中每个核苷酸数目,范围在0~7,且w+x+y+z在5~7范围内;n代表序列串联重复的次数,且至少大约4次,更优选至少大约8次,最优选至少大约15次。
在本方法(c)步中,所述的多个DNA片段与支持工具在一定条件下组合,其中含ITR的DNA片段与支持工具杂交。当该多个片段是多个双链DNA片段时,此DNA在与支持工具杂交前变性。在与支持工具杂交前使双链DNA片段变性的合适方法包括将DNA暴露于足够高的使双链DNA变性的温度,或将DNA悬浮于变性溶液中。此DNA优选用含变性剂如碱(例如NaOH或KOH)的变性溶液变性。当用碱变性DNA片段时,所得混合物的pH优选调正至大约中性pH,优选通过在混合物中加入pH4.8的缓冲液而调正。
一旦DNA片段已与支持工具杂交,优选洗涤此支持工具以除去未杂交的DNA片段及任何存在于含有支持工具的溶液中,或在支持工具表面上的未杂交的其它物质。所用任何洗涤液优选配制成除去如此物质而不释放与支持工具杂交的DNA片段。
与支持工具杂交的DNA片段用加热或合适释放溶液,根据支持工具与DNA片段间结合性质,可从支持工具中释放。例如水或低盐水溶液如TE缓冲液(如10mM Tris-HCl,pH7.5,1mM EDTA)可用于释放与由二氧化硅组成的支持工具杂交的DNA片段。一旦从支持工具释放,此DNA片段可被处理以从存在于释放的DNA片段的所得混合物中的其它DNA片段中分离含ITR序列的DNA。附加处理步骤可包括根据上述方法再杂交和筛选,或克隆入DNA载体及筛选克隆的转化体。
图1图示了分离含ITR的DNA片段的方法的优选实施方案,其中制备DNA片段群,与支持工具杂交,扩增,克隆,并筛选含ITR的转化体。图1中图示的每个步骤均用罗马数字标记。步骤I示出用限制酶(2)消化的双链DNA(1)的分子,产生不同大小的DNA片段群(未示出),其中至少一个包括靶ITR。步骤I和II间的箭头图示将接头(3)加入DNA片段群中以产生在两类不同DNA片段的末端具有接头(3)的接头连接的片段(8),所述的两类不同DNA片段为具有靶ITR序列的片段(6)和没有靶序列的片段(4)。将具有互补于每个接头(3)的引导序列的序列的寡核苷酸引物(7)在第III步中加入DNA片段(8)群中,并通过PCR扩增该DNA片段(8)群,从而产生扩增的DNA片段(9)群。在第IV步中,将扩增的DNA片段(9)群置入具有杂交溶液(12)和结合有至少一个寡核苷酸的滤膜(10)的容器(15)中,该寡核苷酸具有互补于靶ITR序列的一部分的序列。杂交溶液促进含ITR序列的DNA片段与滤膜的杂交。在第V步,将滤膜(10)从容器(15)中除去,并从中释放与其杂交的DNA片段。在第VI步,再扩增所得富集的释放的片段群,使用第III步中扩增反应中使用的相同寡核苷酸引物。最后在第VII步将富集的扩增的DNA片段群的每个片段克隆入质粒载体(18)中。第VII步示出用具有靶ITR序列的片段(6)克隆的载体及用没有ITR序列的片段(4)克隆的载体。
C.检测具有低伪带多态ITR的方法
当根据本发明方法的这一具体实施方案检测具有靶ITR序列的DNA样品的该序列时,观测到最小伪带假象。观测的平均伪带假象优选不超过1.1%,更优选不超过0.9%。靶ITR序列可以是完全ITR或不完全ITR序列。检测的DNA样品优选是基因组DNA。
优选在DNA样品中ITR序列扩增后观测平均伪带假象。
D.引物、探针和标记
本发明还包括以下序列表中SEQ ID NOS:1~43所示的DNA标记,引物,其中每个引物的序列互补于位于由43个序列中的一个序列所示的DNA标记的ITR区侧翼的序列,及探针,其具有互补于43个标记之一的ITR区内所含序列的序列。实施例中实验鉴别的特别优选的引物列于下表1。
表1
  标记SEQ IDNO   克隆号   引物SEQ IDNO   上链引物&下链引物
  1   C074   44   TGGCTCAGACACCTCATTG
  45   CACCACTGTATTCCCAGTTTG
  2   C221   46   CACTTGCCATCCCTGCCACACA
  47   AGCGCACCCCCAATTTCCGGTAT
  C221   48   TGGGGACATGAACACACTTTGC
  49   GAGGCCCAGGACCAGATGAAAT
  C221   50   CACCTGTCAGGCAAGGCTTAAAC
  51   CAACACTGAGCGCTTTTAGGGACT
  C221   52   TCAGGCAAGGCTTAAACAGGGATA
  53   ACACTGAGCGCTTCTAGGGACTTC
  标记SEQ IDNO   克隆号   引物SEQ IDNO   上链引物&下链引物
  C221   52   TCAGGCAAGGCTTAAACAGGGATA
  54   TGAGCGCTTCTAGGGACTTCTTCA
  C221   55   CCCTGCCCTACCCACTTG
  56   AGGCCCAGGACCAGATGA
  C221   57   GCACCTGTCAGGCAAGGCTTAAAC
  58   CCAGCCATGAAGTGGCTGTGAG
  3   C240   59   CCCGCTTCAAAGTTCCCAGTTC
  60   CCTCCCATTTCAGCCTCCTGA
  4   C331   61   GTCTGCCACAGTGCTGGAAACTAA
  62   GCACCCCAGCCTAAGGCAATA
  5   C362   63   GCATGGCGGAAGAAACAA
  64   TGGCAACAGAGCGAGACTC
  6   C390   65   CCTGGGTGACAGCGAGAATCT
  66   TGTCCCTTGCCTTGTCTCACTAAA
  7   G022   67   CAGCCTTGGTGACAGAGCAAA
  68   TGTGTTGAGGGTGGGGTACAT
  8   G023   69   CCTGGGCAAGAGAGCAAG
  70   CACATCCCAAAACCACCCTAC
  9   G025   71   GCATTTCCCCTGCTTGTACT
  72   GATCACATTTGCTAACCACTTCTC
  10   G047   73   GGCAACATATCAAGACCCCCATCTCT
  74   GAAGCTGCCCCTCACCACTACATTTT
  11   G065   75   GATCACATTTGCTAACCACTTCTC
  76   TATAAATTACCCAGTCTCAGGAAG
  12   G085   77   GTGATACAGCAAGCCTCATC
  78   AGAGACTCCTGGAAAGATAAAAGT
  13   G132   79   GTCTGGAGAACAGTGGCCCTTGT
  80   CAGGAAGCTGAGGCAGGAGAATCT
  14   G145   81   AAGGCTCCAGTGGGGTAT
  82   AAAACAAGGCAGTAGTCAATAAAG
  15   G152   83   GGCATGAGAATCGCTTGAACCTG
  84   GGCCTCCATGATGTTTCCAATGAT
  16   G153   85   TCAGGAGGCATGAGAATCGCTTGA
  86   GGCCTCCATGATGTTTCCCAATGA
  17   G158   87   CTCGCCCTCTCCTATAAGCAGTTT
  88   GCAGAGATAATTTGGAGTGGGATG
  18   G181   89   CTTGGGTGCCTGTAATCC
  90   GGTAGAGCTCCCCCATCT
  19   G210   91   GCAGAATATTGGGGCTCATCAC
  标记SEQ IDNO   克隆号   引物SEQ IDNO   上链引物&下链引物
  92   AAACAAGGAAAGGAGAGGAGAGGA
  G210   93   AAGGTTGTGGGATGACTACTACA
  94   TGGTCAACACAGCAAGACATT
  20   G212   95   TCCTGCCACCTGCTTGCTTTCT
  96   ATTGCACTCCAGCCTGGGTGATAC
  21   G233   97   CGCTTGAGCCTTGGAGATTG
  98   GAGCAGTCAGAATTCAGGAGTTGT
  22   G234   99   TGGGCAACAAGAGCAAAACTCCAT
  100   GGGACTTGGGCTGAGGGCTTTAC
  23   G235   101   ATATCAATATCAGGCAGCCACAGG
  102   CCGTTTCAGAGCAGAGGTTTAGC
  24   G331   103   TCTCATTGGTTTCAAAGAACTTA
  104   AGACTCCATCTCAAACAAAAGA
  25   G405   105   TCATGTGCATGGAGCCTGGTTCAT
  106   CCCAGCCTTGGCAAGAGTGAGGT
  26   G475   107   GGCGACTGAGCAAGACTC
  108   TTAAGCAAAGTAGCCTCAAACA
  G475   109   GGGCGACTGAGCAAGACTC
  110   ACTCATTACCTTGCATGCATGATA
  G475   107   GGCGACTGAGCAAGACTC
  111   CATTACCTTGCATGCATGATA
  27   G539   112   TGGGCAACAGAGTAAGACTCA
  113   GTTCAGTACCGTTCACCTCTTTA
  G539   114   GTAAGACTCAGTCTCCAAAAAAAAAAAAAG
  115   AGGAATGGTTTCTCTGTTAGTAAATGGT
  28   S023   116   CAGCCTGGGCAACAAGAATGAAAC
  117   TGGCCCCTGCAGCGGAGTC
  29   S071   118   GAATTCATTTGCGGAAAGATT
  119   CTAGGGAGGCTGGAGTATTCA
  30   S085   120   AGAGCAAGACCCCGTCTCAT
  121   AGTCCATGGGCCTTTTAACA
  31   S125   122   GAGAATCACTTGAACCCAGGAAG
  123   AGAACCAGCTGTTAGTTTCGTTGA
  32   S132   124   GGTTGCAGTGAGCCGAGATAAGAGT
  125   TGTGCCAGGAACCAGAAATTTACAG
  33   S136   126   GGCCCAAGGTTACTTTTCAC
  127   GGGCCACTGCACTCCT
  34   S159   128   CATGGTGAGGCTGAAGTAGGAT
  129   GTGGCGTGTCTTTTTACTTTCTTTA
  标记SEQ IDNO   克隆号   引物SEQ IDNO   上链引物&下链引物
  35   S176   130   AGGCAGCCCAGGAACAAT
  131   CCAAGATAGCGGCCAAGATAGT
  36   S189   132   GAGGGCAGCTGGGATGTTACTCTT
  133   TGCCCTGTTTGGAGAACTGTAGGT
  37   S199   134   CTCCCCAGAAACAGATGTA
  135   GTGAGCCGAGATTGTATCAT
  38   S040   136   TCGGGGACAGGGCTTACTC
  137   ATCATTGTCGCTGCTACTTTATCG
  39   S066   138   CTACTCTACCCCATTTCATTC
  139   GTAGAGTGGAGTGGATGAGA
  40   S077   140   ATCAGGCAAAAACGAACAAAC
  141   CGGCATCCCAAAGTGAC
  41   S097   142   CAGAGAGGGCAGCACCTTGGACAG
  143   GGCTTCACCTGCTCCCGTTTCAG
  42   S103   144   TCTGCCCATTCCCCAGCCTCTC
  145   TACCGCGTGGCATTCAAGCATAGC
  43   S110   146   TCCAGTCTGGGTGACAAA
  147   CAATCCACTCCACTCCTCTA
以下实施例是通过举例说明,而非以任何方法限制本发明。在实施例中,所有百分比如果针对固体则是重量百分比,如果针对液体则是体积百分比,除非特殊指出,所有温度是摄氏度。
实施例1:构建全基因组PCR文库
实施例1和以下实施例2中所用的特殊扩增及杂交选择技术,是对Armor,J.等,(1994)Hum Mol Genet 3(4):599-605中所述选择方法的修改形式。
人基因组DNA是用标准苯酚:氯仿提取程序,从15个个体的集合全血中纯化的(人类遗传学当前方案(1994),Gilber,J.编辑,附录)。
将大约100μg基因组DNA用5单位MboI限制酶/μgDNA在37℃切割16小时,随后用苯酚:氯仿提取,乙醇沉淀进行纯化,在100μlTE缓冲液中(10mM Tris-HCl,1mM EDTA,pH8.0)再悬浮,终浓度为大约1μg/μlDNA。
将在250-600bp范围的DNA片段在1%Seakem GTG(FMCBio Products,Rockland,Maine)制备琼脂糖凝胶上(15×29cm),通过在100v凝胶电泳1.25小时而分离,并通过电洗脱回收(参考),通过在A260测定吸收值对DNA定量,并在无菌超纯(nanopure)水中稀释至500ng/μl并储存在-20℃。
通过将等摩尔量的寡A(5’-GCG GTA CCC GGG AAG CTTGG-3’)和5’磷酸化的寡B(5’-GAT CCC AAG CTT CCC GGGTAC CGC-3’)退火至终浓度为1,000pmd/μl制备接头。将1μg大小选择的插入DNA(3.5pmol,平均大小为425bp)与13μg(875pmols)的接头(250∶1接头∶插入物摩尔比率),用1~3单位的T4DNA连接酶在15℃连接16小时。通过凝胶电泳(1%Seakem GTG琼脂糖,1.5小时,100v)从原始片段中分离过量的接头和接头二聚体。通过电洗脱从凝胶中回收接头连接的DNA片段,并在50μl无菌水中再悬浮。
将具有连接接头的DNA(50ng),在含有10μl 10×STR缓冲液(50mM KCl,100mM Tris-HCl,pH9.0,15mM MgCl2,1%Trition X-100和2mM每种dNTP),1μl Taq聚合酶(5U/μl),和1μM寡A引物(10μl 10pmol/μl储存液)的100μl反应体积中用PCR进行扩增。在此反应中用作引物的“寡A”与上述用于装配MboI接头的“寡A”相同。循环条件是95℃1分钟,67℃1分钟,70℃2分钟,循环30次。通过用Centricon-100s微滤(向样品中加入2ml无菌水,并加载Centricon-100s,在2,000RPM旋转2分钟,倒置Centricon滤膜并在2000RPM旋转2分钟以回收DNA,在100μl无菌水中重悬浮)除去dNTPs,引物和引物二聚体。将5μl等份的所得PCR文库在1%琼脂糖凝胶上检验(1小时,100v),以证实大小在250~600bp范围之间。
实施例2:通过杂交选择而富集五核苷酸重复
将根据实施例1产生的含有各种不同重复的全基因组PCR文库中的DNA片段,用不同的与固体支持物相结合的寡核苷酸混合物,通过杂交富集。将含有(AAAAX)n五核苷酸重复的片段通过杂交选择而富集。此方法通过首先构建用于杂交选择的寡核苷酸而完成,该寡核苷酸由大约1000bp长的(AAAAC)n,(AAAAG)n和(AAAAT)n串联组组成。将这些寡核苷酸固定在膜上,并与全基因组PCR文库杂交,以选择那些含有(AAAAX)n重复的片段。
如下构建一组寡核苷酸:(a)合成5’磷酸化的30mer寡核苷酸(AAAAC)6,(AAAAG)6和(AAAAT)6及其互补寡核苷酸(GTTTT)6,(CTTTT)6和(ATTTT)6,并以1000pmol/μl浓度悬浮于超纯水中,(b)将等摩尔浓度(用10μl或10nmol或198μg)的具有互补序列的寡核苷酸组合,加热至65℃,15分钟,并在4℃放置12小时以互相退火,(c)然后将退火的寡核苷酸用每μgDNA 1Weiss单位的T4DNA连接酶在15℃彼此连接过夜,(d)在1%Seakem GTG琼脂糖上,根据大小选择≥200bp的多联体,(e)将连接DNA进行无引物PCR以延长串联组,(f)将表观大小超过1000bp的片段从1%琼脂糖中回收,并通过微滤纯化。测定在A260的吸光度,并在无菌超纯水中制备成1μg/μl储液。
然后将总计1ug的(AAAAC)200,(AAAAG)200或(AAAAT)200寡核苷酸点在4mm×4mm尼龙HybondNfp滤膜上(Amersham LifeSciences,Inc.)用预杂交缓冲液振荡洗涤2次,每次30分钟,以除去弱结合的寡核苷酸,在空气中干燥,在1200μJoules进行UU交联结合DNA,然后在-20℃贮存。
全基因组PCR文库与上述获得的与尼龙滤膜结合的寡核苷酸的支持介质的杂交选择如下进行:(a)将滤膜在1ml预杂交缓冲液(1%BSA(SigmaB-4287),1mM EDTA,pH8.0,7%(w/v)SDS,0.5MNa2HPO4)中,对于含有(AAAAC)n和(AAAAG)n序列的寡核苷酸的滤膜在40℃预杂交,对于含有(AAAAT)n序列的寡核苷酸在37℃预杂交。20分钟后,除去缓冲液,并加入100μl新鲜预杂交缓冲液,(b)用碱(KOH,终浓度150mM)将全基因组PCR文库DNA(20μg)变性,通过加入0.25体积的1M Tris-HCl pH4.8中和,并加入含滤膜的缓冲液中。将所得反应混合物在37℃或40℃预杂交温度培养过夜,(c)用1ml洗涤缓冲液#1(40mM Na2HPO4,pH7.2,0.1%SDS)在40℃将(AAAAC)200和(AAAAG)200滤膜洗涤2次,及在室温振荡洗涤1次,每次15分钟。(AAAAT)200滤膜用1ml洗涤缓冲液在37℃洗涤1次及在室温洗涤1次,(d)与每个滤膜结合的DNA,通过在100μl无菌纯水中加热至95℃5分钟而释出。在95℃将样品除去,以防止再退火。将滤膜剥离(stripped),并通过在0.4M NaOH中在45℃保温30分钟,然后转移至0.1×SSC,0.1%SDS,0.2M Tris pH7.5中并再保温15分钟而再利用。将此膜印迹干燥并在-20℃贮存在密封管中。
实施例3克隆DNA片段的五核苷酸重复富集文库
将根据实施例2的富集五核苷酸重复的DNA片段群,通过PCR再扩增。然后将再扩增的片段克隆入质粒载体pGEM-3Zf(+)中,如下述。此方法通过将选择的插入物与pGEM载体连接,然后将环化的质粒转化入JM109E.Coli宿主中而进行。
插入物与载体的连接如下进行:(a)将5μl杂交选择的DNA在100μl反应体积中,用1XSTR缓冲液(50mM KCl,10mM Tris-HCl,pH9.0,1.5mM MgCl2,0.1%Triton X-100,和0.2mM每种dNTP),1μlTaq聚合酶(5U/μl),及1μM寡A引物(1μl 100pmol/μl储液)进行再扩增。循环条件是95℃1分钟,67℃1分钟,70℃2分钟;循环30次。(b)通过向100μl PCR反应物中加入11μl Promega限制酶10×缓冲液C,和2μl(8U/μl)MboI,在37℃将所得反应混合物保温过夜而用MboI消化再扩增的DNA,并通过在65℃将混合物保温20分钟加热灭活限制酶。(c)通过用BamHI(5U/μg)在37℃消化16小时,随后加入适量小牛小肠碱性磷酸酶10×缓冲液(Promega)和1μlCIAP(U/μl)并在37℃保温1小时,制备用于进行片段插入的pGEM-3Zf(+)载体(约20μg或10.6pmol)。通过加入0.5M EDTA至终浓度为0.02M而终止此反应。乙醇沉淀及以1g/μl重悬浮于TE缓冲液中,然后用苯酚提取。(d)最后,在室温将1μl用MboI切割的DNA(见b步)与1μl或200ng去磷酸化的pGEM 3Zf(+)(见c步)和1μlT4DNA连接酶(1~3U/μl)保温2小时,进行20μl插入物-载体连接。
最后,用Technical Bulletin#095所述Promega转化法,将10μl的插入物-载体连接反应转化入100μl JM109感受态细胞中。
实施例4通过菌落杂交选择含有(AAAAX)n五核苷酸重复的小插入片段基因组文库
用Lightsmith II试剂和方法(见Promega Technical Bulletin#TM227)经菌落杂交筛选选择含有(AAAAX)n五核苷酸重复的克隆,并通过与碱性磷酸酶辍合的探针杂交而显色。
将MagnaGraph尼龙膜(Micron Separations,Inc.Westboro,MA)置于含有细菌菌落的平板上,搁置3分钟,然后在干燥滤纸上印迹而将菌落DNA转移至膜上,接着将此膜转移到一系列含10%SDS托盘中,放置3分钟,然后转移至含5ml NaOH+30ml 5M NaCl+65mldH2O的变性液中放置5分钟,然后转至由30ml 5M NaCl+25ml MTris-HCl,pH7.4+45ml dH2O组成的中和溶液中放置5分钟,最后转至2XSSC中放置5分钟。然后将此膜在室温干燥30分钟,随后用
Figure C9980269600311
(Stratagene,La Jolla,CA)用1200ufoules UV交联。
借助于AP缀合的探针和化学发光物,检测含有具有(AAAAX)n重复的克隆的菌落。将与AP缀合的探针杂交的滤膜在X线下曝光表明菌落含所需克隆。进行第二次杂交以证实初始结果。
检测程序利用Promega的Lightsmith II试剂盒(见PromegaBulletin#TM227关于程序的详述)。简而言之,所用检测程序由以下步骤组成:(a)在Quantum
Figure C9980269600321
封闭溶液(Promega Cat No F1021)中,将滤膜在56℃强力振荡培养45分钟,(b)到出封闭溶液,并每cm2含AP探针的膜加入0.05ml Quantum
Figure C9980269600322
高严格性杂交溶液(Promega Cat No F1231),并在56℃强力振荡培养45分钟,(c)从滤膜中到出杂交/探针溶液,并用150~200ml在56℃预热15分钟的洗涤液#1(2×SSC,0.1%SDS)洗涤2次,(d)组合所有滤膜,并用洗涤液#2(1×SSC)在室温下洗涤1次,10分钟,(e)在200ml 100mM二乙醇胺,1mM MgCl2中平衡印迹5分钟,(f)加入足够的0.25mM CDP-Star底物(Tropix Bedford,MA),以饱和滤膜,然后在室温至少培养5分钟,(g)将底物饱和的滤膜置于杂交折叠器(folder)中的聚苯乙烯塑料片防护器上,并关上折叠器,(h)将含滤膜的杂交折叠器放在底片盒中,并将所含的滤膜曝光于X光胶片,(i)在曝光至少1小时之后,显色底片。
实施例5DNA测序和分析
一种简便的利用细胞裂解物制备测序模板的方法被开发出,以对实施例4中鉴别的可能含有带有至少一个(AAAAX)n序列的插入物的大量克隆进行测序。此方法包括将菌落杂交分析中的阳性克隆转移至含200μl LB/Amp(100μl/ml)的无菌96孔微滴定平板中(Falconcat.#3072),在250rpm,37℃培养过夜。接着,将过夜培养物分开,并用于三种不同方法,包括制备细胞裂解物,从第二次杂交中制备复制滤膜以证实初始发现,或制备甘油储液以长期贮存克隆。
取2μl过夜培养物并将其加入96孔反应平板(Perkin Elmer Cat#N801-0560)中的100μl无菌超纯水中,在9600热循环仪中加热至100℃4分钟,以产生细胞裂解物。然后冷却,冰冻,并在-20℃贮存直至使用。
经灼烧将96-针复制器灭菌,将此复制器蘸含过夜培养物的96孔平板中,印迹在LB/Amp(100ug/ml)平板上的137mm圆形尼龙膜(MagnaGraph,MSI),在37℃将此膜培养过夜,从而制备复制滤膜以进行第二次杂交。
向每个孔中加入46μl 80%甘油,并将平板放在振荡培养器中,以250rpm振荡几分钟至混合,然后在-70℃贮存,以将剩余过夜培养物转变为甘油储液。
选择在二个菌落杂交分析中是阳性的所有克隆,并将细胞裂解物平板的相应克隆用于PCR扩增。用Qiagen QIAquick 96PCR纯化平板(cat#28180)纯化PCR反应产物,并用模板进行测序。将2μl细胞裂解物用于含有2μM M13-47正向引物(Promega cat,#Q560A)和2μM M13反向引物(Promega cat.#Q542A),1×STR缓冲液和2.5单位Ampli Taq(Perkin Elmer)的50μl PCR反应中。在PE480热循环仪上使用以下循环曲线:在96℃/2分钟循环1次;在94℃/1分钟,56℃/分钟,70℃/1.5分钟循环10次;在90℃/1分钟,56℃/1分钟,70℃/1.5分钟循环20次;在4℃保持。根据生产者之建议用Qiagen QIAquick 96PCR纯化平板(cat.#28180)净化PCR反应产物,并回收入70μl Tris-HCl 10mM pH8.5,终浓度大约35ng/μl,并在-20℃贮存。
用ABI染料终止测序化学和ABI377测序仪进行DNA测序。用ABI染料终止试剂盒和生产商方案(Protocol P/N 402078)制备测序模板。将2μl或大约30~90ng纯化的PCR产物(上述)用作DNA模板进行测序反应。此测序反应包括8μl染料终止剂混合物,2μlDNA模板(35ng/μl),4μl 0.8M M13-21正向引物,和6μl无菌超纯水,在GeneAmp PCR System 9600上循环测序循环曲线为:在96℃/10秒,50℃/5秒,60℃/4分钟循环25次,保持在4℃,在每个试管中加入50μl 95%乙醇和2μl 3M乙酸钠,pH4.6,用涡流混合,置于冰上10分钟,然后在最大速度离心30分钟,从而纯化延伸产物。将粒状沉淀用250μl 70%乙醇漂洗,真空离心约3分钟脱水,并在-20℃干燥贮存直至使用。然后将干燥的粒状沉淀再悬浮于6-9μl加样缓冲液中,然后在95℃变性2分钟,并在冰上贮存直至加样于凝胶上。
根据生产者之方案制备5%Long Ranger凝胶(FMC Bio Products,Rockland,ME),并聚合2小时。将此凝胶在1000v预电泳45分钟。将加样缓冲液中的1.5μl模板加样于凝胶上,并在2×或4×条件下分别电泳3.5小时或7小时。
将产生自ABI 377测序仪的DNA序列数据进行编辑,以除去任何pGEM载体序列,然后置入局部数据库,该数据库是用遗传学计算机组Wisconsin软件包版本9.0(Madison WI)产生的,含有所有被评价克隆的序列信息。接着,测试克隆中是否存在五聚体重复,及其长度和序列模式。然后将那些含有5或更多个重复的克隆,用BLAST序列对比程序(Alargland et al;1990)比较,以鉴别复制的克隆和那些已存在于美国马里兰州Besthesda的国立生物信息中心的GenBank数据库中的克隆。一旦鉴别出独特的克隆,借助于寡聚物引物分析软件版本5.0(National Biosciences,Inc,Plymouth,MN)设计PCR引物。
实施例6筛选多态水平的克隆及测定染色体位置
在二个集合的DNA样品上进行初始多态性筛选,一个样品含有15个随机个体的人基因组DNA,另一个含有取自NIGMS人类遗传突变细胞贮存处(CEPH Collection DNA pool,cat.#NA 13431,CoriellCell Repositories,Camden,NJ)的54个CEPH个体的基因组DNA。荧光标记的PCR引物用于基因组DNA靶基因座的PCR扩增,并将PCR产物在聚丙烯酰胺凝胶上分离,并在荧光扫描仪上显色。将那些具有4个等位基因和50%杂合性的基因座随后用16个个体CEPH DNAs(102-1,102-2,884-1,884-2,1331-1,1331-2,1332-1,1332-2,1347-1,1347-2,1362-1,1362-2,1413-1,1413-2,1416-1,1416-2)测试,以测定初步杂合值。然后进一步分析相同基因座的数据,以确定等位基因数,等位基因频率和杂合值。(见表2)
将发现的含有五聚体重复序列并符合≥4个等位基因和≥50%杂合性的选择标准的克隆作图,以测定精确染色体位置(见表2)。有三种不同方法用于作图:(1)用代表单个人染色体的NIGMS组26个体细胞杂种(Coriell Cell Repositories,camden,NJ)进行体细胞杂种作图,以鉴别染色体起源,(2)利用GeneBridge 4RH组的93个RH克隆(Schuler et al;1996)进行辐射杂种作图的技术,和(3)标准减数连锁作图技术和8个取自CEPH同源参考组的家族(K102,K884,K1347,1362,1331,1332,1413,1416)并用CRI-MAP多点连锁程序(Lander&Green,1987)作图。
在对含有100个以上来自4种主要种族包括非洲人,白人,亚洲人和西班牙人的较大群体研究中,评价了16个CEPH个体中杂合值超过70%的克隆的基因型和等位基因出现频率。图10和11图示扩增自群体中24个不同个体基因组DNA样品中(DNA样品S02~S25)2个不同多态ITR基因座的等位基因迁移的广泛变化。用于此分析的引物对序列见上表1。用荧光标记的引物扩增每个五核苷酸重复基因座,随后在聚丙烯酰胺凝胶上分离,并经FMBIO II荧光扫描仪(Hitachi Software Engineering America,Ltd,San Francisco,CA)扫描显色,而产生凝胶图象。含有每个分析的基因座的大多数已知等位基因的等位梯包含在电泳凝胶两头的泳道中,即S01和S26泳道中。用于扩增每个基因座的引物对具有互补于分离自克隆S159或克隆G210的分离的DNA标记的序列至少一部分的序列,如以下实施例所示。此引物对序列选自上表1列出的克隆S159和G210引物对。
进行多态性筛选的PCR条件如下:25μl含大约200ng集合的DNA模板或25ng个体CEPH DNAs,1×STR缓冲液,1单位Taq聚合酶,和1μM相应引物对的反应物。用于扩增表2所列每个克隆的每个引物对序列见表1中所列。注意到每个引物以表1所列的SEQ ID NO表示。Perkin-Elmer Gene Amp PCR System 9600热循环仪(Perkin-Elmer Foster City,CA)的循环条件是:96℃1分钟,然后在94℃,30秒,68秒内缓升至60℃,保持30秒,50秒内缓升至70℃,保持45秒,循环10次,随后90℃30秒,60秒内缓升至60℃,保持30秒,50秒内缓升至70℃,保持45秒,60℃,30分钟循环20次。将2.5μl每个样品与2.5μl 2×溴酚蓝加样液混合以制备PCR样品,在95℃加热2分钟以变性,冰冻,然后将3μl每个样品在4%聚丙烯酰胺凝胶上,在40W电泳50分钟。将此PCR产物通过Hitachi FMBIO荧光扫描仪扫描显色,并用所附软件分析(FMBIO Analysis Version 6.0,Hitachi Software Engineering,San Francisco CA)
表2
  SEQIDNO.   克隆号   GenBank登录号   观察到的最长ITR序列   观察到的等位基因号   %杂合性(白种人)   染色体位置
  1   C074   none   [TTTTG]<sub>9</sub>   6   75   1
  2   C221   none   [GTTTT]<sub>13</sub>   7   78   9p
  3   C240   none   [CAAAA]<sub>7</sub>   4   42   NA
  4   C331   none   [GTTTT]<sub>10</sub>   5   43   NA
  5   C362   none   [6TTTT]<sub>5</sub>   4   62   4
  6   C390   none   [CAAAA]<sub>7</sub>   5   56   NA
  7   G022   none   [AAAAG]<sub>6</sub>   4   63   2p
  8   G023   none   [AAAAG]<sub>10</sub>   12   71   16q
  9   G025   none   [AAAAG]<sub>6</sub>   12   86   1
  10   G047   none   [AAAAG]<sub>9</sub>   5   86   2p
  11   G065   none   [TTTTC]<sub>6</sub>   13   100   1q
  12   G085   none   [AAAAG]<sub>11</sub>   8   93   10q
  13   G132   none   [CTTTT]<sub>15</sub>   12   100   4qter
  14   G145   none   [AAAAG]<sub>13</sub>   8   33   NA
  15   G152   none   [AAAAG]<sub>6</sub>   5   87   8qter
  16   G153   none   [AAAAG]<sub>6</sub>   5   88   8qter
  17   G158   none   [AAAAG]<sub>5</sub>   8   75   5q
  18   G181   none   [GAAAA]<sub>14</sub>   5   72   NA
  19   G210   none   [CTTTT]<sub>6</sub>   9   56   8p
  20   G212   none   [CTTTT]<sub>9</sub>   6   100   NA
  21   G233   none   [AAAAG]<sub>8</sub>   12   50   10q
  SEQIDNO.   克隆号   GenBank登录号   观察到的最长ITR序列   观察到的等位基因号   %杂合性(白种人)   染色体位置
  22   G234   none   [AAAAG]<sub>12</sub>   4   80   16qter
  23   G235   none   [TTTTC]<sub>6</sub>   4   56   2p
  24   G331   none   [CTTTT]<sub>8</sub>   5   73   NA
  25   G405   none   [CTTTT]<sub>6</sub>   10   80   NA
  26   G475   none   [GAAAA]<sub>12</sub>   12   92   15q22.3
  27   G539   none   [GAAAA]<sub>12</sub>   13   100   15q26.2
  28   S023   ×05367   [AAAAT]<sub>6</sub>   4   50   NA
  29   S071   M90078   [AAAAT]<sub>8</sub>   4   56   6q26-27
  30   S085   U07000   [AAAAT]<sub>5</sub>   7   44   22q11
  31   S125   Z73416   [AAAAT]<sub>13</sub>   5   64   22q11.2-qter
  32   S132   Z83847   [AAAAT]<sub>10</sub>   8   69   22
  33   S136   Z82250   [TTTTC]<sub>6</sub>   11   94   22q12-qter
  34   S159   AC000014   [GAAAA]<sub>9</sub>   12   72   21q22-qter
  35   S176   AC000059   [GTTTT]<sub>9</sub>   4   56   7q21-7q22
  36   S189   Z54073   [AAAAC]<sub>8</sub>   5   69   22q11.2-qter
  37   S199   Z84475   [GTTTT]<sub>7</sub>   4   75   6q21
  38   S040   X06583   [AGCCTGG]<sub>4</sub>   2   NA   NA
  39   S066   M68516   [ACTCC]<sub>5</sub>   3   NA   NA
  40   S077   M25718   [[AATAC]<sub>12</sub>   6   NA   NA
  41   S097   Z21818   [CAGGCT]<sub>3</sub>   3   NA   NA
  42   S103   X15949   [ATCCC]<sub>8</sub>   3   NA   NA
  43   S110   X54108   [GGA(A/G)T]<sub>32</sub>   6   NA   NA
实施例7通过GenBank搜索鉴别短串联重复
鉴别串联重复序列的方法是:搜索国立生物信息中心(NCBI)GenBank中中度串联重复的存在与否。使用的一些方法包括用DNASTAR的Lasergene软件包,在CD-ROM上成批搜索GenBank入口,用遗传学计算机组Wisconsin软件包版本9.0(Madison,WI)成批搜索GenBank。
有45=1024个不同的五字母单词可从4个字母(A,C,G,T)组成,以产生所有可能的五聚体重复,且有46=4096和47=16384个不同六字母和七字母单词产生6碱基重复和7碱基重复。但是,由于二个互补链的等价(如AAAAT等价于ATTTT),及环状置换的等价(如AATAA…等价于ATAAA…),独特的重复基序数相对较少。在5碱基重复的情况下,这意味着如果除去单核苷酸重复A5/T5和C5/G5,有102类独特的五聚体重复。
所有具有至少3个连续拷贝的5,6和7碱基重复的独特组合,用于搜索GenBank人基因组数据库。所有含3个或更多重复拷贝或具有偶然碱基取代的拷贝的重复区被鉴别。用现存的序列数据,设计位于重复区侧翼的引物,靶基因座经PCR扩增,并如实施例6所述评价多态含量。
然后将含有用GenBank数据库信息装配的引物鉴别的序列的每个克隆,如实施例7中所述筛选重复序列含量。发现的含有ITR序列,即ITR标记的每个克隆的序列指定为SEQ ID NO:28~43之一。含有位于每个这种标记的ITR区侧翼的序列的引物的序列见表1。每个这种ITR标记序列特征分析结果见表2。
实施例8评价中度串联重复基因座的PCR假象(即伪带百分率)
本研究中所述的许多标记代表一类新的标记,其产生较少的已知为“伪带”的PCR假象,(见以上本发明详述的解释章节)。这些假象的产生发生在PCR扩增期间,可能是称为重复滑动的DNA聚合酶相的现象导致。(Levinson & Gutman,1987,Mol,Biol.Evol.4(3):203-221;Schlotterer & Tautz,1992.NAR20:211-215)。重复滑动的最终结果是含有与真正等位基因不同数目重复单位的PCR产物的产生。如果在PCR期间发生足够量的滑动,扩增的产物将显示为主要和次要条带,主要条带相当于真正等位基因,而次要条带相当于含有较多或较少重复单位的产物。
为确定不同基因座伪带条带的数量,将6个ITR基因座(C221,G023,G025,G210,S159和本发明中未阐述的另外的ITR即S117),和17个四核苷酸串联重复基因座(F13A01,THO1,TPOX,F13B,FESFPS,D7S820,CSF1PO,D13S317,D8S1179,D16S539,LPL,FGA,D5S818,D3S1358,D18S51,vWA和D21S11)的PCR扩增产物在ABI 377测序仪上电泳,并用GenScan软件(PE AppliedBiosystems,Foster City CA)分析。测定在25~40个研究的个体样品中每个基因座观测到的所有主要峰和次要峰的峰高,以相对荧光单位(RFU)表示。计算次要峰相对于主要真正等位基因峰中观测的RFU百分率,在五核苷酸重复中次要峰通常比真正等位基因少5bp,在四核苷酸重复中比真正等位基因少4bp(见表3)。
ITR基因座S159(图2)和G210(图3),和四核苷酸重复基因座vWA(图4)和D5S818(图5)的ABI 377电泳图示出在ITR基因座伪带最小或无伪带,在四核苷酸重复基因座可清楚观察到伪带。特别地,图3中再产生的vWA四核苷酸重复基因座的电泳图中箭头14和15,和图5中再产生的D5S818四核苷酸重复基因座的电泳图中箭头16和17表示伪带假象。将那些明显的假象峰与示于图2的分离自克隆S159的DNA标记(即具有SEQ ID NO:34的序列的标记)和示于图4的分离自克隆G210的DNA标记(即具有SEQ ID NO:19的序列的标记)的五核苷酸重复的电泳图中渐消的小假象相对比。图2-5中再产生的特异电泳图是每个基因座观测的伪带最高发生率。
对所有基因座观测的伪带数量有一些可变性。通常的趋势是等位基因含有最高重复数(以碱基对大小而表明)呈现最高量伪带。示出的25-40个每个测试个体伪带百分值是散射图(图6,7,8和9)。
简而言之,“伪带”条带与真正等位基因条带的百分比,在大多数评价的ITR基因座中,与四核苷酸串联重复基因座相比明显较低。即使所用四核苷酸基因座代表当前已知的最佳此类标记,此结果也是确实的。例如,13个这种四核苷酸标记,包括一些下表3中阐述报道的具有高伪带百分率的四核苷酸标记,已被美国联邦调查局选择用于分析国立组合DNA指数系统(CODIS)的所有DNA样品,(Macivee,I.(1998)Profiles in DNA(3):2)。
表3
  基因座名称或克隆号   串联重复单位长度   平均伪带百分率   最高伪带百分率   最低伪带百分率   标准偏差   所分析的等位基因数量
  Clone S159   5bp(ITR)   0.1   1.4   0.0   0.4   40.0
  Clone G210   5bp(ITR)   0.6   3.2   0.0   0.9   30.0
  Clone C221   5bp(ITR)   0.9   3.3   0.0   0.9   27.0
  F13A01   4bp   1.2   9.7   0.0   2.5   34.0
  TH01   4bp   1.7   5.2   0.0   1.7   34.0
  Clone S117   5bp(ITR)   2.0   6.9   0.0   1.7   37.0
  Clone G023   5bp(ITR)   2.3   6.6   0.0   1.7   39.0
  TPOX   4bp   2.4   5.6   0.0   1.8   34.0
  F13B   4bp   2.6   7.7   0.0   1.7   31.0
  FESFPS   4bp   3.6   10.0   0.0   2.3   34.0
  D7S820   4bp   3.8   8.2   1.6   1.6   28.0
  CSF1P0   4bp   4.1   9.5   0.0   2.5   31.0
  Clone G025   5bp(ITR)   4.5   9.3   0.0   2.1   36.0
  D13S317   4bp   4.7   7.5   1.7   1.5   26.0
  D8S1179   4bp   5.0   8.3   2.4   1.6   27.0
  D16S539   4bp   5.1   8.6   1.7   2.0   28.0
  LPL   4bp   5.4   15.0   1.7   3.1   29.0
  FGA   4bp   5.5   11.6   3.0   1.7   36.0
  D5S818   4bp   6.1   9.0   0.0   1.9   28.0
  D3S1358   4bp   6.1   12.5   0.9   2.1   25.0
  D18S51   4bp   6.5   11.6   2.5   2.4   28.0
  vWA   4bp   6.6   11.4   3.7   1.4   28.0
  D21S11   4bp   7.5   15.7   1.9   3.5   30.0
序列表
(1)一般信息:
(i)申请人:Schumm,James W.
(ii)发明名称:鉴别和分析中度串联重复DNA标记的物质和方法
(iii)序列数:147
(iv)通讯地址:
(A)收信人:普罗梅加公司
(B)街道:2800Woods Hollow Road
(C)城市:Madison
(D)州:Wisconsin
(E)国家:USA
(F)ZIP:53711-5399
(v)计算机可读形式:
(A)媒介类型:3.5英寸软盘,1.44Mb
(B)计算机:IBM PC兼容机
(C)操作系统:Windows NT4.0
(D)软件:WordPerfect 7.0(DOS文本格式)
(viii)律师/代理人信息:
(A)姓名:Grady J.Frenchick
(B)注册号:29,018
(C)卷号:8976.80
(ix)电讯信息:
(A)电话:(608)257-2281
(B)传真:(608)257-7643
(C)E-MAIL:gfrechick@mail.stroudlaw.com
(2)SEQ ID NO:1的信息:
(i)序列特征:
(A)长度:445bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(vii)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C074
(viii)基因组中的位置
(A)染色体/区段:1
(xi)序列描述:SEQ ID NO:1:
GATCCTTTGC ACCCAGANAG AAGTAATTAT TTCAACACAG TTGGAACAGT     50
TAAAAAGATT TAAAATTTTC AAAAAAACAA TCATTTTCTC TTTTCTTTCT    100
GGCTCAGACA CCTCATTGCT TTCTGACTGA CCAAGGCGCA GCGCANTTTG    150
CAGCAGCCAT GGGGGTTCCA GAGATTCCTG GANAAAAACT GGTGACAGAN    200
AGAAACAAAA AGCGCCTGGA AAAAGATAAG CATGAAAAAG GTGCTCAGAA    250
AACAGATTGT CAAAAGTAAG TCTTACCTGT GGCTCGCATT ATTTGGGAGT    300
TATTAAAATA TGAAAGTTTG GCAAATACCC GGTTATCTAC AGTCCTTTNG    350
TTTNGTTTTG GTTTTGTTTA GTTTGGTTTT GTTTNGTTTN GTTTGACACG    400
GAATCTCTCT CTGTTGCCCA AACTGGGAAT ACAGTGGTGC CGATC         445
(2)SEQ ID NO:2的信息:
(i)序列特征:
(A)长度:411bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C221
(viii)基因组中的位置
(A)染色体/区段:9p
(xi)序列描述:SEQ ID NO:2:
GATCACTTGC CATCCCTGCC ACACAGTTTC CTCCTCTGGA AACTGGGGGT     50
GATGACCCCT GCCCTACCCA CTTGTCATGG CATTGGGGAC ATGAACACAC    100
TTTGCACCTG TCAGGCAAGG CTTAAACAGG GATATGCACT GGTAATAGAA    150
AAGAGGGACT AAGTTTTGTT TTGTTTTGTT TTGTTTTGTT TTGTTTTGTT    200
TTGTTTTGTT TTGTTTTGTT TTGTTTTTCT GAAGAAGTCC CTAGAAGCGC    250
TCAGTGTTGG AATGCTCTCT TGTAGCAGTG GCGGCTGCTG CTGGTTCCGG    300
GTCAGATGCC GGAATTGGGG GTGCGCTTGG GTGCAGCTGC ATTTCATCTG    350
GTCCTGGGCC TCGGTCCTGG CTTGGAGAGG TGCAGCTCAC AGCCACTTCA    400
TGGCTGGGAT C                                              411
(2)SEQ ID NO:3的信息:
(i)序列特征:
(A)长度:354bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C240
(xi)序列描述:SEQ ID NO:3:
GATCANCATG GGTTCTATCT GCCTGGCCCT TCACCCCCTA CTCAGGGCAG    50
CTCTGAATTG TCTNCCCCGC TTCAAAGTTC CCAGTTCAAC TTCTCCCTCT    100
GCCCAATCCT GTTTCCTTCT CTTCCACAGG TATTAATTTG GCCAGNTGCA    150
GTGGCTCATG CCTGTAATCT CAACTTTGGG AGGCCAAGGT GGGAGGATTG    200
CTTGANCCCA GAATTTTGAA ACCANCCTCT GAAACATANT GANACCCCTG    250
TCTCAAAACA AAACAAAACA AAACAAAACA AAACAAAAAC TANCCAGGCA    300
TGATGGTGTG TGCCTGTGGT CCCANCTATT CAGGAGGCTG AAATGGGAGG    350
ATC                                                       353
(2)SEQ ID NO:4的信息:
(i)序列特征:
(A)长度:317bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C331
(xi)序列描述:SEQ ID NO:4:
GACCGTGGAA NCCAAAAGTC TGCCTACCGC ATCTTAGTCC AGAGTTCCTG    50
TTTTTACTTC TTTTTGAAGG TCTGTGGATT CTTTATTTTC ATGGCACCTT    100
AGCAATACAT TTTAAAAGCT TGTTTTATTT TATTCAGCAT TTTGGTTATT    150
TCCATTGGAA NANTCATTCA GGGCGTTTAG TCTGCCACAG TGCTGGAAAC    200
TAAAGCTAGG ATTACATGTT TTGTTTTGTT TTGTTTTGTT TTGTTTTGTT    250
TTGTTTTGTT TTGTTTTGTG ACAGGGTCTT GCTCTATTGC CTTAGGCTGG    300
GGTGCAGTGT TGTGATC                                        317
(2)SEQ ID NO:5的信息:
(i)序列特征:
(A)长度:387bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C362
(viii)基因组中的位置
(A)染色体/区段:4
(xi)序列描述:SEQ ID NO:5:
ACAGACTAAC AGAAAGAANA TCAGGTCGAC TTGCCTAAAA AGAGTGAGCT    150
AGGGAAAAGC ATGGCGGAAG AAACAANGTT GCTGAAAGCA ACTCTTATTT    200
TCTTGGCTTA GAAACCANNA AAATGCNTTT GGGTTTTATC TTAGCATAAT    250
GAAAAGACAT GTNANACTTC TGAACACGAA ATCTGACATG TTTTACAGAC    300
NTGTTTTACA TGGTTTTGTT TTGTTTNGTT TTGTTTTGGG ATGGAGTCTC    350
GCTCTGTTGC CANGCTGGGA GTGCAATGGT TGCGATC                  387
(2)SEQ ID NO:6的信息:
(i)序列特征:
(A)长度:471bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C390
(xi)序列描述:SEQ ID NO:6:
GATCACGAGG TCAGGAGATG GAGACCATCC TGGCTAACAT GGTGAAACCC   50
CGTCTCTACT AAAAATACCA AAAAATTAGC CGGGCATGGT GGCGGGCGCC  100
TGTAGTCCCA GCTACTCAGG AGGCTGAGGC AGGAGAATGG CGTGAACCCG  150
GGAGGCGGAG CTTGCAGTGA GCCGAGATTG CGCCACTGCG CTCCAGCCTG  200
GGTGACAGCG AGAATCTGTC TCAAAACATA ACAAAACAAA ACAAAACAAA  250
ACAAAACAAA ACAAAAAAGA TTTGGAATTA TGTAGGCAAA GTGGGAGAAA  300
GAGANGGACG AGGACTNAGG TAAAGATAAT ATGCAAAATA GAAAGAGCAN  350
GAAGGGGCAT GGATATGTGT AAATTCAAAG AAAGGCAAAG TGGCTGGTGC  400
ACAAAGAGTG AGGAGAGCAA NGNGTGAAAA TGACTTTAGT GAGACAAGGC  450
AAGGGACAAA TCATGAAAAA T                                 471
(2)SEQ ID NO:7的信息:
(i)序列特征:
(A)长度:367bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G022
(viii)基因组中的位置
(A)染色体/区段:2p
(xi)序列描述:SEQ ID NO:7:
GATCGCACCA CTGCACTCCA GCCTTGGTGA CAGAGCAAAA CTCNTTCTCC  50
AAAGAAAAGA AAAGAAAAGA AAAGAAAAGA AAAGAAAAAA AAAATCCATG  100
GTGAAAGTGA CGACAGTNGA GTAGGGGATG AGCTCAAAGC AAATGCATGC  150
ATGTNCCCCA CCCTCAACAC AAACACACAC ACACACACAC ACACACACAC  200
ACACACACAC ACACATACTT CTTTAGAGAT ATTTAGGTGT ATATATGCTA  250
ACTTAGGAAA CTTTAGAAAA CCTTGTTATG ATATTATTAG TCAAAAAATA  300
TTTAAGCCAC AGTTTCGCAA TTTTAAGATT GTACTACTGG TATCTGGAGT  350
ATCTGAATCT CTGGATC                                      367
(2)SEQ ID NO:8的信息:
(i)序列特征:
(A)长度:295bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G023
(viii)基因组中的位置
(A)染色体/区段:16q
(xi)序列描述:SEQ ID NO:8:
GATCACAGCA CTGCACTGCA GCCTGGGCAA GAGAGCAAGA CCCTCTCTCT    50
CAGGGAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA   100
AAGAAAAGAA AGGAAGGAAA GAGAGAGGAA GGAAGGAAGG AAGGTAAGAA   150
GGAAGGAAGG AAAGAAAGAA GGAAGGAAGG TAGGGTGGTT TTGGGATGTG   200
AAATGCTGTC AGTCAACAAA GAGCTATGAC CACAGGTGTC ACTGAGTAGC   250
AGGGGCAGCC CATCCTGCTC CCTAGCTGCA CTCACCCTGA AGATC        295
(2)SEQ ID NO:9的信息:
(i)序列特征:
(A)长度:361bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G025
(viii)基因组中的位置
(A)染色体/区段:1
(xi)序列描述:SEQ ID NO:9:
GATCTGATGG TTTCATAAGT GTCTGGCATT TCCCCTGCTT GTACTTCTCT   50
CCCCGGCTAC CGTGTGAAAA AGGTCCTTGC TTCCCCTTTG CCTTCCACCA  100
TGATTGTGAG CTTCCTGAGG CCTCCACAGA CATGTGGAAC TGTGAGTCAA  150
TTAAACTTCT TTCCTTTATA AATTACCCAG TCTCAGGAAG TTCTTTGTAG  200
CAGTGTGAGA ATGGAGGAAG AAAGAAAAAG AAAAAAAAGG AAAAGAAAAG  250
AAAAGAAAAG AAAAGAAAAG AAAGGAAGA AAGAAAGAAAG AAAGAAAGAA  300
AGAAAGAAAG AAAGAAAGAA AGAAAGAAAG AAAGAGAGAG AAGTGGTTAG  350
CAAATGTGAT C                                            361
(2)SEQ ID NO:10的信息:
(i)序列特征:
(A)长度:318bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G047
(viii)基因组中的位置
(A)染色体/区段:2p
(xi)序列描述:SEQ ID NO:10:
GATCACTTGA GGCCAGGGGT TCGAGGCCAG CCTGGGCAAC ATATCAAGAC  50
CCCCATCTCT ACATAAAAAG AAGAAGAAAC GAAAAGAAAA GAAAAGAAAA 100
GAAAAGAAAA GAAAAGAAAA GAAAAGAGTG GAAGAGTGCA GGAGCCGAGA 150
GGGAGAGAAA ATGTAGTGGT GAGGGGCAGC TTCTGGAAAG GCCCATACTA 200
CAGAGGGAGG AATCCTAATT CCTCACTATC TCTCTAACAT CAGGTAAGCA 250
TCTCATGATG CAGTTAGAAA GCACATTTCC TTCTTCAGTT TCCCCTCTGG 300
CTGTGTTGAC CCAGCCCA                                    318
(2)SEQ ID NO:11的信息:
(i)序列特征:
(A)长度:362bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G065
(viii)基因组中的位置
(A)染色体/区段:1q
(xi)序列描述:SEQ ID NO:11:
GATCACATTT GCTAACCACT TCTCTCTCTN TCTTTCTTTC TTTCTTTCTT  50
TCTTTCTTTC TNTCTTNCTT TCTTTCTTTC TATCTTCCTT TCTTTACTTT 100
NCTTTNCTNT TCTNTTCTAT TCCTTTANAT TTCTTTTTCT TTCTTTCTCC 150
ATTCTCACNC TGCTANAAAG AACTTCCTGA GACTGGGTAA TTTATANAGG 200
AAAGAAGTTT AATTGACTCA CAGTTCCACA TGTTTGTGGA GGCCTCAGGA 250
AACTTACAAT CNTGGTGGAA NGCAAAGGGG AANCAAGGAC CTTTTTCACA 300
CGGTAGCCGG GGAAATAATT ACAANCAGGG GAAATGCCAN ACACTTATGA 350
AACCATCAGA TC                                          362
(2)SEQ ID NO:12的信息:
(i)序列特征:
(A)长度:297bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G085
(viii)基因组中的位置
(A)染色体/区段:10q
(xi)序列描述:SEQ ID NO:12:
GATCATGTCA TTGCACTCCA GCCTGGGTGA TACAGCAAGC CTCATCGAAA  50
GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA  100
GAAAGGAAGA AAAGAAAACA AANAGATAGA AAGCAANCNN GTGGCNTGAG  150
AANTNAAATT CTTATAGGTA ACCTGGAGGA CTTTTATCTT TCCAGGAGTC  200
TCTCTCAATG CATTTAGACT CAACAANGAT TTCCTTTTCT CTTGTCTCTA  250
NAAANAAATG CATTTCCTCA AAANANTGGA GGTCANATTA TGTTANAGAT  300
GGGAGAATGC ACTGAGTTNC GCTGAANGA                         329
(2)SEQ ID NO:13的信息:
(i)序列特征:
(A)长度:372bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G132
(viii)基因组中的位置
(A)染色体/区段:4qter
(xi)序列描述:SEQ ID NO:13:
GATCTACCAT TCTTGGGTCT GGAGAACAGT GGCCCTTGTT TCTTTTCTTT    50
TCTTTTCTTT TCTTTTCTTT TCTTTTCTTT TCTTTTCTTT CCTTTTCTTT    100
TCCTTTCCTT TCCTTTTCTT CTCTCTCTCC TTCTCTCTCT CTCTCTCTCT    150
CTCTCTCTCT CTCTCTCTCT CTCCCTCTCC CTTCCCTTCC CTTCCTTTCC    200
CTTCCTTTCC TTTCCTTTCA TTTTTTTTGA CATGGAGTTT CACTCTTGTC    250
ATCCAGGCTG GAGTACAGTA NTGTGATTTT GGCTCACTGC AACCTCTGCC    300
TCNTGGGTTC AAGAGATTCT CCTGCCTCAG CTTCCTGANT AGCTGGGATT    350
ACAGGTGCCT GCCACCATGC TT                                  372
(2)SEQ ID NO:14的信息:
(i)序列特征:
(A)长度:350bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G145.1
(xi)序列描述:SEQ ID NO:14:
GATCTCTTGA AGCCTCGCAN ATAAAGGCTC CAGTGGGGTA TGATTGCACC  50
ANTGCACTCC ANCCTGNGAN ACGGNAGAGA GATTCTGTCT CAAAAGAAAA  100
CAAAATAAAA GAAAANAAAA NAAAANAAAA TAAAANAAAA TANAAGAAAA  150
GAAAAGGATG CTTTAAAAAT NTGGCAAAAT GTNCCCTTTA TTGACTACTG  200
CCTTGTTTTA ATTTNCTCTA TTTNTCTATT TATTTTCTCA GTGTACTTTC  250
CCATNTNNCT TTNTCTCTTC CTTCTTTGAA AGTAATTCTT GGCCAGGCAT  300
GGTGGTTCAT GCCTATAATC TCANCACTTN AGGGGGCTNA AGCNGGAAGA  350
(2)SEQ ID NO:15的信息:
(i)序列特征:
(A)长度:372bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G152
(viii)基因组中的位置
(A)染色体/区段:8qter
(xi)序列描述:SEQ ID NO:15:
GACCACCTGA GGTCATGAGT TCCAGACCAG CCTGGCCAAC ATGGCAAAAC    50
CCCGTCTCTA CTAAAAATAC AAAAAATAGC CGGTGTGATG GTGGGTGCCT    100
GTAATCCCAG CTACTCAGGA GGCATGAGAA TCGCTTGAAC CTGGGAGGCG    150
GAGGTTGTAG TGAGCTGAGA TTGCGCCTCT GCACTCCAGC CTGAGTGATA    200
GAGTGAGACC CCATCTTGAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA    250
AAGAAATTCA TCATTGGGAA ACATCATGGA NGGCCGCNAC CAGTCAGGGG    300
AACATTTCCG AAAGCNANTT NTTCTTCCAA TGCCCTATGT TNCTTCCCCN    350
AAGCTTGCCA TTTTNAACCC TT                                  372
(2)SEQ ID NO:16的信息:
(i)序列特征:
(A)长度:361bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G153
(viii)基因组中的位置
(A)染色体/区段:8qter
(xi)序列描述:SEQ ID NO:16:
GACCACCTGA GGTCATGAGT TCCAGACCAG CCTGGCCAAC ATGGCAAAAC  50
CCCGTCTCTA CTAAAAATAC AAAAAATAGC CGGTGTGATG GTGGGTGCCT  100
GTAATCCCAG CTACTCAGGA GGCATGAGAA TCGCTTGAAC CTGGGAGGCG  150
GAGGTTGTAN TGAGCTGAGA TTGCGCCTCT GCACTCCAGC CTGAGTGATA  200
GAGTGAGACC CCATCTTGAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA  250
AGAANTTCNT CATTGGGAAA CATCATGGAG GCCGCAGCAN TCAGGGGAAC  300
ATTTCCGAAA GCNAGTTGTC NTTCCAATGC CCTATGTTNC TTCCCCNAAG  350
CNTGCCATTT T                                            361
(2)SEQ ID NO:17的信息:
(i)序列特征:
(A)长度:447bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G158
(viii)基因组中的位置
(A)染色体/区段:5q
(xi)序列描述:SEQ ID NO:17:
GATCGCCTGG GTACAGCAGG AAAGAAGGGG GCGGCCACGG CAAGGCAGCC  50
TCCGACTGCC CGGCGGGGGA NGCCGGCGGC GGCCCCTTCT CGCCCTCTCC 100
TATAAGCAGT TTTATAAGCT TCCTGAGACT ANAAAAGGAA AAGAAAAGAA 150
AAGAAAAGAA AAGAAAAATC AGTCTCTATT TTATATGCGT ATAATTTTTT 200
TTATATGCGT ATAATTTTTT TTTTAACCAA AAACTCNTTA TGGACAAAAC 250
AAACTACCAT CCCACTCCAA ATTATCTCTG CATCATGCTC ACAACCTCAG 300
CNCAAATTTC AATANAANTT TTATTGGGAT ATGTTTGGCT TCCATCAATT 350
GAAATTTCCC CTAATGAATA AAATTTCCTC CCGTTTTTTT GGTAAACATT 400
TCCCCTTGNA AGGCCCACCT AAAAATCNCC NGGNCTTTTT CCAAAGG    447
(2)SEQ ID NO:18的信息:
(i)序列特征:
(A)长度:415bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G181
(viii)基因组中的位置
(A)染色体/区段:
(B)图谱位置:
(C)单位:
(xi)序列描述:SEQ ID NO:18:
GATCCCAAGC TTCCCGGGTA CCGCGATCAC CTGAGGTCAG GAGTTCAAGA  50
CCAGCCTTCT CAACATGGCA AAACCTCATT TCTACTAAAA ATACAAAAAA  100
TTAGCTGGGC ATGGTCTTGG GTGCCTGTAA TCCCAGCTAC TCAGGAGGCT  150
GAGGCAGGAG AATGTCTTGA ACCCAGGAGG CGGTGGCTGC AGTGAGGCAA  200
NATTTTGCCA GTGTNCTCCA GCCTGGGTGA CAANANTGAA ACTCCGTCTG  250
AAAGAAAGAA AGAAAAAGAA AGAAAGGAAG GAAGGAAGGA AGGAAAGGGA  300
AGGAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA  350
AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA TNAGATGGGG GAGCTCTACC  400
GAACTGATTC CGATC                                        415
(2)SEQ ID NO:19的信息:
(i)序列特征:
(A)长度:444bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G210
(viii)基因组中的位置
(A)染色体/区段:8p
(xi)序列描述:SEQ ID NO:19:
GATCCTATCC TGACAAACTC AAGCAAATTC ACAAATACAA CCCTCTAGCC     50
GGCCCATGGC CTCCCTATTT GGGAGGAAAA AACTCAGTAT GATACTGTGA    100
CATATTTCAT TCATTATCTG TTAAGGTGAG CGTGGCAAAC CTGGCCGAAG    150
TGGCAGAATA TTGGGGCTCA TCACTTGGGG GAATGATTCA GGAGTGGCAT    200
CCTTCTGTGA CCTGTGACAG CCACTTAAGG TTGTGGGATG ACTACTACAA    250
AATCCCAAAT AAAGTATATC CTAAAGGCTT TCTTTTCTTT TCTTTTCTTT    300
TCTTTTCTTT TCTCTTCTCA TCTCTTGTCT TCTCTTCTTT TCTCCTCTCC    350
CCTCCCCTCC CATCCCCTCT CCTCTCCTCT CCTTTCCTTG TTTTAAAAAC    400
AATGTCTTGC TCTGTTGACC AGGCTGGAAT GCAGTTCTGT GATC          444
(2)SEQ ID NO:20的信息:
(i)序列特征:
(A)长度:321bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G212
(xi)序列描述:SEQ ID NO:20:
GATCTCCTTC AGTGTACTCA GTGCATTCTC CATCTCTTAC ATAATCTGAC   50
CTCCACTCTT CCTGGAAATG CATTTCTTTT TAGAGACAAG AGAAAAGGAA  100
ATCCTTGTTG AGTCTAAATG CATTGAGANA NACTCCTGGA AAGATAAAAG  150
TCCTCCAGGT TACCTTTAAN ACTTTCATTT CTCCTGCCAC CTGCTTGCTT  200
TCTCTCTCTT TCTTTTCTTT TCTTCCTTTC TTTTCTTTTC TTTTCTTTTC  250
TTTTCTTTTC TTTTCTTTTC TTTTCTTTCG ATGAGGCTTG CTGTATCACC  300
CAGGCTGGAG TGCAATGACA T                                 321
(2)SEQ ID NO:21的信息:
(i)序列特征:
(A)长度:329bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G233
(viii)基因组中的位置
(A)染色体/区段:10q
(xi)序列描述:SEQ ID NO:21:
GATCGCTTGA GCCTTGGAGA TTGAGGCTAC GGTGAGCTAT GATTGCACCA  50
CTGCACTCCA GCCTGGGTGA CAGAGTGAGA CCCTGGGAGA AAAAAAGAAA  100
GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GTCNTGACCT  150
TGGAAAAAAC CANAATTTCT GATGTTGTAC AACTCCTGAA TTCTGACTGC  200
TCTCTCCNCN GAAAGANGGA ATNNNTGNTC CTTGGAGGAT TCNTACTAAT  250
ATTCTTCGGT CNANACAAAA ACNTGACCTC NAGCCNAGAA AACAANATTN  300
NNCCNTTCCA TAGAAAAGTT CAGGGGACA                         329
(2)SEQ ID NO:22的信息:
(i)序列特征:
(A)长度:412bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G234
(viii)基因组中的位置
(A)染色体/区段:16qter
(xi)序列描述:SEQ ID NO:22:
GGATCACGCC ATTGCACTCC ACTCTGGGCA ACAAGAGCAA AACTCCATCT  50
CAGAAAAAAA GAAAGAAAGA AAGAAAGAAA GAGAGAAAAG AAAACAGAAA 100
AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAC 150
CCNNCAGAAA GCCAAGGCAA TGGGAACAAG CTGGGGCAAG TGCCTGGAGG 200
TGTTGCTGGA AAGGCAGATA GGGCAGAGAG CACCTGGACT CTTCCAAAAC 250
ATATTAGCAT CATGGTAAAG CCCTCAGCCC AAGTCCCCCA GAACATAGCC 300
GTAGTCAACC AAGTTGAGAT TGATTACTAG CTTCCTGTNA CAAGGGAGAT 350
TATNCNCACA CAAGTGCCAT CTGCCTCTCC CTTCACCCAG CTTGAGTTTC 400
GCTTGTAGCA CT                                          412
(2)SEQ ID NO:23的信息:
(i)序列特征:
(A)长度:359bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G235
(viii)基因组中的位置
(A)染色体/区段:2p
(xi)序列描述:SEQ ID NO:23:
GATCACCAGG CCCCTGAGGA AGCAGCACAG AAAAACACAA ATAATATCAA   50
TATCAGGCAG CCACAGGGGA AACAATGGGG CATTTCTCCG TGCTACATGC  100
ATGCTGCTAT TGTTTCAAGG GCTGGGGAAT TAATTCCACT TATTTATTTA  150
AGGCGTGTCA ACTCACTGCC TAAACCTGTT TCAGTGTCAA AATGGATAAA  200
ACTTTTATGG CTCATAAAAT ANANCCATTC ATCTCAATGT TCTTTGTGGT  250
GGGTTTTCTT TTCTTTTCTT TTCTTTTCTT TTCTTTTTTC TTTTTTTTTC  300
TGGCATACTG AGCTAAACCT CTGCTCTGAA ACGGTTACAT CTGAACCCAT  350
TGCTGCTAT                                               359
(2)SEQ ID NO:24的信息:
(i)序列特征:
(A)长度:516bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G331
(xi)序列描述:SEQ ID NO:24:
GACTTTCCCA CCTTCTGATG TGGGCATTTA GTGCTATAAA TTTCCCTCTA   50
AACACTGCTT TAGCTGTGTC CCANAGATTC TGGTATGTTG TGTCTTTGTT  100
CTCATTGGTT TCAAAGAACT TATTTATTTC TGCCTTAATT TTGTTATTTA  150
CCCAGTAGTC ATTCAGGAGA AGGTAGTTCA GTTTCCATGT AGTTGTGAAG  200
TTTTGAGTGA GTTTCTTTCC TTTTCTTTTC TTTTCTTTTC TTTTCTTTTC  250
CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT  300
TTCTTTTGTT TGAGATGGAG TCTTACTCTG TCGCCAGTCT GGAGTGCAGT  350
GGTGTCATCT CAGCTCGCTG CAACCTCCGC CTCCTGGGTT CAANAAATTC  400
CTCTGCCTCA GCCTCCCAAG TAGCTGGGTT TACAGGCACA CACCACCACG  450
CCCAGCTAAT TTTTTGTATT TTANTAAAGA CAGGGTTTCA CCATGTTGAC  500
NAAAATGGTC TCGATC                                       516
(2)SEQ ID NO:25的信息:
(i)序列特征:
(A)长度:556bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G405
(xi)序列描述:SEQ ID NO:25:
GATCTCACAT TCTTCCTCAG AATTCTTCTT GTTACCTCTG CAAAATTTCA   50
TCCTTCAAAC TCAAAGCTCA TTATCTTTGG ACTCTGTGAC ACTCTTCTGA  100
TTCTCATATC ACTTCTTGAT TTTCCTGCAT TTCCTCACTA ACTCTCAGCT  150
CATAATCATA TAAAATCACT AAGACTCTTT TTATATTGTC ATGAAGCTCA  200
GGTATTTTCA CAGATTGAAC CATTTCCCTG TAGACAGCAA TGCTCAACAT  250
GAACCATTCA CATCCTTCTT CCAAAGCACA GACTCTTCTT GCCATCTGCG  300
TCATGCCCAT GCTCATGTGC ATGGAGCCTG GTTCATTATC TTCCAAAATC  350
AAGCTTCCCC CACTTGATTT CTCTTTTCTT TTCTTTCCTT TCCTTTCCTC  400
TTTTCCTTTT CCCTTTCCCT TTCCTTACCT TTCCTTTCCT TTCCTTTCCT  450
CTCCTCTTTT CTCTTTTCTT TTCTTTTCTT TTCTTTTCTT TTCCTTTCCT  500
TTCNTTTCTT TTATTTGCAC CTCACTCTTG CCAAGGCTGG GATGGCAGTA  550
ANCACG                                                  556
(2)SEQ ID NO:26的信息:
(i)序列特征:
(A)长度:335bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G475
(viii)基因组中的位置
(A)染色体/区段:15q22.3
(xi)序列描述:SEQ ID NO:26:
GATCACGCCA TTGCACTCCA GCCTGGGCGA CTGAGCAAGA CTCAGTCTCA     50
AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA    100
AAGAAAAGAA AATTGTAAGG AGTTTTCTCA ATTAATAACC CAAATAAGAG    150
AATTCTTTCC ATGTATCAAT CATGATACTA AGCACTTTAC ACACATGTAT    200
GTTATGTAAT CATTATATCA TGCATGCAAG GTAATGAGTA TTATTTTCCT    250
CATTTTATAA AAGAGGAAAC TGATGTTTGA GGCTACTTTG CTTAAGACCG    300
CAGAACTAGC AAAGGAAAAG AGAAGTGAAT GTATC                    335
(2)SEQ ID NO:27的信息:
(i)序列特征:
(A)长度:333bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G539
(viii)基因组中的位置
(A)染色体/区段:15q26.2
(xi)序列描述:SEQ ID NO:27:
GATCGTGCCA CTGCACTCCA GCCTGGGCAA CAGAGTAAGA CTCAGTCTCC     50
AAAAAAAAAA AAAGAAAGAA AGAAAAAGAA AGAAAGAAAG AAAGAAAGAA    100
AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA    150
AAGAAAAGAA AAAGAAAAAG AAAAAATAAA GAGGTGAACG GTACTGAACA    200
GAAACTAAGA AGGCTGAGAG CCAACTCTGA GGTAACAGCT AGGAGCTGAA    250
GCAGGAAAGC TAAAATCTGC CCCAGTCCCA TTGCTGATAG ACTCACCATT    300
TACTAACAGA GAAACCATTC CTCCTTTTAG ATC                      333
(2)SEQ ID NO:28的信息:
(i)序列特征:
(A)长度:1011bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:S023
(xi)序列描述:SEQ ID NO:28:
CTGTACTGAA TTACAGCCCC AAATCTGGGT CAACTGGGGA GAGACGACGA   50
GGATTAGGGT TCCAAGGTGA AACTGTGCCA TTGCGCTCCA GCCTGGGCAA  100
CAAGAATGAA ACTCTCTTAA AATAAAATAA AATAAAATAA AATAAAATAG  150
CCTAAGGATG CATTTCTCAG AACTTATCCC TGTTGTTCAA TGATGTGTGT  200
CTATACAGTG GGGCCATAAC TAAGACGTAT GTTGCCCAAG CTGGCAAGAT  250
AGCTCTGACC TTCTCTTGGG CCCCTCATTT CCCCCAAACA CAGGTTGTCT  300
GCAGTCTTGA CCAATGGCTG CCAGGGCATG GACTCCGCTG CAGGGGCCAG  350
TGGGAGGCCC CAGCTCAGGC AAAAGCACAG GCAGATATTT CAGGAGTCTG  400
CTAGGGCTGG CACTGAGGGC AGAGACAGAG GGGTCTCCCT GTCCTTTGGA  450
GAACCTCACG CTGCAGAAAT TCCAGACTGA ACCTTGATAC CGAGTAGGGG  500
AGGAGCTGTC TGCGGGTTTG AGCCTGCAGC AGGAGGAAGG ACGTGAACAT  550
TTTATCAGCT TCTGGTATGG CCTTGAGCTG GTAGTTATAA TCTTGGCCCT  600
GGTGGCCCAG GGCTACAGTC ATCCTAGCAG TCCCCGCTGA AGTGGAGCAG  650
GTACAGTCAC AGCTGTGGGG ACAGCAATGC TGGCCAAGGG TCTTCCCCCA  700
CGCTCAGTCC TGGTCAAAGG CTGCCAGACC TTTCTGAGTG CCCCCAGGGA  750
GGGGCTGGGG CGTCTCAGGG TGCCCACTGG CGAGGGAGCT GGCATCTCCA  800
CCCGCAGTCC TCGCCCCTTC AATGAGATCC CCTCTCCTGG TGACAATGGC  850
TGGCTAAACC TGTACCATTT CTGGAGGGAG ACGGGCACAC ACAAAGTCCA  900
CCTTCACCAT GTCCAGAATT TCCAGAAGTA TGGCCCGATT TACAGGTAAG  950
CCTGGCAGAG GGTGGGAGCC GAAGGACAGG GAGGAGGAGG GGACTGGGTA  100
OGCCCTGCTGT A                                          1011
(2)SEQ ID NO:29的信息:
(i)序列特征:
(A)长度:1011bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S071
(viii)基因组中的位置
(A)染色体/区段:6q26-27
(xi)序列描述:SEQ ID NO:29:
CTGTACTGAA TTACAGCCCC AAATCTGGGT CAACTGGGGA GAGACGACGA     50
GGATTAGGGT TCCAAGGTGA AACTGTGCCA TTGCGCTCCA GCCTGGGCAA    100
CAAGAATGAA ACTCTCTTAA AATAAAATAA AATAAAATAA AATAAAATAG    150
CCTAAGGATG CATTTCTCAG AACTTATCCC TGTTGTTCAA TGATGTGTGT    200
CTATACAGTG GGGCCATAAC TAAGACGTAT GTTGCCCAAG CTGGCAAGAT    250
AGCTCTGACC TTCTCTTGGG CCCCTCATTT CCCCCAAACA CAGGTTGTCT    300
GCAGTCTTGA CCAATGGCTG CCAGGGCATG GACTCCGCTG CAGGGGCCAG    350
TGGGAGGCCC CAGCTCAGGC AAAAGCACAG GCAGATATTT CAGGAGTCTG    400
CTAGGGCTGG CACTGAGGGC AGAGACAGAG GGGTCTCCCT GTCCTTTGGA    450
GAACCTCACG CTGCAGAAAT TCCAGACTGA ACCTTGATAC CGAGTAGGGG    500
AGGAGCTGTC TGCGGGTTTG AGCCTGCAGC AGGAGGAAGG ACGTGAACAT    550
TTTATCAGCT TCTGGTATGG CCTTGAGCTG GTAGTTATAA TCTTGGCCCT    600
GGTGGCCCAG GGCTACAGTC ATCCTAGCAG TCCCCGCTGA AGTGGAGCAG    650
GTACAGTCAC AGCTGTGGGG ACAGCAATGC TGGCCAAGGG TCTTCCCCCA    700
CGCTCAGTCC TGGTCAAAGG CTGCCAGACC TTTCTGAGTG CCCCCAGGGA    750
GGGGCTGGGG CGTCTCAGGG TGCCCACTGG CGAGGGAGCT GGCATCTCCA    800
CCCGCAGTCC TCGCCCCTTC AATGAGATCC CCTCTCCTGG TGACAATGGC    850
TGGCTAAACC TGTACCATTT CTGGAGGGAG ACGGGCACAC ACAAAGTCCA    900
CCTTCACCAT GTCCAGAATT TCCAGAAGTA TGGCCCGATT TACAGGTAAG    950
CCTGGCAGAG GGTGGGAGCC GAAGGACAGG GAGGAGGAGG GGACTGGGTA   1000
GCCCTGCTGT A                                             1011
(2)SEQ ID NO:30的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S085
(viii)基因组中的位置
(A)染色体/区段:22q11
(xi)序列描述:SEQ ID NO:30:
AGTCAAATGA CGGTCATAGT TTGGGTGATG GTCACGGCTC AGGTTCTTTT    50
TTACACGTGC TTGCTTTGGT TGTTGTTGTT GTTCTTTGTT TTCTTGAGGC    100
AGTATCTGGC TGTGTCTCCC AGGCTGGCGT GCAATGGCAG GATCATAGCT    150
CACTGCAACC TCAAACTCCT GGCTGAAGCA ATCTTTGTGC CCTAGCCTCC    200
CAAGTTGTTG GGATTACAGT CGTGCCCCAC CATGCCTGGC TAAGTTGTTT    250
TTTGTTTTTT GTTTTTTTTT TTTTTTTCGA GACAGAGTTT TGCTCTTGTT    300
GCCCAGGCCG GAGTGCAGTG GTGTGATCTT GGCTCTCTGC AACCTCCCGG    350
GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC AAAGTGATGG GATTACAGGC    400
CTGAGCCACT GTGCCTGGCC ACATGTGCTT TCCCATTCGG TCCTTGCAGC    450
AGATCTTTGA GAGAGCTCAT TTGACACTCA GGAGATGCTT CTCTAACCTG    500
CTCAGAATCA GGGCCCTGGG TATTCAGGGA GGTAGAGGGA GCAGACTGCA    550
AAGCCAGTCG TGCTCCCATC GCTCCCACTT CTCTCTCCCT CTCCATGTTT    600
TCTGTCTCCC CCACCCAGCC TAGGGCATTC CTCCCCCACA GTCCAGCCTG    650
CATCTGGCAC AGTGTCACTG CTCAGCCCAG GGATACTCAC AGCCTGGGTG    700
CCTGGCTCCT TTTTTCAGCT CATCAAACCA GGTAAAGGGA GGTTCAGATT    750
CTGCCAACCA TTGACTCAAT TCATCCAAAT CTTCAATCAC TGGAATCCTG    800
GGAGTGGCTG GATTTGAACC AGGACCTCTG AGTACTATTG CTAAGTAACT    850
GGGGGTCTCA GTGAAAGAGA GAAAAGAGCT GATAGGCCTC TTCCTGTGTT    900
ATCATGTCAG GCCATCTTTT GAAACTCTTT TCTGCAATGC TACTGAAGTA    950
TTTATGCACG TGACCTGTGC TCTTCTGTCA GTCTAGGGGT GCTGGCTGAG   1000
(2)SEQ ID NO:31的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:
(B)克隆:S125
(viii)基因组中的位置
(A)染色体/区段:22q11.2-qter
(xi)序列描述:SEQ ID NO:31:
AGTCAAATGA CGGTCATAGT TTGGGTGATG GTCACGGCTC AGGTTCTTTT    50
TTACACGTGC TTGCTTTGGT TGTTGTTGTT GTTCTTTGTT TTCTTGAGGC    100
AGTATCTGGC TGTGTCTCCC AGGCTGGCGT GCAATGGCAG GATCATAGCT    150
CACTGCAACC TCAAACTCCT GGCTGAAGCA ATCTTTGTGC CCTAGCCTCC    200
CAAGTTGTTG GGATTACAGT CGTGCCCCAC CATGCCTGGC TAAGTTGTTT    250
TTTGTTTTTT GTTTTTTTTT TTTTTTTCGA GACAGAGTTT TGCTCTTGTT    300
GCCCAGGCCG GAGTGCAGTG GTGTGATCTT GGCTCTCTGC AACCTCCCGG    350
GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC AAAGTGATGG GATTACAGGC    400
CTGAGCCACT GTGCCTGGCC ACATGTGCTT TCCCATTCGG TCCTTGCAGC    450
AGATCTTTGA GAGAGCTCAT TTGACACTCA GGAGATGCTT CTCTAACCTG    500
CTCAGAATCA GGGCCCTGGG TATTCAGGGA GGTAGAGGGA GCAGACTGCA    550
AAGCCAGTCG TGCTCCCATC GCTCCCACTT CTCTCTCCCT CTCCATGTTT    600
TCTGTCTCCC CCACCCAGCC TAGGGCATTC CTCCCCCACA GTCCAGCCTG    650
CATCTGGCAC AGTGTCACTG CTCAGCCCAG GGATACTCAC AGCCTGGGTG    700
CCTGGCTCCT TTTTTCAGCT CATCAAACCA GGTAAAGGGA GGTTCAGATT    750
CTGCCAACCA TTGACTCAAT TCATCCAAAT CTTCAATCAC TGGAATCCTG    800
GGAGTGGCTG GATTTGAACC AGGACCTCTG AGTACTATTG CTAAGTAACT    850
GGGGGTCTCA GTGAAAGAGA GAAAAGAGCT GATAGGCCTC TTCCTGTGTT    900
ATCATGTCAG GCCATCTTTT GAAACTCTTT TCTGCAATGC TACTGAAGTA    950
TTTATGCACG TGACCTGTGC TCTTCTGTCA GTCTAGGGGT GCTGGCTGAG   1000
(2)SEQ ID NO:32的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S132
(viii)基因组中的位置
(A)染色体/区段:22
(xi)序列描述:SEQ ID NO:32:
GGTGTGACCT TATCCTCTCT GAACCTCAGT TTCCTCATCC GTAAAATGAA     50
AAGCTGCTAG ATTGTTGTAA AAAAATTAAA TGGAATAGGC TAGGCGCGGT    100
GGCTCACGCC TGTAATCCCA GCACTTTAGA AGGTCGAAGA GGGTGGATCA    150
CTTGAGGTCA GGAGTTTTGA GACCAGCCTG GCCAACACGG TGAAACCCCA    200
TCTCTACTAA AAATAAAAAA TTAGCTNGGG TGCGGTGGCT CACACCTGTA    250
ATCCCAGCAC TTTGGGAGGC TGAGACGGGT GGATCACCTG AAGTCAGGAG    300
TTCAAGGCCA GCCTGGGCAA CATGGTGAAA CCACGTCTCT ACTAAAAATA    350
CAAAAATTAG CCAGGTGTGG TGGCACACGC CTGTAGTCCC AGCTACTTGG    400
GAGGCTGAGG CGGAAGAATC GCTTGAACCC AGTAGGCAGA GGTTGCAGTG    450
AGCCGAGATA AGAGTCACTG CACTCCAGCC TGGGTGACAG AGCAAGACTC    500
CCTCTCAGAA AATAAAATAA AATAAAATAA AATAAAATAA AATAAAATAA    550
AATAAAATTC TAAAAGGGCT GGCATTTGCC TAGCACTTAT ATGCCCAATA    600
AGTAATAGCT ATCAATATCC CCACCCCTAC CACTGTGCTG AAATTTAGTT    650
TCTTTTTGTC ACCCCCCATT AGACTTAAGG CAGAATTCTC ACCGTACTCC    700
TCTGTAAATT TCTGGTTCCT GGCACATAGT TGGGTCTCAG TGAAACATGG    750
TGAGTGAATG AGCAAATGCA AGGAATCTCC AGGCCATCTG GGAGCCCTCC    800
CAGGCGGGTG AGTTCGGGAA ACTCATAGTC TGTCCTCAAT GGCCCACTGA    850
AAGGTAGAGA GTTCTGGGTC CCACCTCCGC ACCCCCATCT CCTGACTCAC    900
TGCTGAAAAA TAAATAAATA AATAAAATAA CACTTATCCG GAGCCTCCCA    950
CATGCCTTGC CAGGACTGCA AGGAGCCCAG CAGAATGATG ACCGGCGTGC   1000
(2)SEQ ID NO:33的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S136
(viii)基因组中的位置
(A)染色体/区段:22q12-qter
(xi)序列描述:SEQ ID NO:33:
CCACTACATA TCCCATACAG GCTAATCAAC ATGTCAAAGT TCACACAGTT     50
ATTGTGTACC CCTGGGCTCA ATCTCAAGTG TTCTGGTTGG TCGTCCAAGG    100
TTACTTTTTT TTTTTTTTTT TTTTTTTTGA GATGGAGTCT TGCTCTGTTG    150
CCCAAGCTGG AGTGCAATGG CATGATCTTG GCTCACTGCA ACCTCCGCCT    200
CCTGGGTTCA AGGGATTCTC CTGCCTCAGC CTCCTGAGTA GTTGGGATTA    250
CAGGCATGCA CTACCATGCC TGGCTAATTT TTGTATTTTT AGTAGAGGTG    300
GAGTTTCTCC ATGTTGTTCA GGCTGGTCTT GAACTCCCAA CCTCAGGCAA    350
TCCACCTCGG CCTCCCAAAG TACTGGGGTT ACAGGCATGA GCCACTGCGC    400
CTGGCCCAAG GTTACTTTTC ACTACATCTT CCTACCTGTA TCACTTACTG    450
CCGTGTGTAT AACTTCCACA TTTTCTTTCT TTTCTTTTCT TTTCTTTTCT    500
TTTCTTTTCT TTCTTTTCTT TCTTTCTTTC TTTCTCTCTC TTTCTCTCTC    550
TCTTTCTCTC TGTCCCCTCC TTCCTTCTCC TTCCTTCTTC CTTCCTTCCT    600
TCCTTTCCTT CCTTCCTTCC TTCTTTCAAC ACAGAGTCTC ACTCTGTCAC    650
CTAGGCAGGA GTGCAGTGGC CCAGTCTCAG CTCACTGCAA CCTCCGCCTC    700
CTGGGCTCAA GCAATTCTCT CACCTCAGCC TCCCGAGTAG CTGGGATTAC    750
AGGCATGTGC CACCATACCC AGCTAATTTT TGTATTTTTA GTAGAGACGG    800
GATTTCACCA TATTTTCCAA GCTGGTCTCG AACTCCTGAC CTCAAGGGAT    850
CTGCCCGACT CAGCCTCCCA AACTGCTGGG ATCATAGGTG TGAGCCATCA    900
TGCTTGGCCC ACACTTTCTA TGTTAATCTA ATTTAGATGA TTTAATCTAT    950
ATACAGTTTC TATATTAATC TAATTTAGAT GACTTAATCT ATATACAACT   1000
(2)SEQ ID NO:34的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S159
(viii)基因组中的位置
(A)染色体/区段:21q22-qter
(xi)序列描述:SEQ ID NO:34:
AAACCCCGTC TCTACTAAAA ATACAAAAGT TAGTTGAGCA TGGTGGCACG   50
GGCCTGTAAT CCCACCTATA ATCCCACCTA CTCGGGAGGC TGAGGCAGGA  100
GAATCGCTTG AACCCAGGAT GGGGCGATTG CAGTGAGCCG AGATCGTGCC  150
ACTGCACTCC AGCCTGGGTG ACAGAGCGAG ACTCCATCTC AAAAAAAAAA  200
AAAAAAAACA GAATCATAGG CCAGGCACAG TGGCTAATTG TACCTTGGGA  250
GGCTGAGACG GGAGGATCGA GACCATCCTG GGCACCATAG TGAGACCCCA  300
TCTCTACAAA AAAAAAAAAA AATTTTTTTT AAATAGCCAG GCATGGTGAG  350
GCTGAAGTAG GATCACTTGA GCCTGGAAGG TCGAAGCTGA AGTGAGCCAT  400
GATCACACCA CTACACTCCA GCCTAGGTGA CAGAGCAAGA CACCATCTCA  450
AGAAAGAAAA AAAAGAAAGA AAAGAAAAGA AAAGAAAAGA AAAGAAAAGA  500
AAAGAAAAGA AAAAACGAAG GGGAAAAAAA GAGAATCATA AACATAAATG  550
TAAAATTTCT CAAAAAAATC GTTATGACCA TAGGTTAGGC AAATATTTCT  600
TAGATATCAC AAAATCATGA CCTATTAAAA AATAATAATA AAGTAAGTTT  650
CATCAAAACT TAAAAGTTCT ACTCTTCAAA AGATACCTTA TAAAGAAAGT  700
AAAAAGACAC GCCACAGGCT AAGAGAAAGT ACTTCTAATC ACATATCTAA  750
AAAAGGACTT GTGTCCAGAT TAAAGAATTC TTACACATCA ATAAGACAAC  800
CCAATTAAAA ATCGGCAAAA GATTTGAAGA GATATTTAAC CAAAGAAAAC  850
ATATAAATGT GTCCGGGCGC GATGGTAATC CCAGCACTTT GAGAGGCCGA  900
GGCAGGCGGA TCACTTGAGG TCAGGAGTTT AGGACCAGTC TGGCCAACAT  950
GGTGAAACCC TGTCTCTAAT AAAAATACAA AAATTAGCTG GGTGTGGTGG 1000
(2)SEQ ID NO:35的信息:
(i)序列特征:
(A)长度:1400bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S176
(viii)基因组中的位置
(A)染色体/区段:7q21-7q22
(xi)序列描述:SEQ ID NO:35:
CCATATGTTT GTTTCCTCTA CTACTGCTCC TCCCTGACCC TTAAGAAACA  50
CTGCCATAGA GCCCTACAGC TTGATGGGAG AAGTCCTATC CCTTAGGCAT  100
GGAAAGCTAT TAAGAATGTG AGAACTGTGT ATGAGGAAAC TAATTTAATA  150
ATTCCTTAGA ATGGAACCAG TTGAAAATTT CCAGCTCCAC AAACTGAAGT  200
GAAATCATTT TTTCTCCACT CCTTACTAGT AAATTTACTG TTCTATGTTA  250
AAAGAAAAAA AAAATCAACC AGCATTTAAA TTATGGCAAC CTAAAATGTG  300
TCCAGTATCT TAGAATAATT TCCCCACTGA CCTATTCCTC TGTAATAGTA  350
AAACATATAC ACAAATGTTT ATAGCTACAT TAGTCATAAT AGCCGAAAGG  400
TAAAAACAAC CCAAATGCCC ATCAACTAGA TAAATGTATT TAAAAAATAT  450
GACCCAGGCG AGGTGGCTCA GGCCTGTAAT CCCAGCACTT TAGGAGGCTG   500
AGGTGGGTGG ATGACCCAGG AGTTCAAGGC CAACCTGGTG AACATAGTGA   550
GACCCCATCT CTACAAAACT AAAAATAAAA AATTAGCCAG ATGTTGTGGT   600
GTACACCTGT AGTCCAAGCT ACTCAGGACG GTGAGGAAGG AAGATCACTT   650
GAGCCCGGGA GTTTGAGGCT GCAGTGAGCT ATGATCACAC CATGGCACTC   700
CAGCCTGGGC AAGAAAGTGA GACCAAATTA TTAAAAAAAA AAAAAAAAAA   750
AAAAAAAAAA AAAAAACAGA AGAAGAAGCA CTGATGCATA GGCCATGAAT   800
AAACTTTGTA AATATTATGC TAAGTAAAAG AAGCCAGAGA TGAAAATCAC   850
ATATTGTAAT TGTATGACTC CATGTGTTTT TTTAAAAAGG TCCACACAGA   900
AAAGCTATTA GTAGTTGCTC ACAGCTGGAA GGCAAGGAGG GCACGTAAGT   950
GGGTGATAGC TATAGGACAC AAGGATTATT TCTGAAATGA TGAAAATGTT  1000
CTAAAACCGT GGTAATGGTT TTACAACCCT GTGAATATAC TAAAAACTAC  1050
TGAATTGTAT ACTTAAAATG GGTGAATTAG ACGGCATATG AATTATATAT  1100
CAATAAAGGT ATTACCCAAG AAAAAGAATA CAGTATCTTC ATATTCTATA  1150
TTCTCCTCTC TTAGCTTTAC TCAGATTTCA CCTCTGTCCA GTCACCTTTC  1200
CACATTAACT CCAGGCAACT CCAAAAGTTA TTCTTCCTGC TTCATTCATC  1250
CCCCAAATAA ATTACATTCA CTACTGCGAA GATAACTGGC CAGAAACTCA  1300
ATTCCTGAAG TTCTGGCAAA TGGTTCCTAG ACTCCAAATG GAGCAGAATA  1350
ATTTGCAACT GGGCTTAAAC ACGATTGTCT TTTTTAAGGC ATCCTCAGTT  1400
(2)SEQ ID NO:36的信息:
(i)序列特征:
(A)长度:1250bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S189
(viii)基因组中的位置
(A)染色体/区段:22q11.2-qter
(xi)序列描述:SEQ ID NO:36:
GTTGCTCTGG CGATTCGCAA CTCGAAAATG ACACTTACTA TTCAGCTAGA  50
GATTAGAATC TCAAGCAGTA GGGCATTTTT TAATAAAAAA TTAAATTAAA  100
AATAGATTTG CCATTGTCTG CTTAATAAAA CTAGTAGCTC TGCTGGCTTA  150
GAGGGGAAAT AACATATTTC TTCGGATTTT TATATATTCA TCTGAGCAGT  200
GCTAAAAAAT AAAACAAAGT TACTAATATT CATATCTTGA GCAATTGTAC  250
ATTGCTTCTA ACTATACATT CAATCTCTCT GGCACATCCA CTGTGGCCCT  300
GAGCAGCCAG TACAGGCTCT TCTACCAAAA CGAAGCAAGC CACTCCAAAA  350
CCTGACGCGT GCAGGTGTCA CGAAACACCA GGTGCAGCTT GACAGATGTG  400
AGCCAAATAA GGAAACATTC AGCCCAGCAC TGCCCAACAG TCATGATGTA  450
TATTTTCTAC ATCTGTGCTC TAAAATATGG TGGCCACTAG CTGCAGGTGG  500
CTATTGAGAC TAAGGAACTG TATTTTTAAT TTTATTTCAT TTCAACTCAT  550
TTAAAGTAGC CACATGCCGC TAATGGCTAC TGATCTAGAG GGCAGCTGGG  600
ATGTTACTCT TGAGAATGTC TCCAGCATTT TACCTGTTGC TCTCTCTCAC  650
TCACATTTCC CATTCTAGCA CAAACAAAAC AAAACAAAAC AAAACAAAAC   700
AAAACAAAAC AAAACAAAAA AACCACAACA CCTACAGTTC TCCAAACAGG   750
GCATCTGTTT TGTTCCTCTG GGGGGGTCCT GTCTATGTTG TTCACGTGGC   800
CCTGGATTTC CATACTCCTA GCCTTCCTGG AAGACATCCT TTTCATCCTC   850
ACAACCCAAC CCAGGCTTTA TCTCTTCTGT GAAGCTGTCC TTGATTTTCC   900
GTTCTATCTT CCCTGCTTGT GAATGGGTCA GCTCTCCTTC CCCACCGCCC   950
TGTGCGTGTG AACATCTTTG TTCAGTATAC TGCAGTGGGT CGGGAGTATG  1000
TCCCTTCCAG ACTGGAAGGC AGAGAGGGTG GCTGTAAGGA TTGGCACTTT  1050
GGGCCAGGCA CAGTGCTCAT GCCTGTAATC CCAGCACTTT GGGAGGCTGA  1100
GGCAGGAGAA TCGCCCGACC CCAGGAGACA GAGTTTGCAG TGAGACGAGA  1150
TTGCACCACT GCACTCTAGC CTGAGGGATA GAGCAAGACT CCCTCTCAAA  1200
AAAATAAATA AATAAATAAA TAAATAAATA AAAATAAAAA ATTAAAGAGG  1250
(2)SEQ ID NO:37的信息:
(i)序列特征:
(A)长度:1200bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S199
(viii)基因组中的位置
(A)染色体/区段:6q21
(xi)序列描述:SEQ ID NO:37:
TTTCATGTTC ACAGATTGGA TTAATATTGT TAAACTGTCC ATACTACCCA  50
AAGCAATCCA TAGATTCAAT GCAACCCTGA TATAGTTTGA ATGTATGTAG  100
GCACCAAAAT CTCATGTTGA ACTTTAATCC CCAGTGTTGG AGGTGGAGCC  150
TGGTGTAAGA TGTTTAGATT ATGAAGGTGA ATCCCTCATG AACGGCTTGG  200
GCCATCTGCT TGGTGATAAG TGAGCTCTTG TTCTGAGTTC ACATGAGATA  250
CAGTCATTTA AAAGCCTGTG GTACCCAAAC TCTCTCTTGC TCTTGCTTCT  300
GTTCACGCCA TGTGATATAC CTGCTATCCT TTGCCTTTGC CTTCTGCCAT  350
GATTGGAAGC TTCCTGAGTC CTCCCCAGAA ACAGATGTAA CTATGCTTCC  400
TGTACAGCCT GCAGAACCAA GAACAAACTG AAACTCTTTT GTTATAAATT  450
GCCCAGGATT AGGTGGGTGT TTTGTTTTGT TTTGTTTTGT TTTGTTTTGT  500
TTTTTGAGAT GGAGTCTCGC TCTGTCTCCC AGGCTGGAGT GCAATGATAC  550
AATCTCGGCT CACTGCAACC TCCACCTCCC CGTTCAAGCA ATTCTCCTGC  600
CTCAGCCTCC TGAGTAGCTG GGATTACAGG CGCACGCCAT CATGCCCGGC  650
TAATTTTTGT ATTTTTAGTA GAGACGGGGT TTCACCACAT TGGTCAGGCT  700
GGTCTCGAAC TCCTGACCTC ATGATCCACC CGCCTTGGCC TCCCAAAGTG  750
CTGGGATTAC AGGCGTAAGC CACCATGCCC AGCCAGGTGG TTTTTTATAG  800
TAGTGCAAGA ATGGCCGAAT ACAAACCCCT ATCAAAATAC CAATGACATT  850
TGTCAGGGAC ATTTTTAAAA ATTCTGAAAT TTATATGGAA CCACAAAAGA  900
CCCAGAATAG CCAAAACTAA CCTGAGCAAA AAGAACAAAC CTGGAAGAAT   950
CACATTACCT GACTTCAAAG TGTACTACAG AGCTCTTATA ATCAAAACAT  1000
CATGGTACTA GCATAACAAC AGACACATAG ACCAATGGAA CACAATAGAG  1050
AACCCAGAAA CAAATCCATA CACCTACTGT GAACTCATTT TTGACAAAGG  1100
TGCCAAGAAC ATACATGGGA GAAAGGACAG TATCTCCAAA TAAATGGTGC  1150
TGAGAAAAGT GGATATACAT ATGCATAAGA ATGTAACTAG ACCCCTATCT  1200
(2)SEQ ID NO:38的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S040
(xi)序列描述:SEQ ID NO:38:
GCTGCAATAA ACACGGGAGT GTAGGTATCT TTAAAAGAAG GTGGTGATTT  1900
CATCTCTTCT GGGTATGTAT CCAAAATAGG GTCACTGTTG GGTTATAAGG  1950
TGGTTAGGTT TTGAATTTCT TTAGGAACCT CCATACTGTT TTCCATAATG  2000
GGTGCACCAA TCATCATTCC CACCAACAAT GTACAAGTGT TTTATTTTCT  2050
TCACACCCTC ATCAATATTT ATCTCTTGTC TTTTTTATAA TAGCCATCCT  2100
AAAGACTGTA AGGCGTTTTA TTTCTAATCT CAGATTTCAC TGTAGAAACA  2150
GTGATGACAC AGTCTCCAGC TTCCCTGTCT TTGTCTCTGG AGAAAAAAGC  2200
CACCCTGACT TGCAGGGCCA GTCAGTGTTA GCAGCTACTA AGCCTGGTAC  2250
CAGAAGAAAC CTGAGCGGGT TCCCAGGCTC CTCATCTATG GTACAGCCCT  2300
GATTTGTGAT AGTGGGTCGG GGACAGGGCT TACTCTCACC ATCGGCAGCC  2350
TGGAGCCTGG AGCCTGGAGA TTTGCACTTC ATCACTGTTA TCAGCATAGT  2400
AGTTGGTGTC CCATACTGAT TCGACATGCA ACAAAAACCT CCAGGAGACC  2450
TAAGGTGTTT ATTTGATTAT ACTACCTGCT TCCTTTTTAG TCATCTGATG  2500
TGGTGCTGCT CAGTTTTAGC ATCTCTGCTT TGATTGGAAA TTCTGAGGTT  2550
CTCAAAAGTA ATTCCTTATA ATATTTATAG TTTCACTCAT GGATTTTTTT  2600
CTCAGACCCA AATGTACAGC CAGGTTCAGG CACAATTTCA TGGTCAAGGC  2650
CATTGGATCA GACTCACATG AGTGGACGCC TCTAAAGGTC CTGGCCAGTG  2700
CGATAAAGTA GCAGCGACAA TGATAAAGAA GAAGAATTAG AAAGGCAGAA  2750
TTAAAGGTAT AACAATTCAC TGATGAAAGG ACTGTGTGGG GGAGAAATTT  2800
CTAATTGTCT ACACAGAAAT TATTAGAATT AATGAGATAC ATAGCAAATT  2850
(2)SEQ ID NO:39的信息:
(i)序列特征:
(A)长度:1050bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S066
(xi)序列描述:SEQ ID NO:39:
GGGGCCTAGC CCAGTTGGAG GGACAAGAGC TGGAAACTGG GTTCCTTAGG     50
GTGGTGCCAG AGTGGGCAGA GACCTCTGGG CAGCCCACGT CCAAGTCCAG    100
AGCAAGGGGA GGCTCATCCT AGAAAAGAGG CCAGAGGAGC CATAACCACC    150
ATTGTTCCTT GGGTTAAGGA GTCCTTTTTT AAAACCATCA AAACTAAGAA    200
TCCAGTGCAT TATGAATCCA AGGGGTGAGG CTCAGTGTGC CAATGCCCCA    250
GAACAGTCTA AGAAAGCTCC TTTTCCCTTT CCAGGCAGCT CGAGCTTTAC    300
CTTCCCAAAT TCTCCATTGA GGGCTCCTAT CAGCTGGAGA AAGTCCTCCC    350
CAGTCTGGGG ATCAGTAACG TCTTCACCTC CCATGCTGAT CTGTCCGGCA    400
TCAGCAACCA CTCAAATATC CAGGTGTCTG AGGTGGGTTC AGAAGCTCCT    450
ATGCATCTGC TTCCCAAGAT CTATTCTGTT CTATTCTTTC TATTCTACTC    500
TACCCCATTT CATTCCATTC CATTCCACTC AACTCCACTC CACTCCACTC    550
CACTCCAGTT CACTCTATTC AATTCCACTC CACTCCAGTT CACTCTATTC    600
AATTCCACTC CACTCCACTC CAGTTCACTC TATTCAGTTC CACTCCACTC    650
CACTCCACTC CACTCCAGTT CACTCTATTC CATTCCACTC CATTCCACTC    700
CTCCACTCCT CTCATCCACT CCACTCTACT CCTCCACTCC ACATCTCCAC    750
TCCACTCCTC CACTCCACTC CTCCACTCCA CTCATCCACT CCACTCCTCC    800
ACTCCACTCC TCCACTCCAC TCCTCCACTC CACTCCACTC ATCCACTCCA    850
CTCTTCCATT CCACTCCATT CCACTCCTCC ACTCCACTCT TCCACTCCAC    900
TCCATTCCAC TCCTCCACTC CACTCCACTC TATTCTATTC TATTCCATTC    950
CATTCTACTC TATTCTATTC CATTCCATTG CAGTCAACTC CACTCCACTC   1000
TCTACTATTC TATTCCACTC CTCTCCCCTC CACTCCATTC CATTGCAGTC   1050
(2)SEQ ID NO:40的信息:
(i)序列特征:
(A)长度:4580bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:
(B)克隆:S077
(xi)序列描述:SEQ ID NO:40:
GGATCCCAAT TCATTCCGGG CTGACACGCT CACTGGCAGG CGTCGGGCAT  50
CACCTAGCGG TCACTGTTAC TCTGAAAACG GAGGCCTCAC AGAGGAAGGG  100
AGCACCAGGC CGCCTGCGCA CAGCCTGGGG CAACTGTGTC TTCTCCACCG  150
CCCCCGCCCC CACCTCCAAG TTCCTCCCTC CCTTGTTGCC TAGGAAATCG  200
CCACTTTGAC GACCGGGTCT GATTGACCTT TGATCAGGCA AAAACGAACA  250
AACAGATAAA TAAATAAAAT AACACAAAAG TAACTAACTA AATAAAATAA  300
GTCAATACAA CCCATTACAA TACAATAAGA TACGATACGA TAGGATGCGA   350
TAGGATACGA TAGGATACAA TACAATAGGA TACGATACAA TACAATACAA   400
TACAATACAA TACAATACAA TACAATACAA TACAATACAA TACAATACGC   450
CGGGCGCGGT GGCTCATGCC TGTCATCCCG TCACTTTGGG ATGCCGAGGT   500
GGACGCATCA CCTGAAGTCG GGAGTTGGAG ACAAGCCCGA CCAACATGGA   550
GAAATCCCGT CTCAATTGAA AATACAAAAC TAGCCGGGCG CGGTGGCACA   600
TGCCTATAAT CCCAGCTGCT AGGAAGGCTG AGGCAGGAGA ATCGCTTGAA   650
CCTGGGAAGC GGAGGTTGCA GTGAGCCGAG ATTGCGCCAT CGCACTCCAG   700
TCTGAGCAAC AAGAGCGAAA CTCCGTCTCA AAAATAAATA CATAAATAAA   750
TACATACATA CATACATACA TACATACATA CATACATACA TAAATTAAAA   800
TAAATAAATA AAATAAAATA AATAAATGGG CCCTGCGCGG TGGCTCAAGC   850
CTGTCATCCC CTCACTTTGG GAGGCCAAGG CCGGTGGATC AAGAGGCGGT   900
CAGACCAACA GGGCCAGTAT GGTGAAACCC CGTCTCTACT CACAATACAC   950
AACATTAGCC GGGCGCTGTG CTGTGCTGTA CTGTCTGTAA TCCCAGCTAC  1000
(2)SEQ ID NO:41的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:
(B)克隆:S097
(xi)序列描述:SEQ ID NO:41:
GGACATGAGG CTTCCCAGCC AACTGCAGGT GCACAACATA AATGTATCTG   50
CAAACAGACT GAGAGTAAAG CTGGGGGCAC AAACCTCAGC ACTGCCAGGA   100
CACACACCCT TCTCGTGGAT TCTGACTTTA TCTGACCCGG CCCACTGTCC   150
AGATCTTGTT GTGGGATTGG GACAAGGGAG GTCATAAAGC CTGTCCCCAG   200
GGCACTCTGT GTGAGCACAC GAGACCTCCC CACCCCCCCA CCGTTAGGTC   250
TCCACACATA GATCTGACCA TTAGGCATTG TGAGGAGGAC TCTAGCGCGG   300
GCTCAGGGAT CACACCAGAG AATCAGGTAC AGAGAGGAAG ACGGGGCTCG   350
AGGAGCTGAT GGATGACACA GAGCAGGGTT CCTGCAGTCC ACAGGTCCAG   400
CTCACCCTGG TGTAGGTGCC CCATCCCCCT GATCCAGGCA TCCCTGACAC   450
AGCTCCCTCC CGGAGCCTCC TCCCAGGTGA CACATCAGGG TCCCTCACTC   500
AAGCTGTCCA GAGAGGGCAG CACCTTGGAC AGCGCCCACC CCACTTCACT   550
CTTCCTCCCT CACAGGGCTC AGGGCTCAGG GCTCAAGTCT CAGAACAAAT   600
GGCAGAGGCC AGTGAGCCCA GAGATGGTGA CAGGGCAATG ATCCAGGGGC   650
AGCTGCCTGA AACGGGAGCA GGTGAAGCCA CAGATGGGAG AAGATGGTTC   700
AGGAAGAAAA ATCCAGGAAT GGGCAGGAGA GGAGAGGAGG ACACAGGCTC   750
TGTGGGGCTG CAGCCCAGGA TGGGACTAAG TGTGAAGACA TCTCAGCAGG   800
TGAGGCCAGG TCCCATGAAC AGAGAAGCAG CTCCCACCTC CCCTGATGCA   850
CGGACACACA GAGTGTGTGG TGCTGTGCCC CCAGAGTCGG GCTCTCCTGT   900
TCTGGTCCCC AGGGAGTGAG AAGTGAGGTT GACTTGTCCC TGCTCCTCTC   950
TGCTACCCCA ACATTCACCT TCTCCTCATG CCCCTCTCTC TCAAATATGA  1000
(2)SEQ ID NO:42的信息:
(i)序列特征:
(A)长度:1144bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S103
(xi)序列描述:SEQ ID NO:42:
CTCTGACTCT CCGCGGTGGT TGTTGGGGCT TCTTGGCTTT GTTTTGTTGT    50
TTGTTTGTAT TTTATTTTTT TCTCTCTGAC ACCTATTTTA GACAAATCTA    100
AGGGAAAAAG CCTTGACAAT AGAACATTGA TTGCTGTGTC CAACTCCAGT    150
ACCTGGAGCT TCTCTTTAAC TCAGGACTCC AGCCCATTGG TAGACGTGTG    200
TTTCTAGAGC CTGCTGGATC TCCCAGGGCT ACTCACTCAA GTTCAAGGAC    250
CAACAAGGGC AGTGGAGGTG CTGCATTGCC TGCGGTCAAG GCCAGCAAGG    300
TGGAGTGGAT GCCTCAGAAC GGACGAGATA ATGTGAACTA GCTGGAATTT    350
TTTATTCTTG TGAATATGTA CATAGGCAGC ACTAGCGACA TTGCAGTCTG    400
CTTCTGCACC TTATCTTAAA GCACTTACAG ATAGGCCTTC TTGTGATCTT    450
GCTCTATCTC ACAGCACACT CAGCACCCCC TTCTCTGCCC ATTCCCCAGC    500
CTCTCTTCCT ATCCCATCCC ATCCCATCCC ATCCCATCCC ATCCCATCCC    550
GCTCTTTTCC TACTTTTCCT TCCCTCAAAG CTTCCATTCC ACATCCGGAG    600
GAGAAGAAGG AAATGAATTT CTCTACAGAT GTCCCATTTT CAGACTGCTT    650
TAAAAAAAAT CCTTCTAATC TGCTATGCTT GAATGCCACG CGGTACAAAG    700
GAAAAAGTAT CATGGAAATA TTATGCAAAT TCCCAGATTT GAAGACAAAA    750
ATACTCTAAT TCTAACCAGA GCAAGCTTTT TTATTTTTTA TACAGGGGAA    800
TATTTTATTC AAGGTAAAAT TCTAAATAAA ATATAATTGT TTTTTATCTT    850
TTCTACAGCA AATTTATAAT TTTAAGATTC CTTTTCTTGT TTATCAGCAG    900
TTGTTATTAC ATCCTTGTGG CACATTTTTT TTTAATTTTG TAAAGGTGAA   1000
AAAAGCTTTT ATGAGCTCAT CTAGCAATCA GATTTTCCTG TGGA         1144
(2)SEQ ID NO:43的信息:
(i)序列特征:
(A)长度:1366bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S110
(xi)序列描述:SEQ ID NO:43:
GGAATTCAAT GGAATATAAC GAAATGGATA GGATCAGAAC GGAACAGAGC   50
GGAGTGGAGT TGAGTGGAGT GGATCGGAGT GCAGTGGAAA GGAATGGAAT   100
AGAATGGAAT GGAATGCAGT GGAGTGGAAT GGAATGAAGT GGAATGGAGT   150
TGAGTGGAGT GGATCGGAGT GCAGTGGAAA GGAATGGAAG AGAATGGAAT   200
GGAATGGAAT GCAGTGGACT GGAATGGAAT GGAGTGGAGT GGAGTGCAGT   250
GGGAATCGAG TGGAGTGGAG TGGAATGGAC TGGAATGGAA TGGATTGGAG   300
TGGAGTGCAG TGGAATCGAG TGGAGTGGAG TGGAATGGAG TAGAATGGAA   350
TGGAGTGGAG TGTAGTGGAA TGGAATGGAA TGGTGAATGA ATGTCAGCTA   400
AGATTGTGCA ACTGCATTCC AGTCTGGGTG ACAAAGTGAG ATCCAGTCGA   450
AGTAAAGGAA TGGAATGGAA TAGAGTAAAA TGGAATGGAA TGGTGTGGAG   500
TGGAATGGAA TGGAGAGGAA TGGAGTGGAG TGGAGTGGAG TGGAGTGGAA   550
TGGAGTGGAG TGGAATGGAG AGTGATGGAG AGGAATGGAA TGGAATGGAA   600
TGGAATGGAG TGGAATGGAA TGGAATGGAG TGGAATGGAA TGGAATGTAG   650
AGGAGTGGAG TGGATTGGAG TGGAGTGGAA TGGAGTGGAA TAGAGTGAAA   700
TTTAGTGGAG TGTAATGGAG TGGAGTGGAG TGGCAGTTGA GTGGCATGGA   750
TCAGGTGCAG TGGAATGGAA TGGAATGGAG TGGAGTGGAG AGGAGTGGAG   800
TGGAATCGAA TGGAATGGCA TGGAGTGGAG TGGAATGGAG TGGATTGGAA   850
TTGAATGCAG TGGAATGGAA TGCAATGGAG TGGAGTGGAG TGCAGTGGAG   900
TGGAGTGGAG GGGAATGGAA TGGAGTGGAG TAAAATGGTT TGGAATGGAG   950
TGGGGTGGAA TGGAGTGGGT TGGAATGGAG TGGAGTGGAG TAGAACGGAG  1000
TGATTGGGGT GGAATGGAAT AGAGTGGAAT GGAATGGAGT GGAGTGGAGT  1050
AGAACGGAGT GATTGGAGTG GAATGGAATA CAGTAGAGTG GAATGCAGTG  1100
GAGTGGAATG GAATGGAGTG GAGTGGCATG GAAAGGAATG GAGAGGAATG  1150
GAATGGAATG GAATGGAATG GAATGGAATG GAATGGAATG GAACGGTGAA  1200
ATAAAATGTG AGTTAAGATT GTGCCACTGC ATTGCAGTCT GGGGGACAGA  1250
GTGAGATACA GTCGAAATAA AGGAATGGAA GGGACTGGAG TAGAATGGAA  1300
TGGAATTGAG TGGAGTGGAA TGGAATGAAG TGGAGAGGAA TGGAATGGAG  1350
TGGAATGCAA TGGAGG                                       1366
(2)SEQ ID NO:44的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:44:
TGGCTCAGAC ACCTCATTG                                      19
(2)SEQ ID NO:45的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:45:
CACCACTGTA TTCCCAGTTT G                                   21
(2)SEQ ID NO:46的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:46:
CACTTGCCAT CCCTGCCACA CA                                  22
(2)SEQ ID NO:47的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:47:
AGCGCACCCC CAATTTCCGG TAT                                 23
(2)SEQ ID NO:48的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:48:
TGGGGACATG AACACACTTT GC                                  22
(2)SEQ ID NO:49的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:49:
GAGGCCCAGG ACCAGATGAA AT                                  22
(2)SEQ ID NO:50的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:50:
CACCTGTCAG GCAAGGCTTA AAC                                 23
(2)SEQ ID NO:51的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:51:
CAACACTGAG CGCTTTTAGG GACT                                24
(2)SEQ ID NO:52的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:52:
TCAGGCAAGG CTTAAACAGG GATA                                24
(2)SEQ ID NO:53的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:53:
ACACTGAGCG CTTCTAGGGA CTTC                                24
(2)SEQ ID NO:54的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:54:
TGAGCGCTTC TAGGGACTTC TTCA                                24
(2)SEQ ID NO:55的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:55:
CCCTGCCCTA CCCACTTG                                       18
(2)SEQ ID NO:56的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:56:
AGGCCCAGGA CCAGATGA                                       18
(2)SEQ ID NO:57的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:57:
GCACCTGTCA GGCAAGGCTT AAAC                                24
(2)SEQ ID NO:58的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:58:
CCAGCCATGA AGTGGCTGTG AG                                  22
(2)SEQ ID NO:59的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:59:
CCCGCTTCAA AGTTCCCAGT TC                                  22
(2)SEQ ID NO:60的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:60:
CCTCCCATTT CAGCCTCCTG A                                   21
(2)SEQ ID NO:61的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:61:
GTCTGCCACA GTGCTGGAAA CTAA                                24
(2)SEQ ID NO:62的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:62:
GCACCCCAGC CTAAGGCAAT A                                   21
(2)SEQ ID NO:63的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:63:
GCATGGCGGA AGAAACAA                                       18
(2)SEQ ID NO:64的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:64:
TGGCAACAGA GCGAGACTC                                      19
(2)SEQ ID NO:65的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:65:
CCTGGGTGAC AGCGAGAATC T                                   21
(2)SEQ ID NO:66的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:66:
TGTCCCTTGC CTTGTCTCAC TAAA                                24
(2)SEQ ID NO:67的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:67:
CAGCCTTGGT GACAGAGCAA A                                   21
(2)SEQ ID NO:68的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:68:
TGTGTTGAGG GTGGGGTACA T                                   21
(2)SEQ ID NO:69的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:69:
CCTGGGCAAG AGAGCAAG                                       18
(2)SEQ ID NO:70的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:70:
CACATCCCAA AACCACCCTA C                                   21
(2)SEQ ID NO:71的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:71:
GCATTTCCCC TGCTTGTACT                                     20
(2)SEQ ID NO:72的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:72:
GATCACATTT GCTAACCACT TCTC                                24
(2)SEQ ID NO:73的信息:
(i)序列特征:
(A)长度:26
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:73:
GGCAACATAT CAAGACCCCC ATCTCT                              26
(2)SEQ ID NO:74的信息:
(i)序列特征:
(A)长度:26
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:74:
GAAGCTGCCC CTCACCACTA CATTTT                              26
(2)SEQ ID NO:75的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:75:
GATCACATTT GCTAACCACT TCTC                                24
(2)SEQ ID NO:76的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:76:
TATAAATTAC CCAGTCTCAG GAAG                                24
(2)SEQ ID NO:77的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:77:
GTGATACAGC AAGCCTCATC                                     20
(2)SEQ ID NO:78的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:78:
AGAGACTCCT GGAAAGATAA AAGT                                24
(2)SEQ ID NO:79的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:79:
GTCTGGAGAA CAGTGGCCCT TGT                                 23
(2)SEQ ID NO:80的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:80:
CAGGAAGCTG AGGCAGGAGA ATCT                                24
(2)SEQ ID NO:81的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:81:
AAGGCTCCAG TGGGGTAT                                       18
(2)SEQ ID NO:82的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:82:
AAAACAAGGC AGTAGTCAAT AAAG                                24
(2)SEQ ID NO:83的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:83:
GGCATGAGAA TCGCTTGAAC CTG                                 23
(2)SEQ ID NO:84的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:84:
GGCCTCCATG ATGTTTCCAA TGAT                                24
(2)SEQ ID NO:85的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:85:
TCAGGAGGCA TGAGAATCGC TTGA                                24
(2)SEQ ID NO:86的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:86:
GGCCTCCATG ATGTTTCCCA ATGA                                24
(2)SEQ ID NO:87的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:87:
CTCGCCCTCT CCTATAAGCA GTTT                                24
(2)SEQ ID NO:88的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:88:
GCAGAGATAA TTTGGAGTGG GATG                                24
(2)SEQ ID NO:89的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:89:
CTTGGGTGCC TGTAATCC                                       18
(2)SEQ ID NO:90的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:90:
GGTAGAGCTC CCCCATCT                                       18
(2)SEQ ID NO:91的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:91:
GCAGAATATT GGGGCTCATC AC                                  22
(2)SEQID NO:92的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:92:
AAACAAGGAA AGGAGAGGAG AGGA                                24
(2)SEQ ID NO:93的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:93:
AAGGTTGTGG GATGACTACT ACA                                 23
(2)SEQ ID NO:94的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:94:
TGGTCAACAC AGCAAGACAT T                                   21
(2)SEQ ID NO:95的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:95:
TCCTGCCACC TGCTTGCTTT CT                                  22
(2)SEQ ID NO:96的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:96:
ATTGCACTCC AGCCTGGGTGA TAC                                23
(2)SEQ ID NO:97的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:97:
CGCTTGAGCC TTGGAGATTG                                     20
(2)SEQ ID NO:98的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:98:
GAGCAGTCAG AATTCAGGAG TTGT                                24
(2)SEQ ID NO:99的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:99:
TGGGCAACAA GAGCAAAACT CCAT                                24
(2)SEQ ID NO:100的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:100:
GGGACTTGGG CTGAGGGCTT TAC                                 23
(2)SEQ ID NO:101的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:101:
ATATCAATAT CAGGCAGCCA CAGG                                24
(2)SEQ ID NO:102的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:102:
CCGTTTCAGA GCAGAGGTTT AGC                                 23
(2)SEQ ID NO:103的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:103:
TCTCATTGGT TTCAAAGAAC TTA                                 23
(2)SEQ ID NO:104的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:104:
AGACTCCATC TCAAACAAAA GA                                  23
(2)SEQ ID NO:105的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:105:
TCATGTGCAT GGAGCCTGGT TCAT                                24
(2)SEQ ID NO:106的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:106:
CCCAGCCTTG GCAAGAGTGA GGT                                 23
(2)SEQ ID NO:107的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:107:
GGCGACTGAG CAAGACTC                                       18
(2)SEQ ID NO:108的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:108:
TTAAGCAAAG TAGCCTCAAA CA                                  22
(2)SEQ ID NO:109的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:109:
GGGCGACTGA GCAAGACTC                                      19
(2)SEQ ID NO:110的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:110:
ACTCATTACC TTGCATGCAT GATA                                24
(2)SEQ ID NO:111的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:111:
CATTACCTTG CATGCATGAT A                                   21
(2)SEQ ID NO:112的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:112:
TGGGCAACAG AGTAAGACTC A                                   21
(2)SEQ ID NO:113的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:113:
GTTCAGTACC GTTCACCTCT TTA                                 23
(2)SEQ ID NO:114的信息:
(i)序列特征:
(A)长度:30
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:114:
GTAAGACTCA GTCTCCAAAA AAAAAAAAAG                          30
(2)SEQ ID NO:115的信息:
(i)序列特征:
(A)长度:38
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:115:
AGGAATGGTT TCTCTGTTAG TAAATGGT                            38
(2)SEQ ID NO:116的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:116:
CAGCCTGGGC AACAAGAATG AAAC                                24
(2)SEQ ID NO:117的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:117:
TGGCCCCTGC AGCGGAGTC                                      19
(2)SEQ ID NO:118的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:118:
GAATTCATTT GCGGAAAGAT T                                   21
(2)SEQ ID NO:119的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:119:
CTAGGGAGGC TGGAGTATTC A                                   21
(2)SEQ ID NO:120的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:120:
AGAGCAAGAC CCCGTCTCAT                                     20
(2)SEQ ID NO:121的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:121:
AGTCCATGGG CCTTTTAACA                                     20
(2)SEQ ID NO:122的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(ii)分子类型:寡核苷酸ssDNA
(iii)假设:否
(iv)立即来源:
(B)扩增的克隆:S125
(xi)序列描述:SEQ ID NO:122:
GAGAATCACT TGAACCCAGG AAG                                 23
(2)SEQ ID NO:123的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:123:
AGAACCAGCT GTTAGTTTCG TTGA                                24
(2)SEQ ID NO:124的信息:
(i)序列特征:
(A)长度:25
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:124:
GGTTGCAGTG AGCCGAGATA AGAGT                               25
(2)SEQ ID NO:125的信息:
(i)序列特征:
(A)长度:25
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:125:
TGTGCCAGGA ACCAGAAATT TACAG                               25
(2)SEQ ID NO:126的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:126:
GGCCCAAGGT TACTTTTCAC                                     20
(2)SEQ ID NO:127的信息:
(i)序列特征:
(A)长度:16
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:127:
GGGCCACTGC ACTCCT                                         16
(2)SEQ ID NO:128的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:128:
CATGGTGAGG CTGAAGTAGG AT                                  22
(2)SEQ ID NO:129的信息:
(i)序列特征:
(A)长度:25
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:129:
GTGGCGTGTC TTTTTACTTT CTTTA                               25
(2)SEQ ID NO:130的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:130:
AGGCAGCCCA GGAACAAT                                       18
(2)SEQ ID NO:131的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:131:
CCAAGATAGC GGCCAAGATA GT                                  22
(2)SEQ ID NO:132的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:132:
GAGGGCAGCT GGGATGTTAC TCTT                                24
(2)SEQ ID NO:133的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:133:
TGCCCTGTTT GGAGAACTGT AGGT                                24
(2)SEQ ID NO:134的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:134:
CTCCCCAGAA ACAGATGTA                                      19
(2)SEQ ID NO:135的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:135:
GTGAGCCGAG ATTGTATCAT                                     20
(2)SEQ ID NO:136的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:136:
TCGGGGACAG GGCTTACTC                                      19
(2)SEQ ID NO:137的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:137:
ATCATTGTCG CTGCTACTTT ATCG                                24
(2)SEQ ID NO:138的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:138:
CTACTCTACC CCATTTCATT C                                   21
(2)SEQ ID NO:139的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:139:
GTAGAGTGGAG TGGATGAGA                                     19
(2)SEQ ID NO:140的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:140:
ATCAGGCAAA AACGAACAAA C                                   21
(2)SEQ ID NO:141的信息:
(i)序列特征:
(A)长度:17
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:141:
CGGCATCCCA AAGTGAC                                        17
(2)SEQ ID NO:142的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:142:
CAGAGAGGGCA GCACCTTGGA CAG                                23
(2)SEQ ID NO:143的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:143:
GGCTTCACCT GCTCCCGTTT CAG                                 23
(2)SEQ ID NO:144的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:144:
TCTGCCCATT CCCCAGCCTC TC                                  22
(2)SEQ ID NO:145的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:145:
TACCGCGTGG CATTCAAGCA TAGC                                24
(2)SEQ ID NO:146的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:146:
TCCAGTCTGG GTGACAAA                                       18
(2)SEQ ID NO:147的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:147:
CAATCCACTC CACTCCTCTA                                     20

Claims (9)

1.检测具有低平均伪带假象百分率的靶中度串联重复DNA序列的方法,包括以下步骤:
(a)含有至少一个靶中度串联重复序列的DNA样品,其中靶中度串联重复序列是含至少一个重复单位的DNA的区域,该重复单位由至少串联重复2次的5,6或7碱基对的序列组成;
(b)将所述样品与包含下述序列的寡核苷酸引物对接触,所述序列与侧接含有中度串联重复序列的DNA的区域的序列互补,在其中含有中度串联重复序列的DNA区域被扩增的条件下;
(c)检测DNA样品中的靶中度串联重复序列,其中观测到平均伪带假象不超过2.4%;
其中靶中度串联重复序列包含于一种DNA标记内,所述DNA标记包含选自如下一组的一个序列:SEQ ID NO:2,SEQ ID NO:8,SEQ ID NO:19,和SEQ ID NO:34。
2.一种检测DNA样品中至少一个靶中度串联重复序列的方法,其中靶中度串联重复序列是含至少一个重复单位的DNA样品的一区域,该重复单位由至少串联重复2次的5,6或7碱基对的序列组成,此方法包括以下步骤:
(a)提供至少一个寡核苷酸引物,该引物包括与DNA标记的含有模板中度串联重复序列的区域的侧翼序列互补的核苷酸序列,其中DNA标记具有选自如下一组的序列:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42和SEQ ID NO:43;
(b)提供一含有靶中度串联重复序列的DNA样品;
(c)用所述的至少一个寡核苷酸引物扩增DNA样品的靶中度重复序列;和
(d)检测扩增的靶中度串联重复序列中的多态性。
3.权利要求2的方法,其中步骤(b)中提供的DNA样品是人基因组DNA样品。
4.权利要求2的方法,其中靶中度串联重复序列是完全中度串联重复。
5.权利要求2的方法,其中靶中度串联重复序列是不完全中度串联重复。
6.权利要求2的方法,其中步骤(a)中提供的寡核苷酸引物包括选自如下一组的序列:
SEQ ID NO:44和SEQ ID NO:45,当DNA标记序列是SEQ IDNO:1时;
SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,当DNA标记序列是SEQ ID NO:2时;
SEQ ID NO:59,SEQ ID NO:60,当DNA标记序列是SEQ IDNO:3时;
SEQ ID NO:61,SEQ ID NO:62,当DNA标记序列是SEQ IDNO:4时;
SEQ ID NO:63,SEQ ID NO:64,当DNA标记序列是SEQ IDNO:5时;
SEQ ID NO:65,SEQ ID NO:66,当DNA标记序列是SEQ IDNO:6时;
SEQ ID NO:67,SEQ ID NO:68,当DNA标记序列是SEQ IDNO:7时;
SEQ ID NO:69,SEQ ID NO:70,当DNA标记序列是SEQ IDNO:8时;
SEQ ID NO:71,SEQ ID NO:72,当DNA标记序列是SEQ IDNO:9时;
SEQ ID NO:73,SEQ ID NO:74,当DNA标记序列是SEQ IDNO:10时;
SEQ ID NO:75,SEQ ID NO:76,当DNA标记序列是SEQ IDNO:11时;
SEQ ID NO:77,SEQ ID NO:78,当DNA标记序列是SEQ IDNO:12时;
SEQ ID NO:79,SEQ ID NO:80,当DNA标记序列是SEQ IDNO:13时;
SEQ ID NO:81,SEQ ID NO:82,当DNA标记序列是SEQ IDNO:14时;
SEQ ID NO:83,SEQ ID NO:84,当DNA标记序列是SEQ IDNO:15时;
SEQ ID NO:85,SEQ ID NO:86,当DNA标记序列是SEQ IDNO:16时;
SEQ ID NO:87,SEQ ID NO:88,当DNA标记序列是SEQ IDNO:17时;
SEQ ID NO:89,SEQ ID NO:90,当DNA标记序列是SEQ IDNO:18时;
SEQ ID NO:91,SEQ ID NO:92,SEQ ID NO:93,SEQ ID NO:94,当DNA标记序列是SEQ ID NO:19时;
SEQ ID NO:95,SEQ ID NO:96,当DNA标记序列是SEQ IDNO:20时;
SEQ ID NO:97,SEQ ID NO:98,当DNA标记序列是SEQ IDNO:21时;
SEQ ID NO:99,SEQ ID NO:100,当DNA标记序列是SEQ IDNO:22时;
SEQ ID NO:101,SEQ ID NO:102,当DNA标记序列是SEQ IDNO:23时;
SEQ ID NO:103,SEQ ID NO:104,当DNA标记序列是SEQ IDNO:24时;
SEQ ID NO:105,SEQ ID NO:106,当DNA标记序列是SEQ IDNO:25时;
SEQ ID NO:107,SEQ ID NO:108,SEQ ID NO:109,SEQ IDNO:110,SEQ ID NO:111,当DNA标记序列是SEQ ID NO:26时;
SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ IDNO:115,当DNA标记序列是SEQ ID NO:27时;
SEQ ID NO:116,SEQ ID NO:117,当DNA标记序列是SEQ IDNO:28时;
SEQ ID NO:124,SEQ ID NO:125,当DNA标记序列是SEQ IDNO:32时;
SEQ ID NO:126,SEQ ID NO:127,当DNA标记序列是SEQ IDNO:33时;
SEQ ID NO:128,SEQ ID NO:129,当DNA标记序列是SEQ IDNO:34时;
SEQ ID NO:132,SEQ ID NO:133,当DNA标记序列是SEQ IDNO:36时;
SEQ ID NO:134,SEQ ID NO:135,当DNA标记序列是SEQ IDNO:37时;
SEQ ID NO:136,SEQ ID NO:137,当DNA标记序列是SEQ IDNO:38时;
SEQ ID NO:138,SEQ ID NO:139,当DNA标记序列是SEQ IDNO:39时;
SEQ ID NO:140,SEQ ID NO:141,当DNA标记序列是SEQ IDNO:40时;
SEQ ID NO:142,SEQ ID NO:143,当DNA标记序列是SEQ IDNO:41时;
SEQ ID NO:144,SEQ ID NO:145,当DNA标记序列是SEQ IDNO:42时;
SEQ ID NO:146,SEQ ID NO:147,当DNA标记序列是SEQ IDNO:43时。
7.一种检测DNA样品中至少一个靶中度串联重复序列的试剂盒,其中靶中度串联重复序列是DNA样品的一区域,其含有至少一个由至少串联重复2次的5,6或7碱基对的序列组成的重复单位,该试剂盒包括:
一种容器,其具有至少一个用于扩增所述至少一个靶中度串联重复序列的寡核苷酸引物,其中寡核苷酸引物包括与双链DNA标记的含有模板中度串联重复序列的区域的侧翼序列互补的核苷酸序列,该模板中度串联重复序列包括至少串联重复2次的重复单位,其中DNA标记具有选自如下一组的序列:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42和SEQ ID NO:43。
8.一种寡核苷酸引物,其包括互补于双链DNA标记的一条链的位于模板中度串联重复序列的侧翼的序列,其中该模板中度串联重复序列是双链DNA标记的含有至少一个由至少串联重复2次的5、6或7碱基对序列组成的重复单位的区域,其中双链DNA标记序列选自如下一组:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26和SEQ ID NO:27。
9.权利要求8的寡核苷酸引物,其中该寡核苷酸引物包括选自如下一组的序列:
SEQ ID NO:44和SEQ ID NO:45,当DNA标记序列是SEQ IDO:1时;
SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,当DNA标记序列是SEQ ID NO:2时;
SEQ ID NO:59,SEQ ID NO:60,当DNA标记序列是SEQ IDNO:3时;
SEQ ID NO:61,SEQ ID NO:62,当DNA标记序列是SEQ IDNO:4时;
SEQ ID NO:63,SEQ ID NO:64,当DNA标记序列是SEQ IDNO:5时;
SEQ ID NO:65,SEQ ID NO:66,当DNA标记序列是SEQ IDNO:6时;
SEQ ID NO:67,SEQ ID NO:68,当DNA标记序列是SEQ IDNO:7时;
SEQ ID NO:69,SEQ ID NO:70,当DNA标记序列是SEQ IDNO:8时;
SEQ ID NO:71,SEQ ID NO:72,当DNA标记序列是SEQ IDNO:9时;
SEQ ID NO:73,SEQ ID NO:74,当DNA标记序列是SEQ IDNO:10时;
SEQ ID NO:75,SEQ ID NO:76,当DNA标记序列是SEQ IDNO:11时;
SEQ ID NO:77,SEQ ID NO:78,当DNA标记序列是SEQ IDNO:12时;
SEQ ID NO:79,SEQ ID NO:80,当DNA标记序列是SEQ IDNO:13时;
SEQ ID NO:81,SEQ ID NO:82,当DNA标记序列是SEQ IDNO:14时;
SEQ ID NO:83,SEQ ID NO:84,当DNA标记序列是SEQ IDNO:15时;
SEQ ID NO:85,SEQ ID NO:86,当DNA标记序列是SEQ IDNO:16时;
SEQ ID NO:87,SEQ ID NO:88,当DNA标记序列是SEQ IDNO:17时;
SEQ ID NO:89,SEQ ID NO:90,当DNA标记序列是SEQ IDNO:18时;
SEQ ID NO:91,SEQ ID NO:92,SEQ ID NO:93,SEQ ID NO:94,当DNA标记序列是SEQ ID NO:19时;
SEQ ID NO:95,SEQ ID NO:96,当DNA标记序列是SEQ IDNO:20时;
SEQ ID NO:97,SEQ ID NO:98,当DNA标记序列是SEQ IDNO:21时;
SEQ ID NO:99,SEQ ID NO:100,当DNA标记序列是SEQ IDNO:22时;
SEQ ID NO:101,SEQ ID NO:102,当DNA标记序列是SEQ IDNO:23时;
SEQ ID NO:103,SEQ ID NO:104,当DNA标记序列是SEQ IDNO:24时;
SEQ ID NO:105,SEQ ID NO:106,当DNA标记序列是SEQ IDNO:25时;
SEQ ID NO:107,SEQ ID NO:108,SEQ ID NO:109,SEQ IDNO:110,SEQ ID NO:111,当DNA标记序列是SEQ ID NO:26时;
SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ IDNO:115,当DNA标记序列是SEQ ID NO:27时。
CNB998026964A 1998-02-04 1999-02-04 鉴别和分析中度串联重复dna标记的物质和方法 Expired - Lifetime CN100545265C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/018,584 1998-02-04
US09/018,584 US6238863B1 (en) 1998-02-04 1998-02-04 Materials and methods for indentifying and analyzing intermediate tandem repeat DNA markers

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN200910164448A Division CN101857895A (zh) 1998-02-04 1999-02-04 鉴别和分析中度串联重复dna标记的物质和方法

Publications (2)

Publication Number Publication Date
CN1290298A CN1290298A (zh) 2001-04-04
CN100545265C true CN100545265C (zh) 2009-09-30

Family

ID=21788699

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200910164448A Pending CN101857895A (zh) 1998-02-04 1999-02-04 鉴别和分析中度串联重复dna标记的物质和方法
CNB998026964A Expired - Lifetime CN100545265C (zh) 1998-02-04 1999-02-04 鉴别和分析中度串联重复dna标记的物质和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200910164448A Pending CN101857895A (zh) 1998-02-04 1999-02-04 鉴别和分析中度串联重复dna标记的物质和方法

Country Status (11)

Country Link
US (2) US6238863B1 (zh)
EP (3) EP2287308B1 (zh)
JP (3) JP4494630B2 (zh)
KR (1) KR100691195B1 (zh)
CN (2) CN101857895A (zh)
AT (1) ATE486129T1 (zh)
AU (1) AU758639B2 (zh)
CA (1) CA2319111A1 (zh)
DE (1) DE69942891D1 (zh)
ES (2) ES2475416T3 (zh)
WO (1) WO1999040194A1 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6251691B1 (en) 1996-04-25 2001-06-26 Bioarray Solutions, Llc Light-controlled electrokinetic assembly of particles near surfaces
JP2004524801A (ja) * 2000-04-12 2004-08-19 ザ クリーブランド クリニック ファウンデーション Are含有遺伝子の発現を同定および分析するための方法
US6531282B1 (en) * 2000-05-30 2003-03-11 Oligotrail, Llc Multiplex amplification and analysis of selected STR loci
EP1311839B1 (en) 2000-06-21 2006-03-01 Bioarray Solutions Ltd Multianalyte molecular analysis using application-specific random particle arrays
US9709559B2 (en) 2000-06-21 2017-07-18 Bioarray Solutions, Ltd. Multianalyte molecular analysis using application-specific random particle arrays
DE10119468A1 (de) * 2001-04-12 2002-10-24 Epigenomics Ag Mikroarray-Verfahren zur Anreicherung von DNA-Fragmenten aus komplexen Mischungen
US20020172948A1 (en) * 2001-05-04 2002-11-21 Perlin Mark W. Method and system for nucleic acid sequencing
US7262063B2 (en) 2001-06-21 2007-08-28 Bio Array Solutions, Ltd. Directed assembly of functional heterostructures
US20040002073A1 (en) 2001-10-15 2004-01-01 Li Alice Xiang Multiplexed analysis of polymorphic loci by concurrent interrogation and enzyme-mediated detection
US20080138800A1 (en) * 2001-10-15 2008-06-12 Alice Xiang Li Multiplexed analysis of polymorphic loci by concurrent interrogation and enzyme-mediated detection
BR0309154A (pt) * 2002-04-08 2005-01-25 Pig Improvement Co Uk Ltd Sistema para rastrear produtos animais
US7157228B2 (en) * 2002-09-09 2007-01-02 Bioarray Solutions Ltd. Genetic analysis and authentication
US7526114B2 (en) 2002-11-15 2009-04-28 Bioarray Solutions Ltd. Analysis, secure access to, and transmission of array images
AU2003902299A0 (en) * 2003-05-13 2003-05-29 Flinders Medical Centre A method of analysing a marker nucleic acid molecule
US7927796B2 (en) 2003-09-18 2011-04-19 Bioarray Solutions, Ltd. Number coding for identification of subtypes of coded types of solid phase carriers
WO2005031305A2 (en) 2003-09-22 2005-04-07 Bioarray Solutions, Ltd. Surface immobilized polyelectrolyte with multiple functional groups capable of covalently bonding to biomolecules
US7563569B2 (en) 2003-10-28 2009-07-21 Michael Seul Optimization of gene expression analysis using immobilized capture probes
JP2007509629A (ja) 2003-10-29 2007-04-19 バイオアレイ ソリューションズ リミテッド 二本鎖dnaの切断による複合核酸分析
US7848889B2 (en) 2004-08-02 2010-12-07 Bioarray Solutions, Ltd. Automated analysis of multiplexed probe-target interaction patterns: pattern matching and allele identification
US7867703B2 (en) * 2004-08-26 2011-01-11 Agilent Technologies, Inc. Element defined sequence complexity reduction
US8486629B2 (en) 2005-06-01 2013-07-16 Bioarray Solutions, Ltd. Creation of functionalized microparticle libraries by oligonucleotide ligation or elongation
US7772390B1 (en) 2006-07-18 2010-08-10 The Regents Of The University Of California Lipid mediated nucleic acid synthesis
US8163480B2 (en) * 2006-10-05 2012-04-24 Quest Diagnostics Investments Incorporated Nucleic acid size detection method
US20090004662A1 (en) 2007-06-18 2009-01-01 Applera Corporation Method and compositions for nucleic acid amplification
WO2009012984A1 (en) 2007-07-26 2009-01-29 Roche Diagnostics Gmbh Target preparation for parallel sequencing of complex genomes
JP5770085B2 (ja) * 2008-06-30 2015-08-26 ライフ テクノロジーズ コーポレーション 粗製核酸サンプルからの直接増幅のための方法
US20120183953A1 (en) * 2011-01-14 2012-07-19 Opgen, Inc. Genome assembly
WO2016044233A1 (en) * 2014-09-18 2016-03-24 Illumina, Inc. Methods and systems for analyzing nucleic acid sequencing data
CN104408331A (zh) * 2014-11-10 2015-03-11 南京工程学院 鉴别dna基因序列中编码区域与非编码区域的系统
JP6728657B2 (ja) * 2015-12-04 2020-07-22 東洋紡株式会社 核酸増幅法
WO2021092216A1 (en) * 2019-11-05 2021-05-14 Florida State University Research Foundation, Inc. Evaluating genomic variation using repetitive nucleic acid sequences

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IS1355B6 (is) 1984-11-12 1989-04-19 Lister Institute Of Preventive Medicine Fjölkjarna kannar
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
GB8606719D0 (en) 1986-03-19 1986-04-23 Lister Preventive Med Genetic probes
AU637768B2 (en) 1988-02-18 1993-06-10 University Of Utah, The Genetic identification employing dna probes of variable number tandem repeat loci
US4963663A (en) 1988-12-23 1990-10-16 University Of Utah Genetic identification employing DNA probes of variable number tandem repeat loci
DE3834636A1 (de) 1988-10-11 1990-04-19 Max Planck Gesellschaft Verfahren zur analyse von laengenpolymorphismen in dna-bereichen
US5075217A (en) 1989-04-21 1991-12-24 Marshfield Clinic Length polymorphisms in (dC-dA)n ·(dG-dT)n sequences
US5582979A (en) 1989-04-21 1996-12-10 Marshfield Clinic Length polymorphisms in (dC-dA)n.(dG-dT)n sequences and method of using the same
US5364759B2 (en) 1991-01-31 1999-07-20 Baylor College Medicine Dna typing with short tandem repeat polymorphisms and identification of polymorphic short tandem repeats
US5686272A (en) 1992-05-29 1997-11-11 Abbott Laboratories Amplification of RNA sequences using the ligase chain reaction
GB9326052D0 (en) * 1993-12-21 1994-02-23 Zeneca Ltd Sequences
US5599666A (en) 1994-03-28 1997-02-04 Promega Corporation Allelic ladders for short tandem repeat loci
US6479235B1 (en) * 1994-09-30 2002-11-12 Promega Corporation Multiplex amplification of short tandem repeat loci
US5843660A (en) * 1994-09-30 1998-12-01 Promega Corporation Multiplex amplification of short tandem repeat loci

Also Published As

Publication number Publication date
EP1058727A4 (en) 2003-03-26
AU2656599A (en) 1999-08-23
EP1058727B1 (en) 2010-10-27
EP2287308B1 (en) 2014-04-09
ES2475416T3 (es) 2014-07-10
JP2013143965A (ja) 2013-07-25
JP2002502606A (ja) 2002-01-29
CA2319111A1 (en) 1999-08-12
US6767703B2 (en) 2004-07-27
KR100691195B1 (ko) 2007-03-08
EP1058727A1 (en) 2000-12-13
KR20010040624A (ko) 2001-05-15
EP2287307B1 (en) 2014-04-09
ATE486129T1 (de) 2010-11-15
EP2287307A3 (en) 2011-06-29
JP2009254388A (ja) 2009-11-05
EP2287307A2 (en) 2011-02-23
EP2287308A3 (en) 2011-06-29
CN101857895A (zh) 2010-10-13
WO1999040194A1 (en) 1999-08-12
US20020012924A1 (en) 2002-01-31
EP2287308A2 (en) 2011-02-23
JP5898829B2 (ja) 2016-04-06
CN1290298A (zh) 2001-04-04
US6238863B1 (en) 2001-05-29
DE69942891D1 (de) 2010-12-09
ES2476266T3 (es) 2014-07-14
JP4494630B2 (ja) 2010-06-30
AU758639B2 (en) 2003-03-27

Similar Documents

Publication Publication Date Title
CN100545265C (zh) 鉴别和分析中度串联重复dna标记的物质和方法
EP0915991B1 (en) Nucleic acid amplification method based on ramification-extension (ram) and in vitro transcription
US8772464B2 (en) Aptamer regulated nucleic acids and uses thereof
GB2424886A (en) Polynucleotide primers against epidermal growth factor receptor and method of detecting gene mutations
TW400386B (en) Primers for the detection of HIV-1
JP2003144176A (ja) 遺伝子多型の検出方法
KR20120083868A (ko) 실시간 중합효소 연쇄반응을 이용한 표적 유전자의 단일 염기 다형성 판별 방법 및 이를 이용한 표적 유전자의 단일 염기 다형성 판별 키트
WO2005123961A9 (en) Approaches to identifying mutations associated with hereditary nonpolyposis colorectal cancer
AU682226B2 (en) Use of antisense oligomers in a process for controlling contamination in nucleic acid amplification reactions
WO2003066827A2 (en) Methods and compositions for detecting differences between nucleic acids
CN101864423A (zh) 决定仔猪F4ac腹泻易感/抗性的MUC13基因及其应用
WO2022244104A1 (ja) 等温遺伝子増幅方法、遺伝子検出方法、ウイルスの検出方法及びそれらに使用するキット
CN114220483B (zh) 用于微卫星稳定性状态检测的标志物、应用、方法及装置
KR102217158B1 (ko) 미세생쥐 바이러스 검출을 위한 프라이머 및 TaqMan 프로브 세트 및 이를 이용한 미세생쥐 바이러스 검출 방법
WO2002034937A2 (en) Methods for detection of differences in nucleic acids
CN117396499A (zh) 用神经源性位点Notch同源蛋白3(NOTCH3)剂治疗脑血管疾病
KR20050020116A (ko) 티지에프베타3 유전자 돌연변이를 이용한 구순구개열 질환의 진단방법
CN113667744A (zh) 一种用于罗库溴铵代谢标志物的基因多态性检测试剂盒及其检测方法和应用
JP2002522047A (ja) 限界まで非弁別的なハイブリダイゼーションを調節する方法及び組成
CN1970759A (zh) 人类肝脏相关基因
CN1970567A (zh) 一类人类肝脏相关基因

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20090930