CN1680594A - 使用核酸阵列分析甲基化状态 - Google Patents

使用核酸阵列分析甲基化状态 Download PDF

Info

Publication number
CN1680594A
CN1680594A CNA2005100095587A CN200510009558A CN1680594A CN 1680594 A CN1680594 A CN 1680594A CN A2005100095587 A CNA2005100095587 A CN A2005100095587A CN 200510009558 A CN200510009558 A CN 200510009558A CN 1680594 A CN1680594 A CN 1680594A
Authority
CN
China
Prior art keywords
sample
fragment
probe
methylated
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005100095587A
Other languages
English (en)
Inventor
罗伯特·J·利普舒茨
史蒂芬·P.A.·福多尔
希瓦尼·诺蒂亚尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Affymetrix Inc
Original Assignee
Affymetrix Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Affymetrix Inc filed Critical Affymetrix Inc
Publication of CN1680594A publication Critical patent/CN1680594A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]

Abstract

本方面公开了扩增核酸样品同时保留胞嘧啶的甲基化状态的方法。在某些方面,扩增的甲基化样品被甲基化敏感的修饰方法所修饰,并且通过与阵列杂交来分析,从而鉴定在起始材料中被甲基化的胞嘧啶和在起始材料中没有被甲基化的胞嘧啶。本发明还公开了检测甲基化状态的方法。在一个实施方案中,在扩增反应中引入DNA甲基转移酶活性,这种活性使用甲基化的基因组模板链作为指导,对新合成的DNA进行甲基化。

Description

使用核酸阵列分析甲基化状态
相关申请
本申请要求2004年2月13日提交的美国临时申请No.60/544,844和2004年12月3日提交的美国临时申请No.60/633,062的优先权。上述申请的全部公开内容在此以其全文引为参考。
发明领域
本发明涉及扩增样品以保存后生信息的方法以及使用核酸阵列检测甲基化的方法。
发明背景
高等真核生物的基因组含有修饰的核苷5-甲基胞嘧啶(5-meC)。该修饰通常作为二核苷酸CpG的一部分。将胞嘧啶转化为5-甲基胞嘧啶的反应包括将完整双螺旋中的靶胞嘧啶翻转出来,然后通过甲基转移酶从S-腺苷甲硫氨酸中转移甲基基团(Klimasauskas等,Cell76:357-369,1994)。这个酶促转化反应是已知的脊椎动物中存在的唯一后生的DNA修饰,对于正常的胚胎发育是必要的(Bird,Cell 70:5-8,1992;Laird和Jaenisch,Human Mol.Genet.3:1487-1495,1994;以及Li等,Cell 69:915-926,1992)。
CpG二核苷酸在人类基因组中的出现频率仅仅是统计预期频率的大约20%,这可能是因为5-甲基胞嘧啶到胸腺嘧啶的自发脱氨基作用(Schoreret等,Proc.Natl.Acad Sci.USA 89:957-961,1992)。CpG以大约是预期的频率水平出现的区域被称为“CpG岛”(Bird,A.P.(1986)Nature 321,209-213)。这些区域占脊椎动物基因组的大约1%,占总的CpG二核苷酸数量的大约15%。CpG岛的长度一般在0.2到1kb之间,并位于许多看家基因和组织特异性基因的上游。CpG岛通常位于被转录区域的上游,但是也可能延伸到被转录区域内。大约2-4%的位于鸟嘌呤5’端的胞嘧啶是甲基化的。
DNA甲基化是基因表达的后生决定因素。CpG甲基化的模式是可遗传和组织特异性的,并与基因表达相关。DNA甲基化也与其它的细胞过程相关,这些过程包括染色质结构、基因组印记、雌性中体细胞X染色体的失活和DNA复制的定时。当基因高度甲基化时,它被表达的可能性降低,这可能是因为CpG甲基化阻止了转录因子识别它们的同源结合位点。与甲基化DNA结合的蛋白也可以召集组蛋白脱乙酰酶以缩合临近的染色质。一般来说,无转录活性的基因含有5-甲基胞嘧啶,而有转录活性的基因不含5-甲基胞嘧啶。因此,鉴别基因组中含有5-甲基胞嘧啶的位点,对于理解在正常发育和疾病例如癌症的过程中,基因表达的细胞类型特异性程序以及基因表达图如何改变都是非常重要的。CpG岛中DNA甲基化模式的精确作图,对于理解多种多样的生物过程,例如印记基因的调控,X染色体的失活,以及在人类癌症中由甲基化增加而引起的肿瘤抑制基因的沉默,已经变得非常重要了。
胞嘧啶的甲基化可以降低基因的表达,这可以通过例如破坏局部的染色质结构,抑制转录因子与DNA的结合,或者通过召集能够与甲基化序列发生特异性相互作用并阻止转录因子结合的蛋白来进行。甲基化模式的改变已显示与癌症相关。肿瘤抑制基因启动子中的CpG寡聚核苷酸的甲基化可以导致它们的失活。正常甲基化过程的改变也已显示与基因组不稳定性有关(Lengauer等Proc.Natl.Acad.Sci.USA94:2545-2550,1997)。这种异常的后生性改变可以在许多类型的癌症中发现,并能用作致癌转化的潜在标记。
在本公开中引用的所有文件,即出版物和专利申请,包括上述引用文件,在此为所有的目的以其全文引为参考,其程度如同每个单独的文件被特定和分别地指明在此以其全文引为参考。
发明概述
本发明的一个方面公开了一种扩增基因组DNA的方法,它拷贝了胞嘧啶的甲基化。甲基化的基因组DNA样品被获得后,使用酶法延伸与DNA杂交的引物来扩增,引物可以是随机序列,也可以是位点特异性的。引物与甲基化的DNA杂交,并使用DNA聚合酶进行延伸,从而产生半甲基化的杂交体,它包括新合成的未甲基化的cDNA链和甲基化的模板链。然后可以用DNA甲基转移酶在存在甲基供体的情况下对半甲基化的杂交体进行处理。DNA甲基转移酶可以对双链DNA中的半甲基化位点进行甲基化,产生甲基化的杂交体,它包括新的甲基化的cDNA和甲基化的模板链。甲基化的杂交体可以被变性,然后如上述再次扩增。获得的产物是扩增的甲基化的样品。扩增的甲基化的样品可以被直接分析以检测甲基化的和未甲基化的胞嘧啶。
DNA聚合酶可以是热稳定的聚合酶或链置换聚合酶,例如phi29。在有些方面,DNA甲基转移酶活性包括Dnmt 1酶,其可以是例如人类或小鼠的Dnmt 1,并且可以从生物来源纯化,也可以是重组蛋白或融合蛋白。Dnmt 1活性可以是人类或小鼠的Dnmt 1的变体形式,与天然酶相比增加了对半甲基化DNA的特异性。在优选情况下,甲基供体是S-腺苷甲硫氨酸。
在一个方面,按照上述方法扩增的DNA可以用甲基化特异的限制性酶处理以检测选定的胞嘧啶的甲基化情况。扩增的甲基化的DNA可以用第一种限制性酶片段化,然后可以给片段连接上接头。与接头连接的片段的等分试样可以平行地采用对甲基化具有不同敏感性的同裂酶进行片段化,例如一种酶对甲基化敏感而另一种酶对甲基化不敏感,或者一种酶是甲基化依赖性的而另一种酶是甲基化不敏感的或甲基化敏感的。在与接头连接的片段被片段化后,片段可以用接头序列的引物进行扩增。在接头之间被切开的片段将不能被扩增。扩增的片段可以被标记,并与检测是否存在不同片段的阵列杂交。可以对杂交模式进行分析以确定哪个片段被扩增了以及哪个片段被切开了从而没有被有效地扩增。扩增可以使用任何引物介导的延伸方法,例如PCR或MDA。
在一个方面,按照上述方法扩增DNA样品,然后使用一种将扩增样品中未甲基化的胞嘧啶转化为尿嘧啶但是对甲基化的胞嘧啶不进行修饰的方法来分析胞嘧啶的甲基化。接着通过测定产物在目的位置处的序列来确定特定胞嘧啶的甲基化。如果它仍然是胞嘧啶,它就被甲基化了,而如果它现在是尿嘧啶,它就没有被甲基化。转化的方法包括化学和酶学的方法,或二者的组合。检测可以通过与探针阵列的杂交。探针可以被设计以查询选定的胞嘧啶。
在有些方面,使用了针对5-甲基胞嘧啶的抗体或针对与5-甲基胞嘧啶选择性结合的蛋白的抗体。样品中的甲基化DNA可以通过免疫学的方法富集,例如用针对5-甲基胞嘧啶的抗体或与5-甲基胞嘧啶结合的蛋白和针对该蛋白的抗体进行免疫沉淀。
在一个方面,探针阵列包括针对预计的片段的探针。生物体的基因组可以通过计算机模拟(in silico)消化进行分析以预测限制性片段的大小和序列,并鉴定具有CpG的片段。在阵列上可以包括针对目的片段的探针。在设计阵列时也可以把扩增方法考虑在内。例如,接头介导的PCR扩增一般来说对大约200到2000碱基对的片段扩增最为有效,所以在这个大小范围内的片段可以作为探针的靶。依赖于被比较的酶的组合可以确定片段中的甲基化。例如,如果在已经用甲基化依赖性的酶消化的样品中存在含有相应限制性位点的片段,该片段极可能没有被甲基化。HpaII和MspI是一对对甲基化具有不同敏感性的同裂酶的例子,而McrBC是一种甲基化依赖性的酶。
在一个方面,公开了按照本发明的方法设计的阵列。阵列可以在固相支持物上已知的或可确定的位置处存在超过1,000,000、2,000,000或5,000,000个不同的探针。阵列中的探针可以被设计用来检测在按照本发明的方法扩增和处理后,在样品中预计会存在的片段。
按照本发明的方法扩增的基因组样品可以被分析,以确定样品中一个或多个CpG位点的甲基化状态。可以使用的方法包括亚硫酸氢钠处理,然后检测没有被处理所修饰仍然保留为C/G碱基对的甲基化的位点,以及未被甲基化但被处理所修饰从而导致引入了A/T碱基对的位点。C/G或A/T碱基对的存在可以通过与探针阵列的杂交来检测,该阵列的探针与带有或不带有由亚硫酸氢钠处理引入的变化的含CpG的区域完全互补。A/T或C/G的检测以类似于SNP的等位基因特异性杂交检测的方式进行。
在另一方面,本方面公开了一种通过用甲基化依赖性的核酸内切酶将样品片段化从而减少复杂性的方法。样品用其切割不依赖于甲基化的限制性酶进行片段化,然后给片段连接上接头。连接了接头的片段再用甲基化依赖性的酶进行消化,对甲基化依赖性的核酸内切酶的消化具有抗性的那部分片段被扩增。扩增的片段可以与阵列杂交以产生表明了该样品甲基化状态的特征的杂交图。来自血液、组织和肿瘤的样品可以被分析以产生杂交图。这样产生的杂交图可以与从已知样品同样产生的杂交图进行比较。通过对杂交图的比较可以对未知样品进行分类。
发明详述
a)总则
本发明有许多优选实施方案,在细节方面正如本领域的专业人员所知依赖于许多专利、申请或其它参考文献。因此,当在下文中引用或重复专利、申请或其它参考文献时,应该理解它为所有的目的以及被重新引用的命题而以其全部引为参考。
除非上下文中有清楚的说明,用于本申请中的单数形式“一个”,“一种”和“该”包括了复数的指称。例如术语“一种试剂”包括多种试剂,还包括其混合物。
个体不限于人,也可以是其它的生物体,包括但不限于哺乳动物、植物、细菌或来自上述任何生物体的细胞。
贯穿本申请,本发明的各个方面以范围的形式加以陈述。应该理解以范围的形式进行的描述仅仅是为了方便和简便,不应该被解释为对发明范围的硬性限制。因此,范围的描述应该被视为特异性地公开了所有可能的子范围,以及范围内所有单个数值。例如,对范围的描述,从1到6应该被视为特异性地公开了子范围,例如从1到3、从1到4、从1到5、从2到4、从2到6、从3到6等,以及该范围内单个数值,例如1、2、3、4、5和6。不论范围有多宽都是这样。
除非特别地说明,本发明的实施都可以使用本领域技术范围内的有机化学、聚合物技术、分子生物学(包括重组技术)、细胞生物学、生物化学和免疫学常规技术和描述。这样的常规技术包括聚合物阵列合成、杂交、连接和使用标记物检测杂交。适当技术的特别的说明可以参考下面的事实例。但是,其它等同的常规步骤当然也可以使用。这些常规的技术和描述可以在标准的实验室手册中发现,例如GenomeAnalysis:A Laboratory Manual Series(Vols.I-IV)(基因组分析:实验室手册丛书,第1-4卷),Using Antibodies:A Laboratory Manual(使用抗体:实验室手册),Cells:A Laboratory Manual(细胞:实验室手册),PCR Primer:A Laboratory Manual(PCR引物:实验室手册)以及Molecular Cloning:A Laboratory Manual(分子克隆实验指南)(都来自冷泉港实验室出版社),Stryer,L.(1995)主编Biochemistry(4th Ed.)(生物化学,第4版)Freeman,New York,Gait,″OligonucleotideSynthesis:A Practical Approach″(寡聚核苷酸合成:实用方法)1984,IRL Press,London,Nelson and Cox(2000),Lehninger,Principles ofBiochemistry 3rd Ed.(生物化学原理,第3版),W.H.Freeman Pub.,NewYork,NY以及Berg等(2002)Biochemistry,5th Ed.(生物化学,第5版),W.H.Freeman Pub.,New York,NY,所有这些在此为所有目的以其全文引为参考。
本发明可以使用固相基底,包括在一些优选实施方案中的阵列。可用于聚合物(包括蛋白)阵列合成的方法和技术已经在下列专利中描述了,包括美国系列号09/536,841、WO 00/58516、美国专利Nos.5,143,854、5,242,974、5,252,743、5,324,633、5,384,261、5,405,783、5,424,186、5,451,683、5,482,867、5,491,074、5,527,681、5,550,215、5,571,639、5,578,832、5,593,839、5,599,695、5,624,711、5,631,734、5,795,716、5,831,070、5,837,832、5,856,101、5,858,659、5,936,324、5,968,740、5,974,164、5,981,185、5,981,956、6,025,601、6,033,860、6,040,193、6,090,555、6,136,269、6,269,846和6,428,752,以及PCT申请号PCT/US99/00730(国际公布号WO 99/36760)和PCT/US01/04285(国际公布号WO 01/58593),在此为所有目的以其全文引为参考。
在特定的实施方案中描述合成技术的专利包括美国专利Nos.5,412,087、6,147,205、6,262,216、6,310,189、5,889,165和5,959,098。在许多上述专利中也描述了核酸阵列,但是同样的技术也可用于多肽阵列。
用于本发明的核酸阵列包括那些可以从Affymetrix公司(SantaClara,CA)购买到的商标名为GeneChip的产品。示例的阵列显示在affymetrix.com的网点上。
本发明也考虑了结合到固相基底上的聚合物的许多应用。这些应用包括基因表达监控、分布、文库筛选、基因分型和诊断。基因表达监控和分布的方法示于美国专利Nos.5,800,992、6,013,449、6,020,135、6,033,860、6,040,138、6,177,248和6,309,822中。基因分型及其应用示于美国系列号10/442,021、10/013,598(美国专利申请公布号20030036069),以及美国专利Nos.5,856,092、6,300,063、5,858,659、6,284,460、6,361,947、6,368,799和6,333,179中。其它的应用体现在美国专利Nos.5,871,928、5,902,723、6,045,996、5,541,061和6,197,506中。
本发明也考虑了某些优选实施方案中的样品制备方法。在基因分型之前或同时,基因组样品可以通过多种机制进行扩增,其中有些使用了PCR。参见例如PCR Technology:Principles and Applications forDNA Amplification(PCR技术:DNA扩增的原理和应用)(H.A.Erlich主编,Freeman Press,NY,NY,1992)、PCR Protocols:A Guide to Methodsand Applications(PCR方案:方法和应用指南)(Innis等主编,AcademicPress,San Diego,CA,1990)、Mattila等,Nucleic Acids Res.19,4967(1991)、Eckert等,PCR Methods and Applications 1,17(1991)、PCR(McPherson等主编,IRL Press,Oxford)和美国专利Nos.4,683,202、4,683,195、4,800,159、4,965,188和5,333,675,在此每一个为所有的目的以其全文引为参考。样品可以在阵列上扩增。参见例如美国专利No.6,300,070和美国系列号No.09/513,300,在此引为参考。
其它适当的扩增方法包括连接酶链反应(LCR)(例如Wu和Wallace,Genomics 4,560(1989),Landegren等,Science 241,1077(1988)和Barringer等Gene 89:117(1990))、转录扩增(Kwoh等,Proc.Natl.Acad.Sci.USA 86,1173(1989)和WO88/10315)、自持序列复制(Guatelli等,Proc.Nat.Acad.Sci.USA,87,1874(1990)和WO90/06995)、靶多核苷酸序列的选择性扩增)(美国专利No.6,410,276)、共有序列引发的聚合酶链反应(CP-PCR)(美国专利No.4,437,975)、随意引发的聚合酶链反应(AP-PCR)(美国专利Nos.5,413,909、5,861,245)以及基于核酸的序列扩增(NABSA)(参见美国专利Nos.5,409,818、5,554,517和6,063,603,每一个在此引为参考)。其它可以使用的扩增方法在美国专利Nos.5,242,794、5,494,810、4,988,617和美国系列号No.09/854,317中有描述,每一个在此引为参考。
其它的样品制备方法和减少核酸样品复杂性的技术描述在Dong等,Genome Research 11,1418(2001)、美国专利No.6,361,947、6,391,592和6,107,023、以及美国系列号09/916,135、09/920,491(美国专利申请公布20030096235)、09/910,292(美国专利申请公布20030082543)和10/013,598中。
进行多核苷酸杂交分析的方法在本领域已经很成熟。杂交分析的步骤和条件依赖于具体的应用而变化,并按照公知的通用结合方法来选择,包括在下面文献中提到的方法:Maniatis等Molecular Cloning:ALaboratory Manual(分子克隆实验指南,第2版)(2nd Ed.Cold SpringHarbor,N.Y,1989);Berger和Kimmel Methods in Enzymology,Vol.152,Guide to Molecular Cloning Techniques(分子克隆技术指南)(AcademicPress,Inc.,San Diego,CA,1987);Young和Davism,P.N.A.S,80:1194(1983)。实施重复和可控的杂交反应的方法和装置已经在美国专利Nos.5,871,928、5,874,219、6,045,996和6,386,749、6,391,623中有描述,在此将每一个引为参考。
本发明也考虑到在某些优选实施方案中配体间的杂交信号检测。参见美国专利Nos.5,143,854、5,578,832、5,631,734、5,834,758、5,936,324、5,981,956、6,025,601、6,141,096、6,185,030、6,201,639、6,218,803和6,225,625、美国系列号10/389,194和PCT申请PCT/US99/06097(公布号WO99/47964),在此为所有的目的以其全文引为参考。
信号检测和强度数据处理的方法和装置公开在例如美国专利Nos.5,143,854、5,547,839、5,578,832、5,631,734、5,800,992、5,834,758、5,856,092、5,902,723、5,936,324、5,981,956、6,025,601、6,090,555、6,141,096、6,185,030、6,201,639、6,218,803和6,225,625、美国系列号10/389,194、60/493,495和PCT申请PCT/US99/06097(公布号WO99/47964)中,在此为所有的目的以其全文引为参考。仪器和软件也可以从多种来源购买到,包括Affymetrix。
本发明的实施也可以使用常规的生物学方法、软件和系统。本发明的计算机软件产品一般包括计算机可读介质,其中带有用于执行本发明方法的逻辑步骤的计算机可执行指令。适当的计算机可读介质包括软盘、CD-ROM/DVD/DVD-ROM、硬盘驱动器、闪存、ROM/RAM、磁带等。计算机可执行指令可以用适当的计算机语言或几种语言的组合来撰写。基本的计算生物学方法描述在例如Setubal和Meidanis等,Introduction to Computational Biology Methods(计算生物学方法导论)(PWS Publishing Company,Boston,1997);Salzberg、Searles、Kasif主编,Computational Methods in Molecular Biology(分子生物学中的计算方法)(Elsevier,Amsterdam,1998);Rashidi和Buehler,BioinformaticsBasics:Application in Biological Science and Medicine(生物信息学基础:在生物科学和医学中的应用)(CRC Press,London,2000)以及Ouelette和Bzevanis Bioinformatics:A Practical Guide for Analysis ofGene and Proteins(生物信息学:基因和蛋白分析实用指南)(Wiley&Sons,Inc.,第2版,2001)中。参见美国专利No.6,420,108。
本发明也可以将各种计算机程序产品和软件应用于各种目的,例如探针设计、数据管理、分析和仪器操作。参见美国专利Nos.5,593,839、5,795,716、5,733,729、5,974,164、6,066,454、6,090,555、6,185,561、6,188,783、6,223,127、6,229,911和6,308,170。
此外,本发明在一些优选实施方案中包括了通过网络例如英特网提供遗传信息的方法,如同在美国系列号10/197,621、10/063,559(美国公布号20020183936)、10/065,856、10/065,868、10/328,818、10/328,872、10/423,403和60/482,389中显示的那样。
b)定义
“接头序列”或“接头”一般是长度为至少5、10或15个碱基的寡核苷酸,在优选情况下长度不超过50或60个碱基,但是它们可以更长,长达100或200个碱基。接头序列可以使用任何本领域专业人员所熟知的方法进行合成。出于本发明的目的,作为选择,它们可以含有引物结合位点、核酸内切酶识别位点、常见序列和启动子。接头可以是完全或基本上双链的或完全单链的。双链接头可以包含两个至少部分互补的寡核苷酸。接头在一条或两条链上可以是磷酸化或未磷酸化的。
接头如果含有基本上是双链的区域以及与限制性酶消化产生的单链区互补的短的单链区域,则与片段的连接将更有效。例如,当DNA用限制性酶EcoR I消化时,产生的双链片段在每端都带有突出的5’-AATT-3’单链,带有突出的5’-AATT-3’单链的接头将与片段通过突出区域之间的互补性而杂交。接头与片段的这种“粘性末端”杂交可以利于接头与片段的连接,但是平末端的连接也是可能的。使用Klenow片段的核酸外切酶活性可以将平末端转化为粘性末端。例如,当DNA用PvuII消化时,通过片段与Klenow在存在dTTP和dCTP的情况下保温,平末端可以被转化为带有两个碱基对的突出。通过在突出上进行填充或去除突出,突出也可以被转化为平末端。
连接的方法为本领域的专业人员所熟知,在例如Sambrook等(2001)的文献和New England BioLabs的目录中有描述,它们在此为所有的目的引为参考。方法包括使用T4 DNA连接酶,它催化在具有平末端或粘性末端的双链DNA或RNA中毗连的5’磷酸和3’羟基末端之间形成磷酸二酯键;Taq DNA连接酶,它催化两个相邻的与互补的靶DNA杂交的寡核苷酸中毗连的5’磷酸和3’羟基末端之间形成磷酸二酯键;大肠杆菌(E.Coli)DNA连接酶,它催化在含有粘着末端的双链DNA中毗连的5’磷酸和3’羟基末端之间形成磷酸二酯键;以及T4 RNA连接酶,它通过形成3’5’磷酸二酯键催化5’-磷酰基末端的核酸供体与3’-羟基末端的核酸受体的连接,底物包括单链RNA和DNA以及二核苷焦磷酸;或者本领域描述的其它任何方法。片段化的DNA在将接头连接到一个或两个末端之前,可以用一种或多种酶,例如核酸内切酶,进行处理,以产生与连接相容的末端而方便连接。
接头也可以掺有能够修饰接头序列性质的修饰的核苷酸。例如硫代磷酸酯基团可以被引入接头的一条链中。硫代磷酸酯基团是一种修饰的磷酸基团,其中有一个氧原子被硫原子所取代。在硫代磷酸酯化的寡聚物(通常称为“S-Oligo”)中,一些或所有的核苷酸间的磷酸基团被硫代磷酸酯基团取代。S-Oligo的修饰的骨架对大多数核酸外切酶和核酸内切酶的作用具有抗性。硫代磷酸酯可以被引入接头链的所有残基之间,也可以引入到序列内的特定位置处。有用的选择是仅仅硫化寡聚物每端的最后几个残基。这样产生的寡聚物对核酸外切酶具有抗性,但是具有天然的DNA中心。
此处所用的术语“阵列”是指有意产生的分子的集合体,这些分子是通过合成或生物合成制备的。阵列中的分子彼此之间可以是相同的,也可以是不同的。阵列可以采取各种格式,例如可溶性分子的文库、束缚在树脂珠、硅芯片或其它固相支持物上的化合物的文库。
此处所用的术语“阵列板”是指具有多个阵列并形成区域或空间的物体,在所述阵列中每个微阵列被物理障碍分隔开来,以阻挡液体的流动,而所述区域或空间称为孔,能够包含与探针阵列接触的液体。
此处所用的术语“生物单体”是指生物聚合物的单个单位,它可以与相同的或其它的生物单体连接形成生物聚合物(例如,带有两个连接基团的单个氨基酸或核苷酸,连接基团中的一个或两个可以具有可去除的保护基团),或是指不是生物聚合物的一部分的单个单位。因此,例如在寡核苷酸生物聚合物中核苷酸是生物单体,而在蛋白或肽生物聚合物中氨基酸是生物单体;例如亲和素、生物素、抗体、抗体片段等也是生物单体。
此处所用的术语“生物聚合物”是指生物或化学部分的重复单位。代表性的生物聚合物包括但不限于核酸、寡核苷酸、氨基酸、蛋白、肽、激素、寡糖、脂类、糖脂、脂多糖、磷脂、上述生物聚合物的合成类似物,包括但不限于反向核苷酸、肽核酸、Meta-DNA,以及上述物质的组合。
此处所用的术语“组合合成策略”指一种组合性合成策略,是通过顺序加入试剂平行地合成多种聚合物序列的有序策略,它可以用反应物矩阵和转换矩阵来代表,其积是产物矩阵。反应物矩阵是待加入积木的l列m行的矩阵。转换矩阵是成列排列的l和m之间的二元数字的全部或其子集,优选情况下是有序的。“二元策略”是指这样的策略,其中至少两个相连的步骤照亮了基底上目的区域的一部分,通常是一半。在二元合成策略中,从有序的反应物组能够形成的所有可能的化合物都形成了。在最优选实施方案中,二元合成是指也把以前的加入步骤作为因素考虑在内的合成策略。例如,在一个策略中,掩蔽策略的转换矩阵将以前照亮的区域分为两半,照亮大约一半以前照亮的区域,保护剩下的一半(同时也保护大约一半以前保护的区域并照亮大约一半以前保护的区域)。应该认识到二元循环中可以散布有非二元循环,只有一部分基底可以经受二元方案。组合的“掩蔽”策略是合成策略,它使用光或其它空间选择性去保护或激活试剂来除去物质上的保护基团,以便添加其它的物质例如氨基酸。
此处所用的术语“互补性”是指核苷酸或核酸之间的杂交或碱基配对,例如在双链DNA分子的两条链之间或在寡核苷酸引物和被测序或扩增的单链核酸上的引物结合位点之间。互补的核苷酸一般是A和T(或A和U)或C和G。两个单链RNA或DNA分子,当其中一条链的核苷酸通过最适化比对和比较,并进行适当的核苷酸插入或缺失,与另一条链的核苷酸有至少80%配对,通常至少约90%到95%,更优选情况下从大约98到100%配对时,它们被说成是互补的。此外,当RNA或DNA链在选择性杂交条件下与其互补链杂交时,互补性也存在。一般来说,当在一段至少14-25个核苷酸的跨度上存在至少大约65%的互补性,优选至少大约75%,更优选至少大约90%互补性时,选择性杂交可以发生。参见M.Kanehisa,Nucleic Acids Res.12:203(1984),在此引为参考。
此处所用的术语“后生的”是指除了基因组的一级序列之外影响生物体的发育或功能的因素,它们可以不改变生物体的基因型而影响其表型。后生的因素包括对由DNA甲基化和染色质结构中可遗传但潜在可逆的变化所控制的基因表达进行修饰。已知甲基化模式与基因表达相关,并且一般而言,高度甲基化的序列表达很差。
此处所用的术语“基因组”是生物体的染色体中所有的遗传物质。来自特定生物体染色体中的遗传物质的DNA是基因组DNA。基因组文库是从代表生物体完整基因组的一套随机产生的重叠DNA片段中制成的克隆的集合。
此处所用的术语“杂交”是指两个单链多核苷酸非共价地结合形成稳定的双链多核苷酸的过程;三链的杂交在理论上也是可能的。产生的(通常)双链多核苷酸是“杂交体”。杂交通常在严谨条件下进行,例如在盐浓度不超过大约1M和温度至少25C的情况下。例如,对于等位基因特异的探针杂交来说,5X SSPE(750mM NaCl,50mM磷酸钠,5mM EDTA,pH7.4)和温度20C-30的条件是适当的,或者是100mM MES,1M[Na+],20mM EDTA,0.01%Tween-20和温度30-50℃,优选为大约45-50℃的条件。杂交可以在存在试剂例如大约0.1mg/ml鲱鱼精子DNA、大约0.5mg/ml乙酰化BSA的情况下进行。因为其它的因素包括互补链的碱基组成和长度、有机溶剂的存在和碱基误配的程度可以影响杂交的严谨性,参数的组合比单独任何一个参数的绝对值更为重要。适合于微阵列的杂交条件描述在Gene ExpressionTechnical Manual(基因表达技术手册)2004和GeneChip Mapping AssayManual(基因芯片作图分析手册)2004中,可以从Affymetrix.com获得。
此处所用的术语“杂交探针”是指能够以碱基特异性方式与互补的核酸链结合的寡核苷酸。这样的探针包括肽核酸,如在Nielsen等,Science 254,1497-1500(1991)中所描述,LNAs,如在Koshkin等,Tetrahedron 54:3607-3630,1998和美国专利No.6,268,490中所描述,以及其它的核酸类似物和核酸模拟物。
此处所用的术语“分离的核酸”是指目的核酸在存在的核酸中居主导地位(即在摩尔基础上它比组合物中任何其它单独核酸种类更丰富)。在优选情况下,分离的核酸占存在的所有大分子物质的至少大约50、80或90%(在摩尔基础上)。在更优选情况下,目的核酸种类被纯化为基本上均一(通过常规的检测方法不能在组合物中检测到污染物质)。
此处所用的术语“标记物”是指荧光标记物、光散射标记物或放射性标记物。其中,荧光标记物包括可以购买到的亚磷酰胺荧光素,例如Fluoreprime(Pharmacia)、Fluoredite(Millipore)和FAM(ABI)。参见美国专利6,287,778。
此处所用的术语“配体”是指被特定的受体识别的分子。与受体结合或反应的试剂被称为“配体”,该术语只有根据其对应的受体定义才有意义。除了表明该物质能够与受体结合或相互作用之外,术语“配体”不暗含任何特定的分子大小或其它的结构或组成特点。此外,配体既可以用作与受体结合的天然配体,也可以作为功能类似物用作激动剂或拮抗剂。在本发明中研究的配体的例子包括但不限于细胞膜受体的激动剂或拮抗剂、毒素和毒液、病毒表位、激素(例如阿片剂、类固醇等)、激素受体、肽、酶、酶的底物、底物类似物、过渡态类似物、辅助因子、药物、蛋白和抗体。
此处所用的术语“混合种群”或有时称为“复杂种群”是指任何含有所需和不需核酸的样品。作为非限制的例子,核酸的复杂种群可以是总的基因组DNA、总的基因组RNA或其组合。此外,核酸的复杂种群可以富集了给定的种群但是仍包括其它不需要的种群。例如,核酸的复杂种群可以是富集了所需的信使RNA(mRNA)序列但是仍包括一些不需要的核糖体RNA序列(rRNA)的样品。
此处所用的术语“mRNA”或有时称为“mRNA转录本”包括但不限于mRNA转录本前体、转录本加工中间体、备译的成熟mRNA以及来自mRNA转录本的基因或核酸的转录本。转录本的加工包括剪接、编辑和降解。如本文所用,来自mRNA转录本的核酸是指为其合成,mRNA转录本或其子序列最终用作模板的核酸。因此,从mRNA反转录得到的cDNA、从cDNA转录得到的RNA、从cDNA扩增得到的DNA、从扩增的DNA转录得到的RNA等都是来自于mRNA转录本,对这些衍生产物的检测可以指示样品中原始转录本的存在和/或丰度。因此,mRNA衍生样品包括但不限于基因的mRNA转录本、从mRNA反转录得到的cDNA、从cDNA转录得到的cRNA、从基因扩增得到的DNA、从扩增的DNA转录得到的RNA等。
此处所用的术语“核酸文库”是指有意产生的核酸的集合,可以通过合成或生物合成制备,以各种不同的形式用于生物活性的筛选(例如可溶性分子的文库、束缚在珠、芯片或其它固相支持物上的寡聚物的文库)。此外,术语“阵列”的意思包括了那些可以通过将几乎任何长度的核酸(例如长度从1到大约1000个核苷酸单体)点样在基底上所制备的核酸文库。此处所用的术语“核酸”是指任何长度的核苷酸的聚合形式,核苷酸可以是核糖核苷酸、脱氧核糖核苷酸或肽核酸(PNAs),它们含有嘌呤和嘧啶碱基,或其它天然的、化学或生物化学修饰的、非天然的或衍生的核苷酸碱基。多核苷酸的骨架可以含有在RNA或DNA中通常所能发现的那些糖和磷酸基团,或者修饰的或取代的糖或磷酸基团。多核苷酸可以含有修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。核苷酸的序列可以被非核苷酸的成分所打断。因此术语核苷、核苷酸、脱氧核苷、脱氧核苷酸一般都包括例如此处所描述的那些类似物。这些类似物是哪些与天然存在的核苷或核苷酸具有一些相同结构特点的分子,因此当它们掺入到核酸或寡核苷序列中时,可以在溶液中与天然存在的核酸序列杂交。一般来说,这些类似物是通过对碱基、核糖或磷酸二酯部分进行取代和/或修饰而从天然存在的核苷和核苷酸衍生而来的。这些改变可以被定制以便稳定或去稳定杂交体的形成,或增强与所需的互补核酸序列杂交的特异性。
此处所用的术语“核酸”可以包括任何嘧啶和嘌呤碱基的多聚物或寡聚物,碱基分别优选为胞嘧啶、胸腺嘧啶、尿嘧啶以及腺嘌呤和鸟嘌呤。参见Albert L.Lehninger,PRINCIPLES OF BIOCHEMISTRY(生物化学原理),第793-800页(Worth Pub.1982)。事实上,本发明考虑到了任何脱氧核糖核苷酸、核糖核苷酸或肽核酸成分,以及它们的任何化学变体,例如这些碱基的甲基化、羟甲基化或糖基化形式等。组合物中的多聚体或寡聚体可以是非均质的,也可以是均质的,可以从天然存在的来源分离,也可以人工或合成生产。此外,核酸可以是DNA,也可以是RNA或它们的混合物,并且可以永久或暂时地以单链或双链的形式存在,包括同源双链体、异源双链体和杂交体状态。
此处所用的术语“寡核苷酸”或有时称为“多核苷酸”是指长度范围至少为2、优选至少为8、和更优选至少为20个核苷酸的核酸,或能够与多核苷酸特异性杂交的化合物。本发明的多核苷酸包括可以从天然来源分离、重组生产或人工合成和模拟的脱氧核糖核酸(DNA)或核糖核酸(RNA)的序列。本发明的多核苷酸的另一个例子可以是肽核酸(PNA)。本发明还包括存在非常规的碱基配对的情况,例如Hoogsteen碱基配对,它已经在某些tRNA分子中被识别并推断存在于三螺旋中。在本申请中,“多核苷酸”和“寡核苷酸”可以互换使用。
此处所用的术语“引物”是指单链寡核苷酸,能够在适当的条件例如缓冲液和温度、在存在四种不同的核苷三磷酸以及聚合试剂例如DNA或RNA聚合酶或反转录酶的情况下,充当模板指导的DNA合成的起始点。在任何给定的情况下,引物的长度依赖于例如引物的使用目的,一般来说,范围从15到30个核苷酸。短的引物分子通常需要较低的温度以与模板形成足够稳定的杂交体复合物。引物不必须反映模板的精确序列,但是必须具有足够的互补性以与该模板杂交。引物位点是模板上引物杂交的区域。引物对是一套引物,包括与被扩增序列的5’端杂交的5’上游引物和与被扩增序列的3’端的互补序列杂交的3’端下游引物。
此处所用的术语“探针”是指被固定在表面上的分子,它能够被特定的靶识别。对于由具有10、12和更多个碱基的探针的所有可能的组合所构成的阵列的例子,参见美国专利No.6,582,908。本发明所研究的探针的例子包括但不限于细胞膜受体的激动剂或拮抗剂、毒素和毒液、病毒表位、激素(例如阿片样肽、类固醇等)、激素受体、肽、酶、酶的底物、辅助因子、药物、外源凝集素、糖、寡核苷酸、核酸、寡糖、蛋白和单克隆抗体。
此处所用的术语“受体”是指与给定的配体具有亲和性的分子。受体可以是天然存在的或人造的分子。同样,它们可以以其未改变的状态使用,也可以与其它物质结合使用。受体可以直接地或通过特定的结合物以共价或非共价形式连接到结合部分上。本发明中使用的受体的例子包括但不限于抗体、细胞膜受体、与特定的抗原决定簇(例如位于病毒、细胞或其它物质上)具有反应性的单克隆抗体和抗血清、药物、多核苷酸、核酸、肽、辅助因子、外源凝集素、糖、多糖、细胞、细胞膜和细胞器。受体在本技术领域中有时称为抗配体。在此所用的术语受体并不打算有不同意义。当两个大分子通过分子识别结合形成复合物时就形成了“配体受体对”。本发明中可以使用的其它受体的例子包括但不限于那些在美国专利No.5,143,854中所显示的分子,该专利在此以其全文引为参考。
此处所用的术语“固相支持物”、“支持物”和“基底”可以互换使用,是指一种或一组具有刚性或半刚性表面的材料。在许多实施方案中,固相支持物的至少一个表面应该是基本上平的,尽管在某些实施方案中可能希望用例如孔、升高的区域、针、刻蚀的沟渠等将合成区域进行物理上的分隔用于不同的化合物。按照其它的实施方案,固相支持物将采取珠子、树脂、凝胶、微球的形式或其它的几何构型。示例性的基底参见美国专利No.5,744,305。
此处所用的术语“靶”是指对给定的探针具有亲和性的分子。靶可以是天然存在的或人工制造的分子。同样,它们可以以其未改变的状态使用,也可以与其它物质结合使用。靶可以直接地或通过特定的结合物以共价或非共价方式连接到结合部分上。本发明中使用的靶的例子包括但不限于抗体、细胞膜受体、与特定的抗原决定簇(例如位于病毒、细胞或其它物质上)具有反应性的单克隆抗体和抗血清、药物、寡核苷酸、核酸、肽、辅助因子、外源凝集素、糖、多糖、细胞、细胞膜和细胞器。靶在本技术领域中有时称为抗探针。在此所用的术语靶并不打算有不同意义。当两个大分子通过分子识别结合形成复合物时就形成了一个“探针靶对”。
此处所用的术语“晶片”是指具有可结合多个阵列的表面的基底。在优选实施方案中,阵列在底物的表面上合成,产生了多个在物理上分离的阵列。在晶片的一个优选实施方案中,阵列物理分离的距离为至少大约0.1、0.25、0.5、1或1.5毫米。位于晶片上的阵列可以是相同的,每一个可以是不同的,或可以是它们的组合。特别优选的晶片是大约8”×8”,使用照相平板印刷工艺制造。
个体不仅限于人类,它也可以包括其它的生物体,包括但不限于哺乳动物、植物、真菌、细菌或来源于上述生物体的细胞。
甲基化分析
DNA中胞嘧啶残基的甲基化在基因调控中发挥重要作用。DNA甲基化为正常的胚胎发育所必需,甲基化的变化常常与疾病有关。基因组印记、X染色体失活、染色质修饰和内源的反转录病毒的沉默都依赖于适当的甲基化模式的建立和维持。基因的表达可以被甲基化的模式所调控。甲基化异常是癌细胞的标志,肿瘤抑制基因的沉默被认为是许多人类癌症的因果基础。使用基于微阵列的方法进行甲基化作图可以被用来例如描述癌细胞的大体情况,发现DNA甲基化的模式可以用来例如诊断恶性肿瘤、预测治疗结果或监测疾病的进展。真核生物中的甲基化也可以用来抑制病毒和转座子的活性,参见Jones等,EMBO J.17:6385-6393(1998)。
在优选方面,本发明公开了利用与核酸探针阵列杂交分析基因组样品中胞嘧啶的甲基化状态的方法。在许多方面,方法包括了辨别甲基化和未甲基化胞嘧啶的步骤。这个步骤可以是例如化学或酶法的。例如,在某些方面,含有甲基化胞嘧啶的样品用亚硫酸氢盐处理,它可以选择性地修饰未甲基化的胞嘧啶。在其它方面,使用能够辨别甲基化和未甲基化DNA的酶,例如,DNA可以平行地用同裂酶消化,其中一种酶是甲基化敏感的,而另一种是甲基化不敏感的。
在某些方面,本方面公开了扩增基因组DNA样品同时保留DNA中胞嘧啶甲基化状态的信息的方法。然后,可以分析被扩增样品中一个或多个胞嘧啶的甲基化状态。当与例如亚硫酸氢盐修饰这样的检测方法结合使用时,这种保留甲基化状态的扩增方法可能特别有用,因为亚硫酸氢盐修饰和其它相似的处理可能损坏DNA,结果使得在修饰后扩增DNA的方法可能是无效的。在修饰或处理前扩增样品可以允许直接检测被修饰的样品,而不需要在修饰或处理后扩增样品。此外本方面还公开了检测胞嘧啶甲基化状态的方法。在优选实施方案中,该方法能够同时分析大量的胞嘧啶,例如超过1000、5000、10,000或100,000个胞嘧啶。
许多分析基因组信息的方法在分析前使用扩增步骤,一般来说,这些方法会导致与起始材料的甲基化状态有关的信息的丧失,这是因为起始物质的序列被再生了,但是后生的信息例如甲基化的存在丢失了。在本发明的一个方面,公开了扩增核酸同时保留至少某些后生信息的方法。
扩增可以通过多种方式进行,例如聚合酶链反应(PCR)、滚环扩增(RCA)、多重置换扩增(MDA)、或其它全基因组扩增方法、代表性的基因组扩增或位点特异性扩增。方法可以包括例如用一个或多个限制性核酸内切酶或通过随机的片段化方法将核酸样品片段化,然后连接通用引发位点,这可以通过例如连接接头、或延伸具有通用5’末端和3’端是随机或简并序列的引物来实现。
对许多扩增方法来说,引物与基因组模板杂交,然后被延伸产生cDNA链,它是基因组DNA的拷贝。第一条链cDNA的合成导致在体外合成的cDNA和体内合成的基因组DNA链之间形成杂交体,但是一般来说,新合成的cDNA是没有甲基化的,因为在体内负责维持甲基化状态的系统在体外反应中不存在。在本发明的一个实施方案中,基因组DNA的扩增是在存在能够通过识别亲本模板链上的甲基化并且在新合成的子代链的相应位点处进行甲基化从而保留甲基化的活性的情况下来实现的。
在优选实施方案中,第一链cDNA在与作为模板产生cDNA的基因组DNA链形成复合物时被甲基化。然后,这个现在已经甲基化的第一链cDNA(子代)和模板基因组DNA链(亲本)被分开,并且可以被用作模板合成其它的链,甲基化的子代作为模板和亲本用于随后新合成的子代链。各个随后产生的链都使用其模板(亲本)链作为甲基化的指导来进行甲基化。
哺乳动物的甲基化模式是复杂的,在发育过程中会变化,参见vanSteensel和Henikoff BioTechniques 35:346-357(2003)。甲基化一般发生在胞嘧啶的5’位置,产生5-甲基胞嘧啶(5-meC)。大多数甲基胞嘧啶发现在CpG二核苷酸中。启动子区中的甲基化一般伴随着基因沉默,甲基化的丧失或与甲基化的CpG结合的蛋白的丧失可以导致人类疾病,例如免疫缺陷性颅面综合症和Rett综合症,Bestor(2000)Hum.Mol.Genet.9:2395-2402。
已经进化出在多轮的细胞分裂甚至种系分裂过程中维持甲基化的方法,参见Raykan和Whitelaw(2003)Curr.Biol.13:R6。在动物中,甲基CpG由DNA甲基转移酶1(Dnmt 1)维持。Dnmt 1跟随在复制叉后面,并且使每个CpG中未甲基化的胞嘧啶残基甲基化,所述CpG是与甲基CpG配对的碱基,参见Leonhardt等(1992)Cell 71:865-873。Dnmt 1对半甲基化的位点具有特异性,因此通过连续的细胞分裂循环能够保存甲基化位点。DNA甲基化是基因特异性的,在整个基因组都可以发生。
有两种不同的过程调节甲基化,在DNA复制后维持甲基化和在以前未甲基化的区域重新加上甲基基团。在哺乳动物中,一类甲基转移酶负责对未修饰的DNA进行甲基化,被命名为重新合成的酶。另一类酶在DNA复制过程中维持子代链的甲基化状态,被称为维持性DNA甲基转移酶。两类酶都催化甲基基团从S-腺苷-L-甲硫氨酸(AdoMet)转移到DNA中的胞嘧啶碱基上。维持性甲基化负责为复制和细胞分裂后新合成的DNA中的胞嘧啶加上甲基基团。亲本DNA中的甲基化位点作为模板用来校正在复制后马上识别半甲基化的子代链的维持性甲基转移酶活性所产生的甲基化,参见Riggs,A.D.(1989)Cell Biophys.15:1-13。相反,重新合成的甲基化活性产生新的甲基化模式。DNA甲基转移酶(DNMTs)在许多生物体包括哺乳动物、植物和细菌中发现(Bestor等Curr.Opin.Cell Biol.,6:380-389(1994))。在哺乳动物中,已经鉴定了三种活性DNA甲基转移酶,Dnmt 1、Dnmt3a和Dnmt 3b。Dnmt 2最近也已经被鉴定。Dnmt 3a和Dnmt 3b的功能主要作为重新合成的甲基转移酶,而Dnmt 1负责维持性甲基化。已经显示出Dnmt 1在体外对半甲基化的CpG位点的甲基化具有高度偏好性,参见Pradhan等(1997)Nucl.Acids Res.25:4666-4673和(1999)J.Biol.Chem.274:33002-33010。
Dnmt 1、Dnmt 3a和Dnmt 3b在存在底物DNA和AdoMet辅助因子的情况下体外具有活性。Dnmt 1是哺乳动物细胞中最丰富的DNA甲基转移酶,已经从天然来源纯化。来自几种生物体包括小鼠和人的重组Dnmt 1也已经获得。该酶在体内对半甲基化的底物的活性比对未甲基化的底物的活性高7到20倍。已经显示出Dnmt 1具有几种天然存在的同工型,包括拼接变体形式Dnmt 1b和卵母细胞特异形式Dnmt 1o。对Dnmt 1蛋白的突变分析已经鉴定出羧基末端的催化结构域和含有核定位信号、复制叉靶向肽和锌结合区域的调控结构域。在该蛋白中也已经鉴定出了许多特异蛋白相互作用区域。综述可参见Pradhan和Esteve,Clinical Immunology 109:6-16(2003)。
人类DNA(胞嘧啶-5)甲基转移酶(Dnmt 1)可以从New EnglandBiolabs购买到。该蛋白使用杆状病毒表达系统从人类的cDNA表达。随酶同时提供10x反应缓冲液、BSA和S-腺苷甲硫氨酸(SAM)。推荐的反应条件是1x Dnmt1反应缓冲液(1X是59mM Tris-HCl,1mMDTT,1mM EDTA,5%甘油,pH7.8,25℃),100μg/ml BSA和160μMSAM,在37℃进行反应。1单位的酶定义为在37℃下,30分钟内,在25μl总反应体积中将1pmol甲基基团催化转移到poly dI.dC底物上所需的酶量。针对该酶的抗体也是可用的。
对Dnmt3a的最新研究显示出该酶的催化活性在体外受DMSO的刺激,参见Yokochi和Robertson,Bioorganic Chem.32:234-243(2004)。该研究表明DMSO的刺激效应依赖于DMSO与酶反应底物DNA和AdoMet之间的相互作用,而不是酶本身。在某些方面,DMSO可以包括在Dnmt1反应中。
在本发明的一个方面,获得了含有甲基化胞嘧啶的基因组DNA样品,并且将一个或多个引物与DNA杂交。引物可以是例如一个或多个位点特异引物或一个集合体或随机或部分简并的引物。引物用DNA聚合酶延伸形成双链DNA杂交体。杂交体含有一条模板DNA链和一条新合成的cDNA链。基因组模板链可以含有甲基化位点,而新合成的链可以是未甲基化的。用DNA甲基转移酶活性处理杂交体,该活性识别模板链上的甲基化位点,并在模板链中的甲基化位点处对新合成的链进行甲基化。甲基转移酶和DNA聚合酶活性可以同时或不同时作用。在新合成的链的甲基化完成后,这个新合成的甲基化的链可以用作第二轮扩增和甲基化中的模板链。这个步骤可以重复多次,以产生起始许多拷贝的基因组模板,其中包括甲基化位点。在优选实施方案中,模板甲基化的拷贝在下一轮扩增前完成。在某些实施方案中,在下一轮扩增之前,反应可以用切割半甲基化位点的酶进行处理。
在一个实施方案中,PCR用于扩增,DNA甲基转移酶活性是热稳定性的,并且在连续使双链DNA加热变性的循环过程中将保持活性。在另一个实施方案中,扩增使用链置换酶例如phi29进行(参见例如美国专利Nos.6,617,137和6,323,009),DNA甲基转移酶可以是也可以不是热稳定的。当使用链置换聚合酶时,在优选情况下甲基转移酶活性与聚合酶结合起作用,以便在子代链被随后的子代链取代之前甲基化位点被拷贝到子代链中。在一个方面,扩增是等温的。
扩增后,甲基化状态保留下来的扩增材料可以被分析,以确定一个或多个胞嘧啶的甲基化状态。任何可用来确定甲基化状态的方法都可以使用。对于检测甲基化状态的方法,参见例如美国专利申请No.10/841,027、美国专利Nos.6,214,556、5,786,146、6,017,704、6,265,171、6,200,756、6,251,594、5,912,147、6,331,393、6,605,432和6,300,071,以及美国专利申请公布20030148327、20030148326、20030143606和20030082609。对于一些甲基化检测方法的综述,参见Oakeley,E.J.,Pharmacology&Therapeutics 84:389-400(1999)。可用的方法包括:反相HPLC、薄层层析、掺入标记的甲基基团的SssI甲基转移酶、氯乙醛反应、不同敏感性的限制性酶、肼或高锰酸盐处理(5-甲基胞嘧啶被高锰酸盐处理切割但不被肼处理切割)、亚硫酸氢钠、组合的亚硫酸氢盐-限制性分析以及甲基化敏感的单核苷酸引物延伸。这些方法分别描述在Oakeley(1999)中。对于这些方法中的许多来说,扩增过程中甲基化状态的保留利于下游的分析方法,这些分析方法依赖于对甲基化敏感的处理。许多检测甲基化的方法在甲基化敏感性修饰步骤之后使用扩增步骤,在某些方面,通过在处理前扩增的同时保留甲基化状态,对修饰后样品进行扩增的需要就被消除了。这可以提高扩增和检测的效率。由于在修饰步骤中对DNA的损坏,修饰后的扩增可能是无效的。
在本发明的一个方面,胞嘧啶的甲基化状态通过限制性消化加以分析,使用两种识别同样识别位点但对甲基化具有不同敏感性的限制性酶来进行。这样的酶对的例子是HpaII和MspI。HpaII和MspI是同裂酶,在识别位点CCGG处切割(参见New England Biolab目录,在此以其全文引为参考)。HpaII的切割被中央C的甲基化所阻断,而MspI的切割不依赖于中央C的甲基化。在本发明的一个方面,具有保留的甲基化信息的被扩增样品用HpaII和MspI进行消化,然后可以分析切割产物以确定甲基化状态。如果目的位点是甲基化的,则它将不被HpaII切割但是可以被MspI切割。
在示例性实施方案中,样品首先用限制性酶例如XbaI、HindIII或BgIII片段化,然后将接头连接到片段上。在优选的实施方案中,第一个限制性酶的识别位点不含有CpG。有多种酶可以用于第一次片段化。在连接了接头后,样品被分成组分或等份,然后进行不同的处理,可以通过例如平行地与探针阵列杂交来进行分析。在一个方面,一个组分用Hpa II片段化,而第二个组分用MspI片段化。也可以包括第三个组分,它既不用Hpa II也不用MspI片段化。Hpa II消化的组分可以与MspI消化的组分或未消化的组分或二者同时进行比较。此处所用的Hpa II和MspI是作为示例性的酶,但是任何一对能够识别同样的限制性位点并对甲基化具有不同敏感性的酶都可以使用。
具有CCGG识别位点的片段,如果CpG是未甲基化的,它在HpaII和MspI组分中都将被切割,但是如果CpG是甲基化的,它将在MspI组分但不在Hpa II组分中被切割。切割后样品用一个或多个与接头互补的引物来扩增。在这个扩增步骤中,并不必需维持关于甲基化状态的信息。用MspI或HpaII消化过的连接了接头的片段在PCR反应过程中将不会扩增,这是因为位点没有甲基化。如果片段已经被MspI或HpaII切割了,该片段将不能在PCR反应中被扩增,因为产生的片段只在一端有接头序列和引发位点。仅仅具有甲基化的CCGG位点的片段在HpaII反应中将不被切割,它们在PCR过程中被扩增。在HpaII反应中出现但是不在MspI反应中出现的片段,可以通过将每一个PCR扩增反应的产物与探针阵列杂交来进行鉴定。探针只在HpaII反应中检测到高于背景的杂交,是甲基化片段的指示。
在另一方面,可以使用一种只切割甲基化的DNA但不切割非甲基化的DNA的酶。如上述产生的连接了接头的片段,用只切割甲基化的DNA的甲基化依赖性酶进行消化,未消化的连接了接头的片段用接头序列的引物进行扩增。被甲基化依赖性酶消化的连接了接头的片段不能被扩增,并在随后的检测步骤中不能被检测到。扩增的产物与阵列杂交,获得杂交模式,并与从平行处理的、但没有用甲基依赖性酶消化的样品中获得的杂交模式进行比较。两种模式之间的区别指示样品中的片段被甲基化。甲基依赖性酶包括例如McrBC。
扩增产物可以用任何本领域所熟知的方法进行检测,例如通过与探针阵列杂交。阵列可以含有针对选定区域的探针,也可以含有平铺的代表完整的染色体、完整的基因组、基因组的一个或多个大区域的探针。阵列也可以被设计有针对含有预计或已知的甲基化位点的区域的探针。示例性阵列包括在美国专利申请Nos.10/264,945、09/916,135和60/417,190中所公开的阵列,分别在此引为参考。
在一个方面,计算机被用来模拟第一次限制性酶消化的产物,以预测片段的大小和序列。然后计算机可用来鉴定那些还含有一个或多个甲基化敏感的限制性酶的识别位点的片段。计算机还可以用来鉴定在PCR条件下易于扩增的片段。在许多实施方案中,PCR条件优选扩增有限大小范围的片段,例如200到2,000个碱基对或200到1,000个碱基对。在预期的大小范围内同时也含有甲基化敏感性酶位点的片段被鉴定出来,并且可以对阵列进行设计,使之含有与多个被鉴定的片段互补的探针。
在示例性方面,第一个限制性酶是XbaI,计算机被用来模拟人类基因组被XbaI的消化,以鉴定200到1,000个碱基对之间的XbaI片段。计算机被用来分析被鉴定的片段的序列,从而鉴定出在片段内至少具有一个CCGG位点的片段的子集。阵列中的探针可以被设计用来质询那些满足这两个标准的片段。探针可以针对片段的任何区域,在优选情况下,每个片段用多个不同序列探针进行质询,这些探针与片段的不同、但任选重叠的区域完全互补。在一个方面,来自HpaII消化的片段的杂交模式与MspI消化反应相比。含有CCGG位点但是在HpaII消化后可以被扩增的片段指示该片段中CCGG位点的甲基化。该片段在MspI消化反应中不应该被检测到。在另一方面,HpaII杂交模式被用来与没有进行第二次消化处理的样品的杂交模式进行比较。没有第二次消化时,甲基化和未甲基化的片段都能被扩增,并通过与阵列杂交而被检测,这可以作为扩增的阳性对照。只带有未甲基化的CCGG序列的片段将在HpaII反应中被消化,所以在随后的扩增步骤中将不能被扩增,针对那些片段的探针应该不产生高于背景的信号。没有用第二个消化步骤处理的样品也可以被用来估计甲基化的水平。如果片段仅仅是部分被甲基化,并且存在甲基化和未甲基化片段的混合物,信号的强度可以与未处理样品的信号强度进行比较,以估计甲基化的片段量。
在一个方面,基于第一次片段化反应的预计产物和显示杂交的探针的序列,计算机系统被用来对基因组中的甲基化片段进行定位和作图。此外,计算机还可以被用来鉴定被鉴定片段中的CCGG位点。
在本发明的一个方面,探针阵列包括与含有CpG岛的基因组区域互补的探针。探针可以被设计成与某区域互补,该区域与CpG岛位于同样的限制性片段中,但是可以与不含CpG二核苷酸的区域互补。
在一个实施方案中,扩增的甲基化产物中的甲基化状态可以用亚硫酸氢钠处理方法进行分析。在亚硫酸氢钠修饰过程中未甲基化的胞嘧啶通过三步过程转化为尿嘧啶。这些步骤是将胞嘧啶转化为胞嘧啶磺酸盐的磺化反应,将胞嘧啶磺酸盐转化为尿嘧啶磺酸盐的脱氨基作用,以及将尿嘧啶磺酸盐转化为尿嘧啶的碱性脱磺酸作用。转化不发生在甲基化的胞嘧啶上。参见Clark等Nucleic Acids Res.,22(15):2990-7(1994)。如果胞嘧啶被甲基化了,它将保留为胞嘧啶。如果胞嘧啶未甲基化,它将被转化为尿嘧啶。当修饰的链通过例如位点特异的引物、随机或简并引物或针对接头的引物的延伸进行拷贝时,如果C被甲基化,则在质询位置将掺入G(与质询的C相对),而如果C是未甲基化的,则在质询位点将会掺入A。当双链延伸产物被扩增时,那些被转化为尿嘧啶并导致在延伸的引物中掺入腺嘌呤的胞嘧啶,将在扩增过程中被胸腺嘧啶所代替。那些没有被修饰并导致鸟嘌呤掺入的胞嘧啶,仍会保留成胞嘧啶。
用于DNA亚硫酸氢盐修饰的试剂盒可以商购自,例如HumanGenetic Signatures的Methyleasy和Chemicon的CpGenome修饰试剂盒。也可参见WO04096825A1,它描述了亚硫酸氢盐修饰方法,以及Olek等Nuc.Acids Res.24:5064-6(1994),它公开了在包被于琼脂糖珠中的物质上进行亚硫酸氢盐处理和随后扩增的方法。在一个方面,诸如二亚乙基三胺的催化剂可以与亚硫酸氢盐处理结合使用,参见Komiyama和Oshima,Tetrahedron Letters 35:8185-8188(1994)。二亚乙基三胺已经被显示在pH5时能有效催化亚硫酸氢盐离子诱导的从2’-脱氧胞苷到2’-脱氧尿苷的脱氨基作用。其它的催化剂包括氨、亚乙基二胺、3’,3’-二氨基二丙胺和精胺。在某些方面,脱氨基作用的进行采用3-5M亚硫酸氢钠溶液,在大约50℃保温12-16小时。更快的步骤也已经报道,使用pH5.4的9-10M亚硫酸氢盐,在90℃保温大约10分钟,参见Hayatsu等,Proc.Jpn.Acad.Ser.B 80:189-194(2004)。
亚硫酸氢盐处理允许用多种方法检测胞嘧啶的甲基化状态。例如,任何可以被用来检测SNP的方法都可以使用,例如参见Syvanen,Nature Rev.Gen.2:930-942(2001)。可以使用例如单碱基延伸(SBE)的方法,或与等位基因特异性杂交方法相似的序列特异探针的杂交。
在一个方面,DNA样品用一种或多种限制性酶片段化,在用亚硫酸氢盐处理前与一个或多个接头序列连接。然后,亚硫酸氢盐处理的样品使用与接头互补的引物,可以通过PCR进行扩增。扩增的条件可以被选择以优选扩增选定大小的片段,例如200到2000bp的片段,从而减少样品的复杂性。
在一个方面,接头在亚硫酸氢盐处理后与DNA连接。在优选的方面,T4 RNA连接酶被用于接头的连接。对于PCR引物的添加,引物可以连接到5’末端(优选情况下,引物是末端保护的),然后将片段的3’端脱磷酸化,并且将5’磷酸化的引物连接到3’末端。亚硫酸氢盐处理可以降解DNA,所以在亚硫酸氢盐处理前连接的接头可能通过处理被破坏或切割掉,使得片段不能被扩增。亚硫酸氢盐处理也可以使DNA成单链,因此为了连接接头序列可能必需使用T4 RNA连接酶。亚硫酸氢盐处理也会在DNA中引入误配。将未甲基化的胞嘧啶转化为尿嘧啶,产生了G:U碱基对代替G:C碱基对,从而导致双链DNA的变性。
除了未甲基化的胞嘧啶的脱氨基作用外,亚硫酸氢盐处理可导致DNA的损坏,使得DNA片段化。在某些方面,亚硫酸氢盐处理在pH大约5时需要较长的保温(大约4-16小时)。在这个步骤中,胞嘧啶被磺化,然后发生脱氨。这个步骤也可能有不需要的副反应,导致DNA的部分脱嘌呤。在脱氨后,硫酸基团通过碱处理除去。碱处理可能导致链在发生脱嘌呤的位点断裂。产生的片段连接到接头上,但是可能需要对片段进行化学或酶法的处理以产生适合连接的末端。在某些方面,脱嘌呤位点的碱水解可以产生适合于连接接头的5’磷酸化末端和因为缺少3’羟基而不适合于连接的3’末端。3’末端可以被处理以除去阻碍连接的修饰。在一个方面,片段在连接接头前用AP核酸内切酶处理。在另一方面,接头可以通过两个反应连接到片段上,在第一个反应中将接头连接到可用于连接的末端,然后用例如激酶处理反应液以从3’端除去磷酸,再用于第二个连接反应。在脱嘌呤和链断裂后形成的末端可以根据切割的机制而变化。在某些方面,产生3’磷酸化的核糖,但是在某些方面,产生具有不同末端的混合物,包括具有末端核糖的片段。在优选的方面,对3’末端进行化学或酶法的加工以产生适合于接头连接的末端。
在另一方面,亚硫酸氢盐处理的DNA的扩增可以用随机的引物引发,例如随机六聚体。其它的扩增方法也可以使用,例如恒温链置换扩增、滚环扩增(Lizardi等,Nat.Genet.19:225-232,1998)、多重置换扩增(Dean等,Proc.Natl.Acad.Sci.99:5261-5266,2002)以及那些在美国专利公布Nos.20040209298和20040209299中所描述的方法。亚硫酸氢盐处理会破坏DNA,损坏的DNA很难被扩增。能使被降解的样品,例如那些从福尔马林固定的石蜡包埋的(FFPE)样品中获得的样品扩增的方法,可以被用来扩增亚硫酸氢盐处理的DNA。对于被降解的样品来说,优选的扩增方法包括那些在美国专利公布Nos.20040209298和20040209299、Wang等,Gen.Res.14:2357-2366,2004和Wang等,Nuc.Acids Res.32:e76,2004中所公开的方法。在优选的方面,用于扩增的引物对亚硫酸氢盐转化的DNA有偏好性,因为它们具有减少数量的G/C碱基对。在扩增的第一轮中,未甲基化的胞嘧啶一般已经被转化为尿嘧啶了,所以引物可以是有偏好的,含有较少的或没有鸟嘌呤。
在一个方面,亚硫酸氢盐处理的DNA与针对5-meC的抗体或与5-meC结合蛋白和针对该蛋白的抗体一起保温,然后分离结合了抗体的复合物。从分离的复合物得到的DNA如上所述通过连接接头和PCR扩增可加以扩增。
在另一方面,活化诱导的胞苷脱氨酶(AID)被用来代替亚硫酸氢盐处理。AID可以将未甲基化的胞嘧啶脱氨,而甲基化的CpG基元免受AID介导的脱氨作用,参见Larijani等,Mol Immunol.42(5):599-604(2005)。AID处理的DNA可以采用与亚硫酸氢盐处理的DNA的同样方法来加以分析。AID分析的优点在于,它可以在较短的时间内进行,大约30分钟,而与此相比,典型的亚硫酸氢盐处理需要12个小时以上,此外,它比复杂的亚硫酸氢盐处理所用的步骤少,使用的有毒化学物质也较少。在某些方面,DNA可以用AID处理和亚硫酸氢盐处理相结合的方法来处理。这两种方法的组合可以被用来改进AID处理的效率,缩短亚硫酸氢盐处理的时间,并且减少DNA的降解。
在一个方面,特定的胞嘧啶的甲基化水平可以被定量。杂交模式可以被分析以测量甲基化的水平,杂交的强度与甲基化程度相关。例如,如果特定的胞嘧啶在样品DNA中有80%是甲基化的,则在亚硫酸氢盐处理后C“等位基因”的标准化强度应该是T“等位基因”的标准化强度的约4倍。使用亚硫酸氢盐处理对特定胞嘧啶甲基化水平进行定量的方法已经公开了,例如在Thomassin等,Nuc.Acids Res.32:e168(2004)中。
在优选的方面,产物通过与阵列的杂交进行分析。在一个示例性实施方案中,阵列被设计来检测亚硫酸氢盐处理的产物,其原理与可商购的Affymetrix 10K作图阵列相同。10K阵列对超过11,000个不同的人类SNPs中的每一个具有探针组。每个探针组的第一多个探针与SNP的第一种等位基因完全互补,而第二多个探针与SNP的第二种等位基因完全互补。如果存在第一种等位基因,信号就被第一多个探针检测,而如果存在第二种等位基因,信号就被第二多个探针检测。杂合子则将被两者都检测到。探针组可以包括对照探针,例如错配探针,质询位置相对于探针的中央位置有偏移的探针也可以包括,例如SNP位置可以位于中央位置,也可以偏离探针的中央向5’或3’移动1个或多个位置。对于有疑问的甲基化位点也可以设计类似的探针组,处理该位置,就好象它是带有C/G或T/A等位基因的SNP。两条链都可以被分析。示例的探针和阵列在美国专利申请No.10/681,773和美国专利Nos.5,733,729、6,300,063、6,586,186和6,361,947中有描述。亚硫酸氢盐处理可以修饰片段中任何未甲基化的C,包括引物结合位点中的C和质询位置周围区域中的C。在优选实施方案中,接头的设计应将此考虑在内,例如接头可以设计成在引物结合位点不含有C,引物也可以用对亚硫酸氢盐修饰有抗性的修饰碱基进行合成以致引物结合位点的序列不会被处理所改变,例如可以将C甲基化,或者引物可以被设计成假定接头中的C会变成U。
可以从序列中检测新的SNPs的重新测序阵列也可以用来检测亚硫酸氢盐处理的产物。重新测序阵列和重新测序方法在例如Cutler等Genome Res.2001 Nov;11(11):1913-25和美国专利申请No.20030124539中有描述,在此以其全文引为参考。一般来说,重新测序阵列检测参比序列中所有可能的单核苷酸变异。与参比序列完全互补的探针被包括在内,并且逐个地质询序列中的多个位点以寻找参比序列中的变异。对于每个可能的变异来说,与变体序列完全互补的探针都被包括在内。阵列可以被平铺开以检测一个或多个参比序列中所有可能的单核苷酸变异。被阵列质询的参比序列可以是例如一个或多个完整的染色体、一个或多个完整的基因组、一个或多个线粒体基因组、或者是从一个或多个基因组内选择的目的区域。在一个实施方案中,重新测序阵列被平铺有已知或怀疑被甲基化的区域。在某些实施方案中,CpG位点可能靠在一起,因此阵列的探针可以与重叠的CpG位点互补。例如,如果探针是25个聚体,第13位的质询位置与第一个胞嘧啶位置互补,在第一个胞嘧啶上游12个碱基对或下游12个碱基对的范围内可能存在第二个CpG。第二个胞嘧啶可以是甲基化的也可以是未甲基化的。探针可以被设计来检测两种可能性,即都是甲基化的(都是C)、都是未甲基化的(都是T)、一个是甲基化的(C)另一个是未甲基化的(T)。可以设计与每一种可能的结果完全互补的探针。
在本发明的另一方面,扩增的甲基化的靶相对于未甲基化的靶得到了富集。在一个示例的实施方案中,使用限制性酶将怀疑含有m5C的核酸样品片段化,并将接头与片段连接。针对m5C的抗体被用来分离含有m5C的连接了接头的片段。此外,核酸也可以与能够特异性结合m5C的蛋白一起保温,然后针对那些蛋白的抗体可以被用来分离甲基化的片段。针对5-meC的抗体是可得到的,例如来自Abcam(Cambridge,UK)的ab 1884。使用与接头互补的引物通过PCR将分离的片段进行扩增,扩增的片段可以与探针阵列杂交。在一种优选方面,阵列的探针与基因组的一个或多个区域互补。阵列中示出高于背景的杂交的区域指明了基因组中被甲基化的区域。在优选实施方案中,阵列含有针对基因组的富含CpG的区域、基因内区域或已知或推测是调控区的区域的探针。在另一个实施方案中,被免疫沉淀的片段用亚硫酸氢盐处理,以便可以鉴定甲基化胞嘧啶的精确位置。样品可以通过与上述的序列特异性探针的阵列杂交来进行分析。
在本发明的一个方面,甲基结合蛋白例如MeCP2和SAP18/30(结合Sin3的多肽18/30)与基因组DNA样品混合,用于富集甲基化的序列。针对甲基CpG结合结构域蛋白(MBDs)例如MBD2和MBD3的抗体可以被用来分离含有甲基化的DNA。抗5-meC结合蛋白的抗体是可得到的,例如针对MeCP2(IMG-297)的抗体来自Imgenex Corp.(San Diego,CA)。在另一方面,识别5-meC的抗体可以被用来富集甲基化的序列。在优选情况下在抗体结合前将DNA变性。
在本发明的另一方面,甲基化被用作以相对可再现的方式使基因组分成亚类的手段,以便在进一步分析前减少样品的复杂性。基因组的某些区域稳定地被甲基化,同时其他区域稳定地被未甲基化。区分甲基化和未甲基化DNA的机制可以被用来获得富集了甲基化DNA或未甲基化DNA的样品的组分。通过这种方法样品的复杂性得以减少。如果扩增采用的是保留甲基化信息的方法,则分离可以在扩增之前进行。通常都希望在杂交之前减少含有复杂的核酸混合物的样品的复杂度,以便改善检测的灵敏度,并使背景最小化。
在本发明的一个方面,公开了在分离甲基化和未甲基化组分之后分析核酸样品的方法。被分析的组分可以是甲基化的组分也可以是未甲基化的组分,或者可以进行甲基化的和未甲基化的组分的比较。在许多实施方案中,未甲基化的组分通过例如从未甲基化的DNA中分离出甲基化的DNA,或者通过优先扩增未甲基化的DNA而富集。对富集有亚类起始核酸的组分的分离可以用作减少样品复杂性的方法,或者用作测量甲基化组分和未甲基化组分之间区别的方法。在一个实施方案中,该方法尤其用来分析样品,以鉴定出在未甲基化组分中存在的基因组区域和甲基化组分中存在的基因组区域。在许多实施方案中,分离甲基化和未甲基化核酸的方法与用探针阵列分析核酸的方法相结合。
在一个方面,通过用酶例如Mse I消化DNA样品,接着大小选择来富集CpG岛。Mse I将基因组DNA切成小片段,但是在CpG岛中切割很罕见。较大的富含CpG岛的片段可以通过任何现有的大小分离方法从较小的片段中分离出来。
复杂性减少了的样品代表了更复杂的样品,例如基因组,它们可以用于多种分析方法,包括那些含有杂交步骤的方法。复杂性减少了的样品可以被用于例如测序、基因分型、拷贝数的定量评估、LOH分析和CGH分析。在许多实施方案中,分析是通过将复杂性减少了的样品与探针阵列杂交来进行的。用于表达分析、重新测序和基因分型的阵列可以得自,例如Affymetrix,Inc.,Santa Clara,CA。
从未甲基化的核酸分离甲基化核酸的方法已经有描述,参见例如美国专利公布Nos.20010046669、20030157546和20030180775,在此分别以其全文引为参考。
在植物和哺乳动物基因组中重复序列通常以高的拷贝数存在,具有高水平的胞嘧啶和低的转录活性(参见,例如Martienssen,R.A.(1998)Trends Genet.14:263;Kass,S.U.等(1997)Trends Genet.13:335;SanMiguel,P.等(1996)Science 274:765;Timmermans,M.C.,等(1996)Genetics 143:1771;Martienssen,R.A.和E.J.Richards,(1995)Curr.Opin.Genet.Dev.5:234-242;Bennetzen,J.L.,等(1994)Genome 37:565;White,L.F.,等(1994)Proc.Natl.Acad.Sci.U.S.A.91:11792;Moore,G.等Genomics 15:472)。高拷贝的DNA序列通常是甲基化的,并且一般不出现在表达的基因的区域。从文库或从核酸样品中消除或减少这样的高拷贝甲基化DNA的方法可以被用来富集目的靶序列,产生复杂性被降低的样品,利于进一步分析。通常未甲基化的区域是含有基因的区域,是最希望被分析的区域。
通过将核酸文库,例如可能是部分文库的基因组文库在甲基化限制性宿主,例如大肠杆菌菌株JM101、JM107和JM109中繁殖,可以从核酸样品中富集出未甲基化的序列。这种方法、甲基化过滤最近才被用来对玉米的基因组进行测序,参见Palmer等Science 302:2115-2117(2003)。该方法阻止了带有甲基化插入物的克隆的繁殖,导致与对照文库相比基因富集了5到7倍。
在另一个实施方案中,核酸样品用甲基化敏感的酶,例如只切割未甲基化的DNA或只切割甲基化的DNA的酶,或切割甲基化或未甲基化DNA的甲基化不敏感的酶进行消化。不同消化的样品被扩增,扩增的片段可以被标记,然后使用微阵列进行检测。样品可以平行地用甲基化敏感和甲基化不敏感的酶消化,并在每种处理后分析以确定存在哪些序列。在第一种样品中出现但是在第二种样品中不出现的序列表明该序列是甲基化的。
在一个示例的实施方案中,核酸样品从某来源,例如从个体获得,核酸可以通过例如用一个或多个限制性酶消化而片段化,然后接头序列连接到片段上产生连接了接头的片段。连接了接头的片段可以用切割甲基化DNA但是不切割未甲基化DNA的酶,例如McrBC来进行消化。接着,样品可以用与接头序列杂交的引物进行扩增。那些已经被甲基特异性酶切开的甲基化片段不会被扩增,因为它们只在一端有接头,从而使未甲基化的DNA得到选择性的扩增。
扩增的产物可以通过例如与微阵列杂交来检测。McrBC消化的样品与没有用McrBC消化的平行样品进行比较,以鉴定被甲基化的区域。如果产物平行地与探针阵列杂交,针对样品中被甲基化的区域的探针应在没有用McrBC消化的样品中显示出杂交,但是在用McrBC消化的样品中不显示出杂交。因为片段中甲基化的存在是通过检测是否存在限制性片段来检测的,在设计合适的探针时有相当的灵活性,这将是合适的。例如,被检测的片段一般在200和1,000个碱基对之间,探针可以被靶向到片段的任何区域。探针无需与甲基化的位点互补,但是可以与上游或下游位点互补。探针可以被靶向到片段的一个区域或片段中的多个区域,它们可以被靶向到片段上的特定特征,例如片段中的SNP或片段中的一个或多个CpG。在一个实施方案中,可以使用含有均匀分隔在整个基因组的探针的探针阵列。
在一个示例的实施方案中,扩增的产物被标记,并且与基因分型阵列,例如作图的10K或100K阵列(Affymetrix,Santa Clara)杂交。GeneChip作图阵列(WGSA)可以被用来减少样品的复杂性。基本分析步骤如下:总基因组DNA(250ng)用限制性酶(例如Xba I)消化,与能够识别4个粘着碱基对突出的接头连接。所有的限制性酶消化片段,不论大小,都是接头连接的底物。识别接头序列的通用引物被用来扩增连接了接头的DNA片段。扩增使用了最适于优先扩增选定的大小范围(例如250到2000bp)的片段的PCR条件。对于不同的大小范围,例如200到1,000碱基对,可以选择最适化条件。然后,扩增的DNA被片段化、标记并与作图10K阵列杂交。与由计算机模拟消化所预测的存在于选定大小范围内的片段(例如当基因组用Xba I消化时长度为250到1000bp)中的基因组区域互补的探针被选择出来包含在阵列中。通过这种方法,扩增富集了亚类片段,同亚类的片段可以被重复地富集,阵列被设计用来质询这些片段中的至少一部分。作图10K和100K阵列质询存在于预计的片段上的已知SNPs的基因型,但是在其他实施方案中,阵列可以被设计用来质询片段是否存在。对于关于作图10K阵列和分析的其它信息参见GeneChip人类作图10K阵列和分析试剂盒数据单,零件号码701366 Rev.4,Affymetrix,Inc.,以及作图10K手册。
在一个实施方案中,含有与生物体中的基因互补的探针的阵列可以被用来分析甲基化的或未甲基化的组分。例如,可得自Affymetrix的表达阵列,例如人类基因组U133 Plus 2.0阵列,可以被使用。有多种生物体,包括小鼠和大鼠的表达阵列可以获得,并且对于选择的生物体,其表达阵列也可以被定制。含有针对预测或已知的外显子或剪接连接(内含子-外显子或外显子-外显子剪接点)的探针的阵列也可以使用。
在一个实施方案中,平铺了完整的基因组,一个或多个完整的染色体或完整的基因组的代表或一个或多个完整的染色体的高密度阵列可以被用来分析通过分离甲基化和未甲基化DNA而制备的样品。例如,可以使用这样的阵列,它含有的探针沿着一个或多个染色体或完整基因组分隔在平均每35个碱基对上。参见,例如Kapranov等Science296:916-919(2002)。也可参见美国专利申请Nos.10/741,193、10/736,054、10/714,253和10/712,322。在一个实施方案中,已经被富集了未甲基化的序列的样品可以通过转录因子结合亲和性进行分析。与转录因子结合的序列可以通过与转录因子的亲和而纯化,然后通过阵列分析得以鉴定。通过富集甲基化的序列,用仅切割未甲基化DNA的酶消化,同样可以降低复杂性。
众多甲基依赖的限制性酶对于本领域的专业技术人员来说是众所周知的,可以从例如New England Biolabs商购到。甲基依赖的限制性酶的例子包括McrBC、McrA、MrrA和DpnI。McrBC是核酸内切酶,可以切割在一条或两条链上含有甲基胞嘧啶(例如,5-甲基胞嘧啶或5-羟甲基胞嘧啶或N4-甲基胞嘧啶,在Raleigh,E.A.(1992)Mol.Microbiol.6,1079-1086中有综述)的DNA。McrBC不作用于未甲基化的DNA(Sutherland,E.等(1992)J.Mol.Biol.225,327-334)。McrBC的识别位点是5′...PumC(N40-3000)PumC...3′。被McrBC识别的DNA上的位点由两个(G/A)mC形式的半位点组成。这些半位点可以彼此分开多达3kb,但是最适的分离距离为55-103个碱基对(Stewart,F.J.和Raleigh E.A.(1998)Biol.Chem.379,611-616以及Panne,D.等(1999)J.Mol.Biol.290,49-60.)。McrBC的切割需要GTP,但是在存在非可水解的GTP类似物的情况下,酶将特异性地与甲基化的DNA结合,但不切割(Stewart,F.J.等(2000)J.Mol.Biol.298,611-622)。重组McrBC可以得自例如New England Biolabs。McrBC可以被用来确定CpG二核苷酸的甲基化状态。McrBC作用于一对PumCG序列元件,但是不识别内部的胞嘧啶被甲基化了的Hpa II/Msp I位点(CCGG)。这个非常短的半位点共有序列(PumC)使得存在的大部分甲基胞嘧啶能够被检测到。
在一个实施方案中,用McrBC消化的条件是50mM NaCl,10mMTris-HCl,10mM MgCl2,1mM二硫苏糖醇(25℃,pH7.9),以及100μg/ml BSA和1mM GTP。37℃保温。条件可以改变。NEB定义一个单位为37℃下在50μl总反应体积中,1小时内切割1μg含有单个McrBC位点的质粒所需的酶量。切割基因组DNA时可以使用5-10倍过量的酶。酶可以通过加热至65℃20分钟来失活。McrBC在每一对半位点之间造成一次切割,切割靠近一个半位点或另一个半位点,但是切割位置分布在距离甲基化的碱基大约30个碱基对的几个碱基对中。也参见,Bird,A.P.(1986)Nature 321,209-213和Gowher,H.等(2000)EMBO J.19,6918-6923。
对McrBC的研究或利用在文献中已有报道,例如Gast等BiolChem.378(9):975-82,(1997),Pieper等,Rabinowicz,Methods Mol Biol.236:21-36(2003),Badal等J Virol.77(11):6227-34(2003)以及Chotai和Payne,J Med Genet.35(6):472-5(1998)。也可参见Lyko,F.等Nat.Genet.,23,363-366(2000),其中使用了McrBC作为在果蝇中富集未甲基化的DNA的工具。
在一个方面,基因组DNA通过本领域所熟知的任何方法被分成甲基化的组分和未甲基化的组分。每个组分可以单独与阵列杂交,或者每个组分可以用不同的可检测的标记物,例如不同颜色的荧光染料进行标记(例如,未甲基化的DNA可以用绿色标记,而甲基化的DNA可以用红色标记),然后,将上述两者与同样的探针阵列杂交。参见,例如美国专利No.6,576,424,在此引为参考。如果基因组的区域没有甲基化,那么对应于该基因组区域的特征将以绿色被检测。如果该区域是甲基化的,那么这些特征将以红色被检测。如果红色和绿色都被检测到了,样品中该区域可能已被部分甲基化,红色与绿色的比率可以被用来确定甲基化的程度。
在一个方面,公开的方法被用来获得肿瘤或组织的甲基化特征或分布图。在癌症的诊断、治疗和结果预测方面,甲基化受到特别的关注,参见Jones和Baylin,Nat.Rev.Genet.3:415-428(2002)以及Bird,Genes Dev.16:6-21(2002)。甲基化的模式可能与特定的肿瘤相关。来自特定类型肿瘤的样品可以被分离,并且使用公开的方法进行分析,获得肿瘤类型或肿瘤阶段的甲基化模式特征。在一个实施方案中,来自个体或肿瘤的样品可以与已知类型或阶段的肿瘤的甲基化模式进行比较,以确定未知的样品在甲基化模式上是否与一个或多个已知的肿瘤类型相似。按照这种方法获得的模式可以用来诊断疾病、疾病阶段、监控治疗、预测治疗结果以及监控疾病进展。在许多实施方案中,分析通过直接比较杂交模式进行,而模式与任何特定序列的存在或不存在无关。从被分析的未知样品获得的模式和从已知样品获得的模式之间的不同或相同点可以被用来确定未知样品是否在甲基化模式上可能与已知样品相匹配。
在一个实施方案中,血液样品被分析来检测脱落到血流中的肿瘤细胞的甲基化模式的变化。异常的甲基化或脱甲基化模式是肿瘤类型的特征,可通过血样的分析进行鉴定。在一个示例的实施方案中,样品用第一个限制性酶片段化,并且片段被连接到接头上。然后,连接了接头的片段用甲基化依赖或甲基化敏感的酶消化。不被消化的连接了接头的片段通过PCR使用针对接头的引物进行扩增。PCR扩增的产物与探针的阵列杂交以产生杂交模式。杂交模式可以与来自另一个被同样处理的样品的杂交模式进行比较。杂交模式之间的区别指示两个样品之间甲基化模式的区别。疾病状态、正常状态或组织类型的特征的杂交模式可以产生数据库,并用来比较未知样品的杂交模式,以鉴定出相似的模式。参见,例如美国专利No.6,228,575,它公开了基于比较杂交模式对样品表征的方法。有多种阵列可用于这个目的,阵列没必要特异地设计来检测来自被分析生物体的特定的基因组序列。
在一个实施方案中,未甲基化的DNA的富集与比较基因组杂交(CGH)相结合来分析肿瘤细胞,以鉴定肿瘤DNA和正常DNA之间的区别。参见,例如Kallioniemi等Methods 9(1):113-121(1996)。等量的不同标记的肿瘤DNA和正常的参比DNA(例如一个可以用生物素标记,而另一个用地高辛标记)可以与探针阵列杂交,信号强度被定量,并且肿瘤相对于正常细胞中的过量或不足信号可以被定量。在一个实施方案中,分析甲基化状态的方法可以与基因组中一个或多个区域的拷贝数的估计方法相结合。许多癌症与基因组中一个或多个区域的拷贝数的增加有关。拷贝数的增加可以通过与阵列的杂交而检测。拷贝数的增加被检测为杂交强度的增加。使用寡聚核苷酸阵列分析拷贝数的方法已公开在,例如美国专利公布No.20040157243中,其中公开了特定的计算机方法,使用例如Affymetrix 10K作图阵列和分析进行拷贝数分析。
在另一方面,在存在或不存在甲基化的基础上,利用组分的分离来减少复杂性的方法被用来富集样品中的目的序列,该样品是宿主和病原基因组DNA的混合物。一些生物体在它们的基因组中缺少5-meC修饰或水平降低的5-meC。例如,病原体如支原体缺少5-meC或水平很低。其它的例子参见,例如Razin和Razin,NAR 8:1383-1390(1980)。未甲基化的病原体DNA可以通过用甲基依赖性酶如McrBC消化样品来富集。未甲基化的病原体DNA也可以通过使用针对5-meC的抗体或5-meC结合蛋白与针对结合蛋白的抗体相结合来消耗甲基化的DNA而得以富集。在一个方面,样品首先用其识别位点中没有CpG的限制性酶进行片段化,再将接头连接到片段上。连接有接头的片段用甲基化依赖性酶消化,以便被甲基化并且含有酶识别位点的片段被片段化。没有被甲基化依赖性酶片段化的连接了接头的片段通过PCR使用针对接头的引物进行扩增。这样产生了相对甲基化的DNA来说未甲基化的DNA被富集了的扩增产物。
在一个实施方案中,利用那些优先扩增未甲基化的核酸的方法来减少基因组样品的复杂性的方法,可以被用来在复杂的混合物中富集病原体DNA。例如,如果核酸样品是从被认为感染有病原体的病人中分离出来的,该核酸样品可能含有病人的DNA和病原体的DNA的混合物。许多原核生物的病原体与它们感染的生物体相比具有较低的甲基化水平,因此在扩增前用优先降解甲基化DNA的酶处理混合样品可以被用来相对于宿主DNA来说富集病原体DNA。然后可以通过例如与核酸探针阵列的杂交来分析扩增的样品以检测病原体DNA。由于宿主DNA的存在而引起的潜在的干扰效应被减小了,从而对病原体DNA的检测得到改善。
在一个实施方案中,被怀疑含有病原体DNA的核酸样品被片段化以产生片段,以及接头被连接到片段的末端。然后,接头修饰的片段用切割甲基化DNA但是不切割未甲基化DNA的酶,例如McrBC进行处理。含有McrBC识别位点的片段将被切割为较小的片段,它们只在一个末端有接头序列。接着,样品使用与接头中的序列互补的引物通过PCR进行扩增。被McrBC切割的片段将不被扩增,因为它们只有一个接头,因而只在一个末端有引发位点。由于病原体的序列没有被甲基化,它不被McrBC切割,并会被扩增。
可以被用来检测甲基化的阵列包括例如平铺阵列,该阵列中的探针对目的区域而言,在亚硫酸氢盐处理后,与多个可能的CpG和5-meCpG的组合完全互补。两条链或一条链上的甲基化都可以被分析。如果探针针对一条链设计,它们也可以被设计用来质询任意一条链。在某些方面,选择有待质询的链是含有胞嘧啶的链,但是在其它方面,那条链已经在修饰后被扩增了,以至于得到的扩增的双链产物含有A:T碱基对代替了C:G碱基对,任何一条链都可以被质询。所有未甲基化的胞嘧啶可以被转化为尿嘧啶,探针和引物在设计时可以将这考虑在内,例如,在与胞嘧啶位置互补的位置上,探针与基因组中胞嘧啶的位置互补的位置应有腺嘌呤。
据估计在人类基因组中有大约2800万到2900万个CpG,其密度在低密度的CpG区域预计是大约每50-100个碱基对1个CpG,而在高密度区域大约是每20个碱基对1个CpG。在一个方面,阵列被设计成质询超过50,000、超过100,000、超过500,000、超过1,000,000、超过2,500,000或超过5,000,000个这些CpG的甲基化状态。在某些实施方案中,阵列还含有质询也能够在胞嘧啶上被甲基化的CNG位置的探针。质询可以例如类似于检测胞嘧啶位点的多态性,反映出由于化学,例如亚硫酸氢盐或酶学,例如AID的机制产生的从胞嘧啶到尿嘧啶的变化。基于相邻CpG二核苷酸的定位可以选择出特定的CpG来质询。当在探针互补的区域内,例如探针的25个碱基中,有多于1个CpG时,为质询中央CpG所需的探针的完全互补性可能受到探针区域内第二、第三或第四个CpG的甲基化状态的影响。在某些方面,用于质询第一个CpG(质询的CpG)的探针组可以被设计成包含了由于次级(非质询的)CpG的甲基化状态的改变而引起的所有可能的序列变化的组合。对于每一个可能的序列变化来说,这需要附加的探针。在另一方面,在上游或下游12、15、20或30个碱基内没有另外的CpG被选择来质询。
结论
本发明公开了保留后生信息的基因组DNA扩增方法。在一个方面,DNA甲基转移酶活性被包括在基因组DNA的扩增过程中。该甲基转移酶活性识别半甲基化的位点,并在扩增过程中使用甲基化的模板DNA为指导对新合成的DNA进行甲基化。
上面的描述是说明性的而非限制性的。对于本领域的专业技术人员来说,在浏览了本公开后,显然可以对本发明做出许多修改。因此,本发明的范围将不是参照上面的描述而确定,而是参照随附的权利要求及其所有等同物的范围而确定。

Claims (50)

1.一种扩增基因组DNA同时维持甲基化状态的方法,包括:
(a)获得含有甲基化基因组DNA的样品;
(b)将一条或多条引物与基因组DNA杂交;
(c)用DNA聚合酶延伸所述一条或多条引物,产生含有新合成的未甲基化的cDNA链和甲基化的模板链的半甲基化的杂合体;
(d)用DNA甲基转移酶活性在存在甲基供体的情况下处理杂合体,其中的DNA甲基转移酶活性使双链DNA中的半甲基化位点甲基化,产生含有新合成的甲基化的cDNA链和甲基化的模板链的甲基化的杂合体;
(e)将甲基化的杂合体变性;以及
(f)将一条或多条引物与步骤(e)的产物杂交,并且重复步骤(c)和(d)至少1次以产生甲基化的扩增产物。
2.权利要求1的方法,其中的DNA聚合酶是热稳定的聚合酶。
3.权利要求1的方法,其中的一条或多条引物包含随机序列引物的集合。
4.权利要求1的方法,其中的一条或多条引物包含多个位点特异性引物,它们与CpG岛的1,000个碱基中至少15个碱基的区域完全互补。
5.权利要求1的方法,其中的DNA聚合酶是链置换酶。
6.权利要求5的方法,其中的链置换酶是phi29。
7.权利要求1的方法,其中的DNA甲基转移酶活性包括Dnmt 1酶。
8.权利要求7的方法,其中的Dnmt 1选自小鼠Dnmt 1和人类Dnmt 1。
9.权利要求7的方法,其中的Dnmt 1是重组的。
10.权利要求1的方法,其中的甲基供体是S-腺苷甲硫氨酸。
11.权利要求1的方法,其中的DNA甲基转移酶活性是人类或小鼠Dnmt 1的变体形式,相对于天然酶它增加了对半甲基化DNA的特异性。
12.一种在基因组DNA样品中分析至少一个基因组区域的甲基化状态以鉴定被甲基化的区域的方法,包括:
(a)按照权利要求1的方法扩增基因组DNA样品,产生含有扩增的甲基化产物的扩增样品;
(b)将从(a)得到的扩增样品用第一个限制性酶进行片段化,并且将接头与片段连接产生连接了接头的片段;
(c)用第二个限制性酶处理从(b)获得的样品的第一个等份试样,并用第三个限制性酶处理从(b)获得的样品的第二个等份试样,其中第二和第三个限制性酶是同裂酶,其中第二个限制性酶是甲基化敏感的,而第三个限制性酶是甲基化不敏感的;
(d)通过PCR使用与接头互补的引物扩增从(c)获得的第一和第二个等份试样,以便从第一个等份试样产生第一个扩增样品,而从第二个等份试样产生第二个扩增样品;
(e)将(d)的产物进行标记,并将标记的产物平行地与探针阵列杂交,以便从第一个扩增样品产生第一个杂交模式,而从第二个扩增样品产生第二个杂交模式,其中的阵列含有多个探针,每个探针至少15个碱基长,并且都与选定的生物体基因组的200到2,000个碱基对的限制性片段完全互补,这些限制性片段是选定的生物体的基因组用所述第一个限制性酶消化产生的;以及
(f)将第一个和第二个杂交模式进行比较,以鉴定在第一个模式中存在而在第二个模式中不存在的片段,其中在第一个模式中存在的那些片段被鉴定为甲基化的区域。
13.权利要求1的方法,进一步包括在扩增样品中分析多个基因组区域的甲基化状态以鉴定多个没有被甲基化的区域,使用的方法包括:
将扩增的样品片段化产生片段;
使接头连接到片段上产生含有连接了接头的片段的样品;
把含有连接了接头的片段的样品分成至少第一个和第二个等份试样;
用甲基化不敏感的限制性酶处理第一个等份试样;
用甲基化依赖的限制性酶处理第二个等份试样;
使用与接头互补的引物扩增处理的第一个和第二个等份试样;
标记扩增产物,并将扩增产物同含有与已知的基因组区域互补的探针的探针阵列进行杂交,以便对于所述第一个等份试样产生第一个杂交模式,而对于所述第二个等份试样产生第二个杂交模式;
将第一个和第二个杂交模式进行比较,并且通过鉴定在第二个等份试样中存在而在第一个等份试样中不存在的基因组片段来鉴定未甲基化的基因组区域。
14.权利要求12的方法,其中的第一个酶的识别位点中不含CpG。
15.权利要求12的方法,其中的第一个酶选自XbaI、HindIII和BglII。
16.权利要求12的方法,其中的第二个限制性酶是HpaII,而第三个限制性酶是MspI。
17.权利要求13的方法,其中的甲基化依赖性酶是McrBC。
18.权利要求12的方法,其中的探针阵列含有至少100,000个不同的连接到固相支持物上的探针,其中探针的位置是确定的或可确定的,以及其中阵列的探针由计算机系统选择,所述计算机系统为阵列选择探针的方法包括:
模拟扩增样品的片段化,产生来自片段化的第一个片段列表,其中第一个列表包括预计长度的片段;
通过鉴定长度在200到2,000个碱基对之间的片段从第一个列表产生第二个片段列表;
通过鉴定含有第二和第三个限制性酶的识别位点的片段从第二个列表产生第三个片段列表;以及
选择与第三个列表中的多个片段互补的探针。
19.权利要求13的方法,其中的探针阵列含有至少100,000个不同的连接到固相支持物上的探针,其中探针的位置是确定的或可确定的,以及其中阵列的探针由计算机系统选择,所述计算机系统为阵列选择探针的方法包括:
模拟扩增样品的片段化,产生来自片段化的第一个片段列表,其中第一个列表包括预计长度的片段;
通过鉴定长度在200到2,000个碱基对之间的片段从第一个列表产生第二个片段列表;
通过鉴定含有甲基化依赖性酶的识别位点的片段从所述第二个列表产生第三个片段列表;以及
选择与第三个列表中的多个片段互补的探针。
20.权利要求18的方法,其中的固相支持物是多个珠子。
21.权利要求19的方法,其中的固相支持物是多个珠子。
22.权利要求1的方法,进一步包括对扩增样品进行分析以鉴定多个在基因组样品中被甲基化了的胞嘧啶和多个在基因组样品中没有被甲基化的胞嘧啶,使用的方法包括通过不将甲基化的胞嘧啶转化为尿嘧啶的方法将扩增样品中未甲基化的胞嘧啶转化为尿嘧啶,以及确定存在于多个胞嘧啶位置上的序列。
23.权利要求22的方法,其中所述转化步骤选自亚硫酸氢盐处理或用胞苷脱氨酶处理。
24.权利要求22的方法,其中所述转化步骤包含了亚硫酸氢盐处理和用胞苷脱氨酶处理。
25.权利要求23或24的方法,其中的胞苷脱氨酶是活化诱导的胞苷脱氨酶。
26.权利要求22、23、24或25的方法,其中所述确定步骤包括将扩增样品标记,并且使标记样品与探针阵列杂交,其中探针阵列含有质询多个胞嘧啶序列的探针,以确定基因组样品中正在被质询的胞嘧啶是否被甲基化了。
27.权利要求26的方法,其中被质询的胞嘧啶是CpG二核苷酸的一部分。
28.权利要求27的方法,其中的阵列质询至少10,000个胞嘧啶的甲基化。
29.一种探针阵列,含有至少100,000个不同的连接到固相支持物上的探针,其中探针的位置是确定的或可确定的,以及其中阵列的探针由计算机系统选择,所述计算机系统为阵列选择探针的方法包括:
模拟第一个核酸样品被第一个限制性酶的片段化,产生来自片段化的第一个片段列表,其中第一个列表包括预计长度的片段;
通过鉴定在选定的大小范围内的片段从第一个列表产生第二个片段列表;
通过鉴定第二个列表中含有第二个限制性酶的识别位点的片段从所述第二个列表产生第三个片段列表,其中所述第二个限制性酶是甲基化依赖的限制性酶或是甲基化敏感的限制性酶;以及
为阵列选择至少100,000个不同的探针,其中每个探针至少15个碱基,并且与第三个列表中的片段完全互补。
30.权利要求29的阵列,其中第一个限制性酶是两种或多种限制性酶的组合。
31.权利要求29的阵列,其中第二个限制性酶是McrBC。
32.权利要求29的阵列,其中第二个限制性酶是Hpa II。
33.在第一个含有基因组DNA的核酸样品中分析多个不同CpG位点的甲基化的方法,包括:
(a)按照权利要求1的方法扩增基因组DNA样品,产生含有扩增的甲基化产物的第一个扩增样品;
(b)将第一个扩增样品用第一个限制性酶片段化,并且使接头与片段连接产生含有连接了接头的片段的第二个样品;
(c)用亚硫酸氢钠处理第二个样品产生第三个样品;
(d)通过PCR使用与接头互补的引物扩增第三个样品中的至少一些连接了接头的片段;
(e)将步骤(d)的产物片段化,并把片段进行末端标记;
(f)将标记的产物与探针阵列杂交产生杂交模式,其中的阵列含有多个探针对,其中每个探针对中的第一个探针在C是甲基化的情况下与亚硫酸氢钠处理后的第一个CpG位点互补,而第二个探针在C是未甲基化的情况下与同样的区域互补;以及
(g)对杂交模式进行分析,以确定对于多个CpG位点中的每一个来说,在第一个核酸样品中所述位点是否是未甲基化的。
34.一种减少第一个含有甲基化基因组DNA的核酸样品的复杂性以产生复杂性降低的样品的方法,包括:
将第一个核酸样品用第一个限制性核酸内切酶片段化,产生含有限制性片段的第二个核酸样品;
将接头连接到第二个核酸样品的限制性片段上,产生含有连接了接头的片段的第三个核酸样品;
将第三个核酸样品用甲基化依赖性核酸内切酶片段化,产生第四个核酸样品;以及
用与接头互补的引物通过PCR对第四个核酸样品进行扩增,从而产生复杂性降低的样品。
35.权利要求34的方法,其中的甲基化依赖性酶是McrBC。
36.权利要求34的方法,其中第一个核酸样品选自血液样品、组织样品和肿瘤样品。
37.一种获得样品的杂交模式特征的方法,包括:
从所述样品获得基因组DNA样品;
按照权利要求34的方法减少核酸样品的复杂性;
将复杂性减少的样品片段化,并用可检测的标记物标记片段;以及
将标记的片段与核酸探针阵列杂交,从而获得杂交模式。
38.一种将未知核酸样品与已知核酸样品进行比较的方法,包括:
按照权利要求30的方法为所述未知样品产生第一个杂交模式;
为所述已知样品获得第二个杂交模式,其中的第二个杂交模式是按照权利要求37的方法产生的;以及
将第一个杂交模式与第二个杂交模式进行比较。
39.一种将肿瘤归类为已知肿瘤类型的方法,包括:
按照权利要求37的方法为所述未知样品产生第一个杂交模式;
从多个已知类型的肿瘤获得多个第二个杂交模式,其中第二个杂交模式是分别按照权利要求37的方法从来自己知类型肿瘤的样品产生的;
将第一个杂交模式与各种第二个杂交模式进行比较,以鉴定与第一个杂交模式最匹配的第二个杂交模式;以及
将肿瘤归类于杂交模式最匹配的已知肿瘤的类型。
40.一种检测基因组DNA样品中甲基化的基因组区域的方法,包括下列步骤:
a、用亚硫酸氢盐处理基因组DNA样品;
b、将基因组DNA样品片段化;
c、将接头连接到片段上;
d、对连接了接头的片段进行扩增;
e、用可检测的标记物标记扩增的片段,并将标记的片段与阵列杂交,以产生杂交模式;以及
f、将上述杂交模式与对照进行比较以鉴定甲基化的基因组区域。
41.权利要求40的方法,其中步骤(a)在步骤(b)之前进行,以及其中步骤(c)包括使用RNA连接酶将接头连接到片段的5’末端,除去3’磷酸,并且将接头连接到片段的3’末端。
42.权利要求40的方法,进一步包括通过将亚硫酸氢盐处理的样品与针对5-甲基胞嘧啶的抗体或与结合5-甲基胞嘧啶的蛋白和针对所述蛋白的抗体一起保温,并且分离抗体复合物,从而使获得的样品富集含有5-甲基胞嘧啶的片段,其中所述分离步骤在步骤(c)之前进行。
43.权利要求40的方法,其中步骤(b)在步骤(a)之前进行。
44.权利要求40的方法,其中的亚硫酸氢盐处理包括与8-10M的亚硫酸氢盐保温5分钟到1小时。
45.一种分析核酸样品中一个或多个胞嘧啶的甲基化状态的方法,所述方法包括:扩增核酸样品中的至少一部分序列,其中起始核酸样品中至少一部分序列的甲基化模式在扩增步骤中被拷贝了,从而产生甲基化的扩增样品;将甲基化的扩增样品进行区别修饰甲基化的胞嘧啶和未甲基化的胞嘧啶的处理;以及通过与核酸探针阵列的杂交检测扩增样品中至少一个胞嘧啶的甲基化状态。
46.权利要求45的方法,其中区别修饰甲基化的胞嘧啶和未甲基化的胞嘧啶的处理是亚硫酸氢盐处理。
47.权利要求45的方法,其中区别修饰甲基化的胞嘧啶和未甲基化的胞嘧啶的处理是使用活化诱导的胞苷脱氨酶的处理。
48.权利要求45的方法,其中区别修饰甲基化的胞嘧啶和未甲基化的胞嘧啶的处理包括使用活化诱导的胞苷脱氨酶的处理和亚硫酸氢盐处理。
49.权利要求46、47或48的方法,其中所述探针阵列包含与用亚硫酸氢盐处理或用活化诱导的胞苷脱氨酶处理后产生的多个不同序列完全互补的探针。
50.权利要求49的方法,其中的探针阵列包含与用亚硫酸氢盐处理或用活化诱导的胞苷脱氨酶处理多个选定的基因组区域后产生的所有可能的序列组合完全互补的探针。
CNA2005100095587A 2004-02-13 2005-02-16 使用核酸阵列分析甲基化状态 Pending CN1680594A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US54484404P 2004-02-13 2004-02-13
US60/544,844 2004-02-13
US63306204P 2004-12-03 2004-12-03
US60/633,062 2004-12-03

Publications (1)

Publication Number Publication Date
CN1680594A true CN1680594A (zh) 2005-10-12

Family

ID=34753137

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005100095587A Pending CN1680594A (zh) 2004-02-13 2005-02-16 使用核酸阵列分析甲基化状态

Country Status (4)

Country Link
US (1) US20050196792A1 (zh)
EP (1) EP1568786A3 (zh)
CN (1) CN1680594A (zh)
CA (1) CA2496997A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105296655A (zh) * 2015-11-26 2016-02-03 北京市中医研究所 检测顺式作用元件有无甲基化修饰或其修饰位点的方法
CN105842451A (zh) * 2016-05-17 2016-08-10 郑州大学 基于量子点荧光免疫检测dnmt1的方法
CN111032868A (zh) * 2017-06-30 2020-04-17 加利福尼亚大学董事会 用于评估无细胞dna中的dna甲基化的方法和系统
CN111183145A (zh) * 2017-03-08 2020-05-19 芝加哥大学 高灵敏度dna甲基化分析方法

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110151438A9 (en) 2001-11-19 2011-06-23 Affymetrix, Inc. Methods of Analysis of Methylation
WO2005085477A1 (en) * 2004-03-02 2005-09-15 Orion Genomics Llc Differential enzymatic fragmentation by whole genome amplification
KR20060026595A (ko) * 2004-09-21 2006-03-24 (주)지노믹트리 제한효소와 dna 칩을 이용한 프로모터의 메틸화 검출방법
EP1828411B1 (en) * 2004-12-03 2012-11-07 Human Genetic Signatures PTY Ltd Methods for simplifying microbial nucleic acids by chemical modification of cytosines
US7932027B2 (en) * 2005-02-16 2011-04-26 Epigenomics Ag Method for determining the methylation pattern of a polynucleic acid
US7449297B2 (en) * 2005-04-14 2008-11-11 Euclid Diagnostics Llc Methods of copying the methylation pattern of DNA during isothermal amplification and microarrays
JP2008541705A (ja) * 2005-05-26 2008-11-27 ヒューマン ジェネティック シグネチャーズ ピーティーワイ リミテッド 非標準塩基を含むプライマーを使用する等温鎖置換増幅
ATE531820T1 (de) * 2005-09-14 2011-11-15 Human Genetic Signatures Pty Gesundheitszustandstest
US20070087355A1 (en) * 2005-10-14 2007-04-19 Barrett Michael T Comparative genomic hybridization assays and compositions for practicing the same
EP1951911A2 (en) * 2005-11-08 2008-08-06 Euclid Diagnostics LLC Materials and methods for assaying for methylation of cpg islands associated with genes in the evaluation of cancer
US20080057499A1 (en) * 2006-02-06 2008-03-06 Affymetrix, Inc. Methods for high specificity whole genome amplification and hybridization
US7901882B2 (en) 2006-03-31 2011-03-08 Affymetrix, Inc. Analysis of methylation using nucleic acid arrays
CN101153336B (zh) 2006-09-27 2011-09-07 香港中文大学 检测dna甲基化程度的方法和试剂盒
JP2010505438A (ja) 2006-10-09 2010-02-25 オキシテック・リミテッド 核酸配列を増幅および検出する方法
US20080102452A1 (en) * 2006-10-31 2008-05-01 Roberts Douglas N Control nucleic acid constructs for use in analysis of methylation status
WO2008096146A1 (en) 2007-02-07 2008-08-14 Solexa Limited Preparation of templates for methylation analysis
US20080213870A1 (en) * 2007-03-01 2008-09-04 Sean Wuxiong Cao Methods for obtaining modified DNA from a biological specimen
US20080254453A1 (en) * 2007-04-12 2008-10-16 Affymetrix, Inc Analysis of methylation using selective adaptor ligation
WO2009006543A1 (en) 2007-07-02 2009-01-08 Euclid Diagnostics Llc Methods for evaluating the methylation status of a polynucleotide
JP2010535513A (ja) * 2007-08-15 2010-11-25 ザ ユニバーシティ オブ ホンコン 高スループット亜硫酸水素dnaシークエンシングのための方法および組成物ならびに有用性
EP2215250B1 (en) * 2007-11-27 2013-02-27 Human Genetic Signatures Pty Ltd Enzymes for amplification and copying bisulphite modified nucleic acids
AU2008331435B2 (en) * 2007-12-05 2013-01-10 Human Genetic Signatures Pty Ltd Bisulphite treatment of RNA
JP2011505845A (ja) * 2007-12-20 2011-03-03 ヒューマン ジェネティック シグネチャーズ ピーティーワイ リミテッド 核酸増幅に伴う汚染物質の排除
EP2163646A1 (en) * 2008-09-04 2010-03-17 Roche Diagnostics GmbH CpG island sequencing
WO2009131223A1 (ja) * 2008-04-25 2009-10-29 地方独立行政法人東京都健康長寿医療センター Dnaメチル化分析方法
US20100041057A1 (en) 2008-08-18 2010-02-18 Life Technologies Corporation Dna methylation detection methods
WO2010037001A2 (en) 2008-09-26 2010-04-01 Immune Disease Institute, Inc. Selective oxidation of 5-methylcytosine by tet-family proteins
US8541207B2 (en) * 2008-10-22 2013-09-24 Illumina, Inc. Preservation of information related to genomic DNA methylation
US20120149593A1 (en) * 2009-01-23 2012-06-14 Hicks James B Methods and arrays for profiling dna methylation
WO2010114821A1 (en) * 2009-03-30 2010-10-07 Zymo Research Corporation Genomic dna methylation analysis
ES2534200T3 (es) * 2009-08-03 2015-04-20 Epigenomics Ag Métodos para la preservación de la complejidad de la secuencia del ADN genómico
US20130059734A1 (en) * 2009-11-13 2013-03-07 Commonwealth Scientific And Industrial Research Organisation Epigenetic analysis
US9518295B2 (en) * 2010-08-11 2016-12-13 Institute Of Psychology, Chinese Academy Of Sciences High-throughput sequencing method for methylated DNA and use thereof
WO2012162139A1 (en) 2011-05-20 2012-11-29 The Regents Of The University Of California Method to estimate age of individual based on epigenetic markers in biological sample
WO2013010074A1 (en) 2011-07-13 2013-01-17 Primeradx, Inc. Multimodal methods for simultaneous detection and quantification of multiple nucleic acids in a sample
NZ622418A (en) 2011-09-07 2014-12-24 Human Genetic Signatures Pty Molecular detection assay
US10023909B2 (en) * 2011-12-13 2018-07-17 Oslo Universitetssykehus Hf Methods and kits for detection of methylation status
US9238836B2 (en) 2012-03-30 2016-01-19 Pacific Biosciences Of California, Inc. Methods and compositions for sequencing modified nucleic acids
WO2014179369A1 (en) * 2013-04-30 2014-11-06 University Of Southern California Accurate in vitro copying of dna methylation
WO2017059245A2 (en) 2015-09-30 2017-04-06 Trustees Of Boston University Deadman and passcode microbial kill switches
WO2018031760A1 (en) * 2016-08-10 2018-02-15 Grail, Inc. Methods of preparing dual-indexed dna libraries for bisulfite conversion sequencing
EP3596098A4 (en) * 2017-03-08 2020-11-04 President and Fellows of Harvard College METHOD OF AMPLIFICATION OF DNA TO MAINTAIN METHYLATION STATUS
CN113286881A (zh) 2018-09-27 2021-08-20 格里尔公司 甲基化标记和标靶甲基化探针板
EP4083231A1 (en) 2020-07-30 2022-11-02 Cambridge Epigenetix Limited Compositions and methods for nucleic acid analysis
WO2023096671A1 (en) * 2021-11-23 2023-06-01 Pleno, Inc. Encoded nucleic acid methylation assays
WO2023175019A1 (en) 2022-03-15 2023-09-21 Genknowme S.A. Method determining the difference between the biological age and the chronological age of a subject

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1009865A1 (en) * 1997-08-29 2000-06-21 Osvaldo J. Lopez Dna methyltransferase genotyping
DE19754482A1 (de) * 1997-11-27 1999-07-01 Epigenomics Gmbh Verfahren zur Herstellung komplexer DNA-Methylierungs-Fingerabdrücke
US7700324B1 (en) * 1998-11-03 2010-04-20 The Johns Hopkins University School Of Medicine Methylated CpG island amplification (MCA)
US6605432B1 (en) * 1999-02-05 2003-08-12 Curators Of The University Of Missouri High-throughput methods for detecting DNA methylation
DE19957827C2 (de) * 1999-11-25 2003-06-12 Epigenomics Ag Verwendung eines Oligomer-Arrays mit PNA- und/oder DNA-Oligomeren auf einer Oberfläche
DE10010282B4 (de) * 2000-02-25 2006-11-16 Epigenomics Ag Verfahren zur Detektion von Cytosin-Methylierung in DNA Proben
EP1274866A2 (en) * 2000-04-06 2003-01-15 Epigenomics AG Diagnosis of diseases associated with metastasis
US6649347B2 (en) * 2000-06-23 2003-11-18 Chromatin, Inc. Use of methylated nucleic acid segments for isolating centromere DNA
DE60125065T2 (de) * 2000-08-25 2007-06-28 Lovelace Respiratory Research Institute, Albuquerque Verfahren zur krebsdetektion mittels verschachtelter ("nested") methylierungsspezifischer pcr
GB0025913D0 (en) * 2000-10-23 2000-12-06 Guldberg Per Materials and methods relating to nucleic acid amplification and profiling
EP1438428A4 (en) * 2001-09-14 2005-11-16 Univ Queensland EVIDENCE OF METHYLATION OF DNA
JP2006500901A (ja) * 2001-09-26 2006-01-12 エピジェンクス ファーマスーティカルズ、 インコーポレイテッド Dnaメチル化変化のアッセイ
JP2005515787A (ja) * 2001-10-18 2005-06-02 ラブレイス レスピレイトリー リサーチ インスティチュート 転写因子遺伝子PAX5α、PAX5β、新規ループヘリックスループタンパク質、新規遺伝子2、およびベータ3遺伝子のプロモーターの異常メチル化による癌のモニタリング
US20030175908A1 (en) * 2002-01-29 2003-09-18 Sten Linnarsson Methods and means for manipulating nucleic acid
DE10214232A1 (de) * 2002-03-25 2003-10-23 Epigenomics Ag Verfahren und Vorrichtung für die DNA Methylierungsanalyse
EP1497447A4 (en) * 2002-04-12 2006-09-20 Univ Missouri US ECIST MICROARRAYSES FOR DUAL SCREENING OF DNA HYPERMETHYLATION AND GENE INACTIVATION, AND FOR USE IN AN INTEGRATED SYSTEM FOR EVALUATING GENE EXPRESSION, DNA METHYLATION AND ACETYLATION OF HISTONE
US20070065816A1 (en) * 2002-05-17 2007-03-22 Affymetrix, Inc. Methods for genotyping
AU2002952944A0 (en) * 2002-11-27 2002-12-12 Human Genetic Signatures Pty Ltd Restoration of methylation states in cells
US7368239B2 (en) * 2003-08-29 2008-05-06 Applera Corporation Method and materials for polyamine catalyzed bisulfite conversion of cytosine to uracil
DE10346363B4 (de) * 2003-09-30 2005-09-29 Epigenomics Ag Verfahren zur Methylierungsanalyse von DNA
US20060134650A1 (en) * 2004-12-21 2006-06-22 Illumina, Inc. Methylation-sensitive restriction enzyme endonuclease method of whole genome methylation analysis

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105296655A (zh) * 2015-11-26 2016-02-03 北京市中医研究所 检测顺式作用元件有无甲基化修饰或其修饰位点的方法
CN105842451A (zh) * 2016-05-17 2016-08-10 郑州大学 基于量子点荧光免疫检测dnmt1的方法
CN111183145A (zh) * 2017-03-08 2020-05-19 芝加哥大学 高灵敏度dna甲基化分析方法
CN111183145B (zh) * 2017-03-08 2024-01-09 芝加哥大学 高灵敏度dna甲基化分析方法
CN111032868A (zh) * 2017-06-30 2020-04-17 加利福尼亚大学董事会 用于评估无细胞dna中的dna甲基化的方法和系统

Also Published As

Publication number Publication date
EP1568786A3 (en) 2007-08-29
CA2496997A1 (en) 2005-08-13
US20050196792A1 (en) 2005-09-08
EP1568786A2 (en) 2005-08-31

Similar Documents

Publication Publication Date Title
CN1680594A (zh) 使用核酸阵列分析甲基化状态
US7452671B2 (en) Methods for genotyping with selective adaptor ligation
JP3175110B2 (ja) リガーゼ/ポリメラーゼ媒体された単一ヌクレオチド多型のジェネティックビットアナリシスおよび遺伝子解析におけるその使用
US20060292585A1 (en) Analysis of methylation using nucleic acid arrays
KR102018122B1 (ko) 한우육의 동일성 확인용 바이오 마커 및 이의 용도
EP1693468A1 (en) Method for determining the methylation pattern of a polynucleic acid
US7563567B1 (en) Use of ECIST microarrays in an integrated method for assessing DNA methylation, gene expression and histone acetylation
US7932027B2 (en) Method for determining the methylation pattern of a polynucleic acid
US20080254453A1 (en) Analysis of methylation using selective adaptor ligation
US20040161779A1 (en) Methods, compositions and computer software products for interrogating sequence variations in functional genomic regions
CN102533941A (zh) 修饰5-羟甲基胞嘧啶的组合物和方法
US7749704B2 (en) Promoter polymorphisms of the BLyS gene and use in diagnostic methods
US6911539B2 (en) Polymorphisms in a diacylglycerol acyltransferase gene, and methods of use thereof
AU756384B2 (en) Method for identifying mismatch repair glycosylase reactive sites, compound and uses thereof
US20030039973A1 (en) Human single nucleotide polymorphisms
CN1339607A (zh) 用核酸酶解活性和杂交技术鉴别核酸分子的方法和组合物
JP2001512961A (ja) イヌ科動物の遺伝子型決定のためのマイクロサテライト配列
US20100184640A1 (en) Dog diabetes
US8003325B2 (en) Polymorphisms of the BLyS gene and use in diagnostic methods
ES2326708B1 (es) Metodos y productos para genotipado in vitro.
Reed et al. A Mismatch EndoNuclease Array-Based Methodology (MENA) for Identifying Known SNPs or Novel Point Mutations.
EP1563090A2 (en) Methods, compositions and computer software products for interrogating sequence variations in functional genomic regions
ES2356458A1 (es) Metodos y productos para genotipado in vitro de variaciones genicas humanas asociadas a reacciones adversas a farmacos.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication