DE69434314T2 - Polymorphismus von mononukleotiden und ihre verwendung in der genanalyse - Google Patents

Polymorphismus von mononukleotiden und ihre verwendung in der genanalyse Download PDF

Info

Publication number
DE69434314T2
DE69434314T2 DE69434314T DE69434314T DE69434314T2 DE 69434314 T2 DE69434314 T2 DE 69434314T2 DE 69434314 T DE69434314 T DE 69434314T DE 69434314 T DE69434314 T DE 69434314T DE 69434314 T2 DE69434314 T2 DE 69434314T2
Authority
DE
Germany
Prior art keywords
individual
snps
snp
probability
ancestor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Revoked
Application number
DE69434314T
Other languages
English (en)
Other versions
DE69434314D1 (de
Inventor
Philip Goelet
R. Michael KNAPP
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orchid Cellmark Inc
Original Assignee
Orchid Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26842710&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69434314(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Orchid Biosciences Inc filed Critical Orchid Biosciences Inc
Publication of DE69434314D1 publication Critical patent/DE69434314D1/de
Application granted granted Critical
Publication of DE69434314T2 publication Critical patent/DE69434314T2/de
Anticipated expiration legal-status Critical
Revoked legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung liegt auf dem Gebiet der rekombinanten DNA-Technik. Genauer betrifft die Erfindung Verfahren, die zur Identifizierung von Einzelnucleotidpolymorphismen im Genom eines Tieres, insbesondere eines Pferdes oder eines Menschen, geeignet sind, und die Verwendung derartiger Stellen zur Analyse der Identität, Abstammung oder genetischer Eigenschaften.
  • Hintergrund der Erfindung
  • Die Fähigkeit, ein Tier, eine Pflanze oder eine Mikrobe zu genotypisieren, ist von grundlegender Bedeutung für die forensische Wissenschaft, die Medizin und die Epidemiologie und die Volksgesundheit, und für die Zucht und Ausstellung von Tieren. Eine derartige Fähigkeit ist beispielsweise erforderlich, um die Identität des Verursachers einer infektiösen Krankheit zu bestimmen, um zu bestimmen, ob zwei Individuen verwandt sind, oder um festzustellen, ob ein bestimmtes Tier wie ein Pferd reinrassig ist.
  • Die Analyse der Identität und der Elternschaft, zusammen mit der Fähigkeit zur Krankheitsdiagnose, ist auch von zentraler Bedeutung für genetische Studien am Menschen, an Tieren und an Pflanzen, insbesondere für forensische oder für Vaterschafts-Bestimmungen, und bei der Beurteilung des Risikos einer genetischen Krankheit eines Individuums. Derartige Ziele wurden verfolgt durch Analyse von Variationen in DNA-Sequenzen, die die DNA eines Individuums von einem anderen unterscheiden.
  • Wenn eine solche Variation die Längen der Fragmente, die durch Restriktionsendonuclease-Spaltung erzeugt werden, verändert, werden die Variationen als Restriktionsfragment-Längenpolymorphismen (restriction fragment length polymorphisms, RFLPs) bezeichnet. RFLPs wurden im breiten Umfang in genetischen Analysen beim Menschen und bei Tieren verwendet (Glassberg, J., UK-Patentanmeldung 2135774; Skolnick, M. H. et al., Cytogen. Cell Genet, 32: 58–67 (1982); Botstein, D. et al., Ann. J. Hum. Genet. 32: 314–331 (1980); Fischer, S. G. et al. (PCT-Anmeldung WO90/13668); Uhlen M., PCT-Anmeldung WO90/11369)). Wenn eine vererbbare Eigenschaft mit einem bestimmten RFLP in Verbindung gebracht werden kann, kann das Vorliegen des RFLP in einem Zieltier verwendet werden, um die Wahrscheinlichkeit vorherzusagen, dass das Tier auch die Eigenschaft zeigen wird. Es wurden statistische Verfahren entwickelt, um die Multilocus-Analyse von RFLPs zu erlauben, so dass komplexe Eigenschaften, die von mehreren Allelen abhängig sind, kartiert werden können (Lander, S. et al., Proc. Natl. Acad. Sci. (USA) 83: 7353–7357 (1986); Lander, S. et al., Proc. Natl. Acad. Sci. (USA) 84: 2363–2367 (1987); Donis-Keller, H. et al., Cell 51: 319–337 (1987); Lander, S. et al., Genetics 121: 185–199 (1989)). Derartige Verfahren können verwendet werden, um eine Genkarte zu entwickeln, sowie um Pflanzen oder Tiere, die wünschenswertere Eigenschaften haben, zu entwickeln (Donis-Keller, H. et al., Cell 51: 319–337 (1987); Lander, S. et. al., Genetics 121: 185–199 (1989)).
  • In manchen Fällen sind die DNA-Sequenzvariationen in Bereichen des Genoms, die durch kurze Tandem-Wiederholungen (short tandem repeats, STRs), die hintereinander angeordnete Dinucleotid- oder Trinucleotid-Wiederholungsmotive von Nucleotiden umfassen, gekennzeichnet sind. Diese Tandem-Wiederholungen werden auch als Polymorphismen der "variablen Anzahl an Tandem-Wiederholungen" (variable number tandem repeat, VNTR) bezeichnet. VNTRs wurden in der Identitäts- und Vaterschafts-Analyse verwendet (Weber, J. L., US-Patent 5 075 217; Armour, J. A. L. et al., FEBS Lett. 307: 113–115 (1992); Jones, L. et al., Eur. J. Haematol. 39: 144–147 (1987); Horn, G. T. et. al., PCT-Anmeldung WO91/14003; Jeffreys, A. J., europäische Patentanmeldung 370 719; Jeffreys, A. J., US-Patent 5 175 082; Jeffreys, A. J. et al., Amer. J. Hum. Genet. 39: 11–24 (1986); Jeffreys, A. J. et al., Nature 316: 76–79 (1985); Gray, I. C. et al., Proc. R. Acad. Soc. Lond. 243: 241–253 (1991); Moore, S. S. et al., Genomics 10: 654–660 (1991); Jeffreys, A. J. et al., Anim. Genet. 18: 1–15 (1987); Hillel, J. et al., Anim. Genet. 20: 145–155 (1989); Hillel, J. et al., Genet. 124: 783–789 (1990)) und werden nun in einer großen Anzahl von Genkartierungs-Studien verwendet.
  • Li und Sadler (Genetics 129: 513–523 (1991)) haben die Nucleotid-Verschiedenheit bei Menschen unter Verwendung veröffentlichter cDNA- und genomischer Sequenzen studiert. Ihr Maß der genetischen Variabilität war definiert als die Anzahl an Nucleotid-Unterschieden pro Stelle zwischen zwei willkürlich gewählten Sequenzen aus einer Population. Auf dieser Basis wurde gefunden, dass die menschliche Nucleotid-Verschiedenheit gering war.
  • Eine dritte Klasse einer DNA-Sequenzvariation ergibt sich aus Einzelnucleotidpolymorphismen (SNPs), die zwischen Individuen derselben Spezies vorliegen. Derartige Polymorphismen sind viel häufiger als RFLPs, STRs und VNTRs. In manchen Fällen weisen derartige Polymorphismen Mutationen auf, die das bestimmende Charakteristikum in einer genetischen Krankheit sind. Tatsächlich können derartige Mutationen ein einziges Nucleotid in einem ein Protein kodierenden Gen in einer Weise beeinflussen, die ausreicht, um die Krankheit (d. h. Hämophilie, Sichelzellenanämie, etc.) tatsächlich zu verursachen. In vielen Fällen sind diese SNPs in nicht-kodierenden Bereichen eines Genoms. Trotz der zentralen Bedeutung derartiger Polymorphismen in der modernen Genetik wurde kein praktikables Verfahren entwickelt, das die Verwendung einer hochgradig parallelen Analyse vieler SNP-Allele in zwei oder mehreren Individuen bei der genetischen Analyse erlaubt.
  • Die vorliegende Erfindung stellt ein derartiges verbessertes Verfahren bereit. Tatsächlich stellt die vorliegende Erfindung Verfahren und Gensequenzen bereit, die die genetische Analyse der Identität und der Elternschaft und die Krankheits-Diagnose durch Feststellen der Variation von Einzelnucleotidpolymorphismen erlauben.
  • Zusammenfassung der Erfindung
  • Die vorliegende Erfindung betrifft Moleküle, die Einzelnucleotidpolymorphismen (SNPs) aufweisen, die in Säugetier-DNA vorliegen, und insbesondere Polymorphismen genomischer DNA beim Pferd und beim Menschen. Die Erfindung betrifft Verfahren zum (i) Identifizieren neuer Einzelnucleotidpolymorphismen, (ii) Verfahren zum wiederholten Analysieren und Testen dieser SNPs in unterschiedlichen Proben und (iii) Verfahren zur Ausnutzung des Vorliegens derartiger Stellen in der genetischen Analyse von einzelnen Tieren und von Populationen von Tieren.
  • Die Analyse (Genotypisierung) derartiger Stellen ist brauchbar bei der Bestimmung der Identität, der Abstammung und der Anfälligkeit für eine genetische Krankheit, des Vorliegens oder Fehlens einer gewünschten Eigenschaft, etc. Genauer stellt die Erfindung bereit:
    Ein Verfahren der genetischen Analyse eines Satzes von Individuen derselben Spezies, aufweisend:
    Bereitstellen einer polymorphen Gruppe, die einen Satz von Einzelnucleotidpolymorphismen (SNPs) aufweist; und
    Feststellen des Vorliegens oder Fehlens der Polymorphismen in dem Satz von SNPs bei jedem des Satzes von Individuen; und
    Feststellen, ob das Vorliegen oder Fehlen eines bestimmten Allels eines Polymorphismus in dem Satz von SNPs mit einer bestimmten Eigenschaft verbunden ist.
  • Die Erfindung stellt auch bereit:
    Ein Verfahren zur Bestimmung der Wahrscheinlichkeit, dass eine Nucleinsäure-Probe von einem bestimmten Individuum stammt, aufweisend:
    Bereitstellen einer polymorphen Gruppe, die einen Satz von Einzelnucleotid-Polymorphismen (SNPs) aufweist, von dem Individuum, und einer entsprechenden polymorphen Gruppe von der Probe;
    Feststellen des Vorliegens oder Fehlens mehrerer SNP-Marker in den zwei Gruppen und Vergleichen der Ergebnisse für jeden SNP-Marker;
    davon ausgehend Bestimmen einer Wahrscheinlichkeit der Identität oder Nicht-Identität aus jedem Vergleich; und
    davon ausgehend Bestimmen einer kumulativen Wahrscheinlichkeit der Identität oder Nicht-Identität durch Multiplizieren der von jedem Vergleich gelieferten Wahrscheinlichkeiten.
  • Die Erfindung stellt auch bereit:
    Ein Verfahren zur Bestimmung der Wahrscheinlichkeit, dass ein Individuum der Nachkomme eines mutmaßlichen Vorfahren oder von mutmaßlichen Vorfahren ist oder nicht ist, aufweisend:
    Bereitstellen einer polymorphen Gruppe, die einen Satz von Einzelnucleotidpolymorphismen (SNPs) aufweist, von dem Individuum, und einer entsprechenden polymorphen Gruppe von dem mutmaßlichen Vorfahren oder den mutmaßlichen Vorfahren;
    Feststellen des Vorliegens oder Fehlens mehrerer SNP-Marker in der Gruppe des Individuums und des mutmaßlichen Vorfahren oder der mutmaßlichen Vorfahren, und Vergleichen der Ergebnisse für jeden SNP-Marker; und
    davon ausgehend Bestimmen der Wahrscheinlichkeit, dass das Individuum der Nachkomme des mutmaßlichen Vorfahren oder der mutmaßlichen Vorfahren ist oder nicht ist.
  • Die Erfindung stellt auch bereit:
    Ein Verfahren zur Erzeugung einer Genkarte eines Individuums, aufweisend:
    • (a) Bereitstellen einer polymorphen Gruppe, die drei oder mehr Einzelnucleotidpolymorphismen (SNPs) aufweist;
    • (b) Identifizieren der bei einem Vorfahren des Individuums vorliegenden SNP-Varianten durch Bestimmen der Basenidentität an jeder SNP-Stelle des Vorfahren des Individuums, und Identifizieren der bei dem Individuum vorliegenden SNP-Varianten durch Bestimmen der Basenidentität an jeder SNP-Stelle des Individuums;
    • (c) Bestimmen der Anzahl von Übereinstimmungen zwischen dem Individuum und dem Vorfahren; und
    • (d) Berechnen des Ausmaßes der genetischen Kopplung zwischen jedem Allel aus der Anzahl von Übereinstimmungen aus Schritt (c) und der Wahrscheinlichkeit, dass irgendein bei dem Individuum gefundenes Paar von Alleln von demselben Vorfahren geerbt wurde, auf der Basis der Allelhäufigkeiten der SNP-Varianten der polymorphen Gruppe, wodurch die Genkarte des Individuums erstellt wird.
  • Kurze Beschreibung der Figuren
  • 1 veranschaulicht das bevorzugte Verfahren zum Klonen willkürlicher genomischer Fragmente. Genomische DNA wurde größenfraktioniert und dann in einen Plasmidvektor eingeführt, um willkürliche Klone zu erhalten. PCR-Primer werden konstruiert und verwendet, um die eingesetzten genomischen Sequenzen zu sequenzieren.
  • 2 veranschaulicht die Daten, die erzeugt wurden durch das bevorzugte Verfahren zur Identifizierung neuer polymorpher Sequenzen, welches das zyklische Sequenzieren eines willkürlichen genomischen Fragments ist.
  • 3 veranschaulicht das RFLP-Verfahren zum Absuchen willkürlicher Klone auf polymorphe Sequenzen. Nach der anfänglichen Optimierung der PCR-Bedingungen (obere Platte) wird amplifiziertes Material mit mehreren Restriktionsenzymen gespalten, und die sich ergebenden Profile werden analysiert (mittlere Platten). Dann wird eine Populations-Studie durchgeführt, um Allelhäufigkeiten zu bestimmen.
  • 4 zeigt eine graphische Darstellung der Wahrscheinlichkeit, dass zwei Individuen identische Genotypen mit gegebenen Gruppen genetischer Marker haben. Die Anzahl verwendeter Tests ist an der Abszisse aufgetragen, während die kumulative Wahrscheinlichkeit der Nicht-Identität an der Ordinate aufgetragen ist. Die horizontale Linie gibt die Wahrscheinlichkeit von 0,95 der Nicht-Identität an. Legende: o bezeichnet den extrapolierten Prototyp; x bezeichnet drei Allele (51%, 34%, 15%); Dreieck bezeichnet zwei Allele (79%, 21%).
  • 5 zeigt eine graphische Darstellung der Wahrscheinlichkeit, dass gegebene Gruppen von 20 genetischen Markern einen willkürlichen angeblichen Vater in einem Vaterschaftsprozeß, in dem die Mutter nicht fraglich ist, ausschließen werden. Die Anzahl verwendeter Tests ist an der Abszisse aufgetragen, während die kumulative Wahrscheinlichkeit des Ausschlusses an der Ordinate aufgetragen ist. Die horizontale Linie gibt die Wahrscheinlichkeit von 0,95 des Ausschlusses an, die Legende ist wie in 4.
  • 6 verwendet den in dem Klon 177-2 identifizierten SNP, um die Organisation der Sequenzen in Tabelle 1 zu veranschaulichen.
  • 7 veranschaulicht das bevorzugte Verfahren zum Genotypisieren von SNPs. Die sieben Schritte veranschaulichen, wie eine GBA ausgehend von einer biologischen Probe durchgeführt werden kann.
  • 8A und 8B veranschaulichen, wie Pferde-Elternschaftsdaten auf der Mikrotiterplattenfläche erscheinen.
  • Beschreibung der bevorzugten Ausführungsformen
  • I. Die Einzelnucleotidpolymorphismen der vorliegenden Erfindung und die Vorteile ihrer Verwendung in der genetischen Analyse
  • A. Die Kennzeichen der Polymorphismen
  • Die bestimmten Gensequenzen, die für die vorliegende Erfindung von Interesse sind, weisen "Einzelnucleotidpolymorphismen" auf. Ein "Polymorphismus" ist eine Variation in der DNA-Sequenz einiger Mitglieder einer Spezies. Die Genome von Tieren und Pflanzen unterliegen im Laufe ihrer fortschreitenden Evolution natürlicherweise der spontanen Mutation (Gusella, J. F., Ann. Rev. Biochem, 55: 831–854 (1986)). Die Mehrzahl derartiger Mutationen schafft Polymorphismen. Die mutierte Sequenz und die Ausgangssequenz existieren gemeinsam in der Population der Spezies. In manchen Fällen befindet sich eine derartige gemeinsame Existenz in einem stabilen oder gleichsam stabilen Gleichgewicht. In anderen Fällen verleiht die Mutation der Spezies einen Überlebensvorteil oder einen Entwicklungsvorteil, und daher kann sie schließlich (d. h. über eine evolutionäre Zeit) in die DNA jedes Mitglieds jener Spezies eingebaut werden.
  • So wird ein Polymorphismus insofern "allelisch" genannt, als wegen des Vorliegens des Polymorphismus manche Mitglieder einer Spezies die nicht mutierte Sequenz (d. h. das ursprüngliche "Allel") haben können, während andere Mitglieder eine mutierte Sequenz (d. h. das Varianten- oder Mutanten-"Allel") haben können. Im einfachsten Fall kann nur eine mutierte Sequenz vorliegen, und der Polymorphismus wird diallelisch genannt. Diallelische Polymorphismen sind die üblichsten und die bevorzugten Polymorphismen der vorliegenden Erfindung. Das Auftreten alternativer Mutationen kann zu triallelischen, etc., Polymorphismen führen. Ein Allel kann durch das Nucleotid (die Nucleotide), das (die) die Mutation aufweist (aufweisen), bezeichnet werden. So veranschaulicht beispielsweise in Tabelle 1 Klon 177-2 (SEQ ID NO: 1 und SEQ ID NO: 2) die Sequenz eines Stranges eines diallelischen Polymorphismus, in dem ein Allel ein "C" und das andere Allel ein "T" an der polymorphen Stelle hat.
  • Die vorliegende Erfindung betrifft eine bestimmte Klasse allelischer Polymorphismen und ihre Verwendung bei der Genotypisierung einer Pflanze oder eines Tieres. Solche allelischen Polymorphismen werden hierin als "Einzelnucleotidpolymorphismen" oder "SNPs" bezeichnet. "Einzelnucleotidpolymorphismen" sind durch die folgenden Kennzeichen definiert. Ein Hauptkennzeichen eines solchen Polymorphismus ist, dass er eine polymorphe Stelle, "X", enthält, die am meisten bevorzugt von einem einzigen Nucleotid besetzt wird, was die Variationsstelle zwischen allelischen Sequenzen ist. Eine zweite charakteristische Eigenschaft eines SNPs ist, dass seiner polymorphen Stelle "X" bevorzugt "invariante" Sequenzen des Allels vorausgehen und folgen. Von der polymorphen Stelle des SNP sagt man daher, dass sie "unmittelbar" 3' zu einer "5'-proximalen" invarianten Sequenz, und "unmittelbar" 5' zu einer 3'-distalen" invarianten Sequenz liegt. Derartige Sequenzen flankieren die polymorphe Stelle.
  • Wie hierin verwendet, wird eine Sequenz eine "invariante" Sequenz eines Allels genannt, wenn die Sequenz in der Population der Spezies nicht variiert und, wenn kartiert, auf eine "korrespondierende" Sequenz desselben Allels in dem Genom jedes Mitglieds der Population der Spezies abbilden würde. Zwei Sequenzen werden "korrespondierende" Sequenzen genannt, wenn sie Analoge voneinander, die aus unterschiedlichen Quellen erhalten wurden, sind. Die Gensequenzen, die Hämoglobin bei zwei Menschen kodieren, veranschaulichen "korrespondierende" allelische Sequenzen. Die Definition von "korrespondierenden Allelen", die hierin gegeben wird, soll die Bedeutung des Begriffs, wie er von Durchschnittsfachleuten verstanden wird, verdeutlichen, aber nicht ändern. Jede Reihe von Tabelle 1 zeigt die Identität des Nucleotids der polymorphen Stelle "korrespondierender" Allele von Pferden, sowie die invarianten 5'-proximalen und 3'-distalen Sequenzen, die ebenfalls Kennzeichen jenes SNPs sind. "Korrespondierende Allele" sind in Tabelle 5 hinsichtlich menschlicher Allele veranschaulicht. Jede Reihe von Tabelle 5 zeigt die Identität des Nucleotids der polymorphen Stelle "korrespondierender" menschlicher Allele, sowie die invarianten 5'-proximalen und 3'-distalen Sequenzen, die ebenfalls Kennzeichen jenes SNPs sind.
  • Da genomische DNA doppelsträngig ist, kann jeder SNP bezüglich jedes der beiden Stränge definiert werden. Daher wird für jeden SNP ein Strang eine unmittelbar 5'-proximate invariante Sequenz enthalten, und der andere wird eine unmittelbar 3'-distale invariante Sequenz enthalten. In der bevorzugten Ausführungsform, in der eine polymorphe Stelle eines SNP's, "X", ein einziges Nucleotid ist, wird jeder Strang der doppelsträngigen DNA des SNP sowohl eine unmittelbar 5'-proximale invariante Sequenz als auch eine unmittelbar 3'-distale invariante Sequenz enthalten.
  • Die bevorzugten SNPs der vorliegenden Erfindung beinhalten zwar eine Substitution eines Nucleotids durch ein anderes an der polymorphen Stelle des SNPs, aber SNPs können auch komplexer sein und können eine Deletion eines Nucleotids aus einer, oder eine Insertion eines Nucleotids in eine, von zwei korrespondierenden Sequenzen aufweisen. Beispielsweise kann eine bestimmte Gensequenz bei manchen Tieren an einer bestimmten polymorphen Stelle ein A enthalten, während bei anderen Tieren an jener Stelle eine einfache oder mehrfache Basendeletion vorliegen kann. Die bevorzugten SNPs der vorliegenden Erfindung haben zwar sowohl eine invariante proximale Sequenz als auch eine invariante distale Sequenz, aber die SNPs können nur eine invariante proximale oder nur eine invariante distale Sequenz haben.
  • Nucleinsäure-Moleküle, die eine Sequenz haben, die zu derjenigen einer unmittelbar 3'-distalen invarianten Sequenz eines SNP komplementär ist, können, wenn sie in einer "Matrizen-abhängigen" Weise verlängert werden, ein Extensionsprodukt bilden, das die polymorphe Stelle des SNP enthalten würde. Ein bevorzugtes Beispiel für ein derartiges Nucleinsäure-Molekül ist ein Nucleinsäure-Molekül, dessen Sequenz dieselbe ist wie diejenige einer 5'-proximalen invarianten Sequenz des SNP. "Matrizen-abhängige" Extension bezeichnet die Fähigkeit einer Polymerase, die Extension eines Primers dergestalt zu vermitteln, dass die verlängerte Sequenz zu der Sequenz einer Nucleinsäure-Matrize komplementär ist. Ein "Primer" ist ein einzelsträngiges Oligonucleotid oder ein einzelsträngiges Polynucleotid, das in der Lage ist, durch die kovalente Addition eines Nucleotids in einer "Matrizen-abhängigen" Extensionsreaktion verlängert zu werden. Um eine solche Fähigkeit zu besitzen, muß der Primer ein 3'-Hydroxyl-Ende haben und an ein zweites Nucleinsäure-Molekül (d. h. die "Matrize") hybridisiert sein. Ein Primer ist typischerweise 11 Basen lang oder länger; am meisten bevorzugt ist ein Primer 20 Basen lang, jedoch Primer von kürzerer oder größerer Länge können genügen. Eine "Polymerase" ist ein Enzym, das in der Lage ist, Nucleosid-triphosphate einzubauen, um eine 3'-Hydroxyl-Gruppe eines Nucleinsäure-Moleküls zu verlängern, wenn das Molekül an ein geeignetes Matrizen-Nucleinsäure-Molekül hybridisiert hat. Polymerase-Enzyme werden diskutiert in Watson, J. D., In: Molecular Biology of the Gene, 3rd Ed., W. A. Benjamin, Inc., Menlo Park, CA (1977)) und in ähnlichen Texten. Andere Polymerasen wie das große proteolytische Fragment der DNA-Polymerase I des Bakteriums E. coli, allgemein bekannt als "Klenow"-Polymerase, E. coli-DNA-Polymerase I und Bakteriophage T7-DNA-Polymerase können auch zur Durchführung des hierin beschriebenen Verfahrens verwendet werden. Nucleinsäuren mit derselben Sequenz wie derjenigen der unmittelbar 3'-distalen invarianten Sequenz eines SNP können in Matrizen-abhängiger Weise an einen Primer, der dieselbe Sequenz hat wie die der unmittelbar 5'-proximalen Sequenz, die in Matrizen-abhängiger Weise um ein Nucleotid verlängert wurde, ligiert werden.
  • B. Die Vorteile der Verwendung von SNPs in der genetischen Analyse
  • Die einzelnucleotidisch polymorphen Stellen der vorliegenden Erfindung können verwendet werden, um die DNA irgendeiner Pflanze oder irgendeines Tieres zu analysieren. Derartige Stellen sind besonders geeignet zum Analysieren des Genoms von Säugetieren, wozu Menschen, nicht-menschliche Primaten, Haustiere (wie Hunde, Katzen, etc.), Farmtiere (wie Rinder, Schafe, etc.) und andere wirtschaftlich wichtige Tiere, insbesondere Pferde, gehören. Sie können jedoch im Hinblick auf andere Arten von Tieren, insbesondere Vögel (wie Hühner, Puten, etc.) verwendet werden. SNPs haben mehrere herausragende Vorteile gegenüber RFLPs, STRs und VNTRs.
  • Erstens treten SNPs mit größerer Häufigkeit (näherungsweise 10- bis 100-fach größer) und mit größerer Gleichmäßigkeit auf als RFLPs und VNTRs. Die größere Häufigkeit von SNPs bedeutet, dass sie leichter identifiziert werden können als die anderen Klassen von Polymorphismen. Die größere Gleichmäßigkeit ihrer Verteilung erlaubt die Identifizierung von SNPs, die "näher" an einer bestimmten Eigenschaft von Interesse sind. Die kombinierte Wirkung dieser zwei Kennzeichen macht SNPs extrem wertvoll. Wenn beispielsweise eine bestimmte Eigenschaft (z. B. Anfälligkeit für Krebs) eine Mutation an einem bestimmten Ort widerspiegelt, dann kann irgendein Polymorphismus, der an den bestimmten Ort gekoppelt ist, verwendet werden, um die Wahrscheinlichkeit, dass ein Individuum jene Eigenschaft zeigen wird, vorherzusagen.
  • Der Wert einer solchen Vorhersage wird teilweise durch den Abstand zwischen dem Polymorphismus und dem Ort bestimmt. Daher wird, wenn der Ort weit von irgendwelchen wiederholten Tandem-Nucleotidsequenz-Motiven entfernt liegt, die VNTR-Analyse von sehr begrenztem Wert sein. Gleichermaßen würde, wenn der Ort von irgendeinem nachweisbaren RFLP weit entfernt ist, eine RFLP-Analyse nicht genau sein. Da jedoch die SNPs der vorliegenden Erfindung näherungsweise einmal in jeweils 300 Basen in dem Säugetier-Genom vorliegen und Gleichmäßigkeit der Verteilung zeigen, kann ein SNP, statistisch, innerhalb von 150 Basen irgendeiner bestimmten genetischen Schädigung oder Mutation gefunden werden. Tatsächlich kann die bestimmte Mutation selbst ein SNP sein. Daher ist, wenn ein solcher Ort sequenziert wurde, die Variation des Nucleotids an dem Ort bestimmend für die fragliche Eigenschaft.
  • Zweitens sind SNPs stabiler als andere Klassen von Polymorphismen. Ihre spontane Mutationsrate beträgt näherungsweise 10–9, näherungsweise 1.000-fach weniger häufig als VNTRs. Signifikanterweise sind Polymorphismen vom VNTR-Typ durch hohe Mutationsraten gekennzeichnet.
  • Drittens haben SNPs den weiteren Vorteil, dass ihre Allelhäufigkeit aus dem Studium relativ weniger repräsentativer Proben gefolgert werden kann. Diese Kennzeichen von SNPs erlauben einen viel höheren Grad an genetischer Auflösung der Identität, des Vaterschafts-Ausschlusses und der Analyse der Anfälligkeit eines Tiers für eine bestimmte genetische Eigenschaft, als er mit RFLP- oder VNTR-Polymorphismen möglich ist.
  • Viertens spiegeln SNPs die höchstmögliche Bestimmung genetischer Information wieder – Nucleotid-Position und Basenidentität. Obwohl sie einen solch hohen Bestimmungsgrad schaffen, können SNPs leichter, und mit größerer Flexibilität, als RFLPs oder VNTRs nachgewiesen werden. Tatsächlich kann, weil DNA doppelsträngig ist, der komplementäre Strang des Allels analysiert werden, um das Vorliegen und die Identität irgendeines SNP zu bestätigen.
  • Die Flexibilität, mit der ein identifizierter SNP charakterisiert werden kann, ist ein herausragendes Merkmal von SNPs. Polymorphismen vom VNTR-Typ beispielsweise werden am einfachsten durch Größenfraktionierungs-Verfahren, die eine Veränderung in der Anzahl der Wiederholungen unterscheiden können, nachgewiesen. RFLPs werden am einfachsten durch Größenfraktionierungs-Verfahren nach Restriktionsverdau nachgewiesen.
  • Im Gegensatz dazu können SNPs unter Verwendung irgendeines aus einer Vielzahl von Verfahren charakterisiert werden. Derartige Verfahren umfassen die direkte oder indirekte Sequenzierung der Stelle, die Verwendung von Restriktionsenzymen, wo die jeweiligen Allele der Stelle eine Restriktionsstelle erzeugen oder zerstören, die Verwendung Allel-spezifischer Hybridisierungs-Sonden, die Verwendung von Antikörpern, die spezifisch sind für die Proteine, die von den verschiedenen Allelen des Polymorphismus kodiert werden, oder durch eine andere biochemische Interpretation.
  • Das Verfahren der "genetischen Bitanalyse" (Genetic Bit Analysis, GBA), das von Goelet, P. et al. (WO92/15712) offenbart wurde, und unten diskutiert wird, ist ein bevorzugtes Verfahren zum Nachweisen des Einzelnucleotidpolymorphismus der vorliegenden Erfindung. GBA ist ein Verfahren zur Abfragung polymorpher Stellen, bei dem Nucleotidsequenz-Information, die die Variationsstelle in einer Ziel-DNA-Sequenz umgibt, verwendet wird, um einen Oligonucleotid-Primer zu konstruieren, der komplementär zu dem Bereich ist, der dem variablen Nucleotid in der Ziel-DNA unmittelbar benachbart ist, es aber nicht enthält. Die Ziel-DNA-Matrize wird aus der biologischen Probe ausgewählt und an den Abfrage-Primer anhybridisiert. Der Primer wird unter Verwendung von DNA-Polymerase in Anwesenheit von zwei, und bevorzugt aller vier kettenterminierenden Nucleosid-triphosphat-Vorläufer durch ein einziges markiertes Dideoxynucleotid verlängert. Cohen, D. et al. (PCT-Anmeldung WO91/02087) beschreibt ein verwandtes Verfahren der Genotypisierung.
  • Kürzlich wurden mehrere Primer-gelenkte Nucleotid-Einbauverfahren zur Untersuchung polymorpher Stellen in DNA beschrieben (Komher, J. S. et al., Nucl. Acids. Res. 17: 7779–77784 (1989); Sokolov, B. P. Nucl. Acids Res. 18: 3671 (1990); Syvänen, A.-C., et al., Genomics 8: 684–692 (1990); Kuppuswamy, M. N. et al., Proc. Natl. Acad. Sci. (USA) 88: 1143–1147 (1991); Prezant, T. R. et al., Hum. Mutat. 1: 159–164 (1992); Ugozzoli, L. et al., GATA 9: 107–112 (1992); Nyrén, P. et al., Anal. Biochem. 208: 171–175 (1993)). Diese Verfahren unterscheiden sich von der GBA insofern, als sie sich alle auf den Einbau markierter Deoxynucleotide stützen, um zwischen Basen an einer polymorphen Stelle zu unterscheiden. Bei einem solchen Format können, da das Signal proportional zu der Anzahl eingebauter Deoxynucleotide ist, Polymorphismen, die in Reihen desselben Nucleotids auftreten, zu Signalen führen, die proportional zur Länge der Reihe sind (Syvänen, A.-C., et al., Amer. J. Hum. Genet, 52: 46–59 (1993)). Ein solcher Bereich ortsspezifischer Signale könnte im Vergleich zu der einfachen, ternären (2:0, 1:1 oder 0:2) Klasse von Signalen, die durch das GBA-Verfahren erzeugt werden, komplizierter zu interpretieren sein, insbesondere für Heterozygoten. Zusätzlich kann bei manchen Orten selbst in Anwesenheit des korrekten Dideoxynucleotids ein Einbau eines falschen Deoxynucleotids auftreten (Komher, J. S. et al., Nucl. Acids. Res. 17: 7779–7784 (1989)). Solche Deoxynucleotid-Fehleinbau-Ereignisse können daran liegen, dass die Km der DNA-Polymerase für das fehlgepaarte Deoxy-Substrat, in manchen Sequenz-Zusammenhängen, mit der relativ schlechten Km selbst eines korrekt basengepaarten Dideoxy-Substrats vergleichbar ist (Kornberg, A., et al., In: DNA Replication, 2nd Edition, W. H. Freeman and Co., (1992); New York; Tabor, S. et al., Proc. Natl. Acad. Sci. (USA) 86: 4076–4080 (1989)). Dieser Effekt würde zum Hintergrundrauschen bei der Abfragung der polymorphen Stelle beitragen.
  • II. Verfahren zur Entdeckung neuer polymorpher Stellen
  • Ein bevorzugtes Verfahren zur Entdeckung polymorpher Stellen beinhaltet die vergleichende Sequenzierung genomischer DNA-Fragmente aus einer Anzahl haploider Genome. Bei der bevorzugten Ausführungsform, die in 1 veranschaulicht ist, wird eine solche Sequenzierung durch Herstellen einer willkürlichen genomischen Bibliothek, die DNA-Fragmente von 0,5–3 kb enthält, die von einem Mitglied einer Spezies stammen, durchgeführt. Sequenzen dieser Rekombinanten werden dann verwendet, um die PCR-Sequenzierung einer Anzahl willkürlich ausgewählter Individuen der Spezies an denselben Genorten zu erleichtern.
  • Mehrere Hundert (200–500) individuelle Klone aus solchen Genbibliotheken (typischerweise aus näherungsweise 50.000 Klonen) werden gereinigt, und die Sequenzen der Enden ihrer Inserte werden bestimmt. Nur eine kleine Menge terminaler Sequenzdaten (100–200 Basen) braucht erhalten zu werden, um eine PCR-Amplifikation des geklonten Bereichs zu erlauben. Der Zweck der Sequenzierung ist, genug Sequenzinformation zu erhalten, um die Synthese von Primern zu erlauben, die zur Vermittlung der Amplifikation der äquivalenten Fragmente aus Proben genomischer DNA anderer Mitglieder der Spezies geeignet sind. Bevorzugt werden solche Sequenzbestimmungen unter Verwendung der Zyklus-Sequenzierungs-Methodik durchgeführt.
  • Die Primer werden verwendet, um DNA aus einer Gruppe willkürlich ausgewählter Mitglieder der Zielspezies zu amplifizieren. Die Anzahl an Mitgliedern in der Gruppe bestimmt die geringste Häufigkeit der Polymorphismen, die zu isolieren sind. Daher könnte, wenn sechs Mitglieder untersucht werden, ein Polymorphismus, der in einer Häufigkeit von, beispielsweise, 0,01 vorliegt, nicht identifiziert werden. In einer veranschaulichenden, aber zu stark vereinfachten, mathematischen Behandlung würde man erwarten, dass eine Probenentnahme bei sechs Mitgliedern nur jene Polymorphismen identifiziert, die mit einer Häufigkeit von größer als etwa 0,08 (d. h. Gesamthäufigkeit 1,0, dividiert durch sechs Mitglieder, dividiert durch zwei Allele pro Genom) auftreten. Daher muß, wenn man die Identifizierung weniger häufiger Polymorphismen wünscht, eine größere Anzahl von Gruppenmitgliedern untersucht werden.
  • Zyklus-Sequenzanalyse (Mullis, K. et al., Cold Spring Harbor Symp. Quant. Biol. 51: 264–273 (1986); Erlich H. et al., europäische Patentanmeldung 50 424; europäische Patentanmeldung 84 796, europäische Patentanmeldung 258 017, europäische Patentanmeldung 237 362; Mullis, K., europäische Patentanmeldung 201 184; Mullis K. et al., US-Patent Nr. 4 683 202; Erlich, H. US-Patent Nr. 4 582 788; und Saiki, R. et al., US-Patent Nr. 4 683 194)) wird erleichtert durch die Verwendung automatisierter DNA-Sequenzierungs-Geräte und -Software (Applied Biosystems, Inc.). Unterschiede zwischen Sequenzen verschiedener Tiere können dadurch identifiziert und durch Untersuchen des relevanten Bereichs der Chromatogramme auf dem Computerschirm bestätigt werden. Unterschiede werden nur dann als einen DNA-Polymorphismus widerspiegelnd interpretiert, wenn die Daten für beide Stränge verfügbar waren und bei mehr als einem haploiden Beispiel unter der Population getesteter Tiere vorlagen. 2 veranschaulicht das bevorzugte Verfahren zur Identifizierung neuer polymorpher Sequenzen, das eine Zyklus-Sequenzierung eines willkürlichen genomischen Fragments ist. Die PCR-Fragmente von fünf nicht verwandten Pferden wurden von Acrylamid-Gelen elektroeluiert und unter Verwendung wiederholter Zyklen thermisch stabiler Taq-DNA-Polymerase in Anwesenheit eines Gemisches von dNTPs und von fluoreszierenden ddNTPs sequenziert. Die Produkte wurden dann getrennt und unter Verwendung eines automatisierten DNA-Sequenzierungsgeräts von Applied Biosystems, Inc. analysiert. Die Daten wurden unter Verwendung von ABI-Software analysiert. Unterschiede zwischen Sequenzen verschiedener Tiere wurden durch die Software identifiziert und durch Prüfen des relevanten Bereichs des Chromatogramms auf den Computer-Schirm bestätigt. Die Unterschiede werden nur dann als "DNA-Polymorphismen" präsentiert, wenn die Daten für beide Strän ge verfügbar sind und bei mehr als einem haploiden Beispiel unter den fünf getesteten Pferden vorliegen. Das obere Feld zeigt einen "A"-Homozygoten, das mittlere Feld einen "AT"-Heterozygoten und das untere Feld einen "T"-Homozygoten.
  • Trotz der zufallsbestimmten Natur einer solchen Suche nach Polymorphismen ist eine derartige Sequenzierung und ein derartiger Vergleich willkürlicher DNA-Klone leicht in der Lage, geeignete Polymorphismen zu identifizieren. Tatsächlich würde, was das Pferd betrifft, näherungsweise 1/400 durch diese Verfahren sequenzierte Nucleotide als die polymorphe Stelle eines SNP entdeckt werden.
  • Die Entdeckung polymorpher Stellen kann alternativ unter Verwendung der in 3 dargelegten Strategie durchgeführt werden. In dieser Ausführungsform werden die DNA-Sequenz-Polymorphismen identifiziert durch Vergleichen der Restriktionsendonuclease-Spaltungsprofile, die von einer Gruppe Restriktionsenzyme an Produkten der PCR-Reaktion von den genomischen Matrizen nicht verwandter Mitglieder erzeugt wurden. Es ist am meisten bevorzugt, dass jede der verwendeten Restriktionsendonucleasen vier Basen-Erkennungssequenzen hat und daher eine erwünschte Anzahl von Schnitten in den amplifizierten Produkten erlaubt.
  • Die von den genomischen DNAs erhaltenen Restriktionsverdaumuster werden bevorzugt direkt mit den Mustern verglichen, die von PCR-Produkten, die unter Verwendung der entsprechenden Plasmid-Matrizen erzeugt wurden, erhalten wurden. Ein derartiger Vergleich liefert eine interne Kontrolle, die anzeigt, dass die amplifizierten Sequenzen von den genomischen und Plasmid-DNAs von äquivalenten Orten stammen. Diese Kontrolle erlaubt auch die Identifizierung von Primern, die zufällig wiederholte Sequenzen, oder Multicopy-Orte, amplifizieren, da diese viel mehr Fragmente von den genomischen DNA-Matrizen als von den Plasmid-Matrizen erzeugen.
  • III. Verfahren zur Genotypisierung der Einzelnucleotidpolymorphismen der vorliegenden Erfindung
  • Es kann irgendeines von einer Vielfalt von Verfahren verwendet werden, um die polymorphe Stelle, "X", eines Einzelnucleotidpolymorphismus der vorliegenden Erfindung zu identifizieren. Das bevorzugte Verfahren einer derartigen Identifizierung beinhaltet ein direktes Ermitteln der Sequenz der polymorphen Stelle für jeden Polymorphismus, der analysiert wird. Diese Herangehensweise ist daher deutlich verschieden von dem RFLP-Verfahren, das Bandenmuster anstelle der spezifischen Sequenz eines Polymorphismus analysiert.
  • A. Probenentnahme-Verfahren
  • Nucleinsäureproben können von einem Individuum der zu analysierenden Spezies entweder unter Verwendung "invasiver" oder "nicht-invasiver" Probennahme-Mittel erhalten werden. Ein Probennahme-Mittel wird "invasiv" genannt, wenn es das Sammeln von Nucleinsäuren von innerhalb der Haut oder von Organen eines Tieres (wozu insbesondere eine Maus, ein Mensch, ein Schaf, ein Pferd, ein Rind, ein Schwein, ein Hund oder eine Katze gehören) beinhaltet. Zu Beispielen für invasive Verfahren gehören das Sammeln von Blut, das Sammeln von Samen, die Nadelbiopsie, die pleurale Aspiration, etc.. Beispiele derartiger Verfahren werden diskutiert von Kim, C. H. et al. (J. Virol. 66: 3879–3882 (1992)); Biswas, B. et al. (Annals NY Acad. Sci. 590: 582–583 (1990)); Biswas, B. et al. (J. Clin. Microbiol. 29: 2228–2233 (1991)).
  • Im Gegensatz dazu ist ein "nicht-invasives" Probennahme-Mittel eins, bei dem die Nucleinsäure-Moleküle von einer inneren oder äußeren Oberfläche des Tiers gewonnen werden. Beispiele für solche "nicht-invasive" Probennahme-Mittel sind "Abtupfen", Sammeln von Tränen, Speichel, Urin, Kot, Schweiß oder Ausdünstung, etc.. Wie hierin verwendet, bezeichnet "Abtupfen" das in Berührung Bringen eines Applikatorsammlers ("Tupfer"), der ein absorbierendes Material enthält oder aufweist, mit einer Oberfläche in einer Art, die ausrei chend ist, um Oberflächen-Gewebsreste und/oder tote oder abgeschilferte Zellen oder Zellreste zu sammeln. Ein solches Sammeln kann erreicht werden durch Abtupfen nasaler, oraler, rektaler, vaginaler oder Ohr-Öffnungen, durch Berühren der Haut oder des Tränen-Nasengangs, durch Sammeln von Haarfollikeln, etc..
  • Nasen-Abstriche wurden verwendet, um klinische Proben zur PCR-Amplifikation zu erhalten (Olive, D. M. et al., J. Gen. Virol, 71: 2141–2147 (1990); Wheeler, J. G. et al., Amer. J. Vet. Res. 52: 1799–1803 (1991)). Die Verwendung von Haarfollikeln zur Identifizierung von VNTR-Polymorphismen für Vaterschafts-Tests bei Pferden wurde beschrieben von Ellegren, H. et al. (Animal Genetics 23. 133–142 (1992). Die Literaturstelle behauptet, dass ein standardisiertes Testsystem auf der Basis von PCR-analysierten Mikrosatelliten-Polymorphismen wahrscheinlich eine Alternative zur Blutgruppenbestimmung für Vaterschafts-Tests ist.
  • Ein bevorzugter Tupfer zum Sammeln von DNA weist einen festen Träger auf, von dem mindestens ein Teil so konstruiert ist, dass er DNA adsorbiert. Der zum Adsorbieren von DNA konstruierte Teil kann von komprimierbarer Beschaffenheit sein, wie ein "Schaumgummi" oder dergleichen. Alternativ kann er eine adsorptive Faserzusammensetzung sein wie Baumwolle, Polyester, Nylon oder dergleichen. In noch einer anderen Ausführungsform kann der zum Adsorbieren von DNA konstruierte Teil ein abreibendes Material sein, wie ein Borstenpinsel oder eine Bürste, oder eine rauhe Oberfläche haben. Der Teil des Tupfers, der zum Adsorbieren von DNA konstruiert ist, kann eine Kombination der obigen Strukturen und Zusammensetzungen sein (wie eine komprimierbare Bürste, etc.). Der Tupfer ist bevorzugt speziell geformt in einer im wesentlichen stabartigen, pfeilartigen oder pilzartigen Gestalt, so dass er ein Segment hat, das von dem sammelnden Individuum gehalten werden kann, und eine Spitze oder einen Endteil hat, der mit der Oberfläche, die die zu sammelnde DNA-Probe enthält, in Berührung gebracht werden kann. In einer Ausführungsform ist der Tupfer mit einem Aufbewahrungsraum ausgestattet, wie einem Kunststoff- oder Glas-Röhrchen oder -Zylinder, der ein offenes Ende haben kann, wie ein Teströhrchen. Alternativ kann das Röhrchen zwei offene Enden haben, so dass der Sammelnde nach dem Abstrich an einem Ende des Tupfers ziehen kann, um zu bewirken, dass das andere Ende des Tupfers in das Röhren hineingezogen wird. In noch einer anderen Ausführungsform kann das Röhrchen zwei offene Enden haben, so dass das Röhrchen nach dem Abstrich in eine Säule umgewandelt werden kann, um bei der weiteren Behandlung der gesammelten DNA hilfreich zu sein. In einer Ausführungsform ist das Ende oder sind die Enden des Aufbewahrungsraums selbstverschließend nachdem der Abstrich durchgeführt wurde.
  • Der Tupfer oder der Aufbewahrungsraum kann antimikrobielle Mittel in Konzentrationen enthalten, die ausreichend sind, um die Proliferation von Mikroben (Bakterien, Hefepilze, Schimmelpilze, etc.) während der nachfolgenden Aufbewahrung oder Handhabung zu verhindern.
  • In einer Ausführungsform enthält der Tupfer oder Aufbewahrungsraum ein farbbildendes Reagens, das auf die Anwesenheit von DNA unter Bildung eines nachweisbaren Signals, das zur Zeit der Probennahme identifiziert werden kann, reagiert. Am meisten bevorzugt ist, dass ein solches Reagens eine Minimalkonzentration-"offener Endpunkt"-Analyse für DNA aufweist. Eine solche Analyse ist in der Lage, Konzentrationen an Nucleinsäuren festzustellen, die von der minimalen Nachweiskonzentration der Analyse bis zur maximalen Analysen-Sättigungskonzentration der Analyse reichen. Die Sättigungskonzentration ist einstellbar und kann durch Verringern der Reaktionszeit erhöht werden. Zu bevorzugten farbbildenden Reagenzien gehören Anti-DNA-Antikörper, die an Enzyme, Diaminopimelinsäure, etc., konjugiert sind.
  • B. Analyse auf der Basis von Amplifikation
  • Der Nachweis polymorpher Stellen in einer DNA-Probe kann durch die Verwendung von DNA-Amplifikationsverfahren erleichtert werden. Solche Verfahren erhöhen spezifisch die Konzentration an Sequenzen, die sich über die polymorphe Stelle erstrecken oder jene Stelle enthalten, und an Sequenzen, die entweder distal oder proximal zu ihr angeordnet sind. Solche amplifizierten Moleküle können leicht durch Gel-Elektrophorese oder andere Mittel nachgewiesen werden.
  • Das am meisten bevorzugte Verfahren zur Erzielung einer solchen Amplifikation verwendet PCR, wobei Primer-Paare verwendet werden, die in der Lage sind, an die proximalen Sequenzen zu hybridisieren, die einen Polymorphismus in seiner doppelsträngigen Form definieren.
  • Anstelle von PCR können alternative Verfahren, wie die "Ligase-Kettenreaktion" (Ligase Chain Reaction, LCR), verwendet werden (Barany, F., Proc. Natl. Acad. Sci. (USA) 88: 189–193 (1991)). LCR verwendet zwei Paare von Oligonucleotid-Sonden, um ein spezifisches Ziel exponentiell zu amplifizieren. Die Sequenzen jedes Paars von Oligonucleotiden sind so ausgewählt, um es dem Paar zu erlauben, an angrenzende Sequenzen desselben Strangs des Ziels zu hybridisieren. Eine solche Hybridisierung bildet ein Substrat für eine Matrizen-abhängige Ligase. Wie bei der PCR dienen die sich ergebenden Produkte daher in nachfolgenden Zyklen als eine Matrize, und es wird eine exponentielle Amplifikation der gewünschten Sequenz erhalten.
  • Gemäß der vorliegenden Erfindung kann die LCR mit Oligonucleotiden, die die proximalen und distalen Sequenzen desselben Strangs einer polymorphen Stelle besitzen, durchgeführt werden. In einer Ausführungsform ist jedes Oligonucleotid so konstruiert, dass es die tatsächliche polymorphe Stelle des Polymorphismus enthält. Bei einer solchen Ausführungsform werden die Reaktionsbedingungen so gewählt, dass die Oligonucleotide nur zusammen ligiert werden können, wenn das Zielmolekül das spezifische Nucleotid, das zu der polymorphen Stelle, die an dem Oligonucleotid vorliegt, komplementär ist, entweder enthält oder wenn es ihm fehlt.
  • In einer alternativen Ausführungsform enthalten die Oligonucleotide die polymorphe Stelle nicht, so dass eine "Lücke" erzeugt wird, wenn sie an das Ziel-Molekül hybridisieren (siehe Segev, D., PCT-Anmeldung WO 90/01069). Diese Lücke wird dann mit komplementären dNTPs (wie durch DNA-Polymerase vermittelt) oder durch ein zusätzliches Paar von Oligonucleotiden "gefüllt". Da her hat am Ende jedes Zyklus jeder Einzelstrang ein Ergänzungsstück, das in der Lage ist, während des nächsten Zyklus als ein Ziel zu dienen, und es wird eine exponentielle Amplifikation der gewünschten Sequenz erhalten.
  • Der "Oligonucleotid-Ligations-Assay" (Oligonucleotide Ligation Assay, OLA) (Landegren, U. et al., Science 241: 1077–1080 (1988)) hat gewisse Ähnlichkeiten mit der LCR gemeinsam und kann auch zur Verwendung bei der polymorphen Analyse angepaßt werden. Das OLA-Protokoll verwendet zwei Oligonucleotide, die konstruiert sind, um fähig zu sein, an angrenzende Sequenzen eines Einzelstrangs eines Ziels zu hybridisieren. OLA, wie LCR, ist besonders geeignet zum Nachweis von Punktmutationen. Anders als die LCR führt der OLA jedoch zu einer "linearen" statt zu einer exponentiellen Amplifikation der Zielsequenz.
  • Nickerson, D. A. et al. haben einen Nucleinsäure-Nachweis-Test beschrieben, der Kennzeichen von PCR und OLA vereinigt (Nickerson, D. A. et al., Proc. Natl. Acad. Sci. (USA) 87: 8923–8927 (1990)). Bei diesem Verfahren wird die PCR verwendet, um die exponentielle Amplifikation von Ziel-DNA zu erreichen, die dann unter Verwendung des OLA nachgewiesen wird. Zusätzlich dazu, dass sie mehrere, und getrennte, Behandlungsschritte erfordern, besteht ein mit solchen Kombinationen verbundenes Problem darin, dass sie alle der mit PCR und OLA verbundenen Probleme erben.
  • Schemata auf der Basis einer Ligation von zwei (oder mehr) Oligonucleotiden in Anwesenheit von Nucleinsäure mit der Sequenz des sich ergebenden "Di-Oligonucleotids", wodurch das Di-Oligonucleotid amplifiziert wird, sind ebenfalls bekannt (Wu, D. Y. et al., Genomics 4: 560 (1989)) und können leicht für die Zwecke der vorliegenden Erfindung angepaßt werden.
  • Andere bekannte Verfahrensweisen zur Nucleinsäure-Amplifikation, wie Amplifikationssysteme auf der Basis von Transkription (Malek, L. T. et al., US-Patent 5 130 238; Davey, C. et al., europäische Patentanmeldung 329 822; Schuster et al., US-Patent 5 169 766; Miller, H. I. et al., PCT-Anmeldung WO 89/06700; Kwoh, D. et al., Proc. Natl. Acad. Sci. (USA) 86: 1173 (1989); Ginge ras, T. R. et al., PCT-Anmeldung WO 88/10315)), oder isotherme Amplifikationsverfahren (Walker, G. T. et al., Proc. Natl. Acad. Sci. (USA) 89: 392–396 (1992)) können ebenfalls verwendet werden.
  • C. Herstellung von einzelsträngiger DNA
  • Die direkte Analyse der Sequenz eines SNP der vorliegenden Erfindung kann entweder unter Verwendung des "dideoxyvermittelten Kettenabbruchverfahrens", auch bekannt als das "Sanger-Verfahren" (Sanger, F., et al., J. Molec. Biol. 94: 441 (1975)), oder des "chemischen Abbauverfahrens", auch bekannt als das "Maxam-Gilbert-Verfahren" (Maxam, A. M.; et al., Proc. Natl. Acad. Sci. (USA) 74: 560 (1977), wobei beide Literaturstellen hierin durch Bezugnahme aufgenommen werden), ausgeführt werden. Verfahren zur Sequenzierung von DNA unter Verwendung entweder des Dideoxy-vermittelten Verfahrens oder des Maxam-Gilbert-Verfahrens sind Durchschnittsfachleuten gut bekannt. Solche Verfahren sind beispielsweise offenbart in Sambrook, J. et al., Molecular Cloning, a Laboratory Manual, 2nd Edition, Cold Spring Harbor Press, Cold Spring Harbor, New York (1989), und in Zyskind, J. W. et al., Recombinant DNA Laboratory Manual, Academic Press. Inc., New York (1988).
  • Wenn eine Nucleinsäure-Probe doppelsträngige DNA (oder RNA) enthält, oder wenn ein Amplifikationsprotokoll für doppelsträngige Nucleinsäure (wie PCR) verwendet wurde, ist es im allgemeinen wünschenswert, eine derartige Sequenzanalyse nach Behandlung der doppelsträngigen Moleküle dergestalt, dass ein Präparat erhalten wird, das an nur einem der zwei Stränge angereichert, und bevorzugt vorherrschend, ist, durchzuführen.
  • Das einfachste Verfahren zur Erzeugung einzelsträngiger DNA-Moleküle aus doppelsträngiger DNA ist die Denaturierung unter Verwendung von Hitze- oder Alkali-Behandlung.
  • Einzelsträngige DNA-Moleküle können auch hergestellt werden unter Verwendung des Bakteriophagen M13 mit einzelsträngiger DNA (Messing, J. et al., Meth. Enzymol. 101: 20 (1983); sie auch Sambrook, J., et al. (in: Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989)).
  • Mehrere alternative Verfahren können zur Erzeugung einzelsträngiger DNA-Moleküle verwendet werden. Gyllenstein, U. et al., (Proc. Natl. Acad. Sci. (USA) 85: 7652–7656 (1988) und Mihovilovic, M. et al. (BioTechniques 7(1): 14 (1989)) beschreiben ein als "asymmetrische PCR" bezeichnetes Verfahren, bei dem das Standard-"PCR"-Verfahren unter Verwendung von Primern, die in unterschiedlichen molaren Konzentrationen vorliegen, durchgeführt wird. Higuchi, R. G. et al. (Nucleic Acids Res. 17: 5865 (1985)) beschreibt beispielhaft ein zusätzliches Verfahren zur Erzeugung einzelsträngiger Amplifikationsprodukte. Das Verfahren erfordert ein Phosphorylieren des 5'-Endes eines Strangs eines doppelsträngigen Amplifikationsprodukts, und dann Zulassen, dass eine 5'→3'-Exonuclease (wie Exonuclease) bevorzugt den phosphorylierten Strang abbaut.
  • Andere Verfahren haben ebenfalls die Nuclease-Beständigkeitseigenschaften von Phosphorthioat-Derivaten ausgenutzt, um einzelsträngige DNA-Moleküle zu erzeugen (Benkovic et al., US-Patent Nr. 4 521 509; 4. Juni 1985); Sayers, J. R. et al. (Nucl. Acids Res. 16: 791–802 (1988); Eckstein, F. et al., Biochemistry 15: 1685 – 1691 (1976); Ott, J. et al., Biochemistry 26: 8237–8241 (1987)).
  • Eine Diskussion der relativen Vorteile und Nachteile derartiger Verfahren zur Herstellung einzelsträngiger Moleküle wird von Nikiforov, T. (US-Patentanmeldung Anmeldenummer 08/005 061, entsprechend WO94/16090, veröffentlicht 21. Juli 1994) vorgelegt.
  • Am meisten bevorzugt werden solche einzelsträngigen Moleküle unter Verwendung der von Nikiforov, T. (oben) beschriebenen Verfahren hergestellt. In Kürze, diese Verfahren verwenden gegen Nuclease beständige Nucleotid-Derivate und bauen derartige Derivate, durch chemische Synthese oder enzymatische Mittel, in Primer-Moleküle oder ihre Extensionsprodukte anstelle natürlich vorkommender Nucleotide ein.
  • Zu geeigneten Nucleotid-Derivaten gehören Derivate, in denen einer oder zwei der nicht-verbrückenden Sauerstoffe der Phosphat-Baueinheit eines Nucleotids durch eine Schwefel enthaltende Gruppe (insbesondere ein Phosphorthioat), eine Alkyl-Gruppe (insbesondere eine Methyl- oder Ethyl-Alkylgruppe), eine Stickstoff enthaltende Gruppe (insbesondere ein Amin) und/oder eine Selen enthaltende Gruppe, etc., ersetzt wurde.
  • Phosphorthioat-deoxyribonucleotid- oder -ribonucleotid-Derivate (z. B. ein Nucleosid-5'-O-1-thiotriphosphat) sind die am meisten bevorzugten Nucleotid-Derivate. Irgendeines aus einer. Vielfalt von chemischen Verfahren zur Herstellung solcher Phosphorthioat-Derivate kann verwendet werden (siehe beispielsweise Zon, G. et al., Anti-Canc. Drug Des. 6: 539–568 (1991); Kim, S. G. et al., Biochem. Biophys. Res. Commun. 179: 1614–1619 (1991); Vu, H. et al., Tetrahedron Lett. 32: 3005–3008 (1991); Taylor, J. W. et al., Nucl. Acids Res. 13: 8749–8764 (1985); Eckstein, F. et al., Biochemistry 15: 1685–1691 (1976); Ott, J. et al., Biochemistry 26: 8237–8241 (1987); Ludwig, J. et al., J. Org. Chem. 54: 631–635 (1989)). Phosphorthioat-Nucleotid-Derivate können auch im Handel von Amersham oder Pharmacia erhalten werden.
  • Es ist wichtig, dass das gewählte Nucleotid-Derivat für in vitro Primer-vermittelte Extension geeignet sein muß und dem Bereich des Nucleinsäure-Moleküls, in den es eingebaut wird, Nuclease-Beständigkeit verleihen muß. In der am meisten bevorzugten Ausführungsform muß es Beständigkeit gegen Exonucleasen, die doppelsträngige DNA vom 5'-Ende her angreifen (5'→3' Exonucleasen) verleihen. Zu Beispielen für solche Exonucleasen gehören Bakteriophage T7-Gen6-Exonuclease ("T7-Exonuclease") und die Bacteriophage-λ-Exonuclease ("λ-Exonuclease"). Sowohl T7-Exonuclease als auch λ-Exonuclease werden durch die Anwesenheit von Phosphorthioat-Bindungen in beträchtlichem Ausmaß gehemmt, so dass sie den selektiven Abbau eines der Stränge erlauben. Es kann jedoch irgendeine Doppelstrang-spezifische 5'→3'-Exonuclease für dieses Verfahren verwendet werden, vorausgesetzt, dass ihre Aktivität durch die Anwesenheit der Bindungen der Nuclease-beständigen Nucleotid-Derivate beeinflußt wird. Das bei der Verwendung von Phosphor thioat-Derivaten bevorzugte Enzym ist die T7-Gen-6-Exonuclease, die in dem selben Puffer, der für viele DNA-abhängige Polymerase-Puffer verwendet wird, einschließlich Taq-Polymerase, maximale enzymatische Aktivität zeigt. Die 5'→3'-Exonuclease-Beständigkeitseigenschaften von DNA-Molekülen, die Phosphorthioat-Derivate enthalten, werden beispielsweise in Kunkel, T. A. (in: Nucleic Acids and Molecular Biology, Vol. 2, 124–135 (Eckstein, F. et al., eds.), Springer-Verlag, Berlin, (1988)) diskutiert. Die 3'→5'-Exonuclease-Beständigkeitseigenschaften von Nucleinsäure-Molekülen, die Phosphorthioat-Nucleotid enthalten, sind in Putney, S. D., et al. (Proc. Natl. Acad. Sci. (USA)) 78: 7350–7354 (1981)) und Gupta, A. P. et al. (Nucl. Acids. Res., 12: 5897–5911 (1984)) offenbart.
  • Zusätzlich dazu, dass sie gegen solche Exonucleasen beständig sind, sind Nucleinsäure-Moleküle, die Phosphorthioat-Derivate an Restriktionsendonuclease-Spaltungs-Erkennungsstellen enthalten, gegen eine solche Spaltung beständig. Taylor, J. W., et al. (Nucl. Acids Res., 13: 8749–8764 (1985)) diskutiert die Endonuclease-Beständigkeitseigenschaften von Phosphorthioat-Nucleotid enthaltenden Nucleinsäure-Molekülen.
  • Die Nuclease-Beständigkeit von Phosphorthioat-Bindungen wurde in einem DNA-Amplifikationsprotokoll verwendet (Walker, T. G. et al. (Proc. Natl. Acad. Sci. (USA) 89: 392–396 (1992)). In dem Verfahren von Walker et al. werden Phosphorthioat-Nucleotid-Derivate in einer Restriktionsendonuclease-Erkennungsstelle in einem Strang eines doppelsträngigen DNA-Moleküls untergebracht. Die Anwesenheit des Phosphorthioat-Nucleotid-Derivats schützt den Strang vor Spaltung und führt so zum Einzelstrangbruch des ungeschützten Strangs durch die Restriktionsendonuclease. Die Amplifikation wird durch periodisches Durchlaufen des Vorgangs des Einzelstrangbruchs und der Polymerisation der Stränge ausgeführt.
  • In ähnlicher Weise wurde diese Beständigkeit gegen Nuclease-Angriff als die Grundlage für ein modifiziertes "Sanger"-Sequenzierungsverfahren verwendet (Labeit, S. et al. (DNA 5: 173–177 (1986)). In dem Verfahren von Labeit et al. wurden 35S-markierte Phosphorthioat-Nucleotid-Derivate anstelle der Dideoxy-Nucleotide des "Sanger"-Verfahrens verwendet.
  • In der am meisten bevorzugten Ausführungsform ist das Phosphorthioat-Derivat im Primer enthalten. Das Nucleotid-Derivat kann in irgendeine Position des Primers eingebaut werden, wird aber bevorzugt am 5'-Ende des Primers eingebaut, am meisten bevorzugt einander benachbart. Bevorzugt haben die Primer-Moleküle eine Länge von näherungsweise 25 Nucleotiden und enthalten von etwa 4% bis etwa 100%, und bevorzugter von etwa 4% bis etwa 40%, und am meisten bevorzugt etwa 16%, Phosphorthioat-Reste (verglichen mit den Resten insgesamt). Die Nucleotide können an irgendeiner Stelle des Primers eingebaut werden und können einander benachbart sein oder überall in dem Primer oder in einen Teil des Primers eingestreut sein.
  • In einer Ausführungsform kann die vorliegende Erfindung im Zusammenwirken mit einem Amplifikationsprotokoll, beispielsweise PCR, verwendet werden. In dieser Ausführungsform ist es bevorzugt, die Zahl der Phosphorthioat-Bindungen der Primer auf etwa 10 (oder näherungsweise die Hälfte der Länge der Primer) zu begrenzen, so dass die Primer in einer PCR-Reaktion ohne irgendwelche Veränderungen des PCR-Protokolls, das für nicht-modifizierte Primer erstellt wurde, verwendet werden können. Wenn die Primer mehr Phosphorthioat-Bindungen enthalten, können die PCR-Bedingungen eine Anpassung erfordern, insbesondere der Annealing-Temperatur, um die Reaktion zu optimieren.
  • Der Einbau derartiger Nucleotid-Derivate in DNA oder RNA kann enzymatisch unter Verwendung einer DNA-Polymerase ausgeführt werden (Vosberg, H. P. et al., Biochemistry 16: 3633–3640 (1977); Burgers, P. M. J. et al., J. Biol. Chem. 254: 6889–6893 (1979); Kunkel, T. A., In: Nucleic Acids and Molecular Biology, Vol. 2, 124–135 (Eckstein, F. et al., eds.), Springer-Verlag, Berlin, (1988); Olsen, D. B. et al., Proc. Natl. Acad. Sci. (USA) 87: 1451–1455 (1990); Griep, M. A. et al., Biochemistry 29: 9006–9014 (1990); Savers, J. R. et al., Nucl. Acids Res. 16: 791–802 (1988)). Alternativ können Phosphorthioat-Nucleotid-Derivate synthetisch in ein Oligonucleotid eingebaut werden (Zon, G. et al., Anti-Canc. Drug Des. 6: 539–568 (1991).
  • Man läßt die Primer-Moleküle an ein komplementäres Ziel-Nucleinsäure-Molekül hybridisieren, und dann werden sie verlängert, bevorzugt mittels einer Polymerase, um ein Extensionsprodukt zu bilden. Die Anwesenheit der Phosphorthioat-Nucleotide in den Primern macht das Extensionsprodukt beständig gegen Nuclease-Angriff. Wie angegeben, sind die Amplifikationsprodukte, die Phosphorthioat- oder andere geeignete Nucleotid-Derivate enthalten, im wesentlichen beständig gegen "Eliminierung" (d. h. Abbau) durch "5'→3'-Exonucleasen wie T7-Exonuclease oder Exonuclease, und daher wird eine 5'→3'-Exonuclease im wesentlichen unfähig sein, ein Nucleinsäure-Molekül weiter abzubauen, wenn sie auf einen Phosphorthioat-Rest trifft.
  • Da dem Zielmolekül gegen Nuclease beständige Reste fehlen, führt die Inkubation des Extensionsprodukts und seiner Matrize – des Ziels – in Anwesenheit einer 5'→3'-Exonuclease zur Zerstörung des Matrizenstrangs und erreicht dadurch die bevorzugte Erzeugung des gewünschten Einzelstrangs.
  • D. Festphasen-Bindung von DNA
  • Das bevorzugte Verfahren zur Bestimmung der Identität der polymorphen Stelle eines Polymorphismus beinhaltet eine Nucleinsäure-Hybridisierung. Eine solche Hybridisierung kann zwar in Lösung durchgeführt werden (Berk, A. J. et al. Cell 12: 721–732 (1977); Hood, L. E., et al., In: Molecular Biology of Eukaryotic Cells: A Problems Approach, Menlo Park, CA: Benjamin-Cummings, (1975); Wetmer, J. G. Hybridization and Renaturation Kinetics of Nucleic Acids, Ann. Rev. Biophys. Bioeng. 5: 337–361 (1976); Itakura, K., et al., Ann. Rev. Biochem. 53: 323–356, (1984)), aber es ist bevorzugt, einen Festphasen-Hybridisierungs-Versuch zu verwenden (siehe Saiki, R. K. et al., Proc. Natl. Acad. Sci. (USA) 86: 6230–6234 (1989); Gilham et al., J. Amer, Chem. Soc. 86: 4982 (1964) und Kremsky et al., Nucl. Acids Res. 15: 3131–3139 (1987)).
  • Es kann irgendeines von einer Vielfalt von Verfahren verwendet werden, um Oligonucleotide an dem festen Träger zu immobilisieren. Eines der im größten Umfang verwendeten Verfahren zur Erzielung einer solchen Immobilisierung von Oligonucleotid-Primern zur nachfolgenden Verwendung in auf Hybridisierung basierenden Analysen besteht in der nicht-kovalenten Beschichtung dieser festen Phasen mit Streptavidin oder Avidin und der nachfolgenden Immobilisierung biotinylierter Oligonucleotide (Holmstrom, K. et al., Anal. Biochem. 209: 278–283 (1993)). Ein anderes bekanntes Verfahren (Running, J. A. et al., BioTechniques 8: 276–277 (1990); Newton, C. R. et al. Nucl. Acids Res. 21: 1155–1162 (1993)) erfordert die Vorbeschichtung der festen Phasen aus Polystyrol oder Glas mit Poly-L-Lys oder Poly-L-Lys,-Phe, gefolgt von der kovalenten Bindung von entweder Amino- oder Sulfhydryl-modifizierten Oligonucleotiden unter Verwendung bifunktioneller Vernetzungsreagenzien. Beide Verfahren haben den Nachteil, die Verwendung modifizierter Oligonucleotide sowie eine Vorbehandlung der festen Phase zu erfordern.
  • Bei einem anderen veröffentlichten Verfahren (Kawai, S. et al., Anal. Biochem. 209: 63–69 (1993)) wurden kurze Oligonucleotid-Sonden miteinander ligiert, um Multimere zu bilden, und diese wurden in einen Phagemid-Vektor ligiert. Nach in vitro-Amplifikation und Isolierung der einzelsträngigen Form dieser Phagemide wurden sie auf Polystyrol-Platten immobilisiert und durch UV-Bestrahlung bei 254 nm fixiert. Die auf diese Weise immobilisierten Sonden wurden dann verwendet, um ein biotinyliertes PCR-Produkt einzufangen und nachzuweisen.
  • Ein Verfahren zur direkten kovalenten Bindung kurzer, 5'-phosphorylierter Primer an chemisch modifizierte Polystyrol-Platten ("Covalink"-Platten, Nunc) wurde ebenfalls veröffentlicht (Rasmussen, S. R. et al., Anal. Biochem. 198: 138–142 (1991)). Die kovalente Bindung zwischen dem modifizierten Oligonucleotid und der Festphasen-Oberfläche wird durch Kondensation mit einem wasserlöslichen Carbodiimid eingeführt. Von diesem Verfahren wird behauptet, dass es eine vorwiegende 5'-Bindung der Oligonucleotide über ihre 5'-Phosphate sicherstellt; es erfordert jedoch die Verwendung speziell vorbereiteter kostspieliger Platten.
  • Am meisten bevorzugt wird eine solche Immobilisierung von Oligonucleotiden (bevorzugt zwischen 15 und 30 Basen) unter Verwendung eines Verfahrens, das direkt verwendet werden kann ohne das Erfordernis irgendeiner Vorbehandlung von im Handel erhältlichen Polystyrol-Mikromuldenplatten (ELISA-Platten) oder Mikroskop-Glasobjektträgern, ausgeführt. Da 96 Mulden-Polystyrolplatten in ELISA-Tests in großem Umfang verwendet werden, gab es ein beträchtliches Interesse an der Entwicklung von Verfahren zur Immobilisierung kurzer Oligonucleotid-Primer an den Mulden dieser Platten für nachfolgende Hybridisierungs-Versuche. Ebenfalls von Interesse ist ein Verfahren zur Immobililsierung an Mikroskop-Glasobjektträgern, da die letzteren in dem sogenannten Slide Immunoenzymatic Assay (SIA) (de Macario, E. C. et al., Bio-Techniques 3: 138–145 (1985)) verwendet werden.
  • Der feste Träger kann Glas, Kunststoff, Papier, etc. sein. Der Träger kann in Form einer Perle, eines Eintauchstäbchens, eines Teströhrchens, etc. hergestellt sein. In einer bevorzugten Ausführungsform ist der Träger eine Mikrotiterplatte mit einer Vielzahl von Vertiefungen. Die konventionellen 96 Mulden-Mikrotiterplatten, die in diagnostischen Laboratorien und in Zell- und Gewebekulturen verwendet werden, sind ein bevorzugter Träger. Die Verwendung eines solchen Trägers erlaubt die gleichzeitige Bestimmung einer großen Anzahl von Proben und Kontrollen und erleichtert so die Analyse. Es können automatisierte Zuflußsysteme verwendet werden, um solche Mikrotiterplatten mit Reagenzien zu versorgen. In ähnlicher Weise können spektrophotometrische Verfahren verwendet werden, um die polymorphen Stellen zu analysieren, und eine solche Analyse kann unter Verwendung automatisierter Spektrophotometer durchgeführt werden.
  • Ein Aspekt der vorliegenden Erfindung betrifft ein Verfahren zur Immobilisierung von Oligonucleotiden für eine solche Analyse. Gemäß dem Verfahren kann irgendeine aus einer Anzahl im Handel erhältlicher Polystyrolplatten direkt für die Immobilisierung verwendet werden, vorausgesetzt, dass sie eine hydrophile Oberfläche haben. Zu Beispielen für geeignete Platten gehören die Immulon (eingetragene Marke) 4 Platten (Dynatech) und die Maxisorp (einge tragene Marke) Platten (Nunc). Die Immobilisierung der Oligonucleotide an den Platten wird einfach durch Inkubieren in Anwesenheit eines geeigneten Salzes erzielt. In Abwesenheit eines Salzes, d. h. wenn das Oligonucleotid in einer Wasserlösung vorliegt, findet keine Immobilisierung statt. Beispiele für geeignete Salze sind: 50–250 mM NaCl; 30–100 mM 1-Ethyl-3-(3'-dimethylaminopropyl)carbodiimid-Hydrochlorid (EDC), pH 6,8; 50–150 mM Octyldimethylamin-Hydrochlorid, pH 7,0; 50–250 mM Tetramethylammonium-chlorid. Die Immobilisierung wird durch Inkubation, bevorzugt 3 bis 24 Stunden lang bei Raumtemperatur, erzielt. Nach einer solchen Inkubation werden die Platten gewaschen, bevorzugt mit einer Lösung von 10 mM Tris HCl, pH 7,5, die 150 mM NaCl und 0,05 Vol.% Tween-20 (TNTw) enthält. Der letztere Bestandteil dient dem wichtigen Zweck, alle freien Oligonucleotid-Bindungsstellen, die noch auf der Polystyroloberfläche vorhanden sind, zu blockieren, so dass während der nachfolgenden Hybridisierungsschritte keine unspezifische Bindung von Oligonucleotiden stattfinden kann. Unter Verwendung radioaktiv markierter Oligonucleotide wurde die Menge an immobilisierten Oligonucleotiden pro Mulde zu mindestens 500 fmol bestimmt. Die Oligonucleotide werden an der Oberfläche der Platte mit ausreichender Stabilität immobilisiert und können nur durch langdauernde Inkubationen mit 0,5 M NaOH-Lösungen bei erhöhten Temperaturen entfernt werden. Kein Oligonucleotid wird entfernt durch Waschen der Platte mit Wasser, TNTw (Tween 20), PBS, 1,5 M NaCl oder anderen ähnlichen Lösungen.
  • Die immobilisierten Oligonucleotide können verwendet werden, um spezifische DNA-Sequenzen durch Hybridisierung festzuhalten. Die Hybridisierung wird üblicherweise in einer Lösung, die 1,5 M NaCl und 10 mM EDTA enthält, 15 bis 30 Minuten lang bei Raumtemperatur durchgeführt. Andere Hybridisierungsbedingungen können ebenfalls verwendet werden. Es wurde gefunden, dass mehr als 400 fmol einer spezifischen DNA-Sequenz an das immobilisierte Oligonucleotid in einer Mulde hybridisierten. Diese DNA ist an das zu Beginn immobilisierte Oligonucleotid nur über Watson-Crick-Wasserstoffbindungen gebunden, kann durch ein kurzes Waschen mit einer 0,1 M NaOH-Lösung leicht aus den Mulden entfernt werden ohne das zu Beginn gebundene Oligonucleotid von der Platte zu entfernen. Wenn das festgehaltene DNA-Fragment nicht-radioaktiv markiert ist, z. B. mit einem Biotin-Rest, kann der Nachweis unter Verwendung eines geeigneten Enzymassays durchgeführt werden.
  • Obwohl in die synthetischen Oligonucleotide keine Modifizierungen eingeführt werden müssen, erlaubt das Verfahren auch die Immobilisierung markierter (z. B. biotinylierter) Oligonucleotide, falls gewünscht. Die Oligonucleotid-Menge, die in einer einzigen Mulde einer ELISA-Platte durch dieses Verfahren immobilisiert werden kann, beträgt mindestens 500 fmol. Die so an der festen Phase immobilisierten Oligonucleotide können an geeignete Matrizen hybridisieren und auch an enzymatischen Reaktionen wie Matrizen-gerichteten Extensionen und Ligationen teilnehmen.
  • Für Testanwendungen mit hohen Volumina ist es wünschenswert, nicht-radioaktive Nachweisverfahren zu verwenden. Daher ist die Verwendung haptenierter Dideoxynucleotide bevorzugt; die Verwendung biotinylierter Dideoxynucleotide ist besonders bevorzugt, da eine solche Modifizierung die eingebaute Base durch die Standard-Avidin (oder Streptavidin)-Enzymkonjugate, die in ELISA-Assays verwendet werden, nachweisbar machen würde. Die biotinylierten ddNTPs werden bevorzugt hergestellt durch zur Reaktion Bringen der vier entsprechenden (3-Aminopropyn-1-yl)nucleosid-triphosphate mit Sulfosuccinimidyl-6-(biotinamido)hexanoat. So werden (3-Aminopropyn-1-yl)nucleosid-5'-triphosphate hergestellt, wie beschrieben von Hobbs, F. W. (J. Org. Chem. 54: 3420–3422 (1989)) und von Hobbs, F. W. et al. (US-Patent Nr. 5 047 519). Das (3-Aminopropyn-1-yl)nucleosid-5'-triphosphat (50 mol) wird in 1 ml wässrigem 1 M Triethylammoniumbicarbonat (TEAB) von pH 7,6 gelöst. Sulfosuccinimidyl-6-(biotinamido)hexanoat-Natriumsalz (Pierce, 55,7 mg, 100 mol) wird zugegeben, und die Lösung wird 2 h lang in einem verschlossenen Röhrchen auf 50°C erwärmt. Das Reaktionsgemisch wird mit Wasser auf 10 ml verdünnt und auf eine DEAE-Sephadex A-25–120-Säule (1,6 × 19 cm) aufgebracht. Die Säule wird mit einem linearen Gradienten mit wässrigem TEAB (0,1 M bis 1,0 M) von pH 7,6 eluiert, und das Eluierungsmittel wird bei 270 nm überwacht. Der spät eluierende Hauptpeak wird gesammelt, abgestrippt und mit Ethanol zusammen verdampft. Das Rohprodukt, das biotinyliertes Nucleosid-triphosphat und, in manchen Fällen, verunreinigendes Ausgangsmaterial enthält, wird durch Umkehrphasen-Säulenchromatographie (Baker C-18-Packung, 2 × 12 cm-Bett) weiter gereinigt. Das Material wird in 0,1 M TEAB von pH 7,6 eingebracht und mit einem Stufengradienten von Acetonitril in 0,1 M TEAB von pH 7,6 (0% bis 36%, Zuwächse von 2%, 8 ml/Schritt) eluiert. In allen Fällen wird das biotinylierte Produkt stärker zurückgehalten und sauber von dem Ausgangsmaterial getrennt. Produkt enthaltende Fraktionen werden in einem Pool gesammelt, abgestrippt und gemeinsam mit Ethanol verdampft. Das Produkt wird in Wasser aufgenommen, und die Ausbeute wird unter Verwendung des Absorptionskoeffizienten für das Ausgangs-Nucleotid berechnet. Die 3H-NMR- und 31P-NMR-Spektren stimmen mit der erwarteten Struktur überein und bestätigen das Fehlen von Phosphor enthaltenden oder von Nucleotiden abstammenden Verunreinigungen. Mittels HPLC (Waters Bondapak C-18, 4,6 × 250 mm, 1 ml/min, 1 bis 35% CH3CN/pH 7/0,01 M Triethylammoniumacetat) wird festgestellt, dass die Materialien > 99% rein sind.
  • Die Synthese von 5-(3-(6-Biotinamido(hexanoamido)propyn-1-yl)-2',3'-dideoxyuridin-5'-triphosphat hat eine näherungsweise Ausbeute von 25% (Voraussetzung = 12 400 bei 291,5 nm); HPLC tx = 16,1 min.
  • Die Synthese von 5-(3-(6-Biotinamido(hexanoamido)propyn-1-yl)-2',3'-dideoxycytidin-5'-triphosphat hat eine näherungsweise Ausbeute von 63% (Voraussetzung = 9230 bei 294,5 nm); HPLC tx = 19,4 min.
  • Die Synthese von 7-(3-(6-Biotinamido(hexanoamido)propyn-l-yl)-7-deaza-2',3'-dideoxyadenosin-5'-triphosphat hat eine näherungsweise Ausbeute von 39% (Voraussetzung = 13600 bei 278,5 nm); HPLC tx = 23,1 min.
  • Die Synthese von 7-(3-(6-Biotinamido(hexanamido)propyn-1-yl)-7-deaza-2',3'-dideoxyguanosin-5'-triphosphat hat eine näherungsweise Ausbeute von 44% (Voraussetzung = 9300 bei 291 nm); HPLC tx = 21,2 min.)
  • E. Festphasenanalyse polymorpher Stellen
  • 1. Polymerase-vermittelte Analyse
  • Die Identität des Nucleotids (der Nucleotide) der polymorphen Stellen der vorliegenden Erfindung kann zwar auf eine Vielfalt von Arten bestimmt werden, aber ein besonders bevorzugtes Verfahren nutzt den diagnostischen Nucleinsäure-Sequenzvariationstest auf Oligonucleotid-Basis, der von Goelet, P. et al. (PCT-Anmeldung WO92/15712) offenbart wurde. Bei diesem Versuch wird ein gereinigtes Oligonucleotid mit einer definierten Sequenz (komplementär zu einer unmittelbar proximalen oder distalen Sequenz eines Polymorphismus) an einen festen Träger, insbesondere eine Mikrotiterplatte, gebunden. Eine Probe, von der vermutet wird, dass sie das Zielmolekül oder ein Amplifikationsprodukt davon enthält, wird mit dem Träger in Berührung gebracht, und man läßt irgendwelche vorhandenen Zielmoleküle an das gebundene Oligonucleotid hybridisieren.
  • In einer bevorzugten Ausführungsform wird ein Oligonucleotid mit einer Sequenz, die zu einer unmittelbar distalen Sequenz eines Polymorphismus komplementär ist, unter Verwendung der oben beschriebenen Verfahren (und bevorzugt desjenigen von Nikiforov, T. (US-Patentanmeldung Anmeldenummer 08/005 061, entsprechend WO94/19090, veröffentlicht am 21. Juli 1994) hergestellt. Das Ende des Oligonucleotids wird an den festen Träger gebunden, wie es beispielsweise von Goelet, P. et al. (PCT-Anmeldung WO92/15712) beschrieben wird, so dass das 3'-Ende des Oligonucleotids als ein Substrat zur Primer-Extension dienen kann.
  • Der immobilisierte Primer wird dann in Anwesenheit eines DNA-Moleküls (bevorzugt eines genomischen DNA-Moleküls) mit einem Einzelnucleotidpolymorphismus, dessen unmittelbar 3'-distale Sequenz zu derjenigen des immobilisierten Primers komplementär ist, inkubiert. Bevorzugt findet eine solche Inkubation in vollständiger Abwesenheit irgendeines dNTPs (d. h. dATP, dCTP, dGTP oder dTTP) statt, sondern nur in Anwesenheit eines oder mehrerer kettenabbrechender Nucleotid-triphosphat-Derivate (wie eines Dideoxy-Deri vats) und unter Bedingungen, die hinreichen, um den Einbau eines solchen Derivats am 3'-Ende des Primers zu erlauben. Wie man verstehen wird, ist die Anwesenheit von nicht verwendbarem Nucleotid-triphosphat (nicht verwendbaren Nucleotid-triphosphaten) bei der Reaktion unerheblich, wenn die polymorphe Stelle so ist, dass nur zwei oder drei Allele existieren (so dass jeweils nur zwei oder drei Arten von dNTPs in das Primer-Extensionsprodukt eingebaut werden könnten). Als Folge der Inkubation und der Verwendung von nur kettenterminierenden Nucleotid-Derivaten wird ein einziges Dideoxynucleotid an das 3'-Ende des Primers angefügt. Die Identität des angefügten Nucleotids wird bestimmt durch das, und ist komplentär zu dem, Nucleotid der polymorphen Stelle des Polymorphismus.
  • Bei dieser Ausführungsform wird das Nucleotid der polymorphen Stelle daher bestimmt durch die Untersuchung, welches aus dem Satz markierter Nucleotide durch eine Primer-abhängige Polymerase an dem 3'-Ende des gebundenen Oligonucleotids eingebaut wurde. Am meisten bevorzugt werden, wenn mehrere Dideoxynucleotid-Derivate gleichzeitig verwendet werden, verschiedene Markierungen verwendet, um die unterscheidende Bestimmung der Identität des eingebauten Dideoxynucleotid-Derivats zu erlauben.
  • 2. Polymerase/Ligase-vermittelte Analyse
  • In einer alternativen Ausführungsform wird die Identität des Nucleotids der polymorphen Stelle unter Verwendung eines Polymerase/Ligase-vermittelten Verfahrens bestimmt. Wie bei der obigen Ausführungsform wird ein Oligonucleotid-Primer verwendet, der komplementär zu der unmittelbar 3'-distalen, invarianten Sequenz des SNP ist. Ein zweites Oligonucleotid wird über sein 3'-Ende an die feste Phase gebunden. Die Sequenz dieses Oligonucleotids ist komplementär zu der 5'-proximalen Sequenz des Polymorphismus, der analysiert wird, ist aber unfähig, an den Oligonucleotid-Primer zu hybridisieren.
  • Diese Oligonucleotide werden in Anwesenheit von DNA, die den Einzelnucleotidpolymorphismus, der zu analysieren ist, enthält, und mindestens eines 2',5'-Deoxynucleotid-triphosphats inkubiert. Die Inkubationsreaktion umfaßt außerdem eine DNA-Polymerase und eine DNA-Ligase. So würde beispielsweise, wenn der Polymorphismus des Klons 177-2 (Tabelle 1) untersucht wird und das gebundene Oligonucleotid die 3'-distale Sequenzvon SEQ ID No: 2 aufweisen könnte, das zweite Oligonucleotid die 5'-proximale Sequenz von SEQ ID NO: 1 haben.
  • Die gebundenen und löslichen Oligonucleotide sind daher in der Lage, an denselben Strang des Einzelnucleotidpolymorphismus, der analysiert wird, zu hybridisieren. Die Sequenz-Gegebenheiten bewirken, dass die zwei Oligonucleotide an die proximalen und distalen Sequenzen des SNP, die die polymorphe Stelle (X) des Polymorphismus flankieren, hybridisieren; die hybridisieren Oligonucleotide werden daher durch eine "Lücke" von einem einzigen Nucleotid an der genauen Position der polymorphen Stelle getrennt.
  • Die Anwesenheit einer Polymerase und eines zu (X) komplementären 2',5'-Deoxynucleotid-triphosphats erlaubt, die Ligation des mit dem komplementären 2',5'-Deoxynucleotid-triphosphat verlängerten Primers an das immobilisierte Oligo, komplementär zu der distalen Sequenz, ein 2',5'-Deoxynucleotid-triphosphat, das zu dem Nucleotid der polymorphen Stelle komplementär ist, erlaubt die Erzeugung eines ligierbaren Substrats. Die Ligationsreaktion immobilisiert das 2',5'-Deoxynucleotid und das vorher lösliche Primer-Oligonucleotid an dem festen Träger.
  • Die Identität der polymorphen Stelle, die der "Lücke" gegenüber lag, kann dann durch irgendeines von mehreren Mitteln bestimmt werden. In einer bevorzugten Ausführungsform ist das 2',5'-Deoxynucleotid-triphosphat der Reaktion markiert, und sein Nachweis enthält daher die Identität des komplementären Nucleotids der polymorphen Stelle. Es können mehrere verschiedene 2',5'-Deoxynucleotid-triphosphate anwesend sein, jedes unterschiedlich markiert. Alternativ können getrennte Reaktionen durchgeführt werden, jede mit einem unterschiedlichen 2',5'-Deoxynucleotid-triphosphat. In einer alternativen Unter-Ausführungsform sind die 2',5'-Deoxynucleotid-triphosphate unmarkiert und das zweite, lösliche Oligonucleotid ist markiert. Es werden ge trennte Reaktionen durchgeführt, wobei jede ein unterschiedliches unmarkiertes 2',5'-Deoxynucleotid-triphosphat verwendet. Die Reaktion, die das komplementäre Nucleotid enthält, erlaubt die Bildung des ligierbaren Substrats und wird bestimmt, indem die Immobilisierung des vorher löslichen Oligonucleotids festgestellt wird.
  • F. Signalverstärkung
  • Die Empfindlichkeit von Nucleinsäure-Hybridisierungs-Nachweisversuchen kann erhöht werden durch Veränderung der Art, auf die der Nachweis dem Beobachter übermittelt oder signalisiert wird. Daher kann beispielsweise die Versuchsempfindlichkeit durch die Verwendung nachweisbar markierter Reagenzien erhöht werden. Für diesen Zweck wurde eine breite Vielfalt derartiger Signalverstärkungsverfahren erdacht. Kourilsky et al. (US-Patent 4581 333) beschreibt die Verwendung von Enzym-Markierungen, um die Empfindlichkeit in einem Nachweisversuch zu erhöhen. Fluoreszierende Markierungen (Albarella et al., EP 144914 ), chemische Markierungen (Sheldon III et al., US-Patent 4 582 789; Albarella et al., US-Patent 4 563 417), modifizierte Basen (Miyoshi et al., EP 119448 ), etc. wurden ebenfalls in dem Bemühen verwendet, die Effizienz, mit der eine Hybridisierung beobachtet werden kann, zu verbessern.
  • Es ist bevorzugt, fluoreszierende, und bevorzugter farbbildende (insbesondere Enzym-), Markierungen zu verwenden, so dass die Identität des eingebauten Nucleotids in einer automatisierten oder halbautomatisierten Weise unter Verwendung eines Spektrophotometers bestimmt werden kann.
  • IV. Die Verwendung von SNP-Genotypisierung bei Verfahren der genetischen Analyse
  • A. Allgemeine Überlegungen zur Verwendung von Einzelnucleotidpolymorphismen in der genetischen Analyse
  • Die Nützlichkeit der polymorphen Stellen der vorliegenden Erfindung ist zurückzuführen auf die Fähigkeit, solche Stellen zu verwenden, um die statistische Wahrscheinlichkeit, dass zwei Individuen für irgendeinen gegebenen Polymorphismus dieselben Allele haben, vorherzusagen.
  • Eine statistische Analyse von SNPs kann für irgendeinen von einer Vielfalt von Zwecken verwendet werden. Wenn ein bestimmtes Tier vorher getestet wurde, kann ein solcher Test als ein "Fingerabdruck" verwendet werden, mit dem zu bestimmen ist, ob ein gewisses Tier das bestimmte Tier ist oder nicht ist.
  • Wenn ein mutmaßlicher Elternteil oder beide Eltern eines Individuums getestet wurden, können die Verfahren der vorliegenden Erfindung verwendet werden, um die Wahrscheinlichkeit zu bestimmen, dass ein bestimmtes Tier der Nachkomme eines solchen Elternteils oder solcher Eltern ist oder nicht ist. Daher kann der Nachweis und die Analyse von SNPs verwendet werden, um die Vaterschaft eines männlichen Tiers für ein bestimmtes Individuum auszuschließen (wie die Vaterschaft eines Hengstes für ein bestimmtes Fohlen), oder um die Wahrscheinlichkeit zu untersuchen, dass ein bestimmtes Individuum der Nachkomme eines ausgewählten weiblichen Tieres ist (wie ein bestimmtes Fohlen und eine ausgewählte Stute).
  • Wie unten angegeben, erlaubt die vorliegende Erfindung den Aufbau einer Genkarte einer Zielspezies. So kann die bestimmte Gruppe von Polymorphismen, die durch die Verfahren der vorliegenden Erfindung identifiziert wurden, mit einer bestimmten Eigenschaft in Zusammenhang gebracht werden, um die Neigung eines bestimmten Tieres (oder einer bestimmten Pflanze) zu einer solchen genetischen Krankheit, Zustand oder Eigenschaft vorherzusagen. Der Begriff "Eigenschaft", wie er hierin verwendet wird, soll "genetische Krankheit", "Verfassung" oder "charakteristische Eigenschaften" umfassen. Der Begriff "genetische Krankheit" bezeichnet einen pathologischen Zustand, der von einer Mutation verursacht wird, unabhängig davon, ob der Zustand nachgewiesen werden kann oder symptomlos ist, Eine "Verfassung" bezeichnet eine Neigung zu einer charakteristischen Eigenschaft (wie Asthma, Knochenschwäche, Blindheit, Geschwüre, Krebs, Herz- oder kardiovaskuläre Krankheiten, Ske lettmuskulatur-Mängel, etc.). Eine "charakteristische Eigenschaft" ist ein Kennzeichen, das einer Pflanze oder einem Tier wirtschaftlichen Wert verleiht. Beispiele für charakteristische Eigenschaften sind Langlebigkeit, Geschwindigkeit, Widerstandsfähigkeit, Alterungsgeschwindigkeit, Fruchtbarkeit, etc..
  • B. Identifizierung und Elternschaft-Überprüfung
  • Die brauchbarsten Messungen zur Bestimmung der Leistungsfähigkeit eines Identifizierungs- und Vaterschaftstests-Systems sind: (i) die "Wahrscheinlichkeit der Identität" (p(ID)) und (ii) die "Wahrscheinlichkeit des Ausschlusses (p(exc)). Die p(ID) berechnet die Wahrscheinlichkeit, dass zwei beliebige Individuen im Hinblick auf einen gegebenen polymorphen Marker denselben Genotyp haben werden. Die (p(exc) berechnet die Wahrscheinlichkeit, im Hinblick auf einen gegebenen polymorphen Marker, das ein beliebiges männliches Tier einen Genotyp haben wird, der unvereinbar damit ist, dass es in einem durchschnittlichen Vaterschaftsfall, in dem die Identität der Mutter nicht fraglich ist, der Vater ist. Da einzelne Genorte, einschließlich Orten mit zahlreichen Allelen wie der Haupt-Histokompatibilitäts-Bereich, selten Tests mit ausreichender statistischer Sicherheit für Vaterschaftstests liefern, wird ein wünschenswerter Test bevorzugt mehrere nicht gekoppelte Orte parallel messen. Kumulative Wahrscheinlichkeiten der Identität oder nicht-Identität und kumulative Wahrscheinlichkeiten des Vaterschafts-Ausschlusses werden für diese Multi-Ort-Tests durch Multiplizieren der Wahrscheinlichkeiten, die sich für jeden Ort ergeben, bestimmt.
  • Die statistischen Messungen von größtem Interesse sind: (i) die kumulative Wahrscheinlichkeit der nicht-Identität (cum p(nonID)) und (ii) die kumulative Wahrscheinlichkeit des Vaterschafts-Ausschlusses (cum p(exc)).
  • Die zur Berechnung dieser Wahrscheinlichkeitswerte verwendeten Formeln sind unten angegeben. Aus Gründen der Einfachheit sind diese zuerst für 2-Allel-Orte angegeben, wobei ein Allel Typ A und das andere Typ B genannt wird. In einem solchen Modell sind vier Genotypen möglich: AA, AB, BA und BB (wobei die Typen AB und BA biochemisch nicht unterscheidbar sind). Die Allelhäufigkeit wird angegben durch die Anzahl von Malen, mit der man A (f(A), die Häufigkeit von A wird mit "p" bezeichnet) oder B (f(B), die Häufigkeit von B wird mit "q" bezeichnet, wobei q = 1 – p) in dem haploiden Genom findet. Die Wahrscheinlichkeit eines gegebenen Genotyps an einem gegebenen Ort:
    Homozygot: p(AA) = p2
    Ein Heterozygot: p(AB) = p(BA) = pq = p(1 – p)
    Beide Heterozygoten: (p(AB + BA) = 2pq = 2p(1 – p)
    Homozygot: p(BB) = q2 = (1 – p)2
  • Die Wahrscheinlichkeit der Identität an einem Ort (d. h. die Wahrscheinlichkeit, dass zwei willkürlich aus einer Population ausgewählte Individuen an einem gegebenen Ort identische Genotypen haben werden) ist gegeben durch die Gleichung: p(ID) = (p2)2 + (2pq)2 + (q2)2
  • Die kumulative Wahrscheinlichkeit der Identität für n Orte ist daher gegeben durch die Gleichung: cump(ID) = ⊆p(ID1)p(ID2)p(ID3) ... p(IDn)
  • Die kumulative Wahrscheinlichkeit der Nicht-Identität für n Orte (d. h. die Wahrscheinlichkeit, dass zwei Individuen an einem oder mehreren Orten verschieden sein werden) ist gegeben durch die Gleichung: cump(nonID) = 1 – cump(ID)
  • Die Wahrscheinlichkeit des Elternschafts-Ausschlusses (die die Wahrscheinlichkeit darstellt, dass ein beliebiges männliches Individuum im Hinblick auf einen gegebenen Ort einen Genotyp haben wird, der es damit unvereinbar macht, dass es in einem durchschnittlichen Vaterschaftsfall, in dem die Identität der Mutter nicht fraglich ist, der Vater ist) ist gegeben durch die Gleichung: p(exc) = pq(1 – pq)
  • Die Wahrscheinlichkeit des nicht-Ausschlusses (die die Wahrscheinlichkeit an einem gegebenen Ort darstellt, dass ein beliebiges männliches Individuum in einem durchschnittlichen Vaterschaftsfall nicht biochemisch ausgeschlossen wird) ist gegeben durch die Gleichung: p(non – exc) = 1 – p(exc)
  • Die kumulative Wahrscheinlichkeit des nicht-Ausschlusses (die den Wert darstellt, der erhalten wird, wenn n Orte verwendet werden) ist daher: cump(non – exc) = ⊆p(non – exc1)p(non – exc2)p(non – exc3) ... p(non – excn)
  • Die kumulative Wahrscheinlichkeit des Ausschlusses (die die Wahrscheinlichkeit bei Verwendung einer Gruppe von n Orten darstellt, dass ein beliebiges männliches Individuum in einem durchschnittlichen Vaterschaftsfall, in dem die Mutter nicht fraglich ist, biochemisch als der Vater ausgeschlossen wird) ist gegeben durch die Gleichung: cump(exc) = 1 – cump(non – exc)
  • Diese Berechnungen können auf irgendeine Anzahl von Allelen an einem gegebenen Ort ausgedehnt werden. Beispielsweise ist die Wahrscheinlichkeit der Identität p(ID) für ein System von drei Allelen, bei dem die Allele in der Population Häufigkeiten von p, q bzw. r haben, gleich der Summe der Quadrate der Genotyp-Häufigkeiten: p(ID) = p4 + (2pq)2 + 2(qr)2 + (2pr)2 + r4 + q4
  • In ähnlicher Weise ist die Wahrscheinlichkeit des Ausschlusses für ein System von drei Allelen gegeben durch: p(exc) = pq(1 – pq) + qr(1 – qr) + pr(1 – pr) + 3pgr(1 – pqr)
  • Bei einem Ort von n Allelen wird die passende binomische Entwicklung zur Berechnung von p(ID) und p(exc) verwendet.
  • Die 4 und 5 zeigen, wie die cum p(nonID) und die cum p(exc) sowohl mit der Anzahl als auch der Art verwendeter genetischer Orte größer werden. Es ist zu sehen, dass bei Verwendung von Systemen mit drei Allelen eine größere Unterscheidungsfähigkeit mit weniger Markern erzielt wird. In den 4 und 5 zeichnen die Dreiecke das Ansteigen der Wahrscheinlichkeitswerte mit steigender Anzahl von Orten bei zwei Allelen auf, wobei das gewöhnliche Allel mit einer Häufigkeit von p = 0,79 vorliegt. Die Kreuze in den 4 und 5 zeigen dieselbe Analyse für steigende Anzahlen von Orten mit drei Allelen, wobei p = 0,51, q = 0,34 und r = 0,15.
  • Die Wahl, ob Orte mit 2, 3 oder mehr Allelen zu verwenden sind, wird jedoch stark durch die oben beschriebenen biochemischen Überlegungen beeinflußt. Es kann ein polymorpher Analysetest entwickelt werden, um irgendeine Anzahl von Allelen an einem gegebenen Ort abzuzählen. Wenn die Allelzählung unter Verwendung von Gelelektrophorese durchgeführt werden soll, sollte jedes Allel durch Gelelektrophorese leicht auflösbar sein. Da die Längenvariationen in Familien mit mehreren Allelen oft klein sind, enthalten Tests für menschliche DNA, die Familien mit mehreren Allelen verwenden, statistische Korrekturen für die irrtümliche Identifizierung von Allelen. Außerdem macht, obwohl das Auftreten eines seltenen Allels aus einem System mit mehreren Allelen hochgradig informativ sein kann, die Seltenheit dieser Allele genaue Messungen ihrer Häufigkeit in der Population äußerst schwierig. Um Irrtümer bei diesen Häufigkeits-Schätzungen zu korrigieren, wenn seltene Allele verwendet werden, muß die statistische Analyse dieser Daten ein Maß für die kumulativen Unsicherheitseffekte in diesen Häufigkeits-Schätzungen enthalten. Die Verwendung dieser Systeme mit mehreren Allelen erhöht auch die Wahrscheinlichkeit, dass im Verlauf der Durchmusterung einer großen Population neue oder seltene Allele in der Population entdeckt werden. Die Vollständigkeit früher gesammelter genetischer Daten würde empirisch revidiert werden, um die Entdeckung eines neuen Allels widerzuspiegeln.
  • Im Hinblick auf diese Überlegungen ist es, obwohl die Verwendung von Orten mit vielen Allelen möglicherweise einige Kurzzeit-Vorteile bieten könnte (weil weniger Orte abgesucht werden müßten), bevorzugt, polymorphe Analysen unter Verwendung von Orten mit weniger Allelen durchzuführen, die: (i) häufiger vorkommen und (ii) leichter zweifelsfrei zu messen sind. Tests dieses Typs können dieselbe Unterscheidungsfähigkeit erzielen wie Tests auf der Basis von Orten höher Polymorphie, vorausgesetzt, dass dieselbe Gesamtzahl von Allelen von einer Reihe nicht gekoppelter Orte gesammelt wird.
  • C. Genkartierung und genetische Eigenschaftsanalyse unter Verwendung von SNPs
  • Die in einem Satz von Individuen derselben Spezies (wie Menschen, Pferde, etc.) oder nah verwandter Spezies aufgefundenen Polymorphismen können analysiert werden, um festzustellen, ob das Vorliegen oder Fehlen eines bestimmten Polymorphismus mit einer bestimmten Eigenschaft korreliert.
  • Zur Durchführung einer solchen polymorphen Analyse wird das Vorliegen oder Fehlen eines Satzes von Polymorphismen (d. h. einer "polymorphen Gruppe") für einen Satz der Individuen bestimmt, von denen manche eine bestimmte Eigenschaft zeigen, und von denen manche eine charakteristische Eigenschaft zeigen, die die andere ausschließt (beispielsweise im Hinblick auf Pferde, spröde Knochen gegenüber nicht spröden Knochen; Alters-Blindheit (maturity onset blindness) gegenüber keiner Blindheit; Neigung zu Asthma, kardiovaskulärer Krankheit gegenüber keiner solchen Neigung). Die Allele jedes Polymorphismus des Satzes werden dann überprüft, um zu bestimmen, ob das Vorliegen oder Fehlen eines bestimmten Allels mit der bestimmten interessierenden Eigenschaft im Zusammenhang steht. Irgendeine solche Korrelierung definiert eine Genkarte der Spezies des Individuums. Allele, die im Hinblick auf eine Eigenschaft nicht willkürlich weitergegeben werden, können verwendet werden, um die Wahrscheinlichkeit vorherzusagen, dass ein bestimmtes Tier jene charakteristische Eigenschaft exprimieren wird. Wenn beispielsweise ein bestimmtes polymorphes Allel nur bei 20% der Mitglieder einer Spezies, die eine kardiovaskuläre Verfassung zeigen, vorliegt, dann würde ein bestimmtes Mitglied der Spezies, das das Allel enthält, eine 20%ige Wahrscheinlichkeit haben, dass es eine solche kardiovaskuläre Verfassung zeigt. Wie angegeben, wird die Vorhersagefähigkeit der Analyse durch den Grad der Kopplung zwischen einem bestimmten polymorphen Allel und einer bestimmten charakteristischen Eigenschaft erhöht. In ähnlicher Weise kann die Vorhersagefähigkeit der Analyse durch gleichzeitiges Analysieren der Allele mehrerer polymorpher Orte und einer bestimmten Eigenschaft erhöht werden. Wenn bei dem obigen Beispiel gefunden würde, dass ein zweites polymorphes Allel ebenfalls bei 20% der Mitglieder, die die kardiovaskuläre Verfassung zeigen, vorliegt, jedoch alle der untersuchten Mitglieder, die eine solche kardiovaskuläre Verfassung zeigten, für diesen ersten und zweiten Polymorphismus eine bestimmte Kombination von Allen hätten, dann hätte ein bestimmtes Mitglied, das beide derartigen Allele enthält, eine sehr hohe Wahrscheinlichkeit, die kardiovaskuläre Verfassung zu zeigen.
  • Der Nachweis mehrerer polymorpher Stellen erlaubt es einem, die Häufigkeit zu bestimmen, mit der solche Stellen unabhängig in einer Population weitergegeben werden. Wenn beispielsweise zwei polymorphe Stellen willkürlich weitergegeben werden, dann sind sie entweder auf getrennten Chromosomen oder sind auf demselben Chromosom voneinander entfernt. Umgekehrt sind zwei polymorphe Stellen, die mit beträchtlicher Häufigkeit gemeinsam vererbt werden, auf demselben Chromosom miteinander gekoppelt. Eine Analyse der Häufigkeit der Weitergabe erlaubt so die Erstellung einer Genkarte von Markern. Daher schafft die vorliegende Erfindung ein Mittel zur Kartierung der Genome von Pflanzen und Tieren.
  • Die Auflösung einer Genkarte ist proportional zur Anzahl an Markern, die sie enthält. Da die Verfahren der vorliegenden Erfindung verwendet werden kön nen, um eine große Anzahl polymorpher Stellen zu isolieren, können sie zur Erstellung einer Karte mit irgendeinem gewünschten Auflösungsgrad verwendet werden.
  • Die Sequenzierung der polymorphen Stellen erhöht ihre Brauchbarkeit bei der Genkartierung stark. Solche Sequenzen können verwendet werden, um Oligonucleotid-Primer und -Sonden zu konstruieren, die eingesetzt werden können, um das Chromosom "hinunter zu wandern" und dadurch neue Markerstellen zu identifizieren (Bender, W. et al., J. Supra. Molec. Struc. 10 (suppl.): 32 (1979); Chinault, A. C. et al., Gene 5: 111–126 (1979); Clarke, et al. Nature 287: 504–509 (1980)).
  • Die Auflösung der Karte kann weiter erhöht werden durch Kombinieren der polymorphen Analysen mit Daten zum Phänotyp anderer Eigenschaften der Pflanze oder des Tieres, dessen Genom kartiert wird. Wenn daher ein bestimmter Polymorphismus zusammen mit brauner Haarfarbe weitergegeben wird, dann bildet sich der Polymorphismus an einem Ort nahe dem Gen oder den Genen, die für die Haarfarbe verantwortlich sind, ab. In ähnlicher Weise können biochemische Daten verwendet werden, um die Auflösung der Genkarte zu erhöhen. Bei dieser Ausführungsform wird eine biochemische Bestimmung (wie ein Serotyp, eine Isoform, etc.) studiert, um festzustellen, ob sie mit irgendeiner polymorphen Stelle gemeinsam weitergegeben wird. Solche Karten können verwendet werden, um neue Gensequenzen zu identifizieren, um beispielsweise die für eine Krankheit ursächlichen Mutationen zu identifizieren.
  • Tatsächlich erlaubt es einem die Identifizierung der SNPs der vorliegenden Erfindung, komplementäre Oligonucleotide als Primer in der PCR oder anderen Reaktionen zu verwenden, um neue Gensequenzen, die an beiden Seiten des SNP liegen, zu isolieren und zu sequenzieren. Die Erfindung umfaßt solche neuen Gensequenzen. Die genomischen Sequenzen, die durch die Verwendung solcher Primer als Klone isoliert werden können, können in RNA transkribiert und als Protein exprimiert werden. Die vorliegende Erfindung umfaßt auch ein solches Protein sowie Antikörper und andere Bindungsmoleküle, die in der Lage sind, an ein solches Protein zu binden.
  • Die Erfindung ist unten bezüglich zwei ihrer Ausführungsformen – Pferde und Menschen – veranschaulicht. Weil jedoch die fundamentalen Grundsätze der Genetik unabhängig von der Spezies gelten, ist eine solche Darstellung gleichermaßen auf irgendeine andere Spezies anwendbar. Durchschnittsfachleute würden daher nur die Verfahren der obigen Erfindung direkt anwenden müssen, um SNPs in irgendeiner anderen Spezies zu isolieren und dadurch die genetische Analyse der vorliegenden Erfindung durchzuführen.
  • Wie oben angegeben, wurde die LOD-Zählungs(LOD scoring)-Methodik entwickelt, um zu erlauben, dass RFLPs verwendet werden, um sowohl der Vererbung genetischer Eigenschaften nachzugehen, als auch eine Genkarte einer Spezies aufzubauen (Lander, S. et al., Proc. Natl. Acad. Sci. (USA) 83: 7353–7357 (1986); Lander, S. et al., Proc. Natl. Acad. Sci. (USA) 84: 2363–2367 (1987); Donis-Keller, H. et al., Cell 51: 319–337 (1987); Lander, S. et al., Genetics 121: 185–199 (1989)). Solche Verfahren können leicht angepaßt werden, um ihre Verwendung mit den Polymorphismen der vorliegenden Erfindung zu erlauben. Tatsächlich sind derartige Polymorphismen in dieser Hinsicht RFLPs und STRs überlegen. Wegen der Häufigkeit von SNPs ist es möglich, leicht eine dichte Genkarte zu erzeugen. Darüber hinaus sind die Polymorphismen der vorliegenden Erfindung, wie oben angegeben, stabiler als typische RFLP-Polymorphismen (vom VNTR-Typ).
  • Die Polymorphismen der vorliegenden Erfindung weisen direkte genomische Sequenzinformation auf und können daher durch eine Anzahl von Verfahren bestimmt werden. In einer RFLP- oder STR-abhängigen Karte muß die Analyse auf Gel basieren und erfordert, dass ein elektrophoretisches Profil der DNA des Zieltiers erhalten wird. Im Gegensatz dazu kann eine Analyse der Polymorphismen (SNPs) der vorliegenden Erfindung unter Verwendung spektrophotometrischer Verfahren durchgeführt werden und kann leicht automatisiert werden, um die Analyse großer Anzahlen von Zieltieren zu erleichtern.
  • Nachdem nun die Erfindung allgemein beschrieben wurde, wird selbige besser verstanden werden durch Bezugnahme auf die folgenden Beispiele der Isolierung und Analyse von Polymorphismen beim Pferd, die zur Veranschaulichung angegeben werden und nicht dazu gedacht sind, für die vorliegende Erfindung beschränkend zu wirken.
  • BEISPIEL 1
  • Auffinden von Polymorphismen beim Pferd
  • Als ein anfänglicher Schritt bei der Identifizierung von Pferde-Polymorphismen wurden kleine Schrotschuß-Bibliotheken aus genomischer DNA hergestellt, die aus Peripherblut-Leukozyten, die auf einem Ficoll-Hypaque-Dichtegradienten gereinigt worden waren, aus dem Blut eines einzigen, 15 Jahre alten Vollblut-Wallachs (John Henry) isoliert worden war. Diese DNA wurde vollständig gleichzeitig mit BamHI und PstI verdaut und entweder direkt oder nach Größenfaktionierung auf Agarosegelen verwendet.
  • Vektor pLT14 (eine Variante des Stratagene-Plasmids pKSM13(–)) wurde mit BamHI und PstI verdaut, und linearisierte DNA wurde von einem Agarosegel gereinigt. Agarose-Pfropfen wurden sowohl für Vektor- als auch größenfraktionierte genomische DNA in gesättigtem Natriumiodid solubilisiert, und die DNA wurde danach auf Glaspulver immobilisiert. Nach dem Waschen wurde die DNA mit Wasser eluiert und mittels Ethanol mit einem Glycogen-Träger ausgefällt.
  • Ligationen mit wechselnden Vektor/Insert-Verhältnissen wurden mit T4-DNA-Ligase bei 4°C bewirkt. Der E. coli-Stamm XLI wurde mit Ligations-Gemischen transformiert und auf LB-Agar, der 100 g/ml Ampicillin enthielt, aufgebracht. Näherungsweise 50.000 Klone wurden in mehreren verschiedenen Experimenten unter Verwendung größenfraktionierter oder unfraktionierter Insert-DNA erzeugt. Nicht aufgebrachte transformierte Zellen wurden in 7% DMSO bei –70° C aufbewahrt. Von den Kolonien wurde zur Isolierung ein Abstrich gemacht, und es wurden Plasmid-Präparationen im kleinen Maßstab durchgeführt, um die Größe der eingesetzten Pferde-DNA zu bestimmen. Präparationen im größeren Maßstab wurden mit Quiagen-Chromatographie durchgeführt.
  • Die Sequenz der ersten 200–300 Nucleotide des genomischen Inserts wurde durch das kettenterminierende Dideoxynucleosid-Verfahren mit T7 DNA-Polymerase von zu Plasmidsequenzen komplementären Primern bestimmt. Diese Information wurde verwendet, um zu den Pferde-Sequenzen komplementäre, synthetische Oligonucleotid-Primer, die in PCR-Reaktionen eingesetzt werden sollten, zu konstruieren.
  • In den meisten Fällen wurden zwei Sätze PCR-Primer (im allgemeinen 25 monomere Einheiten) synthetisiert. Der erste Satz wurde verwendet, um unter einem standardisierten Satz von Bedingungen von genomischer DNA zu amplifizieren. Die Produkte dieser Reaktionen wurden verdünnt und als Matrizen-DNA in einer zweiten PCR verwendet, wobei geschachtelte Primer geringfügig innerhalb des ursprünglichen Satzes verwendet wurden. Die Produkte dieser beiden Reaktionen wurden mit denjenigen verglichen, die unter Verwendung der ursprünglichen Plasmid-DNA als Matrize erhalten wurden. In den meisten Fällen war es möglich, unter Verwendung dieses Verfahrens ohne den Versuch einer Optimierung der Reaktionsbedingungen für irgendein bestimmtes Paar von Primern, Einzelspezies-Produkte hoher Qualität zu erhalten.
  • Zwei verschiedene Verfahren wurden verwendet, um amplifizierte DNA von Pferden auf polymorphe Sequenzen abzusuchen. Zu Beginn wurden PCR-Fragmente von einer Gruppe von 6 Pferden mit einer Gruppe von Restriktions-Endonucleasen mit 4 Basen-Erkennungsstellen verdaut. Die Produkte dieser Reaktionen wurden durch Acrylamid-Gelelektrophorese auf 5%igen bis 7,5%igen nicht-denaturierenden Gelen analysiert. Dies Verdauprodukte, die bei Hybridisierung an verschiedene Mitglieder der Gruppe Variabilität zeigten, wurden der DNA-Sequenzanalyse unterzogen. Später wurde die DNA-Sequenzierung direkt verwendet, um auf polymorphe Stellen abzusuchen. Die PCR-Fragmente von fünf nicht verwandten Pferden wurden von Acrylamid- Gelen elektroeluiert und unter Verwendung wiederholter Reaktionszyklen mit thermostabiler Taq-Polymerase in Anwesenheit eines Gemisches von dNTPs und fluoreszierenden ddNTPs sequenziert. Die Produkte wurden dann getrennt und unter Verwendung des automatisierten DNA-Sequenzierungsgeräts von Applied Biosystems, Inc. analysiert. Die Daten wurden unter Verwendung von ABI-Software analysiert. Unterschiede zwischen Sequenzen verschiedener Tiere wurden von der Software identifiziert und durch Prüfung des relevanten Bereichs der Chromatogramme auf dem Computerbildschirm bestätigt. Der Schluß, dass die Unterschiede ein DNA-Polymorphismus waren, wurde nur gezogen, wenn die Daten für beide Stränge verfügbar waren und/oder bei mehr als einem haploiden Beispiel unter den fünf getesteten Pferden vorlagen.
  • BEISPIEL 2
  • Charakterisierung von Polymorphismen beim Pferd
  • Das Programm zur Identifizierung und Charakterisierung polymorpher DNA-Sequenzen in willkürlich ausgewählten Fragmenten wurde fortgesetzt, so dass näherungsweise 550 Plasmide bis zu dieser Ebene charakterisiert wurden. Die den Klonierungsstellen benachbarten Sequenzen wurden für 200 dieser Plasmide bestimmt. Inserte dieser sequenzierten Plasmide lagen im Größenbereich von 0,25 bis 3,5 kb. Unter Verwendung dieser Sequenzinformation wurden Oligonucleotid-Primer konstruiert; um eine PCR-Amplifikation desselben genomischen Bereichs von verschiedenen Pferden zu ermöglichen.
  • Zur Identifizierung der an polymorphen Stellen vorliegenden Nucleotide wurden PCR-Fragmente von 5 Pferden von Acrylamid-Gelen durch Elektroeluierung gereinigt und unter Verwendung von Taq-Polymerase-"Zyklus"-Sequenzierungs-Biochemie und automatisierter Sequenzierungsausrüstung vollständig sequenziert. Die Ergebnisse der 5 Pferde wurden mittels Computer analysiert und visuell bestätigt. Mit diesem Verfahren aufgefundene DNA-Sequenzvarianten wurden nur gewertet, wenn die Sequenz an beiden Strängen erhalten wurde und die Variantensequenz in mehr als einem haploiden Beispiel gefunden wurde. Die 18 Klone von Tabelle 1 weisen einen Untersatz identifizierter SNPs auf. In Tabelle 1 ist die unmittelbar 5'-proximate Sequenz, die Identität des Nucleotids der polymorphen Stelle, und die unmittelbar 3'-distale Sequenz jedes SNP dargestellt. Für jeden SNP sind solche Sequenzen in den horizontalen Reihen gezeigt. Die Sequenzen doppelsträngiger DNA in Tabelle 1 sind entsprechend den Sequenzprotokoll-Erfordernissen des United States Patent and Trademark Office (Patent- und Markenamt der USA) dargestellt. Daher sind alle Sequenzen in derselben Orientierung (5'→3') dargestellt. Der Aufbau der Tabelle ist in 6 im Hinblick auf einen veranschaulichenden SNP, Klon 177-2, veranschaulicht. Dieser SNP hat eine polymorphe Stelle, die entweder ein C oder ein T in einem Strang, und ein G oder ein A im entgegengesetzten Strang, haben kann. Die 5'-proximate DNA-Sequenz, die der polymorphen Stelle in dem C/T-Strang unmittelbar vorangeht, wird als SEQ ID NO: 1 bezeichnet. Die 3'-distale Sequenz, die der polymorphen Stelle in dem C/T-Strang unmittelbar folgt, wird als SEQ ID NO: 2 bezeichnet. Die 5'-proximale DNA-Sequenz, die der polymorphen Stelle in dem G/A-Strang unmittelbar vorangeht, wird als SEQ ID NO: 3 bezeichnet. Die 3'-distale Sequenz, die der polymorphen Stelle in dem G/A-Strang unmittelbar folgt, wird als SEQ ID NO: 4 bezeichnet. Wenn man bedenkt, dass die Sequenzen in derselben Orientierung (5'→3') geschrieben sind, wird man erkennen, dass die Sequenzen von SEQ ID NO: 1 und SEQ ID NO: 4 komplementär sind; gleichermaßen sind die Sequenzen SEQ ID NO: 2 und SEQ ID NO: 3 komplementär. Die Sequenzen, die eine bestimmte polymorphe Stelle flankieren, werden daher durch Vereinen der proximalen Sequenz einer Reihe mit der distalen Sequenz, die auch in derselben Reihe gezeigt ist, erhalten.
  • Figure 00510001
  • Die vorliegende Beschreibung bezieht sich auf die obigen Sequenzen durch ihre Sequenz-ID-Ziffern (d. h. SEQ ID NO). Zur Erleichterung einer derartigen Offenbarung wird ein algebraisches Bezeichnungssystem (wie "2n + 1") in Übereinstimmung mit konventioneller Algebra verwendet. Daher bedeutet die Bezeichnung "SEQ ID NO: (2n + 1)" SEQ ID NO: 5, wenn n = 2, und SEQ ID NO: 7, wenn n = 3, etc.
  • BEISPIEL 3
  • Allelhäufigkeitsanalyse von Pferde-Polymorphismen in Studien kleiner Populationen
  • Studien an kleinen Populationen (50–60 Tiere) dieser DNA-Sequenz-Polymorphismen wurden bei einer Anzahl dieser polymorphen Stellen unter Verwendung genetischer Bitanalyse (Genetic Bit Analysis (GBA)), dem bevorzugten Einzelnucleotid-Festphasen-Abfragesystem (Goelet, P. et al. (WO 92/15712)) durchgeführt. Die 7 Schritte der am meisten bevorzugten Ausführungsform sind in 7 veranschaulicht:
    Schritt 1: DNA-Herstellung.
    Schritt 2: Amplifikation der Zielsequenz: Nach Herstellung von DNA aus der Probe wird ein spezifischer Bereich des Proben-Genoms (Ort) unter Verwendung der PCR amplifiziert. Einer der PCR-Primer ist mit vier Phosphorthioat-Bindungen am 5'-Ende modifiziert.
    Schritt 3: Exonuclease-Verdau und die Erzeugung einzelsträngiger Matrizen. Das PCR-Produkt wird mit Exonuclease verdaut, wobei der phosphorthioatierte Strang intakt gelassen wird.
    Schritt 4: Hybridisierung zum Festhalten der amplifizierten Matrize. Der Matrizenstrang wird als nächstes an den passenden GBA-Primer, der an der Oberfläche einer Mikrotitermulde immobilisiert ist, hybridisiert.
    Schritt 5: Einzelbasen-Extension mit Polymerase. DNA-Polymerase und haptenierte ddNTPs werden verwendet, um die GBA-Primer in Matrizen-abhängiger Weise um eine Base zu verlängern.
    Schritt 6: Colorimetrischer Nachweis des Extensionsprodukts. Nachdem die Matrize unter Verwendung von NaOH weggewaschen wurde, wird die haptenierte Base unter Verwendung eines Anti-Hapten-Konjugats und des passenden colorimetrischen Substrats nachgewiesen.
    Schritt 6: Computer-unterstützte Interpretation des Genotyps. Die colorimetrischen Daten von einer Anzahl von Orten werden in einen SNP-Genotyp für das bestimmte getestete Individuum umgesetzt.
  • Das Verfahren wird bevorzugt in der folgenden Weise durchgeführt:
  • GBA-Matrizen-Herstellung
  • Die Amplifikation der genomischen Sequenzen wurde unter Verwendung der Polymerasekettenreaktion (polymerase chain reaction, PCR) durchgeführt. In einem ersten Schritt wurden 100 Nanogramm genomische DNA in einem Reaktionsgemisch verwendet, das jeden Erstrunden-Primer in einer Konzentration von 2 M und 10 mM Tris, pH 8,3, 50 mM KCl, 1,5 mM MgCl2, 0,01% Gelatine; und 0,05 Einheiten pro l Taq DNA-Polymerase (AmpliTaq (Eingetragene Marke), Perkin Elmer) enthielt.
  • Um eine einzelsträngige Matrize zur Verwendung mit dem in fester Phase immobilisierten Primer zu erhalten, kann irgendeines von zwei Verfahren verwendet werden. Erstens kann die Amplifikation unter Verwendung von Primern, die 4 Phosphorthioat-nucleotid-Derivate enthalten, vermittelt werden, wie es von Nikiforov, T. (US-Patentanmeldung Anmeldenummer 08/005 061, entsprechend WO94/16090, veröffentlicht am 21. Juli 1994) gelehrt wird. Alternativ kann eine zweite PCR-Runde unter Verwendung "asymetrischer" Primerkon zentrationen durchgeführt werden. Die Produkte der ersten Reaktion werden in einer zweiten Reaktion 1/1000 verdünnt. Einer der Zweitrunden-Primer wird in der Standardkonzentration von 2 M verwendet, während der andere mit 0,08 M verwendet wird. Unter diesen Bedingungen werden während der Reaktion einzelsträngige Moleküle synthetisiert.
  • Festphasen-Immobilisierung von Nucleinsäuren
  • Für das GBA-Verfahren vereinfacht eine Festphasen-Bindung des Matrizen-Primer-Komplexes Wäschen, Puffer-Austausch, etc., und im Prinzip kann diese Bindung entweder über die Matrize oder den Primer erfolgen. In der Praxis ist jedoch, insbesondere wenn keine Nachweisverfahren auf Gelbasis verwendet werden, die Bindung über den Primer bevorzugt. Dieses Format erlaubt die Verwendung stringenter Wäschen (z. B. 0,2 N NaOH), um Verunreinigungen und Reaktions-Nebenprodukte zu entfernen, während das haptenierte Dideoxynucleotid kovalent an das 3'-Ende des Primers gebunden bleibt.
  • Daher wurde für GBA-Reaktionen in 96-Mulden-Platten (Nunc Nunclon (eingetragene Marke)-Platten, Roskilde, Dänemark) der GBA-Primer kovalent an die Platte gekoppelt. Dies wurde erreicht durch Inkubieren von 10 pmol Primer mit einer 5'-Aminogruppe pro Mulde in 50 von 3 mM Natriumphosphat-Puffer, pH 6, 20 mM 1-Ethyl-3(3-dimethylaminopropyl)-carbodiimid (EDC) über Nacht bei Raumtemperatur. Nach dem Koppeln wurde die Platte dreimal mit TNTw gewaschen.
  • GBA in Mikromuldenplatten
  • Die Hybridisierung einzelsträngiger DNA an Primer, die kovalent an 96 Mulden-Platten gekoppelt waren, wurde durch Zugabe eines gleichen Volumens an 3 M NaCl, 20 mM EDTA zu dem einzelsträngigen PCR-Produkt und Inkubieren jeder Mulde mit 20 l dieses Gemisches 30 Minuten lang bei 20°C aus geführt. Die Platte wurde danach dreimal mit TNTw gewaschen. Zwanzig l Polymerase-Extensionsgemisch, enthaltend ddNTPs (jeweils 3 M, von denen eines biotinyliert war), 5 mM DTT, 7,5 mM Natriumisocitrat, 5 mM MnCl2, 0,04 Einheiten pro l Klenow-DNA-Polymerase und 5 Minuten lang bei Raumtemperatur inkubiert.
  • Nach der Extensionsreaktion wurde die Platte einmal mit TNTw gewaschen. Die Matrizenstränge wurden entfernt, indem die Mulden 5 Minuten lang bei Raumtemperatur mit 50 μl 0,2 N NaOH inkubiert wurden, dann die Mulde mit weiteren 50 μl 0,2 N NaOH gewaschen wurde. Die Platte wurde dann dreimal mit TNTw gewaschen. Der Einbau biotinylierter ddNTPs wurde mittels eines Enzym-Assays gemessen. Jede Mulde wurde mit 20 μl Streptavidin-konjugierter Meerrettichperoxidase (Verdünnung 1/1000 in TNTw des von BRL, Gaithersburg, MD erworbenen Produkts) unter Bewegung 30 Minuten lang bei Raumtemperatur inkubiert. Nach fünfmaligem Waschen mit TNTw wurden 100 μl o-Phenylendiamin (OPD, 1 mg/ml in 0,1 M Zitronensäure, pH 4,5) (BRL), die 0,012% H2O2 enthielten, zu jeder Mulde zugegeben. Die Menge an gebundenem Enzym wurde kinetisch mit einem 96Mulden-Spektrophotometer "Vmax" von Molecular Devices bestimmt. Die 8A und 8B veranschaulichen, wie Pferde-Elternschaftsdaten auf der Mikrotiterplatten-Ebene erscheinen. Bei Standard-Pferde-Elternschaftstests werden die 85 Proben (Kolonnen 1–11) plus Kontrollen (Kolonne 12) auf einer Platte angeordnet. Für jeden Pferde-Ort wird das Vorliegen der zwei bekannten Allele durch basenspezifisches Abfragen auf getrennten Platten bestimmt. Die zwei in den 8A und 8B gezeigten Platten sind hinsichtlich PCR-Matrize und GBA-Primer identisch und unterscheiden sich nur in dem biotinylierten ddNTP, das in der Extensionsreaktion verwendet wurde (Biotin-ddCTP in 8A und Biotin-ddTTP in 8B). Bei Zugabe des colorimetrischen Reagens (OPD) wurde die Extinktion der sich ergebenden Farbe in einem Mikrotiterplatten-Lesegerät von Molecular Devices gemessen und die Rohdaten in MilliOD/min pro Mulde erzeugt. Die zwei Rohdaten-Graumaßstab-Darstellungen der Extinktionsdaten für diese Platten sind in den Figuren in genau derselben Anordnung wie auf den Mikrotiterplatten gruppiert. Die Graumaßstab-Intensität korreliert direkt mit der Farberzeugung. An diesem biallelischen Ort sind die festgestellten Basen C (8A) und T (8B). Näherungsweise 40% der bisher getesteten Pferde sind heterozygot (die Probe in Mulde A1, beispielsweise) und die verbleibenden homozygot für C (A2, beispielsweise) oder T (B3, beispielsweise). Synthetische Matrizen-Kontrollen umfassen eine C-homozygote Kontrolle (Mulde E 12), eine T-homozygote Kontrolle (Mulde F12) und eine heterozygote Kontrolle (Mulde G12). Der Maßstab bezieht sich auf MilliOD/min bei 450 nm. Die meisten positiven Proben hatten in diesem Fall Signale über 100. In diesem Format würden für einen Pferde-Elternschaftstest mit einer biallelischen Markergruppe von 28 für eine vollständige Typisierung der 85 Pferde 56 derartige Platten erforderlich sein.
  • Einundfünfzig beliebige, nicht verwandte Pferde und drei Vatertier/Muttertier/Fohlen-Familien wurden für eine Studie ausgewählt, um festzustellen, dass ein vernünftiger Unter-Satz der Gruppe von DNA-Markern, die bisher gefunden wurden, wahrscheinlich die gewünschte p(exc) ≥ 0,90 liefern würde, und um die Leistungsfähigkeit der DNA-Marker zu untersuchen, was es erlaubt, dass bei ihnen für endgültige Allelhäufigkeits-Messungen Prioritäten gesetzt werden.
  • Aus der genomischen DNA jedes Tiers wurde PCR-erzeugte einzelsträngige Matrizen-DNA hergestellt. Dieses Material wurde unter Verwendung von GBA bezüglich Nucleotid-Varianten typisiert. Die für jede polymorphe Stelle erhaltenen Genotyp-Daten sind in Tabelle 2 zusammengefaßt. Aus diesen Genotypdaten wurden Allelhäufigkeiten bestimmt und zur Berechnung der p(exc) jeder Stelle verwendet. Die kumulative p(exc) ist für die Gruppe der in den Tabellen 1 und 2 aufgelisteten 18 Stellen angegeben, beträgt 0,955 für die Gruppe. In den Tabellen 2–5 ist der Genotyp als entweder homozygot (d. h. PP oder QQ) oder heterozygot (PQ) angegeben. Die Ziffern in Klammern bezeichnen die Anzahl an Allelen des betrachteten Genotyps.
  • Figure 00570001
  • BEISPIEL 4
  • Elternschafts-Test
  • Eine Familie, bestehend aus einem Vatertier, einem Muttertier und einem Abkömmling, wurde hinsichtlich der oben diskutierten 18 variablen Stellen typisiert, wobei keine Ausschlüsse gefunden wurden. Bei dieser Familie war vorher nicht die Blutgruppe bestimmt worden. Unter Verwendung der vorhergehenden Allelhäufigkeits-Zahlen, die in Tabelle 2 angegeben sind, ist es möglich, eine p(exc)-Tabelle aufzubauen, die sich auf diesen speziellen Fall bezieht (Tabelle 3). Diese Tabelle ist im wesentlichen unter der Annahme aufgebaut, dass die Identität des Muttertiers nicht fraglich ist (obwohl es in der Praxis möglich ist, die Stute auszuschließen, wenn keines ihrer Allele von dem Fohlen geerbt wurde). Tabelle 3 zeigt die Typisierungsdaten für das Fohlen und sein Muttertier, wobei in diesem Fall die getesteten Stellen in der Reihenfolge des Informationsgehalts aufgelistet sind. Die cum p(exc) insgesamt unter Verwendung von 18 Orten war 0,942.
  • Figure 00590001
  • BEISPIEL 5
  • Identitätstest
  • Es ist von Interesse, von der Populations-Analysegruppe Gebrauch zu machen, um Vorab-Information bezüglich anderer Aspekte der Markergruppe zu gewinnen. Beispielsweise ist es unter Verwendung der Allelhäufigkeits-Daten möglich, einen Wahrscheinlichkeitswert der Identität [p(ID)] für die 18 Stellen zu berechnen, der gleich 4,79 × 10–7 oder näherungsweise 1 in 2,1 Millionen ist. Daher würde man vorhersagen, dass keines der untersuchten Pferde in der Populationsgruppe denselben Genoytp hat, und eine Computer-Analyse der Genotyp-Datenbank offenbarte, dass dies der Fall ist. Wie in Tabelle 4 gezeigt ist, erreicht die p(ID) sehr kleine Zahlen bei Analyse vergleichsweise weniger Orte. Bei Verwendung der oberen sieben Stellen ist die Wahrscheinlichkeit, dass zwei beliebige Tiere verschiedene Genotypen haben, bereits 99,9%.
  • TABELLE 4
    Figure 00600001
  • Falschanzeige-Rate
  • Bei der gegenwärtigen Studie können zwei Arten möglicher falscher Anzeigen angetroffen werden, entweder aufgrund von (1) PCR-Fehlern oder aufgrund von (2) Unvereinbarkeit zwischen den an entgegengesetzten Strängen erhaltenen Genotypen. Nur Daten von jenen Tieren, die an beiden Strängen erfolgreich typisiert wurden, wurden in die Allelhäufigkeits-Berechnungen aufgenommen. Sechzig Pferde, die bezüglich 18 Stellen typisiert wurden, summiert sich zu 1.080 Genotypisierungen. 95% aller Typisierungs-Experimente waren insgesamt erfolgreich. Keine Typisierungs-Irrtümer lagen an traditionellen PCR-Fehlern. 3,8% falsche Anzeigen wurden auf der GBA-Stufe angetroffen, entweder weil die PCR auf der Einzelstrangstufe nicht erfolgreich war, oder wegen eines Irrtums der Bedienungsperson. 1,1% aller Typisierungen ergaben aus unbekannten Gründen unvereinbare Daten zwischen den Strängen.
  • In Summe ist das GBA (genetic bit analysis)-Verfahren daher ein einfaches, praktisches und automatisierbares Verfahren zum Abfragen von SNPs. Bei diesem Verfahren wird sequenzspezifisches Annealing an einen an eine feste Phase gebundenen Primer verwendet, um eine einzige polymorphe Stelle in einer Nucleinsäure-Probe auszuwählen, und die Ergründung dieser Stelle findet über eine hochgradig genaue DNA-Polymerase-Reaktion unter Verwendung eines Satzes neuer, nicht radioaktiver Dideoxynucleotid-Analolge statt. Eines der zugkräftigsten Merkmale der GBA-Herangehensweise ist, dass, weil die tatsächliche Allel-Unterscheidung durch die DNA-Polymerase durchgeführt wird, ein Satz von Reaktionsbedingungen zum Abfragen vieler verschiedener polymorpher Orte verwendet werden kann. Dieses Merkmal erlaubt Kostenverringerungen bei komplexen DNA-Tests durch Ausnutzung paralleler Formate und ermöglicht eine rasche Entwicklung neuer Tests.
  • Die intrinsische Fehlerrate des GBA-Verfahrens in seinem vorliegenden Format scheint niedrig zu sein; das Signal/Rausch-Verhältnis hinsichtlich korrektem gegenüber nicht korrektem Nucleotid-Einbau für Homozygoten scheint näherungsweise 20:1 zu sein. Die GBA ist daher ausreichend quantitativ, um den verläßlichen Nachweis von Heterozygoten in Genotypisierungs-Studien zu er lauben. Die Anwesenheit aller vier Dideoxynucleosid-triphosphate als die einzigen Nucleotid-Substrate in der DNA-Polymerase-vermittelten Extensionsreaktion erhöht die Genauigkeit von Genotyp-Bestimmungen durch Unterdrückung eines Fehleinbaus. Die GBA kann bei irgendeiner Anwendung, bei der gegenwärtig Punktmutation-Analysen eingesetzt werden – einschließlich Genkartierung und Kopplungsstudien, genetische Diagnosen und Identitäts/Vaterschafts-Tests – verwendet werden, unter der Annahme, dass die umgebende DNA-Sequenz bekannt ist.
  • BEISPIEL 6
  • Analyse eines SNP beim Menschen
  • Menschliche Einzelnucleotidpolymorphismen können in derselben Weise wie die oben beschriebenen Pferde-Polymorphismen verwendet werden. Beispiele für geeignete menschliche Polymorphismen sind in Tabelle 5 angegeben.
  • Figure 00630001
  • Zum Zwecke der Bestätigung der Strategie der Umwandlung menschlicher SNPs in ein GBA-Testformat wurde eine phänotypisch neutrale SNP-Stelle umgewandelt und durch GBA getestet. Diese Stelle wurde aus der Johns Hopkins University OMB-Datenbank menschlicher Polymorphismen ausgewählt. Die Stelle ist met-H auf Chromosom 7 bei q31, Mutationsposition 127, A gegen G (Horn, G. T. et al., Clin. Chem. 36, 1614–1619, 1990). Die folgenden Oligonucleotide wurden synthetisiert (p = Phosphorthioat):
    PCR-Primer Nr. 1552 (SEQ ID NO: 93)
    5'-CpApTpCpCATGTAGGAGAGCCTTAGTC
    PCR-Primer Nr. 1553 (SEQ ID NO: 94)
    5'-CCATTTTTGTGTCTTCTAGTCTAAGG
    GBA-Primer Nr. 1554 (SEQ ID NO: 95)
    5'-TTGAAAGATCGTCAGAAAAATCC
  • Menschliche DNA-Proben wurden willkürlich aus den DNA-Archiven zweier Familien, die von der Familiensammlung des Centre D'Etude du Polymorphisme Humaine (CEPH) erhältlich waren, ausgewählt. Eine negative Kontrolle, die keine DNA enthielt, wurde ebenfalls verwendet. Proben-DNAs wurden durch PCR unter Verwendung der obigen Primer amplifiziert, und das sich ergebende Produkt wurde hinsichtlich der zwei möglichen Basen an der polymorphen Stelle, G und A, durch GBA analysiert. GBA-Ergebnisse wurden durch eine Endpunkt-Ablesung der Extinktion bei 450 nm in einem Mikrotiterplatten-Lesegerät erhalten. Die Daten sind in Tabelle 6 angegeben.
  • Die Proben 1, 2, 4, 6 und 8 waren homozygot für A, die Proben 7 und 9 waren homozygot für G und die Proben 3 und 5 waren GA-Heterozygoten. Diese DNAs wurden bisher durch kein anderes Verfahren auf diesen Biallelismus getestet.
  • Figure 00650001
  • Falschanzeige-Rate
  • Bei der gegenwärtigen Studie können zwei Arten möglicher falscher Anzeigen angetroffen werden, entweder aufgrund von (1) PCR-Fehlern oder aufgrund von (2) Unvereinbarkeit zwischen den an entgegengesetzten Strängen erhaltenen Genotypen. Nur Daten von jenen Tieren, die an beiden Strängen erfolgreich typisiert wurden, werden in die Allelhäufigkeits-Berechnungen aufgenommen. Sechzig Pferde, die bezüglich 18 Stellen typisiert wurden, summieren sich zu 1.080 Genotypisierungen. 95% aller Typisierungs-Experimente waren insgesamt erfolgreich. Keine Typisierungs-Irrtümer lagen an traditionellen PCR-Fehlern. 3,8% falsche Anzeigen wurden auf der GBA-Stufe angetroffen, entweder weil die PCR auf der Einzelstrangstufe nicht erfolgreich war, oder wegen eines Irrtums der Bedienungsperson. 1,1% aller Typisierungen ergaben aus unbekannten Gründen unvereinbare Daten zwischen den Strängen.
  • In Summe ist das GBA (genetic bit analysis)-Verfahren ein einfaches, praktisches und automatisierbares Verfahren zum Abfragen von SNPs. Bei diesem Verfahren wird sequenzspezifisches Annealing an einen an eine feste Phase gebundenen Primer verwendet, um eine einzige polymorphe Stelle in einer Nucleinsäure-Probe auszuwählen, und die Ergründung dieser Stelle findet über eine hochgradig genaue DNA-Polymerase-Reaktion unter Verwendung eines Satzes neuer, nicht radioaktiver Dideoxynucleotid-Analolge statt. Eines der zugkräftigsten Merkmale der GBA-Herangehensweise ist, dass, weil die tatsächliche Allel-Unterscheidung durch die DNA-Polymerase durchgeführt wird, ein Satz von Reaktionsbedingungen zum Abfragen vieler verschiedener polymorpher Orte verwendet werden kann. Dieses Merkmal erlaubt Kostenverringerungen bei komplexen DNA-Tests durch Ausnutzung paralleler Formate und ermöglicht eine rasche Entwicklung neuer Tests.
  • Die intrinsische Fehlerrate des GBA-Verfahrens in seinem vorliegenden Format scheint niedrig zu sein; das Signal/Rausch-Verhältnis hinsichtlich korrektem gegenüber nicht korrektem Nucleotid-Einbau für Homozygoten scheint näherungsweise 20:1 zu sein. Die GBA ist daher ausreichend quantitativ, um den verläßlichen Nachweis von Heterozygoten in Genotypisierungs-Studien zu erlauben. Die Anwesenheit aller vier Dideoxynucleosid-triphosphate als die einzigen Nucleotid-Substrate in der DNA-Polymerase-vermittelten Extensionsreaktion erhöht die Genauigkeit von Genotyp-Bestimmungen durch Unterdrückung eines Fehleinbaus. Die GBA kann bei irgendeiner Anwendung, bei der gegenwärtig Punktmutations-Analysen eingesetzt werden – einschließlich Genkartierung und Kopplungsstudien, genetische Diagnosen und Identitäts/Vaterschafts-Tests – verwendet werden, unter der Annahme, dass die örtliche umgebende DNA-Sequenz bekannt ist.
  • Sequenzprotokoll
    Figure 00680001
  • Figure 00690001
  • Figure 00700001
  • Figure 00710001
  • Figure 00720001
  • Figure 00730001
  • Figure 00740001
  • Figure 00750001
  • Figure 00760001
  • Figure 00770001
  • Figure 00780001
  • Figure 00790001
  • Figure 00800001
  • Figure 00810001
  • Figure 00820001
  • Figure 00830001
  • Figure 00840001
  • Figure 00850001
  • Figure 00860001
  • Figure 00870001
  • Figure 00880001
  • Figure 00890001
  • Figure 00900001
  • Figure 00910001
  • Figure 00920001
  • Figure 00930001
  • Figure 00940001
  • Figure 00950001
  • Figure 00960001
  • Figure 00970001
  • Figure 00980001
  • Figure 00990001
  • Figure 01000001
  • Figure 01010001
  • Figure 01020001
  • Figure 01030001
  • Figure 01040001
  • Figure 01050001
  • Figure 01060001
  • Figure 01070001
  • Figure 01080001
  • Figure 01090001
  • Figure 01100001
  • Figure 01110001
  • Figure 01120001
  • Figure 01130001
  • Figure 01140001
  • Figure 01150001

Claims (40)

  1. Verfahren zur genetischen Analyse eines Satzes von Individuen derselben Spezies, aufweisend: Bereitstellen einer polymorphen Gruppe, die einen Satz von Einzelnucleotidpolymorphismen (SNPs) aufweist; und Feststellen des Vorliegens oder Fehlens der Polymorphismen in dem Satz von SNPs bei jedem des Satzes von Individuen; und Feststellen, ob des Vorliegen oder Fehlen eines bestimmten Allels eines Polymorphismus in dem Satz von SNPs mit einer bestimmten Eigenschaft verbunden ist.
  2. Verfahren nach Anspruch 1, bei dem der SNP nicht die Eigenschaft bewirkt.
  3. Verfahren nach Anspruch 1, außerdem aufweisend: Analysieren der Weitergabehäufigkeit zwischen den SNPs in dem Satz unter Erstellen einer Genkarte, in der die SNPs als Marker wirken.
  4. Verfahren zur Bestimmung der Wahrscheinlichkeit, dass eine Nucleinsäure-Probe von einem bestimmten Individuum stammt, aufweisend: Bereitstellen einer polymorphen Gruppe, die einen Satz von Einzelnucleotidpolymorphismen (SNPs) aufweist, von dem Individuum, und einer entsprechenden polymorphen Gruppe von der Probe; Feststellen des Vorliegens oder Fehlens mehrerer SNP-Marker in den zwei Gruppen und Vergleichen der Ergebnisse für jeden SNP-Marker; davon ausgehend Bestimmen einer Wahrscheinlichkeit der Identität oder Nicht-Identität aus jedem Vergleich; und davon ausgehend Bestimmen einer kumulativen Wahrscheinlichkeit der Identität oder Nicht-Identität durch Multiplizieren der von jedem Vergleich gelieferten Wahrscheinlichkeiten.
  5. Verfahren nach Anspruch 4, bei dem die Nucleinsäure-Probe unbekannt ist und das bestimmte Individuum bekannt ist.
  6. Verfahren nach Anspruch 4, bei dem die polymorphe Gruppe einen drei oder mehr SNPs aufweisenden Referenzsatz von Genmarkern aufweist.
  7. Verfahren nach Anspruch 4, bei dem das Vergleichen der Ergebnisse für jeden SNP-Marker das Bestimmen der Allelhäufigkeit der SNPs beinhaltet.
  8. Verfahren nach Anspruch 4, bei dem die kumulative Wahrscheinlichkeit der Identität oder Nicht-Identität größer als etwa 0,95 ist.
  9. Verfahren nach Anspruch 4, bei dem die Nucleinsäure-Moleküle DNA sind.
  10. Verfahren nach Anspruch 4, bei dem die Nucleinsäure-Moleküle RNA sind.
  11. Verfahren zur Bestimmung der Wahrscheinlichkeit, dass ein Individuum der Nachkomme eines mutmaßlichen Vorfahren oder von mutmaßlichen Vorfahren ist oder nicht ist, aufweisend: Bereitstellen einer polymorphen Gruppe, die einen Satz von Einzelnucleotidpolymorphismen (SNPs) aufweist, von dem Individuum, und einer entsprechenden polymorphen Gruppe von dem mutmaßlichen Vorfahren oder den mutmaßlichen Vorfahren; Feststellen des Vorliegens oder Fehlens mehrerer SNP-Marker in den Gruppen des Individuums und des mutmaßlichen Vorfahren oder der mutmaßlichen Vorfahren und Vergleichen der Ergebnisse für jeden SNP-Marker; und davon ausgehend Bestimmen der Wahrscheinlichkeit, dass das Individuum der Nachkomme des mutmaßlichen Vorfahren oder der mutmaßlichen Vorfahren ist oder nicht ist.
  12. Verfahren nach Anspruch 11, bei dem der mutmaßliche Vorfahr ein mutmaßlicher Elternteil ist oder die mutmaßlichen Vorfahren mutmaßliche Eltern sind.
  13. Verfahren nach Anspruch 11, bei dem das Verfahren zum Ausschließen der Vaterschaft eines mutmaßlichen männlichen Elternteils für das Individuum durch Berechnung einer Wahrscheinlichkeit des Vaterschaftsausschlusses aus jedem Vergleich und durch daraus Bestimmen einer kumulativen Wahrscheinlichkeit des Vaterschaftsausschlusses durch Multiplizieren der Wahrscheinlichkeiten des Vaterschaftsausschlusses verwendet wird.
  14. Verfahren nach Anspruch 11, bei dem das Verfahren zur Beurteilung der Wahrscheinlichkeit, dass das Individuum der Nachkomme eines ausgewählten mutmaßlichen weiblichen Elternteils ist, verwendet wird.
  15. Verfahren nach Anspruch 11, bei dem die kumulative Wahrscheinlichkeit der Identität oder Nicht-Identität 0,95 oder größer ist.
  16. Verfahren nach Anspruch 12 oder 13, bei dem die kumulative Wahrscheinlichkeit des Ausschlusses 0,95 oder größer ist.
  17. Verfahren nach Anspruch 16, bei dem die Wahrscheinlichkeit des Ausschlusses größer als 0,99 ist.
  18. Verfahren nach Anspruch 11, bei dem die Bestimmung der Wahrscheinlichkeit, dass das Individuum der Nachkomme des mutmaßlichen Vorfahren oder der mutmaßlichen Vorfahren ist oder nicht ist, erreicht wird durch Identifizieren von Übereinstimmungen, die erhalten wurden durch Vergleichen der Ergebnisse für jeden SNP-Marker und Bestimmen von Allelhäufigkeiten der SNPs in der polymorphen Gruppe oder den polymorphen Gruppen.
  19. Verfahren nach einem der vorangehenden Ansprüche, bei dem die SNP-Marker an mehreren nicht gekoppelten Orten sind.
  20. Verfahren nach einem der vorangehenden Ansprüche, bei dem die SNPs diallelisch oder triallelisch sind.
  21. Verfahren nach einem der vorangehenden Ansprüche, das zum Zweck der Genotypisierung einer Pflanze oder eines Tieres durchgeführt wird.
  22. Verfahren nach Anspruch 21, bei dem das Tier eine Maus, ein Mensch, ein Schaf, ein Pferd, ein Rind, ein Schwein, ein Hund oder eine Katze ist.
  23. Verfahren nach Anspruch 1, bei dem die Eigenschaft eine Anfälligkeit für eine genetische Krankheit ist.
  24. Verfahren nach einem der vorangehenden Ansprüche, bei dem das Vorliegen oder Fehlen der SNPs durch genetische Bitanalyse (GBA) festgestellt wird.
  25. Verfahren nach einem der vorangehenden Ansprüche, bei dem die polymorphe Gruppe drei oder mehr SNPs aufweist.
  26. Verfahren zur Erzeugung einer Genkarte eines Individuums, aufweisend: (a) Bereitstellen einer polymorphen Gruppe, die drei oder mehr Einzelnucleotidpolymorphismen (SNPs) aufweist; (b) Identifizieren der bei einem Vorfahren des Individuums vorliegenden SNP-Varianten durch Bestimmen der Basenidentität an jeder SNP-Stelle des Vorfahren des Individuums und Identifizieren der bei dem Individuum vorliegenden SNP-Varianten durch Bestimmen der Basenidentität an jeder SNP-Stelle des Individuums; (c) Bestimmen der Anzahl von Übereinstimmungen zwischen dem Individuum und dem Vorfahren; und (d) Berechnen des Ausmaßes der genetischen Kopplung zwischen jedem Allel aus der Anzahl von Übereinstimmungen aus Schritt (c) und der Wahrscheinlichkeit, dass irgendein bei dem Individuum gefundenes Paar von Allelen von demselben Vorfahren geerbt wurde, auf der Basis der Allelhäufigkeiten der SNP-Varianten der polymorphen Gruppe, wodurch die Genkarte des Individuums erstellt wird.
  27. Verfahren nach Anspruch 26, bei dem die zum Aufbau der Genkarte verwendeten SNP-Stellen willkürlich überall in dem Genom der Spezies verteilt sind.
  28. Verfahren nach Anspruch 26, bei dem der Vorfahr ausgewählt wird aus der Gruppe, die aus Eltern und Großeltern besteht.
  29. Verfahren nach Anspruch 26, bei dem die SNP-Varianten keine genetische Eigenschaft bewirken.
  30. Verfahren nach Anspruch 1, bei dem die Eigenschaft von Interesse eine Anfälligkeit für eine genetische Krankheit ist.
  31. Verfahren nach Anspruch 1, bei dem die Eigenschaft von Interesse eine genetische Krankheit ist.
  32. Verfahren nach Anspruch 1, bei dem das Individuum aus einem Tier und einer Pflanze ausgewählt wird.
  33. Verfahren nach Anspruch 32, bei dem das Individuum ein Säugetier ist.
  34. Verfahren nach Anspruch 33, bei dem das Säugetier ausgewählt wird aus Menschen, nicht-menschlichen Primaten, Hunden, Katzen, Rindern, Schafen, Pferden, Mäusen, Ratten und Kaninchen.
  35. Verfahren nach Anspruch 34, bei dem das Säugetier ein Mensch ist.
  36. Verfahren nach Anspruch 34, bei dem das Säugetier ein Pferd ist.
  37. Verfahren nach Anspruch 1, bei dem jeder SNP eine Allelhäufigkeit von mindestens 0,20 hat.
  38. Verfahren nach Anspruch 1, außerdem aufweisend die Berechnung eines LOD-Werts und das Feststellen einer genetischen Kopplung von SNP-Varianten und der Eigenschaft von Interesse.
  39. Verfahren nach Anspruch 1, bei dem die polymorphe Gruppe drei oder mehr SNPs aufweist.
  40. Verfahren nach Anspruch 1, bei dem keine der SNP-Varianten in der polymorphen Gruppe die Eigenschaft bewirkt.
DE69434314T 1993-11-03 1994-11-02 Polymorphismus von mononukleotiden und ihre verwendung in der genanalyse Revoked DE69434314T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US14514593A 1993-11-03 1993-11-03
US145145 1993-11-03
US21653894A 1994-03-23 1994-03-23
US216538 1994-03-23
PCT/US1994/012632 WO1995012607A1 (en) 1993-11-03 1994-11-02 Single nucleotide polymorphisms and their use in genetic analysis

Publications (2)

Publication Number Publication Date
DE69434314D1 DE69434314D1 (de) 2005-04-28
DE69434314T2 true DE69434314T2 (de) 2006-03-30

Family

ID=26842710

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69434314T Revoked DE69434314T2 (de) 1993-11-03 1994-11-02 Polymorphismus von mononukleotiden und ihre verwendung in der genanalyse

Country Status (8)

Country Link
US (2) US20020094525A1 (de)
EP (1) EP0726905B1 (de)
AT (1) ATE291583T1 (de)
AU (1) AU8132194A (de)
CA (1) CA2175695A1 (de)
DE (1) DE69434314T2 (de)
ES (1) ES2240970T3 (de)
WO (1) WO1995012607A1 (de)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69531542T2 (de) * 1994-02-07 2004-06-24 Beckman Coulter, Inc., Fullerton Ligase/polymerase-vermittelte analyse genetischer elemente von einzelnukleotid-polymorphismen und ihre verwendung in der genetischen analyse
US5541322A (en) * 1994-10-14 1996-07-30 Glaxo Wellcome Inc. Synthesis of 6-azaandrostenones
US6391550B1 (en) 1996-09-19 2002-05-21 Affymetrix, Inc. Identification of molecular sequence signatures and methods involving the same
EP0941366A2 (de) * 1996-11-06 1999-09-15 Whitehead Institute For Biomedical Research Biallelische marker
US5830665A (en) * 1997-03-03 1998-11-03 Exact Laboratories, Inc. Contiguous genomic sequence scanning
US5888778A (en) * 1997-06-16 1999-03-30 Exact Laboratories, Inc. High-throughput screening method for identification of genetic mutations or disease-causing microorganisms using segmented primers
US6566101B1 (en) 1997-06-16 2003-05-20 Anthony P. Shuber Primer extension methods for detecting nucleic acids
US7105353B2 (en) 1997-07-18 2006-09-12 Serono Genetics Institute S.A. Methods of identifying individuals for inclusion in drug studies
EP0892068A1 (de) * 1997-07-18 1999-01-20 Genset Sa Verfahren zur Herstellung einer genetischen Karte des menschlichen Genoms mit hoher Dichte, basierend auf Linkage Disequilibrium
US6692909B1 (en) 1998-04-01 2004-02-17 Whitehead Institute For Biomedical Research Coding sequence polymorphisms in vascular pathology genes
WO1999053095A2 (en) * 1998-04-09 1999-10-21 Whitehead Institute For Biomedical Research Biallelic markers
US6537751B1 (en) 1998-04-21 2003-03-25 Genset S.A. Biallelic markers for use in constructing a high density disequilibrium map of the human genome
WO1999054500A2 (en) * 1998-04-21 1999-10-28 Genset Biallelic markers for use in constructing a high density disequilibrium map of the human genome
US6525185B1 (en) 1998-05-07 2003-02-25 Affymetrix, Inc. Polymorphisms associated with hypertension
US6703228B1 (en) 1998-09-25 2004-03-09 Massachusetts Institute Of Technology Methods and products related to genotyping and DNA analysis
US6403309B1 (en) 1999-03-19 2002-06-11 Valigen (Us), Inc. Methods for detection of nucleic acid polymorphisms using peptide-labeled oligonucleotides and antibody arrays
WO2001034840A2 (en) * 1999-11-10 2001-05-17 Glaxo Group Limited Genetic compositions and methods
US20020032319A1 (en) * 2000-03-07 2002-03-14 Whitehead Institute For Biomedical Research Human single nucleotide polymorphisms
EP1182265A1 (de) * 2000-08-15 2002-02-27 Eidgenössische Technische Hochschule Zürich Methode zum Nachweis genetischer Merkmale verbesserter Zuchttierembryonen vor Implantation
US6428964B1 (en) 2001-03-15 2002-08-06 Exact Sciences Corporation Method for alteration detection
GB0111886D0 (en) * 2001-05-15 2001-07-04 Animal Health Trust Genetic typing
US20030129630A1 (en) * 2001-10-17 2003-07-10 Equigene Research Inc. Genetic markers associated with desirable and undesirable traits in horses, methods of identifying and using such markers
GB0205455D0 (en) 2002-03-07 2002-04-24 Molecular Sensing Plc Nucleic acid probes, their synthesis and use
CA2491117A1 (en) * 2002-06-28 2004-01-08 Orchid Biosciences, Inc. Methods and compositions for analyzing compromised samples using single nucleotide polymorphism panels
EP1564301A4 (de) 2002-10-29 2007-07-11 Riken Verfahren für nukleinsäureamplifikation
US20050260603A1 (en) 2002-12-31 2005-11-24 Mmi Genomics, Inc. Compositions for inferring bovine traits
US20050181394A1 (en) * 2003-06-20 2005-08-18 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
EP1636337A4 (de) 2003-06-20 2007-07-04 Illumina Inc Verfahren und zusammensetzungen zur ganzgenomischen amplifikation und genotypisierung
US20040259100A1 (en) * 2003-06-20 2004-12-23 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
US20050014165A1 (en) * 2003-07-18 2005-01-20 California Pacific Medical Center Biomarker panel for colorectal cancer
US20050153317A1 (en) * 2003-10-24 2005-07-14 Metamorphix, Inc. Methods and systems for inferring traits to breed and manage non-beef livestock
WO2005063977A1 (ja) 2003-12-25 2005-07-14 Riken 核酸の増幅法およびこれを利用した変異核酸の検出法
US9109256B2 (en) 2004-10-27 2015-08-18 Esoterix Genetic Laboratories, Llc Method for monitoring disease progression or recurrence
US9777314B2 (en) 2005-04-21 2017-10-03 Esoterix Genetic Laboratories, Llc Analysis of heterogeneous nucleic acid samples
AU2006248189A1 (en) 2005-05-20 2006-11-23 Synergenz Bioscience Limited Methods of analysis of polymorphisms and uses thereof
NZ600235A (en) 2008-01-25 2013-11-29 Theranostics Lab Methods and compositions for the assessment of drug response
AU2011229918B2 (en) * 2010-03-24 2015-02-05 Parker Proteomics, Llc Methods for conducting genetic analysis using protein polymorphisms
WO2011151405A1 (en) 2010-06-04 2011-12-08 Institut National De La Sante Et De La Recherche Medicale (Inserm) Constitutively active prolactin receptor variants as prognostic markers and therapeutic targets to prevent progression of hormone-dependent cancers towards hormone-independence
JP2023516299A (ja) * 2020-02-28 2023-04-19 ラボラトリー コーポレイション オブ アメリカ ホールディングス 父子判定のための組成物、方法、およびシステム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2853936A1 (de) * 1978-12-14 1980-07-03 Bayer Ag Phosphonsaeureester
US4582788A (en) * 1982-01-22 1986-04-15 Cetus Corporation HLA typing method and cDNA probes used therein
US4683194A (en) * 1984-05-29 1987-07-28 Cetus Corporation Method for detection of polymorphic restriction sites and nucleic acid sequences
US4683195A (en) * 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) * 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
GB8606719D0 (en) * 1986-03-19 1986-04-23 Lister Preventive Med Genetic probes
GB8612087D0 (en) * 1986-05-19 1986-06-25 Ici Plc Hybridisation probes
GB8810400D0 (en) * 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
WO1989010414A1 (en) * 1988-04-28 1989-11-02 Robert Bruce Wallace AMPLIFIED SEQUENCE POLYMORPHISMS (ASPs)
DE68926504T2 (de) * 1988-07-20 1996-09-12 David Segev Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen
GB2228086A (en) * 1988-11-25 1990-08-15 Ici Plc Characterisation of genomic DNA
SG50434A1 (en) * 1989-02-13 1998-07-20 Geneco Pty Ltd Detection of a nucleic acid sequence or a change therein
FR2650840B1 (fr) * 1989-08-11 1991-11-29 Bertin & Cie Procede rapide de detection et/ou d'identification d'une seule base sur une sequence d'acide nucleique, et ses applications
US5200314A (en) * 1990-03-23 1993-04-06 Chiron Corporation Polynucleotide capture assay employing in vitro amplification
US5851762A (en) * 1990-07-11 1998-12-22 Gene Type Ag Genomic mapping method by direct haplotyping using intron sequence analysis
US5234811A (en) * 1991-09-27 1993-08-10 The Scripps Research Institute Assay for a new gaucher disease mutation
ES2115667T3 (es) * 1990-12-06 1998-07-01 Hoffmann La Roche Metodos y reactivos para el tipado de dna de los acidos nucleicos de hla drbeta.
US6004744A (en) * 1991-03-05 1999-12-21 Molecular Tool, Inc. Method for determining nucleotide identity through extension of immobilized primer
WO1992016657A1 (en) * 1991-03-13 1992-10-01 E.I. Du Pont De Nemours And Company Method of identifying a nucleotide present at a defined position in a nucleic acid
US5266459A (en) * 1992-02-24 1993-11-30 The Scripps Research Institute Gaucher's disease: detection of a new mutation in intron 2 of the glucocerebrosidase gene
US5429923A (en) * 1992-12-11 1995-07-04 President And Fellows Of Harvard College Method for detecting hypertrophic cardiomyophathy associated mutations

Also Published As

Publication number Publication date
CA2175695A1 (en) 1995-05-11
EP0726905A1 (de) 1996-08-21
US20030170624A1 (en) 2003-09-11
DE69434314D1 (de) 2005-04-28
US20020094525A1 (en) 2002-07-18
EP0726905A4 (de) 1997-12-17
ES2240970T3 (es) 2005-10-16
ATE291583T1 (de) 2005-04-15
AU8132194A (en) 1995-05-23
EP0726905B1 (de) 2005-03-23
WO1995012607A1 (en) 1995-05-11

Similar Documents

Publication Publication Date Title
DE69434314T2 (de) Polymorphismus von mononukleotiden und ihre verwendung in der genanalyse
DE69531542T2 (de) Ligase/polymerase-vermittelte analyse genetischer elemente von einzelnukleotid-polymorphismen und ihre verwendung in der genetischen analyse
DE69233458T2 (de) Nukleinsäuretypisierung durch polymeraseverlängerung von oligonukleotiden unter verwendung von terminator-mischungen
DE69432586T2 (de) Methode zum generieren von einzelsträngigen dna molekülen
DE3834636C2 (de)
DE69531831T2 (de) Verfahren mit einer hohen umsatzrate für das auffinden von sequenzen oder genetischen veränderungen in nukleinsäuren
DE69833758T2 (de) Verfahren zur erkennung von genpolymorphismen und allelexpression unter verwendung von sondenchips
DE69534728T2 (de) Amplifizierung von langen Nukleinsäuresequenzen mit PCR
DE69333242T2 (de) Verfahren, reagenz und salz zum nachweis und amplifikation von nukleinsäuresequenzen
DE3687287T3 (de) Verfahren zur Amplifikation von Nukleinsäuresequenzen.
DE69434066T2 (de) Verfahren zur immobilisierung von nukleinsäuremolekülen
DE69432919T2 (de) Verfahren für den Nachweis spezifischer Polynukleotiden
DE69635612T2 (de) Detektion und amplifikation von nukleinsäuren durch chemische verbindung von oligonukleotiden
DE69034197T2 (de) Genomische Klonierung und Kartographie
DE60025840T2 (de) Methode zum nachweis von variationen oder polymorphismen
DE60038109T2 (de) Verfahren zur Analyse von AFLP Reaktionsmischungen unter Verwendung von Primer Verlängerungstechniken
DE10119468A1 (de) Mikroarray-Verfahren zur Anreicherung von DNA-Fragmenten aus komplexen Mischungen
DE60133321T2 (de) Methoden zur Detektion des mecA Gens beim methicillin-resistenten Staphylococcus Aureus
EP1364068B1 (de) Verfahren und kit zur tierartspezifischen dna-identifikation in einer probe
DE112020000525T5 (de) Verfahren zum nachweis mehrerer ziele basierend auf einer einzigennachweissonde unter verwendung eines markierungs-sequenz-snp
DE69734904T2 (de) ABO-Glycosyltransferase-Sequenz-Polymorphismus
DE4416446A1 (de) Für menschliche DNA spezifische Sequenzen
WO2001036670A2 (de) Diagnose-kit, verfahren und mikroarray zur bestimmung der menschlichen entgiftungsfähigkeit
EP1561823A1 (de) Verfahren zum Nachweis von Einzelnukleotid-polymorphismen (SNP) in Genen des Arzneimittelmetabolismus und Testkit zur Durchführung des Verfahrens
DE60109002T2 (de) Methode zum Nachweis von transkribierten genomischen DNA-Sequenzen

Legal Events

Date Code Title Description
8363 Opposition against the patent
8339 Ceased/non-payment of the annual fee
8327 Change in the person/name/address of the patent owner

Owner name: ORCHID CELLMARK INC., PRINCETON, N.J., US

8370 Indication related to discontinuation of the patent is to be deleted
8331 Complete revocation