US20040067491A1 - Diagnosis of diseases associated with metabolism - Google Patents

Diagnosis of diseases associated with metabolism Download PDF

Info

Publication number
US20040067491A1
US20040067491A1 US10/240,454 US24045403A US2004067491A1 US 20040067491 A1 US20040067491 A1 US 20040067491A1 US 24045403 A US24045403 A US 24045403A US 2004067491 A1 US2004067491 A1 US 2004067491A1
Authority
US
United States
Prior art keywords
dna
recited
sequences
genes
oligomer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
US10/240,454
Inventor
Alexander Olek
Christian Piepenbrock
Kurt Berlin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Epigenomics AG
Original Assignee
Epigenomics AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE10019058A external-priority patent/DE10019058A1/en
Priority claimed from DE10032529A external-priority patent/DE10032529A1/en
Application filed by Epigenomics AG filed Critical Epigenomics AG
Assigned to EPIGENOMICS AG reassignment EPIGENOMICS AG ASSIGNMENT OF ASSIGNORS INTEREST (SEE DOCUMENT FOR DETAILS). Assignors: BERLIN, KURT, OLEK, ALEXANDER, PIEPENBROCK, CHRISTIAN
Publication of US20040067491A1 publication Critical patent/US20040067491A1/en
Abandoned legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • A61P11/06Antiasthmatics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P13/00Drugs for disorders of the urinary system
    • A61P13/12Drugs for disorders of the urinary system of the kidneys
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/10Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4703Inhibitors; Suppressors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/82Translation products from oncogenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Definitions

  • the present invention relates to nucleic acids, oligonucleotides, PNA-oligomers and to a method for the diagnosis and/or therapy of diseases which have a connection with the genetic and/or epigenetic parameters of genes associated with metabolism and, in particular, with the methylation status thereof.
  • Metabolism is the sum of chemical changes that occur in living organisms. The thousands of different chemical reactions are carried out simultaneously by a cell are closely coordinated. A variety of control mechanisms regulate the activities of key enzymes in response to changing conditions in the cell. One very common form of regulation is a rapidly reversible feedback inhibition exerted on the first enzyme by the final product of that pathway. A longer lasting form of regulation involves the chemical modification of one enzyme by another. Combinations of regulatory mechanisms can produce major and long lasting changes in the metabolism of the cell. Common metabolic diseases are diabetes, cancer, hyperlipidaemia and atherosclerosis. Cancer, for example, is a multistep disease with a multifactorial aetiology.
  • 5-methylcytosine is the most frequent covalent base modification in the DNA of eukaryotic cells. It plays a role, for example, in the regulation of the transcription, in genetic imprinting, and in tumorigenesis. Therefore, the identification of 5-methylcytosine as a component of genetic information is of considerable interest. However, 5-methylcytosine positions cannot be identified by sequencing since 5-methylcytosine has the same base pairing behavior as cytosine. Moreover, the epigenetic information carried by 5-methylcytosine is completely lost during PCR amplification.
  • a relatively new and currently the most frequently used method for analyzing DNA for 5-methylcytosine is based upon the specific reaction of bisulfite with cytosine which, upon subsequent alkaline hydrolysis, is converted to uracil which corresponds to thymidine in its base pairing behavior.
  • 5-methylcytosine remains unmodified under these conditions. Consequently, the original DNA is converted in such a manner that methylcytosine, which originally could not be distinguished from cytosine by its hybridization behavior, can now be detected as the only remaining cytosine using “normal” molecular biological techniques, for example, by amplification and hybridization or sequencing. All of these techniques are based on base pairing which can now be fully exploited.
  • the prior art is defined by a method which encloses the DNA to be analyzed in an agarose matrix, thus preventing the diffusion and renaturation of the DNA (bisulfite only reacts with single-stranded DNA), and which replaces all precipitation and purification steps with fast dialysis (Olek A, Oswald J, Walter J. A modified and improved method for bisulphite based cytosine methylation analysis. Nucleic Acids Res. 1996 Dec. 15 ;24(24):5064-6). Using this method, it is possible to analyze individual cells, which illustrates the potential of the method.
  • Fluorescently labeled probes are often used for the scanning of immobilized DNA arrays.
  • the simple attachment of Cy3 and Cy5 dyes to the 5′-OH of the specific probe are particularly suitable for fluorescence labels.
  • the detection of the fluorescence of the hybridized probes may be carried out, for example via a confocal microscope. Cy3 and Cy5 dyes, besides many others, are commercially available.
  • Matrix Assisted Laser Desorption Ionization Mass Spectrometry is a very efficient development for the analysis of biomolecules (Karas M, Hillenkamp F. Laser desorption ionization of proteins with molecular masses exceeding 10,000 daltons. Anal Chem. 1988 Oct 15;60(20):2299-301).
  • An analyte is embedded in a light-absorbing matrix. The matrix is evaporated by a short laser pulse thus transporting the analyte molecule into the vapor phase in an unfragmented manner.
  • the analyte is ionized by collisions with matrix molecules.
  • An applied voltage accelerates the ions into a field-free flight tube. Due to their different masses, the ions are accelerated at different rates. Smaller ions reach the detector sooner than bigger ones.
  • MALDI-TOF spectrometry is excellently suited to the analysis of peptides and proteins.
  • the analysis of nucleic acids is somewhat more difficult (Gut I G, Beck S. DNA and Matrix Assisted Laser Desorption Ionization Mass Spectrometry. Current Innovations and Future Trends. 1995, 1; 147-57).
  • the sensitivity to nucleic acids is approximately 100 times worse than to peptides and decreases disproportionally with increasing fragment size.
  • the ionization process via the matrix is considerably less efficient.
  • the selection of the matrix plays an eminently important role.
  • Genomic DNA is obtained from DNA of cell, tissue or other test samples using standard methods. This standard methodology is found in references such as Fritsch and Maniatis eds., Molecular Cloning: A Laboratory Manual, 1989.
  • the object of the present invention is to provide the chemically modified DNA of genes associated with metabolism, as well as oligonucleotides and/or PNA-oligomers for detecting cytosine methylations, as well as a method which is particularly suitable for the diagnosis and/or therapy of genetic and epigenetic parameters of genes associated with metabolism.
  • the present invention is based on the discovery that genetic and epigenetic parameters and, in particular, the cytosine methylation pattern of genes associated with metabolism are particularly suitable for the diagnosis and/or therapy of diseases associated with metabolism.
  • This objective is achieved according to the present invention using a nucleic acid containing a sequence of at least 18 bases in length of the chemically pretreated DNA of genes associated with metabolism according to one of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto.
  • the respective data bank numbers accession numbers
  • GenBank was used as the underlying data bank, which is located at the National Institute of Health at the internet address http://www.ncbi.nlm.nih.gov.
  • the object of the present invention is further achieved by an oligonucleotide or oligomer for detecting the cytosine methylation state in chemically pretreated DNA, containing at least one base sequence having a length of at least 13 nucleotides which hybridizes to a chemically pretreated DNA of genes associated with metabolism according to Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto.
  • the oligomer probes according to the present invention constitute important and effective tools which, for the first time, make it possible to ascertain the genetic and epigenetic parameters of genes associated with metabolism.
  • the base sequence of the oligomers preferably contains at least one CpG dinucleotide.
  • the probes may also exist in the form of a PNA (peptide nucleic acid) which has particularly preferred pairing properties.
  • PNA peptide nucleic acid
  • Particularly preferred are oligonucleotides according to the present invention in which the cytosine of the CpG dinucleotide is the 5 th -9 th nucleotide from the 5′-end of the 13-mer; in the case of PNA-oligomers, it is preferred for the cytosine of the CpG dinucleotide to be the 4 th -6 th nucleotide from the 5′-end of the 9-mer.
  • the oligomers according to the present invention are normally used in so called “sets” which contain at least one oligomer for each of the CpG dinucleotides of the sequences of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto.
  • Preferred is a set which contains at least one oligomer for each of the CpG dinucleotides from one of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto.
  • the present invention makes available a set of at least two oligonucleotides which can be used as so-called “primer oligonucleotides” for amplifying DNA sequences of one of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto, or segments thereof.
  • primer oligonucleotides for amplifying DNA sequences of one of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto, or segments thereof.
  • At least one oligonucleotide is bound to a solid phase.
  • the present invention moreover relates to a set of at least 10 n (oligonucleotides and/or PNA-oligomers) used for detecting the cytosine methylation state in chemically pretreated genomic DNA (Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto).
  • chemically pretreated genomic DNA Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto.
  • the set of oligomers may also be used for detecting single nucleotide polymorphisms (SNPs) in the chemically pretreated DNA of genes associated with metabolism according to one of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto.
  • SNPs single nucleotide polymorphisms
  • an arrangement of different oligonucleotides and/or PNA-oligomers made available by the present invention is present in a manner that it is likewise bound to a solid phase.
  • This array of different oligonucleotide- and/or PNA-oligomer sequences can be characterized in that it is arranged on the solid phase in the form of a rectangular or hexagonal lattice.
  • the solid phase surface is preferably composed of silicon, glass, polystyrene, aluminium, steel, iron, copper, nickel, silver, or gold.
  • nitrocellulose as well as plastics such as nylon which can exist in the form of pellets or also as resin matrices are possible as well.
  • a further subject matter of the present invention is a method for manufacturing an array fixed to a carrier material for analysis in connection with diseases associated with metabolism in which method at least one oligomer according to the present invention is coupled to a solid phase.
  • Methods for manufacturing such arrays are known, for example, from U.S. Pat. No. 5,744,305 by means of solid-phase chemistry and photolabile protecting groups.
  • a further subject matter of the present invention relates to a DNA chip for the analysis of diseases associated with metabolism which contains at least one nucleic acid according to the present invention.
  • DNA chips are known, for example, for U.S. Pat. No. 5,837,832.
  • kits which may be composed, for example, of a bisulfite-containing reagent, a set of primer oligonucleotides containing at least two oligonucleotides whose sequences in each case correspond or are complementary to an 18 base long segment of the base sequences specified in the appendix (Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto), oligonucleotides and/or PNA-oligomers as well as instructions for carrying out and evaluating the described method.
  • a kit along the lines of the present invention can also contain only part of the aforementioned components.
  • the present invention also makes available a method for ascertaining genetic and/or epigenetic parameters of genes associated with the cycle cell by analyzing cytosine methylations and single nucleotide polymorphisms, including the following steps:
  • a genomic DNA sample is chemically treated in such a manner that cytosine bases which are unmethylated at the 5′-position are converted to uracil, thymine, or another base which is dissimilar to cytosine in terms of hybridization behavior. This will be understood as ‘chemical pretreatment’ hereinafter.
  • the genomic DNA to be analyzed is preferably obtained from usual sources of DNA such as cells or cell components, for example, cell lines, biopsies, blood, sputum, stool, urine, cerebral-spinal fluid, tissue embedded in paraffin such as tissue from eyes, intestine, kidney, brain, heart, prostate, lung, breast or liver, histologic object slides, or combinations thereof.
  • sources of DNA such as cells or cell components, for example, cell lines, biopsies, blood, sputum, stool, urine, cerebral-spinal fluid, tissue embedded in paraffin such as tissue from eyes, intestine, kidney, brain, heart, prostate, lung, breast or liver, histologic object slides, or combinations thereof.
  • genomic DNA is preferably carried out with bisulfite (hydrogen sulfite, disulfite) and subsequent alkaline hydrolysis which results in a conversion of non-methylated cytosine nucleobases to uracil or to another base which is dissimilar to cytosine in terms of base pairing behavior.
  • bisulfite hydrogen sulfite, disulfite
  • Fragments of the chemically pretreated DNA are amplified, using sets of primer oligonucleotides according to the present invention, and a, preferably heat-stable polymerase. Because of statistical and practical considerations, preferably more than ten different fragments having a length of 100-2000 base pairs are amplified.
  • the amplification of several DNA segments can be carried out simultaneously in one and the same reaction vessel. Usually, the amplification is carried out by means of a polymerase chain reaction (PCR).
  • PCR polymerase chain reaction
  • the set of primer oligonucleotides includes at least two olignonucleotides whose sequences are each reverse complementary or identical to an at least 18 base-pair long segment of the base sequences specified in the appendix (Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto).
  • the primer oligonucleotides are preferably characterized in that they do not contain any CpG dinucleotides.
  • At least one primer oligonucleotide is bonded to a solid phase during amplification.
  • the different oligonucleotide and/or PNA-oligomer sequences can be arranged on a plane solid phase in the form of a rectangular or hexagonal lattice, the solid phase surface preferably being composed of silicon, glass, polystyrene, aluminium, steel, iron, copper, nickel, silver, or gold, it being possible for other materials such as nitrocellulose or plastics to be used as well.
  • the fragments obtained by means of the amplification can carry a directly or indirectly detectable label.
  • the detection may be carried out and visualized by means of matrix assisted laser desorption/ionization mass spectrometry (MALDI) or using electron spray mass spectrometry (ESI).
  • MALDI matrix assisted laser desorption/ionization mass spectrometry
  • ESI electron spray mass spectrometry
  • the amplificates obtained in the second step of the method are subsequently hybridized to an array or a set of oligonucleotides and/or PNA probes.
  • the hybridization takes place in the manner described in the following.
  • the set of probes used during the hybridization is preferably composed of at least 10 oligonucleotides or PNA-oligomers.
  • the amplificates serve as probes which hybridize to oligonucleotides previously bonded to a solid phase. The non-hybridized fragments are subsequently removed.
  • Said oligonucleotides contain at least one base sequence having a length of 13 nucleotides which is reverse complementary or identical to a segment of the base sequences specified in the appendix, the segment containing at least one CpG dinucleotide.
  • the cytosine of the CpG dinucleotide is the 5 th to 9 th nucleotide from the 5′-end of the 13-mer.
  • One oligonucleotide exists for each CpG dinucleotide.
  • Said PNA-oligomers contain at least one base sequence having a length of 9 nucleotides which is reverse complementary or identical to a segment of the base sequences specified in the appendix, the segment containing at least one CpG dinucleotide.
  • the cytosine of the CpG dinucleotide is the 4 th to 6 th nucleotide seen from the 5′-end of the 9-mer.
  • One oligonucleotide exists for each CpG dinucleotide.
  • the non-hybridized amplificates are removed.
  • the hybridized amplificates are detected.
  • labels attached to the amplificates are identifiable at each position of the solid phase at which an oligonucleotide sequence is located.
  • the labels of the amplificates are fluorescence labels, radionuclides, or detachable molecule fragments having a typical mass which can be detected in a mass spectrometer.
  • the mass spectrometer is preferred for the detection of the amplificates, fragments of the amplificates or of probes which are complementary to the amplificates, it being possible for the detection to be carried out and visualized by means of matrix assisted laser desorption/ionization mass spectrometry (MALDI) or using electron spray mass spectrometry (ESI).
  • MALDI matrix assisted laser desorption/ionization mass spectrometry
  • ESI electron spray mass spectrometry
  • the produced fragments may have a single positive or negative net charge for better detectability in the mass spectrometer.
  • the aforementioned method is preferably used for ascertaining genetic and/or epigenetic parameters of genes associated with metabolism.
  • the oligomers according to the present invention or arrays thereof as well as a kit according to the present invention are intended to be used for the diagnosis and/or therapy of diseases associated with metabolism by analyzing methylation patterns of genes associated with metabolism.
  • the method is preferably used for the diagnosis and/or therapy of important genetic and/or epigenetic parameters within genes associated with metabolism.
  • the method according to the present invention is used, for example, for the diagnosis and/or therapy of solid tumors and cancer
  • nucleic acids according to the present invention of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto can be used for the diagnosis and/or therapy of genetic and/or epigenetic parameters of genes associated with metabolism.
  • the present invention moreover relates to a method for manufacturing a diagnostic agent and/or therapeutic agent for the diagnosis and/or therapy of diseases associated with metabolism by analyzing methylation patterns of genes associated with metabolism, the diagnostic agent and/or therapeutic agent being characterized in that at least one nucleic acid according to the present invention is used for manufacturing it, possibly together with suitable additives and auxiliary agents.
  • a further subject matter of the present invention relates to a diagnostic agent and/or therapeutic agent for diseases associated with metabolism by analyzing methylation patterns of genes associated with metabolism, the diagnostic agent and/or therapeutic agent containing at least one nucleic acid according to the present invention, possibly together with suitable additives and auxiliary agents.
  • the present invention moreover relates to the diagnosis and/or prognosis of events which are disadvantageous to patients or individuals in which important genetic and/or epigenetic parameters within genes associated with metabolism said parameters obtained by means of the present invention may be compared to another set of genetic and/or epigenetic parameters, the differences serving as the basis for a diagnosis and/or prognosis of events which are disadvantageous to patients or individuals.
  • hybridization is to be understood as a bond of an oligonucleotide to a completely complementary sequence along the lines of the Watson-Crick base pairings in the sample DNA, forming a duplex structure.
  • stringent hybridization conditions are those conditions in which a hybridization is carried out at 60° C. in 2.5 ⁇ SSC buffer, followed by several washing steps at 37° C. in a low buffer concentration, and remains stable.
  • the term “functional variants” denotes all DNA sequences which are complementary to a DNA sequence, and which hybridize to the reference sequence under stringent conditions and have an activity similar to the corresponding polypeptide according to the present invention.
  • “genetic parameters” are mutations and polymorphisms of genes associated with metabolism and sequences further required for their regulation.
  • mutations are, in particular, insertions, deletions, point mutations, inversions and polymorphisms and, particularly preferred, SNPs (single nucleotide polymorphisms).
  • epigenetic parameters are, in particular, cytosine methylations and further chemical modifications of DNA bases of genes associated with metabolism and sequences further required for their regulation.
  • Further epigenetic parameters include, for example, the acetylation of histones which, however, cannot be directly analyzed using the described method but which, in turn, correlates with the DNA methylation.
  • Sequences having odd sequence numbers exhibit in each case sequences of the chemically pretreated genomic DNAs of different genes associated with metabolism.
  • FIG. 1 A first figure.
  • FIG. 1 shows the hybridisation of fluorescent labelled amplificates to a surface bound olignonucleotide.
  • Sample I being from a pilocytic astrocytoma tumor sample and sample II being from an oligodenrogliome grade II tumor sample.
  • Flourescence at a spot shows hybridisation of the amplificate to the olignonucleotide.
  • Hybridisation to a CG olignonucleotide denotes methylation at the cytosine position being analysed
  • hybridisation to a TG olignonucleotide denotes no methylation at the cytosine position being analysed. It can be seen that Sample I had a higher degree of methylation than Sample II at position 514.
  • Sequence ID Nos. 1 to 64 show sequences of the chemically pretreated genomic DNAs of different genes associated with metabolism.
  • sequences having odd sequence numbers e.g., Seq. ID No. 1, 3, 5, . . .
  • Sequences having even sequence numbers e.g., Seq. ID No. 2, 4, 6, . . .
  • sequences having even sequence numbers exhibit in each case the sequences of the chemically pretreated genomic DNAs of genes associated with metabolism which are complementary to the preceeding sequences (e.g., the complementary sequence to Seq. ID No.1 is Seq. ID No.2, the complementary sequence to Seq. ID No.3 is Seq. ID No.4, etc.).
  • Seq. ID No. 65 to seq. ID No. 68 show specific oligonucleotide sequences as used in Example 1.
  • the following example relates to a fragment of a gene associated with metabolism, in this case, OAT in which a specific CG-position is analyzed for its methylation status.
  • the following example relates to a fragment of the gene OAT in which a specific CG-position is to be analyzed for methylation.
  • a genomic sequence is treated using bisulfite (hydrogen sulfite, disulfite) in such a manner that all cytosines which are not methylated at the 5-position of the base are modified in such a manner that a different base is substituted with regard to the base pairing behavior while the cytosines methylated at the 5-position remain unchanged.
  • bisulfite hydrogen sulfite, disulfite
  • the treated DNA sample is diluted with water or an aqueous solution.
  • the DNA is subsequently desulfonated (10-30 min, 90-100° C.) at an alkaline pH value.
  • the DNA sample is amplified in a polymerase chain reaction, preferably using a heat-resistant DNA polymerase.
  • cytosines of the gene OAT are analyzed.
  • a defined fragment having a length of 572 bp is amplified with the specific primer oligonucleotides TGGAGGTGGATTTAGAGGTA (Sequence ID 65) and AACCAAAACCCCAAAACAAC (Sequence ID No. 66).
  • This amplificate serves as a sample which hybridizes to an oligonucleotide previously bonded to a solid phase, forming a duplex structure, for example GTGTATTCGGTTGTTTTT (Sequence ID No.
  • the cytosine to be detected being located at position 514 of the amplificate.
  • the detection of the hybridization product is based on Cy3 and Cy5 fluorescently labelled primer oligonucleotides which have been used for the amplification.
  • a hybridization reaction of the amplified DNA with the oligonucleotide takes place only if a methylated cytosine was present at this location in the bisulfite-treated DNA.
  • the methylation status of the specific cytosine to be analyzed is inferred from the hybridization product.
  • a sample of the amplificate is further hybridized to another oligonucleotide previously bonded to a solid phase.
  • Said olignonucleotide is identical to the oligonucleotide previously used to analyze the methylation status of the sample, with the exception of the position in question.
  • said oligonucleotide comprises a thymine base as opposed to a cytosine base i.e GTGTATTTGGTTGTTTTT (Sequence ID No. 68). Therefore, the hybridisation reaction only takes place if an unmethylated cytosine was present at the position to be analysed.
  • the procedure was carried out on cell samples from 2 patients, sample I being from a pilocytic astrocytoma tumor sample and sample 11 being from an oligodenrogliome grade II tumor sample.
  • methylation patterns In order to relate the methylation patterns to one of the diseases associated with metabolism, it is initially required to analyze the DNA methylation patterns of a group of diseased and of a group of healthy patients. These analyses are carried out, for example, analogously to Example 1. The results obtained in this manner are stored in a database and the CpG dinucleotides which are methylated differently between the two groups are identified. This can be carried out by determining individual CpG methylation rates as can be done, for example, in a relatively imprecise manner, by sequencing or else, in a very precise manner, by a methylation-sensitive “primer extension reaction”. It is also possible for the entire methylation status to be analyzed simultaneously, and for the patterns to be compared, for example, by clustering analyses which can be carried out, for example, by a computer.
  • Example 2 can be carried out, for example, for metabolic diseases, solid tumours and cancer.
  • Genbank Entry No. Gen http://www.ncbi.nlm.nih.gov
  • DUSP2 NM_004418 EPHX2 NM_001979 QDPR NM_000320 SGSH NM_000199
  • SHMT2 NM_005412 SLC7A2 NM_003046 SLC7A4 NM_004173 TYMS NM_001071
  • FIG. 1 shows the hybridisation of fluorescent labelled amplificates to a surface bound olignonucleotide.
  • Sample I being from a pilocytic astrocytoma tumor sample and sample II being from an oligodenrogliome grade II tumor sample.
  • Flourescence at a spot shows hybridisation of the amplificate to the olignonucleotide.
  • Hybridisation to a CG olignonucleotide denotes methylation at the cytosine position being analysed
  • hybridisation to a TG olignonucleotide denotes no methylation at the cytosine position being analysed. It can be seen that Sample I had a higher degree of methylation than Sample II at position 514.

Abstract

Chemically modified genomic sequences of genes associated with metabolism, to oligonucleotides and/or PNA-oligomers for detecting the cytosine methylation state of genes associated with metabolism which are directed against the sequence are disclosed. In addition, a method for ascertaining genetic and/or epigenetic parameters of genes associated with metabolism is disclosed.

Description

    FIELD OF THE INVENTION
  • The levels of observation that have been well studied by the methodological developments of recent years in molecular biology, are the genes themselves, the translation of these genes into RNA, and the resulting proteins. The question of which gene is switched on at which point in the course of the development of an individual, and how the activation and inhibition of specific genes in specific cells and tissues are controlled is correlatable to the degree and character of the methylation of the genes or of the genome. In this respect, pathogenic conditions may manifest themselves in a changed methylation pattern of individual genes or of the genome. [0001]
  • The present invention relates to nucleic acids, oligonucleotides, PNA-oligomers and to a method for the diagnosis and/or therapy of diseases which have a connection with the genetic and/or epigenetic parameters of genes associated with metabolism and, in particular, with the methylation status thereof. [0002]
  • PRIOR ART
  • Metabolism is the sum of chemical changes that occur in living organisms. The thousands of different chemical reactions are carried out simultaneously by a cell are closely coordinated. A variety of control mechanisms regulate the activities of key enzymes in response to changing conditions in the cell. One very common form of regulation is a rapidly reversible feedback inhibition exerted on the first enzyme by the final product of that pathway. A longer lasting form of regulation involves the chemical modification of one enzyme by another. Combinations of regulatory mechanisms can produce major and long lasting changes in the metabolism of the cell. Common metabolic diseases are diabetes, cancer, hyperlipidaemia and atherosclerosis. Cancer, for example, is a multistep disease with a multifactorial aetiology. For some genotoxic carcinogens the sequence of events leading to tumour formation is well understood from exposure, to metabolism and ultimately to specific mutations in transformation-associated genes. In the widespread field of metabolic diseases, enzymes, which play a central role in glucose metabolism, like Human hexokinase, are contributing to diseases like pre-non-insulin-dependent diabetes mellitus (Diabetes 1995 March;44(3):347-53 Identification of four amino acid substitutions in hexokinase II and studies of relationships to NIDDM, glucose effectiveness, and insulin sensitivity. Echwald S M, Bjorbaek C, Hansen T, Clausen J O, Vestergaard H, Zierath J R, Printz R L, Granner D K, Pedersen O). Other metabolism based disorders are peroxisomal disorders (Enzyme 1987;38(1-4):161-76 Genetic diseases caused by peroxisomal dysfunction. New findings in clinical and biochemical studies. Schutgens R B, Wanders R J, Nijenhuis A, van den Hoek C M, Heymans H S, Schrakamp G, Bleeker-Wagemakers E M, Delleman J W, Schram A W, Tager J M, et al.). Those disorders are a group of genetic diseases caused by peroxisomal dysfunction. Alcohol-induced oxidative stress, another metabolic disease, is linked to the metabolism of ethanol (J Biomed Sci 2001 January-February;8(1):59-70, Oxidative stress, metabolism of ethanol and alcohol-related diseases. Zima T, Fialova L, Mestek O, Janebova M, Crkovska J, Malbohan I, Stipek S, Mikulikova L, Popov P). Three metabolic pathways of ethanol have been described in the human body so far. Some other described metabolic diseases are hereditary tyrosinemia type I, which is the most severe metabolic disease of the tyrosine catabolic pathway mainly affecting the liver (FASEB J 1999 December;13(15):2284-98 Cyclin B-dependent kinase and caspase-1 activation precedes mitochondrial dysfunction in fumarylacetoacetate-induced apoptosis. Jorquera R, Tanguay R M), methylmalonic acidemia (Hum Gene Ther 1994 September;5(9):1095-104 Overexpression of human methylmalonyl CoA mutase in mice after in vivo gene transfer with asialoglycoprotein/polylysine/DNA complexes. Stankovics J, Crane A M, Andrews E, Wu C H, Wu G Y, Ledley F D) or propionic acidemia (Hum Genet 1991 May;87(1):41-4 Genetic heterogeneity of propionic acidemia: analysis of 15 Japanese patients. Ohura T, Miyabayashi S, Narisawa K, Tada K Department of Pediatrics, Tohoku University School of Medicine, Sendai, Japan). [0003]
  • The high incidence of metabolic diseases has given rise to the development of methods of treatment and diagnosis targeted specifically to metabolic pathways. The further development of such methods would have considerable benifits. For example, cancer where current therapies may have unwanted side effects or fail to provide effective treatment. Conventional methods such as chemotherapy, which with their massive side effects, sometimes result in unacceptable morbidity or lead up to the death of the patient. In practice, the unwanted side effects associated with cancer therapies frequently limit the treatment which could help a patient. [0004]
  • 5-methylcytosine is the most frequent covalent base modification in the DNA of eukaryotic cells. It plays a role, for example, in the regulation of the transcription, in genetic imprinting, and in tumorigenesis. Therefore, the identification of 5-methylcytosine as a component of genetic information is of considerable interest. However, 5-methylcytosine positions cannot be identified by sequencing since 5-methylcytosine has the same base pairing behavior as cytosine. Moreover, the epigenetic information carried by 5-methylcytosine is completely lost during PCR amplification. [0005]
  • A relatively new and currently the most frequently used method for analyzing DNA for 5-methylcytosine is based upon the specific reaction of bisulfite with cytosine which, upon subsequent alkaline hydrolysis, is converted to uracil which corresponds to thymidine in its base pairing behavior. However, 5-methylcytosine remains unmodified under these conditions. Consequently, the original DNA is converted in such a manner that methylcytosine, which originally could not be distinguished from cytosine by its hybridization behavior, can now be detected as the only remaining cytosine using “normal” molecular biological techniques, for example, by amplification and hybridization or sequencing. All of these techniques are based on base pairing which can now be fully exploited. In terms of sensitivity, the prior art is defined by a method which encloses the DNA to be analyzed in an agarose matrix, thus preventing the diffusion and renaturation of the DNA (bisulfite only reacts with single-stranded DNA), and which replaces all precipitation and purification steps with fast dialysis (Olek A, Oswald J, Walter J. A modified and improved method for bisulphite based cytosine methylation analysis. Nucleic Acids Res. 1996 Dec. 15 ;24(24):5064-6). Using this method, it is possible to analyze individual cells, which illustrates the potential of the method. However, currently only individual regions of a length of up to approximately 3000 base pairs are analyzed, a global analysis of cells for thousands of possible methylation events is not possible. However, this method cannot reliably analyze very small fragments from small sample quantities either. These are lost through the matrix in spite of the diffusion protection. [0006]
  • An overview of the further known methods of detecting 5-methylcytosine may be gathered from the following review article: Rein, T., DePamphilis, M. L., Zorbas, H., Nucleic Acids Res. 1998, 26, 2255. [0007]
  • To date, barring few exceptions (e.g., Zeschnigk M, Lich C, Buiting K, Doerfler W, Horsthemke B. A single-tube PCR test for the diagnosis of Angelman and Prader-Willi syndrome based on allelic methylation differences at the SNRPN locus. Eur J Hum Genet. 1997 March-April;5(2):94-8) the bisulfite technique is only used in research. Always, however, short, specific fragments of a known gene are amplified subsequent to a bisulfite treatment and either completely sequenced (Olek A, Walter J. The preimplantation ontogeny of the H19 methylation imprint. Nat Genet. 1997 November;17(3):275-6) or individual cytosine positions are detected by a primer extension reaction (Gonzalgo M L, Jones P A. Rapid quantitation of methylation differences at specific sites using methylation-sensitive single nucleotide primer extension (Ms-SNuPE). Nucleic Acids Res. [0008] 1997 Jun. 15;25(12):2529-31, WO Patent 95/00669) or by enzymatic digestion (Xiong Z, Laird P W. COBRA: a sensitive and quantitative DNA methylation assay. Nucleic Acids Res. 1997 Jun. 15;25(12):25324). In addition, detection by hybridization has also been described (Olek et al., WO 99/28498).
  • Further publications dealing with the use of the bisulfite technique for methylation detection in individual genes are: Grigg G, Clark S. Sequencing 5-methylcytosine residues in genomic DNA. Bioessays. 1994 June;16(6):431-6, 431; Zeschnigk M, Schmitz B, Dittrich B, Buiting K, Horsthemke B, Doerfler W. Imprinted segments in the human genome: different DNA methylation patterns in the Prader-Willi/Angelman syndrome region as determined by the genomic sequencing method. Hum Mol Genet. 1997 March;6(3):387-95; Feil R, Chariton J, Bird A P, Walter J, Reik W. Methylation analysis on individual chromosomes: improved protocol for bisulphite genomic sequencing. Nucleic Acids Res. 1994 Feb. 25;22(4):695-6; Martin V, Ribieras S, Song-Wang X, Rio M C, Dante R. Genomic sequencing indicates a correlation between DNA hypomethylation in the 5′ region of the pS2 gene and its expression in human breast cancer cell lines. Gene. 1995 May 19;157(1-2):261-4; WO 97/46705, WO 95/15373 and WO 97/45560. [0009]
  • An overview of the Prior Art in oligomer array manufacturing can be gathered from a special edition of Nature Genetics (Nature Genetics Supplement, Volume 21, January 1999), published in January 1999, and from the literature cited therein. [0010]
  • Fluorescently labeled probes are often used for the scanning of immobilized DNA arrays. The simple attachment of Cy3 and Cy5 dyes to the 5′-OH of the specific probe are particularly suitable for fluorescence labels. The detection of the fluorescence of the hybridized probes may be carried out, for example via a confocal microscope. Cy3 and Cy5 dyes, besides many others, are commercially available. [0011]
  • Matrix Assisted Laser Desorption Ionization Mass Spectrometry (MALDI-TOF) is a very efficient development for the analysis of biomolecules (Karas M, Hillenkamp F. Laser desorption ionization of proteins with molecular masses exceeding 10,000 daltons. Anal Chem. 1988 Oct 15;60(20):2299-301). An analyte is embedded in a light-absorbing matrix. The matrix is evaporated by a short laser pulse thus transporting the analyte molecule into the vapor phase in an unfragmented manner. The analyte is ionized by collisions with matrix molecules. An applied voltage accelerates the ions into a field-free flight tube. Due to their different masses, the ions are accelerated at different rates. Smaller ions reach the detector sooner than bigger ones. [0012]
  • MALDI-TOF spectrometry is excellently suited to the analysis of peptides and proteins. The analysis of nucleic acids is somewhat more difficult (Gut I G, Beck S. DNA and Matrix Assisted Laser Desorption Ionization Mass Spectrometry. Current Innovations and Future Trends. 1995, 1; 147-57). The sensitivity to nucleic acids is approximately 100 times worse than to peptides and decreases disproportionally with increasing fragment size. For nucleic acids having a multiply negatively charged backbone, the ionization process via the matrix is considerably less efficient. In MALDI-TOF spectrometry, the selection of the matrix plays an eminently important role. For the desorption of peptides, several very efficient matrixes have been found which produce a very fine crystallization. There are now several responsive matrixes for DNA, however, the difference in sensitivity has not been reduced. The difference in sensitivity can be reduced by chemically modifying the DNA in such a manner that it becomes more similar to a peptide. Phosphorothioate nucleic acids in which the usual phosphates of the backbone are substituted with thiophosphates can be converted into a charge-neutral DNA using simple alkylation chemistry (Gut I G, Beck S. A procedure for selective DNA alkylation and detection by mass spectrometry. Nucleic Acids Res. Apr. 25, 1995;23(8):1367-73). The coupling of a charge tag to this modified DNA results in an increase in sensitivity to the same level as that found for peptides. A further advantage of charge tagging is the increased stability of the analysis against impurities which make the detection of unmodified substrates considerably more difficult. [0013]
  • Genomic DNA is obtained from DNA of cell, tissue or other test samples using standard methods. This standard methodology is found in references such as Fritsch and Maniatis eds., Molecular Cloning: A Laboratory Manual, 1989. [0014]
  • DESCRIPTION
  • The object of the present invention is to provide the chemically modified DNA of genes associated with metabolism, as well as oligonucleotides and/or PNA-oligomers for detecting cytosine methylations, as well as a method which is particularly suitable for the diagnosis and/or therapy of genetic and epigenetic parameters of genes associated with metabolism. The present invention is based on the discovery that genetic and epigenetic parameters and, in particular, the cytosine methylation pattern of genes associated with metabolism are particularly suitable for the diagnosis and/or therapy of diseases associated with metabolism. [0015]
  • This objective is achieved according to the present invention using a nucleic acid containing a sequence of at least 18 bases in length of the chemically pretreated DNA of genes associated with metabolism according to one of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto. In the table, after the listed gene designations, the respective data bank numbers (accession numbers) are specified which define the appertaining gene sequences as unique. GenBank was used as the underlying data bank, which is located at the National Institute of Health at the internet address http://www.ncbi.nlm.nih.gov. [0016]
  • The chemically modified nucleic acid could heretofore not be connected with the ascertainment of genetic and epigenetic parameters. [0017]
  • The object of the present invention is further achieved by an oligonucleotide or oligomer for detecting the cytosine methylation state in chemically pretreated DNA, containing at least one base sequence having a length of at least 13 nucleotides which hybridizes to a chemically pretreated DNA of genes associated with metabolism according to Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto. The oligomer probes according to the present invention constitute important and effective tools which, for the first time, make it possible to ascertain the genetic and epigenetic parameters of genes associated with metabolism. The base sequence of the oligomers preferably contains at least one CpG dinucleotide. The probes may also exist in the form of a PNA (peptide nucleic acid) which has particularly preferred pairing properties. Particularly preferred are oligonucleotides according to the present invention in which the cytosine of the CpG dinucleotide is the 5[0018] th-9th nucleotide from the 5′-end of the 13-mer; in the case of PNA-oligomers, it is preferred for the cytosine of the CpG dinucleotide to be the 4th-6th nucleotide from the 5′-end of the 9-mer.
  • The oligomers according to the present invention are normally used in so called “sets” which contain at least one oligomer for each of the CpG dinucleotides of the sequences of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto. Preferred is a set which contains at least one oligomer for each of the CpG dinucleotides from one of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto. [0019]
  • Moreover, the present invention makes available a set of at least two oligonucleotides which can be used as so-called “primer oligonucleotides” for amplifying DNA sequences of one of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto, or segments thereof. [0020]
  • In the case of the sets of oligonucleotides according to the present invention, it is preferred that at least one oligonucleotide is bound to a solid phase. [0021]
  • The present invention moreover relates to a set of at least 10 n (oligonucleotides and/or PNA-oligomers) used for detecting the cytosine methylation state in chemically pretreated genomic DNA (Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto). These probes enable diagnosis and/or therapy of genetic and epigenetic parameters of genes associated with metabolism. The set of oligomers may also be used for detecting single nucleotide polymorphisms (SNPs) in the chemically pretreated DNA of genes associated with metabolism according to one of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto. [0022]
  • According to the present invention, it is preferred that an arrangement of different oligonucleotides and/or PNA-oligomers (a so-called “array”) made available by the present invention is present in a manner that it is likewise bound to a solid phase. This array of different oligonucleotide- and/or PNA-oligomer sequences can be characterized in that it is arranged on the solid phase in the form of a rectangular or hexagonal lattice. The solid phase surface is preferably composed of silicon, glass, polystyrene, aluminium, steel, iron, copper, nickel, silver, or gold. However, nitrocellulose as well as plastics such as nylon which can exist in the form of pellets or also as resin matrices are possible as well. [0023]
  • Therefore, a further subject matter of the present invention is a method for manufacturing an array fixed to a carrier material for analysis in connection with diseases associated with metabolism in which method at least one oligomer according to the present invention is coupled to a solid phase. Methods for manufacturing such arrays are known, for example, from U.S. Pat. No. 5,744,305 by means of solid-phase chemistry and photolabile protecting groups. [0024]
  • A further subject matter of the present invention relates to a DNA chip for the analysis of diseases associated with metabolism which contains at least one nucleic acid according to the present invention. DNA chips are known, for example, for U.S. Pat. No. 5,837,832. [0025]
  • Moreover, a subject matter of the present invention is a kit which may be composed, for example, of a bisulfite-containing reagent, a set of primer oligonucleotides containing at least two oligonucleotides whose sequences in each case correspond or are complementary to an 18 base long segment of the base sequences specified in the appendix (Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto), oligonucleotides and/or PNA-oligomers as well as instructions for carrying out and evaluating the described method. However, a kit along the lines of the present invention can also contain only part of the aforementioned components. [0026]
  • The present invention also makes available a method for ascertaining genetic and/or epigenetic parameters of genes associated with the cycle cell by analyzing cytosine methylations and single nucleotide polymorphisms, including the following steps: [0027]
  • In the first step of the method, a genomic DNA sample is chemically treated in such a manner that cytosine bases which are unmethylated at the 5′-position are converted to uracil, thymine, or another base which is dissimilar to cytosine in terms of hybridization behavior. This will be understood as ‘chemical pretreatment’ hereinafter. [0028]
  • The genomic DNA to be analyzed is preferably obtained from usual sources of DNA such as cells or cell components, for example, cell lines, biopsies, blood, sputum, stool, urine, cerebral-spinal fluid, tissue embedded in paraffin such as tissue from eyes, intestine, kidney, brain, heart, prostate, lung, breast or liver, histologic object slides, or combinations thereof. [0029]
  • The above described treatment of genomic DNA is preferably carried out with bisulfite (hydrogen sulfite, disulfite) and subsequent alkaline hydrolysis which results in a conversion of non-methylated cytosine nucleobases to uracil or to another base which is dissimilar to cytosine in terms of base pairing behavior. [0030]
  • Fragments of the chemically pretreated DNA are amplified, using sets of primer oligonucleotides according to the present invention, and a, preferably heat-stable polymerase. Because of statistical and practical considerations, preferably more than ten different fragments having a length of 100-2000 base pairs are amplified. The amplification of several DNA segments can be carried out simultaneously in one and the same reaction vessel. Usually, the amplification is carried out by means of a polymerase chain reaction (PCR). [0031]
  • In a preferred embodiment of the method, the set of primer oligonucleotides includes at least two olignonucleotides whose sequences are each reverse complementary or identical to an at least 18 base-pair long segment of the base sequences specified in the appendix (Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto). The primer oligonucleotides are preferably characterized in that they do not contain any CpG dinucleotides. [0032]
  • According to the present invention, it is preferred that at least one primer oligonucleotide is bonded to a solid phase during amplification. The different oligonucleotide and/or PNA-oligomer sequences can be arranged on a plane solid phase in the form of a rectangular or hexagonal lattice, the solid phase surface preferably being composed of silicon, glass, polystyrene, aluminium, steel, iron, copper, nickel, silver, or gold, it being possible for other materials such as nitrocellulose or plastics to be used as well. [0033]
  • The fragments obtained by means of the amplification can carry a directly or indirectly detectable label. Preferred are labels in the form of fluorescence labels, radionuclides, or detachable molecule fragments having a typical mass which can be detected in a mass spectrometer, it being preferred that the fragments that are produced have a single positive or negative net charge for better detectability in the mass spectrometer. The detection may be carried out and visualized by means of matrix assisted laser desorption/ionization mass spectrometry (MALDI) or using electron spray mass spectrometry (ESI). [0034]
  • The amplificates obtained in the second step of the method are subsequently hybridized to an array or a set of oligonucleotides and/or PNA probes. In this context, the hybridization takes place in the manner described in the following. The set of probes used during the hybridization is preferably composed of at least 10 oligonucleotides or PNA-oligomers. In the process, the amplificates serve as probes which hybridize to oligonucleotides previously bonded to a solid phase. The non-hybridized fragments are subsequently removed. Said oligonucleotides contain at least one base sequence having a length of 13 nucleotides which is reverse complementary or identical to a segment of the base sequences specified in the appendix, the segment containing at least one CpG dinucleotide. The cytosine of the CpG dinucleotide is the 5[0035] th to 9th nucleotide from the 5′-end of the 13-mer. One oligonucleotide exists for each CpG dinucleotide. Said PNA-oligomers contain at least one base sequence having a length of 9 nucleotides which is reverse complementary or identical to a segment of the base sequences specified in the appendix, the segment containing at least one CpG dinucleotide. The cytosine of the CpG dinucleotide is the 4th to 6th nucleotide seen from the 5′-end of the 9-mer. One oligonucleotide exists for each CpG dinucleotide.
  • In the fourth step of the method, the non-hybridized amplificates are removed. [0036]
  • In the final step of the method, the hybridized amplificates are detected. In this context, it is preferred that labels attached to the amplificates are identifiable at each position of the solid phase at which an oligonucleotide sequence is located. [0037]
  • According to the present invention, it is preferred that the labels of the amplificates are fluorescence labels, radionuclides, or detachable molecule fragments having a typical mass which can be detected in a mass spectrometer. The mass spectrometer is preferred for the detection of the amplificates, fragments of the amplificates or of probes which are complementary to the amplificates, it being possible for the detection to be carried out and visualized by means of matrix assisted laser desorption/ionization mass spectrometry (MALDI) or using electron spray mass spectrometry (ESI). [0038]
  • The produced fragments may have a single positive or negative net charge for better detectability in the mass spectrometer. The aforementioned method is preferably used for ascertaining genetic and/or epigenetic parameters of genes associated with metabolism. [0039]
  • The oligomers according to the present invention or arrays thereof as well as a kit according to the present invention are intended to be used for the diagnosis and/or therapy of diseases associated with metabolism by analyzing methylation patterns of genes associated with metabolism. According to the present invention, the method is preferably used for the diagnosis and/or therapy of important genetic and/or epigenetic parameters within genes associated with metabolism. [0040]
  • The method according to the present invention is used, for example, for the diagnosis and/or therapy of solid tumors and cancer [0041]
  • The nucleic acids according to the present invention of Seq. ID No.1 through Seq. ID No.64 and sequences complementary thereto and/or oligonucleotide- and/or a chemically pretreated DNA of genes according to the sequences of genes according to table 1 and sequences complementary thereto can be used for the diagnosis and/or therapy of genetic and/or epigenetic parameters of genes associated with metabolism. [0042]
  • The present invention moreover relates to a method for manufacturing a diagnostic agent and/or therapeutic agent for the diagnosis and/or therapy of diseases associated with metabolism by analyzing methylation patterns of genes associated with metabolism, the diagnostic agent and/or therapeutic agent being characterized in that at least one nucleic acid according to the present invention is used for manufacturing it, possibly together with suitable additives and auxiliary agents. [0043]
  • A further subject matter of the present invention relates to a diagnostic agent and/or therapeutic agent for diseases associated with metabolism by analyzing methylation patterns of genes associated with metabolism, the diagnostic agent and/or therapeutic agent containing at least one nucleic acid according to the present invention, possibly together with suitable additives and auxiliary agents. [0044]
  • The present invention moreover relates to the diagnosis and/or prognosis of events which are disadvantageous to patients or individuals in which important genetic and/or epigenetic parameters within genes associated with metabolism said parameters obtained by means of the present invention may be compared to another set of genetic and/or epigenetic parameters, the differences serving as the basis for a diagnosis and/or prognosis of events which are disadvantageous to patients or individuals. [0045]
  • In the context of the present invention the term “hybridization” is to be understood as a bond of an oligonucleotide to a completely complementary sequence along the lines of the Watson-Crick base pairings in the sample DNA, forming a duplex structure. To be understood by “stringent hybridization conditions” are those conditions in which a hybridization is carried out at 60° C. in 2.5×SSC buffer, followed by several washing steps at 37° C. in a low buffer concentration, and remains stable. [0046]
  • The term “functional variants” denotes all DNA sequences which are complementary to a DNA sequence, and which hybridize to the reference sequence under stringent conditions and have an activity similar to the corresponding polypeptide according to the present invention. [0047]
  • In the context of the present invention, “genetic parameters” are mutations and polymorphisms of genes associated with metabolism and sequences further required for their regulation. To be designated as mutations are, in particular, insertions, deletions, point mutations, inversions and polymorphisms and, particularly preferred, SNPs (single nucleotide polymorphisms). [0048]
  • In the context of the present invention, “epigenetic parameters” are, in particular, cytosine methylations and further chemical modifications of DNA bases of genes associated with metabolism and sequences further required for their regulation. Further epigenetic parameters include, for example, the acetylation of histones which, however, cannot be directly analyzed using the described method but which, in turn, correlates with the DNA methylation. [0049]
  • In the following, the present invention will be explained in greater detail on the basis of the sequences and examples with respect to the accompanying figure without being limited thereto. [0050]
  • Sequences having odd sequence numbers (e.g., Seq. ID No. 1, 3, 5, . . . ) exhibit in each case sequences of the chemically pretreated genomic DNAs of different genes associated with metabolism. [0051]
  • FIG. 1[0052]
  • FIG. 1 shows the hybridisation of fluorescent labelled amplificates to a surface bound olignonucleotide. Sample I being from a pilocytic astrocytoma tumor sample and sample II being from an oligodenrogliome grade II tumor sample. Flourescence at a spot shows hybridisation of the amplificate to the olignonucleotide. Hybridisation to a CG olignonucleotide denotes methylation at the cytosine position being analysed, hybridisation to a TG olignonucleotide denotes no methylation at the cytosine position being analysed. It can be seen that Sample I had a higher degree of methylation than Sample II at position 514. [0053]
  • Sequence ID Nos. 1 to 64 [0054]
  • Sequence ID Nos. 1 to 64 show sequences of the chemically pretreated genomic DNAs of different genes associated with metabolism. In particular, sequences having odd sequence numbers (e.g., Seq. ID No. 1, 3, 5, . . . ) exhibit in each case sequences of the chemically pretreated genomic DNAs of different genes associated with metabolism. Sequences having even sequence numbers (e.g., Seq. ID No. 2, 4, 6, . . . ) exhibit in each case the sequences of the chemically pretreated genomic DNAs of genes associated with metabolism which are complementary to the preceeding sequences (e.g., the complementary sequence to Seq. ID No.1 is Seq. ID No.2, the complementary sequence to Seq. ID No.3 is Seq. ID No.4, etc.). [0055]
  • Seq. ID No. 65 to seq. ID No. 68 show specific oligonucleotide sequences as used in Example 1. [0056]
  • The following example relates to a fragment of a gene associated with metabolism, in this case, OAT in which a specific CG-position is analyzed for its methylation status.[0057]
  • EXAMPL 1 Methylation Analysis of the Gene OAT Associated with Metabolism.
  • The following example relates to a fragment of the gene OAT in which a specific CG-position is to be analyzed for methylation. [0058]
  • In the first step, a genomic sequence is treated using bisulfite (hydrogen sulfite, disulfite) in such a manner that all cytosines which are not methylated at the 5-position of the base are modified in such a manner that a different base is substituted with regard to the base pairing behavior while the cytosines methylated at the 5-position remain unchanged. [0059]
  • If bisulfite solution is used for the reaction, then an addition takes place at the non-methylated cytosine bases. Moreover, a denaturating reagent or solvent as well as a radical interceptor must be present. A subsequent alkaline hydrolysis then gives rise to the conversion of non-methylated cytosine nucleobases to uracil. The chemically converted DNA (sequence ID 159) is then used for the detection of methylated cytosines. In the second method step, the treated DNA sample is diluted with water or an aqueous solution. Preferably, the DNA is subsequently desulfonated (10-30 min, 90-100° C.) at an alkaline pH value. In the third step of the method, the DNA sample is amplified in a polymerase chain reaction, preferably using a heat-resistant DNA polymerase. In the present case, cytosines of the gene OAT are analyzed. To this end, a defined fragment having a length of 572 bp is amplified with the specific primer oligonucleotides TGGAGGTGGATTTAGAGGTA (Sequence ID 65) and AACCAAAACCCCAAAACAAC (Sequence ID No. 66). This amplificate serves as a sample which hybridizes to an oligonucleotide previously bonded to a solid phase, forming a duplex structure, for example GTGTATTCGGTTGTTTTT (Sequence ID No. 67), the cytosine to be detected being located at position 514 of the amplificate. The detection of the hybridization product is based on Cy3 and Cy5 fluorescently labelled primer oligonucleotides which have been used for the amplification. A hybridization reaction of the amplified DNA with the oligonucleotide takes place only if a methylated cytosine was present at this location in the bisulfite-treated DNA. Thus, the methylation status of the specific cytosine to be analyzed is inferred from the hybridization product. [0060]
  • In order to verify the methylation status of the position, a sample of the amplificate is further hybridized to another oligonucleotide previously bonded to a solid phase. Said olignonucleotide is identical to the oligonucleotide previously used to analyze the methylation status of the sample, with the exception of the position in question. At the position to be analysed said oligonucleotide comprises a thymine base as opposed to a cytosine base i.e GTGTATTTGGTTGTTTTT (Sequence ID No. 68). Therefore, the hybridisation reaction only takes place if an unmethylated cytosine was present at the position to be analysed. The procedure was carried out on cell samples from 2 patients, sample I being from a pilocytic astrocytoma tumor sample and sample 11 being from an oligodenrogliome grade II tumor sample. [0061]
  • From the results (FIG. 1) it can be seen that Sample I had a higher degree of methylation than Sample II at position 514. [0062]
  • EXAMPLE 2 Diagnosis of Diseases Associated with Metabolism
  • In order to relate the methylation patterns to one of the diseases associated with metabolism, it is initially required to analyze the DNA methylation patterns of a group of diseased and of a group of healthy patients. These analyses are carried out, for example, analogously to Example 1. The results obtained in this manner are stored in a database and the CpG dinucleotides which are methylated differently between the two groups are identified. This can be carried out by determining individual CpG methylation rates as can be done, for example, in a relatively imprecise manner, by sequencing or else, in a very precise manner, by a methylation-sensitive “primer extension reaction”. It is also possible for the entire methylation status to be analyzed simultaneously, and for the patterns to be compared, for example, by clustering analyses which can be carried out, for example, by a computer. [0063]
  • Subsequently, it is possible to allocate the examined patients to a specific therapy group and to treat these patients selectively with an individualized therapy. [0064]
  • Example 2 can be carried out, for example, for metabolic diseases, solid tumours and cancer. [0065]
    TABLE 1
    List of preferred genes associated with metabolism
    according to the invention
    Genbank Entry No.
    Gen (http://www.ncbi.nlm.nih.gov)
    DUSP2 NM_004418
    EPHX2 NM_001979
    QDPR NM_000320
    SGSH NM_000199
    SHMT2 NM_005412
    SLC7A2 NM_003046
    SLC7A4 NM_004173
    TYMS NM_001071
  • Diagrams
  • FIG. 1[0066]
  • FIG. 1 shows the hybridisation of fluorescent labelled amplificates to a surface bound olignonucleotide. Sample I being from a pilocytic astrocytoma tumor sample and sample II being from an oligodenrogliome grade II tumor sample. Flourescence at a spot shows hybridisation of the amplificate to the olignonucleotide. Hybridisation to a CG olignonucleotide denotes methylation at the cytosine position being analysed, hybridisation to a TG olignonucleotide denotes no methylation at the cytosine position being analysed. It can be seen that Sample I had a higher degree of methylation than Sample II at position 514. [0067]
  • 1 68 1 6149 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 1 gtgttgggat tataggtttg agttattata tttggttttt aagagatata ttagagtttt 60 aattcgaagt atttatgaat gtgattattt ggaaatagag aatttgtagg tgtaattaaa 120 ttaagatgag gttataattg gatttggatg ggttttaaat ttaatgatta gtgtttttat 180 agtaagagtg gagaaaaagt tatatatagg ggagaagata ggggttggat tgatgttttt 240 ataaagttag gaatattaag gatttttaat aattattacg attttggaga gaggtatgga 300 atagattttt cgttagaatt tatagaaaga attaattttg ttaatatttg gattttggat 360 tttagttttt agaattgtaa gaaaatatat tttttttgtt ttaagttatt tagttggtgg 420 taatttgttg ttgtaatttt aggaaataaa tatagatttt ggtattgaaa agtggggtgt 480 tgttatatta atatatataa atatggaagt gtttttatta atagattggg gtgatgggta 540 gaggaagaag tttgaggtat atgatagatt aagtttagat tgttttgaag agaaagtggg 600 tggaaatgtg agtgttttat ttttataaaa aataaaaatt aggtgggtat ggtgatatac 660 gtgtagtttt agttatttgg aaggttgagg taggaggatt atttgagttt aggaggttgt 720 agtgagttat gatcgtatta ttgtatttta gtttgggtga tagagtaagg ttttgttttt 780 tttttttttt ttttttttgg agatagagtt ttgttttgtc gtttaggttg gagtatagtg 840 gtacgatttc gatttattgt aatttttatt ttttgggttt aagcgatttt tttgttttag 900 ttttttgagt agttgggttt atagaagttt attattatat ttagttaatt ttttgtattt 960 ttattagaga tagggtttta ttatgttagt cgggttggtt tggaattttt gattttaggt 1020 gatttgtttt ttttggtttt ttaaagtgtt agaattatag gtatgagtta ttatatttgg 1080 ttagagattt tgttttttaa ataaatatat tttttggaag gatattgttt aacgtagtat 1140 aacgagttat tttagtagtt taagtttgat agaagttgtt cgttgtagaa gaatttattt 1200 ggaaatgaat attaaatatt tttgtattat aaatataata tttataagtt ttttttaaat 1260 gtttttaatt ttttattagt tttttgttgt gaaaatattg ttttaatatt tttaaaatta 1320 atttttattt ttagaaagtt attttgggtt ttatggatat tttagagggt tttattttat 1380 taatatttta ataatatttt gtaagattta agtttttatt tataagtttg ttattagatg 1440 gaggtattga ttagattttt ttgataaatg taataaattt tagataaatt attttttgag 1500 tagtttttta ttaatatatt tgtttagata ttattgtttg ttatgatagg aatgataatt 1560 taaagttata aatttagata tgtaaaaaat gtttttaaat tttttttttg gttaggtgtg 1620 gtggtttata tttgtaattt tagtattttg ggagattgag ggaggattgt ttgggtttag 1680 gagttggaga ttagtttggg taatatagtg agaatttgtg tttattaaaa tattagtatt 1740 aataataata aattttaaaa tataaataaa aataattttt ttttaattgt atttaatttt 1800 tattttaata ttttattttt attttataga agaaatgtta atttagttat tttttttttt 1860 ttttttgaga cggagtttcg ttttgttatt taggttgtag tgtagtgata cgattttggt 1920 ttattgtaag tttcgttttt tgggtttacg ttattgtttt attttagttt tttaggtagt 1980 tgggattata ggtggttttt tttatgttta gttaattttt tgtattttta gtagagatag 2040 ggttttatcg tgttaggatg gtttcgattt tttgattttg tgattcgttt gttttggttt 2100 tttaaagtgt tgggattata ggcgtgagtt atcgcgttcg gttaagtttt agatttttaa 2160 atgaaattat tagttatatt tttgtttggt gtttatattg gtgataaagt tatttttatt 2220 tttttgaagt ttagttttaa agagtagttt gtttgttgta gttttagaaa taaatgtatt 2280 attttttttt ttttaatgtt tttaaatgtt tttgaatttt tttagaagtt gttttgatga 2340 atatagtggt attttttttt ggtagtgttt ttgatggtag aattgtttaa ttatagttga 2400 tttttatgtt tttagttagg ttttttttag ggtaggtgtt ttttaagata taattagtgt 2460 agtgagtgtt tagaagttta gatttagtaa ttagattgtt tagattttaa ttgtaattgt 2520 gttattaatt attagttttg tgtttttgga taaatttttg gaaaatgtgg ataatgttat 2580 tttttaattt agtggatttt tgggagaatt aaaattaaat tgtaaaagaa ttggtttata 2640 ttaagaatta tgtatatagt tatgtaatta gttttttttt tttttttttt tttttgagat 2700 atagttttat tttgttgttt aggttggagt gtagtggtgt gattttagtt tattgtaatt 2760 tttatttttt aggtttaagt aatttttttg ttttagtttt ttgagtagtt gggattatag 2820 gtgtttatta ttatgtttag ttaatttttg tatttttagt agagatgggg ttttgttatg 2880 ttggttaggt tgtttttaat ttttgatttt aaatgattta tttatttggg ttttttaaag 2940 tgttgtgatt ataggcgtga gcgattacgt ttagtttaat tagttatttt ttattgtgtg 3000 atattttagt tattagtttt ggttttttat aattggtaat ttttatgagg ttagattttt 3060 agttttttga gttatttttt taataattta atttttttag ttagaaatat ttgttttttt 3120 tttttttttt tttttttata tatatatata tataaagttt aaatattgat atataatgta 3180 atgatttttt tttaataatt ttcgaagtag tttagtatga aaaatatttg tttttggttt 3240 ttggtagaag ggaaaggtgt gagtgtgata ttttaaggaa ggaggtaggt tttggtgagt 3300 tgttgaatag agaggttttt cggtgtagga attatagggg attttaaggg ataaatttgg 3360 agtgatgggg aaattaaaga tagggtgtta tattaaaaaa ttattttggt cgcgtgtagt 3420 ggtttacgtt tgtaatttta gtattttggg aggtttagtg ggggcggatt gcgtgagttt 3480 aggagtttga gattagtttt tgggtaatat ggtgaaaatt cgtttttatt aaaatataaa 3540 agattagtta ggtttggtag cgtgcgtttg taattttagt tattcgtgag gttgaggcga 3600 atttaggagg tagaggttgt agtgagttaa gatcgcgttt gggtgataag tgcgagattg 3660 ttttaaaaaa aaaaattatt tttaaataga tttatttagg tggtttatgt ttataatatt 3720 tgtgttttgg gaggttaagg ttagaagatt ttttaaggtt aggagtttga gattagtttg 3780 ggtaatatag taagattttt tttttatata aaataaaaat taaaaaaatt agtatggtgg 3840 agtatgtttg tagttttagt tacgtagtta tttgggaagt agagatagga ggatttttta 3900 gttatttggg aggtagagat aggaggattt tttgagatta ggagtttgag gttgtagtga 3960 gatatgattg tattattgta ttttagattg ggtgataaga gcgagatttt attttaaaaa 4020 aaaaaaatat tttaaaatat aatggtttaa aataataatt tattgttttt tttcgttttt 4080 gtggattatg aatttagata gtatggtggg tatggtttgt ttttgtttta tgatgtttgg 4140 ggttttagtt ggagtggttg aaggttgggg attggaatta tttgaggttt tttatttata 4200 tttgtatttg gattgagttt ggaatttgat tgttttaaaa tatttttacg gttgggtgtg 4260 atggtttacg ttcgttattt tcgtattttg agaggttgag tttggttttt tgtttgagtt 4320 tcggagttag ttattcgttt atggttatat agggagattt agtttttatt aaaaaaaaaa 4380 aatataataa tttgttgggc gtggtcgttt gcgtttgtaa ttttagtatt ttgggaggtc 4440 gaggagggag gtttatttga gtttaggagt ttaagattag tttggttaat atggtgaaat 4500 ttcgttttta taaaaaatat aaaattattt ggttgtggag gttttcgttt gtagttttag 4560 ttattgggat ggttggggag ggaggatcgt ttgagttttg atggtcgaga ttatagtgag 4620 ttgtggttac gttattgtat ttagtttggg tgatagagtg agattttttt tttaaaaaaa 4680 aaaaaaaatt ttaaaatatt tttatgagtt tgtgttgggt aggtttaagg gaaatatgtt 4740 tagtaaatcg aaaaatttcg gattatatat aaattatcgg tttcggtagg ttagatttgg 4800 tggatacggg agttagtagc gtgttaggtg ttcgttgatt ttagcgttag tgtttttatt 4860 tacgtttttt attcgttaat tttttttggt ttaggttgcg gtgttttagc gttaggtttc 4920 gtttcgtttt tggttgtcgg ttaatcgtcg tcgattgaga ggcgattatt ggaggaagcg 4980 ggatgggcgg tgttcgcgtc gggtcgttag gggtgcgggg ttggggagga ggtcgttagt 5040 ttacgtttgt ggagtcgata tttagttttt tgcgattatg gttgtgttgg cggtattttt 5100 gcgtagcggc gttcgtagtc gtagtttttt gtttcggagg ttggtgtagg tgagcggggt 5160 tcgtttttat agtatttaga ttcgggatgc gaggagtttt cgtttcggaa gtttttagtt 5220 cgcggtcgtt gcggttttcg cggttcgggc gcgcggttta ggttttagga tagttacgcg 5280 acgggttttg gtttaaaaat cgtttaagtg tttcgataat atttaggatt cgtttatttt 5340 tatagcgcgt ttttattttt aaggtttcgg cgtaattatt ttaatgagcg ttattggtgt 5400 gttaaataag ggtacgtgtt tgggcgggta ggatcgttag gattggcgtt ggttcggttt 5460 gagcggtggg atcggggaga gtttttttgt aggtttgtgt agttgttttc gagatttttt 5520 ttaaaatata tttgtgtgcg ttattgttag gagaggtttt tttttttttt taatataata 5580 gataattatt gggtatataa ggggagaggg tattatgtga ttataataga tgttttttgg 5640 agtagtttga aatttattag ggaaaataaa tgattattta gataatataa taaattatat 5700 ttgatatatg agtaaagttt atatattgag ggcgttttaa gggttgtcgt ttttttgatc 5760 gttgtgttta gggaatatag taggggtaga gttttaaaga atttattttt tatatgcgta 5820 agtaagggag tacgtattat agattgttag gtaaagtttt aggaataggt agagattttt 5880 agggtgtggt tggtgaagtt tgagtttttt aggtcgatgg gggtaataag tttggagatt 5940 tagttatgtt gtgagtatgg atttgatttt agttaagtag ggattgttga tatgtttgtt 6000 tttgttgtaa tggtaggtta ttttagtttt tacgtttggg cgtagaataa tattatttgt 6060 ataagggtgt tggcggtagg agttttgtaa gagattgtaa aagaattagt ttaggatttg 6120 ataattaggg agtgagggtg cgaagttaa 6149 2 6149 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 2 ttggtttcgt atttttattt tttaattgtt aagttttaga ttggtttttt tataattttt 60 tgtaaagttt ttatcgttag tatttttgtg taagtaatgt tattttacgt ttagacgtaa 120 gaattagagt gatttattat tgtaataaaa ataaatatat taataatttt tatttaatta 180 gggttaagtt tatatttata atataattgg atttttaagt ttattgtttt tatcgattta 240 gaaaatttaa gttttattaa ttatattttg aaggttttta tttatttttg aggttttgtt 300 tgataatttg tggtgcgtat ttttttgttt acgtatgtgg agaataaatt ttttgagatt 360 ttgtttttgt tgtgtttttt aaatataacg gttagaagag cgatagtttt tggaacgttt 420 ttagtatgtg agttttgttt atatgttaag tataatttat tgtattattt gagtagttat 480 ttgttttttt tgataaattt taggttgttt taaaaaatat ttgttatgat tatatggtgt 540 tttttttttt tgtatgttta atgattattt attgtattaa aaaagaaaag gaattttttt 600 tgataataac gtatataaat atgttttaaa gaaaatttcg ggagtagttg tataggtttg 660 taaagagatt tttttcgatt ttatcgttta ggtcgggtta gcgttaattt tggcggtttt 720 gttcgtttag atacgtgttt ttgtttgata tattagtaac gtttattaag atgattacgt 780 cgagattttg gaagtagaaa cgcgttgtaa aaataggcga gttttgggtg ttatcggagt 840 atttaggcgg tttttggatt agaattcgtc gcgtgattgt tttggggttt aagtcgcgcg 900 ttcgggtcgc gggagtcgta acggtcgcgg gttggaagtt ttcgaggcgg ggatttttcg 960 tatttcgggt ttgagtgttg tggggacgaa tttcgtttat ttgtattagt tttcggagta 1020 gggggttgcg gttgcgggcg tcgttgcgta gaagtgtcgt tagtatagtt atggtcgtag 1080 agggttgagt atcggtttta taggcgtaga ttagcggttt tttttttaat ttcgtatttt 1140 tagcggttcg gcgcgggtat cgtttatttc gtttttttta atagtcgttt tttagtcggc 1200 ggcgattggt cggtagttaa gggcggggcg gagtttggcg ttgggatatc gtagtttggg 1260 ttaggaaagg ttgacgagtg aaggacgtgg atggagatat tggcgttggg gttaacgagt 1320 atttgatacg ttgttggttt tcgtgtttat taagtttaat ttgtcggggt cggtggttta 1380 tgtgtaattc gagatttttc gatttattga gtatgttttt tttaggttta tttagtataa 1440 atttatgaaa atattttagg attttttttt ttttttggaa aaagggtttt attttgttat 1500 ttaagttgag tgtagtgacg tgattatagt ttattgtaat ttcgattatt agggtttaag 1560 cgattttttt tttttagtta ttttagtagt tgagattata ggcgaaagtt tttataatta 1620 gataattttg tattttttgt ggagacgggg ttttattatg ttggttagat tggttttgaa 1680 tttttggatt taagtgagtt ttttttttcg gttttttaaa gtgttgggat tataggcgta 1740 ggcgattacg tttagtaaat tgttgtattt tttttttttg gtagagatta ggttttttta 1800 tgtggttata ggcgggtggt tgatttcggg gtttaagtag agggttagat ttagtttttt 1860 aaagtgcggg gataacgggc gtgagttatt atatttagtc gtgaaaatat tttgaagtaa 1920 ttaaatttta ggtttagttt agatataaat atgggtaaaa ggttttaggt gattttagtt 1980 tttaattttt aattatttta gttgagattt tagatattat ggagtagaga taagttatat 2040 ttattatgtt gtttgaattt atggtttata gaaacgagag aaaataatgg gttgttattt 2100 taggttatta tgttttggag tatttttttt ttttaagata gggtttcgtt tttgttattt 2160 agtttggagt atagtggtgt aattatattt tattgtagtt ttaaattttt ggttttaggg 2220 gatttttttg tttttgtttt ttaagtagtt aggggatttt tttgtttttg ttttttaagt 2280 agttacgtag ttaggattat aggtatgttt tattatgtta atttttttaa tttttatttt 2340 atatagagaa ggggttttgt tatgttgttt aggttggttt taaatttttg gttttaagag 2400 attttttggt tttggttttt taaagtatag atattatagg tataagttat ttaaataggt 2460 ttgtttgggg gtaatttttt tttttgagat agtttcgtat ttgttattta ggcgcgattt 2520 tgatttattg taatttttgt tttttgagtt cgttttagtt ttacgagtag ttgggattat 2580 aggcgtacgt tgttaagttt ggttaatttt ttgtatttta gtagagacgg gtttttatta 2640 tgttgtttag aggttggttt taaatttttg agtttacgta attcgttttt attaggtttt 2700 ttaaagtatt gggattatag gcgtgagtta ttgtacgcgg ttagggtaat tttttaatat 2760 agtattttgt ttttaatttt tttattattt taggtttgtt ttttaaagtt ttttgtgatt 2820 tttgtatcga agaatttttt tatttaatag tttattaagg tttatttttt tttttggaat 2880 gttatattta tatttttttt ttttattaga ggttaaagat aaatattttt tatattgggt 2940 tgtttcgaga attattgaaa ggaagttatt atattgtatg ttagtgttta aattttgtgt 3000 gtgtgtgtgt gtgagagaga gagagagaga gagaaataga tatttttaat tgaaaaagtt 3060 gaattgttaa agaaatgatt tagaaaatta aaggtttggt tttatagaga ttattagttg 3120 tgagaggtta aagttgatga ttagggtatt atatagtaaa agatgattgg ttaggttggg 3180 cgtggtcgtt tacgtttgta attatagtat tttgggaggt ttaggtgagt ggattatttg 3240 aagttaggag ttaaaagtag tttggttaat atagtaaaat tttattttta ttaaaaatat 3300 aaaaattagt tgggtatggt agtgggtatt tgtgatttta gttatttagg aggttgaggt 3360 aggagaattg tttaaatttg ggaggtggag gttgtagtga attgagatta tattattgta 3420 ttttagtttg ggtaatagaa tgagattgtg ttttaaaaaa agaagaaaaa aaaaaagatt 3480 ggttatatag ttatgtatat agtttttaat atgaattagt ttttttatag tttaatttta 3540 atttttttaa aaatttattg aattagggag tagtattatt tatatttttt agaagtttgt 3600 ttaagggtat aaagttagta gttagtgata tagttgtaat tggaatttag gtagtttggt 3660 tgttaggttt aggtttttag gtatttatta tattagttgt gttttaggag atatttgttt 3720 taggagaaat ttaattagga atatagaagt tagttgtaat tggataattt tgttattaga 3780 ggtattatta ggaaaaagtg ttattatgtt tattaggata gtttttagag aagtttagag 3840 atatttagga gtattgaggg gagaagaata gtatatttat ttttggagtt atagtaggta 3900 agttgttttt taaaattaaa ttttaaaaaa ataagagtag ttttattatt aatatgagta 3960 ttaggtaaaa atgtagttaa taattttatt taagaattta ggatttggtc gggcgcggtg 4020 gtttacgttt gtaattttag tattttagga ggttaaggta ggcggattat aaggttagga 4080 gatcgagatt attttaatac ggtgaaattt tgtttttatt aaaaatataa aaaattagtt 4140 gggtatggag ggggttattt gtagttttag ttatttggga ggttgaggta ggatagtggc 4200 gtgaatttag gaagcggagt ttgtagtgag ttaagatcgt gttattgtat tatagtttgg 4260 gtgatagagc gagatttcgt tttaaaaaaa aaaaagaaag tgattagatt aatatttttt 4320 ttgtgaaata gaaatggagt gttggaatga aaattaaata taattaagag agaattattt 4380 ttgtttgtat tttaaaattt attattatta gtattagtat tttggtagat ataggttttt 4440 attatgttgt ttaggttggt ttttaatttt tgggtttaag taattttttt ttagtttttt 4500 aaagtgttgg gattataggt gtgagttatt atatttggtt aaagaaaaaa tttaaaaata 4560 ttttttgtat atttgaattt gtggttttgg attattattt ttgttatagt aggtaatagt 4620 gtttggatag atgtattaat gaagagttat ttaaaaagtg gtttatttgg gatttattat 4680 atttgttaag gagatttagt taatattttt atttagtggt aaatttgtaa gtggagattt 4740 aggttttgta aagtattatt aaaatattga taaaataaag ttttttgaaa tgtttatgag 4800 atttagagtg gttttttaga agtagaagtt agttttagga atattagagt aatattttta 4860 tagtaggaaa ttagtggaaa attaaaaata tttaagaaaa atttgtgggt attatattta 4920 taatataaag atgtttgata tttattttta agtaagtttt tttataacga ataatttttg 4980 ttaaatttag attattggaa taattcgttg tattacgtta aatagtgttt ttttaaaaga 5040 tatgtttgtt taagggatag ggtttttggt taggtgtggt ggtttatgtt tgtaatttta 5100 gtattttggg aggttaagga gggtagatta tttgaggtta ggagttttag attagttcgg 5160 ttaatatggt gaaattttgt ttttagtaaa aatataaaaa attagttggg tgtggtgatg 5220 ggtttttgta agtttagtta tttaggaggt tgaggtaaga gaatcgtttg aatttaggag 5280 gtggaggttg tagtgagtcg agatcgtgtt attgtatttt agtttgggcg atagagtaaa 5340 attttgtttt taaaaaaaaa aaaaaagaga gagatagagt tttgttttgt tatttaggtt 5400 ggagtgtagt ggtgcgatta taatttattg tagtttttta agtttaagta atttttttgt 5460 tttagttttt taagtagtta agattatacg tgtgttatta tgtttattta atttttattt 5520 tttgtagaga tggggtattt atatttttat ttattttttt tttaaggtaa tttaggttta 5580 gtttattatg tgttttaaat tttttttttt gtttattatt ttaatttatt aataaaggta 5640 tttttatgtt tgtgtatatt aatatggtag tattttattt tttagtatta aaatttgtat 5700 ttgtttttta agattgtagt agtaaattat tattaattgg gtggtttaaa ataaaagaaa 5760 tgtatttttt tatagttttg gaggttggag tttaagattt aggtgttggt aggattggtt 5820 ttttttgtgg gttttaacgg agagtttgtt ttatgttttt ttttaagatc gtggtggttg 5880 ttggaaattt ttggtatttt tggttttgta gaggtattag tttaattttt gttttttttt 5940 ttgtgtgtgg tttttttttt atttttgtta taaggatatt ggttattgga tttagggttt 6000 atttaaattt aattatgatt ttattttaat ttgattatat ttgtaagttt tttattttta 6060 aatagttata tttataggta tttcgagtta agattttaat atatttttta ggggttaggt 6120 gtggtggttt aggtttgtaa ttttagtat 6149 3 5770 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 3 ttttatttta aattgatacg cgttaggcgt taagttttgc gataagtttt taggatatag 60 aagtgaataa gagttttatt tttattttga gaaatttgaa gttgtggaga aaatagattt 120 agaagtagat taaattagta agtattagaa agagggagga gtagagggag tgatcgattt 180 ggtttgggat tttaaaaaaa ggtatcgtta tatcgaatta tagagaataa ggggattttt 240 ttagatagaa ggtataagag aaatatttga ggaattagga attgagaatt ataatttata 300 taaatcggat tatttttttg tgggaagaaa tttttaggta ggaagtgaag ggaataaaat 360 aaatatatat tattatgatt ggtattcgta cgggcggtta ttttattgtt tttttatatg 420 ttcgaaaatt gattgcgata atttgataat ttaagtaagt tagaataaag gatttagaaa 480 aaaaagaatt tgaagtacga gtttttgttt taggaaatgt tttttagatg ggtaagagaa 540 aggagaatta tattagtgta tttaaattgg tatatgataa taattgattt ttggtagatt 600 gaggttgttt gtgtagtatt gcgtatgtaa gttaaatatt ttatttaaat gtatcgtata 660 aggtaaatgg aaagagtgtt tttttatggt ttttatttgt acgggttatg ttacgggtta 720 tgttagtatt taatgtaggt tttaagtcgg ttttagttta ggttgttgga ggttagagtt 780 aaggttagtt ttttagacgg cgggatttgt gtagatgtat agggattata tatagaagat 840 ttttattttg tttaatgttt tattggtatt atttgtaaat ttttaataat tttatttttg 900 aatttgtgtt ttggatttga agtttaatac gatatagaat atgtgaatga gtagaggaga 960 taggtataat gtttatgttt gtagttttta gatgttatat gtataatatt ggcgatgttt 1020 aggagtatag aatttttgta gtttatgatg agtggtattc ggtgatattt aaattaagta 1080 tacggtaagt atatgttata tttgtgttag agtaataggg tatcgatagt tttaggagtt 1140 atattttgta ttttaattag aatttttttt taaagtaatg aaaggaatat aaaagattaa 1200 ggaattttat tatgttcgtt atgattcgtg ttattttgtt ttaattagtt agttatatag 1260 aaaatagtga ggtagaagga aaagtaaaga gagggtttta tattattttt tgtttttttt 1320 attttttttt atttattagt aagttaaagg tagagagtgt tatagaatgt gtatatatta 1380 ggaggaaata aaaataggtg agttagtgtt gtacggtgtt tttatttttt tggtaggaat 1440 aaaatatttt tgtacgattt gtaaattatg tattgtgtta ttattagtga gtttttatat 1500 gagttaaatg tttttatatt tgtattgaaa attagtatta cggtaaggcg ttgtggttta 1560 tatttgtaat tttagtattt gggaaggttg aggtgggcgg attatttgag gttaggggtt 1620 cgagataagt ttggtttata tggtgaaatt ttatttttat taaaaatata aaagttagtt 1680 gggtgtggtg gtatacgttc gtagttttag ttatttggga ggttgaggta ggagaatcgt 1740 ttgaatttgg gaggtagagg ttgtagtgag tcgagatcgt gttattgtat tttagttttt 1800 ttagtttggg cgatagagta agattttatt ttaaaaaaaa aaaaaaaaaa agaaaagaaa 1860 agaaaagaaa attattattg tataatataa agatgaatgt taaaattaat gttagtaatt 1920 taaattttaa attatttttt ttttagaatg gtattaaata gtaaataaaa atattgtgaa 1980 aagttaagag aggttgtgaa aatatagtaa aggtttatat tttagtattt ttaatggttt 2040 tttttttttg ttttttgaat aagggatatt atatttttat tttgtattgt gttttgtaaa 2100 ttatgtatat agtttttgtg tgaatttatg gtttttaata tatataaata tagaaataaa 2160 tgtagttgta tttgtttgat atatgtatat atgtatatat atgtatattt atatatatat 2220 ttatgtatgt atatatatgt atatttatat atgtatgtat gtatatatat gtatatttat 2280 atatgtatgt atgtatatat atgtatattt atatatgtat gtatgtatat atatgtatat 2340 ttatatatgt atgtatgtat atatatgtat atttatatat gtatgtatgt atatatttgt 2400 atatttatat atgtatgtat atatatgtat atttatatat gtatgtatat atatgtatat 2460 ttatatatgt atgtatatta ttgtatttta gtttgggtga tagagcgaga tttcgtttta 2520 aaaaaaaaaa aaaaattttt tttttttttt ttatttatta tttttagttt ttgtttgttt 2580 tatatgagta gataattata tgagtagtta taatgaggat tttttagggg atagattttg 2640 tttggttatt tagtagaagt atgtaattat ttttttaaga ttggttttta aatttatttt 2700 agatagagtt tttaggtagg aaattttata ttttttggtt ttagaagaat atatttatat 2760 ttatttaaat gtgttaggta ttggttataa agaatattgg tgtttattta taattgttta 2820 taatgtgtta ggagttgtgt ataaagtagt gtaataggat tattttggaa agtttatgta 2880 gttagtagag gagatagata aattaggaat tatatggtaa gttgaaagag gaagttaggg 2940 gtaagatgtt gtattaaatg taggagattg gaaggttttt ttggaagaag tgatgtttag 3000 ggggagtttt agaggtaaat ttttggtttg gttaatagaa gatagtttta ttgtttattg 3060 agattataga agaaataggt tggaagagtt tggttttaat atgttaaatt tgatgtgttt 3120 ataggaaatt ttatttattt gagatagttt ttttttgtcg tttaggttgg agtgtagtgg 3180 tgtgatttcg gtttattgaa atttttgttt tttaggttta agcgattttt ttatgttagt 3240 ttttttagta gttgggatta taggcgtacg gtattacgtt cggttaattt ttttatttta 3300 tggtagaaac gggatattat tatgttggtt aggttggtgt taaattgttg attttaaatg 3360 attcgttttt ttcggttttt taaagtgttg ggattatagg tgtgagttaa ggtgttcgat 3420 ttgatgtgtt tgtaagaatt taaatgaaga gggttagtta gtttaggaga cgaggttaga 3480 tgtaaggatt ttagatttgt tagtatatag gtggtgattg atgtcgtagg aatgattggt 3540 attatttagg gagttggtgt aaagtaggag ttttggggaa tatgttaagg ggatgtgaga 3600 gtaagtttat aaagatttag aagtggttag ggagtaaggg gaaaatggga tagaatagag 3660 taaaagttac gggaggtatt ttttgaattt tttggattta gatatgttag gggataggaa 3720 atatattgaa gataattgaa gagattttag tgtgttgttg agtttttagt agagtagata 3780 gttgatttta ttattatttt agattttaaa gatttttttt gaaattgtat tgttatgtaa 3840 tttttttttt tttttattgt tttatttttg gggtttatat tttttatttt ttttgattta 3900 tttgatttat tcgtatattt ttgtaaagtt ttaatgtagg tttttaggat ttaatgattt 3960 ttttaattaa ttttaaagtt ttttaggaag attttttagg ttcgttaata gttttttttt 4020 ttatgatttt gtgataaagt ttttttgttt tattatttag gtgtttttaa taagttgttg 4080 taacggtggt tttttataag tttgtttgga aattttagaa agtttagaaa aattatgaat 4140 tttgtttagt aagaggttgg gaagttagaa agggttttaa ataaaattga ttttatttgt 4200 tatatgtttt ttttattgtt taaacgttaa ttaaaggaat ttttgtgacg ttaagacgtt 4260 ttcggcgttt ttattcgttt atagttagag ttgattttag aaggtagggg gttcgtatcg 4320 agacgttttt agtaagtttt ttacgcgagc gaatgattgg cgttaggaga aacgtatagg 4380 atttttcgaa gtcgtcgaga gtaaaaggat ttattagagt tgtgttgaga ttcgtcgcgg 4440 gtcgggttcg tattcgagat tttcgttcgt gggattttag ttttgagttg aacgagagat 4500 aagtttttgt tattttttag tttttattgt ttcgagaaat tttaagattt tttaaaaaaa 4560 agtttaagac gttaagtcgg ggaattttaa tattggggtg tttagaaata ttggggtttt 4620 aggcgttttg taaatgcgtt cgaggttcgc ggttttgttc gtaagtttag atttcggttt 4680 tattttcgtt tcgcgtttcg cgtttcggtt ttattttcgt ttcgcgtttc gcgtttcgcg 4740 tttcgcgcgt tttcgttcgt ttttgtttcg gttttgcgtt tgcgtatagt gggatgcgcg 4800 gggaggtggt gcgcggggag gtggagggcg aggggcgggg ttattttagg tttcgttcgc 4860 ggtaggtttg tgggttgcga ggaggagttt tgtttagttt gtaggtagcg tagggtagac 4920 ggcggtagga gaagtaagat gaatgtaggt ttagattttg tggttatcgt ttcggcggcg 4980 cggattatta taggtgagtg gtcggcggga gtcgcgtaga gttcgaggcg tttgttgttt 5040 cggtaggagc gtcgagggtc ggatttgtgt aggagagggg cgtatgtgga ggaagtcggt 5100 taggttaagt cgcgaggagt cgcgggattt ttggaatttt gcggttttcg cgttttttga 5160 tttggtgtta tagttttatt tttttttttt tcgatgtgcg tatttcgttt ttcgtgtttg 5220 gattggtttt cggggtagag ttatcgcgtg gtttgttttt tttattggtt ggcgtaggga 5280 ggtgtttttt ttcggggttt ttgattggtc ggtttcggga ggcgttatcg gtaatgtttg 5340 cggtaggggc ggaattgtta ggtggtttga gttcggtttt gggttggggt cgggttgtta 5400 tataatggtt agaagtcgtg atttcgtttt tttcgtgtcg tatggttttt aacgtttttg 5460 attcgtcggt tttttttgtt tgggaagtat ggggtcgtat ttagtttttc ggatttgggg 5520 aaatagaagg gttatagcgg cgtttttagg tcgttttgga ggtcgtttgt ttagttttcg 5580 gttgttgcga gttgtggtat ttattttgat ttttgtttag attagtaggt gtaggaacgt 5640 gtgggaggag agggtattgt tttttcgcgt ggttttgtta aatagggtta tgaggttttt 5700 ttgttcgtag gtggttttcg tattattcgt aggtttgtga tgtttacgtt tttcgttttt 5760 ttattgtagg 5770 4 5770 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 4 tttataatag aaaggcggag agcgtggata ttataagttt gcgggtaata cgggaattat 60 ttacgagtag gggagtttta tgattttgtt tggtaaggtt acgcgaggag gtagtgtttt 120 ttttttttat acgtttttat atttgttggt ttgagtaaag gttaaggtgg gtgttataat 180 tcgtagtagt cgagggttgg ataggcgatt tttagaacgg tttagggacg tcgttgtagt 240 ttttttattt ttttaaattc gaaggattgg atgcgatttt atgtttttta aataaaagga 300 atcggcgggt taagggcgtt gaaaattatg cggtacgaag gagacgaagt tacgattttt 360 agttattgtg tgatagttcg attttagttt aaagtcgggt ttagattatt tagtagtttc 420 gtttttgtcg taggtattat cgatggcgtt tttcggagtc ggttaattag gggtttcgga 480 ggagaatatt tttttacgtt aattaatggg agaggtaggt tacgcgatgg ttttatttcg 540 ggagttaatt taagtacgag ggacggagtg cgtatatcgg gagaggagag ggtggggttg 600 tagtattagg ttagggaacg cgggagtcgt agggttttag ggatttcgcg gtttttcgcg 660 gtttggtttg atcggttttt tttatatacg tttttttttt atataagttc ggttttcggc 720 gtttttgtcg aagtagtagg cgtttcggat tttgcgcggt tttcgtcggt tatttattta 780 tgatggttcg cgtcgtcgag acgatgatta taggatttga gtttgtattt attttgtttt 840 ttttgtcgtc gtttgttttg cgttgtttgt aagttaggta aagttttttt tcgtagttta 900 taggtttgtc gcgggcggga tttgaggtag tttcgttttt cgttttttat tttttcgcgt 960 attatttttt cgcgtatttt attgtgcgta ggcgtaaggt cggagtaggg gcgggcggag 1020 gcgcgcgggg cgcggggcgc ggggcgcggg gcggaagtga ggtcggggcg cggggcgcgg 1080 ggcggaagtg aggtcggggt ttgggtttgc gggtagaatc gcggatttcg gacgtattta 1140 tagagcgttt gaaattttag tgtttttgga tattttaatg ttggagtttt tcgatttgac 1200 gttttgggtt tttttttaaa aaattttagg gtttttcgaa atagtaaaga ttggggggtg 1260 ataaagattt atttttcgtt tagtttagga ttggaatttt acgggcgaga atttcgagtg 1320 cgagttcggt tcgcggcggg ttttagtata gttttgatgg gtttttttgt tttcggcggt 1380 ttcgggaggt tttatgcgtt ttttttggcg ttagttattc gttcgcgtga ggggtttgtt 1440 aggagcgttt cggtgcgagt tttttgtttt ttaagattaa ttttggttgt gaacgggtga 1500 ggacgtcggg agcgttttag cgttataaaa gtttttttgg ttgacgtttg gatagtgaaa 1560 ggagtatgta ataagtgggg ttagttttgt ttaaaatttt ttttgatttt ttagtttttt 1620 attgggtaaa gtttataatt tttttgagtt ttttagggtt tttaggtaag tttatgaggg 1680 gttatcgtta tagtaatttg ttgggaatat ttggatagtg gaataagaaa gttttgttat 1740 aaagttatga aggggaaaat tgttgacgga tttggagaat ttttttgaag aattttaaag 1800 ttgattgaaa gaattattaa attttggaaa tttatattaa gattttgtag agatatgcgg 1860 atgggttaga taaattagag aaggtaaaga gtgtaggttt tagaggtggg gtaatagaga 1920 aggaaaaaaa ttgtataata gtgtaatttt aggagaaatt tttagggttt ggaatagtgg 1980 tgaaattagt tgtttatttt gttaagaatt tagtagtata ttgaagtttt tttagttgtt 2040 tttaatgtgt tttttgtttt ttaatatatt tgagtttaag gaatttaagg aatgtttttc 2100 gtggtttttg ttttatttta ttttattttt tttttatttt ttggttattt ttgagttttt 2160 gtgggtttat ttttatattt ttttaatatg ttttttaagg tttttatttt gtattagttt 2220 tttgggtaat attagttatt tttacggtat taattattat ttgtatattg ataagtttga 2280 aatttttata tttaatttcg ttttttaagt tgattgattt tttttattta aatttttata 2340 agtatattag gtcgggtatt ttggtttata tttgtaattt tagtattttg ggaggtcgag 2400 gagggcggat tatttgaggt tagtagtttg atattagttt ggttaatatg gtgatatttc 2460 gtttttatta taaaatagaa aaattagtcg ggcgtggtgt cgtgcgtttg taattttagt 2520 tattggggag gttgatatgg gaaaatcgtt tgaatttagg aggtagaggt tttagtgagt 2580 cgagattata ttattgtatt ttagtttgag cgatagagag aaattgtttt aaataaataa 2640 aattttttat aagtatatta aatttgatat attgaaatta aattttttta gtttgttttt 2700 tttgtaattt tagtgagtag tgaaattatt ttttgttaat taaattagaa atttattttt 2760 gaaatttttt ttaaatatta ttttttttag aaaaattttt taattttttg tatttggtgt 2820 agtattttat ttttaatttt tttttttaat ttattatgta atttttagtt tatttgtttt 2880 ttttattgat tatataagtt ttttaagatg attttgttat attgttttat gtatagtttt 2940 tagtatatta taggtagtta tgaatgaata ttaatatttt ttatggttag tgtttagtat 3000 atttgaatga gtatgaatat atttttttgg agttaaggga tatagagttt tttgtttgaa 3060 ggttttattt agagtaagtt taggagttaa ttttgagaag gtaattgtat gtttttgttg 3120 agtggttaaa tagaatttgt tttttgagga gtttttatta tagttattta tatgattatt 3180 tatttatatg agatagatag agattaagaa taatgaatga aggaaagaag aggaattttt 3240 tttttttttt tgagacggag tttcgttttg ttatttaggt tggagtgtag tggtatatat 3300 atatgtatag atatatatat gtatatatat atgtatagat atatatatgt atatatatat 3360 gtatagatat ataggtgtat atatatatat atgtatagat atatatatgt atatatatat 3420 atatgtatag atatatatat gtatatatat atatatgtat agatatatat atgtatatat 3480 atatatatgt atagatatat atatgtatat atatatatat gtatagatat atatatgtat 3540 atatatatag atatatgtat agatatatat atgtatatat atatatatat attagataaa 3600 tatagttata tttattttta tatttatata tattgaaaat tatgaattta tataagagtt 3660 gtgtatataa tttgtaaggt atagtgtaaa atgaaaatgt ggtgtttttt gtttaaaaag 3720 tagaaaaaaa gggttattaa aggtattgaa atatagattt ttgttgtatt tttatagttt 3780 tttttagttt tttatagtat ttttgtttgt tatttagtgt tattttaagg aaagaataat 3840 ttaaaattta aattattagt attaatttta atatttattt ttatgttgtg tagtgatagt 3900 tttttttttt tttttttttt tttttttttt ttttttttga gatggagttt tgttttgtcg 3960 tttaggttgg agaggttgga gtgtagtggt acgatttcgg tttattgtaa tttttgtttt 4020 ttaggtttaa acgatttttt tgttttaatt ttttaagtag ttgggattac gggcgtgtgt 4080 tattatattt agttaatttt tgtattttta gtagagatgg ggttttatta tgtaggttag 4140 gtttatttcg aatttttgat tttaggtgat tcgtttattt tagttttttt aagtgttggg 4200 attataggtg tgagttatag cgttttgtcg taatgttagt ttttaatgta aatataagag 4260 tatttaattt atatggggat ttattgataa tgatataatg tataatttgt agatcgtata 4320 ggagtatttt gtttttatta gaaaggtgga aatatcgtat agtattaatt tatttgtttt 4380 tatttttttt tgatgtatgt atattttatg atattttttg tttttggttt attgatgagt 4440 aagggaggat ggaaaggata aggaatgatg tggagttttt tttttgtttt tttttttatt 4500 ttattatttt ttgtgtagtt ggttggttaa aataaaataa tacgagttat aacgaatatg 4560 atagggtttt ttggtttttt gtgttttttt tattattttg gaaaaaggtt ttagttgaaa 4620 tgtagagtgt ggtttttgga gttgtcggtg ttttgttatt ttgatataaa tgtggtatgt 4680 atttgtcgtg tatttggttt gggtgttatc gaatgttatt tattatgggt tataggaatt 4740 ttgtgttttt gggtatcgtt aatgttatgt atgtgatatt tgggaattgt agatatgggt 4800 attgtgtttg ttttttttgt ttatttatat gttttgtgtc gtgttggatt ttaagtttaa 4860 aatataagtt taaagataaa attattaagg atttgtagat ggtgttagta gagtattaaa 4920 taaagtaagg attttttgtg tatggttttt gtgtatttgt ataggtttcg tcgtttaaga 4980 agttggtttt ggttttggtt tttaataatt tggattaaaa tcggtttgaa atttgtatta 5040 gatgttgata tgattcgtga tatgattcgt gtaagtggga attatggaaa aatatttttt 5100 ttatttgttt tgtacgatat atttgagtag agtatttagt ttatatacgt agtattgtat 5160 aggtagtttt aatttgttag ggattagttg ttattatatg ttaatttgaa tgtattggta 5220 tagttttttt tttttttatt tatttagaaa atatttttta aggtaagaat tcgtgtttta 5280 agtttttttt tttttgaatt ttttgttttg atttatttag gttattaggt tgtcgtagtt 5340 agttttcgga tatgtgaagg ggtagtaggg taatcgttcg tgcgaatgtt aattatgatg 5400 gtgtgtattt attttatttt ttttattttt tgtttgggag ttttttttta taagaaggta 5460 attcgatttg tgtaagttat aatttttaat ttttgatttt ttaaatgttt tttttgtgtt 5520 ttttgtttgg gaaaattttt ttattttttg tgattcggtg taacggtgtt tttttttgag 5580 gttttaggtt aaatcgatta ttttttttgt tttttttttt ttttggtatt tgttggttta 5640 atttgttttt aggtttgttt tttttataat tttaagtttt ttagggtggg aatggggttt 5700 ttatttattt ttgtgttttg aaagtttatc gtagggtttg gcgtttagcg cgtgttaatt 5760 taaaatgggg 5770 5 6032 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 5 tgggtatggt ggtttatatt tgtggtttta gttatttagg aggttgatat gagaggatcg 60 tttgagttcg taagattaag gttgtagtga gttatgatta tattattgta tttaatttgg 120 gtgatagagt gagattttgt tttaaaaaag aaaaaagaaa atatggtata tatatatggt 180 agaatattat ttatttttaa atagaattgt tgtttttaat attatggatg gaatggaggt 240 tattatgtta agtgaagtaa gttaagtaga gagagataaa ttttgtatgt ttttatttat 300 ttgagggaat taaaaaattt aaaaattgaa tttatggaga tagagagtag aataatggtt 360 gttagaattt gggaagggta gttggggatg agtaagaagt ggggttggtt aatgggtatg 420 aaaatataat taaatagaat gaataagatt tagtatttgg tagtataata gggtgattat 480 agttaataat aatttattgt atattttaaa ataattaaag gaatataatt ggattgtttg 540 taatacgaaa gaagaaatgt ttgaggtgat gaatatttta tttattttga tgtgattatt 600 atggattgta tgtttgtatt aaaatatttt atgtatttta tgaatatata tatttagtat 660 gtatttataa aaattaaaat gaaaaaagga aaatatagat aaattggatt ttataaaaat 720 ttaaaatttg tatattaatg agtattttta atagagatta gaaaaagtaa atatataggt 780 ggggtgtagt ggtttatgtt tgtaatttta gtattttggg aggttaagat gggagaattg 840 tttgaggata agagtttaag attagtttgg gtagtataaa gaggcgttat tgttatagaa 900 aaattaaaaa ttagttaggt atggtggtag gtgtttttag ttttaattat ttaggaagtt 960 gaggtatgag gatgaggatt atttgaggtt aagaggttga ggttgtaatg agttatgatt 1020 atgttagtgt attttagttt ggttaataga gtgagatttt atttttaaaa aaaaaaaana 1080 aaanaaaaan nnnaaaaggt aatatataga atggatgtga gaaaatattt gtaaattatt 1140 tatttaatta gggatttaga atgtatagaa tttttaaaat ttaataataa aaaaataaat 1200 aattttattt aaaaaggggt aaaagagttg aatagatatt tatataaaag tatatatgaa 1260 gggttaataa ttatatgaaa agatgtttaa tattattaat tattagaaaa atgtaaatta 1320 aaattataat aagatattat tttaaattta ttaggatgat tattaataaa aaattagaaa 1380 ataataattg ttagtaagga tgtgttgaaa ttgaaatttt tgtgtattgt tagtggtaat 1440 ataaaatagt atagttattg taaaaaatag tatggtagtt atttaaaaaa ttaaaaatag 1500 gacgggtgtt gttattttag tattttggaa gattaaggtc ggtgtattat ttgaggttaa 1560 gagttcgaga ttagtttgat taatatggta aaattttgtt tttattaaaa atataaaata 1620 attaggtgtg gtggtaggcg tttgtaattt tagttattta ggaggttgag gtaggagaat 1680 tgtttgaatt taggaggtgg aagttatagt gagttaagat tatattattt tatttttttt 1740 tgggcgatag agtgagattt tgtttaaaaa aaaaaaaaaa aaaaattaaa aatataatga 1800 ttatttaatt tatttttggg tatataattg aattttaaaa taattaaaag taggatttta 1860 aagagatatt tgtatatgta tgtttatagt agtattattt acgatagtta aaatatggaa 1920 gtaatttaag tgtttattaa taaatgaata gaaaagtaaa atgtgatata tatttataat 1980 ggaatattgt tagttttaaa aaggataaaa attatgatat atgtaataat atggatgaat 2040 tttagtaata ttaggttaag tgaaaaaagt tagttataaa aaaatattat ataatgttat 2100 ttatatgaga tatttagaat ggttaaaatt atggagatag aaaatggaac gatagatgtt 2160 aggggatgag gggaaaggga agttggagtt attgtttttt tgttttgttt tgttttgttg 2220 tttgagatag agttttattt ttgttgttta ggttggaatg tagtgatacg gttttagttt 2280 attgtaattt ttgtttttta ggtttaagtg attttcgtgt tttagttttt tgagtagttg 2340 ggattatagg tgtttgttat tatatttggt taattgtttg tatttttagt agagataggg 2400 ttttattatg ttggttaggt tggtttcgaa tttttgattt taggtgattt attcgtttta 2460 gttttttgaa gtgttgggat tataggtata agttatcgtt tcgttttttg gagttgttta 2520 atgggtatag aaaaaatatt atgttttatg ttattaataa aatattattg aaagaaataa 2580 gaaaatgtgt taattggaag tataaattat tgagtgttaa gggatataat ttaattgtgg 2640 tttaaattaa aaagtattat aagaaaatat tttaagatat tttatagtgt ttgaaatgta 2700 aatttagtga ttataatatt ttagtaaatt aaattttttt tagatttttt tttaagtatg 2760 aaaaaaagtg attatggaaa tataaattac gtaattattt tttgtaaaat tttgtggatg 2820 tgttatattt aaattaagat tttaaaatat gtttattgtt ttaaaatatt atttaaaagt 2880 tattaatacg agtaataata tgatatattg tttgagataa aaattgtttg aaatggaaat 2940 aaattattta cggtttgttg taatgttttt tttatttttt aatttattag tcgaatgttt 3000 tttaaaagta atattatttt agttatggtt attttagtgt tgatgtttta tagaaagaga 3060 tttaagggtt aatttttatt aattattagt tataataatg aaagtattaa ttagaaggta 3120 gaaaaaaaga agattgtttt ttttatattt aatgtgtata aataatgtat gttttttaaa 3180 taaaggttta tttttttaaa aattgtttat tcgtttatta tgatgaattt ttttaatttt 3240 tatagtattt aaattttttt ttaatttggt atatagagat atttatatat atatttaaat 3300 atatatatat atatgtatat gtaaatatat atatatatat atatatattt atttatttta 3360 atatatagat atatatatgt atatagtatt ggattgtttt ttattgatcg tattatttaa 3420 ttattagttt tattaatata tgaattggtt tagtattttt tatatagtat ttatagtaat 3480 tagtataatt ttgtatttat agtaggaatt taagtattta gtagaaaatt ttattattaa 3540 attttaatat atagtatttg gtagatgtgg gtaaatggtt agggaatatt aagcgatgtt 3600 tttaaagtgt tttatttaaa ttggggtagg tttaaaggag ttaatgaaaa attaagaatt 3660 ttgtaatttt tttaaaaaga gtaataattt aatatatttt ttttttatta atataattag 3720 gtatataaga aatgagattg gttgggtatg gtggtttata tttgtaattt taatattttg 3780 ggaggtcgag gtaggtagat tataaggtta ggagatcgag attattttga ttaaaacggt 3840 gaaatttcgt ttttattaaa aatataaaaa attagtcggg cgtggtggtt tttttttgga 3900 tttttagtta ttttggaggt tgaggtagga gaatcgtttg aattcgggag gtggaggttg 3960 tagcgagttt atatgtgttt tatgaatatt agtttacgtt atagtgtgag atttttttta 4020 aaagaaaaaa aaataataat ttttttgtta gaggtgagag agtagaaaaa aaattaatta 4080 gatttttaaa tttttgtacg ttttttagta gagacgggtt tttttttgtt ggttaggttg 4140 attttgaatt tttaatttta ggtgattcgt tcgtttcggt tttttaaagt gttgggatta 4200 taggcgtgag ttatcgcgtt cggttataag acgttttatt gtaatataaa aataggatgt 4260 aacgagtttt ttaattatta atgtaattag agttggttat taagtttttt tacgcgtttt 4320 ttattatgag ggagaaacgg attgtagata aatttagtat tttttgagta gtttaattcg 4380 tattataaat atgtaggtat cgtaaggacg cgatttttta gtttgttagg ttttttttta 4440 tttttttggg ggtataaggc gattttgttt tttgatttaa aaatttcgta aacgttaatt 4500 tttttatttt tttttggtta gtttacgaaa gtagtagtat ggtataattt ttagtttaga 4560 gttcgggtat tgtttgtcgt tagtataacg aagaaattta tatttacgaa gattttagat 4620 tttacgtgat tatattattt aattattagc gttggtttgg aggaattcgt tgttacgtga 4680 tcgttcgtgt ttaatgatcg aggtttacgt tttttagatc gttatagtcg ttgttatagg 4740 gtttgagttt gggcggcgtt tcgtttcggt cgtacggtgc gtcggcgtta atttttttcg 4800 aaggtttcgg tagttaagat tgtaggtttt tattaagtat tgttttcgaa ttgggttacg 4860 agagcgtgtt tttgattggt ttgttttgga ggttgggaag ggatttgtta gagattgcga 4920 ttattttttg aagcgcgagg taggaagtta tatgtttttt ttggagtttt gtagagaaag 4980 tgttttttgt cgtattgata gtagcgagag ttggaggtgt tgggtcggga gaatagtttg 5040 ttcgattttc gtttgtagtg tatggatgtt gggttatttt atttatgatt atttacgatt 5100 gtatattttt taaaattcga aattcgatag tttatgtata tagaaatttt ttaggatttt 5160 tgatatcgat ttagatggta tatatataga tattatatag gtttttattt agaagattgg 5220 atttatcggt tttagttatt tcgagattgt agataagtaa gtgtttttat cgttttgagt 5280 tttgttatta tttcgtgaat tatcgaattt ttgttttagc gcgatagatt tggatttgag 5340 aatgtacgga tttaaaacgt ttagatttag atttttatag atagtgtttt gtatcgtttt 5400 tgatatgtaa tttaatattt tatataatga tataaatcga taacggcggt tagggaattt 5460 tagttatttt ttggatatga agagcggttt tttgtcgtta ggcggttggg atgatagtta 5520 tttggattta gcgggtcggg aaggggatag agaagttttt ttgggggata tcggtattgg 5580 cgatttttta aaagttttat agagttttcg ggtcgaatta agtagtattt tgttattatt 5640 ttttttttac gtgttttagg gtattttttt gggtttggcg ggaagtattt tatttatttt 5700 gtaaagtaaa aatgttagtt atatagatta agtttttttt agttttgttt tttggttttt 5760 tagttttaaa ttattttggg tttcgttggt tgatgcggtt tacgttaaga atttcggtcg 5820 tcgtaaattt tggtttgttt cgatatagta tatattagga ttttttatga tttatttatt 5880 tatttaggtg gatcgtttgt ttgggaatat cgatgataga atattcgacg tgattgtttt 5940 tattgtggcg ttttttttgt ttgaattttt ggtcgttatt taggatattg tcgtcgatgg 6000 ttgggcgtta attatgttat ttagggaaaa tg 6032 6 6032 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 6 tatttttttt ggataatata gttaacgttt aattatcgac ggtaatgttt tgagtggcgg 60 ttaagaattt aaataaaaag aacgttatag tgagagtaat tacgtcgggt gttttgttat 120 cggtattttt aagtaaacgg tttatttgag tggataaata gattatgaag agttttagta 180 tatattgtgt cgggataagt taagatttgc gacgatcgaa gtttttaacg tagatcgtat 240 taattaacgg ggtttagagt aatttgagat tgaagggtta aaagataaaa ttgaagaaag 300 tttggtttgt atagttaata tttttgtttt gtaaaatgag tgggatgttt ttcgttaagt 360 ttaggggaat attttgaagt acgtaaagaa agagtagtag taaaatgttg tttagttcgg 420 ttcggaagtt ttgtggggtt tttaagaagt cgttagtgtc ggtatttttt agaagagttt 480 ttttgttttt ttttcggttc gttgagttta aatgattgtt attttaatcg tttggcggta 540 ggggatcgtt ttttatattt agagagtgat tgaaattttt tggtcgtcgt tgtcgatttg 600 tattattatg tgagatgttg gattatatat tagagacgat gtagagtatt atttgtgggg 660 gtttgagttt gagcgttttg gattcgtata tttttaggtt taagtttgtc gcgttggaat 720 agggattcgg tggtttacgg gatggtggta gggtttagag cgataagggt atttatttat 780 ttgtagtttc ggagtgattg aagtcggtga gtttagtttt ttggatagag gtttatatga 840 tgtttgtata tgtgttattt agatcggtgt taaagatttt gaaggatttt tgtgtgtatg 900 gattatcggg tttcgagttt tggagagtgt gtaatcgtag gtggttatgg atgagataat 960 ttagtattta tatattgtag gcggggatcg aataggttgt tttttcgatt taatattttt 1020 agttttcgtt gttattaatg cggtagagag tatttttttt ataggatttt agaaaaagta 1080 tataattttt tgtttcgcgt tttaggaagt ggtcgtagtt tttaataggt ttttttttag 1140 tttttagagt aagttaatta gggatacgtt ttcgtggttt agttcggaaa taatgtttgg 1200 tgggaatttg taattttggt tgtcggaatt ttcggggagg attaacgtcg gcgtatcgtg 1260 cggtcggggc ggggcgtcgt ttaaatttag gttttgtgat agcgattgtg gcggtttgga 1320 aagcgtgggt ttcggttatt gggtacgagc ggttacgtga tagcgggttt ttttaggtta 1380 gcgttggtgg ttgagtgatg taattacgtg gggtttgaag ttttcgtggg tgtaggtttt 1440 ttcgttatgt tgacgatagg tagtgttcga attttaggtt gggagttgtg ttatgttgtt 1500 gttttcgtgg gttgattaga aaagggtaga aggattgacg tttacgaagt ttttgaatta 1560 ggaggtaagg tcgttttgtg tttttaaaag gatagaaaaa ggtttggtaa attggagaat 1620 cgcgttttta cggtgtttat atatttatag tacgaattaa attgtttaag gggtgttagg 1680 tttgtttgta gttcgttttt tttttatggt ggaagacgcg tggggaaatt tggtaattaa 1740 ttttaattat attggtgatt ggaagattcg ttatattttg tttttatgtt gtaataaaac 1800 gttttgtggt cgggcgcggt ggtttacgtt tgtaatttta gtattttgga aggtcgaggc 1860 gggcggatta tttgagattg ggagtttaag attagtttga ttaataagga gaaattcgtt 1920 tttattaaga gacgtatagg aatttgagaa tttgattaat tttttttttg tttttttatt 1980 tttggtagaa agattattat tttttttttt tttgagagga attttatatt gtagcgtggg 2040 ttggtgttta tgaggtatat ataggttcgt tgtagttttt atttttcggg tttaagcgat 2100 ttttttgttt tagtttttag agtagttggg agtttaggaa aaagttatta cgttcggtta 2160 attttttgta tttttagtag agacgaggtt ttatcgtttt agttaggatg gtttcgattt 2220 tttggttttg tgatttgttt gtttcggttt tttaaagtgt tgggattata ggtgtgagtt 2280 attatgttta gttaatttta ttttttatat atttagttgt attgatggaa ggaaagtgtg 2340 ttagattatt attttttttg agagagttgt aggattttta attttttatt aattttttta 2400 ggtttatttt agtttaaatg aaatatttta aaaatatcgt ttaatatttt ttagttattt 2460 atttatattt gttaagtgtt gtatattaag gtttagtgat aaaatttttt attaaatatt 2520 taaattttta ttatggatgt aaggttatat taattattat gggtattgta taggaagtat 2580 tagattagtt tatatattga tggaattgat agttaaataa tacgattagt agagaataat 2640 ttaatattat atatatatat gtatttgtgt attggggtgg gtgggtgtgt atatgtgtgt 2700 gtatatgttt atatatatat gtatgtatat atgtttaaat atatatataa atgtttttgt 2760 gtgttagatt gggaaagaat ttgagtatta taaaagttaa aagaatttat tataatgaac 2820 gagtggatag tttttgaaga agtgggtttt tatttgaaag atatatattg tttatatata 2880 ttagatatag agaggatagt tttttttttt tttatttttt aattagtgtt tttattattg 2940 tgattaataa ttagtgaggg ttaattttta aatttttttt tgtagaatat tagtattgga 3000 atggttatag ttggaataat gttatttttg agaagtattc gattggtaag ttaaaaaatg 3060 aaaaagatat tataataagt cgtaggtagt ttatttttat tttagataat ttttatttta 3120 aatagtgtat tatattgtta ttcgtattgg tagtttttaa atagtatttt agaataatga 3180 atatatttta aggttttggt ttaaatataa tatatttata ggattttata gaaagtaatt 3240 gcgtggttta tatttttata attatttttt tttatgttta aaaaggaatt tgaaaaggat 3300 ttagtttgtt agaatgttat aattattaaa tttgtatttt aaatattgta gaatatttta 3360 aagtgttttt ttgtggtgtt ttttgattta gattatagtt gaattatgtt ttttagtatt 3420 taataattta tgtttttagt tagtatattt ttttattttt tttaataatg ttttattggt 3480 agtataagat ataatatttt ttttatgttt attaaataat tttagggggc ggggcggtgg 3540 tttatgtttg taattttagt attttaggag gttgaggcga gtggattatt tgaggttagg 3600 agttcgagat tagtttggtt aatatgatga aattttgttt ttattaaaaa tataaataat 3660 tagttaggtg tggtggtagg tatttgtaat tttagttatt taggaggttg aggtacgaga 3720 attatttgaa tttgggaggt agaggttgta gtgagttgaa atcgtgttat tgtattttag 3780 tttgggtaat aagagtgaaa ttttgtttta aataataaaa taaaataaaa taaaaaaata 3840 ataattttaa tttttttttt tttttatttt ttggtattta tcgttttatt ttttgttttt 3900 atgattttga ttattttaga tattttatgt aagtggtatt atatggtatt tttttgtgat 3960 tggttttttt tatttagttt ggtattatta agatttattt atgttgttgt atatattata 4020 atttttgttt tttttaagat tgataatatt ttattgtaag tgtatattat attttgtttt 4080 tttgtttatt tgttgatgga tatttgggtt gtttttatgt tttagttgtc gtgaataatg 4140 ttgttatgaa tatgtatata taaatatttt tttgagattt tatttttagt tattttgaga 4200 tttagttata tatttagaag tggattagat ggttattgtg tttttaattt tttttttttt 4260 tttttttgga tagagtttta ttttgtcgtt taggaaggag tgaagtggtg tgattttggt 4320 ttattgtaat ttttattttt tgggtttaag taattttttt gttttagttt tttgagtagt 4380 tgagattata ggcgtttgtt attatattta attgttttgt atttttggta gagatagggt 4440 tttattatgt tggttaggtt ggtttcgaat ttttgatttt aagtgatata tcggttttgg 4500 ttttttaaag tgttgggata ataatattcg ttttattttt aattttttga gtaattgtta 4560 tattgttttt tatagtggtt gtattatttt atgttattat taataatgta taagagtttt 4620 aattttagta tatttttatt aatagttatt attttttggt tttttgttag tagttatttt 4680 aatgagtttg aggtagtatt ttattgtggt tttgatttgt atttttttaa tgattagtga 4740 tgttgagtat ttttttatgt ggttattggt tttttatata tgtttttgtg taaatatttg 4800 tttagttttt ttgttttttt ttgaatgagg ttgtttgttt ttttgttgtt gaattttagg 4860 agttttgtat attttgagtt tttgattaga taaatgattt gtaaatattt ttttatattt 4920 attttgtatg ttgttttttn nnntttttnt tttntttttt ttttttggag ataaggtttt 4980 attttgttga ttaggttaga gtgtattggt atgattatgg tttattgtag ttttaatttt 5040 ttagttttaa gtgattttta tttttatgtt ttagtttttt gagtagttag gattaaaggt 5100 atttgttatt atgtttggtt aatttttaat ttttttgtag taatggcgtt tttttgtgtt 5160 gtttaggttg gttttgaatt tttgttttta agtagttttt ttattttagt tttttagagt 5220 gttgggatta tagatatgag ttattgtatt ttatttatgt gtttattttt tttaattttt 5280 gttgagagtg tttattgatg tgtaagtttt aaatttttat gaagtttaat ttgtttatgt 5340 tttttttttt ttattttaat ttttgtgagt atatattagg tgtatatatt tatggggtat 5400 atgagatatt ttgatatagg tatatagttt ataataatta tattagagta aatagggtat 5460 ttattatttt aagtattttt tttttcgtgt tgtaaataat ttaattatgt ttttttagtt 5520 attttaaaat gtataataaa ttattgttga ttgtagttat tttgttgtgt tattaaatat 5580 tagattttat ttattttatt taattatatt tttatattta ttaattaatt ttattttttg 5640 tttattttta gttatttttt ttaggttttg gtaattatta ttttattttt tgtttttatg 5700 aatttaattt ttaaattttt tagttttttt aaataagtga gaatatgtaa agtttgtttt 5760 tttttgtttg gtttatttta tttaatataa tgatttttat tttatttatg gtgttggaaa 5820 taatagtttt gtttaaggat gaatagtatt ttattatgta tatgtattat attttttttt 5880 tttttttttg agataaggtt ttattttgtt atttaggttg agtgtagtgg tgtgattatg 5940 atttattgta gttttggttt tgcgggttta agcgattttt ttatgttagt tttttgagta 6000 gttgggatta taggtgtgag ttattatgtt ta 6032 7 12409 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 7 gttgtttgga agttgtttgg tattaggatg cggataatat ggttggagaa atggtaattg 60 ttagggtatt tggagtaaga atggatagat attggtgatt attatttgga tgtatttgag 120 ggataattgt tatgttttta ttagagtaat tatatagagt aggagtaagt aatttatagt 180 ttatagatta tatttgtttt gtttcgtttt ttaaatatag tttaatggaa atagagttat 240 gttcgttttt ttatttattt tgtatggttg atattaggta tggttttaag taatatatat 300 aagttttata tattaatgtt tatttatttt agttgataaa tatgaagtgt tgttattgtt 360 ttattttata gcggagaaaa ttgatataga gatttttttt cgtatttata gttttagtta 420 ttatttttat gttaatgatt taataatatt tttaatttag attttttttt tgagttttag 480 ataggtagat tttttatagt tagttttgga gatattttag aaattatagg ttttaaatta 540 gatttttttt tattttttta aatatatttt tttttaatat tttttttttt ttagtgaata 600 ttattaaata gataagtaag ttagatttaa ggaggttttt ttggtatttt ttttattttt 660 gttttatttt atattattta tttttttttt tttttttttt tgagatggtg ttttattgtg 720 ttatttaggt aagtgtagtg gtgtgatttt ggtttattgt agttttaatt ttattaagtt 780 taggtaattt ttttatttta atttcgtgag tagttgggat tataggtata tgttatcgag 840 ttcggttaat ttttgtattt ttattagaga tagggttttg ttatgttgtt taggttgtta 900 ttttattttt atttttgttg aaatttggtt gttttttttt atttttatta ttaattatta 960 gttaaatttg atttattaaa aggattattt cgtatgtggg ttttgtaata gtttttttaa 1020 aatttatttt tttttattta gatttttttt taatttttaa attgtagtta atatttttaa 1080 ttttgttatc gtttttgtat attttattta atttttaatt ttttaatggt tttttttgtt 1140 tttaggttaa gttaaattga aaattgttaa agttatagtt ttttagtgta attagtaagt 1200 atagtgatta ttatgtttgg tttattttag ttgttgttga ttaatagtat tttttgaatg 1260 aagaaattat attatcgtat tgtagggaaa aatttgtatt ttaatggaaa attgaattat 1320 ttagagtaaa tttttaaggt tatttgattt tgattttatg ggttttttta ttgggtttta 1380 tattgtttta ttgtttttga gttattttat agatgattga tagaaatgta aaataattat 1440 tgtatgtagt tatgtaagta aaatttgaag gttagggttt aattaatttt ttttttttat 1500 tgtggaagaa gttaatttta tttgtatatt tattttaata tttttgattt ataaatatgt 1560 ttgttttttg aattagtttt tatatttgtt tggtaatttt attaaatgat ttaaataaat 1620 tttataattt agtttatttt atatttgtat gatagttagg tttttatttt atttttgttt 1680 tttaaaatta ttttttagtt ttttttaagg tattatttgg ttggtttttt ggttatttat 1740 tagtttaagt tttatttttt tttgtttatc gtagttttag gttttttttt ggttttttgt 1800 tttagttttt tttagagaag tttttttgtt ttggaattta tttttatatt aggtgttttt 1860 tatttttttt ttttttagta aattttttta attttttaga tttttgttta aggattattt 1920 gttgaaagtt tttttaggtt tttttgagtt aatataattt attattagag gtttttagag 1980 tataggtagt atttgttata attttatatt tgtttgtggg attttttaat attttttaat 2040 ataattaata tttttttttt tggttggggg taatgtatga taataggatg atggtatgtt 2100 tttaattttt ttttagtaat tagtttagtg tttcgaatat ggtggataga tatatcgttt 2160 ttattttaga tagatttttg agtagtaagt atttattgtt taggagatag atggattgaa 2220 aaaatatatt tgggagttat tagtatatag gtgtagttat gaaaatgtac gagaagtaaa 2280 attattggta ggaataaaat gaaggttatt agagatttta tttaggtgga ataattggat 2340 agaagttttt aatggggagg aaatagaagt agttaatata gatggaggtc gggcgtcgtg 2400 gtttacgttt gtaattttag tattttggga ggttgagata ggtgggtggt ttgagtttag 2460 gagtttgaga gtagtttggg taatatagta aaattcggtt tttataaaaa atataaaaat 2520 tagttcggcg tggtggcgta ggtttgtagt ttcggttatt ggggaggttg agatgggaga 2580 attgtttgaa tcggggaggc ggatgttgta attagacgag atcgcgttat tgtattttag 2640 tttgggcgat agagcgagat ttcgttttaa aataataagg ataaaattta ttttataagc 2700 gattttggat ttttagggat attcgtcgtt ttatggtggt acgtgatttg tttggatttt 2760 gtggtttttg gagtttggga ttttatttta gcgtaagagg tttttttgtg ttttgtataa 2820 aggagaggaa aagtgtaggt tttttgagtt gataagatta gagttatagt atattattag 2880 tagcgttgta tgaaattatt taaaaaatta aatcggattt aatcgttttt atttagaata 2940 aattgttttt tttttttttt taagattaag ttagttttag ttattatttt ttattaattt 3000 aaaaattagg aaggtttata atttaggttg acgttgcgtt taggcgaata ttgtatataa 3060 gataatagtt attttaattt tttttttttt ttttaaatcg aatagtattt ttaatattat 3120 ttttttagtt ttttttttaa atattgcgat tacgagttta tatcggaaaa ttatgaaaat 3180 agtatgattg gagtttttga tggtttgttt tgtttgaaaa cgatgaaagg tattgagatt 3240 tttgggtaga aatggttttt agggaatgcg agtttggtag ttttataata tttcgagtta 3300 taaattcggt ttgggtaggt ggcgtaggga aatttaaaag ttggatttac gttttttttt 3360 tttagtttgt atatagcggt tagtggtaga taagagtaga cgtataaatg ttaattttcg 3420 ttcgtaaatt ttcgagggta gaaattgttt tttgttagtt ggatttggag tcggtggaaa 3480 agttgtttta atgtagtttt ttcgaggttt ttttagtttt gatcgagggg cgtttttcgg 3540 ttatttattt agaggttgtt taataaataa ggatgttcgc gaaatatttg cgtttggaaa 3600 ggcgttcgtt cgtggcgcgt attttcgggt tttcgtaagc gatttcggtg atagggataa 3660 tcgtttcggt tttagcgatt gtagatagat tgggacgaga cggttggagg ttttttttta 3720 agggatgttg gaggggttgc gtcgtatttt gcgtttggtt ttggcgcgcg gttttaggtc 3780 gtggtattta gcgttttatg ggtcgtgcgt cggggtttgg ttatatcgtt tgttttcgtt 3840 tttagtcgcg cgtttcgtgt tattgtcgtt ttttgtagtt tcgcgttttc gtagtttttt 3900 tatggttagt tcgtttcgtt tcgttgcggt ttttgttcgt taggtatttc gaattcgggc 3960 gtttgcggaa ggggggagga ttggaattcg ggtttcggta gttcgcgggt ttggtcgggc 4020 gttttgtcgt cgttttttgt attatttttt ttcgttttgt tttttatttc gtttttagcg 4080 aggcgttttt tttttttcgt atttttgttc gaaatttgga gtttagtttg taatttttat 4140 tttttcgagg ttttcgttgt ttaggtttag tatttttatg ggtaattcgt ttcggagcgt 4200 ggcgaggatc gttacggggg acgtgagggt agttatggat tcgttttgag ggaggaggcg 4260 ggagttgaat ttttgggttg ttagaattta tagttatatt ttacgtgatt ttgttatttt 4320 aaaatatttt gatcgtagtt ttttgttttt ttggattttt ttttttttta tttttatttt 4380 cgtagttatt tagtagatta cgtattaaaa taaatgtttg taggtttttt taattagttt 4440 cgtttttttg tgtttttatt ttttaaattg tttattaata ttatgaggtt taaggtgtgg 4500 ggtggatgtt gcggtatcgg aggattttgt tggtggagga aatggtttac gttcgttttc 4560 gttttttttg taggtttgtt attgtgcgtt tgtgattgat aagattacga ggttgagcgc 4620 gttttggaga tttttttata aatggtttaa tattttagtt tagattattt gttcggatat 4680 aagggagata attgtttttt tgttttttgt cggcgaattt tggttttgta gggttgattt 4740 ggaatttaat tagttttttt tgagtcggcg gaggaggata aaaatcgtcg cgatttcggt 4800 agggtgggaa gtgtagggta gcgtttttaa gatacgtttg ttggaggttc gggtttgggt 4860 gtttggttgt ttgagttttt ttttttgtgt ttgtttgggt tttggagagg agcgtacggt 4920 attatggtga gcgttacgta ggttatttcg ggtttcgttt atttatttgt atttatttaa 4980 tggtggttta attttttttt aaggattgta gtaacggatg tttcgtagag tgtatcggag 5040 aaggaggatt aaaagaggtg gtggggattt ttaaggtaag ttgtttgtta gaggtttagt 5100 gtttaaagta acgtttaatt gaataaattt attttttgtt gagattcggg gaaattttta 5160 ttgtgtgggt tatttagttt ttaggttgtg ttgttagatt tttaaaattt tatttttaga 5220 ggaaaaaaag ttatttagag agtgatagta tatttattat aataaaaatt atttagtagt 5280 taattgttga ttttattttg agttatatat tttttttgaa aaatagttaa tgcgtaaata 5340 ttaaattagt tgtttattag attttataat acgtataaat ttttagttta tttgtagaaa 5400 aagttaaatt gtgatttttt ttttttagta gtatataata ttttatagtg aaagtgttgt 5460 attttttttt tttttatttg aattgcgggg tttatatagt aaatagttta tattttaaat 5520 agtgagaaat aaagtacgtt gaaaattgta taaatataaa tgtaagatgt aatattattt 5580 tttttataag tttatttttt attttttttt ttcgtggagg ttttagtttt ttttttttat 5640 gtttagtgtt gtttttttgt ttgtttgagt tattgttaat tgttattaga taattgatat 5700 agagtgtttt aatgatttta tattttggcg gtttagagag ggaaggaaat ttgatttatt 5760 agttttttat atattgagtt tttttatagt gtgttggaga ttgtgttatg tattggatat 5820 ttaaaggtga atttaagatt aggtttttat ttgtaaggaa tttttatttt attttttttt 5880 tttttttttt tgttgttatt ttagtaagga ttttttaaaa agtaaaatta gaatattgta 5940 attttttttt tgttttttga gatagggttt cgttttgtta tttaggttgg agtgtagtgg 6000 tacgatttta gtttattgta atttttgttt tttaggttta agtgattttt ttgttttagt 6060 tttttgagta gttgagatta taggtatgtg ttattacgtt tagttaattt tgtattttta 6120 gtagagatgg ggttattatt atgttagtta ggttggtttc gaatttttgg ttttatgtaa 6180 tttatttttt aaagtgttgg gattgtaggc gtgagttatt aagtttagtt tgaagaattt 6240 tttgtaaaga aaaatattaa tttaaattta aataattttt tttttttttt tttttttttt 6300 tgagatagag ttttgttttg ttgtttagat tgaagtgtag tggtattatt aattaggtat 6360 tatttttagt tttgattttt tagatttaag tgattttttt agttttttaa gtatttgaga 6420 ttatcggttt gtatgttatt aggtttaatt aatttcgtta ttttttgtag agatgggatt 6480 tttttgtgtt gtttagattg atttttaatt tttgggtttg tgtaattttt ttatttcggt 6540 tttttaaaat gttgggttat aggtataagt tataatgttt ggttataaat aatttttttt 6600 atttgttaat ttagattttt gtatattagg ttttatttag gggaattgtt tgtttatatt 6660 tatgtattta tatattaaaa tatgagttat ggtggatgta tttatagtat atatgtaata 6720 aggtatgtgt aaaaatgata ttgataattt agggaataaa aatggtagat tttatagatt 6780 atttttgttt ttgatatatt tttttttgtt ttaaaaaata aaaataaaaa taaataaata 6840 aataaaatat atatatatag tttatattgt tgttaattat aattatttta ttttgttatg 6900 aatagtagat tttatcgttt ttatttaatt gtatgtttgt atttattaat taattttttt 6960 ttttttattt atattttttt tattttttgt tattttttga tatttattat tttatgagta 7020 tttttttttt ttatgagatt aatttttttt tttagttttt acgtatgagt gagaatatgt 7080 aatatttgtt tttttgggtt tttttttttt tttgtgtttg gtttatttcg tttattataa 7140 tgatttttag ttttatttat gttgttataa atgatacgat tttatttttt tttaatggtt 7200 tagtagtatt ttattgtgta tatgtattat attttatttg tttattgatg gatatttagg 7260 tgattttatg ttttgattat tgtgaatagt gttgtaataa atatgggatt gtagatattt 7320 ttttgatata ttgatttttt tttttttgga aaatatttag tagtaggatt gttggtttat 7380 atggttattt tatttttagt tttttttttg gaaagtttta tattattttt tatagtagat 7440 aaattaattt atatttttat taatagtgta taagcgtttt tttttttttg tatttttatt 7500 agtatttgtt attttttgtt tttttaataa taattatttt aattgtggtt gtttttgata 7560 tattttttta tttttttgtt aatttatatt atttataata ttttatatgg ttttttgggt 7620 tttttttggg tagtttttat attttttttt ttttttttat ttatgatgta gttatattat 7680 atgaggatgt agttttgtag tagggtttat taatgagaaa cgttggtata tattttggcg 7740 aatttttttg tggattttag gatttttttt atttgtaaga ggttagttat ttattttttt 7800 taattttttt agttttatat atttttatag aatgtaatat tgtaaatttg tagttttttt 7860 tatgattttt tttattagat tttaaaagag tatttttaaa agatgaatat agtgtttaag 7920 gttttttaaa tggagtaaga ataatgtata agaatttaga ataaagttat taaatgtttg 7980 atatagttgt aatatagatt tgatttttga aaaatgtggt taatgaagag aagagtaaat 8040 gtgttatacg atggtgagta aaaggtgttg ataggtttgg tatggtgatt tatttttgta 8100 attttagtat tttgggaggt tgaggtgggt ggattatttg aggttaggag tttgagatta 8160 gtttggttaa tatggtgaaa ttttgtttgt attaaaaata taaaaattag ttaggtgcga 8220 tgatatatgt ttgtaatttt agttatttgg gaggttgagg tttgagattt gtttgaatcg 8280 gggaggcgga ggttgtagcg agtcgagatt gtgttattgt attttagttt gggtaataga 8340 gtaaaaaaaa aaaaaaaaaa aaaaaaaaaa agtgttgatt gaattttggt tgaaatagtt 8400 tttaggtgtt tttaataaat ttatattttt ttgttttgag tttttttatt ttagaataaa 8460 tgattattta attgtaaatt ttgaattagg aagttgtttt taatatgttt tgtttttttt 8520 aatatttttt gttattttat aattagttat tgtggtattt taattttttt ataaatatat 8580 gatgtgaaat attttgattt cgatgttatt agggaatgtg gagtattgga aagagataga 8640 ttaattatgt agaagaaagt attatttgat aaaatattat tttaatttat ttttggaaag 8700 gaaatttaga aaaagaaaat attttttaaa gaatattgat aaaaattgtt tataaaattt 8760 gtttttttta ggaaataaat cgttttttta aaattatatt ttatatttgt tttaaacgag 8820 ttatatgttt ttagttaata ttgtttgttt acgtttgaat tttatttaat tttattattt 8880 agtaatttag tatttttagg taattttttt ttgagtttag gttaaaagtt gttattttta 8940 gtttttagag ttgtagaatt ttttttttaa gtagagaaaa gtttatgatg agattttgaa 9000 gttatttaat cgtatattat tttgaaaaat tggatatatg tcgggcgcgg tagtttatat 9060 ttgtaatttt agtattttta gaggtcgagg tgggtgggtt atttgaggtt aggagttcga 9120 gattagtttg gttaatatgg tgaaatttta tttttattaa aaatataaaa tttagtcggg 9180 tgttgtggta tatgtttgta gttttagtta tttaggaggt tgaagtagga gaattatttg 9240 aatttgggag gcggaggttg tagtgagttt agattatatt attgtttttt cgtttgggtg 9300 atagagtgag attttattta aaagaaaaag taaaataaaa taaaattgga tatagggtag 9360 tgtttaggta taaattagaa agttagaggt tgttatttat attattaaga aataatgtgt 9420 tttacgaaag aatgtagtag tttattgaaa tagaagttat atttagaaat gtaataattt 9480 atttttaatt gttagaaatt taattgatat tatgaagttt taattataag aatatttatt 9540 tgaggttaaa aattatttta ttttattttt gttttgtcgt taatttgatt tttttggatt 9600 agtgggttat tgtgggtttt atgggtattt taaggagagg ttttagaaaa ttaaaaatta 9660 tatatattgg attataatta tttttgttat ttatttttat ttttttgttt ttgttttgtg 9720 ttttattatt tttttttttt tattaagtag ttttagtaga agaaaatttg tattaagttt 9780 gtcgtattgt attgatatgg ttttaaatgt tttttagttt agggtttttt ttatttattg 9840 ataaaagtta attaaggtaa attataggtg tttattgtgt aagaatattg tgaaattatt 9900 tatgtaataa aaagtttgtg ttagaatttt atttttttta aattttggat attttttgtg 9960 agtgtatttg aaagtagtta gatattttta gtatttaaga aattttttat tattttgtgt 10020 gttaggtatt gtgttagttt tggaatttaa ttgtgaatat tttagttaga ttttttgttt 10080 aaatagttta gaataggggt tgttaaattt tttttttttt tttttgagat ggagttttat 10140 ttttattgtt taggttggag tgtattggtg tgtttttgtt gattgtaatt tttgtttttt 10200 aggtttaagt agtttttttg ttttagtttt ttaagtagtt gggattatag gcgtttatta 10260 ttatatttag ttaatttttg tatttttagt agagataggg ttgtgttgtt tgttaggttg 10320 attttaaatt tttgattttt ggtgatttat tcgtttcggt tttttaaagt gttgggattt 10380 agggtgtgtt attgtgttcg gtttgttaaa tttttttaaa tggttagatg ataaatattt 10440 taggtttgag ggttattagg tttttgttat aattagttgg ttgtgttgtt attgaagata 10500 taagaatggc gtgattatgt tttaataata ttttaatttt aaaataggtt agttggttgt 10560 atttggtttg taagtaaagt ttgtttgatt ttttatttag tttagaggat aacgggagag 10620 aaaagggatt taaagataaa aataatttag ttggaatata tttttttaaa taaatttatt 10680 atatttagta aaaagtttta aattaacgtt tttatttgaa ttaaatagtg gtaaaatagg 10740 ttgggtatag tggtttatgt ttgtaatttt agaattttgg gaggtcgagg taggtagatt 10800 gtttaagttt aggagttcga gattagtttg ggtaatatag tgagttttta tttttaaaaa 10860 aaatataaaa taataataat aatggtagaa taaagttaat tttttattga aatttggtat 10920 tttattggta tattataaag tagtattatt agattagttt gaatattata gtaatatttt 10980 gtttttaatg ttttttgtgt tattgtaata tgagtttttt gtttgttttg gaatatgttt 11040 ttagtttgaa tattatttta aaaatataat ttattattat ttataatata ttaaatgatt 11100 tacgtagttg taaggtagtg aattaaatag aattagatta ttttaaaaat aatgataaga 11160 gttgatgatg taaagtgaag gtttgtattt aatttgggag ggaaaagatt ttttttgtat 11220 atttaaagag atggagtttg atattttttt ataatttgtt ataggttgaa tttgtttttg 11280 tttttttaat tgattaaaaa gttttttttt ttgtgttttt tttttttttt tttttttttt 11340 tttttttttt tttttttttt ttttttgaga tagagttttg ttttgttttt taggttggag 11400 tgtagtggtg cgattttgat tttttgtaat tttcgttttt cgggtttaag tgattttttt 11460 gttttagttt tttgagtagt tgcgattata ggtgtatgtt attacgtttg gttaattttt 11520 agtattttta gtagagacgg ggttttatta tgttagttag gatggtttta atttttaaat 11580 tttgtgattt gtatgtttcg gttttttaaa gtgttggttt tttgtgtttt tgttagtatt 11640 ttatagatgt tataaagtta gtggtggtat cgtatgtaat ttgtacgttt aatgtttggt 11700 tatttgtagt gggtaaattg gttatgtcgg gagttggtga gatgttgttt gtggggagtt 11760 gttttttagt attttgattt atttttgttt aaataagagt ttttttgttt attgtttttt 11820 ttatatagaa tagaggattt atattttagt gtttattttt aatttttttg tttttaaaga 11880 ggaaaatatt tgttttattt tgtttatttt ttttttagtg tatttagagg attttgaagg 11940 tttatgttaa taattttttg gggtagttgg agtgtaatta ttgttaaata gtagtttagt 12000 atttaatgat atttatttta gtttaataaa ttattgtgag tgttgttatt ttttattagg 12060 gaaaatattt tttttatttt ttttaaatat ttaatatgag ttttatggtg agagtgaaaa 12120 agggttgtat tttttttttg tattatttta ttttatttgt tattttgttt tttttttata 12180 tattattgaa atttggtttt gatattttat taggtagtgt atattgtaga gattatgaat 12240 aattggtcga attttgaatg taggtatgat ttgtttagtt tagagtgtta aatttttgtg 12300 ttagttgtta atttttaaaa gttaattgat tttttttttt tttttttttt ttgtataatt 12360 tagttagcga atgtttagta gtttttttgt aaatagtgat gattttttt 12409 8 12409 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 8 agaaaaatta ttattattta tagaaaagtt attgagtatt cgttggttag attatataga 60 ggggaaaaaa aaaaaggaaa ttaattgatt tttaaaggtt agtagttaat atagaaattt 120 aatattttga gttgaataaa ttatgtttgt atttagaatt cggttagtta tttataattt 180 ttgtaatgta tattgtttaa tagaatatta gaattaaatt ttagtgatat atagaagagg 240 gataaaatag tagatggggt aagatgatgt aaaaaaagaa tataattttt ttttattttt 300 attataggat ttatgttgag tatttgggaa agatgaaaga gatgtttttt ttaataaaaa 360 atggtaatat ttataatgat ttgttaaatt aaaatgaatg ttattaagta ttgaattgtt 420 atttagtaat ggttatattt taattgtttt aaagaattgt tggtataagt ttttaaaatt 480 ttttgggtgt attggagaag aaatgagtaa agtgaagtaa atgttttttt ttttgaaaat 540 aggaaagttg agaatgaata ttaagatata aattttttgt tttgtgtgga ggaaatagtg 600 aataaaggaa tttttattta aataaagata aattagagta ttaggaaata attttttata 660 agtagtattt tattagtttt cgatatagtt agtttgttta ttgtaaatgg ttaaatatta 720 agcgtataaa ttgtatgcga tattattatt aattttatag tatttgtgga atgttgataa 780 aaatatagga gattagtatt ttgggaagtc gaggtatgta gattataagg tttggagatt 840 gagattattt tagttaatat ggtgaaattt cgtttttatt aaaaatatta aaaattagtt 900 aggcgtggtg gtatgtattt gtagtcgtag ttatttagga ggttgaggta ggaaaattat 960 ttgaattcgg gaggcggagg ttgtagagag ttaagatcgt attattgtat tttagtttgg 1020 gagatagagt aagattttgt tttagaaaaa aaaaaaagaa aagaaaagaa gagaaaagag 1080 aagaaaaaaa gaaatataag agaaggaatt ttttgattag ttaaaaaaat aggggtaagt 1140 ttaatttgta ataggttgtg aagggatgtt aaattttatt tttttgaata tataaaaaaa 1200 gttttttttt ttttaaatta aatatagatt tttattttat attattagtt tttattatta 1260 tttttaaaat gatttaattt tgtttaattt attgttttgt agttacgtga gttatttgat 1320 atattatgaa tgatagtaaa ttgtattttt agaataatat ttaggttgaa aatatatttt 1380 aaaataaata gaaagtttat attatagtga tataaaaggt attaaggata gaatattatt 1440 gtaatgttta ggttagttta gtaatgttat tttgtaatat gttaataaaa tgttaagttt 1500 taataaaaaa ttgattttgt tttattatta ttattattat tttgtatttt ttttagagat 1560 agggatttat tatgttgttt aggttggttt cgaatttttg ggtttaagta atttgtttgt 1620 ttcgattttt taaagtttta agattatagg tatgagttat tgtgtttagt ttgttttatt 1680 attatttaat ttaagtaaaa acgttaattt aagatttttt attaagtata ataagtttat 1740 ttaaagaaat atattttagt taaattattt ttatttttga attttttttt tttttcgttg 1800 ttttttggat taggtagggg gttaggtaga ttttatttgt agattaaatg tagttagttg 1860 gtttgttttg aaattaaaat gttattggaa tatagttacg ttatttttgt atttttagtg 1920 gtagtatagt taattagttg taatagaaat ttgatggttt ttaagtttaa aatatttatt 1980 atttagttat ttaagaaagt ttagtaggtc gggtatagtg gtatattttg aattttaata 2040 ttttgggagg tcgaggcggg tggattatta aaggttagga gtttgagatt aatttggtaa 2100 atagtataat tttgttttta ttaaaaatat aaaaattaat tgagtgtagt ggtgggcgtt 2160 tgtaatttta gttatttggg aggttgaggt aggagaattg tttgaatttg ggaggtagag 2220 gttgtagtta gtagagatat attagtgtat tttagtttgg gtaataagag tggaatttta 2280 ttttaaaaaa aaagaaagaa agtttagtaa tttttatttt ggattattta gataagaagt 2340 ttggttagag tatttatagt tgaattttaa agttaatata gtgtttagta tatagaatag 2400 taaagggttt tttaaatatt gaagatgttt ggttgttttt agatatattt atagaagatg 2460 tttaggattt aaagagagtg aaattttaat ataaattttt tattatatga atagttttat 2520 agtatttttg tataataaat atttgtgatt tattttagtt agtttttatt agtgaatggg 2580 gaggattttg ggttaagaaa tatttggagt tatattaata tagtacgata aatttaatgt 2640 aaattttttt ttattaagat tatttagtaa aaggggaagg gtagtaaaat ataaaataaa 2700 aatagaaaga tgagagtggg tgataagaat gattatgatt tagtatatat aatttttagt 2760 tttttgagat ttttttttaa aatatttata ggatttataa taatttatta atttagagag 2820 attaaattag cggtaaagta gggatagaat aaggtaattt ttaattttaa ataagtgttt 2880 ttataattag aattttataa tattagttaa atttttgata attaaagata aattattata 2940 tttttaggta tgatttttat tttagtaaat tgttatattt tttcgtaaga tatattattt 3000 tttaatgata tgaatagtaa tttttaattt tttgatttgt atttaagtat tgttttgtat 3060 ttagttttgt tttgttttgt tttttttttt agatggagtt ttattttgtt atttaggcgg 3120 aagagtagtg atgtgatttg ggtttattgt aattttcgtt ttttaggttt aagtgatttt 3180 tttgttttag ttttttgagt agttgggatt ataggtatgt gttataatat tcggttaagt 3240 tttgtatttt tggtagagat ggggttttat tatgttgatt aggttggttt cgaatttttg 3300 attttaggtg atttatttat ttcggttttt gaaaatgttg ggattatagg tgtgagttat 3360 cgcgttcggt atatatttag ttttttaaag taatatacga ttaggtggtt ttagaatttt 3420 attatgaatt tttttttatt tgaaaaaaaa attttgtaat tttgaaaatt aaaaataata 3480 atttttaatt tgagtttaaa gagaaattat ttaagaatat taaattatta ggtgatagaa 3540 ttgaataaag tttaaacgta aataagtaat attagttgaa gatatgtgat tcgtttgggg 3600 tagatatgaa atgtagtttt aagggaacga tttgtttttt aaaggaaata aattttataa 3660 ataattttta ttagtgtttt ttaaaaagta tttttttttt ttagattttt tttttaaaga 3720 taaattaaaa taatattttg ttaaatgata tttttttttg tataattaat ttgttttttt 3780 ttaatgtttt atattttttg atgatatcga agttaggatg ttttatatta tatgtttgtg 3840 gaagaattgg aatgttataa taattgattg tgaaatggta agaaatattg agaaaaatag 3900 ggtatattaa aaataatttt ttaatttaaa gtttgtagtt gggtaattat ttgttttgaa 3960 atagggaggt ttagggtagg gaagtgtaaa tttgttgaaa gtatttgaaa attgttttag 4020 ttagggttta gttaatattt tttttttttt tttttttttt tttttttgtt ttgttgttta 4080 ggttggagtg tagtggtata atttcggttc gttgtaattt tcgttttttc ggtttaagta 4140 agttttaagt tttagttttt taggtagttg ggattatagg tatgtgttat cgtatttggt 4200 taatttttgt atttttaata taaatagggt tttattatgt tggttaggtt agttttaaat 4260 ttttgatttt aaatgattta tttattttag ttttttaaag tgttgggatt ataggggtga 4320 gttattatgt taggtttgtt aatatttttt gtttattatc gtatagtata tttgtttttt 4380 tttttattgg ttatattttt taaaaattaa gtttgtatta taattgtatt agatatttaa 4440 taattttatt ttaggttttt gtgtattatt tttattttat ttggaaagtt ttaggtatta 4500 tgtttatttt ttggagatat ttttttaaaa tttaataaag aggattatga agagaattgt 4560 agatttgtag tgttgtattt tgtggagata tgtgaagttg gaggaattgg aagaaataga 4620 tggttgattt tttgtaaatg aagaggattt tagagtttat agaaagattc gttaggatgt 4680 gtattaacgt tttttattgg taggttttgt tgtaaaattg tatttttatg taatatgatt 4740 gtattataaa tggggagggg agaagaaata tgaaaattat ttaagagaga tttaaaaggt 4800 tatatgaaat gttataaatg atgtagatta ataaaaaggt agagaaatat gttaaaagta 4860 attatagtta gaatggttat tattagaaag ataaaaaata atagatgttg atgaggatat 4920 agagaaaaga gaacgtttat atattgttgg taagaatgta aattagttta tttattgtgg 4980 aaaatggtat gaagtttttt aaaaaaaaaa ttaaaagtag aatgattata taaattaata 5040 attttattat tgggtatttt ttaaaggaaa ggaaattagt atattaaagg gatatttgta 5100 gttttatgtt tattatagta ttatttataa tagttaagat atggaattat ttaagtgttt 5160 attaatgaat aaataaaatg tggtgtatat atataatgga atattattaa gttattaaaa 5220 aagagtaaaa tcgtgttatt tgtagtaata tggatggaat tggaagttat tatggtaagc 5280 gaaataagtt aaatatagaa aaaaaaaaaa atttagaaaa ataaatattg tatgttttta 5340 tttatacgtg agagttaaaa aaaaaagttg attttatgga ggaagagagt atttatagaa 5400 tgatagatat tagaagatgg tagggggtgg gaagggtgta ggtggaggaa gagaggttgg 5460 ttaatgagta taaatatata gttagataga agcgataaag tttattgttt atagtagagt 5520 agggtgatta tagttaataa taatgtaggt tatatatata tattttgttt gtttgtttgt 5580 ttttgttttt gttttttgag atagagaaaa gtatattaaa aataaagatg gtttataaaa 5640 tttattattt ttatttttta aattattaat attattttta tatatgtttt attatatatg 5700 tgttgtgaat atatttatta taatttatgt tttgatgtgt aaatatatga gtgtaaatag 5760 gtaatttttt taaataaaat ttaatatata gaaatttaaa ttaataaata aaaaagatta 5820 tttatggtta ggtattgtgg tttatgtttg tgatttagta ttttgggagg tcgaggtggg 5880 agggttgtat aagtttagga gttggagatt agtttgggta atatagggag attttatttt 5940 tataaaaaat gacgaaatta gttgggtttg atggtatgta agtcgatagt tttaggtatt 6000 tgagaggtta agaggattat ttgagtttga gagattaagg ttgaaagtga tatttaattg 6060 atggtgttat tgtattttag tttgggtaat agaataagat tttgttttaa aaaaaagaaa 6120 aagaaaggaa aagattattt aaatttgagt tgatattttt ttttgtaaag aattttttag 6180 gttaggtttg gtggtttacg tttgtaattt tagtattttg ggaggtggat tgtatgaggt 6240 taggagttcg agattagttt ggttaatatg gtgataattt tatttttatt aaaaatataa 6300 aattagttgg gcgtgatggt atatgtttgt aattttagtt atttaggagg ttgaggtagg 6360 agaattattt gaatttggga ggtagagatt gtagtgagtt gagatcgtgt tattgtattt 6420 tagtttgggt gatagagcga gattttgttt taaaaaatag aaaagaaatt gtaatatttt 6480 aattttgttt tttaaaaaat ttttgttaag atgatagtaa gagaaggaaa aagaaaaata 6540 aaataaaaat tttttgtaag tagagattta attttgaatt tatttttgga tgtttaatgt 6600 atggtatagt ttttagtata ttgtgagaga gtttaatgtg tgagaaattg atgagttaag 6660 tttttttttt tttttgaatc gttaggatgt gagattatta ggatattttg tgttaattgt 6720 ttgatgataa ttgatagtga tttaaatagg tagaagagta gtattaggta taaaaagaag 6780 aagttaaaat ttttacgagg agggagggta ggagatagat ttatagaaaa aataatatta 6840 tattttatat ttgtatttgt atagttttta acgtgttttg ttttttattg tttgaagtat 6900 gagttattta ttatataaat ttcgtaattt agatagaaaa gaagaaaatg taatattttt 6960 attgtagagt gttatgtgtt attgaaagag aaaaattata gtttaatttt ttttataagt 7020 agattgaagg tttgtacgta ttatggaatt tgataaataa ttagtttaat atttacgtat 7080 tgattatttt ttaagaaaaa tatatgattt aaaataaaat tagtaattag ttgttagata 7140 atttttgttg tgatgaatgt attgttattt tttaaatggt tttttttttt ttaagagtgg 7200 aattttaaaa gtttggtaat ataatttagg aattgggtaa tttatatagt gaaaattttt 7260 tcgaatttta ataagaaatg gatttattta gttgaacgtt gttttagata ttaagttttt 7320 ggtaagtaat ttattttaaa agtttttatt attttttttg attttttttt ttcggtatat 7380 tttgcggagt attcgttatt gtaattttta aagaagaatt aaattattat taagtaaatg 7440 taggtgggta agcgggattc ggggtaattt acgtgacgtt tattatgata tcgtgcgttt 7500 ttttttagga tttaggtaaa tataaaaaag gaggtttaga taattaagta tttaggttcg 7560 aatttttaat aagcgtgttt tgggagcgtt gttttgtatt ttttattttg tcggggtcgc 7620 ggcggttttt gttttttttc gtcggtttag ggaagattgg ttaaatttta ggttagtttt 7680 atagagttag ggttcgtcgg taaagaataa aaaaataatt gtttttttta tattcgagta 7740 aatagtttag attggggtgt taagttattt atagaaaaat ttttagggcg cgtttagttt 7800 cgtggttttg ttaattatag acgtataata gtaagtttgt aaagggaacg gggacgggcg 7860 tgaattattt tttttattag tagggttttt cgatgtcgta gtatttattt tatattttaa 7920 attttatggt attagtgggt aatttaaaag ataaagatat agggaagcgg gattaattgg 7980 gaaaatttgt agatatttgt tttaatgcgt aatttgttaa ataattacgg gggtgggggt 8040 ggggaaggaa gagatttaag gaggtagaag gttgcggtta aaatattttg gggtggtaga 8100 gttacgtagg atgtggttgt gggttttggt agtttagaga tttagttttc gttttttttt 8160 ttagagcgag tttatagtta tttttacgtt tttcgtggcg gttttcgtta cgtttcggag 8220 cgggttattt atgagggtgt tagatttggg tagcgggaat ttcgaagagg tggagattgt 8280 aggttggatt ttagatttcg ggtagggatg cggggaaggg aagacgtttc gttggaggcg 8340 gaatggaggg taaggcgaag gaggatggtg taggaaacgg cgataaggcg ttcggttagg 8400 ttcgcgagtt atcgagattc gggttttaat tttttttttt ttcgtaaacg ttcgggttcg 8460 aggtatttgg cgggtaaggg tcgtagcgga gcgaagcggg ttggttatgg ggaggttgcg 8520 gggacgcggg gttgtagaga gcggtagtgg tacggagcgc gcggttggaa gcgaaagtag 8580 gcggtgtggt taagtttcgg cgtacggttt atagggcgtt gggtattacg atttggggtc 8640 gcgcgttagg gttaggcgta gggtacgacg taattttttt agtatttttt ggggaggagt 8700 ttttaatcgt ttcgttttag tttgtttgta gtcgttaaaa tcgaagcggt tgtttttgtt 8760 atcggggtcg tttgcggagg ttcgagaatg cgcgttacga acgagcgttt ttttaagcgt 8820 agatatttcg cgagtatttt tgtttattaa ataattttta ggtgaatggt cgggaagcgt 8880 ttttcggtta aggttaagga aatttcggag aaattatatt agggtagttt ttttatcgat 8940 tttaaattta attgataaaa agtagttttt gttttcgaga gtttgcgggc ggggattgat 9000 atttgtgcgt ttgtttttgt ttgttattga tcgttatgtg taaattgaag ggggagaacg 9060 tgaatttagt ttttagattt ttttgcgtta tttatttaaa tcgaatttgt aattcggggt 9120 gttatggggt tattaggttc gtatttttta agggttattt ttgtttaaag attttaatgt 9180 tttttatcgt ttttaggtaa agtagattat taagagtttt aattatattg tttttatagt 9240 ttttcgatgt aggttcgtga tcgtaatatt tagaaagagg attggaaaag tgatgttaga 9300 agtattattc ggtttagaaa gggaaaggag gattggaata gttattgttt tatatgtagt 9360 gttcgtttgg gcgtaacgtt agtttaaatt atgagttttt ttggttttta aattaatagg 9420 aagtggtaat tggggttgat ttgattttgg aaagaggggg agggtagttt attttgggtg 9480 aaagcggtta aattcggttt ggttttttaa atggttttat ataacgttat tgataatata 9540 ttgtagtttt aattttatta atttagaaaa tttatatttt tttttttttt tatataaggt 9600 atagaaaggt tttttacgtt ggggtggggt tttaagtttt aaagattata gagtttaggt 9660 aggttacgta ttattataga gcggcgagtg tttttggaag tttagggtcg tttataagat 9720 aagttttgtt tttgttgttt tgagacggag tttcgttttg tcgtttaggt tggagtgtag 9780 tggcgcgatt tcgtttaatt gtaatattcg ttttttcggt ttaagtaatt tttttatttt 9840 agttttttta gtagtcggga ttataggttt gcgttattac gtcgggttaa tttttgtatt 9900 ttttgtagag atcgggtttt gttatgttgt ttaggttgtt tttaaatttt tggatttaag 9960 ttatttattt attttagttt tttaaagtgt taggattata ggcgtgagtt acggcgttcg 10020 gtttttattt gtattaattg tttttatttt ttttttatta agggtttttg tttaattatt 10080 ttatttaaat aaggttttta atagttttta ttttgttttt gttaatggtt ttgtttttcg 10140 tgtattttta tggttgtatt tatgtgttga tgatttttaa atatattttt ttagtttatt 10200 tgttttttga gtagtaggta tttgttattt aaaaatttgt ttaaaataaa aacggtgtat 10260 ttatttatta tgttcgaagt attgggttag ttgttggggg agggttgaga gtatattatt 10320 attttgttat tatgtattgt ttttagttag agagaaaagt gttaattgtg ttagaaagtg 10380 ttaaggaatt ttatagatag atgtaaaatt ataataagtg ttgtttgtgt tttaagagtt 10440 tttaataatg gattgtattg atttagaaag gtttggaaag gtttttagta agtgattttt 10500 gagtagaaat ttgaaagatt aaagaaattt attaaaggaa gaagggatga agagtatttg 10560 gtatgaaagt gagttttagg ataaaagaat ttttttgagg agggttggaa taaagggtta 10620 aaagagagtt tggggttgcg gtagatagaa gaggatggag tttgggttag tgagtagtta 10680 aagggttagt taagtagtgt tttagggaga gttaaagaat aattttaaaa agtaaaaata 10740 aggtaaaagt ttgattgtta tataggtata aaataaatta aattatagag tttatttaaa 10800 ttatttaatg aagttattag gtagatataa aaattggttt aaagaatagg tatgtttata 10860 ggttagaaat attgaaatga atatgtaaat gaaattggtt ttttttatag taggggagag 10920 aagttaattg aattttgatt tttagatttt atttgtatga ttgtatgtaa taattatttt 10980 gtatttttat tagttatttg taaaataatt taaaaataat gaaataatgt aagatttaat 11040 gaaagggttt atggaattag aattagataa ttttaaaggt ttgttttaaa taatttagtt 11100 ttttattgaa gtataaattt ttttttatag tacggtaata taattttttt atttaagaag 11160 tgttattagt tagtaatagt tgaagtaaat tagatatagt agttattgta tttattagtt 11220 atattaagaa gttgtagttt tagtagtttt taatttagtt taatttaggg gtaagagaaa 11280 ttattgaaag gttaaggatt aggtggagta tgtaggagcg gtgatagaat tgaaggtatt 11340 ggttgtagtt tggagattgg aagagggttt gggtggagag gaatggattt tgaagaagtt 11400 attatagaat ttatatacga gatgattttt ttaataagtt agatttggtt ggtggttggt 11460 aatagaagtg gagagaaata gttagatttt agtaagaatg gagataaggt ggtagtttgg 11520 gtaatatggt aaaattttgt ttttggtaaa aatataaaaa ttagtcgggt tcggtggtat 11580 gtgtttgtag ttttagttat ttacgggatt aaggtgagag gattatttga atttggtgag 11640 gttgaggttg tagtgggtta ggattatatt attgtatttg tttgggtgat atagtgagat 11700 attattttaa aaaaaaagaa aaagaaaaat agatgatata aggtgggata aggatgagag 11760 aagtgttaag gaggtttttt tggatttgat ttgtttattt atttggtgat gtttattaag 11820 aaaaaaggaa tgttgaaaaa gaatgtgttt gaggggatga ggaggagttt ggtttgggat 11880 ttatgatttt tgaagtgttt ttaagattgg ttgtgagaga tttgtttgtt tgaagtttag 11940 agaagaggtt tggattagag gtattattga attattggta tagaggtggt aattgaagtt 12000 atgggtgcga aagagaattt ttatgttagt ttttttcgtt gtaaaatgag ataatagtaa 12060 tattttatgt ttgttaattg ggatagatga gtattaatat atgaaattta tgtatattat 12120 ttagaattat gtttgatgtt agttatgtag aataggtgaa agaacgggta tggttttgtt 12180 tttattaaat tgtatttgaa aaacgggata gagtaaatgt ggtttgtgga ttgtaagttg 12240 tttatttttg ttttatgtag ttgttttagt agaaatatag tagttgtttt ttaaatgtat 12300 ttaagtgatg attattaatg tttatttatt tttgttttaa atattttgat agttgttatt 12360 tttttaatta tgttattcgt attttagtat taaatagttt ttaagtagt 12409 9 6013 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 9 ttattgtatt ttagttttga cgatagagcg agattttgtt ttaaaaaaaa aaaaagaaaa 60 aaaaaaattg ttttagagat aggaagggat tttttcgaag ttataagtag attagaggaa 120 gttggtttaa ggaggtttat ttagatgtta aatttttaag gatagggttt cgggttttat 180 atgttttttt ggtttttttt tattttattt tattttttat atatgttttt tatttagttt 240 tgtatggtta gtgtgaggaa tagttttacg ggtaaagata gcgaatgttt tatgtttgtt 300 tttagtgaaa atatagggtt cggggtttcg aaaattgtat atttttttga tgtggtagga 360 aaataagatt gatcgtatag ggtttttaag atttttgaat tatttttaag agagtggttt 420 ttttattttg agtaggtagg tagagatgtt tagtgcgggt tgagtatgga gttttttttt 480 tagagtttgt agggcgagta tagtttttat ttaagtaagg gagtttgcgt ttttgtttgt 540 tttttattag tgaaaaatat atttatttta tgttatcgtt ttagtagaaa aattaaagat 600 gatggatgtg tagggtattt tttaagtaga agaggtgtta gtgtgagtta ttattcgttg 660 tatgttttga tgcgacgtta tgggatagtt agaagttatt tgtggtttgt tgttgggtgt 720 taattagggg ataggttgtt agggttggag gtgtgtaatt taggaaggag aggggttgta 780 agtttttttt taaggaatta gggttttatc ggagttttga ggatgttttc gttaagtttt 840 tgaggtgagt agggaatggg tttttttcgg tgacgtgttt ttagtgttta gtttaaatag 900 tagttttagt aaatttgaac gtattatggt tttttgcggt tttttagatg aagtttgtat 960 tttttatttt gatttttgtt tttgattttt ggggtttttt gtttttagaa tttattaagg 1020 tttttttttt ttcgggtttt tgtaggtttt taggattgta ttttaaaagt taatttaagt 1080 tttttttttt tttttttttt tattatagag attagtaaaa ttttaagatt tgattttttg 1140 ggggttaggc gttgtggttt acgtttgtaa ttttagtatt ttgggaggat gaggtaggtg 1200 gattatttga ggttaggaga ttaagattag tttggttaat atggtgaaat tttattttta 1260 ttaaaaatat aaaaaattag ttaggtatgg tggtaggggt ttataatttt agttatttag 1320 gaggttgagg taggagaatt atttgaattc gggaggtaga agttgtagtg agtcgagatt 1380 gtattattgt attttagttt gggtaataaa agtaaaattt tattttaaaa ataaaataaa 1440 taaataaaag aaaatttcga ttttttaagt ttttttgttg tttaaggtgg ttatgtaatt 1500 tagatttagt tagtaagtta gaataaaagt ttttgaggag taattttttt tttgaataaa 1560 gagatggagt tggtaaggaa aaggtttttt tattttttgt ttttcggttt tttgtttttt 1620 tttttttttt ttgtttggaa tatggatgtg aggttcggag gtgtcgtagt tattttgtga 1680 ttatgaggta gtaattgtga ggatatagtt tttatattga agatagtgaa agggaagata 1740 gagtaggggt ggtcgtgtta tttgtaagtt attatattaa ttcgattatt tatcgaaggt 1800 ttattattgg ttaaagtaaa attttttgtt tgtataagtt tttgtattag tagttttttt 1860 atttataatg aacgtaatat ttatgttata tagttagttt tttacgagga atttttgtag 1920 aatttgtatt tttatttttt ttggggttta ttgcgtgttc gttattgcgt tggttttttt 1980 tagttttttg attatattga atttattttt gttttaggat ttttgtattg gttgggtcgg 2040 ttagaggttg ttggtttttt tttattattt tggcggtttt agtttaaatt ttacgttttg 2100 aaaaacgttt tttttttttg tcgtataatt tgtaggagtt tttttaggtt tttttatttt 2160 atgagtcggt tttttttttt tattattttt tattgttgtt tgttgttttt tttatttgtt 2220 tttttatttg tttggtgtat agaacggtag ttttataggg agttcggttg tttgtgttga 2280 gtgtttttgt gtttttagtg tgtggtatat agtaagtatt taataaaggt ttgttggatg 2340 aattatttag tgtttttttt gtttgttttg ttttggagat agagtttcgt ttttgttatt 2400 tagacgagtg tagtttcgcg attttggttt attgtaattt ttgtttttta ggtttaagtt 2460 atttttttgt tttagttttt taagtagttg ggattatagg tatttattat tacgttcggt 2520 taattttttg tatttttagt agagatgggg ttttattatg ttggttaggt tggttttaaa 2580 gttttgattt taggtgattt attcgttttg gttttttaaa gtgttgggat tataggcgtg 2640 agttattagg ttcggttatt tatttagtgt attaattaat gttaattttt ttgttgatgt 2700 gttttgtttt tttgtttggg agttggaaat ttttattttt ttttttgagt tgtttttttt 2760 gggaaagttt ttttggtatt tttagatttg ggttgggata tttgtggttt tcgtatttat 2820 gattttaggt gtttttttgt cgttattttt ttataatttt aattgtaagg tggttgacgt 2880 ttttatttgt tagatgttat tttttttttt aggttataaa ttttaagagg atagggatta 2940 ttttcgtttt ttgttttatg gtttatgttt ggcgtaggtc gatgtgtttg ttgaatgaat 3000 gaatgatagt agttgttttt agattggaag attttaggtt agacgatagg agttatttaa 3060 gttttatttt tttttatttt agttcgtttt ttttttcgga agaaaaatta aattaaagtc 3120 gcgtgtttta tttagtttag atttgttttg ttttgaataa aggggtagtt ggtgtttttg 3180 tttagataga cgtttgtatt agtaatacgt aaagttagtt ttgtcgcgta gttcgagggt 3240 ttcggggggt tgttttttag taagattttg tttttttttt tttattttat ttttttattt 3300 attttttttt ttaaataata gtatatattt ttaattttcg tgtggaattt ttcgttttta 3360 aagtattttt taagtattag tttattagta gagcggtttt ttgatattac gaggttgttt 3420 tttgggtgtt ttttgagtta taacgttcga gtttatcgat aaaaataagt tttttttata 3480 gagcggattc ggcgttatag ttaagattat tgttttagaa aaaaagggaa gaaggaagga 3540 gagaaatatt gtttttggta agcgttagtt aagtattgat tttcgtgtta gttttaagta 3600 ttaggagatt cgagagatgt taggtttagc gtaggggtta tcgaagtttt cgttttttgt 3660 tttgggttgg aattttttat taggaggaga tgttatagcg tggtttttga tatttggtat 3720 tttttttagc gttttttttt gtatttatat ttggtttttt attattagga atgtttttcg 3780 ttttttattt tatttttatt tcgtaaatat agttataagt tttaagttta gaggacggga 3840 taattatttg ttgtttaata aatgacgggt ggtgttagtt agttcggata gagggtagtt 3900 attttggtat tgaatagatt tgggtttaaa ttttagattt gttttttata agttttggga 3960 ttttggttaa gtggtcgaga ttgttttttc gtttgtggaa tgaggtcgta ttggttttgt 4020 tttttttagg gtcgtttgtg aaatgatgag tggagagtat tggggtattt ggagttagcg 4080 atgtttttag ttaagggagt agttgttaat ttttttggtt ttaggggtta tagagtggtt 4140 tttattttag aggtagagta taggttttag ggtaggggat ttagtattgg gtattacgga 4200 agtttttata agagttaggg aggatcgtgg tttttttttt gtaggagggg ttggttttag 4260 tatttttgtt tttgtatttt atattatttt atttatagaa gaggtattga ataaagattt 4320 aaattaaaag ttttatgtaa attaatataa aagttggatt gggttatata tagtggttta 4380 taattgtaat tttagtattt tgggaggtta aggcggagga ttatttgacg ttaagagttt 4440 gagattagtt tcgttaaata tggtaagatt tgtttataaa aaatttattt ttttgttttg 4500 tttttgtgag acggagtttt agttttgttg tttaggttgg agtgtaatgg tgagattttg 4560 gtttattgta atttttgttt tttgggttta agcgattttt ttgttttagt tttttgagta 4620 gttgggatta taggcgttcg ttattacgtt tagttaattt tttgtatttt tagtagagat 4680 gtggttttat tatgttggtt agattggttt tgaatttttg attttaagtg atttatttat 4740 tttggttttt taaagtgttg ggattataag tatgaattaa tatatttagt ttttataaaa 4800 attttaaaaa ttagttaagt atggtggtat gtacgtgtgg ttttagttat ttaagagatg 4860 ggaagattgt ttgagtcggg gaggacgagg ttgtagtgag ttatgatgac gttattgtat 4920 tttgttttag tttgggtaat atagtaagat tttgttttta aaaaaagaaa agaaaagaaa 4980 atggttgggt gtagtggttt acgtttgtta ttttagtatt ttgggaggtt aatatgggtg 5040 gattataggg ttaggagttc gagattagtt tgattaatat ggtgaaattt cgtttttatt 5100 aaaaatataa aaattagtcg ggcgtggtgg tggtatgtgt ttatagtttt agttatttag 5160 gaggttgaga taggagaatc gtttgaattc gggaggcgga ggttgtagtg agttaagatt 5220 ttattattgt tttttagttt gggcgataga gtgagatttt gttttaaaag aaaggaaaga 5280 aggaaggaag gaaggaaggg agggacggat agatagaggg agggagagag gaaggaaaga 5340 gaaaggttag gtgcggtggt ttatatttgt aattttagta ttttaggagg ttaaggtagg 5400 cggattattt gaggttagga gttcgagatt agtttggtta gtatggcgaa attttgtttt 5460 tattaaaaat ataaaaatta gttaggtgtg ttggcgtgaa tttgtagttt tagttattta 5520 ggaggttgaa gtaggagaat cgtttgaatt taggaggagg aggttgtagt gagttaagat 5580 tatgttattg tattttagtt tgggtaatag agtgagattg ttttagaaaa taataataat 5640 aaataaaata aataaatata atgtaaaaaa atttttaaag ttggtttggg ttatggaaaa 5700 tgtattagaa atattattat ttagaaattt tttttttgag ttatagtaaa tattgattgg 5760 atttttatta cgtattaggt attgtgttgg gtataggata ttttttttgg agatggtagg 5820 agattgttgg gtattttttt agggtatatg ttagtaatat tttatttcgt gttttagtaa 5880 aaaggtttaa atgtatgtgg ttaagtagat gtgggtgcgt tttgagggta gaaattttgt 5940 tcgttgagta agaacgttgt tggatagttc ggtgtttatt ttgtttttag ttattttttt 6000 aatagaattt tgt 6013 10 6013 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 10 atagggtttt gttaggaagg tagttgggga taaaatggat atcgaattgt ttagtagcgt 60 ttttatttag cgaatagggt ttttgttttt aaggcgtatt tatatttgtt tggttatata 120 tatttggatt tttttgttgg agtacgaagt aggatgttgt tggtatgtgt tttggaggga 180 tgtttagtag ttttttatta tttttagagg gagtgttttg tgtttagtat agtgtttggt 240 gcgtggtagg ggtttaatta atatttgttg tgatttaagg gaggagtttt tagatagtag 300 tgtttttggt gtatttttta tgatttagat tagttttaaa aatttttttg tattgtattt 360 atttatttta tttattatta ttattttttg agatagtttt attttgttgt ttaggttgga 420 atatagtggt atgattttgg tttattgtag tttttttttt ttgggtttaa gcgatttttt 480 tgttttaatt ttttgagtag ttgggattat aggtttacgt taatatattt ggttaatttt 540 tatgttttta gtagagatag ggtttcgtta tgttggttag gttggtttcg aatttttgat 600 tttaagtgat tcgtttgttt tggtttttta aagtgttggg attataggtg tgagttatcg 660 tatttggttt tttttttttt tttttttttt tttttttttg tttgttcgtt tttttttttt 720 tttttttttt tttttttttt ttttttttga gatagagttt tattttgtcg tttaggttgg 780 agggtagtgg tgagattttg gtttattgta attttcgttt ttcgggttta agcgattttt 840 ttgttttagt tttttgagtg gttgggatta taagtatatg ttattattac gttcggttaa 900 tttttgtatt tttagtagag acggggtttt attatgttgg ttaggttgat ttcgaatttt 960 tgattttgtg atttatttat gttggttttt taaagtgtta ggatgatagg cgtgagttat 1020 tgtatttagt tatttttttt tttttttttt ttttagagat agggttttgt tgtgttgttt 1080 aggttggagt agagtgtagt ggcgttatta tggtttattg tagtttcgtt tttttcggtt 1140 taggtaattt ttttattttt tgagtagttg ggattatacg tgtatgttat tatgtttggt 1200 taatttttaa aatttttgta ggggttgggt gtgttggttt atgtttgtaa ttttagtatt 1260 ttgggaggtt aaggtgggtg gattatttaa ggttaggagt ttaagattag tttggttaat 1320 atggtgaaat tatattttta ttgaaaatat aaaaaattag ttgggcgtgg tggcgggcgt 1380 ttgtagtttt agttgtttag gaggttgagg taggagaatc gtttgaattt aggaggtaga 1440 ggttgtagtg agttaagatt ttattattgt attttagttt gggtaataag attgaaattt 1500 cgttttataa aaataaaata aaaaaataaa ttttttgtag atagattttg ttatgtttgg 1560 cgaggttggt tttaaatttt tggcgttaag tgatttttcg ttttggtttt ttaaagtgtt 1620 gggattatag ttatgagtta ttatgtatgg tttagtttag tttttgtatt ggtttatatg 1680 aggtttttag tttggatttt tatttaatgt tttttttgtg gatgagatgg tgtggggtat 1740 agaggtaggg gtgttaagat tagttttttt tgtagggaga aggttacgat tttttttgat 1800 ttttgtgggg gttttcgtaa tgtttagtat tgagtttttt attttgggat ttgtgttttg 1860 tttttggaat ggaagttatt ttgtaatttt taaaattaga gaaattggta gttgtttttt 1920 tggttgagaa tatcgttgat tttaagtgtt ttagtgtttt ttatttatta ttttatagac 1980 gattttgagg gaggtagggt tagtgcggtt ttattttata gacgaggaaa tagtttcggt 2040 tatttggtta aggttttaga gtttgtaagg agtagatttg ggatttgaat ttaggtttgt 2100 ttaatgttag agtaattgtt ttttgttcgg gttggttgat attattcgtt atttattagg 2160 tagtaaatgg ttatttcgtt ttttgggttt agggtttatg gttgtgtttg cggggtgggg 2220 atggagtggg aggcgggaaa tatttttagt ggtgggaaat tagatgtggg tgtagggaga 2280 gacgttggga gaggtgttag gtgttagggg ttacgttgtg atattttttt ttggtggagg 2340 gttttagttt agggtagggg acggaagttt cggtggtttt tacgttgagt ttggtatttt 2400 tcgggttttt tagtgtttag agttgatacg gggattagtg tttggttggc gtttgttaga 2460 ggtagtgttt tttttttttt tttttttttt tttttttgag atagtgattt tggttgtggc 2520 gtcgaattcg ttttatggga aaaatttgtt tttgtcggta aattcgagcg ttatgattta 2580 gaagatattt agggagtagt ttcgtggtgt taaggggtcg ttttgttaat gagttaatgt 2640 ttaggaagtg ttttgaagac gaaaaatttt atacgagggt tgagggtgtg tgttgttatt 2700 tgggggagag ggtgaatagg aggatgaagt ggagggaaag gggtaaaatt ttgttaagga 2760 atagtttttc gagattttcg ggttgcgcgg taaggttggt tttgcgtgtt gttgatgtag 2820 gcgtttgttt gggtagaggt attagttgtt tttttgttta gaataaggta gatttgaatt 2880 gggtgggata cgcggttttg atttagtttt tttttcgggg gagggggcgg gttggggtgg 2940 gaagggatgg gatttgggtg atttttgtcg tttagtttga gattttttag tttggaagta 3000 gttgttgtta tttatttatt taataaatat atcgatttgc gttaggtatg ggttatggag 3060 taggaaacga agatagtttt tgtttttttg aagtttatgg tttggagggg gagatgatat 3120 ttaatagatg aagacgttaa ttattttgta gttagaattg tgaaagggtg gcggtagaga 3180 gatatttaaa gttatgggtg cgggaattat agatgtttta gtttaggttt gggagtgtta 3240 ggaaggtttt tttaggagga atagtttaaa ggaaagagtg ggggttttta gtttttaggt 3300 agagagatag gatatattag tagagagatt ggtattaatt aatatattga ataaatggtc 3360 gggtttggta gtttacgttt gtaattttag tattttggga ggttaaggcg ggtgggttat 3420 ttggggttag gattttgaga ttagtttggt taatatgatg aaattttatt tttattaaaa 3480 atataaaaaa ttagtcgggc gtggtggtgg gtgtttgtaa ttttagttat ttgagaggtt 3540 gaggtaggag aatagtttga atttgggaga tagaggttgt agtgagttaa gatcgcggga 3600 ttgtattcgt ttgggtgata aaagcgaaat tttgttttta aaataaaata aataaaaaag 3660 atattgaata atttatttag taaattttta ttgagtattt attatatgtt atatattggg 3720 gatatagagg tatttaatat aggtagtcgg attttttatg gagttgtcgt tttgtgtatt 3780 aagtagatga agaagtaggt agagaaagta gtagatagta gtaaggagtg gtggggaaaa 3840 gaaatcgatt tatggggtag aggggtttgg ggaggttttt atagattgtg cggtagagag 3900 ggaaggcgtt ttttaggacg tggggtttaa attgagatcg ttagagtggt aaggaagagt 3960 tagtagtttt tagtcggttt agttagtgta aaggttttga gataggaata agtttagtgt 4020 gattagagaa ttaagagagg ttagcgtagt ggcgggtacg tagtgagttt taaggagagt 4080 gagaatgtaa gttttgtagg ggtttttcgt gaagggttgg ttgtgtagta taagtattac 4140 gtttattgta aataaagaaa ttattaatat aggggtttat atagatagaa gattttgttt 4200 tagttaatga taagttttcg gtgggtagtc gggttggtgt agtaatttat agatggtacg 4260 gttatttttg ttttattttt ttttttattg tttttagtgt ggaggttgtg tttttatagt 4320 tgttgtttta tggttataag atggttgcgg tattttcggg ttttatattt atgttttagg 4380 taagaggaag gagaaggagt aaaaggtcga agagtaaaga gtgagagggt tttttttttg 4440 ttagttttat ttttttattt agaaagggaa ttgtttttta gggatttttg ttttaattta 4500 ttggttagat ttgggttata tggttatttt ggatagtaag gaggtttgga aaatcgaggt 4560 ttttttttgt ttgtttgttt tgtttttgag atggagtttt gtttttgttg tttaggttgg 4620 aatgtaatgg tgtaatttcg gtttattgta atttttgttt ttcgggttta agtgattttt 4680 ttgttttagt tttttgagta gttgggatta tgggtttttg ttattatgtt tggttaattt 4740 tttatatttt tagtagagat ggggttttat tatattggtt aggttggttt tgattttttg 4800 attttaggtg atttatttgt tttatttttt taaagtgttg ggattatagg cgtgagttat 4860 agcgtttggt ttttagaaaa ttaagtttta aaattttgtt ggtttttata gtagaaggag 4920 gaaagggaga agagtttggg ttgatttttg gggtgtaatt ttaaaggttt gtaaaggttc 4980 gaaggaggga aggttttggt gaattttggg gatagaaagt tttaggggtt aggggtaggg 5040 gttagggtga agagtgtaga ttttatttgg aggatcgtag ggagttatgg tgcgtttaga 5100 tttgttgaag ttgttattta aattgagtat tggagatacg ttatcgaggg aggtttattt 5160 tttgtttatt ttagagattt gacgggggta tttttagggt ttcgatgaag ttttgatttt 5220 ttggagaaag gtttgtagtt tttttttttt ttggattgta tatttttagt tttggtagtt 5280 tgttttttgg ttggtattta gtagtaggtt atagatggtt tttggttgtt ttatggcgtc 5340 gtattagggt atgtagcgga tagtgattta tattggtatt ttttttgttt ggaaaatgtt 5400 ttatatattt attatttttg gtttttttgt tagaacgatg gtatgaggtg ggtgtatttt 5460 ttattgatgg ggaataggta gagacgtaag tttttttgtt tgaatgagga ttgtgttcgt 5520 tttgtagatt ttggaagaag ggttttatgt ttagttcgta ttgggtattt ttgtttgttt 5580 gtttagggta gaagggttat ttttttaggg atgatttaag ggttttggag gttttatgcg 5640 gttaattttg tttttttgtt atattaaggg agtgtgtaat tttcgaggtt tcgagttttg 5700 tgtttttatt gagggtagat atagggtatt cgttgttttt gttcgtggag ttgtttttta 5760 tattaattat gtagggttgg gtgggagata tgtatggggg gtggggtggg gtgggagggg 5820 gttaagaaga tatgtaagat tcggggtttt gtttttggga gtttaatatt tgggtgggtt 5880 tttttggatt aatttttttt gatttgtttg tgatttcggg aaagtttttt tttgtttttg 5940 ggataatttt tttttttttt tttttttttt tgagatagag tttcgttttg tcgttaaggt 6000 tggagtgtag tgg 6013 11 12951 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 11 tttttttttt tggtgaggtg agtttttgtt atttaggttg gagtatagcg gtgtgatttc 60 ggtttatcgt aatttttgtt ttttgggttt aagttatttt tttgttttag ttttttgagt 120 agttggtatt ataggtatgt attataatat ttagttaaat ttttttgtat ttttagtaga 180 gatgagtttt gttatattgg ttaggttggt tttgaatttt tgattttaag tgatttattc 240 gtttcggttt tttaaagtgt tgggattata ggcgtgagtt acggtattag gtttagttta 300 gtttttttac gtttttttgt ttgttttata ttttggtcgt attggtagtt gattagttgg 360 tgtttattta gattgaggat gggttcgttt tttttagttt tattgattta aatgtttatt 420 ttttttggta acgtttttat agatatattt aggattaata ttttgtattt tttaatttaa 480 ttaagttgat atttattatt aattattata aggtgtgagt tttgtattta gtaatatatt 540 gttttttata tatttataga aatttaattg gttttgtttt tttggaaaat tttgattaat 600 atatattttt ttattttttt tatagtattg aattatggga taaattaggt tggttgtttt 660 gtagaatgtt ttatattgtg atttgattga tattttttta tgattttaat ttttattttt 720 tgtgtttttt aattaattta tttgggtttt tgtttttttt ttttgttttt agatagggtg 780 ttattgtgtt gtttaggttg gagtgtagtg gtatagttat agtttattat agcgtcgatt 840 ttttaggttt agatgattta tttattttag ttttttgagt agttggattt ataggtgtat 900 attattatat ttagttaatt tttaattttt ttagagatgg tagaggtggg gggggttggg 960 gggggtttta ttatgttgtt taggttggtt ttgaattttt gggtttaagc gatttttttg 1020 ttttggtttt ttaaagtgtt gggattatag gtataagtta tcgtatttgg ttttaaataa 1080 tttatttttt ttattttttt agtttttgtt tttatttaat tttttatttt tattttagtt 1140 tttttaggaa tttgagtttt tggatttttt tatttttttt ttgttaataa gtttttttat 1200 aatgttcgtt attattttaa ttattttatt ttttaaaaat ggattttgtt gaggaataat 1260 atgtatataa taaaatgttt gtatttaaaa tgtatttttt agcggatttt aataaatata 1320 tatatttgtg taattatcgt tattattaag tcgttttttt ttttatagtt tttattttgt 1380 ttttttttat tatgtttttt taatttatat taatttttta gatttttttt tttttggtac 1440 gtttggttgt agatttgtag gagagaatat atacgtcgat ttgttggaaa tttgtatatt 1500 agtattgttt tttcgaggat tttcggtttt tgtttaggta gtagtgttcg tttatgtttt 1560 atagtagttt tttttttttt tttttttttt gagatggagt ttcgtttttg ttgtttaggt 1620 tggagtgtag tggtataatt ttagtttatt gtaatttttg ttttttgaat ttaagcgatt 1680 ttcgtgtttt agtttttcga gtagttggga ttggaggcgt ttattattat atttagttta 1740 tgtttttgta tttttagtgg agacggggtt ttattatatt ggttaggttg gtttttaatt 1800 tttgagttta agtgatttat tcgttttagt tttttaaagt gttgggatta taggtttgag 1860 ttattgtgtt cggttagtaa gttttttttt tttttttgag ataggatttt tttttgttgt 1920 ttaggttgga gtgtagtggt atgattttgg tttattgtta ttttaaatgt ttgtttttat 1980 tattgtgtag taataaattt ggttaggagt ggtggtatat atttgtaatt ttagtatttt 2040 gggagattaa agcgggagga ttatatgagt ttaggagttt gagattagtt tgggtaatat 2100 agtgagattt tatttttatt aaaaaaataa aaaaaaatta gttaggtacg gtggtatgta 2160 tttgttattt tagttattta ggaggttggg gtaggaggat tgtttgagtt taagagtttg 2220 agaaaagttt gagtaataaa gtgagatttt atttgataaa atagtataaa aggacgtttt 2280 aaaaaagggt taggtaggta gttttgttta atagaatttt ttttatttgt gttgtttaag 2340 taaggtagtt ataagtttta agtagttatt gagtattgga aatgtggtta gtagttaggc 2400 gtggtggtag gcgtttgtgt tttagttatt taggatttga ggtaaaaaga tcgtttgagt 2460 ttaggaattt aaggtcgtag tggtggattt aataaaagaa aaaaaggtcg aggttgtagt 2520 gaattattat tatgtttttg agtttttaaa ttttaaatga taggagtgtt tattttattt 2580 attgtgggtt ttttagatta tttttgatgg tttatgttaa tgagatgatt tgggatgggt 2640 ttttatatag tttatgttaa taagatgatt gaggatggga attggttatg ttggaaatta 2700 acgatcgaat acgatatttg agttttgtgg ttttgagttt tatttttgga tgggttaggg 2760 agattggtga ttgagaaaat aattttatta gaagagtgag agatagaata gttagtatat 2820 tgcggtttcg atttgaatta gtttaggttt ttttaaatat tagtgatatg tggttattta 2880 aatttaatta aagttaggcg tagtggtata tgtttgtaat tttagtattt tgggaggtcg 2940 aggtgggtag attatttgag gttaggagtt tgagattagt ttggttaata tggtgaaatt 3000 tatttttacg aataatataa aaagtggttg attgtggtgg tgtatgttcg tagttttagt 3060 tatttaggaa gttgaggtat aagaattgtt taaatttagg agatggagat tgtagtgagt 3120 taagattttg ttattgtatt ttagtttggg cgatatagtg aaatttcgtt ttaaaaaata 3180 aatttttaaa aaattaattt aattataatt aaaattttat ttttttagtt tattggttat 3240 tttttttttt ttaattttta tttttttttt tttattgagt ttattattgc ggttttgaat 3300 ttttgggttt aagcgatttt tttgttttag attttgagta gttgggatat aggcgtttgt 3360 tattacgttt ggttgttggt tatattttta gtgtttaata gttatttgaa gtttgtggtt 3420 attttatttg ggtagtatag atagggaaag ttttattgga tagggttgtt tatttagttt 3480 ttttttaaaa cgttttttta tattattttg ttagatgggg ttttattttg ttgtttaggt 3540 tttttttaaa tttttgggtt taagtgattt ttttgtttta gttttttaaa gtaatttgta 3600 aatacgtgta aataatatag tttttttttg ttgtattaaa atgaatgtaa aaatgttacg 3660 atggggtcgg gcgcggtggt ttatgtttgt aattttagta tttcgggagg tcgaggcggt 3720 aggattattt gaggtcggga gttggaaatt agttttttgg tgttttttta atttttgtat 3780 tggagggata acggaagggt tttgtgttat ttttattttt tttatttgta atttttttga 3840 tggttaatta ttattttaaa gttttagttt tttttttttt atttattgag agtatatttt 3900 tttttttata gtaattttta ttttatagag ttttttttga gacggagttt tatttcgtta 3960 tttaggcggg agtgtagtgg tacgatttcg atttattgta attttcgttt ttcgggttta 4020 agcgattttt ttgttttagt ttttcgagta gttgggattt ataggcgttc gttattacgt 4080 ttagttaatt ttttagtata gacggggttt tattaggttg gttaggttgg tttcgaattt 4140 ttgattttag gtgatttatt tatttcggtt ttttatattg ttgggattat aggcgtgagt 4200 tatcgcgttt ggtttcgttt tggttatttt ttaatatgtt tttttataat tgttattttt 4260 atattagttt tgttttagtt tatgggaaat aaaattaatt agttttttta ttatttgttt 4320 tgaggagtag gggtggtgta gtggtatgta tttagggaag tgtgttgtat gggtttttaa 4380 gtgtagaatt tgaattttgt aaaggaagaa ataaattcgt ttttacggag tatgtttttt 4440 taggattttt agttttttaa attcgtagtt atagtgattt agtagaattt gagtttaggg 4500 tattatagta attcgtattc ggtttttttt ttgttttatt tcgtgttaag gttaaaaggg 4560 tatgtttatt tgatttttgg atttttttgg gacgattttt attttgtatt tttttgtatt 4620 ttagggtata gtgcgtagat gggtttgttt tagtattttt agttagattt ttgaggtttt 4680 tgttatatat atttttataa tttttttttt tagtttcgag agattttttt tgatttttat 4740 tagttgtttc ggcgggtgag agtggagagg tttttttttt attttttagg tttttttttt 4800 ttttggagtt gtagttttag tatttttcgt ttagtatttt aggatttagg cgttgggttt 4860 cgtttttgta ggttgtttat tttaaacggg tcggatagga tatataagag agaatgtatc 4920 gtgtattata tacgcgattt ttataaggtt gtagtcggag tcgtttagtt tatcgagagt 4980 ttagtttcgg ttagggtcgt ttcggtaatt acgagtttag ttaattagcg tttcggattg 5040 tattagagtt atggtcggtg agtgttgtaa agggcggggt gtttggcggt cgtttttcga 5100 gtattggtgt ttgtggagga ggttgtaggg gtttggtttt gaattttgtt ttttgattta 5160 aaatttataa agggaagaga ttagggattt gggatgagtt ttgatcggat ttcgggagaa 5220 ggagagtttt tgtttgtatt cggtgtcgcg gatttttttt tattttattt tacgaatttt 5280 agtgggtatt taggagaaat ttgattttgg aagtagaaat tttttttaaa attgtggtta 5340 gaaattggtc gttagaggtt aaattaggtt tacggttata gtttatattt tttttggttt 5400 atagtattta aaatattttg aaataagttg ttaatattaa aatgggtgat tttatttaaa 5460 aatgtggatt tcgagttttt gaagaaaatg agaatatttg gcgattggtg gataggagtg 5520 gaggaaattg atgtttttgg tttgacggag attagaatcg gttttaggtt gttaggtata 5580 ggttttgttt tgttttgttt tgttttgttt gagacggagt tttgtttttg tcgtttaggt 5640 tgtagtgtaa tggcgttatt ttagtttagc gaaattttcg tttttcgggt ttaagcgatt 5700 tttttatttt agtttttcga gtagttggga ttataggagt gcgttattat gcgcggttaa 5760 tttttatatt tttagtagag acgggtttcg ttaagttggt tagcgcggtt ttgaattttt 5820 gattttaggt gatttattta ttttagtttt tttaagtgtt gagattattg acgtgagtta 5880 tcgtgtttgg ttttgggagg tattttttat tgaggttttt ggattaggta aatttgatta 5940 gatcgtattg gattcgtttt tagtattggg tttattttag tgatagagtt tttttattcg 6000 gttatcgatt ttaggggaat ttagaggtta ttttagtttt atttaaggta taaataatta 6060 gttgagataa ttgtagggat tgagagttgt tttttaaata attttatttt gagattggat 6120 agtattaaga tttagaaagt tgttgtttta tttggggtag aattttgcgt tttgtaattt 6180 ttttttttgt ggatttggtt ttgtttttaa aaatgcgttt gtatataaag aagtttattt 6240 tggttaaagt gagtggagga atagattgtt tttgtagttg ataaattgaa attattagga 6300 tttttgagaa agggattaag ttggggattg gtagtttagt atgagttatt ggtagagata 6360 gtagggaata gattttgata gttgagaggt ttgtcgtata tacggtggtt gttgtttttt 6420 ttgtgtttta ttttttagcg tcgaggtatt ggtatttttt tttttaatat tagggtagga 6480 attatttttt gattttttaa ttttatagaa tgttttgtat ttacgtgtag tttaaatata 6540 aaaaagggcg gtggtaatga ggtgaaaagg gaagatttgg attttgtata attagtttta 6600 gttgtattta gttaattaaa ttttgaggtt aattaaagta tttaggattt ttgtttgtaa 6660 ttaatagatg tatttgattt gtatttatgt tttttggagt atttaagtga gaagagaagg 6720 tagaaggaga atgtatgaaa ttgatataaa ggtttatttt tattatattt tttttttttt 6780 ttttgagata gggttttgtt ttgttgttta ggttggagtg tagtggtatg attagggttt 6840 attttagttt tgattttttg ggtttaagtg attgttttat ttttgttttc gagtagttgg 6900 gattataggt gtgtgttatt atatttagtt aatttttttt ggttagagta gaagaatttg 6960 aaatttagtt aattaaaaaa aaaaaaaatt ttggttggga gtggtggttt atttttgtaa 7020 ttttagtatt tttgggaggt tgaggcggga ggattgtttg aggttaggag tttaagatta 7080 agatttagtt taaatggtaa gtttttttga gggttttttc gaatgggtta gttttgaggt 7140 tttgaagttt ttttttgttg aattttttga gatggagttt tatttatttt gttgtttagg 7200 ttgtagtgta gtggcgtgat tttggtttat tgtaattttt attttttagg tttaaacgat 7260 ttttgtgttg tagtttttta agtagttggg attataggcg tttattatta cgtttagtta 7320 attgtgtatt tttagtagag acggggtttt attatgttgg ttaggttggt ttttagtttt 7380 tgattttaag taatttattc gtttcggttt tttaaagtgt tacgattata ggtatgagtt 7440 attatattta gttttttgtt gaattttgtt ttttattttt tttaatatat taatgttatt 7500 gtattttgaa gaggttattc gtgtgtgtat tttgtggttt tttttagggt aaattttaat 7560 agtttaattt tttttaggtt atgttgttta gttagttaag tggtaggaag ggaaaatgaa 7620 ttttttaggg tttagaaaat ttttaaattg tttatttata agtatttttt tgtttgtttg 7680 tttgagatag aggtttgttt tgttgtatag gttggagtgt aatggtgcga tttcggttta 7740 ttgtaatttt cgttttttgg atttaagtaa tttttttgtt ttagtttttc gattagttgg 7800 gattataggt atttgttatt atatttggtt aatttttttt tgtattttta gtagagacgg 7860 ggttttatta tgttaattag gttggttttt aatttttgat atgaggtgat ttgttcgttt 7920 tagtttttta aagtgttgag attataggtg tgagttatcg cgatttattt ataatttttt 7980 tttgattatt ttttttttga gttgttttgg ggatttattt attttaggta ttgtattttg 8040 atggttatat ttgttgtaaa tatattattt ttgtttgtgt gttgttttat atgaaaaatt 8100 gtaaagttat aggtttgttt atagttatta gagtttgagt tttttgaaag agtaagagat 8160 ggatattttg atttgtttat tttttgagaa gtgttttgat tgttttatta tttagaaaat 8220 gtttgttaat attgatgaga agttaataaa ataaaaattg ttggttgggc gttgtggttt 8280 acgtttgtaa ttttagtagt ttgggaggtc gagataggcg gattacgagg ttaggaaatc 8340 gagattattt tggttaatac ggtgaaattt cgtttttatt aaaaatataa ttagtcgggc 8400 gtggcggcga gcgtttgtaa ttttagttat tcgggaggtt gaggtaggag aatggcgtga 8460 atttgggagg cggagtttgt agtgagtcga gatcgcgtta ttgtatttta gtttgggcga 8520 tagagcgaaa ttttgtttta aaaaaataaa taaataaaaa ttgttagagc ggcgattagt 8580 aaatattgat aagattaatg gtaaggtaag ttataaagaa aatgtttgtt agagttgaat 8640 atgtttattt tttttttaat tatgttaaat ttatgggtta aagaggtagg aatttgttga 8700 ggtagtttta gagttttttt tttttttttt taagttattt taagtaagtt aattattttt 8760 agcgtattga aattattatt agatatttat tttattgagt tttagtttta agagtttaaa 8820 attttaggat taagtttgga aattttttgg tttggtatat tgggttttga aagttatatt 8880 tcgttgaatt tagtttaaga ggtatttgtt ttgttagatg tggttaataa taaaagtagg 8940 aagagagttt aaggtttaaa tgtgtttttt tagttatttt agttattttt agttatttag 9000 atggtgtaaa aaagttgtag atgtcggttg ggcgcggtgg tttacgtttg taattttagt 9060 attttgggag gttaaggtag gtgggttatg aggttaggat atcgagatta ttttggttaa 9120 tatggtgttt ttattaaaat aaaaaatata aaaaattagt cgggcgtggt ggtacgcgtt 9180 tgtaatttta gttattcgga ggttgaggaa ggagaatcgt ttgaattcgg gaggtagaag 9240 ttgttgtaag tcgagatggc gttattgtat tttagtttgg gtgatagagt aagattttat 9300 ttttttcgtt tttattttta ttttgttaaa aaagttgtag atgttttttt ttttagtttt 9360 atttattgtt tatggtaggg tatgaagtag tagcgtatat tattaggagt aattgtgggg 9420 gtaagcgttt tttttttggt aattcgtttt atgtttttgt acgttgttgt ttgtattttt 9480 tattgtttgt aagttttatt gtcgtttagg ttggagtata gtggtgtgat tacggtttat 9540 tgtaattttt atttttttgg tttaaatgat ttttttattt tagtttttta agtagttggg 9600 attataggta tatattatta cgtttagtta attttttttt tttttttttt ttggtagaaa 9660 cggggttttt ttatgttagt taggttggtt ttaaattttt gggtttaagt aagttgtttg 9720 tttcggtttt ttaaagtgtt gggattatag gtgtgagtta ttacgtttag ttattttttg 9780 tgtttttaaa ttattttagt tttattattt aatgattata tatttgggta atttgttttt 9840 tttttgtgtt ttagtttttt tatttgtaat atggggttat ttatggtatt gattttatag 9900 ggtgtgtttt agtttatttt gtgttgttat atataatatt tgggattagg tagttaataa 9960 aaaagagaaa ttgatttttt atagttttgg aagttgggaa gtcgaagatt aaggtgttgg 10020 taggtttggt tgtttggtga gagttgtatt tggaggaatg ttgcgttttt atatagacgg 10080 tgggaggtag aaggtggaag ggtaggtgag tttcgtgttg ggcgaagttt tttttatgag 10140 ggttttaatt ttatttatga ggaaggagat tttttcgttt aattatttat tataggtttt 10200 atttgttaat ttttttatat tggtagtatt tgaattttgg agggggatac gtttaaaata 10260 tagtaggttg ttttgataaa ggaagaaagt gtaggtcggg cgtggttgtt tatatttata 10320 attttaatat tgtaggaggt tgaggtaggt aaaattgttt tagtttgggt aatacggttt 10380 taaatttgat tagtttgggt aatatggtaa atttttgttt ttataaaaaa aaaaaaaaaa 10440 ttaggtgtgg tggtgtatat ttgtagtatt agttatttag gaggttgagg tgggaggata 10500 gtttgagttt gagaggttaa ggttgtagtg atttgagatt atgttattgt attttagttt 10560 gggtaataga tcgagatttt gttttagaaa gagaaaaaga aaaaaaagga atgtaaagta 10620 tttagggtag tgtttagtat taaggattta ttaaatattg tttttgtaaa ttgaagtatg 10680 ttgtttttga taattttgtt aatataaaag aggtttattt tttttttatt tgtatttttt 10740 tgttattttt tataaaggaa gttgagttgt taatagttta atgtgattgg tttggtacgg 10800 tggtttatat ttgtaatttt agttattggg gatgttgagg taggagaatc gtttgaattt 10860 gagaggcgga ggttgtagtg agtcgagttt atgttattgt attttagttt gggtaataga 10920 gtgagattgt taaaaaaaaa aaaaagttta atgtgattat tgtatatttt ttttttttat 10980 attaaggtgt tgtaagttta tatataaata tatgttattt tttttttttt tttttttttg 11040 tatttttttt tttttttttt tttttttttt tttttttttt ttttattttt tttattttaa 11100 ataaaaatgg gtttatattt atttgttttt ttattagtta ataatatagt atggatattt 11160 ttttgagtta ttatatatag ttaatttatt ttaatttttt taatttttaa aatttgttta 11220 tttgagatag ggtttttttt tgttatttag gttggagtgt agtgcggcga ttacggatta 11280 ttgtagtttt aattttttgg gtttaagtga tttttttatt ttttagtttt ttgagtagtt 11340 gggattatag gtatatatta ttatgtttag ttaatttttg tacgttttgt agagaaggga 11400 tttcgttttt gttatgttgt ttaggttggt tttgaatttt tgggtttaag taatgttttc 11460 gttttggttt tttaaagtgt tggaattaga agcgtgagta atcgtatttg gttaatagtt 11520 tttaaaaatt tttttttatg ataaggtgtt attatgttgt ttatgttggt ttttattttt 11580 tggttttaag ggattttgtc gttttagttt tttaagtagt tggattatag gttttagtta 11640 ttgtgtttag ttagtttaat ttattttttt ttatatattt tttattttta ttttaattta 11700 tttatttttt tgagataggg ttttattttg ttatttaggt tggagtgtag tggtaagatt 11760 ttagtttatt gtaatttttg ttttttgggt ttaagcgatt tttttgtttt aggttttcga 11820 atagttggga ttataggtgt tcgttattat atttagttaa tttttgtatt tttgtagaga 11880 tagggtttta ttatgttggt taggatggtt ttgatttttt gatttcgtga tttgttcgtt 11940 ttagtttttt aaagtgttgg gattataggt tcgagttatc gtgtttggtt aatttatttt 12000 tgttaatagt aaaatatttt gtagtgtgga tgtatttata attttttaaa atgtttttta 12060 tagataatta ggttatattt aatttttgtt agtgaaaagt atggtgtaat atatattttt 12120 gtttttatag tttgaagttt ttagtttgta gaatagattt ttttaaattg gagagcgaga 12180 taaaagattt atgtgttttt aaagttttaa gagattttgt tttattattt tttttaaagg 12240 ttgaggtagt ttttattttt attagtaagg tgttaatttt tttgttggta taattttaat 12300 aattttgggt gttatttgtt ttatattttg tgggtaaatg taaatttacg gtaaatgtaa 12360 atatagtatt tatgtaaacg aatgggtaaa tgttttattt taattttgtt ttttttgata 12420 ggttacgtag agtatttttt tttttttttt tgagacggag ttttttattg tcgtttaggt 12480 tggagtgtaa tggtgtaatt ttggtttatt gtaatttttt tttttcgagt ttaagtgatt 12540 tttttgtttt agttttttaa gtagttggga ttataggtgt ttgttattat atttagttaa 12600 tttttgtatt tttagtagag atagggtttt attatgttgg ttaggttggt tttaaatttt 12660 tgattttagg tgatttgttc gttttggttt tttaaagtgt tgggattata gttatgagtt 12720 atagagttta gttgttaata ttatttatta aattagttat tgatttaaat gtttttttta 12780 atttttagtg tttttaaggg gaaaatatat ttttggttat aggagatgga atgtataatt 12840 taatgttaaa taaagtcgtt ttttttttta tagattgtaa tttttttgta gttgaaggtt 12900 tgttggttgg taatgggttt tttttgtgtg ttttgtgtgt gtttttgtag g 12951 12 12951 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 12 tttatagaga tatatataaa gtatataggg aaaatttatt attaattagt aaatttttag 60 ttatagggga gttgtagttt gtaaaggagg gggcggtttt gtttgatatt aggttatgta 120 ttttattttt tgtagttaga aatgtatttt ttttttaaaa gtattgaaga ttaaaggaag 180 tatttaaatt agtggttgat ttaataaata atgttgataa ttgggttttg tggtttataa 240 ttgtaatttt agtattttgg gaggttaagg cgggtagatt atttgaggtt aggagtttga 300 gattagtttg gttaatatgg tgaaattttg tttttattaa aaatataaaa attagttggg 360 tgtggtggta ggtatttgta attttagtta tttgggaggt tgaggtagga gaattatttg 420 aattcgggag ggggaggttg tagtgagtta agattgtatt attgtatttt agtttgggcg 480 ataatgggag atttcgtttt aaaaaaaaaa aaaaagatgt tttgcgtgat ttgttaggaa 540 aagtaaaatt aaaatgagat atttatttat tcgtttatat gggtattgtg tttatattta 600 tcgtgagttt atatttattt ataaaatgta aaataaataa tatttagggt tattaagatt 660 gtattaatag aaaaattggt attttattgg tggggataag aattgtttta atttttaggg 720 aaagtaatga ggtagaattt tttgaaattt taaagatata taaatttttt atttcgtttt 780 ttaatttggg ggaatttgtt ttatagatta aaagttttag gttataagag taaagatgtg 840 tattatatta tgttttttat tggtaaaaat tagatataat ttgattgttt atggggaata 900 ttttaagaaa ttatgggtat atttatatta taggatattt tgttgttaat aagaatgagt 960 tggttaggta cggtggttcg agtttgtaat tttagtattt tgggaggttg aggcgggtag 1020 gttacgaggt taagagatta agattatttt ggttaatatg gtgaaatttt gtttttataa 1080 aaatataaaa attagttggg tgtggtagcg ggtatttgta attttagtta ttcgggagtt 1140 tgaggtagga gaatcgtttg aatttaggaa gtagaggttg tagtgagttg agattttgtt 1200 attgtatttt agtttgggtg atagagtaag attttgtttt agaaaaataa ataaattaag 1260 ataaaagtaa aaaatatata aaaaagaatg agttaaattg gttgggtata gtggttggag 1320 tttgtaattt agttatttgg aaggttgagg cggtaagatt ttttgaggtt aggagatgga 1380 gattagtatg ggtagtatag tgatattttg ttataaaaaa aaatttttag agattgttga 1440 ttaggtacgg ttgtttacgt ttttaatttt agtattttgg gaggttaagg cgggaatatt 1500 gtttgagttt aggagtttaa gattagtttg ggtaatatga taaaagcgaa attttttttt 1560 tataaaacgt ataaaaatta gttgggtatg gtggtgtatg tttgtagttt taattattta 1620 ggaggttgag agatggaagg attatttgaa tttaggaggt tgaggttgta gtgattcgtg 1680 atcgtcgtat tgtattttag tttgggtgat agagggagat tttgttttaa ataaataaat 1740 tttaaaaatt aaaaaaatta aaatgaatta attatatgta gtgatttaaa aagatattta 1800 tgttatatta ttaattgata aaaaagtaag tgaatatgaa tttattttta tttaaaatga 1860 aagaagtgag aggaagggag agagggaagg gaaggaagaa aaaagaaaat ataaaaaaaa 1920 aagaaaaaaa gaaatgatat atatttgtat gtagatttgt agtattttgg tatgaggggg 1980 aaaaatgtgt agtgattata ttaaattttt tttttttttt gatagtttta ttttgttgtt 2040 taggttggag tgtagtggta tgaattcggt ttattgtaat tttcgttttt taggtttaag 2100 cgattttttt gttttagtat ttttagtagt taggattata ggtgtgagtt atcgtgttag 2160 gttaattata ttaaattatt aatagtttag ttttttttat aagaaatggt aaagaggtat 2220 aggtagaagg gaaatgggtt ttttttatat taataaggtt gttagaggta gtatgtttta 2280 atttgtaaga atagtattta gtggattttt agtgttaggt attgttttaa gtgttttgta 2340 tttttttttt tttttttttt ttttttgaga tagggtttcg atttgttgtt taggttggaa 2400 tgtagtggta tgattttagg ttattgtagt tttgattttt taggtttaag ttattttttt 2460 attttagttt tttgagtagt tgatattata ggtgtgtatt attatattta attttttttt 2520 tttttttgta gagataggga tttgttatgt tgtttaggtt ggttaaattt ggagtcgtgt 2580 tgtttaggtt ggggtaattt tgtttgtttt agttttttat agtgttggga ttataggtgt 2640 gagtaattac gttcggtttg tatttttttt ttttgttagg ataatttgtt atgttttaaa 2700 cgtgtttttt tttaaaattt aggtgttgtt aatgtgagag gattaataga tggggtttgt 2760 gataggtgat taggcgaggg ggtttttttt tttatgagtg ggattaaggt ttttataaaa 2820 gaggtttcgt ttagtacggg gtttatttgt ttttttattt tttatttttt atcgtttatg 2880 taaggacgta gtattttttt aaatgtagtt tttattagat agttaaattt gttagtattt 2940 tgattttcga ttttttagtt tttagaattg tgagaaatta attttttttt tttattaatt 3000 atttagtttt aagtattatg tatggtagta taaaatagat tgagatatat tttatgaggt 3060 taatattatg agtagtttta tgttatagat gagaaaattg aggtatagga gagaagtaag 3120 ttatttaagt gtgtagttat taagtggtga agttggaata atttaaaaat atagagagtg 3180 gttgggcgtg gtggtttata tttgtaattt tagtattttg ggaagtcgag gtaggtagtt 3240 tgtttgagtt taggagtttg agattagttt ggttaatatg gagaaatttc gtttttatta 3300 aaaaaaaaaa aaaaaaaaaa ttagttgagc gtagtggtgt gtgtttgtag ttttagttat 3360 ttaggaagtt gaggtgggaa gattatttga gttagggagg tggaggttgt agtgagtcgt 3420 gattatatta ttgtatttta gtttgggcga tagtgagatt tataaatagt gagaaatata 3480 aataatagcg tataagggta tagagcgaat tgttagagaa aggacgttta tttttatagt 3540 tgtttttgat aatgtgcgtt gttattttat attttattat gaatagtggg tggagttggg 3600 agagaaggta tttgtaattt ttttggtagg gtgggggtgg gggcggggga gatggagttt 3660 tgttttgtta tttaggttgg agtgtagtgg cgttatttcg gtttatagta atttttgttt 3720 ttcgggttta agcgattttt tttttttagt tttcgaatag ttgggattat aggcgcgtgt 3780 tattacgttc ggttaatttt ttgtattttt tgttttagta gagatattat gttagttagg 3840 atggtttcga tgttttaatt ttatgattta tttgttttgg ttttttaaag tgttgggatt 3900 ataggcgtga gttatcgcgt ttagtcggta tttgtaattt ttttgtatta tttgaataat 3960 tagaaataat taaaataatt agaaaggtat atttaaattt taagtttttt ttttgttttt 4020 attattgatt atatttagta aggtaagtgt tttttgggtt aaatttagcg aagtgtaatt 4080 tttagggttt aatatgttaa attaggggat ttttaaattt ggttttaggg ttttggattt 4140 ttaaaattaa gatttagtgg aataggtgtt tggtgatgat tttaatgcgt tggaagtgat 4200 tgatttgttt gggatagttt ggaaaaagga aaaggaagtt ttgaggttgt tttaataaat 4260 ttttattttt ttaatttatg gatttaatat gattgggagg gaagtgagta tatttagttt 4320 taataggtat tttttttgta atttattttg ttattagttt tattaatgtt tattgatcgt 4380 cgttttgata gtttttgttt gtttgttttt ttgagataga gtttcgtttt gtcgtttagg 4440 ttggagtgta gtggcgcgat ttcggtttat tgtaagtttc gttttttagg tttacgttat 4500 ttttttgttt tagtttttcg agtagttggg attataggcg ttcgtcgtta cgttcggtta 4560 attgtatttt tagtagagac ggggttttat cgtgttagtt aggatggttt cgattttttg 4620 atttcgtgat tcgtttgttt cggtttttta aattgttggg attataggcg tgagttatag 4680 cgtttagtta atagttttta ttttattgat tttttattaa tgttaataag tattttttaa 4740 gtagtaagat agttaaggta ttttttagaa aatgagtaaa ttaggatatt tattttttgt 4800 ttttttaagg agtttagatt ttaatagtta taagtaggtt tgtgatttta taatttttta 4860 tgtaaggtaa tatataagta ggaataatat atttgtaata aatataatta ttaaagtgta 4920 gtatttggaa taggtagatt tttaaaataa tttaaaagaa aaatgattaa aagaaggttg 4980 tgggtgggtc gcggtggttt atatttgtaa ttttagtatt ttgggaggtt gaggcgggta 5040 gattatttta tgttaggagt tagagattag tttggttaat atggtgaaat ttcgttttta 5100 ttaaaaatat aaaaaaaaat taattaggtg tagtggtagg tgtttgtaat tttagttaat 5160 cgggaggttg aggtaggaga attgtttgaa tttaggaggc ggaggttgta atgagtcgag 5220 atcgtattat tgtattttag tttgtgtaat agagtaagtt tttgttttaa ataaataaat 5280 aaaaagatgt ttgtgaatag gtaatttaaa agttttttgg gttttggagg gtttattttt 5340 tttttttgtt atttaattag ttgagtaata tgatttggga ggagttagat tattagagtt 5400 tattttgaga gaggttataa gatgtatata cggataattt ttttagggta taatggtatt 5460 agtgtgttag gagaggtaag ggataaagtt taatagaagg ttgggtgtgg tggtttatgt 5520 ttgtaatcgt agtattttgg gagatcgagg cgggtggatt atttgaggtt aggagttaga 5580 gattagtttg gttaatatgg tgaaatttcg tttttattaa aaatatataa ttagttgggc 5640 gtggtggtgg gcgtttgtaa ttttagttat ttgggaggtt gtagtataag aatcgtttga 5700 atttgggaag tggagattgt aatgagttaa gattacgtta ttgtattata gtttgggtaa 5760 tagagtgagt gagattttat tttaaaaagt ttaatagagg aaaattttag gattttaggg 5820 ttggtttatt cggaaaggtt tttagaggag tttgttattt gagttgaatt ttggttttga 5880 atttttggtt ttaagtagtt ttttcgtttt agttttttaa aagtgttggg attataggaa 5940 tgagttatta tttttagtta aaattttttt tttttttaat tagttgggtt ttaagttttt 6000 ttgttttgat taaaaaaaat tagttgggtg tggtggtata tatttgtagt tttagttatt 6060 cgggggtaaa gatgggataa ttatttgagt ttaggaggtt aaggttgaag tgagttttga 6120 ttatgttatt gtattttagt ttgggtaata aagtaagatt ttgttttaaa aagaaaaaaa 6180 gaagtatgat aaagataagt ttttgtatta gttttatgta tttttttttt gttttttttt 6240 tttatttgag tgttttaggg aatatgagtg taaattagat gtatttatta gttgtaaata 6300 aaaattttgg atgttttagt taattttaag atttggttag ttgggtatag ttaaaattaa 6360 ttatataaga tttaagtttt ttttttttat tttattatta tcgttttttt ttgtgtttaa 6420 gttatacgta aatatagaat attttgtaag attgaaaagt taggaaatag tttttgtttt 6480 agtattggag gagagggtgt tagtgtttcg acgttgaaga atgaaatata agggaaatag 6540 taattatcgt gtatgcggta agttttttag ttgttagaat ttattttttg ttgtttttgt 6600 tagtaattta tgttgggtta ttaattttta gtttagtttt ttttttagag attttgataa 6660 ttttagtttg ttaattgtaa gggtagtttg tttttttatt tattttgatt aagatgggtt 6720 tttttgtgta taggcgtatt tttagaggta ggattaggtt tatagggaag gaaattataa 6780 aacgtaggat tttgttttag atgaggtaat agttttttaa attttagtat tgtttaattt 6840 tagagtgaga ttatttggga aatagttttt aatttttgta gttgttttag ttggttattt 6900 atgttttggg tggagttggg gtgatttttg agttttttta gggtcgatgg tcgagtggga 6960 aggttttatt attgaagtgg atttaatatt agaaacggat ttagtacgat ttgattaggt 7020 ttgtttaatt taagggtttt aatggaaaat gttttttaag gttaggtacg gtggtttacg 7080 ttagtaattt tagtatttgg ggaggttgag gtgggtggat tatttgaggt taggagttta 7140 agatcgcgtt ggttaatttg gcgaaattcg tttttattaa aaatataaaa attagtcgcg 7200 tatgatggcg tatttttgta attttagtta ttcgggaggt tgagatggga gaatcgtttg 7260 aattcgggag gcggaagttt cgttgagttg agatagcgtt attgtattat agtttgggcg 7320 ataagagtaa aatttcgttt taaataaaat aaaataaaat aaaataaaat ttgtgtttgg 7380 tagtttggag tcggttttgg ttttcgttaa attaaaggta ttagtttttt ttatttttgt 7440 ttattaatcg ttagatattt ttattttttt tagaagttcg gaatttatat ttttaagtga 7500 aattatttat tttaatgtta gtaatttatt ttaaagtgtt ttagatatta tagattaaaa 7560 gaggtatggg ttgtgatcgt aagtttgatt tggtttttga cggttagttt ttgattatag 7620 ttttggaggg aatttttgtt tttaaggtta agtttttttt aaatgtttat tagagttcgt 7680 ggggtggagt gaggaaggat tcgcgatatc ggatataaat agaagttttt tttttttcgg 7740 agttcgatta aggtttattt taggttttta attttttttt tttgtgggtt ttgagttaag 7800 gaataaaatt tagggttaag tttttataat tttttttata ggtattagtg ttcgagagac 7860 gatcgttaag tatttcgttt tttgtagtat ttatcgatta tggttttggt gtagttcggg 7920 gcgttgattg gttgggttcg tggttgtcgg ggcgattttg gtcggaatta ggttttcggt 7980 gagttgggcg gtttcggttg taattttgtg ggagtcgcgt gtgtagtgta cggtgtattt 8040 ttttttatat attttgttcg gttcgtttga ggtggatagt ttataagggc gggatttaac 8100 gtttgaattt tggggtgttg ggcggaggat gttgaggttg tagttttagg aagggaggga 8160 gtttggggga tgaaggaggg gtttttttat ttttattcgt cggagtaatt ggtggaagtt 8220 aagaaaagtt tttcggggtt gggggagggg attgtagggg tgtgtgtgat agaggtttta 8280 aaaatttggt tgggggtgtt aaggtaagtt tatttgcgta ttgtgttttg aggtgtaaga 8340 ggatgtaggg tggaagtcgt tttaagagag tttagggatt aagtgggtat gtttttttag 8400 ttttggtacg aaatggagta gaaaaagagt cggatgcgga ttattgtggt gttttaggtt 8460 tagattttgt tgagttattg tgattgcgga tttggaaggt tgagagtttt ggggagatat 8520 gtttcgtgga gacgaatttg tttttttttt tgtaagattt agattttgta tttgggggtt 8580 tatataatat atttttttgg gtgtatgtta ttgtattatt tttgtttttt aaggtaggta 8640 atgggggaat taattggttt tgttttttat gagttaaggt aaggttggtg tggagatagt 8700 agttataggg aagtatatta aagaatagtt aaaacgggat taggcgcggt ggtttacgtt 8760 tgtaatttta gtaatatggg aggtcgaggt gggtggatta tttgaggtta ggagttcgag 8820 attagtttgg ttaatttggt gaagtttcgt ttgtattgaa aaattagttg ggcgtgatgg 8880 cgggcgtttg taagttttag ttattcggga ggttgaggta ggagaatcgt ttgaattcgg 8940 aaggcggagg ttgtagtggg tcgagatcgt gttattgtat tttcgtttgg gtgacgaagt 9000 gagatttcgt tttaaaaaaa attttataaa gtaaaagtta ttgtaaagaa ggagatatat 9060 ttttagtagg tgaaggaaaa agaattagag ttttaaagtg gtaattaatt attagaagaa 9120 ttatagatgg gggaggtgag gatgatatag ggttttttcg ttgttttttt agtgtaaaag 9180 ttaaggaggt attagaaaat tggtttttaa ttttcgattt taggtgattt tatcgtttcg 9240 gtttttcgaa gtgttgggat tataggtatg agttatcgcg ttcggtttta tcgtgatatt 9300 tttgtattta ttttgatgta ataagagagg attatattat ttatacgtat ttataaatta 9360 ttttgggagg ttgaggtagg aggattattt gagtttaaga gtttgagaaa agtttgagta 9420 ataaagtgag attttatttg ataaaatagt ataaaaggac gttttaaaaa agggttaggt 9480 aggtagtttt gtttaataga atttttttta tttgtgttgt ttaagtaagg tagttataag 9540 ttttaagtag ttattgagta ttggaaatgt ggttagtagt taggcgtggt ggtaggcgtt 9600 tgtgttttag ttatttagga tttgaggtaa aaagatcgtt tgagtttagg aatttaaggt 9660 cgtagtggtg gatttaataa aagaaaaaaa atggaaatta aaaaaaaaaa agtggttagt 9720 ggattgagga agtgaagttt taattgtaat taaattaatt ttttaaaaat ttattttttg 9780 aggcggggtt ttattgtgtc gtttaggttg gagtgtagtg gtaggatttt ggtttattgt 9840 aatttttatt ttttgggttt aagtaatttt tgtgttttag ttttttgagt agttaggatt 9900 acgggtatgt attattatag ttagttattt tttgtattat tcgtagagat gagttttatt 9960 atgttagtta ggttggtttt aaatttttga ttttaggtga tttgtttatt tcggtttttt 10020 aaagtgttag gattataggt atgtgttatt gcgtttggtt ttaattaaat ttagatagtt 10080 atatgttatt agtgtttgga aagatttgag ttggtttaga tcgaggtcgt agtgtgttgg 10140 ttattttatt ttttattttt ttagtgagat tgttttttta attattagtt tttttgattt 10200 atttagaggt ggggtttaaa gttataaagt ttaagtgtcg tgttcggtcg ttggttttta 10260 gtatggttag tttttatttt tagttatttt gttaatatga attatatagg ggtttatttt 10320 aagttatttt attagtataa attattagga gtggtttgag aagtttataa tgaataagat 10380 ggatattttt attatttggg atttaggggt ttaggggtat gatgatagtt tattgtagtt 10440 tcgatttttt ttttttttat tgagtttatt attgcggttt tgaatttttg ggtttaagcg 10500 atttttttgt tttagatttt gagtagttgg gatataggcg tttgttatta cgtttggttg 10560 ttggttatat ttttagtgtt taatagttat ttgaagtttg tggttatttt atttgggtag 10620 tatagatagg gaaagtttta ttggataggg ttgtttattt agtttttttt taaaacgttt 10680 ttttatatta ttttgttaga tggggtttta ttttgttgtt taggtttttt ttaaattttt 10740 gggtttaagt aatttttttg ttttagtttt ttgagtagtt gagatgatag gtgtatgtta 10800 tcgtgtttgg ttaatttttt tttatttttt tggtagagat agggttttat tatgttgttt 10860 aagttggttt taaatttttg ggtttatgtg attttttcgt tttgattttt taaagtgttg 10920 gagttatagg tatgtgttat tatttttggt taaatttgtt attatatagt ggtaaagata 10980 gatatttgag gtggtagtga attaagatta tgttattgta ttttagtttg ggtaatagag 11040 ggagattttg ttttaaaaga aaaaaagaaa tttattggtc gggtatagtg gtttaggttt 11100 gtaattttag tattttggga gattgaagcg ggtggattat ttgagtttag gaattggaga 11160 ttagtttggt taatgtggtg aaatttcgtt tttattaaaa atataaaaat atgagttggg 11220 tgtggtggtg ggcgttttta gttttagtta ttcgggaggt tgaggtacga gaatcgtttg 11280 aatttaggag gtagaggttg tagtgagttg agattgtgtt attgtatttt agtttgggta 11340 ataagagcga gattttattt taagaaaaaa agaaaaagaa aaagttgttg tggagtatgg 11400 gcgagtattg ttgtttggat aaagatcgag ggttttcggg agggtagtat tgatgtatag 11460 gtttttagta ggtcggcgtg tgtgtttttt tttgtaggtt tgtagttagg cgtgttagga 11520 gagggggagt ttgagggatt gatgtaggtt gggaaagtat gatgagagga gatagagtgg 11580 gggttgtgaa gaagagagcg atttgatggt ggcggtagtt atataggtgt atgtatttat 11640 taaaattcgt tgaaaagtat attttaaata taagtatttt attgtatgta tgttattttt 11700 taataaagtt tatttttaaa aagtagagtg gttggagtga tgacgaatat tatgaaaggg 11760 tttattggta gagaaaaagt agaggggttt agagatttaa gtttttaagg aggttgaagt 11820 aagagtgggg gattaaataa gggtaaaaat tgagagaata aaaaaagtgg gttgtttggg 11880 gttaggtgcg gtggtttata tttgtaattt tagtattttg ggaggttaag gtagggggat 11940 cgtttgagtt taggagttta agattagttt gggtaatata gtgagatttt ttttaatttt 12000 ttttattttt gttattttta aaaaaattaa aaattagtta ggtgtggtgg tgtgtatttg 12060 tggatttagt tatttaggag gttgagatgg gtggattatt tgagtttggg aagtcgacgt 12120 tatagtgagt tgtgattgta ttattgtatt ttaatttagg tagtatagtg atattttatt 12180 taaaaataaa aagaaaaaat aaaaatttaa gtgggttgat tgggaaatat aggagataga 12240 agttaaaatt atggggaaat attagttaaa ttatagtgtg ggatatttta taggataatt 12300 aatttggttt attttataat ttagtgttat aagaaaaatg aaggagtgta tattgattag 12360 gattttttag agaaatagaa ttaattgaat ttttataaat atataaaaag taatatattg 12420 ttgggtgtag ggtttatatt ttgtgatggt taataatgag tgttaatttg attggattga 12480 aggatgtaaa gtattgattt tgggtgtgtt tgtgagggcg ttattaaagg aggtgaatat 12540 ttgagttagt gggattggga agggcggatt tatttttaat ttgggtgggt attaattaat 12600 tagttgttag tgcggttaga atataaagta ggtagaaaaa cgtgaaaaga ttagattagg 12660 tttggtgtcg tggtttacgt ttgtaatttt agtattttgg gaggtcgaga cgggtggatt 12720 atttgaagtt aggagtttaa gattagtttg gttaatatgg taaaatttat ttttgttaaa 12780 aatataaaaa aatttagttg ggtgttgtgg tgtatgttta taatgttagt tatttaggag 12840 gttgaggtag gagaatagtt tgaatttagg aagtagaggt tgcggtgagt cgagattata 12900 tcgttgtatt ttaatttggg tgatagagat ttattttatt aaaaaaaaaa a 12951 13 8451 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 13 gacggagttt tattatgttg gttaggttgg ttttgaattt ttgattttag gtgatttgtt 60 tattttggtt tttaaagtgt tgggattata agtatgagtt attacgtttg tttttaagta 120 tattttttta gtttattttt tttagtatgt aatttataga agggtaattt gaattgtaaa 180 tacgattttt aagttaaaat ttttgggtta gttcgtgatg aagtagtaat ttataaaaga 240 gatagtatag taataaatga gataattata ttcggaaatg tggaattatt aatttttatg 300 cgaaaatagt ttatgagatt tttgtgtttt tttatttatg ttatgcgttt ttttattttt 360 attttatttt attttatatg tttttttttt tgtttggatt atttttattt tattattatt 420 ttttttttgg taaattttta tttatattta aaaattttgt ttaatgattt tttttttgtg 480 aaaattttgt ggtaaaattt aattattttt gtttgtgtat attttttttt tatttgtgtg 540 tatatagtat gtgtttataa ttggaagggt gtttatttgt tattcgtttg tttgttttgt 600 taaagtgtga gtttttatag ttatagggtt gtgtgttagt tttggtgttt gtatagtatt 660 tagttagtag ttatatttag tgttgttgaa ttaatttttg gtttaaaaat atgtttatat 720 ttgttttttt aaggcgttaa tttaaatttt ttatttattt taaaaaataa ataatttttt 780 ggtattttaa aaattatatt taaataatag aaaaagagtt tatttgaatt ttaagtatta 840 attttaaaat gaattgtatg ttttaaaatt tgatttagtg atattattta agagaatttt 900 taaaaagtaa atttttattt ttattttagt gtaataaata ttaagtttta ttaaattatt 960 aaattgattt attttttttt ttttttttga gatggagttt tgttttgttg tttaggttgg 1020 agtttagtgg ggtaatttcg gtttattgta attttcgttt atttaggttt aagcgatttt 1080 tttgttttag tttttcgagt agttgggatt ataagtgtat attattatat ttagttaatt 1140 tttgtgtttt tagtagagac ggggttttat tatgttggtt aggttggtta cgaatttttg 1200 atttaaagtg atttgttcgt tttggttttt taaagtgttg ggattatagg tgtgagttat 1260 tatatttagt ttgtttttta ttttttggtt tttttttttt tttttttttt tttttgagat 1320 aggttttttt ttttaggttg gagtgtagtg attatagttt attgtagttt taattattgg 1380 ggtttaagta atttttttat tttagttttt cgagtagttg ggattttagg tatgtattat 1440 tatgtttggt taattttttt ttattatttg tggagatggg gttttgttat gttgtttagg 1500 ttggttttaa atttttgggt ttaagtaatt tatttgcgtt ggttttttaa agtgttggga 1560 ttataggtga tttatttttt aattgtgtta aagaataaag tatttatttt atttgttttt 1620 ttgtatttaa aatggttttt tatattttag atttagaaag ataaatataa gtaaattaat 1680 aagtatttta tttgtattat ttgttgtttt ttaatagttt atatttagtt tatttttgaa 1740 gggtaaagat tattgattgt ttatttaatt tttttatttt gaatttagtg agattttttt 1800 ttatttttta taaatgtatg tttaaaattt gattttagtg tagaattgga attaaaatgt 1860 atgtaatttt attttttata gtaggagtta aatgtttatt aagttttttt ttgagtttag 1920 tattttgtag ttaaatgatt attatttttt agttacgttt ttaaaaaaaa ttatgttggt 1980 ttgtaataaa aattgtattt tttttattag gtaagtgaat tattttgttg ggaagagtat 2040 tttggtttcg agaaaaaaat gattttattt tgaaaggttt tttttttaat ttttttttgt 2100 ataaattttt agtttagtaa tttgttagta ttttggaaaa gtgtattata aaataaaaat 2160 tcgaattaga taaaatatat ttttggaatt tttgaggtag attaatgaag ttttgatttt 2220 aggtgttagt aaaataaagt aggtattttt attttgtatt gttttatttt ttagtttttt 2280 atggtgtttt ttaaattttg atgttttgaa gaagttttaa tgtttgttat attagtagga 2340 gttgattata gggaagagat aaatatagtt ttttttggaa aggtgaaggt ttagttatta 2400 gaattttgtt ttttgatgtt gagaatgtat ttttttcgaa tagatggaaa agaggggtgg 2460 agattatttt agggatatat tttgtaaaat gttgatattc gaagatgtat atagttttgt 2520 gttttggtta tttttttaaa ttatgttttt ggtgaaggta tatggagagg agagtagatg 2580 ttgttagatt acggtgtttg acgttatgta tttttttacg tttagtttgt ttatgtgtat 2640 acggttgtag cgggattttg gggtgtgggt taaataataa gaataggggt ttttttgggg 2700 tttgttataa ggtagagatg ttttacggta attagggatt taggggaaga ggaaggaata 2760 tatatgttga taataagtag tttaatatta ttatttttat tttatagatg tagttattga 2820 gtttagagag gttttataat ttgtttagag ttttttaatt agtaaatagt ggagtcgaga 2880 tttgaacgat ttaaagagga aagtaaataa gtagtttttt tattattttt tttttttttt 2940 aagatgaggg ttttgttatg ttgtttaggt tgatattgaa tttttggtta taagtgattt 3000 attattttgg ttttacgaag tattgggatt atagttatga gttattatat tgggttaaag 3060 ttttcgtatt gtaattttta agatgttttt atttttaaag ttaaaggttg ttagagttgt 3120 tgttttgtag ggagttatgg gatggggagt tttcgggaaa tttaggttgg ttttttaaat 3180 ggtattattt aagttggtta ttaagttttt ttagatttag ttattcggtt tttttttttt 3240 ttggttgtag agtaggggtt tggattcgag gttgttgagt ttttttttag tttttatgtt 3300 tagtggtagt gatttattaa ttggtttatt cggtggatgt aggggtgatg tagttttgtt 3360 ttgttttttt gagtgttggg tggttatgag agagggaggt tatgagaggg aggggagggt 3420 ttttatttgt ttagtgttat ttttttttta gtttatttta ggttttttgt cgttttgggt 3480 ttttgcgtga gtagtttttt ttattttggg cgatgttcgt ttttattagt ttaattttaa 3540 gaagtttatt ttggggagga tagagggagt ttttacggtt ttatattttt atgttttgtc 3600 ggagatttgg ttaggtagag tggtgttttt ttgattgagt ttcgagtttt tgtttttttt 3660 ttattttata taaagtcgta gttttggcga gggagtttag aggtttgagg atagtttgtt 3720 gggtgtttgg tattttttag attttttttg tttgggcggt gggtatttgt aatttttttt 3780 gtttcgaatt gtagtagaat gtgtgggtag ggttaggtag atagagagtg ggtgtttgga 3840 tttattggtt agattttaag atcgtttatt ttcgtcgttt tcgtagtttt ttttaggatt 3900 ggttgattta ttagataggg gagggtgttg ttttttatta ttatattttt tgagaaaagt 3960 tatgtaggtt tgggagacgt ttgtgtttta ggagtttttt ttggtttgaa gatttaaggt 4020 tgtaaatagg tgttgagagg gaataagaag gggagttggg gtgtaatata tttagtgata 4080 gattaggagt gagtgttgtg gttatagatt ttaattttta taattgtagt gtgatttagg 4140 ttaagttttt tgtttatttc gatttttgtt ttaaataagt gaaaaggaaa gttaagtttg 4200 atgagttgtg gttttttagt gggtggattt gtatgtatta tggattatat ttattagggt 4260 ttaggaattg ttaagcgttt agtaggttgt tattaggttt tcgagttttt tcgttaggcg 4320 gttttatttg gagtaagagg aaagtaaagg tttgaggttt agttaagagg gcgttatttt 4380 gtttggttag tttttcgata aagtagacgg gggggtgtgg agtcgtggtg atttttttcg 4440 ttttttttag ggtgggtttt ttgggtttgg gttggtggaa gtgaatattg tttgtagtaa 4500 gaagaaggat tgtttatgtg ggagcgtaag gcggtagcgg ggttggaaat ttatttttat 4560 atagttaata tttgttgtta tattaggtta attaagaata tttttttttg gtgtattaat 4620 tatttgttat taaataaagg gttgttatta ggtggtaaag taatatattg tagtagagtt 4680 tatttgtaat ttgagattag tggttgtaag gtattatttt tgagttaagt aagtattaat 4740 atttttgtta ttttaattag aatgtaagag atcgtgtttt taaaattttt tttgaatttg 4800 ttattttgtt tttttttttt tgggtgatat atttggtagt gttggtgggg gttattataa 4860 tgttttttgt tttagatttt ttttttttag atgggattcg agtattgatt attttagttt 4920 tgtatttttt aggttagcgt ggtttagttt gttgtgtaga gtttagggga gataattacg 4980 ttgtgtatat atgagattgg ttgatttggt aggattgtgt aattgttaga aggtcgtggg 5040 gagtgggggt tagtgtttgt agtttgtttt gtttttttta taggttttta gagtatcgtt 5100 aggtgtagag ttttatagtt ttttttttta aggagtaatt agagggtgag aacgtggagt 5160 ttggtggata ggtgaaagta ttgggatttt tttgtttaga aaggggaaag ttgtatattt 5220 atattttaga gggaagcgat agtagtgttt ttttttgtgt tgaggtatag gtaaggaggg 5280 tggtttgtaa agtttattgg ggagggtgat ttttttttat tgttttaata ttatgttcgt 5340 agtttttttg ataatattat gtaaaatgtg ttttattagt ttttagtgta taaaatattg 5400 gtggagtttt tcgttgtgtt gggttagtta ttagtgttgg gtattgtggg ttaaggtagt 5460 gtttaggacg ggtatagttt tgttttttta agttatggtt tattgtggta ggatttgttt 5520 gtttagtgaa gtgtgtttag ttgtttttgt tgttggggga agttttgttt tttgttttcg 5580 gttgtttttt atacgttttt atgtgttttt tagtttttaa tttttagttt tgtttttaat 5640 atcgtagggg tttttagttg attttttttt atttttttaa agggtaggat tttttggtag 5700 agatataacg tttttttgga aatgaaagaa gttgatgtat gttttttttt ttttgaatta 5760 tttaaataag aggaatttat ttttaggtat tttttgtttt gtttttattg tgggagtgtg 5820 gttttagttg tttatttgat tagttgatat agggtttttg gggtttaggt attgttattg 5880 tttgggattg aaagatgaaa gttatagggt taggtatagt agttcgtgtt tttaatttta 5940 ttattttgga aagtcgaggt gggcggatcg ttggaggtta ggagtttgag attagtttgg 6000 ttaatatggt gaaacgttgt ttttattaaa aatataaaaa ttagtaggag gtggtggtat 6060 gtatttgtaa ttatagttat ttaggagttt gaggtacgag aattttttga atttagggat 6120 agaagttgta gtgagtcgag atcgtattat tgtatttttt gagattttgt tttaaaaaaa 6180 aaaaaaaaaa aaaaagggaa agtaatggtt tggtttggtt ggagatggaa tatgtattaa 6240 cgtgttttac gtgtttttag tagggatagc gaaggtttgt tttttggtat atggtagatt 6300 gagtaaatgt tgattagtga gattttgagg tattttagag ttttataatt tagagaggga 6360 gatagattgg aagtttaagg gtggatattt gggtatgatt tttaggacga aggttgtagt 6420 cggttttaag aagtatgttg gtgattatga gagaagaggt tgtgggtttt tttttttgaa 6480 agttgttttt ataattatat gtggggtgat aagggttttg gtttagggga gggggcgagg 6540 tatatagggg gttgaatttg atggtatgag gatttggtga tgggttgtgg ggaaagaatt 6600 ggagatgatt ttagggtttg agggtgggaa gttgggagtt tattgggatt attgatagaa 6660 acgcggaggt ggggggtgtt aagttgattt ttttgattag attttttata gaattgtagg 6720 aataaggcga gagttatcgt tttgggtgga tttttgtttg gagttttatc gttggattat 6780 tgtggataag tattttatag aacgattttt agtagtttaa ttttaggttt agaggggtag 6840 tttttgatag gagtaaattt tagggttttt gtaatttttt agtagagttt taaatatttg 6900 atatgtagtt aatggaggat atgtaagtgg tggggttttt agtagggatt attttttgtt 6960 ttgggttttt aagatagagc gaggggcgtt gttggggcgt ggtttgtagg ggttttgtta 7020 gaattcgatg tttttttttt cgtttgggtt ttaattgtag tgtatttaga gatttttttt 7080 tgatttaggt ataaggacgg ttcgtatatt tatgtaggtt attttgaata agaatagttt 7140 atgggttatt tttttaggaa tgaggaagat gaagagttag ataataatgt tgggttggta 7200 tttgtttgat agtgttttgt taagattatg gttttttttt tttttgatta aaaaagatat 7260 aggagttaga taaatgggga ttaaaagata attgagttga tgtgaaatgt aataggtaat 7320 attatggata tagaaagtag attagaggtt gtttaggatt taacgtggag ggtagtaggg 7380 gagcgatagt tgaagggtat ggagtttttt cgtgtcgatg aaaatgtttt atagttgatt 7440 gtggttatgg ttgtatatgt ttgtgaatat tttagaaatt attggagggt ttattttaaa 7500 tgggcgaatt gtatggtata tgaattatgt tttaataaag tttttatata gttaagttgt 7560 gtggttatgg ttgggttttt tagtagtgtt ttttaatttt aaattgaatt tattttttta 7620 gtatttgggt ttttttatta tttcgtttgt tttgaggata agtttttttt taagaaggat 7680 agagtagggg ttgtgggtta ttatttagga aaggtgtttt ttttttttgg gggagggaat 7740 ttagaggtta tggatagaag tttttttaga tatgtaaaaa atatgaggtt gtcgggcgtc 7800 gtggtttata tttgtaattt tagtattttg ggaggtcgag gcgggcggat tacgaggtta 7860 agagattgag attattttgg ttaatatggt gaaattttat ttttattaaa aatataaaaa 7920 ttagttgggt gtggtggtac gtgtttgtag ttttagttat tcgggaggtt gaggtaggag 7980 aatggtggga atttgggagg taaaggttgt aatgagttga gattgtgtta ttgtatttta 8040 gtttggtgat atagtgaaat tttattttaa aaaaaaaaat aatatgaggt tttagaaatg 8100 tagtttttaa aattttttat ttagggttgt gtagaagtta aattaggttt ttattttttt 8160 aggatgatga atagttttta aagtttagta ggattgtggg tgattttgtt ttattgtttg 8220 ttgttttttt atttttttag attatatata tataatattt atattatata taatatgtat 8280 atagtgtgtg tatatatata tataatatgt atatattagg ttaagtgtaa ataaaattag 8340 ggatagggtt ggagcgtagt aggaaagagt ttgttgggga ttagagtttt tgggttgtta 8400 gggtcgggtt gggcgggttt cgttgttaat ggtttttttt tattttgtag g 8451 14 8451 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 14 tttgtaagat gaggggaagt tattaataac ggagttcgtt tagttcggtt ttgatagttt 60 agagattttg atttttagta ggtttttttt tgttgcgttt taattttgtt tttgatttta 120 tttatatttg atttaatata tatatattat atatatatat atatatatta tatatatatt 180 atatatagta taaatattat atatatatga tttagaaaaa tggaaaaata atagataatg 240 agataaaatt atttataatt ttattaagtt ttgaaaattg tttattattt tgggaaaata 300 ggaatttggt ttggtttttg tatagttttg ggtagggggt tttgggagtt atatttttga 360 ggttttatgt tgtttttttt tttgagatgg agttttattg tgttattagg ttggagtgta 420 gtggtataat tttagtttat tgtaattttt gttttttagg tttttattat ttttttgttt 480 tagtttttcg agtagttggg attataggta cgtgttatta tatttagtta atttttgtat 540 ttttagtaga gatggggttt tattatgtta gttaggatgg ttttaatttt ttgatttcgt 600 gattcgttcg tttcggtttt ttaaagtgtt gggattatag gtgtgagtta cggcgttcga 660 tagttttatg ttttttgtat gtttgagaag gtttttgttt atgatttttg ggtttttttt 720 tttaggggag aggagtattt tttttgaatg gtggtttata gtttttgttt tgtttttttt 780 ggagagaggt ttatttttag ggtagacggg gtaatgggga ggtttaagtg ttgggagagt 840 aagtttaatt tggggttggg ggatattgtt aggaagttta gttatggtta tatagtttag 900 ttgtgtaaga gttttattga aatataattt atatattata taattcgttt atttaaagtg 960 aattttttag tggtttttag gatatttata gatatgtgta gttatagtta tagttaattg 1020 tagaatattt ttatcggtac ggagaaattt tatatttttt agttgtcgtt tttttattgt 1080 tttttacgtt aggttttaag tagtttttaa tttatttttt gtgtttatag tgttgtttgt 1140 tatattttat attaatttag ttgtttttta atttttattt gtttgatttt tgtgtttttt 1200 ttgattagaa gaggaagaaa ttatagtttt ggtaaagtat tattaggtag atattagttt 1260 agtattgtta tttagttttt tatttttttt atttttaggg aagtaattta tagattgttt 1320 ttgtttagag taatttgtat gaatatgcgg gtcgttttta tgtttgagtt agaggagggt 1380 ttttagatgt attgtagtta ggatttagac ggaggagaaa gtatcgagtt ttgataaggt 1440 ttttgtaaat tacgttttag tagcgttttt cgttttgttt tggaaattta aggtaggagg 1500 tggtttttgt tgggaatttt attatttgta tgttttttat tggttatatg ttagatgttt 1560 gggattttgt tggggggttg tagaggtttt ggagtttgtt tttgttaaga gttgtttttt 1620 taaatttaga attgggttat tgggggtcgt tttatgaaat atttgtttat agtggtttag 1680 cgatagagtt ttaaatagaa atttatttag ggcgatggtt ttcgttttat ttttgtagtt 1740 ttgtaggaaa tttaattagg aaaattagtt tggtattttt tattttcgcg tttttattag 1800 tgattttagt gaatttttag ttttttattt ttaggtttta gagttatttt taattttttt 1860 tttatagttt attattaagt ttttatgtta ttagatttag ttttttgtgt gtttcgtttt 1920 tttttttgga ttagagtttt tattatttta tatgtgatta tggagatagt ttttaagaga 1980 ggaaatttat aatttttttt tttatagtta ttagtatatt ttttagaatc gattgtagtt 2040 ttcgttttgg gaattatgtt taggtgttta tttttgaatt tttaatttat tttttttttt 2100 ggattgtgaa attttaaagt gttttaaggt tttattgatt aatatttatt tagtttatta 2160 tgtgttaggg ggtaggtttt cgttattttt gttggagata cgtgggatac gttgatgtat 2220 gttttatttt tagttaagtt aggttattgt tttttttttt tttttttttt ttttttttga 2280 gatagagttt taaagagtgt agtggtgcga tttcggttta ttgtaatttt tgtttttggg 2340 tttaagagat tttcgtgttt tagatttttg agtagttgtg attataggtg tatattatta 2400 ttttttgtta atttttgtat ttttagtaaa gatagcgttt tattatgttg gttaggttgg 2460 ttttaaattt ttgattttta gcgattcgtt tatttcggtt ttttaaagtg atgagattag 2520 aggtacgagt tgttgtgttt ggttttgtgg tttttatttt ttaattttaa gtagtaatag 2580 tgtttgggtt ttaaggattt tatgttagtt gattagatgg gtagttggga ttatattttt 2640 ataataaaaa taaggtaggg aatatttgga aatgagtttt ttttatttaa gtaatttaga 2700 aaagaaaaaa tatgtattag ttttttttat ttttagaaag acgttatgtt tttgttagga 2760 aattttgttt tttaagaaga tggagaaaag ttagttaaaa gtttttgcgg tattgaaagt 2820 aggattaggg gttagggatt gggagatata tgggagcgtg tgggaggtag tcgaaggtag 2880 agagtagagt tttttttagt aataggagta gttgaatata ttttattggg taggtagatt 2940 ttattataat aaattatagt ttgggaaggt agggttgtgt tcgttttggg tattgttttg 3000 atttatagtg tttagtattg gtgattggtt tagtatagcg aagagtttta ttaatatttt 3060 atgtattaga agttagtaag atatattttg tatgatgttg ttaaggaggt tgcgagtata 3120 atattagaat aataaagagg gattattttt tttagtgaat tttataaatt atttttttta 3180 tttgtatttt agtataggga gaagtattgt tgtcgttttt ttttaggata taaatgtgta 3240 attttttttt ttttgggtag aaagatttta gtgtttttat ttgtttatta ggttttacgt 3300 ttttattttt tgattatttt ttgggaaaga gagttgtgga gttttgtatt tggcgatgtt 3360 ttaagggttt gtgagagagg tagggtaggt tgtaggtatt ggtttttatt ttttacggtt 3420 ttttgataat tgtatagttt tgttaagtta gttaatttta tgtgtgtata gcgtggttat 3480 tttttttgga ttttgtatag taaattgaat tacgttgatt tgagagatat agggttgaaa 3540 tgattagtgt tcgagtttta tttaaaagaa gggaatttgg gataaggggt attatgatgg 3600 tttttattag tattattagg tgtattattt aggaagagga gggtaaagtg atagatttaa 3660 agagaatttt aaaaatacga ttttttgtat tttaattaag ataataagaa tattagtatt 3720 tgtttggttt aaggatggtg ttttatagtt attgatttta gattataaat aggttttatt 3780 gtagtgtgtt attttgttat ttagtaatag ttttttattt aatagtaggt ggttaatgta 3840 ttaaagaaaa gtgtttttga ttagtttggt gtgatagtag gtgttgattg tgtgggggtg 3900 ggtttttaat ttcgttgtcg ttttgcgttt ttatatgaat agtttttttt tttgttgtag 3960 gtaatattta tttttattag tttaagttta aggagtttat tttggggagg acggaggggg 4020 ttattacggt tttatatttt ttcgtttgtt ttgtcggaga gttggttagg tagagtggcg 4080 tttttttgat tgagttttaa atttttgttt tttttttatt ttaaataaag tcgtttggcg 4140 aaggagttcg gaggtttgat ggtagtttgt tgggcgtttg ataattttta gattttggta 4200 aatgtaattt atggtatatg taaatttatt tattaaagag ttataattta ttaaatttga 4260 tttttttttt tatttattta aggtaagaat cggagtaggt aaggggttta gtttaaatta 4320 tattgtagtt gtgaggatta gaatttgtgg ttatagtatt tatttttggt ttgttattgg 4380 gtgtgttgta ttttaatttt tttttttgtt tttttttagt atttgtttgt agttttgagt 4440 ttttaggtta gaagggattt ttagggtata gacgtttttt aggtttgtat agtttttttt 4500 aaaaaatgta ataataagaa ataatatttt tttttatttg gtgggttagt tagttttggg 4560 aaggattgcg ggggcggcgg gggtgggcgg ttttagagtt tgattaatga gtttaggtat 4620 ttatttttta tttgtttaat tttgtttata tattttgttg tagttcgaga tagggagaat 4680 tgtagatgtt tatcgtttag gtagggagga tttagagagt gttaggtatt tagtaggttg 4740 tttttaggtt tttgggtttt ttcgttaggg ttgcggtttt atgtggagta aggggaaagt 4800 aaaggttcga ggtttagtta agagggtatt attttgtttg gttagatttt cgataaagta 4860 tgggggtgtg gagtcgtgga gatttttttt gtttttttta gggtggattt tttggggttg 4920 ggttggtgaa agcgaatatc gtttagagtg agaaggattg tttacgtagg aatttaaggc 4980 ggtagaggat ttggggtggg ttggggaggg ggtggtatta agtagatgag aatttttttt 5040 ttttttttat ggtttttttt ttttatggtt atttagtatt taagaggata gagtagggtt 5100 gtattatttt tatatttatc gggtgggtta gttgataagt tattgttatt gggtatggaa 5160 gttggagagg aatttagtag tttcgagttt aaatttttgt tttatagtta gggaaagagg 5220 gggtcgagtg attgagtttg gggaagtttg atggttaatt tgggtgatgt tatttaagga 5280 gttagtttgg gtttttcgga gattttttat tttatggttt tttgtaaaat agtaattttg 5340 ataatttttg attttagaaa tgaaaatatt ttggaggtta taatacgagg gttttggttt 5400 agtgtggtag tttatgattg taattttagt atttcgtggg gttaaggtgg tgaattattt 5460 gtggttagga atttaatatt agtttgggta atatagtaag atttttattt taaaaaaaaa 5520 aaaaagtaat aaaggggttg tttgtttgtt tttttttttg ggtcgtttaa atttcggttt 5580 tattgtttat tagttgaggg gttttgggta agttatgaaa tttttttaag tttagtagtt 5640 gtatttgtaa aatggggata ataatgttga attatttatt attaatatgt gtgttttttt 5700 tttttttttt aaatttttaa ttatcgtgga gtatttttgt tttgtaatag attttagagg 5760 agtttttgtt tttgttattt agtttatatt ttaaggtttc gttgtagtcg tgtgtatata 5820 aataggttgg acgtgaggga gtgtatggcg ttaggtatcg tggtttggta gtatttgttt 5880 ttttttttat gtgtttttat taaggatatg atttgggagg atgattaaag tataaggtta 5940 tgtatatttt cgggtattag tattttgtaa gatatgtttt tggggtaatt tttatttttt 6000 ttttttattt gttcggagaa ggtgtatttt tagtattaag gggtagaatt ttggtggtta 6060 agtttttatt tttttaagga gagttatatt tatttttttt ttgtggttag tttttgttga 6120 tgtagtaaat attagaattt ttttaaaata ttaaagttta ggagatatta tgaaaaattg 6180 agaagtaaaa taatataaaa tgagagtgtt tgttttattt tgttagtatt tgaaattaga 6240 gttttattga tttgttttaa aagttttaga gatatatttt atttgattcg agtttttgtt 6300 ttgtaatgta tttttttaga atattgataa gttattgggt tgagagtttg tgtaggaggg 6360 ggttggaggg gaagtttttt agaatgaaat tatttttttt tcgaagttaa ggtatttttt 6420 ttaataaaat ggtttatttg tttagtaaag aaaatataat ttttgttgta aattagtatg 6480 atttttttta aaaacgtgat tggaagatag tggttattta gttataagat attgagttta 6540 gaggggaatt tgatgaatat ttggttttta ttgtaagaaa tgggattgta tatattttaa 6600 ttttaatttt atattgaagt taaattttgg gtatgtattt gtgaaaggtg gaagaaaatt 6660 ttattaagtt taaggtgaag aagttagatg agtaattaat ggtttttatt ttttaaagat 6720 ggattaaatg taaattgtta gaaaataata aatgatataa gtagagtatt tgttagttta 6780 tttgtgttta tttttttgga tttgaggtat aaaggattat tttaaatata ggagagtaaa 6840 taaagtaggt gttttgtttt ttggtatagt taaaaggtaa attatttgta attttagtat 6900 tttgggaggt taacgtaggt agattatttg agtttaggag tttgagatta gtttgggtaa 6960 tatggtaaaa ttttattttt ataaataata aaaaaaaatt agttaggtat ggtggtgtat 7020 gtttgaggtt ttagttattc gggaggttga agtgggaaga ttgtttgagt tttagtggtt 7080 gaggttgtag tgagttatga ttattgtatt ttagtttgag aggaagaatt tgttttaaaa 7140 aaaaaaaaaa aaaaaaaaaa gaattaaaaa atgaaaaata ggttgggtat ggtggtttat 7200 atttgtaatt ttagtatttt gggaggttaa ggcgagtaga ttattttagg ttaggagttc 7260 gtgattagtt tggttaatat ggtgaaattt cgtttttatt aaaaatataa aaattagttg 7320 ggtgtggtag tgtgtatttg tagttttagt tattcgggag gttgaggtag aagaatcgtt 7380 tgaatttggg taggcggagg ttgtagtgag tcgagattgt tttattagat tttagtttgg 7440 gtaatagagt aagattttat tttaaaaaaa aaagaaaagg tagattagtt taataattta 7500 atggaattta atatttgtta tattggggta aaaataaaag tttgtttttt aaaaattttt 7560 ttaagtgatg ttattaagtt aagttttaaa atatataatt tattttaaga ttgatattta 7620 aagtttaaat gaattttttt tttgttattt gaatgtggtt tttaaagtgt taagaagtta 7680 tttgtttttt aaagtaaata agagatttgg attggcgttt tggaaaagta agtataaata 7740 tgtttttgga ttagaggttg gtttagtaat attgagtgta attattggtt gggtattgtg 7800 taggtattag gattaatata taattttgta attgtaggag tttatatttt agtagggtag 7860 ataaacggat aatagataaa tattttttta gttatagata tatattatat gtatatagat 7920 ggaagagaag tgtgtataag tagaagtggt taggttttgt tataaagttt ttatagagaa 7980 ggggttattg agtagggttt ttaagtatga ataggagttt attaggagaa aaataatggt 8040 ggaatgggaa taatttaggt agaaagaaga gtatgtggaa tggaatggga tggaagtgag 8100 gaagcgtatg gtatgaatga aaaaatataa gagttttata ggttattttc gtataagagt 8160 tgatgatttt atattttcga gtgtagttgt tttatttatt attatattat tttttttata 8220 aattgttatt ttattacgag ttgatttagg agttttaatt tagaaatcgt gtttataatt 8280 tagattattt ttttgtaaat tatatgttga aaagagtgag ttaagaaaat atatttgggg 8340 ataggcgtgg tggtttatgt ttgtaatttt agtattttgg aggttaaggt gggtagatta 8400 tttgaggtta ggagtttaag attagtttgg ttaatatggt gaaatttcgt t 8451 15 6699 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 15 aattttagaa gggtatttga agattaaagt aaaaaaaata agaagatttt ttggagtaga 60 ttttaaatgt ttttttttta gtttttttaa agttgtatta gttttagtgt taatttaagt 120 tgagattatt ttaaatattt ggagaaagtt ggtatttaat ttagttggag ttagtgtttt 180 gtagttgttt tttaatgaaa gaatttattt tattgggaga tgttgagtag taataatata 240 gttgtttaaa attagtaaaa attttaaaat gattcgtaag ggatagtgta gaggttgttt 300 ttataagatt ttgtaattta tttgaaatta aagattgtaa agtattaaag agggagtttt 360 ggttatttta gtttgggtta ttagagtggt attgaataat tgattaagga ttttggttgt 420 gttaggtatt gtgttaggga tatattggtg ggtaaaatag attttttgtt tttaaggagt 480 taatagttat ataagtaggt aattttaggg aatataggtt attgtgggat taggttagtt 540 ttatagtatt ttagatttag aaagtaaatt ttattagttt atttggaatt gattaggtag 600 ttaggaaaaa gagaatatta agaagggaaa tataattagg aagtaagaat tgagttagaa 660 tttattatat tttgagggat aagttagaat gtttattatt attattatta ttattaatat 720 ttttgagata gagttttttt tttgttgttt aggttggagt gtagtggtat gatttcggtt 780 tagggtaatt tttatttttt gggtttaagt aatttttttg ttttagtttt tagagtagtt 840 gggattatag gtgtgtatta atacgtttgg ttaatttttg tatttttagt agagacgggg 900 ttttgttata tttgttaggt tggttttaga tgggtttaag taattttttt gttttaattt 960 ttcgagtagt tgggattata ggtgtgtatt aatatatttg gttaattttt gtatttttag 1020 tagagatggg gttttgttat gtttgttagg ttggttttaa atttttgatt ttaggtgatt 1080 tatttatttt agttttttag agtgttgaga ttataggtgt gaattattat atttagtaga 1140 atattgattt aatattttat aatgagattt ttattttttt agttattaga ttatttgtgt 1200 ttagtttgta gggtaatttt tttatgttaa ggtttttagg gatgagtttg gtgagtttat 1260 aagttagagg aggtgaatag ttttgaggga tattttataa aaatttatag aattattttt 1320 gtttttaata gatttaattt ttttagaggt tagaatattt tgattttatt tttaggtaga 1380 tttggatgaa tagatttcga taggttggtt atttaggttt tttttttaaa aattttatgt 1440 tgataattat attttgtaaa tgtagttttt taaatatgtt ttttgtttat taggtaattt 1500 atttacgtgt ttaaaggtat aataaggttt atagtggaaa atttttttta tttttgtttt 1560 ttagttattt aggttttttt tttagggata atttaggtta ttagtatttg tgtatttttt 1620 taaatatatt ttattgatgt agtttaaata atatttttta aaaaaattgt agttttattt 1680 atattttagg tatgagaata tattttagtt attttgtttg aatttgagta atatattatt 1740 gtttttaatt tattttgaga gatatttttt ttttaaattg taggtataaa tgttttttag 1800 aataggtgat ttttgtagat agttaatttt atttagtgta tttgtgtgta tatgtgtgtg 1860 tttaattaat tttatagagt atttgtattt ttaagtttta ggaatatttt tttttgtatt 1920 tgtttatgtt ttatgtatag attttgaagt taattatgat atagaaataa taaattttta 1980 taacgggttt ttttgttgtt tattttgtta atttaatgat tttatttgtt tttttaattt 2040 taagatatat tttaaaaatt ttgtgttttg ttggttggaa ttagggagag ttgggtatat 2100 ttcgaaagta atagtgatga ggaagaattg aaaagttgaa tttttgttat gtttttggta 2160 tgttttttat tttttgtttt tttagatttt tttatatata tattatttta aattatgttt 2220 ttaagttaag ttataaagat gaattattat tagatttgaa tatgtataac gattaggtat 2280 gagattatta agattttaaa attattggtt taattaaagt atttaatggt atttattgtt 2340 aataggggaa ggtaagataa gattttatag tttattttat tttttttgaa taaggtagta 2400 attaaagatt acggagttgt taattattat tatatagata ttttgtagag ttggtttagt 2460 attagataaa taatttaata tggaaagttt gtattttaaa ttgatgaggt tattttagaa 2520 attgttatta aattttttta aaaatagaat atagaagaga atgaaaaaat ataattgtag 2580 tgaatgaata aaagtgtggt ataaaagggg aaaaaggata aagaatgaaa gtaaattaga 2640 ggtatagtaa aaaggaggag tgagtgtttt gatttgtttt tataatagta ggattggttt 2700 gggtggcgtt atttatatat tttttgttgg attttaggag ataagggtat gttttttggt 2760 tatgagtttt ttattatgta aaatttaata atatcgtaaa ttttattatt attagatatt 2820 tttaattttt atatttgtaa aattaaaata gtgtttttaa tgggtggtaa gaggatgttt 2880 tttaatttta agtagaaatg gtatagtaat tttaagggtt tgttatgtgt atttattgta 2940 ttttttagtt ttttttagga gaagtatatt tttggttgtt tttagtatat taagagaatt 3000 agattttaga ggtggttgta ttttattgtt gggagtaagt attttttaaa ttttgagaaa 3060 tgttagagat tttttaaaat tttattagaa gtatgaagtt ttgattagaa agataaaggg 3120 atttggtttt aggttatata gtaaattaag tggtagaatt aagttatgaa tttagattta 3180 ttttttttat tatattatgg tatttggggg tttttttatt gttagagtag taatatatta 3240 ttttatatag tttttttttt tttttttttt ttagatggag ttttgttttg tcgtttaggt 3300 tggagtgtag tggttcgatt ttagtttagt agttgggatt ataggtattt attattatgt 3360 tcggtttttt tttttttttt tttttttttt ttttgagacg gagtttagtt ttgtcgttta 3420 ggttggagtg tagtggcgtt atttcgtttt attataagtt tcgtttttcg ggtttacgtt 3480 atttttttgt tttagttttt cgagtagttg agattatagg cgttcgttat tacgttcggt 3540 taattttttt ttgtattttt agtagagacg gggttttatt atgttagtta ggatggtttt 3600 gattttttaa tttcgtgatt cgttcgtttc ggttttttaa agtgttggga ttataagtat 3660 gagttatcgc gttcgattta gtttttgtat ttttagtaga tagggtttta ttatgttgat 3720 taggatagtt ttaaattttt gattttaggt aattcgtttg tttcggtttt tttaattgtt 3780 gggattatag gcgtgagtta ttgtattcgg ttttatatag ttttaatgtt acgtattaag 3840 ttttgtatgt ataatttttt attttggttt tttagtaatt ttttatgtgt tagggatagt 3900 aaattttatt gtttttattt tgtagataag aagattgtaa tttaggaaga tatatagtag 3960 tttataagtg atttaggatt ggaatttagt tattttaatt ttttttcgga ggtttttttt 4020 attatgttat ttgttcgttt ggtgtttttt atttatgaat tttggaaaat aagtttgaga 4080 tattaaaatt gaaaagatag tttattaaaa atgaatagtt ataattttat aagtataaaa 4140 atgaaatatt taaatttttt gttttttttt ttgttaggag tataaatgtt aatttgagtt 4200 ttttagtttt gtataaattt atagtaatta agattgtatt gtgagggaaa atattttttt 4260 aaaaaagaat tttgattaag ttgaaataaa aattttaaaa tatgaaatgg aaggaacgaa 4320 attgtcgttt ttttttattt ttgatttata tttgtcgatt tttatgacgg agttttttaa 4380 gttaggggta tatggttaaa gattatgtga aatgttaggt gttttaaata ataatcgacg 4440 gggtattgga aggaaagtat tgttttttcg gggaataaat ggtttaattt ttagatttag 4500 ttttttgtag ttttaaattc gatgttgtat taagaaatta tttaattttt aggtggtttc 4560 gtttatcgaa aaatgaggtg attggtttag tgcgtatatg tgaatttaag ggtaatattg 4620 tatttacgtt ttgtatattt aaatttttaa atatttattt aatatatgta tagattattg 4680 ttatttcgtt agaagtcgcg ttttgtttag ttgcgcgaga ttttaacggg tttttttgcg 4740 acgttcgggt ttgggttcgg gttcggacgt gtaatagaag tcgttagtgg tttcgttggt 4800 taaaaaaggg taagtatcgg aggttcgagt tagcggtcgc ggcgtttttc gatagttttt 4860 aattcggggc gttacgtcgg ttttattatt tgttttcggt agttaatggg gtcgcggggg 4920 gcggtcgggg cggagcgcgg ttataaaagg tttcgggttt cgcgcgttcg tttatttcgt 4980 ttcgggcgcg ttttcgggaa ggtttggatc gacgcggttt agaggttagg aatagttcgc 5040 gcgtggatta gtcgggttag ggcgatgttg cgggtgcggt gtttgcgcgg cgggagtcgc 5100 ggcgtcgagg cggtgtatta tatcggattt cgggtgcgtg cgttatcggt ttcgtttggc 5160 ggtcgcgtga tttattcgat tttgcgggcg gcgtggagta ttcgttcgtt ttttgttcgg 5220 agtcgttatt ttttttcgtt ttttttagtc ggaattgtac gagagtgttt tttttggtat 5280 ttttgggaag tttagtttta agagttttcg taggttttag gagttgggcg gcgtttttta 5340 gttaggggga atttgcgttg cggttttagt ttttggggtt tatttgttgt ttgcgcgttc 5400 gcggtttgtt ggtttacggc gtagggggcg tcgttttttt ttatcggatt ttggtgcgtt 5460 gtattaagtt tttcgttcgg agtaaggggt tgggacgacg gaggtttttt ttagtaaaag 5520 ggtggcgtta ttggggttta gtagtttgag tgggcgtcga gttggggaga tttttggaaa 5580 atgcgtgtgg ggtagatgga tggggagaag aggtaagtaa agtgggaatc ggggacgggg 5640 agcgagcgat tagatttatt ttaagtataa tatgggattt tacgtttgga gaggagtcgg 5700 ggcgagtgta gtttgtaagt agagtttttg cgtttttcgt tttcggttgt tttggtagta 5760 gattttttta tgtttttagt attggaatcg tttcgatatt ttggtttttt tttagtaatt 5820 ggtttttgaa tagttgttat ttttcgtttt ttttttgttt ttattcgagt tttttttttg 5880 tttatttttt aaggttttta atagagtagg atagagattt ggggggttga ggtttgttta 5940 ggggttgagg gatttttttt gttttagatt ttataggtta tgtattttta aaaggttttt 6000 gaagttttta gatttttttt ttatttgttt gaatttacgt ttgagttaat tttgattttg 6060 gttagggtat tgtggattat ttgtaaaatg gagtagatgg tagttgttta tttttagaat 6120 tgaagtgtta aagaatgcga agtgtatgtt aaagatgaaa aaaatttgat ttgaagttgg 6180 ttattttgaa agataaggtt ttttataaat gtttttaatt ttttatttgt aaaaaaaaat 6240 aaataaaaag tttaatattg gtaatttttg atatttaagg gaaaaggagg tttcgttttt 6300 agttgagatt ggcgggaagt tttagagtag ttgtttatgg ttttttgaga ggaggattga 6360 tttatttgta aaatagttgt ttaaagtttg agtgtaggaa ttgtattttg agataaagat 6420 gggggtgtat ggtagttggg gatacggttt tttgaggagt tttaaagagt tatagtaatt 6480 aatagataag aagataattt gtagataaat aagagggtta aaaaaattat ttgtaatttt 6540 attatttatt tatatattgt taacgttttg gtttatgttg ttttaaaggg gtttaagtgg 6600 taatgttatg ttggattttt attttatttt tatttttttt tttttgtaag tattgataga 6660 gtaatgtaat ataataattt tttttttgtt tttggaagt 6699 16 6699 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 16 gtttttaaga ataaagaaaa gattattgta ttgtattgtt ttattagtat ttatagagag 60 gaggaagtgg agatggagta aaaatttagt ataatattgt tatttaaatt tttttagaat 120 agtataaatt aagacgttaa tagtgtgtag gtgggtagtg ggattataga taattttttt 180 aatttttttg tttatttata aattgttttt ttatttatta attgttgtaa ttttttaaaa 240 ttttttagaa gatcgtgttt ttagttatta tatattttta tttttatttt agaatgtaat 300 ttttgtattt aagttttaag taattgtttt gtagatgggt tagttttttt tttagaaaat 360 tatagatagt tgttttaaaa tttttcgtta gttttagttg gggacggaat tttttttttt 420 tttaagtatt aaaggttatt aatattaggt tttttattta ttttttttta taaatgaaaa 480 gttgggaata tttgtaaagg attttatttt ttagaataat tagttttaaa ttaaattttt 540 tttatttttg atatatattt cgtatttttt ggtattttaa ttttgagagt gagtaattgt 600 tatttgtttt attttataga tggtttatag tattttagtt aaggttagga ttagtttagg 660 cgtaaattta aataaataag aaggagattt aaaaatttta aaagtttttt aaaaatgtat 720 ggtttataaa atttagagta gggagggttt tttaattttt gagtaaattt taatttttta 780 aatttttatt ttgttttgtt aaaagtttta ggaagtgggt aggaggagaa ttcgggtgga 840 ggtagaagaa agacggagaa tgatagttgt ttaggaatta gttgttggga ggaagttaga 900 atgtcggagc gattttagta ttagaagtat gggagggttt gttgttaggg tagtcgaggg 960 cggggagcgt agaaattttg tttataggtt gtattcgttt cgattttttt ttagacgtgg 1020 gattttatgt tatatttgga gtgaatttgg tcgttcgttt ttcgttttcg atttttattt 1080 tgtttgtttt ttttttttat ttatttattt tatacgtatt ttttagaaat ttttttaatt 1140 cgacgtttat ttaggttatt gaattttaat aacgttattt ttttattaag aggagttttc 1200 gtcgttttaa ttttttgttt cgagcgggaa gtttggtgta gcgtattaag gttcggtaga 1260 ggggggcggc gttttttgcg tcgtgggtta gtaggtcgcg gacgcgtaga tagtaagtag 1320 attttaaggg ttggagtcgt aacgtaagtt ttttttgatt gggggacgtc gtttagtttt 1380 tggagtttgc gaaggttttt gaagttgagt tttttaggga tattagaagg gatattttcg 1440 tgtaatttcg gttagggaaa gcgagggaag gtggcggttt cgggtaggga gcgagcgagt 1500 gttttacgtc gttcgtagga tcgagtgagt tacgcggtcg ttagacgagg tcggtggcgt 1560 acgtattcga gattcgatgt agtgtatcgt ttcggcgtcg cggttttcgt cgcgtagata 1620 tcgtattcgt agtatcgttt tggttcggtt ggtttacgcg cggattgttt ttggtttttg 1680 ggtcgcgtcg gtttaagttt tttcgagagc gcgttcggag cggggtgggc gggcgcgcgg 1740 ggttcgaggt tttttgtagt cgcgtttcgt ttcggtcgtt tttcgcggtt ttattggttg 1800 tcgggaatag gtggtggggt cggcgtagcg tttcgaatta ggaattgtcg ggaagcgtcg 1860 cggtcgttgg ttcgagtttt cgatgtttgt ttttttttag ttagcggggt tattgacggt 1920 ttttgttgta cgttcggatt cggatttaga ttcgagcgtc gtaagaaggt tcgttggagt 1980 ttcgcgtaat tgggtaggac gcgatttttg acgaagtgat aatggtttat gtatatatta 2040 agtgaatatt tgagaattta aatatgtaaa gcgtgagtat agtgttattt ttaaatttat 2100 atatgcgtat tgaattagtt attttatttt tcggtaaacg aaattattta aagattaggt 2160 ggttttttgg tgtaatatcg ggtttgagat tgtagaaaat taagtttgga aattgggtta 2220 tttgtttttc ggggaggtag tgtttttttt ttagtatttc gtcggttgtt atttggaata 2280 tttggtattt tatatggttt ttggttatat gtttttggtt tgagaaattt cgttatgaaa 2340 atcgataagt gtgggttaga aataagggag gacgatagtt tcgttttttt tattttatgt 2400 tttaaaattt ttgttttaat ttgattagga ttttttttta gaaaagtatt tttttttata 2460 gtgtagtttt aattgttgtg gatttgtata gagttagaga atttaggtta atatttatgt 2520 ttttagtagg agggggggta agagatttga gtattttatt tttgtattta tagaattata 2580 attatttatt tttgatgagt tgttttttta attttggtat tttaagtttg ttttttagag 2640 tttatggatg gaaagtatta gacgagtaga tggtatggtg gaaagagttt tcgagaggga 2700 attaggataa ttgagtttta gttttgaatt atttatagat tattatatgt ttttttgaat 2760 tgtagttttt ttatttgtaa agtgagaata atagaattta ttgtttttag tatatggggg 2820 gttgttgaga ggttaaaatg agagattgta tatgtagaat ttgatgcgtg gtattagagt 2880 tgtatgaggt cgggtgtagt ggtttacgtt tgtaatttta gtaattggga aggtcgaggt 2940 aggcggattg tttgaggtta ggagtttgag attattttgg ttaatatgat gaaattttgt 3000 ttattaaaaa tataaaaatt aggtcgggcg cggtggttta tgtttgtaat tttagtattt 3060 tgggaggtcg aggcgggcgg attacgaggt taggagatta agattatttt ggttaatatg 3120 gtgaaatttc gtttttatta aaaatataaa aaaaaattag tcgggcgtgg tggcgggcgt 3180 ttgtagtttt agttattcgg gaggttgagg taggagaatg gcgtgaattc gggaggcgga 3240 gtttgtagtg aggcgagatg gcgttattgt attttagttt gggcgataga gttagatttc 3300 gttttaaaaa aaaaaaaaaa aaaaaaaaaa aaaagtcggg tatggtggtg ggtgtttgta 3360 attttagtta ttgagttgag atcgagttat tatattttag tttgggcgat agagtaagat 3420 tttatttggg gaaaaaaaaa aaaaaaaagt tatatgaggt aatgtgttat tattttagta 3480 ataaggaggt ttttaaatgt tataatatgg tgaaaggagt aagtttaggt ttataattta 3540 attttgttat ttaatttgtt gtgtgatttg gaattaaatt tttttatttt tttaattaag 3600 gttttatatt tttagtgagg ttttgggaaa tttttaatat tttttaaaat ttaaaaagta 3660 tttattttta ataataaaat gtagttattt ttgaggtttg atttttttag tgtattgagg 3720 gtagttagag atgtgttttt tttgaaaaga attgaagagt atagtaagta tatataataa 3780 gtttttgaga ttattatatt atttttgttt gagattggag gatatttttt tgttatttat 3840 taaaagtatt attttaattt tgtagatgta agaattggga gtgtttggta ataatgaagt 3900 ttacgatgtt gttaagtttt atataatgaa aaatttatag ttaaagagta tatttttatt 3960 ttttgggatt tagtagaaag tgtgtggata gcgttattta aattagtttt attgttataa 4020 aagtaaatta aagtatttat tttttttttt tgttatgttt ttgatttatt tttatttttt 4080 gttttttttt tttttttata ttatattttt atttatttat tataattata tttttttatt 4140 tttttttatg ttttgttttt gaaaaaattt ggtaataatt tttagagtga ttttattaat 4200 ttaaagtata agttttttat attagattgt ttgtttaata ttgggttaat tttgtaaagt 4260 atttatatag tgatagttgg taatttcgtg gtttttagtt gttgttttat ttagaagaaa 4320 tggaatagat tgtgaagttt tgttttgttt ttttttattg gtagtagata ttattaaata 4380 ttttgattga attaataatt ttaggatttt ggtggtttta tatttagtcg ttatgtatat 4440 ttaagtttaa tagtagttta tttttgtagt ttaatttaaa ggtataattt aggatagtgt 4500 gtgtataaag gggtttaaaa ggatagggaa tagaaaatat attagaagta tggtaaaaat 4560 ttagtttttt aatttttttt tattattgtt gttttcgaga tatgtttaat tttttttagt 4620 tttaattaat aaagtataga gtttttgaaa tgtgttttga aattaaaaaa gtaagtaaag 4680 ttattggatt aataaaataa ataataaaag agttcgttgt aagaatttat tatttttata 4740 ttatggttga ttttagaatt tgtatatagg gtataaataa gtatagagga aggtgttttt 4800 agaatttaag aatatagata ttttgtgaaa ttggttaagt atatatatat atatatagat 4860 atattggatg agattagtta tttatagaag ttatttattt taagagatat ttgtatttat 4920 agtttagggg aaggatattt tttaaagtaa attagaaata ataatgtatt atttaagttt 4980 aaataaggtg attaaagtat atttttatgt ttggaatgta aataaagttg taattttttt 5040 agaaaatatt atttgggttg tattaataaa atatatttgg aaggatatat agatattgat 5100 aatttaagtt gtttttgggg aggggatttg gatgattagg aaataggaat gagagagatt 5160 ttttattgta agttttattg tatttttgaa tacgtgagtg aattatttaa taaataaaaa 5220 atatatttaa aagattgtat ttgtagggtg tgattattaa tatggagttt ttaaaaagga 5280 agtttgagtg gttaatttat cggagtttgt ttatttagat ttatttaagg atggaattag 5340 aatattttgg tttttggaaa ggttaaattt attgaggata agaataattt tgtgggtttt 5400 tatgaaatat tttttaaaat tatttatttt ttttaatttg tgagtttatt aagtttattt 5460 ttgggaattt tggtataggg gagttatttt gtaggttgag tataagtgat ttgatagttg 5520 gaaagatgaa gattttattg taaagtatta aattagtatt ttgttgggtg tggtggttta 5580 tatttgtaat tttagtattt tgggaggttg aggtgggtgg attatttgag gttagaagtt 5640 tgagattagt ttggtaaata tggtaaaatt ttatttttat taaaaatata aaaattagtt 5700 aggtgtgttg gtgtatattt gtaattttag ttattcggga ggttgaggta ggagaattgt 5760 ttgaatttat ttgagattag tttggtaaat atggtaaaat ttcgttttta ttaaaaatat 5820 aaaaattagt taggcgtgtt ggtgtatatt tgtaatttta gttattttgg aggttgaggt 5880 aggagaattg tttgaattta ggaggtggag gttgttttga gtcgagatta tattattgta 5940 ttttagtttg ggtaatagga gagaaatttt gttttaaaaa tattagtaat aataataata 6000 ataataaata ttttagttta ttttttagag tgtggtgagt tttagtttag tttttgtttt 6060 ttaattatgt tttttttttt aatgtttttt tttttttgat tatttagtta attttaggta 6120 aattgatgga atttattttt taaatttgaa atgttgtggg attggtttga ttttataata 6180 gtttgtgttt tttggaattg tttgtttata tggttgttgg ttttttaagg atagggagtt 6240 tgttttattt attagtatat ttttagtata gtgtttgata tagttagagt ttttaattaa 6300 ttgtttaatg ttattttgat ggtttaggtt agaataatta gagttttttt tttggtattt 6360 tgtagttttt gattttaaat gagttataaa attttgtgaa ggtagttttt gtattgtttt 6420 ttacgagtta ttttaggatt tttattagtt ttgaatagtt gtgttattat tgtttaatat 6480 tttttaatga ggtagatttt tttattggaa gataattgta aaatattagt tttagttaaa 6540 ttaaatgtta gtttttttta agtatttaaa ataattttag tttaggttag tattgaaatt 6600 gatatagttt taagaaaatt gaggaagaaa tatttgaagt ttgttttaag ggattttttt 6660 atttttttta ttttagtttt taaatatttt tttggaatt 6699 17 6177 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 17 gttttggttg tttggttaag ggtggtttgg aggttagagt aattagagaa tattattggt 60 tatttttgta gagaattaac gtttagtaag gattgagttt ttagttttgg tttttttttt 120 ttaggttgtg ggttaggatt atggaggagg ggatatttta gttttgtata gtttgttttt 180 ggtttggagt tgttttgagt agtgtagttt attgatttta tttagtatgt attgggtgat 240 tattatttat tattaagagt tagggtatat taagttatta taaggtggtt tttacgtttt 300 tttgacgttt ttagggtacg tttttttatt ttcgtttttt ttatttatga ggatttattg 360 taaatttttt ttaattatgt atatgagatt aggattttat atagttttta aatttatatt 420 tattgtgtaa ggttatagtt attttgtagt ttaagataaa taggatattt ttttgtattt 480 atttattttg gtttaagttt ttatatggat tgaatgtttg tgttttttta aaatttatat 540 gttgaagttt tattttttag tgtgatggta ttaggaggtg gggtttttag ggattattaa 600 gttatgggat ggagtttttt tgaatgggat tagtgttttt ataagaagag ataagaacga 660 gatgattttt tttttttttt tttatgtgag gatataaaga gaaaatggtt tttattaaga 720 atttgattat gttggtattt ggatttcgga tttttgtgtt ttttagttgt gagaaatgaa 780 tgtttgttgt ttaaattatt tagttttata gtagtttaaa ttgataaatt ttttttcggg 840 atgattgttt ttattttttc gttttttgtt tttgattttg ggaagtggat tttgaggaag 900 ggttaagtgg gtatattggg gagtgatttt tataagtgta aaaggggagg aagtaggatt 960 gagtaataag atgtgtttta gggagtttag aagtagagat tgtttatgcg ggtagttttg 1020 tatcggatag taatggcgag gttttgatta ttttttggtt tagttatggt ttgaggttat 1080 tttaagaaga atatggttat ttagatagta gaagtatatt tggaagtgtt gataggtgaa 1140 ggtagttagt tggttagttt ttatatcgtt atatagtaag ttttatattg aagggggatg 1200 tttgtttgtt atttattttt gtagtttatt tttagtatag tagttggggt gattttgtta 1260 aaatttaagt taggttatgt tatttttttg ttttaaattt ttaaagatat tttatatagg 1320 tttttaaggg ttcgtaagat ttgttttatt cgtatttcgt ttgttgtttt tttaaattta 1380 tttcgttttt tttatttgtt gtaattatat tgattttttg ttgtttttta agttaggaaa 1440 tattaggtat attttttttt tagggttttt gtattttagg ttttttttgt ttgaaatgtt 1500 gtgtttttag atagttacgg ggtttttttt ttgtttttag ggtttgtatt aaatgttagt 1560 tgtttagtga ggcgtttttt ttttttttat tagaaattga ggtcggttat agtgatttac 1620 gtttataatt ttagtatttt gggaggtcga ggcgggtgga ttatgaggtt aagagatcga 1680 gattattttg gttaatatag tgaaatttcg tttttattaa aaatataaaa attagttggg 1740 cgtggtggta tgcgtttgta gttttagtta tttgagaggt tgaggtagga gaatcgtttg 1800 aatttgggag gtggaggttg tagtgagtta agatcgtatt attgtatttt agtttgggta 1860 atagagtaag attttatttt aaaaaaaaaa aaaaataaaa gaaattgaaa tttgttattt 1920 ttgtattttt attttttttt attttatttt ttttagagta tttattatcg tttaatatgt 1980 tttatatttt gttagaatgt aaaattttcg aggataggga tttttttgtt gttgtttttt 2040 ggttattttt attgtttagg atggtattat agtatatagg aggtgtttag taattattgt 2100 ttttaatagt aaaaattata attatttttg tattaaatta aatatttgtt aaattaataa 2160 atttatatat agatttggtg ttttgttagg tggtggagat ataaagattt agttgtttgt 2220 ttttaaaggg tttatagttt aatggaggag gggaataaag ataagtagat tatgtattaa 2280 ggaatgggga aaggggagtg gtttattaga gatagagttt tagttttgta agatggtaaa 2340 gttttggaga tttgttgtaa aataacgtga atatatttaa tattattgaa ttgtatattt 2400 aaaattttta agatgatata ttttatggta gttgtttttt aatataatta aaaattttta 2460 aataataaaa ataaagtatt atgggtagta gttgagttgt tgaaagtata aaggtatatt 2520 tagtatagag ggagttagta aggggatttt tgggagaagg taataattga gaaaagtttt 2580 gatttatagc gtttagtacg tgagggtgtt ttatgtagag ggaatagtag ggataaaggt 2640 aagagcgtat agagaatttt attagtgaga tttggttggg ttatagcgag aagggtgagg 2700 ggtaaggttg gagaagtggt tagggattgg aggttgggga gtttagggtt tatttagaag 2760 gtgataggga gttatagatg attttttagt agggcgatgt tggttagatt tttagggaag 2820 tgtggaggtt gagttggaag ggtggggtta gaggttaaga gattagttgg gaggttattg 2880 aggtggtagt agtttgaata ggattagggt aaagggaatg tagggaagta tgtggtttta 2940 gggatatttt taggtggaat gattaggttg tggtaattgt tgttttagtt gattttagtt 3000 tttttatttt ttggggagga ggtcgagtta tttaaatttt taaagttttt gaggaaggag 3060 ttagagtagg gtgagggtag ttttgacgtt attttttagt tttttattgg tttttttttt 3120 ttttttagta tattgaatta gaaaggtttt gggagagttg ggtttagttt taagagagga 3180 aaattcggta gtgagtagag gttgtagtgg gggcgtggtg agaattagtt tttaggggtt 3240 tcggttttta tgtttttaag ggttagaatt aagtggggta gttgttagtt ttagaaattt 3300 aggagattta gtttagtttg gttttgaggg agaggtttag aggggaagtt agtttagtcg 3360 gattttttag ggtagttagt tttgaagttt ttaggtttgc gtgtttttaa agatgttttt 3420 ttgttggttt tgaagataga atttttaggg attcggtttt ggggtttagg gaatttaagg 3480 attaaatttt gttgtggagg aatagggatt tttgtgttat tagttttagg ttttaatagt 3540 tttttgttat tttttttttt tttagttgcg ttagttttta ttatttttta agaataattt 3600 atagattttt tttgttatag tattataatg tttttagtta ttatttattt gaaaaatttt 3660 atgtattatt attatattat gtgttttgat tatattgtat gttattaatt ttataaagta 3720 gatattatta ttatttttat tttgtagagg aagaaattga ggtataggga tttgagtaat 3780 ttgtttaagg gtataggagt taatagtaaa gttttagttt ttgggtttag ttattaataa 3840 cgttttagta tttcgagggt agtggttata gttttagaat tttatagttt taggttttcg 3900 agttatattt atgtcgtttt tttatttaga atgttttttt tttttatttg gttaatggag 3960 ggggaaaagt attttttttt ttttaggaaa tgtttttaat taagtttttt gggaattatt 4020 tagtattttt taggagaatt ttttatattt attattttat cgttatttaa gggttgatat 4080 gtttaatttt tgtattagtt agtgagggag gaggttagag attaagtttg gttggttttt 4140 tagggtattt ttaggttttt aagtagcgtt tgtagtatag tagatgttta ttgatgttta 4200 tttatttgtg atgtttgaat gtatgaaggt aggtttcgta tagttttttt atttttatgg 4260 atgtttttta tattatttag ttattattta gaggtataag aacggggttt aagttaaagg 4320 ttaggtggtt tttttatttt tagttttaag gagtttatgg gaattgttta atggtttttg 4380 attgtgtagt ttgtttagat atggggatgt ttgagaattt tggaagaacg tgggttgggc 4440 gtggatagag acgtttgttt tattatgtat gttggaggtg tggattataa tttttgtttt 4500 ttattggagt ttttcgcgtc gtaattagtt ttgatcgttt tattttggta tattagggtt 4560 agttatttag taaatgagtg gtttttatat tttattttta ttcgtttatt ttttatagtt 4620 tcgtaggtta gttgtttaga tttatagttt ttattgtaat ttttttaaat ttagttattt 4680 tgagagattt tggtttggga gaattttttt tttttggtta aagaaacgat aggagagttt 4740 attgtttgga atatttggtg gagagagaat agaggagagg aagggtaggt tagttttttt 4800 tgtttttttt tatcgtaaat tatataggtt tattttttcg gagtgggttt agggagtttg 4860 tattttttag ttttcgtttt cgtttttttt ttagcgttcg tcgttttttt cgtcgcgttt 4920 tttgttttta tttcgttttt ttgcgttatt taaggcgttt tcgtcgttcg tgcggtttag 4980 tagggttttc gcgggcgtta tttcggttat cgtttttatt tttatttggg tcgttcggta 5040 ggtaggcggt gagtcggggg ttaggaaggg attaggggcg ttatttgttc gcgggaggtc 5100 gggaggagtt ttgggttttt cgatgtcggg acgggggttg ttgcggaacg ttcgtcgcga 5160 tagagtcgcg tttatttagg tggttttggt taggttttta tttttttttt atggaatttt 5220 tgtaataatt cgaggcggga ggaatattat tgtttttatt ttatcgtgga ggagattgag 5280 gggtttagag gttgtttttt atttaagggg tcgtagttat taaaaggtaa gatttgaatt 5340 tagggtcgtt tttagagttt ggttttaaat agttttgtat ttgggaagag gtattttttt 5400 tttgggaatt ttgtggtttg tgttttattt tgtaatgata atttttttta agagtttaga 5460 atttgttagt attagttttg gaggtggaag ggggtgggag tggaggtgga ggaagaagat 5520 aggattaaat gttttttttt aagtggtagg tggttattat tgttgatcgg tggagttaaa 5580 ggatgatgtt gtttttagtt tttaaaattt tttttattat ttagtttttg taggtttaaa 5640 gattagagtg aagttagttg ggtaagatat gaggcgggga gtagggattt gaggttttga 5700 gttttttaag aagtagaaga taatattttt attattatta ttagttttta ttgtttgggg 5760 gtagttagtt ttgggtaaaa gggaggaagg gtttagttta gttgtataat tttggataag 5820 ttttttaaat tttgttttta taggtaaagg agttttaatt ttatttagat ttttttggtt 5880 tgtgtttatt ttggggtagt ggttcgggga taagagggat atagatgttt gattaggtag 5940 ggattttagt taaagtagaa tgagattata taaagaggtg ggtagttatt atttaaaaat 6000 ttgggttggg ttttgtttgt attgttgagt gggagttttt aggttagttt tttttttttt 6060 tgagtttggg tttttttgta ggtagaacgg gcgtggtaga tttttttgta ggtttgttgt 6120 tgggcgaacg agaaggatgt tatgttgata tattgacgtg ttttgttttt ttgtaga 6177 18 6177 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 18 tttgtaagga gatagagtac gttagtgtgt tagtatggta tttttttcgt tcgtttagta 60 ataagtttgt agggaggttt gttacgttcg ttttatttat aaagaaattt aggtttagga 120 aggggaagga ttggtttgga ggtttttatt tagtagtgta ggtaggattt aatttagatt 180 tttggatgat ggttgtttat ttttttgtat ggttttattt tgttttggtt aaggtttttg 240 tttaattaga tatttatgtt ttttttgttt tcgagttatt gttttaggat ggatataggt 300 taaggaaatt tgggtggagt tgaggttttt ttgtttatgg gaatagaatt tgaggaattt 360 atttaaagtt gtgtagttgg gttaagtttt tttttttttt tgtttaaggt tggttatttt 420 tagatagtgg gagttagtga tgatggtaga ggtgttattt tttgtttttt agggggttta 480 aagttttagg tttttgtttt tcgttttata ttttatttag ttggttttat tttaattttt 540 gagtttgtag gggttgggta gtggaagggg ttttaggagt tgaaggtagt attatttttt 600 agttttatcg gttagtaata atgattattt gttatttgag gagggatatt tggttttgtt 660 tttttttttt atttttattt ttattttttt ttatttttaa agttgatgtt ggtaaatttt 720 agatttttga aaggaattgt tattgtaggg tgaggtatag gttataaagt ttttaagggg 780 gaggtgtttt tttttaagtg taaagttgtt tagagttagg ttttggaagc ggttttgggt 840 ttaaattttg ttttttagta attgcggttt tttggataag gaataatttt tgggtttttt 900 agtttttttt acgatagagt ggaaataata gtattttttt cgtttcgggt tgttataagg 960 attttatgga aagagggtgg gagtttggtt aaggttattt gggtgagcgc ggttttgtcg 1020 cggcgggcgt ttcgtagtaa ttttcgtttc ggtatcggag gatttaagat ttttttcggt 1080 ttttcgcgag taggtggcgt ttttggtttt tttttagttt tcgatttatc gtttgtttgt 1140 cgggcggttt aggtggaggt ggggacgatg gtcggagtga cgttcgcggg agttttgttg 1200 gatcgtacga gcggcggggg cgttttaaat agcgtagagg ggcggggtgg gggtaggaaa 1260 cgcgacgggg agggcggcgg gcgttggaga gagggcgggg gcggggattg ggaggtgtag 1320 attttttaaa tttatttcgg ggaggtgggt ttgtgtgatt tgcggtgggg aggggtaaga 1380 ggggttgatt tatttttttt tttttttgtt ttttttttat taggtatttt agatagtaaa 1440 tttttttgtc gtttttttgg ttagggaagg agagtttttt taggttagga ttttttaggg 1500 tggttggatt tgaaggggtt gtagtaaggg ttgtggattt gggtaattgg tttgcggggt 1560 tgtgaggggt gggcggatgg ggatggagtg tggggattat ttatttgtta ggtggttggt 1620 tttagtgtgt taggatgagg cgattaaggt taattacggc gcgggaagtt ttaatggggg 1680 ataggggttg taatttatat ttttagtata tatggtggag taggcgtttt tatttacgtt 1740 tagtttacgt ttttttagaa tttttaaata tttttatgtt tgggtaggtt atataattag 1800 aggttattaa gtaattttta tggatttttt gagattgggg gtgggggaat tatttgattt 1860 ttagtttgga tttcgttttt atgtttttaa atggtggttg ggtggtgtgg gggatattta 1920 taggaatgaa agggttatgc ggagtttgtt tttatgtatt taggtattat aggtggatga 1980 gtattagtga gtatttgttg tgttgtagac gttgtttggg gatttgggga tattttgagg 2040 aattagttaa atttggtttt tggttttttt ttttattggt tggtgtaggg attgagtata 2100 ttagtttttg gataacggta agataataaa tgtggaaagt ttttttgaga ggtattgggt 2160 gatttttagg ggatttggtt aggaatattt tttggaggag aggaaatgtt tttttttttt 2220 tattagttaa gtggaaggga agagtatttt aggtagaggg gcggtatgag tgtggttcga 2280 gggtttggag ttgtggggtt ttgagattgt ggttattgtt ttcggagtgt tgagacgttg 2340 ttggtggttg agtttaggag ttgagatttt gttgttgatt tttgtatttt taggtaagtt 2400 atttaaattt ttgtgtttta attttttttt ttatagaatg agaatagtga tagtatttat 2460 tttgtggggt tgatggtata tagtgtgatt aaagtatata gtgtaatagt ggtatataaa 2520 gttttttaag tgagtggtgg ttaaaaatat tgtgatattg taataaaaag ggtttgtggg 2580 ttgtttttag agggtggtag gggttggcgt agttgaggaa agggaaggtg gtagggggtt 2640 gttgaggttt ggggttggtg gtatagaagt ttttgttttt ttatagtaag atttagtttt 2700 tggatttttt gggttttagg gtcgggtttt tgagggtttt gtttttagga ttagtaggag 2760 gatatttttg gggatacgta gatttgagaa ttttagggtt agttgttttg agggattcgg 2820 ttgggttggt ttttttttta ggtttttttt ttagggttag gttgaattga gttttttgga 2880 tttttgaagt taataattgt tttatttaat tttgattttt gagggtatga gaatcgaggt 2940 ttttggaggt tggtttttat tacgttttta ttgtagtttt tgtttattat cgagtttttt 3000 ttttttgggg ttgggtttag tttttttaaa gtttttttga tttagtatat tgggaaagag 3060 ggaagagtta gtggagggtt ggggagtgac gttaaggttg tttttatttt gttttgattt 3120 tttttttaag ggttttggag gtttgaataa ttcggttttt tttttagagg atgaagaagt 3180 tgggattaat taagataata gttattataa tttggttatt ttatttggaa atgtttttgg 3240 aattatatgt ttttttgtat tttttttgtt ttggttttgt ttaggttgtt gttattttag 3300 tggtttttta gttggttttt tgatttttag ttttattttt ttaatttagt ttttatattt 3360 ttttagaaat ttgattaata tcgttttgtt gaaaagttat ttatggtttt ttattatttt 3420 ttgggtaagt tttaggtttt ttaattttta gtttttggtt atttttttag ttttattttt 3480 tatttttttc gttgtgattt aattaggttt tattgatggg gttttttgtg cgtttttgtt 3540 tttgtttttg ttgttttttt tgtatggagt atttttacgt gttgaacgtt gtgaattagg 3600 atttttttta gttgttgttt ttttttagaa gtttttttgt tggttttttt tgtgttaggt 3660 gtatttttgt gtttttagta gtttagttat tatttatggt gttttgtttt tgttatttaa 3720 aaatttttaa ttatgttaaa aagtagttat tataaaatgt attattttaa ggattttaag 3780 tgtatagttt agtagtgttg agtatattta cgttgttttg taatagattt ttagaatttt 3840 gttattttgt aaaattgaaa ttttgttttt agtaaattat tttttttttt ttattttttg 3900 gtgtatggtt tatttatttt tatttttttt ttttattaga ttgtgagttt tttgagggta 3960 ggtagttggg tttttatatt tttattattt agtagggtat tagatttgta tataaatttg 4020 ttaatttaat aagtatttag tttggtgtaa aagtaattgt ggtttttgtt attaaaagta 4080 atagttatta agtatttttt atgtgttgtg atgttatttt agatagtgga gataattagg 4140 gaataataat aaaaaaattt ttgttttcgg aggttttata ttttagtaaa atgtagaata 4200 tgttagacgg tgatgaatgt tttgggggaa atgaagtagg gaggagtgag agtgtagggg 4260 tggtaagttt tagttttttt tgtttttttt tttttttgag atggagtttt gttttgttgt 4320 ttaggttgga gtgtagtggt gcgattttaa tttattgtaa tttttatttt ttaggtttaa 4380 gcgatttttt tgttttagtt ttttaagtag ttgggattat aggcgtatgt tattacgttt 4440 agttaatttt tgtattttta gtagagacgg ggttttattg tgttggttag gatggtttcg 4500 attttttgat tttatgattt attcgtttcg gttttttaaa gtgttgggat tataagcgtg 4560 agttattgtg gtcggtttta atttttagta ggagaggaga gaacgtttta ttaagtagtt 4620 gatatttgat gtaagttttg aaggtaggga ggaagtttcg tggttatttg ggggtatagt 4680 attttagata gagggaattt aggatgtaaa ggttttgggg aaggagtgtg tttggtgttt 4740 tttggtttgg gggatagtag gagattagtg tggttgtagt aggtgaggaa agcgaagtga 4800 gtttagaaag gtaataggcg agatgcggat ggggtagatt ttgcgggttt ttgaaggttt 4860 gtgtaagatg tttttggagg tttgggatag aggagtgata tggtttgatt taggttttga 4920 taggattatt ttagttgttg tgttgggaat agattatagg ggtgggtgat agatagatat 4980 ttttttttaa tgtaggattt gttgtgtagc ggtgtggaga ttggttagtt gattgttttt 5040 atttattagt atttttaggt gtgtttttgt tgtttaagtg gttatgtttt ttttggggtg 5100 gttttaggtt atgattgaat tagggggtgg ttaaggtttc gttattgttg ttcggtgtag 5160 agttgttcgt atggatagtt tttgtttttg agttttttgg gatatatttt gttgtttaat 5220 tttgtttttt ttttttttat atttatagga gttatttttt aatgtattta tttagttttt 5280 ttttagagtt tattttttag agttaggggt aggaagcgag aagatggaag tagttatttc 5340 ggggagagat ttgttagttt gggttgttgt aagattgagt agtttaaata ataaatattt 5400 attttttata gttggggagt atagaagttc gagatttagg tgttagtatg gttaagtttt 5460 tggtgagggt tatttttttt ttgtattttt atatggagga gagagagaga gattatttcg 5520 tttttatttt tttttataag ggtattaatt ttatttagga gggttttatt ttatgattta 5580 atgatttttg aaggttttat tttttaatat tattatattg gggggtagag ttttagtata 5640 tgaattttgg gaagatataa atatttagtt tatatgggga tttggattag ggtgaatgaa 5700 tataaaggaa tgttttgttt attttgggtt gtagggtggt tgtgatttta tatagtagat 5760 gtggatttga agattatatg aaattttaat tttatatgta tgattggagg gagtttgtag 5820 tgaattttta tgggtgggga aggcggaggt agaggaacgt attttgagaa cgttaagggg 5880 acgtgagggt tattttgtgg tgatttaatg tgttttggtt tttggtggtg aatagtagtt 5940 atttaatata tattggatga gattagtgaa ttgtattgtt tagaatagtt ttaggttaaa 6000 ggtaggttgt gtagggttgg aatgtttttt tttttatggt tttggtttat agtttggaga 6060 aaaggggtta ggattagaag tttagttttt gttgagcgtt aattttttgt aggaatagtt 6120 agtgatgttt tttggttatt ttgattttta agttattttt ggttaggtag ttagaat 6177 19 6219 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 19 gatttattat ggaggagata aaatgattta aattatgaaa aaagattggt ggggtgattg 60 ttataaaatt gttaaaatag tttataatta atgtttggtt tgttaaattt ataattgtgg 120 taagataata aaaattttag gtgatatatt ttttgaatat ttataaatgg tttttattta 180 atttttattt taaatgtatg ttttttggtt gtatagaaga tttttaatgt aggaaggtta 240 atgatataat aatagttaaa aggttattgg aaaatatgtt ttttttatgg ggtattgtcg 300 gagaaatttt tagtaataga gaggtatgta ttttattgga tacgttgtaa aatagttaaa 360 taggtattat aaatataata gtttaggaaa agttaattga attgattgga ttgttttggt 420 taaaggtatt attgattgat ggtaataaga tttattttta ttgtaaaata taaattgatt 480 ttttataaaa tagttattgg aaggtttatg tttttaataa taaagtttta tgtatttttt 540 ttttttataa attttgatat gatttaatag tgtaagtttt gaatgtattt tgttaaagta 600 tatttttatt aagtgaaaga agttttttat gatttattaa ttgatgataa ttaagtgttt 660 tataatatag aatttggagg tgggggtttt ttggaaataa ttttagagaa agatattatt 720 tgaattcggt tgaaagggat tatattaagt ttttttttgt agtaaatttt aaggttttga 780 attttggatt tgtatttttt aatataaaag aggttttgta gatttttgga attataaatt 840 tgttggagat tttgaaataa agttgattag ggaagttttt ttttagaagt atatggtatt 900 ttatatgtag atagtttttt taatattgta gattaagagt tttttgttat tatgaaagtt 960 tttttttttt tttttttttt ttttattttt tgtaatatta attttttttt tttttttagg 1020 aaaattttaa ataatgttag atttttttga attatatatg taaggatatg ttattaatat 1080 gtattttaga atttgtaaga aattaataga aatttaatag ttttggtata aggttattaa 1140 tcgtaatttt agttgttatt ttaaaatgtt gtatgtaata gaaataattg aatttttttg 1200 ttaatttggg atgatatttt gtggatggtt ttggtaaagt tttatggttt ttaagaaatt 1260 agagtaattg ttgggtttat gagttaatgc gtaaaaattt ggaaataatt ttattaacgt 1320 taatgtttgt gtttttaatg agagttattt tgtaatttta aggaaagaga ggaaggttat 1380 ttttgatatg ttatatatta ttgttatttg tttttttata tttgttgaaa atagtatttt 1440 gattttttta gttaataatt aaattgttat taaatataaa aaatttggat agaggggatt 1500 ggttaatggg tgtaaagtta tagttagata ggaagaataa aagttgttat tttattatat 1560 agtagaatga ttatagttaa taataatgta ttgtatattt taagatagtt agaagagatg 1620 attttgaatg ttatttttaa aaagaaatga taaatgttta aagtgatata ttatttaata 1680 attattttga tttgattatt gtttaatata tatatgtatt gagatattat attgtatttt 1740 ataaatatgt ataattatta tttgttaatt gtatataaaa gtaaaaaaaa aaaattatta 1800 gaatgatgtt tgtaaaaggt attttgtgtt ttcgggtatt gtatatttaa gacgttgggg 1860 attatttatg tgggtataaa taattgtttg tgtgatttta ttggattaaa tttagtaaag 1920 tttttttatt agatttagtg gtttgtattt ttataatatg ttatataggg attatagaag 1980 agtaagttta ttattggatt ttatttagga gttatgttaa tttgtgggtg gataaattta 2040 attgatttcg gtttaaatat tattaagtgg tttttttttt aagtttttaa gggtttatat 2100 tgggttggtg gataatttga tttgtttttt ttgttgtttt tttattggtt tagattttgt 2160 tatttggttt ggttcgtttt tatattttaa tagttttttt tgaaagtttt tataatattt 2220 tttataatta gaggttaaag tagttaataa ttaaagtaag tattaattta aaaataaatg 2280 aagataagtt agtttttatt gaggaaaggt tttaatggag gtgttggaat ttatttttgg 2340 tattagtagg gtgtttgttg tatggaattt gaaattaatt tataaattgg ggaaaatttt 2400 gaatttgtag ttagttagat tttttagggg tttatatggt agaagttatt taaatatttt 2460 tagtggatta aaatatttgt gtttaataaa tatattttat ggaatattat ataattttgg 2520 attttttttt tgtttatgtt gggggttttt gtatggtgtt gaataaaatt gaatgttgta 2580 tttatttttt ttttaatttt attattatag aaaatttaat ttaaaaggtg gtagatattg 2640 ttgttttttt aaatattgtt attgaatata ttaaggaaat tttttagggg aaaggaatat 2700 atgatatatt tatgggagta gttaatggtt ggtttgtagg tattttgagt agtgaaaggt 2760 aagttaggtt attttaaatt tttttaattt ttatgttttt ttagtggttt tttaggttat 2820 tataatttgt gttattaggt taattataaa aatggatatt tttttaaatt aggttataag 2880 gttgaattag gttatttagt gaattatggt ttttgtaaaa agtaaagtag aggttttttt 2940 ttaaagattt ttttttttat ttgattagga ataaatagta atttttttta gaagtaaaat 3000 ttatttaaag atttgttaat atttttaaat atttgttagt tgtaataaag aaattaatgt 3060 attttatgtt tttagttttt ataatttagt ttaaatattt gttttggtat gtttatattg 3120 gtttaagtgg gtattaggtt atagtttgtt tttttttttt atttagaggt gttttttttt 3180 ttttagtatt ttataagtta tttttttttt tttttgtttt tttttgtttt tgtttttttt 3240 aagaattttt aagttgttag ttaattaaga taaatataga atgtgaagtt tcgttttagt 3300 taatggaaat tagttataat agtaaggtgg acgggttagg ttataaatga ttttgttttt 3360 tttgttcggt gtatttttgt gggaaaattg ttggcgagtg tatttttttc gtagaaagta 3420 aaaatggttt tgttaaagaa attaatttta tgtttaagtg ttattttttt acggtattaa 3480 gaaataagta tttttagtag tttttaatcg ttataatgtt ttaaattaga ttatgattaa 3540 ttggatttaa atattttgaa ttatttttat tgtttgaatt ttgaattgtt taattttgat 3600 tagtttagtt tgtggagatt tttgttaagg tgtgtatttt agtttattgt tatatttttt 3660 ttcgtggtta taatagtttt tttgatgtgt tgttgttttt tcgagagttt ttaatgtttt 3720 tatgtagtta ttttttgtat attaaatggt gttattatag ttagaataat aatatgaaga 3780 aagtataatt atttaattaa tttgatattg tgatttttat attgagataa aataaggttt 3840 tggttaattt cgtaaaattg agaggttgat ttaaaggagg aaattgttat taaattaaat 3900 ttggtttaaa gttgtttttt tatttagtaa agtataatta aatttaatat gtaaataaat 3960 tgtaatgtaa tttgagagta cgttttttta ataagtggtt aagttttggt taattatcgt 4020 agcggagttt ttagtttatt ataggttgta aaaaatattg tttataaacg cggtttgttt 4080 attgttaggg gttggagttt tttgaatttt tattggttta ggatattata tgatttatgt 4140 tttttttgtt tagataaatt ttgttaaatt tgtttgaagt ttttttgtta ataatattta 4200 aatataaagt aaataaatta ataagaattt tatattatta agttatagta attagaaagt 4260 atttatttga gtgagaagat tggttaagtt gttatttagt tttttattat ttgataagat 4320 attttttttt tatgtttttt aatagtattc gttattttag aaaggttgtt ttatgatttt 4380 aaatcgttta tatgtttatt gtattgatag acgtttaacg ttaagatggg taattaaagg 4440 ttaatttttt ttttattttt tttgagtttg atttttgtat tgtaatttat ggttattaga 4500 tatttgtttt gggtgttcgt agtttatatt tatttttttt ttaggggaaa taattattgt 4560 ttacgggatt aaaataattt cgagttgatt atttggtgat attaattaac ggtgtatatt 4620 ttgggtttat tattaatata gttaagtagt atatattttt ttagagttta gatatgtata 4680 tgttattaaa ggatagtatt ttatagagtt aatattattt attttataga ataaggggtt 4740 agtggttttt tagaagaagg gtttgttttc ggttttatat tagaacgtta gtcgttaggt 4800 ttcgttgttt agtaggtttt aagttcgcgt ttattcgggt ttcggttgtt gatagttgcg 4860 agttcgcgcg tgtatattcg tttaacgttg ggacgttata gttagggtta atgggtagag 4920 cgggattcga ggtttcgttt tcgttttgtg gcgttacggg gacgtcgggg gcgcgcgggt 4980 tgtagggtcg cgtaggtttt cgtttttaga gtttggtttt tcgcggttgt tcgtttcgcg 5040 cgtttttttt gttcgggttt tttcgttgtc gtcgtcgttg ttatattatg gttttcgtta 5100 ttaggtagtt tatgcgtttc gtgttttttt cgtttatcgt ttcggtttcg gttaagaaga 5160 taatcgttaa gtacgtgacg gttatcggcg gcgggttgat gggcgtcggt attgtttagg 5220 tgagcggttt tttttgtacg gtgtttacgc gtttggttcg ttattttgag gtggaagttt 5280 tggcgcgatc ggtcgcgagg ggttgtattc gttcgatatt agggagtttt tatttcgcgt 5340 ttttcgggtg tagttgaaat atttcgcgtt tgggtttgtg agggtttaag ttttattttt 5400 tttaaaattt agggttttgg gtcgattttt agttttttcg tttggaaaat tttggttgtt 5460 tttagggttc gttgaaggtt ttatggagag tggcggtgaa tgtattttgg aagcgggtcg 5520 tgtaagagaa gaaagaattg tatgtgtata aggtttaggt ataacgcgtt tgtttttgtt 5580 cggtttaaac gggagtttgt tgttaaagat atgaattgcg attagtttta attttattag 5640 ttatttttga tttttatttt gtaattgtgt agtttttgtt aaagtagttt ttttttttaa 5700 acggtttttc ggtttttttc ggtttttttt tcgtttgtta ggttgtaaag aatagtagta 5760 gttatgattt ttgtagtatt ttgtaaagtt atttaatgga agattgttga ggttttggtt 5820 ttgatttttg aaatagtgtc gtttgtgtag agttttgagt ttgcgatttt ggcgttgtag 5880 cggaataagt tttttttttt tttttttttt tttttttttg gagtcggagt ttttttgatt 5940 taggttggag tggagtgtaa tggcgcgatt tcggtttatt gtaattttcg tttttcgggt 6000 ttaagcgatt tttttgtttt agtttttcga gtagttggga ttataggcgt ttcgttcggt 6060 taattttata tttttagtag agatagggtt ttattttgtg ggttaggttg atttcgaatt 6120 tttgattaaa ggtgattcgt tcgtttggtt tttcgaagtg ttgggattat aggcgttagt 6180 tattgtattt agtcggaata agttttttat ttattgtat 6219 20 6219 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 20 gtataatgga taaaagattt gtttcggttg ggtgtagtgg ttaacgtttg taattttagt 60 atttcgggag gttaggcggg cggattattt ttggttagga gttcgagatt agtttgattt 120 ataaggtgaa attttgtttt tattaaaaat ataaaattag tcgggcgggg cgtttgtaat 180 tttagttatt cgggaggttg aggtaggaga atcgtttgaa ttcgggaggc ggaggttgta 240 gtgaatcgag atcgcgttat tgtattttat tttagtttgg gttaaagaga tttcgatttt 300 aaaaaaaaaa aaaaaaaaaa aagagagaga tttatttcgt tgtagcgtta aaatcgtaag 360 tttagaattt tgtatagacg gtattatttt aaaggttaaa attaggattt tagtaatttt 420 ttattaggtg attttataaa gtgttataaa agttatgatt attattattt tttataattt 480 agtaagcgga gggaagatcg gggagagtcg ggaggtcgtt taggagagga aattattttg 540 ataaaggttg tataattata gaataaaaat taaaaataat tgatagaatt aaaattgatc 600 gtagtttatg tttttggtag taaattttcg tttgagtcga gtaggaataa acgcgttatg 660 tttgaatttt gtgtatatat aatttttttt ttttttgtac ggttcgtttt taaaatgtat 720 ttatcgttat tttttatgga atttttagcg ggttttgggg gtagttagaa ttttttaaac 780 gaggaagttg aggatcggtt tagaattttg aattttgagg ggagtgagat ttgggttttt 840 ataggtttag acgcgagata ttttaattat attcgggagg cgcggggtga aaattttttg 900 gtgtcgggcg ggtgtagttt ttcgcggtcg gtcgcgttag agtttttatt ttagggtggc 960 gggttaagcg cgtgggtatc gtgtagggag ggtcgtttat ttgggtaatg tcggcgttta 1020 ttagttcgtc gtcgatgatc gttacgtgtt tgacgattat ttttttggtc gaggtcgagg 1080 cggtggacga ggaggatacg gaacgtatga attgtttggt gacgaaggtt atggtgtggt 1140 agcggcggcg atagcgagga gattcgggta gggaagacgc gcgaggcggg tagtcgcgga 1200 aagttagatt ttgggggcgg ggatttacgc ggttttgtag ttcgcgcgtt ttcggcgttt 1260 tcgtgacgtt ataaggcggg ggcggggttt cgagtttcgt tttgtttatt ggttttggtt 1320 gtaacgtttt agcgttgagc gggtatatac gcgcgggttc gtagttgtta gtagtcggag 1380 ttcgagtgag cgcgggtttg agatttgttg agtagcggga tttggcggtt ggcgttttgg 1440 tgtggggtcg agaatagatt ttttttttga aaagttattg gttttttgtt ttatgaagtg 1500 agtggtgttg attttgtaaa atgttatttt ttgatgatat gtgtatattt aggttttgaa 1560 gaaatatgtg ttgtttggtt gtgttggtaa tggatttaaa atgtgtatcg ttggttgatg 1620 ttattaaata attaattcgg gattatttta atttcgtgga tagtgattgt tttttttaaa 1680 agggaaataa atgtagattg cgaatattta aaataaatgt ttagtgatta tgagttataa 1740 tgtaaaaatt aggtttaggg aaggtaaaga gagagttgat ttttagttat ttattttgac 1800 gttggacgtt tattagtgta gtgaatatgt ggacggttta aggttataga gtaatttttt 1860 tggaataacg aatattatta gaaagtatag gaaagaaatg ttttgttaaa taatggaaga 1920 ttggatagta gtttggttaa tttttttatt taggtgaata ttttttaatt attgtaattt 1980 agtgatatag gatttttatt aatttatttg ttttatgttt aaatattgtt aataaaaaaa 2040 ttttaaataa gtttagtaga gtttatttga gtaaagaaag tatgaattat gtagtatttt 2100 gagttagtaa aggtttagag agttttagtt tttaatagtg ggtaagtcgc gtttatagat 2160 aatatttttt gtagtttgta atgggttaaa agtttcgttg cggtgattgg ttaagatttg 2220 gttatttgtt aggagaacgt atttttaaat tatattgtag tttatttata tattaggttt 2280 gattatgttt tgttaggtag ggaggtaatt ttaggttaga tttaatttaa taatagtttt 2340 tttttttggg ttagtttttt agttttacga gattgattag aattttgttt tgttttagta 2400 tggaagttat aatgttaaat tagttgagtg attatatttt ttttatgttg ttattttaat 2460 tgtaataata ttatttggtg tataaaggat ggttgtatag agatattgaa gattttcgag 2520 gggataataa tatattaggg agattattat ggttacgaga aggagtatag taataaattg 2580 aggtatatat tttaatagga gtttttataa attgaattga ttaaaattaa ataatttaaa 2640 gtttaggtaa taaagatagt ttaaagtatt tgagtttaat tggttatggt ttaatttagg 2700 gtattatggc ggttaaggat tgttagaaat gtttattttt tggtgtcgta aagaaatagt 2760 atttgaatat aaaattaatt tttttagtaa ggttattttt attttttgcg gaaagagtat 2820 attcgttagt agttttttta taagagtata tcgaataaag gaggtagggt tatttataat 2880 ttgattcgtt tattttattg ttgtgattgg tttttattgg ttagaacggg attttatatt 2940 ttgtatttgt tttgattggt tagtaattta gaaattttta aaagaggtaa aggtagagga 3000 gaataaagga aggaggaagt aatttgtgga atgttgagaa gggaaaaata tttttaaata 3060 aggaagagga ataggttatg atttaatgtt tatttggatt agtataagta tgttagggta 3120 aatatttagg ttaaattgtg ggagttaaga atataaagta tattgatttt tttattatag 3180 ttagtagata tttaagaatg ttaataggtt tttgaataaa ttttgttttt aagagaggtt 3240 attatttatt tttaattaga tgaggaggaa agtttttgaa aaggaatttt tattttattt 3300 tttataagga ttatagttta ttgaatgatt tgatttagtt ttatggtttg atttaaagag 3360 gtatttattt ttgtaattag tttggtaata taagttataa taatttggag agttattaaa 3420 gaagtataaa gattagaaaa gtttggaata gtttagtttg ttttttatta tttaggatgt 3480 ttataaatta attattagtt gtttttataa atgtattatg tgtttttttt ttttgagaag 3540 tttttttaat atatttagtg gtagtgttta gagaaatagt agtatttgtt attttttaaa 3600 ttaagttttt tatagtagta aaattagagg aaaaataagt gtaatattta gttttattta 3660 gtattatgta agagttttta gtatgagtaa agaggagatt taaagttgtg taatgtttta 3720 tgaagtgtgt ttgttgaata taaatgtttt gatttattga gaatatttga gtagttttta 3780 ttatgtgaat ttttaggagg tttgattggt tataaattta agattttttt taatttatag 3840 attagtttta aattttatat aataggtatt ttgttaatgt taagagtgag ttttagtatt 3900 tttattggaa ttttttttta gtagaaatta atttgttttt atttattttt aggttggtgt 3960 ttattttggt tattgattgt tttaattttt gattatgaaa ggtattatgg gaatttttag 4020 ggaaggttat tgggatgtag gagcgagtta ggttaaatag taagatttga attagtgagg 4080 aaataataga gaaggtaggt tagattattt attaatttaa tgtaggtttt tgggggtttg 4140 aaaagagggt tatttagtgg tgtttgagtc gaggttagtt aaatttgttt atttataagt 4200 tggtatagtt tttgaataaa atttagtggt gaatttattt ttttgtggtt tttatatagt 4260 atgttgtaag ggtgtaaatt attggattta gtaaaaagat tttgttagat ttaatttagt 4320 gaaattatat aagtaattat ttgtatttat ataggtagtt tttaacgttt taagtatgta 4380 atgttcggaa gtataagata ttttttgtag gtattatttt gatagttttt tttttttatt 4440 tttatgtata attgataaat aataattgta tatatttatg gggtatagtg tgatgtttta 4500 atgtatgtat atgttgaata atgattaaat taggataatt attaaataat atgttatttt 4560 aagtatttat tatttttttt tggggataat atttaaaatt atttttttta gttattttga 4620 aatatataat atattattat tagttgtagt tattttattg tgtaatagaa tagtagtttt 4680 tatttttttt gtttaattgt aattttgtat ttattgatta atttttttta tttagatttt 4740 ttatatttgg taatagtttg gttattaatt ggaaagatta agatattatt tttagtaagt 4800 ataggaaggt aggtagtagt gatgtgtagt atattaaaga taattttttt tttttttttt 4860 ggggttgtag ggtgattttt attaggaata taggtattag cgttaatgaa attgttttta 4920 gatttttgcg tattagttta taaatttaat agttattttg gttttttgga gattataaga 4980 ttttgttaaa gttatttata gagtattatt ttaaattgat aaggaaattt agttattttt 5040 gttgtatata atattttgag ataataatta gaattacgat taatagtttt atattaggat 5100 tattagattt ttattaattt tttataagtt ttgaaatata tattaataat atatttttat 5160 atatataatt taaaaaagtt tggtattatt tagggttttt ttaaagaaag ggaaggaatt 5220 agtattgtag gaaatagaga aaaaaggaaa aaaagagaag gtttttatga tagtaaagaa 5280 tttttgattt gtaatattag gaaagttgtt tatatatagg atgttatatg tttttaggga 5340 aaaatttttt tgattagttt tattttaagg tttttaataa gtttatagtt ttagaagttt 5400 ataggatttt ttttgtgttg agaaatgtag atttaagatt taaggttttg aagtttgttg 5460 tagagaagaa tttggtatgg ttttttttaa tcgagtttaa gtaatgtttt tttttggagt 5520 tatttttaaa agatttttat ttttaggttt tatattatga aatatttggt tgttattagt 5580 tggtgggtta tgaaggattt tttttatttg gtaaaaatat gttttggtag aatgtattta 5640 aggtttgtat tattaagtta tgttagggtt tataagaggg gaagatatat gagattttat 5700 tattaggggt ataagttttt tagtaattat tttatgaggg gttaatttat gttttatagt 5760 gggaatggat tttattgtta ttaattagta atatttttga ttaaggtaat ttaattaatt 5820 tagttagttt tttttaagtt attgtgttta taatatttgt ttaattgttt tatagcgtgt 5880 ttagtgaaat gtatattttt ttgttgttag aaattttttc ggtaatgttt tataagggaa 5940 atatattttt taataatttt ttagttattg ttatattatt ggtttttttg tattggaaat 6000 tttttatata attagaaaat atgtatttaa agtggaaatt gaatgaaagt tatttgtagg 6060 tgtttaggaa atgtattatt tgaagttttt attgttttat tataattatg ggtttgataa 6120 attagatatt ggttataaat tattttagta attttataat agttatttta ttaatttttt 6180 tttataattt gaattatttt atttttttta taatgagtt 6219 21 8131 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 21 aaattgattt gaagttgtaa tgaaaaattg ggggaggtgg ttgttgatta ggaaaggatt 60 ttgggatagg ataaataggt atatttaaga tttttttaat ttttgatttt gtttaaagtt 120 attttttttt ttaatatgaa aacgaggtat gtgttagatt ggggagttag tagatagttg 180 ggatggaaga tagtataaat attaaggttt tgtttttgtt taggtttttt tgtatataat 240 tttttgagtt agaagaaggt aagatggtag ttttattgtt tttttttttt atagataatg 300 ttttgttgtt ggatggtatt gatttagtgg ttagtagtat ataagaaata gttgttattt 360 tttgagtaat tattacggtt taggtaatgt atgtggtttt tatttaattt ttatagtaat 420 tttatggggt ataggtatta ttattttaat ttttagatga ggaagtaaag gtttagagta 480 ataaataagt tattttttgt ttatggtagt ggaattatag tgtttttatt ttttattttt 540 gaagaaaatg ttatattttg attttagtat tgattatttt tttgtttttt ttttagtgaa 600 aagtagttta ttagttatgt tttataagtt taattttcgt ttgttttttt ttttattaaa 660 tggtaattta ttggaggtag cgttgtataa ataggggata gtgtgtgtat ttgtttgttt 720 gaagataaga aaagggaaag ggtatttttg gaaagtgaat tatttagttt aaaattgagt 780 agttttttta aaatatgagt tagtagtagg agggtatgga ttagttagat taggaattat 840 aggtttaatt attagttaat ggggagttaa gggaagaata gttatttatt ttttttatcg 900 tttttttata atcgttttgt ttgtttatag ttttattttt tttatgttgt gattttgtga 960 gaggagtatt agtgaaagag tgaagagata aagtataaaa tgtgtgagat tagtttatat 1020 ttgtattttg tttttgataa aagttaattt ttttgagatt tggttttttt gtttataaaa 1080 tgggaaaaaa ttatattaat agggttttaa ggattattat aatgtggata aagttttgat 1140 ttagtataat gttattatat agaagaatga gttagtggta gtagttatta atgtgatgtt 1200 agtttatgtg ttataaatga tgttgtattg aggggtggag ggatggggga cgggtgtaga 1260 tgtaagagga gatagttttt agaggaatgt gtatttagga gggattattc gggttttatt 1320 aattattagg tttttatagg aaatttgggt tttaggtatt tagagttttt ttagggtttt 1380 tggatttttt ttatttttga aagatgagaa atagttgttt tgttgatgtt gttaatttac 1440 ggagagttgg gaagttttat aaattttata agttattgtc gtaaattgga agagatagag 1500 ggggattttt ttttgttagg cgttgtagtt gtgttttttt atttagtttt tatagtagtt 1560 ttagtagagg ttgtgtttcg tttatttttt ttaggtattc gttattttgt tgtatattta 1620 tagagttttg ttgtaagtat ttgagatttt gtttgaggat tttttttggt ttgtgttggt 1680 ataagttgag agtattaggg agttagtgtt tttgggatag tttttagtta gtggaagtgg 1740 gaggatagat attttagttt ttttatttag tgagggataa ttttaaggta tattttattt 1800 attttttagg gttttttgtg ggagtgaatt tttttaagtt tttagtaata attaacgtat 1860 atttttttgg tttttttttt tttttatttg gtttttagtt ttttttttgt atttttttga 1920 ttaggattgg gattagggtg atgagttttt atttttgggt ttatttaagt gtaaggttgg 1980 tattcgtatg aatttgagag ggttttttta tattttgtat tttaggtata ttatttgtat 2040 tgttttgatt ttggttttgt tttggattat tttttaaata aagttatttg tatttaaatt 2100 aggtttgttt ttgggtttat ttaatttaaa gtaaatttta tgaagatatt agtttttaag 2160 ttttatataa ggaaaatcga ggtttagagg aataagaaat ttgtttaagg ttttttagtt 2220 ggtaatgaga tgggattttg aaattaggtt tgtttgattt tagagttgaa gttttttgta 2280 ttatagtata ttatttttta ttttttattt tagttataaa attaatgatt taagggaaat 2340 tttaggtttg gatgagttta tttttgtttg tgaattaggg tagttattgg ttttaaggtt 2400 gttagtagat gggaatttgg ggaggggaag gtaggtagta agtggatgag agggttgtag 2460 ttgttagtgg aaagatggat tagtggaaag attgttgaaa ttatatgtat taggaagata 2520 gtaagagttt gtttgttttt ttttagtttt aaaagttttg gatttttttt ttttttgaga 2580 tagttttgtt ttgttattta ggttggagta tagtggcgtg atttcggttt attgtaattt 2640 attttgtttt ttaggttcga gtaatttttt tgttttagtt tttcgagtag ttgggattat 2700 aggtgtatat tattacgttc ggttaatttt tttaattttt agtagagacg gggttttatt 2760 gtattggtta ggttgattat gaatttttga ttttaagtga ttcgtttatt tcggtttttt 2820 aaagtgttgg gattataggc gtgagttatt atgtttggtt agtcgtggat tattgagatt 2880 gtgggagggt tttttaattt aataaaaatt aattgatatt tgttttttgt tagataaaga 2940 attgaggttt gaggttgtac gggtgaataa gaaatatttt ttgggagttt atagtataat 3000 ggggaagaag aatatataaa tagatgtttt taataaatag atataaatgt agtgatataa 3060 gaatatgtat tataatacgg aattaataag tagattatat ttagttgggg tcggttagga 3120 ggagtttttt agagaagggt tttttattgt cgttgatgat tataatttaa gggatgagga 3180 aaaatgaggt gaaaaggtgg gagaggttaa agggagggtt attttagata agttagtgta 3240 aataaagata taatagaagt agttcgatgt gtgtaggaga gttgtaaggt atatttacgg 3300 tataaagggt gtggaataaa ttgggggagt ttattgagga tttttgtgtt tggtatgggt 3360 attgtgagtg gtgagaagtt tgtgagtaag cgtagaggga aggtttgatt ttttagttta 3420 tcggtagtgt tttggttgtg tttatttttt ttttagtaaa ttgttttttt ttatttttta 3480 gttttatttt tatagttgga gattggtatt aaggggttat gagggaattt cgtgaggatt 3540 tgtttttttt tttgttggtt agtggttatt tggtgtttga agagaatcgt tggtagttgt 3600 agtgtttttg ttatagttag gttgttttag ttgtttatag attttaagtt tagttatttt 3660 ttttttttta ttggttttga tttagatttt ttttggtatt ttgattaggg aattaggatt 3720 tttgtttttg ggggtttgga tatagatttt ttagaaacgt agatgaagag ttttggttat 3780 gtttgttagg ggtatatttt tattttggtt taagaaatgg taggttattt gtatgaatta 3840 tagttgggtt ttttatagtt agttttatat tttttttttt taattgaata aagttgaaag 3900 ggattgggat tttaggttag gtaggatgtt gtgttgtttg tgatagttat tttatttttt 3960 gttattttat tttttatttt tttgtttttt atagtttata tgtttggttg gtatttagta 4020 aattttatag taggattgat gtttggtatg ttttttggtt tttttatgtt attattgata 4080 gaggagttat tatttttggt ttttattttg atgttatgtg gaggtttatt atttgtggat 4140 agagttattg ttgataaggt agtttgaagt tttaaagtgt atttatgttt ttaataaaga 4200 ttgttgtagg ttgtttagta ttttatattg gtgttttaag gttttgtgtt tttgaggaga 4260 aatttttata gaaaaatagt ttgttcgtta atagttttat agtagtttaa tatttttttt 4320 tttttagtag agaagattta agatgtgaat ttattttttt tgcgtagttt atagattaaa 4380 ggttagattt cgtagtttgt ttgttatttt tttttttatt atatattttt attttggtgt 4440 atttttttta ggcgtttgga gttgtatttt attgttgtgt gtgtgtgatt tgtggttgtg 4500 tatatgtttt ttattttgtt aaggattatt tttgttagta tattgttgtt ttttttttaa 4560 gatttagttt ttttagttag ttttgtttat tttttgtaga gttagttttt ttcgtttgtg 4620 tttttatatt gttttttgtt taaaagtatt tattataatt tttttaggtt aggcgttttt 4680 agtttttttt aggggcgagt tattatttta gaatttatta tatttgtaaa ataaatagtt 4740 tttagtattg tagagggaat ggtttaaaat tttagattta gtttaacgtt ttatttcgcg 4800 gtaattattt tgtttaagtt tttattatag ttttgtttag tttgggttat ttttagggta 4860 ggtttggaag gaagtgtagt tttttgaatt agttgatgtt tggtaagtgg tggtggagga 4920 aaagggtggg gtttgaggat attataattc gggttatttt tgagtgttgt ttttggttat 4980 tggggtgttt tatattgtta gataagagtt tagatttgag gagagtgatt agtttttttg 5040 tgttttaggt aagtatttcg gtttaaatta cgtgttgttt tttttatagt tgttttgttt 5100 tttatttttt cgtttggtta atattaggtg aagtggatat cggaaagatt aagttagtgg 5160 tttttttttt tgtttgagat ggggtttttt tttttattat ttagattgga gtatagggta 5220 tagttaggtt tattttagtt ttgatttttt gggtttaagt gattttttta ttttagtttt 5280 cggagtagtt gagattatag gcgtatatta ttatatttag ttaatttttg ttattttttt 5340 ttagcgatgg cgttttgtta tgttgtttag gttagtttta tatttttggg tttaagtagt 5400 ttgtttgttt tagtttttta aagtgttggg attataggtg taagttatta tatttagttt 5460 gttagttggt tttcgatggt agtttttaat attagtagag gtttttgggg tattttttag 5520 gaggaaaatt tatttcgtgt agtttattta gttaagggaa gttacggggt ttttaggtaa 5580 atagattttg ggttttgggg atattgtagt gaaggagata tgtttttttt tatagggaat 5640 tttagtggga agagatagag ttgaatatat ttatttagta tataaatatt agggttattt 5700 ggggattgtt ttatagattt tgttatgtaa aaatgttgaa taaatattga atggatgagg 5760 gaatgaatga gtgagtgaat gaataaatga attagttggg ttttgagaaa gatacgtgtg 5820 tagtttttag tttttttcga aggtaattgt tttagttatt ttattttatt tttgaaatag 5880 atttgtagta tagaataaga attttatatt tttatttgat agatttggaa atttagtata 5940 ggtatgtatg gtttggggag atttattaga agttgatttg ttgttttatt aaataaaaaa 6000 ttatttattt tttttgtttt taattttgga aaggtatatt agtatatatt tatattagat 6060 tttgtgtcgg ttatgagtgt agaggtgatt aagttgggtg gggtaaggag gtgaagaaat 6120 tagaagtaga gttgttagtt taggaggttg ttgtaataat taggtcggag gatggtttgg 6180 tgtagtgtgt gggaatgggg aggaggggat gtagaggaga gtttttagag agtttgagat 6240 ttaattgtat agaggaggtg agggtgaggg atgcgcgtag gtagttcgaa cggtcgtgtg 6300 agtgagtata tttcgatgtt tttagttaag gtggagaata gaagagtttt gtgggggtaa 6360 ggtgatggaa aaatgagtat ggtttgttga atttgaggag tttttttatt atttagatag 6420 tgatgtttaa tagattattg ggatttagga ttaggttgag gttaaacggt agaatttggg 6480 agttttgata tagttattaa tgaaattttg ggaatgggcg agataaaggg agtgtagagg 6540 gagggtatga acgaaatttg ggaattttat tgtttgaacg gaacgagaaa ttatttgatg 6600 atagattata gagagattta ggaaggagat ttaggagtag attgtcgtga aagttatagg 6660 atagggggaa ttttgtatta agagaatgat tattggggtt ttgtatgttt gagagagggt 6720 agtagagttg gggattgagg aaaaggtttg ggatttggtt gttagggagg ttatcgtgta 6780 ttacgtggag gttaaattta gtgagtatag tgggagtagg taaggagggg agtgtagggt 6840 tgggaaggta ttatattttt agaagttttg ttgttgtaag gaagggaggt aaagtgattt 6900 agtggataga tgtttttttt tatattgggt tttttgttgt gttttttttt ttttttattt 6960 ttaaagagta tttgatttat tgagggtttt tttgggatta tggaaatagt aatattattt 7020 ttagttcgga tgagcgaagt atttgatatt tttatagttt tttatagtgt gtaaggattt 7080 taattttttt aatttttata gaattgagtt ttttatgtta tagaggaaat ggagaattat 7140 agagttttag tttagattta attatataaa tttgaatgta tatttgagta agtttttttg 7200 ttttcgtgat tttattgttt tatataattt tttgatatat gttggtttta ttttatagat 7260 gaaaagtttg gaggttgaga tggggtgtag ttgttttgtg gagagtaggg tttttatttt 7320 tgagtatagg gttttttttg ttttgtatta ttttattgtt aaaatttatt tgatgtttat 7380 gttgtatatt atattttata aagtattttt ttaggtgtta ttttatttag tgtttataat 7440 aattttgtga gggtagatat tatttttttt tgttttatgg atggaagttg aaatttaaag 7500 aagttataaa tgacgtttaa ggttaggtta ttagtggaat ttttttttga agtatagatt 7560 tatttttgtt tatgattttt gttgttttta ggatgaaatt tatgtgtttt agtttggtat 7620 aatggttgtt ttttttttag tttgtttgtt tttttggtag gtttttggtt ttttttttgt 7680 tttaagtttt tagtatgttt ttgatttttt aattatagta gtatgtttat ttattatatg 7740 tggttatttt gtttattgtt tgtgttaatt atattgtgat tgttgatgag attgtgaggt 7800 ttttgagggt agggtttagg tttgttttat ttgtattata acgtttagta tagtaggtat 7860 taggaattgg tgaatgttaa tgaatgatag aattaacgaa tggtatttgg attgaaatta 7920 gtttttttag tgttttttta ttagatatgt ttgtgaaaaa taagggtttt ttggttgatt 7980 gttataggat ttttgatggt tggaggtttt gaattttgtt tttagttttt tttttggttt 8040 tttttaaaag gaaggaagtt ggtttgggtt atagattttt agggtttata gagtaaatgg 8100 ttgatttagg ttgttttttt ttttttatag g 8131 22 8131 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 22 tttatgggag aaaagggata atttgggtta attatttatt ttataggttt taggagtttg 60 taatttagat taattttttt ttttttgaag gggattagga aggaagttgg gagtagaatt 120 tagaattttt aattattaaa gattttgtag tagttaatta gaaggttttt gttttttata 180 agtatgttta atgagagagt attggaaagg ttgattttag tttaaatgtt attcgttaat 240 tttgttattt attgatattt attagttttt gatgtttgtt atgttggacg ttgtggtata 300 gatgaagtag atttaggttt tgtttttagg gattttatag ttttattaat aattatagta 360 tgattagtat aggtagtgag taagatggtt atatgtaata gatggatatg ttgttgtggt 420 tgggaggtta gggatatgtt agaggtttgg aataaagagg gaattaaaga tttgttagag 480 aagtaggtag gttggaaaag ggatagttat tgtgttaggt taaggtatat gaattttatt 540 ttgaaggtaa taggggttat ggataggggt ggatttgtgt tttagaaagg ggttttatta 600 gtgatttgat tttggacgtt atttatgatt tttttgaatt ttagttttta tttataaaat 660 aggaggaaat aatatttatt tttataaggt tgttgtgagt attaaataga ataatatttg 720 gggaaatgtt ttatgagatg tagtgtgtaa tataaatatt aggtgggttt taatagtgaa 780 gtgatgtaga gtagaaagag ttttgtattt agaggtggga attttgtttt ttataaggta 840 gttgtatttt attttaattt ttaggttttt tatttgtgaa atgggattaa tatgtattaa 900 agggttgtgt ggggtaatga gattacgaga gtaaaggaat ttgtttagat gtgtatttag 960 atttatgtag ttgaatttga attgaaattt tatgattttt tatttttttt ataatatgaa 1020 aagtttagtt ttgtgaggat taaaggagtt agggtttttg tatattgtaa ggaattgtag 1080 aaatgttaga tatttcgttt attcgagttg gaggtggtat tgttgttttt atagttttaa 1140 gggagttttt agtgagttag gtgtttttta ggggtggggg aaaagggaaa tatagtagag 1200 ggtttaatat gggaagagat atttgtttat tgagttattt tatttttttt ttttgtaata 1260 gtagaatttt tggaaatata gtattttttt aattttatat tttttttttt gtttattttt 1320 attatgttta ttaaatttgg tttttacgtg gtatacggtg atttttttaa tagttaaatt 1380 ttaagttttt tttttagttt ttaattttgt tgtttttttt taggtatgta aagttttagt 1440 agttattttt ttgatataga attttttttg ttttgtggtt tttacggtag tttgttttta 1500 ggtttttttt ttgagttttt ttgtagtttg ttattaagta atttttcgtt tcgtttagat 1560 aatggggttt ttaagtttcg tttatgtttt ttttttatat tttttttatt tcgtttattt 1620 ttaaggtttt attaatagtt gtgttagggt ttttaaattt tatcgtttgg ttttagttta 1680 attttaaatt ttagtggttt gttagatatt attatttgga tggtggagaa gttttttaaa 1740 tttaataagt tatatttatt tttttattat tttattttta taaagttttt ttgtttttta 1800 ttttgattgg agatatcgaa gtgtgtttat ttatacggtc gttcgggttg tttgcgcgta 1860 ttttttattt ttattttttt tatgtaattg gattttaggt tttttaagag tttttttttg 1920 tatttttttt tttttatttt tatatattgt attagattat ttttcggttt gattattata 1980 atagtttttt aaattgatag ttttgttttt agttttttta tttttttatt ttatttaatt 2040 tgattatttt tgtatttatg gtcggtatag ggtttggtat aggtatgtgt taatgtgttt 2100 ttttaaaatt ggaagtaagg ggagtgggta gttttttatt taataaagta ataaattagt 2160 ttttgataaa tttttttaaa ttatatatat ttatgttgag tttttaaatt tgttaaatag 2220 gggtgtggaa tttttgtttt atgttgtagg tttattttaa ggataaaatg aggtaattgg 2280 ggtaattatt ttcgaaaagg attaagggtt atatacgtgt tttttttaag gtttagttag 2340 tttatttatt tatttattta tttatttatt tttttattta tttaatattt atttagtatt 2400 tttatatgat agaatttgtg aagtaatttt taagtagttt taatatttat atgttaggta 2460 aatgtattta gttttgtttt tttttattga gattttttgt ggggagggat atgttttttt 2520 tattgtagta tttttagagt ttagggtttg tttgtttaag ggtttcgtgg ttttttttag 2580 ttgaatgggt tatacgaagt gagttttttt tttgaaaagt attttaggga tttttattga 2640 tgttgggagt tgttatcgag aattagttgg taggttgggt gtggtggttt gtatttgtaa 2700 ttttagtatt ttgggaggtt gaggtagata gattgtttga gtttaggaat gtgagattag 2760 tttgggtaat atggtaaaac gttatcgtta gaaaaaaata ataaaaatta gttgggtgtg 2820 gtggtgtgcg tttgtagttt tagttatttc ggaggttgag gtgggaggat tatttgaatt 2880 taggaggtta aggttggagt gagtttgatt gtgttttgta ttttagtttg ggtgatagag 2940 agagagattt tattttaaat aagaaagaga attattggtt taattttttc ggtgtttatt 3000 ttatttggtg ttgattaaac ggagggatga ggaataagat agttgtggaa ggaatagtac 3060 gtaatttaga tcgaagtgtt tatttgggat atagagaagt tagttatttt ttttaggttt 3120 gagtttttgt ttggtaatat gaggtatttt aatgattaaa agtaatattt aggggtgatt 3180 cgagttataa tatttttaag ttttattttt tttttttatt attatttatt aaatattagt 3240 taatttagga agttgtattt ttttttaagt ttgttttaag agtagtttag gttaggtaag 3300 gttgtggtga aaatttgagt aagatgatta tcgcgaagtg gagcgttgaa ttgggtttaa 3360 gattttgggt tatttttttt ataatgttga gggttgttta ttttgtaaat atagtgagtt 3420 ttgaggtggt ggttcgtttt tagaaggagt tggaggcgtt tagtttggaa aggttatggt 3480 aagtattttt gagtaagagg taatgtggga gtataagcgg aagggattga ttttgtagag 3540 agtgggtagg gttagttgaa gaagttgagt tttgaagaaa gaatagtagt atgttgataa 3600 aagtggtttt tgataaagtg gagagtatgt gtataattat aaattatata tatatagtaa 3660 tgaggtgtag ttttaggcgt ttgaagaggg tatattaagg taggaatata tagtgggaga 3720 ggaggtgata ggtagattgc ggagtttagt ttttagtttg taggttgcgt agggagagta 3780 ggtttatatt ttaggttttt tttattggaa gaaggggagt gttaggttgt tgtggagtta 3840 ttggcgaata agttgttttt ttgtgggaat ttttttttaa aggtatagaa ttttggggta 3900 ttaatgtaga atattagata gtttgtaata atttttgttg aaggtatgga tatattttaa 3960 agttttaggt tgttttgtta gtagtaattt tatttataga tagtaggttt ttatatgata 4020 ttaggatgga gattagagat agtggttttt ttattagtag tggtatgaag aggttaggaa 4080 atatgttaaa tattagtttt gttgtgaagt ttattgggta ttaattaggt atataggttg 4140 tgaaaggtag ggaagtgggg gatggggtgg tagagggtag agtggttgtt ataaataata 4200 tagtattttg tttagtttgg gattttagtt ttttttaatt ttgtttagtt gggagaggag 4260 aatgtggaat tgattatgaa aggtttagtt gtgatttatg tagatagttt gttatttttt 4320 gagttagggt gaggatatgt ttttgataag tatggttagg gttttttatt tgcgtttttg 4380 gaaggtttgt gtttagattt ttaggagtag gggttttggt tttttagtta gaatgttagg 4440 gaaagtttgg gttaaggtta atggagggag aaggatggtt gagtttgagg tttgtgagta 4500 gttgggatag tttggttgta gtagaggtat tgtagttgtt agcggttttt tttagatatt 4560 agatggttat tgattaataa agggaaggat aagtttttac gaggtttttt tatagttttt 4620 tagtgttaat ttttaattgt agagatggag ttaaggaatg aggaaaggta gtttgttggg 4680 ggagaggtgg gtataattag agtattgtcg atgggttggg aggttaggtt ttttttttgc 4740 gtttgtttat aggtttttta ttatttatag tgtttatgtt aggtatagag atttttaata 4800 agttttttta atttgtttta tattttttat atcgtgaatg tgttttgtag tttttttata 4860 tatatcgagt tatttttgtt gtgtttttgt ttgtattgat ttgtttggaa tgattttttt 4920 tttggttttt tttatttttt tattttattt ttttttattt tttaaattat aattattaac 4980 gataatgagg agtttttttt tgaaaagttt tttttggtcg attttagttg agtgtggttt 5040 gtttattggt ttcgtattat gatgtatgtt tttgtattat tgtatttata tttgtttatt 5100 aaaggtattt gtttatgtgt tttttttttt tattgtatta tgggttttta gagaatgttt 5160 tttatttatt cgtgtagttt tagattttag ttttttattt ggtaaggaat aagtattaat 5220 taatttttgt taaattgaag agttttttta taattttaat agtttacggt tggttaagta 5280 tgatggttta cgtttgtaat tttaatattt tgggaagtcg aggtggacgg attatttgag 5340 gttaggaatt tatgattagt ttggttaata tagtgaaatt tcgtttttat taaaaattaa 5400 aaaaattagt cgggcgtggt ggtgtgtatt tgtaatttta gttattcggg aggttgaggt 5460 aagagaattg ttcgaatttg ggaggtaggg taagttgtag tgagtcgaga ttacgttatt 5520 gtattttagt ttgggtgata gagtaagatt gttttaaaaa aaaaaaaagt ttagggtttt 5580 tgaaattgag aggaagtaag taagttttta ttgttttttt ggtgtatatg gttttagtag 5640 tttttttatt agtttatttt tttattgata attataattt ttttatttat ttattatttg 5700 tttttttttt tttaaatttt tatttgttaa taattttaag gttaatagtt attttgattt 5760 ataggtaaaa atgagtttat ttaaatttga aatttttttt gagttattag ttttgtgatt 5820 gaaatgagaa gtaggaagta gtgtgttata gtatagaaag ttttagtttt ggggttaggt 5880 agatttggtt ttaaaatttt attttattat taattgaaag attttagata aattttttat 5940 ttttttgagt ttcggttttt tttgtataaa atttggagat tgatgttttt ataggatttg 6000 ttttaggtta ggtaaattta gaggtagatt taatttgaat gtaaataatt ttatttggga 6060 agtgatttag gatagggtta gaattagggt aatgtaaatg atatgtttag ggtatagaat 6120 gtaaagagat ttttttaggt ttatacgggt gttaattttg tatttagatg aatttaagaa 6180 taaaggttta ttattttagt tttagttttg attaggaaaa tatagaagag gagttggaag 6240 ttaggtagga agagaaagaa gttaaggaag tgtacgttaa ttgttattgg gagtttagag 6300 aggtttattt ttatagggaa ttttgagaaa taggtagaat gtgttttaga gttgtttttt 6360 attgagtgag gaagttgggg tatttatttt tttattttta ttggttgaga gttgttttag 6420 gggtattaat tttttggtat ttttagtttg tgttaatata aattaagaga agtttttagg 6480 tagagtttta ggtatttgta ataggatttt gtgggtatat agtagaatgg cgaatgtttg 6540 ggggaaatgg gcgaggtata atttttgttg gggttgttgt aaggattaaa tgaaaaagta 6600 taattatagc gtttaataaa gagaagtttt tttttatttt ttttaattta cggtaatagt 6660 ttgtgaagtt tatggagttt tttagttttt cgtgagttgg tagtattagt agaatagtta 6720 ttttttattt tttagaagta aaagaaattt aggggtttta ggagaatttt agatgtttgg 6780 gatttaagtt ttttgtggaa gtttgatggt tgatggagtt cgagtagttt tttttgagta 6840 tatatttttt tgaaaattat ttttttttgt atttgtattc gttttttatt tttttatttt 6900 ttagtgtaat attatttgtg atatatagat tagtattata ttaataattg ttgttattaa 6960 tttatttttt tatgtgatga tattgtgttg gattaaagtt ttatttatat tatggtaatt 7020 tttagaattt tgttagtatg attttttttt attttatgga taagaaagtt aggttttaga 7080 gaggttaatt tttattagaa gtagggtgta gatgtaggtt gattttatat attttatatt 7140 ttgttttttt atttttttat taatgttttt tttataggat tatagtatgg ggagaataag 7200 attgtgggta aataagacgg ttgtgaggag gcgatggggg aagtgggtag ttgttttttt 7260 tttgattttt tattagttaa taattaagtt tgtggttttt ggtttggttg atttatattt 7320 ttttgttgtt gatttatgtt ttagggaaat tgtttaattt taagttaaat aatttatttt 7380 ttagaagtat tttttttttt tttttatttt taggtaaata gatatatata ttgttttttg 7440 tttatatagc gttattttta ataaattgtt atttaatgaa agagaaaata agcgagagtt 7500 aagtttatgg gatataattg ataaattatt ttttattaga agaaaaatag gaaaataatt 7560 aatattggag ttaaaatata gtattttttt taggaatgaa gagtaggggt attgtggttt 7620 tattgttatg gataaaaagt ggtttatttg ttattttaag tttttgtttt tttatttgga 7680 aattgagatg ataatattta tattttatag ggttgttatg aggattaaat gaaggttata 7740 tatattgttt ggatcgtagt agttgtttaa aaaataatag ttatttttta tgtgttgtta 7800 gttattaggt tagtgttatt taatagtaag atattattta tggaaggaaa agatagtgag 7860 attgttattt tgtttttttt taatttaaaa ggttgtgtgt aaagggattt aggtaggaat 7920 aaggttttaa tgtttgtgtt gttttttatt ttagttattt gttaattttt tagtttaata 7980 tatatttcgt ttttatgtta aaagaaaaga taattttgga taaaattaga agttaggaga 8040 gttttgagtg tgtttgttta ttttgtttta agattttttt ttggttaata gttatttttt 8100 ttagtttttt attataattt taaattagtt t 8131 23 8168 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 23 gagtttggtg gttttgtttt tagtttggtt tgtgtgtttt ttttttgtag tgcgtggatt 60 cgtttatttc gcgttagtac gtatagggag ttttatttag taagtatatt tattatattt 120 ttaaagacgg tgttataggt tatgaatttg ttgtataggt tatagatgtt tagaatttgt 180 ttgtcggagt tttgtgaatt tttgttggta aattttgatt tgtataggaa agaaaaagta 240 ttagatgttt ggatattttt gttttatttt ttttattttt ttttttatga taattttggt 300 gtatatttta tttagtataa attatttttt tggttttttt tattttataa tatgtagcgt 360 tgtgtcggta gttgtatata gagaatatat aaatttgatt ttatttttta ggattttata 420 attaatttaa gtaatagatt agaaaattaa gtatattaat atatttattt atttagaaaa 480 taataattta atatatggta tatgtaaaat attgtgtttg gaattgaatg aaagtaaaat 540 aaattagtat ttaataggga gtatttttat tatgtagaag attttattta ttttttaaaa 600 aaataaaatt aaaataaaat agaaaatttg tattttacgt tttttagtat tttttaattt 660 ttttattgtt gaattttttg tttttttgtt taatttattt tgataaaaga gttaaaaaat 720 aaaataaggt cgggcgtagt ggtttacgtt tgtaatttta gtattttggg aggacgaggt 780 aggtagatta cgaggttagg agatcgagat tattttggtt aatacggtga aatttcgttt 840 ttaataaaaa tataaaaaat tagtcgggta tgggggcggg tatttgtagt tttagttgtt 900 cgggaggttg aggtaggaga atggcgtgaa ttcgggaggc ggagtttgta gtgagtcgag 960 atcgcgttat tgtattttag tttgggtaat agagcgagat tttattttaa ataaaataga 1020 ataaaaaaag taggtttaaa ttttttggag tattttagta tgttagggtt atgtagtaaa 1080 tatttgtagt aaaaatattt attttttagt taaaaaaagt attgtaatta attttagtta 1140 taagtgttat tggttgggtg tagtggttta tatttgtaat tttagtattt tgggaggtcg 1200 aggcgggtag attatttgag gttaggagtt tgatattagt ttggttaata tggtgaaatt 1260 tcgtttttat tgaaaatata aaaagtagtt aggcgtggtg gtatatgttt gtaattttag 1320 ttatttagga ggttgaggta ggagtattat tggaatttag gaggcgaggt tgtagtgagt 1380 cgagattacg ttattgtatt tttgggtgat agagcgagat tttattttaa aaaaaaaaaa 1440 tagaaatgtt atttatataa tatcggagta ggagtaggag attggtagta tttaggtatt 1500 aggattttaa aattaggcgg attttgggga ataagtttag tttttttttt gttttttttt 1560 attgagtttt tatttgggag aaatttttcg gttacgggag ataatgataa ggtagttttt 1620 aaattagtgg gtaatgagtt tatggttttt aaaggcgaag tagggtttac gtttattagg 1680 ttggtataag tagatatatt tattttcggt tataatgaat tgtaggtttt gagaagggtt 1740 atttagggtt gagtagcgta ggttataatt atgggtgttt aattttacgc gagggtagtt 1800 ttttttagaa attatatagg attgttagaa gtaataaagg ggttaatagg tttttttgag 1860 gaggtaattt taagttttta taaaggtatt tttattttta tattggtttt tttttttttt 1920 ttggtatttt aaagtttttt ttttggttgt tggttttttt tattaattat tatttattta 1980 ttaaatatat aattagagat tataattttt ttttttgtat atattattat tatttagtat 2040 agaaattttg taagtaagaa aaatgtaata atttattatt ttattaagag tatttttgag 2100 agagtagatt gttgtaaatt tggggtatta ggaataagaa aggtaaagat atttgtttaa 2160 cgttatttaa aaagttagtt agaaaatagg tcggtgtagt ggtttatgtt tgtaatttta 2220 gtattttggg tggttgaggt aggtggattg tttgggttta ggagttcgag attagtttgg 2280 gtaatatggt gaaattttta tatttagaaa aaatataaaa attagttagg tatggtgata 2340 tatgtttgta attttacgta tttaggaggt tgaggtggga ggattatttg agtttaggag 2400 gtagaggttg tagtgagttg agatagtatt attgtatttt agtttgggtt atatagtaag 2460 attttgtttt aaagaaaaaa aaaaaaaaaa gttagttaga aataaaattt aagggttagg 2520 tgcggtggtt tacgtttgta attttagtat tttggaaggt taaggtgggt ggattatttg 2580 aggttaggag ttggagatta gattggttaa tatggtgaat ttttgttttt attaaaaata 2640 taaaaattag ttgtatatgt tggtgtgtgt ttgtaatttt agttatttag gaggttagag 2700 gtaggaaatt tgtttgattc gggggagatt ggggtaatag tgagttaaga tttcgttatt 2760 gtatttaagt ttgagtaata tagtgaaaaa aatggttttg ttgggtgggg gtttgaataa 2820 gtaaaatttt taaaattttt taagaatggg ggtaagataa aattaaaaaa aaagtttatt 2880 ttttattttt tttttttttt ggttttaggt ttggggaatt aaaaaaaata atggtattaa 2940 ttttttaatc gttcggaaaa ttttaatttt gttaaaaatt aaaattaaat taatttaaat 3000 aaaataaggt ttaaattatt aatggttggg ggtttattcg gaggttaaaa aatttttttt 3060 ttttttttat ggaggtttgt gatgggagtg gaaagtatga agaagtttga gtttaagttt 3120 ttggaatttt agttagattt agagggtatt ttgggtgttt tttttttttt ggagtgatgt 3180 taatagatgg tttttgacgt attaaagggt atgaaatttt attattaaag tatttgtttt 3240 aagattttta ttttattttt tttttttttt ttatttaaag atagggtttt attttgttat 3300 ttgggttgta gtgtagtggt ataaatatag tttattgtag tttgaatttt tgggtttaag 3360 ggattttttt tttttagttt tttgagtagt tgggatgata ggtgtatgtt attatgttta 3420 gataattttt aatttttttt ttttttggaa aaaaagttta attttggtgg tcggggtttg 3480 agtgaaaggg ggcgatttcg gttaattgaa attttcgttt tttaggttaa agcgattgtt 3540 tttttttatt tttcggagta gttgggatta agggtatgta taattatttt tagttaattt 3600 tgttttttaa gtaaaaaggg ggttttttta ttttggttag ggtgtttttg aatttttaat 3660 ttaaggttta attttaaaat ttttaaaaat gtaaaaatgg ggtttaataa tttttgttta 3720 gggtggtttt aaaattttgg ggttaaataa tttttttttt tttggttttt aaagtggggg 3780 gaaaataagg gtgaattttt tatttaagtg ggtgattttt aataattatt atttttaatt 3840 atttttaata ttataggggc ggggcgtatt tttttaattt taatattttg ggaggtcgag 3900 gtgggggaat aattttgagg ttaggaattt aaaatttttt ttaataaaaa ggaaaaattt 3960 tatttttatt taaaaaaaaa aaataatcgg gttttgtggg gggtgttttt aattttaatt 4020 aatcgggggg gttaggtaag aaaatttttt gaattcggga ggcggaggtt gtagtgaagg 4080 gaaattgggt ttttttaatt ttttttcggg taaaaaaaag gaaaattttt ttttaaaaaa 4140 aaaaaaaaat tatgtttatg ggaaagtatt ttttttaata agtttttttt ttattatatg 4200 tagcgtttgt gtttttattt tagttatttg tttttaggta tgatttttaa tttttttgaa 4260 ttagtttttt tattttaaga attgaaatgt tggttgggtt agtggtttac gtttgtaatt 4320 ttagtatttt gggaggttaa ggcgagatga ttgtttgagt ttaggagttc gagattagtt 4380 tgggtaatat agtgaggtta ttttttcgtt gtttttataa aaaaatttag aaattagttt 4440 tacgtggtga tgtgcgtttg tagttttagt tgtttgggag gttgaggtgg ggggatcgtt 4500 gaagtcggga ggttaaggtt gtagtgattc gtggttatgt cgttgtattt tagtttgggg 4560 atatagtgag atttcgtatt aaaaagaaaa atgttgttta ttttaaggtt gtagtaaagt 4620 taagtttgaa tagagtaaag gaagcgttat agaagttgta ttatttgttt atgttatagt 4680 tggggaatgg ggtggtcgaa tggggaggtt tattgtcgta atgttttaat tttcgtttag 4740 agggagggat ttttttttcg agggagggcg tcggaagtga cgcgaggttt tgcggagatt 4800 aggagttaga ttgtaggacg atttcgggtt ttacgtgttt tcggtattcg tcggtcggag 4860 ttttcggttt ttcggggtcg ggggatttta gtggtattta tatatagttt attttttaag 4920 cggagttatg tttggtaacg gtaatgcggt tgtaacggcg gtgagtgttg agtcggtgat 4980 tagtatattt tgggtttttg gacgattcgt gtagcgattg gttttaggtt gttattttta 5040 gttgtttatt ggttagaacg gttatttttt tttttttttt tttttttttt ttggttcgag 5100 tagtttttaa agggttagta gttcggttgt ttttcggaag gaatggggaa attagagagc 5160 ggtgatattg ggttaagagt ggaaggattg tttggaacgg aatttcggtt tttgcgggta 5220 tttgggtggg atttttatta ggtttgggat gtacggtttt agatttagtg atttagatta 5280 agaacgttcg tttatataga cggggttttt ttattcgagg ttgggttgag gcggatgtag 5340 atacggtttt tttgggaaga tacgttttat ttttgattta taggagagag tattagttaa 5400 gttttcgaat tgtatataaa cgttttagaa gtgcgttttt tttttgtgtt atagtggttt 5460 tttagttata gttaacgttt taagttttta gttgtgatat atttattgaa ttattatcgt 5520 gggtgggagg tcgtcgtggg tttttttatt acgagtttgt ttgtcgagtt ttgggtttgt 5580 gtatagataa attgtagagt tggtggaggt tattgttagg tcgagataag aaagagatgg 5640 ggagttgtta attttttttt gtttagtttg ttggtgaggg ttgggatttt tgtttttgta 5700 gttattttag agttttggat taggagtagg aagatttgaa ttgtggtttt aatttttttt 5760 cggttattag ttttgtgatt ttaggtaagt tattttattt tttgatgtta ttcgttgttt 5820 ttgtaatatg gttttaaagg tgtttgtttt gtttatttga taggattttt gagacgataa 5880 taatatgtaa aagtaatagt tttaatatag aagtgtttag tgttttattt tttaatgaaa 5940 cggtttgatt tggatatgtt gtgtatattt aatgaattta aggaattgtt tgaatttagt 6000 agttttggga ttttagagtt ttttttgtgg gttttttgtg gtttagaatt ttggtggtta 6060 cgtttaatat taagtttagt ttaatttgta aagggttttt tagggttaat ttattggagt 6120 gattatatgg agtagattag agtttgaggg tagaaagttg ttatttgttt cggtaataga 6180 ggttttagat gtttgggtgt aaaagaattt tatagtattt cgattaatat ggtgaaattt 6240 cgtttttatt aaaaatataa aaattaggtc gggtatagtg gtttatgttt gtaattttag 6300 tattttggga ggtcgaggta ggtggattgt ttgagtttag gagttcgaga ttagtttagg 6360 gaatatagtg aaatttcgtt tttattaaaa atataaaaaa ttagtcgacg tggtggtatg 6420 cgtttgtagt tttagttatt tgggaggtta agataggaga atcgtttgaa tttgggaggt 6480 ggaggttgta ttgagtcgag atcgcgttat tgtattttag tttgggtgat agagcgcgat 6540 ttttttttaa aaaaagaaaa aaaaaaaaat tatttttttt tttttatata tatatatata 6600 ttttagttgg gtatggtggt gtgcgtttgt agtagtttta gttatttggg aggttgagtt 6660 aggagaatcg tttgaatttg gaaggtagtg gttgtagtta gttgagaata tgttattgta 6720 ttttagtttg ggtaatagag ggagattttg ttttaaaaaa aaaaaaaaaa ggaattatat 6780 aggatgaata ttttagatta gggaatgttg attgtcgata gtattagtat ttatagtggt 6840 tattgtttga tgtagagaat gggattaggt taggcgtgtg tttacgtttg taatttcgag 6900 tattttggga tggttgggtg tagagaggat atattaagtt cgatgattat gtttgtgtta 6960 atatagtaga aatttttgtt tttatataaa aatgtagaaa attagttgtg gtatgtgtgg 7020 aatatgtttg atagttttag attagaattt atggggtgga ggtttgtagt gagtttagat 7080 tacgttattg tattttagtt tgagtaaaat agtgagattt tgtttaaaaa aaaaaaaaaa 7140 aaaaaaaaaa atggggattt tcgttttaaa aggaaaaatt tagttttagg tgtttagcgg 7200 ggaatatttt tggtttaggg tattttgggg gggggaaaag gggtgttttt ttgagttttt 7260 gattggggtt ttggtttgta aatattttta tgttggtgaa attagaggta gtattttagg 7320 tgtacgaatt ttaggtagcg tagtttttta gttttatgga atatttgagg tagaagaaat 7380 ttgagtttaa tttttttatt ttatagatga ataaatagat tttgatggga tagtgtattt 7440 aaggttattt agttaagagg ttgagtagga ttgtacgtta gattcgttta ttttagtttt 7500 taatgtatgt agtttagtta agattaaagg ggatttttaa ttattgttaa gttttttttt 7560 attgtgggga tttttatttt tttgattttt tttgtagtta gatatttggg ttttttgttg 7620 gagaaggtgg tagtttgttg tttttagatt ttagtttatt ttatgtggta tttggatggt 7680 attgaaattt ttttaagtgt tttgtttgtt gtagataatg aatttatttt ttagtgattt 7740 agtataggtt ttttagtgtg gttttggttg ttttgttttt gttagttgta ggttttattt 7800 tttttgtggt taggttgatg ggttttattt ttttatttat ttggttgtgt atagtatttt 7860 tattgataat tgttttggtt aaggtgggtt ttagggttta gtgttttggt tattgtagcg 7920 gtagtaatag taggttttat tatcgttttt ttttagtttt tgtttttttg gatttttgag 7980 gagggtagaa ggtattgagg aaggttaaag ggattagttt tggagtattt ttttattttg 8040 agatttagtt ggttataggt taggttttga agtttttttt ttttaagtta gtgattttgg 8100 tttttggata aggtgttgag gaatattaga aatagagggg attgtgattt ggggattttt 8160 tttgtagg 8168 24 8168 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 24 tttgtagaaa aagtttttag gttatagttt tttttgtttt tagtgttttt taatattttg 60 tttaagaatt agaattattg gtttggaaga aaggaatttt agaatttggt ttgtggttag 120 ttgagtttta gagtggggaa atattttaag gttggttttt ttaatttttt ttagtatttt 180 ttgttttttt tagggattta gagaagtaga gattagaggg aggcgatagt aggatttgtt 240 gttgttgtcg ttgtagtaat taggatattg agttttgaag tttattttga ttaaggtagt 300 tgttagtggg agtgttgtgt atagttaggt gggtaaagag ataaggttta ttagtttggt 360 tataggaagg gtggggtttg tagttggtag gggtagggta gttaggatta tattggggaa 420 tttgtgttga gttattggag gatagattta ttatttataa tagataaggt atttgagaaa 480 attttagtgt tatttagatg ttatatggag tagattagag tttaagagta gtaagttgtt 540 atttttttta gtaagaggtt tagatgtttg gttataaaag aagttaagag gatgaagatt 600 tttatagtgg ggaaaagttt gatagtaatt aagggttttt tttaattttg gttggattgt 660 atgtattaag gattgaggta aacggatttg acgtatagtt ttgtttagtt ttttggttgg 720 gtgattttgg gtatattgtt ttattaggat ttgtttgttt atttataaaa tgaaaaggtt 780 ggatttaggt tttttttgtt ttagatgttt tataagatta ggaggttgcg ttgtttaaag 840 ttcgtgtatt tagagtgttg tttttggttt tattaatatg gaaatattta taggttagag 900 ttttagttaa ggatttaaga ggatattttt tttttttttt ttaaagtatt ttggattaaa 960 agtatttttc gttaaatatt tagaattgaa tttttttttt taaaacgggg gtttttattt 1020 tttttttttt tttttttttt tttagataga gttttattgt tttgtttagg ttggagtgta 1080 gtggcgtgat ttaggtttat tataaatttt tattttatgg gttttaattt ggaattatta 1140 ggtatgtttt atatatgtta tagttaattt tttatatttt tatgtagaga taggggtttt 1200 tattgtgttg gtataggtat ggttatcgaa tttagtgtat tttttttgta tttagttatt 1260 ttaaagtgtt cgggattata ggcgtgagta tacgtttagt ttgattttat tttttatatt 1320 agatagtagt tattgtagat attgatattg tcgatagtta atattttttg atttgggatg 1380 tttattttat gtagtttttt tttttttttt ttttgagata gagttttttt ttgttgttta 1440 ggttggagtg tagtggtatg tttttagtta attataatta ttgtttttta ggtttaagcg 1500 atttttttga tttagttttt taagtagttg ggattattat agacgtatat tattatgttt 1560 agttaaaata tgtgtgtgtg tgtaaaaaaa aaaaaataat tttttttttt tttttttttt 1620 gagggggagt cgcgttttgt tatttaggtt ggagtgtaat ggcgcggttt cggtttagtg 1680 taatttttat tttttaggtt taagcgattt ttttgtttta gttttttaag tagttgggat 1740 tataggcgta tgttattacg tcggttaatt ttttgtattt ttagtagaaa cggggtttta 1800 ttgtgttttt taggttggtt tcgaattttt gagtttaggt aatttatttg tttcggtttt 1860 ttaaagtgtt aggattatag gtatgagtta ttgtgttcgg tttaattttt atatttttag 1920 tagagacggg gttttattat gttggtcggg gtgttatgga gtttttttgt atttagatat 1980 ttggggtttt tattgtcgaa gtaggtgata gttttttgtt tttagatttt ggtttatttt 2040 atgtgattat tttaataaat taattttggg agattttttg taaattaggt taggtttgat 2100 attaaacgtg gttattaaaa ttttgggtta tagggagttt atagaaagga ttttaaggtt 2160 ttagaattat taggtttaaa taatttttta agtttattga atgtgtatag tatatttaag 2220 ttaaatcgtt ttattaaaaa ataaaatatt gagtattttt atgttgaagt tattgttttt 2280 gtatattgtt gtcgttttaa aaattttatt aggtggataa gataggtatt tttgggatta 2340 tgttatagaa gtaacgggtg gtattaaggg atgaggtgat ttgtttaggg ttatagagtt 2400 aataatcgaa agagagttgg ggttataatt tagatttttt tatttttagt ttagggtttt 2460 ggaatgattg taagagtaaa gattttagtt tttattaata ggttggatag ggggagatta 2520 gtagtttttt attttttttt tatttcggtt tggtagtggt ttttattagt tttgtagttt 2580 gtttgtgtat aagtttaggg ttcggtaagt aggttcgtaa tggaaaggtt tacggcggtt 2640 ttttatttac ggtagtaatt tagtaggtgt gttatagttg gggatttgga gcgttggttg 2700 tggttgggag attattataa tataaaaaga aggcgtattt ttaagacgtt tgtgtgtagt 2760 tcggaggttt ggttgatatt tttttttatg aattaaaagt ggaacgtgtt tttttaaagg 2820 ggtcgtattt gtattcgttt tagtttagtt tcgaatgaaa ggatttcgtt tgtgtagacg 2880 aacgtttttg gtttgggtta ttaaatttag agtcgtgtat tttaggtttg atgggaattt 2940 tatttagatg ttcgtaggga tcggagtttc gttttaaata atttttttat ttttaattta 3000 gtattatcgt tttttgattt ttttattttt ttcggagggt aatcgagtta ttggtttttt 3060 aaaagttatt cggattaaaa aaaaaaaaaa aaaaaaaaaa aagatagtcg ttttgattaa 3120 taaataattg aggatggtaa tttggggtta atcgttgtac ggatcgttta gaagtttaaa 3180 gtgtgttggt tatcggttta gtatttatcg tcgttgtagt cgtattgtcg ttattaaata 3240 tggtttcgtt tggaaagtag gttgtgtgtg ggtgttatta aggtttttcg gtttcgggaa 3300 gtcgggggtt tcggtcggcg agtatcgggg atacgtggga ttcgaggtcg ttttatagtt 3360 tgatttttgg ttttcgtaga gtttcgcgtt attttcggcg ttttttttcg aaggggaggt 3420 tttttttttt gggcgggaat tggaatattg cgatagtgga tttttttatt cgattatttt 3480 attttttagt tgtgatatga gtaagtagtg tagtttttat ggcgtttttt ttgttttgtt 3540 taaatttagt tttgttataa ttttgaaata ggtagtattt ttttttttga tacggggttt 3600 tattgtgttt ttagattaga gtgtagcggt atgattacgg gttattgtag ttttgatttt 3660 tcggttttag cgattttttt attttagttt tttaagtagt tgggattata ggcgtatatt 3720 attacgtggg attaattttt agattttttt atagagatag cggggaggtg gttttattat 3780 gttgtttagg ttagtttcga atttttggat ttaagtagtt atttcgtttt ggttttttaa 3840 agtgttggga ttataggcgt gagttattgg tttagttagt attttaattt ttaaaatgag 3900 gaaattggtt tagagagatt aaaggttatg tttaaagata agtaattgaa gtgggagtat 3960 aaacgttata tgtagtgaga aaagggtttg ttaggaaaag tgttttttta tgaatataat 4020 tttttttttt ttttggaaag ggattttttt tttttttgtt cgggggggga ttggaagggt 4080 ttaatttttt tttattgtaa ttttcgtttt tcgggtttaa gaaatttttt tgtttaattt 4140 tttcgattag ttgggattaa gggtattttt tataaaattc ggttattttt tttttttggg 4200 taaaaataag gttttttttt tttattgggg ggggttttga atttttgatt ttagggttat 4260 ttttttattt cggtttttta aagtgttggg attaaagggg tacgtttcgt ttttgtaata 4320 ttaaaaataa ttaaaaataa taattattaa aaattattta tttgggtggg gggtttattt 4380 ttattttttt tttattttag gaattaaggg ggggaggatt gtttggtttt aggattttga 4440 aattattttg ggtaaaggtt attaaatttt atttttatat ttttaaaaat tttaaaatta 4500 ggttttaggt taagagttta aaaatatttt gattaaaatg gaaaaatttt ttttttattt 4560 aaaaaataaa attagttggg ggtggttgtg tatgttttta attttagtta tttcggaggg 4620 tgagggagga taatcgtttt aatttgggag gcggaggttt tagttagtcg aaatcgtttt 4680 tttttattta aatttcggtt attaaaatta aatttttttt ttaaaaaaaa aaaaaattaa 4740 aaattatttg ggtatagtga tatatattta ttattttagt tatttaggag gttgagggag 4800 gaggattttt tgagtttagg agtttaagtt gtaatgagtt atgtttgtat tattgtatta 4860 tagtttaggt gatagagtga gattttgttt ttaaataaaa aagagagaga gagtaaaata 4920 agaattttaa gatagatgtt ttaatggtgg gattttatgt tttttgatac gttaaaagtt 4980 atttgttggt attattttag ggagaaggag gtatttagaa tgttttttaa atttaattag 5040 aattttagga gtttgaattt agattttttt atgtttttta tttttattat aaatttttat 5100 aagaaaaaaa aaaaaatttt ttaattttcg ggtgagtttt taattattaa taatttggat 5160 tttattttat ttgggttaat ttaattttaa tttttggtaa aattagggtt tttcgggcgg 5220 ttggggggtt gatgttatta ttttttttaa ttttttaagt ttagggttaa ggaaaaaaaa 5280 gggtgggggg tgggtttttt ttttggtttt gttttgtttt tatttttaaa aaattttgga 5340 aattttgttt gtttaaattt ttatttaata aaattatttt ttttattgtg ttgtttaggt 5400 ttgagtgtaa tggcgagatt ttgatttatt gttattttag tttttttcgg gttaagtaaa 5460 ttttttgttt ttagtttttt gagtagttgg gattataggt atatattagt atgtatagtt 5520 aatttttgta tttttagtag agataggggt ttattatgtt ggttagtttg gtttttaatt 5580 tttgatttta ggtgatttat ttattttggt tttttaaagt gttgagatta taggcgtgag 5640 ttatcgtatt tggtttttga attttatttt taattagttt tttttttttt ttttttttga 5700 gataggattt tgttgtgtaa tttaggttag agtgtaatgg tgttgtttta gtttattgta 5760 atttttgttt tttgggttta agtgattttt ttattttagt tttttgagta cgtgggatta 5820 taggtatgtg ttattatgtt tggttaattt ttgtattttt tttagatatg ggggttttat 5880 tatgttgttt aggttgattt cgaatttttg ggtttaagta atttatttgt tttaattatt 5940 taaagtgttg gaattatagg tatgagttat tgtatcggtt tattttttaa ttaatttttt 6000 aaatgacgtt ggataagtat ttttattttt tttgtttttg gtgttttaga tttataatag 6060 tttatttttt taggaatatt tttgataaag tagtagatta ttatattttt tttatttgta 6120 gaatttttgt attagatagt gataatatat atagagaaag aaattgtgat ttttggttat 6180 atatttaata gatgggtaat ggttaatgaa gaaggttagt agttaagaga aagattttag 6240 aatgttaaga gggaaaaaag agttagtatg gagatgggaa tatttttgtg aaggtttaga 6300 gttatttttt taaaggagtt tgttaatttt tttgttgttt ttggtagttt tatatagttt 6360 ttggaaaaga ttattttcgc gtggagttgg atatttatgg ttgtggtttg cgttgtttag 6420 ttttaagtga ttttttttag gatttgtagt ttattgtggt cggggatgag tgtgtttatt 6480 tgtattagtt tgatgaacgt gggttttgtt tcgtttttga gggttataag tttattgttt 6540 attggtttag aggttatttt attattgttt ttcgtgatcg gaaggttttt tttaagtaag 6600 gatttagtga gaagggatag ggagagggtt ggatttgttt tttagaattc gtttgatttt 6660 aaaattttaa tgtttggata ttgttaattt tttattttta tttcggtgtt atgtaggtaa 6720 tatttttgtt tttttttttt gagatggagt ttcgttttgt tatttaggag tgtagtggcg 6780 tgatttcggt ttattgtagt ttcgtttttt gggttttagt gatatttttg ttttagtttt 6840 ttgaatagtt gggattatag gtatgtgtta ttacgtttgg ttattttttg tatttttagt 6900 agagacgagg ttttattatg ttggttaggt tggtgttaga tttttgattt taagtgattt 6960 attcgtttcg gttttttaaa gtattgggat tataggtgtg agttattgta tttagttagt 7020 gatatttata gttagagttg gttataatgt tttttttaat tgaaaaatgg atgtttttat 7080 tgtaggtatt tgttatatag ttttagtata ttagaatgtt ttagggaatt tggatttgtt 7140 ttttttgttt tgttttgttt gagatggagt ttcgttttat tgtttaggtt ggagtgtagt 7200 ggcgcgattt cggtttattg taagtttcgt ttttcgggtt tacgttattt ttttgtttta 7260 gtttttcgag taattgggat tataggtgtt cgtttttatg ttcggttaat tttttgtatt 7320 tttattagag acggggtttt atcgtgttag ttaggatggt ttcgattttt tgatttcgtg 7380 atttgtttgt ttcgtttttt taaagtgttg ggattatagg cgtgagttat tgcgttcggt 7440 tttgttttgt tttttaattt ttttgttaaa ataaattggg tagaggaata agggatttag 7500 tagtggagaa attagaaagt gttgggaaac gtaggatgta agttttttgt tttgttttgg 7560 ttttattttt ttaaggggta agtggggttt tttgtatgat gaaagtattt tttgttagat 7620 gttggtttgt tttgttttta tttagtttta ggtatagtgt tttatatata ttatgtattg 7680 gattattatt ttttaaatga atggatatgt tagtgtattt aattttttaa tttgttattt 7740 gggttaattg taggatttta aagggtaaga ttaggtttat gtgtttttta tgtataatta 7800 tcggtatagc gttgtatgtt atgggatgag agggattaga gaggtgattt gtgttgggtg 7860 aaatgtgtat taaagttatt atgggaaagg aaatagggga gataagatag agatgtttaa 7920 atatttggtg tttttttttt tttatgtagg ttagagttta ttagtaggga tttatagagt 7980 ttcgataagt agattttaaa tatttatgat ttgtgtaata agtttatagt ttatagtatc 8040 gtttttgagg atgtagtgga tgtgtttgtt gagtggggtt ttttgtacgt gttgacgcgg 8100 gatgggcggg tttacgtatt gtaggagaag gatatataga ttaaattgga ggtaaggtta 8160 ttaggttt 8168 25 5690 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 25 aattttattg ttttgttatt tattgaggtt tttttttagt attttgtttt ttttattcga 60 tatttttttt tttttttatt ttttatattt tgtgttgtaa gtatattatt tgttttttag 120 gtagaagcga gtatttattt ttattttttt ttttattttg aaattattta tgatatgata 180 ttttagaaat tcgatttttt tgttagtggg agtatatttt ttatatttat taaaaatttt 240 aagaatttta tatttggtat gtaatacgat attttttagt tttttgtaaa agatgtttag 300 agaaatatgt atgttggtat tttataagtt aatacggata ttttttatat taatagttag 360 tgtttgtttt tttttggtaa atggtatggg agttgttgtg tagatattta ttagtaaaat 420 tgtagaggtt tttaattttt tatatttggt agaataagtt tatgagttat ttaatttaaa 480 gtatttaatt attagtgttt tgaaatttag agggaaaaag atatggaaaa agataataat 540 ttttggaggt tttttttgtg tgtgtgtgta tatttatgat gtattagtgt tttatgtttt 600 ttttttgatt gaaataaaat aataaaagtt gattatttat aatgaaagtt attttataat 660 aattttaaat gttttttatt atattttata atttttttta tataaatgtt agtttttttt 720 tttttaaaat attttttaaa tttatagtga aagatattaa ttttgagagt ttattttatg 780 atagatagtg tgttaagtgt tttagttttg tatattttag gatataggat gagtttataa 840 attgaagtaa aaatttaaaa agggatttta tatgggtgat gtaatattta ggattaattt 900 ttatgatatt tagttttatt taaatttaaa ttggttaaaa aatagatgtt gtttgacgtt 960 ttatataaaa ttgagaagta ttaaatattt ggaaaataga gttattttag aatttataga 1020 ttaatttttt ttgttattga aagtttcgtt gaataaatat tttataagaa ttttaaatat 1080 tgattaatga aaaggaagag ttttgtttta taaaattaat gaatataaat tataatatag 1140 aaatatttat tttaatgaat ttgaataagt atatgaaata attttttttt tttaaagtga 1200 tatatgttgt ttaggtgatt tatggatttt ttgaaatttt tattatttaa ttagttattt 1260 ttagatatta tggtttttgt aatggataat tatgttaaag tattttttaa ttattattta 1320 gagatatgaa tgatttagtt attattgttg attaaagagt taaaggaaat ataaaattat 1380 tgtaaatttt ttaaaattat ttttgaaaaa taggttttgg aaataacgaa gtttttttta 1440 attttatcgt taaatttgat aatgatattt tgtttattat tattttagtt ttttaattat 1500 gtttttttaa tattatgagt tttgagttat taatttagat tttaagaatt taaaaaatgt 1560 gtggaataaa ataagaggtt tatttttcgt tttagaggaa aagttaattt ttgatgaaaa 1620 ttaattttta ttttattttt taaaatttga gtatggataa agggtaacgt tagtaagaaa 1680 tttatataga aaagaaaagt agtttgatta cgatgatatt ttttatagta tgttagtatt 1740 tttttttttt ggaggatatt tgtttttttt ttttttttat taggtaatat ttgtaaaggt 1800 taggatgtga gatgtgtgtg agataatgta tgtgtaaata gatttgtttt atattttatg 1860 gatgaaatat tttttttaat ttaaaaagta aaaaggtggt attttttaat agtttaattt 1920 tttaaaatta gtaaattttt gtttttttga ggtttttttt ttgttttgtt ttgttttata 1980 atagtagttt ttatatataa ggtttgtttt tgagttgatt tagaataatt aattatagta 2040 gtttattaat ttataagtga tttataagtt attagtttaa gtaaagataa tttgtattta 2100 aaagagttgg taatgtttat attaaagtta agattattat aattaaagaa atttgttttt 2160 tgtttgtatg gtttaataaa ataagattat tggtttattt ttgggaagtt tggtatattt 2220 gattatatta taatatttat tgagtatttt ttttgttttt aggattaaaa aattaataag 2280 atagtttttg atttttaaga gtttagatta atgaagagta agattaatcg tttttcgtta 2340 tatatttata tttaaattag tttttttatg ttattataga ggttataata aaatttaaaa 2400 gttattgttt taaagtttta agtatgaaga attttaattt ttatttaata tttattgatt 2460 ttttgatttt taattttaga tgaatatatt agtatattgt tttttttgtt ggttgatatt 2520 tttttaagtg tttttagtat tttattttga agtataacgt taataatgta taatttttta 2580 tgtttagtta tagaatgttt acgtgtgatt tggttataat atattgtttt atttaggttt 2640 ttaataaaat tgattttttt taaatggatt tgtagttgtt gaattttaaa ttaatatttt 2700 attttaaaaa tagaaaagga ggggaagggt ggagggaggg gaatagagag ggtataagag 2760 gtaaaaaaag aaaaagagga aaataaatgt ttgtaaataa gttaaattaa ataaaagaga 2820 tataaagtaa ttttttaaaa gaaggaatga tattttaagt aagaattaaa tatttaggta 2880 tgtataaatc gttttcgttt ttttagatcg gttttttttt tttttttata tatttagtat 2940 aaattttagg tgagggggta gagaggggtt ggtattgttt gattaaatat attttgtttt 3000 ttttttgagt ggtagaattt tagagtttga ttaaatgtta cgaaagggtg ttggtggaag 3060 ttaggatgag aagaaatgta atttaataga tttggagaaa tgatgttgta gatattaaga 3120 atagagaaag ttggaaattg gtaatatggg gaggatagtt gggttagaaa ggaaaaatag 3180 gagaatatag aagaaatgtt atgagaaggg aaaataagag atgttttatt tattattatt 3240 tatttcgggg taggtttttt tgtataaggt tatttttagg ttatattata tataaaagag 3300 ttatatttga ggtttgtata gtattgttat aattatagtt ttaaaaggtt aaggttttat 3360 gatggtaggt ttaaaaaatt ttttttaaaa tatttaataa aataaggggt atttattttt 3420 ttttggttta tattatttga aagttaaaag atagttttcg gttttattta ggtttttttt 3480 tattttattt tttgttgttt tttatttttt ggtaaatttg gtgaattttt tgttagtgtt 3540 gttttttagt aggtttttat taatagtttt gaatgaatat tttattagtt tttatttatt 3600 aatagttttg aatgaatatt ttattagttt ttattttgta gtagaatgta tacgtttagg 3660 ttttagtaaa agttttttag taaagtttta gatttattta gattatatgt tatttatggg 3720 ttaagtattg gttttagagt atatgtgttt aaattggttt tatttagttt atgtgattat 3780 ttataaggcg taatatgggt agtttgtttt ttatatagta tttagaaata ttattttgat 3840 tgtggtaaat attgtttaat tataattttt tttttaggtt ttttttattt atatttttta 3900 ttttatttat agtaaaaatt aaaatgttag ttttagtttt aaggttgtag ttgtttgtta 3960 gattttattt taatttattt ttttttttat ttatgtgttt taattatttt tgttttttga 4020 atgttttttg aacgtttaag gtagttttta gtttaaggtt ttgttatttt ttgttttttt 4080 atttggaata atttttttta cgtatatttt tatgttttat tttttggtat tttttaaatt 4140 ttagcgagtg tttttttttt ggtgtgtttt tttttttttt aaattaatta atttaaaatt 4200 ggagtttttt ttttgtattt attgggtttt ttttttattt tagttttttt agggtattta 4260 ttataattta atagattgta tgttttattt atgtatttaa ttttttatat atgttatttt 4320 aatttttatt aaaatataag atttttgaga gtaagtaagt attagaatag taggaaatat 4380 attatagtta tttagtgaat tattttttga gttaattaat taatggatga gtgaattaat 4440 atagtttttt gagcgggaaa ttttgtataa ggtttagtta aaagggaaat tgagtgggtt 4500 aggtattacg gatattatat attttattgt atgatttttt tgtttatatt agaagacgtt 4560 tataagttta ttttaaagga tattagttgg aatttttttt ttattaatta ttaagagaat 4620 tatgaataag ttgtttatta tttgatttat tatttaattt tgatttttag ttttttatat 4680 ttgaaagaag atataatata ttttttatag gattttggga ttattaattg aatttatgtg 4740 tgtaaaagga atttatataa tgaaagtatt agaaataatt attatattta taattattgt 4800 atttttatat gtttaaaata tagttataat tagtttattt aaatttaagt gtaaaagtaa 4860 aatgatttgt tttcgttttg ttttttttgt ttaggggatt atggatattg aagtatattt 4920 tgaaagaatt ggttataaga agtttaggaa taaattggat ttggaaatat taattgatat 4980 tttttaatat tagattcgag ttgttttttt tgagaatttt aatatttatt gtggggatgt 5040 tatggattta ggtttagagg ttatttttga ttaagttgtg agaagaaatc ggggtggatg 5100 gtgtttttag gttaattatt ttttgtattg ggttttgatt attattggtt ttgagattac 5160 gatgttggga gggtatgttt atagtatttt agttaaaaaa tatagtattg gtatgattta 5220 tttttttttg taggtgatta ttgatggtag gaattatatt gtcgatgttg ggtttggacg 5280 tttatattag atgtggtagt ttttggagtt aatttttggg aaggattagt tttaggtgtt 5340 ttgtgttttt cgtttgacgg aagagaatgg attttggtat ttagattaaa ttagaaggga 5400 atagtatatt ttaaatgaag aattttttta ttttgatttt ttagaagata gtaaatatcg 5460 aaaaatttat ttttttattt ttaagtttcg aataattgaa gattttgagt ttatgaatat 5520 atatttgtag atatttttat tatttgtgtt tattagtaaa ttattttgtt ttttgtagat 5580 tttagatggg gtttattgtt tggtgggttt tatttttatt tataggagat ttaattataa 5640 ggataatata gatttaatag agtttaagat tttgagtgag gattttgagt 5690 26 5690 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 26 atttagagtt tttatttaga gttttgaatt ttattagatt tgtattgttt ttataattga 60 attttttatg ggtgagggtg aagtttatta aatagtgaat tttatttggg gtttgtaagg 120 aataaaatga tttattagta aatatagatg atggagatgt ttgtaggtat gtatttatag 180 atttaaaatt tttaattgtt cgaggtttaa gagtaaagga gtagattttt cggtatttgt 240 tgttttttag gagattagaa tgaagaaatt ttttatttgg aatgtattgt ttttttttga 300 tttggtttag atattagaat ttattttttt tcgttaaacg gaagatataa ggtatttgag 360 gttgattttt tttagaaatt aattttagag gttgttatat ttggtatgag cgtttaaatt 420 tagtatcgat aatgtagttt ttgttattaa tggttatttg taggagaagg tgaattatgt 480 tagtgttgta ttttttggtt ggagtgttgt aaatatattt ttttaatatc gtggttttaa 540 aattaatagt ggttagagtt tagtatagaa gatgattgat ttggagatat tatttatttc 600 gatttttttt tataatttga ttaaaaatgg tttttaagtt taagtttatg gtatttttat 660 aatggatgtt aaggttttta aagggaatag ttcggatttg gtgttgaaga atgttagtta 720 atgtttttaa gtttaatttg tttttagatt ttttatagtt aattttttta agatatgttt 780 taatgtttat gattttttaa gtaaggaaaa taaaacgaaa gtaaattatt ttatttttat 840 atttggattt gagtaggtta attatggtta tattttaaat atgtaaaaat ataatggtta 900 taagtataat aattattttt agtgttttta ttgtatgaat tttttttata tatataagtt 960 tagttaatag ttttagaatt ttgtgagaaa tgtattatgt ttttttttaa gtgtgagaag 1020 ttggaaatta agattaaatg atgagttaaa tgataaatag tttgtttatg gtttttttgg 1080 tgattaataa aagagagatt ttaattggta ttttttaaaa taggtttata aacgtttttt 1140 gatgtaggta ggagaattat gtaatagagt gtatagtatt cgtggtattt gatttattta 1200 attttttttt tagttgagtt ttatataaag tttttcgttt aaagaattgt attgatttat 1260 ttatttattg attgattaat ttaagaaata gtttattgaa tagttataat gtgtttttta 1320 ttgttttagt gtttgtttat ttttaaaaat tttatatttt agtgggagtt ggagtgatat 1380 atataggaaa ttgaatatat ggataaaata tgtaatttgt tagattgtag taagtgtttt 1440 gggaaaatta aagtaaagaa aggatttagt aagtatagag ggagagtttt aattttaaat 1500 tagttggttt aaaaaaaaaa aaaatatatt aaaaaaaaaa tattcgttaa gatttgaagg 1560 atgttagaga ataaggtata aggatatgcg tgaggaggat tgttttaagt aggaaaatag 1620 aaaataataa ggttttaagt tggaaattgt tttgagcgtt taaaaaatat ttaggaagta 1680 agggtaattg gagtatatga gtaagaagga gagtggattg agatgagatt tgataggtaa 1740 ttgtagtttt ggagttaaga ttggtatttt ggtttttatt gtaagtgaaa tgagaaatgt 1800 aaatgagaga ggtttgagag aagggttgta attgagtaat gtttgttata attaaagtga 1860 tgtttttgga tattgtgtag agaataggtt gtttatattg cgttttatgg atagttatat 1920 ggattaggtg ggattaattt gaatatatat gttttaggat tagtgtttgg tttatggata 1980 atatatgatt taagtagatt tgagatttta ttgaggaatt tttgttgaaa tttaagcgtg 2040 tatattttgt tataaggtag aagttggtgg ggtatttatt taaagttatt ggtgagtaga 2100 agttggtggg gtatttattt aaagttattg gtgagaattt attgaagaat aatattaata 2160 aagagtttat taagtttatt aagagatgaa aaataataga aggtagaatg aggaaagatt 2220 tgaatgaagt cgaaagttat tttttaattt ttaggtaatg tgaattaaaa aaaaataaat 2280 gttttttatt ttgttaaata ttttagaaaa ggttttttaa atttgttatt atagagtttt 2340 aattttttga gattatgatt gtaatagtgt tgtatagatt ttaggtataa tttttttgta 2400 tgtggtatgg tttgaggatg attttgtata aagggatttg tttcgagatg aatggtgata 2460 agtggagtat tttttatttt ttttttttat aatatttttt ttatattttt ttattttttt 2520 tttttgattt agttattttt tttatattgt tagtttttaa ttttttttgt ttttggtgtt 2580 tataatatta tttttttaaa tttattagat tgtatttttt tttattttaa tttttattag 2640 tattttttcg taatatttgg ttaagtttta aagttttatt atttagagag agaataagat 2700 gtatttagtt agataatgtt aatttttttt tgttttttta tttagaattt gtattgagta 2760 tgtaaagaag agagagaagt cgatttaaaa ggacgaaggc ggtttatata tatttggata 2820 tttgattttt gtttagaata ttattttttt ttttaagaaa ttattttata ttttttttat 2880 ttggtttaat ttgtttataa gtatttgttt tttttttttt ttttttttgt tttttgtatt 2940 ttttttgttt tttttttttt attttttttt tttttttttg tttttaagat aaagtgttga 3000 tttggaattt agtaattgta agtttatttg aaagaagtta gttttgttag aggtttggat 3060 agagtaatat gttgtaatta aattatacgt gaatattttg tggttgaata taagaaattg 3120 tgtattatta acgttgtgtt ttaaggtgga atgttgaaag tatttggaaa gatgttaatt 3180 aataggaaag ataatatatt aatgtgttta tttagagttg aaaattagaa aattagtgaa 3240 tattaagtag aggttaggat tttttatatt tgaaatttta aagtaatgat ttttaagttt 3300 tattgtgatt tttgtgatag tatggaaaag ttgatttggg tgtgagtgtg tggcgggggg 3360 cggttaattt tgttttttat taatttgaat ttttagaggt tagaaattgt tttgttaatt 3420 ttttaatttt gaaagtaaaa aaggtgttta ataaatgtta taatataatt aaatatatta 3480 agttttttaa gagtaggtta gtaattttgt tttattgaat tatataggta ggaggtaagt 3540 ttttttagtt gtaataattt tagttttaat gtggatattg ttagtttttt tagatataaa 3600 ttatttttgt ttagattgat aatttatgga ttatttgtga attaatgagt tgttataatt 3660 aattatttta aattagttta agggtagatt ttgtatatgg ggattgttat tgtaaaataa 3720 aataaaataa aaaaaaaatt ttaaggagat agaagtttgt tggttttgga ggattaagtt 3780 attaaaaaat gttatttttt tattttttaa attgagaaag atgttttatt tataggatgt 3840 aaggtaagtt tatttatata tatattattt tatatatatt ttatattttg gtttttataa 3900 gtgttgttta gtaaagagga ggggaaggta ggtgtttttt agggagaaaa agtgttgata 3960 tattgtaaga ggtattatcg tagttaggtt attttttttt tttgtgtgag ttttttgttg 4020 acgttatttt ttgtttatgt ttagatttta ggaaatagag taaaaattgg tttttattaa 4080 ggattaattt tttttttaaa gcgaaaaata aattttttgt tttattttat atatttttta 4140 aatttttgga gtttggatta gtagtttaga gtttatagtg ttgagggaat ataattgaga 4200 gattaaaatg gtgatgagta aaatgttatt gttaggtttg acgatagagt tgaagaagat 4260 ttcgttgttt ttaaaattta ttttttaaaa ataattttaa aaagtttata ataattttgt 4320 attttttttg gttttttaat tagtaataat gattaaatta tttatgtttt tgaatagtaa 4380 ttagaaaata ttttgatata gttatttatt atagaaatta tagtgtttga gaatgattga 4440 ttaaatagta gaaattttaa gaaatttatg ggttatttag atagtatata ttattttaaa 4500 gggaaaaagt tattttatgt atttatttaa atttattaaa ataggtgttt ttgtgttgtg 4560 gtttgtattt attggtttta taaaataaag tttttttttt ttattgatta atatttgaga 4620 tttttatggg atgtttgttt agcgaggttt ttagtaataa agagaattaa tttgtggatt 4680 ttaaaatagt tttgtttttt aaatatttgg tgttttttag ttttatgtaa aacgttaaat 4740 agtatttatt ttttggttag tttgagtttg gatagaatta aatattatag aagttagttt 4800 taagtattat attatttata taggattttt ttttgaattt ttgttttagt ttatgggttt 4860 attttgtgtt ttaaaatata taaagttaaa gtatttagta tattgtttgt tataaagtag 4920 gtttttaaaa ttaatgtttt ttattgtaaa tttaaaagat gttttaaggg gaaagaaatt 4980 aatatttata tggggaaaat tatgaggtat aataggagat atttggggtt attgtaaagt 5040 gatttttatt ataagtaatt aatttttatt attttatttt agttaggagg aggatataga 5100 atattgatgt attataaatg tatatatata tatagagaga atttttagaa attattgttt 5160 ttttttatat tttttttttt ttaaatttta gagtattgat agttaaatgt tttagattaa 5220 gtgatttata agtttatttt gttagatatg gagggttgag agtttttata gttttgttaa 5280 tgagtgtttg tatagtagtt tttatgttat ttgttaagaa gaaatagata ttggttatta 5340 atgtaaaagg tattcgtatt ggtttatgaa atattagtat gtatattttt ttaaatattt 5400 tttataaaag attaagaaat atcgtgttat atgttaaatg tagggttttt aaagttttta 5460 gtagatgtga gaaatgtgtt tttattgata gaggggtcgg gtttttaaag tgttatatta 5520 taggtaattt tagggtgaga aaaggagtgg aaatgagtgt tcgtttttgt ttgggaggta 5580 gatgatgtgt ttgtagtata gggtgtagga ggtggagagg gaagaagatg tcgaatgagg 5640 agagtagagt gttgggaaag gattttagta gatgatagag tagtgaaatt 5690 27 17527 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 27 ggaattagaa tagtcggttt atttatttta ttattttatt attatatatt tttaaaggat 60 tttttagata ttttgtaaga aataatgaaa tttattttta ttttataatt ttaaatagat 120 tttttggtag tagtgatttt ttaaaatcgt taaggtttag ttttttttat tgttgaaaaa 180 ggaggatttt gtattttttt aggggaagag tgttgttttt atattaatta gtcggggata 240 gtatgaggtg tcgtttagta tttataggaa aaggtttttg aaattagatg ttttttaaat 300 ttttatatta atttttggag ttgggtaata tggttttttt tttttttagg ttttgtggta 360 gttattttgt tgttattcgt ttttgggttt tgtattttta atttttttgt taaatttgtt 420 ttttttagaa tcgaggttat taagttatag atggttttat aaatggattt ttaaattagt 480 ttaattaata atttttatcg aggatttttg gattgattcg ttggtagttt ttttggttta 540 gagatttttt ttttggagga tattataatt gtagggtttt attatcgttt ttatatagta 600 ggaagtagtt agagcggtta ttggttaaat ttttaatagt agttggggtg ttttgtttag 660 aggggggatt gagaggtgat agtttgttgg tagtttttat agttttcgtt cgtttttagt 720 attttttttg tttgggtttt tattttggcg gtatttgagg agttttttag tttattattg 780 aaatattttt aaataaggaa gaggaatagg ttatgattta atgtttgttt ggattagtat 840 aagtatgtta gggtaaatat ttatgttaaa ttgtgggagt taggaatata aagtatattg 900 atttattaaa gttagtagat atttaagaat gttagtatag gtttttgaat aaattttgtt 960 tttaagagaa gttattattt atttttaatt agatggggag gaaagttttt gaagaagaat 1020 ttttatttta tttttttttt tttttttttg agatagagtt ttttttagtt atttaggttg 1080 gggtgtagta gcgcgatttc ggtttattgt aagtttcgtt tttcgggttt acgttatttt 1140 tttgttttag tttttcgagt agttgggatt ataggtgttc gttattatgt ttggttaatt 1200 tttttgtatt tttagtagag atggggtttt atcgtgttag ttaggatggt ttcgattttt 1260 tgatttcgtg attcgtttat ttcggttttt taaagtgttg ggattatagg cgtgagttat 1320 tgcgttcgga ttaatttttg tatttttagt agagataggg tttttttatg ttggttaggt 1380 tggttttaaa tttttgtttt aaggtgattt gtttatttgg gatttttaaa gtgttggggt 1440 gagaggtgtg agttatcgtg tttggttatt tttgatattg ttaatgtatg tttttatttt 1500 gaaaaaggtt ttttgttgtt tatttattta tttttgagat agagttttat tttgttgttt 1560 aggttggagt gtattggtat aattttggtt tattgtaatt ttcgtttttt ggtttgaaga 1620 tttttttgtt ttagtttttt gagtagttgg gattataggt acgtgttatt atgtttggtt 1680 aattttcgta ttttttgtag agttggggtt ttattatgtc ggttaggttg gttttaaatt 1740 tttgatatta ggtgatttgt ttatttcggt tttataaatt gttgtgatta taggtataag 1800 ttattgtgtt tggtttaatt gttttttatt aatattgtat taggttggga agattaattg 1860 ttttagtaat ttttaaattt taatggtgta agaaaataaa aattttattt tttgtttatg 1920 ttatagttcg gtgtaggata gtgagaagga tttgtttttt tttgttattg gagatttagg 1980 ttgtttttgt gtagtgttta gaaaagtttt agtagttgag aggtgaaaag gtgtggagga 2040 ttgtatggaa ggttttataa gttaagttta ggggttgttg aattttatgt ttttttatat 2100 tttattggtt agaaattagg tatagtatta tatcgaattg gaaaggaggt taggatatgt 2160 tgtttaatag gatgtttcga gtagtgtatt tagaagaatg aataggtttg gagatagttt 2220 aagtttgttg tgtttttaat ttttttgggg gtattttttt tataatttat aatttttttt 2280 tttttttttt tgagatggag ttttggtttg tcgtttaggt tggagtgtaa tggtgtagtt 2340 ttagtttatt gaaatttttg tttttcgggt ttaagtgatt tttttgtttt agtttatcga 2400 gtagttggga ttataggggt ttattattat gtttggttaa tgtttgtatt tttagtagag 2460 atggggtttt attatgttgg ttatgttggt ttcgaagtgt tgatttcgtg atttgttcgt 2520 ttcggttttt taaagtgttg ggattatagg cgtgagttat tgttttcggt tataatttat 2580 aattttaaat ggaaaaggta aagataaata ttagtttttt attagtaagg atatatatgt 2640 agttgttgta ataaaggtaa aataaaaaaa tataatgtaa taatttaaat aagatatagt 2700 attttttttg tttgtataaa aatttgaata aagtatttta gggttgacgt ggcggtttta 2760 tagaattagg tattaaaggt ttttggtata ttgttttgtt ttttcgatta tttaattttt 2820 tttttattat ttgagatgat aattttattt ttattgtagt gtttatattt tggtaaattg 2880 gaaagaggag aagggtaagt ggaaagtaag tttttttttt taaaggtata atttaaaagt 2940 tgtttatgtt atttgtgttt atgttttatt ggttaaaatt tagtaattaa attttggtaa 3000 gtatttttgt tgtagtggga gttgggaaat gtagattttt gtttaggtaa gaaagaagag 3060 ggtatggagg gtatagtttt tatattttag attttagtta tggcgttata tttcgttgta 3120 agggaggtta gttattgtag tttttcgttg ggtggttatg tatttagtta gattttaggg 3180 gtatttttat taaagtaatg tatggagaat ggatagtatg agaagtagtt tttgttataa 3240 gtgtttttta taaaaagaat ttttataaga aaaataaata gggtttaagg aaaattaatt 3300 taaagggtaa aatatgggga aaagataaaa aataaaagaa aaaagaaaag taagtttttt 3360 aggtagaaaa tgaatgaaga ttgaggtata taagtgagaa gttttgtaaa attgataatt 3420 ttttttattt tgttataaaa gtttttattt atattttaaa attttattaa atgttatttt 3480 tttgatattt ttattttatt tttttttttt tgggtattta ttatgttgta gtgtatttta 3540 ggttattttt agttttgtaa tttttttaag gtgattttgt aggagatgta aagtagttaa 3600 gaggagaatt tttaatattg atgtgtttat aggtgaggtg gtttgatgtt ttagatttgt 3660 tttaaaatat ttttgtataa aataaaaagg ggaatagatg aaataagatt gataaaatgt 3720 tgatttattg acgcggtgta atgggtattt gggtgattat agtataattt tatttttttt 3780 gtatatattt taaaattttt ataatatagt aaaatatgag tttagttttt taaggtagtt 3840 agatttgggt ttaaatttta gtttgatttt ttattcgttg agtgatttta ttttgttata 3900 gttttagttt ttttaaatgg aaataatata tattttatta aggtttttgt aaatttttaa 3960 gtaagaggga atttgaggtt ttagtatacg gttcggtttt taatagttgt attaattttt 4020 attttatttt tcgaaacgga gtttgttttg ttatttaggt tggagtgtag tggtatgatt 4080 cggtttattg taatttttat ttttagggtt taagtaattt ttttgtttta gttttttttc 4140 gagtaattgg gattatagga gtgcgttatt acgtttagtt aatttttgta ttttttagta 4200 gagacggggt ttcggtatgt tgtttaggtt ggtttttaat ttttgatttt aggttatttt 4260 ttcgtttcgg ttttttagag tgttgggatt ataggcgtga gttattgcgt ttggttagta 4320 gttgtattaa taagggtttt tgtttgcgag taataaagat tgattttagt tgtggttaat 4380 tttttttata tatatatatt aagtgttaga ggtaggattt gagttcggat ttttgatttt 4440 tagatttaga attttttatg tgttattata gtcgttaaaa attttatttg gatttgtgtt 4500 ttgtaattta cgttttcgaa tatgtaggaa tgtagtttgg gtatttgttt ggaatttcgg 4560 attttcggga ttttagggtg gttaaggcgc ggaggtgatt taatgatatt gatcggtttg 4620 gatgtacgtg ggttgttgag tcgatgttgg gaaggtacgg ggtttgttcg gtgtaggtcg 4680 tcggaattta cgtacgtttt tgtttttttt atttttgggg tcggttttgg tcggtggttt 4740 ttagtttagt tagcggtcgg acgcgtagtt cgtcgattag ttttttaggt tttagcgcga 4800 ttttcggatt tcggattcgg cggatttggt cgattattta tttttttttt ttcgtaagtt 4860 agggggcggg gtatcgggtt tttggttcgt gatttgtcgg agtttttgcg tttttttttt 4920 ttattttttt cggttgtgtg agaggttagt agaggggcgg tttgcgggga taataatggc 4980 ggggttttgg gtcgggatag tatcgttggt cgttgtcgga cggcgtgggc ggtggtcgtc 5040 gtagtagttg atgttgagcg cggcgttgcg gattttgaag gtgaggagta acggggtttc 5100 gcgggttcgg gttttattgg gtttttagtc gtgtcgtttt tgggcggttg gcgtcgggag 5160 agcgttggtt gggttcggtt gttttcgcgt ttcggtttcg tattagttat atcgtttgtt 5220 tttttttttt tcggagttcg cgtggtagcg ggtttaggag gtatttttcg ttgtagttgt 5280 ttttcgcggg gattttgcgg agtagagagg tttagggtag aggtagttgg gtgttcgtac 5340 gtttttcgag gcggttgatg gttttgggta ggtatattgt tcgaggtttg tttttagggt 5400 ttcgcggtat tggttttgtt ttaagttttt tagggtgttt ttttaggtgt ttttatagtt 5460 ttcgtgtttt gttgtttttt tttagtattt ttgaagggat attgtgaatt gttgtttaag 5520 tagtgttagg gttgtgagtt tgttttattt tttaaagtat tatattatgt taggattgtt 5580 aatagatttt acgttttatt tgaaagtttg ttttaattgt atgatatttt agtttattgt 5640 gtattaaatg tatttcgtga atttattttt tttttcggta tagtggtgag tttgattttg 5700 gtattgtttt aaatatattt tatgattgtt ttgtatattt aggttgttat gatggtagat 5760 tgataaatag gttggagtgt ttgtgtgtgt ttttgagttt tgtttttagt taatgtcgag 5820 tttgtcgtta attttggggt atagattatt taatttattt tataaggttt gttgaggtat 5880 ttgaatatat tttttaaaat gaaggttttt tgaaaattat ttgttagttg gtttagtgtg 5940 tttgttaaat ttttttttaa aaaataatta ttaattggtt tttttttttt aatgtgttgg 6000 tagagattgt attttgttta tttttgtgtt tttagtataa tgtttgatat aataggtgtt 6060 gaatgtgtaa taatagagta gtattatgtt tgtgtcggta aagaattttt ttttggggtg 6120 ggaagtattt ttgaagttta ttattatttt aggggaattt gagttgttgt ttagtttttt 6180 tttgcgtttt ttttttatga atttgaaata tgttttattg agtttgtttg aagttgaatt 6240 ttttgaagat tttaattttt tttatttttt tttttatttt tgtaaatttt ttggttggtt 6300 gaaaagtagt tagttaattt tagggtttag tttagagaat tttgattatt tttttagtta 6360 gttaatagag tttatttatt tttagggtat atgtagagtt tattttttag ttttatttgt 6420 tttgtgtatt agttttttaa gtatattttg ttttaatgtt tagttttttt ttttgcgtaa 6480 atgtttttag tggttttagg atgttggttt tatggtaatt gttatagtta ttattgaatt 6540 tttatatgtt ttgtatgatt tttttttgtt tttttttttt tttgagatgg ggtttcgttt 6600 tgttgttagg ttggagtgta gtggcgcgat tttagtttat tgtaattttt attttttggg 6660 tttaagtgat ttttttgttt tagtttttta agtggttggg attataggcg tacgttatta 6720 ttatcggtta attttttttt gtattttagt agagatgggg ttttattatg ttggttattt 6780 cgattttttg attttttgat ttattgtttt ggttttttaa agtgtttgga attataggta 6840 tgagttatcg agtttaatgg tgtgattttt tatatatttt ttatttttat aataattagg 6900 taaaaaattt taattttata gtagaggaaa taaagtttag ggtagttaag tagttgttta 6960 aaagtataat tggttgaagt agaatttgaa ttttagataa tatgattttg aaggtttttt 7020 tttttttttt tttttttttt ttttgagatg gggtttggtt ttgttggtta ggttggagtg 7080 tagtggtatg attttggttt attgtagttt ttgttttttg ggtttaagtt atttttttat 7140 tttagttttt taagtaggtg ggattatagg tacgtacgat tatatttggt tattttttaa 7200 ttttaatttt tattttttgt agagatgggg ttttgttatg ttgtttaggt tggttttaaa 7260 tttttgaatt taagtaattt atttatttta gtttgttttt ttaattataa attgttttat 7320 ttgaattatg gttttattgt gtgatgtatt tatgaaattt gaatgtttaa gttttgtgtt 7380 atttgatatt tattattttt ttttgtaatt agtaaatatg gaaaagaatg tttaggttta 7440 tatgaatgtt ttagaattgt ttggaggtta atgtttttaa tatgttgata aatttttgat 7500 aaattatttg ggaaaagaaa tttttgagat tattatagaa attagttttt ggtgtaaaaa 7560 aatgtttata gatatttata tatttatata tttattattt ggattttatt ttgtttttga 7620 gaggtttaga atagaggtaa aaattgtttt agtttttttt taagaggaaa agatgtgata 7680 tttttgatga agagtgaggg aaaaggattt gtttaaatga ttttaaattt taaaaaatgt 7740 aggtgggaga ataaggatga aaaaggaatt tgggaagaaa tatttttttg gtggggttgg 7800 aaatatagtg ttttattgta ggtatttgga gttagatgtt cgtaggagtt atgttgaggt 7860 gttgggtatt agtggttggt ttttgggtta gggatacgag gttagagtta gagttagaat 7920 tgtgagtttt gacggatata gtgagttagt taatatttaa ttgaataaat gtttcgtttt 7980 ataattttaa attaggattt ggaagaagga agaagagata agaggagtta gaggtatggt 8040 ttgagaggag ttaatgtagt gtagtgttat taaatttagg aaagaaattt taagaagtag 8100 ttagtattta tttatttatt tgtttagaga tttagttttt tatttagaaa gtgtttgtgg 8160 agtatttttt aagttttagg tattatggta cgtatagagg agagaaaaag aaattaaaat 8220 atatttttta attatgtttt aggtgtagag aggttaagga ataaaagatt gatgaggtta 8280 ggtgtggtag tttacgtttg taattttaat tttttgggag gttaaagtgg gaggattttt 8340 tgagtttagg agtttgagat tagtttaggt aatataatga tattattttt attttcggtt 8400 atttttataa aataaaataa aataaaataa aaattagttg ggtgtggtgg tacgtgtttg 8460 tggttttagg tatttgggag gttgaggagg gaggattatt tgagtttagg aggttaaggt 8520 tgtagtgagt tgtgattata ttaatgtatt atagtttggg tgatatagta agattttgtt 8580 ttaaaaaaaa gtttgggtac gatggtttat gtttgtaatt ttagtatttt gggaggtcga 8640 ggtaggtaga ttatttgagg tcgggagttt aagattagtt tgattaatat ggagaaattt 8700 cgtttttatt aaaaatataa aattagtcgg gtatggtggc gtatgtttgt aattttagtt 8760 atttgggagg ttgaggtagg agaattattt gaatttagga ggtggaggtt gtagtgagtc 8820 gagattgtat tattgtattt tagtttgggt aataagagcg aaaatttgtt ttaaaaaaaa 8880 aaaaaaaaaa aaaagattgg tgaaagaatt tgaaaagatt tttgattttt aatgagaata 8940 attttagtag tatggtaaag tgttatatat aaaaaatatt gtttttgata atatttttga 9000 atagttgaag taaaattata ttttttgaaa gataagtata ttgtataatt tttaaaaatt 9060 agttttttta ttttaaatgt ttattgatat tttcgttaga aaaaatttta taaattgatg 9120 ggattaattt aataagatta aaataaaagt gaatttaaag aatgttggaa gatatagttt 9180 tgtgatttta tttataaaat ttaatatagt atttatgtgg tatatttttt ttggtattgt 9240 ttgtttgttt ttgagataga gttttatgtt gtttaggttg gagtttagtg gtgtgatttt 9300 cgtttacggt aattttcgtt ttcggggttt aagtgatttt tttgttttag ttttttgagt 9360 agttgggatt ataggtatgt gttattatgt ttagttaatt tttatatttt tagtagagac 9420 ggggttttat tatgtcggtt tggttggttt tgaatttttg attttaattg attcgtttgt 9480 ttcggttttt taaagtgttg ggattataga tgtgagttat cgtgtttgtt ttttttttgg 9540 tattatttat ttaagaaatt tttggttttt tagagttgtt gtataaatga ttatggattt 9600 ggtggtttaa aataataaat ttattttttt atagtattaa aggtttgaag tttgaaatta 9660 aggtatgagt agggttatgt ttcgtttgaa ggttttaggg gagaattttt ttttgttttt 9720 ttgagttttt ggtggttgta tttatttttt ggtttgtggt tgtattattt tagtttttgt 9780 ttttgttttt atatggttgt tttttttttt ttttttttgt gcgttttttt tttttatttt 9840 tttataaaga tattttttat tggatttagg gttatgataa gatttaggat gattttattt 9900 taagattttt tattttgttg tattggtaaa gatattttat tataggtttt aggacgtgga 9960 tatattattt taggggttat cgtttaattt atttatacgt agtatgtgtt agatattatt 10020 tagagttggg aatataattg tgattgtttt tgtttttatt gtggttatat ttgagtaagg 10080 agattgtgtt cgtataaata gaaaagttta gagagtgaga agtgttttcg aaggaaaaag 10140 ataggttaat gggatagaga gtggtagtgg tgttgagttg gggatgttat ttaatgagat 10200 tatgggggat atttttgagt atgtggtatt tggataggaa attgagttag ttagttatgt 10260 gattatatgg gggtttagta ttgtagatta aggagtgtta gggtaaaagt tttgagggga 10320 gattgtattt ggtataatta agggatgaat gtggttgttg tggttggagt gaattgaatg 10380 agggggtgat tttaggagat gagggaggag gagtgggtag gcgggataga gttattaggg 10440 gtttgtattt ggaatttagt aatgagagtt tagttggagg tatttaagta tattgaattt 10500 atgtttggaa aagacgtttg tgattagtac gtagcgaatg ttttagtagg ggtgggagta 10560 ggattgggga ttggggtggg aagagtggaa atagagagat ttattaggaa gttgttgtag 10620 aagattaagt tagagatgat ggtaatttgt gttagggtat tggagttgtt gagaattggt 10680 tagatttgga atgtattttg gagttagagt tagtattttg ttgtggggtt tgaaggtaga 10740 tatagatgta ttttatattt tggttttatt gattttgtag atattgtttt ttttttgttg 10800 tttttataga ttgagggttt gtggtaattt tgttttgagt aattgtattg gtgttatttt 10860 tttaatagta tatatttatt tggtgttttt gtgaaatatt ttgataattt ttttattatt 10920 attatgtttg ttatggtgat ttgtgattag tgattttcga tatttttatt gtaaatattt 10980 tggggtgtcg tgaattacgt ttatataagt tggagaaata taattgataa atgtgtgagt 11040 tttgattttt ttaagtagtt atttttttat gttttttttt ttttttaggt ttttttaatt 11100 ttttgagata taataatatt gaaattaggt taattaataa ttttttaagc gttttagtga 11160 aaggaagagt tatatatttt ttattttgaa ttaaaaatta gaaattatta agtttagtga 11220 ggaaggtttg ttaaaagtta agatagattg aaagttgggt tttttgtgtt aaattgtaaa 11280 tgtaaaggaa aagttttgga aggaaattag aagtgttatt ttagtgagcg tataattgat 11340 taaaaaaagt gaaatagttt tattgttgat atggcgaaag ttttagtggt ttggatagaa 11400 gattaaatta gttataatat ttttttaagt tatagtttaa tttagcgtaa ggttttcgtt 11460 ttagttttgc gaaggttgag agaggtgagg atgttgtaga agaaaatttg gaagtagagg 11520 ttggtttatg gggtttaaga aaagaagtga ggtcgggcgt agtggtttat atttgtaatt 11580 ttagtatttt gggaggtcga ggcgagtgga ttataaggtt aagagattga gattattttg 11640 gttaatatgg tgaaggatta gatgattgtt agtatttttg agtaataatt gttttgaata 11700 ataattaatt ggatttgaat ttatagtatt tgtaaggtat gtataaatag ggaaaggaag 11760 gaattaagag tgatttttga agggtagata tataaggtcg ttattgtgtg attttgtgtt 11820 tatatgtagt ttttagaata gattgattta tgaagataga aagtagatta gtggttgttt 11880 agggtttgga ggagagggga tgggagtgat tgcgaatagt taagggttgt ttttttgggg 11940 tgataaaaaa tgttttggaa ttagtagtta ttatggtttt atgttttgtg gatatattaa 12000 aaattacgga gttgtatatt tttttaaaag ggtgaatttt atggtatgtg aattatattt 12060 taattaaaaa ataaaagaat ggttcgggtg tagtggttta tatttgtaat tttagtattt 12120 tgggaggtcg aggtaggtgg attatttgag gtcgggagtt cgagattagt ttgattaata 12180 tgaagaaatt ttatttttat taaaaatata aaattagtta ggtatggtgg tatatgtttg 12240 taattttagt tattcgggag gttgagacgg gagaattgtt tgaatttggg aggtagaggt 12300 tgtagtgagt taagatggta ttattgtatt ttagtttggc gatagagtga gatttcgttt 12360 taaaaaataa ataaatataa attttcgaat atttatgtta ataaagtaaa gtaaagaggt 12420 taaggtggga ggattatttg aggttagtag tttaagatta gtttggggaa aatagtgaga 12480 attttttagt cgtttagttt ttataaaaaa taaaaaaatt agtggggtat ggtgatatgt 12540 atttatagtt ttagttattt aggaggttga ggtgggagga ttgtttgaat gtaggagttt 12600 aaggttgtag tgagttatga ttttattatt atattttagt ttgggtaata tagtgagatt 12660 ttgttttaaa aaaaaaaagt ataatgaagt taggtgtggt ggtagggatg tgtagtttta 12720 gttatttagg aggttgaggt gggaagatta tttaagttta ggagttagag gttgttatgg 12780 gttataattg tgtttgtgag tagttattgt agtttagttt gggtaaatat agtgagattt 12840 ttatttttta aaaaaataaa aaaagtaaaa taaggtgaaa ttaatatatt ttatttaata 12900 tatttaaata tttaaagtat tatttgaata tgtaaatgta aaaatttatt aatgaggttt 12960 tttatatttt ttgggtatta agtttttaaa atttagtgtg tagtttattt ttagagtata 13020 tttgaatgtg gttcgtggtt gttatattgg atggaatagt tttagggtat agattgtgtt 13080 attaattaag ttttattttg aggtgttggg attggttttt tgaatgtagt gttagttagt 13140 ttttggttag gtagggtcgg gggagttttt aggtttgatg gagagttgta tagttgagga 13200 atatggtcga gatgagggtg taggtgtgag tcgttagttg ttaatatagt agttagagag 13260 gatttgagtg gttattgata atatttgtta tagcgggatg gggaagaatg gtttggcgga 13320 agagttaagg gtgggatgat ggagttttag agttgatatg tatagttttt tggtgtttga 13380 gtttagtata gaggtagagt ttagagaatt ttgagttttg aatatttttt ttaaatatta 13440 ggtgtttaat ttggtttttg gtagatattg aagattggaa tggtttttaa gattttgaag 13500 attaaatagt ttatttgaaa gaaaagttgt gtttttagga aaaagttaga tttaattaag 13560 tgtttttaga gaagggtatg ggttttgtta taatgtatga tgaaatatcg tgttataata 13620 tatggataag atttttattt ggaattttag agatgaagta agatgaagta aattaatgtt 13680 tattttgatt ttggtgagat tattttatag ttttattaat ttagttttga ggatagtttt 13740 ttttttgaag tagaatgtat tttgataatg aatttatttt ataatgagtt atttagtatt 13800 atttatttga atgttattgc gggtatgtta ataatagtag ttttggtttt ggtagaaata 13860 gtgtttagat tgttttttaa gatatttgtt agtggattta ttagttttaa ttgttacgtg 13920 aggttatatt ttgtttatga aagtaggtgt tatttaattt tttttttttt tttttttttg 13980 agatggagtt ttgttttgtt atttagattg gagtgtagtg gcgtgatttc ggtttattat 14040 aatttttgtt tttcgggttt acgttatttt ttcgttttag tttttcgagt agttgggatt 14100 ataggcgttt gttattatat tcggttaatt ttttgtattt ttcgtagaga tagggtttta 14160 ttgtgttagt taggatggtt ttaatttttt gattttgtga tttatttgtt tcggtttttt 14220 aaagtgttgg gattataggc gtgagttatt gtgtttagtt ggtgttattt aattttaaga 14280 aaggattttt ttttagttat tgtaaatagg atttgttttt ttgtttgtag tggttggaag 14340 gtatgtattt agtttgttta aaagtttatt atttttttcg ttttttgtgt aagttattgt 14400 gtgttgatga taatatatgt aagattgtgt tagttatgtt agatattttt atttaatttt 14460 tatagtagta ttatgattta gataagtatt attattattt ttagtgtata aatgaagaaa 14520 ttttttatat atttaggaaa tgttagagtt aagatttgaa tttaggttag aatttgagtt 14580 tagattagaa tttttattga ttatattatt ttttaatggt aatttttaag tggttttggt 14640 ataattttaa gaaagaaggt gatagttata tatttggatt tagtttttat gtaaaatttt 14700 atattttttg gtattttatt gtttataaaa atttatttga tttttttaat aattttttag 14760 gaaattaggg aggtgttatt atttatattt tgtagatgga aacgggggtt tagagaaatg 14820 attagtttaa tgatttatag ttgagagttg atttaagttt tgtgattttg agggttaatg 14880 ttatttttta tgtgttaagt tatttttagg tatttttttt ttatgtgtgg aaaatatagg 14940 aaattattat ttttgtggga gagaattagt ggtaatatgt tattggggag ttattttgta 15000 tacgttgatt ttttttattt tggttgtgat tggttagttt ttataaatag aattgattaa 15060 agtttttttt tagaattttt gttgttagga aatattttat aaagaatttt ggattgggcg 15120 tgtagttagt ttgttatatg tttaataaaa ataataaacg ttaaaatttt gtgtagaggt 15180 ttaaattagt agattttttt aaacgttttt ttttatttag aaaataaatt ttatgttgtg 15240 gttttatata aatggtttga gtgttgattt gattttttat ttttgatttt ttatgaatgt 15300 tttttaggag gaaataggaa tagagttttt atggggttta ttttaaatta gtttagattt 15360 gtcgtgggaa tggtttatat tggtagttgt tttgttatag ttgtgtttgt ttgtacgagt 15420 tttatttttt tttttttttt tttttgttga gatagtgttt cgtttttttt gtttaggttg 15480 gagtgtaacg gtataaattt ggtttattgt aatttcggtt tattgtaatt ttcgtttttc 15540 gggtttaagc gatttttttg ttttagttat tcgagtagtt gggattacgg gtatgtatta 15600 ttatgtttag ttaattttgt atttttagta gagatggggt ttttttatgt tggttaggtt 15660 ggtttcgaat ttttaatttt aagtgatttg ttcgttttag ttttttaaag tgttgggatt 15720 ataggtatga gttatcgtgt tcggttcgag ttttattttt agttattggg taatcgggag 15780 gtatttatgt tttttatagt tttaggttat attattataa gtttatatgt gtgtaagttt 15840 tgtggaataa tattatattt ttgagtagat attagtgttt atttgggaat tgttattgtt 15900 ttttttattt agaaataaaa aattttagaa agtttttgat taatttgtgg ttaaatttta 15960 taattattat agttttagtt tgtgattttt gaaaagttaa agtttttggg atttaatttt 16020 gttataaaat tggggataat atttttgtaa tttatagtta tgtttgaagg aatatatgag 16080 agatagtttt gatttttaat agggatatag taataatttt tcgtttatag tttttttttg 16140 tttttggttt tttatttggt aaaggtttta ttttataaat tatatttttt tgtatttttt 16200 atttttattt ttatatagag attatatttt ttaaattaat taaataatta attaattttt 16260 tttgaggagt ttcgtttttg ttgtttaggt tggagtgtaa tggtaggatt taggtttata 16320 gtaattttta ttttttgggt ttaagtaatt ttattttagt tttttgagta gttgggatta 16380 taggtgtgtg ttattatgtt tcgttaattt ttttgtgtgt gtttttagta gagacgggat 16440 ttcgttattt tggttagttt ggtcgtaaat ttttgatttt aggtgattta tttgttttga 16500 ttttttaaag tgttaggatt ataggtatga gttatggtgt tcgatttttt aaaaaatagt 16560 tgtataaatt ttttagttta tttaaaaatg ttgttataag aatattttgt tttttatttg 16620 agtcgttatt attttagaaa gttttaagag gtggtatttg ttggttgttt tttgttggtt 16680 tttttttttt attttttttt ttttagtttt aatagtgatt attgggaagt tttttttttg 16740 tttttgtttg tttttttgta tttttttatt tttttttttt tttttttttt tttttttttt 16800 ttttagtggg gttttgtttt gttgtttagg ttggagtata gtggtgtgat tttggtttat 16860 tgttatttta aattttgggg tttaagtaat atttttattt ttgttttttg agtagttggg 16920 attttaggtt gtattatcgt gtttggttta gttatttttt ttaatgtttt taagtattaa 16980 gatacgtttt ttttataaat agtttaatga atgagaaata tttttgatta ttgatattgt 17040 ttttttatat ttattagtta aattattttt gtattagaaa atgtgaaata agaaattatg 17100 ttgaagatat tagtaaatat aaaaagaata ttttattatg ttttggttat tgttaaattt 17160 gaagtttttt gagattaaga ttttcgtttt gtgtttttaa aagttttgtg tggtttgtga 17220 tatttttgat tttgttttat ttttttgaat gattagaaag gtttttttta aatttgtttg 17280 gtttttcgat aatttttgtt ttgttttttt ggagatcgtt ttgatgtttt tggttttttt 17340 tatatattaa ggggttgtgt ttgtagatat gatttttttt ttgtaattat atttatggta 17400 tattgtttag aattatattt attgattaga tacgttcgtt agaatttaat tggaagaaat 17460 attttgaaaa aatgttttaa agtttattaa gtatttgtaa tttattttgt tttttttttt 17520 ttgtagt 17527 28 17527 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 28 gttataaaaa aaggaaagta aaataaattg taaatatttg atgggtttta gaatattttt 60 ttaggatatt ttttttagtt aggttttagc gaacgtgttt gattaataaa tgtagtttta 120 ggtaatatat tataaatata attataaaag ggaaattata tttatagata tagttttttg 180 gtatgtaaga gaaattaaaa gtattaaaac gatttttaga aaagtaaaat aagaattgtc 240 gaggggttaa gtaaatttga agaaagtttt tttgattatt taaaaggata gagtagggtt 300 agaaatgtta tagattatat agaattttta aaaatataaa acgagagttt tggttttaag 360 gagttttaaa tttaatagtg gttagaatat aataaaatat tttttttata tttgttgatg 420 tttttagtat gattttttat tttatatttt ttggtataga agtggtttgg ttgataaata 480 tgaaaaagta atattagtaa ttaaggatat tttttattta ttgaattgtt tgtgaagaaa 540 gcgtatttta atgtttaaaa atattaagaa aagtgattaa gttaggtacg gtggtatagt 600 ttggaatttt agttatttag gaggtagagg tgggagtatt atttgagttt tagagtttga 660 ggtggtagtg agttaagatt atattattgt attttagttt aggtaataga gtaagatttt 720 attgaaaaga gagaaaagaa aggagaaaaa gaaaagagat agagagatat agagagatag 780 atagagatag agagagaatt ttttagtagt tattgttaaa gttagaagga aaaaaatgga 840 ggaaaaaaat tagtaaaagg taattaatag gtattatttt ttagaatttt ttaagatgat 900 aacgatttaa ataagaaata aaatgttttt atagtaatat ttttaaatga attgaaaaat 960 ttgtataatt attttttaaa gagtcgggta ttatggttta tgtttgtaat tttagtattt 1020 tgggaggtta aggtaggtgg attatttgag gttaggagtt tgcgattaga ttggttaaaa 1080 tggcgaaatt tcgtttttat taaaaatata tataaaaaaa ttagcggggt atggtggtat 1140 atatttgtag ttttagttat ttaggaggtt gaggtagaat tgtttgaatt taggaggtgg 1200 aggttgttgt gagtttagat tttgttattg tattttagtt tgggtaataa gagcgaaatt 1260 ttttagaaaa aattaattaa ttatttaatt aatttaaaaa atgtaatttt tgtataaaag 1320 tggaggtaaa agatataaaa agatatagtt tataaaataa aatttttatt aagtaaaaga 1380 ttaagaataa gaaggaattg tgaacgggaa attattattg tgtttttatt aaagattaag 1440 attatttttt atatattttt ttaagtataa ttgtgagtta taagagtatt atttttaatt 1500 ttatgataaa gttgagtttt aaggatttta attttttaaa ggttataggt tgaggttgta 1560 atggttataa gatttaatta tagattggtt aagagttttt tgaaattttt tatttttaga 1620 taagaaaaat agtggtaatt tttagataaa tattaatatt tatttaaaga tatgatattg 1680 ttttatagag tttgtatata tgtgaatttg taataatgtg gtttaaagtt gtaaaaagta 1740 tagatgtttt tcggttattt agtaattaga agtagaattc gggtcgggta cggtggttta 1800 tgtttgtaat tttaatattt tgggaggttg aggcgggtag attatttgag gttgggagtt 1860 cgagattagt ttgattaata tggagaaatt ttatttttat taaaaatata aaattagttg 1920 ggtatggtgg tgtatgttcg taattttagt tattcggatg gttgaggtag gagaatcgtt 1980 tgaattcggg aggcggaggt tgtagtgagt cgaggttgta gtgagttaag tttgtatcgt 2040 tgtattttag tttgggtaaa aagagcgaaa tattgtttta ataaaaaaaa aaaaaagaag 2100 aagtagaatt cgtataagta aatataatta taatagaata attattaatg tgaattattt 2160 ttacgataag tttgaattgg tttggaatga gttttataaa ggttttgttt ttgttttttt 2220 ttgggagata tttatggaag gttaaaaatg aagaattagg ttaatattta gattatttgt 2280 gtaaagttat aatataaagt ttatttttta aatgaaggaa aacgtttgaa gaagtttgtt 2340 aatttggatt tttatataga attttaacgt ttgttgtttt tgttaagtat gtaataaatt 2400 ggttatacgt ttagtttaaa attttttgta aggtattttt tagtaataaa ggttttgaga 2460 aagaatttta attaattttg tttataaagg ttagttaatt atagttaaaa tgagagaggt 2520 tagcgtgtgt aaaatgattt tttagtaata tattgttatt ggtttttttt tataggaata 2580 atgatttttt gtatttttta tatatagaaa agaaatgttt gaaaatggtt tggtatatag 2640 gaagtggtat tgatttttag agttataaga tttgggttaa tttttagttg tgagttattg 2700 agttaattat ttttttgggt tttcgttttt atttataaaa tgtaggtgat gatatttttt 2760 tgatttttta gggagttatt aaaaggatta aatgagtttt tataaatagt aaagtgttaa 2820 aaaatgtaag gttttatatg aaaattaaat ttaaatatgt aattgttatt ttttttttta 2880 aaattatatt agaattattt gggaattatt attagagaat aatatagtta ataagagttt 2940 tggtttagat ttagattttg atttggattt aaattttggt tttgatattt tttagatata 3000 tagaaagttt ttttatttgt atattgggga taataatagt atttatttag gttataatgt 3060 tgttatgagg attaaatgag aatgtttaat atggttagta tagttttgta tatattatta 3120 ttagtatata ataatttata taaaaagcgg gggaaatggt aggtttttag ataaattgga 3180 tgtatgtttt ttagttattg taaataggga aataaatttt gtttgtagtg gttggaaaaa 3240 aatttttttt taagattaga tagtattagt tgggtatagt ggtttacgtt tgtaatttta 3300 gtattttgag aggtcgaggt aggtggatta taaggttagg agattgagat tattttggtt 3360 aatatagtga aattttgttt ttacgaaaaa tataaaaaat tagtcgggtg tggtggtagg 3420 cgtttgtagt tttagttatt cgggagattg aggcgggaga atggcgtgaa ttcgggaggt 3480 agaggttgta gtgagtcgag attacgttat tgtattttag tttgggtgat agagtaagat 3540 tttattttaa aaaaaaaaaa aaaaaaaaga ttagatagta tttattttta taagtaagat 3600 gtggttttac gtggtagtta aaattggtaa atttattggt aaatatttta aagaataatt 3660 tgaatattat ttttgttaaa attaaaatta ttgttgttaa tatattcgta gtagtattta 3720 gatgaataat attaaataat ttattatgag ataaatttat tattagaatg tattttgttt 3780 taaagaagaa attattttta aaattgggtt aatggagtta taaaatgatt ttattaaggt 3840 taaagtaaat attagtttat tttattttgt tttattttta aaattttagg tgaaggtttt 3900 atttatgtat tatgatacgg tattttatta tgtattgtaa tagagtttat gttttttttt 3960 gaagatattt aattaggttt ggtttttttt tggaagtata gttttttttt taaatagatt 4020 atttagtttt taggatttta gagattattt taatttttag tgtttgttaa aagttaagtt 4080 gaatatttaa tatttgagag agatgtttaa gatttaagat tttttgggtt ttgtttttgt 4140 attaagttta agtattagga aattatatat gttaatttta gagttttatt attttatttt 4200 tgattttttc gttaggttat ttttttttat ttcgttgtag tagatgttgt tagtggttat 4260 ttagattttt tttaattgtt gtgttgataa ttaacggttt atatttgtat ttttatttcg 4320 attatgtttt ttaattatat agttttttat taagtttgag agttttttcg attttgtttg 4380 gttaagggtt gattaatatt gtatttaaaa ggttagtttt agtattttaa ggtgggattt 4440 gattagtagt ataatttgtg ttttagagtt gttttattta atatggtagt tacgagttat 4500 atttagatgt gttttaagag taaattatat attggatttt gaaaatttag tatttagaaa 4560 atgtaaaaga ttttattagt gaatttttat atttatatat ttaaataata ttttgaatat 4620 ttgaatatat taagtaaaat atattaattt tattttattt tatttttttt gtttttttaa 4680 gagatggggg ttttattatg tttgtttagg ttggattgta gtgattattt ataggtataa 4740 ttatagttta tggtagtttt taatttttag gtttaaatga tttttttatt ttagtttttt 4800 aagtagttga gattatatat ttttgttatt atatttagtt ttattgtatt tttttttttt 4860 gagataggat tttattatgt tgtttagatt gaagtgtagt gataggatta tagtttattg 4920 tagttttgaa tttttgtatt taagtaattt ttttatttta gttttttgaa tagttgggat 4980 tatggatgta tgttattatg ttttattaat ttttttattt tttgtagaga ttgggcggtt 5040 ggggggtttt tattattttt tttaggttgg ttttgaattg ttggttttaa gtgatttttt 5100 tattttggtt tttttgtttt attttgttaa tataagtatt cgaagatttg tgtttgtttg 5160 ttttttgaga cggagtttta ttttgtcgtt aggttggagt gtagtggtgt tattttggtt 5220 tattgtaatt tttgtttttt aggtttaagt aattttttcg ttttagtttt tcgagtagtt 5280 gggattatag gtatgtgtta ttatgtttgg ttaattttgt atttttagta gagatggggt 5340 ttttttatgt tggttaggtt ggtttcgaat tttcgatttt aggtgattta tttgtttcgg 5400 ttttttaaag tgttgggatt ataggtgtga gttattgtat tcggattatt tttttatttt 5460 ttaattgaga tgtaatttat atattataaa atttattttt ttaaaaaagt atataatttc 5520 gtggttttta gtatatttat aaggtatgga attatgatgg ttattgattt taggatattt 5580 tttattattt taaaaagata atttttaatt attcgtagtt atttttattt tttttttttt 5640 aggttttggg taattattaa tttatttttt gtttttatgg attagtttat tttggagatt 5700 gtatataaat ataaaattat ataatagcga ttttgtgtgt ttatttttta aaagttattt 5760 ttaatttttt tttttttttg tttgtatata ttttatagat attgtaggtt taggtttaat 5820 taattattgt ttaaaatagt tattgtttaa aaatgttaat aattatttga ttttttatta 5880 tgttagttag aatggtttta attttttgat tttgtgattt attcgtttcg gttttttaaa 5940 gtattgggat tataggtgtg aattattgcg ttcggtttta tttttttttt taaattttat 6000 gaattaattt ttgtttttaa gttttttttt gtagtatttt tatttttttt agttttcgta 6060 gaattgaagc gaggattttg cgttggatta ggttatggtt taaggaaatg ttgtggttgg 6120 tttgattttt tatttaaatt attaaagttt tcgttatatt agtaataaag ttgttttatt 6180 ttttttaatt agttgtgcgt ttattggagt agtattttta attttttttt agaatttttt 6240 ttttgtattt ataatttggt ataagaggtt taatttttag tttattttgg tttttgatag 6300 gtttttttta ttaagtttaa tgatttttag tttttgattt aaagtgagag atgtgtgatt 6360 ttttttttta ttagaacgtt tagaagatta ttaattggtt taattttaat attgttgtat 6420 tttagagaat tagggaagtt tgaggagagg gagagatata ggggaataat tgtttggaga 6480 agttaaaatt tatatattta ttaattatgt ttttttaatt tatatgggcg tggtttacgg 6540 tattttaaaa tatttataat aagaatatcg aagattattg attatagatt attataatag 6600 atatagtaat aatgaaaaaa ttattaaaat gttttataga gatattaagt aagtatgtgt 6660 tattggaaag atgatattaa tatagttgtt taaagtaggg ttgttataaa tttttaattt 6720 gtaaaaataa taaaaaaaaa gtagtatttg tagggttaat aaagttaaga tatgaggtat 6780 atttgtattt gtttttaaat tttatagtaa gatattggtt ttagttttaa aatatatttt 6840 aagtttgatt agtttttagt aattttagtg ttttagtata agttattatt atttttagtt 6900 tggtttttta taatagtttt ttgatgggtt tttttgtttt tatttttttt attttagttt 6960 ttaattttat ttttattttt attaagatat tcgttacgta ttagttataa acgttttttt 7020 taaatataaa tttaatgtgt ttaaatgttt ttaattggat ttttattatt aaattttaaa 7080 tataagtttt tgatgatttt gtttcgttta tttatttttt tttttttatt ttttaagatt 7140 atttttttat ttagtttatt ttaattatag tagttatatt tattttttaa ttatgttaaa 7200 tgtaattttt ttttagagtt tttgttttgg tattttttgg tttgtaatgt taggttttta 7260 tatagttata tggttggttg gtttagtttt ttgtttaaat gttatatgtt tagaaatgtt 7320 ttttatggtt ttattaggta atatttttaa tttagtatta ttattatttt ttattttatt 7380 aatttatttt tttttttcga gagtattttt tattttttga atttttttat ttatacgagt 7440 atagtttttt tatttaaatg taattataat gggagtagaa atagttataa ttatattttt 7500 agttttaagt agtgtttgat atatattacg tgtaggtgaa ttgaacgata gtttttaaaa 7560 tgatgtgttt acgttttgga atttgtgata aagtgttttt gttaatataa taaagtgaag 7620 gattttgaga tgaaattatt ttagattttg ttatggtttt aaatttaatg aaaagtgttt 7680 ttataaaaga atgagaggga aagacgtata agaaggagga ggagaaggta gttatgtgaa 7740 gatagaggta gagattggag tgatgtagtt ataagttaag gaatgaatgt agttattaga 7800 agtttaaaga ggtaagaaag gatttttttt tagagttttt aggcgaagta tggttttgtt 7860 tatgttttga ttttagattt taggttttta gtattgtggg agaatgaatt tgttgtttta 7920 agttattagg tttatggtta tttgtatagt agttttagga aattaaaggt tttttgaata 7980 aataatatta aagagagggt aggtacggtg gtttatattt gtaattttag tattttggga 8040 ggtcgaggta ggcggattaa ttgaggttaa gagtttaaga ttagttaggt cgatatggtg 8100 aaatttcgtt tttattaaaa atataaaaat tagttgggta tggtggtata tgtttgtaat 8160 tttagttatt taggaggttg aggtaggaga attatttgaa tttcggaggc ggaggttgtc 8220 gtgagcggag attatattat tgaattttag tttggataat atgagatttt attttaaaaa 8280 taaataaata atattaaaga gagtatgtta tatggatgtt gtattaggtt ttgtgaatga 8340 aattataaaa ttgtattttt taatattttt taaatttatt tttattttga ttttattagg 8400 ttgattttat tagtttgtgg ggtttttttt aacgaaaatg ttaataggta tttaaaataa 8460 agaaattaat ttttgaaagt tatgtaatat gtttattttt taaaaaatat aattttgttt 8520 taattattta agagtgttgt taaaagtagt attttttgta tataatattt tattatgtta 8580 ttaaaattat ttttattaaa gattaaagat ttttttaaat ttttttatta attttttttt 8640 tttttttttt tttttgagat agattttcgt ttttgttgtt taggttggag tgtagtggtg 8700 taatttcggt ttattgtaat ttttattttt tgggtttaag tgattttttt gttttagttt 8760 tttaagtagt tgagattata ggtatgcgtt attatgttcg gttaattttg tatttttagt 8820 agagacggga tttttttatg ttggttaggt tggttttgaa ttttcgattt taggtgattt 8880 gtttgtttcg gttttttaaa gtgttgggat tataggtatg agttatcgtg tttagatttt 8940 tttttgagat agggttttgt tgtgttattt aggttgtagt atattggtgt gattatagtt 9000 tattgtagtt ttgatttttt gggtttaagt gatttttttt ttttagtttt ttaagtattt 9060 agaattatag gtacgtgtta ttatatttag ttaattttta ttttatttta ttttattttg 9120 tagagatagt cgggggtggg ggtggtatta ttatgttgtt taggttggtt ttaaattttt 9180 gagtttaaga aattttttta ttttggtttt ttaaagggtt gagattgtag gcgtgagtta 9240 ttatatttgg ttttattaat tttttatttt ttagtttttt tgtatttggg atatagttag 9300 ggaatatgtt ttaatttttt tttttttttt ttgtacgtgt tatagtattt ggaatttaga 9360 aaatgtttta taaatatttt ttgagtaaag agttagattt ttagataaat gaatgaatga 9420 atgttaatta ttttttgaaa tttttttttt aggtttggta atattatatt atattggttt 9480 tttttaaatt atatttttaa ttttttttgt tttttttttt tttttttaaa ttttaattta 9540 gggttataaa acgaagtatt tatttaatta aatattaatt gatttattat attcgttagg 9600 gtttatagtt ttaattttaa ttttagtttc gtatttttgg tttaaaagtt agttattgat 9660 atttagtatt ttagtatggt ttttgcgggt atttaatttt agatatttat aatgaaatat 9720 tatgttttta gttttattaa aaaagtgttt ttttttaaat ttttttttta tttttgtttt 9780 tttatttata ttttttaaag tttggaatta tttaaataaa tttttttttt ttatttttta 9840 ttaaaaatgt tatatttttt ttttttagaa aaggattaga gtagttttta tttttgtttt 9900 gaatttttta ggaatagaat aaaatttaaa tggtagatgt ataaatatat aaatgtttat 9960 aaatattttt ttatattaga aattagtttt tgtaataatt ttagaaattt ttttttttaa 10020 atgatttgtt agaaatttat tagtatgttg gaaatattaa tttttaggta attttaaagt 10080 atttatataa gtttaaatat ttttttttat atttattgat tataaaagaa aataatggat 10140 gttaagtaat atagggttta aatatttaaa ttttatgaat gtattatata atgagattat 10200 gatttaaatg agataatttg taattagaaa agtaagttga ggtgggtgga ttgtttgagt 10260 ttaggagttt gagattagtt tgggtaatat agtaaaattt tatttttata aaaaataaaa 10320 attaaaatta aaaaatagtt aggtgtggtc gtacgtgttt gtggttttat ttatttggga 10380 ggttgagatg ggaggatggt ttgagtttag gaggtagagg ttgtagtagg ttaagattat 10440 gttattgtat tttagtttgg ttaatagagt tagattttat tttaaaaaaa aaaaaggaag 10500 aaagaaaaga aagtttttag aattatatta tttaaggttt aaattttatt ttagttaatt 10560 gtgtttttaa gtaattattt aattgttttg agttttgttt tttttattgt aaaattggga 10620 ttttttattt agttgttata aggataaaag atatatgaaa aattatatta ttgggttcgg 10680 tggtttatgt ttgtaatttt aagtattttg ggaggttaag gtagtggatt aagaggttag 10740 aagatcgagg tggttaatat ggtgaaattt tatttttatt aaaatataaa aaaaaattag 10800 tcggtggtgg tggcgtgcgt ttgtagtttt agttatttgg gaggttgagg taagggaatt 10860 atttgaattt aggaggtgga ggttatagtg agttgagatc gcgttattgt attttagttt 10920 ggtaatagag cgagatttta ttttaaaaaa aaagaaaagt aaagaaaaat tatgtaaggt 10980 atataagagt ttaataataa ttatagtaat tattataaaa ttaatatttt agagttattg 11040 aaaatattta cgtagaagaa aaaattaggt attaaaatag aatgtgttta aaaagttgat 11100 atataaaata aataagatta aaaggtgaat tttatatata ttttaaaaat aaataaattt 11160 tgttgattgg ttaaaagaat ggttagaatt ttttagatta gattttagag ttagttggtt 11220 gttttttaat taattaaaag gtttgtagag gtggagggag ggatgggagg ggttaaaatt 11280 tttaaaagat ttagttttaa atagatttag tagagtatat tttaagttta tagaagagaa 11340 gcgtagagag aagttaagta gtagtttaag tttttttaga gtgatagtga attttagaga 11400 tgttttttat tttaaggagg aattttttat cggtataaat ataatgttat tttattgtta 11460 tatatttagt atttattgtg ttaaatattg tattaagaat atagaaatag ataagatgta 11520 gtttttgtta atatattaaa aggaaaaaat tagttaataa ttatttttta aaaggaagtt 11580 taataagtat attgaattag ttgatagatg gtttttaggg gatttttatt ttaaagaatg 11640 tgtttaagtg ttttaataaa ttttataaag taggttaggt ggtttgtgtt ttagaattaa 11700 cgatagattc gatattgatt ggagatagag tttagaagta tatataagta ttttaatttg 11760 tttgttaatt tgttattatg atagtttagg tatatagaat agttatgaaa tgtgtttaga 11820 atagtgttaa aattaggttt attattatat cgaaaaggaa agtaagttta cgggatgtat 11880 ttggtatata gtagattggg gtgttatata attaaaatag gtttttaaat gaaacgtaaa 11940 atttattggt agttttgata tggtataata ttttaaaaga taagataaat ttataatttt 12000 aatattattt aagtaatagt ttatagtgtt tttttaaaaa tgttggaaag aggtaataga 12060 atacggaaat tataaggata tttaaaaaga tattttggaa agtttaagat aaagttaatg 12120 tcgcggggtt ttggaagtag atttcgagta atatgtttgt ttaaagttat tagtcgtttc 12180 ggagggcgtg cgggtattta attgtttttg ttttaggttt ttttgtttcg taggattttc 12240 gcgaggaata gttgtaacga gggatgtttt ttgagttcgt tgttacgcga atttcgggag 12300 ggaggaaagt aagcggtgta gttgatgcgg aatcggggcg cgggggtagt cggatttagt 12360 tagcgttttt tcggcgttag tcgtttagag gcggtacggt tagaagttta gtgaagttcg 12420 gattcgcgag gtttcgttgt tttttatttt tagggttcgt agcgtcgcgt ttagtattag 12480 ttgttgcggc ggttatcgtt tacgtcgttc ggtagcgatt agcggtgttg tttcgattta 12540 gaatttcgtt attgttgttt tcgtagatcg tttttttgtt gattttttat atagtcggag 12600 ggggtggaga aggggagcgt aggagtttcg gtaaattacg agttagaaat tcgatgtttc 12660 gttttttaat ttgcggaaag gggagggtga gtggtcggtt agattcgtcg gattcgggat 12720 tcgggagtcg cgttaggatt tggagggtta gtcggcgggt tgcgcgttcg gtcgttagtt 12780 gagttggagg ttatcggtta gagtcgattt taggagtgag agagataggg gcgtgcgtga 12840 gtttcggcgg tttgtatcgg gtaaatttcg tattttttta gtatcggttt agtaatttac 12900 gtgtatttag gtcggttaat gttattgagt tattttcgcg ttttggttat tttggagttt 12960 cgagaattcg aagttttaga taaatgttta aattatattt ttgtatgttc gaaagcgtaa 13020 attgtaaagt ataaatttag gtaaggtttt taacgattgt aataatatat aaaaagtttt 13080 aggtttggaa attagagatt cgagtttaag ttttattttt ggtatttaat atgtgtgtgt 13140 gaaagaaatt agttataatt agagttagtt tttgttgttc gtaagtagaa atttttgtta 13200 gtataattat tggttaggcg tagtggttta cgtttgtaat tttagtattt tgggaggtcg 13260 aggcgggagg ataatttgag gttaggagtt ggagattagt ttggataata tgtcgaaatt 13320 tcgtttttat taaaaaatat aaaaattagt tgggcgtggt ggcgtatttt tgtaatttta 13380 gttattcggg aggaggttga ggtaggagaa ttgtttgaat tttggaggtg gaggttgtag 13440 tgagtcggat tatgttatta tattttagtt tgggtgatag agtaaatttc gtttcgaaaa 13500 ataaaataaa aattagtata attattaagg gtcgggtcgt gtgttagagt tttagatttt 13560 tttttatttg agagtttata agaattttaa tggagtatat attattttta tttggagaaa 13620 ttgaagttgt agtagggtaa agttatttag cgagtaaaag gttaaattag ggtttgaatt 13680 taaatttggt tgttttgagg gattgggttt atgttttgtt atattatgga aattttaaaa 13740 tatatataaa agagataaaa ttgtattatg attatttaga tatttattat atcgcgttaa 13800 tgaattaata ttttgttaat tttgttttat ttattttttt ttttattttg tgtaggaata 13860 ttttaaagta aatttaagat attagattat tttatttata aatatattag tattgggggt 13920 ttttttttta attattttgt attttttgta gagttatttt gagagagtta taaagttagg 13980 aatggtttag agtatattat agtatggtaa atgtttaaag agagagaaat aaaatgggga 14040 tattagaaag gtgatattta atggaatttt agaatgtaag tagggatttt tgtgataaaa 14100 tgaaaaggat tattaatttt ataggatttt ttatttatgt attttagttt ttatttattt 14160 tttatttggg aaatttgttt tttttttttt ttttgttttt tgtttttttt ttatgtttta 14220 ttttttggat tagttttttt taggttttgt ttgttttttt tataggagtt ttttttatga 14280 aaggtatttg tagtagaaat tgttttttat gttatttatt ttttatgtat tattttagta 14340 agagtgtttt tgagatttag ttgggtatat ggttatttag cgaaaggttg taatagttag 14400 ttttttttat aacgaggtgt agcgttatga ttaaggtttg gaatgtaagg attgtgtttt 14460 ttatgttttt ttttttttta tttaaataaa gatttatatt ttttaatttt tattgtagta 14520 agggtgttta ttaagatttg gttattaagt tttggttaat gggatataag tataagtgat 14580 atagataatt tttgggttat atttttaaag ggaaaggttt gttttttatt tgtttttttt 14640 ttttttttag tttgttagaa tgtggatatt atagtggagg taaagttgtt attttagatg 14700 ataagaagga agttaggtga tcggggagat aaaataatat attaggagtt tttagtgttt 14760 gattttgtgg agtcgttacg ttaattttgg agtgttttgt ttagattttt atgtaagtaa 14820 gaaaaatatt gtattttgtt taagttattg tattgtgttt ttttgttttg tttttgttat 14880 agtagttata tgtgtgtttt tattgataga ggattaatat ttatttttgt tttttttatt 14940 tgaagttgta gattgtggtc gggagtagtg gtttacgttt ataattttag tattttggga 15000 ggtcgaggcg gatagattac gaggttagta tttcgagatt agtatggtta atatggtgaa 15060 gttttatttt tattaaaaat ataaatatta gttaggtatg gtggtaggtt tttgtaattt 15120 tagttattcg gtaggttgag gtaggagaat tatttgaatt cgggaggtag aggttttagt 15180 gagttgagat tgtattattg tattttagtt tgggcgatag attaagattt tattttaaaa 15240 aaaaaaaaaa aaaagttata gattgtaagg aaaatatttt taaggaagtt gaggatatag 15300 tagatttgga ttgtttttaa atttgtttat ttttttgagt gtattgttcg gagtatttta 15360 ttgggtagta tattttggtt ttttttttag ttcgatgtgg tattatattt gatttttggt 15420 taataaaata tgagaggata tgaaatttaa tagtttttgg gtttggttta taaaattttt 15480 tatgtaattt tttatatttt tttatttttt agttgttgag atttttttag gtattatata 15540 gaagtagttt gggtttttag tagtaaagga gagtagattt tttttattat tttgtatcga 15600 attgtgatat gagtaaaaaa taaagttttt atttttttat attattgaga tttgaggatt 15660 gttagagtag ttagtttttt tagtttaata tagtattagt agaggataat taggttagat 15720 atagtagttt atgtttataa ttatagtagt ttataaggtc gaggtgggta gattatttga 15780 tgttaggagt ttgagattag tttggtcgat atggtgaaat tttagtttta taaaaaatac 15840 gaaaattagt taaatatggt ggtacgtgtt tgtgatttta gttatttagg aagttgaggt 15900 aggaaaattt ttaagttagg aggcggaggt tgtagtgaat taagattgta ttagtgtatt 15960 ttagtttggg taatagagtg agattttgtt ttaaaaataa ataaataaat aataaaaaat 16020 tttttttaga ataaaaatat atattaataa tattaagaat ggttaggtac ggtggtttat 16080 attttttatt ttagtatttt gagagtttta ggtgagtaga ttattttagg gtaggagttt 16140 gagattagtt tggttaatat ggggaaattt tgtttttatt aaaaatataa aaattagttc 16200 gggcgtagtg gtttacgttt gtaattttag tattttggga ggtcgagatg ggcggattac 16260 gaggttagga gatcgaggtt attttggtta atacggtgaa attttatttt tattaaaaat 16320 ataaaaaaat tagttaggta tgatggcggg tatttgtaat tttagttatt cgggaggttg 16380 aggtaggaga atggcgtgaa ttcgggaggc ggagtttgta gtgagtcgag atcgcgttgt 16440 tgtattttag tttgggtgat tgagggagat tttgttttaa aaaaaaaaaa aagaaggtaa 16500 agtagaggtt tttttttaaa gatttttttt tttatttaat taggaataaa tagtaatttt 16560 ttttagaagt aaaatttatt taaagatttg tgttaatatt tttaaatatt tgttagtttt 16620 aataaattaa tgtattttat gtttttagtt tttataattt agtataaata tttgttttgg 16680 tatgtttata ttagtttaag taagtattag gttatagttt gttttttttt tttatttgaa 16740 gatgttttag tggtgggttg aagggttttt taagtgtcgt taaagtggga gtttaggtag 16800 aggaggtgtt gagagcgagc gagggttgtg aggattgtta gtaggttgtt attttttaat 16860 ttttttttta aataggatat tttaattgtt gttgggaatt tggttaatga tcgttttagt 16920 tattttttgt tgtatagggg cgatgatggg gttttgtagt tgtagtgttt tttagagggg 16980 aggtttttag gttagggaaa ttgttagcgg gttagtttag gggttttcgg tagaagttgt 17040 tagttgaatt gatttggggg tttatttgta agattatttg tagtttgatg gtttcgattt 17100 tagaggaaat aaatttgata ggaaggttaa aaatataggg tttaaaggcg agtaatagta 17160 agatggttgt tataggattt agaaagggga gaagttatgt tgtttaattt tagaggttgg 17220 tataagaatt tgaaaggtat ttgattttag aagttttttt ttgtaaatat taggcggtat 17280 tttatattat tttcgattgg ttagtgtaaa aataatattt tttttttaag aaggtgtaga 17340 gttttttttt tttagtagtg aggaggatta ggttttggcg gttttggaga gttattgttg 17400 ttaaagagtt tatttgggat tataaagtaa gaatagattt tattattttt tgtagaatgt 17460 ttgagaaatt ttttgagagt gtgtggtagt aggataatga agtagataaa tcggttattt 17520 tggtttt 17527 29 8842 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 29 aattgtaata tatgttatta tgagttttaa aataattaag tgagtaattg gtagggttgt 60 taatagtgtt aattaatttt ttggatgttt agttataaag atatgttaaa ataatgtttt 120 ttgtatttga ttttattgtt atggggaaaa aatattttaa attattggag gaagtttttt 180 tttgttttcg aaaaaaaatt atatatgaga aaaatataag gaattttaag tttggtaagg 240 gtttgttttt tttttttggg aatcgtgata agttttttta tgaagtgttg attttaggta 300 gatttaaata ggtggtttgt tagacggtta gattttattt atacgagggt tggcggtttt 360 gagagttttt tgagttaatt gtatatatat atattttttt gagacgaagt tttattttgt 420 tatttaggtt ggagtgtagt ggcgtgattt tagtttattg taatttttgt tttttgggtt 480 taagtgtatt ttttttggtt tagtgtaatt cgtacggatt tagggggatt gaataaaggg 540 gattgaacgt gggaataaaa gataagagat aaaataatat atttggaaga aggggttagt 600 ggtattttag ttttttaaag tgttgggatt ataggcgtga gttattgttt taagttagaa 660 gatagaaatt tttaagtttt gttttattag tgaggattta ggttattaag aagtgaaaag 720 atttgtaata tttatttata gtttataaga ttttagtata gtgtttatta aggatggggt 780 tttgttttaa gtgtttgata aatattaatt tatataagtt ttatgatagt tagttttatg 840 agatgaatgt tgttattatg ttttatttaa agacgaggaa atcgaagtat agagagttta 900 ggtaaattgt tcgaggttat atagttggta agtcgttgag ttaggatttg agattaggta 960 gattggtgtt agagtttaga tgttaggtcg ttttttcgta ggatagtttt taggttttta 1020 aaggttgttt tcgtttgggg attagttata gaaaatgatt gatagtaatt ttaggttaga 1080 tttattagtg tgtgtttaaa atttttttta ttaaaatatg tattttttta tatattttta 1140 ttggataata gaaagatatg atgggtcgag tgtagtggat tatgtttttg attttagtat 1200 tttgtgaggt tgaggtggga ggatcgtttg agtttaggag ttcgagattt gtttgggtaa 1260 tatagcgaga ttttgttttt attttaaaaa ttatatagaa agatatgttt atatttattg 1320 tggtttattt attttagatt taggaatttc gtgttttttt gaatatatta tggtattttt 1380 ttttattaat tttttttagg attttgttat gagagggtat agtttatttt ttatatttat 1440 aaaatgtaaa gttgatatga atattttttt ttggtttttt attattttta ggaaaagtgt 1500 ttaaattttt aatgaggttt aataggatta ggataattta ttgttaattt cgtgtttagc 1560 gtttagatta tagttagaag gttttttttt tagtgttgag gtttgaatgt gttttttaaa 1620 atttatttat tgaaatttaa tttttaatgt gagggtatta ggaagcgggg tttttgggag 1680 gtgattagat gatgaggatg gagttttgtt ttattttttt aggttttttt gaatggaatt 1740 agtattttga tggaagaggt tgaagggaat attttaggta attttttgtt tttttatttt 1800 tttgttatgt gaggatttag ttagaaggtt tttattagat attgaatgtt ttgatcgtgg 1860 attttttaat agttagaatt ataataaatt aatgtttggg tttgtttgtt tggttggttt 1920 ttattgttgt tgttgtttgt tgtttttttt ttttgagata gggttttgtt ttgttatata 1980 ggttggagtg tagtgatata atcgtggttt attgtagttt cgatttttcg ggtttaagtt 2040 atttttttat tttagttttt taagtagttg ggattatagg tatttgttat tatgtttagt 2100 taatttttgt tttttttgta gagatggggt tttattacgt ttgttaggtt ggttttaaat 2160 ttttgggttt aagtaattta tttgttttag tttcggaaag tgttaagatt ataggtatga 2220 gttatcgggt ttggttaaaa ttttttatat tttgtgttga gtggtgaata taattgtaaa 2280 aaaaaaaaaa aattatgtaa ttgtatagtt ataaattgtg tattttatta tatgtaagtt 2340 atattttatt tttttaatta gaaaataatt attttaaata tgatttgttg tgatatattt 2400 ggattttaaa atgggtattt tatattcgta ggggaaaagg tgggaattaa tatttgggtt 2460 ttgttgtata ataggttttg tgtgagattt aatatagaag aattagattt ttttataata 2520 ttaggaaaat attaggaaaa aattattagg aaaaaaatat taggtaattt taggaattaa 2580 atgtaatttt gtgatatttt ttattaggtt tttttaagag taattatttt aggtatttta 2640 atggtagatg gaatttttaa ggaattttta tttttaggtg gattaatagt ttattttgaa 2700 aatgatagta atgtgtattt agtttaatat gataaagtat ttttatataa atgtttgatg 2760 aattttatgt taataagatt atatttgtta gtagaagggt ttaaattagg attgaaattt 2820 taaatttata tgtgataatg ataagtgttt tattaatttg aaagtatatt aaataaaata 2880 ataaattatt tttggagtta tagtgaattt ttttaatata tttattttaa gaatatataa 2940 tttaggaaat tttagatgtt tattttatga tatttcggga gataggggat tttagaggat 3000 tttcgttcgt ggcgtaaaag tattattatt tcgtggagat gatttttaaa ttaatatttt 3060 tagtaagatg ttttagattt ataattttaa tttttcgggg gatattttta gatagttgtg 3120 ttattgttat tattaggtta atatgtttta aattatttag attagttttt ttttttgagt 3180 tggatatttg gtttttaatt tttttatttt tttttatttt ttatatttta ttagtagtag 3240 tagttgttga aattatatta tgtaagtttt ttacgtttat ttttgttttt taatggcgtt 3300 tttttatttt tttaagaagt ttttttttat tgtaatacga ttttttagtt tagagtttgg 3360 tttagtgttt aaattatttt tttagttatg ttgagagttg gttatgtttt gaatttttgt 3420 tttgaatatt tttagtgata ttgggagaga attattttat tggattattg ttattgttag 3480 aaaatttatt gttatgttga aatgaaatga ttttatttat atatatatat atatatatat 3540 aaaatagttt ttttttttgg aatatgattg gtttgaaaat gtgtgaagat atatttaatt 3600 ttttttggtt ttattgttta tttaattttt tgtttttttt ttggtaggag gattatattt 3660 tattttgtgg aatttagata tggtcgggta attagttttg gttcgtgaaa attgagagga 3720 agtgatatgt gttatttttg ggtagaagtt ttgagagtcg gtttaaatga tttttttttt 3780 ttttatttat gagataagtt aagttttaga gagagggtgt tacgttgtga gggatttgtg 3840 ttacgagtac gatggttcgc gttattttaa atttttgaaa ttattgaaat ttggaggtta 3900 gttgttatat tataatttag ttaattttag ttagtttgtt ttttttttaa tttttttaat 3960 cgttttttat aagttataat cgtagttttt tatcgttttg attattgttt ttggatttta 4020 tttagtttat ttattatttt ttttaaaatg tggagtttaa atttgaattc ggaattttag 4080 gtgtaatttt attaggatat aatataatgg gtttttgagt tttttgattt tttgaataga 4140 gttttttgtt gttttggtgt tttgtttttg tgtgtgtttt tattatcggt tgagttacgt 4200 tgttaattcg tagtgagttt gtgaattaat aattagagaa aaaagatttt ttttattgtt 4260 ttttcgatat atattgggaa ataaattttt tgattcgcgt ttaagtagat agggtagaat 4320 tgtttaattg ttacgtgatt ttttaaagat aaagttagtg gtagattatt tatagaaatt 4380 agatgttttg ttttttggtt ttgagtatgt tgttaatttt tattatttag tgtattgaac 4440 gagatgtatt gaacgagggt tgtagagttg tagtatcggt aggagtaggc gttcggtagg 4500 acggggtttg tataattttt tcggtagtta gtagagcgga atttaggaag gttttttttt 4560 cgcggcgttt tggaggcggg ggttttattt ttttacgtag gcgttattaa gtttcgtttt 4620 tttattcgtt cgcggcgtgg cgtcggaaag agtttttagt tttttttttt ttggcgttga 4680 tatttaatgg gtagttttag gtttttagcg ggggcggggt attttttgga cgtcgttttg 4740 gttggttcgc ggttcggcgt agcgtatgac gttattacga ttttgttacg tcgcggtgcg 4800 attgaggcgt ggcgtttgtt ggggtatttg aaggagattt gggggtattc gcgtcgtgtt 4860 ttttgggttg tgaggagtcg tcgttgtcgt tattgtttgt gttttatgag gaagatgttc 4920 gtcgtcgttt ttcgcgtgtt gtttggcgtt ttttagaagt cggtgagatt tttcgggcgg 4980 gtcgggatgg ggcgcgagtg gggttgaggc ggggtcggag ggtagggcgg gttaggtcgg 5040 gttatttaga gcggggtgga aggcgttagg ggagtcgggg agtttttatt tcgttttcgc 5100 gttttgtatt tcgtttttgg tttcgggaga agcggtacgg atcgggatta cgttaaggtt 5160 cgtgtgaatt tttttttttt cgatatttat ttttcgtttt cgggtttagt tgtgcgttag 5220 gcgaagtcgg tgtgtttaag aggtgtttgt tgggttatag gatacggaaa gggtggtttc 5280 ggtttttttc gagtttttaa ttgattttat ttatttcgga ttttttaatt taattttttt 5340 tgatcgagag gttttgtaat agcgtagaat ttggagatag ggtggtttcg tttaaatagt 5400 atttttatta ttgattagtt ttgtgatttt gagtaagttt ttaaacgttt cggggattcg 5460 gttttttaaa atgtttgttc gaagtggagt taatttttaa atggagataa gagttatttt 5520 tgaaatgtta ttagttaatt ttaaaatgga gataataaga gtttttattt tttggggttg 5580 ttttgaggat ttaacgagtg atacgtgtgg aaacgatttt aaatagtatt tggtatataa 5640 tcgataatat gtgtgttgaa tagtgttatt tattgagttt ttagttcggt atatattttt 5700 tgaatatttg tgtttagttt tgaggcgggt ttatagaagg ttagtttttt tagaaataaa 5760 tttttttttt tttttttttt tttaatattt gagttttttt tggtagtgag tttaggagcg 5820 tcgaagtaga atttagatta ttttttttgg tntattntcg ttttgtttga gatagggttt 5880 ttgtgttatt taggttggag tgtagtagta ggatagttta ttgtagtttt agtttgttgg 5940 gtttaagcga tttttttgtt ttagtttttt gagtagttgg gaatataggt atgtgttatt 6000 attatattta gttaattaaa aaaatttttt ttttattaga gatatggttt tgttacgttg 6060 tttagtttgg tttttatttt taggtttaag tagttttttt atttcggttt tttaaagtgt 6120 tgggattatt tttatttttt taaaattagg taggtaggga gatttatttt aggtttaaag 6180 attgttattg ttttattaaa gagtgtttgg tgtgaaattt tgaaatgaat attaagattg 6240 tgtttttatt tttgaataag gtttatagtt tttatagttt ttattttatg gaagaagatt 6300 gaatgtattt aaaatgttat tttattgttt gtatttttgt atggtttttt ttgtgagatt 6360 tttattagta atgttttggt tttataagtg gtaggtaaga gttttaattt atattgttag 6420 aatttggaat ttttgaaacg tttttttttt tttatatgaa tggtttttat gtatttagga 6480 agttaaagtt ttattttttt ttaattaatt ttttttttta ggttggaatg tagtggtata 6540 gttatagttt attgtagttt taggtgtgtg ttattatatt tgattaattt tttaatattt 6600 atttttgtag agatgagagt tttatgttgt ttaggttggt tttgaatttt tggttttaag 6660 tggttttttt attttggttt tttaaagtgt tggggattat aggtgtgagt tattatgttc 6720 ggtttagttt ttatttttta aaatttgagt gggttgttcg tggtttttgt tagagaggaa 6780 ttttatttaa tagagaattt ttttatggtt ttttagagaa aatgaatggt aaatttattt 6840 ttttaataag tttttattta gaaatgatat atatatattt ttgataggat ttttagtttt 6900 tttaattttg ttttttttat ttatattagt ggtttttatt tttgagatat atagtaatga 6960 agttatggga gaaagtattt aagtagtttt ttggtagttt taatttttgt aggcgtaaga 7020 ttataggcgt atgttatagt attgggtttt tttttgtttt ttattgtata gtattatttt 7080 gttttattgt tttaatttta ggattgagaa agaagttatt ttttttttgt tattgtcgtt 7140 tggttggttt ggatttttgt tttttaaaaa ttgtagtttt tgtagttgta tttggaaatt 7200 tattttataa tataataaat ttttggtttt ataaaatatt tattaattgt taagaataat 7260 atatttgttt gattgttaaa tataattatt gatttgttgt tttatttttt tttagtttta 7320 ttttttttta aatttttaaa ttttttttat tttttttgag atatattagt ggattgtttt 7380 tgtttgtaag ttaattgaaa tattgatttt tagtatttta gttgtttttt tttagtattg 7440 ttattgtttg tgtttgttgg ttttgtttaa taatggttta ttgaggggtg aagatatacg 7500 taattagttt tttgtttatt ggtttgtata ttttagggta tatttggtag attagtttta 7560 atttttttta ttaagattag tttagtgttg gattaggtaa ggtatgaata tattagatgt 7620 gttttttatg gagaaattat gttggtttat acgttagtgt gtgagaatgt ggtagaaggg 7680 agttaaaata gtatgataat attattggat aaattttgtg gtttaattta aattttagtt 7740 attatataga atatttttgt tgtgagtagg tttgtttagt tgtaaaattg gaaaggaatt 7800 attttttatt tttcgttttt aagtttttta tttttaaata gtgatagtta tttaaatatt 7860 aagagaatag tgttttagag aatattttta ttggggtttt aggaggagtt tgtttaagat 7920 ttaggttgtt taaattataa attataaaat agttggttta agtttattgt gtttaagtta 7980 gagagtgtta agtatttttt tttttgtttt gtttttttaa agtatttatt ttatatttta 8040 attaatttaa aatatttttt tttatagatt ttatttgata gaagagttac gtttgtttag 8100 agtggagatt aggttatagt tttatttgaa gtataatttt ggtttgttta aaatgaatag 8160 tatttggtta tgattaagaa tggtatgaaa aggttagacg tagtggttta tgtttgtaat 8220 tttagtattt tgggaggtta aggtaggtgg attatttgag gttaggagtt ggagattagg 8280 ttggttaata tggtgaaatt ttatttttat taaaaatata aaaattagtc gggcgtggtg 8340 gtgggtattt gtaattttag ttattcggga gattgagata ggagaaatta tttgaattcg 8400 ggaagcggag gttgtagtga gtcgagatcg tattattgta ttttagtttg ggtgataaaa 8460 gtaaaatttc gttttaaaat aaataaataa aagaatggta taaatagata tagtttatag 8520 atgatttagt ttttttagtt attaatttta ttatattttt attataattt ttttgaaaat 8580 aaaggatggg tttgtttttt gttttttttt gcgttgtttg tttttagatg cgggataatt 8640 ttgttttatt ggttaaagta tggatttatt ttggaggtta aggaagatgt aaatatagtg 8700 tatagggtgg aagagaagtt tatgaatatg ttggggttta ttaaattttt ataattttat 8760 tttgataatt gattattata ttttttaaaa tagttgataa ttaaaaagta ttgatttgtt 8820 tgtatatttt tgttttttaa gg 8842 30 8842 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 30 ttttaaaaga taaaaatata taaataaatt agtatttttt aattgttagt tattttggaa 60 agtataataa ttagttatta gaatgaagtt atggaaattt aataagtttt aatatattta 120 taggtttttt ttttattttg tgtattgtgt ttgtattttt tttggttttt aaaatgaatt 180 tatgttttgg ttaatgaaat aggattattt cgtatttgaa ggtaagtagc gtaaagaggg 240 gtaaaaaata aatttatttt ttgtttttaa agaaattata gtgagaatat aatgaaatta 300 gtggttaaag agattagatt atttgtgagt tgtgtttgtt tatgttattt ttttgtttgt 360 ttgttttgag acggagtttt gtttttatta tttaggttgg agtgtagtgg tgcgatttcg 420 gtttattgta attttcgttt ttcgggttta agtgattttt tttgttttag tttttcgagt 480 agttgggatt ataggtgttt attattacgt tcggttaatt tttatatttt tagtagagat 540 ggggttttat tatgttggtt agtttggttt ttaatttttg attttaggtg atttatttgt 600 tttggttttt taaagtattg ggattgtagg tatgagttat tgcgtttggt ttttttatgt 660 tatttttagt tataattaga tattgtttat tttgagtaag ttaaaattat attttaaata 720 aaattatgat ttaattttta ttttaggtaa acgtgatttt tttattaaat aggatttgta 780 agagaagata ttttaaattg attgaagtat gagataaata ttttagggag ataagataaa 840 agaaaagata tttagtattt tttgatttaa atataatggg tttgagttag ttgttttata 900 atttataatt tgaatagttt aaattttgga taggtttttt ttgaagtttt agtagaaatg 960 ttttttgaaa tattgttttt ttgatgtttg ggtggttgtt attgtttgga ggtaaaaagt 1020 ttggaggcgg ggggtgagaa atgatttttt tttagtttta taattgagta aatttgttta 1080 tagtaaaagt attttatgta atggttaagg tttaggttag attataaaat ttatttagta 1140 gtattattat attattttag tttttttttg ttatattttt atatattgac gtgtaaatta 1200 atatgatttt tttataaaaa gtatatttga tgtgtttata ttttatttaa tttagtattg 1260 gattgatttt ggtgagaaga gttaagattg atttgttaag tatattttgg agtgtataag 1320 ttaataggta gaaagttaat tacgtatatt tttatttttt aatagattat tattggataa 1380 agttaataaa tatagataat gatagtgttg gaggaaaata attgaaatat taggaattag 1440 tgttttagtt aatttatagg tagagatagt ttattaatgt attttagaaa aagtgaagga 1500 aatttaggaa tttgggaaga agtaaagttg agagaaggtg aaatagtaaa ttaatggtta 1560 tatttagtaa ttaaatagat gtgttatttt tggtagttaa taaatatttt gtggggttag 1620 aaatttattg tattgtgaaa taaattttta aatataatta tagaaattgt agtttttgga 1680 aggtaggagt ttaaattagt taggcgatag taatagagaa aaggtaattt tttttttaat 1740 tttagagttg aaataatgag gtaggataat gttatataat aaagagtaag aaggggttta 1800 gtgttgtggt atgcgtttgt aattttgcgt ttgtaaagat taggattgtt agaaagttat 1860 ttagatattt ttttttatgg ttttattatt gtgtatttta aaaataagaa ttattgatat 1920 gagtgaaagg aataaagtta aagaagttaa aagttttatt agaagtgtgt gtgtattatt 1980 tttgagtgag agtttgttga aaagataagt ttattattta ttttttttgg agagttataa 2040 aaagattttt tgttaaatgg gatttttttt tgatagagat tacgaataat ttatttaaat 2100 tttaaaaaat aaaaattagg tcgggtatga tggtttatat ttataatttt tagtattttg 2160 ggaggttagg gtgggaggat tatttgaagt taggagttta aagttagttt gggtaatatg 2220 agatttttat ttttataaaa ataaatatta aaaaattagt taggtatggt ggtatatatt 2280 tgaggttata gtgagttatg attgtgttat tgtattttag tttaaaaaaa aaaattaatt 2340 aaaaaaaagt aaaattttaa ttttttaaat atataggaat tatttatgtg aaagaggaaa 2400 aacgttttaa aaattttaga ttttaatagt gtaaattaaa atttttattt attatttata 2460 aagttaaaat attgttagta aagattttat aaaaggagtt atatagaaat gtaaataata 2520 aaataatatt ttaaatgtat ttaatttttt tttatgaaat aagaattatg aaaattataa 2580 attttattta aaaataaaaa tataattttg atatttattt taaagtttta tattaaatat 2640 tttttgatga gataatggta atttttaagt ttgagataaa tttttttatt tgtttggttt 2700 taagagagtg agagtaattt tagtattttg ggaggtcgag gtgggaggat tgtttgagtt 2760 tggagatgga gattagattg ggtaacgtag taagattatg tttttagtaa aaaaaaaatt 2820 tttttaattg gttgggtgtg gtggtggtat atgtttgtgt ttttagttat ttaggaggtt 2880 aaggtaggag gatcgtttga gtttagtagg ttaaggttgt agtgagttgt tttgttattg 2940 tattttagtt tgggtgatat agagattttg ttttaaataa aacganagta nattagggag 3000 aataatttga gttttgtttc ggcgtttttg aatttattgt taagaaaagt ttagatgttg 3060 agggagaggg aagaggagga agtttgtttt tgaagaggtt gattttttgt gaattcgttt 3120 tagaattgag tataggtgtt taagaaatgt atatcgaatt ggagatttaa taaataatat 3180 tatttaatat atatgttatc gattatgtgt taggtgttat ttggaatcgt ttttatacgt 3240 gttattcgtt gaatttttaa gataatttta agaggtgggg atttttatta tttttatttt 3300 agagttaatt gataatattt tagagataat ttttattttt atttagagat taattttatt 3360 tcgagtaaat attttaggaa atcgggtttt cgggacgttt aaaaatttgt ttaaggttat 3420 agggttagtt aatggtgagg gtgttgtttg aacgaagtta ttttgttttt agattttacg 3480 ttattataaa gtttttcggt taagagaaat taagttagaa gattcgaaat gagtggggtt 3540 aattggagat tcgaaggagg tcgaggttat ttttttcgtg ttttgtaatt taataggtat 3600 tttttgagta tatcgatttc gtttggcgta tagttgggtt cgggggcggg aggtgggtgt 3660 cgagaagggg gaagtttata cggattttgg cgtgatttcg gttcgtgtcg tttttttcga 3720 ggttaggaac ggaatgtagg gcgcggaggc gaagtaaagg tttttcggtt tttttggcgt 3780 tttttatttc gttttgggtg gttcggtttg gttcgttttg tttttcggtt tcgttttagt 3840 tttattcgcg ttttatttcg gttcgttcgg gaggttttat cggtttttga gaagcgttag 3900 atagtacgcg ggagacggcg gcgagtattt tttttatgaa gtataggtag tggcggtagc 3960 ggcgattttt tataatttag gaggtacgac gcgggtgttt ttaagttttt tttaggtgtt 4020 ttagtagacg ttacgtttta gtcgtatcgc ggcgtgatag agtcgtaata acgttatgcg 4080 ttgcgtcggg tcgcgggtta attagaacgg cgtttagggg gtgtttcgtt ttcgttaaag 4140 gtttgaggtt gtttattggg tattagcgtt agagagggag gggttgaggg tttttttcga 4200 cgttacgtcg cgggcgggtg aggaggcggg gtttgatagc gtttgcgtgg gaaggtgggg 4260 ttttcgtttt tagggcgtcg cgggaaagga gtttttttag atttcgtttt gttgattatc 4320 ggggaggttg tgtaggtttc gttttatcga gcgtttattt ttgtcggtgt tgtagttttg 4380 tagttttcgt ttagtatatt tcgtttagta tattagatga tgaagattag tagtatgttt 4440 agagttaaaa gatagaatat ttggtttttg taaatggttt gttattaatt ttgtttttaa 4500 aagattacgt agtagttgga tagttttgtt ttgtttattt gaacgcggat taaaaaattt 4560 gttttttaat atatgtcgag aggataatgg gaaaaatttt ttttttttag ttattggttt 4620 ataggtttat tgcgagttaa tagcgtggtt tagtcgatga taaaagtata tatagagata 4680 aaatattaaa gtaataaggg gttttattta gaggattaaa gggtttagga atttattgtg 4740 ttgtgtttta gtgggattgt atttggggtt tcgggtttag atttgggttt tatattttaa 4800 gggggataat gagtaaattg agtggaattt agggatagtg gttagaacgg tgaggggttg 4860 cgattgtgat ttatgaagaa cgattaaaga agttaggaag aaaataggtt aattagaatt 4920 ggttgggtta tgatgtaata attgattttt aaattttagt gattttaaga atttgaagtg 4980 acgcgagtta tcgtattcgt aatataggtt ttttatagcg tggtattttt tttttggaat 5040 ttagtttgtt ttatggatga agagaaaagg gattatttaa atcggttttt aaagtttttg 5100 tttagaagtg atatatgtta ttttttttta atttttacgg attagagtta gttattcgat 5160 tatgtttgag ttttataagg tgaaatataa tttttttgtt aggaggagaa tagaaaattg 5220 gatgaatagt aaaattagag aggattggat atgtttttat atatttttag gttagttatg 5280 ttttaggagg aagagttatt ttgtgtgtgt gtgtgtgtgt gtgtgaataa aattatttta 5340 ttttagtata ataatgaatt ttttaataat gataatggtt taatgagata attttttttt 5400 agtgttattg aaagtattta aagtagaagt ttaaagtatg attagttttt agtatagtta 5460 gagaaataat ttgggtattg ggttagattt tggattgaga gatcgtgttg tagtggaaga 5520 aaatttttta aaggagtgag agggcgttat taaaaggtag agatggacgt gagaaatttg 5580 tatggtatga ttttagtagt tgttgttgtt gatagaatat gaaaggtaaa agagaatgaa 5640 aaggttggag gttagatgtt tagtttagga gaaaaagttg gtttgaatgg tttgggatat 5700 gttgatttgg tggtggtagt ggtatagtta tttgaagatg tttttcggga agttggagtt 5760 gtaagtttgg aatattttgt taaaaatatt aatttgggag ttatttttac ggggtggtga 5820 tatttttacg ttacggacgg ggatttttta gagtttttta tttttcgggg tgttataaaa 5880 tgaatatttg ggattttttg gattgtatat ttttgaaata agtatattaa aaagatttat 5940 tgtggtttta aggataattt attattttgt ttggtgtgtt tttaagttga tggaatattt 6000 attattgtta tatgtaaatt taggatttta attttgattt aagttttttt attggtaaat 6060 ataattttgt tgatatgaaa tttattaaat atttatatag aaatgtttta ttatgttaaa 6120 ttggatgtat attattgtta tttttaaggt gaattattag tttatttaga aatgaaaatt 6180 ttttaaaagt tttatttgtt attaaaatgt ttgaaatggt tgtttttgaa agggtttgat 6240 aagaaatgtt atagaattat atttggtttt taggattatt tagtattttt tttttagtaa 6300 ttttttttta atattttttt agtattatgg aaaagtttaa tttttttatg ttaagtttta 6360 tatagagttt gttatatagt aggatttaaa tattaatttt tatttttttt tttgcgggtg 6420 taaaatattt attttaaggt ttaaatgtgt tatagtaggt tatatttggg gtaattgttt 6480 tttgattaaa aaaatgagat ataatttata tataataaaa tgtatagttt gtagttatgt 6540 agttatatga tttttttttt tttttataat tgtatttatt atttagtata agatatagaa 6600 aattttggtt aggttcggtg gtttatattt gtaattttag tatttttcga ggttgaggta 6660 ggtggattgt ttgagtttag gaatttgaga ttaatttagt aaacgtggtg aaattttatt 6720 tttataaaaa agataaaaat tagttgggta tagtggtagg tgtttgtaat tttagttatt 6780 tgggaggttg agatgggagg atggtttgaa ttcgggaggt cgaagttgta gtgagttacg 6840 attgtgttat tgtattttag tttgtgtggt aaagtaagat tttgttttaa aaaaaaaaaa 6900 taataaataa taataataat aaaaattaat taaataaata aatttagata ttgatttatt 6960 atggttttgg ttgttgggaa gtttacggtt agggtattta gtgtttggtg agggtttttt 7020 ggttgagttt ttatatggta gaagagtgga agggtaaaaa attgtttggg gtgttttttt 7080 taattttttt tattagggtg ttaattttat ttaaaggggt ttgggggagt ggggtagagt 7140 tttattttta ttatttaatt attttttaaa ggtttcgttt tttgatattt ttatattgga 7200 ggttaagttt tagtagatga attttagggg gtatatttag attttagtat tgaggaggag 7260 attttttagt tgtggtttga gcgttgagta cgaggttggt aatagattgt tttggttttg 7320 ttagatttta ttaaagattt agatattttt tttaagaata atgggaagtt agagaaggat 7380 gtttatgtta gttttgtatt ttgtaaatat ggaagatgag ttgtgttttt ttatgatagg 7440 attttaaagg aaattaatgg aaggaggtgt tatagtgtgt ttaggagagt acggggtttt 7500 tgaatttaag ataggtgaat tatagtgagt atgagtatat ttttttatat gatttttaaa 7560 atagagatag ggtttcgtta tgttgtttag gtaagtttcg aatttttggg tttaagcgat 7620 ttttttattt taattttata aagtgttgaa attaaaggta tgatttattg tattcggttt 7680 attatgtttt tttattattt aatggagata tgtggaaaaa tatatatttt aatagggaag 7740 attttaggta tatattgatg agtttggttt gaagttatta ttaattattt tttgtggttg 7800 atttttaaac ggaagtagtt tttggaaatt taagaattgt tttacggaga ggcggtttag 7860 tatttggatt ttggtattag tttgtttggt tttaaatttt ggtttaacga tttattagtt 7920 gtgtgatttc gggtaatttg tttaaatttt ttgtgtttcg gttttttcgt ttttaaatgg 7980 agtataatga taatatttat tttatagggt tggttgttat aaagtttata tggattaata 8040 tttgttaggt atttaagata gagttttatt tttaatgagt attatattag aattttgtag 8100 attataagta aatattgtaa atttttttat tttttggtga tttgggtttt tattggtaaa 8160 gtaaagttta gaaattttta ttttttggtt tggagtagtg gtttacgttt gtaattttag 8220 tattttggga agttgaggtg ttattgattt ttttttttaa atgtattatt ttgttttttg 8280 ttttttattt ttacgtttag ttttttttgt ttagtttttt taggttcgtg cgggttatat 8340 tgagttaggg agggtatatt tgaatttagg aggtagaggt tgtagtgagt tgagattacg 8400 ttattgtatt ttagtttggg tgatagagtg agatttcgtt ttaaaaaaat atatatatat 8460 gtagttggtt taaaagattt ttagggtcgt tagttttcgt gtgaatagag tttaatcgtt 8520 tgataagtta tttgtttggg tttgtttggg attaatattt tatgaagaag tttgttacgg 8580 tttttagaag gagagaatag gtttttgtta agtttaaggt tttttatgtt ttttttatgt 8640 ataatttttt ttcggggata gggggggatt ttttttagtg gtttaaggta tttttttttt 8700 ataatagtaa agttaaatat aggagatatt gttttaatat atttttgtga ttgggtattt 8760 agaaaattgg ttaatattgt taatagtttt gttaattgtt tatttgattg ttttgaggtt 8820 tatggtagta tgtattgtag tt 8842 31 6033 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 31 atatatattt ttaatgtatt tggataaata ttaaggagtt tgattgttag atagtgtggt 60 gagattatgt ttagttttgt aaaaaattgt tatattgttt tttaaagtgg ttgtattgtt 120 tcgtattttt attggtaatg aatgagagtt tgttgcgtta tattttcgtt cgtatttgat 180 gttgttaatg ttttggattt tagttattta atagttgtgt agtagtattt ttttgtttta 240 atttgtaatt ttttcgatag tatatgatgt taaatatttt tttatatgtt tatttgttat 300 atgtgtattg tttttgatga agggtttatt tagatttttt gtttattttt atttatttat 360 ttatttattt atttatttat ttttgggata gtattttatt tttgtcgttt aggttatagt 420 gtaatggcgt gtttttggtt tattgtaatt tttatttttt aggttttagt gatttttttg 480 tattagtttt ttaagtagtt gggattatag gtgtttgtta ttatgtatgg ttaatttttt 540 gtatttttat taaagatagg gttttattat gttggttagg ttggttttaa atttttgatt 600 ttaggtgatt tatttgtatc ggttttttaa agtgttggga ttttaggcgt gagttatcgc 660 gttttgttgt gtttttaaag tgaggtgttt ttttattatt tagttttaag agttttttgt 720 gtattttgga tattagtttt ttattagata tgtattttgt aaagattttt ttttagtttg 780 tggtttgttt ttttattgtt ttaatattgt ttttgtagat tagaaggttt taattttaat 840 gaaggttaat ttggtaatta ttttttttat agataatgtt tttgttgttg tatttaaaaa 900 gttattggta gatttttttt tatgttattt tttaagtatt ttataggttt gtgttttata 960 tttaggttta tgatttgttt tgagttaatt gttgtgtaag atgttaaagt ttgtgtttag 1020 atttattttt tgtatgtggc ggtttaggtt tagttgtttt aggattattt gttgaggaga 1080 ttattttgtt tttattgatt tgttttagtt attttggatt agttatttgt gtgggtttag 1140 gttattgttt gggtttcgat gtttgtgttt tttagatttt atgttgaaat ttgattttta 1200 atgttgaagg tggaatttaa tgggaggtat ttggtttacg ggtgtggatt ttttatgaaa 1260 tgtttttttt gggggtaggt gggacgggga gatgaatttt tattttatta gatgatttcg 1320 gagttggtta tttaaaggaa tcgggttttt tttttttttt ttttttgttt atatttttgt 1380 tatgtgattt ttgtatatac gtatattttt ttttattttt tgttatgagt ggaagtagtt 1440 tgaggttttt tttatatgta gatgtttaat tttgaatttt ttagttatta gaattgtgag 1500 ttaaataaat tatttttttt ttataaatta tttagattcg agtattttat tatagtaata 1560 taaaataaat taagtttatt tttgagtttt atattttgtt tatttttata tatatttttt 1620 atttttatta tgaagttcgt atgtatttag taggtagtaa aatttttatt tcgaaaatga 1680 ggaaattgag gtatagagtg agtagggttt ttttttttag gttagtagtt ggttagaatt 1740 gaaatttata tttgtttggt tttgattttg tgtatttttt ttgtttttaa ggtgtttaat 1800 ggtgttagaa agagatttag tatgttaatt ttaattttag atgttgtttt ttagggttta 1860 aattgtagta tttttttttt ttaatggttg ttggaatttt gggtagttgt tttttgattg 1920 taattaaggt tgtttgttat ttacggtttt tttgaatttg taatgtgagt tttgatttgt 1980 ttaaaaattg gttttgttta aaatatgtag ttttttttat tagtattttt taatgttttg 2040 ttgagatttt gtgcgtaatt attttttttt tggtttatat tgaatttttt ttgttgagaa 2100 gttatttgtt tatggggttt gttttatcgt ttttttgaag ataggatttt gttgagtggg 2160 attgttaaac ggagtatagt gttaaaaatt ttttgggtta aatgttatta tatttttatt 2220 agggtttgga gtatttgttt ttagaattta taaatattaa tttatgttgg cgttttgtgt 2280 tgtttaagga gagtattttt ataatttatg aaattttatt ttattgttag aagttagtaa 2340 agagaaaaag aaagaaagag aggtagaaag agaaaatttt atagttatat tttaaatatt 2400 aagggataga tttttttttt aagaatataa gatttataag ttttaaatag gagtgaaata 2460 gtttgtagaa gtttttatag taaatgaatt ggtagagttt agatttaaat tttgatttgg 2520 tgttaagggt aaagtaggtg gtttttaatt ttattaggtt tttttttgtg agaaggggat 2580 atgtttattg tggttttagt agatagagta ggttgcgtgg gatttgggag attttttgtg 2640 aatggaaggt attattttat tattgtgtaa ttgaattaag atatattgtt ttatttattt 2700 tttattgatt tttattatta tttttttgag acggagtttc gttttgttat taggttgggg 2760 cgtagtggtg cgattttggt ttattgtaat cgtcgttttt tgggtttaag cgattttttt 2820 gttttagttt ttcgagtagt tgggattata ggcgtgcgtt attacgttta gattattttt 2880 gtatttttag tagagacggg gttttattat gttggttagg atggtgttaa tttgttgatt 2940 ttatgatttg tttgttttgt ttttttaaag tgttggatta taggcgtgag ttatcgtgat 3000 aggttagatt tgttgtttta aaataaagta tatatggtgg tttattatga tgttaagtat 3060 tgtttaaagt atattataaa gttgggtagg atggtgttcg tttatatttt tagttattgg 3120 ggaagttaaa gtgaggcgat cgtttgagtt taggagttta aggttgtagt gagttatgat 3180 gttgttattg tattttaatt tggtgataga gtgagattta ttttttaaaa taaagataaa 3240 aatatatttt ataattgtta agttatttgt atgtgtttat taaaattttt tttggggatt 3300 ttttttggtt tatttttgta gtttcgatgt taggggaggt tgaggtaaaa tgatcgttag 3360 atagttggta tttgaggtta gtttatgtaa tatattaaaa attcgtgttt atatgtagaa 3420 aaaatattaa ttaggcgtga tgatataagt ttgtagtttt atttgtttgg gaggttgagg 3480 taggaggatg gtttgagttt gggaatttga agttttagtg agttatgatt gtatcgttgt 3540 attttagttt gggtgataga gtgagatttt tgtttttaaa aaataaataa atgataatag 3600 taataataat agaatatttt ttttgaagtt agtattatgt agttatgtat tttataaatt 3660 gttagtttaa ttttaaggga atagtttagt agttgatatt tgagaaggat ttgtagaaag 3720 gatttaaaga ttacggatat cgtttattgt ttttttgttt ttttataaga tagaagaagg 3780 atggtattat taatttatgt tttgtttatt tattttaagt tttagattat tggattttta 3840 aagattatga ttttcgtttg gtttttggta taaaaggaga taaggaggga gtttaaaagg 3900 tgagtacggt gtgatttagg attgaagttt ttgttatttt ttggggggta attgtaaaag 3960 tgagtcgttt tgattagtcg tttgtgtatt tgttattgtt aagggggtat aggtagattt 4020 aagttttggg gtttttttga taattggtaa ggataaggta ttagtaaggg taaaggaata 4080 gtaataaaat aatttaataa taaagatatg aagatttata ataattttta ggtcggtgta 4140 gtgttttagg attgtaattt tagggcgttt tgggaggttt aggcgggagg atcgtttgag 4200 gttaggattt cgaggttaag gtgaattgcg ttttagtttg ggtaatagag taatattttg 4260 tttttaaaat gaaaagaaaa tagtttaaat tttttaagtg tatattaaat tttttatttt 4320 ggagaaggaa aattggtttc gagtttcgtg tgagtttttt ggggttcgtc gggagggggt 4380 tggtacggtc ggatttgtag tattagtttt ggttagggcg ttgtgggatt tgtaggggat 4440 tataggatgt tgtggcgcgg tgcgtttaga ttggcggaga aacggttata cgtttacgga 4500 gttattgaga aggcgagcgg aggcgtagtt cgttcgttcg tcgcgggaat tttaggttgg 4560 ggcgttgggc gcgcgaagat ttagtcgttt cgtttattaa gggcgcgtcg gttttcggtc 4620 gtagtttttg ggttggtagt cgtcgtcgcg tcgcgttttt attggtgttc ggcggtgacg 4680 cggtcgagcg ggtcggggtt gtttggttcg ggggcgggcg tggggcgcgg ggcgcggagc 4740 gcgaggggcg ggggtcgggc gtattgttga tgaaatttgg cgtcggaatt cgttagtttt 4800 cggcgtttat ttagttcgcg taggtaggtg tgagtagcgg gttaattatt tggtaggcgc 4860 gtacgcggtc gcgggttttc gttaatcgta gtttttattt tttttttcgc gcgtcgcgtt 4920 ttcgtttcgt ttcgtttcgt tcggtttcgt cggtcgagcg ttcgttggtt tttgagcgcg 4980 ttcgatagtt tgtttgttcg cgattttgtc ggagtttttt cgtcgtcggt ttggtgagtg 5040 ttcggtttcg ttaacgtagg gggtagtttt ttgggttcgg gttattacgg agggggtttt 5100 ggcgtcgcgt ggggtcgcgg tagggcggcg cgggagtggc gagggttttc gcgtcgggaa 5160 cgttgttatt ttttgggaag ggttaggatt agggtcgggc gggtttcgga gtgggcgagc 5220 ggggttggtg tttatgcgat tgtcgttttt acggagttta ttttggtttt ttgaaatcgc 5280 ggcgtggtgt atgatgtaat atcgagtgag taagcgtggg cgatttggcg atgttcgttt 5340 cgcgcgtttg ttcggggatt cgcgcgtcgt tacgtacggg gtggtcgggg tgcgtaggcg 5400 ggcggcgggt acgggggtta gattgggagg tatacggagt tcgtcggcgg cgaggagatt 5460 tttttttata tggcgcggtg tagagtattt cgtttcgtta cgaggttcgg ggatgtgtta 5520 ttagtcgtgg gtggggattt tgttcggtcg ttcggagggt ggtttcgcgg taggtggtcg 5580 gtttagggat tttgttgtta ttttcgttcg gtggtcgttt tgatttaggg cgtttggttt 5640 ttcgtttgtt tttagaattc gggacgcgtc gtttgtattt ttcgtttggg tttttaagat 5700 tgttttgagg aagttttttt taggtgggtt tttttgtgat ttagtgtggt ttggaaaggt 5760 cgggtttttt aagtttttta tatggtttgg aatgagagga agttttttcg tttttagtaa 5820 gatatcgtat ttttagggtg tttttttttg cgtagtagaa aattttttag gtatgggtag 5880 gttagagtta ttttaaaatt tgcgcgtata tagagcggta gttgtattgt agtattataa 5940 tagtttgttg gtttagtttt tgattttttt taggggatgg gggaattaga tagtagttgt 6000 gtttgatttg tgtgattagg atagttagat atg 6033 32 6033 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 32 tatgtttgat tattttagtt atataagtta aatataattg ttgtttggtt tttttatttt 60 ttggaaaggg ttaggagttg aattagtagg ttgttgtagt attatagtgt agttgtcgtt 120 ttgtgtacgc gtaggtttta gaatgatttt gatttgttta tgtttgggaa gttttttatt 180 acgtagaaag gaatattttg agaatacggt gttttgttaa aggcggaaga attttttttt 240 attttaaatt atgtggaggg tttgaggaat tcggtttttt taggttatat tgggttataa 300 ggaagtttat ttaggggaga tttttttaaa gtaattttgg ggatttagac gagaggtgta 360 ggcggcgcgt ttcgggtttt agggataagc ggagagttag gcgttttagg ttagggcggt 420 tatcgggcgg ggatggtagt agagtttttg ggtcggttat ttgtcgcggg attatttttc 480 gggcggtcgg gtagagtttt tatttacggt tgatgatata ttttcggatt tcgtggcggg 540 gcggggtgtt ttgtatcgcg ttatgtaagg gaaggttttt tcgtcgtcgg cgggtttcgt 600 gtgtttttta gtttggtttt cgtgttcgtc gttcgtttac gtatttcgat tatttcgtgc 660 gtagcggcgc gcgggttttc ggataggcgc gcggagcggg tatcgttaga tcgtttacgt 720 ttatttattc ggtgttgtat tatgtattac gtcgcggttt tagggagtta aaatggattt 780 cgtggaggcg atagtcgtat gggtattagt ttcgttcgtt tatttcgggg ttcgttcggt 840 tttggttttg gtttttttta gaggatggta gcgttttcgg cgcgggggtt ttcgttattt 900 tcgcgtcgtt ttgtcgcggt tttacgcggc gttagggttt ttttcgtgat gattcgggtt 960 taaggagttg ttttttgcgt tggcggggtc gggtatttat taagtcggcg gcgggggggt 1020 ttcggtagga tcgcgaatag atagattgtc ggacgcgttt aaggattaac ggacgttcgg 1080 tcggcgagat cgggcggggc ggggcggggc gggggcgcgg cgcgcgggga gaggagtgga 1140 ggttgcggtt agcgggagtt cgcggtcgcg tgcgcgtttg ttaggtagtt gattcgttgt 1200 ttatatttgt ttgcgcggat tgaatgggcg tcgagggttg gcgggtttcg gcgttaggtt 1260 ttattagtag tgcgttcggt tttcgttttt cgcgtttcgc gtttcgcgtt ttacgttcgt 1320 tttcggatta ggtagtttcg gttcgttcgg tcgcgttatc gtcgggtatt aatgggagcg 1380 cggcgcggcg gcggttgtta gtttagaggt tgcggtcggg gatcgacgcg tttttggtgg 1440 gcggggcggt tgagttttcg cgcgtttagc gttttaattt ggggttttcg cggcgggcgg 1500 gcgggttgcg ttttcgttcg tttttttagt agtttcgtag gcgtgtggtc gttttttcgt 1560 taatttgagc gtatcgcgtt atagtatttt gtggtttttt gtagatttta tagcgttttg 1620 gttagaatta gtgttgtagg ttcggtcgtg ttaatttttt ttcggcgggt tttagggagt 1680 ttatacggaa ttcgagatta gttttttttt tttaaaataa aagatttggt atgtatttaa 1740 aaggtttaaa ttgttttttt tttattttag agatagggtg ttattttatt gtttaggttg 1800 gagcgtagtt tattttaatt tcgaaatttt ggttttaagc gattttttcg tttgggtttt 1860 ttaaagcgtt ttaggattat agttttgaaa tattgtatcg gtttaaaaat tattataaat 1920 ttttatgttt ttgttattgg attattttat tattattttt ttgtttttgt taatatttta 1980 tttttgttag ttgttagaag agttttaaag tttgaattta tttgtgtttt tttggtagtg 2040 gtaaatgtat aaacggttag ttagaacggt ttatttttgt agttattttt taggaagtgg 2100 tagaagtttt agttttgaat tatatcgtgt ttatttttta agtttttttt ttgttttttt 2160 ttgtattaaa agttaagcga gaattataat ttttaaagat ttagtgattt gggatttggg 2220 ataggtaaat agggtataaa ttaataatgt tatttttttt ttattttata ggaaaataga 2280 aaaatagtgg acggtgttcg tggtttttga atttttttta taggtttttt ttaaatatta 2340 gttgttgaat tatttttttg gaattagatt agtaatttat aaagtatata attgtatggt 2400 gttagtttta gaaaaagtgt tttgttgttg ttgttgttgt tatttgtttg ttttttagag 2460 ataggggttt tattttgtta tttaggttgg aatgtagcgg tataattata gtttattgga 2520 attttaaatt tttaggttta agttattttt ttgttttagt tttttaagta gatggaatta 2580 taggtttgtg ttattacgtt tagttaatat tttttttata tatagatacg ggtttttgat 2640 atgttgtata ggttggtttt aaatattagt tgtttagcga ttattttgtt ttaatttttt 2700 ttagtatcgg gattataggg atgagttaga aaaagttttt agaaaaagtt ttaatgaata 2760 tatgtagatg gtttagtagt tgtaaaatgt gtttttgttt ttgttttaga gagtgggttt 2820 tattttgtta ttaagttgga gtgtagtggt aatattatag tttattgtag ttttgaattt 2880 ttaggtttaa gcgatcgttt tattttagtt tttttagtag ttggaaatat aggcgagtat 2940 tattttgttt agttttgtaa tgtgttttga atagtgtttg atattatagt aagttattat 3000 atatgttttg ttttaaagta ataaatttgg tttgttacgg tggtttacgt ttgtaattta 3060 gtattttggg agggtaaggt aggtagatta tgaggttagt agattgatat tattttggtt 3120 aatatggtga aatttcgttt ttattgaaaa tataaaaatg atttgggcgt ggtagcgtac 3180 gtttgtagtt ttaattattc gggaggttga ggtaggagaa tcgtttgaat ttaggaggcg 3240 gcggttgtag tgagttaaga tcgtattatt gcgttttagt ttggtgatag agcgagattt 3300 cgttttaaaa aaataataat aaaaattaat aaaaaataaa taaaataatg tattttagtt 3360 taattgtata gtggtgaaat gatgtttttt atttatagaa gattttttag attttacgta 3420 gtttgttttg tttgttgagg ttatagtaag tatgtttttt ttttatagag agaagtttgg 3480 taggattaaa gattatttgt tttgtttttg gtattagatt aggatttgaa tttgaatttt 3540 attagtttat ttgttgtgag agtttttgta aattatttta tttttgtttg gagtttgtaa 3600 attttatatt tttaagaaaa aaatttattt tttggtgttt gaaatatgat tgtggaattt 3660 tttttttttg tttttttttt tttttttttt tttttgttga tttttggtag taaaatagaa 3720 ttttataaat tgtagagatg ttttttttgg gtaatataga gcgttaatat gagttaatgt 3780 ttgtaaattt tgagagtaag tgttttaggt tttgatggga gtatggtgat atttaattta 3840 ggagattttt agtattgtgt ttcgtttagt aattttattt agtaaggttt tgtttttaaa 3900 aagacgataa gataagtttt atgagtaagt gattttttag taaaaaggat ttagtatgaa 3960 ttagggaaaa aatagttacg tataagattt tagtaaaata ttagaggatg ttgataaaga 4020 gggttatatg ttttaagtaa agttagtttt taggtaggtt aagatttata ttataggttt 4080 agagaaatcg tgagtgatag gtagttttga ttataattaa agagtagttg tttaagattt 4140 tagtaattat taagaaaggg agatgttata atttaggttt tagagagtaa tatttaaggt 4200 taaggttgat atattaagtt tttttttagt attattaggt attttggggg taaggaaagt 4260 gtatagaatt aaagttaggt agatgtgggt tttaatttta attagttgtt ggtttgggga 4320 gaggggtttt gtttattttg tgttttagtt tttttatttt cgaaataaga attttattat 4380 ttgttggata tatacgaatt ttatggtaag gatgaaaaat gtgtataaag atgaatagaa 4440 tatagagttt agaaatagat ttagtttgtt ttgtattgtt ataatggaat attcgagttt 4500 gggtaattta taaagaaaaa atggtttatt tggtttataa ttttaatggt tggaaagttt 4560 aagattggat atttgtatgt ggagagggtt ttaggttgtt tttatttatg gtaaaagatg 4620 aaagggagtg tgcgtgtgtg tagagattat atgataagag tataagtaag agggagagga 4680 gagaagggtt cggttttttt aaataattag tttcggagtt atttaataga gtgaaaattt 4740 attttttcgt tttatttatt tttaggaagg atattttatg aaggatttat attcgtgaat 4800 taaatatttt ttattaggtt ttatttttaa tattggggat taaattttaa tatgaggttt 4860 ggagggtata aatatcgaaa tttaaatagt agtttagatt tatataaata gttgatttag 4920 agtggttaag ataagttaat ggagataaga tagttttttt aataaatggt tttggaataa 4980 ttggatttgg atcgttatat gtaaaaaata aatttagata tagattttaa tattttatat 5040 agtaattaat ttaaaataga ttataggttt aaatgtaaaa tataaattta taaaatgttt 5100 agaagataat ataggaggaa atttattaat ggttttttag atataatagt aaaagtatta 5160 tttatgaaag aaatgattgt taagttggtt tttattaaag ttaaaatttt ttggtttgta 5220 aagataatgt taaggtaatg aaaagataag ttataggttg ggagaaaatt tttgtaaaat 5280 atatatttga taaaggattg gtatttaaaa tatataaagg atttttaaaa ttgagtaata 5340 agaaaatatt ttattttaaa aatatagtag ggcgcggtgg tttacgtttg gaattttagt 5400 attttgggag atcgatatag gtggattatt tgaggttagg agtttgagat tagtttggtt 5460 aatatggtga aattttgttt ttaataaaaa tataaaaaat tagttatgta tgatgatagg 5520 tatttgtaat tttagttatt tgggaggttg atataggaga attattggaa tttgggaggt 5580 ggaggttgta gtgagttaag agtacgttat tgtattgtag tttgggcgat aagagtgaaa 5640 tgttgtttta aaaataaata aataaataaa taaataaata aataaaaata gataaaagat 5700 ttgaatagat tttttattaa agataatata tatataataa ataagtatat ggaaaaatat 5760 ttaatattat atattatcgg agaaattgta gattaaagta aagagatatt attatataat 5820 tattgaataa ttaaaattta aaatattggt agtattaaat gcgggcgagg atatggcgta 5880 ataaattttt atttattgtt agtgaggatg cgaaatagta tagttatttt ggaagataat 5940 gtgatagttt tttataaaat taaatatagt tttattatat tatttagtag ttaggttttt 6000 tggtatttat ttaaatgtat tgaaaatgta tgt 6033 33 5574 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 33 tttaaattta gggttgtatt agatttgagt agggattgag ggtaggttag ggcgtaggtt 60 aggggagagg ggagaaagag taggggaaag agggaatttg ttaaattagg gttatgattt 120 aaatttgttt agaatcgttt atttatttta ttttattttg ttttagggag gagagtagaa 180 gttgagttat tgggtgggtg ggatagaagt gaattagtcg tgaaaatatg gggggtagcg 240 gggagatggg gagggtagga aatgtaaatt gcgtatttta gaggttttgg gtttttttta 300 cgggagggga tggagaattt atttggagtt ttttttagtt ttaaatgttc gagtgtaggt 360 ttttgggcgt ttttttaaaa ggtggtttgg gtggatgaga ggaggtagtt tggaattaaa 420 tggttgggtg ttaaatgtag ggaatgaagg agaaggtttg gggaggggtg ggtattttga 480 ggaagaagga ttagatttag gattgtaggg gaaatgtttt ttgggttgtg agtggtagtt 540 agttgggagt ttgtttttag gtatagagga agaggatttt tttaggggtt ttgatatttg 600 attagatgtt aggtaaattt taagtagtta gtatatgttt ttttttttgt ttttttttgt 660 ttttgattta tttttttatt tttttttagt tttgagtttt tttcggattt ttcggaaatt 720 ttttttagag ttaggagtaa tttgtaggtt ggaagttttt tattttttgt atttttttaa 780 tttgttttta gtttattttg gttaagggtt gaatttatgt gtttttggga ttattggggt 840 tgagttggtt tgggttatag ggtattagaa gggagaggtt tttattgtag tgttttagaa 900 gtaattatat tttaggtttg ggaggggtgg gttgagttat agtaaggtta tagtagggat 960 atatattttt tttgggtttt tgttggtttt ttttttatat tcgttgtttt tttgttttag 1020 tttttcggtt tcgtgcgttt ttttttggtt tttggtggaa tagttaggtt tttttattta 1080 aagtttaaag ttttaaatag ttttttgaat ttgtttttta tttttttatt tattttatta 1140 tttattgtaa ttaattgatt gatttttaaa ttagttaatt ttttaaaatt aagtaattag 1200 ttaatttttt aaaattaagt aattaattaa ttttttaaaa ttaagtagtt aatttttttt 1260 aattaagtaa ttaattaatt ttaaaaagta tttatttatt ttgagataaa gttttatttt 1320 gttgtttagg ttggagtata gtggtttagc gttttattgt aattttcgtt ttttcgagtt 1380 taagcgattt ttttgtttta gttttcggag tagttgggat tataggagtt tgatattatg 1440 ttaggttaat ttttgtattt ttagtggaga cggggtttta ttatgttggt taggttggtt 1500 tcgaacgttt gattttaagt gatttgttta ttttggtttt ttaaagtgtt gggatgatag 1560 gtatgagtta ttgcgtttag ttaataattt atttattttt gagatagggt tttattcggt 1620 tgtttaggtt gaagtgtagt agtataatta tggtttattg tagttttgat ttttggggtt 1680 taagtagttt ttttgtttta gttttttaag tagttgggat tgtaggtgta cgttattata 1740 tttcggtaat tttataaatt atttgtagag atgaggtttt tattatgttg tttaggttgg 1800 ttttaaattt ttgggttcga gtaatttttt tatttttgtt ttttaaagtt ttgggattat 1860 aggcgtgagt tattgtattt atttttattt tttatttttg ttttttaaaa tttatttttt 1920 ttataagttt taaaaattag tatgggaaat attggggaat attgttagga aaagtaatat 1980 aattatttgt tagagaaaga aattagggtt agtattatgt aatagcgggg tataaggttt 2040 tttttttttt attttagtag gtgatgtggg taaggttttt ttttatatgg ttttgtttga 2100 tttttgattt tttttttttt tatttttttt ttagttgtag aggagaattt taaggagagt 2160 aaattttaag taggtattgt tcgtttatag gatgtgaatc gtagagatta atagaggaat 2220 ttaggtattt ttattacgtt tttttagttt aattttgcgg gtgtttaaga tattgagatg 2280 gtgcgtttgg agttggtagg gagtaggagg ggtgggaagt tttggagatt tttatttgag 2340 attgtttttt tgggtttgga gacgttttta ttgtttgttt tgggtgtttg tttggtgggt 2400 tagaaggttg gaatggggag ttgggttgga gcggttttaa gttgtttatt tttttttttt 2460 tagggtttat gtcgtagata tttggattta gtgttgtagt aattttagat tgaggtttat 2520 cgaggggttt aaatatttta cgtgtttaat tgtgattatc gaggttttta tcggaagcgg 2580 taggtgagat tatttttttt ttttttttgt tttagtagaa ggtttttgtt agggagtggg 2640 ggcggtgttg tttataaagt tgtataaata agatattgtt ttatttttaa ggatttttta 2700 attttaggag aatatagaga atataattta ttaaataaat ttagagaata attaattata 2760 tattgtgaga gaaaatttat ttaaggaatg ttttaattta gtggtttttg aatttgaggt 2820 attagaattt ttcggagggt ttatgttata tagatagttg agttttatcg gtagtttttt 2880 tgatttagga ggtgtggggt ggggtttgat aatatgtatt tttaatatgt tttttcgtga 2940 ttcggatttg ggaacgttat tttgaaaatt attgttttag gttagtagaa tgtatataat 3000 ttattggttg aagaggggga attaaagaga gggaatattg ggtcgggtgc ggtgttttat 3060 gtttgtaatt ttagtatttt gggaggttaa ggttggtgga ttacgaggtt aggagtttaa 3120 gattagtttg aataatttgg tgaaatttta tttgttttaa aaattataaa aattagttag 3180 atgtggtggt atgtatttgt aattttagtt atttaggagg ttgaggtaag agaattgttt 3240 gaatttggga ggtggaggtt gtagtgagta gagattatgt taatgtattt tagttagggc 3300 gatagagcga gattttattt taaaaaaaaa aaaaaaaaaa aaaaaaagag agggaatttt 3360 cgaggagacg tttaggtgtt tttatatttt tagatttaga tgtttttttt tatttttttg 3420 ttggaagttt ttggttttat ttttgatttg tgtgtttttt tttttagtgt cgtttttttt 3480 aggggtagcg tcgaggtttt tgttggtgtg tggatcggat gggtaagttt ttgttagggt 3540 ttttagatgg taatggaagt tttttttgtt ttattgggag tagcggttaa agttggggga 3600 tagaggggtt gtagggttat tggaaggaat atggagttgt tattatttaa taaaaaatcg 3660 aggtttttaa tttattttta ggtttcgttt tatgggtttt ttatcgttgg ttggaaagag 3720 tgttggtgtt ggttggggtg ttaataaagt tgtgtttggg gtcgttggtt tgtgtttttg 3780 tgtttgtttt ttataatttt ggaatttttg gttttttttt tattttatta tagtttattt 3840 atagtatttt tttttttttg tggatatttt tagttttttt tgtgatagtt aggtagaagt 3900 tttaagttat taagttttat agagttgttt attaggagtt gggagtggga aggggagata 3960 ttgagattat ggttttaatt tgaagttgtg attttgtttt taatattgat ttttggatat 4020 aaagggaggg gaaggattaa tagttaattt tagtaggaat ttagtaaaga ggaattttta 4080 aagtatatat ttttttgtta ttttttatta aaaaaagaag gaaattatta ttaatatatg 4140 agtttatttt atggttttga attatgtgat tttatttgga taattttatt ttgagtttac 4200 gataattttg tgatataggg atttttattt ttatttttta gaggaggaaa ttggtttaaa 4260 atttggggtt atttgtttga aattatatag ttggtaaatg atagagggag gtttgtattc 4320 ggttttttta tatgtgataa tatttggtat tttttaggtg ttgaatacgt gtttgtttag 4380 tttttttttt gtttatatgt ttatttaagt aggtgttagg aagcggtttt gttagtttag 4440 gggttttgat atttagtttt ttttggaggg gttttagttt cgtgagtagt atagtgttaa 4500 ttttattaga atattattat atgtgttaat tatatatttt gtggtgaaag cgagttgaac 4560 gtattgatat atgaagatat ttttgatttt tttttgattt ttagtttgtt gggagagaga 4620 ttggaaggtt agttatgtta ggtgataagt ttttgagagg taaagttttt ttttttaaga 4680 tgtatttagt tattattttt gtgtgtgtgt ggcggggtgg atagtatttt tggagttggg 4740 tatttggatg gtggttgggg tgttaggggg atgtggcgat ttttgcgata gatagtagag 4800 tgaggtttga atttgagaag ttttgttttt agattagata atttatcgta tttttagagg 4860 tttttttttt ttgaaaggat tttagttttt ggagttgtta tttgagttga gtgggataag 4920 agttttatag ggtaggttat attgcgaagg aaggaggtaa tacgggtaag ggttgtttgt 4980 tgttcgttgg agatcgtatt atggagttag gcggggttcg tttgcgtttg tagaggatag 5040 aagggttggg aggggagcgg gagcgttaat tttgtggaga tggtgagtcg ttttcggggg 5100 tgtagaaggt ataggtaagt gggggggagg cggggagaga tgcgttatgg agagaaggtt 5160 ttaattgttt gatgttaatt ttttttgttg tttagagagg ttaaggaagg tagattttgg 5220 ttttagttta gagttattta gttggaagat ggaatagaaa agagttatgt tagagttgtg 5280 gtttggtttt atttttttga ttgtttagtt ttagatagtg aatggagtag ttttttattt 5340 tttgagtgtt ttgtttttag taatgttatt aggttttttg tttgtttatg gtttttttat 5400 tattggtaat agtaattttt ttttttagta gttttaatta tgatattaga tattggttgg 5460 ttggggtgag ggtagttgtt gagtatataa agtatttttt gattatagga tgtttttggg 5520 tttgtagaat tttaattttt tttgttgatt gtgtttttga ttttttttta tagg 5574 34 5574 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 34 tttgtgagga gggattaaag gtatagttaa taggaggaat tggggttttg tagatttaga 60 ggtattttgt ggttaggaaa tgttttgtgt gtttagtagt tgtttttatt ttaattagtt 120 aatatttagt attatggttg gggttattag aaggggaagt tgttgttgtt agtggtgagg 180 aggttatagg taagtagggg gtttggtgat attattggga atagggtatt tagggaatgg 240 gaagttattt tatttattat ttggggttaa atagttagaa ggataaggtt aggttatagt 300 tttgatatag tttttttttg ttttattttt tagttgggtg gttttgggtt gaggttaggg 360 tttatttttt ttggtttttt tggatagtag gaaggattgg tattaggtag ttggagtttt 420 ttttttatag cgtatttttt ttcgtttttt ttttatttgt ttgtgttttt tgtattttcg 480 agggcggttt attattttta tagggttggc gttttcgttt tttttttagt ttttttgttt 540 tttgtagacg tagacgggtt tcgtttggtt ttatggtgcg gtttttagcg ggtagtaggt 600 agtttttgtt cgtgttgttt ttttttttcg tagtgtggtt tgttttgtag agtttttgtt 660 ttatttagtt taggtgatag ttttaaagat taaagttttt ttaggaggag ggggtttttg 720 ggagtgcgat aggttatttg atttggaggt agagtttttt agatttagat tttattttgt 780 tgtttgtcgt agggatcgtt atattttttt aatattttaa ttattattta gatgtttagt 840 tttaagggtg ttatttattt cgttatatat atataggaat agtggttggg tatattttgg 900 ggaggggaat tttgtttttt agaagtttgt tatttagtat ggttggtttt ttagtttttt 960 ttttagtagg ttgaaggtta gggaggagtt agaaatgttt ttatgtatta gtgcgtttag 1020 ttcgttttta ttataaggtg tgtgattgat atatgtggta atattttgat ggggttggta 1080 ttgtgttatt tacggaattg gggttttttt aggaaaggtt gagtgttagg gtttttgaat 1140 tgatagggtc gttttttgat atttgtttgg gtgagtatgt aggtagaaag gagattaaat 1200 aaatacgtat ttagtattta gggaatatta ggtattgtta tatatggaag aatcggatgt 1260 aaattttttt ttgttattta ttagttatat aattttaggt aagtgatttt aaattttaag 1320 ttagtttttt tttttgaaaa ataggggtaa aaatttttat attataaggt tatcgtaagt 1380 ttaaaatgag gttgtttagg taaaattata tggtttaggg ttatgggatg agtttatata 1440 ttagtaataa tttttttttt tttttagtag gaagtaatag aagggtatgt gttttgagag 1500 tttttttttg ttgggttttt gttgggatta attattaatt tttttttttt ttttgtgttt 1560 aaagattagt gttagaaata aggttataat tttagattaa ggttatgatt ttagtgtttt 1620 ttttttttat ttttaatttt tggtgggtag ttttgtgagg tttgatggtt tgaagttttt 1680 gtttggttgt tataggaagg attaaaggta tttataggaa aggagaaatg ttgtgagtga 1740 gttgtagtgg ggtaaagaga gggttaggga ttttagaatt gtgagaggta gatatagaga 1800 tataagttag cgattttaag tatagtttta ttgatatttt agttaatatt aatatttttt 1860 ttaattagcg gtgaggggtt tatggggcgg ggtttgaagg tggattgagg gtttcggttt 1920 tttgttgagt gatgatagtt ttatgttttt tttagtggtt ttgtagtttt tttatttttt 1980 agttttagtc gttattttta gtggggtagg aggagttttt attgttattt ggagattttg 2040 gtagggattt gtttattcga tttatatatt agtagggatt tcggcgttgt ttttgggagg 2100 agcggtattg gagagagagg tatataggtt aggagtgagg ttagaggttt ttagtaggag 2160 aatgagaggg gatatttgag tttgaggatg taaaaatatt tgagcgtttt ttcgggggtt 2220 tttttttttt tttttttttt tttttttttt tttgagatgg agtttcgttt tgtcgttttg 2280 gttggaatgt attggtatga tttttgttta ttgtaatttt tattttttag gtttaagtaa 2340 tttttttgtt ttagtttttt gagtagttgg gattataggt gtatgttatt atatttggtt 2400 aatttttgta atttttaaaa tagatggggt tttattaggt tgtttaggtt gattttgaat 2460 ttttgatttc gtgatttatt agttttggtt ttttaaagtg ttgggattat aggtatgaga 2520 tatcgtattc ggtttagtgt tttttttttt tagttttttt tttttaatta ataaattgtg 2580 tgtattttgt tagtttggaa tagtagtttt taaagtgacg tttttaaatt cggattacga 2640 gggaatatgt tagaaatgta tattgttagg ttttatttta tattttttga attaggaagg 2700 ttgtcggtgg ggtttagtta tttgtgtggt ataagttttt cggaggattt tgatgtttta 2760 agtttaagag ttattgagtt agggtatttt ttaagtgggt ttttttttat agtgtgtggt 2820 tgattatttt ttaagtttgt ttaataaatt atatttttta tgttttttta aagttggaag 2880 atttttaaag atggggtagt gttttattta tgtagttttg taagtagtat cgtttttatt 2940 ttttggtagg agttttttgt tggagtagga ggagaagaaa aatagtttta tttgtcgttt 3000 tcggtagaag tttcgatggt tataattggg tacgtagagt gtttgagttt ttcggtagat 3060 tttagtttgg agttgttgta gtattgagtt tagatgttta cggtatgggt tttggggaag 3120 ggagagtagg tagtttagaa tcgttttagt ttagtttttt attttaattt tttggtttat 3180 taggtaagta tttaggatag ataatggaga cgtttttaag tttaagggag tagttttaga 3240 tggaagtttt tagggttttt tatttttttt gttttttatt agttttaaac gtattatttt 3300 agtgttttgg atattcgtag aattgggttg ggagggcgtg gtagaggtgt ttggattttt 3360 ttgttggttt ttgcggttta tattttgtgg gcgggtagtg tttgtttggg gtttattttt 3420 tttaggattt ttttttgtaa ttggaggagg aataggagaa ggagaggtta gaaattaggt 3480 agagttatgt ggagaagggt tttgtttata ttatttgttg aagtaaggaa gggagggttt 3540 tatgtttcgt tgttgtatga tgttggtttt agtttttttt tttgataaat agttatatta 3600 ttttttttga taatattttt tagtattttt tatattgatt tttaaggttt ataaaggaga 3660 tgaattttgg aaagtaaaaa tggaaaatga ggatgggtgt aatggtttac gtttgtaatt 3720 ttagaatttt gagaagtaga ggtgggagga ttgttcgagt ttaggagttt gagattagtt 3780 tgggtaatat aatgagaatt ttatttttat aaataattta taaaattatc gaggtgtggt 3840 ggcgtgtatt tgtagtttta gttatttgag aggttgaggt aggaggattg tttgagtttt 3900 agaagttaag attgtagtga gttatgattg tgttattgta ttttagtttg gataatcgag 3960 tgagattttg ttttaaaaat aaataaatta ttggttgggc gtagtggttt atgtttgtta 4020 ttttagtatt ttgggaggtt aaggtgggta gattatttga ggttaggcgt tcgagattag 4080 tttggttaat atggtgaaat ttcgttttta ttaaaaatat aaaaattagt ttggtatggt 4140 attaggtttt tgtagtttta gttatttcgg aggttgagat aggagaatcg tttgaattcg 4200 ggggggcgga ggttgtagtg agacgttgga ttattgtatt ttagtttggg taatagagtg 4260 agattttgtt ttaaaataaa taaatatttt ttaaaattaa ttaattattt aattaaaaaa 4320 aattaattat ttaattttaa aaaattaatt aattatttaa ttttaaaaaa ttaattaatt 4380 atttaatttt aaaaaattaa ttaatttaaa aattaattaa ttaattataa taaataataa 4440 aataaatgaa aaaatggaga ataaatttaa aggattattt ggggttttgg gttttgggtg 4500 aaaagatttg gttgttttat tagaggttag aagggggcgt acgaagtcgg agagttgggg 4560 tagaagagta acggatgtag gaggggggtt aatagggatt taaaaggaat gtgtgttttt 4620 gttgtgattt tgttatgatt taatttattt tttttaggtt tgagatgtgg ttatttttgg 4680 ggtattgtag tgggaatttt ttttttttgg tattttgtga tttaggttag tttaatttta 4740 gtggttttag gagtatatgg atttaatttt taattaagat aggttgaggg tagattaaga 4800 aggtgtaagg aatgaggggt ttttaatttg taggttgttt ttggttttgg agaaagtttt 4860 cggagggttc ggggagagtt taggattggg aaggggtgag gaaataagtt agggatagga 4920 aaaggtagaa aggggagtat gtattgattg tttggaattt gtttaatatt taattagata 4980 ttagaatttt tgaagggatt tttttttttt gtgtttaaag ataagttttt agttaattat 5040 tatttataat ttaggagata ttttttttgt aattttgagt ttgatttttt ttttttagga 5100 tgtttatttt tttttagatt ttttttttta ttttttatat ttagtattta attatttagt 5160 tttaaattgt ttttttttat ttatttagat tattttttag gaggacgttt agaagtttgt 5220 attcgggtat ttggaattga aagaaatttt aagtgaattt tttatttttt ttcgtggaag 5280 gaatttagag tttttgggat gcgtagtttg tattttttgt tttttttatt ttttcgttgt 5340 tttttatgtt tttacggttg atttattttt gttttattta tttagtgatt tagtttttgt 5400 tttttttttt ggagtagggt ggggtaggat gggtgaacga ttttgagtag gtttaaatta 5460 taattttgat ttggtagatt tttttttttt tttatttttt tttttttttt ttttaattta 5520 cgttttagtt tgtttttagt ttttatttaa gtttaatata attttggatt tggg 5574 35 6207 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 35 ttagtgttat aaattttttt ttatatattg ttttaaatgt gttttagaga ttttggtatt 60 ttgtgttttt gtttttattg gttttaagga atatttttat ttttgttttt attttattat 120 ttatttagta gttatttagg aatagtatag tttttatgta gttttgtggt tttgagtgag 180 ttttttaatt ttgagtttta atttgattgc gttgtggttt tagaggtagt gtgttgtgat 240 ttttgttttt ttatatttgt tgagaagtgt tttattttta attatgtggt taattttgga 300 ataagtgtta tgtggtgttt agaagaatgt atattttgtt gatttggggt ggagagtttt 360 gtagatgttt attaggtttg tttggtgtag agttgagttt aagttttgga tatttttgtt 420 aatattttgt tttgttgatt tgtttaatat tgatagttgg atgttaaagt tttttattat 480 tatggtgtgg gagtttaagt ttttttgtaa gtttttaagg atttgtttta tgaatttggg 540 tgtttttgta ttgggtgtat aaatatttag gatagttagt tttttttttt gaattgattt 600 ttttattatt atgtaatggt tttttttgtt ttttgatttt tgttggttta aagtttgttt 660 tattagagat taggattgaa atttttgttt tttttttttt ttttttggtt ttttatttgt 720 ttgttagatt tttttttatt tttttatttt gagtcgatgt gagtttttgt aggtgagatg 780 ggttttttga atatagtata ttgatgggtt ttgaattttt atttaatttg ttagtttatg 840 ttttttaatt ggggtattta gttcgtttat atttaaggtt aatatagtag gttttagaag 900 gttggtaata atatattttt tttagttaaa gaaggatgtt tgaatttatt atgtattgtt 960 atgtgtgaat ttgattttgt tattttgatg ttagttggtt attttgttta ttatttaatg 1020 tatttttttt ttagtattga tggtttttaa aatttggtat gtttttgtag tggttggtat 1080 tggttgttgt tttttatgtt tagtgttttt tttaggagtt tttgtaaggg aggtttggtg 1140 gtgataaaat tttttagtat ttgtttgttt gtaaagtatt ttattttttt tttatttatg 1200 atgtttagtt tggttgaata tgaaattttg ggttgaaaat tttttttttg aagaatgttg 1260 aatattggtt tttatttttt tttggtttgt agagtttttg ttgagagatt tagtgttagt 1320 ttgaggggtt tttttttgtg ggtaattcga tttttttttt tggttgcgtt taatattttt 1380 ttttttattt taattttggt gaatttggta attgtgtgtt tcggggttgt tttttttgag 1440 gagtattttt gtggtgtttt ttgtattttt ttaatttgaa tgttggtttg ttttgttagg 1500 ttgtggaagt ttttttggat aatattttga agagtgtttt ttaatttgtt tttatttttt 1560 ttgttatttt taggtatatt aattaaatgt agatttggtt tttttatata gttttatatt 1620 tttcggaggt tttgtttatt tttttttatt tttttttttt taaatttttt tttttatttt 1680 attttattaa tttgattttt aattattgat attttttttt ttatttgaat gaattggttg 1740 ttgaagtttg tgtatgtatt atatagtttt tgtgttatgg tttttagttt tattaggtta 1800 tttaaggttt tttttatatt atttatttta gttagttatt cgtttaattt ttttttaagg 1860 tttttagttt ttttgcgatg ggtttgaata ttttttttta gttgggagaa gtatgttatt 1920 attaattttt tgaagtttat tttttttagt ttattaaagt tatttttcgt ttatttttgg 1980 ttcgttgttg atgaggagtt gtgatttttt ggaggagaag aggtattttg gattttagaa 2040 tttttcgttt ttttgttttg gttttttttt attttcgtgg ttttatttat ttttgatgtt 2100 ggtgatttat agatggggtt ttggtgtgga tgtttttttt gttgatgttg atgttatttt 2160 tatttgttag tttttttttt aagagttagg ttttttagtt gtagatttgt tggagtttgc 2220 gggaggttaa ttttaaattt tgtttatttg agtattatta gtggaggttg tagaatagta 2280 aatattgtag aagagtaaat gttgttgttt gatttttttt ttggaagttt cgttttatag 2340 gggtattcgt ttgtatgagg tgttagttgg tttttattgg gaagtgtttt ttagttaggt 2400 tatatggggg ttagggattt atttgaggag gtagtttgtt tatttttaga gtttaaatat 2460 tgtattggga gagttattgt tttttttaga gttgttagat agggacgttt aagtttgtag 2520 aagtttttgt tgttttttgt ttatttatgt tttgttttta gaggtgaggt ttatagaggt 2580 agtagatttt gtagagttgc ggtgggtttt gtttagttta attttttcgg ttgttttgtt 2640 tatttattta agttttagta atggcggacg tttttttttt gttaggttgt tgttttagat 2700 tgttgtgtta gtagtgagta aggttttgtg ggcgtgggat ttattgagtt aggtatagga 2760 tttaattttt tggtgtgtta tttgttaaga tcgttggaaa agtgtagtat ttgggtgaga 2820 gtgttttgat tttttaggta tagtttgtta tagttttttt tggttaggaa agggaaattt 2880 tttaatcgtt tgcgtttttc gggtgaggta atgttttttt ttgtttcggt ttatttttta 2940 tgggttgtag ttattgttta attagtttta atgagatgaa ttaggtattt tagttggaaa 3000 tgtagaaatt atcgtttttt gtatcgatta tattgggagt tgtagatcgg agttgttttt 3060 atttggttat tttggaacgg aatttggatg atttattttt ggttattaat ttggaagttt 3120 tatgttagta ggttatttta gattttttga attttttagg taattaagcg ggtaaggtgt 3180 ttaaattgaa agtttagttt tgtttataat aagttaaata tttaggttta attttagtta 3240 gaggaattag ggtttttagt aaggaataaa tatagtttat attggtatcg gttttttaag 3300 gcgtagtatt aattagattg ataaatttat ttatttgatt ttgtggtttt cgtttagaaa 3360 ttgatttagt ttaagaagat agtttagatt ttttatgatt ttatttttga tttaaataat 3420 tagtattttt gatttattgg ttttttttta tttattaaat tatttttaaa aattttgagt 3480 tttcgtatgt tcgaatgttt ggggagtcgg atttgagtaa taatgaaatt ttagtttttt 3540 gtatagttgg ttttgtatga attttttttt tattgtagtt tttttgtttt gataaattag 3600 ttttgtttag gtagtaggta aggtgaattt attgggcggt tatatattgg ggagggggga 3660 ttgtaaggga atgaaatttt gagtattatt tttaaaggag ggaggggttt tatagattta 3720 ggtttattta gaagcgtttt tttttttaga gagtaaaatt ttattgtttt ttagagggtt 3780 gagaggtttg aaggaagagt ttgggtagaa attttgtttt gaatagaagt agtagattta 3840 gttgagagaa agaggtttat aaattttatt ttatggtttt ttttttttta aagatagatt 3900 tttatttttg ttgtttaggt tggtgttgaa tggtatgatt ttagtttatt gtaattatgt 3960 tttttaggtt taagttattt ttttgttatt agtttttcga gtagttgaga ttaaggcgta 4020 tgttattatg ttcggttaat ttttgtattt ttagtagaga cggggttttt attatattgg 4080 ttaggttggt ttcgaatttt tgattttagg tgatttattt gtttcggttt tttaaagtgt 4140 tgggattata ggtaagagtt attgcgttcg gttttatgtt ttttttatat ttaagtatta 4200 ggtttatgta atgatgtacg aatttattta tttttattcg tgttaggttt ttttttgggg 4260 gttggagata aagggtcgac gtggacgttg cgttatggta gtatttgttt cgtaaagtgt 4320 atatcgtgtt ttatttatag ttttagtatt ttcgttgtta ggaatatgga tttttaggta 4380 gtattttaga tttagattta ttgtattaga atttttgtgt tggttttgag aatgtgtatt 4440 tttaatagcg ttttatattt tttattttaa tttttttgta gttaacgttt gagagcgttg 4500 gtttggtgtt tattgttttt gtaggcggtt tttaaggtag tcgtgtgtgt ttgtatgtga 4560 ggcggtaaaa atagcgcgtt gtagggtcgg cgcggtggtt tacgtttgta attttagtat 4620 tttgggaggc ggaggcgggt ggattacgag gttaggatat cgagattatt ttggttaata 4680 cggtgaaatt tcgtttttat taaataaaaa tacgtggtgg tgggcgtttg tagttttagt 4740 tattcgggag gttgaggtag gagaatggtt tgaattcggg aggtagagtt tgtagtgagt 4800 cgggatcgta ttattgtatt ttagtttcgg cgataaataa ataaataaat aaaaaaaata 4860 gcgcgttgta gatggagtta gtattcgggt ttttcgtttt tagttttttt tcgaagtttc 4920 gtttcgtttt cgggtttgga ggaggttggg aagtttcgtt tttttacgtt agcgtcgttt 4980 aggttggtat aaaggaggaa gtttagtttc gtttttgcgt gcggcgtttt ttttaggttt 5040 tattttttat ttagtgtttt ggattttcgg ttgggtagcg ttattagagc gattaaacgt 5100 ttcgcgtttt ttaggtcgta ttttagagtt aaaagagttt tatggcggcg gcggttaagt 5160 ttaataattt ttttttggtg gtgtacggat cgggggattt gcgtttggta agttgggaag 5220 gagggtggga agtatatcga ttttgtttta tttttttntg agtttagtta tagttttggt 5280 tttttatttt tagtttggcg tcggtttcgt attttaagcg ttttggttgt ttagatttta 5340 gttggttttt ttcggggtgt gggggtagta ggtagtggtt gttgcgaagg gtagggattt 5400 agtcgtgtgt ttttcggaat ttagtttcgt ggttggtacg tggtcggtgt ttaggacggt 5460 tgtaaattgt ttgaatgaag tttttttttt tttttgttag ttgtagattt atagtttagt 5520 tttttgttat tgattttttt aaaggaaatg ttaaggttgt ttgaattatc ggggtagatc 5580 gtgtagagta gagaaagggg ggttagagga tatttagaaa tagtagaatt tgtatttaat 5640 ttttttgttt gggattgata aatttttttt gtaggattat gatgattata agagtattta 5700 gtatttagta cgtgtttagg aagtgttagt tttttttttt ttttttttag tttaggtttt 5760 tatttttaga atttttgttg ttttttttgt ttgtgttaga tttgtggatt ttgatagttt 5820 ttttgtttgt aaggattttt ttttttttaa gattttgttt ggtttatttt ttagtagttt 5880 ttttttttaa tttcgtgttt ttgttttttt aggagtattt tgtatgtgtg ttttttgttt 5940 tagattttgt tttttgtttt ttggtttgtg gtattaaagt ttaggaagtg gttgagttag 6000 tagtttagtt atgttaagtt ttttttgata aagttttttt tagatgggtt tgggatggta 6060 gtgggtatgt gggatgagtg ttagttattt ttgttgtttt tttgtatttt ttttttttta 6120 aagtatatgc gttagtatgt aaattgtagt aatttagaag tttatttagg ttagtagttt 6180 ttgattattt aagaatttgt ggtgttt 6207 36 6207 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 36 ggatattata gatttttaaa tagttaagaa ttgttaattt ggataagttt ttgaattatt 60 gtagtttata tattgacgta tgtattttga gggaaaagag gtatagggga gtagtagaga 120 tggttggtat ttattttata tatttattgt tattttaggt ttatttgaga gggattttgt 180 taagggaggt ttggtatgat taggttgttg atttagttat tttttaaatt ttggtgttat 240 aagttaggga gtaaaaggta gggtttaagg tagaggatat atatatagaa tgtttttaaa 300 gggatagagg tacgggattg gaaagaaaaa ttgttggaaa gtgaattaga tagggtttta 360 gggagagaag gatttttata gataagggag ttattaagat ttataagttt ggtataggta 420 aggggaatag taggggtttt ggagatggag gtttagattg gaaggaaagg agaaggagtt 480 ggtatttttt gagtacgtat taagtgttga gtatttttgt gattattata attttgtaag 540 ggaggtttat tagttttaag taagggagtt aaatataagt tttgttgttt ttaagtgttt 600 tttggttttt ttttttttgt tttgtacggt ttgtttcgat aatttagata gttttagtat 660 tttttttgga aaggttaatg ataagaggtt ggattatgaa tttgtagttg gtaaaggaga 720 gagaaagttt tatttaaata gtttgtaatc gttttgggta tcggttacgt gttagttacg 780 gggttaggtt tcgggaggta tacgattaga tttttgtttt tcgtaatagt tattatttgt 840 tgtttttata tttcgagggg aattagttgg gatttgggta gttagggcgt ttaaggtgcg 900 gggtcggcgt taggttggaa gtgggaagtt aggattatgg ttgggtttan aggagagtga 960 ggtaggatcg gtatgttttt tatttttttt tttagtttat taggcgtaag tttttcggtt 1020 cgtgtattat tagggaaagg ttgttgggtt tggtcgtcgt cgttatggag tttttttggt 1080 tttggagtgc ggtttggaag gcgcgggacg tttggtcgtt ttggtggcgt tatttagtcg 1140 agggtttagg gtattggatg gaaggtgggg tttgggagaa gcgtcgtacg taggggcggg 1200 attaggtttt tttttttgtg ttagtttggg cggcgttagc gtggaggggc ggggtttttt 1260 agtttttttt agattcggag gcggggcggg gtttcgggag ggggttggga gcgagaagtt 1320 cgggtgttgg ttttatttgt agcgcgttgt tttttttgtt tgtttgtttg tttgtcgtcg 1380 aggttggagt atagtggtgc gatttcggtt tattgtaagt tttgtttttc gggtttaagt 1440 tatttttttg ttttagtttt tcgaatagtt gggattatag gcgtttatta ttacgtattt 1500 ttgtttagta gagacggggt tttatcgtgt tagttaggat ggtttcgata ttttgatttc 1560 gtgatttatt cgttttcgtt ttttaaagtg ttgggattat aggcgtgagt tatcgcgtcg 1620 gttttgtagc gcgttgtttt tgtcgtttta tatgtaagta tatacggttg ttttgaaaat 1680 cgtttgtaga ggtagtaggt attagattag cgtttttaaa cgttagttgt agaagaattg 1740 gggtggggaa tgtgaggcgt tgttgagaat gtatattttt aggattagta tagagatttt 1800 gatatagtag gtttaggttt gaggtgttgt ttgagggttt atatttttag taacgagaat 1860 gttgaggttg tgggtggagt acggtgtgta ttttgcgaga taggtgttat tatgacgtag 1920 cgtttacgtc ggttttttgt ttttagtttt taggaaaggg tttggtacga gtaggagtaa 1980 atgaattcgt gtattattat atgggtttgg tgtttaagta taaaaaagat atgaggtcgg 2040 gcgtagtggt ttttgtttgt aattttagta ttttgggaag tcgaggtagg tggattattt 2100 gaggttagga gttcgagatt agtttgatta atatggtgaa aatttcgttt ttattaaaaa 2160 tataaaaatt agtcgggtat ggtggtatgc gttttaattt tagttattcg ggaggttgat 2220 gataggaaaa tagtttgaat ttgggaagta tagttgtagt gagttgagat tatgttattt 2280 aatattagtt tgggtaataa gagtgaaaat ttgtttttaa aaaaaaaaaa gttatgaaat 2340 ggaatttgtg aatttttttt ttttaattgg atttgttgtt tttatttaaa gtagagtttt 2400 tgtttaaatt ttttttttaa gttttttagt tttttgagaa atagtgaggt tttatttttt 2460 gaggagagag gcgtttttag ataggtttaa gtttataagg tttttttttt ttttgaggat 2520 aatgtttagg attttatttt tttatagttt ttttttttta atatgtaatc gtttaatgga 2580 tttattttgt ttgttgttta gataaaatta atttattaag ataggggaat tgtaataggg 2640 aaagagttta tgtagaatta gttatgtagg agattggaat tttattattg tttaaattcg 2700 gttttttaag tattcgagta tacggggatt tagagttttt aaggatagtt tgatgggtgg 2760 ggaaaggtta gtgagttagg agtgttgatt gtttgggtta gagatgaaat tataggggat 2820 ttaagttgtt tttttggatt gagttagttt ttgggcgagg gttataaggt tagataagtg 2880 agtttattaa tttggttggt gttacgtttt gagggatcgg tgttagtata ggttgtattt 2940 gttttttgtt gagggttttg gtttttttgg ttaagattag gtttagatat ttgatttgtt 3000 gtaggtagag ttgggttttt agtttagata ttttgttcgt ttgattattt agaaagttta 3060 agagatttag agtagtttgt tggtatgagg tttttaaatt ggtagttaaa agtaaattat 3120 ttagatttcg ttttaagatg gttaaatagg aatagtttcg gtttgtagtt tttagtgtga 3180 tcgatgtaga agacggtgat ttttgtattt ttaattgagg tatttggttt attttattgg 3240 gattggttgg atagtggttg tagtttatgg agggtgagtc gaagtaggga ggggtattgt 3300 tttattcggg aagcgtaagc ggttggggga tttttttttt ttagttaagg aaagttgtga 3360 tagattgtat ttggaaaatt aggatatttt tatttaaata ttgtattttt ttaacggttt 3420 tagtaaatgg tatattagga gattaaattt tgtgtttggt ttagtgggtt ttacgtttat 3480 agagttttgt ttattattag tatagtagtt tgaggtagta gtttggtagg ggaggggcgt 3540 tcgttattgt tgaggtttga gtaggtaaat aaagtagtcg ggaaggttga attgggtaga 3600 gtttatcgta gttttgtaag gtttgttgtt tttgtagatt ttatttttgg gggtagggta 3660 taggtgaata aaagatagta gaaatttttg tagatttaaa cgtttttgtt tgatagtttt 3720 gaagagagta gtggtttttt tagtatagtg tttgagtttt gagaatggat agattgtttt 3780 tttaagtggg tttttggttt ttatgtagtt taattgggag atatttttta gtaggggtta 3840 attgatattt tatataggcg ggtgtttttg tgggacgaag tttttagagg aaggattagg 3900 tagtaatatt tgtttttttg taatatttgt tgttttgtag tttttattgg taatatttag 3960 gtaaataggg tttggagttg atttttcgta aattttaata gatttgtagt tgagggattt 4020 gatttttaga aggaaaatta gtaaatagga atagtattaa tattaataaa aaggatattt 4080 atattaaaat tttatttgta ggttattagt attaaaggta gataaaatta cgaagatggg 4140 gagaaattag agtagaaaaa cggaaaattt taaaatttag agtgtttttt tttttttaaa 4200 agattatagt tttttattag taacggatta aaggtggacg gagaatgatt ttgatgagtt 4260 gagagaagta ggttttagaa ggttggtaat aatatatttt ttttagttaa aggaggatgt 4320 ttaaatttat cgtaaagaag ttaaaaattt tgaaaaaaga ttagacgaat ggttaattgg 4380 aataaatagt gtagagaaga ttttaaatga tttgatggag ttgaaaatta tggtataaga 4440 attatgtgat gtatgtataa gttttaatag ttaatttatt taaatggaag aaaggatatt 4500 agtgattgaa gattaaatta atgaaataaa gtgagaggag aagtttagag aaaaaagagt 4560 aaaaagaaat gaataaagtt ttcgagaaat atgggattat gtgaaaagat taaatttata 4620 tttgattggt gtatttgaaa gtgataggga gaatggaaat aagttggaaa atatttttta 4680 ggatattatt taggagaatt tttataattt agtaagatag gttaatattt aaattaagga 4740 aatatagaga atattataaa gatatttttt aagaagagta atttcgagat atataattgt 4800 tagatttatt aaggttgaaa tgaaggaaaa aatgttaagc gtagttagag agaaaggtcg 4860 gattatttat aaagggaagt tttttagatt agtattggat tttttagtag aaattttata 4920 agttagaaga gagtgggggt taatatttaa tattttttaa gaaaagaatt tttaatttag 4980 aattttatat ttagttaaat taagtattat aagtgaagga gaaataaaat attttataga 5040 taagtaaatg ttgagaggtt ttgttattat taggtttttt ttataagagt ttttgaagga 5100 aatattaaat atggaaagta ataattagta ttagttattg taaaaatatg ttaaatttta 5160 aagattatta atgttaggaa gaaaatgtat taaataatgg gtaaaataat tagttaatat 5220 taaaatgata ggattaaatt tatatataat aatgtatgat gggtttaaat attttttttt 5280 agttgggaga agtatgttat tattaatttt ttgaagttta ttatattaat tttaaatata 5340 aacgggttaa atgttttagt taaaagatat ggattggtaa attaggtaaa gatttaagat 5400 ttattagtgt gttgtattta ggagatttat tttatttgta gagatttata tcggtttaaa 5460 ataaagggat ggaagaagat ttaataagta aatggaaagt taaaaaaaaa aaaaaaaaag 5520 taggggtttt aattttagtt tttgataaaa tagattttga attaataaag attaagagat 5580 agagaaggtt attatatagt ggtaaaggga ttaatttaaa aagaagagtt aattatttta 5640 aatatttatg tatttaatat aggagtattt agatttataa aataagtttt tagagattta 5700 taaagagatt tagattttta tattatgata atgggagatt ttaatattta attgttaata 5760 ttagatagat taataagata gaatgttaat aaggatattt aggatttgaa tttagttttg 5820 tattaggtag atttagtaga tatttataga attttttatt ttaaattaat agaatatata 5880 tttttttaag tattatatag tatttatttt aaaattgatt atatagttgg aagtaaagta 5940 ttttttagta aatgtaaaag aatagaaatt ataatatatt gtttttgaga ttatagcgta 6000 attaaattag aatttaggat taagaaattt atttaaaatt ataaaattat atgaaaattg 6060 tattgttttt gaatgattat tgggtaaata atgaaatgaa ggtagaaata aagatgtttt 6120 ttgaaattaa tgagaataaa gatataaagt attagaattt ttgggatata tttaaagtag 6180 tgtgtagagg gaaatttata gtattaa 6207 37 5464 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 37 tattagagtg cgtaaggagg aaatagaggt aaattttggt tttgatgaag aggtagaagg 60 ggttaggagg tttttattat tgtttgtttt ttgtaaggtt atttaaaaag tgaagagata 120 tttttaaagt gagtattgat taaatgttag ttgttttttt agatttttta tggtttaaaa 180 ataaatgaaa agaaaaaagt tttgtttttt tatttaaatt tgagttatat tattaaaggt 240 tttttaggta atggggtttt tatacgtttt agagtaagta gtatatggtg tgtgtatgta 300 tgtttttttt tttttttttt ttttttattt tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 360 tgtgtgtgtg ttagtggaga gagagagaga cgaagaaaag ggaggagtga taattttttt 420 aaacgtatat aagttgtttg tgagaaaaat agtagtaatt ataatatatt aagtttttta 480 ttgttggtaa tgttttttat gtgttttttt agattgttta attttaattt tttaaatgtt 540 ttattttttt ttttatattt tggaaaatta taatatgttg atttaattta aaaaagttat 600 ttgaaatgta gttaaattta tttgattttt tttaatttat tattgtatat gggttttatt 660 ttattttatt agtaaatttg atattgatta tgataaattt atttagtgtt atatattttt 720 atttgtaaat tttaaggttt aattttaaat tttttagggt aagaggtttt taaaatattt 780 ttaatttgta ggatttttaa gattttattt ttaaatgttt taatatgatt aattttatat 840 atgtgatttt atatttttat attagatata aaaaagattt agattattta ggtttttagt 900 tagttttttt tatatatgaa gttattttta cgagtaagat gaaggggaag tgagatagtg 960 gtagttgttg ttttttggat gataggttaa tttatttttt gtttttaaag gaagtaggtt 1020 ttatttttta aatttttttt attatatgtt tttgtatgta ttgttttttt ttattagtaa 1080 gtttttttga ttttttttgt tttttttttt ttttttattt ttttttttgt ttgattgttt 1140 ttttgatatt atttaaagat aattgttttt tttttttggt tttagaatta ttcgatgttt 1200 tttagtagtg aggttagttt ttataaatgt ttaattaaaa aaaatttttt ttaaaatagg 1260 taagaggagg aggagttgaa ttttaaatat ttggagtttt ttttgattag tagtatttaa 1320 tttttgatag tatttaattt atggtatttt agtgaagata attttaaaag ttaatagaga 1380 agttaggtta attttttcga taggatgata tatttttttg taaattttta aatgtttttt 1440 attgtattat ttgtgagtag ggattagtag tgtttttaaa taggaagtgt gttttttgtt 1500 aatagtaagt tttatagatt tttggttttt ttgtttagtg gagggttatt aagagagagt 1560 atttaatttt ttatagttgg aaattttttt ggttttttta gattatgtaa ttttttaaaa 1620 tgttataggg tagattaagt tttgaatttt atttgtgttt ttgattaggt tttagtttgt 1680 tttatagatt attgtatttt ttgttttttt ttgtgttttt tttatagtgt aggtagtaat 1740 tataatattt tttatagagt gtattatttt gtttttaagg atgttagaaa cgtatggtat 1800 cgatttttat tgtgtattta gataatagta atataagtat agaatattat tttggtatta 1860 tagaagtttt ataattttta agtgttagta gtatattttt tttaaacgtt agtaatttta 1920 atttttggta agaaaaaaaa tagattatgt aatttataat gattttattt tttagtaaaa 1980 ttttattttt ttgtgttcgt tattagaaat ttttatagat atattttagt agttatattt 2040 ttgtttgttt agttagagta agtttagtga ggaagggggt ttgttgttat ttttttttaa 2100 tgatggaaat attgaggagt atatgaggaa ttttatttat tagatgtgtg aggttaagag 2160 atttttgatt atgttattgt tttttagttt gggcgataga gtgagatttt gttttaaaaa 2220 aaaaaaaaaa tgatatgttt atttattaaa aatttttgtt agattatttt tttttataaa 2280 tttttaaatt ttttaatgat ttaataagtt ttatttttat tattgttaaa aaaatttttt 2340 ttttgagtaa tataattata aagtaaagaa tgttattatt gatttaatta gtaaaaaaat 2400 aatatttaat aataaaattt tttaaatatg gttttaggtt atttagatga tttagttatt 2460 tttttttgat gttttttttt ttttcgaatg aattataatg aggtagaaaa atttttatgg 2520 gtgtagagta ggtgtatata tttatggagt atgtgagata ttttgatata ggtatataat 2580 atgaaataag tatattatgg agaatggggt atttatattt ttaagtattt attttttgag 2640 ttataaataa tttaataata ttttttaagt tatttaaaaa tatatagtta tgattgatta 2700 tagttatttt attgtgttat taaatagtag gttttattta tttttgttaa tttttttgta 2760 tttattgatt atttttattt ttttattttt tttagatatt tattattttt tttagttttt 2820 atttttttat tttttatgtt tataagttta attgttttga ggtttagatt ttataaataa 2880 gtgagaataa gtgatgtttg tttttttgtg tttggtttat tttatttaat agaatgttta 2940 gttttattta tgttggtgta aatgattgga ttttattgtt ttattgtatt ttgtatatgt 3000 attatatttt tttaatttat ttatttattg atgaatattt aggttgtttt taaattttag 3060 ttttgtaaat agtgttgtaa taaatatagg agtgtagata tttttttaat atattgattt 3120 tttttttttt gggtatatat ttagtagtgg gattgttgga ttatatagta gtttaatttt 3180 tagttttttg aggaaatttt aaattttgtt ttatagtggt tgtattaatt tatattatta 3240 ttaacgttgt atgagggttt tttttttttt atatttttgt taatattttt tattgtttga 3300 attttggata taagttattt taattggggt aagagggtat tttataatag ttttgatttg 3360 tattttttta atgattaata atgttgagta tttttttata agtttgtttg ttatttgtat 3420 gttttttttt gataaatgtt tgtttaaata ttttgtttat ttttttattg gattattaat 3480 ttttttttat agaatttttt gagtttttta tatattttgg atattaattt tttgttaaat 3540 gggtagttta taaatatttt attttatttt gtgggttgtt tttttatttt attgattgta 3600 ttttttgttg tgtagaagat ttttaattag atgtgatttt atttgtttat ttttgttttg 3660 gttatttgtg tttgtgtggt attgtttaag aaatttttgt taagattaat gtttttaaga 3720 ttttttttaa tgttttttta ttgtagtttt atagtttgag gttttagatt taaatattta 3780 attaaattat tttttatttg atttttgtat atggaacgag atagggattt agttttattt 3840 ttttgtatat gggtatgtag tttgttagta ttatttatta aaaagattgt ttttttttta 3900 gtgtatgttt ttggtatttt ggtgaaaaat gtttttattg taggtgtgtg attttgtttt 3960 tgggtttttt tgttttattg ttttatgtgt ttgtttttag gttagtatta tgttgttttt 4020 gttattatta tttcgtagta taatttgaag taaagtaata tgattttttt agttttgtta 4080 tttttgttta ggataatttt gtttttttaa ggtttggtgt tttatataaa ttttaggatt 4140 ttttttttgt ttttgtgaag aatgtttttg gtattttgat aggaattgta ttgaatttgt 4200 agattgtttt aggtaatacg gattttttaa taattttgat ttttttaatt tatgaatata 4260 taatattttt ttattatttg gtgttttttt taattttttt tattaatgtt ttgtagttat 4320 tattatagag attttttatt tattggttaa tttttaggta tttaatttta tgtgtggtta 4380 ttgtaaatgg gattattttt ttattttttt tttatatttt ttattgttgg tatatggaaa 4440 ttttgttgat tttggtatgt tgattttgta ttttgtaatt ttattgaatt tgtttgttag 4500 ttttaatagt tttttagagg agtttttagg ttttatttaa atataagatt ttattattag 4560 taaataagga taatttgatt tttttatttt taatttggat gttttttata tttttttttg 4620 tttggttgtt ttagtaaggt aatatgttga ataatagttg aataatagaa taaaaaaaaa 4680 tttttgtaaa gtaaataaat tttattagtt tatttgattt gtattttaaa ttagtgtttt 4740 tggttttttt ttaaaatttt aagtattata aggaaattag ttggaaggga attatgtgtt 4800 gattaagttt ttaaagggta gaaatattta ttgaagtgaa aaggattagt aaagggtgga 4860 aaaaaagatt agtttttcgt ttagtttggg tgagtagatt tgggattaat tattaggtag 4920 taatttatat gtatttaata gttttgacgt gagaggataa gaaatataag taaatataaa 4980 atatttaatt ttaagagaag tttattagag atatttttta ggattgtgag gtattggaaa 5040 gaagttttat ggggagtggg tggatacgtg ttaaaatttt attagtgtaa gggattttaa 5100 attatagaaa ttaatttgtt ggaaatttgt ttttaatttt ttttttagtt ttaaggttaa 5160 attaaatgta attaatgatg gtgatttgtt aatttatgtt tttgataatt gatatttagt 5220 atgtatatat atataaataa aatgacgagg atagggaatt taattatttg ggtattatat 5280 atgtaggtgt tatatatgtt aaattttaaa ggtaaaattt gtgtgaaatg ttatattttt 5340 attatttgtg tgaaatgtta ttttatatat gggttttatt ttgaaagtgg tttgggaagg 5400 gggtatatta ttttaagtat taagaaaaat ttgtataatt ttattttatt tttttttttt 5460 tagt 5464 38 5464 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 38 gttgaaaaag agaaagtaaa atgagattat gtaagttttt tttggtattt aaaatggtat 60 gttttttttt taaattattt ttaaaatgga atttatatgt aaaatgatat tttatataaa 120 taataaaagt gtgatatttt atataaattt tatttttaaa atttggtata tataatattt 180 gtatgtgtga tatttaaata attaaatttt ttgttttcgt tattttgttt atatatatat 240 atatattaga tattagttat taaaagtatg aattagtagg ttattattat taattatatt 300 taatttaatt ttggagttga aggaagaatt gggaatagat ttttagtaag ttaatttttg 360 tgatttaaag ttttttatat taatggagtt ttggtacgtg tttatttatt ttttatagga 420 ttttttttta gtattttata attttgaagg atgtttttga tgaatttttt ttagaattga 480 atgttttata tttgtttgtg ttttttgttt ttttacgtta gaattgttaa gtgtatgtgg 540 attgttgttt gataattaat tttaaatttg tttatttaaa ttaggcgggg ggttggtttt 600 tttttttatt ttttattaat tttttttatt ttagtgaata tttttgtttt ttaaggattt 660 gattagtata tgattttttt ttaattgatt tttttgtgat gtttaaagtt ttaagaaaag 720 gttagaagta ttaatttgga atataagtta gataaattag tgagatttgt ttattttgta 780 gagatttttt tttattttgt tatttaattg ttatttaata tattattttg ttagagtaat 840 taggtaagag aaggtataaa gagtatttaa attggaaatg aagaagttaa attatttttg 900 tttgttgatg ataagatttt atatttgaat aaaatttaaa gattttttta aaaaattatt 960 agagttgata aataaattta gtaaagttgt aggatataaa attagtatat taaaattagt 1020 aaagttttta tatattaata gtgaaaaatg tgaaaaagaa ataaaaaagt aattttattt 1080 ataatagtta tatataaaat taaatattta ggaattaatt aatgaatgaa aggtttttat 1140 aatgataatt ataaaatatt gatgaaagaa attgaagaag atattaaata atggaaaaat 1200 attatatgtt tatggattgg gagaattaag attgttaaaa agttcgtatt atttaaagta 1260 atttatagat ttaatgtaat ttttattaaa atattaaaga tattttttat agaaatagaa 1320 agaaaatttt aaaatttata tggaatatta aattttgaag aggtaaagtt attttaagta 1380 aaaataataa aattggagga attatattat tttattttaa attatattac ggagtgatag 1440 tagtaaaaat agtatggtat tggtttaaaa atagatatat agagtaatgg aataggagaa 1500 tttaaaaata aaattatata tttatagtaa agatattttt tattaagata ttaagaatat 1560 atattgggga aaagatagtt tttttaataa atggtgttgg taaattatat atttatatgt 1620 aaaagaatga aattaggttt ttatttcgtt ttatatataa aaattaaata aaaaatgatt 1680 tgattaaata tttaaatttg agattttaaa ttatgaaatt ataatgaaga aatattgagg 1740 aaaattttga ggatattggt tttgataaag attttttgag taatattata taagtatagg 1800 tagttaaagt aaaaatgaat aaatgggatt atatttagtt aaaaattttt tgtatagtaa 1860 agagtataat taatgaagtg aagagataat ttatagaatg ggataagata tttgtaaatt 1920 atttatttga taagggatta atatttagaa tatatgagaa gtttaaaaaa ttttatagaa 1980 aaaaattaat aatttaataa aaaaatgggt aaaatatttg agtagatatt tattaaaaga 2040 agatatataa atggtaaata gatttatgaa aagatattta atattattga ttattagaga 2100 agtataaatt aaaattattg tgagatattt ttttatttta attaaaatgg tttatgttta 2160 aaatttaggt aataagaaat gttgataagg atgtggagaa aaggaaattt ttatatagcg 2220 ttggtagtaa tgtaaattag tataattatt atggagtaaa gtttggagtt tttttaaaaa 2280 attaaaaatt gagttattat atgatttagt aattttattg ttagatatat atttaaaaga 2340 aaggaaatta atatattgaa gagatatttg tatttttatg tttattgtag tattgtttat 2400 aaagttaaaa tttggaagta atttaagtgt ttattaatag atgaatggat taagaaaata 2460 tggtatatat gtaaaatgta gtaaaataat gagatttagt tatttgtatt aatatggatg 2520 gaattagata ttttgttaag tgaaataagt taggtataga aagataaata ttatttattt 2580 ttatttattt gtggaattta aattttaaaa taattgaatt tatggatata aagagtagaa 2640 gaatggaggt tgggaaaggt agtgggtgtt tgaggggagt agggaagtag ggatagttaa 2700 taggtataaa aaaattagta agaatgaata agatttattg tttgatagta taatagggtg 2760 attatagtta attataattg tatattttta aataatttaa aaagtgttat tggattgttt 2820 gtaatttaaa ggataaatgt ttgagggtat gaatatttta ttttttatga tgtgtttatt 2880 ttatgttgta tgtttgtatt aaaatatttt atatatttta taaatatata tatttatttt 2940 gtatttatga aaattttttt gttttattgt gatttattcg aagaagagaa gggtattaaa 3000 ggaggataat taagttattt ggatggtttg gagttatgtt tgaaaaattt tattgttaag 3060 tattgttttt ttattggtta aattaatgat aatatttttt attttgtgat tgtgttattt 3120 aaaagaagga tttttttaat aatgataaaa ataaagtttg ttagattatt aaaaaattta 3180 aaaatttata aaaaagagtg gtttgataga agtttttaat gagtggatat attatttttt 3240 tttttttttg ggatagggtt ttattttgtc gtttaggttg gagagtagtg gtatgattaa 3300 agatttttta gttttatata tttaatgggt aaaatttttt atatattttt tagtgttttt 3360 attattaaag aagagtagta atagattttt ttttttattg agtttatttt agttgggtag 3420 gtagaaatat gattgttaaa atatgtttgt ggaaattttt aataacgaat ataaaaaaat 3480 agaattttgt tgaagagtaa gattattata gattgtataa tttgtttttt tttttgttag 3540 ggattgaggt tgttaacgtt tgaagaaaat gtattattga tatttgggga ttgtagagtt 3600 tttatggtgt taagataata ttttgtgttt gtattgttat tatttaaatg tataatggga 3660 atcgatatta tgcgttttta atatttttaa gggtaaggta gtatatttta tgaaggatat 3720 tgtgattatt gtttgtattg tggaaaaagt atagaaggag ataagaaata taataatttg 3780 taaaataaat tgaagtttaa ttaaaagtat aggtaaaatt tagaatttgg tttattttat 3840 aatattttga agaattatat ggtttagaga aattaggaaa atttttaatt gtgagaaatt 3900 aagtattttt ttttagtaat tttttattaa ataggaaaat tagagattta tgggatttat 3960 tgttggtaaa aaatatattt tttatttagg aatattgttg gtttttattt ataaataatg 4020 taatgaaaag tatttaaaga tttataaagg agtgtgttat tttatcggaa agattggttt 4080 gatttttttg ttaattttta gaattgtttt tattaaaatg ttataaattg ggtattatta 4140 gaaattaaat attgttaatt aaaggagatt ttaggtgttt ggaatttaat tttttttttt 4200 tttgtttatt ttaaggaaaa ttttttttaa ttaggtattt gtggaagttg attttattat 4260 taaaggatat cgaataattt tgagattaga aaaaaaaaat agttattttt gggtaatgtt 4320 agagaaatag ttaaatagag agagagatag agagagaggg agagatagag aagattagga 4380 gaatttattg atgaaaggaa atagtatatg taagaatata tgatggggga ggtttaaagg 4440 gtaaagttta ttttttttag aagtaagaag taaattggtt tgttatttaa aagatagtaa 4500 ttgttattat tttatttttt ttttattttg ttcgtaaaag tagttttatg tataaaaaga 4560 attaattgaa agtttaaata atttaaattt tttttatatt tgatatagaa atataaaatt 4620 atatgtataa gattggttat attgaaatat ttagaaataa ggttttggaa attttatagg 4680 ttgaaaatat tttaaaaatt ttttatttta aaaagtttaa aattaaattt tgaaatttgt 4740 agatggagat gtgtggtatt ggatggattt attataatta gtgttaaatt tattaataaa 4800 atgggatgaa atttatatgt agtgatgaat tgaggaagat taaatgagtt tggttatatt 4860 ttaaataatt tttttaaatt gaattagtat attataattt tttagggtat agaggaggag 4920 atgagatatt taagaagtta aaattaggta atttggagag atatatgaaa agtattatta 4980 gtagtaaggg atttggtgtg ttatgattat tgttattttt tttataagta atttgtatac 5040 gtttagaagg attattattt tttttttttt ttcgtttttt ttttttttta ttgatatata 5100 tatatatata tatatatata tatatatata tatagaatga gagagagaga gagagagaga 5160 aatatgtatg tatatattat atgttattta ttttggaacg tataaaggtt ttattattta 5220 aggggttttt ggtaatataa tttaaattta ggtaagaaaa tagagttttt ttttttttat 5280 ttatttttaa attataggaa gtttgaagag ataattgata tttggttaat atttatttta 5340 aggatgtttt tttatttttt agataatttt gtagaagata gataatgatg gaaatttttt 5400 gatttttttt atttttttat tagaattaaa atttattttt gttttttttt tacgtatttt 5460 aata 5464 39 7479 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 39 acggtttggt aagtagagcg aaggaggaaa tttagagttt aaaatatttt gttaattttg 60 gaaaagagag aattttttgt ttagtttgtg gaggcgggag ggatagaagg agggagtatg 120 tggtttgttg tgagtttttg tatttagggg taagagttag gtttagatag gtgattgggg 180 ggtgtatatt tgggtttttt taggggagat ttgatatttt tgttttgtta agaggtttaa 240 aagggagata gtatgtatgg gtgttgtagt ttttttgaga cgggttatat aggagtagat 300 tattaatata ttaaagaaga gaggatgatt ttagggataa agtatagaag ttattagtaa 360 gggtttgttt aaaaaggtgg gggttgtttt taaaattttg aggtagtacg tattaggtga 420 gttgatttga aaggtgggtg tcggggtttt tttaggtaaa ggtaaagagg ttttgggaat 480 tagggtgtaa aggaattgtg aaaaagtatt atttaggttt agaatagaaa aatgggtggt 540 attcgaggga agtgaggaaa gtaaagtata tgggttagaa attattggat atattgggag 600 tatagtttgg ttaatgagtt tgaggttttg gattaagtga taagttttat ttggtttttt 660 aataggtaga attgatgtgt taaaaggaga gtttgttggg tagagtaggt gattggtgag 720 gaggagagaa atgataggtt ttaggtttat gagagttgtt tgggggatga gatattgttt 780 ttgtgatagg aacggggtgg gttttttaag ggtgatgtgg atgggggtgt ggtgttttgt 840 gatcgagggt gtggaagtat tttaaatagt ggggttaatt ataggtgcgg gataaggaaa 900 agttgtatgt tttagggtgg gaggtcggag gagtagaaga aggttagaag tttgttagaa 960 gttttggagg ggtttgggtt gatgtgttgg gtattatggg gaatgtggaa gtggagagta 1020 gtgtggagtt ttgaaagaat atttttgttt aggagcggag ttgggtatga aggtaggatt 1080 aagaaagagt gattgaagga aaaggtgttt agggagtaga aaagtggagg ggggttttgg 1140 ggtttggaga tttgtttatt gatttttata atagagattt gggaggattg ggtgggtttt 1200 gaaaatttag gtaaagtaga gtaggttgtt ttaatattaa tttttaaaaa atatgtatgt 1260 ttatttgtta ttattagagt tatttttggt ttagatgaag taatggtagt tgttgggata 1320 tttgttttag ggtattgtta gtttttagtg gtaaggtcga tgagattcga gtaggaggtt 1380 ttggttagtt cggaaaggga tggaggcgat ttttgttgga gtcgtttata gtttgatttt 1440 tattgagttt tttatagagg gggtatagtt tggtgagtat agttgggttt gggtatggtt 1500 tggattagta gtttttattg ttatatttga aataggcgtt aggtggaggt gttttgttag 1560 gaggtttttg tatggagttg tggttttgtg ggtttgtagg gtaaaggtaa gtattggaaa 1620 ttgttttttt tttttatttt ttttattata attgttaaag attttgaagg ttaaattaag 1680 aaggttttat tgtggggttt gagggtcgtt attaattttt tgaagtttgc gttaaatatt 1740 atggtagatt gggtgaggaa ttgaaggttt gaaatagtgg ttttttttgg gttggttggg 1800 tttaggttgg taattttttt atggttttag ttaaataaga gagaaaaagg gttgggtttt 1860 tgttaggatt ttcggtgatt tttgaaagtt ttttatagtt tattatttta tgggtatttt 1920 ttttgagttt tgtaaggaga tatataatta tgaggttttg atggttgtgt ttagaggttt 1980 tgttttgata attttagtgg gggttttggt tgggaattgt ttttgtgtta gtaggttggg 2040 taggagtttg atgatgaatt gtattagtat gtatttgagt tagggtttaa gtacggtgtt 2100 ggttttttgg ggtgagggtg gaagagaaga taagtagttg ttatgttagg ttagtttata 2160 agattgagta aggtattgaa tttttttaat ataagaggta ggattttttg gaaatgaatt 2220 gagttttttg ttagtttgag agagattagt gagggagaag ggaatatgaa ttttaataat 2280 atttttagtt tttgttattt ttcgaagggg gtattttagt attggcgtta aagtacgggt 2340 ggggtatggg ggttaaagat ggtgtcggag ttagtatggg taggagagaa ggaagaagtt 2400 agaaggggtt tttgttgagg gtttgaagag ggaagggggg ttgagttgat aggtattgga 2460 ggatagatac gggtgtaagg tggcgggatg ggtttatagg tttcgtgaga gggttgtaag 2520 gaaggagaat gagtataggt aatgttagag tttttttgag gagaggatgg tataggaaaa 2580 gaagtgggtg atgttggttg ggaagatggt ggttgggaag atggtggttg agaagataat 2640 gaggaagttt ggggagttaa tgaagttggt tgagatggag gggtagggtt tgggaggggt 2700 ggatagtagt ttgttttatt taatgaggaa aaagaggtag ggtcgggagg ataaaggtaa 2760 tgagggcggc gagaatgaag aaggatttga ataggtaagt aagaattgta gaggtcgggt 2820 tgtgatttga gtgtaaaaag gtttggatat aaggaatttt tttttatttt tttagttatt 2880 tgtaataatt gtttaagtta gttaaaattg taaagttgag tgttttattt gcgggttatt 2940 tggattcgtt atttaattta tattgcgatt aggttttatc gtataaaaaa gataaggtat 3000 ttatggtaga tattttgttt gaggtttaag gtttgtagat ttttaatgag gtaggttgga 3060 gggttgtttt ttggaattga ggatcgggag ttttttataa tgaagggtag ttcgagagaa 3120 tagggaaaaa ggagattatt ttggatagtt ggagggagac gataaaagga gttatcgttt 3180 tcgttgtttt tttggttttt ggaatgggat gaaatggttt agaggtattt ttttaagatt 3240 agatgattag cgagtgtttg gcgtacgttg gcgttttttt ggattagtgt tggatttttg 3300 gattggagaa attaagagag gttatgtaga ttttgttttg ttaatcgggt tttaagggaa 3360 atttattagt aggcgagatt agtggttgat gcgtatgtat agagaggcga ttggaggttg 3420 aggagttttt tttgtttaat tgttgtggtt tgttttttgg ggtggagggg taggtttata 3480 agcgatatag atttgagttt tttttaggat ttggtattag atgtaaggtt tttgaattag 3540 tttgaatttt aatagcgcgt taatagataa taggaggcgg tgtggagtaa tatgttgttt 3600 taatgaacgt ttggttgtag gtgggttgag gtttaaaatg gtattagttt ttagtgagga 3660 tgggataggg gttttgtagt tttttgtaaa tagtaagtgt tttagtttgt tgtgattgtt 3720 atgtagtatt tggatggttt attttttgat ttttaggggt atattttttt tagttagggt 3780 aagtgttttt tggtcggttt tttttttgtt tttgttattt tgttgatata cgttgttgat 3840 gtaagtggtt ttgtattttg gggttgggtt tgagaaggga ggagttattt atttttttaa 3900 gtttttaggt tttgaggaga atttttgaat tttttgtatt attggttatt tttttgatag 3960 atttttgtga tgttaggtag gaatgagtcg tttgggtatt tagagagttt ttagtgtttt 4020 tttgttattt tttttatttt tgtattttgt ttggtttggt tttttaattt gatttagttt 4080 tatataaagt taggaatttt ttttgttaat agaattttag tttttttagt ggggatgtgt 4140 attttggaga gggggattat ttttttttat ttttattgtt ggggtattta tagtgtttgg 4200 gatgtttttt aggttttgta ggagtagtac gttttttgta gagggtgtgt ggattttttt 4260 agaattgttg gtttgttttt gtagttgatt tgtagttaaa atttataatg taagtttttg 4320 tatgttgttt tgtttggagt tgtaatttag ttttgtattt tatttgttat gattattgga 4380 aaatttttat ttatttttta aagggtttag aaaatgttaa tttatagaga tagaaattag 4440 attagtggtt gtttagggta ggatggatgt aaaattttag agtggggggt tagaggttat 4500 tgtatagaat tttttggaga taatattgat tattgtagtg aaagtaaaat tttgtgaata 4560 tattaggaaa tattgaattg tatatattaa ttggtgagtt atatggtata tgaattatgt 4620 gttaataaag ttttagaaga tattatttgt attacgatat taaaaaatgt cgtttgagtt 4680 gtataattat tttttttttt tatgttaagg gtatcgaata ggtaggagtt ttttatttgt 4740 tattgttttt aatagtatta taaaataatt atataagata ggttatttat atattttagg 4800 ttataaaaat tattgtttga ttagagtaat tgtaaatata aaagaatatt aaatatatta 4860 aaataaatat gaggttatta attttttgtt ggtttttttg gtatgtattt atttagattg 4920 ttagtattat gtatttattt taaattttag tagttatatt ttaatttgat tgattttttt 4980 ttagatataa gtatgagaaa tgatagaaag aaataataat tggaaaagaa gtattgtata 5040 agattaggat gtttttgaaa tggacgttag tttttttgtt gatatagttt agttgttatt 5100 ttagttttgg aagttgtgga aaggtgttag tgtggtttat agaatatagt tattggataa 5160 atatgaagat aattttggaa gagtttgttt agaggggtta tgaggtgatt gtgttgatat 5220 tttcggtttt tatttttgtt aatgttagta aattatttgt tattaaatta gaagtttatt 5280 ttatattttt aattaaaaat gatttggaag attttttttt gaaaattttc gatagatgga 5340 tatatggtgt tttaaaaaat atattttggt tatatttttt ataattataa gaattgtgtt 5400 gggaatatta tgattatagt aataagtttt gtaaagatgt agttttgaat aagaaattta 5460 tgatgaaatt ataagagtta aagtttgatg ttattttggt agatgttttt aatttttgtg 5520 gtgagttatt ggttgaatta tttaatatat tttttttgta tagttttcga ttttttgttg 5580 gttatatatt tgagaagaat ggtggaggat ttttgttttt ttttttttat gtatttgttg 5640 ttatgttaga attaagtgat taaatgattt ttatggagag gataaaaaat atgatatata 5700 tgttttattt tgatttttgg ttttaaattt atgatttgaa gaagtgggat tagttttata 5760 gtgaagtttt aggtaagtta tgtgtttaat tggtgtttat taagttttaa tttttttgtg 5820 tttttgaagg tgagtttata taaatataat gttagaagat agtgttttta agggaaatta 5880 tgaattgtaa atgtaagatg atttattagt tttaaaaata ttatagaatg ttgattttat 5940 agaattagtt agaattttgg ggttattatt attataggat atttagagag ttataaattt 6000 ttattgtaaa gtattaatga tttttttaaa ttattatata ttattttgtt atatattttt 6060 ttatttttaa aaaaagttaa tagatatttt aagaaatatt tttatgaagg tagatacgta 6120 aatttagtat ttatatatat ttttagaaaa attattaatg taggattgag gaatttgttt 6180 ttttttgagt tttttagttt ttttatttag aaattaaatt ttgtttttta tgtaagaagg 6240 atttttttat agttgagtaa tatagtggtt ttattttaga aatagaagtt taaaatttga 6300 gatttttaat gtttatatat ttttttaata ataggttgat aattattttt tttaaaaatt 6360 gaaattttgt tgaaagtgaa tatttaagtt ttaatttata ttttattaaa ttgtattttt 6420 ttattaaaga aaataggggt taaattaagg gagagtatat atttttatgt taataaattt 6480 tgaaaatgtt ttaattttta tttgtaaata tatttatttt aaaaatttaa ttatattaag 6540 attttaagat gaattaagat agtagtaggt gtaaagattt tagtgttgag tttaaaaaat 6600 ttatggttta ttttgagaat taaggattaa gggattagtt taataaattg tagatattag 6660 agtatttttt ggaaagttgt ttttatgggt aaggtaagat gaattaattg tggaattgaa 6720 agagttgttt aaaggtatat ttgttattat tgtagtttta gagggaagat aaatgtgtat 6780 ttaagtttat agtggttata ttagtttatt tttatattgt tgtaaagaaa tatttgagat 6840 tgggtaattt ataaagaaaa gaagtttaat agatttagtt ttatatgatt gggatgtttt 6900 aagaaattta gaattatggt gaaaggttaa ggggaagtaa gtttggattt ttttatttag 6960 tggtaggaga gagaagtgta agtaggggaa atattagata tttataaaat tattagattt 7020 tatgagagtt tatttaatat tatgagaata gtatggagga atttatatta tgatttaatt 7080 atttgttatt gggttttttt ttggatatat ggggattatg gggattataa tttaagatga 7140 gaggagattt gggtggggat agttaaatta tattagtgat ttattttaat aattatttat 7200 gattgtgaat atattgatgt tatattaaag atgtgatttt tttttataga tttttgaata 7260 tattgttttt tttatatata tatatgagta atatatgtaa taaataaaat ttaaattatg 7320 attatatata aatgtattta tatatatttt attaatgtat agatatttta tatatgtttg 7380 ggtatgttat tttaagtttt tttaggaaaa tatttgtata tttaaataat aattttcgtg 7440 ttagttattt tttgttttgt tttgtttttt tttattagg 7479 40 7479 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 40 tttgatggaa aaaaataaaa taaaataaaa ggtagttaat acgagaattg ttatttgaat 60 atgtaggtat ttttttgaaa ggatttggaa taatatattt aaatatatat aaaatgtttg 120 tgtattgata aaatatatat aaatatattt atatatagtt ataatttaga ttttatttat 180 tgtatatgtt gtttatatgt atatataagg aaggtaatgt atttagagat ttgtaagaag 240 aaattatatt tttaatgtaa tattagtata tttataatta taaataatta ttaaaataag 300 ttattaatat ggtttgattg tttttattta aatttttttt tattttgaat tataattttt 360 ataattttta tgtgtttagg gagggattta gtggtaggtg attggattat ggtgtggatt 420 tttttatgtt gtttttatga tattgagtga gtttttatga gatttgatag ttttataagt 480 gtttggtatt ttttttgttt gtattttttt tttttgttat taagtgagaa gatttaagtt 540 tgtttttttt tagtttttta ttatgatttt aagttttttg aggtatttta gttatgtaga 600 attgagttta ttaaattttt tttttttata aattatttag ttttaggtat ttttttatag 660 tagtgtgaga atggattaat gtagttatta tgaatttaaa tatatatttg tttttttttt 720 gaagttgtaa tagtaataaa tatattttta aataattttt ttagttttat aattaattta 780 ttttatttta tttatgaaaa tagtttttta ggaagtattt tagtgtttat agtttattaa 840 gttagttttt tgatttttgg tttttaaagt aaattatgag ttttttgagt ttaatattga 900 aatttttata tttattattg ttttggttta ttttaagatt ttaatataat tagattttta 960 aaataaatat atttataaat gagaattaaa atatttttag aatttattga tatagagata 1020 tgtgtttttt tttaatttgg tttttatttt ttttgatgga gagatgtagt ttaataaaat 1080 atagattaaa atttagatgt ttatttttaa taagatttta gtttttgaaa gaaataattg 1140 ttaatttgtt attgaaggaa tgtataaata ttagaaattt taagttttag gtttttgttt 1200 ttggagtaga gttattatat tatttaattg tgaaggaatt ttttttatat gaaaaataaa 1260 atttaatttt taaatgagga aattgaggaa tttaaagaga aataaatttt ttaattttgt 1320 attgataatt tttttagaaa tatgtgtaaa tattaaattt acgtgtttgt ttttatgaag 1380 atgttttttg aggtatttat tgattttttt taaagatgaa aaaatgtata gtaaaatgat 1440 atgtgatagt ttaaagaaat tattagtgtt ttataatgaa ggtttatgat tttttgggtg 1500 ttttgtagta gtgatggttt tagggtttta attgatttta taaggttaat attttataat 1560 atttttgaga ttgatagatt attttatatt tgtaatttat aatttttttt aaaaatatta 1620 ttttttgata ttatatttat ataagtttat ttttaaaggt atagaaaagt tagaatttaa 1680 taagtattag ttagatatat gatttattta gaattttatt ataaaattgg ttttattttt 1740 ttagattata aatttgaaat taaaagttaa aataaagtat atgtattata ttttttattt 1800 tttttatgaa aattatttga ttatttaatt ttgatataat aataggtata taggaaggag 1860 ggaatagaaa ttttttatta ttttttttaa atgtgtagtt aatagagaat cgaagattgt 1920 atagaaaggg tatgttaaat agtttagtta gtagtttatt atagggatta agggtatttg 1980 ttagaatgat attaaatttt gatttttgta gttttattat aagtttttta tttaaaattg 2040 tatttttata gagtttgtta ttgtagttat aatattttta atataatttt tgtaattgtg 2100 aaaaatatga ttaaaatgta ttttttgaaa tattatatat ttatttatcg agaattttta 2160 gaagagaatt ttttaaatta tttttagtta aagatgtagg ataaattttt aatttaatag 2220 tagatgattt attggtattg ataagagtag aagtcgaaga tgttaatata gttattttat 2280 gatttttttg aataagtttt tttaggattg tttttatatt tatttaatgg ttgtattttg 2340 tgggttatat tagtattttt ttatagtttt tagagttaaa gtaataattg agttgtatta 2400 gtagaaagat tgacgtttat tttagagata ttttggtttt atgtaatgtt ttttttttag 2460 ttgttgtttt tttttgttat tttttatatt tatatttgag gaaaaattaa ttaagttaaa 2520 atataattgt taaaatttga agtaaatata taatattaat agtttgaata ggtgtatgtt 2580 aaggagatta ataaaagatt gatgatttta tatttatttt agtgtgtttg gtgttttttt 2640 atgtttataa ttattttagt taagtaataa tttttatgat ttagaatatg taagtaattt 2700 gttttatgta attattttat aatattgtta agaatagtgg taagtgagag gtttttgttt 2760 gttcggtgtt tttgatatag agagaagaag taattatata atttaaacgg tattttttaa 2820 tatcgtggtg taagtaatgt tttttaaaat tttgttgata tataatttat atgttatatg 2880 atttattaat tagtgtgtat agtttaatgt tttttagtat atttatagaa ttttattttt 2940 attataataa ttagtattat ttttaaaaga ttttatataa tagtttttaa ttttttattt 3000 tgaaattttg tatttatttt attttaggta attattaatt taatttttat ttttatagat 3060 tagtattttt tggatttttt aaaaaataaa tgagggtttt ttagtgatta tggtagatgg 3120 gatgtaggat tagattgtag ttttagatag agtagtatgt agaggtttgt attgtgaatt 3180 ttagttgtag attaattgta agaatagatt agtaattttg agaggattta tatatttttt 3240 gtaggaagcg tattgttttt gtaggatttg ggagatattt taaatattgt gagtgtttta 3300 ataatggaag tgggaaaggg tgattttttt ttttagaata tatattttta ttggagaagt 3360 tgaagttttg ttggtaggag aagtttttga ttttatgtga agttgagtta aattagagaa 3420 ttaagttaag taaaatatag gggtagagga agtagtagaa aggtattggg agttttttgg 3480 atatttaagc ggtttatttt tgtttggtat tatagggatt tattaggagg gtggttagtg 3540 atgtaggggg tttaaagatt ttttttaggg tttgaaggtt tgaagggatg agtaattttt 3600 ttttttttag gtttagtttt aagatgtaag attatttgta ttagtagcgt gtgttagtaa 3660 gatagtagaa gtaggaagag agtcggttag aagatattta ttttggttgg aagagatgta 3720 tttttgaaga ttaagaaata ggttatttag gtattatata gtagttataa tagattggga 3780 tatttattgt ttatagagga ttataaaatt tttgttttat ttttattggg ggttgatgtt 3840 attttaggtt ttagtttatt tgtaattagg cgtttattaa aatagtatgt tgttttatat 3900 cgttttttgt tgtttgttgg cgcgttgttg gggtttaaat tgatttaaga attttatatt 3960 tggtgttaaa ttttaggagg ggtttaggtt tgtgtcgttt gtggatttat ttttttattt 4020 tagagagtag gttatagtaa ttagatagag gaagtttttt agtttttagt cgtttttttg 4080 tgtatgcgta ttagttattg atttcgttta ttggtaagtt ttttttggag ttcggttaat 4140 agggtaaaat ttatatggtt ttttttggtt tttttagttt aaaaatttaa tattgattta 4200 agaaggcgtt agcgtgcgtt aggtattcgt tggttatttg gttttagggg gatgttttta 4260 agttatttta ttttatttta ggaattaaaa aggtagcgga gacgataatt ttttttatcg 4320 ttttttttta gttgtttagg atggtttttt ttttttttgt tttttcgagt tattttttat 4380 tatgggaaat tttcggtttt taattttaaa aaatagtttt ttagtttgtt ttattaaaaa 4440 tttgtaaatt ttaggtttta ggtaagatat ttgttataag tgttttgttt tttttatacg 4500 ataaagtttg gtcgtagtat gaattagata acgggtttaa atggttcgta aatggaatat 4560 ttagttttat agttttaatt gatttaagta gttattgtag atgattggga aaatggggag 4620 aaattttttg tgtttaggtt tttttgtatt tagattatag ttcgattttt gtaatttttg 4680 tttatttgtt taaatttttt tttattttcg tcgtttttat tgtttttatt ttttcgattt 4740 tatttttttt tttttattgg atggagtaga ttgttgttta ttttttttag attttatttt 4800 tttattttaa ttaattttat taatttttta agttttttta ttgttttttt agttattatt 4860 tttttagtta ttattttttt agttagtatt atttattttt ttttttatat tatttttttt 4920 ttaggaaaat tttagtattg tttgtattta tttttttttt ttatagtttt tttacggagt 4980 ttgtaaattt atttcgttat tttatattcg tatttatttt ttaatgttta ttaatttaat 5040 tttttttttt tttttaaatt tttagtagga attttttttg gttttttttt ttttttttgt 5100 ttatattagt ttcggtatta tttttggttt ttatgtttta ttcgtatttt agcgttagtg 5160 ttagaatgtt tttttcggga agtagtagga attgaaggta ttgttagagt ttatgttttt 5220 ttttttttta ttgatttttt ttaaattaat aaaagattta gtttattttt agaagatttt 5280 attttttata ttagggagat ttagtatttt atttagtttt atgaattaat ttggtatgat 5340 agttatttat tttttttttt atttttattt tagaagatta gtatcgtatt tggattttag 5400 tttaggtgta tgttaatata atttattatt aagtttttgt ttagtttatt ggtatagagg 5460 tagtttttaa ttaggatttt tattgggatt attaagatag ggtttttgga tatagttatt 5520 aagattttat gattatgtgt ttttttgtag gatttaaaaa gggtgtttat aaagtggtaa 5580 attatgaaaa atttttagaa attatcgaag gttttgataa aaatttagtt tttttttttt 5640 tttgtttaat tgaagttatg agaaaattat taatttggat ttagttagtt tagaaggaat 5700 tattatttta aatttttagt tttttattta atttattatg atatttggcg taagttttag 5760 aaggttgatg acggttttta aattttatag tgggattttt ttaatttagt ttttaaagtt 5820 tttaatagtt gtgatgagga aagtaaaaga aaaaaatagt ttttaatgtt tgtttttatt 5880 ttgtaggttt atagggttat agttttatat agaagttttt tagtaaaata tttttatttg 5940 gcgtttgttt taagtgtggt aatgaaggtt attggtttag gttatgttta aatttagttg 6000 tgtttattag gttgtgtttt ttttgtggag gatttagtga aagttaggtt gtgagcggtt 6060 ttagtaagga tcgtttttat tttttttcga gttggttaaa attttttatt cggattttat 6120 cggttttgtt attgaagatt gatagtgttt tggaatagat gttttagtaa ttattattgt 6180 tttatttgag ttaagggtaa ttttgatggt ggtaggtagg tatgtatgtt ttttaaaaat 6240 taatattgga gtaatttatt ttgttttatt taaattttta ggatttattt agttttttta 6300 agtttttgtt gtgggaatta atggataagt ttttaaattt taagattttt ttttattttt 6360 ttgttttttg aatatttttt tttttagtta ttttttttta gttttgtttt tatgtttagt 6420 ttcgttttta ggtagagata tttttttaaa attttatatt attttttatt tttatatttt 6480 ttatagtatt taatatatta atttagattt ttttaaggtt tttaataggt ttttaatttt 6540 tttttatttt ttcgattttt tattttgaaa tatgtaattt ttttttattt cgtatttgta 6600 gttaatttta ttgtttggga tatttttata ttttcggtta tagagtatta tatttttatt 6660 tatattattt ttaaagagtt tatttcgttt ttattataga agtagtattt tattttttaa 6720 gtagttttta taggtttaaa gtttattatt tttttttttt ttattagtta tttattttgt 6780 ttaataaatt ttttttttaa tatattagtt ttatttgtta aaaagttaga tggaatttat 6840 tatttagttt aggattttag gtttattaat taagttgtat ttttagtgtg tttagtagtt 6900 tttaatttat atattttatt ttttttattt ttttcgaata ttatttattt ttttgtttta 6960 aatttaaatg atgttttttt ataatttttt tatattttga tttttaaaat ttttttgttt 7020 ttatttggga aaatttcgat atttattttt taggttagtt tatttggtgc gtattatttt 7080 aaggttttag agatagtttt tatttttttg gataggtttt tgttagtaat ttttgtattt 7140 tatttttaaa attatttttt tttttttaat atgttaataa tttgtttttg tgtagttcgt 7200 tttaaagaga ttgtaatatt tatatatatt attttttttt taaatttttt ggtagaatag 7260 gggtattagg ttttttttaa gaaagtttaa atatgtattt tttagttatt tatttaggtt 7320 tagtttttat ttttgaatgt aagggtttat aatagattat atattttttt tttttgtttt 7380 tttcgttttt ataaattaag taagaaattt tttttttttt aggattagta ggatatttta 7440 agttttgggt tttttttttc gttttattta ttaaatcgt 7479 41 5857 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 41 aattaaaaaa ttaaaattaa aaaggagggt gagatagata tgataaggat tatatggtga 60 gttagaattt agatttttcg ataaggttta gttgtttttt tntatagttg ttattatttt 120 ttttttttaa agttttgaaa attatatttt tttggaggtt agtttgggta gtatatagag 180 attttttttt tataaaataa aagtaaagta attagttggg tatggtggtt tatgtttgta 240 gttttagtta tttaggagga tgaggtggga ggattgtttg gatcggngga aggttaaggt 300 tgtantaant tatgattttg ttatatcgta ttttagtttg ggttatagag tgagattttg 360 ttttaaaaat aaaataataa taataaataa ttttatattt tttaaatgtg tttaataatt 420 agatttttta ggttagtaga ttttaattag ggaatatttg gtaatattaa gagatatttt 480 tagttgttat aattagaggg gaggagtcgt ggtattattg gggtttagta agtagaggtt 540 agggatattg ttaagtattt tataatgtat aggataatgt ttttattttt atttcgtaat 600 aaagaattat ttagtttaaa atgttagtgg tgttaaggtt gaganaattt tattttangt 660 tatttggttt tgatttttgt ttttaggtat gtggtttgtt tttaaaaata ttatttatta 720 aggaaatatt tttttttttt tttttttgag atggagtttt gttttgttgt ttaggttgga 780 gtgtaatggt acgattttgg tttattgtaa ttttcgtttt ttaggtttaa gtgatttttt 840 tgttttagtt ttttgaatag ttaggattat aggagtatgt tgttatattc ggttaatttt 900 ttgtattttt attggagata gggttttatt atgtcggtta ggttggtttc gaatttttga 960 ttttaagtga tttatttatt ttggtttttt aaagtgttgg gattataggc gtgagttatc 1020 gtgttcggtt attgatgaaa tttttcgaat gaaaagnatt ttttggtttt tattttttga 1080 attatattgt tanggaagtt tttttttttg tttagtttta attttttttt tttttagttg 1140 aagagtattt ttcgttgttt agttatattt ttttaaaaat agagagatga ggggtttggt 1200 tttcggttaa gttttaattt tgtttgaata gagatttagt ttttttgttg ttttgatgtt 1260 gtgatatttt attttttttc gttgtttgtt tttttnttgt gtgtacgtat gtgttttgtg 1320 tgtttttttt tattttttag gtttttaggt tttgatttgg tttttttgat tttttgtttt 1380 gataagaata aagtttattt taattcgatt ggtttagttt tttgtttcgt taatttgatg 1440 aagttttttt ttttcggtat gggttttatt tttcgtaatt gttttttaaa ttcgggattt 1500 tttttttttt cggttagttt taggttatta tttcggaagg attcggaagt ttttaaggtt 1560 tttttattgt tattcgagtt atggtagcgt attttattat tagaagagtt tgtgtttttt 1620 tagagttttt tgnatggtnt tgagggtttt atttttgttt tattttatta tagagattag 1680 tgttttnggn tggtaggttt ttttttaggt tttttgagat ggggntatng gannggggtt 1740 tttttttttc ggttttcgag tatttttttt tatttattgt gttaaagttt tgggtttttt 1800 ttttgatggg tatcggtttt tttgaacgtg atgggatttg ttttttttat tagtagttgg 1860 gtagtttata atttatattt gtgtatttgt tatatttttt atttggtgga aaatatttag 1920 aaggttttga gttttttatt tttgggtgtt agtttaaatg attgtatagg aggtntttta 1980 tttttgttat agagtaagtt ggttatgaac gaaggagaga agacgttata gatttttttt 2040 tttttttttt aggagattat aagatagatt ttnttatttt tttagtttta tttttatgtt 2100 ttttttttat tggaggagtt gattaaagta gttttaacgg gttataatat ttgattaatt 2160 tagttgttgg tagagggagg aaataagtgt ttttttaagt ggtattttta tttcgttttt 2220 attttgatta aagattgttt taagtagtag tttagttcgt ttagttttag gtgggtagtg 2280 gggnaggaga gttggtattt ttttaggtgg taaatggcga ttttatattt ttcgttcgtt 2340 ttagggttgg atggattaga aaaatgttta ttttttttgt atcgatgtag agattttatt 2400 tttttttaaa gatattattt ttgtagttgt ttgaagtttg tatatttttt ngtattgtag 2460 agtttatata aaattgaaga atgttaatgt tcgagttttt ttattttgtg tttagaggtt 2520 gttttttgta gattttggtg ttaatagatt aaataaataa ataaatattt ttagtagttt 2580 gaagttttgt taaatatttg gggaaggagg agtggggtag agattaaggg tatatattga 2640 ttattttatt tttgttttta agagaaggag ttttaatttt tatatttggg tgttgttatg 2700 gttgtatata gagtttttgt tttttggata ttatgtttgt atattttata tggatatata 2760 aataatagat ttatgaaaag gttgtttaga atgaagangg gtggtttgtt ttagaggtgg 2820 ggtgagggag tntattgggg aagttattta tttttgtatg agtttgaaaa agttttttaa 2880 ggagaatgga ttttagaaag gaaaagtagg tgattaaggg aagatagttt gatattgntg 2940 ggtgtttttt gtattggttg gattttttga tagttttggg gaagttttgg tttattttag 3000 ggagtattta taatatagtg tgtagtttta aagggaataa agaaattata taaagatatt 3060 atttttattt tttcgtagtt tttataatgt tgtatttgta agagttttta ggtttttggg 3120 gaaaatggga ataattattt taatatttta atgatgtttt ggaattttcg aagtattttt 3180 ataaaangat atatntttta ttgtatgggt gaatagttga ttattttaag ggtagttata 3240 ataagtataa ttgtatttgt tttataagat ttgataataa atttttaaat taggttattt 3300 taattattat ttattgggtt ggtaagaatt agttattatg ttaagtgttt tatataaagt 3360 gttattgaaa tatgataatt atttagtaag agaaatatgg taagttttat tgtataatta 3420 ggaaaggata aatagatcga ataatttttt ttaaaagata tagatatgaa gtgggagagt 3480 taggattgga aatttgatta tttgaattta gtgtttatgt ttttaattat agcgtttttt 3540 tgtttgttat tatattttta ttaattttac gtgaggaaat tcgatttagg ataagcgaat 3600 tgtttgaggt tttagttggt aaagaagtag agttggtagg tttttttttt tagttatttg 3660 gtgttttggt atcgcgggtt gagttagtag agtaagttag tgagtaagag agtaaatgta 3720 tnggggtttt tttatgttat taatatcgag gagatagtgg gttggggata ttttattttt 3780 tattttttat tttttttttt aaaagatttt tggttttttc gtaaagtttt attgagttag 3840 gttcggagcg atgggntgtg gtgttgttta gtattttttt tttttgtttg aggttgtgtt 3900 aaaagagtag gttgttagaa gaggagtttc gatttagaga gtagtttaga gtttattagg 3960 tggtncggag atttgggttn naattaagnt agggggttgg aggtagtagt aggaagattt 4020 gaggttagtt ttgttttggt aattcgtgtt agtaagtgaa gatttaatat ttgtatgagg 4080 aagggattta acgaggagtt tattaatggg aaatatttag gagcgcggtc gaagggtttg 4140 cgttattgtt ggtgagttgt taagatttgg aagaaaattg attttagtaa gtttttattt 4200 ttatttttcg atgtgaggaa ataagattag ggttgataaa tagtgatgat taataatatt 4260 ttaagtttgt atagtatatt ttatagttta taaaatattt ttatttgatt tttataatag 4320 ttaagaggcg ataaggtggt tattattaat tatttttagt ttttagattt ggaaaatttt 4380 ggtttagaat ttgggtgata cgggtaggtt atttcgtttt taagtgatta agtcgagatt 4440 tattgtgtcg tttttttttt tggaagttta gtgatgtgtt taggtaatga gtaggtaaag 4500 tcgttgacgt tgggtagtag ttagacggcg ttgaagtttt agtaaggaat ttggtattag 4560 gatttagtag aagtttggtc gttcgtcgcg gaaaagatta ttggatttgt tttgtcgatt 4620 atattttttt tcgtttcgtt tatttgttcg ttttcgtata gcgtagttaa ttggtggttt 4680 ttatattttt atacgttatt attttacgtt taggtggttt taggatattt tgtggtgttt 4740 tgggtcgtag ttgtttttag agttgtttga ttggaaaaat ttttagggcg agggattagt 4800 ttcgaggttg tcggtttttt tggtttttag ggatggagtt aaggttttan gggcgggttt 4860 ttttttttag gaagtggttg ttgggttttn gaggagtttt ttttttggta gttatgagtc 4920 ggtagttttg gtagtgattg ttgggttttg ttggatagcg gtcgtatgta gtttttatga 4980 ggtttttgtc gtcggtcggc gatgttcggt tggagttgtc gttttcgtcg tcgttgttgt 5040 cggtgtcggt tgtgagcggg tttttagtcg gtttttttgg gcgttttatg gtttttagta 5100 gttttttggt gttcgatcgg ttgcgtttgt cgttttgttt tttgggtgtt tttgtttgtt 5160 atttttatta tgggattttg taggaaaaga tgtgagcgat ttcgggggcg ggtcgatagt 5220 ttttttttag tttgtgatag ggatttcggg ttnttttgtt tttggattcg ggtttttttt 5280 ttgttttttt gttcggttgt cgttttttta gtattttatt atttttgtag ttatggttga 5340 gtttatttag aattttagaa ttttanggan ttattttttg gatttttcgg atttggttat 5400 tttttttttt tagttgtttt ttttcgtttg gttttaaggg tttgcgtttt ataggttgag 5460 atttttattt tttaaatagg attcgagtcg gttttttttt ggtattttta gatgtttgta 5520 aataatttat tcgttttcgg ttttggtgtt atagtcgaaa tatcgttttt ttttgtttgg 5580 ggtatttgat tttattattt cgttttgtat gttttttttt cgtttttttt ngggtatttt 5640 ttttttaggt tttggaatta gtaggttggg atgtttagtt tttagattta gtaaaattag 5700 ttttttttgt aaatgagttt agtggttttt aataaatttt gtttatattt agagaggtaa 5760 gataatttta aagtttttag tggttcggga tatattagat gatagtgagt gaaatatatt 5820 aatttttttt ttttttttta tgtattttat ttttaga 5857 42 5857 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 42 tttagaaatg aaatgtatga gaaaagaggg agaaattagt gtattttatt tattgttatt 60 taatatattt cgagttattg aaaattttaa aattattttg tttttttgga tgtaggtaga 120 gtttgttaag gattattagg tttatttgta aaaggggttg attttattgg atttagaaat 180 tagatatttt agtttattga ttttaaagtt taagaaaaga atatttngaa aaagacggag 240 aggaaatatg tagaacgaga tagtgaaatt aggtatttta ggtaggagga gacggtattt 300 cggttatggt attaaggtcg aggacgaata ggttgtttgt aagtatttgg gagtattaaa 360 agggggtcga ttcgggtttt gtttgaggaa tagaagtttt agtttgtaaa acgtaggttt 420 ttagaattaa gcggggaaaa atagttaaga aaagaaaata attaagttcg aagaatttag 480 aaaataantt tntggagttt tggaattttg ggtaggttta gttatagttg taaaagtagt 540 agggtgttaa gagggcgata gtcgggtagg aggataagag gaaagttcgg gtttagaggt 600 agaanggttc gggatttttg ttataggttg gggagagatt gtcggttcgt tttcggggtc 660 gtttatattt ttttttgtag gattttatag taaaaatagt agataaagat atttaggaag 720 tagagcggta ggcgtagtcg gtcgggtatt agggagttgt tagaggttat gagacgttta 780 gaggagtcga ttggagattc gtttataatc ggtatcggta gtagcggcgg cggaggcgat 840 agttttagtc ggatatcgtc gatcggcggt aggggtttta taggagttgt atgcgatcgt 900 tgtttagtag ggtttagtag ttattattag aattgtcggt ttatggttgt taagggggaa 960 attttttnag aatttagtaa ttatttttta ggaaagaaaa ttcgtttntg ggattttggt 1020 tttatttttg agggttaggg gaatcggtag tttcgagatt gatttttcgt tttggagatt 1080 tttttaatta ggtaattttg aggataattg cgatttagag tattataggg tgttttagag 1140 ttatttgggc gtagaataat gacgtataag gatgtggagg ttattaattg gttgcgttgt 1200 gcgaagacgg ataggtaggc ggggcgggag gaggtgtggt cggtagagta aatttaatag 1260 tttttttcgc ggcgggcggt taggtttttg ttgggtttta atgttaaatt ttttattgga 1320 gttttagcgt cgtttagttg ttgtttagcg ttagcgattt tatttgttta ttatttaggt 1380 atattattag gtttttaagg gggagagcgg tatagtaagt ttcggtttgg ttatttaaag 1440 gcggggtaat ttattcgtgt tatttaagtt ttgagttaga gttttttagg tttggaaatt 1500 agggataatt agtaatagtt attttgtcgt tttttggttg ttgtgaggat taaataagag 1560 tgttttgtaa attgtaaagt atgttgtgta agtttaaggt attattagtt attattgttt 1620 gttagttttg attttatttt tttatatcga ggggtggaaa tggaagttta ttgaagttag 1680 ttttttttta agttttaata atttattaat aatggcgtaa atttttcggt cgcgtttttg 1740 aatatttttt attaatgagt ttttcgttgg attttttttt tatgtaagtg ttgggttttt 1800 atttgttggt acgaattgtt agggtaagat tgattttagg tttttttatt attattttta 1860 attttttant ttaattnngg tttaaatttt cgngttattt ggtggatttt gggttgtttt 1920 ttaggtcgag gttttttttt tagtagtttg tttttttggt atagttttag gtaaaggaag 1980 gaaatattgg gtagtattat antttatcgt ttcgggtttg atttaataag gttttgcggg 2040 ggagttagaa gttttttaga gggaggagta agggatagaa gatagggtgt ttttagttta 2100 ttgttttttc gatattagtg gtatgggaaa gttttnatat atttgttttt ttgtttatta 2160 gtttatttta ttggtttagt tcgcgatgtt agggtattaa atagttggga agagagattt 2220 gttagtttta tttttttatt agttgggatt ttaaataatt cgtttgtttt gagtcgagtt 2280 tttttacgtg aaattaatgg gaatataata ataagtagga gagcgttgtg gttagaaata 2340 tgggtattgg atttaaatga ttaggttttt aattttagtt tttttatttt atatttgtgt 2400 tttttgggga aagttattcg atttatttgt ttttttttga ttatatagtg ggatttatta 2460 tatttttttt attgggtggt tgttatattt taataatatt ttatgtaaag tatttaatat 2520 ggtagttggt ttttattagt ttaatgaatg gtggttggga tagtttggtt taggagtttg 2580 ttgttaggtt ttatgaggta gatataattg tatttattat gattgttttt ggggtagtta 2640 attgtttatt tatataatgg ggnatgtgtt nttttgtgaa aatgtttcgg aaattttaaa 2700 gtattattga aatattgaga tggttatttt tatttttttt aaaagtttaa gagtttttat 2760 aggtgtagta ttataaaggt tgcgaaagga taagagtagt gtttttgtat agtttttttg 2820 ttttttttaa ggttgtatat tatgttgtgg gtattttttg agatgaatta aagttttttt 2880 aaaattgtta agagatttaa ttagtgtaaa gaatatttan taatgttaaa ttgttttttt 2940 ttggttattt gttttttttt tttgaaattt atttttttta gggagttttt ttagatttat 3000 ataagaatgg gtaatttttt tagtgnattt ttttatttta tttttaggat aaattatttn 3060 tttttatttt ggatagtttt tttatgggtt tgttgtttat atgtttatgt aaagtatgta 3120 agtatggtgt ttagaggata ggaattttgt gtatagttat aataatattt agatgtggga 3180 attgaggttt ttttttttga agataaagat gaaatgatta gtatatattt ttaattttta 3240 ttttattttt ttttttttaa atatttaata gaattttaag ttgttgggaa tatttattta 3300 tttatttggt ttattaatat taagatttgt aaaaaataat ttttaaatat aagataagaa 3360 aattcgaata ttaatatttt ttaattttgt gtaagttttg tagtatngga aaatatataa 3420 attttaaata gttgtaaaaa tagtgttttt gggagaaaat agagttttta tatcgatata 3480 agaaaaatag gtattttttt aatttattta gttttggggc gggcggagag tatagagtcg 3540 ttatttgtta tttggaggaa tgttagtttt tttnttttat tatttatttg gggttgggcg 3600 ggttgggttg ttatttaaga taatttttag ttagggtgaa agcgagatga aaatgttatt 3660 tgggaaaata tttgtttttt ttttttgtta gtagttgaat tggttaagtg ttatggttcg 3720 ttagggttgt tttggttagt ttttttaatg agagggaggt atgggaatag ggttgagagg 3780 atggngggat ttattttatg gttttttgga ggagagggaa ggaaatttgt ggcgtttttt 3840 ttttttcgtt tatggttagt ttgttttgtg ataaaaataa ggngtttttt atatagttat 3900 ttggattgat atttaggggt gggggattta agattttttg ggtgtttttt attaagtgag 3960 ggatgtggta ggtatatagg tgtgaattgt gagttgttta gttattagtg gagaaggtag 4020 gttttattac gtttagaggg gtcggtgttt attaaaaaga ggatttaggg ttttgatata 4080 gtaagtgaaa gaaagtgttc gaaggtcgag agggaagggt tttnntttna tanttttatt 4140 ttaggggatt tggggaggga tttgttantt naaggtattg gtttttatgg taaagtgggg 4200 taggggtggg atttttagna ttatntaggg agttttggaa aagtataggt ttttttgatg 4260 gtggggtgcg ttgttatggt tcgaatggta gtggggaggt tttggaggtt ttcggatttt 4320 ttcgaggtgg tggtttgggg ttggtcgggg gaaggggaga tttcgggttt gaggggtagt 4380 tacggaagat gaagtttatg tcggggaaga ggggttttat taggttgacg gggtagaagg 4440 ttgagttagt cgggttgaaa tggattttgt ttttgttagg ataggaagtt aggaaggtta 4500 ggttaggatt tggagatttg gaggatgaag agagatatat aagatatata cgtatatata 4560 gnagagaaat agatagcgag agagggtgag atgttatagt attaaggtag taggagagtt 4620 gggtttttgt ttaaatagaa ttggaatttg atcgaaaatt aagtttttta tttttttatt 4680 tttaaaaaaa tatggttaaa taacgggaaa tgttttttag ttaaaaaaag gagggattga 4740 agttagatag gaaggagaat ttttntgata atgtgattta agaagtggag attaagaaat 4800 nttttttatt cgaaagattt tattagtggt cgggtacggt ggtttacgtt tataatttta 4860 gtattttgga aggttaaggt ggatggatta tttgaggtta ggagttcgag attagtttgg 4920 tcgatatggt gaaattttgt ttttagtaaa aatataaaaa attagtcggg tgtggtagta 4980 tgtttttgta attttagtta tttagaaggt tgaggtagga gaattatttg aatttgggag 5040 gcggaggttg tagtaagtta agatcgtgtt attgtatttt agtttgggta atagagtaag 5100 attttatttt aaaaagaaaa gaaaagaaat atttttttag tgaatggtgt ttttggggat 5160 agattatatg tttgaaagta gagattaaag ttaagtgatn taaagtgggg ttnttttagt 5220 tttggtatta ttgatatttt gggttggatg attttttgtt gcggggtggg gatggaggta 5280 ttgttttgtg tattgtaaga tgtttaatag tgtttttggt ttttatttat tagattttag 5340 tagtattacg attttttttt tttagttgtg ataattaaaa atgttttttg atattgttaa 5400 atgtttttta gttgaaattt attggtttaa agaatttaat tgttgggtat atttgaaagg 5460 tatggggttg tttattgttg ttgttttgtt tttgagatag agttttattt tgtggtttag 5520 gttggagtgc ggtgtggtag gattatggnt tantgtagtt ttgatttttt ntcggtttaa 5580 gtaatttttt tattttattt ttttgagtag ttgggattat aggtatgaat tattatgttt 5640 agttaattgt tttattttta ttttgtagag aaggggtttt tgtatgttat ttaggttggt 5700 ttttagaaag gtgtgatttt taaaattttg agaggaaagg atggtaataa ttgtgnagaa 5760 aggtagttag attttatcgg aagatttggg ttttaattta ttatgtggtt tttgttatat 5820 ttgttttatt ttttttttta attttaattt tttaatt 5857 43 8238 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 43 aatagtaaat atttttaaaa gatatttttt ttttaaagta gttgttttaa tatgtattat 60 ttttatagcg tgtttttatt atagttattt gtgtgtatat tttatgtttt ttagtgagtt 120 tttgaggatt ttttaaattt taaatattta taaatagtga tgaatgtacg aatttggatg 180 tgtgtggagg atgtgttgta gttgatttcg gttttttttt agtagtaaaa ttagttgttt 240 gttaatgatg tatttggttt gaattttagt tagaatattg attacgttaa agagattttt 300 gttggtagaa tttttttttt ttttttttaa aggtttgtat ttgtgaatgg ttattttagg 360 aaaagtaaat atttgttaaa atagtaagaa taaatttatt ttttaagttg aatattttaa 420 gtggtttttg gataatttta cgtcgattat ttttttagag taagaaaata gtttttaaga 480 gtataggtta aattaatttt aaaatgtagt tttttgtgga aattttattg taggtatgtt 540 ttaatgtaga tggatgggtt agatggaggg agtaatggta gtttgaagga ttttgttaat 600 tacgtggata aaatttttag tgttagaatt ttagtttgtt aagagtaatt tgtttttatt 660 tttaggattt gagtatgggc gttaggtaga tgtatgatag ttgtttggaa tatattattt 720 tgatttttga aggttattag atttaatgaa gtaaattttt gatgaagaga tgagttattt 780 tagatgaggt tagagagtga atattttttt ttagagttag atttaatttg gttagggata 840 ggtgatttta tggttttgat tatttgttat tttgattttt ttaggagttt taagtaagat 900 tgattttttt atttgataaa ggtttatagg atgtttaatt tgggttaggt tttaggaatg 960 taaagtgaat tttattgttt tttaaaggag tttagagtat agatttatag gtataaaaat 1020 aagtggtttg tagtgttagg attcgttata agtttgtata gtttttggga gtttttagga 1080 gggatttaaa tagtaaattt tataggggag ggtgaaaaaa agttaatatg gatgttaatt 1140 atgtatagaa aaaataatta aatgttaatg gttattatgt aagtgtaaaa ttgttggtaa 1200 tttttttgtt tgtgtttttt aattttttat taattgaaaa atggtgtgtg tgtgtttttt 1260 taaatagttt taaaaataaa ttatggtatt gttgattttg atattttaga aattggttag 1320 ttttaagggt aaaagggaat tgagtggtta ttttgtgttg gatttggtat agtaatatta 1380 atttatttta tttttagtga tattttaatt tttttttata aatggggaga ttgaagttta 1440 gaaagattga tagaattatt tagagttatt ttttagaatt atagatagaa tttaaaattt 1500 cggtttttaa attcgggatt tttcgtttga ttttttcggt tttgaaattt ttttggaaga 1560 ggttgttatt gatgttggtt atttttaagt ttattttaat tttgttttaa gattttttat 1620 atagtgttaa gtatagtaat ttgaatatag aaggtttttt aatagaaatg cgtttatagg 1680 attttgatat attatggttt atttagtttt tgattttttt tagttgaatt aaatatttag 1740 attttatttt aaaaatttta agaatagttg atttaggggt gtgtgtttgt agttttattt 1800 ttttttgagg ttgaggtaga aggatttttt gagtttaggt gttcgaggtt aatttgggta 1860 atatagttga gattttattt gtaagtgaaa agaaataaaa attttaagaa tgagtattag 1920 taatgttttg aatgatatta ttttgttttt agttattttt taataaaatt gtttaaattt 1980 aataggtaaa tgaatttttt attttatttt tgttggaaat tagttgtgta gataattttt 2040 atataaaata agaatgttga atttagataa tttttgatat tttttttttt tttttttttt 2100 tttttttttt ttttttagcg atatagtttc gttttgtagt ttaggttgga gtgttggtgg 2160 tatagatcgt ggtttattgt agtttagaat ttagggttta agagattttt ttattttagt 2220 tttagttttt taagtattag atattatagg tacgtatcgt tatatttggt taatatttat 2280 attttttata gagatggggt ttttttatgt tgtttaggtt gatttttaat ttttgggttt 2340 aagtgatttg ttttggtttt ttaaagcgtt gggattatag gcgtgagtta ttttgtttgg 2400 ttttagaaag ttgttacggt ttagagtatt attaagtatt gtttgagtgt tttattgtta 2460 atttgatagg taaaaattaa tgttttaatt ttttagttga ttaaataatt tatttatatt 2520 gagtaaagta taaagagttt aagaaagaaa ttatatatga gtgttttaga tttagtagta 2580 gtattttggg gaagttatat atagtatagt tagatatttt tgttagtagt tatttttagt 2640 tggatgattt ttatattatt tttgttttga ttgttggtat ttattttttt gagataaagt 2700 ttgatgaaag ttatggattt tttttttgga aaaatatacg tttgtatgta attttgtatt 2760 ttattttagg agattttgga ttttttgtag attgtttttg gattttgggt taaaaatttg 2820 tattttagat tgaatcgtgg gaagaaaaaa tagttagtga gtttttggta aatcggagta 2880 ttggattttg tttagtaatt gtaaattttt gaatatattg gatttattgg gtagtgttaa 2940 gtttaaaggg aagtaagtta aattttaagt attatgtttt gttaatttgg tagttcgaat 3000 taagagtggt tgtgagatta tatatggttt gatttgttat tggtagattt ttgttgaaat 3060 atgaattaat tagtttttta gaaagtaagt atagatggaa taagtatgtt tagtttttgg 3120 taattttttt ttaattatga atttattttt aagttttttt tttttttttt tttttagagg 3180 tgatttttat gtatatgttt taattttttt ttaattatta gtttttttta tagtttagtt 3240 tttattttat ggtttattag gatgtttaat ggtaaattgg gtataaagag gtgtgtgaag 3300 ttttgtggag gggttagttt tagggttggg ggtgattggg gagagtagtt atggttttga 3360 tttatgtgat ggggcggtag ggtaaatatt agtttgttta gtgatgttta gattttaata 3420 tttatataag taacggattg tagtttgtag tttgattttt tttagttttt tagttatttt 3480 ttgttaataa tagttttttc gtttgtttgt ttgttttttg agacggagtt ttatttttgt 3540 tgtttaggtt ggagtgtaat gcgtagtttt ggtttattgt agtttcgttt ttttaagttt 3600 aagcgatttt tttgttttag ttttttgagt cgttgggatt ataggtatgt attattacgt 3660 ttggttaatt ttgtattttt agtagagacg gggttttttt atgttggtta ggttggtttc 3720 gaattttcga tttaggtgat cgtttgtttt tgttatttaa agtgttggga ttataggtat 3780 gagttatcgt atttggttaa taatattttt tatgttataa ttttttagga taagttttgt 3840 agaaataatt attttagtag aatagattgt tttgtttggg aattttatat atgtgtgtgt 3900 gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtatgt atttatgtat gtatgtatat 3960 gttggtttaa tttaatttgt tgtgaatatt ttaaagttat tataagttaa tatttttttt 4020 ttagtttttt tgttttttat ttttgtttat gataaatttg atttatagaa gttttagata 4080 tttgtggtta aataaaagat tttaggttgg gtatagtggt ttatattttt aattcgaaaa 4140 ttttgggagg tcgtggtggg tagattgttt gagtttagag ggatggatag tttttttgtt 4200 ttttgtttta tgtttagttt ttggtagttt tttttgattt ggtttttttg tttttggttt 4260 ttgttttata gttgtagttg ttttatagta ttgtgtttga tggtattgga ttgtggtagg 4320 tgtttaataa atatttagtg tttagtaggt atttagttaa tatatagtgt attagttttg 4380 gaaagagttt tatttttatt gattggttgg ttgattgatt gtttgattga tagggtatta 4440 ttttgttgtt taggttggtt ttaaattttt gggtttaagt gattttttcg ttttagtttt 4500 ttgagtagtt gggggttata ggtataaatt attatatttg atttaagatt tttatttttt 4560 tttttttttt tatagagatt atgttgttta ggttggtttt taatttttcg gtttaagcga 4620 tttttttatt ttggtttttt aaggtgttgg aattatagat gtgagttatt acgtttggtt 4680 attttttttt ttttgagatt gggttttttt ttgtttttta ggttggagta tagtggtata 4740 attttagttt attgtagttt taattttcgg gtttaagtaa tttttttatt ttagtttttt 4800 gagtagttgg gattgtagat gtatattatt atatttagtt aattttttaa ttttttttag 4860 tgatggagtt ttgttttgtt gtttaggttg gttttaaatt tttgggttta cgtgattttt 4920 tggttttagt tttttaaagt gttgagatta taggtataag ttaaggattt ttatttttaa 4980 tgtatttttt tttttttgga tagatttgtg gtttttttat ttgaaggata taatgttttt 5040 taaattagta tatttgtaga ggtttgttgt atttagtcgc ggagtttatt ttttagtggt 5100 ttttgttata tttgttgtaa ttaaaaaaat agtttaaggt tttttaattt ttgatgatat 5160 ttttgaaagg gaatataagt atggtgtata taattattat tttttatttg tagttttgga 5220 gagaggaaaa ggtacgtttt aaattaattc gttttttttt tttttttgaa attttttata 5280 aaaaaaaatt gtttttatat ttttataata tatatttttt tagatgtgtt taatgtgtat 5340 attgtagata tggttaattt tttttttttt tttttttttt ttttttgaga cggagtttta 5400 ttttgttatt taggttggag tatagtggta taattttagt ttattgtaat ttttgttttt 5460 taggtttaag cgattttttt gttttagttt tttgagtagt tgggattata ggcgtgcgtt 5520 attatattta gttaattttt gtatttttag tagagatggg gttttattat gttggttagg 5580 ttggttttag atttttgatt ttgtgatttt tttattttgg ttttttaaag tgttgggatt 5640 ataggtgtga gttattacgt ttggttagtt aatttattta ttgagtgttt agtgttgttg 5700 tgttaggtgt tatggaggtt ttaaagagga attattgttt ttgttatgta gattttatta 5760 agagggaatg taagagaaat aaggaaagta ttattatatt gttgttattt ttttttttta 5820 atttttattt tggtatagtt ttagatttaa gaaaagttgt aataaatagt attgatattt 5880 tttttttata ttttttttag attttttaag tgttaatttt ttgttgtttt ggttttagtg 5940 tgtttatttt tttttttttt tttttcgtcg tttgtatatt ttatattgtt ttttgaattg 6000 ttttgagagg aagttgtaga tatgatattt tttttttttt tttttttttt tttttttttt 6060 ttgagacgga atgttgtttt gttatttagg ttggagtgta atggtgggat ttcggtttat 6120 tgtaattttt atttttcggt tttaagtgat ttttttgttt tagtttttcg aggagttggg 6180 attataggtt tacgttatta cgtttagtta atttttgtat ttttagtaga gatagggttt 6240 tattatgttg gtcgggttgg tttcgaattt ttgattttag gtgatttatt tattttagtt 6300 ttttaaagtg ttggattata ggcgtgagtt atcgcgtttc gttatatgat atttttttat 6360 ttataaatat ttagtgtgtt tttttaaaaa cgtaatgatt ttttgagata gggttttatt 6420 ttgttgttta ggttggagtt tagtggtgtg attatggttt attgtagttt ggaattttcg 6480 gttttaggtg atttttttat tttagttttt taagtagttg ggattatagg tgtgttttat 6540 tatgtttggt ttattttttg tagagattag attttgttat gttgtttagg gtgattttga 6600 atttttggtt ttaagtgatt ttattattta gttttttata gtgttgggat tgtaggtgtg 6660 agttattgtg tttagttgat tttttttttt ataattatag agtaattgta aaaattaaga 6720 atttaatatt ggtatagtat tattagttta gagatttaat ttagatgtta tttgtttttt 6780 tttataataa aagaaaaatt ttcgatgagt tgtatttagt tgttatgttt agtttttttt 6840 aatttagaat agttttttaa tttttggttg ttttggtttt tttttttttt gtattaagta 6900 ttttgtgggg atagagtgta aaattttgta aatatttagt tatttatgaa tttttattta 6960 taattttagt atttattaat gatttttgtt tgaataaatg attacggtgg tagttgttaa 7020 atggtgattt aatttataat ttggaataaa taatagtttt aattaaataa aattaaagtt 7080 tattatttag ttttgtatta gaaaatgata atataagagt attatatatt ttggttattt 7140 gtttgtattt tatttggtat tagtattgta gatatatttt tttttgaatt attgaaaatt 7200 tgttttatat tatatgatat ggtaattttg tttttatttt tttattagta atgtatgaga 7260 gtgttaattt ttttagattt ttgttaaaag ttgttttttt aattataatt attttaggga 7320 gtatgagatg gtattttatt gtggttttaa tttgtatttt tttaatgatt agtgatgttg 7380 aatatttttt tatgtgtttt ttgttatttg tatatttttt ttgaagaaat agttatttaa 7440 gttttttttt attttttaaa ttgggttgtt tgtttttttg aaattgagtt gtaagaattt 7500 tggatattag atttttatta gatatatgat ttataaatat ttttttttta ttttaagggt 7560 tattatagtt tattttttat gatttttgtt tgttatgtgt aatttttgtt tttttatttt 7620 taaattttat ttattttatt ttattttttt tataggtagg attttgtttt ggtgtttagg 7680 ttggagtgta gtggtataat tttaatttat tgtatttttt attttttagg tttaagtaat 7740 ttttttattt tagtttttgt aacgggatta tacgcgcgta ttattatgtt tagtattttt 7800 ttgtagcgtt agggattttg tcgtgttgtt taggttgatt tggaattttt gggtttaagt 7860 aatttttgtt ttggtttttt aaagtgttag gattataggc gtgagttacg gttttttgtt 7920 taatttttgt ttttaaattt taattttgga ttttaaattt tagaattagg taaaggtttt 7980 attttagagt ttataatttt tttgtgttat ttttgttaaa tgtgtgtttt gaagttgggt 8040 agataaaata taatttttag taatttttta taaattaaag tttattatgt ttgagttaaa 8100 ataagtttta attataaata tgtattaaat agaggtttat atataggtat ttagagggtt 8160 tgttagtatt tttaattttt ggattttatg tcgtatagta attgtttaaa attatttttt 8220 ttttttatgt attttagg 8238 44 8238 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 44 tttaaaatat ataagaaagg aaaataattt tagataatta ttatacggta taaagtttaa 60 aaattaagag tgttagtaag ttttttgaat gtttatatat gaatttttat ttaatatata 120 tttgtagtta aagtttgttt tagtttaggt ataataaatt ttggtttgta aggaattatt 180 aagaattgta ttttatttgt ttagttttaa aatatatatt taataaaaat aatataaaaa 240 ggttataaat tttggagtaa aatttttatt taattttaag atttaggatt taaaattaga 300 atttaaaagt agaagttagg tagggagtcg tggtttacgt ttgtaatttt agtattttgg 360 gagattaagg tagggattgt ttgagtttag gagttttaga ttagtttgga taatacggta 420 aaatttttga cgttatagaa aaatgttggg tatggtagtg cgcgcgtatg gtttcgttat 480 agaggttgag gtgggaggat tgtttgagtt tgggaggtag aggatgtagt gagttgagat 540 tgtgttattg tattttagtt tgggtattag agtaaaattt tgtttataaa aaaaataaaa 600 taaaataaat aaaatttaaa aataaaaaag tagaagttat atataataga taaaaattat 660 gagaagtaga ttgtaataat ttttaggatg gaaaaaaaat atttgtaaat tatgtgtttg 720 ataaggattt aatatttaga atttttataa tttaatttta aaaggataaa taatttaatt 780 taaaaaatgg ggaaagattt gaatagttat ttttttaaag aggatatata aatggtaaga 840 aatatatgaa aagatgttta atattattaa ttattaggaa aatgtaagtt aaaattataa 900 tgagatatta ttttatattt tttgggatgg ttataattaa aaaaataatt tttgataagg 960 atttgaagaa attggtattt ttatatattg ttagtgggaa agtaaaaata aggttgttat 1020 gttatgtaat atgaaataga tttttaatag tttaaaagaa gatatgttta tagtattggt 1080 attaaataaa atataagtaa atgattaaaa tgtgtgatat ttttatattg ttattttttg 1140 gtataaagtt aagtaataaa ttttggtttt atttggttaa ggttgttatt tattttaaat 1200 tatagattaa attattattt ggtaattatt atcgtaatta tttatttagg taagaattat 1260 tagtggatgt tgaaattgtg agtaaaagtt tatgagtaat tggatattta tagagtttta 1320 tattttgttt ttataagata tttaatataa agggaaagaa gattaagata attaaggatt 1380 gaggaattgt tttgggttaa agaagattaa atatgataat tgaatgtaat ttatcggagg 1440 tttttttttt gttataaaag agaataaatg atatttggat taggttttta gattaatggt 1500 gttgtattag tgttaagttt ttgattttta taattatttt atggttataa aagagaaagt 1560 tagttgggta tagtagttta tatttgtaat tttagtattg tgggaggttg agtggtagga 1620 ttatttgaga ttaggagttt aagattattt tgggtaatat agtaaaattt aatttttata 1680 aaaaataagt taggtatggt aaggtatatt tgtagtttta gttatttggg aagttgaggt 1740 gggaaaatta tttgaagtcg ggagttttag gttgtagtga gttatgatta tattattgaa 1800 ttttagtttg ggtaatagaa tgagatttta ttttaaaaag ttattgcgtt tttggaaaga 1860 tatattaagt atttatgggt aaagagatgt tatgtggcgg ggcgcggtgg tttacgtttg 1920 taatttagta ttttgggagg ttgaggtggg tggattattt gaggttagga gttcgagatt 1980 agttcggtta atatgatgaa attttgtttt tattaaaaat ataaaaatta gttggacgtg 2040 gtggcgtggg tttgtagttt tagtttttcg ggaggttgag gtaagagaat tatttgaaat 2100 cgagaggtag aggttgtagt gagtcgagat tttattattg tattttagtt tgggtgataa 2160 agtaatattt cgttttaaaa aaaaaaaaaa aaaaaaaaaa aaaagaagag atgttatgtt 2220 tgtaattttt ttttaaaata gtttagaaaa taatgtagaa tatgtaggcg gcggggggag 2280 aagagaaggg agtgaatata ttaagattaa agtagtaaaa agttagtatt tggaaaattt 2340 gggagaagta taaaaggaaa atgttagtat tatttgttat aatttttttt aagtttaaaa 2400 ttatgttaaa ataaaagtta aaagaaaaaa atgatagtaa tatgatagta ttttttttat 2460 tttttttgta tttttttttg gtaaggttta tatgataaag ataatggttt ttttttgaag 2520 tttttatagt atttaatata gtagtattag atatttaata aatgaattaa ttggttaggc 2580 gtggtggttt atatttgtaa ttttagtatt ttgggaggtt aaggtgggag gattataaag 2640 ttaggagttt gagattagtt tggttaatat ggtgaaattt tatttttatt aaaaatataa 2700 aaattagttg ggtgtggtgg cgtacgtttg tagttttagt tatttaggag gttgaggtag 2760 aagaatcgtt tgaatttggg aggtagaggt tgtagtgagt tgggattgtg ttattgtatt 2820 ttagtttggg tgatagagtg agatttcgtt ttaaaaaaaa aaaaaaaaag aagaagaaga 2880 attaattatg tttgtaatat atatattaaa tatatttaga aaaatgtata ttgtgaaaat 2940 atggaagtaa ttttttttta taaaaggttt taagaaaagg gaaaagacgg attaatttga 3000 aacgtatttt tttttttttt tagggttata ggtaaaggat ggtagttgtg tgtattatat 3060 ttatattttt ttttaaaaat gttattagag gttggagggt tttggattgt ttttttagtt 3120 gtaatagatg tagtagaagt tattgaagaa tgaatttcgc gattaagtat agtaaatttt 3180 tgtaaatgtg ttagtttgga aaatattgtg ttttttaagt agaaaaatta tagatttgtt 3240 taaagaaaag agaatgtatt aagagtgaga atttttggtt tatgtttata attttagtat 3300 tttgggaggt tgaggttaaa ggattacgtg agtttaggag tttgagatta gtttgggtaa 3360 tagagtaaga ttttattatt aaaaaaaatt gaaaaattag ttgggtgtag tggtatgtat 3420 ttgtagtttt agttatttag gagattgagg tgggaggatt gtttgagttc ggaagttgag 3480 gttgtagtga gttgagattg tgttattgta ttttaatttg ggagataaag aaaggtttag 3540 ttttaagaaa aaaaaaatgg ttaggcgtga tagtttatat ttgtaatttt agtattttgg 3600 gaggttaaga tgggaggatc gtttgagtcg aggagttaaa gattagttta ggtaatatag 3660 tttttataaa agaaaaaaaa agagtgagaa ttttgagtta ggtgtggtgg tttgtgtttg 3720 tagtttttag ttgtttagga ggttgaggcg ggaggattat ttgagtttaa gagtttgagg 3780 ttagtttggg taatagagtg atattttgtt aattaggtaa ttaattaatt aattaattaa 3840 taagagtaag atttttttta gagttaatgt attgtgtgtt gattgagtat ttgttaaata 3900 ttaagtattt gttaagtatt tattatagtt taatattatt aggtataatg ttatgagata 3960 gttataattg tagggtagag attagaggta gggagattaa attagagaag attgttagag 4020 attaggtatg gggtaggaga tagaggaatt gtttattttt ttgggtttaa gtagtttgtt 4080 tattacggtt ttttaaagtt ttcgaattaa aggtgtgagt tattgtgttt agtttaaaat 4140 tttttattta gttataaata tttaaaattt ttgtaggtta aatttattat aaataaaggt 4200 gaaaggtaaa aagattagga aaaaaatgtt aatttataat agttttaaag tgtttatagt 4260 aagttgaatt agattaatat atatatatat atataaatat atatatatat atatatatat 4320 atatatatat atatatatat atatatatat atgagatttt taaataaaat aatttatttt 4380 gttaggatgg ttgtttttat aaaatttatt ttgaaaaatt gtagtataaa agatattgtt 4440 gattaggtgc ggtgatttat gtttataatt ttagtatttt gggtggtaga ggtaggcgat 4500 tatttgaatc gggagttcga gattagtttg attaatatgg agaaatttcg tttttattga 4560 aaatataaaa ttagttaggc gtggtggtgt atgtttgtaa ttttagcgat ttaggaggtt 4620 aaggtaggag aatcgtttga atttgggagg acgaggttgt agtgagttaa gattgcgtat 4680 tgtattttag tttgagtaat aagagtgaaa tttcgtttta aaaaataaat aaataaacga 4740 aaaagttatt gttagtaaaa ggtaattgag aaattagaga gagttaaatt ataaattata 4800 attcgttatt tgtatgagtg ttaaagttta aatattattg agtaggttgg tgtttatttt 4860 gtcgttttat tatataagtt agagttatag ttattttttt tagttatttt tagttttaaa 4920 attagttttt ttataaggtt ttatatattt ttttgtattt aatttattat taagtatttt 4980 gataagttat gaagtaaaaa ttaagttatg aaagaaatta ataattaaaa ggaaattaga 5040 gtatgtgtat aggaattatt tttggaagga aaaaaaaaaa aaaagtttaa agataaattt 5100 atgattagga gaaagttgtt aaaaattagg tatatttatt ttatttatat ttatttttta 5160 aaagattagt taatttatgt tttaatagaa gtttattaat gataagttaa attatgtata 5220 attttatagt tatttttgat tcgagttgtt aaattagtaa aatataatat ttggagtttg 5280 gtttattttt ttttaaattt ggtattattt agtaaattta gtatgtttag gaatttgtaa 5340 ttgttaaata aaatttagta tttcggtttg ttaaagattt attgattatt tttttttttt 5400 acggtttagt ttagaatata gatttttaat ttaagattta gggatagttt gtagagagtt 5460 taaaattttt tgaaataaaa tgtagaatta tatgtagacg tatatttttt taagaagaag 5520 gtttataatt tttattagat tttattttaa aggggtgggt attaataatt aaaataaaag 5580 tgatgtaaga attatttaat tggaggtagt tgttagtaaa aatgtttaat tgtattatat 5640 gtaatttttt taaaatatta ttgttaagtt taaaatattt atgtatgatt ttttttttgg 5700 attttttatg ttttatttag tatgaataaa ttgtttgatt aattaaaaaa ttagaatatt 5760 aatttttgtt tattaaatta gtagtaaaat atttaggtaa tatttagtgg tgttttaaat 5820 cgtaataatt ttttagggtt aggtaaggtg gtttacgttt ataattttag cgttttggga 5880 ggttaaggta gattatttga gtttaggagt taaagattaa tttgggtaat atagggagat 5940 tttattttta taaaaaatat gaatattagt taggtgtggc gatgcgtatt tgtagtattt 6000 ggtatttagg agattaagat taaggtggaa agattttttg agttttgagt tttgggttgt 6060 agtgagttac gatttgtgtt attagtattt tagtttgggt tataaagcga gattgtgtcg 6120 ttaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaggaat attagagatt atttaaattt 6180 aatattttta ttttatataa aagttatttg tatagttaat ttttaataga aatgggatga 6240 aaaatttatt tatttgttaa gtttaggtag ttttattaaa gaataattgg ggataaaata 6300 atattattta aaatattatt aatatttatt tttaaggttt ttgttttttt ttatttatag 6360 atggagtttt agttatgttg tttaggttgg tttcgaatat ttgggtttaa gggatttttt 6420 tgttttagtt ttaggaagag gtgggattat aggtatatat ttttgagtta gttattttta 6480 aggtttttaa gatgaagttt ggatatttaa tttaattggg aaaggttaga aattggatga 6540 gttatgatgt attaaaattt tgtaaacgta tttttattaa agaatttttt gtgtttaagt 6600 tattgtgttt ggtattgtat gagaaatttt agagtagaat taagatggat ttaaaaatag 6660 ttaatattaa taatagtttt ttttaaaaag gttttaaaat cgggagaatt aagcggaaaa 6720 tttcgagttt ggagatcggg attttaaatt ttgtttgtgg ttttgaagag taattttggg 6780 tgattttgtt aatttttttg agttttagtt tttttatttg taaaaggagg ttgaagtgtt 6840 attgaggatg aaatgggtta atgttattgt gttaaattta gtataaaatg gttatttagt 6900 ttttttttgt ttttaaaatt agttagtttt tgaaatatta gaattaatag tgttatgatt 6960 tatttttaaa attgtttaaa aagatatata tatattattt tttagttgat aaaaaattag 7020 aaaatataga taagaaaatt attagtaatt ttatatttgt atgataatta ttaatatttg 7080 gttatttttt ttatgtataa ttagtattta tattagtttt tttttatttt tttttataga 7140 atttattatt taagtttttt ttagagattt ttagggattg tgtagatttg taacgggttt 7200 taatattgta ggttatttgt ttttatgttt ataagtttat attttaagtt tttttaaaaa 7260 atagtaaaat ttattttgta tttttagaat ttagtttagg ttgggtattt tgtgggtttt 7320 tattagataa agaggttagt tttatttagg atttttgagg gagttaaggt agtaagtgat 7380 taagattatg ggattattta tttttgatta ggttgagttt aattttaaga gggggtgttt 7440 attttttgat tttatttaga ataatttatt tttttattaa gagtttattt tattagattt 7500 aatggttttt aaaggttaaa ataatgtgtt ttaggtagtt attatgtatt tatttgacgt 7560 ttatatttag gttttggaaa tgagaataaa ttgtttttgg taagttagaa ttttaatatt 7620 gaaggtttta tttacgtaat taatagggtt ttttaggtta ttattatttt ttttatttag 7680 tttatttatt tatattagaa tatatttata gtagaatttt tataaaaggt tgtattttga 7740 agttaattta gtttatattt ttaaaaatta tttttttatt ttaaaagaat agtcggcgta 7800 aagttgttta aaagttattt aaaatattta atttgaggag taaatttgtt tttgttattt 7860 tgataaatat ttattttttt tgaggtaatt atttataaat ataggttttt aaaaaaaaaa 7920 aaaaaaagtt ttattaatag aagttttttt gacgtaatta gtattttggt taaaatttaa 7980 gttaagtgta ttattggtaa ataattagtt ttattattga gaaaggatcg gggttaatta 8040 tagtatattt tttatatata tttaaattcg tgtatttatt attatttgta aatgtttgag 8100 atttgaaagg tttttaagaa tttattaaag ggtataaaat atgtatataa ataattgtaa 8160 taaaggtacg ttatggggat aatatatatt aagatagttg ttttgaggga aaaatgtttt 8220 ttaaaaatgt ttattatt 8238 45 7025 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 45 aagaaatttt ggatttaagt ttgacgtttg attaattgga tttaatattt tgtagaatat 60 tttattttat aattatgaaa tttatatttt atttattttt atatgaaata tagtttaaga 120 ttaataataa tttttgttat gaagtaagat tgaatatatt tataataatt gaaattattt 180 taaatgtaaa ttataggngg aggtataaaa tgttttgtaa ggaaaaggat attatgttat 240 ttttaaataa tggaaaaatg ttatttttta atagaaagga gtggattttt tttgtagatt 300 cggagtttag gggagtttag aaattgaaga ttttaattgt aatgaattat tttttaaatg 360 ttttataatt ttattttatt taaattgaga ttttgaatat ggttagtgat tagattaggt 420 tgggaattta gttagaattg agttgggttt atttttaaaa tttagttttg gatttaagat 480 ttagatttat ttggtggtgg ggatcgggtg tttttatatg aagtgagagt ttttgtatat 540 gttgtagtta gggaagtagg agttgaggag agatagagta atgtgatttt aagtttagtt 600 ttttataaat atatatattt gtaatgaaga gtttagatgt tttaatattt aaaacgatat 660 atgattttaa gataataata gttatgtttt gatgtattta tataagaaag tgttaaggat 720 agtttttttg gtataaatag aataattagt tttgttttgt tgtttgatta tttataatta 780 gatatagttt aattaatttt tatagagatg agatttttat ataagaaaaa tttaaaataa 840 aggtgttgta tttaattttt tgttttttga ggatgtttta ttttgtaatg ttatagtttt 900 taatgaattg tttttttatt gtattttgtg attgattttg aattttttat tgtgtggaat 960 ttaataattt ttttttggtg tttgaattta gatttttttt tttggtaata tttttaagga 1020 gatttttttg gtttttatcg tttgttttaa tttgatggtt attggttttt atttttttat 1080 tatttttttt taagtattaa ttttgtagaa aaaaatattt gtttttattg tggttataat 1140 ttttattttt tttatattga taaatttgtg atatatttta ataagtaaag tttttttttt 1200 taaaatatta ttagtataat ttattattat tgaaagtatg aaaaatttaa attattatat 1260 tttaggggtt atttgtgttt tttgtattaa tagtgatagg atttttatta taattggtag 1320 tgtatgattt aattttaaaa ttttattttg ttgtttgttt tttttttttt gatttttttt 1380 ggtatatatt attaaatgtt gggtgttttt aagaagtaga ttttaagttg aatatttttt 1440 gatggagata attagggaga ttttttgaaa ataatatttg tgaaaaagta ggaagtaaga 1500 ttggatagtg gaataaaata gtatataatt tagtgtaata gtttgaatgt ttgagtgttt 1560 ttaaaattaa tatgttaaaa tttttataat taaaatgatt gtattagtag atagaatttt 1620 ttaggaggtg tttatgttat gaaggtagag ttttgtttaa tggaattaat ttttttgaaa 1680 aatatgttta taataattta tttatttatt ttttttatta agatatggtg acgggttgtt 1740 attttggagg aatgtttaat attagtattt tgatggtgaa ttttttagtt ttaagaattg 1800 tgataaataa atgtttgttg tttgtaagtt agttaatgta tggtattttt ttatatagta 1860 ttttgagtat gttaagatat gtagttttag tataggtttt attttattta ttggaaattt 1920 tgaagttaag ttagtttttt agagttggtt taagttgaaa tgaggagaat gggtttttag 1980 agttttatat gtgattaggt attggatatt ggttgttttg gaaaagttat tatatattag 2040 atagttttta gtagagatgt attgagagag agagtttata ggtgaggtat gttagttgtt 2100 tattatttta ttagttggaa agtaattttt atatttttaa aagggaaatt tgggtgatat 2160 ataatgtttg tatttaagga tattgaaaat attgaataat attgttattt tgtaggtaat 2220 atttgtttag aaattgtgtt taaatatttt tttaagaaag atttatttta ttttagatta 2280 atagattatt aatagaataa aaataaatat ttttattttg tgatatgtat tttttttttt 2340 ttaattttat ttgatgtaaa tttttattta gattttttaa aagtataatt tgtttgaatt 2400 ataaggtaat ttgtgaaata agttaagtag taggtattta gaagataaat attttttaag 2460 attgagaaat gtaagtaatg ttgtaaatat ttagaaaagg aaattattgt gatttagata 2520 aaatattttt aaatgaaata aagtaattgt aattgtattt aaaatatatt tgtttggata 2580 aaaataaaag gaatttttat agttagaaaa ataatgttaa ggaatatgaa atgaagttaa 2640 tataataagt gtgaaattat atagagaaaa tgaagatatt ttatttgaga atgtttagat 2700 aaataagaat agattatatt attgttttat tgttgataga atgatgtttt tttatattag 2760 aaatttttta tatataatta aattattttt tgttttggag atagttatat ttataataag 2820 taaataataa taaatttatt atttatatat ataaatataa aattatttat tttttttttt 2880 atttttttgt tttttaaaaa ttttattgtt aatatttaaa ttattgtgat attgattgat 2940 attgatatgt attaagttag agaaagttag aaagaaagat agtattttaa taagttgttt 3000 aagaaatggg tttttttgtt ttttatgttg atagttgtat tttagttttg agttttgtga 3060 gaatgtgttg gtgtggttag tgaaatatag tttttatatt aatttaataa tgatatttga 3120 tgaatttgtt tagaaatatt aagaggtaat tgtgtttgtt atttttagtt tttattttta 3180 ttgattttaa taatttgttg ttaaatttga ggtttatttt atatttttta ttgagaatga 3240 atttgatttt atttttatga aattgattaa gatatggata tataagtttt taaagagtat 3300 attttggtat atgatttaaa gatataaaaa atatatatta tgaatgtttt gatattgttt 3360 aaaagttttg tgagtatgtt gttttgaata agaaatttat aaggaataat aagattttag 3420 aatttatgtt atttttgtag atgttatttt ttattagtga gttgttattt gaatagttta 3480 atttgttaaa tatttgttat atatttggtt tattattatt tatttataat tggtagtatg 3540 tattaagaat tttgtggagg atttttatta tttttttttg atgtagttgt tgttatgtta 3600 gaatttagta ttaaaatata tttatagaaa gatgaaaaat tttttgtatt ttttttattt 3660 taattttgta tttgataatt ttaataaaaa gaagtgtgat tagttttata gtgaagtatt 3720 aggtaagtta gtggttaatt tatttttttt tttttttaat atgtggaagg aaattttttt 3780 ttttttgtgt ttgttagagt gtgttaatga attaaaatag aaaataattt tttttgttat 3840 ttgaaagatg aggtttggta agttggtgga gatattgaaa tttttatata ttgttggtga 3900 gaatagaaaa ttatttattt attgtgaaaa agtttagtaa ttttttaaaa gtttatatat 3960 atatttatta tataatttaa taattgtttt tttaggtata tatttaagaa aaataaaaat 4020 atgtttatag aaagtatgta tattaatgtt aattaacgtt atttataatg gttaaaagtg 4080 gaagaaaaat aatgttcgta tattgataaa tgaataaata aattgtgttt ataagtagta 4140 tttgatatta tttggtaata aaaatgtgaa cgttatttat aatggttaaa agtggaagaa 4200 aattaatgtt tatttattga aaaatgaata aataattttt gtttataagt agtatttgat 4260 aaaaagtaat aaaaatgaaa tttttatata tattatttta tggatggttt tttaaaaata 4320 ttaaattaaa taaaagtagt tagttataaa agattatata ttatatagtt ttatttattt 4380 ttaaaaagat tttgaatagg tatatttgta gaggtagaaa ttagattatt ggttgtttag 4440 tatagtgtgg gtgtagaaat ttaggtgggg agatgatagt taatatatag gatttttttt 4500 ttttttagat aaaattgatt gttatgttgg atgtataagt ttgtgaattt attaggaaat 4560 atttaatttt aaataattat ttatgaatta tatggtatgt gaattatatt ttaataaagt 4620 tttataaaat attttttgaa ttaagatatt taaaaatttt atttgtattg tataattatt 4680 ttatttttta ttttgtgtta aggggtttgt aggatttttt tatttgttat tgtttttgat 4740 attattataa aatatattat ataaaatacg atatttgtaa ggttattaaa tttaggtgga 4800 tgatattaaa tataaatata aaagaaatat taaatatttt tgagtaaata tgaagtaatc 4860 gaattttgtt tttttgttat ttatgtattt aggatgttta tataatgtat ttattttgaa 4920 ttgaaggagt tatgttttaa tttgattgat ttttttttgt atataagtat gagaaagaaa 4980 tagtgattgg aaaagaatta ttatattgta taaggatggt tttgaaatgg attatagttt 5040 tgttgatata atttagtttt tattttagtt ttgggagttg tggaaaggtg ttggtatggg 5100 tcgtagaata tagtttttgg atgaatatga agataatttt gaaagaattt gtttagagag 5160 gttatgaggt gattgtattg gtatttttag tttttatttt ttttgatttt aacgatttat 5220 ttatttttaa atttgaagtt tattttatat ttttaattaa aattgaattt gagaatatta 5280 ttatgtaatt ggttaagaga ttgttagaaa tttaaaaaga tatattttgg ttattttttt 5340 tataagaata agaaattttg tgggtaatta atgatataat tagaaatttt tgtaaagatg 5400 tagttttaaa taagaaattt atgaaaaaat tataagagtt aagatttgat atcgtttttg 5460 tagatgttta tttattttgt ggtgagttgt tggttgagtt atttaatata ttttttgtgt 5520 atagttatag ttttagtttt ggttatttat ttgaaaggta tagtggagga tttatttttt 5580 ttttttttta cgtatttgtt gttatgttaa aattaagtga ttaaatgatt tttatggaga 5640 gggtaaaaaa tatgttttat gtgttttatt ttgatttttg gttttaaata tttaatatga 5700 agaagtggga ttagttttat agtgaagttt taggtaagat tttttttagt tagtaatatg 5760 aagttttaat ttatttgtgt ttttgaagta taatttgtat aaagttataa agttagggaa 5820 gtggagtttt tgataaatga atttatgaaa tgaaaatata agatgattta ttaattttat 5880 aaatattata gaaaagttta aattatgggg ttagtgaaaa cgttgtgatt attatttata 5940 tagaatattt taggaaatta taaatttata tattagtata tttaagattt taagtaatta 6000 tatatttgtt ttattataga atgttttaga ttttaaaaat agtaagattc gttaagtaat 6060 atttaatcga atgtatagat ttagaatgag taattatata tttttttata attatttata 6120 taattgtaga aagttttttt tttaaatttt agttgtttta tttagaaatt aaaagatgtt 6180 tttatgttat taggaggttg tttttatagt agagagagat aatgtttata ttttagatgt 6240 aaaaattaat aagggtaatt tgaagtttta aatgttttta tattttttta ttaaataatt 6300 ggaaattttt tatttaaagt ttaattattt tgttgaagtg tgaaggttgt tatatttata 6360 tagtttattt gaaattatgt ttttttattt aaaaatacga gattgattat ggtcgagtat 6420 agatttttat tttaataatt ttttaaaaat ttttagttat aatttataaa tatttttatt 6480 taatattatt aagattttag tttggattta aatgagtagt tggtataatg attttagtta 6540 tatttataaa atagtttata gttaatttga agaattaaag ataaaaggat tagtttaatg 6600 agttgtgtaa attagattat ttgttagaaa attgttttta tggttattgt agaattaatt 6660 gattatggag tttaaagatt tgtttaaata tttagaggtt attattgaag ttttaaagag 6720 aaaataaatt gatgtttaat tttttatgat ttattttaat aattgtgagt atattgatat 6780 gatattagag atgtagttta attttataat ttttttatta ttttgttttt tttataaata 6840 aataagggta aaatatagaa tatataaaaa ataaattatt tttatatatg aatatatgta 6900 tatatttttt aaagtatata aattttatta atatttttgt ttgtattatt ttaatttttt 6960 ttagaaaatt atataaagta attattttat gttatttatt tttttttttt tttattttta 7020 ttagg 7025 46 7025 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 46 tttgatagga ataaagaaaa gaagaagtgg atgatataag ataattattt tatgtaattt 60 tttgaaaggg gttagaataa tgtaggtaaa aatgttggta aagtttgtgt gttttgaaaa 120 atatgtatat atatttatat ataggaataa tttatttttt atgtatttta tattttgttt 180 ttgtttattt ataagaaagg taaagtagtg ggagaattat gaggttaagt tatattttta 240 atgttatgtt agtatattta taattattaa aataagttat agagaattaa atattaattt 300 attttttttt taaagtttta atagtagttt ttagatattt aaataaattt ttgagtttta 360 taattaatta attttatagt aattatagaa ataatttttt aataaatagt ttagtttata 420 taatttatta agttaatttt tttatttttg gttttttaag ttaattgtgg attattttgt 480 gagtatggtt gaaattattg tattaattat ttatttggat ttaagttaag attttaataa 540 tattaagtaa aaatatttgt aaattatagt tagaaatttt tgagaaatta ttgaaataga 600 gatttgtatt cgattataat tagtttcgta tttttaaata aagagatata gttttaaata 660 aattatatag atataataat ttttatattt taataagatg attggatttt aaataaaaga 720 tttttaatta tttagtgaag gagtatagaa atatttgaaa ttttaaatta tttttattga 780 tttttgtatt tgagatatag atattatttt tttttattgt gaagataatt ttttggtaat 840 atgggaatat tttttaattt ttaaataaga taattgagat ttagaaggaa aattttttgt 900 agttatatag atagttgtag aaaaatgtgt aattatttat tttaaattta tgtattcggt 960 tagatgttat ttgacggatt ttgttgtttt taagatttga aatattttat agtaaaatag 1020 atatataatt gtttaaagtt ttaggtgtat taatatatag gtttatgatt ttttggggtg 1080 ttttgtatga gtgatggtta tagcgttttt attgatttta taatttaagt ttttttataa 1140 tatttgtgag attggtagat tattttgtat ttttatttta taaatttatt tattaaaaat 1200 tttatttttt tgattttatg gttttatgta agttgtgttt taaagatata aataagttag 1260 agttttatgt tattaattga aaaaaatttt atttaaaatt ttattgtaaa attgatttta 1320 tttttttata ttaaatattt ggaattaaaa gttaaaataa agtatataga gtatattttt 1380 tatttttttt atgaaagtta tttgattatt taattttgat ataataatag gtacgtagga 1440 aggagggaaa ataaattttt tattgtgttt tttaaatgag tagttaggat tgaagttgtg 1500 attgtatata aagggtatgt taaatagttt agttagtagt ttattatagg gtaaataagt 1560 atttgtaaaa acgatgttaa attttgattt ttgtagtttt tttataagtt ttttatttga 1620 aattatattt ttatagaagt ttttaattat gttattaatt gtttatagga ttttttgttt 1680 ttgtgaaaaa ggtaattaaa atgtattttt ttgaattttt gataattttt taattaattg 1740 tatgatgata tttttaaatt tagttttagt taaagatgta ggataaattt taagtttaag 1800 agtggatgag tcgttgggat taaaaagaat ggaagttgaa gatgttagta tagttatttt 1860 atgatttttt tgaataagtt tttttaggat tgtttttata tttatttaaa ggttgtattt 1920 tgcggtttat attagtattt ttttataatt tttagagtta aagtaaaaat tgagttgtat 1980 tagtagaatt gtagtttatt ttagagttat ttttgtgtaa tgtgataatt tttttttagt 2040 tattgttttt tttttatatt tatatataga gaaaaattaa ttaagttaaa atataatttt 2100 tttaatttaa agtaaatata ttatatgagt attttgagta tatggatggt aaggagataa 2160 agttcgatta ttttatattt atttaaggat gtttgatgtt ttttttatgt ttatatttgg 2220 tgttatttat ttaagtttaa tgattttgta aatatcgtgt tttatataat gtattttata 2280 atagtgttaa gaatagtggt aagtgagaga gttttgtagg ttttttgata tagaatgaga 2340 gatgaagtaa ttatataatg taaatagaat ttttgaatat tttggtttaa ggaatatttt 2400 gtaaaatttt gttgaagtat aatttatata ttatatgatt tatgaatgat tatttaaaat 2460 taaatatttt ttagtaaatt tatagatttg tgtatttaat atagtaatta gttttattta 2520 aaaaaaaaaa aaattttgta tattaattgt tattttttta tttgaatttt tgtatttata 2580 ttgtattggg taattagtaa tttaattttt gtttttataa atatgtttat ttaggatttt 2640 tttaaaaata aatgaaatta tataatatgt ggttttttgt ggttggttat ttttatttag 2700 tttaatgttt ttaaaggatt atttatagaa tagtgtatat aaggatttta tttttattgt 2760 tttttattag atgttattta taagtagaaa ttatttattt attttttagt ggatagatat 2820 tgattttttt ttatttttgg ttattataaa tagcgtttat atttttattg ttaaatagta 2880 ttagatgtta tttataaata taatttattt atttatttat tagtgtacgg atattgtttt 2940 ttttttattt ttggttatta tgaatagcgt tgattaatat tgatgtatat gttttttgta 3000 gatatgtttt tatttttttt gggtatatgt ttagaaaggt aattattgaa ttatgtggta 3060 aatatatgtg taaatttttg aggaattgtt agattttttt atagtgggtg aataattttt 3120 tatttttatt aataatgtat gagagtttta gtgtttttat taatttgtta aattttattt 3180 tttaaataat aaaaaaggtt attttttatt ttaatttatt aatatatttt aatagatata 3240 aagaaaggaa agtttttttt tatatattgg agggaaaagg gaataaatta attattaatt 3300 tatttaatat tttattgtaa aattgattat attttttttt gttaaaatta ttaaatgtaa 3360 agttaaaatg aagaaaatgt aaaagatttt ttattttttt gtaaatgtat tttggtatta 3420 agttttgata tgataatagt tatattagaa ggaggtaatg aaagtttttt atagagtttt 3480 tggtatatat tgttagttgt aaatggatga tagtagatta aatgtataat aaatgtttaa 3540 tagattaagt tgtttagata gtagtttatt aatgagaaat gatatttgta agaatgatat 3600 aaattttgga attttgttgt tttttataag ttttttgttt aaaatagtat atttatagag 3660 tttttgaata gtattagaat atttataata tgtgtttttt gtatttttga attatatgtt 3720 aaaatgtatt ttttggaaat ttgtatgttt atattttgat taattttata aaaatgaaat 3780 taagtttatt tttagtaaaa gatgtgggat aaattttaaa tttaatagta aattgttgga 3840 attaatgagg atggaagttg aaggtgataa gtatagttat tttttggtgt ttttgagtaa 3900 gtttattaag tattattatt aaattgatat aaagattgta ttttattggt tatattagta 3960 tatttttata ggatttagag ttagaatata attgttagta taagaaataa aaaagtttat 4020 tttttagata atttgttaaa atgttatttt tttttttaat tttttttaat ttggtatata 4080 ttaatgttaa ttaatgttat aatgatttaa gtgttgataa tagagttttt ggaaagtaag 4140 agaataaaga aaaggatgaa tgattttgtg tttgtatgtg tgaataataa atttattgtt 4200 atttgtttat tgtaaatgtg gttgttttta gaataagaga taatttaatt gtatataaag 4260 agtttttagt ataagaaagt attattttgt taataatgag gtagtggtgt gatttatttt 4320 tatttattta aatattttta aatagaatat ttttattttt tttatgtagt tttatattta 4380 ttatattagt tttattttat gttttttgat attgtttttt tgattgtaga aatttttttt 4440 atttttattt aaatagatat gttttaagta taattatagt tattttgttt tatttgaaaa 4500 tattttgttt aaattataat aatttttttt tttgaatatt tgtaatattg tttatatttt 4560 ttagttttag aaaatattta ttttttaaat gtttattatt taatttgttt tatagattgt 4620 tttgtaattt aggtaagttg tatttttaaa aagtttaaat agaaatttat attaagtaga 4680 attaggaagg aaaagatgta tgttataaaa tagagatatt tgtttttatt ttattaataa 4740 tttgttaatt tgaaatgagg taaatttttt ttaaaaagat atttgaatat agtttttgag 4800 taaatattgt ttgtagagtg gtaatattgt ttaatatttt taatgttttt gagtgtaggt 4860 attatgtgtt atttagattt tttttttggg aatatagaaa ttatttttta gttgatgaag 4920 tgatgaataa ttgatatatt ttatttataa gttttttttt ttagtatatt tttgttgaaa 4980 gttatttagt atgtagtgat ttttttaaga tagttaatat ttaatgtttg gttatatgta 5040 ggattttaaa ggtttatttt ttttatttta atttggatta attttgaagg gttaatttag 5100 ttttagaatt tttagtgggt gagatgaaat ttatgttgag attgtatgtt ttagtatgtt 5160 tagggtgtta tatagaaaaa tattatatat tggttagttt atagataata aatatttatt 5220 tgttatagtt tttgaggttg aaagatttat tattaagatg ttggtattgg gtattttttt 5280 aagatggtaa ttcgttatta tgttttaatg gggaaaatag atgaatgagt tattgtgagt 5340 atatttttta aaagaattaa ttttattaaa taggattttg tttttatgat ataaatattt 5400 tttaaaaggt tttgtttgtt aatataatta ttttggttat aagaatttta atatattaat 5460 tttgggggta tttagatatt taaattattg tattgaatta tgtattattt tgttttattg 5520 tttaattttg ttttttattt ttttatagat gttattttta agaaattttt ttaattattt 5580 ttattaaaaa atatttagtt tagagtttat tttttggaag tatttaatat ttgataatat 5640 gtattaagag aggttagaaa aaaaagaata gataataaaa tgagatttta gagttggatt 5700 atatattatt agttgtaatg agaattttat tattattggt atagagaata taaatagttt 5760 ttggaatgtg ataatttaaa ttttttatat ttttagtaat ggtaaattat gttggtagta 5820 ttttgaaagg gaaagtttta tttattagga tatattataa atttattaat atgggaaaag 5880 tagaaattat gattataata gaggtaaatg tttttttttg tagaattaat gtttgggaga 5940 aaataatgga agagtgagga ttaataatta ttaaattaag gtaaacggtg aaagttagaa 6000 aagttttttt ggaagtgtta ttagaaaaag gggtttagat ttagatatta agagaaggtt 6060 attggatttt atatagtaag gaatttaagg ttagttatag agtgtaatga gaagataatt 6120 tattgaaagt tatgatatta tagagtaggg tatttttaga aggtaaggag ttgaatgtaa 6180 tatttttgtt ttaagttttt tttatgtagg agttttattt ttgtaaaggt taattaagtt 6240 gtgtttagtt gtgggtggtt agataatagg ataaaattga ttattttatt tatgttaaga 6300 aaattatttt tgatattttt ttgtgtgaat atattaaaat ataattgtta ttattttgaa 6360 attatgtatc gttttgggta ttgggatatt tggatttttt attgtaggtg tgtgtgttta 6420 tagggagttg aatttaaaat tatattattt tgtttttttt tagtttttgt ttttttaatt 6480 gtagtatata tagagatttt tattttatgt agaagtattc ggtttttatt attaaatgaa 6540 tttgaatttt aagtttagga ttgaatttta aaaataagtt tagtttagtt ttagttgaat 6600 ttttagttta gtttgattat taattatatt tagggtttta gtttagatag agtgaaatta 6660 taagatattt gagaaataat ttattgtagt taaaattttt agtttttaga tttttttgaa 6720 tttcgaattt gtaaaagagg tttatttttt tttgttaagg gatagtattt ttttattgtt 6780 tgaagatgat atagtgtttt tttttttgta ggatatttta tatttttntt tgtgatttgt 6840 atttggaatg attttaatta ttgtaaatgt atttagtttt gttttataat aaaggttgtt 6900 gttgatttta gattatgttt tatgtaaaaa tgagtggaat gtaaatttta tggttgtggg 6960 gtggagtgtt ttgtagagtg ttaggtttaa ttggttaagc gttaagttta agtttagagt 7020 ttttt 7025 47 6048 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 47 gtgggttaaa taaaatgtta taggttatag ttttagtttg gtggttgttg atttattgat 60 tttgttataa tattggaggt taggattttg ggtaaatgaa agagaaaagg aggtagattg 120 agaatgtgat tttataattt tagttttttt aggggttggg tggttagtgt ttttttagta 180 gttttttttc gtaggaagta gaattgtttg taacgttgat ggagttatag taatttttat 240 tttattgagt ttaggatttg tagagttatt aagattttgg agtaattgtt tttagtattt 300 aatagaagtt gttaaaagga ttatgggtta atttatttta gatatttttt ttagatgttt 360 ttatggaaag ttagggttta aattagtggt ttttattttt ggtagtattt gagttttatt 420 tggggaattg ttagaaagtg aaatttggac ggtatttata ttagtttagt ttttgggtgg 480 ggtttggata ttagtatttg tagaagtttt ttaggtggtt ttggtgtagt taggttggaa 540 attattgatt taattaatag aaatgttagg ttgggatttt tttcgaggta tttttttagg 600 ataggttgtg tatgatagtt ttatagtgtt agggttttaa gatgttttaa tggtttaggt 660 attggtttta attttcgttt tttcgttttt tttgagattt taataaattt tatagggttg 720 ggtataatgg tttacgttta taattttagt attttttttt tttttttttt tttttttttt 780 tttttttttt tttttttttt tttttttttt tttttttttt ttttttttga gattgtttta 840 ttttgtcgtt taggttggag tgtagtggta taattttggt ttattataat ttttattttt 900 taggtttaag cgattttttt gtttaagttt tttaagtagt tgggattata ggtttttgtt 960 attatgttta gttaattttt gtatttttag tagagatagg gttttattat gttggttagg 1020 ttggtttcga atttttgatt acgtgatttt tttattttag ttttttaaag tgttgggatt 1080 ataggcgtga gttattgcgt ttggttaatt ttagtagttt tagaggttaa ggtaagagga 1140 ttttttgagt ttaggagttc gagattagtt tgggtaatat ggtaagattt tattttaatt 1200 taagaaaaaa attaaaatat ttaagtttta taatttttat atttttattg attgattaag 1260 tgtagataat gatatttgtt tttttaattt tattaggttg ttattaggag aaatgaagta 1320 ataaatgaga aattgttttg taaattgtta acgttatgta aatattgtta tttagagtgt 1380 gtttttaggt gcgggaggta tagttgttat ttgttggaga ttatttttga agtaatattt 1440 ttagtgttat gggttagatg ggaattggta tagatatttt aatttagaag gtagttttta 1500 ttgttttata agtaggtgcg ttttttgggg tggtagtttg gtattggtta ttttaatttt 1560 aatttgtgta ggaggtatta tagtaaatga gtagagagag tttaggggat ttgaagggaa 1620 gtggagggtt atttggagag ggagggaatt aaggattttt tgtgggttgg ggtttttttg 1680 aggatttagg gagtaattgt taaggagttt tagtagggat ttaagagtta tgtaagagta 1740 aaaagaggta aattattaag gaaattagtg aagttagtat tggaataata gagaggggat 1800 atagtagtgt agtatgggtt ttggttttag gaagttgttt gattggggta gataggatta 1860 gttttttaga agatagttat ttatattagt taggtagtta tgatttagtg ttatttattt 1920 gaggtttagg ttgtatgagg ggttgggggt gggatggata gagtattggt tgggtattag 1980 gattaggttg gagttttggt ttaaaatttt attataattt gatattgggt aagatggttt 2040 atttgtggta ttttaggttt ttgttttgta aagaggagtt tgggtgtata tttagatgga 2100 ttgtgagtat agtttgagtt tgttttgtcg aggtgttgag gtttgggaga ttggggtgag 2160 tagttgtggt ttagggaagg ttggtaagtt gggttttaga tgagagggga tgtttggtta 2220 ggtagaggtg agtggagaag gtagggtaag gaagggaata tgagcggcga ataaatggag 2280 tggatatggt gggggtagag gatggtggga agtggttttg ttgcggttag agtggaggaa 2340 gagataagtg ggaaagagtg gagtcgatta tagaaggttt cggaaattag gtagagatgt 2400 ttaaattggt ttttttagga aggagagggt tatgaaggga tttagggaag ggttatgata 2460 tgattatgtt gtattttagt aggattaatg tgatttggtg tttagaatga tttggatggt 2520 atgaggttag gagtcgagga ggatagttag aagatttttg taatattttt ggtataggga 2580 gatggattgg gagttgggag gtggtaatag gttaggttta gagatatttt ttaggaaata 2640 ttgataggtt ttggggtttg gttgtattta tggagtgggg aggaatgagt tattttgaga 2700 agtagttttt tttttaaagg ttagggaaga taaagtagag gtagtttttt tgtttgtaaa 2760 taggatattt tagggtaatt tggttttttt aagcgttagt ttttttttgg ttttagttta 2820 gataggagtt gtaataacgg gttgggtatg ggtgatggta tcggttggtg gttgggttaa 2880 gggttatgtt tttgattatg tattaggttt atttagtttg ttaagtgtta ggttttgcgt 2940 ttgtgtagga gatagagtaa ttagtaaaat atagtttttt atttttaagg agtttttagt 3000 tttgtgagtt tggtagattt gtagaattta aatgaaatgg tagttgagaa taattatttt 3060 gtttttattt attttatttt gtttaacggt tatgtaggta gttttaaatg tttgatgtgt 3120 attagaaaat tttttttttt ttggtttata attatgattt agggtaaatt taggttttgt 3180 tgggtttgaa aattaaataa attggtattt tttatggaaa ataatttaaa tataaatata 3240 taaatattat attgttaggt ttttttaggg ttagtaaggg taggaatgaa agtgagagtt 3300 tttgaagttt taatcgtatt aattttttag ttagttttat gatatttgtt attttttaag 3360 tgtgtattat gtgtacgtat tttgcgtata gtattatata ataattaagg ggaggtgagg 3420 tgggtattag tgtttttatt ttatggatga agatatagtt ttagaggtga tttaagatgt 3480 ttttttgtat aggttttaag gtaaggggtg gggattgtga tttggatagg aagttggggt 3540 tttaggattg tatttaagtt tttttttttt tgtgggtgat ggtggttgtt aggttttgaa 3600 tttacgttat tttttttttt gatttgattg tatttttgtt aggtttggtt aagggttagg 3660 gatttttaaa gttaagagtt agggtagagg ttgggggttg gattttaggg tattatatgg 3720 tcgagatttg gttgtaggaa agtgatttat ttaggtagag gggttttata taattgggat 3780 tatagtaaat tttagaggtg agtatttgtt ttaaagattt atagatttaa gttgtgattt 3840 tagatttata attttttggt tgtataaagt ttagtaagat tgaggtttta ttgagtttta 3900 atttttttat ttgtttaatt agaatagtaa taatttgttt gtatatttga gtttattata 3960 tgttattttg taaggtatta aagtttttgg aggttttcgg aatatagaaa taattaattt 4020 aagaatttta aagtggttgt tttggtagta tttttaggga gtttttttat tttacgtaat 4080 tttttttggg aaagtagaaa atacggtatt tgggaagggg cgttgaatcg tgttttaagt 4140 tttagtgggt ttggatgttt aagagtaaga ggaggtttag aggatgggga taggttacga 4200 tttgtggttt aagtttcgtt tagagggagt gcgttttgag ggagagttat cggagttggt 4260 gattcggggg cgggtgtttt ggggtgtcgt tttgggttta gtaatataaa tttgttagtt 4320 ggagattagg cggggtacgt cggggagagg tgatgtattg tcgttgaaga tttaggtagg 4380 tcggtgcgtt cggtttgggt gaggaaggcg cgggattcgg gtgcgaggat tgcgtagcgt 4440 tttcggtttt cgttttcgtt cgttttttac gtttattttt gtaagttttt ttcggtattt 4500 cggcgtttat cggattttta gggcgagttt ttattttcga ggaatgggat cgttttcgtt 4560 tttcggggtt gttagttttt agattacgtt taggggtttt ttcgattcgg agtcgggcgg 4620 tgttttttgt ttgcgtttcg tattttttcg tttggtacgg ttattcgggt acgcgtcgtt 4680 acgcgtgaag gttcgtatcg gttttttacg tgggggacgt gtaggatgat gcggggtcgg 4740 gggggatttc gttcgtcgtt cgtttttttt tcggcgtagg agggagcggt cgattcgttt 4800 tcgtttttcg gtcgggacgt tatcgtcggg cgttgtagag gcgcgtcgta attaatgggc 4860 gtggaggagg tgggtcggtt ggcggttgtt attttttagg ggacgggagc gcggagatcg 4920 ggcgaagacg gagttgtcgt cgcgtttcgg gtcgaggggg aggagtcggg ggaggaggag 4980 gaggaggagt cgtcgagtag tcgtcggagg attacggttc gttagggttg cggaggatcg 5040 atcgttttta cgtttgtcgt ttcgcgattt cgatcgttag tatgatcgtc gcgtagtttt 5100 tggtttatta ttttacggag ttgaaggatg attaggttaa aaaggtgagt tttcgttcgc 5160 gtcgtcgttg gttttggtcg tagttttgcg tttcggtatt cgttcgtcgt tttcgttgtt 5220 tttatttttc ggcgttcggt ttttttcggg ttagtatcga gttggattgt agggcgtaag 5280 gaaagttttc gttttcgatt ttatcggtat tgttagtgtt tttgtgtgtg tgcgtttttg 5340 ggaggggggt aatcgggcgg aagatttcga gatcgggttg tttgttgtag tgtttttgaa 5400 acgggttttg gatgttagat aggttttcgg gttgtgcggg gaggtggtcg gtggtttttt 5460 cgtaggtttg ttcgggaggg ttcgagcgtc gtgggaggag gtgtgttatg gagatgttgg 5520 ggaggtgatc gagtagtagg cgngggtgtt ggttggaggt agttttttat atttngggtt 5580 ttggcggagg tgtcggtgtt cgaaaaaaaa attaaaatgt ttttaggtat ttgttgttat 5640 tttaaatgaa gttttaaagt ggtgtttttt tggaaaggta ttgtagttgg ggagtttatg 5700 aatttggggt gggttatttt tggttgtgtg gttttgtgta agttttttaa tttcgttgag 5760 ttgtagtgtt ttttaaatat agaatgaaga taattatatt tattttttag aattgtttgg 5820 gggatttaat aagataatgc gtataaagta tttggtatag cgcgaggtat agtgttaaaa 5880 tcggaggtac gtgtttttat tattattatt gagaaagatg ttggtgggta tttaatatag 5940 ataaatgata aaattttgga tggataaatt attcgtttat atttttcgtt gttaagttat 6000 taagaaagta tgtgtattta atttttaaag ttgaatgaat ttttatag 6048 48 6048 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 48 ttgtgagaat ttatttaatt ttaagaatta aatgtatatg tttttttgat agtttggtag 60 cggagggtgt gaacggatgg tttatttatt taggattttg ttatttattt atgttgaata 120 tttattaata ttttttttaa taataatgat aaaagtacgt gttttcggtt ttgatattgt 180 atttcgcgtt gtgttaaatg ttttatgcgt attattttgt taaatttttt aaataatttt 240 aagaggtaga tatgattatt tttattttat atttgagaaa tattgtagtt tagcgaggtt 300 aagagatttg tataaagtta tataattaag agtagtttat tttaagttta taagtttttt 360 aattatagtg tttttttaga aagatattat tttagaattt tatttaaaat ggtagtaggt 420 gtttgaaagt attttgattt ttttttcggg tatcgatatt ttcgttagaa tttnaaatat 480 gagaggttgt ttttagttag tatttncgtt tgttgttcga ttattttttt agtattttta 540 taatatattt ttttttacgg cgttcggatt ttttcgaata ggtttgcgga agagttatcg 600 gttatttttt cgtatagttc gggggtttat ttgatattta gggttcgttt taaggatatt 660 gtagtaggta gttcggtttc ggggtttttc gttcgattgt ttttttttta aaaacgtata 720 tatatagaga tattgataat gtcggtagaa tcgaaggcga aggttttttt tgcgttttgt 780 agtttaattc gatgttggtt cggagaaggt cgggcgtcgg aggatggagg tagcggaggc 840 ggcgagcgga tgtcggaacg taaggttgcg gttaggatta gcggcggcgc gggcgggggt 900 ttattttttt gatttggtta ttttttagtt tcgtgaagta ataggttagg agttgcgcgg 960 cgattatgtt ggcggtcggg gtcgcggggc ggtaggcgtg gggacggtcg gtttttcgta 1020 gttttggcga gtcgtggttt ttcggcggtt gttcggcggt tttttttttt tttttttttt 1080 cggttttttt ttttcggttc ggggcgcggc gatagtttcg ttttcgttcg gttttcgcgt 1140 tttcgttttt tggagggtga tagtcgttag tcgatttatt ttttttacgt ttattggttg 1200 cggcgcgttt ttgtaacgtt cggcggtggc gtttcggtcg gggagcgggg acgggtcggt 1260 cgtttttttt tgcgtcggaa agggggcggg cgacgagcga aatttttttc gatttcgtat 1320 tattttgtac gttttttacg tagggagtcg atgcgggttt ttacgcgtgg cggcgcgtgt 1380 tcgggtggtc gtgttaggcg gggaggtgcg aggcgtaggt aggaggtatc gttcggtttc 1440 ggatcgaaga agtttttagg cgtagtttag ggattggtag tttcggggga cgaaggcggt 1500 tttatttttc ggaaatgagg gttcgtttta ggagttcggt ggacgtcgag gtgtcggagg 1560 ggatttgtag aagtgggcgt ggaaagcggg cggaagcggg agtcggggac gttacgtagt 1620 tttcgtattc gggtttcgcg ttttttttat ttaggtcgaa cgtatcggtt tatttgggtt 1680 tttagcggta gtgtattatt ttttttcggc gtgtttcgtt taatttttag ttggtagatt 1740 tgtattgttg aatttaaagc gatattttag agtattcgtt ttcgagttat tagtttcggt 1800 ggtttttttt tagggcgtat tttttttggg cgggatttgg gttataggtc gtggtttgtt 1860 tttatttttt gggttttttt ttgtttttgg gtatttaggt ttattgggat ttggggtacg 1920 gtttagcgtt tttttttagg tgtcgtgttt tttatttttt tagaggaagt tacgtaggat 1980 gggaggattt tttagaggtg ttattaggat agttatttta ggatttttag attaattatt 2040 tttgtgtttc ggaagttttt aggagtttta gtgttttata aaatgatatg taatgagttt 2100 aaatatataa ataagttgtt gttattttgg ttagataggt aaggaaattg aagtttagtg 2160 aggttttagt tttgttggat tttatatagt taggaagttg tagatttagg attatagttt 2220 ggatttgtga gtttttgaag taggtgttta tttttagggt ttgttgtggt tttagttgta 2280 tagagttttt ttgtttaaat aggttatttt tttgtaatta agtttcgatt atatggtgtt 2340 ttgagattta atttttaatt tttattttag tttttgattt taggagtttt tagtttttga 2400 ttaggtttag taaaggtata gttaaattag agggagggat gacgtaggtt tagggtttga 2460 tagttattat tatttataga aaaggaggag tttagatgta gttttgaggt tttagttttt 2520 tgtttaggtt atagttttta ttttttgttt tagggtttat gtagaggggt attttgaatt 2580 atttttgaga ttgtgttttt atttataaga tgaagatatt aatgtttatt ttattttttt 2640 ttgattgttg tgtaatattg tacgtaaaat acgtgtatat aatatatatt taaggaatgg 2700 taggtattat agaattgatt gaaaagttaa tgcggttaaa gttttaggga tttttatttt 2760 tatttttatt tttattagtt ttgggagggt ttagtagtgt gatatttgta tatttatatt 2820 tgaattattt tttatagaga gtgttaattt atttaatttt taagtttaat aaaatttgga 2880 tttgttttgg attataatta taaattagga agagagagat tttttggtat atattaaata 2940 tttggaatta tttatatggt cgttaagtaa aatggagtga atgagaataa gatggttgtt 3000 tttaattgtt attttatttg agttttgtag atttgttaag tttatagggt tggaaatttt 3060 ttgaggatgg aggattatgt tttgttaatt gttttgtttt ttatataagc gtagggtttg 3120 gtatttggta ggttgaataa gtttaatgta taattaaaaa tatggttttt aatttagtta 3180 ttagtcggtg ttattattta tgtttaattc gttgttataa tttttatttg agttggagtt 3240 agggagaagt tgacgtttgg aagagttagg ttattttgaa atgttttgtt tgtaggtagg 3300 aaagttgttt ttgttttgtt ttttttggtt tttgagaggg aaattgtttt ttaaggtgat 3360 ttattttttt ttattttatg aatgtaatta ggttttaagg tttgttaata ttttttgaga 3420 aatgttttta ggtttgattt attgttattt tttaattttt agtttatttt tttgtgttag 3480 aaatattata agagtttttt aattgttttt ttcggttttt ggttttatgt tatttaagtt 3540 attttgagta ttaggttata ttaattttgt taaaatgtag tataattatg ttatgatttt 3600 tttttaaatt tttttatggt tttttttttt ttgagagagt taatttaaat atttttgttt 3660 ggttttcgag gttttttgta atcgatttta ttttttttta tttatttttt tttttatttt 3720 ggtcgtaata aggttatttt ttattatttt ttgtttttat tatgtttatt ttatttgttc 3780 gtcgtttata tttttttttt tgttttgttt tttttattta tttttgtttg attaagtatt 3840 tttttttatt taaggtttag tttgttaatt ttttttggat tatagttatt tattttaatt 3900 ttttaggttt tagtatttcg atagggtaaa tttaggttgt gtttatagtt tatttggata 3960 tatatttaga ttttttttta tagggtagga atttgggatg ttataggtgg gttattttgt 4020 ttagtgttag gttgtggtag agttttgagt taggatttta gtttagtttt gatgtttagt 4080 tagtgttttg tttattttat ttttaatttt ttatgtaatt tgggttttag ataagtaata 4140 ttgagttatg attgtttaat tgatatgggt gattgttttt tagggggttg gttttatttg 4200 ttttaattag atagtttttt gaggttaggg tttatgttgt attgttgtgt tttttttttg 4260 ttgttttagt gttgatttta ttaatttttt taataatttg tttttttttg tttttgtata 4320 gtttttagat ttttgttaag gttttttgat agttattttt tggattttta ggaagatttt 4380 aatttatagg gagtttttag tttttttttt ttttagatgg ttttttattt ttttttaagt 4440 tttttgaatt ttttttattt atttattgtg gtatttttta tataagttgg ggttggagtg 4500 attagtgtta ggttgttatt ttaggaaacg tatttgttta taagataata aaggttgttt 4560 tttaagttgg aatgtttgta ttaattttta tttgatttat ggtattagga atgttatttt 4620 aggagtgatt tttaatagat aatagttgta tttttcgtat ttgggagtat attttgaata 4680 gtaatgttta tataacgttg atagtttgta gagtaatttt ttatttattg ttttattttt 4740 tttgataata gtttggtgag gttagaaggg taaatattat tatttgtatt taattagtta 4800 atgaggatgt gaaggttata gagtttgggt gttttggttt tttttttaaa ttgaaatgag 4860 gttttgttat gttgtttagg ttggtttcga atttttggat ttaagggatt tttttgtttt 4920 gatttttaaa attgttggaa ttggttaggc gtagtggttt acgtttgtaa ttttagtatt 4980 ttgggaggtt gaggtgggag gattacgtgg ttaggagttc gagattagtt tggttaatat 5040 agtgaaattt tgtttttatt aaaaatataa aaattagttg ggtatagtgg taagagtttg 5100 tagttttagt tatttgggag gtttaggtaa gagaatcgtt tgaatttggg aggtggaggt 5160 tgtggtgagt taagattgtg ttattgtatt ttagtttggg cgatagagtg agatagtttt 5220 agaaaaaaag aaagaaaaga aaagagagaa gagaagagaa aagaaaagga aagaagaaaa 5280 agaaaaaaag aaaaaaatgt tgggattata gacgtgagtt attgtgttta gttttataga 5340 gtttgttaag gttttaaaga gagcgaaaaa acgaaaatta agattagtgt ttaaattatt 5400 ggagtatttt agaattttga tattatggga ttgttatgta tagtttgttt taaagagatg 5460 tttcggaaga gattttaatt tagtattttt attagttgga ttagtggttt ttaatttggt 5520 tgtattaaag ttatttaggg agtttttata aatgttgatg tttaagtttt atttagagat 5580 tggattaatg tgaatgtcgt ttaagtttta ttttttaata gttttttagg tgaaatttag 5640 gtgttgttag gaatgaggat tattgattta gattttagtt ttttatggga atatttggaa 5700 gaaatgttta aaatgaattg atttataatt tttttagtag tttttgttgg atgttgaagg 5760 tagttgtttt agggttttag tggttttgta gattttgagt ttagtggggt gaaggttatt 5820 gtgattttat tagcgttgta gatagttttg ttttttgcgg gagaaggttg ttgaggagat 5880 attggttatt tagtttttgg agaggttgga gttgtaaaat tatattttta gtttgttttt 5940 tttttttttt tatttgttta aagttttgat ttttaatatt ataatagggt tagtaaatta 6000 gtaattatta agttaaaatt gtggtttgta atattttatt tggtttat 6048 49 9265 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 49 ttttattaat aaagggttgt tttgttttaa gggttttttt agatgttaga tatataaaat 60 ttttaagttt tagtgttata aattttatgt gaaaatttag gttgttgggg agtttatttt 120 ttaaagttta gtataaataa agttatataa tagtaaatga tatatataaa tagtaaaagt 180 aatattatat tttttatttg gaaagaaaaa atattaattt ttgaaaatag gtagaaattg 240 agggaaaaga atgattttaa ttggtattcg agattttgat aatgttaata tttagaatat 300 tattaatttt agtagtagtt tgttgtttta tttttttttt ttttttttta ataggttttg 360 atttattttg gagaggagta ggaagtaata tgagtaggaa tttttgggag gttagaataa 420 ttaatttgcg tatggtgagt aattgttttt ttatattatt ttttaaaata gatatgttat 480 ttatttagaa ttatagtttt ggaagggaat ttatgaatgg tataggtgag gagattgtag 540 attggtttaa ttgagtgatt ggttttagaa tttagttaag tttattaagt aatacgaaag 600 tattagattt ttaaagattg aattatagtt tttattataa atagttaatg ttaaaaatgt 660 taatattttt tttttatttt aaaagagtat ttttaaaata ggtttttata gttttgatag 720 tgagaataat ttgttttatt tttatttatt gaatatttta aaaataattt gtttattgtt 780 aattaagttt tttttttttt ttaggattgt cgaaagaaat ataaagacgt aaaaaggaaa 840 atgaaattaa aataataaat gttagttggt tttgatattg aatgtgaata aggtttattt 900 aaggaaattg atttagaaaa tagttttagt tgataaagaa gaaattttag agtgaaggaa 960 ttttaaaaat ttggttgacg gaatattatt ttggttgtta tttttttttg tggaattttt 1020 ttgtattttt ttttaagtaa ttattttaaa aattaaattt aattttttat aaaggaagaa 1080 taagatagtt tttgaaaata ttttttgtat ataatttttt tgttttttat tttgagtaat 1140 taatggatat ttttttatgt aaggtttata tgaagttttt ttaaataaat gagttaaagt 1200 atttgtattt tttagtttag gttttgtgtg aattataggt tatttgaaat tttatttttg 1260 attatgttaa atatattttt tattttgtta tttttgttta aattgataaa ttataagtta 1320 atattgagtt ttatatttgt gttttggtga atggttaatt gaaatatagg atattttaga 1380 ttaatattat ataagagttt tgtgaggatt aggagaggaa gttaaatata gttattttgt 1440 tattgttttt aggaattaag gaataatatt tagatgtata ttaattttaa aattttagtt 1500 agattaaaag tttatgaaaa atattaagtg tttgaaagat aggtagttat aattaggagt 1560 taggattttg agtttaaata gggaaataga tttaatatta tattaaataa attaatttgt 1620 ttagatttta agatatacgt tttttattaa aatgggtttt gtatgaaata gtattatata 1680 ggtcgggcgt gatggcgtat atttgtaatt ttagtatttt gggaggttaa ggcgggcgga 1740 ttatgaggag gttaggattt taagattagt ttggttaata tggtgaaatt ttatttttat 1800 taaaaatgta aaaattagtt gggtgtggtg gtttatattt gtaattttag ttgttaggga 1860 ggttgatata ggagaattat ttgaatttag gaggtagagg ttgtagtgtt gagattatgt 1920 tgttgtattt tagtttgggt aatagagtga gattttattt taaaaaaaaa aaaaaaaaga 1980 aatagtatta tatagtttta agggattatt attaagttat gatgtgtgta tttaaaatta 2040 gtatttattg atttatttat gttgaatata aatttttaat tgttgggatt ttatttggtg 2100 tgttaattat tatgatttta gggtttatgt tttatgtttt tttagtaagg gtttaaggaa 2160 ttaaataatt tgaagagtaa ttttggattt ttaggttttt aaaattttag attttaagga 2220 gagtgtggat aattaagtag taggataaat aatttatatt ttttattttt ttttgatgta 2280 gattatattt gtattttatt ttttattgtt gtatagtaaa ttattttagt aataattatt 2340 tattttatgt ataaatattg taatttggtt aatatttatt agggattgtt gatttgtgtt 2400 gtgtgttttt attggggtgg tttagttagg gttacgggat ttgtttttaa gatggtttat 2460 ttagtgtttg tttatgggtt tttttatagt atagtaaaaa agttttagga gtaagtgttt 2520 ttagaggtag gaagtagatg ttgtttgttt tttaaggttt ggtttagaaa tcggtttagt 2580 tattttattg tattttatag gtttaaattg atatatagtt taattagatt gaaagggagg 2640 ggatatagat ttttattttt tagtgggagg agtgttagaa tgtgtggtcg taatttaaat 2700 tcggtatatg ttttataagt agataaataa gtaatattaa gtagttttgt ttatttttta 2760 gtttttgttt tttagatgaa attattttta gtaatttaat ttttttagta tttattttta 2820 tgtttttatt taatatgttt atgttttgat tttttggttt tttattttta gatattatat 2880 attttgaaaa ggtgaaaaaa ttatttattt ttttagttta agtaatatat tttgattata 2940 gttaattttt ttgttggaat ttttttattt gtttaatttt ttttagattt agttttttta 3000 tattttttaa ttgtgggata tgatgaggtt tttttttaaa tagtttgatt aattttttat 3060 tttttaattt atagtgtttt tttttttttt tttttttttt tttttttttt gtttttgtta 3120 tatgtttaga taggttatag tattaggcgt tattagtatt agttcgtatt ttttattcga 3180 agagaagatt agttttttag tttattatag atagtttttt tttttttttt ttttttttta 3240 cgtgtttatt ttatttaaag aaagttaaaa tgtttagtta attgtggtta ttttagattg 3300 tgaggtttaa tttcggttaa tggagaaagg gtataggggt agggtttgtg ttagggataa 3360 aggttttcgt gtttttttgt tttggtgtgt ttttatggtg attggttaag gagaagtatt 3420 tttttgcgta gaagtaaaat tgttttgttg aaaatttttt gtttgaatgt ttaatttttt 3480 taggattttg agtattattt ttaatataat agtattatta atataaatgt tttttaatta 3540 aatttttaaa taattagatt tggtttattt tatttttgtt taggagtttt ttgtttggtt 3600 ttatttgggt tttttggata ggtgataaaa atgaattgaa taaggtggta acgtgaggaa 3660 tgtgaaaatt ttaaatatat tttaaatatt tttagttaat taataagatt tgtagttatt 3720 aaattatgta cgttatgtga gtatagttag aatattgagt tatttatgat ggaggatatg 3780 aaattatttt aattttttat atagggttaa gacggtaagt aaagttaaat atatgttgaa 3840 tagattatta aaatgttttt aaatttaata agaaattgta ttttatttat tttaggttag 3900 ataaattttt tatatttttt taacggatat aataggtagt tacggaatta tttttaattt 3960 ggtaagattt agaatttttt ttagaggttt tggggttaaa gttcgaggtt tattgttttt 4020 tgtaaggttt tagattttaa ttagtagatt agtaaggtat taagtcgatt tatagtaatg 4080 ataataagta tgtaggtcgg gtgtagtggt ttatgtttgt aattttaata gttaaggagg 4140 ttaaggtaag tagatcgttt gagtttacga gtttgatagt agtttaggta atatagtaag 4200 atttcgttgt tatagaaaat ataaaaatta gtcgggcgtg gtggcgttag tttgtagttt 4260 tagttatttg gttagggatg aggtgcgagg attatttgat tcggggaggt tgaggttgta 4320 gtgagttatg atcgtgttat tgtattttag tttgggcgat agaatgagat cgttttttaa 4380 aaaaagaaaa aaaaatcgtt tgtgtaatgt ttttattatc ggaaatattt taagtaaaat 4440 ataataaaat ttttaaattt ggttgttaga tttttttttt ttttttgtta ttatcgtttt 4500 acgtagttat ttatgatagg agaagcggtt ttggggtcgg cggtttaggg tttaaaagta 4560 taattattaa agttattttt tcggaagttg ttgtttgtcg ttattaattt aggtacgaag 4620 tgtttagtta gataaatatt gataaaagta aataagatga agaatatgag tttcgatttc 4680 ggcgtttttt tttagtgggt cgttatttat tcggaggtgt ttataattcg agtgagattt 4740 cggtttatat tattgtaacg gatataagta gtacgtatag cgtcgttttt agcgttggtt 4800 cgttttttac gtggaggcgt aaaattagta agtattattg tcgtattatt cgagttagtg 4860 ggcgtaatta tgttcggcgc gattaatcgg cgtttggttt gttggtaggt gttaggtagc 4920 gcgtattgat tggtcggtgc ggagtttgtt ttttttattg gatttcgtat ttttagcgcg 4980 ttgtattatt ttcgtgcgtt cggttgtagc gtggacgtcg gatgagttgt ttttaggttt 5040 gttggttcgc ggggttgttt aggtacgcga ggttttttag gtacgttttt ttttttttgt 5100 aggattcggt ttttaaagac gagggttacg tacgcgttat aatttcgaaa tagtagtata 5160 agatttaatt tttaaaagag cgtgtttttt cggggtttgt cgttcgttcg tttttagttt 5220 taggaattta tggtcgtttt tttgaatgag gtagtgtttg aaatgagtaa aattttttta 5280 aaatgatata tatagtataa attgatatag ttgtgatttt atgtataggt aatacgtatt 5340 tttatatgtt ttaatttatt atttttaatg gttgcgagat atttatttta ttgatgtatc 5400 gtaatttatt ttagttatta tgaatattta gattgttttt agttatttgt ttggagaaat 5460 aattattcgg tgaatgttat tgtatatata ttttgtatat ttgtatgagt atatttgtgg 5520 agtttatgtt aataggatat aattaaattg aggaaacgtt tgagacggtt ttatttttag 5580 gttatatttg atttaataga ttatgaagat ttgagaataa aaggagaaat agaaatggat 5640 ttagaggaga atgaaaaggg ggaatagaaa taggtttata ggtaggattt atatgatttg 5700 atgattaatt ggttgtgtgt attttttgag tagtgttagg ggtgatttaa aaatgttatg 5760 tttaagtaat gggaagaata ttggaattat taatatagta gtttaaaagg gaagtaattt 5820 tggaaggaat tatgaaattt taaataaaat atggttttag tgtgcgtttt taaaatatat 5880 tgaggtaaaa taatatgaag taatgtgaat aatatgtagt taatattagg gagggtggtt 5940 tcgaaattgt tgaacgggaa gttgaggtta aggtgatttg aaggagttgt ggagtagcga 6000 agagttaagg gtttggatta taataagagg gaagtaaagg ggatggtatt tttttgtata 6060 ataaggttgt tgtgtaaggt taatttgttt tgtttttgtt ttgtggttgt tggatgttgt 6120 tgtgtatgga tagtttttta gtggattcga tgggttatag taattttgtg atttatgtat 6180 ggaggttgtt tttttttagt agttgttata gttcggtcgt tggtatatga ttttttttga 6240 atagttaatg ttgttatatt gagtgtttat gtttgacgta ataatgtagt gatttttaat 6300 ttttggggaa agtagagatt ttttaaaaaa tatagtaaaa gttgaatgag ttggttaggt 6360 atagtggttt atgtttgtaa ttttagtttt ttgggagttt agggtaagag gatcgtttta 6420 gtttaggagt tgaagattag ttagggtaat atggtaaaat tttgttttta taaattattt 6480 tttttttatt aaaaaaaaaa aaaaaaaaag ttgagtgtgg tggtgtatat ttgtagtttt 6540 agttatttgg cgggttaaat tgggaggaat atttgaattt agggaggtta aggttgtagt 6600 gagttatgat tgtgttattg tattttagtt taggtgatag agtgagttat tgttttaaaa 6660 aaaaaaaaaa aaaaggaatg attttttttt tagaaagttt aaattttatt tttttaaaaa 6720 taaaaattta gatagatatt tttgaataat tgttagaata gtgtaagagt ggtgatgttt 6780 agattttgat gtgaatgttt attttttagg gattttgtta aaatgtaggt tttgattcgt 6840 aggtgcgagg tgaggttggt aagtttgtat ttttaataag tttttataga tgtgggttat 6900 agtaggatta gttttgaaga gattagaatg tgttggtatt taaaggtttg ttagttttta 6960 gataataatt ttataagttt tagttggttt ttgataaggt atataatgaa tttaaataaa 7020 ttagtaaatg tataaatatt tattttggtt tttgaaaggt tagaggttat aataagagtt 7080 gaagatttaa aatgttttaa attttttgtt taatattttt taatggtata ttgtgattag 7140 aaatagttat tttagttagt taaatagttt aattgttttt gttttgtttt tttttaaatt 7200 aaatttagag gtatttatat atttgaaaaa ttaatgaggg taaaagaaaa tgaaagatat 7260 tatttgttat agattttttt ttaaatgata atttgaatta ataatttgat tagattatga 7320 tgtttttgat gtttttaaaa ttgtttgagg tatgtaggtg tttttttttg tagagttgat 7380 tattttggtt tgttgtggtt tttgagtatt taagattttt tatttttttt gttgtttttt 7440 tattagtaat tttatttttt tttgatttga tattgatttg gaaagttcgt tatttatttt 7500 gttagaattg ttaagtaaat ataaatagat tttgagaagg aaaggtttta agggtggttt 7560 attagatatt taagttatag attgattaag tatttttgta tgaggttatt agtaaaatat 7620 ttaaaaagat attttaagat tttttttatt agggattaaa ttagaaaggt atagggttta 7680 ttttttataa aaattatgaa taagtaataa aaagggtaaa atggaaaatt ggaatttata 7740 tttgaatgtg agatttttat ttttttagtt ttaagatttt ttaagtttta ttagtttttt 7800 ttaaagagaa gatgaagtta ttttaagaga attgattttt gttatgtgag tgtaggtaag 7860 aaaattttta attattttga gatatttttt tttagattat taatgagttt tttgtattat 7920 tagatagaat ttttaagatt tttttgttta tttttggaaa tattgttttt attattattg 7980 aatattaaat aatagttatg tatttttttt ttatattata tacgaaaata aaattatttg 8040 tggtttaaat gtaagcgaaa aatttataat tttgtttagg taatggttta ttgatgatat 8100 taaaagttta agtagtaaaa ttaaaaattg ataaattggg tattattaaa atgaaaaatt 8160 tttgtgtttt aaaaaatgtt attaagaaaa taaaaagacg gtttatagaa taggagaaat 8220 tttttataaa ttatatattt gataaaggat ttgtatttag gatgtatata taatttttaa 8280 aatttaatta taaaaagagt ttaattagaa aataggtaaa ggataaatat ttatttaacg 8340 tggatacgta aatggttaat aagtatgtgg aaagatgttt agtattatta gtttttaggg 8400 aaatgtaaat taaaattata agatattatt taatattttt tagaatgatt gtaatttaaa 8460 gatggataat aagatgtgtt gggtaagatt tgaagaaatt agaattttta tttattgttg 8520 agggaatgta aaatagtata gttattttgg aaaaattttg gtattttttt aaaaagttaa 8580 atatagaatt attatgtgat ttagaaattt tatttttagt tataaattta agagaaatga 8640 aaatatagat ttatataaaa ttttgtatgt gaatgtttat agtagcgtta ttcgtaataa 8700 ttaaaaagtg gaaataatat aggtatttaa gaaatgatga atggataaat aaaatgtggt 8760 atatttatga aatggaatat tatttagtta ttaaaagtaa tgaagtatga atatatatta 8820 tattatggat gagttttgaa aatatgttag agaaaggaaa ttagatgtaa taggttatat 8880 atagatgatt tttataaatt tttttattta tatgaaatgt ttagaatagg taaatttgta 8940 gggatagaaa gaagataaat cgttgttatt ggttatggag aagaaagaat ggggagtgat 9000 tgttaatggt tttggggtgt tttggtgggg aggggaggtt gaaaacgttt tgaaattagg 9060 tattattagt tatattattt tgtaaatata ttaaaaagtt attgaattgt atatttttta 9120 tattatatta tgtaaattgt atattaataa agttgtaatt ttttaaaagt atggatagtg 9180 ttatgtatat ttatgttaat aatatggtat tttgttattt ttagattttt tttttgatag 9240 taataaattt gatttttttt gtagt 9265 50 9265 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 50 gttgtaaaag aaattaaatt tattattgtt aaaagagaaa tttaggaata atagagtatt 60 atattattaa tatgggtgta tatgatatta tttatatttt taaaaaatta tagttttatt 120 gatgtataat ttatatagtg taatgtaaaa agtgtataat ttagtggttt tttagtatat 180 ttataaggta gtataattag taatatttaa ttttaaaacg tttttaattt ttttttttta 240 ttaaaatatt ttaaaattat tagtagttat tttttatttt ttttttttta tagttagtgg 300 taacgattta tttttttttt gtttttgtag atttatttat tttggatatt ttatataaat 360 gggaaaattt ataggaatta tttatatgtg gtttattgta tttggttttt tttttttagt 420 atgtttttaa ggtttattta tgatgtaata tgtatttata ttttattatt tttgatagtt 480 gaatagtatt ttattttatg aatatgttat attttgttta tttatttatt attttttgga 540 tatttgtatt gtttttattt tttggttatt acgaataacg ttgttatgaa tatttatata 600 taaaattttg tgtggattta tgtttttatt ttttttgggt ttgtagttag aagtagaatt 660 tttgggttat atgataattt tgtatttaat tttttgagaa aatgttaaaa tttttttaaa 720 gtgattgtat tattttatat ttttttagta gtgaatgagg attttaattt ttttagattt 780 tatttaatat attttattgt ttatttttga attatagtta ttttaggaga tgttaagtag 840 tattttgtgg ttttgatttg tattttttta aggattaatg atgttgagta tttttttata 900 tgtttattgg ttatttgcgt atttacgttg gatagatatt tattttttgt ttatttttta 960 attgggtttt ttttgtggtt gggttttaag ggttatgtat atattttgga tataaatttt 1020 ttattagata tatgatttat aaaaaatttt ttttgttttg tgggtcgttt ttttattttt 1080 ttgatggtat tttttgaagt ataaagattt tttattttaa tgatgtttaa tttgttaatt 1140 tttggttttg ttgtttgagt ttttggtgtt attaataaat tattatttaa ataaggttat 1200 agatttttcg tttatattta ggttataaat aattttattt tcgtatatgg tgtgagggag 1260 gggtatatgg ttattattta atatttagta atggtagaga taatgttttt aaaagtaagt 1320 aggaaaattt tggaaatttt atttagtggt gtaaaaaatt tattaataat ttgaagaaaa 1380 atattttaaa gtagttaaga atttttttat ttatatttat atgatagaaa ttagtttttt 1440 tgaagtaatt ttattttttt tttgaggaaa attggtaaaa tttaaaaaat tttaaagtta 1500 aaaagatgag aattttatat ttaaatatag attttagttt tttattttat tttttttatt 1560 gtttatttat gatttttatg aaggatgagt tttatatttt tttggtttag tttttaatga 1620 gagaagtttt aaagtgtttt tttaaatgtt ttgttaataa ttttatgtag agatatttga 1680 ttaatttatg atttaagtat ttagtgagtt atttttgaga tttttttttt ttaaagttta 1740 tttatattta tttaataatt ttaataaggt gggtgacgag ttttttaagt tagtattaga 1800 ttagaagggg ataaaattgt taataaggga ataatagaga agataaaaaa ttttaagtat 1860 ttaagaatta taatagatta gggtaattaa ttttatagga aaagatattt atatatttta 1920 aatagttttg aaagtattaa aagtattata gtttaattaa gttattgatt taagttatta 1980 tttaaaaaaa agtttgtgat aagtagtatt ttttattttt ttttattttt attaattttt 2040 tagatgtgtg agtgtttttg agtttaattt aagaaaaaat aggataagaa tagttgggtt 2100 gtttaattaa ttgaaatagt tatttttgat tatagtatgt tattaaaagg tattaaatag 2160 aaggtttaag gtattttaga tttttaattt ttattataat ttttagtttt ttaaggatta 2220 aaataagtgt ttgtgtattt attgatttat ttaggtttat tgtgtatttt attagaggtt 2280 aattgaaatt tatgggattg ttatttgaag attaatagat ttttagatat taatatattt 2340 taattttttt aaggttggtt ttattatggt ttatatttat gggagtttat tagagatgta 2400 gatttattag ttttatttcg tatttacgag ttagaatttg tattttaata agatttttag 2460 gggatgagta tttatattaa agtttgaata ttattatttt tgtattgttt taataattat 2520 ttaggaatat ttatttgaat ttttattttt gagaaaataa gatttaagtt ttttgagaag 2580 aggattattt tttttttttt tttttttttg agatagtggt ttattttgtt atttaggttg 2640 gagtgtagtg gtataattat ggtttattgt agttttgatt tttttgggtt taggtgtttt 2700 ttttagttta gttcgttaag tagttaggat tataggtgtg tattattata tttagttttt 2760 tttttttttt tttttggtgg ggagggggtg gtttgtagag atagggtttt gttatgttgt 2820 tttggttggt ttttaatttt taggttaaag cgattttttt gttttgggtt tttaaagggt 2880 tgggattata ggtatgagtt attatgtttg gttagtttat ttagttttta ttgtgttttt 2940 tagggagttt ttattttttt taaagattaa gaattattgt attattacgt taagtataaa 3000 tatttagtat aatagtattg attatttagg aagaattatg tattagcgat cgggttatgg 3060 tagttgttga ggagaagtag tttttatgta taaattatag gattgttatg gtttatcgaa 3120 tttattggag agttgtttat gtataatagt atttagtaat tatagggtag ggatagagta 3180 ggttaatttt gtataataat tttgttgtgt agagggatgt tatttttttt gttttttttt 3240 tattataatt taggtttttg atttttcgtt gttttataat ttttttaggt tattttaatt 3300 ttaatttttc gtttagtaat ttcgagatta ttttttttga tattaattat atattattta 3360 tattatttta tattattttg ttttaatata ttttagaaac gtatattaaa attatgtttt 3420 gtttaaaatt ttataatttt ttttagaatt gttttttttt taaattattg tattagtggt 3480 tttaatattt tttttattat ttaggtatga tatttttgag ttatttttga tattatttag 3540 aagatatata taattaatta attattaagt tatgtggatt ttatttataa gtttattttt 3600 gttttttttt tttatttttt tttaaattta tttttgtttt tttttttatt tttaggtttt 3660 tataatttat taagttaaat gtaatttgaa agtgggatcg ttttaaacgt ttttttaatt 3720 tagttatatt ttattaatat agattttata ggtatattta tgtaaatgta taaaatgtgt 3780 atataatgat atttatcgaa taattgtttt tttaggtaaa taattgaaaa taatttaaat 3840 atttatggtg attgaagtaa attacggtat attaataaaa taagtatttc gtagttattg 3900 aaggtaataa attaagatat ataaaaatac gtattgttta tatataaagt tatagttata 3960 ttaatttata ttatgtatat tattttaaaa agattttatt tattttaaat attattttat 4020 ttaaaaaggc gattataaat ttttgaggtt ggaaacgaac gaacggtaag tttcgaagaa 4080 atacgttttt ttaaaaatta aattttgtgt tattgtttcg gggttgtaac gcgtgcgtga 4140 ttttcgtttt tgagggtcgg attttgtagg gaagagaggg cgtatttgag gggtttcgcg 4200 tgtttggata gtttcgcggg ttagtaagtt taaaagtaat ttattcggcg tttacgttgt 4260 aatcgggcgt acggaggtga tgtaacgcgt tgaaaatgcg ggatttagtg aaggagatag 4320 gtttcgtatc ggttaattag tgcgcgttgt ttgatatttg ttaataagtt aggcgtcgat 4380 tggtcgcgtc ggatatgatt gcgtttattg gttcggatgg tgcgatagtg gtgtttgttg 4440 gttttgcgtt tttacgtgga aaacgaatta gcgttgaggg cggcgttgtg cgtgttgttt 4500 gtattcgttg tagtagtgta gatcgaggtt ttattcgggt tgtgggtatt ttcgggtagg 4560 tgacggttta ttgggaaggg gcgtcgaggt cggggtttat gttttttatt ttgtttgttt 4620 ttgttagtat ttatttgatt ggatatttcg tatttaaatt gataacgata aatagtaatt 4680 ttcggagagg tggttttaat aattatattt ttgggttttg agtcgtcgat tttaaagtcg 4740 ttttttttat tataaatggt tacgtgaaac gataataata aaagggaagg aagggtttga 4800 taattagatt taaaagtttt attgtatttt atttaaaatg ttttcggtaa tgaaaatatt 4860 gtataaacga tttttttttt tttttttgag aagcggtttt attttgtcgt ttaggttgga 4920 gtgtagtggt acggttatgg tttattgtag ttttaatttt ttcggattag atgattttcg 4980 tattttattt ttggttaagt agttgggatt ataggttagc gttattacgt tcggttaatt 5040 tttgtatttt ttgtagtaac ggggttttgt tatgttgttt aggttgttgt taaattcgtg 5100 ggtttaagcg atttgtttgt tttagttttt ttaattgttg ggattatagg tatgagttat 5160 tgtattcggt ttgtatattt attattattg ttatgagtcg gtttggtatt ttattgattt 5220 gttggttaaa atttggagtt ttgtaaaggg tagtaggttt cgggttttgg ttttagagtt 5280 tttaaaggaa attttggatt ttgttaaatt gggagtagtt tcgtagttgt ttattgtatt 5340 cgttagaggg atataaaaaa tttatttggt ttagaatagg tagaatgtag ttttttatta 5400 agtttaggaa tattttgata gtttgtttag tatatattta attttattta tcgttttggt 5460 tttgtgtgaa ggattaaagt ggttttatgt tttttattat gggtaattta gtgttttgat 5520 tatatttata taacgtatat aatttaatag ttgtaaattt tgttaattaa ttgaaagtat 5580 ttggaatgtg tttgaagttt ttatattttt tacgttgtta ttttgtttag tttatttttg 5640 ttatttattt agagagttta gatagagtta gatagagggt ttttggataa aggtgaggta 5700 ggttaagttt aattatttaa aaatttgatt gagaaatatt tatattaata gtattgttgt 5760 gttggaaata atgtttaaaa ttttaaggaa attgaatatt taaataaagg atttttagta 5820 aagtaatttt atttttgcgt agaggggtgt ttttttttgg ttagttatta tgagagtata 5880 ttagaataaa ggggtacgag aatttttatt tttgatataa attttgtttt tgtatttttt 5940 ttttattggt cggagttggg ttttataatt taaaataatt atagttggtt aaatatttta 6000 atttttttta gataaggtgg gtacgtaaga gagaggggaa agggggaagg gttgtttgta 6060 atgagttaga gagttagttt ttttttcgga taaggaatac gagttggtat tgataacgtt 6120 tggtattgtg gtttgtttag gtatgtaata aaggtagaaa ggaaagagga gaaaaaggga 6180 agaggggggt attgtgaatt aaagaataaa ggattgatta ggttatttga agagaaattt 6240 tattatgttt tatagttgga aggtatggga agattaagtt tagaaaaagt taagtaaatg 6300 aaaaaatttt agtaaaaaag ttaattgtag ttaaaatata ttatttggat tgaagaggtg 6360 aataattttt ttattttttt agaatatgta gtgtttggaa gtgaaaaatt aagaaattag 6420 agtataagta tgttaggtag aaatatggag gtaaatatta gagaaattaa attgttgaag 6480 gtggttttat ttggggagta ggaattgggg ggtgggtaag gttatttgat gttatttatt 6540 tgtttgtttg tgaaatatgt gtcggattta aattacggtt atatattttg atattttttt 6600 tattaagaag tgaggatttg tgtttttttt tttttagttt ggttgggttg tgtgttagtt 6660 taaatttgta gaatatagtg aagtgattga gtcggttttt gggttaggtt ttaagagata 6720 ggtagtattt gttttttgtt tttgagaata tttgttttta gagttttttt gttatgttgt 6780 aaggaagttt atgaataggt attgagtggg ttattttaga aatagatttc gtagttttag 6840 ttgaattatt ttagtgaaag tatatagtat agattagtag tttttagtga gtgttgatta 6900 aattgtagta tttgtgtata aaataaatga ttgttattga gatgatttgt tatgtagtaa 6960 tagaaaataa ggtataaatg tgatttatat taagagaagg tagaaagtgt gaattattta 7020 ttttgttgtt tagttgttta tatttttttt gaagtttgaa gttttggaaa tttaggaatt 7080 tagaattatt ttttaagtta tttagttttt tggattttta ttaaaaaaat atagagtata 7140 agttttaggg ttataatggt taatatatta gatgaaattt taatagttaa gagtttatat 7200 ttagtatagg taaattaata aatattaatt ttaggtatat atattatggt ttaatgatag 7260 ttttttggaa ttatataata ttattttttt tttttttttt ttttaagatg gagttttatt 7320 ttgttattta ggttggagtg tagtaatatg attttagtat tgtaattttt gttttttggg 7380 tttaagtgat ttttttgtat tagttttttt agtagttggg attataggtg tgagttatta 7440 tatttagtta atttttgtat ttttagtaga gatggggttt tattatgttg gttaggttgg 7500 ttttgaaatt ttgatttttt tatgattcgt tcgttttggt tttttaaagt attgagatta 7560 taggtgtgcg ttattacgtt cggtttatgt aatattattt tatatagagt ttattttgat 7620 aggagacgta tgttttgaaa tttaggtagg ttggtttatt taatgtaatg ttaaatttgt 7680 ttttttattt gggtttaggg ttttgatttt taattgtgat tatttatttt ttaggtattt 7740 ggtatttttt ataagttttt agtttaatta gaattttggg attggtgtat atttagatgt 7800 tgttttttaa tttttagagg taatgataag ataattgtat ttggtttttt tttttggttt 7860 ttatagaatt tttatatgat gttggtttga aatgttttat attttagtta attatttatt 7920 aaaatataag tataaaattt aatgttgatt tgtaatttat tagtttaaat aaaaatgata 7980 aaatggaagg tgtatttgat ataattagaa ataaaatttt aaatagttta taatttatat 8040 aaagtttagg ttggaaaata taagtgtttt gatttattta tttaaaaagg ttttatataa 8100 attttgtatg agaagatgtt tattagttat ttaggataga gggtaaagag attatatata 8160 aaaagtattt ttaaggatta ttttgttttt tttttataag aagttgaatt taatttttga 8220 agtaattatt taggaagaaa tgtagaggag ttttatagaa aaagatggta attagaatga 8280 tatttcgtta gttagatttt taaaattttt ttattttgaa attttttttt tgttagttaa 8340 aattgttttt tgggttagtt tttttaggtg agttttgttt atatttagta ttaaaattag 8400 ttgatattta ttattttggt tttatttttt tttttgcgtt tttatgtttt tttcgataat 8460 tttaggaaaa aaaaaagatt tggttagtaa taaataaatt gtttttaaga tgtttagtag 8520 atagaagtaa aataggttat ttttattgtt agggttgtgg aaatttattt tgaaagtgtt 8580 tttttgaaat gaagagggga tattggtatt tttggtatta attgtttata atgggaatta 8640 taatttagtt tttaaaaatt tgatgttttc gtgttattta ataggtttgg ttggattttg 8700 agattagtta tttaattgag ttagtttgta gtttttttat ttatattatt tatgagtttt 8760 tttttaggat tgtaatttta gataggtaat atgtttattt taggaaataa tatggagaaa 8820 taattattta ttatacgtag gttggttgtt ttggtttttt aagagttttt gtttatatta 8880 ttttttattt ttttttagaa taagttagaa tttattaggg gaaaaagaag aaagatgagg 8940 tagtaaatta ttattaaaat tggtaatatt ttaagtgttg gtattattaa ggtttcgaat 9000 attagttaag attatttttt ttttttagtt tttatttatt tttaaaaatt agtatttttt 9060 ttttttaaat gaaaaatata atattgtttt tattgtttat atatattatt tattattatg 9120 taattttgtt tatgttaggt tttaagaaat gagtttttta atagtttgag tttttatatg 9180 gaatttatgg tattaaaatt taggggtttt atatgtttaa tatttaagga agtttttgga 9240 ataaaataat tttttgttga tgaga 9265 51 5586 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 51 atttaggttg gaaggttttt ttttatatag tttattgtag tttttaaatt tttaggttta 60 agggattttt ttttttaagt ttttggaata gttgggatta taagtgtgta ttattatgtt 120 tggttaatat tttaattttt tgtagagata atgttttgtt atgttgttta ggttggtttt 180 aaatttttgg ttttaagtag tttttttatt ttagtttttt taagtgttgg gattatagat 240 gtgagttatt gcgtatggtt taggttttag gttttaataa gaatttttaa gtataattta 300 agttaggatt tttgggtttt aatttcggta ttaaagtaaa tatagtttag tattaataat 360 gtgaattttt aatttggata atatagagaa attattgttt ttatataaaa ttagaaaatt 420 agggttaggt gtggcggttt atatttgtaa ttttagtatt ttaggaggtt aaagcgggag 480 gattttttga ggttaggagt ttaaggttag tttggttaat acggtgaaat ttcgttttta 540 ttaataatat aaaaaaatta ggtatagtgg tatatatttg tagttttagt tatttgggag 600 gttgaggtag gagaattttt tggatttagg aggtagaggt tgtagtgagt taagatgtgt 660 attttagtat tatagtttgg gtgatagaag gagattttgt tttaaaaaaa aaaaaaaaaa 720 aaaattagtt aggtttggtg gtatttgttt gcggttttag ttatggggga ggtttaggtg 780 aaggattgtt tgagtttagg aggttaaggt tatagtgagt tatgattata atgttgtatt 840 ttagtttggg gaatagaata agattttatt ttaaaaaaag aaaaaataaa ggtaaacgta 900 aattttaagt attttatttt ttatttagtt aaaatatata tatatatata tattatatat 960 attaaggaga gaagatataa ttaatgtaaa ataaaaattt taaaaattta gttggtatgg 1020 tagtatgtat ttgtagtttt agttatttag gaggttgagt ggggaggatt atttgagttt 1080 aggagtttaa ggttgtagtg agttgtgatt ttgttaattc gttttagttt gagtgataga 1140 gtaagatttt gttttaaaaa taaataaata aataaataaa aataaatttt ataattttga 1200 ggtagaatta ttattatttt aattttatag aagaggaaat tgaggttaag ttgtttaagt 1260 tatatagagg taattggtag agttggaatt aattttagga tagtttaata ttaatgattg 1320 ggtttttgtt attatgttat gggtaataaa tttagaatat aagggtttta tagattattt 1380 tttttttatt tttatagagg aaattgagat ttttaggtga atgattttgt gttatttagg 1440 aagttagggt agaagtaaga tttgtattta ggtgttgatt ttaaatttta gttttacgtt 1500 ttagaaagtg agaaaattag aagattaggg tggtttttgt tttataatgg agaaaaaagt 1560 tcggacgtag ttattagcgg ggggattaag gataggaaag tagtttggag tatagtggta 1620 ttaaagggta attattggat aattgttttt tatttttaat ttttttttat ttttatttat 1680 ttgttttaag ttggagtttg tatgtgaggt ttgaggaata atattataga tttatagaat 1740 tatggagtgt ttataggtag ggtattagga tagtgagaaa gaagtggagg gagagaggat 1800 tagttggagg aagtagttag gtttagtgag tttttttgtg ttgggttttt tattaagtat 1860 tggttattta aagttaaata agaaaaattt ttttgttttt gaggattagg atagattgta 1920 tggaggagat gatatttgag taggttttag agtttgaaaa gatatagagg agggggcgaa 1980 aatttttgga tttatatgta attgtttatt tgttagttcg atttaatttt ataaatatat 2040 tttaaaggtt ttttttgcgt tgggttttgt tttaggtgtt gggattatag tggtgagtaa 2100 attagttgta gtttttgatt tttggttgga gagtttgttt aggaagatag ttaaataatt 2160 ttaatatagt gtgagatgtg ttttatgtaa ggaatttata aggtattgtg ggataaggga 2220 gtttaattgt ttttaggtta aaagtaagtt ttaatttttg aatatgaaaa aattttttat 2280 aatttaatgt tatttttatt ttttagtttt atttattatt atttttttaa aagttgggaa 2340 tataataaag tatgtgtgtg tgtttgtgta tgtgaatttg aatatgttag gtttttgttt 2400 atattgtttt tgttttttgg tatatggatg tttttttgga gaaatttttt ttaatatatt 2460 tagttttatt taaatttttt tttgtgtttt taaggtaatt tgttttttta ggttgtttat 2520 ttgttttttt aggttggtaa agtttttaaa gtaaggattt aaatgtaagg ttaagagtat 2580 ttattacgga gttatataga tataggtggg ttttgtttag ttaagaggtt ttggttttta 2640 agttgttttt tttatttaga tgaattgtta ttattttagg aaatgtaatt agtattgatg 2700 tttagttttt ggtatatggt aggtgtttaa aaatgttttt tgagttgaat tgtattaata 2760 ttaaggttat aggttagaat ttgtatttta tgaaggtttt ggttatgagt tggatttggg 2820 aagggtttat gattaatttt agtagttttt tgtggttaaa aatgagaaat ataaattatg 2880 ttttttgttt tgaagatttg tttgttagtg ggagaaatag atggttaagt ttttaatagt 2940 ataattttaa atttttagag tagtggtttt taaattttag taagtagatt agaattattt 3000 aaaggttatt tgttaaaata gatggttggt tttagtttta gagtttttga tttaaaggtt 3060 tggagtaagt tttgagaatt cgagtttgta tttttaattt atttttaggt gatattgaag 3120 ttgttggatt gataagattt tttttttgat taaatattgg ttaggttttt ttgagttttt 3180 tttttgatta ggtttgagtg tgggttttta tgttattttt tgtggaattt tattttagta 3240 agaaatttgt taagttagtt tagttagaat tttttatttt tgatatttga ttatttttta 3300 tatttggttt tgatttatat cgttattatt ttttaggtga tgtttagtta ttttgatttg 3360 ttttgggtag gaattttgtt aggttaattt agttagattt ttcgttaatg ttttttttta 3420 gtaatttttt atttattgat ttttatatat tgttttttag ttataaatta ttattttgtt 3480 atatttagtt taatcgtttt gatttatggt aaaattttat ttttattttt gttagattgg 3540 gtttgaataa agtttgtttt attattttta aatatgaata attaagtgtt atgaatagtt 3600 ttttttttaa tgggatttat attttgagaa ttattgatta gaggttaagg gttttgtgtt 3660 tattatttgg tatatattaa tgataggttt ttgagtttga attttggtta attatattgt 3720 tagttttggt tttttttttt tttttttttt gagatagggt tttgtttagg ttggagtgta 3780 gtgatgtaat tacggtttat tgtagtttcg attttttggg ttaagttatt ttgtcgtttt 3840 agtttttcga gtagttgggg ttataggtgt aagtcgttat gtttagttaa tttttaattt 3900 ttttgtagag gtggggtttt attatattgt ttaggttggt tttgggtttt tgggtttatt 3960 tatttcggtt ttagttttgt tttttgatta aattatttat ttttttgtgt ttgatttatt 4020 ttatttgtga aatttagata gtaagttagt gtatggtaag tgtaaaaagt aatatttggt 4080 ataatgttta ataaatgttg gttaaatttt ataattattt tttgtaggaa gtgggacgat 4140 aaagttaagg gtttaggtgg ttagagaaga gtaaggatta tgtttttttt ttgtgtagtt 4200 aggtaggttt tgtatttttt ttttgcgcga tttttttcgg gtagtatcgg gtttcgaatt 4260 tttacgtttt atttttaagt aggttttgta gtttagtttt cgcggttttt tatagttagt 4320 cgatgttgcg taagcgtcgt atttacgttt tagtatatgc gtatttaggt gcgtcggtag 4380 gggacgcgtc ggtatagtaa aaatggcggc ggtattacgg gtggcggcgg tcggggtaag 4440 gtttagcgtt ttggcgagcg gttttcgcgt cgcggttcgt agtttttgta gttaggttat 4500 ttttgttaac gaacgtatcg aaaataagcg tcggatcgcg ttgttgggag ggggttaacg 4560 tcgtattgac gcgtagtata agcgagtgag ttttgagggg tttaagtgag tttcgttttt 4620 ggcgttcgcg atttattatt gcgtgttcgg tttgcggcgt tcgaggtttt tttgttaatt 4680 cgtacggtgt ttggaggggt cggagtaagg gtgtttattt tgaaaatttg tagcgttttt 4740 cgtggaggcg ggtataatta gtagaagtat ttgtgtgttt ttttatattg tttaattttt 4800 gggatttaga cggatttggt tcgtttttag ttagtttaat atttaatata agtttttggg 4860 taatttatta aatttttgtg ggttatttta ataataattt tttttttata agtgtatcgt 4920 tagattatag atagtaaaat gataggcgtt tagtaaaaat tatgtgttta ttttcgtgtt 4980 ttatgaaaga gtgatggtag gttttttttt ttttgtggaa gtaggaaaat tgaatttggg 5040 tatattttat taatatgaaa tgggggatgt gcgcgtgtag gaatttgtgg aatttttgtt 5100 cgtagaatgt ttggtcgagt tttttagggt tttagtatgt ttcgttttga tgggtagtaa 5160 aggtacgtgt cggaagtagg tggttttttt gggagtgcgt aggttatttt cgatgtttgg 5220 ttggattgag tagttgaaat attgttattt atcgtttggg ttttgaggcg agaatttagt 5280 tggtttttag agataagttg ggcggtttat tttggagagg tgatttttga tttgaaatta 5340 ggtttgttta gtgtgttcgt gattggtggg tgagtttgga tcgttgtgtt gaacgaatta 5400 attaacggga aggtgtagaa gtgaaatttt tatagatgaa gagtatttag gtataattta 5460 taattatgag ggaggtattg ggggagggat ggggttttaa agtgaggaga tttgaatagt 5520 tttatatttg tttaatattg atttagatgt tataaattcg tatttgataa gggtttaaag 5580 gtaata 5586 52 5586 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 52 tgttattttt ggatttttgt taaatgcgaa tttatgatat ttgaattaat attagataaa 60 tatagagttg tttaaatttt tttattttaa gattttattt tttttttagt gtttttttta 120 tggttgtgag ttgtgtttga atatttttta tttgtaagag ttttattttt gtattttttc 180 gttggttaat tcgtttagta taacggttta gatttattta ttagttacgg atatattggg 240 taagtttggt tttaagttag ggattatttt tttaaaatgg gtcgtttagt ttatttttga 300 aggttagttg gattttcgtt ttaaaattta ggcggtgggt ggtagtgttt taattgttta 360 gtttagttaa atatcgagag tagtttgcgt atttttagaa aggttatttg ttttcgatac 420 gtgtttttgt tatttattaa ggcgaggtat gttaaggttt taaagagttc gattaggtat 480 tttgcgggta gaagttttat aagtttttgt acgcgtatat tttttatttt atgttagtgg 540 agtatgttta agtttagttt ttttgttttt ataaaggaga aagaatttat tattattttt 600 ttatggggta cgagaataag tatatggttt ttattgagcg tttattattt tgttatttat 660 ggtttaacga tatatttgtg aaggaagaat tattattaaa atgatttata gagatttaat 720 aagttgttta aaagtttatg ttaagtgttg agttggttag agacgagtta gattcgttta 780 aattttaagg gttaaatagt atgaaaaagt atataggtgt ttttgttggt tatattcgtt 840 tttacgagaa acgttatagg tttttaaggt gaatattttt gtttcggttt ttttaggtat 900 cgtgcggatt ggtagggagg tttcggacgt cgtaagtcgg gtacgtagtg ataggtcgcg 960 gacgttaggg gcgggattta tttaggtttt ttaggattta ttcgtttgtg ttgcgcgtta 1020 atacggcgtt ggtttttttt tagtagcgcg gttcggcgtt tgttttcgat gcgttcgtta 1080 atagaggtgg tttggttgta aaggttgcgg atcgcggcgc ggagatcgtt cgttagaacg 1140 ttgagttttg tttcgatcgt cgttattcgt aatgtcgtcg ttatttttgt tgtgtcggcg 1200 cgttttttat cggcgtattt gagtacgtat gtgttaaagc gtgggtacgg cgtttgcgta 1260 gtatcggttg gttgtaggga gtcgcggggg ttggattata gaatttgttt gggagtaagg 1320 cgtgagagtt cgagattcgg tgttgttcga ggagggtcgc gtagagaaaa agtatagggt 1380 ttgtttggtt gtataaaaaa gggatatagt ttttgttttt ttttgattat ttagattttt 1440 aattttgtcg ttttattttt tatagaaaat gattataaga tttaattaat atttattaag 1500 tattgtgtta ggtgttgttt tttgtattta ttatgtatta gtttattatt tggattttat 1560 agatgaggta aattaagtat agagagatga gtgatttgat taagaggtaa gattgaggtc 1620 gaggtaggtg agtttaggag tttaagatta gtttgagtaa tatagtaaga ttttattttt 1680 ataaaaaaat taaaaattag ttgggtatgg cggtttgtat ttgtgatttt agttattcgg 1740 gaggttaagg cggtaggatg gtttggttta ggaagtcgag gttgtagtga gtcgtgattg 1800 tattattgta ttttagtttg ggtaaaattt tgttttaaaa aaaaaaaaaa aaaaaagtta 1860 agattgataa tgtggttggt taggatttaa atttagagat ttattattaa tatgtgttag 1920 ataatgagta taggattttt aatttttaat tagtagtttt taaagtatgg attttattaa 1980 agaaaaaatt atttatgata tttaattatt tatgtttaag aatggtaagg taaattttat 2040 ttaggtttaa tttgatagag gtagggatag agttttgtta taagttagag cgattgggtt 2100 gaatatagta aagtggtaat ttatagttaa ggggtagtgt gtggaagtta gtggatggaa 2160 aattattaag aggaaatatt ggcggggaat ttggttaaat tgatttaata ggatttttgt 2220 ttaaggtagg ttagggtaat tgaatattat ttgggggatg gtggcggtat gggttaaaat 2280 tagatatgga gagtaattag atattaagaa tggaggattt tggttaaatt gatttggtaa 2340 gttttttgtt aaaatggaat tttataagga atgatatggg agtttatatt taggtttagt 2400 taaagagaga gtttagaaga gtttgattaa tgtttgatta aggagggaat tttgttaatt 2460 tagtaatttt agtattattt gggagtgagt tggaaatgta agttcgaatt tttagaattt 2520 attttagatt tttaaattag aaattttggg gttggggtta gttatttgtt ttagtagatg 2580 atttttaggt gattttgatt tgtttgttaa agtttaagaa ttattgtttt aggaatttgg 2640 aattgtattg ttgagagttt gattatttgt tttttttatt aataggtagg tttttaagat 2700 aaagaatatg gtttatattt tttattttta gttatagaaa attgttaaag ttgattatga 2760 gtttttttta gatttagttt atagttaggg tttttataaa gtataaattt tgatttatga 2820 ttttaatgtt aatgtaattt aatttagaaa atatttttga gtatttatta tgtgttaaga 2880 attaaatatt agtattgatt gtattttttg gagtagtaat agtttattta gatagagagg 2940 gtagtttaga ggttaaagtt ttttggttag gtaaagttta tttgtatttg tataatttcg 3000 taatgggtat ttttgatttt gtatttgggt ttttgtttta aagattttat taatttagag 3060 aggtagatgg ataatttaga gaggtagatt gttttgggag tataagagag aatttgagta 3120 aggttgagtg tgttgaggag agttttttta agaaagtatt tatatgttag ggaatagaag 3180 tagtgtgagt aaaggtttgg tatgtttaga tttatatata tagatatata tatatatttt 3240 gttgtgtttt tagtttttgg ggaaatggtg gtaaatgaga ttggaaagtg agaatggtat 3300 tagattgtga agagtttttt tatgtttaga aattgggatt tgtttttggt ttgggggtag 3360 ttggattttt ttgttttata gtgttttgta ggttttttat ataaagtata ttttatattg 3420 tgttaagatt gtttagttgt ttttttagat agatttttta gttaaaggtt agggattgta 3480 gttgatttgt ttattattgt ggttttagta tttggaataa ggtttaacgt agagaaggtt 3540 tttagaatgt atttgtgaaa ttgaatcgag ttagtaaata ggtaattgta tgtgagttta 3600 gaggttttcg tttttttttt tatgtttttt taggttttga aatttgttta ggtattattt 3660 tttttatgta gtttattttg atttttagaa gtaaggaagt tttttttatt taattttaga 3720 taattagtgt ttagtagaaa atttaatata gggaggttta ttgaatttaa ttgttttttt 3780 tagttagttt tttttttttt tatttttttt ttattgtttt aatgttttgt ttatgggtat 3840 tttatagttt tatagatttg taatgttatt ttttagattt tatatgtaag ttttagtttg 3900 gggtaggtgg gtgggggtag gaggaagttg gaggtaggag gtaattattt agtaattgtt 3960 ttttaatatt attatgtttt aggttgtttt tttgttttta gttttttcgt tggtggttgc 4020 gttcgagttt ttttttttat tgtgagatag gagttatttt gattttttag tttttttatt 4080 ttttgagacg tagagttgaa atttggagtt aatatttggg tataaatttt gtttttgttt 4140 tgattttttg gataatatag ggttatttat ttaaggattt tagttttttt tgtaaaagtg 4200 gagagggggt gatttgtgaa atttttgtgt tttgagtttg ttatttatga tataataata 4260 agagtttagt tattggtgtt agattgtttt gaggttagtt ttaattttgt tagttatttt 4320 tgtgtgattt ggataatttg gttttagttt ttttttttgt aaaattggaa taataatagt 4380 tttattttag agttgtaagg tttattttta tttatttatt tatttatttt tgagataggg 4440 ttttgttttg ttatttaggt tggagcggat tggtaggatt atagtttatt gtagttttga 4500 atttttgggt ttaggtgatt ttttttattt agttttttga gtagttggga ttataggtat 4560 atgttattat attagttaga tttttaagat ttttgttttg tattaattat gttttttttt 4620 tttggtgtgt gtggtgtgta tgtgtgtgtg tgttttaatt gaataaaaaa tgaagtgttt 4680 aaaatttacg tttattttta tttttttttt ttttgagata gggttttgtt ttgtttttta 4740 ggttagagtg tagtattgtg attatggttt attatagttt tgattttttg ggtttaagta 4800 attttttatt taagtttttt ttatagttgg gatcgtaggt agatgttatt aagtttggtt 4860 aatttttttt tttttttttt tttaagatag agtttttttt tgttatttag gttgtaatgt 4920 tagagtgtat attttggttt attgtaattt ttgttttttg ggtttaagag atttttttgt 4980 tttagttttt taagtagtta ggattatagg tatgtgttat tgtgtttaat ttttttgtat 5040 tgttagtaga gacggggttt tatcgtgttg gttaggttgg ttttgaattt ttgattttaa 5100 gagatttttt cgttttggtt ttttgaagtg ttgagattat aggtgtgagt cgttatattt 5160 ggttttaatt ttttaatttt gtgtagagat aatggttttt ttatgttgtt taggttgaaa 5220 atttatattg ttagtgttga attgtgtttg ttttgatgtc gagattagaa tttaagagtt 5280 ttagtttaaa ttgtatttaa agatttttat taagatttgg agtttaggtt atgcgtagtg 5340 gtttatattt gtaattttag tatttgggga ggttaaaata ggaggattgt ttgaggttaa 5400 gagtttgaga ttagtttggg taatatggta agatattatt tttataaaaa attaaaatgt 5460 tagttaggta tggtggtgta tatttgtagt tttagttatt ttagaggttt ggggaggagg 5520 attttttgag tttaggagtt tgaggattgt agtgagttat atgaaaaaaa gttttttagt 5580 ttgggt 5586 53 5244 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 53 ttttgatttt agatgatcga ttcgtttcgg ttttttaaat tgttgggatt ataggtataa 60 gttattgagt tcggttaggt atgagttttt gtagggtata ttagattgaa aatgaagatt 120 gttaggttag gcgtggtggt ttacgtttgt aattttagta ttttgggagg taaggtgggt 180 ggattacgag gttaggagat cgagattatt ttggttaata cggtgaaatt tcgtttttat 240 taaaaatata aaaatttagt cgggcgtggt ggcgggggtt tgtagtttta gttgtttagg 300 aggttgaggt aggagaatgg tgagaattta agaggtaaag tttgtagtga gttaagattt 360 tattattgtt ttttagtttg ggtgatagag cgagattttg ttttaaaaaa aataaaaaga 420 aaaagaaaag attgtgggtt gggcgcggtg gtttatattt gtaattttag tattttgggg 480 ggtcgaggta gtcggattat ttgaggttag gaatttgaga ttagtttggt taataaggtg 540 aaatttcgtt tttattaaaa atacgaaaat tagtcgtatg tggtagtagg cgtttgtaat 600 tttagttatt cgggagtttg aggtaggaga attatttgaa ttcgggaggc ggatgttgta 660 gtgagttaag attaaatttt tgtatttttt gtattttggt ttgaggataa tagtaagatt 720 tgattttaaa aaaaaaaaaa aagattttgg attgggtgta gtggtttata ttagtaattt 780 tagtattttt cgaggtcgag gcggacggat tacgagatta ggagttggag attagtttgg 840 ttagtatggt gaaatatcgt ttttattaaa aattagtcgg gtatggtggt gcgtattcgt 900 agttttagtt attcgggagg ttgaggtagg ataattgttt gaattcgtga ggtagaggtt 960 gtagtgagcg gagttcgtat tattgtattt tagcgtgcgc gatagagatt ttgttttaaa 1020 aaaaaaaaaa aaaagaaata aaagaaagat ttaatattat attaggatat gtaattttta 1080 tttatttttt atttttaata aggaagaaag gttttttttt taattttgtt tttttaatat 1140 ttgaggatag gtatttttaa tttttttttt tttagggagg ttttagtatt agtgtttgtg 1200 gacgtagttt ttgaagagtg ttttagttga tggggaagga gaaatttaag atagagattt 1260 ttttagggat ggcgttattt ttttgttaat tttttcgttg tttttttttg aaagtagaag 1320 aagtgttagt ttttagtttt cgttagattt tgggttttta gggttttgta taagtttatg 1380 gttttttggt tttagtttag gacggttagg cggaattggg agtagttttt atttaaggtt 1440 atttgtggga gaagataata ttaatttttt tggggttaaa aaagaaaaag gtttttttat 1500 tttttttttt aattcgggtt ttttttttat atatttttgt ttttttaggt ttttatttgt 1560 cgttttattt atttttttat tttagttatt tttttgatta ttttggaatt aattttttga 1620 tttgttgtgg agagaaagag gtaaaaaata gttattgttt gagttgaagg ggattagaaa 1680 atgatatcgg ttgggttttg gggatagggg ataatagtgg ggtttgtggg gtgttttgtt 1740 tttattttag ttttagtttt tgtttagtat ttcgatattt cggtattata tagatatttt 1800 ttagataaat ggtgcgtttt ttttatgtat tgtagatgaa atagtatatt ttatagttta 1860 ttacgtaggg ttttgagaga gagaaaaggg gagtaaggtt tttggaagtt tgtggggaga 1920 tttttgaggt cggttggaga ggtggatttt taagggttag gtgtttttat ttagtagttt 1980 ttcgggcgtt ggaagaattt ttgttattaa atagtgatag aaaggattgt ttttaaagtt 2040 atttgttttt agggttgtcg agattggagt tgtgataaag agatagagaa agaggacgtg 2100 ggtgtatgtt tagtttggag ttgtcgtttg gggaatttat tttttatttt ttttttagtt 2160 ttcgttagaa tttgggcgtt gagtttttat tttttttatt gatttttatt tgattcgaga 2220 gtttttcgaa ttcggttagt ttttaaggcg tgggtacgga agttagatta gagtagaagg 2280 gtttcgttgt ttttcgagta ggtttttaag gcgagttttt ttttttgttt tcgtttttta 2340 cgatttcgtt ttggtcgcgt tattttgatt ttcgggttat cggtttgtag tttttattcg 2400 aattagtttt aggatatttt tatagttttt ttttttggtt tttcggattc gtacggaagt 2460 tattcggatt ttcgttgttt gggattaaag ttttagggtt tcgtaaacgg taattagatt 2520 ttttaaaggg tttacggatt tggattttga agagtttgag agagcggggt ggcgggagtc 2580 gggggggacg gcggggtagt cgcggtttgg taagtggagt tgggatttcg gcgtcgtacg 2640 ggaggagaga gtaggttagc gaggcgattt tttgttcggg tatagtttta ttttttcgaa 2700 ttttgtcgta gtagggggta taattgttag ttaattagtt tggagaatag gtacggtcgc 2760 gtttttttta agttttattt tcgatagttg gattttgtga ttgggttttt gggtagagtt 2820 taaggttgga gtgaagcggt ttttttgcgg ttgtgtgggt gttttaattt gggtcgagat 2880 atttcgcggt ttaaaggttt tttcgtagtg ttttttaaat tgatatatgt agtgataatt 2940 tgttttagtt ttaggtttat ttattcgttt agattttggg taagttttaa gatttttagt 3000 tttgaaagtt gttttttgta gtttttgagt agtatgaagt gttatttttt gggggtattt 3060 gtatttttta aatgttttat ttttatattt atttatttat ttatttttgg agatggtgta 3120 ttgttttgtc gtttaggttg gggtgtagtg gcgcgatttt tgtttattgt agtttttatt 3180 tttcgagttt aagcgatttt tttgttttag ttttcggagt agttggaatt atagtcgcgt 3240 atcggtacgt tcggttaatt tttttttttt tttttttttt tttttttttg ttttaacgga 3300 tttttatttt gttatttagg ttggagtgta gtggcgcgat ttcggtttat tgtaattttt 3360 tttttttggg tttaagcgat ttttttgttt tattttcgga gtagttggga ttataggtat 3420 gggtaattat atttggttaa tttttgtatt tttagtagag acggggtttt attatgttgg 3480 ttaggttggt ttggaatttt tgattttaag tgatttgttc gttttagttt tttaaagtgt 3540 tgggattata gatgtgattt attaagttcg gtttgttatt tgtattttaa aatgggttat 3600 ggggtgggta tagtggttta tatttgtaat tttagtattt tgggaggtag aggtaggcgg 3660 attatttgag attaggaatt tgagattagt ttgattaata tggtgaaatt tcgtttttat 3720 taaaaatata aaaattagat aggtgtggtg gcgtatgttt ttatttttag ttattcggga 3780 ggttgagata ggagaatcgt ttgaatttgg gaggtggagg ttatagtgag tcgagatcgt 3840 gttattgtat tttagtttgg gtaataaaag cgaaatttta ttttaaaata aataaataaa 3900 ataaaatgcg ttagggaggg tcgggttttg tggttaatgt ttgtaattta ggtattttgg 3960 gaggttgagg tgggcggatt attttaggtt agaggttcga gattagtttg ggtaacgtgg 4020 tgaaattttc gtttttatta aaaatataaa aaaatttgtt gggcgtggtg gtgcgtgtat 4080 ttgtagtttt aattattaag gaggttgaga taggaggatc gtttgaattc gagaggtaga 4140 ggtagtagtg agtcgagatt acgttattgt attttagttt gggtgataga gtaagatttt 4200 gtttaaaata aaataaaata aaataaaata aaataaaata aaatgggtta gggagtgggt 4260 gatttttatt gttagattgt ttaggttttg taataaatgg ataagggaag ataattgaga 4320 ggcggggggt aggttttttt ttaatattta ttgaattata tatatagata atattttttt 4380 gggagatagg ttttagaggt ttgggaaaag attgggggag gagtttagat tagatgttag 4440 gtattgtgtt tgtatttttt taatgaattt ttttttatag ttatttcgta aagtattatt 4500 ttttttattt tatagataag gatattgaag tatagaggtg aagtgatttg tttaaggtta 4560 tttagttaga aatttaggat tttattattt tatttttagt tttgatatag gatgttattt 4620 gggacgtagg ggaggattgt ttttagattt taggtttgtg aatgtaggtt tttcgagtgg 4680 atagaaattt tggaggattt agattaggtt ttagaggagg agaggggaga tggaatattt 4740 ttttttagtt tagaaatttt ttcggtagtg gaggatgata gtggagggga ttttgttttt 4800 tattttattg atttttagag gggtgatagt tgagttttgt gattgggttt ttgggtaggg 4860 gttaagggtt agtgtttttg ttttttttat tttttttttt tcgggtaatt tttaattttt 4920 tatcgtttat acgtaaggtt gtttgttttt atatattttt ttaagagttg tttgagtcgt 4980 cgagtggata gtggttgatt atggagagta gaggtttatt ggttatttcg cgtttgttgt 5040 tgttgttgtt gttgttatta ttgcgttata ttcgttaggg atgggttttg agatttgttt 5100 tttttattta ggtgtaggag cgggataggg tatttagttt atgtagtttt tttttttttt 5160 ttttggtttt gtagtagggt tttttttttt gtttgttttt gatatgtttt tatttagttt 5220 tgtttgtttt ttttttttga taga 5244 54 5244 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 54 tttattagaa agagaaaata aataaagttg agtagggata tgttagagat agatagaggg 60 agaggttttg ttatagggtt agaggagaga agggaagatt gtatgagttg agtgttttgt 120 ttcgtttttg tatttgggtg gggagaatag gttttagggt ttatttttgg cgggtgtgac 180 gtagtagtag taatagtagt aatagtagta ggcgcgaggt agttagtggg tttttgtttt 240 ttataattag ttattgttta ttcggcggtt tagataattt ttgggagaat gtgtagaggt 300 aggtagtttt gcgtgtgggc ggtggagggt taaaggttgt tcggggagga gggggtaaag 360 gaaatagggg tattgatttt tgatttttgt ttaggggttt agttataaga tttagttatt 420 atttttttgg ggattaatgg ggtgaaggat agagtttttt ttattattat tttttattgt 480 cgagaaagtt tttgaattgg gagaggatat tttatttttt tttttttttt ttagggtttg 540 atttaggttt tttaagattt ttgtttattc ggggagtttg tatttatagg tttgaggttt 600 agaaatagtt tttttttgcg ttttaagtag tattttgtat taggattaga aatgagataa 660 tggaatttta aatttttagt tgagtgattt tgggtaagtt attttatttt tgtgttttag 720 tgtttttgtt tgtaaaatga ggaaaataat attttacggg gtgattgtga aagagggttt 780 attgagaaaa tgtaggtata gtgtttggta tttggtttga attttttttt tagttttttt 840 ttaggttttt gaggtttgtt ttttaagaag gtattgtttg tgtgtatgat ttagtgaata 900 ttaagaaggg atttgttttt cgttttttag ttattttttt ttatttattt attatagggt 960 ttaaatagtt tagtagtaga aattatttat tttttgattt attttatttt attttatttt 1020 attttatttt attttatttt agatagagtt ttgttttatt atttaggttg gagtgtagtg 1080 gcgtgatttc ggtttattgt tgtttttgtt tttcgagttt aagcgatttt tttgttttag 1140 tttttttagt agttgggatt ataggtgtac gtattattac gtttagtaaa tttttttgtg 1200 tttttagtag agacggggat tttattacgt tgtttaggtt gatttcgaat ttttgatttg 1260 aaatgattcg tttattttag ttttttaaag tatttggatt ataggtatta gttataaggt 1320 tcgatttttt ttgacgtatt ttattttatt tatttatttt gagatggagt ttcgtttttg 1380 ttgtttaggt tggagtgtaa tggtacgatt tcggtttatt gtaattttta ttttttaggt 1440 ttaagcgatt tttttgtttt agtttttcga gtagttggga gtaaaggtat gcgttattat 1500 atttgtttaa tttttgtatt tttagtagag acggggtttt attatgttgg ttaggttggt 1560 tttaaatttt tgattttagg tgattcgttt gtttttgttt tttaaaatgt tgggattata 1620 ggtgtgagtt attgtgttta ttttatgatt tattttaaaa tgtaaatgat agatcgggtt 1680 tggtgggtta tatttgtaat tttagtattt tagaaggttg aggcgggtag attatttgag 1740 gttaggagtt ttagattagt ttggttaata tagtgaaatt tcgtttttat taaaaatata 1800 aaaattagtt aggtatggtt gtttatgttt gtaattttag ttatttcgag ggtgaggtag 1860 gagaatcgtt tgaatttagg agggagaggt tgtagtgagt cgagatcgcg ttattgtatt 1920 ttagtttgag tgatagagtg agaattcgtt aaaataaaaa aaaagagaag aaaaaagaaa 1980 aaaaaattag tcgggcgtgt cggtgcgcga ttgtagtttt agttatttcg gaggttgaga 2040 taggaggatc gtttgaattc gggaggtgga ggttgtagtg agtagagatc gcgttattat 2100 attttagttt gggcgataaa gtaatatatt atttttaaaa ataaataaat aaataaatat 2160 aaaaataaaa tatttaaaaa atgtaaatgt ttttaagagg taatatttta tgttatttaa 2220 gagttgtagg aaatagtttt tagagttgag ggttttaagg tttatttagg gtttgggcgg 2280 gtgagtgagt ttgaggttaa agtaggttat tattgtatat gttaatttaa aaagtattgc 2340 gggggagttt ttgaatcgcg gggtatttcg atttaggttg ggatatttat ataatcgtaa 2400 ggaagtcgtt ttattttaat tttgaatttt atttaggagt ttagttataa gatttagttg 2460 tcgggggtgg ggtttggggg ggacgcggtc gtgtttgttt tttaagttga ttggttgata 2520 gttgtgtttt ttgttgcgat agaattcgag ggggtggggt tatgttcgga tagaggatcg 2580 tttcgttggt ttattttttt ttttcgtacg gcgtcggaat tttagtttta tttattaggt 2640 cgcggttatt tcgtcgtttt tttcgatttt cgttatttcg tttttttagg ttttttagga 2700 tttaagttcg taggtttttt aaggggttta gttgtcgttt gcgaggtttt gggattttgg 2760 ttttagatag cggggattcg gatggttttc gtgcggattc gagaggttaa ggagggagat 2820 tgtggagata ttttgaggtt gattcgggtg aagattgtag gtcggtaatt cgggggttag 2880 agtggcgcgg ttagagcggg gtcgtaggag gcgggggtag ggggaggggt tcgttttggg 2940 aatttgttcg gggagtagcg gggttttttt gttttaattt agttttcgta tttacgtttt 3000 aggagttagt cgaattcgaa aaattttcgg attaggtgaa gattagtgaa gaaggtgggg 3060 gtttagcgtt taggttttgg cggaggttgg ggaggaaatg agggatgggt tttttaggcg 3120 atagttttag gttgggtata tatttacgtt tttttttttt atttttttgt tataatttta 3180 atttcggtag ttttgagagt agatggtttt ggagataatt ttttttatta ttgtttggta 3240 gtagagattt ttttagcgtt cgggaagtta ttgggtaaga gtatttggtt tttagaagtt 3300 tattttttta gtcggtttta gaggtttttt tataggtttt tagaagtttt attttttttt 3360 tttttttttt agggttttgc gtggtgggtt atgggatata ttattttatt tatagtatat 3420 ggaagggacg tattatttat ttggaggata tttatgtgat gtcggaatat cggggtattg 3480 ggtagaagtt gaggttgggg tgggagtaaa gtattttata gattttattg ttattttttg 3540 tttttagagt ttagtcggtg ttattttttg atttttttta gtttaaataa tagttatttt 3600 ttgttttttt ttttttataa taggttaagg gattggtttt aaaataatta aaaaggtggt 3660 tgaggtgagg agatgggtgg ggcgataagt gaggatttga agaagtaagg gtatatggag 3720 gggggattcg ggttgaaaga gggagtgaga aaattttttt tttttttgat tttagaaaag 3780 ttagtgttgt ttttttttat aggtggtttt ggataagggt tgtttttaat ttcgtttggt 3840 cgttttggat tggaattaga gggttatgga tttgtataag gttttaggag tttaagattt 3900 gacggaagtt gagggttggt attttttttg tttttaagga gaggtaacga gaaagttggt 3960 aggaaagtga cgttattttt aggaggattt ttgttttgag tttttttttt tttattagtt 4020 gaagtatttt ttagagatta cgtttataga tattgatgtt gaggtttttt tggaggaagg 4080 agggttaggg gtgtttattt ttaagtattg gaagagtaga attgagggag agattttttt 4140 tttttgttga gggtgaaaaa taaataagaa ttatatgttt tgatgtggtg ttgggttttt 4200 tttttatttt tttttttttt tttttttgag atagagtttt tgtcgcgtac gttggagtgt 4260 agtggtgcga atttcgttta ttgtaatttt tgttttacgg gtttaagtaa ttattttgtt 4320 ttagtttttc gagtagttgg gattacgggt gcgtattatt atgttcggtt aatttttagt 4380 agagacggtg ttttattata ttggttaggt tggtttttaa tttttgattt cgtgattcgt 4440 tcgtttcggt ttcgaaaagt gttgggatta ttggtgtgag ttattgtatt tagtttaaag 4500 tttttttttt tttttttgag attaagtttt gttgttgttt ttaggttaga gtgtaaggag 4560 tgtaaaggtt tgattttggt ttattgtaat attcgttttt cgggtttaag tgattttttt 4620 gttttagatt ttcgagtagt tgggattata ggcgtttgtt attatatgcg gttaattttc 4680 gtatttttag tagagacggg gttttatttt gttggttagg ttggttttaa atttttgatt 4740 ttaggtagtt cgattgtttc ggttttttaa agtgttggga ttataggtgt gagttatcgc 4800 gtttagttta tagttttttt tttttttttt tatttttttt gagatagagt ttcgttttgt 4860 tatttaggtt ggagggtagt ggtgagattt tggtttattg taagttttgt tttttgggtt 4920 tttattattt ttttgtttta gttttttgaa tagttgggat tataggtttt cgttattacg 4980 ttcggttaag tttttgtatt tttagtagag acggggtttt atcgtgttag ttaggatggt 5040 ttcgattttt tgatttcgtg atttatttat tttgtttttt aaagtgttga gattataggc 5100 gtgagttatt acgtttggtt tgatagtttt tatttttaat ttggtatgtt ttataaaagt 5160 ttatgtttgg tcgggtttag tggtttatgt ttgtgatttt agtagtttgg gaggtcgagg 5220 cgggtcgatt atttgaggtt agga 5244 55 815 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 55 gagttttagg attgagatat ttttattata ttttttttat tattttgtat ttttaaaata 60 gtttttaggg tatttttatt tgtttttgtg gaaagattgg taattagagg tagaaaagtg 120 aaataaatgg aaatagtatt atttagggtt gttatattta tatttgtgtt tttgtagtgt 180 taatttgtat tttttgagtg agttattttt atttattttt atagtagtta gtatcgtagt 240 gttttgtata tattatattt ttaatgagta tttgttaatt gattttgtat atgcgtgtga 300 tagtataaat atattatgaa aaatgaggag gttaggtaat aaaagagtta ggattttttt 360 taaaaaaaat atatagcggt ggagtttggt ataaagttta aatgttttta tattttgttt 420 tgtagtattt ttaattaggg gattttgata aggaagttga agggtgatat tatttttgtt 480 tttttattgt aattgaatat attttttagt ttttaggtgg ttttcgttgg ttaatttgtt 540 gtggagtttt taagggtata gaatcgtttt ttatataatt aaaagaagat gttgtttaat 600 ttgaggattt tgttaaataa tgtagttttt agaaatggtt ataattttat ggttcgaaat 660 tttcggtaag tgatggttag agatttgggt ttgatttagg aattatggtg atgtataaaa 720 ttatattttg tagtaaggtt tttttttgta gaatgtagtg ttacgttttg ttttattttt 780 atttgagata gttgttttta attttagtaa agttt 815 56 815 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 56 aagttttgtt ggaattagag gtagttgttt taaataagag taaagtagag cgtggtatta 60 tattttgtag aaagaggttt tattgtagaa tatagtttta tgtattatta tgatttttaa 120 attaaattta agtttttgat tattatttat cgaaaatttc gaattatgaa gttgtgatta 180 tttttaaaag ttgtattgtt taataggatt tttagattaa atagtatttt tttttaattg 240 tgtaaaggac gattttatgt ttttgaaaat tttatagtaa gttagttagc gggggttatt 300 taaaaattaa gaaatgtgtt tagttgtagt gagggagtaa aggtaatatt attttttagt 360 ttttttatta aagttttttg gttagagata ttgtagggta gggtgtagga gtatttgaat 420 tttatgttaa gttttatcgt tgtgtatttt ttttggaaga aattttgatt tttttattgt 480 ttggtttttt tattttttat aatatattta tattgttata cgtatgtata aaattaattg 540 ataagtattt attgaggata taatatatgt aaggtattgc ggtattggtt gttgtgaagg 600 tgagtagaag taatttattt agaaaatgta aattggtatt gtaaaaatat agatgtagat 660 gtgatagttt tgagtagtat tatttttatt tattttattt ttttattttt aattgttagt 720 ttttttataa aaataaatag aagtgttttg gaagttattt tgggggtgta agatgataga 780 gaaggtatag taaaaatatt ttagttttgg ggttt 815 57 762 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 57 gagttttatt ttttgttaaa ttagattatt taattagaaa tagtattaga ttttatagta 60 tgttaaattt aattgtgaat tgtatatgta agggatttag gttgtatgtt tttaatgaaa 120 atttaattag tggaaaaatt gttttttacg aaatcggatt ttggtgataa aaaggttggg 180 gatttcgatt tatggtattt gtggagaatt ttatggttag tatatttggt aaataaattt 240 aaaagaaaac gaattttatt ttattaaaaa tgaatatatt tatatgtata aatataagtt 300 ggaatgggga aatttatgta gttggaaaat agttattaaa tgtaaataaa tataattata 360 gtgtagatta aggattagta atttttttag aggtaataat aatattaatg ttgtatattt 420 attttttttt tttttttttt ttttttttga gacggagttt ggttttgtcg tttaggttgg 480 agtgtagtgg ttcgatttcg gtttattgta acgttcgttt tttaagttta tgttattttt 540 ttggtttagt ttttcgagta gttgggatta taggtattcg ttattacgtt tggcgaattt 600 tttgtatttt tagtagagac ggggttttat cgtgttagtt aggatggttt ggattttttg 660 atttcgtgat ttatttattt cggtttttta aagtgttggg attatagata tgagttatcg 720 cgtttagttt tatttatttt tttttaaaag ttagatttta gg 762 58 762 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 58 tttagggttt gatttttgaa aagggatgaa tagggttggg cgcggtggtt tatgtttgta 60 attttagtat tttaggaggt cgaggtgggt ggattacgag gttaggagat ttagattatt 120 ttggttaata cggtgaaatt tcgtttttat taaaaatata aaaaattcgt taggcgtggt 180 ggcgggtgtt tgtagtttta gttattcgag aggttgagtt aggagaatgg tatgaatttg 240 ggaggcggac gttgtagtga gtcgagatcg ggttattgta ttttagtttg ggcgatagag 300 ttaggtttcg ttttaaaaaa aaaaaaaaag aaagaaaagg atgaatgtat aatattggtg 360 ttattattat ttttgaaaag attgttagtt tttaatttat attataatta tgtttgttta 420 tatttaatag ttatttttta attatataaa tttttttatt ttaatttatg tttgtgtatg 480 taaatatgtt tatttttaat gagataagat tcgttttttt ttgaatttgt ttattaagtg 540 tgttagttat aaaatttttt ataaatgtta tagatcgggg tttttagttt ttttgttatt 600 agggttcggt ttcgtggaag atagtttttt tattagttag atttttatta ggagtatgta 660 atttagattt tttgtatgta tagtttataa ttgggtttgg tatattgtag aatttaatgt 720 tgtttttgat tggataattt gatttgatag gaggtggagt tt 762 59 645 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 59 ttgtagtttt tgttaggttt tgttagtcgg ggcgagggtt gggatgattt tggcggttta 60 tgtttgtgtg ggttgttttt ttcgttgtga attttgtatt tgtttcgtaa gtttttattt 120 aggtagattt tttgggtata aagggtgttt gtttagtagt cgggtatgag ttgtttcgat 180 gggcgaagga ggttgtttat tttatagttg gagagggttt tttttgttta gtgggcgatt 240 tgggttacgg ttaagttgtt attagttagt ttcgtttgaa aattattttt ggtttcgtgg 300 gggatttaag cggtttaagc gagggttttt ttgagcgtcg gagtttatag gtttcgtttt 360 gtttcgaaag ttttcgtaat cgaggcggag gcgatcgagt tttcgatttt tttagaacgt 420 tgttataaga aggggaacgt cggaatagtg tattatcggg cggcggtcgg ggcggcggta 480 ggagggcggg cggggggtag ggtttcgggg gattgggcgg gttatggcgg aggacggcga 540 ggaggcggag ttttatttcg cggcgtttta tataagtggg tagtggtcgg attgcgcgta 600 gatattgatt tttagcgttt cggttcggtt atggcgtttt ttagg 645 60 645 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 60 tttggagggc gttatggtcg agtcgaggcg ttgaaggtta gtgtttgcgc gtagttcggt 60 tattgtttat ttatatagag cgtcgcgaag tggaatttcg ttttttcgtc gtttttcgtt 120 atggttcgtt tagtttttcg gagttttgtt tttcgttcgt ttttttgtcg tcgtttcggt 180 cgtcgttcga tgatgtattg tttcgacgtt tttttttttg tggtaacgtt ttaggagagt 240 cgggggttcg gtcgttttcg tttcgattgc gggggttttc gggataaggc gagatttgtg 300 agtttcggcg tttaggggaa ttttcgtttg gatcgtttga gttttttacg gggttagaag 360 tggtttttaa gcggaattag ttggtggtaa tttggtcgta gtttagatcg tttattgggt 420 agagagggtt ttttttaatt gtggaataga taattttttt cgtttatcgg agtagtttat 480 gttcgattgt tgagtaggta ttttttgtat ttagggagtt tatttgagtg aaaatttgcg 540 ggataaatgt agggtttata gcgggagggg tagtttatat aggtataggt cgttaggatt 600 attttaattt tcgtttcggt tggtaaggtt tggtaggaat tgtag 645 61 3586 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 61 tttagaattg ataggaaaaa taatatggtt atagtattgg agagagagag aaaggagaga 60 ggagaaagga gagagagaga aaggagagag gagagagata gaggagagag agagaggata 120 gagggggaga gagagagagg agagagatag aggagagaga gagaggatag aggggagaga 180 gagggagagg gagagagagg gagagagagg gagagagaga gagagagagg gagagagaga 240 gagaaagaga gagagaggga gagagagaga gagagttttt taacgtgaga tattttataa 300 tgaataaatc gtttagttat taaagtgtag ttatttttag gagttgttag aaaatgtatt 360 aggattatta gagaaaagta ttagaaagat tttttttttt gatacgttgt ataaaataaa 420 taaattgaaa tttaataata tataaggaat tttgtttggg ttttgaagat aatttttttt 480 tgtatattga gttttttaaa tattgtagtt tttttatggt ttttgagaaa taattatttt 540 aaatttataa tttttaatat tttttaaatt tttttaataa gagaagtttt atttttgata 600 ttatttttta tttgtaaggt taaattatta ttagttttgt agtttattaa ttgggtttgt 660 ttaggttagg tattattatt attaatttta ttgttaatat tttaattata agaattaaat 720 tattaatggt gaatagagtt ttttatttta atataggttt attttattgg tgggatacga 780 gttaattcga aagaaaagtt agttatgtgt tttttagagg atgaaagttt aagataaaga 840 ttaaaagtgt ttgatgttgg aggtgggagt ggtattatat aggttttagt taagatatgt 900 gataattatt gtagtagtag ttggaaagag aaatttgtga ttttaattag ttagtttttg 960 tagattttgt gaggattaga ggaagaatgt ttttggttgt tttgtattgt ttgttgtgga 1020 gtttttagat tttcgttggt tattttttta gagtttgtgt tttttttaag aatttgatgg 1080 agaaggaatg ttgtttatcg tggagcgggg ataggagttt ttgtggttag tttttaggta 1140 gaggtttttg ttagaatatt tttttgttta atgtattatt tgggttttaa ttttttttta 1200 taggggtgga tgatcgggag tcgtggtttt tcgtttttta taataggatt tgttagtgtt 1260 ttggtaattt tatgggattt aattgtggaa attgtaagtt tggtttttgg ggattaaatt 1320 gtatagagag acgatttttg gtgagaagaa atattttcga tttgagtgtt ttagagaagg 1380 ataaattttt tgtttatttt attttagtaa agtatattat tagtttagat tatgttattt 1440 ttatagggat ttatggttaa atgaaaaatg gattaatatt tatgtttaac gatattaata 1500 tttatgattt ttttgtttgg atgtattatt atgtgttaat ggatgtattg tttgggggat 1560 ttgaaatttg gagagatatt gattttgttt atgaagtatt agtttttttg ttttggtata 1620 gatttttttt gttgcggtgg gaataagaaa tttagaagtt gataggagat gaaaatttta 1680 ttattttata ttgggattgg cgggatgtag aaaagtgtga tatttgtata gatgagtata 1740 tgggaggtta gtattttata aattttaatt tatttagttt agtattattt tttttttttt 1800 ggtaggtaag atatgttaga tatacgatgt tagagtaggg aggaatttta ataattattt 1860 ttttaggtag ggtataaatt ttttatttga atatttattg tagtttttat taaggataga 1920 aatggtgttt tgttaagaat ttttaatgta ttttgtattt tttttttata gtatatttta 1980 gatatttgtg taattatttg tttaatgatt tttattaggt ttttaaattg taatgaatag 2040 agtatttgat ttattattgt attttttaga atatagtatg gtgtttttaa aaatggtaat 2100 agtgtattat gtattttgtg aattgaataa atgagtgaat gaatgaatat ttggatgatt 2160 aaaaaaataa atgatatata ttaatgtttt tgaaaaataa aattattatt tataatagga 2220 tttatatggt gtataaatta aaaatgtaaa tttttggttt tattttagat taattggtta 2280 gaatttttag gagagagttt cgagaaggta taatttatta aatgtttatg gtgatttttt 2340 taattaggaa tgtttgggaa ataattattg gattagattt ttatttttga aagtatgaag 2400 attttgaggt ttaaataggt aaataatgaa gatggttaat atttattgaa tatttagtat 2460 gtgtaaattt cgtggtaagt gtttttgtgt attcgtttat tttatgtttt tattagtttt 2520 tttttatttt agaggttata aaggtattag gtaatttgta taagattata tagttaataa 2580 gtagtaaaaa aaaaattata tttatttttt aatagtttag ttgtatgatt attgtatttt 2640 atttttaagg atgtgattgt tgtgatattt ttagttaaag gatttggttt attttgtttt 2700 attttttttt taggttgtat tagaagttag tttttttttt tagtttttga aaattttaga 2760 taaaatatga agtattatta tttggaattg aatttttatt ttatttattt gaatttttta 2820 ttttgaatta ggggtaaatg gtaattaaag aaatatgtgt ttaattattt attattttaa 2880 aattatatgt taaaggaatg tttttttgtt tgttttttaa aaatttttaa tatagtattt 2940 ttgattagta atgttttatg aaattaagtt taatatgtga atgggatggg aagaattttg 3000 tatttaattt tttataattt gtagttttga aatgtagatg gtttttttcg tttaattaag 3060 tttgtatttt attttaatgg agtttattga agtttattta aaaaatagtt attgtataat 3120 ttttggtgtt attagttagt tatttattaa atgtaatggg ttttgtgtag gaaaggttag 3180 aaaaaatgtg tttggaaaaa aatttatttt aataagtttt tagatttttt attttaattt 3240 ataatgtgta aatttttatt tagtttttat attttttgtt tttgtttaaa aaattgttag 3300 gattggatat gggattttta gttagttatg atgttttatt taattatgtg gtttaatttg 3360 atttagaaag gttggaggat tgtttaaatt attaaaataa gttgtaatat ttataggaaa 3420 ttttaataga tagatatata ttaattttta attatatgag atgtgtaata ttagatgtta 3480 tttataattg tatgagtatt atttttttaa ttatttatta attgtcgagt agaatttttt 3540 tttttttttt tttttatgaa tgtgtttaat tttaatattt tttaga 3586 62 3586 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 62 tttagagagt attaaaattg aatatattta tgaagagaga aaaaggaaaa agttttgttc 60 gataattaat aagtaattag gaaaataata tttatatagt tgtggatagt atttggtatt 120 atatatttta tgtaattaaa aattaatgtg tatttattta ttaagatttt ttgtggatgt 180 tgtagtttat tttggtaatt tagatagttt tttaattttt ttgggttaag ttaagttata 240 tagttaaata aagtattata attgattgaa aattttatgt ttaattttgg tagtttttta 300 aataggaata gaggatataa gagttagatg agagtttgta tattatagat taaggtagga 360 ggtttgaaag tttattgaaa tagatttttt tttaagtata ttttttttag ttttttttgt 420 ataaaattta ttatatttgg taaatagttg attaataata ttagaaatta tatagtggtt 480 attttttaaa tgaattttag tagattttat tgggatgggg tataaatttg gttgggcgga 540 gaaggttatt tatattttaa aattgtagat tgtgggaaat tgagtgtaag atttttttta 600 ttttatttat atattgggtt taattttata gagtattgtt agttaaaagt gttgtattag 660 aaatttttgg aagataggta gaaaagtatt tttttaatat atggttttaa aatgataaat 720 aattaagtat atattttttt ggttattatt tgtttttaat ttagaatgaa aaatttagat 780 agatgaaata ggaatttaat tttaaatagt aatgttttat attttattta aagtttttaa 840 ggattgagaa agaaagttaa tttttaatgt agtttaaaga aaaagtgaga tagaatgaat 900 tagatttttt agttaaagat attatagtag ttatattttt ggaaatagga tatagtggtt 960 atatagttgg attattagag aataaatgtg attttttttt tgttgtttat tagttgtatg 1020 attttatata agttatttga tatttttata atttttaaaa tagggaaaga ttgataagag 1080 tatgaaatga acgaatgtat aaaaatattt gttacggggt ttgtatatgt tagatgttta 1140 atgaatatta gttattttta ttatttattt gtttaagttt taggattttt atatttttaa 1200 aaatgaagat ttaatttaat aattattttt taaatatttt tgattaaaag aattattata 1260 gatatttagt aaattgtgtt ttttcgggat ttttttttga agattttgat taattagttt 1320 gggataaggt taggaatttg tatttttaat ttgtatatta tatgaatttt gttgtgaata 1380 ataattttat tttttagaga tattagtgta tattatttgt ttttttaatt atttagatat 1440 ttatttattt atttatttat ttaatttata aaatatataa tgtattattg ttatttttaa 1500 aggtattata ttatgttttg ggaaatgtaa taatgaatta agtattttgt ttattgtagt 1560 ttagaaattt agtagaagtt attaaataaa taattatata aatatttaaa gtgtgttata 1620 aaggaaaaat ataagatata ttgagagttt ttaatagggt attatttttg tttttgatgg 1680 gggttgtaat gagtgtttag gtgagaagtt tatattttgt ttgaagaagt gattgttaag 1740 gttttttttt attttgatat cgtatattta gtatatttta tttgttaaga ggagaagaat 1800 gatgttgggt tgagtaagtt aggatttgtg gggtgttgat tttttatgta tttatttgtg 1860 taaatgttat atttttttgt atttcgttag ttttaatatg gaatagtgaa gtttttattt 1920 tttgttagtt tttggatttt ttgtttttat cgtaataaga agagtttatg ttaaggtaga 1980 aaagttggtg ttttatgggt aaaattaatg tttttttaga ttttagattt tttaagtagt 2040 gtatttattg atatataata atgtatttag ataaagaggt tataaatatt gatgtcgtta 2100 aatatgggtg ttgatttatt ttttatttgg ttataggttt ttatggggat gatatagttt 2160 gagttgatgg tatgttttgt taaagtgagg taggtaaaaa atttgttttt ttttggggta 2220 tttaaatcga agatgttttt ttttattaag agtcgttttt ttgtgtagtt tggtttttaa 2280 aagttaaatt tgtagttttt atagttgaat tttatgaagt tgttagagta ttggtaggtt 2340 ttattataaa agacggaagg ttacgatttt cggttattta tttttgtgaa gggaaattga 2400 ggtttaagtg gtgtattgga tagaaggata ttttgatagg aatttttgtt tgaaagttgg 2460 ttatagggat ttttgttttc gttttacggt ggatagtatt ttttttttat taggttttta 2520 gaggagatat aggttttagg gaaatggtta gcggaggttt ggaaatttta tagtaggtag 2580 tataaaatag ttaggagtat ttttttttta gtttttataa ggtttgtagg aattggttaa 2640 ttggagttat agattttttt ttttagttat tattatagtg attattatat gttttggttg 2700 agatttatat aatattattt ttatttttag tattaaatat ttttagtttt tattttaagt 2760 ttttattttt tgaaaagtat atgattgatt tttttttcga attggttcgt attttattag 2820 tgggataggt ttatgttaaa gtgaaaaatt ttatttatta ttaatagttt aatttttatg 2880 gttagaatat taataataag gttagtaata ataatgtttg atttaagtaa atttagttaa 2940 tagattataa aattaatgat gatttgattt tgtaaatgag aggtagtgtt aggaatagag 3000 ttttttttat taagaaagtt taggaagtat taaagattat gggtttaagg tagttatttt 3060 ttagagatta taaagaggtt ataatgtttg aagaatttaa tatgtagaga gagattgttt 3120 ttagagttta gatagaattt tttatatgtt attgaatttt agtttgttta ttttatataa 3180 cgtattagaa aaaaaaattt ttttgatatt tttttttgat aattttgatg tattttttga 3240 taatttttaa ggatagttgt attttgataa ttgggcgatt tgtttattgt gggatatttt 3300 acgttaaaga gttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3360 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt ttttttttat 3420 tttttttttt ttttttttgt tttttttttt tttttttttt tttttttatt tttttttttt 3480 tttttttgtt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3540 ttttttttaa tgttgtagtt atattgtttt ttttattaat tttaga 3586 63 600 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 63 ggtagcgacg atttttggag gtggatttag aggtataatt aagtcgcgcg gcgtattagg 60 gtttaagggt atggggtttt cgtagttgtg gttggggtag agttggggtt gttttttttt 120 ttaggagtat aggcggcggt ttagttttac gtttttcgtt tttagttata ttcggttcgc 180 gtagtggggg gtttaataga tttttttttt tcgggtttta gttttttcgt tagtaagggc 240 ggataaggat ttttttcgtt tcgttagagg aggcgatcga ggggtttgag tttaggtata 300 ggtcggcggg tttaggaggc gcgaggcgga tcgaattcgc gggaggagta aagatttttg 360 atgcgcggtc ggagggcggg gcggaggacg ggatttacgc gattggtatt ttgtttttcg 420 ttttagttaa tgagcggcga gggtgttttg ggggcggggt agaattagtt tttaagttgt 480 agtgacgttt cggcgttatt gttgcgtttt atagacgtcg cgtgtattcg gttgttttta 540 ggcgttgtta ggtatcgttt gggcgtcgtt gttttggggt tttggttcgg gtttggtcgg 600 64 600 DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 64 tcggttaggt tcgaattaga gttttaggat agcggcgttt agacggtatt tgatagcgtt 60 tgaggataat cgggtatacg cggcgtttat gaagcgtaat agtgacgtcg gagcgttatt 120 gtaatttaaa ggttgatttt gtttcgtttt taagatattt tcgtcgttta ttggttgggg 180 cggagggtag gatattaatc gcgtgggttt cgtttttcgt ttcgtttttc ggtcgcgtat 240 taaggatttt tgtttttttc gcggattcga ttcgtttcgc gttttttgag ttcgtcggtt 300 tgtatttgag tttaggtttt tcggtcgttt tttttggcgg gacgagaaga gtttttgttc 360 gtttttgttg acgagaagat tgaggttcga aaaggaaaag tttgttgggt tttttattgc 420 gcgggtcggg tgtggttgga ggcgagagac gtgaggttgg atcgtcgttt gtgtttttgg 480 agggagggat agttttagtt ttgttttagt tatagttgcg ggagttttat gtttttgaat 540 tttgatgcgt cgcgcggttt agttgtgttt ttgagtttat ttttaaaagt cgtcgttgtt 600 65 20 DNA Artificial Sequence OAT primer 65 tggaggtgga tttagaggta 20 66 20 DNA Artificial Sequence OAT primer 66 aaccaaaacc ccaaaacaac 20 67 18 DNA Artificial Sequence OAT detection oligomer 67 gtgtattcgg ttgttttt 18 68 18 DNA Artificial Sequence OAT detection oligomer 68 gtgtatttgg ttgttttt 18

Claims (32)

1. A nucleic acid comprising a sequence at least 18 bases in length of a segment of the chemically pretreated DNA of genes associated with metabolism according to one of the sequences taken from the group of Seq. ID No.1 to Seq. ID No.64 and sequences complementary thereto.
2. A nucleic acid comprising a sequence at least 18 base pairs in length of a segment of the chemically pretreated DNA of genes associated with metabolism according to a sequence according to one of the genes DUSP2 (NM004418), EPHX2 (NM001979), QDPR (NM000320), SGSH (NM000199), SHMT2 (NM005412), SLC7A2 (NM003046), SLC7A4 (NM004173), TYMS (NM001071) and sequences complementary thereto.
3. An oligomer, in particular an oligonucleotide or peptide nucleic acid (PNA)-oligomer, said oligomer comprising in each case at least one base sequence having a length of at least 9 nucleotides which hybridizes to or is identical to a chemically pretreated DNA of genes associated with metabolism according to one of the Seq ID Nos 1 to 64 according to claim 1 or to a chemically pretreated DNA of genes according to claim 2 and sequences complementary thereto.
4. The oligomer as recited in claim 3;
wherein the base sequence includes at least one CpG dinucleotide.
5. The oligomer as recited in claim 3;
characterized in that the cytosine of the CpG dinucleotide is located approximately in the middle third of the oligomer.
6. A set of oligomers, comprising at least two oligomers according to any of claims 3 to 5.
7. A set of oligomers as recited in claim 6,
comprising oligomers for detecting the methylation state of all CpG dinucleotides within one of the sequences according to Seq. ID Nos. 1 through 64 according to claim 1 or a chemically pretreated DNA of genes according to claim 2, and sequences complementary thereto.
8. A set of at least two oligonucleotides as recited in claim 3,
which can be used as primer oligonucleotides for the amplification of DNA sequences of one of Seq. ID 1 through Seq. ID 64 and sequences complementary thereto and/or sequences of a chemically pretreated DNA of genes according to claim 2, and sequences complementary thereto and segments thereof.
9. A set of oligonucleotides as recited in claim 8,
characterized in that at least one oligonucleotide is bound to a solid phase.
10. Use of a set of oligomer probes comprising at least ten of the oligomers according to any of claims 6 through 9 for detecting the cytosine methylation state and/or single nucleotide polymorphisms (SNPs) in a chemically pretreated genomic DNA according to claim 1 or a chemically pretreated DNA of genes according to claim 2.
11. A method for manufacturing an arrangement of different oligomers (array) fixed to a carrier material for analyzing diseases associated with the methylation state of the CpG dinucleotides of one of the Seq. ID 1 through Seq. ID 64 and sequences complementary thereto and/or chemically pretreated DNA of genes according to claim 2, wherein at least one oligomer according to any of the claims 3 through 5 is coupled to a solid phase.
12. An arrangement of different oligomers (array) obtainable according to claim 11.
13. An array of different oligonucleotide- and/or PNA-oligomer sequences as recited in claim 12,
characterized in that these are arranged on a plane solid phase in the form of a rectangular or hexagonal lattice.
14. The array as recited in any of the claims 12 or 13,
characterized in that the solid phase surface is composed of silicon, glass, polystyrene, aluminium, steel, iron, copper, nickel, silver, or gold.
15. A DNA- and/or PNA-array for analyzing diseases associated with the methylation state of genes,
comprising at least one nucleic acid according to one of the preceeding claims.
16. A method for ascertaining genetic and/or epigenetic parameters for the diagnosis and/or therapy of existing diseases or the predisposition to specific diseases by analyzing cytosine methylations, characterized in that the following steps are carried out:
a) in a genomic DNA sample, cytosine bases which are unmethylated at the 5-position are converted, by chemical treatment, to uracil or another base which is dissimilar to cytosine in terms of hybridization behavior;
b) fragments of the chemically pretreated genomic DNA are amplified using sets of primer oligonucleotides according to claim 8 or 9 and a polymerase, the amplificates carrying a detectable label;
c) Amplificates are hybridized to a set of oligonucleotides and/or PNA probes according to the claims 6 and 7, or else to an array according to one of the claims 12 through 15;
d) the hybridized amplificates are subsequently detected.
17. The method as recited in claim 16,
characterized in that the chemical treatment is carried out by means of a solution of a bisulfite, hydrogen sulfite or disulfite.
18. The method as recited in one of the claims 16 or 17,
characterized in that more than ten different fragments having a length of 100-2000 base pairs are amplified.
19. The method as recited in one of the claims 16 through 18,
characterized in that the amplification of several DNA segments is carried out in one reaction vessel.
20. The method as recited in one of the claims 16 through 19,
characterized in that the polymerase is a heat-resistant DNA polymerase.
21. The method as recited in claim 20,
characterized in that the amplification is carried out by means of the polymerase chain reaction (PCR).
22. The method as recited in one of the claims 16 through 21, characterized in that the labels of the amplificates are fluorescence labels.
23. The method as recited in one of the claims 16 through 21, characterized in that the labels of the amplificates are radionuclides.
24. The method as recited in one of the claims 16 through 21, characterized in that the labels of the amplificates are detachable molecule fragments having a typical mass which are detected in a mass spectrometer.
25. The method as recited in one of the claims 16 through 21, characterized in that the amplificates or fragments of the amplificates are detected in the mass spectrometer.
26. The method as recited in one of the claims 24 and/or 25, characterized in that the produced fragments have a single positive or negative net charge for better detectability in the mass spectrometer.
27. The method as recited in one of the claims 24 through 26, characterized in that detection is carried out and visualized by means of matrix assisted laser desorption/ionization mass spectrometry (MALDI) or using electron spray mass spectrometry (ESI).
28. The method as recited in one of the claims 16 through 27, characterized in that the genomic DNA is obtained from cells or cellular components which contain DNA, sources of DNA comprising, for example, cell lines, biopsies, blood, sputum, stool, urine, cerebral-spinal fluid, tissue embedded in paraffin such as tissue from eyes, intestine, kidney, brain, heart, prostate, lung, breast or liver, histologic object slides, and all possible combinations thereof.
29. A kit comprising a bisulfite (=disulfite, hydrogen sulfite) reagent as well as oligonucleotides and/or PNA-oligomers according to one of the claims 3 through 5.
30. The use of a nucleic acid according to claims 1 or 2, of an oligonucleotide or PNA-oligomer according to one of the claims 3 through 5, of a kit according to claim 29, of an array according to one of the claims 12 through 15, of a set of oligonucleotides according to one of claims 6 through 9 for the diagnosis of metabolic disease, solid tumours and cancers.
31. The use of a nucleic acid according to claims 1 or 2, of an oligonucleotide or PNA-oligomer according to one of claims 3 through 5, of a kit according to claim 29, of an array according to one of the claims 12 through 15, of a set of oligonucleotides according to one of claims 6 through 9 for the therapy of metabolic disease, solid tumours and cancers.
32. A kit, comprising a bisulfite (=disulfite, hydrogen sulfite) reagent as well as oligonucleotides and/or PNA-oligomers according to one of claims 3 through 5.
US10/240,454 2000-04-06 2001-04-06 Diagnosis of diseases associated with metabolism Abandoned US20040067491A1 (en)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
DE10019058.8 2000-04-06
DE10019058A DE10019058A1 (en) 2000-04-06 2000-04-06 Designing primers and probes for analyzing diseases associated with cytosine methylation state e.g. arthritis, cancer, aging, arteriosclerosis comprising fragments of chemically modified genes associated with cell cycle
DE10019173 2000-04-07
DE10019173.8 2000-04-07
DE10032529A DE10032529A1 (en) 2000-06-30 2000-06-30 Diagnosis of major genetic parameters within the Major Histocompatibility Complex (MHC)
DE10032529.7 2000-06-30
DE10043826 2000-09-01
DE10043826.1 2000-09-01
PCT/EP2001/004016 WO2001076451A2 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with metabolism

Publications (1)

Publication Number Publication Date
US20040067491A1 true US20040067491A1 (en) 2004-04-08

Family

ID=27437807

Family Applications (7)

Application Number Title Priority Date Filing Date
US10/239,676 Expired - Fee Related US7195870B2 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with gene regulation
US10/240,454 Abandoned US20040067491A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with metabolism
US10/240,589 Abandoned US20040076956A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with dna repair
US10/240,453 Abandoned US20030148326A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with dna transcription
US10/240,485 Abandoned US20030148327A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with metastasis
US10/240,452 Abandoned US20030162194A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with apoptosis
US10/240,708 Abandoned US20050282157A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with dna replication

Family Applications Before (1)

Application Number Title Priority Date Filing Date
US10/239,676 Expired - Fee Related US7195870B2 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with gene regulation

Family Applications After (5)

Application Number Title Priority Date Filing Date
US10/240,589 Abandoned US20040076956A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with dna repair
US10/240,453 Abandoned US20030148326A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with dna transcription
US10/240,485 Abandoned US20030148327A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with metastasis
US10/240,452 Abandoned US20030162194A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with apoptosis
US10/240,708 Abandoned US20050282157A1 (en) 2000-04-06 2001-04-06 Diagnosis of diseases associated with dna replication

Country Status (7)

Country Link
US (7) US7195870B2 (en)
EP (9) EP1274866A2 (en)
JP (3) JP2003534780A (en)
AT (1) ATE353975T1 (en)
AU (9) AU2001254788A1 (en)
DE (1) DE60126593T2 (en)
WO (8) WO2001077164A2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090321626A1 (en) * 2006-05-26 2009-12-31 Akos Vertes Laser desorption ionization and peptide sequencing on laser induced silicon microcolumn arrays
US20100323917A1 (en) * 2009-04-07 2010-12-23 Akos Vertes Tailored nanopost arrays (napa) for laser desorption ionization in mass spectrometry
US9000361B2 (en) 2009-01-17 2015-04-07 The George Washington University Nanophotonic production, modulation and switching of ions by silicon microcolumn arrays

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6780982B2 (en) * 1996-07-12 2004-08-24 Third Wave Technologies, Inc. Charge tags and the separation of nucleic acid molecules
US6818404B2 (en) 1997-10-23 2004-11-16 Exact Sciences Corporation Methods for detecting hypermethylated nucleic acid in heterogeneous biological samples
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US8076063B2 (en) 2000-02-07 2011-12-13 Illumina, Inc. Multiplexed methylation detection methods
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
EP1274866A2 (en) 2000-04-06 2003-01-15 Epigenomics AG Diagnosis of diseases associated with metastasis
AU2001275294A1 (en) * 2000-06-07 2001-12-17 Biosynexus Incorporated. Immunostimulatory RNA/DNA hybrid molecules
EP1294947A2 (en) * 2000-06-30 2003-03-26 Epigenomics AG Method and nucleic acids for pharmacogenomic methylation analysis
AUPR142500A0 (en) * 2000-11-13 2000-12-07 Human Genetic Signatures Pty Ltd A peptide nucleic acid-based assay for the detection of specific nucleic acid sequences
DE10128508A1 (en) 2001-06-14 2003-02-06 Epigenomics Ag Methods and nucleic acids for the differentiation of prostate tumors
WO2003031932A2 (en) * 2001-10-05 2003-04-17 Case Western Reserve University Methods and compositions for detecting colon cancers
JP2003144172A (en) * 2001-11-16 2003-05-20 Nisshinbo Ind Inc Oligonucleotide-immobilized board for detecting methylation
US20110151438A9 (en) 2001-11-19 2011-06-23 Affymetrix, Inc. Methods of Analysis of Methylation
DE10161625A1 (en) * 2001-12-14 2003-07-10 Epigenomics Ag Methods and nucleic acids for the analysis of a pulmonary cell division disorder
WO2003076593A2 (en) * 2002-03-07 2003-09-18 The Johns Hopkins University School Of Medicine Genomic screen for epigenetically silenced genes associated with cancer
EP1344832A1 (en) * 2002-03-15 2003-09-17 Epigenomics AG Methods and nucleic acids for the analysis of methylation within the gene melastatin
WO2003083107A1 (en) * 2002-03-25 2003-10-09 The Board Of Trustees Of The University Of Arkansas Cpg retrieval of dna from formalin-fixed pathology specimen for promoter methylation analysis
AU2003247880B2 (en) * 2002-07-03 2010-09-02 Coley Pharmaceutical Group, Inc. Nucleic acid compositions for stimulating immune responses
US20040053880A1 (en) 2002-07-03 2004-03-18 Coley Pharmaceutical Group, Inc. Nucleic acid compositions for stimulating immune responses
US7807803B2 (en) 2002-07-03 2010-10-05 Coley Pharmaceutical Group, Inc. Nucleic acid compositions for stimulating immune responses
CA2500255A1 (en) * 2002-10-01 2004-04-29 Epigenomics Ag Method and nucleic acids for the treatment of breast cell proliferative disorders
WO2004050915A1 (en) * 2002-12-02 2004-06-17 Solexa Limited Determination of methylation of nucleic acid sequences
DE10304219B3 (en) * 2003-01-30 2004-08-19 Epigenomics Ag Method for the detection of cytosine methylation patterns with high sensitivity
US20050266409A1 (en) * 2003-02-04 2005-12-01 Wyeth Compositions and methods for diagnosing, preventing, and treating cancers
US20050009059A1 (en) * 2003-05-07 2005-01-13 Affymetrix, Inc. Analysis of methylation status using oligonucleotide arrays
WO2004111266A1 (en) 2003-06-17 2004-12-23 Human Genetic Signatures Pty Ltd Methods for genome amplification
EP1660683B1 (en) 2003-08-14 2017-04-19 Case Western Reserve University Methods and compositions for detecting colon cancers
US8415100B2 (en) 2003-08-14 2013-04-09 Case Western Reserve University Methods and compositions for detecting gastrointestinal and other cancers
DE10338308B4 (en) 2003-08-15 2006-10-19 Epigenomics Ag Method for the detection of cytosine methylations in DNA
CA2537810C (en) 2003-09-04 2012-12-18 Human Genetic Signatures Pty Ltd Nucleic acid detection assay
AU2004281299B2 (en) * 2003-10-20 2010-11-18 St Vincent's Hospital Sydney Limited Assessment of disease risk by quantitative determination of epimutation in normal tissues
EP3269826B1 (en) * 2003-12-01 2020-03-11 Epigenomics AG Methods and nucleic acids for the analysis of gene expression associated with the development of prostate cell proliferative disorders
EP1561821B1 (en) 2003-12-11 2011-02-16 Epigenomics AG Prognostic markers for prediction of treatment response and/or survival of breast cell proliferative disorder patients
EP1568786A3 (en) * 2004-02-13 2007-08-29 Affymetrix, Inc. (A US Entity) Analysis of methylation status using nucleic acid arrays
US8168777B2 (en) 2004-04-29 2012-05-01 Human Genetic Signatures Pty. Ltd. Bisulphite reagent treatment of nucleic acid
ATE476439T1 (en) 2004-09-10 2010-08-15 Human Genetic Signatures Pty AMPLIFICATION BLOCKERS COMPRISING INTERCALATING NUCLEIC ACIDS (INA) CONTAINING INTERCALATING PSEUDONUCLEOTIDES (IPN)
KR20060026595A (en) 2004-09-21 2006-03-24 (주)지노믹트리 Method for detecting methylaion of promoter using restriction enzyme and dna chip
KR100617649B1 (en) * 2004-09-24 2006-09-04 (주)지노믹트리 Composition For Cancer diagnosis Containing Methylated Promoters of Colon Cancer Specific Expression-decreased Genes and Use Thereof
EP1828411B1 (en) 2004-12-03 2012-11-07 Human Genetic Signatures PTY Ltd Methods for simplifying microbial nucleic acids by chemical modification of cytosines
US20060134650A1 (en) * 2004-12-21 2006-06-22 Illumina, Inc. Methylation-sensitive restriction enzyme endonuclease method of whole genome methylation analysis
WO2006088978A1 (en) 2005-02-16 2006-08-24 Epigenomics, Inc. Method for determining the methylation pattern of a polynucleic acid
SI1871912T1 (en) 2005-04-15 2012-06-29 Epigenomics Ag Method for determining DNA methylation in blood or urine samples
WO2006111586A2 (en) * 2005-04-20 2006-10-26 Proyecto De Biomedicina Cima, S.L. Method for the in vitro determination of the degree of methylation of the line-1 promoter
JP2008541705A (en) 2005-05-26 2008-11-27 ヒューマン ジェネティック シグネチャーズ ピーティーワイ リミテッド Isothermal strand displacement amplification using primers containing non-standard bases
US20060292585A1 (en) * 2005-06-24 2006-12-28 Affymetrix, Inc. Analysis of methylation using nucleic acid arrays
ATE531820T1 (en) 2005-09-14 2011-11-15 Human Genetic Signatures Pty HEALTH CONDITION TEST
WO2007082099A2 (en) 2006-01-11 2007-07-19 Genomic Health, Inc. Gene expression markers for colorectal cancer prognosis
US7465544B2 (en) * 2006-01-11 2008-12-16 Wisconsin Alumni Research Foundation Synthetic cofactor analogs of S-adenosylmethionine as ligatable probes of biological methylation and methods for their use
EP1826278A1 (en) * 2006-02-28 2007-08-29 Epiontis GmbH Epigenetic modification of the loci for camta1 and/or foxp3 as a marker for cancer treatment
US7901882B2 (en) 2006-03-31 2011-03-08 Affymetrix, Inc. Analysis of methylation using nucleic acid arrays
EP2471951A1 (en) * 2006-05-02 2012-07-04 University of Southhampton Predicting cognitive development by gene methylation analysis
WO2008096146A1 (en) * 2007-02-07 2008-08-14 Solexa Limited Preparation of templates for methylation analysis
ES2685678T3 (en) * 2007-10-23 2018-10-10 Clinical Genomics Pty Ltd A method for the diagnosis of neoplasms - II
EP2215250B1 (en) 2007-11-27 2013-02-27 Human Genetic Signatures Pty Ltd Enzymes for amplification and copying bisulphite modified nucleic acids
WO2010007083A2 (en) * 2008-07-15 2010-01-21 Epigenomics Ag Methods and nucleic acids for analyses of cell proliferative disorders
US8541207B2 (en) 2008-10-22 2013-09-24 Illumina, Inc. Preservation of information related to genomic DNA methylation
CA2760333A1 (en) 2009-05-01 2010-11-04 Genomic Health Inc. Gene expression profile algorithm and test for likelihood of recurrence of colorectal cancer and response to chemotherapy
CA2769862A1 (en) 2009-08-28 2011-03-03 Cellular Dynamics International, Inc. Identifying genetic variation in affected tissues derived from induced pluripotent stem cells
WO2011080314A2 (en) * 2009-12-31 2011-07-07 Deutsches Krebsforschungszentrum Novel modulators of trail signalling
WO2012149245A2 (en) * 2011-04-28 2012-11-01 Ostrer Harry Genomic signatures of metastasis in prostate cancer
WO2012162139A1 (en) 2011-05-20 2012-11-29 The Regents Of The University Of California Method to estimate age of individual based on epigenetic markers in biological sample
NZ622418A (en) 2011-09-07 2014-12-24 Human Genetic Signatures Pty Molecular detection assay
EP2821487B1 (en) * 2012-02-29 2016-10-26 Sysmex Corporation Method for determining presence or absence of cancer cell derived from hepatocellular carcinoma, and determination marker and kit
US10706957B2 (en) 2012-09-20 2020-07-07 The Chinese University Of Hong Kong Non-invasive determination of methylome of tumor from plasma
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
KR101302173B1 (en) 2012-12-07 2013-08-30 이화여자대학교 산학협력단 Composition for diagnosing alzheimer's disease using methylation status of hmox1 gene and method for diagnosing alzheimer's disease using the same
US20140274757A1 (en) 2013-03-14 2014-09-18 Marie K. Kirby Differential Methylation Level of CpG Loci That Are Determinative of a Biochemical Reoccurrence of Prostate Cancer
SG11201608403TA (en) * 2014-04-28 2016-11-29 Sigma Aldrich Co Llc Epigenetic modification of mammalian genomes using targeted endonucleases
EP3850083A4 (en) * 2018-09-14 2022-06-29 Shinozaki, Gen Systems and methods for detection of delirium risk using epigenetic markers
CN111217900A (en) * 2018-11-27 2020-06-02 上海交通大学 Transcription regulation factor for angiogenesis and application thereof
SG11202107670TA (en) 2019-01-18 2021-08-30 Univ California Dna methylation measurement for mammals based on conserved loci
EP4047102A4 (en) 2019-10-14 2024-04-17 Gencurix Inc Composition for diagnosing liver cancer by using cpg methylation changes in specific genes, and use thereof
KR102637032B1 (en) 2020-01-28 2024-02-15 주식회사 젠큐릭스 Composition for diagnosing bladder cancer using CpG methylation status of specific gene and uses thereof
WO2021206467A1 (en) 2020-04-08 2021-10-14 주식회사 젠큐릭스 Composition for diagnosing colorectal cancer, rectal cancer, or colorectal adenoma using cpg methylation change of glrb gene, and use thereof
CN111500702B (en) * 2020-04-26 2021-04-20 江苏大学附属医院 Application of cg00843506 site methylation of RPN1 gene in diagnosing asthma
WO2023175019A1 (en) 2022-03-15 2023-09-21 Genknowme S.A. Method determining the difference between the biological age and the chronological age of a subject

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6017704A (en) * 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US6214556B1 (en) * 1997-11-27 2001-04-10 Epigenomics Ag Method for producing complex DNA methylation fingerprints
US6331393B1 (en) * 1999-05-14 2001-12-18 University Of Southern California Process for high-throughput DNA methylation analysis

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5744101A (en) * 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5474796A (en) * 1991-09-04 1995-12-12 Protogene Laboratories, Inc. Method and apparatus for conducting an array of chemical reactions on a support surface
SE501439C2 (en) 1993-06-22 1995-02-13 Pharmacia Lkb Biotech Method and apparatus for analyzing polynucleotide sequences
US5837832A (en) 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
DE69433180T2 (en) * 1993-10-26 2004-06-24 Affymetrix, Inc., Santa Clara FIELDS OF NUCLEIC ACID PROBE ON ORGANIC CHIPS
KR100392057B1 (en) 1993-11-30 2003-10-30 맥길 유니버시티 A Methool of Reducing Methylation of Cytosine in a Cpg Dinucleotide in a Cell
US5858661A (en) * 1995-05-16 1999-01-12 Ramot-University Authority For Applied Research And Industrial Development Ataxia-telangiectasia gene and its genomic organization
US5871917A (en) 1996-05-31 1999-02-16 North Shore University Hospital Research Corp. Identification of differentially methylated and mutated nucleic acids
WO1998056952A1 (en) * 1997-06-09 1998-12-17 University Of Southern California A cancer diagnostic method based upon dna methylation differences
DE19750172C1 (en) * 1997-11-12 1998-10-01 Deutsches Krebsforsch DNA with promoter activity
WO1999029898A2 (en) * 1997-12-05 1999-06-17 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Method for identifying nucleic acids by means of matrix-assisted laser desorption/ionisation mass spectrometry
AU5128999A (en) * 1998-07-24 2000-02-14 Yeda Research And Development Co. Ltd. Prevention of metastasis with 5-aza-2'-deoxycytidine
DE19905082C1 (en) * 1999-01-29 2000-05-18 Epigenomics Gmbh Identification of methylation patterns of cytosine in genome DNA comprises chemical treatment to produce different base pairing behavior between cytosine and 5-methylcytosine
US6783933B1 (en) * 1999-09-15 2004-08-31 The Johns Hopkins University School Of Medicine CACNA1G polynucleotide, polypeptide and methods of use therefor
US7332275B2 (en) * 1999-10-13 2008-02-19 Sequenom, Inc. Methods for detecting methylated nucleotides
EP1283905A2 (en) * 2000-03-15 2003-02-19 Epigenomics AG Diagnosis of diseases associated with the cell cycle
EP1274866A2 (en) 2000-04-06 2003-01-15 Epigenomics AG Diagnosis of diseases associated with metastasis
EP1294947A2 (en) 2000-06-30 2003-03-26 Epigenomics AG Method and nucleic acids for pharmacogenomic methylation analysis
DE10037769A1 (en) 2000-08-03 2002-02-21 Epigenomics Gmbh Diagnosis of diseases associated with CD24
US6812339B1 (en) * 2000-09-08 2004-11-02 Applera Corporation Polymorphisms in known genes associated with human disease, methods of detection and uses thereof
DE10054974A1 (en) 2000-11-06 2002-06-06 Epigenomics Ag Diagnosis of diseases associated with Cdk4
DE10054972A1 (en) 2000-11-06 2002-06-06 Epigenomics Ag Diagnosis of diseases associated with humus
DE10128508A1 (en) * 2001-06-14 2003-02-06 Epigenomics Ag Methods and nucleic acids for the differentiation of prostate tumors
WO2003004696A2 (en) * 2001-07-02 2003-01-16 Epigenomics Ag A distributed system for epigenetic based prediction of complex phenotypes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6017704A (en) * 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US6214556B1 (en) * 1997-11-27 2001-04-10 Epigenomics Ag Method for producing complex DNA methylation fingerprints
US6331393B1 (en) * 1999-05-14 2001-12-18 University Of Southern California Process for high-throughput DNA methylation analysis

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090321626A1 (en) * 2006-05-26 2009-12-31 Akos Vertes Laser desorption ionization and peptide sequencing on laser induced silicon microcolumn arrays
US8084734B2 (en) 2006-05-26 2011-12-27 The George Washington University Laser desorption ionization and peptide sequencing on laser induced silicon microcolumn arrays
US9000361B2 (en) 2009-01-17 2015-04-07 The George Washington University Nanophotonic production, modulation and switching of ions by silicon microcolumn arrays
US20100323917A1 (en) * 2009-04-07 2010-12-23 Akos Vertes Tailored nanopost arrays (napa) for laser desorption ionization in mass spectrometry
US9490113B2 (en) 2009-04-07 2016-11-08 The George Washington University Tailored nanopost arrays (NAPA) for laser desorption ionization in mass spectrometry

Also Published As

Publication number Publication date
ATE353975T1 (en) 2007-03-15
US20030162194A1 (en) 2003-08-28
JP2003534780A (en) 2003-11-25
DE60126593D1 (en) 2007-03-29
DE60126593T2 (en) 2007-10-31
WO2001081622A3 (en) 2003-09-04
WO2001092565A3 (en) 2002-09-06
EP1272670A2 (en) 2003-01-08
AU2001254794A1 (en) 2001-10-23
AU7633001A (en) 2001-10-23
WO2001092565A8 (en) 2002-05-30
US7195870B2 (en) 2007-03-27
WO2001076451A9 (en) 2002-08-08
WO2001077375A8 (en) 2002-10-24
WO2001081622A8 (en) 2002-05-16
WO2001092565A2 (en) 2001-12-06
AU2001276330B2 (en) 2006-08-31
EP1370685A2 (en) 2003-12-17
WO2001077377A2 (en) 2001-10-18
WO2001077164A8 (en) 2002-03-21
US20030082609A1 (en) 2003-05-01
EP1274866A2 (en) 2003-01-15
WO2001077378A3 (en) 2002-10-17
WO2001077376A8 (en) 2002-03-21
AU2001254788A1 (en) 2001-10-23
WO2001077375A2 (en) 2001-10-18
WO2001077377A8 (en) 2002-02-28
US20040076956A1 (en) 2004-04-22
US20030148327A1 (en) 2003-08-07
EP1274865B1 (en) 2007-02-14
WO2001077376A3 (en) 2002-08-08
AU2001275663A1 (en) 2001-10-23
WO2001077376A2 (en) 2001-10-18
EP1278893A2 (en) 2003-01-29
WO2001077164A2 (en) 2001-10-18
EP1360319A2 (en) 2003-11-12
JP2004508807A (en) 2004-03-25
US20030148326A1 (en) 2003-08-07
WO2001076451A3 (en) 2003-09-04
AU2001276331A1 (en) 2001-10-23
AU2001277487A1 (en) 2001-10-23
EP1268857A2 (en) 2003-01-02
WO2001077375A3 (en) 2002-06-27
WO2001077377A3 (en) 2002-07-11
WO2001076451A2 (en) 2001-10-18
AU2001289600A1 (en) 2001-12-11
WO2001081622A2 (en) 2001-11-01
EP2014776A2 (en) 2009-01-14
EP2014776A3 (en) 2009-04-01
EP1268861A2 (en) 2003-01-02
EP1274865A2 (en) 2003-01-15
WO2001077378A2 (en) 2001-10-18
US20050282157A1 (en) 2005-12-22
WO2001077164A3 (en) 2002-06-20
AU2001278420A1 (en) 2001-11-07
JP2003531589A (en) 2003-10-28

Similar Documents

Publication Publication Date Title
US20040067491A1 (en) Diagnosis of diseases associated with metabolism
KR101708544B1 (en) Methods and nucleic acids for analyses of cellular proliferative disorders
KR102318434B1 (en) Antisense oligomers for the treatment of conditions and diseases
KR102046668B1 (en) Methods and nucleic acids for determining the prognosis of a cancer subject
KR101778036B1 (en) Phosphodiesterase 4D7 as prostate cancer marker
KR20200103765A (en) Targeted integration of nucleic acids
WO1998045435A2 (en) SECRETED EXPRESSED SEQUENCE TAGS (sESTs)
KR102110469B1 (en) Phosphodiesterase 4d7 as marker for malignant, hormone-sensitive prostate cancer
EP0973896A2 (en) SECRETED EXPRESSED SEQUENCE TAGS (sESTs)
CN112195287B (en) Probe group for human papilloma virus HPV typing and integration detection and kit thereof
KR101621273B1 (en) Use of Cathepsin C
KR20210107057A (en) Targeted Integration of Nucleic Acids
CN101151371B (en) Retrotransposon inhibition in therapy
KR20230038486A (en) How to Diagnose Respiratory Pathogens and Predict COVID-19 Related Outcomes
KR101691415B1 (en) Naproxen responsive genes in Hydra magnipapillata and the method for diagnosing aquatic environment pollution using the same
KR20220025806A (en) Random configuration of nucleic acids targeted integration
KR101879998B1 (en) Zinc oxide nanoparticles responsive genes in hydra magnipapillata and the method for diagnosing aquatic environment pollution using the same
KR101474053B1 (en) Polymorphism marker for estimating risk of osteoporesis and osteoporotic fracture occurrence
CN112261951A (en) Stem cells comprising synthetic chimeric vaccinia virus and methods of use thereof
KR101635497B1 (en) Novel Citrullus vulgaris reduced seed number and breeding method thereof
KR102205790B1 (en) Ibuprofen responsive genes in hydra magnipapillata and the method for diagnosing aquatic environment pollution and diagnosing physiological and metabolic changes in hydra using the same
MXPA01011882A (en) Expression products of genes involved in diseases related to cholesterol metabolism.
KR20230027043A (en) Targeted integration of nucleic acids
KR20230158917A (en) 482-SNP panel for kinship identification in Korean and use thereof
US20020142378A1 (en) Isolated human transporter proteins, nucleic acid molecules encoding human transporter proteins, and uses thereof

Legal Events

Date Code Title Description
AS Assignment

Owner name: EPIGENOMICS AG, GERMANY

Free format text: ASSIGNMENT OF ASSIGNORS INTEREST;ASSIGNORS:OLEK, ALEXANDER;PIEPENBROCK, CHRISTIAN;BERLIN, KURT;REEL/FRAME:013829/0839

Effective date: 20021001

STCB Information on status: application discontinuation

Free format text: ABANDONED -- FAILURE TO RESPOND TO AN OFFICE ACTION