CN1333820A - 产生环氧噻酮及其衍生物的重组方法和材料 - Google Patents

产生环氧噻酮及其衍生物的重组方法和材料 Download PDF

Info

Publication number
CN1333820A
CN1333820A CN99815678A CN99815678A CN1333820A CN 1333820 A CN1333820 A CN 1333820A CN 99815678 A CN99815678 A CN 99815678A CN 99815678 A CN99815678 A CN 99815678A CN 1333820 A CN1333820 A CN 1333820A
Authority
CN
China
Prior art keywords
epothilone
pks
gene
assembly
perhaps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99815678A
Other languages
English (en)
Other versions
CN100381566C (zh
Inventor
布赖恩·朱利恩
雷那德·卡滋
柴坦·科斯拉
汤立
赖内·则曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kosan Biosciences Inc
Original Assignee
Kosan Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kosan Biosciences Inc filed Critical Kosan Biosciences Inc
Publication of CN1333820A publication Critical patent/CN1333820A/zh
Application granted granted Critical
Publication of CN100381566C publication Critical patent/CN100381566C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D417/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
    • C07D417/02Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings
    • C07D417/06Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings linked by a carbon chain containing only aliphatic carbon atoms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/10Antimycotics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D493/00Heterocyclic compounds containing oxygen atoms as the only ring hetero atoms in the condensed system
    • C07D493/02Heterocyclic compounds containing oxygen atoms as the only ring hetero atoms in the condensed system in which the condensed system contains two hetero rings
    • C07D493/04Ortho-condensed systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D493/00Heterocyclic compounds containing oxygen atoms as the only ring hetero atoms in the condensed system
    • C07D493/02Heterocyclic compounds containing oxygen atoms as the only ring hetero atoms in the condensed system in which the condensed system contains two hetero rings
    • C07D493/08Bridged systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D513/00Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00
    • C07D513/02Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00 in which the condensed system contains two hetero rings
    • C07D513/08Bridged systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin

Abstract

编码环氧噻酮聚酮化合物合成酶(PKS)的全部或者部分的重组核酸被用于在宿主细胞中表达重组PKS基因,以生产用作肿瘤化学治疗剂,杀真菌剂,和免疫抑制剂的环氧噻酮,环氧噻酮衍生物和聚酮化合物。

Description

产生环氧噻酮及其衍生物的重组方法和材料
政府基金说明
本发明中部分由SBIR基金1R43-CA79228-01支持。美国政府对本发明享有某些权利。
发明领域
本发明提供了产生环氧噻酮[Epothilone]和环氧噻酮衍生物的重组方法和材料。本发明涉及农业,化学,药物化学,医学,分子生物学和药学领域。
发明背景
环氧噻酮最早是由国家生物工程研究所[National Biotechnology ReasearchInsitute]的Gerhard Hofle和其同事从粘细菌,纤维堆囊菌(Sorangiumcellulosum)中作为抗真菌活性抽提出来的(参见K.Gerth等人,1996,J.Antibiotics[抗生素杂志]49:560-563和德国专利号DE 41 38 042的报道)。后来发现环氧噻酮在微管蛋白聚合测定中具有活性(见D.Bollag等人,1995,Cancer Res[肿瘤研究]55:2325-2333),从而鉴定为抗肿瘤试剂,并在此后作为治疗肿瘤的可能的抗肿瘤试剂而被广泛研究。
由纤维堆囊菌So ce 90株产生的环氧噻酮的化学结构的描述参见Hofle等人1996,epothilone A and B-novel 16-membered macrolides with cytotoxicactivity:isolation,crystal structure,and conformation in solution[环氧噻酮A和B-新的具有细胞毒活性的十六元大环内酯:分离,晶体结构,和溶液构象],Angew.Chem.Int.Ed.Engl,35(13/14):1567-1569。发现该菌株能产生两种环氧噻酮化合物,被命名为A(R=H)和B(R=CH3),如下所示,它们表现出对真核细胞具有广谱细胞毒活性,以及对乳腺和结肠肿瘤细胞系的显著的活性和选择性。
环氧噻酮A和B的脱氧对应物,也被称为环氧噻酮C(R=H)和D(R=CH3),已知具有更小的细胞毒活性,这些环氧噻酮的结构如下所示:
其它两种天然存在的环氧噻酮也有叙述。它们是环氧噻酮E和F;其中环氧噻酮A和B噻唑部分的甲基侧链被羟化,从而分别得到环氧噻酮E和F。
因为环氧噻酮作为抗肿瘤试剂的可能应用,以及由天然so ce 90菌株产生环氧噻酮的低水平,许多研究小组进行了合成环氧噻酮的努力。这些努力已经获得了成功(见Balog等,1996,Total Synthesis Of.(-)环氧噻酮A[环氧噻酮A的全程合成],Angen,Chem.Int.Ed.Engl.35(23/24);2801-2801;Su等,1997,Total Synthesis Of(-)环氧噻酮,B:an extension of the Suziki coupling methodand insighes into structure-activity relationships of the 环氧噻酮s[环氧噻酮B的全程合成:Suziki偶联法的扩展和环氧噻酮结构功能关系的透视],Agew.Chem.Int.Ed.Engl.36(7):757-759;Meng等,1997,Total SMThesis Of环氧噻酮s A and B[环氧噻酮A和B的全程合成],JACS 119(42);10073-10092;和Baloy等,1998,A novel adol condensation with 2-methy1-4-pentenaland its application to an improved total synthesis of epothilone B[一种新的带有2-甲基-4戊烯基的醇醛缩合和它应用于环氧噻酮B全程合成的改进],Angew Chem Int Ed Engl.37(19):2675-2678,各篇此处引入作为参考)。尽管这些努力获得了成功,但化学合成环氧噻酮是乏味,耗时和代价昂贵的。实际上,对于整个的环氧噻酮的药物开发来说,这些方法被证明是不实用的。
大量的环氧噻酮衍生物,和环氧噻酮A-D得到了体内和体外的研究(见Su等1997,Structure-activity relationships of环氧噻酮s and the first in vivocomparison with paclitaxel[环氧噻酮的结构活性关系和第一次与paclitaxel的体内比较],Angew Chem Int Ed Engl 36(19):2093-2096;和Chou等Aug.1998,Desoxy环氧噻酮B:an efficacious microtube-targed antitumor agent with apromising in vivo profile relATive to 环氧噻酮B[脱氧环氧噻酮B:一种在体内可能在一些方面与环氧噻酮B有关的有效的微管靶向的抗肿瘤试剂],Proc.NATI.Acad.Sci.USA 95:9642-9647,此处引入各篇作为参考)。其它的环氧噻酮衍生物以及合成环氧噻酮及环氧噻酮衍生物的方法的描述见:PCT专利公开号99/54330,99/54319,99/54318,99/43653,99/43320,99/42602,99/40047,99/27890,99/07692,99/02514,99/01124,98/25929,98/22461,98/08849,和97/19086;美国专利号5,969,145;和德国专利公开号DE.4138 042,此处引用各篇文献作为参考。
有必要用比较经济的方法来生产天然存在的环氧噻酮和它们的衍生物或前体,及其改进性能的新的环氧噻酮衍生物。有必要用比天然产物菌纤维堆囊菌更易操作和发酵的宿主细胞来产生环氧噻酮或者环氧噻酮衍生物。本发明解决了这些和其它的需要。
发明概述
在一个实施方案中,本发明提供了编码所需蛋白的重组DNA化合物以产生环氧噻酮A,B,C和D。本发明还提供了编码部分这些蛋白的重组DNA化合物。本发明还提供了编码杂合蛋白的重组DNA化合物,所述杂合蛋白包括与环氧噻酮生物合成有关的完整的蛋白质或其一部分,以及与其它聚酮化合物或者非核糖体衍生的肽的生物合成有关的完整的蛋白质或其一部分。在一个优选实施方案中,本发明的重组DNA化合物是易于编码序列操作的重组DNA克隆载体,或在重组宿主细胞中编码以表达本发明的一种或者多种蛋白质的重组DNA表达载体。
在另一个实施方案中,本发明提供了产生目的环氧噻酮或环氧噻酮衍生物的重组宿主细胞。在一个实施方案中,本发明提供了宿主细胞,它以比天然存在的产生环氧噻酮的生物高的水平,产生一种或者多种环氧噻酮或者环氧噻酮衍生物。在另一个实施方案中,本发明提供的宿主细胞产生的环氧噻酮混合物,比天然存在的宿主细胞所产生的混合物的复杂性要小。在另一个实施方案中本发明提供了产生环氧噻酮或者环氧噻酮衍生物的非纤维堆囊菌重组宿主细胞。
在一个优选的实施方案中,本发明的宿主细胞比天然存在的产环氧噻酮的细胞,产生较少复杂性的环氧噻酮混合物。天然存在的产环氧噻酮细胞通常产生环氧噻酮A,B,C,D,E和F的混合物。下表总结了本发明设计的不同的宿主细胞产生的环氧噻酮。
细胞类型    产生的环氧噻酮    不产生的环氧噻酮
1           A,B,C,D,E,F      -------
2               A,C,E           B,D,F
3               B,D,F           A,C,E
4             A,B,C,D           E,F
5                A,C            B,D,E,F
6                 C             A,B,D,E,F
7                B,D            A,C,E,F
8                 D             A,B,C,E,F
另外,可以构建一些细胞类型产生新发现的环氧噻酮G和H,G和H的一种,或者它们的下游环氧噻酮,如下作进一步讨论。因此可以理解,基于本发明,与天然存在的环氧噻酮有关的生物合成途径分别是,G-C-A-E和H-P-B-F。合适的酶也可以将一个途径中的成员转换为另外一个途径的相应的成员。
因此,本发明的宿主细胞还包括仅产生一种目的环氧噻酮或者环氧噻酮衍生物的宿主细胞。
在另一个实施方案中,本发明提供了经过遗传修饰的纤维堆囊菌宿主细胞,它或者以比在天然宿主细胞中观察到的较高的水平产生环氧噻酮,或者产生的环氧噻酮混合物比天然宿主细胞中产生的复杂性要小,或者产生一种不在天然状态下产生的环氧噻酮衍生物。在一个优选的实施方案中,宿主细胞产生的环氧噻酮等于或者大于20mg/L。
在另一个实施方案中,本发明的重宿主细胞是经过遗传修饰以产生环氧噻酮或者环氧噻酮衍生物的非纤维堆囊菌细胞。在一个优选实施方案中,宿主细胞产生的环氧噻酮等于或者大于20mg/L。在更优选的实施方案中,重组宿主细胞是粘球菌(Myxococcus),假单胞菌(Pseudomonas)或者链霉菌(Streptomyces)宿主细胞,它们以等于或者大于20mg/L的水平产生环氧噻酮或者环氧噻酮衍生物。在另一个实施方案中,本发明提供了应用于农业,兽医,和医学的新的化合物。在一个实施方案中,这些化合物被用作杀真菌剂。在另一个实施方案中,这些化合物被用作肿瘤化学治疗剂。在一个优选的实施方案中,该化合物是至少有可能抗肿瘤细胞的环氧噻酮衍生物,如环氧噻酮B或者D。在另一个实施方案中,该化合物可以用做免疫抑制剂。在另一实施方案中,这些化合物被用于其它化合物的制备。在一个优选实施方案中,化合物用于人用和动物用的混合物和溶液配方中。
本发明的这些和其它实施方案在后续说明,实施例和后续列出的 有更详细的描述。
附图简要说明
图1显示了在四个互相重叠的粘粒粘粒克隆中插入的,跨过整个环氧噻酮基因簇的纤维堆囊菌基因组DNA的限制性位点图谱(分别对应于pKOS35-70.8A3,pKOS35-70.1A2,pKOS35-70.4,和pKOS35-79.85称做8A3,1A2,4和85)。图中也显示了环氧噻酮基因簇的功能图谱。图中还显示了装载结构域(装载,epo A),非核糖体肽合成酶组件(NRPS,组件1,epo B),和环氧噻酮合成酶基因余下的8个组件中的每个组件(从组件2到9,epo C,epoD,epo E和epo F),图中也显示了编码细胞色素P450类环氧化酶的epo K基因的位置。
图2显示了许多可供应给本发明的环氧噻酮PKS的N-酰基胱氨酸硫酯衍生物的前体化合物,该环氧噻酮PKS酶中NRPS类组件1或者组件2KS结构域被失活以产生一种新的环氧噻酮衍生物。图2还显示了制备这种化合物的整个合成步骤。
图3显示了质粒pKOS35-82.1,和pKOS35-82.2的限制性酶切位点和功能图谱。
图4显示了质粒pKOS35-154,和pKOS90-22的限制性酶切位点和功能图谱。
图5显示了,如实施例3所述的,将环氧噻酮PKS和修饰酶基因导入黄色粘球菌宿主细胞染色体中的方法流程。
图6显示了质粒pKOS039-124,和pKOS39-124R的限制性酶切位点和功能图谱。
图7显示了质粒pKOS39-126R的限制性酶切位点和功能图谱。
图8显示了质粒pKOS039-141的限制性酶切位点和功能图谱。
图9显示了质粒pKOS045-12的限制性酶切位点和功能图谱。
发明详述
本发明提供了在纤维堆囊菌细胞中合成环氧噻酮的,重组或者分离形式的基因和蛋白质。这里使用的术语“重组的”指的是通过人类干预,通常是通过对基因或者它的一部分的特异性地和直接地操作而获得的化合物或者组合物。术语的“分离的”,指的是制备的化合物或组合物基本上没有污染,或者没有不需要的物质,或者与天然存在的化合物或组合物相比,制备基本上没有该化合物或者组合物在天然状态下相关的物质。环氧噻酮(环氧噻酮A,B,C,D,E和F)以及它们结构上相关的化合物(环氧噻酮衍生物)是有前景的对真核细胞特异的细胞毒试剂。这些化合物可用作抗真菌剂,肿瘤化学治疗剂,和免疫抑制剂。环氧噻酮在它们从中鉴定出来的天然存在的纤维堆囊菌细胞中,以非常低的水平产生,纤维堆囊菌生长非常缓慢,而且纤维堆囊菌菌株的发酵是困难的和耗时的。本发明的一个重要的好处是能够方便地在非纤维堆囊菌宿主细胞中,产生环氧噻酮或环氧噻酮衍生物。本发明另一个好处是在本发明的重组细胞中能比可能的天然存在的环氧噻酮产生细胞中,以更高,水平和更大量地产生环氧噻酮。而另一个好处是能够在重组宿主细胞中产生环氧噻酮衍生物。
通过纤维堆囊菌SMP44 DNA基因组文库的探针,达到编码环氧噻酮生物合成基因重组DNA的分离。如下述实施例1中所更完整描述的那样,用SaulllAl限制性酶部分消化的纤维堆囊菌基因组DNA,并将产生的DNA片段插入到BamHI消化的SupERcosTM粘粒粘粒(StrATagene公司)DNA中,从而制备了该文库。用特异于PKS基因序列的探针进行探针检测,并用含有初级探针检测出的核苷酸序列的次级探针进行再次探针检测,从而鉴定出含有环氧噻酮基因序列的柯期质粒克隆。
通过这些努力鉴定出4个相互重叠的粘粒粘粒克隆。这4个粘粒,根据布达佩斯条约的期限,保藏在美国典型培养物保藏中心(ATCC),Manassas,VA,USA,并被给予ATCC登记号。这些克隆(和登记号)被命名为粘粒pKOS35-70.1A2(ATCC 203782),pKOS35-70.4(ATCC 203781),pKOS35-70.8A3(ATCC 203783),和pKOS35-79.85(ATCC 203780)。这些粘粒含有插入DNA完全跨越环氧噻酮基因簇。这些粘粒的限制性位点图谱见图1。图1还提供了环氧噻酮基因簇的功能图谱,显示了6个环氧噻酮PKS基因和epoK P450环氧化酶基因的位点。
环氧噻酮PKS基因,和其它的PKS基因一样,含有的编码序列编码组织起来的一个装载结构域,一些组件,和一个硫酯酶结构域。如下面所全面描述的,每一个结构域和组件对应于一个具一种或多种特异性功能的多肽。通常,装载结构域负责结合用于合成聚酮化合物的第一个构造单位,并将它传递给第一个组件。用于形成复杂的聚酮化合物的构造单位通常是酰基硫硫酯,最通常的的是乙酰基,丙酰基,丙二酰基,甲基丙二酰基和乙基丙二酰基辅酶A,其它的构造单位包括氨基酸类的酰基硫酯。PKS通过反复的脱羧基的Claisen缩聚,在酰基硫构造单位之间,催化聚酮的生物合成。每个组件负责形成一个构造单位,对构造单位行使一种或者多种功能,开将形成的化合物传递给下一个组件。下一个组件,接着负责连结下一个构造单位,并将生长着的化合物传递给下一个组件,直到合成反应完成。这时,PKS酶的硫酯酶活性(TE)裂解聚酮。
在本领域技术人员公知,这种模块组织是合成复杂的聚酮化合物的PKS酶类的特征。对于模块化PKS基因进行操作的重组方法如下所述:美国专利号5,672,491,;5,712,146;5,830,750;和,843,718;以及PCT专利公开号98/49315和97/02358,每篇文献此处引入作为参考。已知一种原始类型的模块化PKS酶合成一种被称为6-脱氧红霉素内酯B(6-Deoxyeryhronolide B,6-dEB)的聚酮。被称为eryAI,eryAII,和eryAIII的基因编码合成称做脱氧红霉素内酯合成酶或DEBS多亚基蛋白(各个亚基被称为DEBS1,DEBS2,或者DEBS3),它合成6-dEB如美国专利号5,712,146和5,824,513所述,此处引入作为参考。
DEBS PKS的装载结构域包括一个酰基转移酶(AT)和一个酰基载体蛋白(ACP)。DEBS装载结构域的AT识别丙酰基辅酶A(其它的装栽结构域AT可以识别其它的酰基辅酶A,例如乙酰基辅酶A,丙二酰基辅酶A,甲基丙二酰基辅酶A,或者丁酰基辅酶A)并将它们以硫酯酶的形式传递给装载结构域的ACP。同时,6个延伸组件上的每一个AT都识别一个甲基丙二酰基辅酶A(其它的延伸组件AT能够识别其后的辅酶a,例如丙二酰基,乙基丙二酰基,或者2-羟基丙二酰基辅酶A)并将它传递给该组件的ACP以形成硫酯。一旦DEBS形成酰基和甲基丙二酰基辅酶ACP,装载结构域的酰基基团就迁移在第一个组件的KS位置形成硫酯(转酯反应);在这一步骤,组件1占据着邻近甲基丙二酰基辅酶ACP的酰基-KS位置。DEBS装载结构域上的酰基基团然后由伴随的脱羧反应驱动,共价结合到延伸基因的α-碳上,形成碳碳键,从而产生一个骨架比装载单位长2个碳的新的酰基ACP(延长或延伸)。生长着的聚酮化合物链被从ACP上转移到DEBS下一个组件的KS上,并且这个过程继续下去。
聚酮化合物在DEBS的每个组件上生长2个碳,以共价键硫酯的形式顺次由组件向下一组件转移,类似于装配线过程。由这一过程产生的碳链在每2个碳原子上有一个酮基,产生一个聚酮化合物,聚酮化合物的名字由此而来。然而,通常地,在每2个碳单位的酮基团加到生长着的聚酮化合物的碳链后和在被转移到下一个组件之前,附加的酶促活性,对它进行了修饰。因此,除了含有形成碳碳键所必需的KS,AT和ACP的最小的组件外,组件还可以含有将酮基还原为醇基的酮还原酶(KR)。组件还可以含有一个KR和一个对醇基脱氢形成双键的脱氢酶(DH)。组件还可以含有一个KR,一个DH和一个烯醇基还原酶(ER),该烯醇基还原酶能够将β-碳用作亚甲基,转换双键成为饱和的单键。DEBS组件包括只有KR结构域,只有失活的KR结构域,和具有所有3个KR,DH和ER结构域。
一旦聚酮化合物链转移到PKS的最后一个组件,它就会遇到存在于大多数PKS末端的释放结构域或者硫酯酶。在这里,聚酮化学物被从酶上裂解下来,对大多数但不是所有的聚酮化合物来说,它会被环化。聚酮化合物通过加尾或者修饰酶的使用被进一步修饰,这些酶在聚酮化合物核心原子上加上糖基或者甲基,或者进行其它的修饰,即,氧化或者还原。例如,6-dEB在天然产生它的Saccharopolyspora erytraea细胞中被羟化,甲基化糖基化(糖苷化)而得到有名的抗生素红霉素A。
虽然上面的描述一般适用于模块化PKS酶,特别是DEBS,自然界中存否在许多不同的PKS酶。例如,许多PKS酶含有的装载结构域不象DEBS的装载结构域,这些PKS酶含有一个行使脱羧酶功能的“失活”的KS结构域。这些失活的KS在大多数例子中被称为KSQ,这里的上标是氨基酸(谷氨酰胺)的单字母缩写,它取代了酮合成酶活性所必需的活性部位的半胱氨酸。环氧噻酮PKS装载结构域含有其他PKS酶中不存在的KSY结构域,现在已获知它的氨基酸序列中氨基酸酪氨酸替换了半胱氨酸。本发明提供了这种新的KS结构域的重组DNA编码序列。
另一个重要的PKS酶的变化涉及到加入的构造单位的类型。一些聚酮化合物,包括环氧噻酮,被加入氨基酸衍生的构造单位。制造这种聚酮化合物的PKS酶要求加入构造单位所需的特异的组件。这些组件被称为非核糖体肽合成酶(NRPS)组件。例如,环氧噻酮PKS,含有一个NRPS组件。另一例变化涉及组件的附加功能。例如,环氧噻酮PKS含有一个转甲基酶(MT)结构域,一个此前未知的制造聚酮化合物的组件化PKS酶结构域。
如下的实施例1中提供了环氧噻酮PKS基因和环氧噻酮加尾修饰酶基因可读框编码序列的完整核苷酸序列。这一序列资料,以及下面提供的关于序列中基因的可读框可读框位置的资料,提供了它们所编码蛋白的氨基酸序列。本领域的技术人员会认识到,由于遗传密码的简并性,各种种核苷酸序列不同的DNA化合物能用来编码本发明中特定的氨基酸序列。在本文中显示出来的纤维堆囊菌中的编码环氧噻酮PKS和环氧噻酮修饰酶的天然DNA序列,仅仅是用来例证性描述本发明的优选的实施方案。本发明包括,编码本发明多肽和蛋白质的氨基酸序列的任何序列的DNA化合物。同样地,通常多肽能够忍受它的氨基酸序列中的一个或多个替换,删除和插入而不丢失或明显丢失所要的活性,在一些例子中,甚至会有所需活性的提高。本发明包括含有不同的氨基酸序列的那些多肽,本发明所给出的氨基酸序列只是用来例证性描述本发明的优选的实施方案。
本发明提供了产生环氧噻酮的重组基因。本发明是用纤维堆囊菌SMP44的环氧噻酮PKS和修饰酶的克隆,鉴定和操作来例证的。本发明的描述和保藏的相关重组质粒及其描述,使从任何产生环氧噻酮的天然存在的宿主细胞来源的环氧噻酮PKS和修饰酶的鉴定,克隆和操作成为可能。这些宿主细胞包括其它纤维堆囊菌菌株,例如So ce 90,其它的纤维堆囊菌种,以及非纤维堆囊菌细胞。使用鉴定同源DNA序列和鉴定与已知蛋白功能,及相近基因编码基因的标准方法,本发明相关的普通技术人员能够进行这些鉴定,克隆和特征分析。而且本发明提供了从头合成,或者由其它非环氧噻酮PKS基因组装的重组环氧噻酮PKS和修饰酶基因,这些基因提供了在一种或多种蛋白中有序排列的结构域和组件,它们组装成产生环氧噻酮或环氧噻酮衍生物的PKS。
本发明的重组核酸,蛋白质和肽是种类繁多和多样的。为增加对本发明和它提供的不同化合物和方法的理解,下面的讨论描述了环氧噻酮的不同区域和相关的编码序列。这些讨论首先总体描述了编码PKS的基因,这些基因中不同结构域和组件的位置,以及这些组件中不同结构域的位置。然后,进行了更详细的讨论,首先集中在装载结构域,然后是NRPS组件,然后是环氧噻酮PKS的余下8个组件。
共有6个环氧噻酮PKS基因。epoA基因编码149 kDa的装载结构域(也被称为装载组件)。epoB编码组件1,158 kDa的NRPS组件。epoC基因编码193kDa的组件2。epoD编码一种765kDa的蛋白质,该蛋白包括组件3到6。epoE编码一种405kDa的蛋白质,它包含组件7和8。epoF基因编码一种257kDa的蛋白质,它包含组件9和硫酯酶结构域。紧接着epoF基因的下游是epoK,编码一个47kDa蛋白质的p450环氧化酶基因,紧接着的是epoL基因,它编码一个24kDa的脱氢酶。epoL基因随后的是一些可读框可读框,它们包括的基因编码据信与转运和调节有关的蛋白质。
如实施例1中所示,这些基因的序列以一个邻接的序列或者71,989个核苷酸的重叠群的形式存在。这重叠群还含有2个显示出源于转座子的基因,如下被命名为ORF A和ORF B。这两个基因据信与环氧噻酮的生物合成无关,但是可能含有起启动子或者增强子作用的序列。这个重叠群还含有多于12个的另外的可读框可读框,如下其中只有12个,被称为ORF2到ORF12和ORF2互补子的被鉴定出来。如上面提到的。ORF2实际上是2个ORF,因为互补链上显示出还含有一个ORF。这些ORF的相应的基因产物的功能(如果有的话),尚未确定。下面的表提供了实施例1所示重叠群序列中各种可读框,组件的编码序列,和结构域的编码序列的位置。本领域的技术人员在考虑实施例1所示的序列时应该认识到,因为在可读框中紧靠近显示为起始密码子的密码子的附近有甲硫氨酸或者缬氨基酸密码子的存在,几种基因的实际的起始位置可能不同于表中所示的起始位置。真正的起始密码子,应该通过基因表达蛋白的氨基酸测序来确定。
起始   终止             注释
3      992     转位酶基因ORF A,非PKS的部分
989    1501    转位酶基因ORF B,非PKS的部分
1998   6263    epoA基因,编码装载结构域
2031   3548    装载结构域的KSY
3621   4661    装载结构域的AT
4917   5810    装载结构域的ER,可能与噻唑部分形成有关
5856   6155    装载结构域的ACP
6260   10493   epoB基因,编码组件1,NRPS组件
6620   6649    NRPS组件的缩聚结构域C2
6861   6887    杂环化特征序列
6962   6982    NRPS组件的缩聚结构域C4
7358   7366    NRPS组件的缩聚结构域C7(部分)
7898   7921    NRPS组件的腺苷酰化结构域A1
8261   8308    NRPS组件的腺苷酰化结构域A3
8411   8422    NRPS组件的腺苷酰化结构域A4
8861   8905    NRPS组件的腺苷酰化结构域A6
8966   8983    NRPS组件的腺苷酰化结构域A7
9090  9179     NRPS组件的腺苷酰化结构域A8
9183  9992     形成噻唑的氧化区
10121 10138    NRPS组件的腺苷酰化结构域A10
10261 10306    NRPS组件的硫代结构域(PCP)
10639 16137    epoC基因,编码组件2
10654 12033    KS2,组件2的KS结构域
12250 13287    AT2,组件2的AT结构域
13327 13899    DH2,组件2的DH结构域
14962 15756    KR2,组件2的KR结构域
15763 16008    ACP2,组件2的ACP结构域
16134 37907    epoD基因,编码组件3-6
16425 17606    KS3
17817 18857    AT3
19581 20396    KR3
20424 20642    ACP3
20706 22082    KS4
22296 23336    AT4
24069 24647    KR4
24867 25151    ACP4
25203 26576    KS5
26793 27833    AT5
27966 28574    DH5
29433 30287    ER5
30321 30869    KR5
31077 31373    ACP5
31440 32807    KS6
33018 34067    AT6
34107 34676    DH6
35760 36641    ER6
36705 37256    KR6
37470 37796    ACP6
37912 49308    epo E基因,编码组件7和8
38014 39375    KS7
39589 40626    AT7
41341 41922    KR7
42181 42423    ACP7
42478 43851    KS8
44065 45102    AT8
45262 45810    DH(失活的)
46072 47172    MT8,组件8的甲基转移酶结构域
48103 48636    KR8,这个结构域是失活的
48850 49149    ACP8
49323 56642    epo F基因,编码组件9和TE结构域
49416 50774    KS9
50985 52025    AT9
52173 53414    DH(失活的)
54747 55313    KR9
55593 55805    ACP9
55878 56600    TE9,硫酯酶结构域
56757 58016    epo K基因,编码P450环氧化酶
58194 58733    epo L基因(推断的脱氢酶)
59405 59974    ORF2互补子,显示出互补链
59460 60249    ORF2
60271 60738    ORF3互补子,显示出互补链
61730 62647    ORF4(推断的转运蛋白)
63725 64333    ORF5
64372 65643    ORF6
66237 67472    ORF7(推断的氧化还原酶)
67572 68837    ORF8(推断的氧化还原酶膜亚基)
68837 69373    ORF9
69993 71174    ORF10(推断的转运蛋白)
71171 71542    ORF11
71557 71989    ORF12
通过浏览环氧噻酮基因簇的组织和序列,可以更好理解本发明提供的许多种不同的重组DNA化合物。
环氧噻酮PKS是由epoA,epoB,epoC,epoD,epoE,和epoF基因产物组成的多蛋白质复合物。为了将产生环氧噻酮的能力转移入宿主细胞中,人们可以提供具有本发明epoA,epoB,epoC,epoD,epoE,和epoF基因的宿主细胞,并可以选择其它能在宿主细胞中表达的基因。
本领域的技术人员可以理解,尽管环氧噻酮和其它的PKS酶可以指的是单体,这些酶通常是多亚基蛋白质。因此,人们可以通过改变构成PKS的编码一种或几种多亚基蛋白的一种或几种基因,来制备衍生的PKS(通过缺失或者突变形成的不同于天然存的PKS的PKS)或者杂合PKS(由两种不同的PKS酶的部分构成的PKS)。
环氧噻酮在PKS后的修饰或加尾包括由多种酶介导的多个步骤。这些酶在这里指的是加尾酶或修饰酶。令人惊讶地是,通过基因分析预测,以前没有报导过具有功能的环氧噻酮PKS结构域的产物。。这些化合物这里称为环氧噻酮G和H。环氧噻酮G和H缺少环氧噻酮C和D的C-12-C-13π-键和环氧噻酮A和B的C-12-C-13环氧化物,取而代之的是C-13位的羟基和氢,C12和C-13间的单键,以及C-12位的氢或者甲基。这些化合物预测是由环氧噻酮PKS产生的,因为环氧噻酮PKS组件4的DNA和相应的氨基酸序列没有显示出包含一个DH结构域。
然而,如下所述,环氧噻酮PKS基因epoA,epoB,epoC,epoD,epoE和epoF在特定的不表达epoK或者epoL的异源宿主细胞中的表达,导致环氧噻酮C和D的产生,它们缺少C-13羟基而具有C-12和C13之间的双键。介导双键开成的脱氢反应可有是由于环氧噻酮PKS中尚未识别的结构域(例如,脱氢反应可能发生在具有一个活性DH结构域的下一个组件上,它能在ER结构域的脱氢反应前,产生一个共轭的二烯烃前体),或者由于异源宿主细胞(天蓝色链酶菌)中发现的内源酶。以下,在纤维堆囊菌或者其它的宿主细胞中,环氧噻酮G和H可以通过epoL基因编码的脱氢酶的功能转化为环氧噻酮C和D。在任何时候,环氧噻酮C和D通过epoK基因编码的环氧化酶转换为环氧噻酮A和B。环氧噻酮A和B可以被羟化酶基因转化为环氧噻酮E和F,该羟化酶可以被上面鉴定出的一个ORF或者被纤维堆囊菌中的其他内源基因所编码。因此,通过向宿主细胞提供本发明的一种或多种重组修饰酶基因,或者通过应用天然表达或不表达修饰酶的宿主细胞,可以在宿主细胞中产生所要的环氧噻酮或者修饰的环氧噻酮衍生物。因此,通常通过使用合适的宿主和如果需要,对修饰酶的合适的失活,可以中断G→C→A→E的进    环氧噻酮H相应的下游过程;通过控制甲基化,可以选择一个或者两个途径。
因此,本发明提供了表达天然的存在的环氧噻酮A,B,C,和D及其衍生物的许多种重组DNA化合物和宿主细胞,本发明还提供了重组宿主细胞,特别是纤维堆囊菌宿主细胞,它生产的环氧噻酮衍生物以类似于环氧噻酮E和F的方式受到修饰。而且,通过,在不表达将环氧噻酮G和H转变为C和D的脱氢酶的宿主细胞中表达环氧噻酮基因,或者通过突变或改变PKS以消除可能存在于环氧噻酮PKS中的脱氢酶功能,本发明还提供了能产生此前未知的环氧噻酮G和H的宿主细胞。
作为PKS基因簇的产物的大环内酯类衍生物因此可以通过各种途径修饰。除了上述的修饰外,PKS产物还可以使用合适的酶而被糖基化,羟基化,去羟基化,氧化,甲基化和去甲基化。因此,除了通过改变PKS中所含组件的数目,功能和特异性以修饰PKS基因簇产物外,本发明的更多的化合物,还可以通过产生聚酮化合物合成酶的宿主细胞提供的,或者通过修饰含有附加酶的宿主细胞提供的附加的酶的催化活性来产生,或者使用纯化的酶或者粗提物进行体外修饰,或者实际上通过化学修饰来产生。
本发明还提供了产生环氧噻酮衍生物的许多种重组DNA化合物和宿主细胞。这里使用的术语“环氧噻酮衍生物”指的是重组的环氧噻酮PKS产生的化合物,该环氧噻酮PKS中的至少一个结构域被失活,突变以改变催化功能,或被不同功能的结构域替换或者其中插入了一个结构域。在任何时候,“环氧噻酮衍生物PKS”作用而产生的化合物在结构上不同于天然存在的环氧噻酮,但是保留了它的环状骨架结构,因此被称为“环氧噻酮衍生物”。为更好理解本发明所提供的重组DNA化合物和宿主细胞,下面对装载结构域,环氧噻酮PKS的各个组件,以及它们新的重组衍生物进行了详细的讨论。
环氧噻酮的装载结构域包括一个失活的KS结构域,KSY,和一个对丙二酰基辅酶A特异的AT结构域(据信丙二酰基辅酶A会被KSY结构域脱羧而得到乙酰基基团),和ACP结构域。本发明提供了编码环氧噻酮装载结构域的重组DNA化合物。装载结构域编码序列包含在粘粒pKOS35-70.8A3的一个约8.3kb的限制性片段中,这里所指的KS结构域是失活的,因为装载结构域的KS结构域的活性区“TAYSSSL”有一个酪氨酸残基替换了酮合成酶活性所需要的半胱氨酸残基Y;所以这个结构域不具有脱羧活性。见Witkowiski等,1999年9月7日,生物化学,38(36):11643-11650,此处引入作为参考。
酪氨酸残基的存在对谷氨酰胺残基(通常存在于失活的装载结构域KS中)的替换可使KS结构域具有更小的脱羧基效率。本发明提供了重组的环氧噻酮PKS结构域和相应的DNA序列,在编码的环氧噻酮PKS装载结构域的DNA序列中,通过改变装载结构域编码序列中的密码子,将酪氨酸残基改为谷氨酰氨残基。本发明还提供了含有这种装载结构域的PKS酶,和产生这种酶的宿主细胞以及由此产生的聚酮化合物,这些重组装载结构域包括仅仅酪氨酸残基被替换的,包括酪氨酸结构域在内的周围的氨基酸也被改变的,以及整个KSY结构域,被整个KSQ结构域替换的那些。后面的实施方案包括但是不限于其中KSY结构域被oleandolide PKS或者narbonolide PKS的KSQ结构域替换的重组环氧噻酮装载结构域(见下面的关有夹竹桃霉素,那波霉素和苦霉素PKS和修饰酶的参考文献)。
环氧噻酮装载结构域还包含据信结合丙二酰辅酶A的一个AT结构域。AT结构域中的“QTAFTQPALFTFEYALAALW…GHSIG”序列与丙二酰辅酰A特异性一致。如上面提到的,丙二酰辅酶A据信被KSY结构域脱羧从而获得乙酰辅酶A。本发明提供了重组环氧噻酮衍生物装载结构域,或者它们的编码DNA序列。其中的丙二酰特异性AT结构域被改变成为了另外一种特异性,比如甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,羟基丙二酰基辅酶A特异性。当与其它的环氧噻酮PKS蛋白一起表达时,这种装载结构域导致产生的环氧噻酮中,环氧噻酮噻唑环的甲基取代分别被乙基,丙基,和羟甲基替换。本发明提供了含有这种装载结构域的重组PKS酶,和产生这种酶的宿主细胞和它们产生的聚酮化合物。
本领域中的技术人员会认识到,对羟基丙二酰辅酶A具有特异性的AT结构域会导致产生的聚酮化合物在多酮相应的位置上具有羟基基团,羟基基团可被甲基化而获得甲氧基基团,见下表所引用的与FK-520PKS有关的专利申请。结果,具对羟基丙二酰辅酶A具有特异性的AT结构域的PKS指的是由该PKS产生的聚酮化合物在多酮相应的位置上具有羟基基团或者甲氧基基团。
环氧噻酮PKS的装载结构域还包含有ER结构域。而这个ER结构域可能参与形成环氧噻酮的噻唑部分的一个双键(与正常反应相反的反应),或者它是没有功能的。在这些示例中,本发明提供了重组DNA化合物,该组分编码的环氧噻酮PKS装载结构域带有或者不带有ER,以及其中来源于其它PKS的ER结构域(有活性的或者失活的,带有或者不带有KR和DH结构域)替换了环氧噻酮装载蛋白的结构域的杂合装载结构域。本发明还提供了含有这种装载结构域的重组PKS酶和产生这种酶的宿主细胞和它们所产生的聚酮化合物。
本发明的重组核酸编码环氧噻酮PKS的装载结构域,它们编码的相应的多肽用于许多实际应用中。在一个实施方案中,含有环氧噻酮装载蛋白编码序列的DNA化合物和异源PKS蛋白质表达。在这里使用的异源模块化PKS(或者它们的编码序列)指的是整个PKS或者一个部分,包括构成PKS的多聚体蛋白质的任一个,它们合成不是环氧噻酮或者环氧噻酮衍生物的聚酮化合物(或者指它们的编码序列)。这种共表达可以是两种形式中的一种。环氧噻酮装载蛋白可以作为分离的蛋白和其它的异源PKS蛋白质共表达,或者作为融合蛋白表达,其中的装载结构域融合到异源PKS的一个或多个组件上。无论如何,异源PKS的装载结构域被环氧噻酮装载结构域替换形成的杂合PKS,提供了一种新的PKS。异源PKS的例子包括但是不限于DEBS和picromycin(narbonolide),Oleandolide,Rapamycin Fk-S06,Fk-S20,利福霉素,和阿维菌素的PKS酶和它们的相应编码序列。
在另一个实施方案中,一种含有环氧噻酮装载结构域编码序列的核酸化合物与构成环氧噻酮PKS其余部分的蛋白质(即,epoB,epoC,epoD,epoE和eopF基因产物),或者与由于epoB,epoC,epop,epoE和eopf基因中一个或多个的改变或突变而产生环氧噻酮衍生物的重组环氧噻酮PKS共表达。这里所说的环氧噻酮或产生环氧噻酮衍生物的PKS(或者它们的编码序列),指的是构成PKS的所有或任何一种蛋白质(或者它们的编码序列)。
在另一个实施方案中,本发明提供了重组核酸化合物,它编码的装载结构域由环氧噻酮或产生环氧噻酮衍生物的装载结构域部分和异源PKS部分构成。在这个实施方案中,本发明提供了,例如,用甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换丙二酰基特异性的AT。这种替换,也如这里所述的其它替换,通常是通过变换它们的编码序列从而获得本发明的重组DNA化合物来介导的。这些变化(包括不仅有替换还有缺入和插入)这里可以指的是在DNA或者蛋白质水平的。
本发明的组分还包括那些,其中的环氧噻酮装载结构域的KSY和AT结构域都被替换了,但是ACP和/或环氧噻酮PKS装载结构的连接区保留未动。连接区是装载结构域和PKS组件中结构域之间的那些氨基酸片段,它们帮助形成蛋白质的四级结构,PKS结构域的正确排列和定位。这些化合物包括,例如,重组装载结构域编码序列,其中的环氧噻酮PKS的KSY和AT结构域编码序列被例如环氧噻酮PKS或者环氧噻酮PKS的KSq和AT结构域编码序列所替换。还有一些PKS酶不使用KSQ结构域,而是只使用AT结构域结合乙酰基辅酶A,或者丁酰基辅酶A(DEBS装载结构域),或者异丁酰基辅酶A(阿维菌素装栽组构域)。因些,本发明的化合物包括,例如,重组的装载结构域编码序列,其中的环氧噻酮PKS的KSY和AT结构域编码序列被DEBS或者阿维菌素PKS的一个AT结构域所替换。本发明还提供了编码装载结构域的重组DNA化合物,其中的环氧噻酮PKS装载结构域的ACP结构域或者任意连接区被另一个ACP或者连接区所替换。
上述的任一种装载结构域编码序列可与其它合成环氧噻酮,环氧噻酮衍生物,或者其它聚酮化合物的构成PKS的蛋白质共表达,从而提供本发明的PKS。如果需要的产物是环氧噻酮或者环氧噻酮衍生物,那么装载结构域编码序列如同天然存在的环氧噻酮PKS,通常表达一种分泌蛋白质。如果想要的产物是由本发明的装载结构域,和一种或几种非环氧噻酮PKS酶的蛋白质产生的,那么装载结构域或者以分泌蛋白质的形式表达,或者以与一种或几种异源PKS组件的融合蛋白质形式表达。
本发明还提供了PKS酶,其中环氧噻酮装载结构域,被异源PKS的装载结构域完全替换而余下的PKS蛋白质部分由修饰的或者未修饰的环氧噻酮PKS蛋白质提供。本发明还提供了产生这种酶的重组表达载体和宿主细胞,以及它们产生的聚酮化合物。在另一个实施方案中,异源装载结构域在表达epoB,epoC,epoD,epoE和epoF基因产物的宿主细胞中以分泌蛋白的形式表达。在另一个实施方案中,异源装载结构域在表述epoB,epoC,epoD,epoE和epoF基因产物的宿主细胞中以与epoB基因产物的融合蛋白的形式表达。在相关的实施方案中,本发明提供了一种,其中装载结构域被删除或者被NRPS组件替换的重组环氧噻酮PKS酶,和相应的重组DNA化合物和表达载体。在这个实施方案中,如同在化合物雷诺霉素中一样,重组PKS酶因此产生一种含有含有一个二肽部分的环氧噻酮衍生物。本发明提供的酶中环氧噻酮PKS的其余部分具有和天然环氧噻酮PKS一样的功能,以及其中余下部分产生本发明的环氧噻酮衍生物的重组PKS。
本发明还提供了,用于删除宿主细胞,如纤维堆囊菌中染色体装载蛋白结构域编码序列或其一部分,或者用编码重组装载结构域的序列替换这些序列或其一部分试剂和方法。使用一种重组载体,它含有纤维堆囊菌与包括染色体中装栽结构域编码序列和/或其侧边的DNA互补的DNA,使用几种载体和同源重组,可以用重组装载结构域编码序列替换天然的装载结构域编码序列,或者删除这一序列。
而且,虽然上面的讨论集中于删除或替换环氧噻酮装载结构域编码序列,本领域技术人员可以认识到,本发明提供的重组DNA化合物,载体和方法可用于删除或者替换环氧噻酮PKS基因或者环氧噻酮修饰酶基因的整个或一部分,这些方法和材料可用于许多目的。一个目的是用于构建不产生天然存在的环氧噻酮或者环氧噻酮衍生物的宿主细胞,例如,被修饰不产生天然存在的环氧噻酮的宿主细胞,特别指的是它制造除天然存在的环氧噻酮外的环氧噻酮衍生物或者其它聚酮化合物。另一个目的是用改变了的基因来替换删除了的基因,从而提供不同的产物或者产生的一种产物比其它产物要多。
如果纤维堆囊菌宿主细胞中的环氧噻酮装载结构域编码序列被删除或者变得没有功能了,那么得到的宿主细胞可以产生没有功能的环氧噻酮PKS。这种PKS仍然能够结合和形成延伸单位,但是环氧噻酮的噻唑部分不会形成,从而产生一种新的环氧噻酮衍生物。因为这些衍生物预测含有一个游离的氨基,大多数情况下,它以非常低的量产生。然而,象上面所提到的,向宿主细胞中提供异源的或重组的其它装载结构域,将会导致产生的环氧噻酮衍生物结构上由提供的装载结构域决定。
紧跟着环氧噻酮PKS的装载结构域是PKS的第一个组件,即对半胱氨酸具特异性的NRPS组件。这个NRPS组件天然情况下以一种分泌蛋白质,epoB基组产物的形式表达。本发明提供了重组形式的epoB基因。本发明的重组核酸组分编码环氧噻酮PKS的NRPS组件,它们编码的相应的肽用于许多用途中。在一个实施方案中,含有编码环氧噻酮NRPS组件序列的核酸组分与一种,或几种异源PKS蛋白质的编码基因共表达。NRPS组件可以作为分离蛋白或者融合蛋白与异源PKS的一种蛋白表达出来。得到的PKS中,至少异源PKS的一个组件被环氧噻酮NRPS组件替换,或者NRPS组件作为一个组件被有效地加到异源PKS上,从而获得一个新的PKS。在另一个实施方案中,DNA化合物含环氧噻酮NRPS组件的编码序列,它与其它的环氧噻酮PKS蛋白质或者修饰的成分共表达,而获得产生环氧噻酮或者环氧噻酮衍生物的重组环氧噻酮PKS。
这部分描述了本发明提供的两种杂合PKS酶。两种杂合PKS酶都是DEBS和环氧噻酮NRPS组件的杂合。第一种杂合PKS是由4种蛋白质组成:(i)DEBS1;(ii)由DEBS组件3的KS结构域和除环氧噻酮PKS的装载结构域KS结构域以外的部分组成的融合蛋白;(iii)环氧噻酮NRPS组件;和(iv)由融合到DEBS组件5的AT结构域的环氧噻酮PKS组件2的KS结构域和剩余的DEBS3构成的融合蛋白。这种杂合PKS在天蓝色链霉菌中表达时,会产生一种新的聚酮化合物,它具有一个和大环内酯环结合的噻唑部分,分子量为413.53。在红色糖多孢菌中表达杂合PKS能够产生糖基化的,羟基化的和甲基化的衍生物。
图示表示构建。
产物的结构为:
Figure A9981567800232
本发明这部分所描述的第二种杂合PKS由5种蛋白质组成:(i)DEBS1;(ii)由DEBS组件3的KS结构域和除环氧噻酮PKS的装载结构域KS结构域的所有部分组成的融合蛋白;(iii)环氧噻酮NRPS组件;(iv)由融合到DEBS组件4的AT结构域的环氧噻酮PKS组件2的KS结构域和剩余的DEBS2构成的融合蛋白;以及(v)DEBS3。这种杂合PKS在天蓝色链霉菌中表达时,会产生一种新的聚酮化合物,它具有一个和大环内酯环结合的噻唑部分,分子量为455.61。在红色糖多孢菌中表达杂合PKS能够产生糖基化的,羟基化的和甲基化的衍生物。
图示表示构建。
Figure A9981567800241
产物的结构为:
Figure A9981567800242
在另一个实施方案中,NRPS编码序列的一部分被用于和异源编码序列相结合。在这个实施方案中,本发明提供了,例如,环氧噻酮PKS的NRPS组件的特异性从半胱氨酸到其它氨基酸的变化。这种变化是通过构建一种编码序列来实现的,在其中整个环氧噻酮PKS NRPS组件编码完整序列或其一部分,被不同特异性的NRPS组件的编码序列所替换。在一个例证性的实施方案中,环氧噻酮NRPS组件的特异性从半胱氨酸改变为丝氨酸或者苏氨酸。当这里所述的修饰的NRPS组件与环氧噻酮PKS的其它蛋白质一起表达时,重组PKS产生的环氧噻酮(或者其衍生物)中的噻唑部分,分别变成的噁唑或与甲基噁唑部分。另外,本发明提供了由epoA,epoB epop epoE和epoF基因产物或者它们修饰成分组成的,不带有NRPS组件,或者带有来自异源PKS的NRPS组件的重组PKS酶。异源NRPS组件可以分离的蛋白质或者与epoA或epoC基因的融合蛋白质的形式来表达。
本发明还提供了用于将异源NRPS组件的特异性从另外一种氨基酸变为半胱氨酸的方法和试剂。这种变化是通过构建一种编码序列来完成的,其中决定异源NRPS组件特异性的序列,被从环氧噻酮PKS组件编码序列来的,对半胱氨酸特异性的序列所替换。获得的异源NRPS组件,通常与构成异源PKS的蛋白质一起共表达,其中异源PKS合成的聚酮化合物不是环氧噻酮或者环氧噻酮衍生物,尽管异源NRPS组件能够被用来产生环氧噻酮或者环氧噻酮衍生物。
在另一个实施方案中,本发明提供了重组环氧噻酮PKS酶和相应的重组核酸组分和载体,其中的NRPS组件被失或者删除。这些酶,组分和载体,通常是根据上述的删除或失活环氧噻酮PKS或修饰酶的方法来构建的。本发明提供的失活的NRPS组件蛋白质,和它们的编码序列,包括那些,其中的肽酰基载体蛋白(PCP)结构域被整个或部分地删除,或者通过将活性位点(磷酸泛酰巯基亚胺基化位点)的丝氨酸改变为其他氨基酸比如丙氨酸而失活,或者腺苷酰化结构域被删除或失活。在一个实施方案中,装载结构域和NRPS都被删除或者失活。在各种情况中,只有当提供可结合环氧噻酮PKS与环氧噻酮衍生物PKS组件2(或后面的组件)KS结构域的底物时,获得的环氧噻酮PKS才能起作用。在本发明提供的一种方法中,向这样修饰的细胞提供有活性的酰基硫酯,它优选结合到第二个,但是可能是任何后面的组件,并转变成新的环氧噻酮衍生物。
因此。在一个实施方案中,本发明提供了表达带有失活的NRPS的环氧噻酮PKS(或者产生环氧噻酮衍射衍生物的PKS)的纤维堆囊菌和非纤维堆囊菌宿主细胞。向宿主细胞提供活化的酰基硫酯以产生新的本发明的环氧噻酮衍生物。可以向表达PKS的宿主细胞,或者含有这种PKS的无细胞抽提物,提供新的前体分子N-酰基半胱氨酸硫酯(NACS)来制备环氧噻酮衍生物。参见美国专利,其申请号为60/117,248,于1999年1月27日提交,和PCT专利公开号US99/03986,两者此处引入作为参考,并见下面的实施例6。
环氧噻酮PKS的第二个(第一个非NRPS)组件包括一个KS,一个甲基丙二酰基辅酶A特异性的AT,一个DH,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.8A3的一个约13.1kb的EcoR I-Nsi I限制性片段内的一个序列编码的组件。
本发明的编码环氧噻酮第二个组件的重组核酸组分和它们编码的相应的多肽,被用于各种途径中。经epoC基因表达的一种分离蛋白质的形式产生环氧噻酮PKS的第二个组件。本发明提供了重组形式的epoC基因。在一个实施方案中,含有环氧噻酮第二个组件编码序列的DNA化合物,以分离蛋白质的形式,或者与异源PKS的一个或多个组件的融合蛋白的形式,与构成异源PKS的蛋白质共表达。得到的PKS中,或者异源PKS的一个组件被环氧噻酮PKS的第二个组件所替换,或者后者仅仅是加到异源PKS的组件上,从而产生了一种新的PKS。在另一个实施方案中,含有环氧噻酮PKS第二个组件编码序列的核酸组分和构成环氧噻酮PKS的其它蛋白质,或者产生环氧噻酮衍生物的重组环氧噻酮PKS共表达。
在另一个实施方案中,第二个组件编码序列的整个或其一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换甲基丙二酰基辅酶A特异性的AT;删除了或者DH或者KR或者它们二者;用具有不同立体化学特性的DH或KR或它们二者来替换DH或者KR或者它们二者;和/或插入一个ER。通常地,这里所说的插入或替换PKS的KR,DH,和/或ER结构域,包括通常用插入的或者替换结构域来自组件中的相关的结构域,来替换该组件中相应的KR,DH,或者ER结构域。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换和插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的异源的第二个组件的编码序列能够和构成PKS的其它蛋白质共表达,该PKS可合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物。另外可以删除环氧噻酮PKS的第二个组件,或者用来自于异源PKS的组件来替换它。它可以以分离蛋白的形式,或者以与epoB或者epoD基因产物的融合蛋白的形式表达。
本发明的例证的重组PKS基因,包括那些基因,其中的环氧噻酮PKS第二个组件的AT结构域编码序列被改变或替换,从而使它们编码的AT结构域从甲基丙二酰基特异性的AT变成丙二酰基特异性的AT。这些丙二酰基特异性的AT结构域编码核酸可以从,例如但不限于,编码Narbonolide PKS,RapamycinPKS(即,组件2和12),以及FK-520PKS(即组件3、7和8)的基因分离。当这种杂合的第二组件和构成环氧噻酮PKS的其它蛋白质共表达时,所产生的环氧噻酮衍生物是16-去甲基环氧噻酮衍生物。
另外,本发明提供了编码重组环氧噻酮PKS酶和对应重组蛋白的DNA化合物和载体,其中的第二个(或后面的)组件的KS结构域被失活或者删除。在优选的实施方案中,这种失活是通过将活性部位的丝氨酸密码子变成丙氨酸密码子来实现的。如同上面所述的相应的NRPS组件的变异体,获得的重组环氧噻酮PKS酶不能产生环氧噻酮或环氧噻酮衍生物,除非供给的前体能被重组PKS酶剩下的结构域和组件结合和延伸。下面的实施例6中描述了例证性的二酮化合物。
环氧噻酮PKS的第3个组件包括一个KS,一个丙二酰基特异性的AT,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.8A3中的一个约8kb的Bgl II-Nsi I限制性片段中的序列编码的。
本发明的重组DNA化合物编码环氧噻酮PKS的第三个组件,该DNA化合物以及它们编码的相应的多肽被用于各种途径中。环氧噻酮PKS的第三个组件是由epo D基因表达的产物中的一种蛋白质,它还包括组件4,5和6。本发明提供了重组形式的epoD基因。本发明还提供了重组DNA化合物,它以分离的不带有其它环氧噻酮组件编码序列的形式编码环氧噻酮PKS组件3,4,5和6的各个组件。在一个实施方案中,含有环氧噻酮第三个组件编码序列的DNA化合物,与构成异源PKS的蛋白质共表达。环氧噻酮PKS的第三个组件能够以分离蛋白质的形式或者以与异源PKS的一个或者多个组件融合的融合蛋白的形式表达。得到的PKS中,其中异源PKS的一个组件被环氧噻酮PKS的第三个组件替换,或者后者仅仅是加到异源PKS的组件上,结果提供了一种新的PKS。在另一个实施方案中,含有环氧噻酮PKS第三个组件编码序列的DNA化合物与含有环氧噻酮PKS剩余部分的蛋白质共表达,或者与一种重组的环氧噻酮PKS共表达,该重组环氧噻酮PKS产生一种环氧噻酮衍生物,通常它作为一种蛋白质,含有不仅有第三个,而且有第四,第五和第六个组件。
在另一个实施方案中,整个的第三个组件编码序列或其一部分被用于与其它的PKS编码序列相结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换丙二酰基辅酶A特异性的AT;删除KR;用具有不同立体化学特性KR来替换KR;和/或插入一个DH和/或一个DH和一个ER。如上面所述,这里所说的插入一个DH或一个DH和一个ER,包括用一个DH和KR或者一个ER,DH,和KR来替换KR。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换和插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。获得的异源的第三个组件的编码序列可用来与合成环氧噻酮,环氧噻酮衍生物,或其它聚酮化合物的PKS的编码序列结合在一起。
本发明的例证的重组PKS基因,包括那些基因,其中的环氧噻酮PKS第三个组件的AT结构域编码序列被改变或替换,从而使它们编码的AT结构域从丙二酰基辅酶A特异性的AT变成甲基丙二酰基辅酶A特异性的AT。这些甲基丙二酰基辅酶A特异性的AT结构域编码核酸可以从,例如但不限于,编码DEBS,Narbonolide PKS,Rapamycin PKS,以及FK-520 PKS的基因分离。当这种杂合的第三组件和构成环氧噻酮PKS或者环氧噻酮PKS衍生物的其它组件和蛋白质共表达时,重组的PKS所产生的环氧噻酮衍生物是本发明的14-甲基环氧噻酮衍生物。
本领域的技术人员可以认识到,PKS第三个组件的KR结构域负责形成羟基基团,与环氧噻酮的环化有关。因此,消除第三个组件的KR结构域,或者添加一个DH,或者DH和结构域会影响环化,导致形成线性分子,或者分子在不同于环氧噻酮的位置环化。
环氧噻酮PKS的第四个组件包括一个KS,一个结合丙二酰基辅酶A或者甲基丙二酰基辅酶A的AT,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.1A2中的一个约10kb的Nsi I-Hind III限制性片段中的序列编码的。
本发明的重组DNA化合物编码环氧噻酮PKS的第四个组件,它们编码的相应的多肽被用于各种途径中。在一个实施方案中,含有环氧噻酮PKS的第四个组件编码序列的DNA化合物,被插入到含有一个或者多个异源PKS组件编码序列的DNA化合物中。得到的PKS中,其中异源PKS的一个组件被环氧噻酮PKS的第四个组件替换,或者后者仅仅是加到异源PKS的组件上,结果提供了一种新的PKS。这个蛋白和其他构成异源PKS的蛋白质一起,提供了一种新的PKS。在另一个实施方案中,含有环氧噻酮PKS第四个组件编码序列的DNA化合物,在表达环氧噻酮PKS剩余部分的蛋白质和组件,或者在表达一种产生环氧噻酮衍生物的重组环氧噻酮PKS的宿主中表达,该重组第四组件通常在一种蛋白质中表达,该蛋白质也含有第三个,第五和第六个组件或者它们的修饰本。
在另一个实施方案中,整个的第四个组件编码序列或其一部分被用于与其它的PKS编码序列相结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用丙二酰基辅酶A,甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换丙二酰基辅酶A和甲基丙二酰基辅酶A特异性的AT;删除KR;选择包括用具有不同立体化学特性KR来替换KR;和/或插入一个DH和/或一个DH和一个ER。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换和插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。获得的异源的第三个组件的编码序列结合在重组PKS的蛋白质亚基中,用来与合成环氧噻酮,环氧噻酮衍生物,或其它聚酮化合物。如果所要得到的聚酮化合物是环氧噻酮或者环氧噻酮衍生物,那么重组的第四组件通常作为一种蛋白质表达,其中还含有环氧噻酮PKS的第三个,第五和第六个组件或者它们的修饰本。可选地,本发明提供了重组的环氧噻酮和环氧噻酮衍生物PKS酶,其中的整个的第四组件被删除或者被异源PKS的一个组件替换。
在一个优选的实施方案中,本发明提供了重组的DNA化合物,它含有的环氧噻酮PKS的第四组件的编码序列,环氧噻酮PKS被修饰去编码一种能结合甲基丙二酰基辅酶A,而不是丙二酰基辅酶A的AT。这些重组分子被用于表达epoD蛋白重组衍生物的蛋白,该epoD蛋白含有修饰的第4组件,以及组件3,5和6,以及它们的任何一种或几种可以选择的环氧噻酮PKS,或其衍生物。在另一个优选实施方案中,表发明提供的重组DNA化合物,它含有的环氧噻酮PKS第4组件的编码序列,被修饰以编码一个结合丙二配基酶A,而不是甲基丙二酰基辅酶A的AT。这些重组分子被用于表达一种蛋白质,该蛋白质是epoD蛋白质的重组形式的衍生物,它含有修饰的第四组件,以及组件3,5和6,以及它们中的任何一种或几种可以选择的环氧噻酮PKS,或其衍生物。
在本发明之前,已知纤维堆囊菌产生环氧噻酮A,B,C,D,E,和F,而环氧噻酮A,C和E,在C-12的位置具有氢,而环氧噻酮B,D和F在这个位置具有甲基。在本发明之前所不被了解的是在纤维堆囊菌中,这些化合物被合成的顺序,以及一些化合物在C-12具有氢,而另外一些在这位置具有甲基的机制。本文公开的内容提示了环氧噻酮A和B是通过epoK基因产物的活性而由环氧噻酮C和D衍生的,而C-12位氢或者甲基组分的存在是因为环氧噻酮PKS组件4的AT结构域。这个结构域可以结合,丙二酰基或者甲基丙二酰基辅酶A,以及,因为它与丙二酰基特异性的AT结构域,比与甲基丙二酰基特异性的AT结构的具有更大的相似性,所以,结合丙二酰基辅酶A比结合甲基丙二酰基辅酶A更常见。
因此,本发明提供了重组DNA化合物和表达载体和相应的重组PKS,其中结合了一个具甲基丙二酰基特异性AT的第四组件。这种甲基丙二酰基辅酶A特异性的AT编码序列,可以起源于,例如但不限于,编码oleandolide PKS,DEBS,Narbonolide PKS,Rapamycin PKS,或者任何含有甲基丙二酰基辅酶A特异性AT结构域的PKS。依照本发明,由这个编码序列表达的杂合第四组件,通常作为衍生的epo D基因产物,结合到环氧噻酮PKS(或者环氧噻酮衍生物的PKS)中。获得的重组环氧噻酮PKS产生的环氧噻酮在C-12位具有一个甲基部分,如果没有脱氢酶活性形成C-12-C-13二烯烃,得到的即是环氧噻酮H(或者环氧噻酮H衍生物);如果有脱氢酶活性但是没有环氧化物酶活性存在,得到环氧噻酮D(或者环氧噻酮D衍生物);如果没有脱氢酶和环氧化酶活性但是有羟化酶活性,得到环氧噻酮B(或者环氧噻酮B衍生物);如果没有脱氢酶,环氧化酶和羟化酶活性三者都存在,得到环氧噻酮F(或者环氧噻酮F衍生物)。如上面所显示的。如果有环氧噻酮PKS的其它的变化,细胞会产生相应的环氧噻酮衍生物。
当含有杂合的甲基丙二基特异性第四组件的重组PKS在例如纤维堆囊菌中表达时,并有合适的修饰酶存在(除非它们被根据本发明的方法失活),将会产生环氧噻酮D,B和/或F。通常是在由本发明提供的重组纤维堆囊菌中产生这些衍生物,其中天然的环氧噻酮PKS不能行使功能,或者,除非与提供的重组第四组件相结合,否则不能行使功能。在一个例证性的实施例中,可以使用本发明的方法和试剂来灭活天然宿主中的epoD基因。然后可用含有第四组件编码序列的重组epoD基因的载体转化宿主细胞。重组载体可以成为染色体外的部件或者作为一个DNA片段整合到宿主细胞染色体中。在后面的实施方案中,本发明提供的方法,可以方便地通过使用与天然epoD基因同源重组,将重组的甲基丙二酰基特异性的组件4编码序列整合到野生型纤维堆囊菌中,从而保证只是产生想要的环氧噻酮。本发明提供的纤维堆囊菌宿主细胞可以表达或者不表达(通过对它们的天然基因突变或者同源重组)脱氢酶,环氧化物酶,和/或氧化酶基因产物,因此可由操作人员选择,形成或者不成相应的环氧噻酮D,B和F化合物。
上述的修饰的纤维堆囊菌只是本发明提供的重组宿主细胞中的一种。在优选的实施方案中,重组的甲基丙二酰基特异性的环氧噻酮第四组件编码序列,被用于根据本发明的方法在异源宿主细胞中,产生环氧噻酮D,B和F,或者其它的相应的衍生物。因此,本发明提供了将环氧噻酮或者环氧噻酮衍生物PKS和环氧噻酮脱氢酶,环氧化酶,和羟基化酶基因及它们的组合导入异源宿主细胞中的试剂和方法。
本发明提供的重组的甲基丙二酰基性异性的环氧噻酮第四组件编码序列,提供了重要的在宿主细胞中产生所要的环氧噻酮化合物的可以替换的方法。因此,本发明了提供了杂合的第四组件编码序列,基中除了内源AT编码序列,被甲基丙二酰基特异性的AT编码序列替换外,例如但不限于Rapamycin PKS的组件10,或者FK-520PKS的组件1或者5的DH和KR编码序列,被内源的KR编码序列所替换。当含有杂合第四组件和环氧噻酮PKS组件3,5和6或者它们的衍生物的,由这些编码序列编码的基因产物,与宿主细胞提供的含有其它环氧噻酮PKS蛋白质(或者它们的衍生物)的PKS结合在一起时,细胞将依赖于插入的DH和KR结构域的立体化学特异性,而产生环氧噻酮D或者它的反式立体异构体(或者它们的衍生物)。
同样,如上面所提到的,本发明提供了重组的DNA化合物,它所含有的环氧噻酮PKS第四组件的编码序列,被修饰来编码一个结合丙二酰基辅酶A而不是甲基丙二酰基辅酶A的AT。本发明提供了重组DNA化合物和载体和相应的重组PKS,其中杂合的第四组件被结合到衍生的epoD基因产物中。当结合进环氧噻酮PKS(或者环氧噻酮衍生物PKS)后获得的重组环氧噻酮PKS将依赖于环氧噻酮修饰酶是否存在而产生环氧噻酮C,A和E。如上面所提到的,依赖于宿主,第四组件是否包括KR和DH结构域,以及脱氢酶,环氧化酶,和氧化酶活性是否存在和哪种存在,本发现的实践者,可以使用本发明的化合物,宿主细胞和方法生产环氧噻酮G,C,A和E化合物的一种或几种或者它们的衍生物。
环氧噻酮PKS的第五个组件包括一个KS,一个结合丙二酰基辅酶A的AT,一个DH,一个ER,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.1A2中的一个约12.4kb的Nsi I-NotI限制性片段中的序列编码的。
本发明的重组DNA化合物编码环氧噻酮PKS的第五个组件,它们编码的相应的多肽被用于各种途径中。在一个实施方案中,含有环氧噻酮第五组件编码序列的DNA化合物,被插入含有异源PKS一个或者几个组件的编码序列的DNA化合物中。获得的构造,其中异源PKS一个组件的编码序列被环氧噻酮PKS第五组件的编码序列所替换,或者后者仅仅是加到异源PKS的组件的编码序列上,该构造可以连结到表达载体上,以产生它们编码的重组蛋白质。当重组蛋白质与异源PKS的其余蛋白组分组合在一起时,就产生了一种新的PKS。在另一个实施方案中,含有环氧噻酮PKS第五组件编码序列插入到或含有环氧噻酮或者产生环氧噻酮衍生物的重组环氧噻酮PKS编码序列的DNA化合物中。在后一构造中,环氧噻酮第五组件,通常以含有环氧噻酮PKS的第三,第四,第六组件,或其衍生物的蛋白质的形式表达的。
在另一个实施方案中,第五个组件编码序列的整个或其一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换丙二酰基辅酶A特异性的AT;删除ER,DH和KR中的一个,两个或者所有三个;和/或用包括特别是具有不同立体化学特性的,一个KR,一个DH和KR,或者一个KR,DH和KR,来替换DH,KR和ER中的一个,两个或者所有三个。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换或插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的杂合第五组件编码序列能够和合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物的PKS编码序列结合起来应用。另外,可以删除环氧噻酮PKS的第五组件,或者用来自于异源PKS的组件来整个替换它,从而产生一种新的蛋白质,它与其他的环氧噻酮PKS或其衍生物蛋白质结合,构成一种产生环氧噻酮衍生物的PKS。
本发明的例证的重组PKS基因,包括重组的epoD基因衍生物,其中的环氧噻酮PKS第二个组件的AT结构域编码序列被改变或替换,从而使它们编码的AT结构域从丙二酰基特异性的AT变成甲基丙二酰基特异性的AT。这些甲基丙二酰基特异性的AT结构域编码核酸可以从,例如但不限于,编码DEBS的PKS基因,Narbonolide PKS,Rapamycin PKS,以及FK-520 PKS的基因分离出来。当这种重组的epoD基因衍生物和epoA,epoB,epoC,epoE,和epoF基因(或其衍生物)共表达时,它们组成的PKS产生10-甲基环氧噻酮或其衍生物。本发明提供的另一个重组epoD基因衍生物包括不仅改变了的组件5编码序列,还有编码结合甲基丙二酰基辅酶A的AT结构域的组件4编码序列。当与结合到含有epoA,epoB,epoC,epoE,epoF基因的PKS中时,重组的epoD基因衍生物的产物引导产生10-甲基环氧噻酮B和/或D衍生物。
本发明其他的例证性的重组epoD基因衍生物,包括那些基因,其中的环氧噻酮PKS第五组件的ER,DH,和KR结构域编码序列下面的编码序列替换成:(i)一个KR和DH结构域;(ii)一个KR结构域;和(iii)一个失活的KR结构域。本发明的这些重组的epoD基因衍生物与epoA,epoB,epoC,epoE,和epoF基因的PKS共表达重组的epo D基因衍生物,产生重组PKR,它对应于(i)C-11烯烃,(ii)C-11羟基,(iii)C-11酮基环氧噻酮衍生物。这些重组的epoD基因衍生物,可以与含有其他改变的重组epo基因共表达,或者它们自身可作进一步的改变以产生制备相关的C-11环氧噻酮衍生物的PKS。例如,本发明的重组的epoD基因衍生物可以包括只结合甲基丙二酰基辅酶A的AT结构域的组件4编码序列。当与具有epoA,epoB,epoC,epoE,和epoF基因的PKS结合在一起时,重组的epo D基因衍生物,导致产生相应的C-11环氧噻酮B和/或D衍生物。
产生环氧噻酮C-11衍生物的功能相似的epoD基因,可是通过失活环氧噻酮第五组件的ER,DH和KR结构域的其中的一个,二个,和三个来产生。然而。在任何组件中改变这些结构域的优选方式是,用来自其它组件的另外一个组件或者异源PKS编码序列的完整的一套相想要的结构域来替换这些组件。在这种方式中,PKS的天然结构是保守的。同样,如果存在,在天然PKS中一起发挥作用的KR和DH或者KR,DH,以及ER结构域被优选用于重组的PKS中,上面所述的用于的替换,可以考虑的替换结构域包括,例如但不限于,来自rapomycin PKS组件3的失活的KR结构域以形成酮基,来自rapomycin PKS组件5的KR结构域以形成醇基,来自rapomycin PKS组件4的KR和DH结构域以形成烯烃基。其它的这些失活的KR,和活性KR,和活性KR和DH结构域编码核酸可以分离自,例如,但不限于,编码DEBS的PKS基因,narbonolidePKS和FK-520 PKS。得到的各种PKS酶所产生的聚酮化合物组分在C-11位含有的功能基因,可进一步在体外用通常的化学方法进行衍化,以得到本发明半合成的环氧噻酮衍生物。
环氧噻酮PKS的第六个组件包括一个KS,一个结合甲基丙二酰基辅酶A的AT,一个DH,一个ER,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.1A2中的一个约14.5kb的Hind III-Nsi I限制性片段中的序列编码的。
本发明的重组DNA化合物编码环氧噻酮PKS的第六个组件,它们编码的相应的多肽被用于各种途径中。在一个实施方案中,含有环氧噻酮第六组件编码序列的DNA化合物,被插入含有异源PKS一个或者几个组件的编码序列的DNA化合物中。获得的构造所编码的蛋白质,其中异源PKS一个组件的编码序列被环氧噻酮PKS第六组件的编码序列所替换,或者后者仅仅是加到异源RKS的组件的编码序列上,当与构成PKS的其他蛋白质共表达时,就产生了一种新的PKS。在另一个实施方案中,含有环氧噻酮PKS第六组件编码序列的DNA化合物插入到或含有环氧噻酮PKS组件PKS3,4和5或者产生环氧噻酮衍生物的重组环氧噻酮PKS编码序列的DNA化合物中,与环氧噻酮或者环氧噻酮衍生物PKS共表达而获得一种PKS,该PKS在宿主细胞中产生环氧噻酮衍生物。
在另一个实施方案中,第六个组件编码序列的一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换甲基丙二酰基辅酶A特异性的AT;删除ER,DH和KR中的任何一个,两个或者所有三个;和/或用包括特别是具有不同立体化学特性的,一个KR,一个DH和KR,或者一个KR,DH和KR,来替换DH,KR和ER中的任何一个,两个或者所有三个。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换或插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的异源第六组件编码序列能够和合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物的PKS蛋白亚基编码序列结合起来应用。假如PKS制备环氧噻酮,环氧噻酮衍生物,杂合第六组件通常表达成含有环氧噻酮,环氧噻酮衍生物组件3,4和5的蛋白,另外,可以删除环氧噻酮PKS的第六组件,或者用来自于异源PKS的组件来整个替换它,制备环氧噻酮衍生物用的PKS。
本发明的例证性的重组PKS基因,包括那些基因,其中的环氧噻酮PKS第六个组件的AT结构域编码序列被改变或替换,从而使它们编码的AT结构域从甲基丙二酰基特异性的AT变成丙二酰基特异性的AT。这些丙二酰基特异性的AT结构域编码核酸可以从,例如但不限于,编码Narbonolide PKS,RapamycinPKS,以及FK-520PKS的的PKS基因分离。当编码这种杂合组件6的本发明的重组epoD基因衍生物和其他的环氧噻酮PKS基因共表达时,重组的PKS产生8-去甲基环氧噻酮衍生物。这些重组的epoD基因衍生物,可以与含有其它变化的重组epo基因衍生物共表达,或者它们自身可作进一步的改变以产生制备相关的8-去甲基环氧噻酮衍生物的PKS。例如,本发明提供的一个重组的epoD基因衍生物,可以包括只结合甲基丙二酰基辅酶A的AT结构域的组件4编码序列。当与具有epoA,epoB,epoC,epoE,和epoF基因的PKS结合在一起时,重组的epo D基因衍生物,产生相应的8-去甲基环氧噻酮B和/或D衍生物。
本发明其他的例证性的重组epoD基因衍生物,包括那些,其中的环氧噻酮PKS第六组件的ER,DH,和KR结构域编码序列可为下面的编码序列替换:(i)一个KR和DH结构域;(ii)一个KR结构域;和(iii)一个失活的KR结构域。本发明的这些重组的epoD基因衍生物与其他的PKS基因共表达时,产生相应的(i)C-9烯烃,(ii)C-9羟基,(iii)C-9酮基环氧噻酮衍生物。这些重组的epoD基因衍生物,可以与含有其他改变的重组epo基因共表达,或者它们自身可作进一步的改变以产生制备相关的C-9环氧噻酮衍生物的PKS。例如,本发明的重组的epoD基因衍生物可以包括只结合甲基丙二酰基辅酶A的AT结构域的组件4编码序列。当与具有epoA,epoB,epoC,epoE,和epoF基因的PKS结合在一起时,重组的epoD基因衍生物,引导产生相应的C-9环氧噻酮B和/或D衍生物。
功能相同的第六组件,可是通过失活环氧噻酮第六组件的ER,DH和KR结构域的其中之一,之二,和之三来产生。然而。在任何组件中改变这些结构域的优选方式是,用来自相同分子的另外一个组件或者异源PKS编码序列的完整的一套相要的结构域来替换这些组件。上面所述的例证性的用于替换的结构域包括,例如但不限于,来自rapomycin PKS组件3的失活的KR结构域,以形成酮基,来自rapomycin PKS组件5的KR结构域,以形成醇基,来自rapomycinPKS组件4的KR和DH结构域,以形成烯烃基。其它的这些失活的KR,和活性KR,和活性KR和DH结构域编码核酸可以分离自,例如,但不限于,编码DEBS的PKS基因,narbonolide PKS和FK-520 PKS。得到的各种PKS酶所产生的聚酮化合物组分在C-9位含有的功能基团,可进一步在体外用通常的化学方法进行衍化,以得到本发明半合成的环氧噻酮衍生物。
环氧噻酮PKS的第七个组件包括一个KS,一个甲基丙二酰基辅酶A特异性的AT,一个DH,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.4中的一个约8.7kb的BgIII限制性片段中的序列编码的。
本发明编码环氧噻酮PKS的第七个组件的重组DNA化合物,和它们编码的相应的多肽被用于各种途径中。环氧噻酮PKS的第七个组件包含在epoE基因的基因产物中,该基因也包含了第八组件。本发明提供了重组形式的epoE基因,但是也提供了编码第七组件但是不含第八组件编码序列的DNA化合物,以及编码第八组件但是不含第七组件编码序列的DNA化合物。在一个实施方案中,含有环氧噻酮第七组件编码序列的DNA化合物,被插入含有异源PKS一个或者几个组件的编码序列的DNA化合物中。获得的构造中,异源PKS一个组件的编码序列被环氧噻酮PKS第七组件的编码序列所替换,或者后者仅仅是加到异源RKS的组件的编码序列上,产生了一种新的能在宿主细胞中表达的PKS编码序列。可选地,环氧噻酮第七个组件可以作为一个分离的蛋白质表达。在另一个实施方案中,含有环氧噻酮PKS第七组件编码序列的DNA化合物表达形成一种蛋白质,它和其他蛋白质一起构成环氧噻酮PK,或者产生环氧噻酮衍生物的PKS。在这些实施方案中,第七个组件通常是作为含有环氧噻酮PKS的第八个组件,或其衍生物的蛋白质的形式表达的,与epoA,epoB,epoC,epoD,和epoF基因或其衍生物共表达,构成PKS。
在另一个实施方案中,第七组件编码序列的整个或其一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换甲基丙二酰基辅酶A特异性的AT;删除KR;用具有不同立体化学特性的KR来替换KR;和/或插入一个DH或者一个DH和一个ER。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换或插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的杂合第七组件编码序列能够和合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物的PKS蛋白亚基编码序列结合起来应用。当用于制备环氧噻酮或者环氧噻酮衍生物时,第七个组件通常是作为含有环氧噻酮PKS的第八个组件,或其衍生物的蛋白质的形式表达的,它与epoA,epoB,epoC,epoD,和epoF基因或其衍生物共表达,构成PKS。可选择地,epoE基因中的第七组件编码序列可被删除,或者被异源的组件替换,以制备重组的epoE基因衍生物,它和epoA,epoB,epoC,epoD,和epoF基因一起表达,构成环氧噻酮衍生物PKS。
本发明的例证性的重组的epoE基因衍生物,包括那些,其中的环氧噻酮PKS第七个组件的AT结构域编码序列被改变或替换,从而使它们编码的AT结构域从甲基丙二酰基特异性的AT变成丙二酰基特异性的AT。这些丙二酰基特异性的AT结构域编码核酸可以从,例如但不限于,编码narbonolide PKS,rapamycinPKS,以及FK-520 PKS的的PKS基因分离。当和其他的环氧噻酮PKS基因,epoA,epoB,epoC,epoD,和epoF或其衍生物共表达时,得到的一种PKS产生的是C-6氢,而不是C-6甲基的环氧噻酮衍生物的PKS。因此,如果基因中没有别的改变,产生的化合物是6-去甲基环氧噻酮。
环氧噻酮PKS的第八个组件包括一个KS,一个甲基丙二酰基辅酶A特异性的AT,一个DH,失活的KR,和DH结构域,甲基转移酶(MT)结构域和一个ACP。这个组件是由粘粒pKOS35-79.85中的一个约10kb的NotI限制性片段中的序列编码的。
编码环氧噻酮PKS的第八个组件的本发明的重组DNA化合物,和它们编码的相应的多肽被用于各种途径中。在一个实施方案中,环氧噻酮第八组件编码序列的DNA化合物,被插入含有异源PKS一个或者几个组件的编码序列的DNA化合物中。获得的构造中,异源PKS一个组件的编码序列被环氧噻酮PKS第八组件的编码序列所替换,或者后者仅仅是加到异源RKS的组件的编码序列上,产生了一种新的PKS编码序列,它和构成PKS的其他蛋白质一起表达,产生一种新的PKS。可选地,环氧噻酮第八个组件可以作为一个分离的蛋白质表达,与其他的PKS蛋白质结合形成新的PKS。在另一个实施方案中,含环氧噻酮PKS第八组件编码序列的DNA化合物和构成环氧噻酮PKS,或者产生环氧噻酮衍生物的PKS的其他蛋白质共表达。在这些实施方案中,第八个组件通常是作为也含有环氧噻酮PKS的第七个组件,或其衍生物的蛋白质的形式表达的。
在另一个实施方案中,第八组件编码序列的整个或其一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换甲基丙二酰基辅酶A特异性的AT;删除失活的KR和/或失活的DH;用有活性的KR和/或有活性的DH替换失活的KR和/或失活的DH;和/或插入一个ER。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换或插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的异源第八组件编码序列能够作为蛋白来表达,用于同其它蛋白结合,构成合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物的PKS。当用于制备环氧噻酮或者环氧噻酮衍生物时,异源或者杂合第八组件通常是作为重组epoE基因产物表达的,该产物含有第7组件。可选择地,epoE基因中的第八组件编码序列可被删除,或者被异源的组件替换以制备重组的epoE基因衍生物,它和epoA,epoB,epoC,epoD,和epoF基因一起表达,构成环氧噻酮衍生物PKS。
环氧噻酮PKS第八组件还含有一个带有给环氧噻酮前体加上甲基活性的甲基化或者甲基转移酶结构域(MT)。这个功能可以被删除,从而获得本发明的重组epoD基因衍生物,它可以和其他的环氧噻酮PKS或其衍生物一起表达,依赖于是否第八组件的AT结构域被变化为丙二酰基特异性的AT结构域,在相应的环氧噻酮分子的C-4位点,可以产生缺少一个或者两个甲基基团的环氧噻酮衍生物。在另一个实施方案中,本发明提供了编码这个甲基化结构域和活性的多肽的重组DNA化合物,以及许多种编码结合这个多肽的重组PKS酶的重组PKS编码序列。这个MT结构域和它的编码序列提供了大量的在附加甲基基团的存在上不同于已知聚酮化合物的新的聚酮化合物。本发明的MT结构域能够有效地加到任何PKS组件上,去指导由PKS生成的聚酮化合物相应位点的甲基化。在一个例证性实施例中,本发明提供了,由MT活性编码序列插入到DEBS酶的六个组件的一个或多个组件上,所产生的一种重组的DEBS核酸组分,它合成在C-2,C-4,C-6,C-8,C-10,和/或C-12位点,含有一个或多个附加的甲基基团的6-deoxyerythronolide B衍生物。在这一构造中,MT结构域可以插入与AT或者ACP邻接。
环氧噻酮PKS的第九个组件包括一个KS,一个丙二酰基辅酶A特异性的AT,一个KR,失活的DH,和一个ACP。这个组件是由粘粒pKOS35-79.85上的一个约14.7kb的HindII-BgIII限制性片段中的序列编码的。
编码环氧噻酮PKS的第九个组件的本发明的重组DNA化合物,和它们编码的相应的多肽被用于各种途径中。环氧噻酮PKS的第九个组件是以epoF基因基因产物蛋白的形式表达的,该基因也包含了环氧噻酮PKS的TE结构域。本发明提供了重组形式的epoF基因,但也提供了编码第九组件但是不含TE结构域编码序列的DNA化合物,以及编码TE结构域但是不含第九组件编码序列的DNA化合物。在一个实施方案中,含有环氧噻酮第九组件编码序列的DNA化合物,被插入含有异源PKS一个或者几个组件的编码序列的DNA化合物中。获得的构造中,异源PKS一个组件的编码序列被环氧噻酮PKS第九组件的编码序列所替换,或者后者仅仅是加到异源RKS的组件的编码序列上,产生了一种新的PKS蛋白质编码序列,它和构成PKS的其他蛋白质一起表达,产生一种新的PKS。环氧噻酮第九个组件可以作为一个分离的蛋白质表达,带或不带有附加的TE结构域。在另一个实施方案中,含有环氧噻酮PKS第九组件编码序列的DNA化合物和构成环氧噻酮PKS,或者产生环氧噻酮衍生物的PKS的其他蛋白质共表达。在这些实施方案中,第九个组件通常是作为也含有环氧噻酮PKS的或异源PKS的TE结构域的蛋白形式表达的。
在另一个实施方案中,第九组件编码序列的整个或其一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换丙二酰基辅酶A特异性的AT;删除KR;用具有不同立体化学特性的KR来替换KR;和/或插入一个DH或者一个DH和一个ER。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换或插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的异源第九组件编码序列能够和合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物的PKS蛋白亚基编码序列共表达。可以选择地,本发明提供了用于制备环氧噻酮和环氧噻酮衍生物的PKS,其中的第九组件被异源PKS的一个组件替换,或者被整个的删除。在后一个实施方案中,TE结构域作为一个分离的蛋白质表达或者融合到第八组件上。
环氧噻酮PKS的第九组件后面是硫酯酶结构域。这个结构域是由一个包含第九组件编码序列的约14.kb的Hind III-BgIII限制性片段编码的。本发明提供编码杂合PKS酶的重组DNA化合物,其中环氧噻酮PKS的第九组件被融合到一个异源硫酯酶,或者异源PKS的一个或者多个组件被融合进入环氧噻酮PKS硫酯酶。因此,例如,来自其它PKS的硫酯酶结构域编码序列能够插入本发明重组DNA化合物中的第九组件ACP编码序列的终端。编码这种硫酯酶结构域的重组DNA化合物能用于构建编码环氧噻酮PKS,产生环氧噻酮衍生物的PKS,以及产生不是环氧噻酮或者环氧噻酮衍生物的PKS的蛋白。
在一个实施重要的方案中,本发明提供一种杂合PKS和编码构建那些杂合PKS酶的重组DNA化合物。为了本发明的目的,杂合PKS是异种重组PKS,它包括所有的或者部分一或多个组件,装载结构域和第一PKS硫酯酶/环化酶结构域,和所有或者部分一个或多个组件,装载结构域和第二PKS硫酯酶/环化酶结构域。在一个优选的实施方案中,所述的第一PKS是绝大多数但非全部的环氧噻酮PKS,而第二PKS仅仅是部分或者全部非环氧噻酮PKS。这种杂合PKS的例证包括能够用其它PKS装载结构域替代的天然装载结构域的环氧噻酮PKS。这种杂合PKS的另外的例证是一种环氧噻酮PKS,它的第四组件的AT结构域被用仅与甲基丙二酰辅酶结合的异源PKSAT结构域替代。在另一个实施方案中,所述的第一PKS是绝大多数但非全部的环氧噻酮PKS,而第二PKS仅仅是部分或者全部环氧噻酮PKS。这种杂合PKS的例证包括能够用对丙二酰辅酶特异性的环氧噻酮PKS的AT替代对甲基丙二酰辅酶特异性的AT的红霉素PKS。另一个实施例是包括环氧噻酮PKS MT结构域的红霉素PKS。
本领域技术人员可以认识到,本发明的杂合PKS的第一个和第二个PKS的整个或其一部分,不需要从天然来源分离。例如,AT结构域的仅仅很小一部分决定了它的特异性。见美国专利申请号09/346,860和PCT专利申请号WOUS99/15047。本领域中所描述的DNA合成技术的状况,使技术人员可以从头合成足够大小的DNA化合物,以构建有用的PKS组件或结构域部分。对于本发明来说,这种合成的DNA化合物是PKS的一部分。
下表列出了描述PKS基因的相关的参考文献,用于构建重组PKS的相应的酶,和它们所编码的本发明的相应的DNA化合物。也列出了描述聚酮化合物加尾和修饰酶的各种参考文献,以及用来制备本发明的重组DNA化合物的相应的基因。阿维菌素:
美国专利号5,252,474,授予Merk公司
MacNeil等人,1993,Industrial Microorganism Basic And Applied MolecularGenetics,(工业微生物基础和应用遗传学]Baltz,Hegeman,和Skatrud,编(ASM),p245-256,A comparison of the Genes Encoding the Polyketide聚酮化合物Synthasesfor Avermectin,Eryhromycin,and Nemadectin.
MacNeil等人,1992,基因Gene 115:119-125,Complex Organization Of theStreptomyces avermitilis genes,encoding the avermecoin polyketide synthase(编码阿维菌素聚酮化合物合成酶的阿维菌素链霉菌基因的复杂组织)。
Ikeda和Omura,1997,Chem Res 97:2599-2609,AvermectinBiosynthesis(阿维菌素生物合成)。杀念珠菌素(FR008):Hu等人,1994,Mol Microbiol(分子微生物学)14:163-172。红霉素
PCT公开号93/13663.申请人Abbott
美国专利号5,824,513.申请人Abbott
Donadio等人,1991科学252:6759。
Cortes等人,11月8日1990,nature(自然)348:176-8,红色糖多孢菌产生红霉素的聚酮合成酶的特别异常的多功能多肽糖基化酶
PCT专利申请公开号97/23630,申请人Abbott。FK-506Motamedi等人,《欧洲生物化学杂学》1998,256:528-534,免疫抑制剂FK-506的大环内酯环的生物合成基因簇,。Motamedi等人,《欧洲生物化学杂学》1997,244:74-80大环内酯免疫抑制剂FK-506生物合成有关的多功能聚酮合成酶的结构组织]。甲基转移酶
美国专利申请号5,246,355,1993年11月23日颁布,来自链霉菌MA6858.31的甲基化酶,31-氧-去甲-FK-506-甲基转移酶。Motamedi等人,1996,《细菌学杂志》1178:5243-5248免疫抑制剂FK-506和FK-520生物合成中涉及的甲基转移酶和羟基化酶基因的特征。FK-520
美国专利申请序列号09/154,083,1998年9月16日递交。
美国专利申请序列号09/410,551,1999年10月1日递交。
Nielsen等人,1991,生物化学30:5789-96洛伐他丁
美国专利号5,744,350,Merk公司Narhomvcin
美国专利申请序列号60/107,093,1998年11月5日递交Nemadectin
MacNeil等人,1993,supra。尼达霉素
Kakavas等人,细菌学,179:7515-7522,来自天青链霉菌尼达霉素聚酮化合物合成酶基因的鉴别与特征。Oleandomvcin
Swan等人,分子基因遗传学,242:358-362,编码I型聚酮化合物合成酶抗生链霉菌基因的特征。
美国专利申请系列号60/120,254,要求优先权,发明人S,Shah,M.Betlach,R McDaniel和L.Tang,专利律师号:30063-20029.00。Olano等人,1998,Analysis Of A Streptomyces antibioticas Chromosomalregion involved in Oleandomycin Biosynthesis,which encodes twoglycosyltransferases reponsible for Glylosylation of the macrolatone ring,(与Oleandomycin生物合成有关的抗生链霉菌染色体区的分析,它编码两种负责大环内酯环糖基化的糖基转移酶),Mol,Gen Genet。(分子基因遗传学)259(3):299-308。苦霉素
PCT专利申请号WO US99/11814,1999年5月28日递交。
U.S专利申请号09/320,878,1999年5月27日递交。
U.S专利申请号09/141,908,1998年8月28日递交
Xue等人,1998,由pikC编码的委内瑞拉链霉菌细胞色素p450介导的大环内酯YC-17和那波霉素的羟基化,化学和生物学5(11):661-667。
Xue等人,1998年10月,委内瑞拉链霉菌大环内酯类抗生素生物合成的基因簇:代谢多样性的结构,Proc natl Acad sci USA[美国科学院院报]95:1211112116Platenolide
欧洲专利申请公开号791,656,申请人Lilly。Pradimicin
PCT公开号WO 98/11230申请人Bristol-Myers SquibbRapamycin
Schweche等人,1995年八月,聚酮化合物Rapamcin的生物合成基因簇,Proc.Natl.Acad.Sci.USA 92:7839-7843.
Aparicio等人,1996,吸水链霉菌中Rapamycin生物合成基因簇的组织:组件化聚酮化合物合成酶中酶结构域的分析,Gene[基因]169:9-16。RifamycinPCT公开号WO98/07868申请人NOVARTISAugest等人,1998年2月13日,安沙霉素抗生素Rifamycin的生物合成:Amycolatopsis mediterranei S669的RIF生物合成基因簇的分子分析中还原,化学和生物学,5(2):69-79。Sorangium PKS
美国专利申请号09/144,085,1998年8月31日递交。Soraphen
美国专利号5,716,849,授与Novarfis。
Schupp等人,1995,细菌学杂志,177:3673-3679,一个大环内酯抗生素Soraphen A生物合成的纤维堆囊菌(分枝杆菌)基因簇:克隆,分析,和与来自放线菌的聚酮化合物合成酶基因的同源性。Spiramycin
美国专利号:5,098,837,授予Lilly。
活化因子基因
美国专利号:5,514,544,授予Lilly。Tylosin[泰乐菌素]
美国专利号:5,876,991,授予Lilly。
欧洲专利公开号:791,655申请人Lilly。
Kuhstoss等人,1996基因183:231-6,经过杂合聚酮化合物合成酶的构建制备一种新的聚酮化合物。加尾酶
 Merson-Daves和Cundliffe,1994,Mol Microbiol 13:349-355[分子微生物学],B:349-355,Analysis of five Tylosin biosynthetic genes from the TylBAregion of the Streptomyces Fradiae Genome(弗氏链霉菌基因组TylBA区的五种泰乐菌素生物合成基因的分析。)
如上面所述的,有许多种PKS基因可作为可方便地获取的DNA的来源,以及许多的序列资料可用于构建本发明的杂合PKS编码DNA化合物。构建杂合PKS编码DNA化合物的方法,虽然没有提及环氧噻酮PKS,可以参见下面文献中的描述:美国专利号5,672,491和5712146,和美国专利申请09/073,538,该申请于1998年5月6日提交,09/141,908,该申请于1998年8月28日提交,各篇在此处引入作为参考。为分离本发明用于构建杂合PKS酶的异源PKS编码结构域序列,优选的PKS酶和这种酶的编码序列是上面表中所述的Soraphen PKS和作为纤维堆囊菌PKS的PKS。
这里概述了实施例中克隆基因和序列的功能。
基因    蛋白质    组件       存在的结构域
epoA    EpoA       Load       KSYmAT ER ACP
epoB    EpoB        1         NRPS,缩聚,异源环化,
                              腺苷酰化,硫酯化,PCP
epoC    EpoC        2         KS mmAT DH KR ACP
epoD    EpoD        3         KS mAT KR ACP
                    4         KS mAT KR ACP
                    5         KS mAT DH ER KR ACP
                    6         KS mmAT DH ER KR ACP
epoE    EpoE        7         KS mmAT KR ACP
                    8         KS mmAT MT DH*KR*ACP
epoF    EpoF        9         KS mAT KR DH*ACP TENRPS-非核糖体肽合酶;KS-酮合成酮;mAT-丙二酰基特异性酰基转移酶;mmAT-甲基丙二酰基特异性酰基转移酶;DH-脱氢酶;ER-烯醇还原酶;KR-酮还原酶;MT-甲基转移酶。TE-硫酯酶;*-失活的结构域。
本发明的杂合的PKS编码DNA化合物,可以是并且通常是多于两种PKS基因的杂合。甚至当只使用两种基因时,在杂合基因中通常有两种或更多种的组件,其中该组件的部分或者全部是衍生自第二个(或第三个)PKS基因。本发明的重组环氧噻酮衍生物PKS基因的例证性实施例,通过列出来杂合组件的特异性辨明(其它组件与环氧噻酮PKS具有同样的特异性),包括:(a)组件4具有甲基丙二酰基特异性的AT(mmAT)和KR,而组件2有丙二酰基特异性的AT(mAT)和一个KR。(b)组件4具有一个mMAT和一个KR,和组件3,具有mMAT和一个KR;(c)组件4具有一个mMAT和一个KR,和组件5,具有mMAT和ER DH KR;(d)组件4具有一个mMAT和一个KR,和组件5,具有mMAT和DH KR;(e)组件4具有一个mMAT和一个KR,和组件5,具有mMAT和一个KR;(f)组件4具有一个mMAT和一个KR,和组件5,具有mMAT和一个失活KR;(g)组件4具有一个mMAT和一个KR,和组件6,具有mAT和ER DH KR;(h)组件4具有一个mMAT和一个KR,和组件6,具有mAT和一个DH KR;(i)组件4具有一个mMAT和一个KR,和组件6,具有mAT和一个KR;(j)组件4具有一个mMAT和一个KR,和组件6,具有mAT和一个失活KR;(k)组件4具有一个mMAT和一个KR,和组件7,具有一个mAT;(l)(c)到(f)的杂合,除了组件5具有一个mAT;(m)(g)到(j)的杂合,除了组件6具有一个Mm AT;(n)(a)到(m)的杂合,除了组件4具有一个mAT
上面的列表仅仅是例证性的,它们不应该被解释为限定本发明,本发明还包括有其它的重组环氧噻酮PKS基因和酶,这些重组的环氧噻酮PKS基因和酶不仅带有不同于上述的杂合组件,还包括带有三个或更多杂合组件。
本领域中的技术人员可以理解,本发明的杂合PKS包括但不限于下述的任何一种PKS;(i)环氧噻酮或者环氧噻酮衍生物PKS,它含有的组件,至少其中一个结构域来自异源组件;(ii)环氧噻酮或者环氧噻酮衍生物PKS,它含有的一个来自异源PKS的组件;(iii)一种环氧噻酮或者环氧噻酮衍生物PKS,它含有的一种来自异源PKS的蛋白质;以及以前述的组合。
尽管本发明的一个重要的实施方案涉及杂合PKS基因,本发明还提供了重组环氧噻酮PKS基因,其中没有第二种PKS基因序列存在,但是因为一个或更多删除而不同于环氧噻酮PKS基因。这种删除可以包括一个或几个组件和或可以限定于一个或几个组件中的部分删除。当删除包括除NRPS组件外的整个组件时,得到的环氧噻酮衍生物比由删除本衍生自的PKS产生的化合物,要短至少两个碳原子。如上面提到的。删除可以包括NRPS组件和或装载结构域。当删除是在一个组件内时,删除通常饮食一个KR,DH,或者ER结构域,或者DH和ER结构域二者,或者所有三个KR,DH,和ER结构域。
环氧噻酮PKS和环氧噻酮修饰酶的结构域和组件的催化特性,也可以通过相关基因的随机或者位点专性突变来改变。本领域公知的许多突变试剂和方法适用于这一目的。这种技术也可以被称为DNA漫游的方法。见美国专利号US5,830,712;5,830,238和5,605,793,各篇参考文献于此处作为参考。重组操作:
为构建本发明的杂合PKS或者环氧噻酮衍生物PKS基因,或者只是表达未修饰的环氧噻酮生物合成基因,人们可以使用下述的方法:见PCT公开号98/27203和1997年12月11日递交的美国专利申请序列号08/989,332,各篇在此处引入作为参考,其中各种不同的PKS基因被分成两个或者多个,常常是三个片段,每一个片段放在分离的表达载体上。用这种方法,全部互补的基因可以更方便地装配起来和用于异源表达的操作,基因的各个片段可以被改变,各个改变了的片段可以组合在单个宿主细胞中,用于提供本发明的重组PKS。这一技术使得可以更方便地构建大的重组PKS基因文库,表达这些基因的载体,和含有这些载体的宿主细胞。在本文的此处和其它的上下文中,编码目的PKS的基因不仅可以存在于两个或者更多个载体上,而且还可以以与基因所来自的天然生产微生物中不同的方式来排序和排列。应用于环氧噻酮PKS的这一技术的不同例子,在下面的实施例中有描述。在一个实施方案中,epoA,epoB,epoC和epoD基因存在于第一个质粒上,而epoE和epoF,以及可以选择地epoK或者epoK和epoL基因存在于第二个(或第三个)质粒上。
因此,在一个重要的实施方案中,本发明的重组核酸组分是表达载体。这里所使用的术语“表达载体”指的是可以被导入宿主细胞中的任何核酸或者无细胞转录和翻译中间体。表达载体可以稳定和暂时保存在细胞中,无论是作为染色体的一部分或者细胞中的其它的DNA形式,或者在细胞中的任何部分中,比如作为细胞质中的复制载体。表达载体还含有基因,用以产生在细胞或细胞抽提物中翻译成多肽的RNA。因此,载体通常含有一个启动子以增强基因表达,但是也可以将相关的编码序列结合在内源启动子的控制之下。而且,表达载体通常含有附加的功能元件,比如作为选择的标记的带有抗性的基因和增强启动子活性的调节基因。
表达载体的各种元件可以有很大的变化,依赖于所要求的对载体的使用。特别是,元件依赖于载体所要使用于和发挥功能的宿主细胞。用于在大肠杆菌中表达和载体保存的载体元件是公知的,可以商业上获得。对于其它通常用的载体元件也是这样,比如酵母细胞和链霉菌细胞。
在一个实施方案中,本发明的载体被用于转化纤维堆囊菌宿主细胞以提供本发明的纤维堆囊菌宿主细胞。美国专利号5,686,295描述了转化纤维堆囊菌宿主细胞的方法,尽管也可以使用其它方法。纤维堆囊菌是一种方便的重组载体,用来表达本发明的环氧噻酮衍生物,其中产生这种衍生物的重组PKS用重组载体表达,载体中,环氧噻酮PKS基因启动子被定位用来驱动重组编码序列的表达。基因启动子被本发明以重组方式提供,并且它自身是重要的实施方案。该启动子包含在转座子序列和epoA基因可读框起始位点间的一段500核苷酸序列中。可以选择地,启动子可以包括这个500bp区域更上游的序列。本领域的技术人员可以认识到,如果产生环氧噻酮的纤维堆囊菌宿主被用作宿主细胞,重组载体需要驱动表达的仅仅是含有改变了的序列的那部分PKS。因此,这一载体可以含有仅仅一个单独的改变了的环氧噻酮PKS基因,而环氧噻酮PKS多肽的其余部分可以由宿主细胞染色体DNA中的基因提供。如果宿主细胞天然产生环氧噻酮,那么环氧噻酮衍生物将以含有天然存在的环氧噻酮的混合物的形式产生。
本领域技术人员也认识到,本发明的重组DNA化合物可用于构建纤维堆囊菌宿主细胞,其中涉及环氧噻酮生物合成的一种或几种基因被失活。因此,本发明提供了这种纤维堆囊菌宿主细胞,它可以是优选的用于表达本发明的环氧噻酮衍生物的宿主细胞,这样就避免出现复杂的环氧噻酮混合物。特别优选地,这一种类型的宿主细胞包括那些细胞,其中的一种或更多种的环氧噻酮PKS基因可读框被破坏,和/或那些其中的任何的或更多的环氧噻酮修饰酶基因被破坏掉。这些宿主细胞通常是用同源重组的方法构建,重组所使用的载体中含有的DNA与要改变和定位的基因片段侧边的区域同源,因此将会出现所需要的同源双交换重组情况。
因此,同源重组可用于删除,破坏,或者改变某个基因。在一个优选的例证性实施方案中,本发明提供了一种重组产环氧噻酮的纤维堆囊粘细菌宿主细胞,其中epoK基因被使用本发明的重组DNA载体,通过同源重组的方法删除或者破坏。这种不能产生epoK环氧化物酶基因产物的宿主细胞,不能制造环氧噻酮A和B,因此是宿主细胞是一种优选的环氧噻酮C和D的来源。
通过使用那些特异的,同源重组可被用于改变PKS组件的特异性,它是通过要求特异性的组件或者结构域,来替换要改变的组件或者结构域的编码序列达到的。在另一个优选的例证性实施方案中,本发明提供了重组的产环氧噻酮的纤维堆囊粘细菌宿主细胞,其中的epoD基因编码的组件4 AT结构域的编码序列,被使用编码只结合甲基丙二酰基辅酶A的AT结构域的本发明重组DNA载体,通过用同源重组加以改变。这种不能制造环氧噻酮A,C,和E的宿主细胞是一种优选的环氧噻酮B,D和F的来源。本发明还提供了重组的纤维堆囊菌宿主细胞,其中进行了环氧噻酮生物合成酶基因的改变和删除。例如,本发明提供了重组的纤维堆囊菌宿主细胞,其中作了前述的改变和删除中,获得只产生环氧噻酮D的宿主细胞。
同样地,本领域技术人员可以理解,本发明提供了许多重组的纤维堆囊菌宿主细胞,它们比野生型的环氧噻酮细胞制造比较少种类的只产生环氧噻酮混合物,以及那些制造一种或者几种环氧噻酮衍生物的细胞。这些宿主细胞包括只制备环氧噻酮A,C和E的那些细胞;只制备环氧噻酮B,D和F的细胞;只制备环氧噻酮D的细胞和只制备环氧噻酮C的细胞。
在另一个优选的实施方案中,本发明提供了表达载体和重组的粘球菌,优选是黄色粘球菌宿主细胞,该细胞含有表达重组环氧噻酮PKS或者环氧噻酮衍生物PKS的那些表达载体。现在,黄色粘球菌中,染色体外复制的载体还未知。然而,已知有大量的已知噬菌体整合进黄色粘球菌的染色体DNA中,包括Mx8,Mx9,Mx81和Mx82。这些噬菌体的整合和附加功能可以被置于质粒上,以制备可整合进黄色粘球菌染色体DNA的噬菌体的表达载体。当然,噬菌体Mx9和Mx8被优选用于发明的目的。质粒pPLH343,如Salmi等所述,1988年2月,Genetic determinants of immunity and integration of temperate黄色粘球菌phage MX8(温和黄色粘球菌噬菌体MX8的免疫遗传决定子和整合),J.Bact(细用菌学杂志).180(3):614-621,是一种可在大肠杆菌中复制的质粒,它含有编码附着和整合功能的噬菌体Mx8基因。
环氧噻酮PKS基因的启动子可以在黄色粘球菌宿主细胞中起作用。因此,在一个实施方案中,本发明提供了衍生自纤维堆囊粘细菌环氧噻酮PKS基因启动子的,可用于重组宿主细胞中的重组启动子。该启动子可用于在宿主细胞中表达一种或几种环氧噻酮PKS基因,或者其它的有用的基因产物。本发明还提供了环氧噻酮PKS表达载体,其中的一种或几种环氧噻酮PKS或者环氧噻酮修饰酶基因在它们自身启动子的控制下。另一个优选的在黄色粘球菌宿主细胞中表达本发明重组PKS的启动子,是黄色粘球菌的pilA基因的启动子。这个启动子,以及两个高水平表达由pilA启动子控制的基因表达产物的黄色粘球菌菌株,一个删除pilA的菌株和一个删除pilS的菌株,如WU和Kaiser所述,1997年12月,Regulation of expression of the pilA gene in myxococcus xanthus(黄色粘球菌中pilA基因表达的调控),J.Bact(细菌学杂志),179(24):7748-7758,此处引入作为参考。另外,本发明提供了含有删除pilA和pilS二者的重组MyXoCoccus宿主细胞。另一个优选的启动子是饥饿依赖性的sdcK基因启动子。
用于黄色粘球菌的选择性标记包括带有卡那霉素,四环素,氯霉素,zeocin,壮观霉素,和链霉素抗性的基因。本发明的用于粘球菌的重组DNA表达载体通常包含有这些选择性标记,还可以包含衍生自环氧噻酮PKS或者环氧噻酮修饰酶基因的启动子。
本发明提供了用于制备重组黄色粘球菌表达载体和本发明的宿主细胞的优选的表达载体。这些载体,被命名为质粒pKOS35-82.1和pKOS35-82.2(图3),能够在大肠杆菌宿主细胞中复制,以及整合进黄色粘球菌的染色体DNA中。这些载体含有Mx8附着和整合基因,以及pilA启动子,其下游排列有方便使用的限制酶识别位点。两种载体相互间的区别仅在于载体上pilA启动子的方向,并且可以方便地修饰去含有环氧噻酮PKS和本发明的修饰酶基因。载体的构建如
实施例3所详述。
本发明特别优选的粘球菌宿主细胞是那些细菌,它产生的环氧噻酮或者环氧噻酮衍生物,或者环氧噻酮或环氧噻酮混合物的量等于或者大于20mg/L,优选等于或大于200mg/L,更优选等于或大于1g/l。特别优选的是产生这种水平产物的黄色粘球菌宿主细胞。可用于本发明的黄色粘球菌(M.xanthus)宿主细胞包括DZ1(Campos等,1978,J.Mol.Biol 119:167-178[分子微生物学杂志],此处引入作为参考),产TA的细胞系ATCC 31046,DK1219(Hodgkin和Kaser,1979,Mol.Gen.Genet[分子基因遗传学],171:177-191此处引入作为参考),和DK1622细胞系(Kaiser,1979.Proc.Natl.Acad.Sci.USA 76:5952-5956,此处引入作为参考)。
在另一个优选的实施方案中,本发明提供了表达载体,和含有那些表达载体并表达本发明的重组PKS的重组荧光假单胞菌(Pseudomonas fiuorescens)宿主细胞。用于构建荧光假单胞菌(P.fluorescens)表达载体和本发明的宿主细胞的一个质粒是pRSF1010质粒,它能够在大肠杆菌和荧光假单胞菌宿主细胞中复制(见Scholz等人,1989,Gene 75:271-8,此处引入作为参考)。也可以使用低拷贝的复制子和载体。如上面所提到的,本发明还提供了重组形式的纤维堆囊菌环氧噻酮PKS和环氧噻酮修饰酶基因的启动子。启动子可用于在荧光假单胞菌宿主细胞中表达环氧噻酮PKS基因或其它的基因。同时,SoraphenPKS基因的启动子可用在任何纤维堆囊菌启动子能起作用的宿主细胞中。因此,在一个实施方案中,本发明提供了一种用在荧光假单胞菌宿主细胞中的环氧噻酮PKS表达载体。
在另一个优选的实施方案中,本发明的表达载体被用于构建表达本发明的重组PKS的重组链霉菌细胞。用于本发明的链霉宿主细胞包括天蓝色链霉菌,浅青紫链霉菌,委内瑞拉链霉菌,生二素链霉菌,弗氏链霉菌等等(S.coelicolor,S.lividans S,venezuelae,S.ambofaciens,S.fradiae and the like)。本发明的优选的链霉菌宿主细胞/载体组合包括不产生放线菌紫素的,天蓝色链霉菌(Scoelicolor)CH999和浅青紫链霉菌(S.lividans)K4-114以及浅青紫链霉菌(S.lividans)K4-155宿主细胞,和衍生自pRM1和pRM5载体的表达载体,如下所述:美国专利号5,830,750和美国专利申请序列号08/828,898,1997年3月递交,和09/181,833,1998年10月28日递交的申请。本发明特别优选的链霉菌宿主细胞是那些细胞,它们产生的环氧噻酮或者环氧噻酮衍生物或者环氧噻酮和环氧噻酮衍生物的混合物的水平等于或者大于20mg/L,更优选等于或者大于200mg/L,最优选大于或者等于1g/L。特别优选的是在这个水平的天蓝色链霉菌和浅青紫链霉菌宿主细胞。同时,紧密相关的糖多孢菌属,包括但不限于红色糖多孢菌(S.eryhraea)可用于产生环氧噻酮。
本发明提供了许多种用于链霉菌的表达载体。复制载体的复制起点,可以是,例如但不限于,低拷贝数复制子和含有相同的,比如SCP 2*(见Hopwood等人,Genetic Manipulation of Streptomyces:A Laboratory Manual(链菌霉遗传操做实验手册)(The John Innes Foundation,Norwich,UK.,1985);Lydiate等,1985,GENE 35:223-235和Kieser和Melton,1988,Genes:65:83-91,各篇此处引入作为参考),SLP1.2(Thompson等人,1982,Gene 20:51-62,此处引入作为参考),和pSG5(ts)(Muth 1989,Mol GEN GENENT[分子基因和遗传学]219:341-348,和Bierman等人,Gene 116:43-49,各篇此处引入作为参考),或者一些高拷贝数的复制子和含有它的载体,例如plJ101和pJV1(见KATZ等,1983,J Gen.Microbiol.[微生物遗传杂志]129:2703-2714;Vara等人,1989 J.Bacteriol,171:5782-5781;和Servin-Gonzalez,1993,Plasmid 30:131-140,各篇在此引入作为参考)。然而,高拷贝数载体通常不是优选的用于表达大的基因或者多基因的载体。对于非复制和整合载体来说,以及通常对于任何载体来说,有用的是包括至少一个大肠杆菌复制起点,比如,来自pUC,p1P,p1I和pBR的那些,对于基于噬菌体的载体来说,噬菌体phiC31和它的衍生物KC515可以使用(见Hopwood等,同上)。质粒pSET152,质粒pSAM,质粒pSE101和质粒Pse211可以使用,所有它们都能够位点专一性地整合到的染色体DNA上。
通常,表达载体会有一个或多个标记基因,含有载体的宿主细胞可以通过它来鉴定和或筛选。用于链霉菌宿主细胞的有用的带有抗生素抗性的基因包括ermE(带有红霉素和林可霉素抗性),tsr(带有硫链丝菌肽抗性),aad A(带有壮观霉素和链霉素抗性),aac C4(带有阿泊拉霉素,卡那霉素,庆大霉素,遗传霉素(G418),和新霉素抗性),hyg(带有潮霉素抗性),和vph(带有紫霉素抗性)抗性的基因。
载体上的重组PKS基因,会在启动子的控制下,通常带有一个伴随的核糖体结合位点序列。一个优选的启动子actI启动子和它伴随的激活子基因actII-ORF4,它在pRM1和pRM 5如上表达载体中提供。这个启动子在次级代谢物正常合成时的稳定期被激活。其它有用的链霉菌启动子包括但不限于来自ermE和melCl基因的那些启动子,它组成型地起作用,以及tipA基因和merA基因,它可在任何生长期被诱导。另外,T7RNA聚合酶系统已被转入链霉菌中,并可用于本发明的载体和宿主细胞中。在这一个系统中,T7RNA聚合酶的编码序列被插入到染色体中性位点,或在载体中置于诱导性merA启动子的控制下,目的基因置于T7启动子的控制下。如上面所提到的,一种或多种激动子基因可用于增强启动子的活性。除了上面所讨论的actII-ORF4基因外,激活子基因还包括,dnrI基因,redD,和ptpA基因(见美国专利申请序列系列号09/181,833,见上),它们可用于和同类的启动子一起来表达本发明的重组基因。
本发明还提供了在植物细胞中表达产生环氧噻酮和环氧噻酮衍生物的环氧噻酮PKS和PKS酶的重组表达载体。这些载体根据1998年月10日提交的美国专利申请序列号09/114,083和PCT专利公开号99/02669构建的,各篇文献在此引入作为参考。表达环氧噻酮的植物和植物细胞具有对疾病的抗性,能够抵抗真菌感染。为了提高环氧噻酮或者环氧噻酮衍生物在任何异源宿主细胞,包括植物,粘球菌,假单胞菌,和链霉菌宿主细胞中的产量,可以转化细胞使之表达异源的磷酸泛酰巯基亚胺基转移酶。见1996年10月11日提交的美国专利申请序列号08/728,742,和PCT专利公开号97/13845,两者在此引入作为参考。
除了提供编码环氧噻酮或者环氧噻酮衍生物PKS的重组表达载体外,如上面所讨论的本发明还提供了编码环氧噻酮修饰酶基因的DNA化合物。如上面所讨论的,这些基因产物将环氧噻酮C和D转变为环氧噻酮A和B,将环氧噻酮A和B转变为环氧噻酮E和F。本发明还提供了重组表达载体和用这些表达载体转化的宿主细胞,这些载体表达那些基因中的一种或几种,从而产生相应的环氧噻酮和或者环氧噻酮衍生物。在一部分中,本发明提供了重组形式的epoK基因和表达它的基因产物的宿主细胞,它分别将环氧噻酮C和D转变为环氧噻酮A和B。
在另一个重要的实施方案中,以及如下面所提到的,本发明提供的载体可用于破坏epoL,epoK和纤维堆囊菌细胞中与环氧噻酮PKS基因簇有关的可读框的任意一种或几种重组纤维堆囊菌。本发明还提供了缺少(或者含有失活形式的)这些基因的一种或几种的。这些细胞可用于产生由于这些基因的一种或几种的缺失所导致的相应的环氧噻酮和环氧噻酮衍生物。
本发明还提供了含有重组的环氧噻酮PKS或者环氧噻酮衍生物PKS,但是不含有(或者含有无功能形式的)任何环氧噻酮修饰酶基因的非纤维堆囊菌宿主细胞。本发明的这些宿主细胞希望在缺少能形成环氧噻酮C和D的C-12-C-13烯烃的脱氢酶活性的情况下,产生环氧噻酮G和H。这种脱氢反应相信是在链霉菌宿主细胞epoL基因产物存在的情况下发生的。当脱氢酶活性存在而P450环氧化酶和羟化酶(它将环氧噻酮A和B分别转化成环氧噻酮E和F)基因存在时,宿主细胞能产生环氧噻酮C和D(或者对应的环氧噻酮C和D的衍在物)。当羟化酶基因缺乏时,宿生细胞也产生环氧噻酮A和B(或者对应的环氧噻酮A和B的衍生物)。在这些宿主细胞中优先表达的是本发明的重组环氧噻酮PKS酶,它的组件4含有只对甲基丙二酰基辅酶A具有专一性的AT,选择性也与一种或几种附加的杂合组件组合。在这些宿主细胞中同样优选表达的是本发明的重组环氧噻酮PKS酶,它的组件4含有只对丙二酰基辅酶A具有专一性的AT,选择性也与一种或几种附加的杂合组件组合。
本发明的重组宿主细胞还包含有增加目的环氧噻酮或者环氧噻酮衍生物表达的其它基因和相关的基因产物。作为一个非限制性的实施例,环氧噻酮PKS蛋白要求装载结构域的ACP结构域,组件2到组件6,以及NRPS的PCP结构域的磷酸泛酰硫基乙胺基化。磷酸泛酰硫基乙胺基化是由称为磷酸泛酰硫基乙胺基转移酶(PPTase)的酶介导的。为在并不天然表达能用于目的PKS酶的PPTase的宿主细胞中产生有功能的PKS酶,或者提高宿主细胞中PPTase作为限速因素有功能的PKS酶的含量,可以导入异源PPTase包括但不限于Sfp,如PCT专利公开号97/13845和98/27203,和1996年10月11日递交的美国专利申请序列号08/728,742的申请中所描述的,各篇文献在此引入作为参考。
本发明的宿主细胞可在本领域已知的条件下发酵生长,以生产本发明的化合物。本发明化合物可以从培养细胞的发酵液中分离,并用标准的方法纯化。从纤维堆囊菌宿主细胞产生本发明的化合物发酵条件可以基于PCT专利公开号93/10121,97/19086,与99/42602中所描述的方法,各篇文献此处引入作为参考。本发明的新的环氧噻酮同系物,以及本发明的宿主细胞发酵所产生的环氧噻酮,以及可以衍生和形成的化合物可以如下所述:PCT专利公开号93/10121,97/19086,98/08849,98/22461,98/25929,99/01124,99/02514,99/07692,99/27890,99/39694,99/40047,99/42602,99/43653,99/43320,99/54319和99/54330,以及美国专利号5,969,145,在此处引入作为参考。发明化合物
本发明的优选的化合物包括14-甲基环氧噻酮衍生物(应用本发明的具结合甲基丙二酰基辅酶A而非丙二酰基辅酶A的AT的杂合组件3而制备);8,9-脱氢环氧噻酮衍生物(应用本发明的具DH和KR而非ER,DH,和KR的杂合组件6而制备);10-甲基环氧噻酮衍生物(应用本发明的具结合甲基丙二酰基辅酶A而非丙二酰基辅酶A的AT的杂合组件5而制备);9-羟基环氧噻酮衍生物(应用本发明的具KR,而非ER,DH,和KR的杂合组件6而制备);8-去甲基-14-甲基环氧噻酮衍生物(应用本发明的具结合甲基丙二酰基辅酶A而非乙酰基辅酶A的AT的杂合组件3,以及具结合丙二酰基辅酶A而非甲基丙二酰基辅酶A的AT的杂合组件6而制备);8-去甲基-8,9-脱羟环氧噻酮衍生物(应用本发明的具KR和DH,而非ER,DH,和KR的杂合组件6,以及一个对丙二酰基辅酶A而非甲基丙二酰基辅酶A具有特异性的AT而制备)。
更通常地,本发明的优选的环氧噻酮衍生物是那些通过本文所述的改变环氧噻酮PKS基因,和选择性地改变环氧噻酮修饰酶活性,和/或对这些基因表达所获得的环氧噻酮进行化学修饰而得到的,因此,本发明提供的化合物的化学式为:
通式1包括它们的糖基化形式和立体异构体形式,其中立体化学结构未示出。
通式中A基团为任意地含有1-3个选自O,S,和N的杂原子的,取代或者未取代的直链,支链或者环烷基,烯基(alkenyl),或者炔基;或者其中A基团为取代或者未取代的芳基;
R2代表H,H,或者H,低级链烃基,或者低级链烃基,低级链烃基,低级链烃基;
X5代表氧基=O或者它的衍生物,或者H,OH,或者H,NR2(胺),其中R为H,烷基或者酰基,H,OCOR,或H,OCONR2,其中R是H,或者是烃基,或者是H,H;
R6代表H或者低级链烃基,相应的碳留下的取代基团为H;
X7代表OR,NR2,其中的R为H,或烷基,或烃基或者酰基,或者为OCOR,或者OCONR2,其中的R为氢或者烃基或者由X7和X9形成碳酸盐或者氨甲酸盐环,其中相应的碳上留下的取代基团为H;
R8代表H或者低级链烃,相应的碳上留下的取代基团为H;
X9代表氧基=O或者它的衍生物,或者H,OR,或者H,NR2,其中R为H,或烷基或者酰基,或者H,OCOR,或者OCONR2,其中R是H,或者是烃基,或者代表H,H或其中由X9和X7或者X11可以形成环状碳酸盐或者氨甲酸盐;
R10是H,H,或者H,低级链烃基,或者低级链烃基,低级链烃基;
X11是氧基=O或者它的衍生物,或者H,OR,或者H,NR2,其中R为H,或烷基或者酰基,或者氢(H),OCOR或者H,OCONR2,其中R是氢或者是烃基,或者是氢,氢;或者其中由X11和X9结合可以形成环状碳酸盐或者氨甲酸盐;
R12是氢,氢,或者H,低链烃基,或者低链烃基,低链烃基;
X13是氧基=O或者它的衍生物,或者H,OR,或者H,NR2,其中R为H,烷基或者酰基,或者是H,OCOR或者H,OCONR2,其中R是H或者是烃基;
R14是H,H,或者H,低级链烃基,或者低级链烃基,低级链烃基;
R16是H或者低级链烃基;以及
其中可选择的是,H或者另外一个取代基团可以随意地从12和13和/或8和9去除掉以形成双键,其中该双键可以任意地转换为环氧化物。
特别优选的化合物的通式是:
Figure A9981567800531
此处提到的取代基如上面所定义。
更特别优选的化合物的通式是:
Figure A9981567800532
这里的Z是氧,或者一个Z是氮,而另外一个Z是氧,其余的基团如上面所定义。
这里所说的,“含有芳族部分的取代基”,包括至少一个芳香环,比如苯基,吡啶基,嘧啶基,苯硫酚基,噻唑基。取代基还可能包括,融合的芳基残基,比如,萘基,吲哚基,苯噻唑基等。芳香基部分还可以是融合到非芳香环上和或者通过一个非芳香族的,例如烯烃残基与化合物的余下的取代基融合。芳香基部分可以被取代,或者可以是取代基的余下部分而不被取代。
A优选的实施方案包括图2所示的基团。
这里所用的术语烷基指的是,从碳氢部分移去一个原子所得到的C1-C8饱和的,直链或支链碳氢基团。烯基和炔基指的是相应的不饱和形式。烷基的例子包括但不限于甲基,乙基,丙基,异丙基,正丁基,叔丁基,新戊基,异己基,正庆基,正辛基。低链烷基或烯基,炔基指的是1-4碳基团。优选的是甲基。酰基指的是烷基羰基(CO),烯基羰基,或者炔基羰基。
术语卤或者卤素这里指的是选自氟,氯,溴和碘的原子。术语卤烷基这里指的是其中一个,两个或三个卤素原子连接到任一个碳上的烷基基因,包括但不限于氯甲基,溴乙基,三氟甲基等。
术语杂环芳基指的是,其中具有五到十个环上原子中的一个环选自硫,氧和氮的环状芳族基团;零个,一个,或者两个环上的原子为另外杂原子,它独立地,选自硫,氧和氮;剩余的环上原子是碳,该基团通过任意的环上的原子连接到分子的剩余部分上,例如,吡啶基,吡嗪基,嘧啶基,吡咯基,吡唑基,咪唑基,噻唑基,噁唑基,异噁唑基,噻二唑基,噁二唑基,苯硫基,呋喃基,喹啉基,异喹啉基等等。
术语杂环包括但不限于吡咯烷基,吡唑啉基,吡唑烷基,咪唑基,嘧咪唑烷基,哌啶基,哌嗪基,噁唑烷基,异噁唑烷基,吗啉基,噻唑烷基,异噻唑烷基和四氢叶酸。
术语被取代在这里指的是一个基团,通过它上面的任意氢原子的替换而被取代,替换的基团可以是例如,氯,溴,氟,碘,羟基,CN,烷基,烷氧基,用芳基取代的烷氧基,卤烷基,硫代烷基,氨基,烷基氨基,二烷基氨基,巯基,氮基,羧代醛基,羧基,烷氧基羰基,或者羧基酰胺基。任一取代基因可以是芳基,杂环芳基,或者杂环芳基。
显而易见,通式(1)中位置2,3,6,8,10,12,14和16的取代的性质至少最初是分别由组件9,8,7,6,5,4,3和2的AT催化结构域的特异性决定的。因为AT结构域可以是接受丙二酰基辅酶A,甲基丙二酰是辅酶A,乙基丙二酰基辅酶A(以及通常地,低级链烷基丙二酰基辅酶A),及羟基丙二酰基辅酶A,所以这个位置的任何一个取代基可以是氢,另一个也可以是氢,低级链烷基,特别是甲基和乙基,或者羟基。这个位置上的进一步的反应,例如环氧噻酮PKS组件8所催化的甲基转移酶活性,也可用于替换这个位置的氢。再者,氢和羟基可以通过被氧化成能够氧基(=O),或与邻近的环上碳脱氢形成π-健。如下面所讨论的,羟基(OH)和氧基都可以被衍生出来。
因此,可以合成各种基因R2,R6,R8,R10,R12,R14和R16。通式(1)中定义的取代基团有关的限定,反应了下面实施例8中SAR描述中所述的信息。
同样地,可以通过修饰环氧噻酮PKS基因簇,使之包含合适的序列,在相应的环氧噻酮基因簇的位置上含有或不含有活性KR,DH和/或ER结构域,从而方便地控制β-碳修饰(或者无修饰)。因此,可以合成得到大量的x5,x7,x9,x11和X13基因,包括相邻的环的位置上π-健的形成。
羟基占据的位置可以通过本领域中已知的方法转变为醚或者酯;也要求保护各位上的羟基不被衍生。再者,羟基可以转变为一个单独的基团,比如甲苯磺酰酯以及被氨基和卤取代基替换。如上面所讨论的,本领域已知有大量的“羟基衍生物”。
同样地,含有氧基团的环上的位置可以转变为“羰基衍生物”比如肟,聚酮等。氧部分最初的反应产物可进一步反应得到复杂的衍生物。如实施例8所述的,这种衍生物最终可产生连接两个环位置的环状取代基。
用于修饰最初合成的聚酮化合物的酶,例如转甲基酶,脱氢酶,氧化酶,糖基化酶等。当聚酮化合物在细胞内合成时,可以通过修饰宿主使之含有产生这些修饰酶的重组材料,从而由宿主细胞内源供应,或者以纯化的或者相对粗的提取物的形式,由无细胞体系提供。因此,例如,12-13位π-健的环氧化可以直接在体外使用epoK基因的蛋白产物来完成。
A的性质,可以如后面的实施例6所述,通过使用一种其中含有失活的组件1 NRPS(使用组件2底物)或KS2敲除(使用组件3底物)的环氧噻酮PKS,更方便地加以控制。可以通过改变装载组件的AT催化特异性来获得一定的改变;更多改变可以通过用不同特异性的NRPS或者用通常的PKS组件来替换组件1的NRPS来实现。然而目前,如实施例6所述,通过给合适改变的环氧噻酮PKS提供合成的组件2底物前体和组件3底物前体,可以更方便地制备可变异体。药物组合物
可以方便地配制化含物以提供本发明的药物组合物。本发明的药物组合物可以以例如,固体,半固体,或者液体形式的药物制剂的形式来使用。制剂含有一种或多种本发明的化合物作为活性成分,可适于外用,肠道内,或者胃肠外,给药的有机或无机填料或其成形剂成为混合物。活性成分可以与可使用的,无毒的,制药学上可接受的填料组成片剂,丸剂,胶囊剂,栓剂,阻道栓,溶液,乳剂,悬浮剂,以及其它的,任合一种适于使用的剂型。
可以使用的填料包括水,葡萄糖,乳糖,阿拉伯胶,明胶,甘露醇,淀粉糊,三硅酸镁,滑石粉,玉米淀粉,角蛋白,胶体硅,马铃薯淀粉,尿素,以及其它的固体,半固体,或液体形式的适用于药物制剂的填料。例如,本发明的化合物可以与羟丙基甲基纤维素一起使用,如美国专利号4,916,138所述,此处引入作为参考,或者与表面活性剂一起使用,如EPO专利公开号428,169所述,此处引入作为参考。
口服给药形式制剂的制备,可以如Hondo等所描述的制备,Hondo等,1987,Transplantion Proceedings(移植学报),XLX,supp 6:17-22此处引入作为参考。肠外给药的制剂的制备见EPO专利公开号423,714,此处引入作为参考。药物组合物中有足够量的活性化合物以产生所要的对疾病过程或症状的作用。
对于治疗由于感染,免疫系统障碍(或抑制免疫功能),癌症等疾病,本发明的化合物可以口服,外用,经肠道外给药,吸入以及直肠给药,其药物剂量的配方中含有常规的无毒的可接受的药物载体,辅助剂和赋形剂。本文术语“经肠道外”给药包括皮下注射,静脉,鞘内,肌肉内,胸骨内注射或者注入技术。
本发明的化合物的剂量水平按医嘱为大约每千克体重每天0.01mg到大约100mg,优选每千克体重每天0.1mg到大约50mg。这一剂量水平是用于治序上面所述症状的(假设一个70kg的病人,每个病人每天给药从大约0.7mg到大约3.5mg)。再者,本发明的化合物可以间隔给药,即,半周,每周,半月,或者每月间隔来给药。
制备单一剂量的活性成分与载体物质的组合量,根据要治序的宿主和特定的给药方式而变化。例如,用于人的口服给药的配方可以含有0.5mg到5mg的活性成份,与合适的传统量的载体物质组合,活性成分占总组分的量从大约5%到大约95%。剂量单位形式通常含有大约0.5mg到大约500mg的活性成分。对于外用药来说,本发明的化合物的配制在例如0.00001%到60%的重量范围内,优选地从0.001%到10%的重量范围内,最优选为大约0.005%到0.8%的重量范围。
然而,可以理解,任何特定病人的特定剂量水平依赖于各种因素。这些因素包括使用的化合物的活性;年龄,体重,总体健康状况,性别,和饮食;给药的时间和途径和药物排泄的速率;是否药物的组合被用于治疗;和所要治疗的特定疾病和症状的严重性。
以上提供了发明详述,下面给出了用于例证本发明的实施例,这些实施例不能认为是对本发明和权利要求的范围的限定。
                          实施例1
                粘粒克隆和它们的亚克隆的DNA测序
将产环氧噻酮的纤维堆囊粘细菌SMP44菌株培养在含纤维素的培养基上,见Bollng等人,1995 Cancer Reseorch(癌症研究)55:232-2333,此外引入作为参考,通过培养基上清的液相色谱一质谱(LC/MS)分析来证明环氧噻酮的产生。参考Jaoue等人,1992,plasmi(质粒)28:157-165所述的方法从这个菌株制备总DNA。为制备质粒文库,用Sau3AI部分酶切纤维堆囊粘菌基因组DNA,并与BamHI消化的pSupercos(Stratagen公司)连接。根据制造商的建议在λ噬菌体中包装DNA,然后用混合物感染大肠种菌XL1-Blue MR细胞。这一过程在LB-氨苄青霉素平板上,收获了大约3,000个分离的克隆。因为纤维堆囊粘菌基因组的大小估计为大约107核苷酸,现在3000个克隆中的插入片段对应于大约10个纤维堆囊粘菌基因组。
为了对文库进行筛选,两个KS结构域片段被用于设计PCR引物,而以纤维堆囊菌基因组DNA作为模板。得到的片段被用作筛选文库的探针。之所以选择这种方法是因为发现,从检测的超过12个PKS基因中,在检测的所有PKS结构域中K5结构域是最保守的(在氨基酸水平)。因此,希望得到的探针不仅探测环氧噻酮PKS基因,而且也探测存在于文库中的其它PKS基因簇。使用来自DEBS和Soraphen PKS基因序列酮合成酶(KS)结构域内的保守区而合成的两个简并寡核苷酸(使用简并核苷酸的标准命名法):CTSGTSKCSSTBCACCTSGCSTGC和TGAYRTGSGCGTTSGTSCCGSWGA。在使用该寡聚核苷酸作为引物和纤维堆纤维堆囊菌SMP44基因组DNA作为模板进行PCR后,在琼脂糖凝胶上可看到相应于预测大小的一个750bp的带。从胶上取下片段,克隆到pUC118的HincII位点(它是个pUC18的衍生物,带有制备单链DNA的插入序列)。在转化大肠杆菌后,分离和测序来自10个独立克隆的质粒DNA。分析显示9个单独的序列,每个都相应于PKS基因的KS结构的一个共同片段。九个中的三个与先前从这种生物分离的聚酮合成酶基因簇一样,从组件分析断定它们不属于环氧噻酮基因簇。剩下的6个KS片段被从载体上切下来,收集,末端用32P标记,并用作杂交探针,在高度严谨条件下与含有粘粒文库的克隆杂交。
筛选鉴定出15个能与收集的KS探针杂交的粘粒。从每个粘粒制备DNA,用NotI消化,在琼脂糖凝胶上分离,转移到硝酸纤维素膜上用收集的KS片段作为探针进行Southern杂交。结果显示,有两个粘粒不含有可与KS杂交的插入,有13个粘粒留待进一步分析。清除杂交印迹上的探针,用含有来自DEBS基因族组件4的烯醇还原酶相关的序列的探针,在低度严谨条件下进行杂交。因为预期环氧噻酮PKS基因簇编码两个有含ER结构域的两个连续的组件,并且因为不是所有的PKS基因簇都具有带ER结构域的组件,用ER探针进行杂交,预期可以鉴定出含有环氧噻酮PKS基因簇的插入DNA粘粒。两个粘粒被发现能与ER探针强烈杂交,一个中度杂交,一个微弱杂交。NotI片段限制性图谱的分析显示,这两个ER探针强烈杂交的粘粒相互重叠。使用T7和T3引物结合位点得到了13个粘粒中的每一个的核苷酸序列。所有得到的序列都显示出与PKS基因的同源性,来自可与ER探针强烈杂交的粘粒的序列显示出与NRP5,以特别是与NRPS腺苷化结构的同源性。因为据推断环氧噻酮的噻唑部分可能衍生自乙酸和半胱氨酸分子酰胺键的形成(以及随后的环化步骤),在同时含有ER结构域的NRPS结构域的存在支持了该粘粒可能含有整个或部分PKS基因簇的预测。
对12个余下的粘粒进行限制性分析显示,其中的三个可能是相互重叠的目的粘粒。为证明这一点,对四个粘粒的每一个的末端合成了寡核苷酸(通过上面所述的末端测序来确定的),并用作四个粘粒DNA中的若个PCR的引物组。非邻接的引物一模板反应中条带的出现,显示了这种重叠。这一实验结果证明两个粘粒与含有NRPS的粘粒重叠。三个粘粒的限制性图谱显示这三个粘粒实际上是重叠的。而且,因为PKS序列延伸到最后一个重叠片段的插入的末端,基于NRPS作图位于基因族的5′端的推断,结果也显示基因簇的3′端在已鉴定的克隆中没有被分离出来。
为分离环氧噻酮生物合成基因其余的片段,从含有推断的基因簇最靠近3′端区域的粘粒得到一个PCR片段。这个片段被用作探针检测,也是大约3000个克隆的新制备的纤维堆囊菌基因组DNA的粘粒文库。鉴定了几个杂交克隆,从它们中的六个制备了DNA。NotI消化片段的分析显示它们都含有重叠的区域。含有最大插入DNA并含有最短重叠的粘粒,被用来制备探针以作进一步的筛选分析。
制作的四个粘粒的限制性图谱,如图1所示。粘粒pKOS35-70.8A3的末端得到的序列与PKS序列或者任何相关的修饰酶,都显示无同源性。同样,来自粘粒pKOS35-79.85一个末端的序列也不含有与PKS区有关的序列。这些发现支持了环氧噻酮基因簇保存于由四个粘粒插入所组成的~70kb的区域内这一报告。
为对粘粒中的插入片段测序,从四个粘粒而来的每个NotI限制性片段都被克隆入可商业获得的pBluesoript质粒的NotI位点。最开始对每个克隆的末端进行测序。在获得完整的序列之前,序列分析的结果预测得到,这个PKS基因簇中有10个组件,一个装载结构域加上9个组件。
得到的完整的PKS序列如下。分离13个非重叠NotI片段中的每一个,并且HinPI进行部分消化。从琼脂糖凝胶回收~2到4kb长度的片段,并克隆到pUC118的AccI位点。从片段的文库中测序足够的克隆,以提供对每个片段至少四倍的覆盖。为测过NotI酶切位点,设计一套寡核苷酸,一个在位点的5′侧,另一个在3′侧,它们被用作引物,PCR扩增含有若个NotI位点的片段。用这种方法得到的每个片段被克隆和测序。
测得的核苷酸序列对应于一个约72kb的线性片段。分析显示它是一个带有一个装载结构域和9个组件的PKS基因簇。PKS序列的下游是一个可读框,被命名为epoK,它与细胞色素P450氧化酶基因显示出强的同源性,编码环氧噻酮过氧化酶。epoK下游的15kb的核苷酸序列也被测定:鉴定出一些另外的可读框,但是没有鉴定出一个与任何脱氧酶显示出同源性的可读框。epoL基因可能编码脱氧酶活性,但是这一活性也可能存在于环氧噻酮PKS的内部,或者被另外的一个基因所编码。
PKS基因被组织在6个可读框中。在多肽水平上,装载结构域和组件1,2和9显示为单独的多肽,它们的相应的基因被分别命名为epoA,epoB,epoC和epoF,组件3,4,5和6被包合在一条多肽中,它的基因被命名为epoD,而组件7和8在另一条多肽上,它的基因被命名为epoE。很清楚从可读框的间隔间可知,epoC,epoD,epoE和epoF构成了一个操纵子。epoA,epoB,和epoK基因可能是一个大的操纵子的一部分,但是具有一个启动子的epoB和epoC间有约100bp的间隔,epoF和epoK有大约115bp的间隔。本发明还提供了重组形式的基因间的序列。至少一个,但是有可能多于一个的启动子被用于表达所有的环氧噻酮基因。环氧噻酮PKS基因簇图示如下。
Figure A9981567800591
对于这些组件的详细的检测表明,它们的组织和组成与能用于环氧噻酮的生物合成是一致的。下面的描述是在多肽水平进行的。装载结构域和组件3,4,5和9中的AT结构域的序列显示出与丙二酰基装载结构域共有序列的相似性,这分别与C-14,C-12(环氧噻酮A和C),C-10和C-2上氢链,以及装载结构域的存在一致。组件2,6,7和8上AT结构域与甲基丙二酰基特异性的AT结构域的共有序列相似,又分别与C-16,C-8,C-6和C-4上甲基侧链的存在一致。
装载结构域含有一个KS结构域,其中通常是半胱氨酸残基存在的活性位点被酪氨酸所替代。这个结构域被称为KSY,并作为脱羧酶起作用,这是它的正常功能的一部分,但是不能作为缩聚酶起作用。因此,装载结构域可以期待装载丙二酰基辅A,移动它到ACP上,对它进行脱羧,以生成用于半胱氨酸缩聚的乙酰残基。
组件1,是一个非核糖体肽合成酶,它活化和催化与装载结构域上乙酸的缩聚反应。这个序列含有与ATP结合位点高度相似的片段和氨基酸活化所需的ATP酶结构域,一个磷酸泛酰巯基亚胺位点和一个延伸结构域。在数据库搜索中,组件1显示出与大量的以前鉴定出的肽合成酶有高度的相似性。
组件2决定了环氧噻酮C-15,C-17的结构。组件2 DH结构域的存在使分子中得到C16-17脱氢部分。组件3的结构域与环氧噻酮C-14和C-15的结构是一致的;羟基来源于组件乳糖化过程中所使用的KR活性。
组件4控制了C-12和C-13的结构,此处在环氧噻酮C和D中存在双键,这与DH结构域的存在是一致的,尽管AT结构域的序列显示出与特异性装载丙二酸盐的那些结构域一致,它也可以装载甲基丙二酸盐,因此是造成天然存在生物体发酵液中存在环氧噻酮混合物的部分原因。
一个与所期待功能明显的偏离存在于组件中。这个组件被期待含有DH结构或,因此能导致作为PKS结构的环氧噻酮C和D的合成。粗略分析显示组件4的AT和KR结构域之间的间隔大小不足以容纳一个有功能的DH结构域。因此,组件4进行的缩合形成β-酮后,酮的还原事件没有发生在组件4中。因为发现了C-12,13的不饱和(环氧噻酮C和D),因此必然存在另外的脱氢酶功能引导双键的形成,这一功能相信存在于PKS自身,或者存在于环氧噻酮生物合成基因簇中。
因此,脱氢酶的作用可以发生在聚酮化合物的合成过程中,或者是在环化发生后。在前面的例子中,每个共价链末端生长所形成的化合物是环氧噻酮C和D。如果C12,13脱氛是一个聚酮化合物后发生的,形成的酰基链在C-13的位置会有羟基基团,如下所示。在没有脱氢酶的情况下,或者在脱氢酶发生作用以前,环氧噻酮G和H被命名为13-羟基化合物。
Figure A9981567800601
组件5和6具有整套的还原结构域(KR,DH和ER)以形成C-11和C-9位的亚甲基。组件7和9具有KR结构域,以在C-7和C-3位生成羟基,而组件8不具有有功能的KR结构域,这与C-5上酮基的存在是一致的。组件8还含有一个甲基转移酶(MT)结构域,它导致C-4所存在的二甲基功能团。组件9含有硫酯酶结构域,它终止聚酮化合物的合成,催化环的封闭。环氧噻酮PKS的基因,蛋白质,组件和结构域简要在上文的表中。
序列分析揭示了epoA和epoB(装载结构域和组件1)以及epoC和epoD间的翻译偶联。在epoD和epoE以及epoE和epoF有非常小的间隔,而epoB,epoC,epoF和epoK间的间隔超过了100bp。这些基因间的区域可能含有启动子。序列分析的结果没有显示调节基因的存在,因此可能在纤维堆囊菌中环氧噻酮合成不受操终子特异性的调节。
环氧噻酮PKS和侧边序列收集在一个单一的重叠区中,显示如下:   1  TCGTGCGCGG  GCACGTCGAG  GCGTTTGCCG  ACTTCGGCGG  CGTCCCGCGC  GTGCTGCTCT61  ACGACAACCT  CAAGAACGCC  GTCGTCGAGC  GCCACGGCGA  CGCGATCCGG  TTCCACCCCA121  CGCTGCTGGC  TCTGTCGGCG  GATTACCGCT  TCGAGCCGCG  CCCCGTCGCC  GTCGCCCGCG181  GCAACGAGAA  GGGCCGCGTC  GAGCGCGCCA  TCCGCTACGT  CCGCGAGGGC  TTCTTCGAGG241  CCCGGGCCTA  CGCCGACCTC  GGAGACCTCA  ACCGCCAAGC  GACCGAGTGG  ACCAGCTCCG301  CGGCGCTCGA  TCGCTCCTGG  GTCGAGGACC  GCGCCCGCAC  CGTGCGTCAG  GCCTTCGACG361  ACGAGCGCAG  CGTGCTGCTG  CGACACCCTG  ACACACCGTT  TCCGGACCAC  GAGCGCGTCG421  AGGTCGAGGT  CGGAAAGACC  CCCTACGCGC  GCTTCGATCT  CAACGACTAC  TCGGTCCCCC481  ACGACCGGAC  GCGCCGCACG  CTGGTCGTCC  TCGCCGACCT  CAGTCAGGTA  CGCATCGCCG541  ACGGCAACCA  GATCGTCGCG  ACCCACGTCC  GTTCGTGGGA  CCGCGGCCAG  CAGATCGAGC601  AGCCCGAGCA  CCTCCAGCGC  CTGGTCGACG  AGAAGCGCCG  CGCCCGCGAG  CACCGCGGCC661  TTGATCGCCT  CGCGCGCGCC  GCCCGCAGCA  GCCAGGCATT  CCTGCGCATC  GTCGCCGAGC721  GCGGCGATAA  CGTCGGCAGC  GCGATCGCCC  GGCTTCTGCA  ACTGCTCGAC  GCCGTGGGCG781  CCGCCGAGCT  CGAAGAGGCC  CTGGTCGAGG  TGCTTGAGCG  CGACACCATC  CACATCGGTG841  CCGTCCGCCA  GGTGATCGAC  CGCCGCCGCT  CCGAGCGCCA  CCTGCCGCCT  CCAGTCTCAA901  TCCCCGTCAC  CCGCGGCGAG  CACGCCGCCC  TCGTCGTCAC  GCCGCATTCC  CTCACCACCT961  ACGACGCCCT  GAAGAAGGAC  CCGACGCCAT  GACCGACCTG  ACGCCCACCG  AGACCAAAGA1021  CCGGCTCAAG  AGCCTCGGCC  TCTTCGGCCT  GCTCGCCTGC  TGGGAGCAGC  TCGCCGACAA1081  GCCCTGGCTT  CGCGAGGTGC  TCGCCATCGA  GGAGCGCGAG  CGCCACAAGC  GCAGCCTCGA1141  ACGCCGCCTG  AAGAACTCCC  GCGTCGCCGC  CTTCAAGCCC  ATGACCGACT  TCGACTCGTC1201  CTGGCCCAAG  AAGATCGACC  GCGAGGCCGT  CGACGACCTC  TACGATAGCC  GCTACGCGGA1261  CCTGCTCTTC  GAGGTCGTCA  CCCGTCGCTA  CGACGCGCAG  AAGCCGCTCT  TGCTCAGCAC1321  GAACAAGGCA  TTCGCCGACT  GGGGCCAGGT  CTTCCCGCAC  GCCGCGTGCG  TCGTCACGCT1381  CGTCGACCGG  CTCGTGCACC  GCGCCGAGGT  GATCGAGATC  GAGGCCGAGA  GCTACCGGCT1441  GAAGGAAGCC  AAGGAGCTCA  ACGCCACCCG  CACCAAGCAG  CGCCGCACCA  AGAAGCACTG1501  AGCGGCATTT  TCACCGGTGA  ACTTCACCGA  AATCCCGCGT  GTTGCCGAGA  TCATCTACAG1561  GCGGATCGAG  ACCGTGCTCA  CGGCGTGGAC  GACATGGCGC  GGAAACGTCG  TCGTAACTGC1621  CCAGCAATGT  CATGGGAATG  GCCCCTTGAG  GGGCTGGCCG  GGGTCGACGA  TATCGCGCGA1681  TCTCCCCGTC  AATTCCCGAG  CGTAAAAGAA  AAATTTGTCA  TAGATCGTAA  GCTGTGCTAG1741  TGATCTGCCT  TACGTTACGT  CTTCCGCACC  TCGAGCGAAT  TCTCTCGGAT  AACTTTCAAG1801  TTTTCTGAGG  GGGCTTGGTC  TCTGGTTCCT  CAGGAAGCCT  GATCGGGACG  AGCTAATTCC1861  CATCCATTTT  TTTGAGACTC  TGCTCAAAGG  GATTAGACCG  AGTGAGACAG  TTCTTTTGCA1921  GTGAGCGAAG  AACCTGGGGC  TCGACCGGAG  GACGATCGAC  GTCCGCGAGC  GGGTCAGCCG1981  CTGAGGATGT  GCCCGTCGTG  GCGGATCGTC  CCATCGAGCG  CGCAGCCGAA  GATCCGATTG2041  CGATCGTCGG  AGCGGGCTGC  CGTCTGCCCG  GTGGCGTGAT  CGATCTGAGC  GGGTTCTGGA2101  CGCTCCTCGA  GGGCTCGCGC  GACACCGTCG  GGCAAGTCCC  CGCCGAACGC  TGGGATGCAG2161  CAGCGTGGTT  TGATCCCGAC  CTCGATGCCC  CGGGGAAGAC  GCCCGTTACG  CGCGCATCTT2221  TCCTGAGCGA  CGTAGCCTGG  TTCGACGCCT  CCTTCTTCGG  CATCTCGCCT  CGCGAAGCGC2281  TGCGGATGGA  CCCTGCACAT  CGACTCTTGC  TGGAGGTGTG  CTGGGAGGCG  CTGGAGAACG2341  CCGCGATCGC  TCCATCGGCG  CTCGTCGGTA  CGGAAACGGG  AGTGTTCATC  GGGATCGGCC2401  CGTCCGAATA  TGAGGCCGCG  CTGCCGCGAG  CGACGGCGTC  CGCAGAGATC  GACGCTCATG2461  GCGGGCTGGG  GACGATGCCC  AGCGTCGGAG  CGGGCCGAAT  CTCGTATGTC  CTCGGGCTGC2521  GAGGGCCGTG  TGTCGCGGTG  GATACGGCCT  ATTCGTCCTC  GCTCGTGGCC  GTTCATCTGG2581  CCTGTCAGAG  CTTGCGCTCC  GGGGAATGCT  CCACGGCCCT  GGCTGGTGGG  GTATCGCTGA2641  TGTTGTCGCC  GAGCACCCTC  GTGTGGCTCT  CGAAGACCCG  CGCGCTGGCC  ACGGACGGTC2701  GCTGCAAGGC  GTTTTCGGCG  GAGGCCGATG  GGTTCGGACG  AGGCGAAGGG  TGCGCCGTCG2761  TGGTCCTCAA  GCGGCTCAGT  GGAGCCCGCG  CGGACGGCGA  CCGGATATTG  GCGGTGATTC2821  GAGGATCCGC  GATCAATCAC  GACGGAGCGA  GCAGCGGTCT  GACCGTGCCG  AACGGGAGCT2881  CCCAAGAAAT  CGTGCTGAAA  CGGGCCCTGG  CGGACGCAGG  CTGCGCCGCG  TCTTCGGTGG2941  GTTATGTCGA  GGCACACGGC  ACGGGCACGA  CGCTTGGTGA  CCCCATCGAA  ATCCAAGCTC3001  TGAATGCGGT  ATACGGCCTC  CGGCGAGACG  TCGCCACGCC  GCTGCTGATC  GGGTCGGTGA3061  AGACCAACCT  TGGCCATCCT  GAGTATGCGT  CGGGGATCAC  TGGGCTGCTG  AAGGTCGTCT3121  TGTCCCTTCA  GCACGGGCAG  ATTCCTGCGC  ACCTCCACGC  GCAGGCGCTG  AACCCCCGGA3181  TCTCATGGGG  TGATCTTCGG  CTGACCGTCA  CGCGCGCCCG  GACACCGTGG  CCGGACTGGA3241  ATACGCCGCG  ACGGGCGGGG  GTGAGCTCGT  TCGGCATGAG  CGGGACCAAC  GCGCACGTGG3301  TGCTGGAAGA  GGCGCCGGCG  GCGACGTGCA  CACCGCCGGC  GCCGGAGCGG  CCGGCAGAGC3361  TGCTGGTGCT  GTCGGCAAGG  ACCGCGGCAG  CCTTGGATGC  ACACGCGGCG  CGGCTGCGCG3421  ACCATCTGGA  GACCTACCCT  TCGCAGTGTC  TGGGCGATGT  GGCGTTCAGT  CTGGCGACGA3481  CGCGCAGCGC  GATGGAGCAC  CGGCTCGCGG  TGGCGGCGAC  GTCGAGCGAG  GGGCTGCGGG3541  CAGCCCTGGA  CGCTGCGGCG  CAGGGACAGA  CGCCGCCCGG  TGTGGTGCGC  GGTATCGCCG3601  ATTCCTCACG  CGGCAAGCTC  GCCTTTCTCT  TCACCGGACA  GGGGGCGCAG  ACGCTGGGCA3661  TGGGCCGTGG  GCTGTATGAT  GTATGGCCCG  CGTTCCGCGA  GGCGTTCGAC  CTGTGCGTGA3721  GGCTGTTCAA  CCAGGAGCTC  GACCGGCCGC  TCCGCGAGGT  GATGTGGGCC  GAACCGGCCA3781  GCGTCGACGC  CGCGCTGCTC  GACCAGACAG  CCTTTACCCA  GCCGGCGCTG  TTCACCTTCG3841  AGTATGCGCT  CGCCGCGCTG  TGGCGGTCGT  GGGGCGTAGA  GCCGGAGTTG  GTCGCTGGCC3901  ATAGCATCGG  TGAGCTGGTG  GCTGCCTGCG  TGGCGGGCGT  GTTCTCGCTT  GAGGACGCGG3961  TGTTCCTGGT  GGCTGCGCGC  GGGCGCCTGA  TGCAGGCGCT  GCCGGCCGGC  GGGGCGATGG4021  TGTCGATCGC  GGCGCCGGAG  GCCGATGTGG  CTGCTGCGGT  GGCGCCGCAC  GCAGCGTCGG4081  TGTCGATCGC  CGCGGTCAAC  GGTCCGGACC  AGGTGGTCAT  CGCGGGCGCC  GGGCAACCCG4141  TGCATGCGAT  CGCGGCGGCG  ATGGCCGCGC  GCGGGGCGCG  AACCAAGGCG  CTCCACGTCT4201  CGCATGCGTT  CCACTCACCG  CTCATGGCCC  CGATGCTGGA  GGCGTTCGGG  CGTGTGGCCG4261  AGTCGGTGAG  CTACCGGCGG  CCGTCGATCG  TCCTGGTCAG  CAATCTGAGC  GGGAAGGCTG4321  GCACAGACGA  GGTGAGCTCG  CCGGGCTATT  GGGTGCGCCA  CGCGCGAGAG  GTGGTGCGCT4381  TCGCGGATGG  AGTGAAGGCG  CTGCACGCGG  CCGGTGCGGG  CACCTTCGTC  GAGGTCGGTC4441  CGAAATCGAC  GCTGCTCGGC  CTGGTGCCTG  CCTGCCTGCC  GGACGCCCGG  CCGGCGCTGC4501  TCGCATCGTC  GCGCGCTGGG  CGTGACGAGC  CAGCGACCGT  GCTCGAGGCG  CTCGGCGGGC4561  TCTGGGCCGT  CGGTGGCCTG  GTCTCCTGGG  CCGGCCTCTT  CCCCTCAGGG  GGGCGGCGGG4621  TGCCGCTGCC  CACGTACCCT  TGGCAGCGCG  AGCGCTACTG  GATCGACACG  AAAGCCGACG4681  ACGCGGCGCG  TGGCGACCGC  CGTGCTCCGG  GAGCGGGTCA  CGACGAGGTC  GAGAAGGGGG4741  GCGCGGTGCG  CGGCGGCGAC  CGGCGCAGCG  CTCGGCTCGA  CCATCCGCCG  CCCGAGAGCG4801  GACGCCGGGA  GAAGGTCGAG  GCCGCCGGCG  ACCGTCCGTT  CCGGCTCGAG  ATCGATGAGC4861  CAGGCGTGCT  CGATCGCCTG  GTGCTTCGGG  TCACGGAGCG  GCGCGCCCCT  GGTCTTGGCG4921  AGGTCGAGAT  CGCCGTCGAC  GCGGCGGGGC  TCAGCTTCAA  TGATGTCCAG  CTCGCGCTGG4981  GCATGGTGCC  CGACGACCTG  CCGGGAAAGC  CCAACCCTCC  GCTGCTGCTC  GGAGGCGAGT5041  GCGCCGGGCG  CATCGTCGCC  GTGGGCGAGG  GCGTGAACGG  CCTTGTGGTG  GGCCAACCGG5101  TCATCGCCCT  TTCGGCGGGA  GCGTTTGCTA  CCCACGTCAC  CACGTCGGCT  GCGCTGGTGC5161  TGCCTCGGCC  TCAGGCGCTC  TCGGCGACCG  AGGCGGCCGC  CATGCCCGTC  GCGTACCTGA5221  CGGCATGGTA  CGCGCTCGAC  GGAATAGCCC  GCCTTCAGCC  GGGGGAGCGG  GTGCTGATCC5281  ACGCGGCGAC  CGGCGGGGTC  GGTCTCGCCG  CGGTGCAGTG  GGCGCAGCAC  GTGGGAGCCG5341  AGGTCCATGC  GACGGCCGGC  ACGCCCGAGA  AGCGCGCCTA  CCTGGAGTCG  CTGGGCGTGC5401  GGTATGTGAG  CGATTCCCGC  TCGGACCGGT  TCGTCGCCGA  CGTGCGCGCG  TGGACGGGCG5461  GCGAGGGAGT  AGACGTCGTG  CTCAACTCGC  TTTCGGGCGA  GCTGATCGAC  AAGAGTTTCA5521  ATCTCCTGCG  ATCGCACGGC  CGGTTTGTGG  AGCTCGGCAA  GCGCGACTGT  TACGCGGATA5581  ACCAGCTCGG  GCTGCGGCCG  TTCCTGCGCA  ATCTCTCCTT  CTCGCTGGTG  GATCTCCGGG5641  GGATGATGCT  CGAGCGGCCG  GCGCGGGTCC  GTGCGCTCTT  CGAGGAGCTC  CTCGGCCTGA5701  TCGCGGCAGG  CGTGTTCACC  CCTCCCCCCA  TCGCGACGCT  CCCGATCGCT  CGTGTCGCCG5761  ATGCGTTCCG  GAGCATGGCG  CAGGCGCAGC  ATCTTGGGAA  GCTCGTACTC  ACGCTGGGTG5821  ACCCGGAGGT  CCAGATCCGT  ATTCCGACCC  ACGCAGGCGC  CGGCCCGTCC  ACCGGGGATC5881  GGGATCTGCT  CGACAGGCTC  GCGTCAGCTG  CGCCGGCCGC  GCGCGCGGCG  GCGCTGGAGG5941  CGTTCCTCCG  TACGCAGGTC  TCGCAGGTGC  TGCGCACGCC  CGAAATCAAG  GTCGGCGCGG6001  AGGCGCTGTT  CACCCGCCTC  GGCATGGACT  CGCTCATGGC  CGTGGAGCTG  CGCAATCGTA6061  TCGAGGCGAG  CCTCAAGCTG  AAGCTGTCGA  CGACGTTCCT  GTCCACGTCC  CCCAATATCG6121  CCTTGTTGAC  CCAAAACCTG  TTGGATGCTC  TCGCCACAGC  TCTCTCCTTG  GAGCGGGTGG6181  CGGCGGAGAA  CCTACGGGCA  GGCGTGCAAA  GCGACTTCGT  CTCATCGGGC  GCAGATCAAG6241  ACTGGGAAAT  CATTGCCCTA  TGACGATCAA  TCAGCTTCTG  AACGAGCTCG  AGCACCAGGG6301  TGTCAAGCTG  GCGGCCGATG  GGGAGCGCCT  CCAGATACAG  GCCCCCAAGA  ACGCCCTGAA6361  CCCGAACCTG  CTCGCTCGAA  TCTCCGAGCA  CAAAAGCACG  ATCCTGACGA  TGCTCCGTCA6421  GAGACTCCCC  GCAGAGTCCA  TCGTGCCCGC  CCCAGCCGAG  CGGCACGTTC  CGTTTCCTCT6481  CACAGACATC  CAAGGATCCT  ACTGGCTGGG  TCGGACAGGA  GCGTTTACGG  TCCCCAGCGG6541  GATCCACGCC  TATCGCGAAT  ACGACTGTAC  GGATCTCGAC  GTGGCGAGGC  TGAGCCGCGC6601  CTTTCGGAAA  GTCGTCGCGC  GGCACGACAT  GCTTCGGGCC  CACACGCTGC  CCGACATGAT6661  GCAGGTGATC  GAGCCTAAAG  TCGACGCCGA  CATCGAGATC  ATCGATCTGC  GCGGGCTCGA6721  CCGGAGCACA  CGGGAAGCGA  GGCTCGTATC  GTTGCGAGAT  GCGATGTCGC  ACCGCATCTA6781  TGACACCGAG  CGCCCTCCGC  TCTATCACGT  CGTCGCCGTT  CGGCTGGACG  AGCAGCAAAC6841  CCGTCTCGTG  CTCAGTATCG  ATCTCATTAA  CGTTGACCTA  GGCAGCCTGT  CCATCATCTT 6901  CAAGGATTGG  CTCAGCTTCT  ACGAAGATCC  CGAGACCTCT  CTCCCTGTCC  TGGAGCTCTC6961  GTACCGCGAC  TATGTGCTCG  CGCTGGAGTC  TCGCAAGAAG  TCTGAGGCGC  ATCAACGATC7021  GATGGATTAC  TGGAAGCGGC  GCGTCGCCGA  GCTCCCACCT  CCGCCGATGC  TTCCGATGAA7081  GGCCGATCCA  TCTACCCTGA  GGGAGATCCG  CTTCCGGCAC  ACGGAGCAAT  GGCTGCCGTC7141  GGACTCCTGG  AGTCGATTGA  AGCAGCGTGT  CGGGGAGCGC  GGGCTGACCC  CGACGGGCGT7201  CATTCTGGCT  GCATTTTCCG  AGGTGATCGG  GCGCTGGAGC  GCGAGCCCCC  GGTTTACGCT7261  CAACATAACG  CTCTTCAACC  GGCTCCCCGT  CCATCCGCGC  GTGAACGATA  TCACCGGGGA7321  CTTCACGTCG  ATGGTCCTCC  TGGACATCGA  CACCACTCGC  GACAAGAGCT  TCGAACAGCG7381  CGCTAAGCGT  ATTCAAGAGC  AGCTGTGGGA  AGCGATGGAT  CACTGCGACG  TAAGCGGTAT7441  CGAGGTCCAG  CGAGAGGCCG  CCCGGGTCCT  GGGGATCCAA  CGAGGCGCAT  TGTTCCCCGT7501  GGTGCTCACG  AGCGCGCTCA  ACCAGCAAGT  CGTTGGTGTC  ACCTCGCTGC  AGAGGCTCGG7561  CACTCCGGTG  TACACCAGCA  CGCAGACTCC  TCAGCTGCTG  CTGGATCATC  AGCTCTACGA7621  GCACGATGGG  GACCTCGTCC  TCGCGTGGGA  CATCGTCGAC  GGAGTGTTCC  CGCCCGACCT7681  TCTGGACGAC  ATGCTCGAAG  CGTACGTCGC  TTTTCTCCGG  CGGCTCACTG  AGGAACCATG7741  GAGTGAACAG  ATGCGCTGTT  CGCTTCCGCC  TGCCCAGCTA  GAAGCGCGGG  CGAGCGCAAA7801  CGAGACCAAC  TCGCTGCTGA  GCGAGCATAC  GCTGCACGGC  CTGTTCGCGG  CGCGGGTCGA7861  GCAGCTGCCT  ATGCAGCTCG  CCGTGGTGTC  GGCGCGCAAG  ACGCTCACGT  ACGAAGAGCT7921  TTCGCGCCGT  TCGCGGCGAC  TTGGCGCGCG  GCTGCGCGAG  CAGGGGGCAC  GCCCGAACAC7981  ATTGGTCGCG  GTGGTGATGG  AGAAAGGCTG  GGAGCAGGTT  GTCGCGGTTC  TCGCGGTGCT8041  CGAGTCAGGC  GCGGCCTACG  TGCCGATCGA  TGCCGACCTA  CCGGCGGAGC  GTATCCACTA8101  CCTCCTCGAT  CATGGTGAGG  TAAAGCTCGT  GCTGACGCAG  CCATGGCTGG  ATGGCAAACT8161  GTCATGGCCG  CCGGGGATCC  AGCGGCTGCT  CGTGAGCGAT  GCCGGCGTCG  AAGGCGACGG8221  CGACCAGCTT  CCGATGATGC  CCATTCAGAC  ACCTTCGGAT  CTCGCGTATG  TCATCTACAC8281  CTCGGGATCC  ACAGGGTTGC  CCAAGGGGGT  GATGATCGAT  CATCGGGGTG  CCGTCAACAC8341  CATCCTGGAC  ATCAACGAGC  GCTTCGAAAT  AGGGCCCGGA  GACAGAGTGC  TGGCGCTCTC8401  CTCGCTGAGC  TTCGATCTCT  CGGTCTACGA  TGTGTTCGGG  ATCCTGGCGG  CGGGCGGTAC8461  GATCGTGGTG  CCGGACGCGT  CCAAGCTGCG  CGATCCGGCG  CATTGGGCAG  CGTTGATCGA8521  ACGAGAGAAG  GTGACGGTGT  GGAACTCGGT  GCCGGCGCTG  ATGCGGATGC  TCGTCGAGCA8581  TTCCGAGGGT  CGCCCCGATT  CGCTCGCTAG  GTCTCTGCGG  CTTTCGCTGC  TGAGCGGCGA8641  CTGGATCCCG  GTGGGCCTGC  CTGGCGAGCT  CCAGGCCATC  AGGCCCGGCG  TGTCGGTGAT8701  CAGCCTGGGC  GGGGCCACCG  AAGCGTCGAT  CTGGTCCATC  GGGTACCCCG  TGAGGAACGT8761  CGATCCATCG  TGGGCGAGCA  TCCCCTACGG  CCGTCCGCTG  CGCAACCAGA  CGTTCCACGT8821  GCTCGATGAG  GCGCTCGAAC  CGCGCCCGGT  CTGGGTTCCG  GGGCAACTCT  ACATTGGCGG8881  GGTCGGACTG  GCACTGGGCT  ACTGGCGCGA  TGAAGAGAAG  ACGCGCAACA  GCTTCCTCGT8941  GCACCCCGAG  ACCGGGGAGC  GCCTCTACAA  GACCGGCGAT  CTGGGCCGCT  ACCTGCCCGA9001  TGGAAACATC  GAGTTCATGG  GGCGGGAGGA  CAACCAAATC  AAGCTTCGCG  GATACCGCGT9061  TGAGCTCGGG  GAAATCGAGG  AAACGCTCAA  GTCGCATCCG  AACGTACGCG  ACGCGGTGAT9121  TGTGCCCGTC  GGGAACGACG  CGGCGAACAA  GCTCCTTCTA  GCCTATGTGG  TCCCGGAAGG9181  CACACGGAGA  CGCGCTGCCG  AGCAGGACGC  GAGCCTCAAG  ACCGAGCGGG  TCGACGCGAG9241  AGCACACGCC  GCCAAAGCGG  ACGGATTGAG  CGACGGCGAG  AGGGTGCAGT  TCAAGCTCGC9301  TCGACACGGA  CTCCGGAGGG  ATCTGGACGG  AAAGCCCGTC  GTCGATCTGA  CCGGGCTGGT9361  TCCGCGGGAG  GCGGGGCTGG  ACGTCTACGC  GCGTCGCCGT  AGCGTCCGAA  CGTTCCTCGA9421  GGCCCCGATT  CCATTTGTTG  AATTCGGCCG  ATTCCTGAGC  TGCCTGAGCA  GCGTGGAGCC9481  CGACGGCGCG  GCCCTTCCCA  AATTCCGTTA  TCCATCGGCT  GGCAGCACGT  ACCCGGTGCA9541  AACCTACGCG  TACGCCAAAT  CCGGCCGCAT  CGAGGGCGTG  GACGAGGGCT  TCTATTATTA9601  CCACCCGTTC  GAGCACCGTT  TGCTGAAGGT  CTCCGATCAC  GGGATCGAGC  GCGGAGCGCA9661  CGTTCCGCAA  AACTTCGACG  TGTTCGATGA  AGCGGCGTTC  GGCCTCCTGT  TCGTGGGCAG9721  GATCGATGCC  ATCGAGTCGC  TGTATGGATC  GTTGTCACGA  GAATTCTGCC  TGCTGGAGGC9781  CGGATATATG  GCGCAGCTCC  TGATGGAGCA  GGCGCCTTCC  TGCAACATCG  GCGTCTGTCC9841  GGTGGGTCAA  TTCGATTTTG  AACAGGTTCG  GCCGGTTCTC  GACCTGCGGC  ATTCGGACGT9901  TTACGTGCAC  GGCATGCTGG  GCGGGCGGGT  AGACCCGCGG  CAGTTCCAGG  TCTGTACGCT9961  CGGTCAGGAT  TCCTCACCGA  GGCGCGCCAC  GACGCGCGGC  GCCCCTCCCG  GCCGCGATCA10021  GCACTTCGCC  GATATCCTTC  GCGACTTCTT  GAGGACCAAA  CTACCCGAGT  ACATGGTGCC10081  TACAGTCTTC  GTGGAGCTCG  ATGCGTTGCC  GCTGACGTCC  AACGGCAAGG  TCGATCGTAA10141  GGCCCTGCGC  GAGCGGAAGG  ATACCTCGTC  GCCGCGGCAT  TCGGGGCACA  CGGCGCCACG10201  GGACGCCTTG  GAGGAGATCC  TCGTTGCGGT  CGTACGGGAG  GTGCTCGGGC  TGGAGGTGGT10261  TGGGCTCCAG  CAGAGCTTCG  TCGATCTTGG  TGCGACATCG  ATTCACATCG  TTCGCATGAG10321  GAGTCTGTTG  CAGAAGAGGC  TGGATAGGGA  GATCGCCATC  ACCGAGTTGT  TCCAGTACCC10381  GAACCTCGGC  TCGCTGGCGT  CCGGTTTGCG  CCGAGACTCG  AAAGATCTAG  AGCAGCGGCC10441  GAACATGCAG  GACCGAGTGG  AGGCTCGGCG  CAAGGGCAGG  AGACGTAGCT  AAGAGCGCCG10501  AACAAAACCA  GGCCGAGCGG  GCCAATGAAC  CGCAAGCCCG  CCTGCGTCAC  CCTGGGACTC10561  ATCTGATCTG  ATCGCGGGTA  CGCGTCGCGG  GTGTGCGCGT  TGAGCCGTGT  TGCTCGAACG10621  CTGAGGAACG  GTGAGCTCAT  GGAAGAACAA  GAGTCCTCCG  CTATCGCAGT  CATCGGCATG10681  TCGGGCCGTT  TTCCGGGGGC  GCGGGATCTG  GACGAATTCT  GGAGGAACCT  TCGAGACGGC10741  ACGGAGGCCG  TGCAGCGCTT  CTCCGAGCAG  GAGCTCGCGG  CGTCCGGAGT  CGACCCAGCG10801  CTGGTGCTGG  ACCCGAACTA  CGTCCGGGCG  GGCAGCGTGC  TGGAAGATGT  CGACCGGTTC10861  GACGCTGCTT  TCTTCGGCAT  CAGCCCGCGC  GAGGCAGAGC  TCATGGATCC  GCAGCACCGC10921  ATCTTCATGG  AATGCGCCTG  GGAGGCGCTG  GAGAACGCCG  GATACGACCC  GACAGCCTAC10981  GAGGGCTCTA  TCGGCGTGTA  CGCCGGCGCC  AACATGAGCT  CGTACTTGAC  GTCGAACCTC11041  CACGAGCACC  CAGCGATGAT  GCGGTGGCCC  GGCTGGTTTC  AGACGTTGAT  CGGCAACGAC11101  AAGGATTACC  TCGCGACCCA  CGTCTCCTAC  AGGCTGAATC  TGAGAGGGCC  GAGCATCTCC11161  GTTCAAACTG  CCTGCTCTAC  CTCGCTCGTG  GCGGTTCACT  TGGCGTGCAT  GAGCCTCCTG11221  GACCGCGAGT  GCGACATGGC  GCTGGCCGGC  GGGATTACCG  TCCGGATCCC  CCATCGAGCC11281  GGCTATGTAT  ATGCTGAGGG  GGGCATCTTC  TCTCCCGACG  GCCATTGCCG  GGCCTTCGAC11341  GCCAAGGCGA  ACGGCACGAT  CATGGGCAAC  GGCTGCGGGG  TTGTCCTCCT  GAAGCCGCTG11401  GACCGGGCGC  TCTCCGATGG  TGATCCCGTC  CGCGCGGTCA  TCCTTGGGTC  TGCCACAAAC11461  AACGACGGAG  CGAGGAAGAT  CGGGTTCACT  GCGCCCAGTG  AGGTGGGCCA  GGCGCAAGCG11521  ATCATGGAGG  CGCTGGCGCT  GGCAGGGGTC  GAGGCCCGGT  CCATCCAATA  CATCGAGACC11581  CACGGGACCG  GCACGCTGCT  CGGAGACGCC  ATCGAGACGG  CGGCGTTGCG  GCGGGTGTTC11641  GATCGCGACG  CTTCGACCCG  GAGGTCTTGC  GCGATCGGCT  CCGTGAAGAC  CGGCATCGGA11701  CACCTCGAAT  CGGCGGCTGG  CATCGCCGGT  TTGATCAAGA  CGGTCTTGGC  GCTGGAGCAC11761  CGGCAGCTGC  CGCCCAGCCT  GAACTTCGAG  TCTCCTAACC  CATCGATCGA  TTTCGCGAGC11821  AGCCCGTTCT  ACGTCAATAC  CTCTCTTAAG  GATTGGAATA  CCGGCTCGAC  TCCGCGGCGG11881  GCCGGCGTCA  GCTCGTTCGG  GATCGGCGGC  ACCAACGCCC  ATGTCGTGCT  GGAGGAAGCA11941  CCCGCGGCGA  AGCTTCCAGC  CGCGGCGCCG  GCGCGCTCTG  CCGAGCTCTT  CGTCGTCTCG12001  GCCAAGAGCG  CAGCGGCGCT  GGATGCCGCG  GCGGCACGGC  TACGAGATCA  TCTGCAGGCG12061  CACCAGGGGC  TTTCGTTGGG  CGACGTCGCC  TTCAGCCTGG  CGACGACGCG  CAGTCCCATG12121  GAGCACCGGC  TCGCGATGGC  GGCACCGTCG  CGCGAGGCGT  TGCGAGAGGG  GCTCGACGCA12181  GCGGCGCGAG  GCCAGACCCC  GCCGGGCGCC  GTGCGTGGCC  GCTGCTCCCC  AGGCAACGTG12241  CCGAAGGTGG  TCTTCGTCTT  TCCCGGCCAG  GGCTCTCAGT  GGGTCGGTAT  GGGCCGTCAG12301  CTCCTGGCTG  AGGAACCCGT  CTTCCACGCG  GCGCTTTCGG  CGTGCGACCG  GGCCATCCAG12361  GCCGAAGCTG  GTTGGTCGCT  GCTCGCCGAG  CTCGCCGCCG  ACGAAGGGTC  GTCCCAGATC12421  GAGCGCATCG  ACGTGGTGCA  GCCGGTGCTG  TTCGCGCTCG  CGGTGGCATT  TGCGGCGCTG12481  TGGCGGTCGT  GGGGTGTCGG  GCCCGACGTC  GTGATCGGCC  ACAGCATGGG  CGAGGTAGCC12541  GCCGCGCATG  TGGCCGGGGC  GCTGTCGCTC  GAGGATGCGG  TGGCGATCAT  CTGCCGGCGC12601  AGCCGGCTGC  TCCGGCGCAT  CAGCGGTCAG  GGCGAGATGG  CGGTGACCGA  GCTGTCGCTG12661  GCCGAGGCCG  AGGCAGCGCT  CCGAGGCTAC  GAGGATCGGG  TGAGCGTGGC  CGTGAGCAAC12721  AGCCCGCGCT  CGACGGTGCT  CTCGGGCGAG  CCGGCAGCGA  TCGGCGAGGT  GCTGTCGTCC12781  CTGAACGCGA  AGGGGGTGTT  CTGCCGTCGG  GTGAAGGTGG  ATGTCGCCAG  CCACAGCCCG12841  CAGGTCGACC  CGCTGCGCGA  GGACCTCTTG  GCAGCGCTGG  GCGGGCTCCG  GCCGCGTGCG12901  GCTGCGGTGC  CGATGCGCTC  GACGGTGACG  GGCGCCATGG  TAGCGGGCCC  GGAGCTCGGA12961  GCGAATTACT  GGATGAACAA  TCTCAGGCAG  CCTGTGCGCT  TCGCCGAGGT  AGTCCAGGCG13021  CAGCTCCAAG  GCGGCCACGG  TCTGTTCGTG  GAGATGAGCC  CGCATCCGAT  CCTAACGACT13081  TCGGTCGAGG  AGATGCGGCG  CGCGGCCCAG  CGGGCGGGCG  CAGCGGTGGG  CTCGCTGCGG13141  CGAGGGCAGG  ACGAGCGCCC  GGCGATGCTG  GAGGCGCTGG  GCGCGCTGTG  GGCGCAGGGC13201  TACCCTGTAC  CCTGGGGGCG  GCTGTTTCCC  GCGGGGGGGC  GGCGGGTACC  GCTGCCGACC13261  TATCCCTGGC  AGCGCGAGCG  GTACTGGATC  GAAGCGCCGG  CCAAGAGCGC  CGCGGGCGAT13321  CGCCGCGGCG  TGCGTGCGGG  CGGTCACCCG  CTCCTCGGTG  AAATGCAGAC  CCTATCAACC13381  CAGACGAGCA  CGCGGCTGTG  GGAGACGACG  CTGGATCTCA  AGCGGCTGCC  GTGGCTCGGC13441  GACCACCGGG  TGCAGGGAGC  GGTCGTGTTT  CCGGGCGCGG  CGTACCTGGA  GATGGCGATT13501  TCGTCGGGGG  CCGAGGCTTT  GGGCGATGGC  CCATTGCAGA  TAACCGACGT  GGTGCTCGCC13561  GAGGCGCTGG  CCTTCGCGGG  CGACGCGGCG  GTGTTGGTCC  AGGTGGTGAC  GACGGAGCAG13621  CCGTCGGGAC  GGCTGCAGTT  CCAGATCGCG  AGCCGGGCGC  CGGGCGCTGG  CCACGCGTCC13681  TTCCGGGTCC  ACGCTCGCGG  CGCGTTGCTC  CGAGTGGAGC  GCACCGAGGT  CCCGGCTGGG13741  CTTACGCTTT  CCGCCGTGCG  CGCACGGCTC  CAGGCCAGCA  TGCCCGCCGC  GGCCACCTAC13801  GCGGAGCTGA  CCGAGATGGG  GCTGCAGTAC  GGCCCTGCCT  TCCAGGGGAT  TGCTGAGCTA13861  TGGCGCGGTG  AGGGCGAGGC  GCTGGGACGG  GTACGCCTGC  CCGACGCGGC  CGGCTCGGCA13921  GCGGAGTATC  GGTTGCATCC  TGCGCTGCTG  GACGCGTGCT  TCCAGGTCGT  CGGCAGCCTC13981  TTCGCCGGCG  GTGGCGAGGC  GACGCCGTGG  GTGCCCGTGG  AAGTGGGCTC  GCTGCGGCTC14041  TTGCAGCGGC  CTTCGGGGGA  GCTGTGGTGC  CATGCGCGCG  TCGTGAACCA  CGGGCGCCAA14101  ACCCCCGATC  GGCAGGGCGC  CGACTTTTGG  GTGGTCGACA  GCTCGGGTGC  AGTGGTCGCC14161  GAAGTCAGCG  GGCTCGTGGC  GCAGCGGCTT  CCGGGAGGGG  TGCGCCGGCG  CGAAGAAGAC14221  GATTGGTTCC  TGGAGCTCGA  GTGGGAACCC  GCAGCGGTCG  GCACAGCCAA  GGTCAACGCG14281  GGCCGGTGGC  TGCTCCTCGG  CGGCGGCGGT  GGGCTCGGCG  CCGCGTTGCG  CTCGATGCTG14341  GAGGCCGGCG  GCCATGCCGT  CGTCCATGCG  GCAGAGAGCA  ACACGAGCGC  TGCCGGCGTA14401  CGCGCGCTCC  TGGCAAAGGC  CTTTGACGGC  CAGGCTCCGA  CGGCGGTGGT  GCACCTCGGC14461  AGCCTCGATG  GGGGTGGCGA  GCTCGACCCA  GGGCTCGGGG  CGCAAGGCGC  ATTGGACGCG14521  CCCCGGAGCG  CCGACGTCAG  TCCCGATGCC  CTCGATCCGG  CGCTGGTACG  TGGCTGTGAC14581  AGCGTGCTCT  GGACCGTGCA  GGCCCTGGCC  GGCATGGGCT  TTCGAGACGC  CCCGCGATTG14641  TGGCTTCTGA  CCCGCGGCGC  ACAGGCCGTC  GGCGCCGGCG  ACGTCTCCGT  GACACAGGCA14701  CCGCTGCTGG  GGCTGGGCCG  CGTCATCGCC  ATGGAGCACG  CGGATCTGCG  CTGCGCTCGG14761  GTCGACCTCG  ATCCGACCCG  GCCCGATGGG  GAGCTCGGTG  CCCTGCTGGC  CGAGCTGCTG14821  GCCGACGACG  CCGAAGCGGA  AGTCGCGTTG  CGCGGTGGCG  AGCGATGCGT  CGCTCGGATC14881  GTCCGCCGGC  AGCCCGAGAC  CCGGCCCCGG  GGGAGGATCG  AGAGCTGCGT  TCCGACCGAC14941  GTCACCATCC  GCGCGGACAG  CACCTACCTT  GTGACCGGCG  GTCTGGGTGG  GCTCGGTCTG15001  AGCGTGGCCG  GATGGCTGGC  CGAGCGCGGC  GCTGGTCACC  TGGTGCTGGT  GGGCCGCTCC15061  GGCGCGGCGA  GCGTGGAGCA  ACGGGCAGCC  GTCGCGGCGC  TCGAGGCCCG  CGGCGCGCGC15121  GTCACCGTGG  CGAAGGCAGA  TGTCGCCGAT  CGGGCGCAGC  TCGAGCGGAT  CCTCCGCGAG15181  GTTACCACGT  CGGGGATGCC  GCTGCGGGGC  GTCGTCCATG  CGGCCGGCAT  CTTGGACGAC15241  GGGCTGCTGA  TGCAGCAGAC  TCCCGCGCGG  TTTCGTAAGG  TGATGGCGCC  CAAGGTCCAG15301  GGGGCCTTGC  ACCTGCACGC  GTTGACGCGC  GAAGCGCCGC  TTTCCTTCTT  CGTGCTGTAC15361  GCTTCGGGAG  TAGGGCTCTT  GGGCTCGCCG  GGCCAGGGCA  ACTACGCCGC  GGCCAACACG15421  TTCCTCGACG  CTCTGGCGCA  CCACCGGAGG  GCGCAGGGGC  TGCCAGCGTT  GAGCGTCGAC15481  TGGGGCCTGT  TCGCGGAGGT  GGGCATGGCG  GCCGCGCAGG  AAGATCGCGG  CGCGCGGCTG15541  GTCTCCCGCG  GAATGCGGAG  CCTCACCCCC  GACGAGGGGC  TGTCCGCTCT  GGCACGGCTG15601  CTCGAAAGCG  GCCGCGTGCA  GGTGGGGGTG  ATGCCGGTGA  ACCCGCGGCT  GTGGGTGGAG15661  CTCTACCCCG  CGGCGGCGTC  TTCGCGAATG  TTGTCGCGCC  TGGTGACGGC  GCATCGCGCG15721  AGCGCCGGCG  GGCCAGCCGG  GGACGGGGAC  CTGCTCCGCC  GCCTCGCTGC  TGCCGAGCCG15781  AGCGCGCGGA  GCGGGCTCCT  GGAGCCGCTC  CTCCGCGCGC  AGATCTCGCA  GGTGCTGCGC15841  CTCCCCGAGG  GCAAGATCGA  GGTGGACGCC  CCGCTCACGA  GCCTGGGCAT  GAACTCGCTG15901  ATGGGGCTCG  AGCTGCGCAA  CCGCATCGAG  GCCATGCTGG  GCATCACCGT  ACCGGCAACG15961  CTGTTGTGGA  CCTATCCCAC  GGTGGCGGCG  CTGAGCGGGC  ATCTGGCGCG  GGAGGCATGC16021  GAAGCCGCTC  CTGTGGAGTC  ACCGCACACC  ACCGCCGATT  CTGCTGTCGA  GATCGAGGAG16081  ATGTCGCAGG  ACGATCTGAC  GCAGTTGATC  GCAGCAAAAT  TCAAGGCGCT  TACATGACTA16141  CTCGCGGTCC  TACGGCACAG  CAGAATCCGC  TGAAACAAGC  GGCCATCATC  ATTCAGCGGC16201  TGGAGGAGCG  GCTCGCTGGG  CTCGCACAGG  CGGAGCTGGA  ACGGACCGAG  CCGATCGCCA16261  TCGTCGGTAT  CGGCTGCCGC  TTCCCTGGCG  GTGCGGACGC  TCCGGAAGCG  TTTTGGGAGC16321  TGCTCGACGC  GGAGCGCGAC  GCGGTCCAGC  CGCTCGACAG  GCGCTGGGCG  CTGGTAGGTG16381  TCGCTCCCGT  CGAGGCCGTG  CCGCACTGGG  CGGGGCTGCT  CACCGAGCCG  ATAGATTGCT16441  TCGATGCTGC  GTTCTTCGGC  ATCTCGCCTC  GGGAGGCGCG  ATCGCTCGAC  CCGCAGCATC16501  GTCTGTTGCT  GGAGGTCGCT  TGGGAGGGGC  TCGAGGACGC  CGGTATCCCG  CCCCGGTCCA16561  TCGACGGGAG  CCGCACCGGT  GTGTTCGTCG  GCGCTTTCAC  GGCGGACTAC  GCGCGCACGG16621  TCGCTCGGTT  GCCGCGCGAG  GAGCGAGACG  CGTACAGCGC  CACCGGCAAC  ATGCTCAGCA16681  TCGCCGCCGG  ACGGCTGTCG  TACACGCTGG  GGCTGCAGGG  ACCTTGCCTG  ACCGTCGACA16741  CGGCGTGCTC  GTCATCGCTG  GTGGCGATTC  ACCTCGCCTG  CCGCAGCCTG  CGCGCAGGAG16801  AGAGCGATCT  CGCGTTGGCG  GGAGGGGTCA  GCACGCTCCT  CTCCCCCGAC  ATGATGGAAG16861  CCGCGGCGCG  CACGCAAGCG  CTGTCGCCCG  ATGGTCGTTG  CCGGACCTTC  GATGCTTCGG16921  CCAACGGGTT  CGTCCGTGGC  GAGGGCTGTG  GCCTGGTCGT  CCTCAAACGG  CTCTCCGACG16981  CGCAACGGGA  TGGCGACCGC  ATCTGGGCGC  TGATCCGGGG  CTCGGCCATC  AACCATGATG17041  GCCGGTCGAC  CGGGTTGACC  GCGCCCAACG  TGCTGGCTCA  GGAGACGGTC  TTGCGCGAGG17101  CGCTGCGGAG  CGCCCACGTC  GAAGCTGGGG  CCGTCGATTA  CGTCGAGACC  CACGGAACAG17161  GGACCTCGCT  GGGCGATCCC  ATCGAGGTCG  AGGCGCTGCG  GGCGACGGTG  GGGCCGGCGC17221  GCTCCGACGG  CACACGCTGC  GTGCTGGGCG  CGGTGAAGAC  CAACATCGGC  CATCTCGAGG17281  CCGCGGCAGG  CGTAGCGGGC  CTGATCAAGG  CAGCGCTTTC  GCTGACGCAC  GAGCGCATCC17341  CGAGAAACCT  CAACTTCCGC  ACGCTCAATC  CGCGGATCCG  GCTCGAGGGC  AGCGCGCTCG17401  CGTTGGCGAC  CGAGCCGGTG  CCGTGGCCGC  GCACGGACCG  TCCGCGCTTC  GCGGGGGTGA17461  GCTCGTTCGG  GATGAGCGGA  ACGAACGCGC  ATGTGGTGCT  GGAAGAGGCG  CCGGCGGTGG17521  AGCTGTGGCC  TGCCGCGCCG  GAGCGCTCGG  CGGAGCTTTT  GGTGCTGTCG  GGCAAGAGCG17581  AGGGGGCGCT  CGACGCGCAG  GCGGCGCGGC  TGCGCGAGCA  CCTGGACATG  CACCCGGAGC17641  TCGGGCTCGG  GGACGTGGCG  TTCAGCCTGG  CGACGACGCG  CAGCGCGATG  ACCCACCGGC17701  TCGCGGTGGC  GGTGACGTCG  CGCGAGGGGC  TGCTGGCGGC  GCTTTCGGCC  GTGGCGCAGG17761  GGCAGACGCC  GGCGGGGGCG  GCGCGCTGCA  TCGCGAGCTC  CTCGCGCGGC  AAGCTGGCGT17821  TGCTGTTCAC  CGGACAGGGC  GCGCAGACGC  CGGGCATGGG  CCGGGGGCTC  TGCGCGGCGT17881  GGCCAGCGTT  CCGGGAGGCG  TTCGACCGGT  GCGTGACGCT  GTTCGACCGG  GAGCTGGACC17941  GCCCGCTGCG  CGAGGTGATG  TGGGCGGAGG  CGGGGAGCGC  CGAGTCGTTG  TTGCTGGACC18001  AGACGGCGTT  CACCCAGCCC  GCGCTCTTCG  CGGTGGAGTA  CGCGCTGACG  GCGCTGTGGC18061  GGTCGTGGGG  CGTAGAGCCG  GAGCTCCTGG  TTGGGCATAG  CATCGGGGAG  CTGGTGGCGG18121  CGTGCGTGGC  GGGGGTGTTC  TCGCTGGAAG  ATGGGGTGAG  GCTCGTGGCG  GCGCGCGGGC18181  GGCTGATGCA  GGGGCTCTCG  GCGGGCGGCG  CGATGGTGTC  GCTCGGAGCG  CCGGAGGCGG18241  AGGTGGCCGC  GGCGGTGGCG  CCGCACGCGG  CGTGGGTGTC  GATCGCGGCG  GTCAATGGGC18301  CGGAGCAGGT  GGTGATCGCG  GGCGTGGAGC  AAGCGGTGCA  GGCGATCGCG  GCGGGGTTCG18361  CGGCGCGCGG  CGTGCGCACC  AAGCGGCTGC  ATGTCTCGCA  CGCGTTCCAC  TCGCCGCTGA18421  TGGAACCGAT  GCTGGAGGAG  TTCGGGCGGG  TGGCGGCGTC  GGTGACGTAC  CGGCGGCCAA18481  GCGTTTCGCT  GGTGAGCAAC  CTGAGCGGGA  AGGTGGTCAC  GGACGAGCTG  AGCGCGCCGG18541  GCTACTGGGT  GCGGCACGTG  CGGGAGGCGG  TGCGCTTCGC  GGACGGGGTG  AAGGCGCTGC18601  ACGAAGCCGG  CGCGGGCACG  TTCCTCGAAG  TGGGCCCGAA  GCCGACGCTG  CTCGGCCTGT18661  TGCCAGCTTG  CCTGCCGGAG  GCGGAGCCGA  CGTTGCTGGC  GTCGTTGCGC  GCCGGGCGCG18721  AGGAGGCTGC  GGGGGTGCTC  GAGGCGCTGG  GCAGGCTGTG  GGCCGCTGGC  GGCTCGGTCA18781  GCTGGCCGGG  CGTCTTCCCC  ACGGCTGGGC  GGCGGGTGCC  GCTGCCGACC  TATCCGTGGC18841  AGCGGCAGCG  GTACTGGATC  GAGGCGCCGG  CCGAAGGGCT  CGGAGCCACG  GCCGCCGATG18901  CGCTGGCGCA  GTGGTTCTAC  CGGGTGGACT  GGCCCGAGAT  GCCTCGCTCA  TCCGTGGATT18961  CGCGGCGAGC  CCGGTCCGGC  GGGTGGCTGG  TGCTGGCCGA  CCGGGGTGGA  GTCGGGGAGG19021  CGGCCGCGGC  GGCGCTTTCG  TCGCAGGGAT  GTTCGTGCGC  CGTGCTCCAT  GCGCCCGCCG19081  AGGCCTCCGC  GGTCGCCGAG  CAGGTGACCC  AGGCCCTCGG  TGGCCGCAAC  GACTGGCAGG19141  GGGTGCTGTA  CCTGTGGGGT  CTGGACGCCG  TCGTGGAGGC  GGGGGCATCG  GCCGAAGAGG19201  TCGGCAAAGT  CACCCATCTT  GCCACGGCGC  CGGTGCTCGC  GCTGATTCAG  GCGGTGGGCA19261  CGGGGCCGCG  CTCACCCCGG  CTCTGGATCG  TGACCCGAGG  GGCCTGCACG  GTGGGCGGCG19321  AGCCTGACGC  TGCCCCCTGT  CAGGCGGCGC  TGTGGGGTAT  GGGCCGGGTC  GCGGCGCTGG19381  AGCATCCCGG  CTCCTGGGGC  GGGCTCGTGG  ACCTGGATCC  GGAGGAGAGC  CCGACGGAGG19441  TCGAGGCCCT  GGTGGCCGAG  CTGCTTTCGC  CGGACGCCGA  GGATCAGCTG  GCATTCCGCC19501  AGGGGCGCCG  GCGCGCAGCG  CGGCTCGTGG  CCGCCCCACC  GGAGGGAAAC  GCAGCGCCGG19561  TGTCGCTGTC  TGCGGAGGGG  AGTTACTTGG  TGACGGGTGG  GCTGGGCGCC  CTTGGCCTCC19621  TCGTTGCGCG  GTGGTTGGTG  GAGCGCGGGG  CGGGGCACCT  TGTGCTGATC  AGCCGGCACG19681  GATTGCCCGA  CCGCGAGGAA  TGGGGCCGAG  ATCAGCCGCC  AGAGGTGCGC  GCGCGCATTG19741  CGGCGATCGA  GGCGCTGGAG  GCGCAGGGCG  CGCGGGTCAC  CGTGGCGGCG  GTCGACGTGG19801  CCGATGCCGA  AGGCATGGCG  GCGCTCTTGG  CGGCCGTCGA  GCCGCCGCTG  CGGGGGGTCG19861  TGCACGCCGC  GGGTCTGCTC  GACGACGGGC  TGCTGGCCCA  CCAGGACGCC  GGTCGGCTCG19921  CCCGGGTGTT  GCGCCCCAAG  GTGGAGGGGG  CATGGGTGCT  GCACACCCTT  ACCCGCGAGC19981  AGCCGCTGGA  CCTCTTCGTA  CTGTTTTCCT  CGGCGTCGGG  CGTCTTCGGC  TCGATCGGCC20041  AGGGCAGCTA  CGCGGCAGGC  AATGCCTTTT  TGGACGCGCT  GGCGGACCTC  CGTCGAACGC20101  AGGGGCTCGC  CGCCCTGAGC  ATCGCCTGGG  GCCTGTGGGC  GGAGGGGGGG  ATGGGCTCGC20161  AGGCGCAGCG  CCGGGAACAT  GAGGCATCGG  GAATCTGGGC  GATGCCGACG  AGTCGTGCCC20221  TGGCGGCGAT  GGAATGGCTG  CTCGGTACGC  GCGCGACGCA  GCGCGTGGTC  ATCCAGATGG20281  ATTGGGCCCA  TGCGGGAGCG  GCTCCGCGCG  ACGCGAGCCG  AGGCCGCTTC  TGGGATCGGC20341  TGGTAACTGT  CACGAAAGCG  GCCTCCTCCT  CGGCCGTGCC  AGCTGTAGAG  CGCTGGCGCA20401  ACGCGTCTGT  TGTGGAGACC  CGCTCGGCGC  TCTACGAGCT  TGTGCGCGGC  GTGGTCGCCG20461  GGGTGATGGG  CTTTACCGAC  CAAGGCACGC  TCGACGTGCG  ACGAGGCTTC  GCCGAGCAGG20521  GCCTCGACTC  CCTGATGGCT  GTGGAGATCC  GCAAACGGCT  TCAGGGTGAG  CTGGGTATGC20581  CGCTGTCGGC  GACGCTGGCG  TTCGACCATC  CGACCGTGGA  GCGGCTGGTG  GAATACTTGC20641  TGAGCCAGGC  GCTGGAGCTG  CAGGACCGCA  CCGACGTGCG  AAGCGTTCGG  TTGCCGGCGA20701  CAGAGGACCC  GATCGCCATC  GTGGGTGCCG  CCTGCCGCTT  CCCGGGCGGG  GTCGAGGACC20761  TGGAGTCCTA  CTGGCAGCTG  TTGACCGAGG  GCGTGGTGGT  CAGCACCGAG  GTGCCGGCCG20821  ACCGGTGGAA  TGGGGCAGAC  GGGCGCGGCC  CCGGCTCGGG  AGAGGCTCCG  AGACAGACCT20881  ACGTGCCCAG  GGGTGGCTTT  CTGCGCGAGG  TGGAGACGTT  CGATGCGGCG  TTCTTCCACA20941  TCTCGCCTCG  GGAGGCGATG  AGCCTGGACC  CGCAACAGCG  GCTGCTGCTG  GAAGTGAGCT21001  GGGAGGCGAT  CGAGCGCGCG  GGCCAGGACC  CGTCGGCGCT  GCGCGAGAGC  CCCACGGGCG21061  TGTTCGTGGG  CGCGGGCCCC  AACGAATATG  CCGAGCGGGT  GCAGGACCTC  GCCGATGAGG21121  CGGCGGGGCT  CTACAGCGGC  ACCGGCAACA  TGCTCAGCGT  TGCGGCGGGA  CGGCTGTCAT21181  TTTTCCTGGG  CCTGCACGGG  CCGACCCTGG  CTGTGGATAC  GGCGTGCTCC  TCGTCGCTCG21241  TGGCGCTGCA  CCTCGGCTGC  CAGAGCTTGC  GACGGGGCGA  GTGCGACCAA  GCCCTGGTTG21301  GCGGGGTCAA  CATGCTGCTC  TCGCCGAAGA  CCTTCGCGCT  GCTCTCACGG  ATGCACGCGC21361  TTTCGCCCGG  CGGGCGGTGC  AAGACGTTCT  CGGCCGACGC  GGACGGCTAC  GCGCGGGCCG21421  AGGGCTGCGC  CGTGGTGGTG  CTCAAGCGGC  TCTCCGACGC  GCAGCGCGAC  CGCGACCCCA21481  TCCTGGCGGT  GATCCGGGGT  ACGGCGATCA  ATCATGATGG  CCCGAGCAGC  GGGCTGACAG21541  TGCCCAGCGG  CCCTGCCCAG  GAGGCGCTGT  TACGCCAGGC  GCTGGCGCAC  GCAGGGGTGG21601  TTCCGGCCGA  CGTCGATTTC  GTGGAATGCC  ACGGGACCGG  GACGGCGCTG  GGCGACCCGA21661  TCGAGGTGCG  GGCGCTGAGC  GACGTGTACG  GGCAAGCCCG  CCCTGCGGAC  CGACCGCTGA21721  TCCTGGGAGC  CGCCAAGGCC  AACCTTGGGC  ACATGGAGCC  CGCGGCGGGC  CTGGCCGGCT21781  TGCTCAAGGC  GGTGCTCGCG  CTGGGGCAAG  AGCAAATACC  AGCCCAGCCG  GAGCTGGGCG21841  AGCTCAACCC  GCTCTTGCCG  TGGGAGGCGC  TGCCGGTGGC  GGTGGCCCGC  GCAGCGGTGC21901  CGTGGCCGCG  CACGGACCGT  CCGCGCTTCG  CGGGGGTGAG  CTCGTTCGGG  ATGAGCGGAA21961  CGAACGCGCA  TGTGGTGCTG  GAAGAGGCGC  CGGCGGTGGA  GCTGTGGCCT  GCCGCGCCGG22021  AGCGCTCGGC  GGAGCTTTTG  GTGCTGTCGG  GCAAGAGCGA  GGGGGCGCTC  GACGCGCAGG22081  CGGCGCGGCT  GCGCGAGCAC  CTGGACATGC  ACCCGGAGCT  CGGGCTCGGG  GACGTGGCGT22141  TCAGCCTGGC  GACGACGCGC  AGCGCGATGA  ACCACCGGCT  CGCGGTGGCG  GTGACGTCGC22201  GCGAGGGGCT  GCTGGCGGCG  CTTTCGGCCG  TGGCGCAGGG  GCAGACGCCG  CCGGGGGCGG22261  CGCGCTGCAT  CGCGAGCTCG  TCGCGCGGCA  AGCTGGCGTT  CCTGTTCACC  GGACAGGGCG22321  CGCAGACGCC  GGGCATGGGC  CGGGGGCTTT  GCGCGGCGTG  GCCAGCGTTC  CGAGAGGCGT22381  TCGACCGGTG  CGTGGCGCTG  TTCGACCGGG  AGCTGGACCG  CCCGCTGTGC  GAGGTGATGT22441  GGGCGGAGCC  GGGGAGCGCC  GAGTCGTTGT  TGCTCGACCA  GACGGCGTTC  ACCCAGCCCG22501  CGCTCTTCAC  GGTGGAGTAC  GCGCTGACGG  CGCTGTGGCG  GTCGTGGGGC  GTAGAGCCGG22561  AGCTGGTGGC  TGGGCATAGC  GCCGGGGAGC  TGGTGGCGGC  GTGCGTGGCG  GGGGTGTTCT22621  CGCTGGAAGA  TGGGGTGAGG  CTCGTGGCGG  CGCGCGGGCG  GCTGATGCAG  GGGCTCTCGG22681  CGGGCGGCGC  GATGGTGTCG  CTCGGAGCGC  CGGAGGCGGA  GGTGGCCGCG  GCGGTGGCGC22741  CGCACGCGGC  GTGGGTGTCG  ATCGCGGCGG  TCAATGGGCC  GGAGCAGGTG  GTGATCGCGG22801  GCGTGGAGCA  AGCGGTGCAG  GCGATCGCGG  CGGGGTTCGC  GGCGCGCGGC  GTGCGCACCA22861  AGCGGCTGCA  TGTCTCGCAC  GCATCCCACT  CGCCGCTGAT  GGAACCGATG  CTGGAGGAGT22921  TCGGGCGGGT  GGCGGCGTCG  GTGACGTACC  GGCGGCCAAG  CGTTTCGCTG  GTGAGCAACC22981  TGAGCGGGAA  GGTGGTCACG  GACGAGCTGA  GCGCGCCGGG  CTACTGGGTG  CGGCACGTGC23041  GGGAGGCGGT  GCGCTTCGCG  GACGGGGTGA  AGGCGCTGCA  CGAAGCCGGC  GCGGGGACGT23101  TCCTCGAAGT  GGGCCCGAAG  CCGACGCTGC  TCGGCCTGTT  GCCAGCTTGC  CTGCCGGAGG23161  CGGAGCCGAC  GCTGCTGGCG  TCGTTGCGCG  CCGGGCGCGA  GGAGGCTGCG  GGGGTGCTCG23221  AGGCGCTGGG  CAGGCTGTGG  GCCGCCGGCG  GCTCGGTCAG  CTGGCCGGGC  GTCTTCCCCA23281  CGGCTGGGCG  GCGGGTGCCG  CTGCCGACCT  ATCCGTGGCA  GCGGCAGCGG  TACTGGCCCG23341  ACATCGAGCC  TGACAGCCGT  CGCCACGCAG  CCGCGGATCC  GACCCAAGGC  TGGTTCTATC23401  GCGTGGACTG  GCCGGAGATA  CCTCGCAGCC  TCCAGAAATC  AGAGGAGGCG  AGCCGCGGGA23461  GCTGGCTGGT  ATTGGCGGAT  AAGGGTGGAG  TCGGCGAGGC  GGTCGCTGCA  GCGCTGTCGA23521  CACGTGGACT  TCCATGCGTC  GTGCTCCATG  CGCCGGCAGA  GACATCCGCG  ACCGCCGAGC23581  TGGTGACCGA  GGCTGCCGGC  GGTCGAAGCG  ATTGGCAGGT  AGTGCTCTAC  CTGTGGGGTC23641  TGGACGCCGT  CGTCGGCGCG  GAGGCGTCGA  TCGATGAGAT  CGGCGACGCG  ACCCGTCGTG23701  CTACCGCGCC  GGTGCTCGGC  TTGGCTCGGT  TTCTGAGCAC  CGTGTCTTGT  TCGCCCCGAC23761  TCTGGGTCGT  GACCCGGGGG  GCATGCATCG  TTGGCGACGA  GCCTGCGATC  GCCCCTTGTC23821  AGGCGGCGTT  ATGGGGCATG  GGCCGGGTGG  CGGCGCTCGA  GCATCCCGGG  GCCTGGGGCG23881  GGCTCGTGGA  CCTGGATCCC  CGAGCGAGCC  CGCCCCAAGC  CAGCCCGATC  GACGGCGAGA23941  TGCTCGTCAC  CGAGCTATTG  TCGCAGGAGA  CCGAGGACCA  GCTCGCCTTC  CGCCATGGGC24001  GCCGGCACGC  GGCACGGCTG  GTGGCCGCCC  CGCCACGGGG  GGAAGCGGCA  CCGGCGTCGC24061  TGTCTGCGGA  GGCGAGCTAC  CTGGTGACGG  GAGGCCTCGG  TGGGCTGGGC  CTGATCGTGG24121  CCCAGTGGCT  GGTGGAGCTG  GGAGCGCGGC  ACTTGGTGCT  GACCAGCCGG  CGCGGGTTGC24181  CCGACCGGCA  GGCGTGGCGC  GAGCAGCAGC  CGCCTGAGAT  CCGCGCGCGG  ATCGCAGCGG24241  TCGAGGCGCT  GGAGGCGCGG  GGTGCACGGG  TGACCGTGGC  AGCGGTGGAC  GTGGCCGACG24301  TCGAACCGAT  GACAGCGCTG  GTTTCGTCGG  TCGAGCCCCC  GCTGCGAGGG  GTGGTGCACG24361  CCGCTGGCGT  CAGCGTCATG  CGTCCACTGG  CGGAGACGGA  CGAGACCCTG  CTCGAGTCGG24421  TGCTCCGTCC  CAAGGTGGCC  GGGAGCTGGC  TGCTGCACCG  GCTGCTGCAC  GGCCGGCCTC24481  TCGACCTGTT  CGTGCTGTTC  TCGTCGGGCG  CAGCGGTGTG  GGGTAGCCAT  AGCCAGGGTG24541  CGTACGCGGC  GGCCAACGCT  TTCCTCGACG  GGCTCGCGCA  TCTTCGGCGT  TCGCAATCGC24601  TGCCTGCGTT  GAGCGTCGCG  TGGGGTCTGT  GGGCCGAGGG  AGGCATGGCG  GACGCGGAGG24661  CTCATGCACG  TCTGAGCGAC  ATCGGGGTTC  TGCCCATGTC  GACGTCGGCA  GCGTTGTCGG24721  CGCTCCAGCG  CCTGGTGGAG  ACCGGCGCGG  CTCAGCGCAC  GGTGACCCGG  ATGGACTGGG24781  CGCGCTTCGC  GCCGGTGTAC  ACCGCTCGAG  GGCGTCGCAA  CCTGCTTTCG  GCGCTGGTCG24841  CAGGGCGCGA  CATCATCGCG  CCTTCCCCTC  CGGCGGCAGC  AACCCGGAAC  TGGCGTGGCC24901  TGTCCGTTGC  GGAAGCCCGC  ATGGCTCTGC  ACGAGGTCGT  CCATGGGGCC  GTCGCTCGGG24961  TGCTGGGCTT  CCTCGACCCG  AGCGCGCTCG  ATCCTGGGAT  GGGGTTCAAT  GAGCAGGGCC25021  TCGACTCGTT  GATGGCGGTG  GAGATCCGCA  ACCTCCTTCA  GGCTGAGCTG  GACGTGCGGC25081  TTTCGACGAC  GCTGGCCTTT  GATCATCCGA  CGGTACAGCG  GCTGGTGGAG  CATCTGCTCG25141  TCGATGTACT  GAAGCTGGAG  GATCGCAGCG  ACACCCAGCA  TGTTCGGTCG  TTGGCGTCAG25201  ACGAGCCCAT  CGCCATCGTG  GGAGCCGCCT  GCCGCTTCCC  GGGCGGGGTG  GAGGACCTGG25261  AGTCCTACTG  GCAGCTGTTG  GCCGAGGGCG  TGGTGGTCAG  CGCCGAGGTG  CCGGCCGACC25321  GGTGGGATGC  GGCGGACTGG  TACGACCCTG  ATCCGGAGAT  CCCAGGCCGG  ACTTACGTGA25381  CCAAAGGCGC  CTTCCTGCGC  GATTTGCAGA  GATTGGATGC  GACCTTCTTC  CGCATCTCGC25441  CTCGCGAGGC  GATGAGCCTC  GACCCGCAGC  AGCGGTTGCT  CCTGGAGGTA  AGCTGGGAGG25501  CGCTCGAGAG  CGCGGGTATC  GCTCCGGATA  CGCTGCGAGA  TAGCCCCACC  GGGGTGTTCG25561  TGGGTGCGGG  GCCCAATGAG  TACTACACGC  AGCGGCTGCG  AGGCTTCACC  GACGGAGCGG25621  CAGGGCTGTA  CGGCGGCACC  GGGAACATGC  TCAGCGTTGC  GGCTGGACGG  CTGTCGTTTT25681  TCCTGGGTCT  GCACGGCCCG  ACGCTGGCCA  TGGATACGGC  GTGCTCGTCC  TCCCTGGTCG25741  CGCTGCACCT  CGCCTGCCAG  AGCCTGCGAC  TGGGCGAGTG  CGATCAAGCG  CTGGTTGGCG25801  GGGTCAACGT  GCTGCTCGCG  CCGGAGACCT  TCGTGCTGCT  CTCACGGATG  CGCGCGCTTT25861  CGCCCGACGG  GCGGTGCAAG  ACGTTCTCGG  CCGACGCGGA  CGGCTACGCG  CGGGGCGAGG25921  GGTGCGCCGT  GGTGGTGCTC  AAGCGGCTGC  GCGATGCGCA  GCGCGCCGGC  GACTCCATCC25981  TGGCGCTGAT  CCGGGGAAGC  GCGGTGAACC  ACGACGGCCC  GAGCAGCGGG  CTGACCGTGC26041  CCAACGGACC  CGCCCAGCAA  GCATTGCTGC  GCCAGGCGCT  TTCGCAAGCA  GGCGTGTCTC26101  CGGTCGACGT  TGATTTTGTG  GAGTGTCACG  GGACAGGGAC  GGCGCTGGGC  GACCCGATCG26161  AGGTGCAGGC  GCTGAGCGAG  GTGTATGGTC  CAGGGCGCTC  CGAGGATCGA  CCGCTGGTGC26221  TGGGGGCCGT  CAAGGCCAAC  GTCGCGCATC  TGGAGGCGGC  ATCCGGCTTG  GCCAGCCTGC26281  TCAAGGCCGT  GCTTGCGCTG  CGGCACGAGC  AGATCCCGGC  CCAGCCGGAG  CTGGGGGAGC26341  TCAACCCGCA  CTTGCCGTGG  AACACGCTGC  CGGTGGCGGT  GCCACGTAAG  GCGGTGCCGT26401  GGGGGCGCGG  CGCACGGCCG  CGTCGGGCCG  GCGTGAGCGC  GTTCGGGTTG  AGCGGAACCA26461  ACGTGCATGT  CGTGCTGGAG  GAGGCACCGG  AGGTGGAGCT  GGTGCCCGCG  GCGCCGGCGC26521  GACCGGTGGA  GCTGGTTGTG  CTATCGGCCA  AGAGCGCGGC  GGCGCTGGAC  GCCGCGGCGG26581  AACGGCTCTC  GGCGCACCTG  TCCGCGCACC  CGGAGCTGAG  CCTCGGCGAC  GTGGCGTTCA26641  GCCTGGCGAC  GACGCGCAGC  CCGATGGAGC  ACCGGCTCGC  CATCGCGACG  ACCTCGCGCG26701  AGGCCCTGCG  AGGCGCGCTG  GACGCCGCGG  CGCAGCGGCA  GACGCCGCAG  GGCGCGGTGC26761  GCGGCAAGGC  CGTGTCCTCA  CGCGGTAAGT  TGGCTTTCCT  GTTCACCGGA  CAGGGCGCGC26821  AAATGCCGGG  CATGGGCCGT  GGGCTGTACG  AGGCGTGGCC  AGCGTTCCGG  GAGGCGTTCG26881  ACCGGTGCGT  GGCGCTCTTC  GATCGGGAGC  TCGACCAGCC  TCTGCGCGAG  GTGATGTGGG26941  CTGCGCCGGG  CCTCGCTCAG  GCGGCGCGGC  TCGATCAGAC  CGCGTACGCG  CAGCCGGCTC27001  TCTTTGCGCT  GGAGTACGCG  CTGGCTGCCC  TGTGGCGTTC  GTGGGGCGTG  GAGCCGCACG27061  TACTCCTCGG  TCATAGCATC  GGCGAGCTGG  TCGCCGCCTG  CGTGGCGGGC  GTGTTCTCGC27121  TCGAAGACGC  GGTGAGGTTG  GTGGCCGCGC  GCGGGCGGCT  GATGCAGGCG  CTGCCCGCCG27181  GCGGTGCCAT  GGTCGCCATC  GCAGCGTCCG  AGGCCGAGGT  GGCCGCCTCC  GTGGCACCCC27241  ACGCCGCCAC  GGTGTCGATC  GCCGCGGTCA  ACGGTCCTGA  CGCCGTCGTG  ATCGCTGGCG27301  CCGAGGTACA  GGTGCTCGCC  CTCGGCGCGA  CGTTCGCGGC  GCGTGGGATA  CGCACGAAGA27361  GGCTCGCCGT  CTCCCATGCG  TTCCACTCGC  CGCTCATGGA  TCCGATGCTG  GAAGACTTCC27421  AGCGGGTCGC  TGCGACGATC  GCGTACCGCG  CGCCAGACCG  CCCGGTGGTG  TCGAATGTCA27481  CCGGCCACGT  CGCAGGCCCC  GAGATCGCCA  CGCCCGAGTA  TTGGGTCCGG  CATGTGCGAA27541  GCGCCGTGCG  CTTCGGCGAT  GGGGCAAAGG  CGTTGCATGC  CGCGGGTGCC  GCCACGTTCG27601  TCGAGATTGG  CCCGAAGCCG  GTCCTGCTCG  GGCTATTGCC  AGCGTGCCTC  GGGGAAGCGG27661  ACGCGGTCCT  CGTGCCGTCG  CTACGCGCGG  ACCGCTCGGA  ATGCGAGGTG  GTCCTCGCGG27721  CGCTCGGGAC  TTGGTATGCC  TGGGGGGGTG  CGCTCGACTG  GAAGGGCGTG  TTCCCCGATG27781  GCGCGCGCCG  CGTGGCTCTG  CCCATGTATC  CATGGCAGCG  TGAGCGCCAT  TGGATGGACC27841  TCACCCCGCG  AAGCGCCGCG  CCTGCAGGGA  TCGCAGGTCG  CTGGCCGCTG  GCTGGTGTCG27901  GGCTCTGCAT  GCCCGGCGCT  GTGTTGCACC  ACGTGCTCTC  GATCGGACCA  CGCCATCAGC27961  CCTTCCTCGG  TGATCACCTC  GTGTTTGGCA  AGGTGGTGGT  GCCCGGCGCC  TTTCATGTCG28021  CGGTGATCCT  CAGCATCGCC  GCCGAGCGCT  GGCCCGAGCG  GGCGATCGAG  CTGACAGGCG28081  TGGAGTTCCT  GAAGGCGATC  GCGATGGAGC  CCGACCAGGA  GGTCGAGCTC  CACGCCGTGC28141  TCACCCCCGA  AGCCGCCGGG  GATGGCTACC  TGTTCGAGCT  GGCGACCCTG  GCGGCGCCGG28201  AGACCGAACG  CCGATGGACG  ACCCACGCCC  GCGGTCGGGT  GCAGCCGACA  GACGGCGCGC28261  CCGGCGCGTT  GCCGCGCCTC  GAGGTGCTGG  AGGACCGCGC  GATCCAGCCC  CTCGACTTCG28321  CCGGATTCCT  CGACAGGTTA  TCGGCGGTGC  GGATCGGCTG  GGGTCCGCTT  TGGCGATGGC28381  TGCAGGACGG  GCGCGTCGGC  GACGAGGCCT  CGCTTGCCAC  CCTCGTGCCG  ACCTATCCGA28441  ACGCCCACGA  CGTGGCGCCC  TTGCACCCGA  TCCTGCTGGA  CAACGGCTTT  GCGGTGAGCC28501  TGCTGGCAAC  CCGGAGCGAG  CCGGAGGACG  ACGGGACGCC  CCCGCTGCCG  TTCGCCGTGG28561  AACGGGTGCG  GTGGTGGCGG  GCGCCGGTTG  GAAGGGTGCG  GTGTGGCGGC  GTGCCGCGGT28621  CGCAGGCATT  CGGTGTCTCG  AGCTTCGTGC  TGGTCGACGA  AACTGGCGAG  GTGGTCGCTG28681  AGGTGGAGGG  ATTTGTTTGC  CGCCGGGCGC  CGCGAGAGGT  GTTCCTGCGG  CAGGAGTCGG28741  GCGCGTCGAC  TGCAGCCTTG  TACCGCCTCG  ACTGGCCCGA  AGCCCCCTTG  CCCGATGCGC28801  CTGCGGAACG  GATGGAGGAG  AGCTGGGTCG  TGGTGGCAGC  ACCTGGCTCG  GAGATGGCCG28861  CGGCGCTCGC  AACACGGCTC  AACCGCTGCG  TACTCGCCGA  ACCCAAAGGC  CTCGAGGCGG28921  CCCTCGCGGG  GGTGTCTCCC  GCAGGTGTGA  TCTGCCTCTG  GGAACCTGGA  GCCCACGAGG28981  AAGCTCCGGC  GGCGGCGCAG  CGTGTGGCGA  CCGAGGGCCT  TTCGGTGGTG  CAGGCGCTCA29041  GGGATCGCGC  GGTGCGCCTG  TGGTGGGTGA  CCACGGGCGC  CGTGGCTGTC  GAGGCCGGTG29101  AGCGGGTGCA  GGTCGCCACA  GCGCCGGTAT  GGGGCCTGGG  CCGGACAGTG  ATGCAGGAGC29161  GCCCGGAGCT  CAGCTGCACT  CTGGTGGATT  TGGAGCCGGA  GGTCGATGCC  GCGCGTTCAG29221  CTGACGTTCT  GCTGCGGGAG  CTCGGTCGCG  CTGACGACGA  GACCCAGGTG  GTTTTCCGTT29281  CCGGAGAGCG  CCGCGTAGCG  CGGCTGGTCA  AAGCGACAAC  CCCCGAAGGG  CTCTTGGTCC29341  CTGACGCAGA  ATCCTATCGA  CTGGAGGCTG  GGCAGAAGGG  CACATTGGAC  CAGCTCCGCC29401  TCGCGCCGGC  ACAGCGCCGG  GCACCCGGCC  CGGGCGAGGT  CGAGATCAAG  GTAACCGCCT29461  CGGGGCTCAA  CTTCCGGACC  GTCCTCGCTG  TGCTGGGAAT  GTATCCGGGC  GACGCTGGGC29521  CGATGGGCGG  AGATTGTGCC  GGTATCGTCA  CGGCGGTGGG  CCAGGGGGTG  CACCACCTCT29581  CGGTCGGCGA  TGCTGTCATG  ACGCTGGGGA  CGTTGCATCG  ATTCGTCACG  GTCGACGCGC29641  GGCTGGTGGT  CCGGCAGCCT  GCAGGGCTGA  CTCCCGCGCA  GGCAGCTACG  GTGCCGGTTG29701  CGTTCCTGAC  GGCCTGGCTC  GCTCTGCACG  ACCTGGGGAA  TCTGCGGCGC  GGCGAGCGGG29761  TGCTGATCCA  TGCTGCGGCC  GGCGGCGTGG  GCATGGCCGC  GGTGCAAATC  GCCCGATGGA29821  TAGGGGCCGA  GGTGTTCGCC  ACGGCGAGCC  CGTCCAAGTG  GGCAGCGGTT  CAGGCCATGG29881  GCGTGCCGCG  CACGCACATC  GCCAGCTCGC  GGACGCTGGA  GTTTGCTGAG  ACGTTCCGGC29941  AGGTCACCGG  CGGCCGGGGC  GTGGACGTGG  TGCTCAACGC  GCTGGCCGGC  GAGTTCGTGG30001  ACGCGAGCCT  GTCCCTGCTG  ACGACGGGCG  GGCGGTTCCT  CGAGATGGGC  AAGACCGACA30061  TACGGGATCG  AGCCGCGGTC  GCGGCGGCGC  ATCCCGGTGT  TCGCTATCGG  GTATTCGACA30121  TCCTGGAGCT  CGCTCCGGAT  CGAACTCGAG  AGATCCTCGA  GCGCGTGGTC  GAGGGCTTTG30181  CTGCGGGACA  TCTGCGCGCA  TTGCCGGTGC  ATGCGTTCGC  GATCACCAAG  GCCGAGGCAG30241  CGTTTCGGTT  CATGGCGCAA  GCGCGGCATC  AGGGCAAGGT  CGTGCTGCTG  CCGGCGCCCT30301  CCGCAGCGCC  CTTGGCGCCG  ACGGGCACCG  TACTGCTGAC  CGGTGGGCTG  GGAGCGTTGG30361  GGCTCCACGT  GGCCCGCTGG  CTCGCCCAGC  AGGGCGCGCC  GCACATGGTG  CTCACAGGTC30421  GGCGGGGCCT  GGATACGCCG  GGCGCTGCCA  AAGCCGTCGC  GGAGATCGAA  GCGCTCGGCG30481  CTCGGGTGAC  GATCGCGGCG  TCGGATGTCG  CCGATCGGAA  CGCGCTGGAG  GCTGTGCTCC30541  AGGCCATTCC  GGCGGAGTGG  CCGTTACAGG  GCGTGATCCA  TGCAGCCGGA  GCGCTCGATG30601  ATGGTGTGCT  TGATGAGCAG  ACCACCGACC  GCTTCTCGCG  GGTGCTGGCA  CCGAAGGTGA30661  CTGGCGCCTG  GAATCTGCAT  GAGCTCACGG  CGGGCAACGA  TCTCGCTTTC  TTCGTGCTGT30721  TCTCCTCCAT  GTCGGGGCTC  TTGGGCTCGG  CCGGGCAGTC  CAACTATGCG  GCGGCCAACA30781  CCTTCCTCGA  CGCGCTGGCC  GCGCATCGGC  GGGCCGAAGG  CCTGGCGGCG  CAGAGCCTCG30841  CGTGGGGCCC  ATGGTCGGAC  GGAGGCATGG  CAGCGGGGCT  CAGCGCGGCG  CTGCAGGCGC30901  GGCTCGCTCG  GCATGGGATG  GGAGCGCTGT  CGCCCGCTCA  GGGCACCGCG  CTGCTCGGGC30961  AGGCGCTGGC  TCGGCCGGAA  ACGCAGCTCG  GGGCGATGTC  GCTCGACGTG  CGTGCGGCAA31021  GCCAAGCTTC  GGGAGCGGCA  GTGCCGCCTG  TGTGGCGCGC  GCTGGTGCGC  GCGGAGGCGC31081  GCCATGCGGC  GGCTGGGGCG  CAGGGGGCAT  TGGCCGCGCG  CCTTGGGGCG  CTGCCCGAGG31141  CGCGTCGCGC  CGACGAGGTG  CGCAAGGTCG  TGCAGGCCGA  GATCGCGCGC  GTGCTTTCAT31201  GGGGCGCCGC  GAGCGCCGTG  CCCGTCGATC  GGCCGCTGTC  GGACTTGGGC  CTCGACTCGC31261  TCACGGCGGT  GGAGCTGCGC  AACGTGCTCG  GCCAGCGGGT  GGGTGCGACG  CTGCCGGCGA31321  CGCTGGCATT  CGATCACCCG  ACGGTCGACG  CGCTCACGCG  CTGGCTGCTC  GATAAGGTCC31381  TGGCCGTGGC  CGAGCCGAGC  GTATCGCCCG  CAAAGTCGTC  GCCGCAGGTC  GCCCTCGACG31441  AGCCCATTGC  GGTGATCGGC  ATCGGCTGCC  GTTTCCCAGG  CGGCGTGACC  GATCCGGAGT31501  CGTTTTGGCG  GCTGCTCGAA  GAGGGCAGCG  ATGCCGTCGT  CGAGGTGCCG  CATGAGCGAT31561  GGGACATCGA  CGCGTTCTAT  GATCCGGATC  CGGATGTGCG  CGGCAAGATG  ACGACACGCT31621  TTGGCGGCTT  CCTGTCCGAT  ATCGACCGGT  TCGAGCCGGC  CTTCTTCGGC  ATCTCGCCGC31681  GCGAAGCGAC  GACCATGGAT  CCGCAGCAGC  GGCTGCTCCT  GGAGACGAGC  TGGGAGGCGT31741  TCGAGCGCGC  CGGGATTTTG  CCCGAGCGGC  TGATGGGCAG  CGATACCGGC  GTGTTCGTGG31801  GGCTCTTCTA  CCAGGAGTAC  GCTGCGCTCG  CCGGCGGCAT  CGAGGCGTTC  GATGGCTATC31861  TAGGCACCGG  CACCACGGCC  AGCGTCGCCT  CGGGCAGGAT  CTCTTATGTG  CTCGGGCTAA31921  AGGGGCCGAG  CCTGACGGTG  GACACCGCGT  GCTCCTCGTC  GCTGGTCGCG  GTGCACCTGG31981  CCTGCCAGGC  GCTGCGGCGG  GGCGAGTGTT  CGGTGGCGCT  GGCCGGCGGC  GTGGCGCTGA32041  TGCTCACGCC  GGCGACGTTC  GTGGAGTTCA  GCCGGCTGCG  AGGCCTGGCT  CCCGACGGAC32101  GGTGCAAGAG  CTTCTCGGCC  GCAGCCGACG  GCGTGGGGTG  GAGCGAAGGC  TGCGCCATGC32161  TCCTGCTCAA  ACCGCTTCGC  GATGCTCAGC  GCGATGGGGA  TCCGATCCTG  GCGGTGATCC32221  GCGGCACCGC  GGTGAACCAG  GATGGGCGCA  GCAACGGGCT  GACGGCGCCC  AACGGGTCGT32281  CGCAGCAAGA  GGTGATCCGT  CGGGCCCTGG  AGCAGGCGGG  GCTGGCTCCG  GCGGACGTCA32341  GCTACGTCGA  GTGCCACGGC  ACCGGCACGA  CGTTGGGCGA  CCCCATCGAA  GTGCAGGCCC32401  TGGGCGCCGT  GCTGGCACAG  GGGCGACCCT  CGGACCGGCC  GCTCGTGATC  GGGTCGGTGA32461  AGTCCAATAT  CGGACATACG  CAGGCTGCGG  CGGGCGTGGC  CGGTGTCATC  AAGGTGGCGC32521  TGGCGCTCGA  GCGCGGGCTT  ATCCCGAGGA  GCCTGCATTT  CGACGCGCCC  AATCCGCACA32581  TTCCGTGGTC  GGAGCTCGCC  GTGCAGGTGG  CCGCCAAACC  CGTCGAATGG  ACGAGAAACG32641  GCGCGCCGCG  ACGAGCCGGG  GTGAGCTCGT  TTGGCGTCAG  CGGGACCAAC  GCGCACGTGG32701  TGCTGGAGGA  GGCGCCAGCG  GCGGCGTTCG  CGCCCGCGGC  GGCGCGTTCA  GCGGAGCTTT32761  TCGTGCTGTC  GGCGAAGAGC  GCCGCGGCGC  TGGACGCGCA  GGCGGCGCGG  CTTTCGGCGC32821  ATGTCGTTGC  GCACCCGGAG  CTCGGCCTCG  GCGACCTGGC  GTTCAGCCTG  GCGACGACCC32881  GCAGCCCGAT  GACGTACCGG  CTCGCGGTGG  CGGCGACCTC  GCGCGAGGCG  CTGTCTGCGG32941  CGCTCGACAC  AGCGGCGCAG  GGGCAGGCGC  CGCCCGCAGC  GGCTCGCGGC  CACGCTTCCA33001  CAGGCAGCGC  CCCAAAGGTG  GTTTTCGTCT  TTCCTGGCCA  GGGCTCCCAG  TGGCTGGGCA33061  TGGGCCAAAA  GCTCCTCTCG  GAGGAGCCCG  TCTTCCGCGA  CGCGCTCTCG  GCGTGTGACC33121  GAGCGATTCA  GGCCGAAGCC  GGCTGGTCGC  TGCTCGCCGA  GCTCGCGGCC  GATGAGACCA33181  CCTCGCAGCT  CGGCCGCATC  GACGTGGTGC  AGCCGGCGCT  GTTCGCGATC  GAGGTCGCGC33241  TGTCGGCGCT  GTGGCGGTCG  TGGGGCGTCG  AGCCGGATGC  AGTGGTAGGC  CACAGCATGG33301  GCGAAGTGGC  GGCCGCGCAC  GTCGCCGGCG  CCCTGTCGCT  CGAGGATGCT  GTAGCGATCA33361  TCTGCCGGCG  CAGCCTGCTG  CTGCGGCGGA  TCAGCGGCCA  AGGCGAGATG  GCGGTCGTCG33421  AGCTCTCCCT  GGCCGAGGCC  GAGGCAGCGC  TCCTGGGCTA  CGAAGATCGG  CTCAGCGTGG33481  CGGTGAGCAA  CAGCCCGCGA  TCGACGGTGC  TGGCGGGCGA  GCCGGCAGCG  CTCGCAGAGG33541  TGCTGGCGAT  CCTTGCGGCA  AAGGGGGTGT  TCTGCCGTCG  AGTCAAGGTG  GACGTCGCCA33601  GCCACAGCCC  ACAGATCGAC  CCGCTGCGCG  ACGAGCTATT  GGCAGCATTG  GGCGAGCTCG33661  AGCCGCGACA  AGCGACCGTG  TCGATGCGCT  CGACGGTGAC  GAGCACGATC  GTGGCGGGCC33721  CGGAGCTCGT  GGCGAGCTAC  TGGGCGGACA  ACGTTCGACA  GCCGGTGCGC  TTCGCCGAAG33781  CGGTGCAATC  GTTGATGGAA  GGCGGTCATG  GGCTGTTCGT  GGAGATGAGC  CCGCATCCGA33841  TCCTGACGAC  GTCGGTCGAG  GAGATCCGAC  GGGCGACGAA  GCGGGAGGGA  GTCGCGGTGG33901  GCTCGTTGCG  GCGTGGACAG  GACGAGCGCC  TGTCCATGTT  GGAGGCGCTG  GGAGCGCTCT33961  GGGTACACGG  CCAGGCGGTG  GGCTGGGAGC  GGCTGTTCTC  CGCGGGCGGC  GCGGGCCTCC34021  GTCGCGTGCC  GCTGCCGACC  TATCCCTGGC  AGCGCGAGCG  GTACTGGGTC  GAAGCGCCGA34081  CCGGCGGCGC  GGCGAGCGGC  AGCCGCTTTG  CTCATGCGGG  CAGTCACCCG  CTCCTGGGTG34141  AAATGCAGAC  CCTGTCGACC  CAGAGGAGCA  CGCGCGTGTG  GGAGACGACG  CTGGATCTCA34201  AACGGCTGCC  GTGGCTCGGC  GATCACCGGG  TGCAGGGGGC  GGTCGTGTTC  CCGGGCGCGG34261  CGTACCTGGA  GATGGCGCTT  TCGTCTGGGG  CCGAGGCCTT  GGGTGACGGT  CCGCTCCAGG34321  TCAGCGATGT  GGTGCTCGCC  GAGGCGCTGG  CCTTCGCGGA  TGATACGCCG  GTGGCGGTGC34381  AGGTCATGGC  GACCGAGGAG  CGACCAGGCC  GCCTGCAATT  CCACGTTGCG  AGCCGGGTGC34441  CGGGCCACGG  CCGTGCTGCC  TTTCGAAGCC  ATGCCCGCGG  GGTGCTGCGC  CAGACCGAGC34501  GCGCCGAGGT  CCCGGCGAGG  CTGGATCTGG  CCGCGCTTCG  TGCCCGGCTT  CAGGCCAGCG34561  CACCCGCTGC  GGCTACCTAT  GCGGCGCTGG  CCGAGATGGG  GCTCGAGTAC  GGCCCAGCGT34621  TCCAGGGGCT  TGTCGAGCTG  TGGCGGGGGG  AGGGCGAGGC  GCTGGGACGT  GTGCGGCTCC34681  CCGAGGCCGC  CGGCTCCCCA  GCCGCGTGCC  GGCTCCACCC  CGCGCTCTTG  GATGCGTGCT34741  TCCACGTGAG  CAGCGCCTTC  GCTGACCGCG  GCGAGGCGAC  GCCATGGGTA  CCCGTCGAAA34801  TCGGCTCGCT  GCGGTGGTTC  CAGCGGCCGT  CGGGGGAGCT  GTGGTGTCAT  GCGCGGAGCG34861  TGAGCCACGG  AAAGCCAACA  CCCGATCGGC  GGAGTACCGA  CTTTTGGGTG  GTCGACAGCA34921  CGGGCGCGAT  CGTCGCCGAG  ATCTCCGGGC  TCGTGGCGCA  GCGGCTCGCG  GGAGGTGTAC34981  GCCGGCGCGA  AGAAGACGAC  TGGTTCATGG  AGCCGGCTTG  GGAACCGACC  GCGGTCCCCG35041  GATCCGAGGT  CACGGCGGGC  CGGTGGCTGC  TCATCGGCTC  GGGCGGCGGG  CTCGGCGCTG35101  CGCTCTACTC  GGCGCTGACG  GAAGCTGGCC  ATTCCGTCGT  CCACGCGACA  GGGCACGGCA35161  CGAGCGCCGC  CGGGTTGCAG  GCACTCCTGA  CGGCGTCCTT  CGACGGCCAG  GCCCCGACGT35221  CGGTGGTGCA  CCTCGGCAGC  CTCGATGAGC  GTGGCGTGCT  CGACGCGGAT  GCCCCCTTCG35281  ACGCCGATGC  CCTCGAGGAG  TCGCTGGTGC  GCGGCTGCGA  CAGCGTGCTC  TGGACCGTGC35341  AGGCCGTGGC  CGGGGCGGGC  TTCCGAGATC  CTCCGCGGTT  GTGGCTCGTG  ACACGCGGCG35401  CTCAGGCCAT  CGGCGCCGGC  GACGTCTCCG  TGGCGCAAGC  GCCGCTCCTG  GGGCTGGGCC35461  GCGTTATCGC  CTTGGAGCAC  GCCGAGCTGC  GCTGCGCTCG  GATCGACCTC  GATCCAGCGC35521  GGCGCGACGG  AGAGGTCGAT  GAGCTGCTTG  CCGAGCTGTT  GGCCGACGAC  GCCGAGGAGG35581  AAGTCGCGTT  TCGCGGCGGT  GAGCGGCGCG  TGGCCCGGCT  CGTCCGAAGG  CTGCCCGAGA35641  CCGACTGCCG  AGAGAAAATC  GAGCCCGCGG  AAGGCCGGCC  GTTCCGGCTG  GAGATCGATG35701  GGTCCGGCGT  GCTCGACGAC  CTGGTGCTCC  GAGCCACGGA  GCGGCGCCCT  CCTGGCCCGG35761  GCGAGGTCGA  GATCGCCGTC  GAGGCGGCGG  GGCTCAACTT  TCTCGACGTG  ATGAGGGCCA35821  TGGGGATCTA  CCCTGGGCCC  GGGGACGGTC  CGGTTGCGCT  GGGCGCCGAG  TGCTCCGGCC35881  GAATTGTCGC  GATGGGCGAA  GGTGTCGAGA  GCCTTCGTAT  CGGCCAGGAC  GTCGTGGCCG35941  TCGCGCCCTT  CAGTTTCGGC  ACCCACGTCA  CCATCGACGC  CCGGATGGTC  GCACCTCGCC36001  CCGCGGCGCT  GACGGCCGCG  CAGGCAGCCG  CGCTGCCCGT  CGCATTCATG  ACGGCCTGGT36061  ACGGTCTCGT  CCATCTGGGG  AGGCTCCGGG  CCGGCGAGCG  CGTGCTCATC  CACTCGGCGA36121  CGGGGGGCAC  CGGGCTCGCT  GCTGTGCAGA  TCGCCCGCCA  CCTCGGCGCG  GAGATATTTG36181  CGACCGCTGG  TACGCCGGAG  AAGCGGGCGT  GGCTGCGCGA  GCAGGGGATC  GCGCACGTGA36241  TGGACTCGCG  GTCGCTGGAC  TTCGCCGAGC  AAGTGCTGGC  CGCGACGAAG  GGCGAGGGGG36301  TCGACGTCGT  GTTGAACTCG  CTGTCTGGCG  CCGCGATCGA  CGCGAGCCTT  GCGACCCTCG36361  TGCCGGACGG  CCGCTTCATC  GAGCTCGGCA  AGACGGACAT  CTATGCAGAT  CGCTCGCTGG36421  GGCTCGCTCA  CTTTAGGAAG  AGCCTGTCCT  ACAGCGCCGT  CGATCTTGCG  GGTTTGGCCG36481  TGCGTCGGCC  CGAGCGCGTC  GCAGCGCTGC  TGGCGGAGGT  GGTGGACCTG  CTCGCACGGG36541  GAGCGCTGCA  GCCGCTTCCG  GTAGAGATCT  TCCCCCTCTC  GCGGGCCGCG  GACGCGTTCC36601  GGAAAATGGC  GCAAGCGCAG  CATCTCGGGA  AGCTCGTGCT  CGCGCTGGAG  GACCCGGACG36661  TGCGGATCCG  CGTTCCGGGC  GAATCCGGCG  TCGCCATCCG  CGCGGACGGC  ACCTACCTCG36721  TGACCGGCGG  TCTGGGTGGG  CTCGGTCTGA  GCGTGGCTGG  ATGGCTGGCC  GAGCAGGGGG36781  CTGGGCATCT  GGTGCTGGTG  GGCCGCTCCG  GTGCGGTGAG  CGCGGAGCAG  CAGACGGCTG36841  TCGCCGCGCT  CGAGGCGCAC  GGCGCGCGTG  TCACGGTAGC  GAGGGCAGAC  GTCGCCGATC36901  GGGCGCAGAT  CGAGCGGATC  CTCCGCGAGG  TTACCGCGTC  GGGGATGCCG  CTCCGCGGCG36961  TCGTTCATGC  GGCCGGTATC  CTGGACGACG  GGCTGCTGAT  GCAGCAAACC  CCCGCGCGGT37021  TCCGCGCGGT  CATGGCGCCC  AAGGTCCGAG  GGGCCTTGCA  CCTGCATGCG  TTGACACGCG37081  AAGCGCCGCT  CTCCTTCTTC  GTGCTGTACG  CTTCGGGAGC  AGGGCTCTTG  GGCTCGCCGG37141  GCCAGGGCAA  CTACGCCGCG  GCCAACACGT  TCCTCGACGC  TCTGGCACAC  CACCGGAGGG37201  CGCAGGGGCT  GCCAGCATTG  AGCATCGACT  GGGGCCTGTT  CGCGGACGTG  GGTTTGGCCG37261  CCGGGCAGCA  AAATCGCGGC  GCACGGCTGG  TCACCCGCGG  GACGCGGAGC  CTCACCCCCG37321  ACGAAGGGCT  GTGGGCGCTC  GAGCGTCTGC  TCGACGGCGA  TCGCACCCAG  GCCGGGGTCA37381  TGCCGTTCGA  CGTGCGGCAG  TGGGTGGAGT  TCTACCCGGC  GGCGGCATCT  TCGCGGAGGT37441  TGTCGCGGCT  GGTGACGGCA  CGGCGCGTGG  CTTCCGGTCG  GCTCGCCGGG  GATCGGGACC37501  TGCTCGAACG  GCTCGCCACC  GCCGAGGCGG  GCGCGCGGGC  AGGAATGCTG  CAGGAGGTCG37561  TGCGCGCGCA  GGTCTCGCAG  GTGCTGCGCC  TCCCCGAAGG  CAAGCTCGAC  GTGGATGCGC37621  CGCTCACGAG  CCTGGGAATG  GACTCGCTGA  TGGGGCTAGA  GCTGCGCAAC  CGCATCGAGG37681  CCGTGCTCGG  CATCACCATG  CCGGCGACCC  TGCTGTGGAC  CTACCCCACG  GTGGCAGCGC37741  TGAGTGCGCA  TCTGGCTTCT  CATGTCGTCT  CTACGGGGGA  TGGGGAATCC  GCGCGCCCGC37801  CGGATACAGG  GAACGTGGCT  CCAATGACCC  ACGAAGTCGC  TTCGCTCGAC  GAAGACGGGT37861  TGTTCGCGTT  GATTGATGAG  TCACTCGCGC  GTGCGGGAAA  GAGGTGATTG  CGTGACAGAC37921  CGAGAAGGCC  AGCTCCTGGA  GCGCTTGCGT  GAGGTTACTC  TGGCCCTTCG  CAAGACGCTG37981  AACGAGCGCG  ATACCCTGGA  GCTCGAGAAG  ACCGAGCCGA  TCGCCATCGT  GGGGATCGGC38041  TGCCGCTTCC  CCGGCGGAGC  GGGCACTCCG  GAGGCGTTCT  GGGAGCTGCT  CGACGACGGG38101  CGCGACGCGA  TCCGGCCGCT  CGAGGAGCGC  TGGGCGCTCG  TAGGTGTCGA  CCCAGGCGAC38161  GACGTACCGC  GCTGGGCGGG  GCTGCTCACC  GAAGCCATCG  ACGGCTTCGA  CGCCGCGTTC38221  TTCGGTATCG  CCCCCCGGGA  GGCACGGTCG  CTCGACCCGC  AGCATCGCTT  GCTGCTGGAG38281  GTCGCCTGGG  AGGGGTTCGA  AGACGCCGGC  ATCCCGCCTA  GGTCCCTCGT  CGGGAGCCGC38341  ACCGGCGTGT  TCGTCGGCGT  CTGCGCCACG  GAGTATCTCC  ACGCCGCCGT  CGCGCACCAG38401  CCGCGCGAAG  AGCGGGACGC  GTACAGCACC  ACCGGCAACA  TGCTCAGCAT  CGCCGCCGGA38461  CGGCTATCGT  ACACGCTGGG  GCTGCAGGGA  CCTTGCCTGA  CCGTCGACAC  GGCGTGCTCG38521  TCATCGCTGG  TGGCCATTCA  CCTCGCCTGC  CGCAGCCTGC  GCGCTCGAGA  GAGCGATCTC38581  GCGCTGGCGG  GAGGGGTCAA  CATGCTTCTC  TCCCCCGACA  CGATGCGAGC  TCTGGCGCGC38641  ACCCAGGCGC  TGTCGCCCAA  TGGCCGTTGC  CAGACCTTCG  ACGCGTCGGC  CAACGGGTTC38701  GTCCGTGGGG  AGGGCTGCGG  TCTGATCGTG  CTCAAGCGAT  TGAGCGACGC  GCGGCGGGAT38761  GGGGACCGGA  TCTGGGCGCT  GATCCGAGGA  TCGGCCATCA  ATCAGGACGG  CCGGTCGACG38821  GGGTTGACGG  CGCCCAACGT  GCTCGCCCAG  GGGGCGCTCT  TGCGCGAGGC  GCTGCGGAAC38881  GCCGGCGTCG  AGGCCGAGGC  CATCGGTTAC  ATCGAGACCC  ACGGGGCGGC  GACCTCGCTG38941  GGCGACCCCA  TCGAGATCGA  AGCGCTGCGC  ACCGTGGTGG  GGCCGGCGCG  AGCCGACGGA39001  GCGCGCTGCG  TGCTGGGCGC  GGTGAAGACC  AACCTCGGCC  ACCTGGAGGG  CGCTGCCGGC39061  GTGGCGGGCC  TGATCAAGGC  TACACTTTCG  CTACATCACG  AGCGCATCCC  GAGGAACCTC39121  AACTTTCGTA  CGCTCAATCC  GCGGATCCGG  ATCGAGGGGA  CCGCGCTCGC  GTTGGCGACC39181  GAACCGGTGC  CCTGGCCGCG  GACGGGCCGG  ACGCGCTTCG  CGGGAGTGAG  CTCGTTCGGG39241  ATGAGCGGGA  CCAACGCGCA  TGTGGTGTTG  GAGGAGGCGC  CGGCGGTGGA  GCCTGAGGCC39301  GCGGCCCCCG  AGCGCGCTGC  GGAGCTGTTC  GTCCTGTCGG  CGAAGAGCGT  GGCGGCGCTG39361  GATGCGCAGG  CAGCCCGGCT  GCGGGACCAC  CTGGAGAAGC  ATGTCGAGCT  TGGCCTCGGC39421  GATGTGGCGT  TCAGCCTGGC  GACGACGCGC  AGCGCGATGG  AGCACCGGCT  GGCGGTGGCC39481  GCGAGCTCGC  GCGAGGCGCT  GCGAGGGGCG  CTTTCGGCCG  CAGCGCAGGG  GCATACGCCG39541  CCGGGAGCCG  TGCGTGGGCG  GGCCTCCGGC  GGCAGCGCGC  CGAAGGTGGT  CTTCGTGTTT39601  CCCGGCCAGG  GCTCGCAGTG  GGTGGGCATG  GGCCGAAAGC  TCATGGCCGA  AGAGCCGGTC39661  TTCCGGGCGG  CGCTGGAGGG  TTGCGACCGG  GCCATCGAGG  CGGAAGCGGG  CTGGTCGCTG39721  CTCGGGGAGC  TCTCCGCCGA  CGAGGCCGCC  TCGCAGCTCG  GGCGCATCGA  CGTGGTTCAG39781  CCGGTGCTCT  TCGCCATGGA  AGTAGCGCTT  TCTGCGCTGT  GGCGGTCGTG  GGGAGTGGAG39841  CCGGAAGCGG  TGGTGGGCCA  CAGCATGGGC  GAGGTGGCGG  CGGCGCACGT  GGCCGGCGCG39901  CTGTCGCTCG  AGGACGCGGT  GGCGATCATC  TGCCGGCGCA  GCCGGCTGCT  GCGGCGGATC39961  AGCGGTCAGG  GCGAGATGGC  GCTGGTCGAG  CTGTCGCTGG  AGGAGGCCGA  GGCGGCGCTG40021  CGTGGCCATG  AGGGTCGGCT  GAGCGTGGCG  GTGAGCAACA  GCCCGCGCTC  GACCGTGCTC40081  GCAGGCGAGC  CGGCGGCGCT  CTCGGAGGTG  CTGGCGGCGC  TGACGGCCAA  GGGGGTGTTC40141  TGGCGGCAGG  TGAAGGTGGA  CGTCGCCAGC  CATAGCCCGC  AGGTCGACCC  GCTGCGCGAA40201  GAGCTGATCG  CGGCGCTGGG  GGCGATCCGG  CCGCGAGCGG  CTGCGGTGCC  GATGCGCTCG40261  ACGGTGACGG  GCGGGGTGAT  CGCGGGTCCG  GAGCTCGGTG  CGAGCTACTG  GGCGGACAAT40321  CTTCGGCAGC  CGGTGCGCTT  CGCTGCGGCG  GCGCAAGCGC  TGCTGGAAGG  TGGCCCCACG40381  CTGTTCATCG  AGATGAGCCC  GCACCCGATC  CTGGTGCCGC  CCCTGGACGA  GATCCAGACG40441  GCGGTCGAGC  AAGGGGGCGC  TGCGGTGGGC  TCGCTGCGGC  GAGGGCAGGA  CGAGCGCGCG40501  ACGCTGCTGG  AGGCGCTGGG  GACGCTGTGG  GCGTCCGGCT  ATCCGGTGAG  CTGGGCTCGG40561  CTGTTCCCCG  CGGGCGGCAG  GCGGGTTCCG  CTGCCGACCT  ATCCCTGGCA  GCACGAGCGG40621  TGCTGGATCG  AGGTCGAGCC  TGACGCCCGC  CGCCTCGCCG  CAGCCGACCC  CACCAAGGAC40681  TGGTTCTACC  GGACGGACTG  GCCCGAGGTG  CCCCGCGCCG  CCCCGAAATC  GGAGACAGCT40741  CATGGGAGCT  GGCTGCTGTT  GGCCGACAGG  GGTGGGGTCG  GCGAGGCGGT  CGCTGCAGCG40801  CTGTCGACGC  GCGGACTTTC  CTGCACCGTG  CTTCATGCGT  CGGCTGACGC  CTCCACCGTC40861  GCCGAGCAGG  TATCCGAAGC  TGCCAGTCGC  CGAAACGACT  GGCAGGGAGT  CCTCTACCTG40921  TGGGGCCTCG  ACGCCGTCGT  CGATGCTGGG  GCATCGGCCG  ACGAAGTCAG  CGAGGCTACC40981  CGCCGTGCCA  CCGCACCCGT  CCTTGGGCTG  GTTCGATTCC  TGAGCGCTGC  GCCCCATCCT41041  CCTCGCTTCT  GGGTGGTGAC  CCGCGGGGCA  TGCACGGTGG  GCGGCGAGCC  AGAGGTCTCT41101  CTTTGCCAAG  CGGCGTTGTG  GGGCCTCGCG  CGCGTCGTGG  CGCTGGAGCA  TCCCGCTGCC41161  TGGGGTGGCC  TCGTGGACCT  GGATCCTCAG  AAGAGCCCGA  CGGAGATCGA  GCCCCTGGTG41221  GCCGAGCTGC  TTTCGCCGGA  CGCCGAGGAT  CAACTGGCGT  TCCGCAGCGG  TCGCCGGCAC41281  GCAGCACGCC  TTGTAGCCGC  CCCGCCGGAG  GGCGACGTCG  CACCGATATC  GCTGTCCGCG41341  GAGGGAAGCT  ACCTGGTGAC  GGGTGGGCTG  GGTGGCCTTG  GTCTGCTCGT  GGCTCGGTGG41401  CTGGTGGAGC  GGGGAGCTCG  ACATCTGGTG  CTCACCAGCC  GGCACGGGCT  GCCAGAGCGA41461  CAGGCGTCGG  GCGGAGAGCA  GCCGCCGGAG  GCCCGCGCGC  GCATCGCAGC  GGTCGAGGGG41521  CTGGAAGCGC  AGGGCGCGCG  GGTGACCGTG  GCAGCGGTGG  ATGTCGCCGA  GGCCGATCCC41581  ATGACGGCGC  TGCTGGCCGC  CATCGAGCCC  CCGTTGCGCG  GGGTGGTGCA  CGCCGCCGGC41641  GTCTTCCCCG  TGCGTCCCCT  GGCGGAGACG  GACGAGGCCC  TGCTGGAGTC  GGTGCTCCGT41701  CCCAAGGTGG  CCGGGAGCTG  GCTGCTGCAC  CGGCTGCTGC  GCGACCGGCC  TCTCGACCTG41761  TTCGTGCTGT  TCTCGTCGGG  CGCGGCGGTG  TGGGGTGGCA  AAGGCCAAGG  CGCATACGCC41821  GCGGCCAATG  CGTTCCTCGA  CGGGCTCGCG  CACCATCGCC  GCGCGCACTC  CCTGCCGGCG41881  TTGAGCCTCG  CCTGGGGCCT  ATGGGCCGAG  GGAGGCGTGG  TTGATGCAAA  GGCTCATGCA41941  CGTCTGAGCG  ACATCGGAGT  CCTGCCCATG  GCCACGGGGC  CGGCCTTGTC  GGCGCTGGAG42001  CGCCTGGTGA  ACACCAGCGC  TGTCCAGCGT  TCGGTCACAC  GGATGGACTG  GGCGCGCTTC42061  GCGCCGGTCT  ATGCCGCGCG  AGGGCGGCGC  AACTTGCTTT  CGGCTCTGGT  CGCGGAGGAC42121  GAGCGCACTG  CGTCTCCCCC  GGTGCCGACG  GCAAACCGGA  TCTGGCGCGG  CCTGTCCGTT42181  GCGGAGAGCC  GCTCAGCCCT  CTACGAGCTC  GTTCGCGGCA  TCGTCGCCCG  GGTGCTGGGC42241  TTCTCCGACC  CGGGCGCGCT  CGACGTCGGC  CGAGGCTTCG  CCGAGCAGGG  GCTCGACTCC42301  CTGATGGCTC  TGGAGATCCG  TAACCGCCTT  CAGCGCGAGC  TGGGCGAACG  GCTGTCGGCG42361  ACTCTGGCCT  TCGACCACCC  GACGGTGGAG  CGGCTGGTGG  CGCATCTCCT  CACCGACGTG42421  CTGAAGCTGG  AGGACCGGAG  CGACACCCGG  CACATCCGGT  CGGTGGCGGC  GGATGACGAC42481  ATCGCCATCG  TCGGTGCCGC  CTGCCGGTTC  CCGGGCGGGG  ATGAGGGCCT  GGAGACATAC42541  TGGCGGCATC  TGGCCGAGGG  CATGGTGGTC  AGCACCGAGG  TGCCAGCCGA  CCGGTGGCGC42601  GCGGCGGACT  GGTACGACCC  CGATCCGGAG  GTTCCGGGCC  GGACCTATGT  GGCCAAGGGG42661  GCCTTCCTCC  GCGATGTGCG  CAGCTTGGAT  GCGGCGTTCT  TCTCCATCTC  CCCTCGTGAG42721  GCGATGAGCC  TGGACCCGCA  ACAGCGGCTG  TTGCTGGAGG  TGAGCTGGGA  GGCGATCGAG42781  CGCGCTGGCC  AGGACCCGAT  GGCGCTGCGC  GAGAGCGCCA  CGGGCGTGTT  CGTGGGCATG42841  ATCGGGAGCG  AGCACGCCGA  GCGGGTGCAG  GGCCTCGACG  ACGACGCGGC  GTTGCTGTAC42901  GGCACCACCG  GCAACCTGCT  CAGCGTCGCC  GCTGGACGGC  TGTCGTTCTT  CCTGGGTCTG42961  CACGGCCCGA  CGATGACGGT  GGACACCGCG  TGCTCGTCGT  CGCTGGTGGC  GTTGCACCTC43021  GCCTGCCAGA  GCCTGCGATT  GGGCGAGTGC  GACCAGGCAC  TGGCCGGCGG  GTCCAGCGTG43081  CTTTTGTCGC  CGCGGTCATT  CGTCGCGGCA  TCGCGCATGC  GTTTGCTTTC  GCCAGATGGG43141  CGGTGCAAGA  CGTTCTCGGC  CGCTGCAGAC  GGCTTTGCGC  GGGCCGAGGG  CTGCGCCGTG43201  GTGGTGCTCA  AGCGGCTCCG  TGACGCGCAG  CGCGACCGCG  ACCCCATCCT  GGCGGTGGTC43261  CGGAGCACGG  CGATCAACCA  CGATGGCCCG  AGCAGCGGGC  TCACGGTGCC  CAGCGGTCCT43321  GCCCAGCAGG  CGTTGCTAGG  CCAGGCGCTG  GCGCAAGCGG  GCGTGGCACC  GGCCGAGGTC43381  GATTTCGTGG  AGTGCCACGG  GACGGGGACA  GCGCTGGGTG  ACCCGATCGA  GGTGCAGGCG43441  CTGGGCGCGG  TGTATGGCCG  GGGCCGCCCC  GCGGAGCGGC  CGCTCTGGCT  GGGCGCTGTC43501  AAGGCCAACC  TCGGCCACCT  GGAGGCCGCG  GCGGGCTTGG  CCGGCGTGCT  CAAGGTGCTC43561  TTGGCGCTGG  AGCACGAGCA  GATTCCGGCT  CAACCGGAGC  TCGACGAGCT  CAACCCGCAC43621  ATCCCGTGGG  CAGAGCTGCC  AGTGGCCGTT  GTCCGCGCGG  CGGTCCCCTG  GCCGCGCGGC43681  GCGCGCCCGC  GTCGTGCAGG  CGTGAGCGCT  TTCGGCCTGA  GCGGGACCAA  CGCGCATGTG43741  GTGTTGGAGG  AGGCGCCGGC  GGTGGAGCCT  GAGGCCGCGG  CCCCCGAGCG  CGCTGCGGAG43801  CTGTTCGTCC  TGTCGGCGAA  GAGCGTGGCG  GCGCTGGATG  CGCAGGCAGC  CCGGCTGCGG43861  GATCATCTGG  AGAAGCATGT  CGAGCTTGGC  CTCGGCGATG  TGGCGTTCAG  CCTGGCGACG43921  ACGCGCAGCG  CGATGGAGCA  CCGGCTGGCG  GTGGCCGCGA  GCTCGCGCGA  GGCGCTGCGA43981  GGGGCGCTTT  CGGCCGCAGC  GCAGGGGCAT  ACGCCGCCGG  GAGCCGTGCG  TGGGCGGGCC44041  TCCGGCGGCA  GCGCGCCGAA  GGTGGTCTTC  GTGTTTCCCG  GCCAGGGCTC  GCAGTGGGTG44101  GGCATGGGCC  GAAAGCTCAT  GGCCGAAGAG  CCGGTCTTCC  GGGCGGCGCT  GGAGGGTTGC44161  GACCGGGCCA  TCGAGGCGGA  AGCGGGCTGG  TCGCTGCTCG  GGGAGCTCTC  CGCCGACGAG44221  GCCGCCTCGC  AGCTCGGGCG  CATCGACGTG  GTTCAGCCGG  TGCTCTTCGC  CGTGGAAGTA44281  GCGCTTTCAG  CGCTGTGGCG  GTCGTGGGGA  GTGGAGCCGG  AAGCGGTGGT  GGGCCACAGC44341  ATGGGCGAGG  TTGCGGCGGC  GCACGTGGCC  GGCGCGCTGT  CGCTCGAGGA  TGCGGTGGCG44401  ATCATCTGCC  GGCGCAGCCG  GCTGCTGCGG  CGGATCAGCG  GTCAGGGCGA  GATGGCGCTG44461  GTCGAGCTGT  CGCTGGAGGA  GGCCGAGGCG  GCGCTGCGTG  GCCATGAGGG  TCGGCTGAGC44521  GTGGCGGTGA  GCAACAGCCC  GCGCTCGACC  GTGCTCGCAG  GCGAGCCGGC  GGCGCTCTCG44581  GAGGTGCTGG  CGGCGCTGAC  GGCCAAGGGG  GTGTTCTGGC  GGCAGGTGAA  GGTGGACGTC44641  GCCAGCCATA  GCCCGCAGGT  CGACCCGCTG  CGCGAAGAGC  TGGTCGCGGC  GCTGGGAGCG44701  ATCCGGCCGC  GAGCGGCTGC  GGTGCCGATG  CGCTCGACGG  TGACGGGCGG  GGTGATTGCG44761  GGTCCGGAGC  TCGGTGCGAG  CTACTGGGCG  GACAATCTTC  GGCAGCCGGT  GCGCTTCGCT44821  GCGGCGGCGC  AAGCGCTGCT  GGAAGGTGGC  CCCACGCTGT  TCATCGAGAT  GAGCCCGCAC44881  CCGATCCTGG  TGCCGCCTCT  GGACGAGATC  CAGACGGCGG  TCGAGCAAGG  GGGCGCTGCG44941  GTGGGCTCGC  TGCGGCGAGG  GCAGGACGAG  CGCGCGACGC  TGCTGGAGGC  GCTGGGGACG45001  CTGTGGGCGT  CCGGCTATCC  GGTGAGCTGG  GCTCGGCTGT  TCCCCGCGGG  CGGCAGGCGG45061  GTTCCGCTGC  CGACCTATCC  CTGGCAGCAC  GAGCGGTACT  GGATCGAGGA  CAGCGTGCAT45121  GGGTCGAAGC  CCTCGCTGCG  GCTTCGGCAG  CTTCATAACG  GCGCCACGGA  CCATCCGCTG45181  CTCGGGGCTC  CATTGCTCGT  CTCGGCGCGA  CCCGGAGCTC  ACTTGTGGGA  GCAAGCGCTG45241  AGCGACGAGA  GGCTATCCTA  TCTTTCGGAA  CATAGGGTCC  ATGGCGAAGC  CGTGTTGCCC45301  AGCGCGGCGT  ATGTAGAGAT  GGCGCTCGCC  GCCGGCGTAG  ATCTCTATGG  CGCGGCGACG45361  CTGGTGCTGG  AGCAGCTGGC  GCTCGAGCGA  GCCCTCGCCG  TGCCTTCCGA  AGGCGGACGC45421  ATCGTGCAAG  TGGCCCTCAG  CGAAGAAGGG  CCCGGTCGGG  CCTCATTCCA  GGTATCGAGC45481  CGTGAGGAGG  CAGGTAGAAG  CTGGGTTCGG  CACGCCACGG  GGCACGTGTG  TAGCGACCAG45541  AGCTCAGCAG  TGGGAGCGTT  GAAGGAAGCT  CCGTGGGAGA  TTCAACAGCG  ATGTCCGAGC45601  GTCCTGTCGT  CGGAGGCGCT  CTATCCGCTG  CTCAACGAGC  ACGCCCTCGA  CTATGGCCCC45661  TGCTTCCAGG  GTGTGGAGCA  GGTGTGGCTC  GGCACGGGGG  AGGTGCTCGG  CCGGGTACGC45721  TTGCCAGAAG  ACATGGCATC  CTCAAGTGGC  GCCTATCGGA  TTCATCCCGC  CTTGTTGGAT45781  GCATGTTTTC  AAGTGCTGAC  CGCGCTGCTC  ACCACGCCGG  AATCCATCGA  GATTCGGAGG45841  CGGCTGACGG  ATCTCCACGA  ACCGGATCTC  CCGCGGTCCA  GGGCTCCGGT  GAATCAAGCG45901  GTGAGTGACA  CCTGGCTGTG  GGACGCCGCG  CTGGACGGTG  GACGGCGCCA  GAGCGCGAGC45961  GTGCCCGTCG  ACCTGGTGCT  CGGCAGCTTC  CACGCGAAGT  GGGAGGTCAT  GGATCGCCTC46021  GCGCAGACGT  ACATCATCCG  CACTCTCCGC  ACATGGAACG  TCTTCTGCGC  TGCTGGAGAG46081  CGTCACACGA  TAGACGAGTT  GCTCGTCAGG  CTCCAAATCT  CTGCTGTCTA  CAGGAAGGTC46141  ATCAAGCGAT  GGATGGATCA  CCTTGTCGCG  ATCGGCGTCC  TTGTAGGGGA  CGGAGAGCAT46201  CTTGTGAGCT  CTCAGCCGCT  GCCGGAGCAT  GATTGGGCGG  CGGTGCTCGA  GGAGGCCGCG46261  ACGGTGTTCG  CCGACCTCCC  AGTCCTACTT  GAGTGGTGCA  AGTTTGCCGG  GGAACGGCTC46321  GCGGACGTGT  TGACCGGGAA  GACGCTGGCG  CTCGAGATCC  TCTTCCCTGG  CGGCTCGTTC46381  GATATGGCGG  AGCGAATCTA  TCAAGATTCG  CCCATCGCCC  GTTACTCGAA  CGGCATCGTG46441  CGCGGTGTCG  TCGAGTCGGC  GGCGCGGGTG  GTAGCACCGT  CGGGAACGTT  CAGCATCTTG46501  GAGATCGGAG  CAGGGACGGG  CGCGACCACC  GCCGCCGTCC  TCCCGGTGTT  GCTGCCTGAC46561  CGGACAGAAT  ACCATTTCAC  CGATGTTTCT  CCGCTCTTCC  TTGCTCGTGC  GGAGCAAAGA46621  TTTCGAGATC  ATCCATTCCT  GAAGTATGGT  ATCCTGGATA  TCGACCAGGA  GCCAGCTGGC46681  CAGGGATACG  CACATCAGAA  GTTCGACGTC  ATCGTCGCGG  CCAACGTCAT  CCATGCGACC46741  CGCGATATAA  GAGCCACGGC  GAAGCGTCTC  CTGTCGTTGC  TCGCGCCCGG  AGGCCTTCTG46801  GTGCTGGTCG  AGGGCACAGG  GCATCCGATC  TGGTTCGATA  TCACCACGGG  ATTGATCGAG46861  GGGTGGCAGA  AGTACGAAGA  TGATCTTCGT  ACCGACCATC  CGCTCCTGCC  TGCTCGGACC46921  TGGTGTGACG  TCCTGCGCCG  GGTAGGCTTT  GCGGATGCCG  TGAGTCTGCC  AGGCGACGGA46981  TCTCCGGCGG  GGATCCTCGG  ACAGCACGTG  ATCCTCTCGC  GCGCTCCGGG  CATAGCAGGA47041  GCCGCTTGTG  ACAGCTCCGG  TGAGTCGGCG  ACCGAATCGC  CGGCCGCGCG  TGCAGTACGG47101  CAGGAATGGG  CCGATGGCTC  CGCTGACGGC  GTCCATCGGA  TGGCGTTGGA  GAGAATGTAC47161  TTCCACCGCC  GGCCGGGCCG  GCAGGTTTGG  GTCCACGGTC  GATTGCGTAC  CGGTGGAGGC47221  GCGTTCACGA  AGGCGCTCAC  TGGAGATCTG  CTCCTGTTCG  AAGAGACCGG  GCAGGTCGTG47281  GCAGAGGTTC  AGGGGCTCCG  CCTGCCGCAG  CTCGAGGCTT  CTGCTTTCGC  GCCGCGGGAC47341  CCGCGGGAAG  AGTGGTTGTA  CGCGTTGGAA  TGGCAGCGCA  AAGACCCTAT  ACCAGAGGCT47401  CCGGCAGCCG  CGTCTTCTTC  CACCGCGGGG  GCTTGGCTCG  TGCTGATGGA  CCAGGGCGGG47461  ACAGGCGCTG  CGCTCGTATC  GCTGCTGGAA  GGGCGAGGCG  AGGCGTGCGT  GCGCGTCGTC47521  GCGGGTACGG  CATACGCCTG  CCTCGCGCCG  GGGCTGTATC  AAGTCGATCC  GGCGCAGCCA47581  GATGGCTTTC  ATACCCTGCT  CCGCGATGCA  TTCGGCGAGG  ACCGGATGTG  CCGCGCGGTA47641  GTGCATATGT  GGAGCCTTGA  TGCGAAGGCA  GCAGGGGAGA  GGACGACAGC  GGAGTCGCTT47701  CAGGCCGATC  AACTCCTGGG  GAGCCTGAGC  GCGCTTTCTC  TGGTGCAGGC  GCTGGTGCGC47761  CGGAGGTGGC  GCAACATGCC  GCGACTTTGG  CTCTTGACCC  GCGCCGTGCA  TGCGGTGGGC47821  GCGGAGGACG  CAGCGGCCTC  GGTGGCGCAG  GCGCCGGTGT  GGGGCCTCGG  TCGGACGCTC47881  GCGCTCGAGC  ATCCAGAGCT  GCGGTGCACG  CTCGTGGACG  TGAACCCGGC  GCCGTCTCCA47941  GAGGACGCAG  CTGCACTCGC  GGTGGAGCTC  GGGGCGAGCG  ACAGAGAGGA  CCAGATCGCA48001  TTGCGCTCGA  ATGGCCGCTA  CGTGGCGCGC  CTCGTGCGGA  GCTCCTTTTC  CGGCAAGCCT48061  GCTACGGATT  GCGGCATCCG  GGCGGACGGC  AGTTATGTGA  TCACCGATGG  CATGGGGAGA48121  GTGGGGCTCT  CGGTCGCGCA  ATGGATGGTG  ATGCAGGGGG  CCCGCCATGT  GGTGCTCGTG48181  GATCGCGGCG  GCGCTTCCGA  CGCCTCCCGG  GATGCCCTCC  GGTCCATGGC  CGAGGCTGGC48241  GCAGAGGTGC  AGATCGTGGA  GGCCGACGTG  GCTCGGCGCG  TCGATGTCGC  TCGGCTTCTC48301  TCGAAGATCG  AACCGTCGAT  GCCGCCGCTT  CGGGGGATCG  TGTACGTGGA  CGGGACCTTC48361  CAGGGCGACT  CCTCGATGCT  GGAGCTGGAT  GCCCATCGCT  TCAAGGAGTG  GATGTATCCC48421  AAGGTGCTCG  GAGCGTGGAA  CCTGCACGCG  CTGACCAGGG  ATAGATCGCT  GGACTTCTTC48481  GTCCTGTACT  CCTCGGGCAC  CTCGCTTCTG  GGCTTGCCCG  GACAGGGGAG  CCGCGCCGCC48541  GGTGACGCCT  TCTTGGACGC  CATCGCGCAT  CACCGGTGTA  GGCTGGGCCT  CACAGCGATG48601  AGCATCAACT  GGGGATTGCT  CTCCGAAGCA  TCATCGCCGG  CGACCCCGAA  CGACGGCGGC48661  GCACGGCTCC  AATACCGGGG  GATGGAAGGT  CTCACGCTGG  AGCAGGGAGC  GGAGGCGCTC48721  GGGCGCTTGC  TCGCACAACC  CAGGGCGCAG  GTAGGGGTAA  TGCGGCTGAA  TCTGCGCCAG48781  TGGCTGGAGT  TCTATCCCAA  CGCGGCCCGA  CTGGCGCTGT  GGGCGGAGTT  GCTGAA6GAG48841  CGTGACCGCA  CCGACCGGAG  CGCGTCGAAC  GCATCGAACC  TGCGCGAGGC  GCTGCAGAGC48901  GCCAGGCCCG  AAGATCGTCA  GTTGGTTCTG  GAGAAGCACT  TGAGCGAGCT  GTTGGGGCGG48961  GGGCTGCGCC  TTCCGCCGGA  GAGGATCGAG  CGGCACGTGC  CGTTCAGCAA  TCTCGGCATG49021  GACTCGTTGA  TAGGCCTGGA  GCTCCGCAAC  CGCATCGAGG  CCGCGCTCGG  CATCACCGTG49081  CCGGCGACCC  TGCTATGGAC  TTACCCTACC  GTAGCAGCTC  TGAGCGGGAA  CCTGCTAGAT49141  ATTCTGTTCC  CGAATGCCGG  CGCGACTCAC  GCTCCGGCCA  CCGAGCGGGA  GAAGAGCTTC49201  GAGAACGATG  CCGCAGATCT  CGAGGCTCTG  CGGGGTATGA  CGGACGAGCA  GAAGGACGCG49261  TTGCTCGCCG  AAAAGCTGGC  GCAGCTCGCG  CAGATCGTTG  GTGAGTAAGG  GACTGAGGGA49321  GTATGGCGAC  CACGAATGCC  GGGAAGCTTG  AGCATGCCCT  TCTGCTCATG  GACAAGCTTG49381  CGAAAAAGAA  CGCGTCTTTG  GAGCAAGAGC  GGACCGAGCC  GATCGCCATC  ATAGGTATTG49441  GCTGCCGCTT  CCCCGGCGGA  GCGGACACTC  CGGAGGCATT  CTGGGAGCTG  CTCGACTCGG49501  GCCGAGACGC  GGTCCAGCCG  CTCGACCGGC  GCTGGGCGCT  GGTCGGCGTC  CATCCCAGCG49561  AGGAGGTGCC  GCGCTGGGCC  GGACTGCTCA  CCGAGGCGGT  GGACGGCTTC  GACGCCGCGT49621  TCTTTGGCAC  CTCGCCTCGG  GAGGCGCGGT  CGCTCGATCC  TCAGCAACGC  CTGCTGCTGG49681  AGGTCACCTG  GGAAGGGCTC  GAGGACGCCG  GCATCGCACC  CCAGTCCCTC  GACGGCAGCC49741  GCACCGGGGT  ATTCCTGGGC  GCATGCAGCA  GCGACTACTC  GCATACCGTT  GCGCAACAGC49801  GGCGCGAGGA  GCAGGACGCG  TACGACATCA  CCGGCAATAC  GCTCAGCGTC  GCCGCCGGAC49861  GGTTGTCTTA  TACGCTAGGG  CTGCAGGGAC  CCTGCCTGAC  CGTCGACACG  GCCTGCTCGT49921  CGTCGCTCGT  GGCCATCCAC  CTTGCCTGCC  GCAGCCTGCG  CGCTCGCGAG  AGCGATCTCG49981  CGCTGGCGGG  GGGCGTCAAC  ATGCTCCTTT  CGTCCAAGAC  GATGATAATG  CTGGGGCGCA50041  TCCAGGCGCT  GTCGCCCGAT  GGCCACTGCC  GGACATTCGA  CGCCTCGGCC  AACGGGTTCG50101  TCCGTGGGGA  GGGCTGCGGT  ATGGTCGTGC  TCAAACGGCT  CTCCGACGCC  CAGCGACATG50161  GCGATCGGAT  CTGGGCTCTG  ATCCGGGGTT  CGGCCATGAA  TCAGGATGGC  CGGTCGACAG50221  GGTTGATGGC  ACCCAATGTG  CTCGCTCAGG  AGGCGCTCTT  ACGCCAGGCG  CTGCAGAGCG50281  CTCGCGTCGA  CGCCGGGGCC  ATCGATTATG  TCGAGACCCA  CGGAACGGGG  ACCTCGCTCG50341  GCGACCCGAT  CGAGGTCGAT  GCGCTGCGTG  CCGTGATGGG  GCCGGCGCGG  GCCGATGGGA50401  GCCGCTGCGT  GCTGGGCGCA  GTGAAGACCA  ACCTCGGCCA  CCTGGAGGGC  GCTGCAGGCG50461  TGGCGGGTTT  GATCAAGGCG  GCGCTGGCTC  TGCACCACGA  ATCGATCCCG  CGAAACCTCC50521  ATTTTCACAC  GCTCAATCCG  CGGATCCGGA  TCGAGGGGAC  CGCGCTCGCG  CTGGCGACGG50581  AGCCGGTGCC  GTGGCCGCGG  GCGGGCCGAC  CGCGCTTCGC  GGGGGTGAGC  GCGTTCGGCC50641  TCAGCGGCAC  CAACGTCCAT  GTCGTGCTGG  AGGAGGCGCC  GGCCACGGTG  CTCGCACCGG50701  CGACGCCGGG  GCGCTCAGCA  GAGCTTTTGG  TGCTGTCGGC  GAAGAGCACC  GCCGCGCTGG50761  ACGCACAGGC  GGCGCGGCTC  TCAGCGCACA  TCGCCGCGTA  CCCGGAGCAG  GGCCTCGGAG50821  ACGTCGCGTT  CAGCCTGGTA  GCGACGCGGA  GCCCGATGGA  GCACCGGCTC  GCGGTGGCGG50881  CGACCTCGCG  CGAGGCGCTG  CGAAGCGCGC  TGGAAGCTGC  GGCGCAGGGG  CAGACCCCGG50941  CAGGCGCGGC  GCGCGGCAGG  GCCGCTTCCT  CGCCCGGCAA  GCTCGCCTTC  CTGTTCGCCG51001  GGCAGGGCGC  GCAGGTGCCG  GGCATGGGCC  GTGGGTTGTG  GGAGGCGTGG  CCGGCGTTCC51061  GCGAGACCTT  CGACCGGTGC  GTCACGCTCT  TCGACCGGGA  GCTCCATCAG  CCGCTCTGCG51121  AGGTGATGTG  GGCCGAGCCG  GGCAGCAGCA  GGTCGTCGTT  GCTGGACCAG  ACGGCATTCA51181  CCCAGCCGGC  GCTCTTTGCG  CTGGAGTACG  CGCTGGCCGC  GCTCTTCCGG  TCGTGGGGCG51241  TGGAGCCGGA  GCTCATCGCT  GGCCATAGCC  TCGGCGAGCT  GGTGGCCGCC  TGCGTGGCGG51301  GTGTGTTCTC  CCTCGAGGAC  GCCGTGCGCT  TGGTGGTCGC  GCGCGGCCGG  TTGATGCAGG51361  CGCTGCCGGC  CGGCGGTGCG  ATGGTATCGA  TCGCCGCGCC  GGAGGCCGAC  GTGGCTGCCG51421  CGGTGGCGCC  GCACGCAGCG  TCGGTGTCGA  TCGCGGCAGT  CAATGGGCCG  GAGCAGGTGG51481  TGATCGCGGG  CGCCGAGAAA  TTCGTGCAGC  AGATCGCGGC  GGCGTTCGCG  GCGCGGGGGG51541  CGCGAACCAA  ACCGCTGCAT  GTTTCGCACG  CGTTCCACTC  GCCGCTCATG  GATCCGATGC51601  TGGAGGCGTT  CCGGCGGGTG  ACCGAGTCGG  TGACGTATCG  GCGGCCTTCG  ATGGCGCTGG51661  TGAGCAACCT  GAGCGGGAAG  CCCTGCACGG  ATGAGGTGTG  CGCGCCGGGT  TACTGGGTGC51721  GTCACGCGCG  AGAGGCGGTG  CGCTTCGCGG  ACGGCGTGAA  GGCGCTGCAC  GCGGCCGGTG51781  CGGGCATCTT  CGTCGAGGTG  GGCCCGAAGC  CGGCGCTGCT  CGGCCTTTTG  CCGGCCTGCC51841  TGCCGGATGC  CAGGCCGGTG  CTGCTCCCAG  CGTCGCGCGC  CGGGCGTGAC  GAGGCTGCGA51901  GCGCGCTGGA  GGCGCTGGGT  GGGTTCTGGG  TCGTCGGTGG  ATCGGTCACC  TGGTCGGGTG51961  TCTTCCCTTC  GGGCGGACGG  CGGGTACCGC  TGCCAACCTA  TCCCTGGCAG  CGCGAGCGTT52021  ACTGGATCGA  AGCGCCGGTC  GATGGTGAGG  CGGACGGCAT  CGGCCGTGCT  CAGGCGGGGG52081  ACCACCCCCT  TCTGGGTGAA  GCCTTTTCCG  TGTCGACCCA  TGCCGGTCTG  CGCCTGTGGG52141  AGACGACGCT  GGACCGAAAG  CGGCTGCCGT  GGCTCGGCGA  GCACCGGGCG  CAGGGGGAGG52201  TCGTGTTTCC  TGGCGCCGGG  TACCTGGAGA  TGGCGCTGTC  GTCGGGGGCC  GAGATCTTGG52261  GCGATGGACC  GATCCAGGTC  ACGGATGTGG  TGCTCATCGA  GACGCTGACC  TTCGCGGGCG52321  ATACGGCGGT  ACCGGTCCAG  GTGGTGACGA  CCGAGGAGCG  ACCGGGACGG  CTGCGGTTCC52381  AGGTAGCGAG  TCGGGAGCCG  GGGGCACGTC  GCGCGTCCTT  CCGGATCCAC  GCCCGCGGCG52441  TGCTGCGCCG  GGTCGGGCGC  GCCGAGACCC  CGGCGAGGTT  GAACCTCGCC  GCCCTGCGCG52501  CCCGGCTTCA  TGCCGCCGTG  CCCGCTGCGG  CTATCTATGG  GGCGCTCGCC  GAGATGGGGC52561  TTCAATACGG  CCCGGCGTTG  CGGGGGCTCG  CCGAGCTGTG  GCGGGGTGAG  GGCGAGGCGC52621  TGGGCAGAGT  GAGACTGCCT  GAGTCCGCCG  GCTCCGCGAC  AGCCTACCAG  CTGCATCCGG52681  TGCTGCTGGA  CGCGTGCGTC  CAAATGATTG  TTGGCGCGTT  CGCCGATCGC  GATGAGGCGA52741  CGCCGTGGGC  GCCGGTGGAG  GTGGGCTCGG  TGCGGCTGTT  CCAGCGGTCT  CCTGGGGAGC52801  TATGGTGCCA  TGCGCGCGTC  GTGAGCGATG  GTCAACAGGC  CCCCAGCCGG  TGGAGCGCCG52861  ACTTTGAGTT  GATGGACGGT  ACGGGCGCGG  TGGTCGCCGA  GATCTCCCGG  CTGGTGGTGG52921  AGCGGCTTGC  GAGCGGTGTA  CGCCGGCGCG  ACGCAGACGA  CTGGTTCCTG  GAGCTGGATT52981  GGGAGCCCGC  GGCGCTCGAG  GGGCCCAAGA  TCACAGCCGG  CCGGTGGCTG  CTGCTCGGCG53041  AGGGTGGTGG  GCTCGGGCGC  TCGTTGTGCT  CAGCGCTGAA  GGCCGCCGGC  CATGTCGTCG53101  TCCACGCCGC  GGGGGACGAC  ACGAGCGCTG  CAGGAATGCG  CGCGCTCCTG  GCCAACGCGT53161  TCGACGGCCA  GGCCCCGACG  GCCGTGGTGC  ACCTCAGCAG  CCTCGACGGG  GGCGGCCAGC53221  TCGACCCGGG  GCTCGGGGCG  CAGGGCGCGC  TCGACGCGCC  CCGGAGCCCA  GATGTCGATG53281  CCGATGCCCT  CGAGTCGGCG  CTGATGCGTG  GTTGCGACAG  CGTGCTCTCC  CTGGTGCAAG53341  CGCTGGTCGG  CATGGACCTC  CGAAATGCGC  CGCGGCTGTG  GCTTTTGACC  CGCGGGGCTC53401  AGGCGGCCGC  CGCCGGCGAT  GTCTCCGTGG  TGCAAGCGCC  GCTGTTGGGG  CTGGGCCGCA53461  CCATCGCCTT  GGAGCACGCC  GAGCTGCGCT  GTATCAGCGT  CGACCTCGAT  CCAGCCCAGC53521  CTGAAGGGGA  AGCCGATGCT  TTGCTGGCCG  AGCTACTTGC  AGATGATGCC  GAGGAGGAGG53581  TCGCGCTGCG  CGGTGGCGAG  CGGTTTGTTG  CGCGGCTCGT  CCACCGGCTG  CCCGAGGCTC53641  AACGCCGGGA  GAAGATCGCG  CCCGCCGGTG  ACAGGCCGTT  CCGGCTAGAG  ATCGATGAAC53701  CCGGCGTGCT  GGACCAACTG  GTGCTCCGGG  CCACGGGGCG  GCGCGCTCCT  GGTCCGGGCG53761  AGGTCGAGAT  CGCCGTCGAA  GCGGCGGGGC  TCGACTCCAT  CGACATCCAG  CTGGCGGTGG53821  GCGTTGCTCC  CAATGACCTG  CCTGGAGGAG  AAATCGAGCC  GTCGGTGCTC  GGAAGCGAGT53881  GCGCCGGGCG  CATCGTCGCT  GTGGGCGAGG  GCGTGAACGG  CCTTGTGGTG  GGCCAGCCGG53941  TGATCGCCCT  TGCGGCGGGA  GTATTTGCTA  CCCATGTCAC  CACGTCGGCC  ACGCTGGTGT54001  TGCCTCGGCC  TCTGGGGCTC  TCGGCGACCG  AGGCGGCCGC  GATGCCCCTC  GCGTATTTGA54061  CGGCCTGGTA  CGCCCTCGAC  AAGGTCGCCC  ACCTGCAGGC  GGGGGAGCGG  GTGCTGATCC54121  GTGCGGAGGC  CGGTGGTATC  GGTCTTTGCG  CGGTGCGATG  GGCGCAGCGC  GTGGGCGCCG54181  AGGTGTATGC  GACCGCCGAC  ACGCCCGAGA  AACGTGCCTA  CCTGGAGTCG  CTGGGCGTGC54241  GGTACGTGAG  CGATTCCCGC  TCGGGCCGGT  TCGCCGCAGA  CGTGCATGCA  TGGACGGACG54301  GCGAGGGTGT  GGACGTCGTG  CTCGACTCGC  TTTCGGGCGA  GCACATCGAC  AAGAGCCTCA54361  TGGTCCTGCG  CGCCTGTGGC  CGCCTTGTGA  AGCTGGGCAG  GCGCGACGAC  TGCGCCGACA54421  CGCAGCCTGG  GCTGCCGCCG  CTCCTACGGA  ATTTTTCCTT  CTCGCAGGTG  GACTTGCGGG54481  GAATGATGCT  CGATCAACCG  GCGAGGATCC  GTGCGCTCCT  CGACGAGCTG  TTCGGGTTGG54541  TCGCAGCCGG  TGCCATCAGC  CCACTGGGGT  CGGGGTTGCG  CGTTGGCGGA  TCCCTCACGC54601  CACCGCCGGT  CGAGACCTTC  CCGATCTCTC  GCGCAGCCGA  GGCATTCCGG  AGGATGGCGC54661  AAGGACAGCA  TCTCGGGAAG  CTCGTGCTCA  CGCTGGACGA  CCCGGAGGTG  CGGATCCGCG54721  CTCCGGCCGA  ATCCAGCGTC  GCCGTCCGCG  CGGACGGCAC  CTACCTTGTG  ACCGGCGGTC54781  TGGGTGGGCT  CGGTCTGCGC  GTGGCCGGAT  GGCTGGCCGA  GCGGGGCGCG  GGGCAACTGG54841  TGCTGGTGGG  CCGCTCCGGT  GCGGCGAGCG  CAGAGCAGCG  AGCCGCCGTG  GCGGCGCTAG54901  AGGCCCACGG  CGCGCGCGTC  ACGGTGGCGA  AAGCGGATGT  CGCCGATCGG  TCACAGATCG54961  AGCGGGTCCT  CCGCGAGGTT  ACCGCGTCGG  GGATGCCGCT  GCGGGGTGTC  GTGCATGCGG55021  CAGGTCTTGT  GGATGACGGG  CTGCTGATGC  AGCAGACTCC  GGCGCGGCTC  CGCACGGTGA55081  TGGGACCTAA  GGTCCAGGGA  GCCTTGCACT  TGCACACGCT  GACACGCGAA  GCGCCTCTTT55141  CCTTCTTCGT  GCTGTACGCT  TCTGCAGCTG  GGCTGTTCGG  CTCGCCAGGC  CAGGGCAACT55201  ATGCCGCAGC  CAACGCGTTC  CTCGACGCCC  TTTCGCATCA  CCGCAGGGCG  CACGGCCTGC55261  CGGCGCTGAG  CATCGACTGG  GGCATGTTCA  CGGAGGTGGG  GATGGCCGTT  GCGCAAGAAA55321  ACCGTGGCGC  GCGGCTGATC  TCTCGCGGGA  TGCGGGGCAT  CACCCCCGAT  GAGGGTCTGT55381  CAGCTCTGGC  GCGCTTGCTC  GAGGGTGATC  GCGTGCAGAC  GGGGGTGATA  CCGATCACTC55441  CGCGGCAGTG  GGTGGAGTTC  TACCCGGCAA  CAGCGGCCTC  ACGGAGGTTG  TCGCGGCTGG55501  TGACCACGCA  GCGCGCGGTT  GCTGATCGGA  CCGCCGGGGA  TCGGGACCTG  CTCGAACAGC55561  TTGCCTCGGC  TGAGCCGAGC  GCGCGGGCGG  GGCTGCTGCA  GGACGTCGTG  CGCGTGCAGG55621  TCTCGCATGT  GCTGCGTCTC  CCTGAAGACA  AGATCGAGGT  GGATGCCCCG  CTCTCGAGCA55681  TGGGCATGGA  CTCGCTGATG  AGCCTGGAGC  TGCGCAACCG  CATCGAGGCT  GCGCTGGGCG55741  TCGCCGCGCC  TGCAGCCTTG  GGGTGGACGT  ACCCAACGGT  AGCAGCGATA  ACGCGCTGGC55801  TGCTCGACGA  CGCCCTCGCC  GTCCGGCTTG  GCGGCGGGTC  GGACACGGAC  GAATCGACGG55861  CAAGCGCCGG  ATCGTTCGTC  CACGTCCTCC  GCTTTCGTCC  TGTCGTCAAG  CCGCGGGCTC55921  GTCTCTTCTG  TTTTCACGGT  TCTGGCGGCT  CGCCCGAGGG  CTTCCGTTCC  TGGTCGGAGA55981  AGTCTGAGTG  GAGCGATCTG  GAAATCGTGG  CCATGTGGCA  CGATCGCAGC  CTCGCCTCCG56041  AGGACGCGCC  TGGTAAGAAG  TACGTCCAAG  AGGCGGCCTC  GCTGATTCAG  CACTATGCAG56101  ACGCACCGTT  TGCGTTAGTA  GGGTTCAGCC  TGGGTGTCCG  GTTCGTCATG  GGGACAGCCG56161  TGGAGCTCGC  TAGTCGTTCC  GGCGCACCGG  CTCCGCTGGC  CGTTTTTGCG  TTGGGCGGCA56221  GCTTGATCTC  TTCTTCAGAG  ATCACCCCGG  AGATGGAGAC  CGATATAATA  GCCAAGCTCT56281  TCTTCCGAAA  TGCCGCGGGT  TTCGTGCGAT  CCACCCAACA  AGTTCAGGCC  GATGCTCGCG56341  CAGACAAGGT  CATCACAGAC  ACCATGGTGG  CTCCGGCCCC  CGGGGACTCG  AAGGAGCCGC56401  CCTCGAAGAT  CGCGGTCCCT  ATCGTCGCCA  TCGCCGGCTC  GGACGATGTG  ATCGTGCCTC56461  CAAGCGACGT  TCAGGATCTA  CAATCTCGCA  CCACGGAGCG  CTTCTATATG  CATCTCCTTC56521  CCGGAGATCA  CGAGTTTCTC  GTCGATCGAG  GGCGCGAGAT  CATGCACATC  GTCGACTCGC56581  ATCTCAATCC  GCTGCTCGCC  GCGAGGACGA  CGTCGTCAGG  CCCCGCGTTC  GAGGCAAAAT56641  GATGGCAGCC  TCCCTCGGGC  GCGCGAGATG  GTTGGGAGCA  GCGTGGGTGC  TGGTGGCCGG56701  CGGCAGGCAG  CGGAGGCTCA  TGAGCCTTCC  TGGAAGTTTG  CAGCATAGGA  GATTTTATGA56761  CACAGGAGCA  AGCGAATCAG  AGTGAGACGA  AGCCTGCTTT  CGACTTCAAG  CCGTTCGCGC56821  CTGGGTACGC  GGAGGACCCG  TTTCCCGCGA  TCGAGCGCCT  GAGAGAGGCA  ACCCCCATCT56881  TCTACTGGGA  TGAAGGCCGC  TCCTGGGTCC  TCACCCGATA  CCACGACGTG  TCGGCGGTGT56941  TCCGCGACGA  ACGCTTCGCG  GTCAGTCGAG  AAGAATGGGA  ATCGAGCGCG  GAGTACTCGT57001  CGGCCATTCC  CGAGCTCAGC  GATATGAAGA  AGTACGGATT  GTTCGGGCTG  CCGCCGGAGG57061  ATCACGCTCG  GGTCCGCAAG  CTCGTCAACC  CATCGTTTAC  GTCACGCGCG  ATCGACCTGC57121  TGCGCGCCGA  AATACAGCGC  ACCGTCGACC  AGCTGCTCGA  TGCTCGCTCC  GGACAAGAGG57181  AGTTCGACGT  TGTGCGGGAT  TACGCGGAGG  GAATCCCGAT  GCGTGCGATC  AGCGCTCTGT57241  TGAAGGTTCC  GGCCGAGTGT  GACGAGAAGT  TCCGTCGCTT  CGGCTCGGCG  ACTGCGCGCG57301  CGCTCGGCGT  GGGTTTGGTG  CCCCGGGTCG  ATGAGGAGAC  CAAGACCCTG  GTCGCGTCCG57361  TCACCGAGGG  GCTCGCGCTG  CTCCATGGCG  TCCTCGATGA  GCGGCGCAGG  AACCCGCTCG57421  AAAATGACGT  CTTGACGATG  CTGCTTCAGG  CCGAGGCCGA  CGGCAGCAGG  CTGAGCACGA57481  AGGAGCTGGT  CGCGCTCGTG  GGTGCGATTA  TCGCTGCTGG  CACCGATACC  ACGATCTACC57541  TTATCGCGTT  CGCTGTGCTC  AACCTGCTGC  GGTCGCCCGA  GGCGCTCGAG  CTGGTGAAGG57601  CCGAGCCCGG  GCTCATGAGG  AACGCGCTCG  ATGAGGTGCT  CCGCTTCGAC  AATATCCTCA57661  GAATAGGAAC  TGTGCGTTTC  GCCAGGCAGG  ACCTGGAGTA  CTGCGGGGCA  TCGATCAAGA57721  AAGGGGAGAT  GGTCTTTCTC  CTGATCCCGA  GCGCCCTGAG  AGATGGGACT  GTATTCTCCA57781  GGCCAGACGT  GTTTGATGTG  CGACGGGACA  CGAGCGCGAG  CCTCGCGTAC  GGTAGAGGCC57841  CCCATGTCTG  CCCCGGGGTG  TCCCTTGCTC  GCCTCGAGGC  GGAGATCGCC  GTGGGCACCA57901  TCTTCCGTAG  GTTCCCCGAG  ATGAAGCTGA  AAGAAACTCC  CGTGTTTGGA  TACCACCCCG57961  CGTTCCGGAA  CATCGAATCA  CTCAACGTCA  TCTTGAAGCC  CTCCAAAGCT  GGATAACTCG58021  CGGGGGCATC  GCTTCCCGAA  CCTCATTCTT  TCATGATGCA  ACTCGCGCGC  GGGTGCTGTC58081  TGCCGCGGGT  GCGATTCGAT  CCAGCGGACA  AGCCCATTGT  CAGCGCGCGA  AGATCGAATC58141  CACGGCCCGG  AGAAGAGCCC  GATGGCGAGC  CCGTCCGGGT  AACGTCGGAA  GAAGTGCCGG58201  GCGCCGCCCT  GGGAGCGCAA  AGCTCGCTCG  CTCGCGCTCA  GCGCGCCGCT  TGCCATGTCC58261  GGCCCTGCAC  CCGCACCGAG  GAGCCACCCG  CCCTGATGCA  CGGCCTCACC  GAGCGGCAGG58321  TTCTGCTCTC  GCTCGTCGCC  CTCGCGCTCG  TCCTCCTGAC  CGCGCGCGCC  TTCGGCGAGC58381  TCGCGCGGCG  GCTGCGCCAG  CCCGAGGTGC  TCGGCGAGCT  CTTCGGCGGC  GTGGTGCTGG58441  GCCCGTCCGT  CGTCGGCGCG  CTCGCTCCTG  GGTTCCATCG  AGTCCTCTTC  CAGGATCCGG58501  CGGTCGGGGG  CGTGCTCTCC  GGCATCTCCT  GGATAGGCGC  GCTCGTCCTG  CTGCTCATGG58561  CGGGTATCGA  GGTCGATGTG  AGCATTCTAC  GCAAGGAGGC  GCGCCCCGGG  GCGCTCTCGG58621  CGCTCGGCGC  GATCGCGCCC  CCGCTGCGCA  CGCCGGGCCC  GCTGGTGCAG  CGCATGCAGG58681  GCACGTTGAC  GTGGGATCTC  GACGTCTCGC  CGCGACGCTC  TGCGCAAGCC  TGAGCCTCGG58741  CGCCTGCTCG  TACACCTCGC  CGGTGCTCGC  TCCGCCCGCG  GACATCCGGC  CGCCCCCCGC58801  GGCCCAGCTC  GAGCCGGACT  CGCCGGATGA  CGAGGCCGAC  GAGGCGCTCC  GCCCGTTCCG58861  CGACGCGATC  GCCGCGTACT  CGGAGGCCGT  TCGGTGGGCG  GAGGCGGCGC  AGCGGCCGCG58921  GCTGGAGAGC  CTCGTGCGGC  TCGCGATCGT  GCGGCTGGGC  AAGGCGCTCG  ACAAGGCACC58981  TTTCGCGCAC  ACGACGGCCG  GCGTCTCCCA  GATCGCCGGC  AGACTTCCCC  AGAAAACGAA59041  TGCGGTCTGG  TTCGATGTCG  CCGCGCGGTA  CGCGAGCTTC  CGCGCGGCGA  CGGAGCACGC59101  GCTCCGCGAC  GCGGCGTCGG  CCACGGAGGC  GCTCGCGGCC  GGCCCGTACC  GCGGATCGAG59161  CAGCGTGTCC  GCTGCCGTAG  GGGAGTTTCG  GGGGGAGGCG  GCGCGCCTTC  ACCCCGCGGA59221  CCGCGTACCC  GCGTCCGACC  AGCAGATCCT  GACCGCGCTG  CGCGCAGCCG  AGCGGGCGCT59281  CATCGCGCTC  TACACCGCGT  TCGCCCGTGA  GGAGTGAGCC  TCTCTCGGGC  GCAGCCGAGC59341  GGCGGCGTGC  CGGTTGTTCC  CTCTTCGCAA  CCATGACCGG  AGCCGCGCCC  GGTCCGCGCA59401  GCGGCTAGCG  CGCGTCGAGG  CAGAGAGCGC  TGGAGCGACA  GGCGACGACC  CGCCCGAGGG59461  TGTCGAACGG  ATTGCCGCAG  CCCTCATTGC  GGATCCCCTC  CAGACACTCG  TTCAGCGCCT59521  TGGCGTCGAT  GCCGCCTGGG  CACTCGCCGA  AGGTCAGCTC  GTCGCGCCAG  TCGGATCGGA59581  TCTTGTTCGA  GCACGCATCC  TTGCTCGAAT  ACTCCCGGTC  TTGTCCGATG  TTGTTGCACC59641  GCGCCTCGCG  GTCGCACCGC  GCCGCCACGA  TGCTATCGAC  GGCGCTGCCG  ACTGGCACCG59701  GCGCCTCGCC  TTGCGCGCCA  CCCCGGGTTT  GCGCCTCCCC  GCCTGACCGC  TTTTCGCCGC59761  CGCACGCCGC  CGCGAGCAGG  CTCATTCCCG  ACATCGAGAT  CAGGCCCACG  ACCAGTTTCC59821  CAGCAATCTT  TTGCATGGCT  TCCCCTCCCT  CACGACACGT  CACATCAGAG  ATTCTCCGCT59881  CGGCTCGTCG  GTTCGACAGC  CGGCGACGGC  CACGAGCAGA  ACCGTCCCCG  ACCAGAACAG59941  CCGCATGCGG  GTTTCTCGCA  GCATGCCACG  ACATCCTTGC  GACTAGCGTG  CCTCCGCTCG60001  TGCCGAGATC  GGCTGTCCTG  TGCGACGGCA  ATGTCCTGCG  ATCGGCCGGG  CAGGATCGAC60061  CGACACGGGC  GCCGGGCTGG  AGGTGCCGCC  ACGGGCTCGA  AATGCGCTGT  GGCAGGCGCC60121  TCCATGCCCG  CTGCCGGGAA  CGCAGCGCCC  GGCCAGCCTC  GGGGCGACGC  TGCGAACGGG60181  AGATGCTCCC  GGAGAGGCGC  CGGGCACAGC  CGAGCGCCGT  CACCACCGTG  CGCACTCGTG60241  AGCGCTAGCT  CCTCGGCATA  GAAGAGACCG  TCACTCCCGG  TCCGTGTAGG  CGATCGTGCT60301  GATCAGCGCG  TCCTCCGCCT  GACGCGAGTC  GAGCCGGGTA  TGCTGCACGA  CGATGGGCAC60361  GTCCGATTCG  ATCACGCTGG  CATAGTCCGT  ATCGCGCGGG  ATCGGCTCGG  GGTCGGTCAG60421  ATCGTTGAAC  CGGACGTGCC  GGGTGCGCCT  CGCTGGAACG  GTCACCCGGT  ACGGCCCGGC60481  GGGGTCGCGG  TCGCTGAAGT  AGACGGTGAT  GGCGACCTGC  GCGTCCCGGT  CCGACGCATT60541  CAACAGGCAG  GCCGTCTCAT  GGCTCGTCAT  CTGCGGCTCA  GGTCCGTTGC  TCCGGCCTGG60601  GATGTAGCCC  TCTGCGATTG  CCCAGCGCGT  CCGCCCGATC  GGCTTGTCCA  TGTGTCCTCC60661  CTCCTGGCTC  CTCTTTGGCA  GCCTCCCTCT  GCTGTCCAGG  TGCGACGGCC  TCTTCGCTCG60721  ACGCGCTCGG  GGCTCCATGG  CTGAGAATCC  TCGCCGAGCG  CTCCTTGCCG  ACCGGCGCGC60781  TGAGCGCCGA  CGGGCCTTGA  AAGCACGCGA  CCGGACACGG  GATGCCGGCG  CGACGAGGCC60841  GCCCCGCGTC  TGATCCCGAT  CGTGGCATCA  CGACGTCCGC  CGACGCCTCG  GCAGGCCGGC60901  GTGAGCGCTG  CGCGGTCATG  GTCGTCCTCG  CGTCACCGCC  ACCCGCCGAT  TCACATCCCA60961  CCGCGGCACG  ACGCTTGCTC  AAACCGCGAC  GACACGGCCG  GGCGGCTGTG  GTACCGGCCA61021  GCCCGGACGC  GAGGCCCGAG  AGGGACAGTG  GGTCCGCCGT  GAAGCAGAGA  GGCGATCGAG61081  GTGGTGAGAT  GAAACACGTT  GACACGGGCC  GACGAGTCGG  CCGCCGGATA  GGGCTCACGC61141  TCGGTCTCCT  CGCGAGCATG  GCGCTCGCCG  GCTGCGGCGG  CCCGAGCGAG  AAGACCGTGC61201  AGGGCACGCG  GCTCGCGCCC  GGCGCCGATG  CGCACGTCAC  CGCCGACGTC  GACGCCGACG61261  CCGCGACCAC  GCGGCTGGCG  GTGGACGTCG  TTCACCTCTC  GCCGCCCGAG  CGGATCGAGG61321  CCGGCAGCGA  GCGGTTCGTC  GTCTGGCAGC  GTCCGAACTC  CGAGTCCCCG  TGGCTACGGG61381  TCGGAGTGCT  CGACTACAAC  GCTGCCAGCC  GAAGAGGCAA  GCTGGCCGAG  ACGACCGTGC61441  CGCATGCCAA  CTTCGAGCTG  CTCATCACCG  TCGAGAAGCA  GAGCAGCCCT  CAGTCGCCAT61501  CGTCTGCCGC  CGTCATCGGG  CCGACGTCCG  TCGGGTAACA  TCGCGCTATC  AGCAGCGCTG61561  AGCCCGCCAG  CATGCCCCAG  AGCCCTGCCT  CGATCGCTTT  CCCCATCATC  CGTGCGCACT61621  CCTCCAGCGA  CGGCCGCGTC  AAAGCAACCG  CCGTGCCGGC  GCGGCTCTAC  GTGCGCGACA61681  GGAGAGCGTC  CTAGCGCGGC  CTGCGCATCG  CTGGAAGGAT  CGGCGGAGCA  TGGAGAAAGA61741  ATCGAGGATC  GCGATCTACG  GCGCCGTCGC  CGCCAACGTG  GCGATCGCGG  CGGTCAAGTT61801  CATCGCCGCC  GCCGTGACCG  GCAGCTCTGC  GATGCTCTCC  GAGGGCGTGC  ACTCCCTCGT61861  CGATACCGCA  GACGGGCTCC  TCCTCCTGCT  CGGCAAGCAC  CGGAGCGCCC  GCCCGCCCGA61921  CGCCGAGCAT  CCGTTCGGCC  ACGGCAAGGA  GCTCTATTTC  TGGACGCTGA  TCGTCGCCAT61981  CATGATCTTC  GCCGCGGGCG  GCGGCGTCTC  GATCTACGAA  GGGATCTTGC  ACCTCTTGCA62041  CCCGCGCTCG  ATCGAGGATC  CGACGTGGAA  CTACGTTGTC  CTCGGCGCAG  CGGCCGTCTT62101  CGAGGGGACG  TCGCTCGCCA  TCTCGATCCA  CGAGTTCAAG  AAGAAAGACG  GACAGGGCTA62161  CGTCGCGGCG  ATGCGGTCCA  GCAAGGACCC  GACGACGTTC  ACGATCGTCC  TGGAGGATTC62221  CGCGGCGCTC  GCCGGGCTCG  CCATCGCCTT  CCTCGGCGTC  TGGCTTGGGC  ACCGCCTGGG62281  AAACCCCTAC  CTCGACGGCG  CGGCGTCGAT  CGGCATCGGC  CTCGTGCTCG  CCGCGGTCGC62341  GGTCTTCCTC  GCCAGCCAGA  GCCGTGGACT  CCTCGTAGGG  GAGAGCGCGG  ACAGGGAGCT62401  CCTCGCCGCG  ATCCGCGCGC  TCGCCAGCGC  AGATCCTGGC  GTGTCGGCGG  TGGGGCGGCC62461  CCTGACGATG  CACTTCGGTC  CGCACGAAGT  CCTGGTCGTG  CTGCGCATCG  AGTTCGACGC62521  CGCGCTCACG  GCGTCCGGGG  TCGCGGAGGC  GATCGAGCGA  ATCGAGACAC  GGATACGGAG62581  CGAGCGACCC  GACGTGAAGC  ACATCTACGT  CGAGGCCAGG  TCGCTCCACC  AGCGCGCGAG62641  GGCGTGACGC  GCCGTGGAGA  GACCGCTCGC  GGCCTCCGCC  ATCCTCCGCG  GCGCCCGGGC62701  TCGGGTAGCC  CTCGCAGCAG  GGCGCGCCTG  GCGGGCAAAC  CGTGAAGACG  TCGTCCTTCG62761  ACGCGAGGTA  CGCTGGTTGC  AAGTTGTCAC  GCCGTATCGC  GAGGTCCGGC  AGCGCCGGAG62821  CCCGGGCGGT  CCGGGCGCAC  GAAGGCCCGG  CGAGCGCGGG  CTTCGAGGGG  GCGACGTCAT62881  GAGGAAGGGC  AGGGCGCATG  GGGCGATGCT  CGGCGGGCGA  GAGGACGGCT  GGCGTCGCGG62941  CCTCCCCGGC  GCCGGCGCGC  TTCGCGCCGC  GCTCCAGCGC  GGTCGCTCGC  GCGATCTCGC63001  CCGGCGCCGG  CTCATCGCCG  CCGTGTCCCT  CACCGGCGGC  GCCAGCATGG  CGGTCGTCTC63061  GCTGTTCCAG  CTCGGGATCA  TCGAGCACCT  GCCCGATCCT  CCGCTTCCAG  GGTTCGATTC63121  GGCCAAGGTG  ACGAGCTCCG  ATATCGCGTT  CGGGCTCACG  ATGCCGGACG  CGCCGCTCGC63181  GCTCACCAGC  TTCGCGTCCA  ACCTGGCGCT  GGCTGGCTGG  GGAGGCGCCG  AGCGCGCCAG63241  GAACACCCCC  TGGATCCCCG  TCGCCGTGGC  GGCCAAGGCG  GCCGTCGAGG  CGGCCGTGTC63301  CGGATGGCTC  CTCGTCCAGA  TGCGACGGCG  GGAGAGGGCC  TGGTGCGCGT  ACTGCCTGGT63361  CGCCATGGCG  GCCAACATGG  CCGTGTTCGC  GCTCTCGCTC  CCGGAAGGGT  GGGCGGCGCT63421  GAGGAAGGCG  CGAGCGCGCT  CGTGACAGGG  CCGTGCGGGC  GCCGCGGCCA  TCGGAGGCCG63481  GCGTGCACCC  GCTCCGTCAC  GCCCCGGCCC  GCGCCGCGGT  GAGCTGCCGC  GGACAGGGCG63541  CGTACCGTGG  ACCCCGCACG  CGCCGCGTCG  ACGGACATCC  CCGGCGGCTC  GCGCGGCGCG63601  GCCGGCGCAA  CTCCGGCCCG  CCGCCGGGCA  TCGACATCTC  CCGCGAGCAA  GGGCACTCCG63661  CTCCTGCCCG  CGTCCGCGAA  CGATGGCTGC  GCTGTTTCCA  CCCTGGAGCA  ACTCCGTTTA63721  CCGCGTGGCG  CTCGTCGGGC  TCATCGCCTC  GGCGGGCGGC  GCCATCCTCG  CGCTCATGAT63781  CTACGTCCGC  ACGCCGTGGA  AGCGATACCA  GTTCGAGCCC  GTCGATCAGC  CGGTGCAGTT63841  CGATCACCGC  CATCACGTGC  AGGACGATGG  CATCGATTGC  GTCTACTGCC  ACACCACGGT63901  GACCCGCTCG  CCGACGGCGG  GGATGCCGCC  GACGGCCACG  TGCATGGGGT  GCCACAGCCA63961  GATCTGGAAT  CAGAGCGTCA  TGCTCGAGCC  CGTGCGGCGG  AGCTGGTTCT  CCGGCATGCC64021  GATCCCGTGG  AACCGGGTGA  ACTCCGTGCC  CGACTTCGTT  TATTTCAACC  ACGCGATTCA64081  CGTGAACAAG  GGCGTGGGCT  GCGTGAGCTG  CCACGGGCGC  GTGGACGAGA  TGGCGGCCGT64141  CTACAAGGTG  GCGCCGATGA  CGATGGGCTG  GTGCCTGGAG  TGCCATCGCC  TGCCGGAGCC64201  GCACCTGCGC  CCGCTCTCCG  CGATCACCGA  CATGCGCTGG  GACCCGGGGG  AACGGAGGGA64261  CGAGCTCGGG  GCGAAGCTCG  CGAAGGAGTA  CGGGGTCCGG  CGGCTCACGC  ACTGCACAGC64321  GTGCCATCGA  TGAACGATGA  ACAGGGGATC  TCCGTGAAAG  ACGCAGATGA  GATGAAGGAA64381  TGGTGGCTAG  AAGCGCTCGG  GCCGGCGGGA  GAGCGCGCGT  CCTACAGGCT  GCTGGCGCCG64441  CTCATCGAGA  GCCCGGAGCT  CCGCGCGCTC  GCCGCGGGCG  AACCGCCCCG  GGGCGTGGAC64501  GAGCCGGCGG  GCGTCAGCCG  CCGCGCGCTG  CTCAAGCTGC  TCGGCGCGAG  CATGGCGCTC64561  GCCGGCGTCG  CGGGCTGCAC  CCCGCATGAG  CCCGAGAAGA  TCCTGCCGTA  CAACGAGACC64621  CCGCCCGGCG  TCGTGCCGGG  TCTCTCCCAG  TCCTACGCGA  CGAGCATGGT  GCTCGACGGG64681  TATGCCATGG  GCCTCCTCGC  CAAGAGCTAC  GCGGGGCGGC  CCATCAAGAT  CGAGGGCAAC64741  CCCGCGCACC  CGGCGAGCCT  CGGCGCGACC  GGCGTCCACG  AGCAGGCCTC  GATCCTCTCG64801  CTGTACGACC  CGTACCGCGC  GCGCGCGCCG  ACGCGCGGCG  GCCAGGTCGC  GTCGTGGGAG64861  GCGCTCTCCG  CGCGCTTCGG  CGGCGACCGC  GAGGACGGCG  GCGCTGGCCT  CCGCTTCGTC64921  CTCCAGCCCA  CGAGCTCGCC  CCTCATCGCC  GCGCTGATCG  AGCGCGTCCG  GCGCAGGTTC64981  CCCGGCGCGC  GGTTCACCTT  CTGGTCGCCG  GTCCACGCCG  AGCAAGCGCT  CGAAGGCGCG65041  CGGGCGGCGC  TCGGCCTCAG  GCTCTTGCCT  CAGCTCGACT  TCGACCAGGC  CGAGGTGATC65101  CTCGCCCTGG  ACGCGGACTT  CCTCGCGGAC  ATGCCGTTCA  GCGTGCGCTA  TGCGCGCGAC65161  TTCGCCGCGC  GCCGCCGACC  CGCGAGCCCG  GCGGCGGCCA  TGAACCGCCT  CTACGTCGCG65221  GAGGCGATGT  TCACGCCCAC  GGGGACGCTC  GCCGACCACC  GGCTCCGCGT  GCGGCCCGCC65281  GAGGTCGCGC  GCGTCGCGGC  CGGCGTCGCG  GCGGAGCTCG  TGCACGGCCT  CGGCCTGCGC65341  CCGCGCGGGA  TCACGGACGC  CGACGCCGCC  GCGCTGCGCG  CGCTCCGCCC  CCCGGACGGC65401  GAGGGGCACG  GCGCCTTCGT  CCGGGCGCTC  GCGCGCGATC  TCGCGCGCGC  GGGGGGCGCC65461  GGCGTCGCCG  TCGTCGGCGA  CGGCCAGCCG  CCCATCGTCC  ACGCCCTCGG  GCACGTCATC65521  AACGCCGCGC  TCCGCAGCCG  GGCGGCCTGG  ATGGTCGATC  CTGTGCTGAT  CGACGCGGGC65581  CCCTCCACGC  AGGGCTTCTC  CGAGCTCGTC  GGCGAGCTCG  GGCGCGGCGC  GGTCGACACC65641  TGATCCTCCT  CGACGTGAAC  CCCGTGTACG  CCGCGCCGGC  CGACGTCGAT  TTCGCGGGCC65701  TCCTCGCGCG  CGTGCCCACG  AGCTTGAAGG  CCGGGCTCTA  CGACGACGAG  ACCGCCCGCG65761  CTTGCACGTG  GTTCGTGCCG  ACCCGGCATT  ACCTCGAGTC  GTGGGGGGAC  GCGCGGGCGT65821  ACGACGGGAC  GGTCTCGTTC  GTGCAACCCC  TCGTCCGGCC  GCTGTTCGAC  GGCCGGGCGG65881  TGCCCGAGCT  GCTCGCCGTC  TTCGCGGGGG  ACGAGCGCCC  GGATCCCCGG  CTGCTGCTGC65941  GCGAGCACTG  GCGCGGCGCG  CGCGGAGAGG  CGGATTTCGA  GGCCTTCTGG  GGCGAGGCAT66001  TGAAGCGCGG  CTTCCTCCCT  GACAGCGCCC  GGCCGAGGCA  GACACCGGAT  CTCGCGCCGG66061  CCGACCTCGC  CAAGGAGCTC  GCGCGGCTCG  CCGCCGCGCC  GCGGCCGGCC  GGCGGCGCGC66121  TCGACGTGGC  GTTCCTCAGG  TCGCCGTCGG  TCCACGACGG  CAGGTTCGCC  AACAACCCCT66181  GGCTGCAAGA  GCTCCCGCGG  CCGATCACCA  GGCTCACCTG  GGGCAACGCC  GCCATGATGA66241  GCGCGGCGAC  CGCGGCGCGG  CTCGGCGTCG  AGCGCGGCGA  TGTCGTCGAG  CTCGCGCTGC66301  GCGGCCGTAC  GATCGAGATC  CCGGCCGTCG  TCGTCCGCGG  GCACGCCGAC  GACGTGATCA66361  GCGTCGACCT  CGGCTACGGG  CGCGACGCCG  GCGAGGAGGT  CGCGCGCGGG  GTGGGCGTGT66421  CGGCGTATCG  GATCCGCCCG  TCCGACGCGC  GGTGGTTCGC  GGGGGGCCTC  TCCGTGAGGA66481  AGACCGGCGC  CACGGCCGCG  CTCGCGCTGG  CTCAGATCGA  GCTGTCCCAG  CACGACCGTC66541  CCATCGCGCT  CCGGAGGACG  CTGCCGCAGT  ACCGTGAACA  GCCCGGTTTC  GCGGAGGAGC66601  ACAAGGGGCC  GGTCCGCTCG  ATCCTGCCGG  AGGTCGAGTA  CACCGGCGCG  CAATGGGCGA66661  TGTCCATCGA  CATGTCGATC  TGCACCGGGT  GCTCCTCGTG  CGTCGTGGCC  TGTCAGGCCG66721  AGAACAACGT  CCTCGTCGTC  GGCAAGGAGG  AGGTGATGCA  CGGCCGCGAG  ATGCAGTGGT66781  TGCGGATCGA  TCAGTACTTC  GAGGGTGGAG  GCGACGAGGT  GAGCGTCGTC  AACCAGCCGA66841  TGCTCTGCCA  GCACTGCGAG  AAGGCGCCGT  GCGAGTACGT  CTGTCCGGTG  AACGCGACGG66901  TCCACAGCCC  CGATGGCCTC  AACGAGATGA  TCTACAACCG  ATGCATCGGG  ACGCGCTTTT66961  GCTCCAACAA  CTGTCCGTAC  AAGATCCGGC  GGTTCAATTT  CTTCGACTAC  AATGCCCACG67021  TCCCGTACAA  CGCCGGCCTC  CGCAGGCTCC  AGCGCAACCC  GGACGTCACC  GTCCGCGCCC67081  GCGGCGTCAT  GGAGAAATGC  ACGTACTGCG  TGCAGCGGAT  CCGAGAGGCG  GACATCCGCG67141  CGCAGATCGA  GCGGCGGCCG  CTCCGGCCGG  GCGAGGTGGT  CACCGCCTGC  CAGCAGGCCT67201  GTCCGACCGG  CGCGATCCAG  TTCGGGTCGC  TGGATCACGC  GGATACAAAG  ATGGTCGCGT67261  GGCGCAGGGA  GCCGCGCGCG  TACGCCGTGC  TCCACGACCT  CGGCACCCGG  CCGCGGACGG67321  AGTACCTCGC  CAAGATCGAG  AACCCGAACC  CGGGGCTCGG  GGCGGAGGGC  GCCGAGAGGC67381  GACCCGGAGC  CCCGAGCGTC  AAACCCGCGC  TCGGGGCGGA  GGGCGCCGAG  AGGCGACCCG67441  GAGCCCCGAG  CGTCAAACCG  GAGATTGAAT  GAGCCATGGC  GGGCCCGCTC  ATCCTGGACG67501  CACCGACCGA  CGATCAGCTG  TCGAAGCAGC  TCCTCGAGCC  GGTATGGAAG  CCGCGCTCCC67561  GGCTCGGCTG  GATGCTCGCG  TTCGGGCTCG  CGCTCGGCGG  CACGGGCCTG  CTCTTCCTCG67621  CGATCACCTA  CACCGTCCTC  ACCGGGATCG  GCGTGTGGGG  CAACAACATC  CCGGTCGCCT67681  GGGCCTTCGC  GATCACCAAC  TTCGTCTGGT  GGATCGGGAT  CGGCCACGCC  GGGACGTTCA67741  TCTCCGCGAT  CCTCCTCCTG  CTCGAGCAGA  AGTGGCGGAC  GAGCATCAAC  CGCTTCGCCG67801  AGGCGATGAC  GCTCTTCGCG  GTCGTCCAGG  CCGGCCTCTT  TCCGGTCCTC  CACCTCGGCC67861  GCCCCTGGTT  CGCCTACTGG  ATCTTCCCGT  ACCCCGCGAC  GATGCAGGTG  TGGCCGCAGT67921  TCCGGAGCGC  GCTGCCGTGG  GACGCCGCCG  CGATCGCGAC  CTACTTCACG  GTGTCGCTCC67981  TGTTCTGGTA  CATGGGCCTC  GTCCCGGATC  TGGCGGCGCT  GCGCGACCAC  GCCCCGGGCC68041  GCGTCCGGCG  GGTGATCTAC  GGGCTCATGT  CGTTCGGCTG  GCACGGCGCG  GCCGACCACT68101  TCCGGCATTA  CCGGGTGCTG  TACGGGCTGC  TCGCGGGGCT  CGCGACGCCC  CTCGTCGTCT68161  CGGTGCACTC  GATCGTGAGC  AGCGATTTCG  CGATCGCCCT  GGTGCCCGGC  TGGCACTCGA68221  CGCTCTTTCC  GCCGTTCTTC  GTCGCGGGCG  CGATCTTCTC  CGGGTTCGCG  ATGGTGCTCA68281  CGCTGCTCAT  CCCGGTGCGG  CGGATCTACG  GGCTCCATAA  CGTCGTGACC  GCGCGCCACC68341  TCGACGATCT  CGCGAAGATG  ACGCTCGTGA  CCGGCTGGAT  CGTCATCCTC  TCGTACATCA68401  TCGAGAACTT  CCTCGCCTGG  TACAGCGGCT  CGGCGTACGA  GATGCATCAG  TTTTTCCAGA68461  CGCGCCTGCA  CGGCCCGAAC  AGCGCCGCCT  ACTGGGCCCA  GCACGTCTGC  AACGTGCTCG68521  TCATCCAGCT  CCTCTGGAGC  GAGCGGATCC  GGACGAGCCC  CGTCGCGCTC  TGGCTCATCT68581  CCCTCCTGGT  CAACGTCGGG  ATGTGGAGCG  AGCGGTTCAC  GCTCATCGTG  ATGTCGCTCG68641  AGCAAGAGTT  CCTCCCGTCC  AAGTGGCACG  GCTACAGCCC  GACGTGGGTG  GACTGGAGCC68701  TCTTCATCGG  GTCAGGCGGC  TTCTTCATGC  TCCTGTTCCT  GAGCTTTTTG  CGCGTCTTTC68761  CGTTCATCCC  CGTCGCGGAG  GTCAAGGAGC  TCAACCATGA  AGAGCTGGAG  AAGGCTCGGG68821  GCGAGGGGGG  CCGCTGATGG  AGACCGGAAT  GCTCGGCGAG  TTCGATGACC  CGGAGGCGAT68881  GCTCCATGCG  ATCCGAGAGC  TCAGGCGGCG  CGGCTACCGC  CGGGTGGAAG  CGTTCACGCC68941  CTATCCGGTG  AAGGGGCTCG  ACGAGGCGCT  CGGCCTCCCG  CGCTCGAACC  TCAACCGGAT69001  GGTGCTGCCC  TTCGCGATCC  TGGGGGTCGT  GGGCGGCTAC  TTCGTCCAGT  GGTTCTGCAA69061  CGCTTTCCAC  TATCCGCTGA  ACGTGGGCGG  GCGCCCGCTG  AACTCGGCGC  CGGCGTTCAT69121  CCCGATCACG  TTCGAGATGG  GGGTGCTCTC  CACCTCGATC  TTCGGCGTGC  TCATCGGCTT69181  TTACCTGACG  AGGCTGCCGA  GGCTCTACCT  CCCGCTCTTC  GACGCCCCGG  GCTTCGAGCG69241  CGTCACGCTG  GATCGGTTTC  TGGTCGGGCT  CGACGACACG  GAACCTTCCT  TCTCGAGCGC69301  CCAGGCGGAG  CGCGACCTCC  TCGCGCTCGG  CGCCCGGCGC  GTCGTCGTCG  CGAGGAGGCG69361  CGAGGAGCCA  TGAGGGCCGG  CGCCCCGGCT  CGCCCTCTCG  GGCGCGCGCT  CGCGCCGTTC69421  GCCCTCGTCC  TGCTCGCCGG  GTGCCGCGAG  AAGGTGCTGC  CCGAGCCGGA  CTTCGAGCGG69481  ATGATCCGCC  AGGAGAAATA  CGGACTCTGG  GAGCCGTGCG  AGCACTTCGA  CGACGGCCGC69541  GCGATGCAGC  ACCCGCCCGA  GGGGACCGTC  GCGCGCGGGC  GCGTCACCGG  GCCGCCCGGC69601  TATCTCCAGG  GCGTCCTCGA  CGGGGCGTAC  GTCACGGAGG  TGCCGCTCTT  GCTCACGGTC69661  GAGCTCGTGC  AGCGCGGCCG  GCAGCGCTTC  GAGACCTTCT  GCGCGCCGTG  CCACGGGATC69721  CTCGGCGACG  GCAGCTCGCG  CGTGGCGACG  AACATGACGC  TGCGCCCGCC  CCCGTCGCTC69781  ATCGGACCCG  AGGCGCGGAG  CTTCCCGCCG  GGCAGGATCT  ACCAGGTCAT  CATCGAGGGC69841  TACGGCCTGA  TGCCGCGCTA  CTCGGACGAT  CTGCCCGACA  TCGAAGAGCG  CTGGGCCGTG69901  GTCGCCTACG  TGAAGGCGCT  TCAGCTGAGC  CGCGGAGTGG  CCGCGGGCGC  CCTCCCGCCA69961  GCGCTCCGCG  GCCGGGCAGA  GCAGGAGCTG  CGATGAACAG  GGATGCCATC  GAGTACAAGG70021  GCGGCGCGAC  GATCGCGGCC  TCGCTCGCGA  TCGCGGCGCT  CGGCGCGGTC  GCCGCGATCG70081  TCGGCGGCTT  CGTCGATCTC  CGCCGGTTCT  TCTTCTCGTA  CCTCGCCGCG  TGGTCGTTCG70141  CGGTGTTTCT  GTCCGTGGGC  GCGCTCGTCA  CGCTCCTCAC  CTGCAACGCC  ATGCGCGCGG70201  GCTGGCCCAC  GGCGGTGCGC  CGCCTCCTCG  AGACGATGGT  GGCGCCGCTG  CCTCTGCTCG70261  CGGCGCTCTC  CGCGCCGATC  CTGGTCGGCC  TGGACACGCT  GTATCCGTGG  ATGCACCCCG70321  AGCGGATCGC  CGGCGAGCAC  GCGCGGCGCA  TCCTCGAGCA  CAGGGCGCCC  TACTTCAATC70381  CAGGCTTCTT  CGTCGTGCGC  TCGGCGATCT  ACTTCGCGAT  CTGGATCGCC  GTCGCCCTCG70441  TGCTCCGCCG  GCGATCGTTC  GCGCAGGACC  GTGAGCCGAG  GGCCGACGTC  AAGGACGCGA70501  TGTATGGCCT  GAGCGGCGCC  ATGCTGCCGG  TCGTGGCGAT  CACGATCGTC  TTCTCGTCGT70561  TCGACTGGCT  CATGTCCCTC  GACGCGACCT  GGTACTCGAC  GATGTTCCCG  GTCTACGTGT70621  TCGCGAGCGC  CTTCGTGACC  GCCGTCGGCG  CGCTCACGGT  CCTCTCGTAT  GCCGCGCAGA70681  CGTCCGGCTA  CCTCGCGAGG  CTGAACGACT  CGCACTATTA  CGCGCTCGGG  CGGCTGCTCC70741  TCGCGTTCAC  GATATTCTGG  GCCTATGCGG  CCTATTTCCA  GTTCATGTTG  ATCTGGATCG70801  CGAACAAGCC  CGATGAGGTC  GCCTTCTTCC  TCGACCGCTG  GGAAGGGCCC  TGGCGGCCGA70861  CCTCCGTGCT  CGTCGTCCTC  ACGCGGTTCG  TCGTCCCGTT  CCTGATCCTG  ATGTCGTACG70921  CGATCAAGCG  GCGCCCGCGC  CAGCTCTCGT  GGATGGCGCT  CTGGGTCGTC  GTCTCCGGCT70981  ACATCGACTT  TCACTGGCTC  GTGGTGCCGG  CGACAGGGCG  CCACGGGTTC  GCCTATCACT71041  GGCTCGACCT  CGCGACCCTG  TGCGTCGTGG  GCGGCCTCTC  GACCGCGTTC  GCCGCGTGGC71101  GGCTGCGAGG  GCGGCCGGTG  GTCCCGGTCC  ACGACCCGCG  GCTCGAAGAG  GCCTTTGCGT71161  ACCGGAGCAT  ATGATGTTCC  GTTTCCGTCA  CAGCGAGGTT  CGCCAGGAGG  AGGACACGCT71221  CCCCTGGGGG  CGCGTGATCC  TCGCGTTCGC  CGTCGTGCTC  GCGATCGGCG  GCGCGCTGAC71281  GCTCTGGGCC  TGGCTCGCGA  TGCGGGCCCG  CGAGGCGGAT  CTGCGGCCCT  CCCTCGCGTT71341  CCCCGAGAAG  GATCTCGGGC  CGCGGCGCGA  GGTCGGCATG  GTCCAGCAGT  CGCTGTTCGA71401  CGAGGCGCGC  CTGGGCCAGC  AGCTCGTCGA  CGCGCAGCGC  GCGGAGCTCC  GCCGCTTCGG71461  CGTCGTCGAT  CGGGAGAGGG  GCATCGTGAG  CATCCCGATC  GACGACGCGA  TCGAGCTCAT71521  GGTGGCGGGG  GGCGCGCGAT  GAGCCGGGCC  GTCGCCGTGG  CCCTCCTGCT  GGCAGCCGGC71581  CTCGTGTCGC  GCCCGGGCGC  CGCGTCCGAG  CCCGAGCGCG  CGCGCCCCGC  GCTGGGCCCG71641  TCCGCGGCCG  ACGCCGCGCC  GGCGAGCGAC  GGGTCCGGCG  CGGAGGAGCC  GCCCGAAGGC71701  GCCTTCCTGG  AGCCCACGCG  CGGGGTGGAC  ATCGAGGAGC  GCCTCGGCCG  CCCGGTGGAC71761  CGCGAGCTCG  CCTTCACCGA  CATGGACGGG  CGGCGGGTGC  GCCTCGGCGA  CTACTTCGCC71821  GACGGCAAGC  CCCTCCTCCT  CGTCCTCGCG  TACTACCGGT  GTCCCGCGCT  GTGCGGCCTC71881  GTGCTGCGCG  GCGCCGTCGA  GGGGCTGAAG  CTCCTCCCGT  ACCGGCTCGG  CGAGCAGTTC71941  CACGCGCTCA  CGGTCAGCTT  CGACCCGCGC  GAGCGCCCGG  CGGCCGCDD
                    实施例2
              黄色粘球菌表达载体的构建
噬菌体MX8的,提供整合与附着功能的DNA被插入到商业上获得pACYC184(New England Biolabs公司)。如salm等人,1998年2月,在细菌学杂志(J.Bact.)180(3):614-621所述,一个大约2360bp的质粒pPLH343的MfeI-SaaI片段被分离,并连接到质粒pACYC184的大的EcoRI-XmnI限制片段上。形成的环状DNA为大约6Kb,被称之为质粒pKOS35-77。
质粒pKOS35-77作为一个很便利的质粒,在环氧噻酮PKS基因启动子的控制下表达本发明的重组PKS基因。在一个例证性实施方案中,整个的环氧噻酮PK5基和它的内源启动子一起,被以一个或几个片段插入质粒中以得到本发明的表达载体。
本发明还提供了表达载体,其中本发明的重组基因在黄色粘球菌启动子的控制下。为构建一个例证性的质粒,黄色粘球菌(M.Xanthus)pilA基因的启动子被作为PCR扩增产物分离出来。如Wu和Kaiser,于1997年12月在细菌学杂志.179(24):7748-7758所述,含有pilA基因启动子的质粒Pswu357与PCR引物Seq1和MxpiII引物混合:
Seq1: 5′-AGCGGATAACAATTTCACACAGGAAACAGC-3′
MxpiII:5′-TTAATTAAGAGAAGGTTGCAACGGGGGGC-3′
使用标准的PCR条件扩增,得到一个~800bp的片段。用限制酶KpnI裂解片段,并连接到商业上得到的质粒pLitmus 28 C(New Englmd.Biolabs公司)大的kpnI-EcoRV限制性片段上。得到的环状DNA被命名为pKOS35-71B。
自质粒pKOS35-71B的pilA基因的启动子作为一个约800bp的EcoRV-SnaBI限制性片段被分离出来,并与质粒pKOS35-77的大的MscI限制性片段连接,得到一个约6.8kb大小的环状DNA。因为约800bp的片段可以以两个方向连接,连接产生了两种同样大小的质粒,被命名为质粒pKOS35-82.1和pKOS35-82.2。这些质粒的限制性位点和功能图谱如图3所示。
质粒pKOS35-82.1和pKOS35-82.2可以作为本发明载体的很方便的起始材料,其中重组PKS基因被置于黄色粘球菌pilA基因启动子的控制下。这些质粒在紧靠启动子转录起始位点的下游有一个单一的PacI限制酶识别序列。在一个例证性实施方案中,不带自身同源启动子的完整的环氧噻酮PKS基因启动子被以一个或更多片段插入到质粒的PacI位点,生成本发明的表达载体。
这些质粒中的pilA序列如下所示CGACGCAGGTGAAGCTGCTTCGTGTGCTCCAGGAGCGGAAGGTGAAGCCGGTCGGCAGCGCCGCGGAGATTCCCTTCCAGGCGCGTGTCATCGCGGCAACGAACCGGCGGCTCGAAGCCGAAGTAAAGGCCGGACGCTTTCGTGAGGACCTCTTCTACCGGCTCAACGTCATCACGTTGGAGCTGCCTCCACTGCGCGAGCGTTCCGGCGACGTGTCGTTGCTGGCGAACTACTTCCTGTCCAGACTGTCGGAGGAGTTGGGGCGACCCGGTCTGCGTTTCTCCCCCGAGACACTGGGGCTATTGGAGCGCTATCCCTTCCCAGGCAACGTGCGGCAGCTGCAGAACATGGTGGAGCGGGCCGCGACCCTGTCGGATTCAGACCTCCTGGGGCCCTCCACGCTTCCACCCGCAGTGCGGGGCGATACAGACCCCGCCGTGCGTCCCGTGGAGGGCAGTGAGCCAGGGCTGGTGGCGGGCTTCAACCTGGAGCGGCATCTCGACGACAGCGAGCGGCGCTATCTCGTCGCGGCGATGAAGCAGGCCGGGGGCGTGAAGACCCGTGCTGCGGAGTTGCTGGGCCTTTCGTTCCGTTCATTCCGCTACCGGTTGGCCAAGCATGGGCTGACGGATGACTTGGAGCCCGGGAGCGCTTCGGATGCGTAGGCTGATCGACAGTTATCGTCAGCGTCACTGCCGAATTTTGTCAGCCCTGGACCCATCCTCGCCGAGGGGATTGTTCCAAGCCTTGAGAATTGGGGGGCTTGGAGTGCGCACCTGGGTTGGCATGCGTAGTGCTAATCCCATCCGCGGGCGCAGTGCCCCCCGTTGCAACCTTCTCTTAATTAA
为制备本发明的重组黄色粘球菌宿主细胞,在CYE培养基中培养该黄色粘球菌(Myxococcus xanthus)细胞(Campos和Zusman,1975,黄色粘球菌的发育调节:effect of 3’:5’cyclic Amp,ADP and nutrition,Pro.Natl.Acad.Sci USA72:518-522[3′:5’环腺苷酸,ADP和营养的作用,美国科学院院报]72:J518-522),在30℃,300rpm下,培养至100klett。剩下的过程除非另外说明,是在25℃下进行的。(离心8000rpm,10分钟,SS34或SA600转子)在去离子水中沉淀细胞,并悬浮。再次沉淀细胞,并悬浮在原始体积1/100的体积中。
将DNA(1到2μl)在室温,400ohm,25μFD,0.65V,持续时间范围8.8-9.4的范围内,电穿孔转移到细胞中。DNA应该是无盐的,因此应该再悬浮在蒸馏水和去离子水中,或者用0.025μm的VS型薄膜(millipore公司)透析。对于低效的电穿孔来说,斑点透析所述的DNA,并在CYE培养基中过度生长,电穿孔后加1ML的CYE培养基,用另外1.5mL的CYE在小管中中收集细胞,此前加入到50ML的三角摇瓶中(总体积2.5mL)。使细胞在30到32℃,300rpm生长4到8小时(或过夜)以使选择性标记得到表达。然后,将细胞涂在带选择条件的CYE软琼脂平板上。如果选择性标记是卡那霉素,那么每μgDNA通常可以得到103到105个细胞。如果选择性标记是链霉素,那么它必须包含在顶层琼脂中,因为它能够结合琼脂。
通过这种方法,本发明的重组DNA表达载体被电穿转入粘球菌宿主细胞中,它在细胞中表达本发明的重组PKS,并产生环氧噻酮,环氧噻酮衍生物,和其它由它们所编码的新的聚酮化合物。
                          实施例3
      用于黄色粘球菌中环氧噻酮表达的细菌人工染色体的构建。
为了在异源宿主中表达环氧噻酮PKS和修饰酶基因,通过发酵黄色粘球菌,生产环氧噻酮,这种细菌与纤维难囊菌密切相关,并且有许多克隆载体可使用,也可以根据本发明的方法使用黄色粘球菌。因为黄色粘球菌和纤维堆囊菌都是粘细菌,预料它们会共同使用基因表达,翻译调控和翻译后修饰(如果有的话)的元件,因此增加了来自纤维堆囊菌的epo基因可在黄色粘球菌中表达产生环氧噻酮的可能性。黄色粘球菌也已经利用基因克隆和表达。可以通过电穿孔导入DNA,可以使用大量的导入外源DNA所需的载体和遗传,包括令其稳定插入染色体的那些。最后,黄色粘球菌可相对容易地在发酵器中的复合培养基中生长,并可在需要时,通过操作来提高基因表达的水平。
为将环氧噻酮基因簇导入黄色粘球菌中,可以应用本发明的粘粒和同源重组,将环氧噻酮基因簇导入染色体中,组装完整的基因簇别。也可以选用将完整的环氧噻酮基因簇克隆到细菌人工染色体(BAC)上,然后转导进入黄色粘球菌,以整合进入染色体中。
为从粘粒pKOS35-70.1A2和pKOS35-79.85组装基因簇,从这些粘粒所得到的小的同源区被导入黄色粘球菌中以提供基因簇2片段的重组位点。如图4所示,制备了质粒pKOS35-154和pKOS90-22以导入这些重组位点。在黄色粘球菌染色体中组装环氧噻酮基因簇的策略如图5所示。开始时,在细菌染色体中选择一个不会破坏任何基因或转录单位的中性位点。这样的区域在devS基因的下游,它不影响黄色粘球菌的生长或发育。第一质粒,pKOS35-154被用DraI切割成线性并电穿孔转入黄色粘球菌中。这个质粒含有两个靠近环氧噻酮基因簇的两上片段的dev位点的两个区域。卡那霉素抗性标记和galk基因被插入到epo基因区间。如果DNA通过以dev区序列为同源区的双重组重组进dev区中,将有卡那霉素抗性克隆生长起来。菌株K35-59,含有少量的环氧噻酮基因簇,它允许pKOS35-79.85重组。因为pKOS35-79.85上和K35-159上的的抗性标记一样,一个四环素转座子被转到粘粒中,筛选含有插入卡那霉素标记中的转座子的粘粒。粘粒pKOS90-23被电穿孔导入k35-159中,筛选土霉素抗性克隆创建菌株K35-174。为从粘粒中移除不需要的区域,仅仅留下环氧噻酮基因,将细胞涂在含1%半乳糖的CYE平板上。galk基因的存在使细胞对1%半乳糖敏感。半乳糖抗性克隆K35-174代表了这种细胞,它们通过重组,或者galk基因中发生突变失去了galk标记,如果发生了重组,那么半乳糖抗性菌株就会对卡那霉素和土霉素敏感。对两种抗生素敏感的菌株被通过southern杂交分析证实。正确的菌株被得以证实,并命名为K35-175,它含有的基因簇从组件7,通过两个可读框到epoL基因。
为了从组件7导入组件1,再重更一次上述的过程。质粒pKOS90-22被用DraI线性化,并电穿孔导入K35-175中,创建K35-180。用四环素抗性的pKOS35-70.1A2,pKOS90-38电穿孔转化该菌株,并筛选对土霉素抗性的克隆。产生的菌株是K35-185。现在通过对1%半乳糖抗性筛选含有整个环氧噻酮基因族的重组子,结果得到菌株K35-188。这个菌株含有所有的环氧噻酮基因,以及所有可能的启动子。发酵这个菌株并检测环氧噻酮A和B的产生。
为将整个基因簇作为一个片段克隆,构建了一个细菌人工染色体BAC文库。首先,SMP44细胞被包理在标脂糖中,并根据BIO-RAD基因组DNA插入试剂盒的方法裂解。DNA插入片段被用限制酶例如Sau3AI或者HindIII进行部分消化,在FIGE或者CHEF胶上电泳。通过从琼脂糖上电洗脱DNA片段,或者选用琼脂酶降解所述的琼脂糖分离DNA片段,这种选择分离该片段的方法参见strong等人,1997,Nucleic Acids Res(核酸研究)19:3959-3961。DNA连接进入合适的酶裂解的BAC(pBelBACII)中。pBeloBACII的图谱显示如下。
Figure A9981567800851
DNA通过电穿孔转入DH10B细胞中,获得一个纤维堆囊粘菌基因组文库,方法参见Sheng等人,1995,Nucleic Acids Res(核酸研究),23:1990-1996。使用来自环氧噻酮基因簇的NRPS区作为探针来筛选克隆。挑选出阳性克隆,分离DNA,通过限制性分析证明完整的基因簇的存在。这个阳性克隆被命名为pKOS35-178.
为制备可用来导入pKOS35-178的菌株,构建了pKOS35-164质粒,它含有dev位侧边的环氧噻酮基因簇上游和下游的同源区,并且含有卡那霉素抗性galk弹夹,它与pKOS90-22和pKOS35-154同系。这个质粒被用DraI切成线状,电穿孔导入M.xanthaS中,根据Kafeshi等人,1995 Mol.Microbiol.15:483-494.(分子微生物学)报道的方法进行,得到K35-183菌株。质粒pKOS35-178可以通过电穿孔或者噬菌体P1的转导导入K35-183中,并筛选氯霉素抗性克隆。可选地,含有pRP4接合转移起点的pKOS35-178质粒可以构建DNA,用于从大肠杆菌向K35-183中的转移。这个质粒的构建是先构建一个含有来自RP4的oriT区和来自pACYC184的四环素抗性标记的转座子,然后在体内或体外,将转座子转座到pKOS35-178上。这个质粒转化进入S17-1,并经接合转移导入黄色粘球菌。菌株K35-190在1%半乳糖存在的条件下生长,以筛选第二个重组。该菌株含有所有的环氧噻酮基因和所有可用的启动子。发酵这个菌株,并检测环氧噻酮A和B的产生。
除了将pKOS35-178整合进dev位点外,还使用来自粘细菌噬菌体MX8或者MX9的整合功能整合进一个噬菌体附着位点。构建了一个转座子,它含有来自MX8或者MX9的整合基因和附着位点,以及来自pACYC184的四环素基因。这个转座子的另一种样式中是仅仅具有附着位点。在这一样式中,整合基因是反式提供的,经一个电穿孔共转移的含有整合酶基因的质粒,或者从组成型启动子的电穿孔转化菌株表达的,比如mgl启动好表达的整合酶蛋白(参见Margrini等人,1999年7月,J.Bact(细菌学杂志),181(13):4062-4070,)来完成。一旦构建了转座子,将其转座到pKOS35-178上,创建pKOS35-191。将这个质粒导入上述的黄色粘球菌中。该菌株含有所有的环氧噻酮基因和所有可用的启动子。发酵这个菌株,检测环氧噻酮A和B的产生。
一旦环氧噻酮基因被构建到黄色粘球菌菌株中,对基因簇的任何部分的操作,例如改变启动子或交换组件,都可以通过卡那霉素抗性和galk序列弹夹来实现。
将含有epo基因的黄色粘球菌培养物生长在许多种培养基中,检测环氧噻酮的产生。如果环氧噻酮(特别是B或者C)产生的水平太低,不能用于大规模发酵,则可使如下所述的用于提升链霉菌中产生水平的方法,提高菌株的表达水平的。
                            实施例4
                      链霉菌表达载体的构建
本发明提供了在链霉菌宿主中,组件式(MODULAR)聚酮化合物合成酶基因异源表达的重组表达载体。这些载体包括使用actI启动子的表达载体,该启动子受基因actII ORF4的调节,使得当生成的细胞进入稳定期后,其调节表达处于高水平上。
这些载体中可用的是质粒pRM1和pRM5,以及它们的衍生物,如pCKJ,它是稳定的,低拷贝,带有放线菌中的硫链霉素抗性标记的质粒。这些质粒可容纳插入大片段的克隆DNA,被用于在天蓝色链霉菌和淡青紫链霉菌中表达DEBS PKS,在淡青紫链霉菌中表达苦霉素PKS基因和oleandomycin PKS基因。参见美国专利号5,712,146。本领域的技术人员可以认识到,淡青紫链霉菌中表达直到晚期生长时期制造tRNA,这种tRNA识别亮氨酸的TTA密码子,如果所要的蛋白是在早期产的,那么可进行合适的密码子修饰。
Figure A9981567800871
质粒pCK7。
另一个载体质粒pSET152的衍生物,含有actII ORF4 PactI表达系统,但是带有apramycin抗性筛选标记。这些载体含有attP位点和放线菌噬菌体phic31的整合酶基因,不能在链霉菌宿主细胞中自主复制,但是在导入宿主细胞后,在phic31的附着位点处通过位点专一性重组,整合到染色体中。pCK7和pSET152的衍生物,以及从各个质粒表达的不同的PKS基因被一起用于缩聚酮的异源产生。参见1999年4月16日递交的美国专利申请序列号60/129,731专利申请。
质粒图:pKOS010-153,一种pSET152衍生物。
很明显需要开发在链霉菌中起使用的环氧噻酮PKS的表达载体。现在环氧噻酮化合物可在生长缓慢,遗传上上可改变的纤维堆囊菌细胞中产生,或者通过合成而制备。链霉菌,它是一种产生70%的所有已知抗生素和重要的复杂聚酮化合物的细菌,它是非常好的产生环氧噻酮和环氧噻酮衍生物的宿主。淡青紫链霉菌和天蓝色链霉菌被开发用于表达异源的PKS系统。这些生物能稳定地保持克隆的异源PKS基因,在控制条件下高水平地表达它们,以及修饰相关的PKS蛋白质(例如,磷酸泛酰巯基亚胺化),因此它们能够产生这些基因编码的聚酮化合物。而且,这些宿主含有必需的产生聚酮化合物合成的底物的途径,例如丙二酰基辅酶和甲基丙二酰基辅酶A。对于这些宿主可以利用多种克隆和表达载体,以及外源DNA大片段的导入和稳定保存的方法。相对于缓慢生长的纤维堆囊菌宿主来说,淡青紫链霉菌和天蓝色链霉菌(S.1ividans和S.coeliclor)在许多种培养基上生长良好,适于在发酵器中高水平产生聚酮化合物。许多种方法可以提高产量,包括搅拌方法以增加表达的速度,提高前体的供应等,以增加表达的速度,提高前体的供应等等。长期以来证明对链霉菌中许多种其它聚酮化合物有效的,许多种增加聚酮化合物滴度的方法,可用于本发明的产环氧噻酮和环氧噻酮衍生物的缩主细胞。
为通过发酵在异源链霉菌缩主细胞中生产环氧噻酮,环氧噻酮基因(包括NRPS组件)被以两个片段克隆到pCK7(装载结构域到组件6)和pKOS010-153(组件7到9)衍生物中。这两种质粒被导入淡青紫链霉菌中,以用来筛选thiostrepton和apramycin的抗性。在这种安排中,pCK7衍生物自主复制,而pKOS010-153衍生物整合到染色体中。在两个载体中,环氧噻酮基因的表达受质粒内的存在的actI启动子的控制。
为提高克隆的效果,两个环氧噻酮克隆编码片段(一个是经组件6装载结构域,一个是组件7到9)与ery PKS组件5的KS结构域N端片段的翻译融合的形式进行克隆。使用KS5作为第一个翻译序列从这个启动子显示高水平的表达,参见Jacobsen等人,1998年生物化学Biochemistry,37:4928-4934。一个提供很大便利的BasBI位点存在于一个DNA片段中,该片段编码氨基酸序列EPIAV,EPIAV在许多KS的区域是高度保守的,包括epoA编码的和epoE中组件7的KS编码区。
含有环氧噻酮PKS的装载结构域和组件1到组件6的表达载体被命名为pKOS039-124,而组件7到9的表达载体被命名为pKOS039-126。本领域中的技术人员可以认识到,其它的载体和载体构件可用来制备同样的载体。因为本发明的优选的表达载体,如下所述衍生自pKOS039-124和PKOS039-126,根据布达佩斯条约的规定已经被保藏,下面只对质粒pKOS039-124和pKOS039-126的构建作一概述。
eryKS5接头编码序列作为来自质粒pKOS10-153的~0.4kb的PacI-BglII片段被克隆到pKOS039-98质粒中,构建质粒pKOS039-117。一大约8.7kb的来自粘粒pKOS35-70.1A2的片段,插入到EcoRI-XbaI消化的质粒pLItmus28上,从而将eryKS5接头的编码序列连接到环氧噻酮装载结构域的编码序列上。所得质粒的~3.4kb的BsaBI-NotI和~3.7kb的NotI-HindIII限制性片段,插入到BsaBI-HindIII消化的质粒pKOS039-117上,构建质粒pKOS039-120。质粒pKOS039-120的~7kb的PacI-XbaI限制性片段被插入到质粒pKAO18上,构建质粒pKOS039-123。将粘粒pKOS35-70.1A2的~34kb的XbaI-AvrII限制性片段与pKOS039-123的~21.1kb的AvrII-XbaI限制性片段连接,构建了最终的pKOS039-124表达载体。
质粒表达载体pKOS039-126的构建流程如下所述。首先,经过BgIII-Not双酶切消化pKOS35-70.4所得约6.9kb片段与NotI-HindIII双酶切消化pKOS35-79.85所得约5.9kb片段克隆至用BgIII-HindIII双酶切消化的质粒pLitmus28上,构建质粒pKOS039-119,将粘粒pKOS35-70.4和pKOS35-79.85得到组件7的编码序列连接。将NdeI-NheI双酶切消化粘粒pKOS35-79.85所得约12kb片段克隆至用NdeI-XbaI双酶切消化的pKOS039-119质粒载体上,构建得到质粒pKOS039-122。
为了将eryKS5接头编码序列与组件7编码序列融合,由BsaBI-NglII双酶切消化粘粒pKOS35-70.4所得约1kb片段克隆至用BsaBI-Ncl I双酶切消化的pKOS039-117质粒载体上,构建质粒pKOS039-121。由Avr II酶切消化pKOS039-122所得约21.5kb片段克隆至用Avr II-XbaI双酶切消化的pKOS039-121质粒载体上,构建得到质粒pKOS039-125。由PacI-EcoRI双酶切消化pKOS039-125所得约21.8kb片段被连接至用PacI-EcoRI双酶切消化质粒载体pKOS039-44所得大小约为9kb的片段上,构建质粒pKOS039-126。
利用相应的药物抗性筛选标记,将质粒pKOS039-124和pKOSl26依次导入淡青紫链霉菌K4-114菌株中。因为质粒pKOS039-126在链霉菌中不能自主复制,只有发生质粒与染色体在phiC31的attB位点发生位点特异性重组的细胞才能在抗性筛选培养基中存活。因为质粒会稳定整合,不需要对阿泊拉霉素抗性进行持续的筛选。如果愿意可以在培养基中保持抗性成分。培养基中仍含有硫链丝菌肽(thiostrepton),以保证对质粒pKOS039-124的持续筛选。质粒pKOS039-124和质粒pkOS039-126被转入淡青紫链霉菌中,培养含有质粒的转化子并进行环氧噻酮产量测定。最初的测定没有发现环氧噻酮。
为了提高这些载体表达环氧噻酮的产量,用环氧噻酮PKS基因替代了eryKS5接头序列区,所得载体被转入天蓝色链霉菌(Streptomyces coelicolor)CH999中。为了利用PCR的方法扩增epoA基因编码序列,利用了以下两条引物:N39-73,5’一GCTTAATTAAGGAGGACACATATGCCCGTCGTGGCGGGATCGTCC-3,;N39-74,5’-GCGGATCCTCGAATCACCGCCAATATC-3’。
模板DNA来自粘粒pKOS35-70.8A3。用限制性内切酶PacI和BamHI消化所得的约0.8kb PCR产物,再与质粒pKOS039-120约2.4kb BamHI-NotI酶切片段及约6.4kb PacI-NotI酶切片段相连接,构建质粒pKOS039-136。为了分别构建epoA,epoB,epoC,和epoD基因的表达载体,质粒pKOS039-136约5kbPacI-AvrII酶切片段被连至用PacI-AvrII酶切质粒pKOS039-124所得的约50kb片段上,构建表达质粒pKOS039-124R。质粒pKOS039-124R已遵循布达佩斯条约并受该条约保护,保藏于美国典型培养物中心(ATCC),保藏号为——。
为了PCR扩增epoE基因编码序列,设计了以下两个寡核苷酸引物:N39-67A;N39-68,N39-67A,5′-GCTTAATTAAGGAGGACACATATGACCGACCGAGAAGGCCAGCTC-CTGGA-3′,N39-68,5′-GGACCTAGGCGGGATGCCGGCGTCT-3′.
模板DNA来自于粘粒pKOS35-70.1A2。所得的约0.4kb扩增产物用限制性内切酶PacI和AvrII消化,并被分别连至约29.5kb的PacI-AvrII酶切消化pKOS039-126载体片段上,构建质粒pKOS039-126R,或约23.8kb的PacI-AvrII酶切消化pKOS039-125载体片段上,得到质粒pKOS039-125R。质粒pKOS039-126R已按照布达佩斯条约保藏在美国典型培养物中心(ATCC,保藏号为———。
pKOS039-124R和pKOS039-126R质粒对(同样的还有pKOS039-124和pKOS039-126质粒对)含有完整的epoA,epoB,epoC,epoD,epoE,epoF,epoK和epoL基因。最后的两个基因位于质粒pKOS039-126R(同样的还有质粒pKOS039-126);然而,为了确保这些基因能够高水平表达,本发明的另一表达载体,质粒pKOS039-141(Fig 8)中的epoK和epoL基因被置于ermE*启动子调控之下。
为了PCR扩增epoK基因编码序列,设计了以下寡核苷酸引物:
N39-69,5′-AGGCATGCATATGACCCAGGAGCAAGCGAATCAGAGTG-3′;
N39-70,5′-CCAAGCTTTATCCAGCTTTGGAGGGCTTCAAG-3′.
为了PCR扩增epoL基因编码序列,设计了以下寡核苷酸引物:
N39-71A,5′-GTAAGCTTAGGAGGACACATATGATGCAACTCGCGCGCGGGTG-3′;
N39-72,5′-GCCTGCAGGCTCAGGCTTGCGCAGAGCGT-3′.
用于扩增的模板DNA来自于粘粒pKOS35-79.85。PCR产物被亚克隆至PCR-script以便进行序列分析。然后,分别用NdeI-HindIII和HindIII-EcoRI限制性内切酶酶切所得克隆,分离得到epoK基因片段和epoL基因片段,并连至经NdeI-EcoRI双酶切质粒pKOS039-134B所得的约6kb片段上,构建出质粒pKOS039-140。质粒pKOS039-134B含有ermE*启动子。质粒pKOS039-140经NheI-PstI双酶切所得约2.4kb酶切片段被克隆至经XbaI-PstI消化的质粒pSAM-Hyg上,构建出质粒pKOS039-141。质粒pSAM2衍生物含有潮霉素抗性转移基因。
构建另一种质粒pKOS039-126R,向没有epoK和epoL基因的表达载体上提供epoE和epoF基因。质粒pKOS039-12(图9)的构建流程如下。质粒pXH106(见参考文献J.Bact.,1991,173:5573-5577)经限制性内切酶StuI和BamHI双酶切,分离出含有xylE及潮霉素抗性转移基因的约2.8kb酶切片段,克隆至用EcoRV-BgIII酶切的质粒pLitmus28上。所得质粒的约2.8kb NcoI-AvrII限制性片段与质粒pKOS039-125R的约18kb PacI-BspHI酶切片段及质粒pKOS039-42的约9kb SpeI-PacI酶切片段相互连接,构建质粒pKOS045-12。
为了构建只含有epoL基因的表达载体,质粒pKOS039-141经限制性内切酶NdeI不完全消化,分离出约9kb NdeI酶切片段,所述的片段自我环化连接,生成质粒pKOS039-150。
于是,将以上构建的各种载体以多种组合分别转入天蓝色链霉菌CH999和淡青紫链霉菌K4-114中,转化的宿主细胞分别培养于固体平板和液体培养基上(R5培养基,即不含琼脂的R2YE培养基)。典型的发酵条件如下。首先,含有50μg/l硫链丝菌肽(thiostrepton)的约5mL种子培养液接种后在30℃培养2天。然后,取大约1-2mL的种子培养液转接到含50μg/l硫链丝菌肽和1mM半胱氨酸的50mL生产培养液中,于30℃培养5天。同时,用种子培养液在固体平板(该平板含有与生产培养液相同的成分,并添加10mM丙酸盐)上接种,于30℃培养9天。
对一些天蓝色链霉菌培养物及培养液进行环氧噻酮产量分析。液体培养物用等体积的乙酸乙酯抽提3次,合并有机相并蒸发浓缩,残余物经乙腈溶解,用于LC/MS分析测定。固体琼脂培养基切碎后用等体积丙酮抽提2次,合并丙酮相,经蒸发浓缩成含水泥浆,再用等体积乙酸乙酯抽提3次,合并有机相并蒸发浓缩,残余物经乙腈溶解,用于LC/MS分析测定。
利用LC质谱测定法可以估计环氧噻酮的产量。从分析型HPLC紫外检测仪流出的样品等量分配至Perkin Elmer/Sciex API100LC质谱仪和Alltech 500蒸发光谱散射检测仪上进行测定。样品上样于4.6×150mm反相HPLC柱(MetaChem5m ODS-3 Inertsil),用水平衡,流速为1.0mL/min。UV检测仪的波长设在250nm。样品组分先用H2O洗脱1min,然后用0-100%乙腈梯度洗脱10分钟。在该洗脱条件下,环氧噻酮A会在10.2分钟后洗脱下来,环氧噻酮B会在10.5分钟后洗脱下来。利用大气化学离子源,喷口及环压分别为75V和350V,分辨率为0.1amu的质谱仪进一步测定并确证了这些组分的可靠性。在这些条件下,环氧噻酮A的[M+H]值显示为494.4amu,在476.4,318.3和306.4amu处有可观察到的碎片。环氧噻酮B的[M+H]值显示为508.4amu,在490.4,320.3和302.4amu处有可观察到的碎片。
含有pKOS039-124R和pKOS039-126R质粒对或pKOS039-124和pKOS039-126R质粒对的转化子产生可检测量的环氧噻酮A和环氧噻酮B。含有这些质粒对及附加质粒pKOS039-141的转化子也产生相同量的环氧噻酮A和环氧噻酮B,表明在该实验条件下,附加epoK和epoL基因拷贝是非必需的。因此,当重组epoA,epoB,epoC,epoD,epoE,epoF,epoK和epoL基因存在时,这些转化子可生产环氧噻酮A和B。观测结果表明,没有丙酸盐时,环氧噻酮A和B的比例会增加。
含有pKOS039-124R和pKOS045-12质粒对的转化子产生环氧噻酮C和D,同样含有该质粒对和质粒pKOS039-150的转化子也可以产生环氧噻酮C和D。这些结果显示在该实验条件下,附加epoL基因拷贝对于形成C-12-C-13双键是非必需的。这些结果表明有可能单独的环氧噻酮PKS基因即可完成双健的形成,也有可能天蓝色链霉菌表达一种基因产物,能够将环氧噻酮G和H转变成为环氧噻酮C和D。因此,当重组epoA,epoB,epoC,epoD,epoE,和epoF基因存在时,这些转化子可生产环氧噻酮C和D。
这里所述的环氧噻酮PKS异源表达被认为代表的是在重组宿主细胞中已被表达的最大蛋白及活性酶类复合体的重组表达。可生产环氧噻酮的天蓝色链霉菌转化子所显示的生长状态表明,环氧噻酮PKS基因或其产物,或是环氧噻酮,抑制了细胞的生长,或在某种程度上对细胞有毒害作用。任何此类抑制或毒害活性皆有可能归因于细胞内环氧噻酮的积累,据认为天然的纤维堆囊菌生产细胞可能含有某种转运蛋白,影响着环氧噻酮向细胞外的转运。此类转运子基因被认为存在于epoK基因及上述基因下游的开放可读框中。因此,本发明提供的链霉菌及其它宿主细胞含有编码一个或多个产物的重组基因包括该区域的所有开放可读框编码序列。
例如,每个可读框编码序列皆可克隆在ermE*启动子之后,参见参考文献Stassi等人,1998年,Appl.Microbiol.Biotechnol(应用微生物生物技术)。49:725-731,通过噬菌体phiC31的attB位点进行位点特异性重组,pSAM2系列质粒载体能够整合进入天蓝色链霉菌和淡青紫链霉菌中,参见参考文献Smokvina等人.,1990,Gene 94:53-59。携带潮霉素抗性基因的pSAM2系列质粒载体经改造,携带后面接有多克隆位点的ermE*启动子。PCR得到得每个下游开放可读框编码序列克隆至质粒载体后,被导入宿主细胞中(已含有pKOS039-124R和pKOS039-126R,或本发明其它表达载体),用潮霉素抗性进行筛选。分析那些携带每个epoK基因下游单个基因的克隆中,增加环氧噻酮的产量。
以下介绍了其它一些有关另外的发酵及株系改良的方法。在多种构建体中PKS基因的表达水平可以通过分析比较其mRNAS水平与相同宿主中类似表达载体上其它异源PKS mRNA水平(如苦霉素)加以检测(通过定量RT-PCR)。如果有一种环氧噻酮转录子生产不足,可以将相应的DNA片断在不同的表达载体上克隆增强其表达。例如,假如一个或者多个基因产物的生物合成限速的话,任何一或多个环氧噻酮PKS基因多重拷贝均能导入细胞。如果产量低的原因不是因为PKS基因的低水平表达(在RNA水平),可采用每种重要的商业化发酵产物产量改良中常用的经验式的突变及筛选方法加以提高。将孢子暴露在UV、X-射线中,或用化学诱导突变剂处理,将单个幸存菌斑涂板,并转接后进行小规模发酵实验以检测产量。尽管这个过程可以自动化,还可以用易感菌类Mucor hiemalis作为试验有机体,检测数千个菌斑的环氧噻酮生产量。
增加环氧噻酮产量的另一种方法是将环氧噻酮PKS装载结构域的KSY结构域转变成KSQ结构域。这种装载结构域的变换方法有许多种,其中一种示意途径,但非限定性的如下。本发明的pKOS39-124R质粒可以方便作为起始材料。为了扩增构建过程中有用的DNA片段,使用了下列4条寡核苷酸引物:
N39-83:5′-CCGGTATCCACCGCGACACACGGC-3′,
N39-84:5′-GCCAGTCGTCCTCGCTCGTGGCCGTTC-3′,
和如上所述的N39-73以及N39-74。由引物N39-73和N39-83,引物N39-74和N39-84扩增所得的PCR片段各自用PacI-BamHI双酶切,并连接至约3.ikb的质粒pKOS39-120 PacI-BamHI片段上,构建得到质粒pKOS039-148。约0.8kb的pKOS039-148 PacI-BamHI限制性酶切片段(含有这两个PCR产物)与质粒pKOS039-120的约2.4kb BamHI-NotI片段及约6.4kb PacI-NotI片段相连接,构建得到pKOS39-136Q。约5kb的质粒pKOS039-136Q PacI-AvrII片段与约50kb的质粒pKOS039-124 PacI-AvrII限制性酶切片段相连接,构建得到质粒pKOS39-124Q。然后将质粒pKOS039-124Q与pKOS039-126R转化至天蓝色链霉菌CH999中,以产生环氧噻酮。
从epoA到epoF,随意加上epoK或epoK与epoL,这些基因的克隆及表达就足以完成环氧噻酮化合物的合成,并且C-12H至C-12甲基类型的合成似乎也与天然宿主中的所见相类似(A∶B∷2∶1)。这个比率显示组件4的AT结构域更接近类似于丙二酰而不是甲基丙二酰特异性AT共有结构域。因此,环氧噻酮D和B的产生量要比它们对应的C-12未甲基化配对物C和A要少。本发明提供了专门产生环氧噻酮D和/或B的PKS基因。特别地,多种来源中具有的甲基丙二酰CoA特异性AT结构域(例如,narbonolide PKS,纳巴霉素rapamycin PKS,及以上所列的其它一些PKS)可以用来替代天然生成的组件4的AT结构域。这种调换可以通过将相应DNA序列的定向克隆至环氧噻酮PKS编码DNA片段的合适位点、或者通过同源重组进行基因重排来实现。
对于通过同源重组进行基因重排,待调换的供体序列被置在穿梭载体上,并且其侧翼序列至少有1kb全长要与epo组件4的AT结构域编码DNA相匹配。同源区的交叉重组导致epo AT4结构域与穿梭载体上的相应区域发生调换。因为pKOS039-124和pKOS039-124R含有AT4编码序列,它们可被用作宿主DNA用于调换。临近的DNA片段被克隆至一个大肠杆菌E.coli系列具温度敏感型复制特征的质粒上。异源AT结构域可以沿正确方向被克隆在这些质粒上,位于同源区之间作为弹夹,从而能够同时完成数个AT调换。通过将重构质粒(pKOS039-124*或pKOS039-124R)和pKOS039-126或pKOS-39-126R一起导入天蓝色链霉菌和/或淡青紫链霉菌中,以测试它们合成环氧噻酮B的能力。
因为携带不同基因置换的株系与株系之间的聚酮化合物效价的多样性,本发明提供了一系列异源甲基丙二酰CoA特异性AT结构域,以确保产生的环氧噻酮D在效价上等同于上述天蓝色链霉菌宿主中产生的坏氧噻酮C和D混合物。其外,供体基因的大片段可被用于置换,除了AT结构域之外,还包括对应于完整组件的临近上游区及下游区序列。如果完整的组件被用于置换,可以从实施例中得到完整的KS,甲基丙二酰AT,DH,KR,ACP的编码DNA序列,并不仅限于纳巴霉素PKS的第十组件编码DNA序列,或FK-520 PKS的第一或第五组件。
                        实施例5
        EpoK的异源表达及环氧噻酮D向环氧噻酮B的转化
这个实施例叙述了epoK基因在大肠杆菌中的表达载体的构建。EpoK基因产物在大肠杆菌中作为与多聚组氨酸靶(his tag)共表达成融合蛋白的形式进行表达。纯化融合蛋白后,用于环氧噻酮D向环氧噻酮B的转化。
构建的质粒所编码的融合蛋白中,所含的6组氨酸残基既可融合在EpoK的氨基末端,也可融合在EpoK的羧基末端。下列寡核苷酸被用于质粒的构建:55-101.a-1:5’-AAAAACATATGCACCACCACCACCACCACATGACACAGGAGCAAGCGAAT-CAGAGTGAG-3′,55-101.b:5’-AAAAAGGATCCTTAATCCAGCTTTGGAGGGCTT-3′,55-101.c:5′-AAAAACATATGACACAGGAGCAAGCGAAT-3′,and55-101.d:5′-AAAAAGGATCCTTAGTGGTGGTGGTGGTGGTGTCCAGCTTTGGAGGGCTTC-AAGATGAC-3′.
利用引物55-101.a-1和引物55-101.b,构建了编码氨基酸末端标记融合蛋白,Pkos55-121的质粒,利用引物55-101.c和引物55-101.d,在含有pKOS35-83.5为模板的PCR反应中构建了羧基末端编码区的质粒pKOS55-129。质粒pKOS35-83.5含有约5kb NotI酶切片段,该片段含有被连在pBluescriptSKII+(Stratagene)上的epoK基因。PCR产物经限制性内切酶BamHI和NdeI双切,连至同样用BamHI和NdeI双切的pET22b(Invitrogen)上。所得两个质粒经测序,确证在PCR扩增过程中没有引入突变。按本领域常规方法进行蛋白质凝胶。
EpoK的纯化按以下方法进行。质粒pKOS55-121和pKOS55-129被转入含有groELS表达质粒pREP4-groELS的BL21(DE3)菌株中(Casper等人,1994,Cellular and Molecular Biology[细胞分子生物学]40(5):635-644)。菌株接种至加有2mM MgSO4,1%葡萄糖,20mg维生素B1,5mg FeCl2,4mg CaCl2和50mg乙酰丙酸的250mL M9培养基中。当培养物生长至OD600位于0.4-0.6之间时,加入终浓度为1mM的IPTG进行诱导表达,培养物可继续生长2小时后收集菌体。菌体收集后,冻于-80℃。冻存的菌体细胞重悬于10mL缓冲液1中(5mM咪唑,500mM NaCl,和45mM Tris pH7.6),用超声波破碎细胞三次,每次15秒,超声波强度设为8。细胞碎片经SS-34转子于16,000rpm离心30分钟。移去上清液,16000rpm离心30分钟。上清置入5mL的镍柱(Novagen),然后用50mL的缓冲液1洗脱(Novagen)。EpoK用从5mM到1M梯度的咪唑稀释。含有EpoK的部分被收集并用1L的透析缓冲液透析两次(45mM的TrispH7.6,0.2mM的DTF,0.1mM的EDTA,和20%的甘油)。等分的样品在液氮中冷冻并-80℃保存。蛋白制备物的纯度大于90%。
如下述方法进行EpoK的测定(见Betlach等人.,生物化学(1998)37:14937通过引用被在此合并)。简而言之,反应包括50mM的Tris(pH7.5),21μM的菠菜铁氧化还原蛋白,0.132单位的菠菜铁氧化还原蛋白:NADP+氧化还原酶,0.8单位的葡萄糖6磷酸脱氢酶,1.4μM的NADP,和7.1mM的葡萄糖6磷酸,100或200μM的环氧噻酮D(S.Danishefsky公司惠赠),和1.7μM的氨基酸末端组氨酸标记EpoK或1.6μM的羧基末端组氨酸标记EpoK总体积为100μl。反应体系在30℃温育67分钟并在90℃两分钟来终止反应。通过离心除去不溶的物质,50μL的上清液通过LC/MC进行分析。HPLC条件为:Metachem5μ ODS-3Inersil(4.6×150mm);80%的水1分钟,用100%的MeCN 10分钟流速1mL/min,用UV(λmax=250nm),ELSD,和MS测定。在这些条件下,在11.6分钟洗脱出环氧噻酮D,且9.3分钟时洗脱出环氧噻酮B。LC/MC被获得通过使用带有孔和环的气压化学离子化源,分别在1amu的团溶液中设置为20V和250V电压。在这些条件下,环氧噻酮E在m/z493处表现[M+H]峰,并有491和320处可见碎片峰。
含EpoK以及环氧噻酮D的反应物包括在对照中不存在的化合物其表现相同的保持时间,分子量,以及分子片段模式环氧噻酮B。环氧噻酮D的浓度为100μM时,氨基和羧基末端组氨酸标记的EpoK能够分别转化82%和58%为环氧噻酮B。在浓度为200μM时,能够分别转化44%和21%为环氧噻酮B。这些结果表明EpoK能够将环氧噻酮D转化为环氧噻酮B。
                          实施例6
                 化学生物合成修饰环氧噻酮
此实施例描述了一系列由本发明提供的硫酯通过化学生物合成来产生环氧噻酮衍生物。来自纤维堆囊粘菌的用于环氧噻酮生物合成的基因簇的DNA序列表明了PKS的启动涉及多肽和核酸成分的混合物。启动涉及带有丙二酰CoA的装载区域的类PKS部分的装载,接着,进行脱羧化和带有半胱氨酸的组件一的装载,然后,浓缩来形成酶联的N-乙酰基半胱氨酸。环化形成一个二氢噻唑,然后再被氧化形成一个酶联2-甲基噻唑-4-羧酸盐,其为装载区和NRPS的产物。甲基丙二酰CoA通过组件2的酮合成酶的浓缩,提供了如下列表所示的组件的底物。
本发明提供了化学生物合成产生环氧噻酮衍生物的方法和试剂,其相似的方式为PCT公开号99/03986和97/02358中加以描述。它提供了两种类型的底物:NRPS产物的类似物,以及组件2底物的类似物同带有突变的NRPS-样的结构域的PKS酶一起使用,组件3底物被与带有组件2的突变KS区域的PKS酶一起使用。
下图示出用作带有修饰的失活NRPS的环氧噻酮PSK的底物的组件2底物(N-乙酰基半胱胺硫酯):
Figure A9981567800971
通过相关羧酸的激化和用N-乙酰基半胱胺处理来制备组件2底物。激活的方法包括氯酸的形成,混合的酸酐的形成,或与浓缩试剂例如碳二亚胺的反应。
当作NAc硫酯用作带有KS2敲除的环氧噻酮PKS的底物的组件3底物为:
这些化合物通过三步法被制备。首先,乙醛用Witting试剂或其等同物处理来形成取代的丙烯酸酯。这些酯被皂化为酸,其然后被活化并用N-乙酰基半胱胺处理。
形成组件2和组件3的反应式如下所示。其他的适于产生通过坏氧噻酮PKS用于多肽合成的起始物质的化合物被显示于表2中如羧酸(或可被转化为羧酸的乙醛)其被转化为用于提供给本发明宿主的N-乙酰基半胱胺。
A.噻吩-3-羧基N-乙酰基半胱胺硫酯
干燥的四氢呋喃的2mL噻吩-3-羧酸(128mg)溶液在惰性气体中被用三乙胺(0.25mL)和联苯磷酰基叠氮化物(0.50mL)。1小时后,加入N-乙酰基半胱胺(0.25mL),并且该反应进行12小时。混合物倒入水中并用等体积的乙酸提取三次。有机提取物被联合,依次用水,1N HCl,饱和CuSO4和盐水,然后用MgSO4,在真空中过滤和浓缩。在SiO2上使用醚层析,然后,通过乙烷基醋酸盐提供纯的化合物,通过标准的方法对其结晶。
B.呋喃-羧基N-乙酰基半胱胺硫酯
干燥的四氢呋喃的2mL呋喃-3-羧酸(112mg)溶液在惰性气体中被用三乙胺(0.25mL)和联苯磷酰基叠氮化物(0.50mL)。1小时后,加入N-乙酰基半胱胺(0.25mL),并且该反应进行12小时。混合物倒入水中并用等体积的乙酸提取三次。有机提取物被联合,依次用水,1N HCl,饱和CuSO4和盐水,然后用MgSO4,在真空中过滤和浓缩。在SiO2上使用醚层析,然后通过乙烷基醋酸盐提供纯的化合物,通过标准的方法对其结晶。
C.吡咯-2-羧基N-乙酰基半胱胺硫酯
干燥的四氢呋喃的2mL吡咯-2-羧酸(112mg)溶液,在惰性气体中被用三乙胺(0.25mL)和联苯磷酰基叠氮化物(0.50mL)。1小时后,加入N-乙酰基半胱胺(0.25mL),并且该反应进行12小时。混合物倒入水中并用等体积的乙酸提取三次。合并有机提取物,依次用水,1NHCl,饱和CuSO4和盐水,然后用MgSO4,在真空中过滤和浓缩。在SiO2上使用醚层析,然后通过乙烷基醋酸盐提供纯的化合物,通过标准的方法对其结晶。D.2-甲基-3-(3-噻吩基)丙烯酸盐N-乙酰基半胱胺硫酯
(1)乙烷基2-甲基-3-(3-噻吩基)丙烯酸盐:干燥的四氢呋喃(20mL)吡咯-3-carboxaldehyde(1.12g)和(乙氧羰基亚乙基)三苯正膦(4.3)的混合物被逆流加热16小时。混合物被冷却到室温并在真空中浓缩干燥。将固体残基悬浮在1∶1的醚/乙烷中,并过滤除去三苯磷化氢。滤出物通过SiO2使用1∶1的醚/乙烷过滤提供这种产物(1.78g,91%)作为淡黄色油。
(2)2-甲基-3-(3-噻吩基)丙烯酸:来自(1)的酯倍溶解于甲醇(5mL)和8N KOH(5mL)并回流加热30分钟。混合物被冷却到室温,用水稀释,并用酯洗涤两次。液相用1N HCl酸化,然后用等体积的酯提取三次。合并有机提取物,然后用MgSO4干燥,用2∶1的醚/乙烷结晶提供无色针体。
(3)2-甲基-3-(3-噻吩基)丙烯酸盐N-乙酰基半胱胺硫酯:干燥的四氢呋喃的2mL2-甲基-3-(3-噻吩基)丙烯酸(168mg)溶液在惰性气体中用三乙胺(0.56mL)和联苯磷酰基叠氮化物(0.45mL)。15分钟后,加入N-乙酰基半胱胺(0.15mL),并且该反应进行4小时。混合物倒入水中并用等体积的乙酸提取三次。合并有机提取物,依次用水,1N HCl,饱和CuSO4和盐水,然后用MgSO4,在真空中过滤和浓缩。在SiO2上使用醚层析然后通过乙烷基醋酸盐提供纯的化合物,通过标准的方法对其结晶。
将上述的化合物提供到含有本发明的重组环氧噻酮PKS的宿主细胞培养物中,其中的组件2的NRPS或KS区通过诱变,制备相应的本发明的环氧噻酮衍生物。
                                实施例7
          在纤维堆囊菌SMP44中产生环氧噻酮和环氧噻酮衍生物
本发明提供了一系列重组的纤维堆囊粘菌宿主细胞,它与自然环氧噻酮的产生者如产生环氧噻酮衍生物的宿主细胞相比,产生较少的复合环氧噻酮的混合物。此实施例描述了该菌株的构建,通过描述如何产生仅生产环氧噻酮C和D不产生A和B的菌株。为了构建此菌株,在epoK基因中制备一个失活突变。使用含有NotI片段靠近epoK基因的质粒Pkos35-83.5,将来自Tn5的卡那霉素和博来霉素抗性标记结合到epoK基因的ScaI位点,构建pKOS90-55。抗性标记的定位是在转录卡那霉素启动子处,开始启动epoK的下游基因的表达。换言之,突变是非极性的。接着,来自RP4的联合运输的起点被结合于pKOS90-55来产生pKOS90-63。可将这个质粒导入S17-1,并同SMP44结合。在如前面所述的在腐草霉素平皿上筛选转化结合子。可选择的是,可利用上述用于黄色粘球菌的条件完成质粒的电穿孔。
因为有三个用于黄色粘球菌转导阶段,一个可以将DNA从黄色粘球菌运输到SMP44。首先在黄色粘球菌中通过线性化质粒pKOS90-55构建epoK基因突变子,并电穿孔进入黄色粘球菌中。筛选卡那抗性克隆,该克隆具有一个epoK的基因置换。用Mx9,Mx8,Mx4ts 18hft hrm噬菌体感染此菌株,产生噬菌体溶解物。此溶解物再分别被感染到SMP44,筛选腐草霉素抗性克隆。一旦构建了菌株,,如下文所述的标准的发酵方法能够用于产生环氧噻酮C和D。
在S42培养基上制备纤维堆囊菌宿主细胞的新鲜平皿。S42培养基含有色氨酸,0.5g/L,MgSO4 1.5g/L;HEPES,12g/L,琼脂,12g/L,用脱去离子水。S42培养基的pH用KOH调为7.4。为了制备S42培养基,在121℃自动裂解至少30分钟后,加入下述的成分(每升):CaCl2,1g;K2HPO4,0.06g;铁柠檬酸盐,0.008g;葡萄糖,3.5g;硫酸铵,0.5g;用液体培养基35mL;以及假如200mg/mL的卡那霉素以防止污染。32℃培养4-7天,或直到橙色堆囊(sorangia)在表面出现。
为了制备种子培养物来接种琼脂平皿/生物反应器,接着进行下面的方法。移去琼脂上的橙色的纤维堆囊菌细胞斑(大约5mm2)并转到带有38mm硅泡沫盖片的250mL带挡板的瓶中,其含有50mL的豆浆培养基,该培养基含有马铃薯淀粉,8g;脱脂豆粉,2g;酵母提取物,2g;铁(III)钠盐EDTA,0.008g;MgSO4.7H2O,1g;CaCl2.2H2O,1g;葡萄糖,2g;HEPES缓冲液,11.5g。使用去离子水,pH用10%KOH调为7.4。加入2-3滴抗泡剂B来阻止产泡。在蹄槽瓶中30℃250RPM培养4-5天。培养物将显现出橙色。此种子培养物可被反复扩大次培养,来接种在生产培养基的期望体积中。
同样的制备物可与带有下列成分的培养基1一起使用(每升):CaCl2.2H2O,1g;酵母提取物,2g;豆蛋白,2g;FeEDTA,0.008g;MgSO4.7H2O,1g;HEPES,11.5g;pH用10%KOH调为7.4,在121℃下自动裂解至少30分钟后,加入8mL的灭菌的40%的葡萄糖。用250mL带有金属薄片覆盖的的Spring瓶代替baffle瓶。加入2-3滴抗泡剂B来阻止产泡。在蹄槽瓶中30℃以及250RPM下培养7天。整个50mL扩大次培养到500mL的新鲜培养基中,在具有38mm硅泡沫盖片的,带挡板的窄颈Fernbach瓶中将0.5mL的抗泡剂加到培养物中。在相同的条件下培养2-3天。使用至少10%的接种体来用于生物反应器的培养。
为了在固体培养基上培养,可以使用以下的操作。制备(每升CNS培养基)含有KNO3,0.5g;Na2HPO4,0.25g;MgSO4.7H2O,1g;FeCl2,0.01g;HEPES,2.4g;琼脂,1.5g;以及无菌Whatman过滤纸。当琼脂没有完全固化时,在表面上放置一个无菌的过滤纸盘。当平皿干燥后,加入足够的种子培养物来完全覆盖表面(大约1mL)。用无菌环或涂布器均匀涂布,并32℃放入培养器培养7天。收获平皿。
为了在5L生物反应器中生产,采用下面的操作。发酵可在B.Braun BisetatMD-1%L生物反应器中进行。制备4L的生产培养基(与不含HEPES缓冲液的用于种子培养的豆粉培养基相同)。加入2%(体积对体积)XAD-16吸收树脂,不洗涤且不处理,例如,每50mL的生产培养基中加入1mL的XAD。使用2.5NH2SO4用作酸瓶,10%KOH作为碱瓶,50%的抗泡剂B作为抗泡瓶。为了样品的检测,确定使接触培养基的管道系统有一个小的开口,以允许XAD通过通道,收集每日的样品。在自动裂解之前,搅动混合物完全来均匀成分。校准pH探针和检测溶解氧的探针,以确保其正确的功能。使用一个小的约3英寸长的抗泡探针。对于瓶子来说,使用可以无菌焊接的,但在样品出口使用硅树脂管道系统。确定所有安装是安全的,管道系统被用C-夹子嵌住,但不是太紧。不要夹住管道系统来对冷凝器排放。将与任意开口管道连接的0.2μm过滤盘接触空气。使大的ACRO 50过滤盘用于大的管道系统。制备一个无菌空瓶用于接种。121℃无菌自动裂解90分钟。一旦反应停止自动裂解,通过各自的泵通过将管道系统与酸,碱和抗泡剂接触。释放夹子,确认管道系统没有被焊接死。将温度探测器贴在控制单元上。使反应器冷却,同时通过空气入口以较低的空气流速喷射空气。
在确定泵在工作,且没有流速和阻塞问题,将水池连接到水配头的软管上,并排气冷凝器。确定水套接近满负荷。设定温度为32℃。将pH,D.O.,和抗泡剂探针连接到主要的控制单元上。测试抗泡剂的正确功能。将pH调整为7.4。将搅拌速度设成400RPM。使用空气和氮气校准D.O.探针。调整使用发酵操作速率的空气流动,例如1LPM(升/分钟)。为了控制溶解氧的水平,调整参数在喷流之下使得搅拌被抵消,使空气的的水平保持在50%的D.O值。基于控制单元的设置,设置最小和最大的搅拌分别为400到1000RPM。如有必要,调整设置。
在接种入发酵容器之前,检测种子培养物的任意可能的污染。纤维堆囊菌细胞是棒状的,像一个柱子,在细胞的相对的末端带有2个大的不同的环形真液泡。其长最大约5倍细胞的宽度。使用10%(最小)的接种体积,例如,400mL加入4L的生产培养基。从容器中取出最初的样品,并检测小试的pH。如果在发酵容器pH和小试的pH的差别大于等于0.1单位,再校正1点。将deadband校正到0.1。取每日的25mL样品注明发酵pH,小试pH,温度,D.O.,气流,搅拌,酸,碱,以及抗泡剂水平。如有必要调整pH。在收获之前允许发酵7天。
化合物的提取和分析大体上如上面实施例4所述的。简而言之,发酵培养物用乙烷基醋酸盐洗涤两次,浓缩干燥提取物,并溶解/悬浮在约500μL的Me-CNH2O(1∶1)中。样品被装在5ML的,预先用Me-CN H2O(1∶1)平衡的BakerbondODS SPE柱中。此柱用1mL的同种溶剂,然后是2mL的Me-CN洗涤。浓缩MeCN洗脱液至干燥。样品(50μl)通过在含有Beckman System Gold HPLC和PE S和配有气压化学离子源的API10LC单quadrapole MS-based检测仪的系统上进行HPLC/MS分析。环和孔电压被分别设置为75V和300。应用m/z290-330和450-550的双重范围扫描。HPLC条件:Metachem 5μ ODS-3Intersil(4.6×150mm);100%的水1分钟,然后用100%的MeCN多于10分钟流速1mL/min。在这种条件下,0.2分钟时洗脱出环氧噻酮A,且其在m/z494(M+H),476(M+H-H2O),318,和306处有特征离子。
                          实施例8
                作为抗癌试剂的环氧噻酮衍生物
上述通式(I)经过以下显示的新环氧噻酮衍生物能够做为有效的的抗癌试剂,并且可用于治疗不同形式的包括乳房,卵巢,和肺癌的癌症病人。
环氧噻酮的结构与活性的关系建立在微管蛋白结合方式上(参见Nicolalou等人,1007,Angew.Chem.Int.Ed.Engl.36:2097-2103)如下所示:
Figure A9981567801021
A)(3S)构形是重要的;B)4,4-ethano基团并不耐受;C)(6R,7S)构型是重要的,8,8-二甲基基团并不耐受;E)环氧化合物对于微管蛋白的聚合并不重要,但可能与细胞毒活性相关;环氧化合物结构可能很重要;R基团是重要的;两个链烯几何结构是耐受的;F)(15S)构型的重要性;G)较大的还原活性基团;H)氧气替代耐受;I)替代的重要性;J)杂环是重要的。
因此,这个SAR表明C1-C8的分子片段的修饰对活性有强烈影响,而分子的剩余部分对于改变相对耐受。C1-C8部分的取代立体化学的改变,或移去其功能能够导致活性的显著减少。环氧噻酮衍生化合物A-H的区别在于,对于环氧噻酮不敏感部分的分子修饰并具有优良的生物活性,但赋予较好的药代动力学特性,能改善亲脂和抗菌谱。
通过改变选择性参与环氧噻酮生物合成的基因,并伴随着化学修饰来制备得到这些新的衍生物。通过基因工程制备的9-羟基-环氧噻酮衍生物能通过用三碳酰氯或1,1′羰基二咪唑,在一个碱基存在下处理用以产生碳酸盐衍生物(化合物D)。以相似的方式,9,11-二羟基环氧噻酮衍生物,根据C-7羟基的话对其进行适当保护,能产生碳酸盐衍生物(化合物F)。带有羟胺的9含氧环氧噻酮的选择性氧化时,通过还原(在氢或硼氢化氰存在下的Raney镍)产生9-氨基类似物。将这些9-氨基衍生物在碱基存在下与p-硝基苯氯仿反应,然后与氢化物反应产生氨基甲酸盐衍生物(化合物E)。同样,氨基甲酸盐化合物G,如果存在上述C-7羟基并对其进行适当保护,能够制得9-氨基-11羟基-环氧噻酮衍生物。
合成路线如下所示。
A部分。环氧噻酮D-7,9-环化碳酸盐
将溶解于5mL亚甲基氯化物中的254mg环氧噻酮D溶液加入在一个圆底烧瓶中。冰浴冷却,然后加入0.3mL三乙基胺。在该溶液中加入104mg三碳酰氯。移走冰浴,混合物在氮气下搅拌5小时。所述溶液用20mL亚甲基氯稀释,然后用稀释的羧酸盐溶液洗涤。该有机溶剂用硫酸镁干燥并过滤。通过蒸馏干燥,分离环氧噻酮D-7,9-环化羧酸盐。
B部分。环氧噻酮D-7,9-环化氨基甲酸盐
(i)9-氨基环氧噻酮D
将溶解于5mL甲醇中的252mg 9-含氧环氧噻酮D加入一个圆底烧瓶中。加入0.5ML 50%羟胺于水中以及0.1mL乙酸,混合物在室温下搅拌过夜。在减压条件下移走溶剂,从而产生9-肟-环氧噻酮D。在冰浴条件下,向溶于5mL四氢呋喃(THF)的该9肟化合物中加入0.25mL1M的溶于THF中的硼氢化氰溶液。混合物反应1小时后,移走冰浴,溶液慢慢到加热至室温。加入1mL乙酸,在减压条件按下移走溶剂。残余物溶解在30mL亚甲基氯中,并用饱和氯化钠溶液洗涤。有机层被分离并用硫酸镁干燥过滤。通过蒸馏产生9-氨基环氧噻酮D。
(ii)环氧噻酮D-7,9-环化氨基甲酸盐
向溶解于5mL亚甲基氯化物中的250mg 9-氨基-环氧噻酮D中加入110mg4-硝基苯氯化物,然后加入1mL三乙基胺。溶液在室温下搅拌16小时。用25mL亚甲基氯化物稀释。溶液用饱和氯化钠溶液洗涤,有机层被分离并用硫酸镁干燥过滤。过滤后,溶液通过减压蒸馏。残基溶解在10mL干燥的THF中。在冰浴条件下加入40mg(60%分散于矿物油中)氢化钠。移走冰浴,混合物搅拌16小时。加入一半体积的的乙酸,溶液通过减压蒸馏干燥。残余物在溶解于50mL亚甲基氯化物稀释,并用饱和氯化钠溶液洗涤。有机层被分离并用硫酸镁干燥过滤。过滤后,有机溶剂通过减压蒸馏干燥。在硅胶柱中纯化分离出环氧噻酮D-7,9-氨基甲酸盐。
本发明已经通过书面以及实施例进行了描述,本领域技术人员将意识到本发明能够实际应用于很多实施方案中,上述描述和实施例适仅用于说明的目的,并非对下述权利要求进行限制。

Claims (28)

1.一种分离的重组核酸化合物,它含有编码环氧噻酮聚酮化合物合成酶(PKS)蛋白的至少一个结构域,和/或编码环氧噻酮修饰酶的一个功能区的多核苷酸序列。
2.根据权利要求1所述的核酸,其中该结构域选自装载结构域,硫酯酶结构域(thioesterase),NRPS,AT结构域,KS结构域,ACP结构域,KR结构域,DH结构域,ER结构域,甲基转移酶结构域和功能氧化酶结构域。
3.根据权利要求1或者2所述的核酸,它含有epoA基因的编码序列,和/或
      epoB基因的编码序列,和/或
      epoC基因的编码序列,和/或
      epoD基因的编码序列,和/或
      epoE基因的编码序列,和/或
      epoF基因的编码序列,和/或
      epoK基因的编码序列,和/或
      epoL基因的编码序列。
4.根据权利要求1-3的核酸,它还含有定在宿主细胞中转录该编码核苷酸序列的启动子,该启动子在该宿主细胞可以操作。
5.根据权利要求4的核酸,其中该启动子是选自堆囊菌(Sarangium)基因的启动子,或者选自
  粘球菌(myxococcus)基因,或者
  链霉菌(Strepomyces)基因,或者
  环氧噻酮聚酮化合物合成酶(PKS)基因,或者
  pilA基因,或者
  actinorhodin PKS基因,
6.根据权利要求1-5任何一项的核酸,它是一种重组DNA表达载体。
7.含有所有权利要求4-6所述核酸的宿主细胞。
8.根据权利要求7的宿主细胞,它是堆囊菌(Sarangium)细胞,或者
      粘球菌(myxococcus)细胞,或者
      假单胞菌(pseudomonas)细胞,或者
      链霉菌(Strepomyces)细胞。
9.一种产生聚酮化合物的方法,该方法包括在一定条件下培养权利7或者8的的细胞,其中的表达编码核苷酸序列从而获得功能PKS。
10.一种重组的纤维堆囊菌(Sarangium cellulosum)细胞,它含有环氧噻酮PKS蛋白或者环氧噻酮修饰酶的突变基因,其中通过同源重组的方法,应用含有整个或者部分环氧噻酮PKS基因或者环氧噻酮修饰酶基因的重组载体,将该突变基因完整地或者部分插入到该细胞的基因组DNA中。
11.根据权利要求10的重组宿主细胞,其中
由于一种突变失活或者删除了epoK基因,它能够产生环氧噻酮C或者D,但是不能产生环氧噻酮A或者B,或者
由于epoD中的突变改变了组件4AT结构域的特异性,它能够产生环氧噻酮A或者C,但是不能产生环氧噻酮B或者D,或者
由于epoD中的突变改变了组件4AT结构域的特异性,它能够产生环氧噻酮B或者D,但是不能产生环氧噻酮A或者C,或者
由于epoD中的突变改变了组件4AT结构域的特异性和epoK中的突变,它能够产生环氧噻酮C,但是不能产生环氧噻酮A,B或者D,或者
由于epoD中的突变改变了组件4AT结构域的特异性和epoK中的突变,它能够产生环氧噻酮D,但是不能产生环氧噻酮A,B或者C。
12.表达环氧噻酮PKS基因或者环氧噻酮修饰酶基因的重组链霉菌(Strepomyces)或者粘球菌(myxococcus)细胞,可选择的包括一个或者更多整合进它们的染色体DNA中的所述的环氧噻酮PKS或者环氧噻酮修饰酶基因,和/或含有一个或者更多在染色体外表达载体上的所述的环氧噻酮PKS或者环氧噻酮修饰酶基因。
13.根据权利要求12或者13所述的宿主细胞是天蓝色链霉菌(Streptomycescoelicolor)CH999。
14.一种生产环氧噻酮或者环氧噻酮衍生物的方法,包括培养权利要求12或者13的方法。
15.一种修饰的功能环氧噻酮PKS,其中这种修饰包括至少如下之一:
   用不同特异性的AT结构域替换至少一个AT结构域;
   失活NRPS类组件1或者KS2催化结构域;
   失活至少一个β-羰基修饰结构域的至少一种活性;
   在至少一个β-羰基修饰结构域中添加至少一种KR,DH和ER活性;以及用不同特异性的NRPS替换NPRS结构域。
16.细胞中或者无细胞体系中的根据权利要求15所述的修饰的PKS,其中该细胞或者体系中含有该环氧噻酮PKS修饰产物的的添加的酶。
17.根据权利要求16的修饰的PKS,其中该修饰酶包括至少一种甲基转移酶,氧化酶或者糖基化酶。
18.一种环氧噻酮衍生物的制备方法,该方法包括向权利要求15-17任何一项中所述的修饰的PKS提供包括添加单位(extender Unit)的底物。
19.一种修饰的环氧噻酮PKS,其中该修饰包括失活组件1的NRPS或者其组件2的KS2。
20.一种产生环氧噻酮衍生物的方法,该方法包括将权利要求19所述的修饰的PKS与组件1的底物或者组件2的底物及添加单位接触。
21.重组宿主细胞,它包括权利要求15-17或者19所述的修饰的PKS。
22.根据权利要求21所述的细胞,它产生的环氧噻酮衍生物选自:16-去甲基环氧噻酮,14-甲基环氧噻酮,11-羟基环氧噻酮,10-甲基环氧噻酮,8,9-环氧噻酮酐,9-羟基环氧噻酮,9-酮基环氧噻酮,8-去甲基环氧噻酮,和6-去甲基环氧噻酮。
23.一种化合物,选自:16-去甲基环氧噻酮,14-甲基环氧噻酮,11-羟基环氧噻酮,10-甲基环氧噻酮,8,9-环氧噻酮酐,9-羟基环氧噻酮,9-酮基环氧噻酮,8-去甲基环氧噻酮,和6-去甲基环氧噻酮。
24.一种重组PKS酶,它包括非环氧噻酮PKS的一个或多个结构域,组件或者蛋白,以及环氧噻酮PKS的一个或多个结构域,组件或者蛋白,和/或包括含有KSQ结构域的装载结构域。
25.根据权利要求24所述的PKS酶,其中
该PKS含有DEBS装载结构域,和DEBS的5个组件,和环氧噻酮PKS的一个NRPS,
其中该PKS含有带有环氧噻酮PKS的MT结构域的非环氧噻酮PKS的完整部分。
26.一种通式化合物:
Figure A9981567800041
包括它们的糖基化形式和未示出的立体异构体形式,
其中A基团为选择性地含有1-3个选自O,S,和N的杂原子的,取代或者未取代的直链,支链或者环状烷基,链烯基,或者炔基;或者其中A基团为取代或者未取代的芳族残基。
R2代表H,H,或者H,低级烷基,或者低级烷基,低级烷基;
X5代表=O或者它的衍生物,或者H,OH,或者H,NR2,其中R为H,烷基或者酰基,或者H,OCOR,OCONR2,其中R是H,或者是烷基,或者是H,H;
R6代表H或者低级烷基,相应的碳上留下的取代基团为H;
X7代表OR,或者NR2,其中的R为H,烷基或者酰基或者OCOR,或者OCONR2,其中的R为氢或者烷基或者由X7和X9形成碳酸盐或者氨甲酸盐环,其中相应的碳上留下的取代基团为H;
R8代表H或者低级烷基,相应的碳上留下的取代基团为H;
X9代表=O或者它的衍生物,或者H,OR,或者H,NR2,其中R为H,烷基或者酰基,或者H,OCOR,或OCONR2,其中R是H,或者是烷基,或者表示H,H或其中由X9和X7或者X11可以形成环式碳酸盐或者氨甲酸盐;
R10是H,H,或者H,低级烷基,或者低级烷基,低级烷基;
X11是=O或者它的衍生物,或者H,OR,或者H,NR2,其中R为H,烷基或者酰基,或者H,OCOR或者OCONR2,其中R是H或者是烷基,或者是H,H;或者其中由X11和X9可以形成环式碳酸盐或者氨甲酸盐;
R12是H,H,或者H,低级烷基,或者低级烷基,低级烷基;
X13是=O或者它的衍生物,或者H,OR,或者H,NR2,其中R为H,烷基或者酰基,或者H,OCOR或者OCONR2,其中R是H或者是烷基;
R14是H,H,H,低级烷基,或者低级烷基,低级烷基;
R16是H或者低级烷基;以及
其中H或者另外一个取代基团可以选择性地从12和13和/或8和9位去除掉以形成双键,其中该双键可以任意地转换为环氧化物。
27.一种通式化合物:
Figure A9981567800061
其中Z基团是氧或者一个Z基团是氮N而另外一个Z基团是氧,余下的取代基团由权利要求26确定。
28.一种重组载体,选自:pKOS35-70.8A3,pKOS35-70.1A2,pKOS35-70.4,pKOS35-79.85,pKOS039-124R,和pKOS039-126R。
CNB998156787A 1998-11-20 1999-11-19 产生环氧噻酮及其衍生物的重组方法和材料 Expired - Fee Related CN100381566C (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US10940198P 1998-11-20 1998-11-20
US60/109,401 1998-11-20
US11938699P 1999-02-10 1999-02-10
US60/119,386 1999-02-10
US12262099P 1999-03-03 1999-03-03
US60/122,620 1999-03-03
US13056099P 1999-04-22 1999-04-22
US60/130,560 1999-04-22
PCT/US1999/027438 WO2000031247A2 (en) 1998-11-20 1999-11-19 Recombinant methods and materials for producing epothilone and epothilone derivatives

Publications (2)

Publication Number Publication Date
CN1333820A true CN1333820A (zh) 2002-01-30
CN100381566C CN100381566C (zh) 2008-04-16

Family

ID=27493695

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB998156787A Expired - Fee Related CN100381566C (zh) 1998-11-20 1999-11-19 产生环氧噻酮及其衍生物的重组方法和材料

Country Status (10)

Country Link
US (7) US6303342B1 (zh)
EP (1) EP1135470A2 (zh)
JP (2) JP4662635B2 (zh)
KR (3) KR20070087132A (zh)
CN (1) CN100381566C (zh)
AU (1) AU768220B2 (zh)
CA (1) CA2350189A1 (zh)
IL (2) IL143069A0 (zh)
NZ (1) NZ511722A (zh)
WO (1) WO2000031247A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108658949A (zh) * 2018-06-29 2018-10-16 云南大学 一种用作抗肿瘤药物的化合物及其生产方法
WO2022017523A1 (zh) * 2020-07-24 2022-01-27 北京华昊中天生物医药股份有限公司 生产脱环氧埃坡霉素b的重组菌及其用途

Families Citing this family (158)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100538095B1 (ko) 1996-11-18 2005-12-21 게젤샤프트 퓌어 비오테크놀로기쉐 포르슝 엠베하(게베에프) 에포틸론 씨, 디, 이 및 에프, 그 제조방법 및 세포증식 억제제와 식물 위생제로서의 이들의 용도
EP0977563B1 (en) 1996-12-03 2005-10-12 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto, analogues and uses thereof
US20050043376A1 (en) * 1996-12-03 2005-02-24 Danishefsky Samuel J. Synthesis of epothilones, intermediates thereto, analogues and uses thereof
US6204388B1 (en) * 1996-12-03 2001-03-20 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto and analogues thereof
US6399789B1 (en) 1996-12-18 2002-06-04 Kosan Biosciences, Inc. Multi-plasmid method for preparing large libraries of polyketides and non-ribosomal peptides
US6605599B1 (en) 1997-07-08 2003-08-12 Bristol-Myers Squibb Company Epothilone derivatives
US6365749B1 (en) 1997-12-04 2002-04-02 Bristol-Myers Squibb Company Process for the preparation of ring-opened epothilone intermediates which are useful for the preparation of epothilone analogs
FR2775187B1 (fr) 1998-02-25 2003-02-21 Novartis Ag Utilisation de l'epothilone b pour la fabrication d'une preparation pharmaceutique antiproliferative et d'une composition comprenant l'epothilone b comme agent antiproliferatif in vivo
US6498257B1 (en) 1998-04-21 2002-12-24 Bristol-Myers Squibb Company 2,3-olefinic epothilone derivatives
US6380395B1 (en) 1998-04-21 2002-04-30 Bristol-Myers Squibb Company 12, 13-cyclopropane epothilone derivatives
US6121029A (en) 1998-06-18 2000-09-19 Novartis Ag Genes for the biosynthesis of epothilones
DE19826988A1 (de) 1998-06-18 1999-12-23 Biotechnolog Forschung Gmbh Epothilon-Nebenkomponenten
DE19846493A1 (de) * 1998-10-09 2000-04-13 Biotechnolog Forschung Gmbh DNA-Sequenzen für die enzymatische Synthese von Polyketid- oder Heteropolyketidverbindungen
US6410301B1 (en) 1998-11-20 2002-06-25 Kosan Biosciences, Inc. Myxococcus host cells for the production of epothilones
US6303342B1 (en) 1998-11-20 2001-10-16 Kason Biosciences, Inc. Recombinant methods and materials for producing epothilones C and D
HUP0200296A2 (en) * 1998-12-23 2002-05-29 Bristol Myers Squibb Co Microbial transformation method for the preparation of an epothilone
US6596875B2 (en) * 2000-02-07 2003-07-22 James David White Method for synthesizing epothilones and epothilone analogs
ATE331028T1 (de) * 1999-04-16 2006-07-15 Kosan Biosciences Inc Multi-plasmid verfahren zur herstellung von grossen bibliotheken von polyketiden und nicht- ribosomalen peptiden
WO2001031049A2 (en) * 1999-10-25 2001-05-03 Kosan Biosciences, Inc. Production of polyketides
IL148934A0 (en) * 1999-10-27 2002-09-12 Kosan Biosciences Inc Heterologous production of polyketides
US6518421B1 (en) 2000-03-20 2003-02-11 Bristol-Myers Squibb Company Process for the preparation of epothilone analogs
US6589968B2 (en) 2001-02-13 2003-07-08 Kosan Biosciences, Inc. Epothilone compounds and methods for making and using the same
AU2001295195B2 (en) * 2000-04-28 2007-02-01 Kosan Biosciences, Inc. Myxococcus host cells for the production of epothilones
US8618085B2 (en) * 2000-04-28 2013-12-31 Koasn Biosciences Incorporated Therapeutic formulations of desoxyepothilones
US6998256B2 (en) 2000-04-28 2006-02-14 Kosan Biosciences, Inc. Methods of obtaining epothilone D using crystallization and /or by the culture of cells in the presence of methyl oleate
WO2001092991A2 (en) 2000-05-30 2001-12-06 Kosan Biosciences, Inc. Design of polyketide synthase genes
JP2004516011A (ja) * 2000-07-25 2004-06-03 コーサン バイオサイエンシーズ, インコーポレイテッド エポチロンのための発酵プロセス
AU2001283275A1 (en) * 2000-08-09 2002-02-18 Kosan Biosciences, Inc. Bio-intermediates for use in the chemical synthesis of polyketides
WO2002032916A2 (en) * 2000-09-25 2002-04-25 Kosan Biosciences, Inc. Sixteen-membered macrolide compounds
US7257562B2 (en) 2000-10-13 2007-08-14 Thallion Pharmaceuticals Inc. High throughput method for discovery of gene clusters
US20030077759A1 (en) * 2000-12-28 2003-04-24 Zhihao Hu Plasmids for polyketide production
PT1353668E (pt) 2001-01-25 2008-06-30 Bristol Myers Squibb Co Processos de preparação de substâncias farmacêutica contendo substâncias análogas à epotilona para o tratamento de cancro
SK8552003A3 (en) 2001-01-25 2004-06-08 Bristol Myers Squibb Co Parenteral formulation containing epothilone analogs
WO2002058699A1 (en) 2001-01-25 2002-08-01 Bristol-Myers Squibb Company Pharmaceutical forms of epothilones for oral administration
US6893859B2 (en) * 2001-02-13 2005-05-17 Kosan Biosciences, Inc. Epothilone derivatives and methods for making and using the same
EP1368030A1 (en) 2001-02-20 2003-12-10 Bristol-Myers Squibb Company Epothilone derivatives for the treatment of refractory tumors
WO2002066038A1 (en) 2001-02-20 2002-08-29 Bristol-Myers Squibb Company Treatment of refractory tumors using epothilone derivatives
SK11082003A3 (sk) 2001-03-14 2004-08-03 Bristol-Myers Squibb Company Kombinácia analógov epotilónu a chemoterapeutických činidiel na liečenie proliferatívnych ochorení
US6906188B2 (en) * 2001-04-30 2005-06-14 State Of Oregon Acting By And Through The State Board Of Higher Education On Behalf Of Oregon State University Method for synthesizing epothilones and epothilone analogs
US20070203346A1 (en) * 2001-04-30 2007-08-30 Oregon State University Method for synthesizing epothilones and epothilone analogs
MXPA03010909A (es) 2001-06-01 2004-02-17 Bristol Myers Squibb Co Derivados de epotilona.
TWI315982B (en) 2001-07-19 2009-10-21 Novartis Ag Combinations comprising epothilones and pharmaceutical uses thereof
WO2003014311A2 (en) * 2001-08-06 2003-02-20 Kosan Biosciences, Inc. Methods for altering polyketide synthase genes
AU2002363803A1 (en) * 2001-11-15 2003-05-26 Kosan Biosciences, Inc. Method for making epothilone compounds by bioconversion with microorganisms
US7189549B2 (en) * 2002-06-14 2007-03-13 Kosan Biosciences, Inc. Recombinant polynucleotides encoding pro-geldanamycin producing polyketide synthase and accessory proteins, and uses thereof
EP2030618A3 (en) 2002-01-14 2009-03-11 Novartis AG Combinations comprising epothilones and anti-metabolites
CN1639319B (zh) * 2002-02-25 2010-04-28 高山生物科学股份有限公司 次级代谢物同属物分布调节法
EP1483251B1 (en) 2002-03-12 2009-12-23 Bristol-Myers Squibb Company C3-cyano epothilone derivatives
AU2003218107A1 (en) 2002-03-12 2003-09-29 Bristol-Myers Squibb Company C12-cyano epothilone derivatives
TW200403994A (en) 2002-04-04 2004-03-16 Bristol Myers Squibb Co Oral administration of EPOTHILONES
TW200400191A (en) 2002-05-15 2004-01-01 Bristol Myers Squibb Co Pharmaceutical compositions and methods of using C-21 modified epothilone derivatives
EP1575556A2 (en) * 2002-05-20 2005-09-21 Kosan Biosciences, Inc. Methods to administer epothilone d
AU2003243561A1 (en) 2002-06-14 2003-12-31 Bristol-Myers Squibb Company Combination of epothilone analogs and chemotherapeutic agents for the treatment of proliferative diseases
AU2003258978A1 (en) 2002-06-28 2004-01-19 Kosan Biosciences, Inc. Recombinant genes for polyketide modifying enzymes
WO2004015088A2 (en) * 2002-08-13 2004-02-19 Kosan Biosciences, Inc. Transposon-based transformation system
AU2003265608A1 (en) * 2002-08-21 2004-03-11 Kosan Biosciences, Inc. Myxococcus xanthus bacteriophage mx9 transformation and integration system
US6921769B2 (en) 2002-08-23 2005-07-26 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto and analogues thereof
EP1767535B1 (en) 2002-08-23 2009-12-02 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto, analogues and uses thereof
US7649006B2 (en) * 2002-08-23 2010-01-19 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto and analogues thereof
KR101406635B1 (ko) 2002-09-23 2014-06-11 브리스톨-마이어스 스큅 컴퍼니 에포틸론 b의 제조, 분리 및 정제 방법, 및 에포틸론 b의 x-선 결정 구조
CN101177425B (zh) * 2003-01-28 2012-07-18 北京华昊中天生物技术有限公司 一类新型埃坡霉素化合物及其制备方法和用途
US20050171167A1 (en) * 2003-11-04 2005-08-04 Haby Thomas A. Process and formulation containing epothilones and analogs thereof
US20050215604A1 (en) * 2004-03-26 2005-09-29 Kosan Biosciences, Inc. Combination therapies with epothilones and carboplatin
PL2253614T3 (pl) 2004-04-07 2013-03-29 Novartis Ag Inhibitory IAP
US7595187B2 (en) * 2004-11-12 2009-09-29 Wyeth Elaiophylin biosynthetic gene cluster
US20060211736A1 (en) * 2005-01-13 2006-09-21 Wisconsin Alumni Research Foundation Glutarimide-containing polyketide analogs and methods thereof
EP2634252B1 (en) 2005-02-11 2018-12-19 University of Southern California Method of expressing proteins with disulfide bridges
KR100681811B1 (ko) * 2005-03-15 2007-02-12 성균관대학교산학협력단 생물학적 대사부산물의 효율적인 제거를 통한 유용 이차대사산물의 제조방법
US7772177B2 (en) 2005-05-18 2010-08-10 Aegera Therapeutics, Inc. BIR domain binding compounds
GB0510390D0 (en) 2005-05-20 2005-06-29 Novartis Ag Organic compounds
BRPI0616755A2 (pt) 2005-09-27 2011-06-28 Novartis Ag compostos de carboxiamina e métodos de uso dos mesmos
AU2006314444C1 (en) 2005-11-21 2018-01-04 Novartis Ag Neuroendocrine tumor treatment using mTOR inhibitors
GB0605120D0 (en) 2006-03-14 2006-04-26 Novartis Ag Organic Compounds
CN102671196B (zh) 2006-04-05 2014-12-03 诺华股份有限公司 用于治疗癌症的治疗剂的组合
EP2314297A1 (en) 2006-04-05 2011-04-27 Novartis AG Combinations comprising bcr-abl/c-kit/pdgf-r tk inhibitors for treating cancer
EP2029156A4 (en) * 2006-05-01 2010-07-21 Univ Southern California POLY THERAPY FOR TREATING CANCER
KR20090007635A (ko) 2006-05-09 2009-01-19 노파르티스 아게 철 킬레이터 및 항-신생물 약제를 포함하는 조합물 및 그의용도
JP5419685B2 (ja) 2006-05-16 2014-02-19 ファーマサイエンス・インコーポレイテッド Iapbirドメイン結合タンパク質
JP2010504933A (ja) 2006-09-29 2010-02-18 ノバルティス アーゲー Pi3k脂質キナーゼ阻害剤としてのピラゾロピリミジン
EP2359818A1 (en) 2007-02-15 2011-08-24 Novartis AG Combination of LBH589 with HSP 90 inhibitors for treating cancer
US9115359B2 (en) * 2007-04-02 2015-08-25 Newsouth Innovations Pty Limited Methods for producing secondary metabolites
KR100901164B1 (ko) * 2007-07-16 2009-06-04 성균관대학교산학협력단 이종 세포 유래의 프로피오닐―CoA 신테타제 유전자로형질전환된 에포틸론 생산균주 및 이를 이용한 에포틸론의제조방법
MX2010010525A (es) 2008-03-24 2010-10-25 Novartis Ag Inhibidores de metaloproteasa de matriz basados en aril-sulfonamida.
NZ588069A (en) 2008-03-26 2012-06-29 Novartis Ag Hydroxamate-based inhibitors of deacetylases b
US8569023B2 (en) * 2008-03-28 2013-10-29 The Regents Of The University Of California Producing dicarboxylic acids using polyketide synthases
DK2276485T3 (da) 2008-04-24 2014-10-13 Bristol Myers Squibb Co Anvendelse af epothilon d i behandling af tau-associerede sygdomme,herunder alzheimers sygdom
JP2011519860A (ja) * 2008-04-29 2011-07-14 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア ポリケチドシンターゼを使用するバイオ燃料の生成
WO2010056901A2 (en) 2008-11-13 2010-05-20 University Of Southern California Method of expressing proteins with disulfide bridges with enhanced yields and activity
WO2010083617A1 (en) 2009-01-21 2010-07-29 Oncalis Ag Pyrazolopyrimidines as protein kinase inhibitors
EP2391366B1 (en) 2009-01-29 2012-11-28 Novartis AG Substituted benzimidazoles for the treatment of astrocytomas
SI2445903T1 (sl) 2009-06-26 2014-07-31 Novartis Ag 1,3-disubstituirani imidazolidin-2-onski derivati kot inhibitorji CYP 17
US8389526B2 (en) 2009-08-07 2013-03-05 Novartis Ag 3-heteroarylmethyl-imidazo[1,2-b]pyridazin-6-yl derivatives
MX2012001838A (es) 2009-08-12 2012-02-29 Novartis Ag Compuestos de hidrazona heterociclico y sus usos para tratar cancer e inflamacion.
KR20120089463A (ko) 2009-08-20 2012-08-10 노파르티스 아게 헤테로시클릭 옥심 화합물
BR112012008075A2 (pt) 2009-08-26 2016-03-01 Novartis Ag compostos de heteroarila tetrassubstituídos e seu uso como moduladores de mdm2 e/ou mdm4
MY156209A (en) 2009-11-04 2016-01-29 Novartis Ag Heterocyclic sulfonamide derivatives useful mek inhibitors
EP3351558B1 (en) 2009-11-13 2020-03-11 Daiichi Sankyo Europe GmbH Material and methods for treating or preventing her-3 associated diseases
CA2781218A1 (en) 2009-12-08 2011-06-16 Novartis Ag Heterocyclic sulfonamide derivatives
US8440693B2 (en) 2009-12-22 2013-05-14 Novartis Ag Substituted isoquinolinones and quinazolinones
CU24130B1 (es) 2009-12-22 2015-09-29 Novartis Ag Isoquinolinonas y quinazolinonas sustituidas
BR112012020113A2 (pt) 2010-02-12 2016-06-07 Pharmascience Inc compostos de ligação ao domínio iap bir
EP2571525A4 (en) 2010-05-18 2016-04-27 Cerulean Pharma Inc Compositions and methods for treating autoimmune and other diseases
UA112517C2 (uk) 2010-07-06 2016-09-26 Новартіс Аг Тетрагідропіридопіримідинові похідні
CA2815154A1 (en) 2010-08-06 2012-02-09 U3 Pharma Gmbh Use of her3 binding agents in prostate treatment
US8946260B2 (en) 2010-09-16 2015-02-03 Novartis Ag 17α-hydroxylase/C17,20-lyase inhibitors
US8852902B2 (en) 2010-11-22 2014-10-07 The Regents Of The University Of California Producing a trimethylpentanoic acid using hybrid polyketide synthases
MX2013008062A (es) 2011-01-28 2013-08-09 Amyris Inc Seleccion de microcolonias encapsuladas en gel.
JP2014505088A (ja) 2011-02-10 2014-02-27 ノバルティス アーゲー C−METチロシンキナーゼ阻害剤としての[1,2,4]トリアゾロ[4,3−b]ピリダジン化合物
CN103649073B (zh) 2011-04-28 2016-04-13 诺瓦提斯公司 17α-羟化酶/C17,20-裂合酶抑制剂
KR20140032438A (ko) 2011-05-13 2014-03-14 아미리스 인코퍼레이티드 수혼화성 화합물의 미생물 생산의 검출 방법 및 조성물
IN2014DN00123A (zh) 2011-06-09 2015-05-22 Novartis Ag
US8859535B2 (en) 2011-06-20 2014-10-14 Novartis Ag Hydroxy substituted isoquinolinone derivatives
WO2012175487A1 (en) 2011-06-20 2012-12-27 Novartis Ag Cyclohexyl isoquinolinone compounds
KR20140025530A (ko) 2011-06-27 2014-03-04 노파르티스 아게 테트라히드로-피리도-피리미딘 유도체의 고체 형태 및 염
BR112014006223A8 (pt) 2011-09-15 2018-01-09 Novartis Ag 3-(quinolin-6-iltio)-[1,2,4-triazol[4,3-a] piradinas 6-substituídas, seus usos, composições farmacêuticas, e combinação
JP5992054B2 (ja) 2011-11-29 2016-09-14 ノバルティス アーゲー ピラゾロピロリジン化合物
EA025322B1 (ru) 2011-12-22 2016-12-30 Новартис Аг Производные дигидробензооксазина и дигидропиридооксазина
WO2013093850A1 (en) 2011-12-22 2013-06-27 Novartis Ag Quinoline derivatives
CN104125953A (zh) 2011-12-23 2014-10-29 诺华股份有限公司 用于抑制bcl2与结合配偶体相互作用的化合物
EP2794591A1 (en) 2011-12-23 2014-10-29 Novartis AG Compounds for inhibiting the interaction of bcl2 with binding partners
CA2859873A1 (en) 2011-12-23 2013-06-27 Novartis Ag Compounds for inhibiting the interaction of bcl2 with binding partners
JP2015503515A (ja) 2011-12-23 2015-02-02 ノバルティス アーゲー Bcl2と結合相手の相互作用を阻害するための化合物および組成物
WO2013096055A1 (en) 2011-12-23 2013-06-27 Novartis Ag Compounds for inhibiting the interaction of bcl2 with binding partners
US8815926B2 (en) 2012-01-26 2014-08-26 Novartis Ag Substituted pyrrolo[3,4-D]imidazoles for the treatment of MDM2/4 mediated diseases
WO2013171640A1 (en) 2012-05-15 2013-11-21 Novartis Ag Benzamide derivatives for inhibiting the activity of abl1, abl2 and bcr-abl1
PL2900637T3 (pl) 2012-05-15 2018-01-31 Novartis Ag Pirymidyna podstawiona tiazolem lub imidazolem, amidowe pochodne pirazyny i pirydyny i powiązane związki takie jak inhibitory abl1, abl2 i bcr-abl1 do leczenia nowotworu, specyficznych infekcji wirusowych i specyficznych zaburzeń cns
WO2013171642A1 (en) 2012-05-15 2013-11-21 Novartis Ag Benzamide derivatives for inhibiting the activity of abl1, abl2 and bcr-abl1
CU24265B1 (es) 2012-05-15 2017-07-04 Novartis Ag Compuestos derivados de benzamida para inhibir la actividad de abl1, abl2 y bcr-abl1, útiles en el tratamiento del cáncer
US9365576B2 (en) 2012-05-24 2016-06-14 Novartis Ag Pyrrolopyrrolidinone compounds
EP2861256B1 (en) 2012-06-15 2019-10-23 The Brigham and Women's Hospital, Inc. Compositions for treating cancer and methods for making the same
US10090498B2 (en) 2012-06-24 2018-10-02 SeeScan, Inc. Modular battery pack apparatus, systems, and methods including viral data and/or code transfer
AU2013299608B2 (en) 2012-08-07 2019-02-21 Amyris, Inc. Methods for stabilizing production of acetyl-coenzyme a derived compounds
PE20150998A1 (es) 2012-10-02 2015-06-29 Epitherapeutics Aps Inhibidores de histona demetilasas
TW201422625A (zh) 2012-11-26 2014-06-16 Novartis Ag 二氫-吡啶并-□衍生物之固體形式
EP2948451B1 (en) 2013-01-22 2017-07-12 Novartis AG Substituted purinone compounds
US9556180B2 (en) 2013-01-22 2017-01-31 Novartis Ag Pyrazolo[3,4-d]pyrimidinone compounds as inhibitors of the P53/MDM2 interaction
WO2014128612A1 (en) 2013-02-20 2014-08-28 Novartis Ag Quinazolin-4-one derivatives
PL2961736T3 (pl) 2013-02-27 2018-08-31 Gilead Sciences, Inc. Inhibitory demetylaz histonowych
MX364748B (es) 2013-03-15 2019-05-06 Amyris Inc Uso de fosfoquetolasa y fosfotransacetilasa para la produccion de compuestos derivados de acetil-coenzima a.
US20150018376A1 (en) 2013-05-17 2015-01-15 Novartis Ag Pyrimidin-4-yl)oxy)-1h-indole-1-carboxamide derivatives and use thereof
UY35675A (es) 2013-07-24 2015-02-27 Novartis Ag Derivados sustituidos de quinazolin-4-ona
US10563229B2 (en) 2013-08-07 2020-02-18 Amyris, Inc. Methods for stabilizing production of acetyl-coenzyme a derived compounds
WO2015022663A1 (en) 2013-08-14 2015-02-19 Novartis Ag Compounds and compositions as inhibitors of mek
WO2015022664A1 (en) 2013-08-14 2015-02-19 Novartis Ag Compounds and compositions as inhibitors of mek
US9227969B2 (en) 2013-08-14 2016-01-05 Novartis Ag Compounds and compositions as inhibitors of MEK
US9657007B2 (en) 2013-09-22 2017-05-23 Calitor Sciences, Llc Substituted aminopyrimidine compounds and methods of use
US10233431B2 (en) 2014-02-26 2019-03-19 The Regents Of The University Of California Producing 3-hydroxycarboxylic acid and ketone using polyketide synthases
JP6517319B2 (ja) 2014-03-28 2019-05-22 キャリター・サイエンシーズ・リミテッド・ライアビリティ・カンパニーCalitor Sciences, Llc 置換されたヘテロアリール化合物および使用方法
WO2015153498A1 (en) 2014-03-31 2015-10-08 Epitherapeutics, Aps Inhibitors of histone demethylases
BR112016022499A2 (pt) 2014-04-03 2017-08-15 Invictus Oncology Pvt Ltd Produtos terapêuticos combinatórios supramoleculares
KR101606635B1 (ko) * 2014-06-02 2016-03-28 이화여자대학교 산학협력단 에포틸론 발현 카세트 및 이의 용도
KR101601424B1 (ko) * 2014-06-02 2016-03-09 이화여자대학교 산학협력단 에포틸론 발현용 벡터 및 이의 용도
AU2015306662A1 (en) 2014-08-27 2017-03-09 Gilead Sciences, Inc. Compounds and methods for inhibiting histone demethylases
BR112017027970A2 (pt) 2015-06-25 2018-08-28 Amyris, Inc. degrons dependentes de maltose, promotores responsivos à maltose, construtos de estabilização, e seu uso na produção de compostos não catabólicos
EP3347097B1 (en) 2015-09-11 2021-02-24 Sunshine Lake Pharma Co., Ltd. Substituted aminopyrimidine derivatives as modulators of the kinases jak, flt3 and aurora
EP3710006A4 (en) 2017-11-19 2021-09-01 Sunshine Lake Pharma Co., Ltd. SUBSTITUTED HETEROARYL COMPOUNDS AND THEIR METHODS OF USE
AU2019209960B2 (en) 2018-01-20 2023-11-23 Sunshine Lake Pharma Co., Ltd. Substituted aminopyrimidine compounds and methods of use
FR3087650B1 (fr) 2018-10-31 2021-01-29 Bio Even Flavine adenine dinucleotide (fad) pour son utilisation pour la prevention et/ou le traitement de cancer

Family Cites Families (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8608080D0 (en) 1986-04-02 1986-05-08 Fujisawa Pharmaceutical Co Solid dispersion composition
US5252474A (en) 1989-03-31 1993-10-12 Merck & Co., Inc. Cloning genes from Streptomyces avermitilis for avermectin biosynthesis and the methods for their use
KR0159766B1 (ko) 1989-10-16 1998-12-01 후지사와 토모키치로 양모제 조성물
GB8925797D0 (en) 1989-11-15 1990-01-04 Fisons Plc Compositions
US5824513A (en) 1991-01-17 1998-10-20 Abbott Laboratories Recombinant DNA method for producing erythromycin analogs
WO1993013663A1 (en) 1992-01-17 1993-07-22 Abbott Laboratories Method of directing biosynthesis of specific polyketides
PT501921E (pt) 1991-03-01 2001-12-28 Syngenta Participations Ag Processo para a manipulacao genetica de mixobacterias
DE4138042C2 (de) 1991-11-19 1993-10-14 Biotechnolog Forschung Gmbh Epothilone, deren Herstellungsverfahren sowie diese Verbindungen enthaltende Mittel
US5264355A (en) 1992-07-02 1993-11-23 Merck & Co., Inc. Methlating enzyme from streptomyces MA6858
AU678058B2 (en) 1993-09-20 1997-05-15 John Innes Centre Recombinant production of novel polyketides
US5712146A (en) 1993-09-20 1998-01-27 The Leland Stanford Junior University Recombinant combinatorial genetic library for the production of novel polyketides
US6066721A (en) 1995-07-06 2000-05-23 Stanford University Method to produce novel polyketides
US5672491A (en) 1993-09-20 1997-09-30 The Leland Stanford Junior University Recombinant production of novel polyketides
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
NZ313383A (en) 1995-07-06 1999-08-30 Univ Leland Stanford Junior Cell-free synthesis of polyketides using pks (polyketide synthase)
DE69636195T2 (de) 1995-10-13 2007-03-29 President And Fellows Of Harvard College, Cambridge Phosphopantethenyltransferasen und deren verwendungen
DK1186606T4 (da) 1995-11-17 2011-12-05 Biotechnolog Forschung Gmbh Epothilonderivater, deres fremstilling og anvendelse
US5776735A (en) 1995-12-04 1998-07-07 Pfizer Inc. Process for dienone macrolides
US5998194A (en) 1995-12-21 1999-12-07 Abbott Laboratories Polyketide-associated sugar biosynthesis genes
US5783431A (en) 1996-04-24 1998-07-21 Chromaxome Corporation Methods for generating and screening novel metabolic pathways
US5969145A (en) 1996-08-30 1999-10-19 Novartis Ag Process for the production of epothilones and intermediate products within the process
NZ334821A (en) 1996-08-30 2000-12-22 Novartis Ag Method for producing epothilones
KR100538095B1 (ko) * 1996-11-18 2005-12-21 게젤샤프트 퓌어 비오테크놀로기쉐 포르슝 엠베하(게베에프) 에포틸론 씨, 디, 이 및 에프, 그 제조방법 및 세포증식 억제제와 식물 위생제로서의 이들의 용도
EP0977563B1 (en) 1996-12-03 2005-10-12 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto, analogues and uses thereof
US6380394B1 (en) 1996-12-13 2002-04-30 The Scripps Research Institute Epothilone analogs
US6441186B1 (en) 1996-12-13 2002-08-27 The Scripps Research Institute Epothilone analogs
US6033883A (en) 1996-12-18 2000-03-07 Kosan Biosciences, Inc. Production of polyketides in bacteria and yeast
JP2001524829A (ja) 1997-04-30 2001-12-04 コーサン バイオサイエンシーズ,インコーポレイテッド 足場としてモジュラー性pks遺伝子クラスターを使用して生成されるコンビナトリアルなポリケチドライブラリー
US6605599B1 (en) 1997-07-08 2003-08-12 Bristol-Myers Squibb Company Epothilone derivatives
IL133716A0 (en) 1997-07-10 2001-04-30 Kosan Biosciences Inc Production of polyketides in plants
EP1847540A1 (de) 1997-08-09 2007-10-24 Bayer Schering Pharma Aktiengesellschaft Neue Epothilonderivate, Herstellungsverfahren dafür und ihre pharmazeutische Verwendung
DE19741899A1 (de) 1997-09-22 1999-03-25 Hahl Erwin Gmbh Kunststoffborsten für die Waschbürsten von automatischen Autowaschanlagen
US6365749B1 (en) 1997-12-04 2002-04-02 Bristol-Myers Squibb Company Process for the preparation of ring-opened epothilone intermediates which are useful for the preparation of epothilone analogs
US6090601A (en) 1998-01-23 2000-07-18 Kosan Bioscience Sorangium polyketide synthase
US6280999B1 (en) * 1998-01-23 2001-08-28 Kosan Bioscience Sorangium polyketide synthases and encoding DNA therefor
MY125921A (en) 1998-02-05 2006-08-30 Novartis Ag Compositions containing organic compounds
DE19804673A1 (de) 1998-02-06 1999-08-12 Studiengesellschaft Kohle Mbh Verfahren zur Darstellung makrocyclischer Produkte durch ringschliessende Diin-Metathese
US6194181B1 (en) 1998-02-19 2001-02-27 Novartis Ag Fermentative preparation process for and crystal forms of cytostatics
FR2775187B1 (fr) 1998-02-25 2003-02-21 Novartis Ag Utilisation de l'epothilone b pour la fabrication d'une preparation pharmaceutique antiproliferative et d'une composition comprenant l'epothilone b comme agent antiproliferatif in vivo
DE69927790T2 (de) 1998-02-25 2006-07-20 Sloan-Kettering Institute For Cancer Research Synthese von epothilonen, ihren zwischenprodukten und analogen verbindungen
US6498257B1 (en) 1998-04-21 2002-12-24 Bristol-Myers Squibb Company 2,3-olefinic epothilone derivatives
US6380395B1 (en) 1998-04-21 2002-04-30 Bristol-Myers Squibb Company 12, 13-cyclopropane epothilone derivatives
US6121029A (en) 1998-06-18 2000-09-19 Novartis Ag Genes for the biosynthesis of epothilones
DE19826988A1 (de) 1998-06-18 1999-12-23 Biotechnolog Forschung Gmbh Epothilon-Nebenkomponenten
NZ508326A (en) * 1998-06-18 2003-10-31 Novartis Ag A polyketide synthase and non ribosomal peptide synthase genes, isolated from a myxobacterium, necessary for synthesis of epothiones A and B
WO1999067253A2 (en) 1998-06-22 1999-12-29 Novartis Ag Desmethyl epothilones
WO2000000485A1 (de) 1998-06-30 2000-01-06 Schering Aktiengesellschaft Epothilon-derivate, verfahren zu deren herstellung, zwischenprodukte und ihre pharmazeutische verwendung
WO2000001838A2 (en) 1998-07-02 2000-01-13 The Board Of Regents Of The Leland Stanford Junior University Methods for making polyketides
DE19846493A1 (de) * 1998-10-09 2000-04-13 Biotechnolog Forschung Gmbh DNA-Sequenzen für die enzymatische Synthese von Polyketid- oder Heteropolyketidverbindungen
US6410301B1 (en) 1998-11-20 2002-06-25 Kosan Biosciences, Inc. Myxococcus host cells for the production of epothilones
US6303342B1 (en) 1998-11-20 2001-10-16 Kason Biosciences, Inc. Recombinant methods and materials for producing epothilones C and D
US6998256B2 (en) 2000-04-28 2006-02-14 Kosan Biosciences, Inc. Methods of obtaining epothilone D using crystallization and /or by the culture of cells in the presence of methyl oleate
US6489314B1 (en) 2001-04-03 2002-12-03 Kosan Biosciences, Inc. Epothilone derivatives and methods for making and using the same
US6589968B2 (en) 2001-02-13 2003-07-08 Kosan Biosciences, Inc. Epothilone compounds and methods for making and using the same
AU2001295195B2 (en) 2000-04-28 2007-02-01 Kosan Biosciences, Inc. Myxococcus host cells for the production of epothilones
US6893859B2 (en) 2001-02-13 2005-05-17 Kosan Biosciences, Inc. Epothilone derivatives and methods for making and using the same
WO2002080846A2 (en) 2001-04-03 2002-10-17 Kosan Biosciences, Inc. Epothilone derivatives and methods for making and using the same
EP3318214B1 (en) 2017-04-21 2020-04-15 Siemens Healthcare GmbH Medical imaging device with smartglasses and method for supporting a person using a medical imaging device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108658949A (zh) * 2018-06-29 2018-10-16 云南大学 一种用作抗肿瘤药物的化合物及其生产方法
WO2022017523A1 (zh) * 2020-07-24 2022-01-27 北京华昊中天生物医药股份有限公司 生产脱环氧埃坡霉素b的重组菌及其用途

Also Published As

Publication number Publication date
KR20070087132A (ko) 2007-08-27
US7402421B2 (en) 2008-07-22
US6921650B1 (en) 2005-07-26
NZ511722A (en) 2004-05-28
EP1135470A2 (en) 2001-09-26
WO2000031247A2 (en) 2000-06-02
US20090170172A1 (en) 2009-07-02
US6583290B1 (en) 2003-06-24
US7732186B2 (en) 2010-06-08
KR20060124789A (ko) 2006-12-05
US20040253697A1 (en) 2004-12-16
CN100381566C (zh) 2008-04-16
CA2350189A1 (en) 2000-06-02
US7129071B1 (en) 2006-10-31
US6303342B1 (en) 2001-10-16
KR100716272B1 (ko) 2007-05-09
AU768220B2 (en) 2003-12-04
US6858411B1 (en) 2005-02-22
JP2007097595A (ja) 2007-04-19
IL143069A (en) 2008-06-05
IL143069A0 (en) 2002-04-21
JP2002530107A (ja) 2002-09-17
JP4662635B2 (ja) 2011-03-30
KR20010093103A (ko) 2001-10-27
WO2000031247A3 (en) 2000-12-07
AU1737700A (en) 2000-06-13
KR100851418B1 (ko) 2008-08-08

Similar Documents

Publication Publication Date Title
CN1333820A (zh) 产生环氧噻酮及其衍生物的重组方法和材料
CN1227362C (zh) 生产刺糖噻杀虫剂所用的生物合成基因
US6410301B1 (en) Myxococcus host cells for the production of epothilones
EP1320611B1 (en) Heterologous production of polyketides
US7323573B2 (en) Production of polyketides
Bian et al. Heterologous production and yield improvement of epothilones in Burkholderiales strain DSM 7029
CN1977046A (zh) 编码参与普拉地内酯生物合成的多肽的dna
CN1732264A (zh) 产生疏螺旋体素的聚酮化合物合酶及其用途
AU2001295195A1 (en) Myxococcus host cells for the production of epothilones
CN1305530A (zh) 用于epothilone生物合成的基因
CN1633237A (zh) 新的产生spinosyn的聚酮合酶
CN1676607A (zh) 为抗生素的生物合成从蓝灰链霉菌非产蓝亚种中克隆基因及其使用方法
CN1521180A (zh) 介导除虫菌素b2:b1比例的除虫链霉菌基因
CN1507493A (zh) 用于生产丁烯基-多杀菌素杀虫剂的生物合成基因
WO2004015088A2 (en) Transposon-based transformation system
AU2007200160B2 (en) Heterologous production of polyketides
RU2234532C2 (ru) Нуклеиновая кислота (варианты), ее использование для экспрессии эпотилонов, полипептид (варианты), клон бактерий е.coli
Julien et al. Genetic Engineering of Myxobacterial Natural Product Biosynthetic Genes
ZA200207688B (en) Heterologous production of polyketides.

Legal Events

Date Code Title Description
C06 Publication
C10 Entry into substantive examination
PB01 Publication
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080416

Termination date: 20111119