CN100381566C - 产生环氧噻酮及其衍生物的重组方法和材料 - Google Patents

产生环氧噻酮及其衍生物的重组方法和材料 Download PDF

Info

Publication number
CN100381566C
CN100381566C CNB998156787A CN99815678A CN100381566C CN 100381566 C CN100381566 C CN 100381566C CN B998156787 A CNB998156787 A CN B998156787A CN 99815678 A CN99815678 A CN 99815678A CN 100381566 C CN100381566 C CN 100381566C
Authority
CN
China
Prior art keywords
epothilone
pks
assembly
gene
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB998156787A
Other languages
English (en)
Other versions
CN1333820A (zh
Inventor
布赖恩·朱利恩
雷那德·卡滋
柴坦·科斯拉
汤立
赖内·则曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kosan Biosciences Inc
Original Assignee
Kosan Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kosan Biosciences Inc filed Critical Kosan Biosciences Inc
Publication of CN1333820A publication Critical patent/CN1333820A/zh
Application granted granted Critical
Publication of CN100381566C publication Critical patent/CN100381566C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D417/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
    • C07D417/02Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings
    • C07D417/06Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings linked by a carbon chain containing only aliphatic carbon atoms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/10Antimycotics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D493/00Heterocyclic compounds containing oxygen atoms as the only ring hetero atoms in the condensed system
    • C07D493/02Heterocyclic compounds containing oxygen atoms as the only ring hetero atoms in the condensed system in which the condensed system contains two hetero rings
    • C07D493/04Ortho-condensed systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D493/00Heterocyclic compounds containing oxygen atoms as the only ring hetero atoms in the condensed system
    • C07D493/02Heterocyclic compounds containing oxygen atoms as the only ring hetero atoms in the condensed system in which the condensed system contains two hetero rings
    • C07D493/08Bridged systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D513/00Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00
    • C07D513/02Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00 in which the condensed system contains two hetero rings
    • C07D513/08Bridged systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin

Abstract

编码环氧噻酮聚酮化合物合成酶(PKS)的全部或者部分的重组核酸被用于在宿主细胞中表达重组PKS基因,以生产用作肿瘤化学治疗剂,杀真菌剂,和免疫抑制剂的环氧噻酮,环氧噻酮衍生物和聚酮化合物。

Description

产生环氧噻酮及其衍生物的重组方法和材料
政府基金说明
本发明中部分由SBIR基金1R43-CA79228-01支持。美国政府对本发明享有某些权利。
发明领域
本发明提供了产生环氧噻酮[Epothilone]和环氧噻酮衍生物的重组方法和材料。本发明涉及农业,化学,药物化学,医学,分子生物学和药学领域。
发明背景
环氧噻酮最早是由国家生物工程研究所[National Biotechnology Reasearchlnsitute]的Gerhard Hofle和其同事从粘细菌,纤维堆囊菌(Sorangiumcellulosum)中作为抗真菌活性抽提出来的(参见K.Gerth等人,1996,J.Antibiotics[抗生素杂志]49:560-563和德国专利号DE 41 38 042的报道)。后来发现环氧噻酮在微管蛋白聚合测定中具有活性(见D.Bollag等人,1995,Cancer Res[肿瘤研究]55:2325-2333),从而鉴定为抗肿瘤试剂,并在此后作为治疗肿瘤的可能的抗肿瘤试剂而被广泛研究。
由纤维堆囊菌So ce 90株产生的环氧噻酮的化学结构的描述参见Hofle等人1996,epothilone A and B-novel 16-membered macrolides with cytotoxicactivity:isolation,crystal structure,and conformation in solution [环氧噻酮A和B-新的具有细胞毒活性的十六元大环内酯:分离,晶体结构,和溶液构象],Angew.Chem.Int.Ed.Engl,35(13/14):1567-1569。发现该菌株能产生两种环氧噻酮化合物,被命名为A(R=H)和B(R=CH3),如下所示,它们表现出对真核细胞具有广谱细胞毒活性,以及对乳腺和结肠肿瘤细胞系的显著的活性和选择性。
Figure C9981567800061
环氧噻酮A和B的脱氧对应物,也被称为环氧噻酮C(R=H)和D(R=CH3),已知具有更小的细胞毒活性,这些环氧噻酮的结构如下所示:
Figure C9981567800071
其它两种天然存在的环氧噻酮也有叙述。它们是环氧噻酮E和F;其中环氧噻酮A和B噻唑部分的甲基侧链被羟化,从而分别得到环氧噻酮E和F。
因为环氧噻酮作为抗肿瘤试剂的可能应用,以及由天然so ce 90菌株产生环氧噻酮的低水平,许多研究小组进行了合成环氧噻酮的努力。这些努力已经获得了成功(见Balog等,1996,Total Synthesis Of(-)环氧噻酮A[环氧噻酮A的全程合成],Angen,Chem.Int.Ed.Engl.35(23/24);2801-2801;Su等,1997,Total Synthesis Of(-)环氧噻酮,B:an extension of the Suziki coupling methodand insighes into structure-activity relationships of the环氧噻酮s[环氧噻酮B的全程合成:Suziki偶联法的扩展和环氧噻酮结构功能关系的透视],Agew.Chem.Int.Ed.Engl.36(7):757-759;Meng等,1997,Total SMThesis Of环氧噻酮s A and B[环氧噻酮A和B的全程合成],JACS 119(42);10073-10092;和Baloy等,1998,A novel adol condensation with 2-methy1-4-pentenaland its application to an improved total synthesis of epothilone B[一种新的带有2-甲基-4戊烯基的醇醛缩合和它应用于环氧噻酮B全程合成的改进],Angew Chem Int Ed Engl.37(19):2675-2678,各篇此处引入作为参考)。尽管这些努力获得了成功,但化学合成环氧噻酮是乏味,耗时和代价昂贵的。实际上,对于整个的环氧噻酮的药物开发来说,这些方法被证明是不实用的。
大量的环氧噻酮衍生物,和环氧噻酮A-D得到了体内和体外的研究(见Su等1997,Structure-activity relationships of环氧噻酮s and the first in vivocomparison with paclitaxel[环氧噻酮的结构活性关系和第一次与paclitaxel的体内比较],Angew Chem Int Ed Engl 36(19):2093-2096;和Chou等Aug.1998,Desoxy环氧噻酮B:an efficacious microtube-targed antitumor agent with apromising in vivo profile relATive to环氧噻酮B[脱氧环氧噻酮B:一种在体内可能在一些方面与环氧噻酮B有关的有效的微管靶向的抗肿瘤试剂],Proc.NATI.Acad.Sci.USA 95:9642-9647,此处引入各篇作为参考)。其它的环氧噻酮衍生物以及合成环氧噻酮及环氧噻酮衍生物的方法的描述见:PCT专利公开号99/54330,99/54319,99/54318,99/43653,99/43320,99/42602,99/40047,99/27890,99/07692,99/02514,99/01124,98/25929,98/22461,98/08849,和97/19086;美国专利号5,969,145;和德国专利公开号DE.4138 042,此处引用各篇文献作为参考。
有必要用比较经济的方法来生产天然存在的环氧噻酮和它们的衍生物或前体,及其改进性能的新的环氧噻酮衍生物。有必要用比天然产物菌纤维堆囊菌更易操作和发酵的宿主细胞来产生环氧噻酮或者环氧噻酮衍生物。本发明解决了这些和其它的需要。
发明概述
在一个实施方案中,本发明提供了编码所需蛋白的重组DNA化合物以产生环氧噻酮A,B,C和D。本发明还提供了编码部分这些蛋白的重组DNA化合物。本发明还提供了编码杂合蛋白的重组DNA化合物,所述杂合蛋白包括与环氧噻酮生物合成有关的完整的蛋白质或其一部分,以及与其它聚酮化合物或者非核糖体衍生的肽的生物合成有关的完整的蛋白质或其一部分。在一个优选实施方案中,本发明的重组DNA化合物是易于编码序列操作的重组DNA克隆载体,或在重组宿主细胞中编码以表达本发明的一种或者多种蛋白质的重组DNA表达载体。
在另一个实施方案中,本发明提供了产生目的环氧噻酮或环氧噻酮衍生物的重组宿主细胞。在一个实施方案中,本发明提供了宿主细胞,它以比天然存在的产生环氧噻酮的生物高的水平,产生一种或者多种环氧噻酮或者环氧噻酮衍生物。在另一个实施方案中,本发明提供的宿主细胞产生的环氧噻酮混合物,比天然存在的宿主细胞所产生的混合物的复杂性要小。在另一个实施方案中本发明提供了产生环氧噻酮或者环氧噻酮衍生物的非纤维堆囊菌重组宿主细胞。
在一个优选的实施方案中,本发明的宿主细胞比天然存在的产环氧噻酮的细胞,产生较少复杂性的环氧噻酮混合物。天然存在的产环氧噻酮细胞通常产生环氧噻酮A,B,C,D,E和F的混合物。下表总结了本发明设计的不同的宿主细胞产生的环氧噻酮。
细胞类型    产生的环氧噻酮     不产生的环氧噻酮
1           A,B,C,D,E,F   -------
2           A,C,E            B,D,F
3           B,D,F            A,C,E
4           A,B,C,D         E,F
5           A,C               B,D,E,F
6           C                  A,B,D,E,F
7           B,D               A,C,E,F
8           D                  A,B,C,E,F
另外,可以构建一些细胞类型产生新发现的环氧噻酮G和H,G和H的一种,或者它们的下游环氧噻酮,如下作进一步讨论。因此可以理解,基于本发明,与天然存在的环氧噻酮有关的生物合成途径分别是,G-C-A-E和H-P-B-F。合适的酶也可以将一个途径中的成员转换为另外一个途径的相应的成员。
因此,本发明的宿主细胞还包括仅产生一种目的环氧噻酮或者环氧噻酮衍生物的宿主细胞。
在另一个实施方案中,本发明提供了经过遗传修饰的纤维堆囊菌宿主细胞,它或者以比在天然宿主细胞中观察到的较高的水平产生环氧噻酮,或者产生的环氧噻酮混合物比天然宿主细胞中产生的复杂性要小,或者产生一种不在天然状态下产生的环氧噻酮衍生物。在一个优选的实施方案中,宿主细胞产生的环氧噻酮等于或者大于20mg/L。
在另一个实施方案中,本发明的重宿主细胞是经过遗传修饰以产生环氧噻酮或者环氧噻酮衍生物的非纤维堆囊菌细胞。在一个优选实施方案中,宿主细胞产生的环氧噻酮等于或者大于20mg/L。在更优选的实施方案中,重组宿主细胞是粘球菌(Myxococcus),假单胞菌(Pseudomonas)或者链霉菌(Streptomyces)宿主细胞,它们以等于或者大于20mg/L的水平产生环氧噻酮或者环氧噻酮衍生物。在另一个实施方案中,本发明提供了应用于农业,兽医,和医学的新的化合物。在一个实施方案中,这些化合物被用作杀真菌剂。在另一个实施方案中,这些化合物被用作肿瘤化学治疗剂。在一个优选的实施方案中,该化合物是至少有可能抗肿瘤细胞的环氧噻酮衍生物,如环氧噻酮B或者D。在另一个实施方案中,该化合物可以用做免疫抑制剂。在另一实施方案中,这些化合物被用于其它化合物的制备。在一个优选实施方案中,化合物用于人用和动物用的混合物和溶液配方中。
本发明的这些和其它实施方案在后续说明,实施例和后续列出的权利要求中有更详细的描述。
附图简要说明
图1显示了在四个互相重叠的粘粒粘粒克隆中插入的,跨过整个环氧噻酮基因簇的纤维堆囊菌基因组DNA的限制性位点图谱(分别对应于pKOS35-70.8A3,pKOS35-70.1A2,pKOS35-70.4,和pKOS35-79.85称做8A3,1A2,4和85)。图中也显示了环氧噻酮基因簇的功能图谱。图中还显示了装载结构域(装载,epo A),非核糖体肽合成酶组件(NRPS,组件1,epo B),和环氧噻酮合成酶基因余下的8个组件中的每个组件(从组件2到9,epo C,epoD,epo E和epo F),图中也显示了编码细胞色素P450类环氧化酶的epo K基因的位置。
图2显示了许多可供应给本发明的环氧噻酮PKS的N-酰基胱氨酸硫酯衍生物的前体化合物,该环氧噻酮PKS酶中NRPS类组件1或者组件2KS结构域被失活以产生一种新的环氧噻酮衍生物。图2还显示了制备这种化合物的整个合成步骤。
图3显示了质粒pKOS35-82.1,和pKOS35-82.2的限制性酶切位点和功能图谱。
图4显示了质粒pKOS35-154,和pKOS90-22的限制性酶切位点和功能图谱。
图5显示了,如实施例3所述的,将环氧噻酮PKS和修饰酶基因导入黄色粘球菌宿主细胞染色体中的方法流程。
图6显示了质粒pKOS039-124,和pKOS39-124R的限制性酶切位点和功能图谱。
图7显示了质粒pKOS39-126R的限制性酶切位点和功能图谱。
图8显示了质粒pKOS039-141的限制性酶切位点和功能图谱。
图9显示了质粒pKOS045-12的限制性酶切位点和功能图谱。
发明详述
本发明提供了在纤维堆囊菌细胞中合成环氧噻酮的,重组或者分离形式的基因和蛋白质。这里使用的术语“重组的”指的是通过人类干预,通常是通过对基因或者它的一部分的特异性地和直接地操作而获得的化合物或者组合物。术语的“分离的”,指的是制备的化合物或组合物基本上没有污染,或者没有不需要的物质,或者与天然存在的化合物或组合物相比,制备基本上没有该化合物或者组合物在天然状态下相关的物质。环氧噻酮(环氧噻酮A,B,C,D,E和F)以及它们结构上相关的化合物(环氧噻酮衍生物)是有前景的对真核细胞特异的细胞毒试剂。这些化合物可用作抗真菌剂,肿瘤化学治疗剂,和免疫抑制剂。环氧噻酮在它们从中鉴定出来的天然存在的纤维堆囊菌细胞中,以非常低的水平产生,纤维堆囊菌生长非常缓慢,而且纤维堆囊菌菌株的发酵是困难的和耗时的。本发明的一个重要的好处是能够方便地在非纤维堆囊菌宿主细胞中,产生环氧噻酮或环氧噻酮衍生物。本发明另一个好处是在本发明的重组细胞中能比可能的天然存在的环氧噻酮产生细胞中,以更高,水平和更大量地产生环氧噻酮。而另一个好处是能够在重组宿主细胞中产生环氧噻酮衍生物。
通过纤维堆囊菌SMP44 DNA基因组文库的探针,达到编码环氧噻酮生物合成基因重组DNA的分离。如下述实施例1中所更完整描述的那样,用SauIIIAI限制性酶部分消化的纤维堆囊菌基因组DNA,并将产生的DNA片段插入到BamHI消化的SupERcosTM粘粒粘粒(StrATagene公司)DNA中,从而制备了该文库。用特异于PKS基因序列的探针进行探针检测,并用含有初级探针检测出的核苷酸序列的次级探针进行再次探针检测,从而鉴定出含有环氧噻酮基因序列的柯期质粒克隆。
通过这些努力鉴定出4个相互重叠的粘粒粘粒克隆。这4个粘粒,根据布达佩斯条约的期限,保藏在美国典型培养物保藏中心(ATCC),Manassas,VA,USA,并被给予ATCC登记号。这些克隆(和登记号)被命名为粘粒pKOS35-70.1A2(ATCC 203782),pKOS35-70.4(ATCC 203781),pKOS35-70.8A3(ATCC 203783),和pKOS35-79.85(ATCC 203780)。这些粘粒含有插入DNA完全跨越环氧噻酮基因簇。这些粘粒的限制性位点图谱见图1。图1还提供了环氧噻酮基因簇的功能图谱,显示了6个环氧噻酮PKS基因和epoK P450环氧化酶基因的位点。
环氧噻酮PKS基因,和其它的PKS基因一样,含有的编码序列编码组织起来的一个装载结构域,一些组件,和一个硫酯酶结构域。如下面所全面描述的,每一个结构域和组件对应于一个具一种或多种特异性功能的多肽。通常,装载结构域负责结合用于合成聚酮化合物的第一个构造单位,并将它传递给第一个组件。用于形成复杂的聚酮化合物的构造单位通常是酰基硫硫酯,最通常的的是乙酰基,丙酰基,丙二酰基,甲基丙二酰基和乙基丙二酰基辅酶A,其它的构造单位包括氨基酸类的酰基硫酯。PKS通过反复的脱羧基的Claisen缩聚,在酰基硫构造单位之间,催化聚酮的生物合成。每个组件负责形成一个构造单位,对构造单位行使一种或者多种功能,开将形成的化合物传递给下一个组件。下一个组件,接着负责连结下一个构造单位,并将生长着的化合物传递给下一个组件,直到合成反应完成。这时,PKS酶的硫酯酶活性(TE)裂解聚酮。
在本领域技术人员公知,这种模块组织是合成复杂的聚酮化合物的PKS酶类的特征。对于模块化PKS基因进行操作的重组方法如下所述:美国专利号5,672,491,;5,712,146;5,830,750;和,843,718;以及PCT专利公开号98/49315和97/02358,每篇文献此处引入作为参考。已知一种原始类型的模块化PKS酶合成一种被称为6-脱氧红霉素内酯B(6-Deoxyerythronolide B,6-dEB)的聚酮。被称为eryAI,eryAII,和eryAIII的基因编码合成称做脱氧红霉素内酯合成酶或DEBS多亚基蛋白(各个亚基被称为DEBS1,DEBS2,或者DEBS3),它合成6-dEB如美国专利号5,712,146和5,824,513所述,此处引入作为参考。
DEBS PKS的装载结构域包括一个酰基转移酶(AT)和一个酰基载体蛋白(ACP)。DEBS装载结构域的AT识别丙酰基辅酶A(其它的装栽结构域AT可以识别其它的酰基辅酶A,例如乙酰基辅酶A,丙二酰基辅酶A,甲基丙二酰基辅酶A,或者丁酰基辅酶A)并将它们以硫酯酶的形式传递给装载结构域的ACP。同时,6个延伸组件上的每一个AT都识别一个甲基内二酰基辅酶A(其它的延伸组件AT能够识别其后的辅酶a,例如丙二酰基,乙基丙二酰基,或者2-羟基丙二酰基辅酶A)并将它传递给该组件的ACP以形成硫酯。一旦DEBS形成酰基和甲基丙二酰基辅酶ACP,装载结构域的酰基基团就迁移在第一个组件的KS位置形成硫酯(转酯反应);在这一步骤,组件1占据着邻近甲基丙二酰基辅酶ACP的酰基-KS位置。DEBS装载结构域上的酰基基团然后由伴随的脱羧反应驱动,共价结合到延伸基因的α一碳上,形成碳碳键,从而产生一个骨架比装载单位长2个碳的新的酰基ACP(延长或延伸)。生长着的聚酮化合物链被从ACP上转移到DEBS下一个组件的KS上,并且这个过程继续下去。
聚酮化合物在DEBS的每个组件上生长2个碳,以共价键硫酯的形式顺次由组件向下一组件转移,类似于装配线过程。由这一过程产生的碳链在每2个碳原子上有一个酮基,产生一个聚酮化合物,聚酮化合物的名字由此而来。然而,通常地,在每2个碳单位的酮基团加到生长着的聚酮化合物的碳链后和在被转移到下一个组件之前,附加的酶促活性,对它进行了修饰。因此,除了含有形成碳碳键所必需的KS,AT和ACP的最小的组件外,组件还可以含有将酮基还原为醇基的酮还原酶(KR)。组件还可以含有一个KR和一个对醇基脱氢形成双键的脱氢酶(DH)。组件还可以含有一个KR,一个DH和一个烯醇基还原酶(ER),该烯醇基还原酶能够将β-碳用作亚甲基,转换双键成为饱和的单键。DEBS组件包括只有KR结构域,只有失活的KR结构域,和具有所有3个KR,DH和ER结构域。
一旦聚酮化合物链转移到PKS的最后一个组件,它就会遇到存在于大多数PKS末端的释放结构域或者硫酯酶。在这里,聚酮化学物被从酶上裂解下来,对大多数但不是所有的聚酮化合物来说,它会被环化。聚酮化合物通过加尾或者修饰酶的使用被进一步修饰,这些酶在聚酮化合物核心原子上加上糖基或者甲基,或者进行其它的修饰,即,氧化或者还原。例如,6-dEB在天然产生它的Saccharopolyspora erytraea细胞中被羟化,甲基化糖基化(糖苷化)而得到有名的抗生素红霉素A。
虽然上面的描述一般适用于模块化PKS酶,特别是DEBS,自然界中存否在许多不同的PKS酶。例如,许多PKS酶含有的装载结构域不象DEBS的装载结构域,这些PKS酶含有一个行使脱羧酶功能的“失活”的KS结构域。这些失活的KS在大多数例子中被称为KSQ,这里的上标是氨基酸(谷氨酰胺)的单字母缩写,它取代了酮合成酶活性所必需的活性部位的半胱氨酸。环氧噻酮PKS装载结构域含有其他PKS酶中不存在的KSY结构域,现在已获知它的氨基酸序列中氨基酸酪氨酸替换了半胱氨酸。本发明提供了这种新的KS结构域的重组DNA编码序列。
另一个重要的PKS酶的变化涉及到加入的构造单位的类型。一些聚酮化合物,包括环氧噻酮,被加入氨基酸衍生的构造单位。制造这种聚酮化合物的PKS酶要求加入构造单位所需的特异的组件。这些组件被称为非核糖体肽合成酶(NRPS)组件。例如,环氧噻酮PKS,含有一个NRPS组件。另一例变化涉及组件的附加功能。例如,环氧噻酮PKS含有一个转甲基酶(MT)结构域,一个此前未知的制造聚酮化合物的组件化PKS酶结构域。
如下的实施例1中提供了环氧噻酮PKS基因和环氧噻酮加尾修饰酶基因可读框编码序列的完整核苷酸序列。这一序列资料,以及下面提供的关于序列中基因的可读框可读框位置的资料,提供了它们所编码蛋白的氨基酸序列。本领域的技术人员会认识到,由于遗传密码的简并性,各种种核苷酸序列不同的DNA化合物能用来编码本发明中特定的氨基酸序列。在本文中显示出来的纤维堆囊菌中的编码环氧噻酮PKS和环氧噻酮修饰酶的天然DNA序列,仅仅是用来例证性描述本发明的优选的实施方案。本发明包括,编码本发明多肽和蛋白质的氨基酸序列的任何序列的DNA化合物。同样地,通常多肽能够忍受它的氨基酸序列中的一个或多个替换,删除和插入而不丢失或明显丢失所要的活性,在一些例子中,甚至会有所需活性的提高。本发明包括含有不同的氨基酸序列的那些多肽,本发明所给出的氨基酸序列只是用来例证性描述本发明的优选的实施方案。
本发明提供了产生环氧噻酮的重组基因。本发明是用纤维堆囊菌SMP44的环氧噻酮PKS和修饰酶的克隆,鉴定和操作来例证的。本发明的描述和保藏的相关重组质粒及其描述,使从任何产生环氧噻酮的天然存在的宿主细胞来源的环氧噻酮PKS和修饰酶的鉴定,克隆和操作成为可能。这些宿主细胞包括其它纤维堆囊菌菌株,例如So ce 90,其它的纤维堆囊菌种,以及非纤维堆囊菌细胞。使用鉴定同源DNA序列和鉴定与已知蛋白功能,及相近基因编码基因的标准方法,本发明相关的普通技术人员能够进行这些鉴定,克隆和特征分析。而且本发明提供了从头合成,或者由其它非环氧噻酮PKS基因组装的重组环氧噻酮PKS和修饰酶基因,这些基因提供了在一种或多种蛋白中有序排列的结构域和组件,它们组装成产生环氧噻酮或环氧噻酮衍生物的PKS。
本发明的重组核酸,蛋白质和肽是种类繁多和多样的。为增加对本发明和它提供的不同化合物和方法的理解,下面的讨论描述了环氧噻酮的不同区域和相关的编码序列。这些讨论首先总体描述了编码PKS的基因,这些基因中不同结构域和组件的位置,以及这些组件中不同结构域的位置。然后,进行了更详细的讨论,首先集中在装载结构域,然后是NRPS组件,然后是环氧噻酮PKS的余下8个组件。
共有6个环氧噻酮PKS基因。epoA基因编码149kDa的装载结构域(也被称为装载组件)。epoB编码组件1,158kDa的NRPS组件。epoC基因编码193kDa的组件2。epoD编码一种765kDa的蛋白质,该蛋白包括组件3到6。epoE编码一种405kDa的蛋白质,它包含组件7和8。epoF基因编码一种257kDa的蛋白质,它包含组件9和硫酯酶结构域。紧接着epoF基因的下游是epoK,编码一个47kDa蛋白质的p450环氧化酶基因,紧接着的是epoL基因,它编码一个24kDa的脱氢酶。epoL基因随后的是一些可读框可读框,它们包括的基因编码据信与转运和调节有关的蛋白质。
如实施例1中所示,这些基因的序列以一个邻接的序列或者71,989个核苷酸的重叠群的形式存在。这重叠群还含有2个显示出源于转座子的基因,如下被命名为ORF A和ORF B。这两个基因据信与环氧噻酮的生物合成无关,但是可能含有起启动子或者增强子作用的序列。这个重叠群还含有多于12个的另外的可读框可读框,如下其中只有12个,被称为ORF2到ORF12和ORF2互补子的被鉴定出来。如上面提到的。ORF2实际上是2个ORF,因为互补链上显示出还含有一个ORF。这些ORF的相应的基因产物的功能(如果有的话),尚未确定。下面的表提供了实施例1所示重叠群序列中各种可读框,组件的编码序列,和结构域的编码序列的位置。本领域的技术人员在考虑实施例1所示的序列时应该认识到,因为在可读框中紧靠近显示为起始密码子的密码子的附近有甲硫氨酸或者缬氨基酸密码子的存在,几种基因的实际的起始位置可能不同于表中所示的起始位置。真正的起始密码子,应该通过基因表达蛋白的氨基酸测序来确定。
起始      终止        注释
3         992         转位酶基因ORF A,非PKS的部分
989       1501        转位酶基因ORF B,非PKS的部分
1998      6263        epoA基因,编码装载结构域
2031      3548        装载结构域的KSY
3621      4661        装载结构域的AT
4917      5810        装载结构域的ER,可能与噻唑部分形成有关
5856      6155        装载结构域的ACP
6260      10493       epoB基因,编码组件1,NRPS组件
6620      6649        NRPS组件的缩聚结构域C2
6861      6887        杂环化特征序列
6962      6982        NRPS组件的缩聚结构域C4
7358      7366        NRPS组件的缩聚结构域C7(部分)
7898      7921        NRPS组件的腺苷酰化结构域A1
8261      8308        NRPS组件的腺苷酰化结构域A3
8411      8422        NRPS组件的腺苷酰化结构域A4
8861      8905        NRPS组件的腺苷酰化结构域A6
8966      8983        NRPS组件的腺苷酰化结构域A7
9090       9179     NRPS组件的腺苷酰化结构域A8
9183       9992     形成噻唑的氧化区
10121      10138    NRPS组件的腺苷酰化结构域A10
10261      10306    NRPS组件的硫代结构域(PCP)
10639      16137    epoC基因,编码组件2
10654      12033    KS2,组件2的KS结构域
12250      13287    AT2,组件2的AT结构域
13327      13899    DH2,组件2的DH结构域
14962      15756    KR2,组件2的KR结构域
15763      16008    ACP2,组件2的ACP结构域
16134      37907    epoD基因,编码组件3-6
16425      17606    KS3
17817      18857    AT3
19581      20396    KR3
20424      20642    ACP3
20706      22082    KS4
22296      23336    AT4
24069      24647    KR4
24867      25151    ACP4
25203      26576    KS5
26793      27833    AT5
27966      28574    DH5
29433      30287    ER5
30321      30869    KR5
31077      31373    ACP5
31440      32807    KS6
33018      34067    AT6
34107      34676    DH6
35760      36641    ER6
36705      37256    KR6
37470      37796    ACP6
37912      49308    epoE基因,编码组件7和8
38014      39375    KS7
39589      40626    AT7
41341      41922    KR7
42181    42423    ACP7
42478    43851    KS8
44065    45102    AT8
45262    45810    DH(失活的)
46072    47172    MT8,组件8的甲基转移酶结构域
48103    48636    KR8,这个结构域是失活的
48850    49149    ACP8
49323    56642    epo F基因,编码组件9和TE结构域
49416    50774    KS9
50985    52025    AT9
52173    53414    DH(失活的)
54747    55313    KR9
55593    55805    ACP9
55878    56600    TE9,硫酯酶结构域
56757    58016    epoK基因,编码P450环氧化酶
58194    58733    epoL基因(推断的脱氢酶)
59405    59974    ORF2互补子,显示出互补链
59460    60249    ORF2
60271    60738    ORF3互补子,显示出互补链
61730    62647    ORF4(推断的转运蛋白)
63725    64333    ORF5
64372    65643    ORF6
66237    67472    ORF7(推断的氧化还原酶)
67572    68837    ORF8(推断的氧化还原酶膜亚基)
68837    69373    ORF9
69993    71174    ORF10(推断的转运蛋白)
71171    71542    ORF11
71557    71989    ORF12
通过浏览环氧噻酮基因簇的组织和序列,可以更好理解本发明提供的许多种不同的重组DNA化合物。
环氧噻酮PKS是由epoA,epoB,epoC,epoD,epoE,和epoF基因产物组成的多蛋白质复合物。为了将产生环氧噻酮的能力转移入宿主细胞中,人们可以提供具有本发明epoA,epoB,epoC,epoD,epoE,和epoF基因的宿主细胞,并可以选择其它能在宿主细胞中表达的基因。
本领域的技术人员可以理解,尽管环氧噻酮和其它的PKS酶可以指的是单体,这些酶通常是多亚基蛋白质。因此,人们可以通过改变构成PKS的编码一种或几种多亚基蛋白的一种或几种基因,来制备衍生的PKS(通过缺失或者突变形成的不同于天然存的PKS的PKS)或者杂合PKS(由两种不同的PKS酶的部分构成的PKS)。
环氧噻酮在PKS后的修饰或加尾包括由多种酶介导的多个步骤。这些酶在这里指的是加尾酶或修饰酶。令人惊讶地是,通过基因分析预测,以前没有报导过具有功能的环氧噻酮PKS结构域的产物。。这些化合物这里称为环氧噻酮G和H。环氧噻酮G和H缺少环氧噻酮C和D的C-12-C-13π-键和环氧噻酮A和B的C-12-C-13环氧化物,取而代之的是C-13位的羟基和氢,C12和C-13间的单键,以及C-12位的氢或者甲基。这些化合物预测是由环氧噻酮PKS产生的,因为环氧噻酮PKS组件4的DNA和相应的氨基酸序列没有显示出包含一个DH结构域。
然而,如下所述,环氧噻酮PKS基因epoA,epoB,epoC,epoD,epoE和epoF在特定的不表达epoK或者epoL的异源宿主细胞中的表达,导致环氧噻酮C和D的产生,它们缺少C-13羟基而具有C-12和C13之间的双键。介导双键开成的脱氢反应可有是由于环氧噻酮PKS中尚未识别的结构域(例如,脱氢反应可能发生在具有一个活性DH结构域的下一个组件上,它能在ER结构域的脱氢反应前,产生一个共轭的二烯烃前体),或者由于异源宿主细胞(天蓝色链酶菌)中发现的内源酶。以下,在纤维堆囊菌或者其它的宿主细胞中,环氧噻酮G和H可以通过epoL基因编码的脱氢酶的功能转化为环氧噻酮C和D。在任何时候,环氧噻酮C和D通过epoK基因编码的环氧化酶转换为环氧噻酮A和B。环氧噻酮A和B可以被羟化酶基因转化为环氧噻酮E和F,该羟化酶可以被上面鉴定出的一个ORF或者被纤维堆囊菌中的其他内源基因所编码。因此,通过向宿主细胞提供本发明的一种或多种重组修饰酶基因,或者通过应用天然表达或不表达修饰酶的宿主细胞,可以在宿主细胞中产生所要的环氧噻酮或者修饰的环氧噻酮衍生物。因此,通常通过使用合适的宿主和如果需要,对修饰酶的合适的失活,可以中断G→C→A→E的进   环氧噻酮H相应的下游过程;通过控制甲基化,可以选择一个或者两个途径。
因此,本发明提供了表达天然的存在的环氧噻酮A,B,C,和D及其衍生物的许多种重组DNA化合物和宿主细胞,本发明还提供了重组宿主细胞,特别是纤维堆囊菌宿主细胞,它生产的环氧噻酮衍生物以类似于环氧噻酮E和F的方式受到修饰。而且,通过,在不表达将环氧噻酮G和H转变为C和D的脱氢酶的宿主细胞中表达环氧噻酮基因,或者通过突变或改变PKS以消除可能存在于环氧噻酮PKS中的脱氢酶功能,本发明还提供了能产生此前未知的环氧噻酮G和H的宿主细胞。
作为PKS基因簇的产物的大环内酯类衍生物因此可以通过各种途径修饰。除了上述的修饰外,PKS产物还可以使用合适的酶而被糖基化,羟基化,去羟基化,氧化,甲基化和去甲基化。因此,除了通过改变PKS中所含组件的数目,功能和特异性以修饰PKS基因簇产物外,本发明的更多的化合物,还可以通过产生聚酮化合物合成酶的宿主细胞提供的,或者通过修饰含有附加酶的宿主细胞提供的附加的酶的催化活性来产生,或者使用纯化的酶或者粗提物进行体外修饰,或者实际上通过化学修饰来产生。
本发明还提供了产生环氧噻酮衍生物的许多种重组DNA化合物和宿主细胞。这里使用的术语“环氧噻酮衍生物”指的是重组的环氧噻酮PKS产生的化合物,该环氧噻酮PKS中的至少一个结构域被失活,突变以改变催化功能,或被不同功能的结构域替换或者其中插入了一个结构域。在任何时候,“环氧噻酮衍生物PKS”作用而产生的化合物在结构上不同于天然存在的环氧噻酮,但是保留了它的环状骨架结构,因此被称为“环氧噻酮衍生物”。为更好理解本发明所提供的重组DNA化合物和宿主细胞,下面对装载结构域,环氧噻酮PKS的各个组件,以及它们新的重组衍生物进行了详细的讨论。
环氧噻酮的装载结构域包括一个失活的KS结构域,KSY,和一个对丙二酰基辅酶A特异的AT结构域(据信丙二酰基辅酶A会被KSY结构域脱羧而得到乙酰基基团),和ACP结构域。本发明提供了编码环氧噻酮装载结构域的重组DNA化合物。装载结构域编码序列包含在粘粒pKOS35-70.8A3的一个约8.3kb的限制性片段中,这里所指的KS结构域是失活的,因为装载结构域的KS结构域的活性区“TAYSSSL”有一个酪氨酸残基替换了酮合成酶活性所需要的半胱氨酸残基Y;所以这个结构域不具有脱羧活性。见Witkowiski等,1999年9月7日,生物化学,38(36):11643-11650,此处引入作为参考。
酪氨酸残基的存在对谷氨酰胺残基(通常存在于失活的装载结构域KS中)的替换可使KS结构域具有更小的脱羧基效率。本发明提供了重组的环氧噻酮PKS结构域和相应的DNA序列,在编码的环氧噻酮PKS装载结构域的DNA序列中,通过改变装载结构域编码序列中的密码子,将酪氨酸残基改为谷氨酰氨残基。本发明还提供了含有这种装载结构域的PKS酶,和产生这种酶的宿主细胞以及由此产生的聚酮化合物,这些重组装载结构域包括仅仅酪氨酸残基被替换的,包括酪氨酸结构域在内的周围的氨基酸也被改变的,以及整个KSY结构域,被整个KSQ结构域替换的那些。后面的实施方案包括但是不限于其中KSY结构域被oleandolide PKS或者narbonolide PKS的KSQ结构域替换的重组环氧噻酮装载结构域(见下面的关有夹竹桃霉素,那波霉素和苦霉素PKS和修饰酶的参考文献)。
环氧噻酮装载结构域还包含据信结合丙二酰辅酶A的一个AT结构域。AT结构域中的“QTAFTQPALFTFEYALAALW...GHSIG”序列与丙二酰辅酰A特异性一致。如上面提到的,丙二酰辅酶A据信被KSY结构域脱羧从而获得乙酰辅酶A。本发明提供了重组环氧噻酮衍生物装载结构域,或者它们的编码DNA序列。其中的丙二酰特异性AT结构域被改变成为了另外一种特异性,比如甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,羟基丙二酰基辅酶A特异性。当与其它的环氧噻酮PKS蛋白一起表达时,这种装载结构域导致产生的环氧噻酮中,环氧噻酮噻唑环的甲基取代分别被乙基,丙基,和羟甲基替换。本发明提供了含有这种装载结构域的重组PKS酶,和产生这种酶的宿主细胞和它们产生的聚酮化合物。
本领域中的技术人员会认识到,对羟基丙二酰辅酶A具有特异性的AT结构域会导致产生的聚酮化合物在多酮相应的位置上具有羟基基团,羟基基团可被甲基化而获得甲氧基基团,见下表所引用的与FK-520PKS有关的专利申请。结果,具对羟基丙二酰辅酶A具有特异性的AT结构域的PKS指的是由该PKS产生的聚酮化合物在多酮相应的位置上具有羟基基团或者甲氧基基团。
环氧噻酮PKS的装载结构域还包含有ER结构域。而这个ER结构域可能参与形成环氧噻酮的噻唑部分的一个双键(与正常反应相反的反应),或者它是没有功能的。在这些示例中,本发明提供了重组DNA化合物,该组分编码的环氧噻酮PKS装载结构域带有或者不带有ER,以及其中来源于其它PKS的ER结构域(有活性的或者失活的,带有或者不带有KR和DH结构域)替换了环氧噻酮装载蛋白的结构域的杂合装载结构域。本发明还提供了含有这种装载结构域的重组PKS酶和产生这种酶的宿主细胞和它们所产生的聚酮化合物。
本发明的重组核酸编码环氧噻酮PKS的装载结构域,它们编码的相应的多肽用于许多实际应用中。在一个实施方案中,含有环氧噻酮装载蛋白编码序列的DNA化合物和异源PKS蛋白质表达。在这里使用的异源模块化PKS(或者它们的编码序列)指的是整个PKS或者一个部分,包括构成PKS的多聚体蛋白质的任一个,它们合成不是环氧噻酮或者环氧噻酮衍生物的聚酮化合物(或者指它们的编码序列)。这种共表达可以是两种形式中的一种。环氧噻酮装载蛋白可以作为分离的蛋白和其它的异源PKS蛋白质共表达,或者作为融合蛋白表达,其中的装载结构域融合到异源PKS的一个或多个组件上。无论如何,异源PKS的装载结构域被环氧噻酮装载结构域替换形成的杂合PKS,提供了一种新的PKS。异源PKS的例子包括但是不限于DEBS和苦霉素(那波内酯,narbonolide),夹竹桃内酯(Oleandolide),拉珀霉素Fk-S06,Fk-S20,利福霉素,和阿维菌素的PKS酶和它们的相应编码序列。
在另一个实施方案中,一种含有环氧噻酮装载结构域编码序列的核酸化合物与构成环氧噻酮PKS其余部分的蛋白质(即,epoB,epoC,epoD,epoE和eopF基因产物),或者与由于epoB,epoC,epop,epoE和eopf基因中一个或多个的改变或突变而产生环氧噻酮衍生物的重组环氧噻酮PKS共表达。这里所说的环氧噻酮或产生环氧噻酮衍生物的PKS(或者它们的编码序列),指的是构成PKS的所有或任何一种蛋白质(或者它们的编码序列)。
在另一个实施方案中,本发明提供了重组核酸化合物,它编码的装载结构域由环氧噻酮或产生环氧噻酮衍生物的装载结构域部分和异源PKS部分构成。在这个实施方案中,本发明提供了,例如,用甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换丙二酰基特异性的AT。这种替换,也如这里所述的其它替换,通常是通过变换它们的编码序列从而获得本发明的重组DNA化合物来介导的。这些变化(包括不仅有替换还有缺入和插入)这里可以指的是在DNA或者蛋白质水平的。
本发明的组分还包括那些,其中的环氧噻酮装载结构域的KSY和AT结构域都被替换了,但是ACP和/或环氧噻酮PKS装载结构的连接区保留未动。连接区是装载结构域和PKS组件中结构域之间的那些氨基酸片段,它们帮助形成蛋白质的四级结构,PKS结构域的正确排列和定位。这些化合物包括,例如,重组装载结构域编码序列,其中的环氧噻酮PKS的KSY和AT结构域编码序列被例如环氧噻酮PKS或者环氧噻酮PKS的KSq和AT结构域编码序列所替换。还有一些PKS酶不使用KSQ结构域,而是只使用AT结构域结合乙酰基辅酶A,或者丁酰基辅酶A(DEBS装载结构域),或者异丁酰基辅酶A(阿维菌素装栽组构域)。因些,本发明的化合物包括,例如,重组的装载结构域编码序列,其中的环氧噻酮PKS的KSY和AT结构域编码序列被DEBS或者阿维菌素PKS的一个AT结构域所替换。本发明还提供了编码装载结构域的重组DNA化合物,其中的环氧噻酮PKS装载结构域的ACP结构域或者任意连接区被另一个ACP或者连接区所替换。
上述的任一种装载结构域编码序列可与其它合成环氧噻酮,环氧噻酮衍生物,或者其它聚酮化合物的构成PKS的蛋白质共表达,从而提供本发明的PKS。如果需要的产物是环氧噻酮或者环氧噻酮衍生物,那么装载结构域编码序列如同天然存在的环氧噻酮PKS,通常表达一种分泌蛋白质。如果想要的产物是由本发明的装载结构域,和一种或几种非环氧噻酮PKS酶的蛋白质产生的,那么装载结构域或者以分泌蛋白质的形式表达,或者以与一种或几种异源PKS组件的融合蛋白质形式表达。
本发明还提供了PKS酶,其中环氧噻酮装载结构域,被异源PKS的装载结构域完全替换而余下的PKS蛋白质部分由修饰的或者未修饰的环氧噻酮PKS蛋白质提供。本分明还提供了产生这种酶的重组表达载体和宿主细胞,以及它们产生的聚酮化合物。在另一个实施方案中,异源装载结构域在表达epoB,epoC,epoD,epoE和epoF基因产物的宿主细胞中以分泌蛋白的形式表达。在另一个实施方案中,异源装载结构域在表述epoB,epoC,epoD,epoE和epoF基因产物的宿主细胞中以与epoB基因产物的融合蛋白的形式表达。在相关的实施方案中,本发明提供了一种,其中装载结构域被删除或者被NRPS组件替换的重组环氧噻酮PKS酶,和相应的重组DNA化合物和表达载体。在这个实施方案中,如同在化合物雷诺霉素中一样,重组PKS酶因此产生一种含有含有一个二肽部分的环氧噻酮衍生物。本发明提供的酶中环氧噻酮PKS的其余部分具有和天然环氧噻酮PKS一样的功能,以及其中余下部分产生本发明的环氧噻酮衍生物的重组PKS。
本发明还提供了,用于删除宿主细胞,如纤维堆囊菌中染色体装载蛋白结构域编码序列或其一部分,或者用编码重组装载结构域的序列替换这些序列或其一部分试剂和方法。使用一种重组载体,它含有纤维堆囊菌与包括染色体中装栽结构域编码序列和/或其侧边的DNA互补的DNA,使用几种载体和同源重组,可以用重组装载结构域编码序列替换天然的装载结构域编码序列,或者删除这一序列。
而且,虽然上面的讨论集中于删除或替换环氧噻酮装载结构域编码序列,本领域技术人员可以认识到,本发明提供的重组DNA化合物,载体和方法可用于删除或者替换环氧噻酮PKS基因或者环氧噻酮修饰酶基因的整个或一部分,这些方法和材料可用于许多目的。一个目的是用于构建不产生天然存在的环氧噻酮或者环氧噻酮衍生物的宿主细胞,例如,被修饰不产生天然存在的环氧噻酮的宿主细胞,特别指的是它制造除天然存在的环氧噻酮外的环氧噻酮衍生物或者其它聚酮化合物。另一个目的是用改变了的基因来替换删除了的基因,从而提供不同的产物或者产生的一种产物比其它产物要多。
如果纤维堆囊菌宿主细胞中的环氧噻酮装载结构域编码序列被删除或者变得没有功能了,那么得到的宿主细胞可以产生没有功能的环氧噻酮PKS。这种PKS仍然能够结合和形成延伸单位,但是环氧噻酮的噻唑部分不会形成,从而产生一种新的环氧噻酮衍生物。因为这些衍生物预测含有一个游离的氨基,大多数情况下,它以非常低的量产生。然而,象上面所提到的,向宿主细胞中提供异源的或重组的其它装载结构域,将会导致产生的环氧噻酮衍生物结构上由提供的装载结构域决定。
紧跟着环氧噻酮PKS的装载结构域是PKS的第一个组件,即对半胱氨酸具特异性的NRPS组件。这个NRPS组件天然情况下以一种分泌蛋白质,epoB基组产物的形式表达。本发明提供了重组形式的epoB基因。本发明的重组核酸组分编码环氧噻酮PKS的NRPS组件,它们编码的相应的肽用于许多用途中。在一个实施方案中,含有编码环氧噻酮NRPS组件序列的核酸组分与一种,或几种异源PKS蛋白质的编码基因共表达。NRPS组件可以作为分离蛋白或者融合蛋白与异源PKS的一种蛋白表达出来。得到的PKS中,至少异源PKS的一个组件被环氧噻酮NRPS组件替换,或者NRPS组件作为一个组件被有效地加到异源PKS上,从而获得一个新的PKS。在另一个实施方案中,DNA化合物含环氧噻酮NRPS组件的编码序列,它与其它的环氧噻酮PKS蛋白质或者修饰的成分共表达,而获得产生环氧噻酮或者环氧噻酮衍生物的重组环氧噻酮PKS。
这部分描述了本发明提供的两种杂合PKS酶。两种杂合PKS酶都是DEBS和环氧噻酮NRPS组件的杂合。第一种杂合PKS是由4种蛋白质组成:(i)DEBS1;(ii)由DEBS组件3的KS结构域和除环氧噻酮PKS的装载结构域KS结构域以外的部分组成的融合蛋白;(iii)环氧噻酮NRPS组件;和(iv)由融合到DEBS组件5的AT结构域的环氧噻酮PKS组件2的KS结构域和剩余的DEBS3构成的融合蛋白。这种杂合PKS在天蓝色链霉菌中表达时,会产生一种新的聚酮化合物,它具有一个和大环内酯环结合的噻唑部分,分子量为413.53。在红色糖多孢菌中表达杂合PKS能够产生糖基化的,羟基化的和甲基化的衍生物。
图示表示构建。
Figure C9981567800221
产物的结构为:
Figure C9981567800222
本发明这部分所描述的第二种杂合PKS由5种蛋白质组成:(i)DEBS1;(ii)由DEBS组件3的KS结构域和除环氧噻酮PKS的装载结构域KS结构域的所有部分组成的融合蛋白;(iii)环氧噻酮NRPS组件;(iv)由融合到DEBS组件4的AT结构域的环氧噻酮PKS组件2的KS结构域和剩余的DEBS2构成的融合蛋白;以及(v)DEBS3。这种杂合PKS在天蓝色链霉菌中表达时,会产生一种新的聚酮化合物,它具有一个和大环内酯环结合的噻唑部分,分子量为455.61。在红色糖多孢菌中表达杂合PKS能够产生糖基化的,羟基化的和甲基化的衍生物。
图示表示构建。
产物的结构为:
Figure C9981567800232
在另一个实施方案中,NRPS编码序列的一部分被用于和异源编码序列相结合。在这个实施方案中,本发明提供了,例如,环氧噻酮PKS的NRPS组件的特异性从半胱氨酸到其它氨基酸的变化。这种变化是通过构建一种编码序列来实现的,在其中整个环氧噻酮PKS NRPS组件编码完整序列或其一部分,被不同特异性的NRPS组件的编码序列所替换。在一个例证性的实施方案中,环氧噻酮NRPS组件的特异性从半胱氨酸改变为丝氨酸或者苏氨酸。当这里所述的修饰的NRPS组件与环氧噻酮PKS的其它蛋白质一起表达时,重组PKS产生的环氧噻酮(或者其衍生物)中的噻唑部分,分别变成的噁唑或与甲基噁唑部分。另外,本发明提供了由epoA,epoB epop epoE和epoF基因产物或者它们修饰成分组成的,不带有NRPS组件,或者带有来自异源PKS的NRPS组件的重组PKS酶。异源NRPS组件可以分离的蛋白质或者与epoA或epoC基因的融合蛋白质的形式来表达。
本发明还提供了用于将异源NRPS组件的特异性从另外一种氨基酸变为半胱氨酸的方法和试剂。这种变化是通过构建一种编码序列来完成的,其中决定异源NRPS组件特异性的序列,被从环氧噻酮PKS组件编码序列来的,对半胱氨酸特异性的序列所替换。获得的异源NRPS组件,通常与构成异源PKS的蛋白质一起共表达,其中异源PKS合成的聚酮化合物不是环氧噻酮或者环氧噻酮衍生物,尽管异源NRPS组件能够被用来产生环氧噻酮或者环氧噻酮衍生物。
在另一个实施方案中,本发明提供了重组环氧噻酮PKS酶和相应的重组核酸组分和载体,其中的NRPS组件被失或者删除。这些酶,组分和载体,通常是根据上述的删除或失活环氧噻酮PKS或修饰酶的方法来构建的。本发明提供的失活的NRPS组件蛋白质,和它们的编码序列,包括那些,其中的肽酰基载体蛋白(PCP)结构域被整个或部分地删除,或者通过将活性位点(磷酸泛酰巯基亚胺基化位点)的丝氨酸改变为其他氨基酸比如丙氨酸而失活,或者腺苷酰化结构域被删除或失活。在一个实施方案中,装载结构域和NRPS都被删除或者失活。在各种情况中,只有当提供可结合环氧噻酮PKS与环氧噻酮衍生物PKS组件2(或后面的组件)KS结构域的底物时,获得的环氧噻酮PKS才能起作用。在本发明提供的一种方法中,向这样修饰的细胞提供有活性的酰基硫酯,它优选结合到第二个,但是可能是任何后面的组件,并转变成新的环氧噻酮衍生物。
因此。在一个实施方案中,本发明提供了表达带有失活的NRPS的环氧噻酮PKS(或者产生环氧噻酮衍射衍生物的PKS)的纤维堆囊菌和非纤维堆囊菌宿主细胞。向宿主细胞提供活化的酰基硫酯以产生新的本发明的环氧噻酮衍生物。可以向表达PKS的宿主细胞,或者含有这种PKS的无细胞抽提物,提供新的前体分子N-酰基半胱氨酸硫酯(NACS)来制备环氧噻酮衍生物。参见美国专利,其申请号为60/117,248,于1999年1月27日提交,和PCT专利公开号US99/03986,两者此处引入作为参考,并见下面的实施例6。
环氧噻酮PKS的第二个(第一个非NRPS)组件包括一个KS,一个甲基丙二酰基辅酶A特异性的AT,一个DH,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.8A3的一个约13.1kb的EcoR I-Nsi I限制性片段内的一个序列编码的组件。
本发明的编码环氧噻酮第二个组件的重组核酸组分和它们编码的相应的多肽,被用于各种途径中。经epoC基因表达的一种分离蛋白质的形式产生环氧噻酮PKS的第二个组件。本发明提供了重组形式的epoC基因。在一个实施方案中,含有环氧噻酮第二个组件编码序列的DNA化合物,以分离蛋白质的形式,或者与异源PKS的一个或多个组件的融合蛋白的形式,与构成异源PKS的蛋白质共表达。得到的PKS中,或者异源PKS的一个组件被环氧噻酮PKS的第二个组件所替换,或者后者仅仅是加到异源PKS的组件上,从而产生了一种新的PKS。在另一个实施方案中,含有环氧噻酮PKS第二个组件编码序列的核酸组分和构成环氧噻酮PKS的其它蛋白质,或者产生环氧噻酮衍生物的重组环氧噻酮PKS共表达。
在另一个实施方案中,第二个组件编码序列的整个或其一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换甲基丙二酰基辅酶A特异性的AT;删除了或者DH或者KR或者它们二者;用具有不同立体化学特性的DH或KR或它们二者来替换DH或者KR或者它们二者;和/或插入一个ER。通常地,这里所说的插入或替换PKS的KR,DH,和/或ER结构域,包括通常用插入的或者替换结构域来自组件中的相关的结构域,来替换该组件中相应的KR,DH,或者ER结构域。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换和插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的异源的第二个组件的编码序列能够和构成PKS的其它蛋白质共表达,该PKS可合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物。另外可以删除环氧噻酮PKS的第二个组件,或者用来自于异源PKS的组件来替换它。它可以以分离蛋白的形式,或者以与epoB或者epoD基因产物的融合蛋白的形式表达。
本发明的例证的重组PKS基因,包括那些基因,其中的环氧噻酮PKS第二个组件的AT结构域编码序列被改变或替换,从而使它们编码的AT结构域从甲基丙二酰基特异性的AT变成丙二酰基特异性的AT。这些丙二酰基特异性的AT结构域编码核酸可以从,例如但不限于,编码那波内酯PKS,拉珀霉素PKS(即,组件2和12),以及FK-520PKS(即组件3、7和8)的基因分离。当这种杂合的第二组件和构成环氧噻酮PKS的其它蛋白质共表达时,所产生的环氧噻酮衍生物是16-去甲基环氧噻酮衍生物。
另外,本发明提供了编码重组环氧噻酮PKS酶和对应重组蛋白的DNA化合物和载体,其中的第二个(或后面的)组件的KS结构域被失活或者删除。在优选的实施方案中,这种失活是通过将活性部位的丝氨酸密码子变成丙氨酸密码子来实现的。如同上面所述的相应的NRPS组件的变异体,获得的重组环氧噻酮PKS酶不能产生环氧噻酮或环氧噻酮衍生物,除非供给的前体能被重组PKS酶剩下的结构域和组件结合和延伸。下面的实施例6中描述了例证性的二酮化合物。
环氧噻酮PKS的第3个组件包括一个KS,一个丙二酰基特异性的AT,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.8A3中的一个约8kb的Bgl II-Nsi I限制性片段中的序列编码的。
本发明的重组DNA化合物编码环氧噻酮PKS的第三个组件,该DNA化合物以及它们编码的相应的多肽被用于各种途径中。环氧噻酮PKS的第三个组件是由epo D基因表达的产物中的一种蛋白质,它还包括组件4,5和6。本发明提供了重组形式的epoD基因。本发明还提供了重组DNA化合物,它以分离的不带有其它环氧噻酮组件编码序列的形式编码环氧噻酮PKS组件3,4,5和6的各个组件。在一个实施方案中,含有环氧噻酮第三个组件编码序列的DNA化合物,与构成异源PKS的蛋白质共表达。环氧噻酮PKS的第三个组件能够以分离蛋白质的形式或者以与异源PKS的一个或者多个组件融合的融合蛋白的形式表达。得到的PKS中,其中异源PKS的一个组件被环氧噻酮PKS的第三个组件替换,或者后者仅仅是加到异源PKS的组件上,结果提供了一种新的PKS。在另一个实施方案中,含有环氧噻酮PKS第三个组件编码序列的DNA化合物与含有环氧噻酮PKS剩余部分的蛋白质共表达,或者与一种重组的环氧噻酮PKS共表达,该重组环氧噻酮PKS产生一种环氧噻酮衍生物,通常它作为一种蛋白质,含有不仅有第三个,而且有第四,第五和第六个组件。
在另一个实施方案中,整个的第三个组件编码序列或其一部分被用于与其它的PKS编码序列相结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换丙二酰基辅酶A特异性的AT;删除KR;用具有不同立体化学特性KR来替换KR;和/或插入一个DH和/或一个DH和一个ER。如上面所述,这里所说的插入一个DH或一个DH和一个ER,包括用一个DH和KR或者一个ER,DH,和KR来替换KR。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换和插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。获得的异源的第三个组件的编码序列可用来与合成环氧噻酮,环氧噻酮衍生物,或其它聚酮化合物的PKS的编码序列结合在一起。
本发明的例证的重组PKS基因,包括那些基因,其中的环氧噻酮PKS第三个组件的AT结构域编码序列被改变或替换,从而使它们编码的AT结构域从丙二酰基辅酶A特异性的AT变成甲基丙二酰基辅酶A特异性的AT。这些甲基丙二酰基辅酶A特异性的AT结构域编码核酸可以从,例如但不限于,编码DEBS,Narbonolide PKS,Rapamycin PKS,以及FK-520PKS的基因分离。当这种杂合的第三组件和构成环氧噻酮PKS或者环氧噻酮PKS衍生物的其它组件和蛋白质共表达时,重组的PKS所产生的环氧噻酮衍生物是本发明的14-甲基环氧噻酮衍生物。
本领域的技术人员可以认识到,PKS第三个组件的KR结构域负责形成羟基基团,与环氧噻酮的环化有关。因此,消除第三个组件的KR结构域,或者添加一个DH,或者DH和结构域会影响环化,导致形成线性分子,或者分子在不同于环氧噻酮的位置环化。
环氧噻酮PKS的第四个组件包括一个KS,一个结合丙二酰基辅酶A或者甲基丙二酰基辅酶A的AT,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.1A2中的一个约10kb的Nsi I-Hind III限制性片段中的序列编码的。
本发明的重组DNA化合物编码环氧噻酮PKS的第四个组件,它们编码的相应的多肽被用于各种途径中。在一个实施方案中,含有环氧噻酮PKS的第四个组件编码序列的DNA化合物,被插入到含有一个或者多个异源PKS组件编码序列的DNA化合物中。得到的PKS中,其中异源PKS的一个组件被环氧噻酮PKS的第四个组件替换,或者后者仅仅是加到异源PKS的组件上,结果提供了一种新的PKS。这个蛋白和其他构成异源PKS的蛋白质一起,提供了一种新的PKS。在另一个实施方案中,含有环氧噻酮PKS第四个组件编码序列的DNA化合物,在表达环氧噻酮PKS剩余部分的蛋白质和组件,或者在表达一种产生环氧噻酮衍生物的重组环氧噻酮PKS的宿主中表达,该重组第四组件通常在一种蛋白质中表达,该蛋白质也含有第三个,第五和第六个组件或者它们的修饰本。
在另一个实施方案中,整个的第四个组件编码序列或其一部分被用于与其它的PKS编码序列相结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用丙二酰基辅酶A,甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换丙二酰基辅酶A和甲基丙二酰基辅酶A特异性的AT;删除KR;选择包括用具有不同立体化学特性KR来替换KR;和/或插入一个DH和/或一个DH和一个ER。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换和插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。获得的异源的第三个组件的编码序列结合在重组PKS的蛋白质亚基中,用来与合成环氧噻酮,环氧噻酮衍生物,或其它聚酮化合物。如果所要得到的聚酮化合物是环氧噻酮或者环氧噻酮衍生物,那么重组的第四组件通常作为一种蛋白质表达,其中还含有环氧噻酮PKS的第三个,第五和第六个组件或者它们的修饰本。可选地,本发明提供了重组的环氧噻酮和环氧噻酮衍生物PKS酶,其中的整个的第四组件被删除或者被异源PKS的一个组件替换。
在一个优选的实施方案中,本发明提供了重组的DNA化合物,它含有的环氧噻酮PKS的第四组件的编码序列,环氧噻酮PKS被修饰去编码一种能结合甲基丙二酰基辅酶A,而不是丙二酰基辅酶A的AT。这些重组分子被用于表达epoD蛋白重组衍生物的蛋白,该epoD蛋白含有修饰的第4组件,以及组件3,5和6,以及它们的任何一种或几种可以选择的环氧噻酮PKS,或其衍生物。在另一个优选实施方案中,表发明提供的重组DNA化合物,它含有的环氧噻酮PKS第4组件的编码序列,被修饰以编码一个结合丙二配基酶A,而不是甲基丙二酰基辅酶A的AT。这些重组分子被用于表达一种蛋白质,该蛋白质是epoD蛋白质的重组形式的衍生物,它含有修饰的第四组件,以及组件3,5和6,以及它们中的任何一种或几种可以选择的环氧噻酮PKS,或其衍生物。
在本发明之前,已知纤维堆囊菌产生环氧噻酮A,B,C,D,E,和F,而环氧噻酮A,C和E,在C-12的位置具有氢,而环氧噻酮B,D和F在这个位置具有甲基。在本发明之前所不被了解的是在纤维堆囊菌中,这些化合物被合成的顺序,以及一些化合物在C-12具有氢,而另外一些在这位置具有甲基的机制。本文公开的内容提示了环氧噻酮A和B是通过epoK基因产物的活性而由环氧噻酮C和D衍生的,而C-12位氢或者甲基组分的存在是因为环氧噻酮PKS组件4的AT结构域。这个结构域可以结合,丙二酰基或者甲基丙二酰基辅酶A,以及,因为它与丙二酰基特异性的AT结构域,比与甲基丙二酰基特异性的AT结构的具有更大的相似性,所以,结合丙二酰基辅酶A比结合甲基丙二酰基辅酶A更常见。
因此,本发明提供了重组DNA化合物和表达载体和相应的重组PKS,其中结合了一个具甲基丙二酰基特异性AT的第四组件。这种甲基丙二酰基辅酶A特异性的AT编码序列,可以起源于,例如但不限于,编码夹竹桃内酯PKS,DEBS,那波内酯PKS,拉珀霉素PKS,或者任何含有甲基丙二酰基辅酶A特异性AT结构域的PKS。依照本发明,由这个编码序列表达的杂合第四组件,通常作为衍生的epoD基因产物,结合到环氧噻酮PKS(或者环氧噻酮衍生物的PKS)中。获得的重组环氧噻酮PKS产生的环氧噻酮在C-12位具有一个甲基部分,如果没有脱氢酶活性形成C-12-C-13二烯烃,得到的即是环氧噻酮H(或者环氧噻酮H衍生物);如果有脱氢酶活性但是没有环氧化物酶活性存在,得到环氧噻酮D(或者环氧噻酮D衍生物);如果没有脱氢酶和环氧化酶活性但是有羟化酶活性,得到环氧噻酮B(或者环氧噻酮B衍生物);如果没有脱氢酶,环氧化酶和羟化酶活性三者都存在,得到环氧噻酮F(或者环氧噻酮F衍生物)。如上面所显示的。如果有环氧噻酮PKS的其它的变化,细胞会产生相应的环氧噻酮衍生物。
当含有杂合的甲基丙二基特异性第四组件的重组PKS在例如纤维堆囊菌中表达时,并有合适的修饰酶存在(除非它们被根据本发明的方法失活),将会产生环氧噻酮D,B和/或F。通常是在由本发明提供的重组纤维堆囊菌中产生这些衍生物,其中天然的环氧噻酮PKS不能行使功能,或者,除非与提供的重组第四组件相结合,否则不能行使功能。在一个例证性的实施例中,可以使用本发明的方法和试剂来灭活天然宿主中的epoD基因。然后可用含有第四组件编码序列的重组epoD基因的载体转化宿主细胞。重组载体可以成为染色体外的部件或者作为一个DNA片段整合到宿主细胞染色体中。在后面的实施方案中,本发明提供的方法,可以方便地通过使用与天然epoD基因同源重组,将重组的甲基丙二酰基特异性的组件4编码序列整合到野生型纤维堆囊菌中,从而保证只是产生想要的环氧噻酮。本发明提供的纤维堆囊菌宿主细胞可以表达或者不表达(通过对它们的天然基因突变或者同源重组)脱氢酶,环氧化物酶,和/或氧化酶基因产物,因此可由操作人员选择,形成或者不成相应的环氧噻酮D,B和F化合物。
上述的修饰的纤维堆囊菌只是本发明提供的重组宿主细胞中的一种。在优选的实施方案中,重组的甲基丙二酰基特异性的环氧噻酮第四组件编码序列,被用于根据本发明的方法在异源宿主细胞中,产生环氧噻酮D,B和F,或者其它的相应的衍生物。因此,本发明提供了将环氧噻酮或者环氧噻酮衍生物PKS和环氧噻酮脱氢酶,环氧化酶,和羟基化酶基因及它们的组合导入异源宿主细胞中的试剂和方法。
本发明提供的重组的甲基丙二酰基性异性的环氧噻酮第四组件编码序列,提供了重要的在宿主细胞中产生所要的环氧噻酮化合物的可以替换的方法。因此,本发明了提供了杂合的第四组件编码序列,基中除了内源AT编码序列,被甲基丙二酰基特异性的AT编码序列替换外,例如但不限于拉珀霉素PKS的组件10,或者FK-520PKS的组件1或者5的DH和KR编码序列,被内源的KR编码序列所替换。当含有杂合第四组件和环氧噻酮PKS组件3,5和6或者它们的衍生物的,由这些编码序列编码的基因产物,与宿主细胞提供的含有其它环氧噻酮PKS蛋白质(或者它们的衍生物)的PKS结合在一起时,细胞将依赖于插入的DH和KR结构域的立体化学特异性,而产生环氧噻酮D或者它的反式立体异构体(或者它们的衍生物)。
同样,如上面所提到的,本发明提供了重组的DNA化合物,它所含有的环氧噻酮PKS第四组件的编码序列,被修饰来编码一个结合丙二酰基辅酶A而不是甲基丙二酰基辅酶A的AT。本发明提供了重组DNA化合物和载体和相应的重组PKS,其中杂合的第四组件被结合到衍生的epoD基因产物中。当结合进环氧噻酮PKS(或者环氧噻酮衍生物PKS)后获得的重组环氧噻酮PKS将依赖于环氧噻酮修饰酶是否存在而产生环氧噻酮C,A和E。如上面所提到的,依赖于宿主,第四组件是否包括KR和DH结构域,以及脱氢酶,环氧化酶,和氧化酶活性是否存在和哪种存在,本发现的实践者,可以使用本发明的化合物,宿主细胞和方法生产环氧噻酮G,C,A和E化合物的一种或几种或者它们的衍生物。
环氧噻酮PKS的第五个组件包括一个KS,一个结合丙二酰基辅酶A的AT,一个DH,一个ER,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.1A2中的一个约12.4kb的Nsi I-NotI限制性片段中的序列编码的。
本发明的重组DNA化合物编码环氧噻酮PKS的第五个组件,它们编码的相应的多肽被用于各种途径中。在一个实施方案中,含有环氧噻酮第五组件编码序列的DNA化合物,被插入含有异源PKS一个或者几个组件的编码序列的DNA化合物中。获得的构造,其中异源PKS一个组件的编码序列被环氧噻酮PKS第五组件的编码序列所替换,或者后者仅仅是加到异源PKS的组件的编码序列上,该构造可以连结到表达载体上,以产生它们编码的重组蛋白质。当重组蛋白质与异源PKS的其余蛋白组分组合在一起时,就产生了一种新的PKS。在另一个实施方案中,含有环氧噻酮PKS第五组件编码序列插入到或含有环氧噻酮或者产生环氧噻酮衍生物的重组环氧噻酮PKS编码序列的DNA化合物中。在后一构造中,环氧噻酮第五组件,通常以含有环氧噻酮PKS的第三,第四,第六组件,或其衍生物的蛋白质的形式表达的。
在另一个实施方案中,第五个组件编码序列的整个或其一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换丙二酰基辅酶A特异性的AT;删除ER,DH和KR中的一个,两个或者所有三个;和/或用包括特别是具有不同立体化学特性的,一个KR,一个DH和KR,或者一个KR,DH和KR,来替换DH,KR和ER中的一个,两个或者所有三个。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换或插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的杂合第五组件编码序列能够和合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物的PKS编码序列结合起来应用。另外,可以删除环氧噻酮PKS的第五组件,或者用来自于异源PKS的组件来整个替换它,从而产生一种新的蛋白质,它与其他的环氧噻酮PKS或其衍生物蛋白质结合,构成一种产生环氧噻酮衍生物的PKS。
本发明的例证的重组PKS基因,包括重组的epoD基因衍生物,其中的环氧噻酮PKS第二个组件的AT结构域编码序列被改变或替换,从而使它们编码的AT结构域从丙二酰基特异性的AT变成甲基丙二酰基特异性的AT。这些甲基丙二酰基特异性的AT结构域编码核酸可以从,例如但不限于,编码DEBS的PKS基因,那波内酯PKS,拉珀霉素PKS,以及FK-520PKS的基因分离出来。当这种重组的epoD基因衍生物和epoA,epoB,epoC,epoE,和epoF基因(或其衍生物)共表达时,它们组成的PKS产生10-甲基环氧噻酮或其衍生物。本发明提供的另一个重组epoD基因衍生物包括不仅改变了的组件5编码序列,还有编码结合甲基丙二酰基辅酶A的AT结构域的组件4编码序列。当与结合到含有epoA,epoB,epoC,epoE,epoF基因的PKS中时,重组的epoD基因衍生物的产物引导产生10-甲基环氧噻酮B和/或D衍生物。
本发明其他的例证性的重组epoD基因衍生物,包括那些基因,其中的环氧噻酮PKS第五组件的ER,DH,和KR结构域编码序列下面的编码序列替换成:(i)一个KR和DH结构域;(ii)一个KR结构域;和(iii)一个失活的KR结构域。本发明的这些重组的epoD基因衍生物与epoA,epoB,epoC,epoE,和epoF基因的PKS共表达重组的epoD基因衍生物,产生重组PKR,它对应于(i)C-11烯烃,(ii)C-11羟基,(iii)C-11酮基环氧噻酮衍生物。这些重组的epoD基因衍生物,可以与含有其他改变的重组epo基因共表达,或者它们自身可作进一步的改变以产生制备相关的C-11环氧噻酮衍生物的PKS。例如,本发明的重组的epoD基因衍生物可以包括只结合甲基丙二酰基辅酶A的AT结构域的组件4编码序列。当与具有epoA,epoB,epoC,epoE,和epoF基因的PKS结合在一起时,重组的epoD基因衍生物,导致产生相应的C-11环氧噻酮B和/或D衍生物。
产生环氧噻酮C-11衍生物的功能相似的epoD基因,可是通过失活环氧噻酮第五组件的ER,DH和KR结构域的其中的一个,二个,和三个来产生。然而。在任何组件中改变这些结构域的优选方式是,用来自其它组件的另外一个组件或者异源PKS编码序列的完整的一套相想要的结构域来替换这些组件。在这种方式中,PKS的天然结构是保守的。同样,如果存在,在天然PKS中一起发挥作用的KR和DH或者KR,DH,以及ER结构域被优选用于重组的PKS中,上面所述的用于的替换,可以考虑的替换结构域包括,例如但不限于,来自拉珀霉素PKS组件3的失活的KR结构域以形成酮基,来自拉珀霉素PKS组件5的KR结构域以形成醇基,来自拉珀霉素PKS组件4的KR和DH结构域以形成烯烃基。其它的这些失活的KR,和活性KR,和活性KR和DH结构域编码核酸可以分离自,例如,但不限于,编码DEBS的PKS基因,那波内酯PKS和FK-520PKS。得到的各种PKS酶所产生的聚酮化合物组分在C-11位含有的功能基因,可进一步在体外用通常的化学方法进行衍化,以得到本发明半合成的环氧噻酮衍生物。
环氧噻酮PKS的第六个组件包括一个KS,一个结合甲基丙二酰基辅酶A的AT,一个DH,一个ER,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.1A2中的一个约14.5kb的Hind III-Nsi I限制性片段中的序列编码的。
本发明的重组DNA化合物编码环氧噻酮PKS的第六个组件,它们编码的相应的多肽被用于各种途径中。在一个实施方案中,含有环氧噻酮第六组件编码序列的DNA化合物,被插入含有异源PKS一个或者几个组件的编码序列的DNA化合物中。获得的构造所编码的蛋白质,其中异源PKS一个组件的编码序列被环氧噻酮PKS第六组件的编码序列所替换,或者后者仅仅是加到异源RKS的组件的编码序列上,当与构成PKS的其他蛋白质共表达时,就产生了一种新的PKS。在另一个实施方案中,含有环氧噻酮PKS第六组件编码序列的DNA化合物插入到或含有环氧噻酮PKS组件PKS3,4和5或者产生环氧噻酮衍生物的重组环氧噻酮PKS编码序列的DNA化合物中,与环氧噻酮或者环氧噻酮衍生物PKS共表达而获得一种PKS,该PKS在宿主细胞中产生环氧噻酮衍生物。
在另一个实施方案中,第六个组件编码序列的一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换甲基丙二酰基辅酶A特异性的AT;删除ER,DH和KR中的任何一个,两个或者所有三个;和/或用包括特别是具有不同立体化学特性的,一个KR,一个DH和KR,或者一个KR,DH和KR,来替换DH,KR和ER中的任何一个,两个或者所有三个。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换或插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的异源第六组件编码序列能够和合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物的PKS蛋白亚基编码序列结合起来应用。假如PKS制备环氧噻酮,环氧噻酮衍生物,杂合第六组件通常表达成含有环氧噻酮,环氧噻酮衍生物组件3,4和5的蛋白,另外,可以删除环氧噻酮PKS的第六组件,或者用来自于异源PKS的组件来整个替换它,制备环氧噻酮衍生物用的PKS。
本发明的例证性的重组PKS基因,包括那些基因,其中的环氧噻酮PKS第六个组件的AT结构域编码序列被改变或替换,从而使它们编码的AT结构域从甲基丙二酰基特异性的AT变成丙二酰基特异性的AT。这些丙二酰基特异性的AT结构域编码核酸可以从,例如但不限于,编码那波内酯PKS,拉珀霉素PKS,以及FK-520PKS的的PKS基因分离。当编码这种杂合组件6的本发明的重组epoD基因衍生物和其他的环氧噻酮PKS基因共表达时,重组的PKS产生8-去甲基环氧噻酮衍生物。这些重组的epoD基因衍生物,可以与含有其它变化的重组epo基因衍生物共表达,或者它们自身可作进一步的改变以产生制备相关的8-去甲基环氧噻酮衍生物的PKS。例如,本发明提供的一个重组的epoD基因衍生物,可以包括只结合甲基丙二酰基辅酶A的AT结构域的组件4编码序列。当与具有epoA,epoB,epoC,epoE,和epoF基因的PKS结合在一起时,重组的epo D基因衍生物,产生相应的8-去甲基环氧噻酮B和/或D衍生物。
本发明其他的例证性的重组epoD基因衍生物,包括那些,其中的环氧噻酮PKS第六组件的ER,DH,和KR结构域编码序列可为下面的编码序列替换:(i)一个KR和DH结构域;(ii)一个KR结构域;和(iii)一个失活的KR结构域。本发明的这些重组的epoD基因衍生物与其他的PKS基因共表达时,产生相应的(i)C-9烯烃,(ii)C-9羟基,(iii)C-9酮基环氧噻酮衍生物。这些重组的epoD基因衍生物,可以与含有其他改变的重组epo基因共表达,或者它们自身可作进一步的改变以产生制备相关的C-9环氧噻酮衍生物的PKS。例如,本发明的重组的epoD基因衍生物可以包括只结合甲基丙二酰基辅酶A的AT结构域的组件4编码序列。当与具有epoA,epoB,epoC,epoE,和epoF基因的PKS结合在一起时,重组的epoD基因衍生物,引导产生相应的C-9环氧噻酮B和/或D衍生物。
功能相同的第六组件,可是通过失活环氧噻酮第六组件的ER,DH和KR结构域的其中之一,之二,和之三来产生。然而。在任何组件中改变这些结构域的优选方式是,用来自相同分子的另外一个组件或者异源PKS编码序列的完整的一套相要的结构域来替换这些组件。上面所述的例证性的用于替换的结构域包括,例如但不限于,来自拉珀霉素PKS组件3的失活的KR结构域,以形成酮基,来自拉珀霉素PKS组件5的KR结构域,以形成醇基,来自拉珀霉素PKS组件4的KR和DH结构域,以形成烯烃基。其它的这些失活的KR,和活性KR,和活性KR和DH结构域编码核酸可以分离自,例如,但不限于,编码DEBS的PKS基因,那波内酯PKS和FK-520PKS。得到的各种PKS酶所产生的聚酮化合物组分在C-9位含有的功能基团,可进一步在体外用通常的化学方法进行衍化,以得到本发明半合成的环氧噻酮衍生物。
环氧噻酮PKS的第七个组件包括一个KS,一个甲基丙二酰基辅酶A特异性的AT,一个DH,一个KR,和一个ACP。这个组件是由粘粒pKOS35-70.4中的一个约8.7kb的BglII限制性片段中的序列编码的。
本发明编码环氧噻酮PKS的第七个组件的重组DNA化合物,和它们编码的相应的多肽被用于各种途径中。环氧噻酮PKS的第七个组件包含在epoE基因的基因产物中,该基因也包含了第八组件。本发明提供了重组形式的epoE基因,但是也提供了编码第七组件但是不含第八组件编码序列的DNA化合物,以及编码第八组件但是不含第七组件编码序列的DNA化合物。在一个实施方案中,含有环氧噻酮第七组件编码序列的DNA化合物,被插入含有异源PKS一个或者几个组件的编码序列的DNA化合物中。获得的构造中,异源PKS一个组件的编码序列被环氧噻酮PKS第七组件的编码序列所替换,或者后者仅仅是加到异源RKS的组件的编码序列上,产生了一种新的能在宿主细胞中表达的PKS编码序列。可选地,环氧噻酮第七个组件可以作为一个分离的蛋白质表达。在另一个实施方案中,含有环氧噻酮PKS第七组件编码序列的DNA化合物表达形成一种蛋白质,它和其他蛋白质一起构成环氧噻酮PK,或者产生环氧噻酮衍生物的PKS。在这些实施方案中,第七个组件通常是作为含有环氧噻酮PKS的第八个组件,或其衍生物的蛋白质的形式表达的,与epoA,epoB,epoC,epoD,和epoF基因或其衍生物共表达,构成PKS。
在另一个实施方案中,第七组件编码序列的整个或其一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换甲基丙二酰基辅酶A特异性的AT;删除KR;用具有不同立体化学特性的KR来替换KR;和/或插入一个DH或者一个DH和一个ER。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换或插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的杂合第七组件编码序列能够和合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物的PKS蛋白亚基编码序列结合起来应用。当用于制备环氧噻酮或者环氧噻酮衍生物时,第七个组件通常是作为含有环氧噻酮PKS的第八个组件,或其衍生物的蛋白质的形式表达的,它与epoA,epoB,epoC,epoD,和epoF基因或其衍生物共表达,构成PKS。可选择地,epoE基因中的第七组件编码序列可被删除,或者被异源的组件替换,以制备重组的epoE基因衍生物,它和epoA,epoB,epoC,epoD,和epoF基因一起表达,构成环氧噻酮衍生物PKS。
本发明的例证性的重组的epoE基因衍生物,包括那些,其中的环氧噻酮PKS第七个组件的AT结构域编码序列被改变或替换,从而使它们编码的AT结构域从甲基丙二酰基特异性的AT变成丙二酰基特异性的AT。这些丙二酰基特异性的AT结构域编码核酸可以从,例如但不限于,编码那波内酯PKS,拉珀霉素PKS,以及FK-520PKS的的PKS基因分离。当和其他的环氧噻酮PKS基因,epoA,epoB,epoC,epoD,和epoF或其衍生物共表达时,得到的一种PKS产生的是C-6氢,而不是C-6甲基的环氧噻酮衍生物的PKS。因此,如果基因中没有别的改变,产生的化合物是6-去甲基环氧噻酮。
环氧噻酮PKS的第八个组件包括一个KS,一个甲基丙二酰基辅酶A特异性的AT,一个DH,失活的KR,和DH结构域,甲基转移酶(MT)结构域和一个ACP。这个组件是由粘粒pKOS35-79.85中的一个约10kb的NotI限制性片段中的序列编码的。
编码环氧噻酮PKS的第八个组件的本发明的重组DNA化合物,和它们编码的相应的多肽被用于各种途径中。在一个实施方案中,环氧噻酮第八组件编码序列的DNA化合物,被插入含有异源PKS一个或者几个组件的编码序列的DNA化合物中。获得的构造中,异源PKS一个组件的编码序列被环氧噻酮PKS第八组件的编码序列所替换,或者后者仅仅是加到异源RKS的组件的编码序列上,产生了一种新的PKS编码序列,它和构成PKS的其他蛋白质一起表达,产生一种新的PKS。可选地,环氧噻酮第八个组件可以作为一个分离的蛋白质表达,与其他的PKS蛋白质结合形成新的PKS。在另一个实施方案中,含环氧噻酮PKS第八组件编码序列的DNA化合物和构成环氧噻酮PKS,或者产生环氧噻酮衍生物的PKS的其他蛋白质共表达。在这些实施方案中,第八个组件通常是作为也含有环氧噻酮PKS的第七个组件,或其衍生物的蛋白质的形式表达的。
在另一个实施方案中,第八组件编码序列的整个或其一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换甲基丙二酰基辅酶A特异性的AT;删除失活的KR和/或失活的DH;用有活性的KR和/或有活性的DH替换失活的KR和/或失活的DH;和/或插入一个ER。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换或插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的异源第八组件编码序列能够作为蛋白来表达,用于同其它蛋白结合,构成合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物的PKS。当用于制备环氧噻酮或者环氧噻酮衍生物时,异源或者杂合第八组件通常是作为重组epoE基因产物表达的,该产物含有第7组件。可选择地,epoE基因中的第八组件编码序列可被删除,或者被异源的组件替换以制备重组的epoE基因衍生物,它和epoA,epoB,epoC,epoD,和epoF基因一起表达,构成环氧噻酮衍生物PKS。
环氧噻酮PKS第八组件还含有一个带有给环氧噻酮前体加上甲基活性的甲基化或者甲基转移酶结构域(MT)。这个功能可以被删除,从而获得本发明的重组epoD基因衍生物,它可以和其他的环氧噻酮PKS或其衍生物一起表达,依赖于是否第八组件的AT结构域被变化为丙二酰基特异性的AT结构域,在相应的环氧噻酮分子的C-4位点,可以产生缺少一个或者两个甲基基团的环氧噻酮衍生物。在另一个实施方案中,本发明提供了编码这个甲基化结构域和活性的多肽的重组DNA化合物,以及许多种编码结合这个多肽的重组PKS酶的重组PKS编码序列。这个MT结构域和它的编码序列提供了大量的在附加甲基基团的存在上不同于已知聚酮化合物的新的聚酮化合物。本发明的MT结构域能够有效地加到任何PKS组件上,去指导由PKS生成的聚酮化合物相应位点的甲基化。在一个例证性实施例中,本发明提供了,由MT活性编码序列插入到DEBS酶的六个组件的一个或多个组件上,所产生的一种重组的DEBS核酸细分,它合成在C-2,C-4,C-6,C-8,C-10,和/或C-12位点,含有一个或多个附加的甲基基团的6-脱氧红霉内酯B衍生物。在这一构造中,MT结构域可以插入与AT或者ACP邻接。
环氧噻酮PKS的第九个组件包括一个KS,一个丙二酰基辅酶A特异性的AT,一个KR,失活的DH,和一个ACP。这个组件是由粘粒pKOS35-79.85上的一个约14.7kb的HindII-BglII限制性片段中的序列编码的。
编码环氧噻酮PKS的第九个组件的本发明的重组DNA化合物,和它们编码的相应的多肽被用于各种途径中。环氧噻酮PKS的第九个组件是以epoF基因基因产物蛋白的形式表达的,该基因也包含了环氧噻酮PKS的TE结构域。本发明提供了重组形式的epoF基因,但也提供了编码第九组件但是不含TE结构域编码序列的DNA化合物,以及编码TE结构域但是不含第九组件编码序列的DNA化合物。在一个实施方案中,含有环氧噻酮第九组件编码序列的DNA化合物,被插入含有异源PKS一个或者几个组件的编码序列的DNA化合物中。获得的构造中,异源PKS一个组件的编码序列被环氧噻酮PKS第九组件的编码序列所替换,或者后者仅仅是加到异源RKS的组件的编码序列上,产生了一种新的PKS蛋白质编码序列,它和构成PKS的其他蛋白质一起表达,产生一种新的PKS。环氧噻酮第九个组件可以作为一个分离的蛋白质表达,带或不带有附加的TE结构域。在另一个实施方案中,含有环氧噻酮PKS第九组件编码序列的DNA化合物和构成环氧噻酮PKS,或者产生环氧噻酮衍生物的PKS的其他蛋白质共表达。在这些实施方案中,第九个组件通常是作为也含有环氧噻酮PKS的或异源PKS的TE结构域的蛋白形式表达的。
在另一个实施方案中,第九组件编码序列的整个或其一部分,被用于和其它的PKS编码序列结合以产生杂合组件。在这个实施方案中,本发明提供了,例如用甲基丙二酰基辅酶A,乙基丙二酰基辅酶A,或者2-羟基丙二酰基辅酶A特异性的AT来替换丙二酰基辅酶A特异性的AT;删除KR;用具有不同立体化学特性的KR来替换KR;和/或插入一个DH或者一个DH和一个ER。另外,KS和/或ACP可以用另外的KS和/或ACP来替代。上面的所有这些替换或插入中,异源的KS,AT,DH,KR,ER,或者ACP编码序列可以来自环氧噻酮PKS另外一个组件编码序列,产生不同于环氧噻酮的聚酮化合物的PKS的基因,或者来自化学合成。得到的异源第九组件编码序列能够和合成环氧噻酮,环氧噻酮衍生物,或者其它的聚酮化生物的PKS蛋白亚基编码序列共表达。可以选择地,本发明提供了用于制备环氧噻酮和环氧噻酮衍生物的PKS,其中的第九组件被异源PKS的一个组件替换,或者被整个的删除。在后一个实施方案中,TE结构域作为一个分离的蛋白质表达或者融合到第八组件上。
环氧噻酮PKS的第九组件后面是硫酯酶结构域。这个结构域是由一个包含第九组件编码序列的约14.kb的Hind III-BglII限制性片段编码的。本发明提供编码杂合PKS酶的重组DNA化合物,其中环氧噻酮PKS的第九组件被融合到一个异源硫酯酶,或者异源PKS的一个或者多个组件被融合进入环氧噻酮PKS硫酯酶。因此,例如,来自其它PKS的硫酯酶结构域编码序列能够插入本发明重组DNA化合物中的第九组件ACP编码序列的终端。编码这种硫酯酶结构域的重组DNA化合物能用于构建编码环氧噻酮PKS,产生环氧噻酮衍生物的PKS,以及产生不是环氧噻酮或者环氧噻酮衍生物的PKS的蛋白。
在一个实施重要的方案中,本发明提供一种杂合PKS和编码构建那些杂合PKS酶的重组DNA化合物。为了本发明的目的,杂合PKS是异种重组PKS,它包括所有的或者部分一或多个组件,装载结构域和第一PKS硫酯酶/环化酶结构域,和所有或者部分一个或多个组件,装载结构域和第二PKS硫酯酶/环化酶结构域。在一个优选的实施方案中,所述的第一PKS是绝大多数但非全部的环氧噻酮PKS,而第二PKS仅仅是部分或者全部非环氧噻酮PKS。这种杂合PKS的例证包括能够用其它PKS装载结构域替代的天然装载结构域的环氧噻酮PKS。这种杂合PKS的另外的例证是一种环氧噻酮PKS,它的第四组件的AT结构域被用仅与甲基丙二酰辅酶结合的异源PKSAT结构域替代。在另一个实施方案中,所述的第一PKS是绝大多数但非全部的环氧噻酮PKS,而第二PKS仅仅是部分或者全部环氧噻酮PKS。这种杂合PKS的例证包括能够用对丙二酰辅酶特异性的环氧噻酮PKS的AT替代对甲基丙二酰辅酶特异性的AT的红霉素PKS。另一个实施例是包括环氧噻酮PKS MT结构域的红霉素PKS。
本领域技术人员可以认识到,本发明的杂合PKS的第一个和第二个PKS的整个或其一部分,不需要从天然来源分离。例如,AT结构域的仅仅很小一部分决定了它的特异性。见美国专利申请号09/346,860和PCT专利申请号WOUS99/15047。本领域中所描述的DNA合成技术的状况,使技术人员可以从头合成足够大小的DNA化合物,以构建有用的PKS组件或结构域部分。对于本发明来说,这种合成的DNA化合物是PKS的一部分。
下表列出了描述PKS基因的相关的参考文献,用于构建重组PKS的相应的酶,和它们所编码的本发明的相应的DNA化合物。也列出了描述聚酮化合物加尾和修饰酶的各种参考文献,以及用来制备本发明的重组DNA化合物的相应的基因。
阿维菌素
美国专利号5,252,474,授予Merk公司
MacNeii等人,1993,industriai Microorganism Basic And Applied MolecularGenetics,(工业微生物基础和应用遗传学]Baltz,Hegeman,和Skatrud,编(ASM),p245-256,A comparison of the Genes Encoding the Polyketide聚酮化合物Synthases for Avermectin,Erythromycin,and Nemadectin.
MacNeil等人,1992,基因Gene 115:119-125,Complex Organization Of theStreptomyces avermitilis genes,encoding the avermecoin polyketide synthase(编码阿维菌素聚酮化合物合成酶的阿维菌素链霉菌基因的复杂组织)。
Ikeda和Omura,1997,Chem Res 97:2599-2609,AvermectinBiosynthesis(阿维菌素生物合成)。
杀念珠菌素(FR008):
Hu等人,1994,Mol Microbiol(分子微生物学)14:163-172。
红霉素
PCT公开号93/13663.申请人Abbott
美国专利号5,824,513.申请人Abbott
Donadio等人,1991科学252:6759。
Cortes等人,11月8日1990,nature(自然)348:176-8,红色糖多孢菌产生红霉素的聚酮合成酶的特别异常的多功能多肽
糖基化酶
PCT专利申请公开号97/23630,申请人Abbott。
FK-506
Motamedi等人,《欧洲生物化学杂学》1998,256:528-534,免疫抑制剂FK-506的大环内酯环的生物合成基因簇,。
Motamedi等人,《欧洲生物化学杂学》1997,244:74-80大环内酯免疫抑制剂FK-506生物合成有关的多功能聚酮合成酶的结构组织]。
甲基转移酶
美国专利申请号5,246,355,1993年11月23日颁布,来自链霉菌MA6858.31的甲基化酶,31-氧-去甲-FK-506-甲基转移酶。
Motamedi等人,1996,《细菌学杂志》1178:5243-5248免疫抑制剂FK-506和FK-520生物合成中涉及的甲基转移酶和羟基化酶基因的特征。
FK-520
美国专利申请序列号09/154,083,1998年9月16日递交。
美国专利申请序列号09/410,551,1999年10月1日递交。
Nielsen等人,1991,生物化学30:5789-96
洛伐他丁
美国专利号5,744,350,Merk公司
Narbomycin
美国专利申请序列号60/107,093,1998年11月5日递交
Nemadectin
MacNeil等人,1993,supra。
尼达霉素
Kakavas等人,细菌学,179:7515-7522,来自天青链霉菌尼达霉素聚酮化合物合成酶基因的鉴别与特征。
Oleandomycin
Swan等人,分子基因遗传学,242:358-362,编码I型聚酮化合物合成酶抗生链霉菌基因的特征。
美国专利申请系列号60/120,254,要求优先权,发明人S,Shah,M.Betlach,R McDaniel和L.Tang,专利律师号:30063-20029.00。
Olano等人,1998,Analysis Of A Streptomyces antibioticas Chromosomalregion involved in Oleandomycin Biosynthesis,which encodes twoglycosyltransferases reponsible for Glylosylation of the macrolatone ring,(与Oleandomycin生物合成有关的抗生链霉菌染色体区的分析,它编码两种负责大环内酯环糖基化的糖基转移酶),Mol,Gen Genet。(分子基因遗传学)259(3):299-308。
苦霉素
PCT专利申请号WO US99/11814,1999年5月28日递交。
U.S专利申请号09/320,878,1999年5月27日递交。
U.S专利申请号09/141,908,1998年8月28日递交
Xue等人,1998,由pikC编码的委内瑞拉链霉菌细胞色素p450介导的大环内酯YC=17和那波霉素的羟基化,化学和生物学5(11):661-667。
Xue等人,1998年10月,委内瑞拉链霉菌大环内酯类抗生素生物合成的基因簇:代谢多样性的结构,Proc natl Acad sci USA[美国科学院院报]95:1211112116
普拉地内酯(Platenolide)
欧洲专利申请公开号791,656,申请人Lilly。
普那米星(Pradimicin)
PCT公开号WO98/11230申请人Bristol-Myers Squibb
拉珀霉素(Rapamycin)
Schweche等人,1995年八月,聚酮化合物拉珀霉素的生物合成基因簇,Proc.Natl.Acad.Sci.USA 92:7839-7843.
Aparicio等人,1996,吸水链霉菌中拉珀霉素生物合成基因簇的组织:组件化聚酮化合物合成酶中酶结构域的分析,Gene[基因]169:9-16。
利福霉素(Rifamycin)
PCT公开号WO98/07868申请人NOVARTIS
Augest等人,1998年2月13日,安沙霉素抗生素利福霉素的生物合成:
Amycolatopsis mediterranei S669的RIF生物合成基因簇的分子分析中还原,化学和生物学,5(2):69-79。
堆囊菌(Sorangium)PKS
美国专利申请号09/144,085,1998年8月31日递交。
索那芬(Soraphen)
美国专利号5,716,849,授与Novarfis。
Schupp等人,1995,细菌学杂志,177:3673-3679,一个大环内酯抗生素索那芬A生物合成的纤维堆囊菌(分枝杆菌)基因簇:克隆,分析,和与来自放线菌的聚酮化合物合成酶基因的同源性。
螺旋霉素(Spiramycin)
美国专利号:5,098,837,授予Lilly。
活化因子基因
美国专利号:5,514,544,授予Lilly。
泰乐菌素(Tylosin)
美国专利号:5,876,991,授予Lilly。
欧洲专利公开号:791,655申请人Lilly。
Kuhstoss等人,1996基因183:231-6,经过杂合聚酮化合物合成酶的构建制备一种新的聚酮化合物。
加尾酶
Merson-Daves和Cundliffe,1994,Mol Microbiol 13:349-355[分子微生物学],B:349-355,Analysis of five Tylosin biosynthetic genes from the TylBAregion of the Streptomyces Fradiae Genome(弗氏链霉菌基因组TyIBA区的五种泰乐菌素生物合成基因的分析。)
如上面所述的,有许多种PKS基因可作为可方便地获取的DNA的来源,以及许多的序列资料可用于构建本发明的杂合PKS编码DNA化合物。构建杂合PKS编码DNA化合物的方法,虽然没有提及环氧噻酮PKS,可以参见下面文献中的描述:美国专利号5,672,491和5712146,和美国专利申请09/073,538,该申请于1998年5月6日提交,09/141,908,该申请于1998年8月28日提交,各篇在此处引入作为参考。为分离本发明用于构建杂合PKS酶的异源PKS编码结构域序列,优选的PKS酶和这种酶的编码序列是上面表中所述的索那芬PKS和作为纤维堆囊菌PKS的PKS。
这里概述了实施例中克隆基因和序列的功能。
基因    蛋白质    组件    存在的结构域
epoA    EpoA      Load    KSymAT ER ACP
epoB    EpoB      1       NRPS,缩聚,异源环化,
                          腺苷酰化,硫酯化,PCP
epoC    EpoC      2       KS mmAT DH KR ACP
epoD    EpoD      3       KS mAT KR ACP
                  4       KS mAT KR ACP
                  5       KS mAT DH ER KR ACP
                  6       KS mmAT DH ER KR ACP
epoE    EpoE      7       KS mmAT KRACP
                  8       KS mmAT MT DHKRACP
epoF    EpoF      9       KS mAT KR DHACP TE
NRPS-非核糖体肽合酶;
KS-酮合成酮;
mAT-丙二酰基特异性酰基转移酶;
mmAT-甲基丙二酰基特异性酰基转移酶;
DH-脱氢酶;ER-烯醇还原酶;
KR-酮还原酶;MT-甲基转移酶。
TE-硫酯酶;-失活的结构域。
本发明的杂合的PKS编码DNA化合物,可以是并且通常是多于两种PKS基因的杂合。甚至当只使用两种基因时,在杂合基因中通常有两种或更多种的组件,其中该组件的部分或者全部是衍生自第二个(或第三个)PKS基因。本发明的重组环氧噻酮衍生物PKS基因的例证性实施例,通过列出来杂合组件的特异性辨明(其它组件与环氧噻酮PKS具有同样的特异性),包括:
(a)组件4具有甲基丙二酰基特异性的AT(mmAT)和KR,而组件2有丙二酰基特异性的AT(mAT)和一个KR。
(b)组件4具有一个mM AT和一个KR,和组件3,具有mM AT和一个KR;
(c)组件4具有一个mM AT和一个KR,和组件5,具有mM AT和ER DH KR;
(d)组件4具有一个mM AT和一个KR,和组件5,具有mM AT和DH KR;
(e)组件4具有一个mM AT和一个KR,和组件5,具有mM AT和一个KR;
(f)组件4具有一个mM AT和一个KR,和组件5,具有mM AT和一个失活KR;
(g)组件4具有一个mM AT和一个KR,和组件6,具有mAT和ER DH KR;
(h)组件4具有一个mM AT和一个KR,和组件6,具有mAT和一个DH KR;
(i)组件4具有一个mM AT和一个KR,和组件6,具有mAT和一个KR;
(j)组件4具有一个mM AT和一个KR,和组件6,具有mAT和一个失活KR;
(k)组件4具有一个mM AT和一个KR,和组件7,具有一个mAT;
(l)(c)到(f)的杂合,除了组件5具有一个mAT;
(m)(g)到(j)的杂合,除了组件6具有一个Mm AT;
(n)(a)到(m)的杂合,除了组件4具有一个mAT
上面的列表仅仅是例证性的,它们不应该被解释为限定本发明,本发明还包括有其它的重组环氧噻酮PKS基因和酶,这些重组的环氧噻酮PKS基因和酶不仅带有不同于上述的杂合组件,还包括带有三个或更多杂合组件。
本领域中的技术人员可以理解,本发明的杂合PKS包括但不限于下述的任何一种PKS;(i)环氧噻酮或者环氧噻酮衍生物PKS,它含有的组件,至少其中一个结构域来自异源组件;(ii)环氧噻酮或者环氧噻酮衍生物PKS,它含有的一个来自异源PKS的组件;(iii)一种环氧噻酮或者环氧噻酮衍生物PKS,它含有的一种来自异源PKS的蛋白质;以及以前述的组合。
尽管本发明的一个重要的实施方案涉及杂合PKS基因,本发明还提供了重组环氧噻酮PKS基因,其中没有第二种PKS基因序列存在,但是因为一个或更多删除而不同于环氧噻酮PKS基因。这种删除可以包括一个或几个组件和或可以限定于一个或几个组件中的部分删除。当删除包括除NRPS组件外的整个组件时,得到的环氧噻酮衍生物比由删除本衍生自的PKS产生的化合物,要短至少两个碳原子。如上面提到的。删除可以包括NRPS组件和或装载结构域。当删除是在一个组件内时,删除通常饮食一个KR,DH,或者ER结构域,或者DH和ER结构域二者,或者所有三个KR,DH,和ER结构域。
环氧噻酮PKS和环氧噻酮修饰酶的结构域和组件的催化特性,也可以通过相关基因的随机或者位点专性突变来改变。本领域公知的许多突变试剂和方法适用于这一目的。这种技术也可以被称为DNA漫游的方法。见美国专利号US5,830,712;5,830,238和5,605,793,各篇参考文献于此处作为参考。
重组操作
为构建本发明的杂合PKS或者环氧噻酮衍生物PKS基因,或者只是表达未修饰的环氧噻酮生物合成基因,人们可以使用下述的方法:见PCT公开号98/27203和1997年12月11日递交的美国专利申请序列号08/989,332,各篇在此处引入作为参考,其中各种不同的PKS基因被分成两个或者多个,常常是三个片段,每一个片段放在分离的表达载体上。用这种方法,全部互补的基因可以更方便地装配起来和用于异源表达的操作,基因的各个片段可以被改变,各个改变了的片段可以组合在单个宿主细胞中,用于提供本发明的重组PKS。这一技术使得可以更方便地构建大的重组PKS基因文库,表达这些基因的载体,和含有这些载体的宿主细胞。在本文的此处和其它的上下文中,编码目的PKS的基因不仅可以存在于两个或者更多个载体上,而且还可以以与基因所来自的天然生产微生物中不同的方式来排序和排列。应用于环氧噻酮PKS的这一技术的不同例子,在下面的实施例中有描述。在一个实施方案中,epoA,epoB,epoC和epoD基因存在于第一个质粒上,而epoE和epoF,以及可以选择地epoK或者epoK和epoL基因存在于第二个(或第三个)质粒上。
因此,在一个重要的实施方案中,本发明的重组核酸组分是表达载体。这里所使用的术语“表达载体”指的是可以被导入宿主细胞中的任何核酸或者无细胞转录和翻译中间体。表达载体可以稳定和暂时保存在细胞中,无论是作为染色体的一部分或者细胞中的其它的DNA形式,或者在细胞中的任何部分中,比如作为细胞质中的复制载体。表达载体还含有基因,用以产生在细胞或细胞抽提物中翻译成多肽的RNA。因此,载体通常含有一个启动子以增强基因表达,但是也可以将相关的编码序列结合在内源启动子的控制之下。而且,表达载体通常含有附加的功能元件,比如作为选择的标记的带有抗性的基因和增强启动子活性的调节基因。
表达载体的各种元件可以有很大的变化,依赖于所要求的对载体的使用。特别是,元件依赖于载体所要使用于和发挥功能的宿主细胞。用于在大肠杆菌中表达和载体保存的载体元件是公知的,可以商业上获得。对于其它通常用的载体元件也是这样,比如酵母细胞和链霉菌细胞。
在一个实施方案中,本发明的载体被用于转化纤维堆囊菌宿主细胞以提供本发明的纤维堆囊菌宿主细胞。美国专利号5,686,295描述了转化纤维堆囊菌宿主细胞的方法,尽管也可以使用其它方法。纤维堆囊菌是一种方便的重组载体,用来表达本发明的环氧噻酮衍生物,其中产生这种衍生物的重组PKS用重组载体表达,载体中,环氧噻酮PKS基因启动子被定位用来驱动重组编码序列的表达。基因启动子被本发明以重组方式提供,并且它自身是重要的实施方案。该启动子包含在转座子序列和epoA基因可读框起始位点间的一段500核苷酸序列中。可以选择地,启动子可以包括这个500bp区域更上游的序列。本领域的技术人员可以认识到,如果产生环氧噻酮的纤维堆囊菌宿主被用作宿主细胞,重组载体需要驱动表达的仅仅是含有改变了的序列的那部分PKS。因此,这一载体可以含有仅仅一个单独的改变了的环氧噻酮PKS基因,而环氧噻酮PKS多肽的其余部分可以由宿主细胞染色体DNA中的基因提供。如果宿主细胞天然产生环氧噻酮,那么环氧噻酮衍生物将以含有天然存在的环氧噻酮的混合物的形式产生。
本领域技术人员也认识到,本发明的重组DNA化合物可用于构建纤维堆囊菌宿主细胞,其中涉及环氧噻酮生物合成的一种或几种基因被失活。因此,本发明提供了这种纤维堆囊菌宿主细胞,它可以是优选的用于表达本发明的环氧噻酮衍生物的宿主细胞,这样就避免出现复杂的环氧噻酮混合物。特别优选地,这一种类型的宿主细胞包括那些细胞,其中的一种或更多种的环氧噻酮PKS基因可读框被破坏,和/或那些其中的任何的或更多的环氧噻酮修饰酶基因被破坏掉。这些宿主细胞通常是用同源重组的方法构建,重组所使用的载体中含有的DNA与要改变和定位的基因片段侧边的区域同源,因此将会出现所需要的同源双交换重组情况。
因此,同源重组可用于删除,破坏,或者改变某个基因。在一个优选的例证性实施方案中,本发明提供了一种重组产环氧噻酮的纤维堆囊粘细菌宿主细胞,其中epoK基因被使用本发明的重组DNA载体,通过同源重组的方法删除或者破坏。这种不能产生epoK环氧化物酶基因产物的宿主细胞,不能制造环氧噻酮A和B,因此是宿主细胞是一种优选的环氧噻酮C和D的来源。
通过使用那些特异的,同源重组可被用于改变PKS组件的特异性,它是通过要求特异性的组件或者结构域,来替换要改变的组件或者结构域的编码序列达到的。在另一个优选的例证性实施方案中,本发明提供了重组的产环氧噻酮的纤维堆囊粘细菌宿主细胞,其中的epoD基因编码的组件4AT结构域的编码序列,被使用编码只结合甲基丙二酰基辅酶A的AT结构域的本发明重组DNA载体,通过用同源重组加以改变。这种不能制造环氧噻酮A,C,和E的宿主细胞是一种优选的环氧噻酮B,D和F的来源。本发明还提供了重组的纤维堆囊菌宿主细胞,其中进行了环氧噻酮生物合成酶基因的改变和删除。例如,本发明提供了重组的纤维堆囊菌宿主细胞,其中作了前述的改变和删除中,获得只产生环氧噻酮D的宿主细胞。
同样地,本领域技术人员可以理解,本发明提供了许多重组的纤维堆囊菌宿主细胞,它们比野生型的环氧噻酮细胞制造比较少种类的只产生环氧噻酮混合物,以及那些制造一种或者几种环氧噻酮衍生物的细胞。这些宿主细胞包括只制备环氧噻酮A,C和E的那些细胞;只制备环氧噻酮B,D和F的细胞;只制备环氧噻酮D的细胞和只制备环氧噻酮C的细胞。
在另一个优选的实施方案中,本发明提供了表达载体和重组的粘球菌,优选是黄色粘球菌宿主细胞,该细胞含有表达重组环氧噻酮PKS或者环氧噻酮衍生物PKS的那些表达载体。现在,黄色粘球菌中,染色体外复制的载体还未知。然而,已知有大量的已知噬菌体整合进黄色粘球菌的染色体DNA中,包括Mx8,Mx9,Mx81和Mx82。这些噬菌体的整合和附加功能可以被置于质粒上,以制备可整合进黄色粘球菌染色体DNA的噬菌体的表达载体。当然,噬菌体Mx9和Mx8被优选用于发明的目的。质粒pPLH343,如Salmi等所述,1988年2月,Genetic determinants of immunity and integration of temperate黄色粘球菌phage MX8(温和黄色粘球菌噬菌体MX8的免疫遗传决定子和整合),J.Bact(细用菌学杂志).180(3):614-621,是一种可在大肠杆菌中复制的质粒,它含有编码附着和整合功能的噬菌体Mx8基因。
环氧噻酮PKS基因的启动子可以在黄色粘球菌宿主细胞中起作用。因此,在一个实施方案中,本发明提供了衍生自纤维堆囊粘细菌环氧噻酮PKS基因启动子的,可用于重组宿主细胞中的重组启动子。该启动子可用于在宿主细胞中表达一种或几种环氧噻酮PKS基因,或者其它的有用的基因产物。本发明还提供了环氧噻酮PKS表达载体,其中的一种或几种环氧噻酮PKS或者环氧噻酮修饰酶基因在它们自身启动子的控制下。另一个优选的在黄色粘球菌宿主细胞中表达本发明重组PKS的启动子,是黄色粘球菌的pilA基因的启动子。这个启动子,以及两个高水平表达由pilA启动子控制的基因表达产物的黄色粘球菌菌株,一个删除pilA的菌株和一个删除pilS的菌株,如WU和Kaiser所述,1997年12月,Regulation of expression of the pilA gene in myxococcus xanthus(黄色粘球菌中pilA基因表达的调控),J.Bact(细菌学杂志),179(24):7748-7758,此处引入作为参考。另外,本发明提供了含有删除pilA和pilS二者的重组MyXoCoccus宿主细胞。另一个优选的启动子是饥饿依赖性的sdcK基因启动子。
用于黄色粘球菌的选择性标记包括带有卡那霉素,四环素,氯霉素,zeocin,壮观霉素,和链霉素抗性的基因。本发明的用于粘球菌的重组DNA表达载体通常包含有这些选择性标记,还可以包含衍生自环氧噻酮PKS或者环氧噻酮修饰酶基因的启动子。
本发明提供了用于制备重组黄色粘球菌表达载体和本发明的宿主细胞的优选的表达载体。这些载体,被命名为质粒pKOS35-82.1和pKOS35-82.2(图3),能够在大肠杆菌宿主细胞中复制,以及整合进黄色粘球菌的染色体DNA中。这些载体含有Mx8附着和整合基因,以及pilA启动子,其下游排列有方便使用的限制酶识别位点。两种载体相互间的区别仅在于载体上pilA启动子的方向,并且可以方便地修饰去含有环氧噻酮PKS和本发明的修饰酶基因。载体的构建如实施例3所详述。
本发明特别优选的粘球菌宿主细胞是那些细菌,它产生的环氧噻酮或者环氧噻酮衍生物,或者环氧噻酮或环氧噻酮混合物的量等于或者大于20mg/L,优选等于或大于200mg/L,更优选等于或大于1g/l。特别优选的是产生这种水平产物的黄色粘球菌宿主细胞。可用于本发明的黄色粘球菌(M.xanthus)宿主细胞包括DZ1(Campos等,1978,J.Mol.Biol 119:167-178[分子微生物学杂志],此处引入作为参考),产TA的细胞系ATCC 31046,DK1219(Hodgkin和Kaser,1979,Mol.Gen.Genet[分子基因遗传学],171:177-191此处引入作为参考),和DK1622细胞系(Kaiser,1979.Proc.Natl.Acad.Sci.USA 76:5952-5956,此处引入作为参考)。
在另一个优选的实施方案中,本发明提供了表达载体,和含有那些表达载体并表达本发明的重组PKS的重组荧光假单胞菌(Pseudomonas fluorescens)宿主细胞。用于构建荧光假单胞菌(P.fluorescens)表达载体和本发明的宿主细胞的一个质粒是pRSF1010质粒,它能够在大肠杆菌和荧光假单胞菌宿主细胞中复制(见Scholz等人,1989,Gene 75:271-8,此处引入作为参考)。也可以使用低拷贝的复制子和载体。如上面所提到的,本发明还提供了重组形式的纤维堆囊菌环氧噻酮PKS和环氧噻酮修饰酶基因的启动子。启动子可用于在荧光假单胞菌宿主细胞中表达环氧噻酮PKS基因或其它的基因。同时,SoraphenPKS基因的启动子可用在任何纤维堆囊菌启动子能起作用的宿主细胞中。因此,在一个实施方案中,本发明提供了一种用在荧光假单胞菌宿主细胞中的环氧噻酮PKS表达载体。
在另一个优选的实施方案中,本发明的表达载体被用于构建表达本发明的重组PKS的重组链霉菌细胞。用于本发明的链霉宿主细胞包括天蓝色链霉菌,浅青紫链霉菌,委内瑞拉链霉菌,生二素链霉菌,弗氏链霉菌等等(S.coelicolor,S.lividans S,venezuelae,S.ambofaciens,S.fradiae and the like)。本发明的优选的链霉菌宿主细胞/载体组合包括不产生放线菌紫素的,天蓝色链霉菌(Scoelicolor)CH999和浅青紫链霉菌(S.lividans)K4-114以及浅青紫链霉菌(S.lividans)K4-155宿主细胞,和衍生自pRM1和pRM5载体的表达载体,如下所述:美国专利号5,830,750和美国专利申请序列号08/828,898,1997年3月递交,和09/181,833,1998年10月28日递交的申请。本发明特别优选的链霉菌宿主细胞是那些细胞,它们产生的环氧噻酮或者环氧噻酮衍生物或者环氧噻酮和环氧噻酮衍生物的混合物的水平等于或者大于20mg/L,更优选等于或者大于200mg/L,最优选大于或者等于1g/L。特别优选的是在这个水平的天蓝色链霉菌和浅青紫链霉菌宿主细胞。同时,紧密相关的糖多孢菌属,包括但不限于红色糖多孢菌(S.erythraea)可用于产生环氧噻酮。
本发明提供了许多种用于链霉菌的表达载体。复制载体的复制起点,可以是,例如但不限于,低拷贝数复制子和含有相同的,比如SCP 2*(见Hopwood等人,Genetic Manipulation of Streptomyces:A Laboratory Manual(链菌霉遗传操做实验手册)(The John Innes Foundation,Norwich,UK.,1985);Lydiate等,1985,GENE 35:223-235和Kieser和Melton,1988,Genes:65:83-91,各篇此处引入作为参考),SLP1.2(Thompson等人,1982,Gene 20:51-62,此处引入作为参考),和pSG5(ts)(Muth 1989,Mol GEN GENENT[分子基因和遗传学]219:341-348,和Bierman等人,Gene 116:43-49,各篇此处引入作为参考),或者一些高拷贝数的复制子和含有它的载体,例如plJ101和pJV1(见KATZ等,1983,J Gen.Microbiol.[微生物遗传杂志]129:2703-2714;Vara等人,1989 J.Bacteriol,171:5782-5781;和Servin-Gonzalez,1993,Plasmid 30:131-140,各篇在此引入作为参考)。然而,高拷贝数载体通常不是优选的用于表达大的基因或者多基因的载体。对于非复制和整合载体来说,以及通常对于任何载体来说,有用的是包括至少一个大肠杆菌复制起点,比如,来自pUC,p1P,p1I和pBR的那些,对于基于噬菌体的载体来说,噬菌体phiC31和它的衍生物KC515可以使用(见Hopwood等,同上)。质粒pSET152,质粒pSAM,质粒pSE101和质粒Pse211可以使用,所有它们都能够位点专一性地整合到的染色体DNA上。
通常,表达载体会有一个或多个标记基因,含有载体的宿主细胞可以通过它来鉴定和或筛选。用于链霉菌宿主细胞的有用的带有抗生素抗性的基因包括ermE(带有红霉素和林可霉素抗性),tsr(带有硫链丝菌肽抗性),aad A(带有壮观霉素和链霉素抗性),aac C4(带有阿泊拉霉素,卡那霉素,庆大霉素,遗传霉素(G418),和新霉素抗性),hyg(带有潮霉素抗性),和vph(带有紫霉素抗性)抗性的基因。
载体上的重组PKS基因,会在启动子的控制下,通常带有一个伴随的核糖体结合位点序列。一个优选的启动子actI启动子和它伴随的激活子基因actII-ORF4,它在pRM1和pRM5如上表达载体中提供。这个启动子在次级代谢物正常合成时的稳定期被激活。其它有用的链霉菌启动子包括但不限于来自ermE和melCI基因的那些启动子,它组成型地起作用,以及tipA基因和merA基因,它可在任何生长期被诱导。另外,T7RNA聚合酶系统已被转入链霉菌中,并可用于本发明的载体和宿主细胞中。在这一个系统中,T7RNA聚合酶的编码序列被插入到染色体中性位点,或在载体中置于诱导性merA启动子的控制下,目的基因置于T7启动子的控制下。如上面所提到的,一种或多种激动子基因可用于增强启动子的活性。除了上面所讨论的actII-ORF4基因外,激活子基因还包括,dnrI基因,red D,和ptpA基因(见美国专利申请序列系列号09/181,833,见上),它们可用于和同类的启动子一起来表达本发明的重组基因。
本发明还提供了在植物细胞中表达产生环氧噻酮和环氧噻酮衍生物的环氧噻酮PKS和PKS酶的重组表达载体。这些载体根据1998年月10日提交的美国专利申请序列号09/114,083和PCT专利公开号99/02669构建的,各篇文献此引入作为参考。表达环氧噻酮的植物和植物细胞具有对疾病的抗性,能够抵抗真菌感染。为了提高环氧噻酮或者环氧噻酮衍生物在任何异源宿主细胞,包括植物,粘球菌,假单胞菌,和链霉菌宿主细胞中的产量,可以转化细胞使之表达异源的磷酸泛酰巯基亚胺基转移酶。见1996年10月11日提交的美国专利申请序列号08/728,742,和PCT专利公开号97/13845,两者在此引入作为参考。除了提供编码环氧噻酮或者环氧噻酮衍生物PKS的重组表达载体外,如上面所讨论的本发明还提供了编码环氧噻酮修饰酶基因的DNA化合物。如上面所讨论的,这些基因产物将环氧噻酮C和D转变为环氧噻酮A和B,将环氧噻酮A和B转变为环氧噻酮E和F。本发明还提供了重组表达载体和用这些表达载体转化的宿主细胞,这些载体表达那些基因中的一种或几种,从而产生相应的环氧噻酮和或者环氧噻酮衍生物。在一部分中,本发明提供了重组形式的epoK基因和表达它的基因产物的宿主细胞,它分别将环氧噻酮C和D转变为环氧噻酮A和B。
在另一个重要的实施方案中,以及如下面所提到的,本发明提供的载体可用于破坏epoL,epoK和纤维堆囊菌细胞中与环氧噻酮PKS基因簇有关的可读框的任意一种或几种重组纤维堆囊菌。本发明还提供了缺少(或者含有失活形式的)这些基因的一种或几种的。这些细胞可用于产生由于这些基因的一种或几种的缺失所导致的相应的环氧噻酮和环氧噻酮衍生物。
本发明还提供了含有重组的环氧噻酮PKS或者环氧噻酮衍生物PKS,但是不含有(或者含有无功能形式的)任何环氧噻酮修饰酶基因的非纤维堆囊菌宿主细胞。本发明的这些宿主细胞希望在缺少能形成环氧噻酮C和D的C-12-C-13烯烃的脱氢酶活性的情况下,产生环氧噻酮G和H。这种脱氢反应相信是在链霉菌宿主细胞epoL基因产物存在的情况下发生的。当脱氢酶活性存在而P450环氧化酶和羟化酶(它将环氧噻酮A和B分别转化成环氧噻酮E和F)基因存在时,宿主细胞能产生环氧噻酮C和D(或者对应的环氧噻酮C和D的衍在物)。当羟化酶基因缺乏时,宿生细胞也产生环氧噻酮A和B(或者对应的环氧噻酮A和B的衍生物)。在这些宿主细胞中优先表达的是本发明的重组环氧噻酮PKS酶,它的组件4含有只对甲基丙二酰基辅酶A具有专一性的AT,选择性也与一种或几种附加的杂合组件组合。在这些宿主细胞中同样优选表达的是本发明的重组环氧噻酮PKS酶,它的组件4含有只对丙二酰基辅酶A具有专一性的AT,选择性也与一种或几种附加的杂合组件组合。
本发明的重组宿主细胞还包含有增加目的环氧噻酮或者环氧噻酮衍生物表达的其它基因和相关的基因产物。作为一个非限制性的实施例,环氧噻酮PKS蛋白要求装载结构域的ACP结构域,组件2到组件6,以及NRPS的PCP结构域的磷酸泛酰硫基乙胺基化。磷酸泛酰硫基乙胺基化是由称为磷酸泛酰硫基乙胺基转移酶(PPTase)的酶介导的。为在并不天然表达能用于目的PKS酶的PPTase的宿主细胞中产生有功能的PKS酶,或者提高宿主细胞中PPTase作为限速因素有功能的PKS酶的含量,可以导入异源PPTase包括但不限于Sfp,如PCT专利公开号97/13845和98/27203,和1996年10月11日递交的美国专利申请序列号08/728,742的申请中所描述的,各篇文献在此引入作为参考。
本发明的宿主细胞可在本领域已知的条件下发酵生长,以生产本发明的化合物。本发明化合物可以从培养细胞的发酵液中分离,并用标准的方法纯化。从纤维堆囊菌宿主细胞产生本发明的化合物发酵条件可以基于PCT专利公开号93/10121,97/19086,与99/42602中所描述的方法,各篇文献此处引入作为参考。本发明的新的环氧噻酮同系物,以及本发明的宿主细胞发酵所产生的环氧噻酮,以及可以衍生和形成的化合物可以如下所述:PCT专利公开号93/10121,97/19086,98/08849,98/22461,98/25929,99/01124,99/02514,99/07692,99/27890,99/39694,99/40047,99/42602,99/43653,99/43320,99/54319和99/54330,以及美国专利号5,969,145,在此处引入作为参考。
发明化合物
本发明的优选的化合物包括14-甲基环氧噻酮衍生物(应用本发明的具结合甲基丙二酰基辅酶A而非丙二酰基辅酶A的AT的杂合组件3而制备);8,9-脱氢环氧噻酮衍生物(应用本发明的具DH和KR而非ER,DH,和KR的杂合组件6而制备);10-甲基环氧噻酮衍生物(应用本发明的具结合甲基丙二酰基辅酶A而非丙二酰基辅酶A的AT的杂合组件5而制备);9-羟基环氧噻酮衍生物(应用本发明的具KR,而非ER,DH,和KR的杂合组件6而制备);8-去甲基-14-甲基环氧噻酮衍生物(应用本发明的具结合甲基丙二酰基辅酶A而非乙酰基辅酶A的AT的杂合组件3,以及具结合丙二酰基辅酶A而非甲基丙二酰基辅酶A的AT的杂合组件6而制备);8-去甲基-8,9-脱羟环氧噻酮衍生物(应用本发明的具KR和DH,而非ER,DH,和KR的杂合组件6,以及一个对丙二酰基辅酶A而非甲基丙二酰基辅酶A具有特异性的AT而制备)。
更通常地,本发明的优选的环氧噻酮衍生物是那些通过本文所述的改变环氧噻酮PKS基因,和选择性地改变环氧噻酮修饰酶活性,和/或对这些基因表达所获得的环氧噻酮进行化学修饰而得到的,因此,本发明提供的化合物的化学式为:
Figure C9981567800501
通式1
包括它们的糖基化形式和立体异构体形式,其中立体化学结构未示出。
通式中A基团为任意地含有1-3个选自O,S,和N的杂原子的,取代或者未取代的直链,支链或者环烷基,烯基(alkenyl),或者炔基;或者其中A基团为取代或者未取代的芳基;
R2代表H,H,或者H,低级链烃基,或者低级链烃基,低级链烃基,低级链烃基;
X5代表氧基=O或者它的衍生物,或者H,OH,或者H,NR2(胺),其中R为H,烷基或者酰基,H,OCOR,或H,OCONR2,其中R是H,或者是烃基,或者是H,H;
R6代表H或者低级链烃基,相应的碳留下的取代基团为H;
X7代表OR,NR2,其中的R为H,或烷基,或烃基或者酰基,或者为OCOR,或者OCONR2,其中的R为氢或者烃基或者由X7和X9形成碳酸盐或者氨甲酸盐环,其中相应的碳上留下的取代基团为H;
R8代表H或者低级链烃,相应的碳上留下的取代基团为H;
X9代表氧基=O或者它的衍生物,或者H,OR,或者H,NR2,其中R为H,或烷基或者酰基,或者H,OCOR,或者OCONR2,其中R是H,或者是烃基,或者代表H,H或其中由X9和X7或者X11可以形成环状碳酸盐或者氨甲酸盐;
R10是H,H,或者H,低级链烃基,或者低级链烃基,低级链烃基;
X11是氧基=O或者它的衍生物,或者H,OR,或者H,NR2,其中R为H,或烷基或者酰基,或者氢(H),OCOR或者H,OCONR2,其中R是氢或者是烃基,或者是氢,氢;或者其中由X11和X9结合可以形成环状碳酸盐或者氨甲酸盐;
R12是氢,氢,或者H,低链烃基,或者低链烃基,低链烃基;
X13是氧基=O或者它的衍生物,或者H,OR,或者H,NR2,其中R为H,烷基或者酰基,或者是H,OCOR或者H,OCONR2,其中R是H或者是烃基;
R14是H,H,或者H,低级链烃基,或者低级链烃基,低级链烃基;
R16是H或者低级链烃基;以及
其中可选择的是,H或者另外一个取代基团可以随意地从12和13和/或8和9去除掉以形成双键,其中该双键可以任意地转换为环氧化物。
特别优选的化合物的通式是:
Figure C9981567800511
Figure C9981567800521
此处提到的取代基如上面所定义。
更特别优选的化合物的通式是:
Figure C9981567800522
这里的Z是氧,或者一个Z是氮,而另外一个Z是氧,其余的基团如上面所定义。
这里所说的,“含有芳族部分的取代基”,包括至少一个芳香环,比如苯基,吡啶基,嘧啶基,苯硫酚基,噻唑基。取代基还可能包括,融合的芳基残基,比如,萘基,吲哚基,苯噻唑基等。芳香基部分还可以是融合到非芳香环上和或者通过一个非芳香族的,例如烯烃残基与化合物的余下的取代基融合。芳香基部分可以被取代,或者可以是取代基的余下部分而不被取代。
A优选的实施方案包括图2所示的基团。
这里所用的术语烷基指的是,从碳氢部分移去一个原子所得到的C1-C8饱和的,直链或支链碳氢基团。烯基和炔基指的是相应的不饱和形式。烷基的例子包括但不限于甲基,乙基,丙基,异丙基,正丁基,叔丁基,新戊基,异已基,正庆基,正辛基。低链烷基或烯基,炔基指的是1-4碳基团。优选的是甲基。酰基指的是烷基羰基(CO),烯基羰基,或者炔基羰基。
术语卤或者卤素这里指的是选自氟,氯,溴和碘的原子。术语卤烷基这里指的是其中一个,两个或三个卤素原子连接到任一个碳上的烷基基因,包括但不限于氯甲基,溴乙基,三氟甲基等。
术语杂环芳基指的是,其中具有五到十个环上原子中的一个环选自硫,氧和氮的环状芳族基团;零个,一个,或者两个环上的原子为另外杂原子,它独立地,选自硫,氧和氮;剩余的环上原子是碳,该基团通过任意的环上的原子连接到分子的剩余部分上,例如,吡啶基,吡嗪基,嘧啶基,吡咯基,吡唑基,咪唑基,噻唑基,噁唑基,异噁唑基,噻二唑基,噁二唑基,苯硫基,呋喃基,喹啉基,异喹啉基等等。
术语杂环包括但不限于吡咯烷基,吡唑啉基,吡唑烷基,咪唑基,嘧咪唑烷基,哌啶基,哌嗪基,噁唑烷基,异噁唑烷基,吗啉基,噻唑烷基,异噻唑烷基和四氢叶酸。
术语被取代在这里指的是一个基团,通过它上面的任意氢原子的替换而被取代,替换的基团可以是例如,氯,溴,氟,碘,羟基,CN,烷基,烷氧基,用芳基取代的烷氧基,卤烷基,硫代烷基,氨基,烷基氨基,二烷基氨基,巯基,氮基,羧代醛基,羧基,烷氧基羰基,或者羧基酰胺基。任一取代基因可以是芳基,杂环芳基,或者杂环芳基。
显而易见,通式(1)中位置2,3,6,8,10,12,14和16的取代的性质至少最初是分别由组件9,8,7,6,5,4,3和2的AT催化结构域的特异性决定的。因为AT结构域可以是接受丙二酰基辅酶A,甲基丙二酰是辅酶A,乙基丙二酰基辅酶A(以及通常地,低级链烷基丙二酰基辅酶A),及羟基丙二酰基辅酶A,所以这个位置的任何一个取代基可以是氢,另一个也可以是氢,低级链烷基,特别是甲基和乙基,或者羟基。这个位置上的进一步的反应,例如环氧噻酮PKS组件8所催化的甲基转移酶活性,也可用于替换这个位置的氢。再者,氢和羟基可以通过被氧化成能够氧基(=O),或与邻近的环上碳脱氢形成π-健。如下面所讨论的,羟基(OH)和氧基都可以被衍生出来。
因此,可以合成各种基因R2,R6,R8,R10,R12,R14和R16。通式(1)中定义的取代基团有关的限定,反应了下面实施例8中SAR描述中所述的信息。
同样地,可以通过修饰环氧噻酮PKS基因簇,使之包含合适的序列,在相应的环氧噻酮基因簇的位置上含有或不含有活性KR,DH和/或ER结构域,从而方便地控制β-碳修饰(或者无修饰)。因此,可以合成得到大量的x5,x7,x9,x11和X13基因,包括相邻的环的位置上π-健的形成。
羟基占据的位置可以通过本领域中已知的方法转变为醚或者酯;也要求保护各位上的羟基不被衍生。再者,羟基可以转变为一个单独的基团,比如甲苯磺酰酯以及被氨基和卤取代基替换。如上面所讨论的,本领域已知有大量的“羟基衍生物”。
同样地,含有氧基团的环上的位置可以转变为“羰基衍生物”比如肟,聚酮等。氧部分最初的反应产物可进一步反应得到复杂的衍生物。如实施例8所述的,这种衍生物最终可产生连接两个环位置的环状取代基。
用于修饰最初合成的聚酮化合物的酶,例如转甲基酶,脱氢酶,氧化酶,糖基化酶等。当聚酮化合物在细胞内合成时,可以通过修饰宿主使之含有产生这些修饰酶的重组材料,从而由宿主细胞内源供应,或者以纯化的或者相对粗的提取物的形式,由无细胞体系提供。因此,例如,12-13位π-健的环氧化可以直接在体外使用epoK基因的蛋白产物来完成。
A的性质,可以如后面的实施例6所述,通过使用一种其中含有失活的组件1NRPS(使用组件2底物)或KS2敲除(使用组件3底物)的环氧噻酮PKS,更方便地加以控制。可以通过改变装载组件的AT催化特异性来获得一定的改变;更多改变可以通过用不同特异性的NRPS或者用通常的PKS组件来替换组件1的NRPS来实现。然而目前,如实施例6所述,通过给合适改变的环氧噻酮PKS提供合成的组件2底物前体和组件3底物前体,可以更方便地制备可变异体。
药物组合物
可以方便地配制化含物以提供本发明的药物组合物。本发明的药物组合物可以以例如,固体,半固体,或者液体形式的药物制剂的形式来使用。制剂含有一种或多种本发明的化合物作为活性成分,可适于外用,肠道内,或者胃肠外,给药的有机或无机填料或其成形剂成为混合物。活性成分可以与可使用的,无毒的,制药学上可接受的填料组成片剂,丸剂,胶囊剂,栓剂,阻道栓,溶液,乳剂,悬浮剂,以及其它的,任合一种适于使用的剂型。
可以使用的填料包括水,葡萄糖,乳糖,阿拉伯胶,明胶,甘露醇,淀粉糊,三硅酸镁,滑石粉,玉米淀粉,角蛋白,胶体硅,马铃薯淀粉,尿素,以及其它的固体,半固体,或液体形式的适用于药物制剂的填料。例如,本发明的化合物可以与羟丙基甲基纤维素一起使用,如美国专利号4,916,138所述,此处引入作为参考,或者与表面活性剂一起使用,如EPO专利公开号428,169所述,此处引入作为参考。
口服给药形式制剂的制备,可以如Hondo等所描述的制备,Hondo等,1987,Transplantion Proceedings(移植学报),XLX,supp 6:17-22此处引入作为参考。肠外给药的制剂的制备见EPO专利公开号423,714,此处引入作为参考。药物组合物中有足够量的活性化合物以产生所要的对疾病过程或症状的作用。
对于治疗由于感染,免疫系统障碍(或抑制免疫功能),癌症等疾病,本发明的化合物可以口服,外用,经肠道外给药,吸入以及直肠给药,其药物剂量的配方中含有常规的无毒的可接受的药物载体,辅助剂和赋形剂。本文术语“经肠道外”给药包括皮下注射,静脉,鞘内,肌肉内,胸骨内注射或者注入技术。
本发明的化合物的剂量水平按医嘱为大约每千克体重每天0.01mg到大约100mg,优选每千克体重每天0.1mg到大约50mg。这一剂量水平是用于治序上面所述症状的(假设一个70kg的病人,每个病人每天给药从大约0.7mg到大约3.5mg)。再者,本发明的化合物可以间隔给药,即,半周,每周,半月,或者每月间隔来给药。
制备单一剂量的活性成分与载体物质的组合量,根据要治序的宿主和特定的给药方式而变化。例如,用于人的口服给药的配方可以含有0.5mg到5mg的活性成份,与合适的传统量的载体物质组合,活性成分占总组分的量从大约5%到大约95%。剂量单位形式通常含有大约0.5mg到大约500mg的活性成分。对于外用药来说,本发明的化合物的配制在例如0.00001%到60%的重量范围内,优选地从0.001%到10%的重量范围内,最优选为大约0.005%到0.8%的重量范围。
然而,可以理解,任何特定病人的特定剂量水平依赖于各种因素。这些因素包括使用的化合物的活性;年龄,体重,总体健康状况,性别,和饮食;给药的时间和途径和药物排泄的速率;是否药物的组合被用于治疗;和所要治疗的特定疾病和症状的严重性。
以上提供了发明详述,下面给出了用于例证本发明的实施例,这些实施例不能认为是对本发明和权利要求的范围的限定。
实施例1
粘粒克隆和它们的亚克隆的DNA测序
将产环氧噻酮的纤维堆囊粘细菌SMP44菌株培养在含纤维素的培养基上,见Bollng等人,1995 Cancer Reseorch(癌症研究)55:232-2333,此外引入作为参考,通过培养基上清的液相色谱一质谱(LC/MS)分析来证明环氧噻酮的产生。参考Jaoue等人,1992,plasmi(质粒)28:157-165所述的方法从这个菌株制备总DNA。为制备质粒文库,用Sau3AI部分酶切纤维堆囊粘菌基因组DNA,并与BamHI消化的pSupercos(Stratagen公司)连接。根据制造商的建议在λ噬菌体中包装DNA,然后用混合物感染大肠种菌XL1-Blue MR细胞。这一过程在LB-氨苄青霉素平板上,收获了大约3,000个分离的克隆。因为纤维堆囊粘菌基因组的大小估计为大约107核苷酸,现在3000个克隆中的插入片段对应于大约10个纤维堆囊粘菌基因组。
为了对文库进行筛选,两个KS结构域片段被用于设计PCR引物,而以纤维堆囊菌基因组DNA作为模板。得到的片段被用作筛选文库的探针。之所以选择这种方法是因为发现,从检测的超过12个PKS基因中,在检测的所有PKS结构域中K5结构域是最保守的(在氨基酸水平)。因此,希望得到的探针不仅探测环氧噻酮PKS基因,而且也探测存在于文库中的其它PKS基因簇。使用来自DEBS和Soraphen PKS基因序列酮合成酶(KS)结构域内的保守区而合成的两个简并寡核苷酸(使用简并核苷酸的标准命名法):CTSGTSKCSSTBCACCTSGCSTGC和TGAYRTGSGCGTTSGTSCCGSWGA。在使用该寡聚核苷酸作为引物和纤维堆纤维堆囊菌SMP44基因组DNA作为模板进行PCR后,在琼脂糖凝胶上可看到相应于预测大小的一个750bp的带。从胶上取下片段,克隆到pUC118的HincII位点(它是个pUC18的衍生物,带有制备单链DNA的插入序列)。在转化大肠杆菌后,分离和测序来自10个独立克隆的质粒DNA。分析显示9个单独的序列,每个都相应于PKS基因的KS结构的一个共同片段。九个中的三个与先前从这种生物分离的聚酮合成酶基因簇一样,从组件分析断定它们不属于环氧噻酮基因簇。剩下的6个KS片段被从载体上切下来,收集,末端用32P标记,并用作杂交探针,在高度严谨条件下与含有粘粒文库的克隆杂交。
筛选鉴定出15个能与收集的KS探针杂交的粘粒。从每个粘粒制备DNA,用NotI消化,在琼脂糖凝胶上分离,转移到硝酸纤维素膜上用收集的KS片段作为探针进行Southern杂交。结果显示,有两个粘粒不含有可与KS杂交的插入,有13个粘粒留待进一步分析。清除杂交印迹上的探针,用含有来自DEBS基因族组件4的烯醇还原酶相关的序列的探针,在低度严谨条件下进行杂交。因为预期环氧噻酮PKS基因簇编码两个有含ER结构域的两个连续的组件,并且因为不是所有的PKS基因簇都具有带ER结构域的组件,用ER探针进行杂交,预期可以鉴定出含有环氧噻酮PKS基因簇的插入DNA粘粒。两个粘粒被发现能与ER探针强烈杂交,一个中度杂交,一个微弱杂交。NotI片段限制性图谱的分析显示,这两个ER探针强烈杂交的粘粒相互重叠。使用T7和T3引物结合位点得到了13个粘粒中的每一个的核苷酸序列。所有得到的序列都显示出与PKS基因的同源性,来自可与ER探针强烈杂交的粘粒的序列显示出与NRP5,以特别是与NRPS腺苷化结构的同源性。因为据推断环氧噻酮的噻唑部分可能衍生自乙酸和半胱氨酸分子酰胺键的形成(以及随后的环化步骤),在同时含有ER结构域的NRPS结构域的存在支持了该粘粒可能含有整个或部分PKS基因簇的预测。
对12个余下的粘粒进行限制性分析显示,其中的三个可能是相互重叠的目的粘粒。为证明这一点,对四个粘粒的每一个的末端合成了寡核苷酸(通过上面所述的末端测序来确定的),并用作四个粘粒DNA中的若个PCR的引物组。非邻接的引物一模板反应中条带的出现,显示了这种重叠。这一实验结果证明两个粘粒与含有NRPS的粘粒重叠。三个粘粒的限制性图谱显示这三个粘粒实际上是重叠的。而且,因为PKS序列延伸到最后一个重叠片段的插入的末端,基于NRPS作图位于基因族的5’端的推断,结果也显示基因簇的3’端在已鉴定的克隆中没有被分离出来。
为分离环氧噻酮生物合成基因其余的片段,从含有推断的基因簇最靠近3’端区域的粘粒得到一个PCR片段。这个片段被用作探针检测,也是大约3000个克隆的新制备的纤维堆囊菌基因组DNA的粘粒文库。鉴定了几个杂交克隆,从它们中的六个制备了DNA。NotI消化片段的分析显示它们都含有重叠的区域。含有最大插入DNA并含有最短重叠的粘粒,被用来制备探针以作进一步的筛选分析。
制作的四个粘粒的限制性图谱,如图1所示。粘粒pKOS35-70.8A3的末端得到的序列与PKS序列或者任何相关的修饰酶,都显示无同源性。同样,来自粘粒pKOS35-79.85一个末端的序列也不含有与PKS区有关的序列。这些发现支持了环氧噻酮基因簇保存于由四个粘粒插入所组成的~70kb的区域内这一报告。
为对粘粒中的插入片段测序,从四个粘粒而来的每个NotI限制性片段都被克隆入可商业获得的pBluesoript质粒的NotI位点。最开始对每个克隆的末端进行测序。在获得完整的序列之前,序列分析的结果预测得到,这个PKS基因簇中有10个组件,一个装载结构域加上9个组件。
得到的完整的PKS序列如下。分离13个非重叠NotI片段中的每一个,并且HinPI进行部分消化。从琼脂糖凝胶回收~2到4kb长度的片段,并克隆到pUC118的AccI位点。从片段的文库中测序足够的克隆,以提供对每个片段至少四倍的覆盖。为测过NotI酶切位点,设计一套寡核苷酸,一个在位点的5’侧,另一个在3′侧,它们被用作引物,PCR扩增含有若个NotI位点的片段。用这种方法得到的每个片段被克隆和测序。
测得的核苷酸序列对应于一个约72kb的线性片段。分析显示它是一个带有一个装载结构域和9个组件的PKS基因簇。PKS序列的下游是一个可读框,被命名为epoK,它与细胞色素P450氧化酶基因显示出强的同源性,编码环氧噻酮过氧化酶。epoK下游的15kb的核苷酸序列也被测定:鉴定出一些另外的可读框,但是没有鉴定出一个与任何脱氧酶显示出同源性的可读框。epoL基因可能编码脱氧酶活性,但是这一活性也可能存在于环氧噻酮PKS的内部,或者被另外的一个基因所编码。
PKS基因被组织在6个可读框中。在多肽水平上,装载结构域和组件1,2和9显示为单独的多肽,它们的相应的基因被分别命名为epoA,epoB,epoC和epoF,组件3,4,5和6被包合在一条多肽中,它的基因被命名为epoD,而组件7和8在另一条多肽上,它的基因被命名为epoE。很清楚从可读框的间隔间可知,epoC,epoD,epoE和epoF构成了一个操纵子。epoA,epoB,和epoK基因可能是一个大的操纵子的一部分,但是具有一个启动子的epoB和epoC间有约100bp的间隔,epoF和epoK有大约115bp的间隔。本发明还提供了重组形式的基因间的序列。至少一个,但是有可能多于一个的启动子被用于表达所有的环氧噻酮基因。环氧噻酮PKS基因簇图示如下。
Figure C9981567800581
对于这些组件的详细的检测表明,它们的组织和组成与能用于环氧噻酮的生物合成是一致的。下面的描述是在多肽水平进行的。装载结构域和组件3,4,5和9中的AT结构域的序列显示出与丙二酰基装载结构域共有序列的相似性,这分别与C-14,C-12(环氧噻酮A和C),C-10和C-2上氢链,以及装载结构域的存在一致。组件2,6,7和8上AT结构域与甲基丙二酰基特异性的AT结构域的共有序列相似,又分别与C-16,C-8,C-6和C-4上甲基侧链的存在一致。
装载结构域含有一个KS结构域,其中通常是半胱氨酸残基存在的活性位点被酪氨酸所替代。这个结构域被称为KSY,并作为脱羧酶起作用,这是它的正常功能的一部分,但是不能作为缩聚酶起作用。因此,装载结构域可以期待装载丙二酰基辅A,移动它到ACP上,对它进行脱羧,以生成用于半胱氨酸缩聚的乙酰残基。
组件1,是一个非核糖体肽合成酶,它活化和催化与装载结构域上乙酸的缩聚反应。这个序列含有与ATP结合位点高度相似的片段和氨基酸活化所需的ATP酶结构域,一个磷酸泛酰巯基亚胺位点和一个延伸结构域。在数据库搜索中,组件1显示出与大量的以前鉴定出的肽合成酶有高度的相似性。
组件2决定了环氧噻酮C-15,C-17的结构。组件2DH结构域的存在使分子中得到C16-17脱氢部分。组件3的结构域与环氧噻酮C-14和C-15的结构是一致的;羟基来源于组件乳糖化过程中所使用的KR活性。
组件4控制了C-12和C-13的结构,此处在环氧噻酮C和D中存在双键,这与DH结构域的存在是一致的,尽管AT结构域的序列显示出与特异性装载丙二酸盐的那些结构域一致,它也可以装载甲基丙二酸盐,因此是造成天然存在生物体发酵液中存在环氧噻酮混合物的部分原因。
一个与所期待功能明显的偏离存在于组件中。这个组件被期待含有DH结构或,因此能导致作为PKS结构的环氧噻酮C和D的合成。粗略分析显示组件4的AT和KR结构域之间的间隔大小不足以容纳一个有功能的DH结构域。因此,组件4进行的缩合形成β-酮后,酮的还原事件没有发生在组件4中。因为发现了C-12,13的不饱和(环氧噻酮C和D),因此必然存在另外的脱氢酶功能引导双键的形成,这一功能相信存在于PKS自身,或者存在于环氧噻酮生物合成基因簇中。
因此,脱氢酶的作用可以发生在聚酮化合物的合成过程中,或者是在环化发生后。在前面的例子中,每个共价链末端生长所形成的化合物是环氧噻酮C和D。如果C12,13脱氛是一个聚酮化合物后发生的,形成的酰基链在C-13的位置会有羟基基团,如下所示。在没有脱氢酶的情况下,或者在脱氢酶发生作用以前,环氧噻酮G和H被命名为13-羟基化合物。
Figure C9981567800591
组件5和6具有整套的还原结构域(KR,DH和ER)以形成C-11和C-9位的亚甲基。组件7和9具有KR结构域,以在C-7和C-3位生成羟基,而组件8不具有有功能的KR结构域,这与C-5上酮基的存在是一致的。组件8还含有一个甲基转移酶(MT)结构域,它导致C-4所存在的二甲基功能团。组件9含有硫酯酶结构域,它终止聚酮化合物的合成,催化环的封闭。环氧噻酮PKS的基因,蛋白质,组件和结构域简要在上文的表中。
序列分析揭示了epoA和epoB(装载结构域和组件1)以及epoC和epoD间的翻译偶联。在epoD和epoE以及epoE和epoF有非常小的间隔,而epoB,epoC,epoF和epoK间的间隔超过了100bp。这些基因间的区域可能含有启动子。序列分析的结果没有显示调节基因的存在,因此可能在纤维堆囊菌中环氧噻酮合成不受操终子特异性的调节。
环氧噻酮PKS和侧边序列收集在一个单一的重叠区中,显示如下:
1    TCGTGCGCGG GCACGTCGAG GCGTTTGCCG ACTTCGGCGG CGTCCCGCGC GTGCTGCTCT
61   ACGACAACCT CAAGAACGCC GTCGTCGAGC GCCACGGCGA CGCGATCCGG TTCCACCCCA
121  CGCTGCTGGC TCTGTCGGCG GATTACCGCT TCGAGCCGCG CCCCGTCGCC GTCGCCCGCG
181  GCAACGAGAA GGGCCGCGTC GAGCGCGCCA TCCGCTACGT CCGCGAGGGC TTCTTCGAGG
241  CCCGGGCCTA CGCCGACCTC GGAGACCTCA ACCGCCAAGC GACCGAGTGG ACCAGCTCCG
301  CGGCGCTCGA TCGCTCCTGG GTCGAGGACC GCGCCCGCAC CGTGCGTCAG GCCTTCGACG
361  ACGAGCGCAG CGTGCTGCTG CGACACCCTG ACACACCGTT TCCGGACCAC GAGCGCGTCG
421  AGGTCGAGGT CGGAAAGACC CCCTACGCGC GCTTCGATCT CAACGACTAC TCGGTCCCCC
481  ACGACCGGAC GCGCCGCACG CTGGTCGTCC TCGCCGACCT CAGTCAGGTA CGCATCGCCG
541  ACGGCAACCA GATCGTCGCG ACCCACGTCC GTTCGTGGGA CCGCGGCCAG CAGATCGAGC
601  AGCCCGAGCA CCTCCAGCGC CTGGTCGACG AGAAGCGCCG CGCCCGCGAG CACCGCGGCC
661  TTGATCGCCT CGCGCGCGCC GCCCGCAGCA GCCAGGCATT CCTGCGCATC GTCGCCGAGC
721  GCGGCGATAA CGTCGGCAGC GCGATCGCCC GGCTTCTGCA ACTGCTCGAC GCCGTGGGCG
781  CCGCCGAGCT CGAAGAGGCC CTGGTCGAGG TGCTTGAGCG CGACACCATC CACATCGGTG
841  CCGTCCGCCA GGTGATCGAC CGCCGCCGCT CCGAGCGCCA CCTGCCGCCT CCAGTCTCAA
901  TCCCCGTCAC CCGCGGCGAG CACGCCGCCC TCGTCGTCAC GCCGCATTCC CTCACCACCT
961  ACGACGCCCT GAAGAAGGAC CCGACGCCAT GACCGACCTG ACGCCCACCG AGACCAAAGA
1021 CCGGCTCAAG AGCCTCGGCC TCTTCGGCCT GCTCGCCTGC TGGGAGCAGC TCGCCGACAA
1081 GCCCTGGCTT CGCGAGGTGC TCGCCATCGA GGAGCGCGAG CGCCACAAGC GCAGCCTCGA
1141 ACGCCGCCTG AAGAACTCCC GCGTCGCCGC CTTCAAGCCC ATGACCGACT TCGACTCGTC
1201 CTGGCCCAAG AAGATCGACC GCGAGGCCGT CGACGACCTC TACGATAGCC GCTACGCGGA
1261 CCTGCTCTTC GAGGTCGTCA CCCGTCGCTA CGACGCGCAG AAGCCGCTCT TGCTCAGCAC
1321 GAACAAGGCA TTCGCCGACT GGGGCCAGGT CTTCCCGCAC GCCGCGTGCG TCGTCACGCT
1381 CGTCGACCGG CTCGTGCACC GCGCCGAGGT GATCGAGATC GAGGCCGAGA GCTACCGGCT
1441 GAAGGAAGCC AAGGAGCTCA ACGCCACCCG CACCAAGCAG CGCCGCACCA AGAAGCACTG
1501 AGCGGCATTT TCACCGGTGA ACTTCACCGA AATCCCGCGT GTTGCCGAGA TCATCTACAG
1561 GCGGATCGAG ACCGTGCTCA CGGCGTGGAC GACATGGCGC GGAAACGTCG TCGTAACTGC
1621 CCAGCAATGT CATGGGAATG GCCCCTTGAG GGGCTGGCCG GGGTCGACGA TATCGCGCGA
1681 TCTCCCCGTC AATTCCCGAG CGTAAAAGAA AAATTTGTCA TAGATCGTAA GCTGTGCTAG
1741 TGATCTGCCT TACGTTACGT CTTCCGCACC TCGAGCGAAT TCTCTCGGAT AACTTTCAAG
1801 TTTTCTGAGG GGGCTTGGTC TCTGGTTCCT CAGGAAGCCT GATCGGGACG AGCTAATTCC
1861 CATCCATTTT TTTGAGACTC TGCTCAAAGG GATTAGACCG AGTGAGACAG TTCTTTTGCA
1921 GTGAGCGAAG AACCTGGGGC TCGACCGGAG GACGATCGAC GTCCGCGAGC GGGTCAGCCG
1981 CTGAGGATGT GCCCGTCGTG GCGGATCGTC CCATCGAGCG CGCAGCCGAA GATCCGATTG
2041 CGATCGTCGG AGCGGGCTGC CGTCTGCCCG GTGGCGTGAT CGATCTGAGC GGGTTCTGGA
2101 CGCTCCTCGA GGGCTCGCGC GACACCGTCG GGCAAGTCCC CGCCGAACGC TGGGATGCAG
2161 CAGCGTGGTT TGATCCCGAC CTCGATGCCC CGGGGAAGAC GCCCGTTACG CGCGCATCTT
2221 TCCTGAGCGA CGTAGCCTGC TTCGACGCCT CCTTCTTCGG CATCTCGCCT CGCGAAGCGC
2281 TGCGGATGGA CCCTGCACAT CGACTCTTGC TGGAGGTGTG CTGGGAGGCG CTGGAGAACG
2341 CCGCGATCGC TCCATCGGCG CTCGTCGGTA CGGAAACGGG AGTGTTCATC GGGATCGGCC
2401 CGTCCGAATA TGAGGCCGCG CTGCCGCGAG CGACGGCGTC CGCAGAGATC GACGCTCATG
2461 GCGGGCTGGG GACGATGCCC AGCGTCGGAG CGGGCCGAAT CTCGTATGTC CTCGGGCTGC
2521 GAGGGCCGTG TGTCGCGGTG GATACGGCCT ATTCGTCCTC GCTCGTGGCC GTTCATCTGG
2581 CCTGTCAGAG CTTGCGCTCC GGGGAATGCT CCACGGCCCT GGCTGGTGGG GTATCGCTGA
2641 TGTTGTCGCC GAGCACCCTC GTGTGGCTCT CGAAGACCCG CGCGCTGGCC ACGGACGGTC
2701 GCTGCAAGGC GTTTTCGGCG GAGGCCGATG GGTTCGGACG AGGCGAAGGG TGCGCCGTCG
2761 TGGTCCTCAA GCGGCTCAGT GGAGCCCGCG CGGACGGCGA CCGGATATTG GCGGTGATTC
2821 GAGGATCCGC GATCAATCAC GACGGAGCGA GCAGCGGTCT GACCGTGCCG AACGGGAGCT
2881 CCCAAGAAAT CGTGCTGAAA CGGGCCCTGG CGGACGCAGG CTGCGCCGCG TCTTCGGTGG
2941 GTTATGTCGA GGCACACGGC ACGGGCACGA CGCTTGGTGA CCCCATCGAA ATCCAAGCTC
3001 TGAATGCGGT ATACGGCCTC GGGCGAGACG TCGCCACGCC GCTGCTGATC GGGTCGGTGA
3061 AGACCAACCT TGGCCATCCT GAGTATGCGT CGGGGATCAC TGGGCTGCTG AAGGTCGTCT
3121 TGTCCCTTCA GCACGGGCAG ATTCCTGCGC ACCTCCACGC GCAGGCGCTG AACCCCCGGA
3181 TCTCATGGGG TGATCTTCGG CTGACCGTCA CGCGCGCCCG GACACCGTGG CCGGACTGGA
3241 ATACGCCGCG ACGGGCGGGG GTGAGCTCGT TCGGCATGAG CGGGACCAAC GCGCACGTGG
3301 TGCTGGAAGA GGCGCCGGCG GCGACGTGCA CACCGCCGGC GCCGGAGCGG CCGGCAGAGC
3361 TGCTGGTGCT GTCGGCAAGG ACCGCGGCAG CCTTGGATGC ACACGCGGCG CGGCTGCGCG
3421 ACCATCTGGA GACCTACCCT TCGCAGTGTC TGGGCGATGT GGCGTTCAGT CTGGCGACGA
3481 CGCGCAGCGC GATGGAGCAC CGGCTCGCGG TGGCGGCGAC GTCGAGCGAG GGGCTGCGGG
3541 CAGCCCTGGA CGCTGCGGCG CAGGGACAGA CGCCGCCCGG TGTGGTGCGC GGTATCGCCG
3601 ATTCCTCACG CGGCAAGCTC GCCTTTCTCT TCACCGGACA GGGGGCGCAG ACGCTGGGCA
3661 TGGGCCGTGG GCTGTATGAT GTATGGCCCG CGTTCCGCGA GGCGTTCGAC CTGTGCGTGA
3721 GGCTGTTCAA CCAGGAGCTC GACCGGCCGC TCCGCGAGGT GATGTGGGCC GAACCGGCCA
3781 GCGTCGACGC CGCGCTGCTC GACCAGACAG CCTTTACCCA GCCGGCGCTG TTCACCTTCG
3841 AGTATGCGCT CGCCGCGCTG TGGCGGTCGT GGGGCGTAGA GCCGGAGTTG GTCGCTGGCC
3901 ATAGCATCGG TGAGCTGGTG GCTGCCTGCG TGGCGGGCGT GTTCTCGCTT GAGGACGCGG
3961 TGTTCCTGGT GGCTGCGCGC GGGCGCCTGA TGCAGGCGCT GCCGGCCGGC GGGGCGATGG
4021 TGTCGATCGC GGCGCCGGAG GCCGATGTGG CTGCTGCGGT GGCGCCGCAC GCAGCGTCGG
4081 TGTCGATCGC CGCGGTCAAC GGTCCGGACC AGGTGGTCAT CGCGGGCGCC GGGCAACCCG
4141 TGCATGCGAT CGCGGCGGCG ATGGCCGCGC GCGGGGCGCG AACCAAGGCG CTCCACGTCT
4201 CGCATGCGTT CCACTCACCG CTCATGGCCC CGATGCTGGA GGCGTTCGGG CGTGTGGCCG
4261 AGTCGGTGAG CTACCGGCGG CCGTCGATCG TCCTGGTCAG CAATCTGAGC GGGAAGGCTG
4321 GCACAGACGA GGTGAGCTCG CCGGGCTATT GGGTGCGCCA CGCGCGAGAG GTGGTGCGCT
4381 TCGCGGATGG AGTGAAGGCG CTGCACGCGG CCGGTGCGGG CACCTTCGTC GAGGTCGGTC
4441 CGAAATCGAC GCTGCTCGGC CTGGTGCCTG CCTGCCTGCC GGACGCCCGG CCGGCGCTGC
4501 TCGCATCGTC GCGCGCTGGG CGTGACGAGC CAGCGACCGT GCTCGAGGCG CTCGGCGGGC
4561 TCTGGGCCGT CGGTGGCCTG GTCTCCTGGG CCGGCCTCTT CCCCTCAGGG GGGCGGCGGG
4621 TGCCGCTGCC CACGTACCCT TGGCAGCGCG AGCGCTACTG GATCGACACG AAAGCCGACG
4681 ACGCGGCGCG TGGCGACCGC CGTGCTCCGG GAGCGGGTCA CGACGAGGTC GAGAAGGGGG
4741 GCGCGGTGCG CGGCGGCGAC CGGCGCAGCG CTCGGCTCGA CCATCCGCCG CCCGAGAGCG
4801 GACGCCGGGA GAAGGTCGAG GCCGCCGGCG ACCGTCCGTT CCGGCTCGAG ATCGATGAGC
4861 CAGGCGTGCT CGATCGCCTG GTGCTTCGGG TCACGGAGCG GCGCGCCCCT GGTCTTGGCG
4921 AGGTCGAGAT CGCCGTCGAC GCGGCGGGGC TCAGCTTCAA TGATGTCCAG CTCGCGCTGG
4981 GCATGGTGCC CGACGACCTG CCGGGAAAGC CCAACCCTCC GCTGCTGCTC GGAGGCGAGT
5041 GCGCCGGGCG CATCGTCGCC GTGGGCGAGG GCGTGAACGG CCTTGTGGTG GGCCAACCGG
5101 TCATCGCCCT TTCGGCGGGA GCGTTTGCTA CCCACGTCAC CACGTCGGCT GCGCTGGTGC
5161 TGCCTCGGCC TCAGGCGCTC TCGGCGACCG AGGCGGCCGC CATGCCCGTC GCGTACCTGA
5221 CGGCATGGTA CGCGCTCGAC GGAATAGCCC GCCTTCAGCC GGGGGAGCGG GTGCTGATCC
5281 ACGCGGCGAC CGGCGGGGTC GGTCTCGCCG CGGTGCAGTG GGCGCAGCAC GTGGGAGCCG
5341 AGGTCCATGC GACGGCCGGC ACGCCCGAGA AGCGCGCCTA CCTGGAGTCG CTGGGCGTGC
5401 GGTATGTGAG CGATTCCCGC TCGGACCGGT TCGTCGCCGA CGTGCGCGCG TGGACGGGCG
5461 GCGAGGGAGT AGACGTCGTG CTCAACTCGC TTTCGGGCGA GCTGATCGAC AAGAGTTTCA
5521 ATCTCCTGCG ATCGCACGGC CGGTTTGTGG AGCTCGGCAA GCGCGACTGT TACGCGGATA
5581 ACCAGCTCGG GCTGCGGCCG TTCCTGCGCA ATCTCTCCTT CTCGCTGGTG GATCTCCGGG
5641 GGATGATGCT CGAGCGGCCG GCGCGGGTCC GTGCGCTCTT CGAGGAGCTC CTCGGCCTGA
5701 TCGCGGCAGG CGTGTTCACC CCTCCCCCCA TCGCGACGCT CCCGATCGCT CGTGTCGCCG
5761 ATGCGTTCCG GAGCATGGCG CAGGCGCAGC ATCTTGGGAA GCTCGTACTC ACGCTGGGTG
5821 ACCCGGAGGT CCAGATCCGT ATTCCGACCC ACGCAGGCGC CGGCCCGTCC ACCGGGGATC
5881 GGGATCTGCT CGACAGGCTC GCGTCAGCTG CGCCGGCCGC GCGCGCGGCG GCGCTGGAGG
5941 CGTTCCTCCG TACGCAGGTC TCGCAGGTGC TGCGCACGCC CGAAATCAAG GTCGGCGCGG
6001 AGGCGCTGTT CACCCGCCTC GGCATGGACT CGCTCATGGC CGTGGAGCTG CGCAATCGTA
6061 TCGAGGCGAG CCTCAAGCTG AAGCTGTCGA CGACGTTCCT GTCCACGTCC CCCAATATCG
6121 CCTTGTTGAC CCAAAACCTG TTGGATGCTC TCGCCACAGC TCTCTCCTTG GAGCGGGTGG
6181 CGGCGGAGAA CCTACGGGCA GGCGTGCAAA GCGACTTCGT CTCATCGGGC GCAGATCAAG
6241 ACTGGGAAAT CATTGCCCTA TGACGATCAA TCAGCTTCTG AACGAGCTCG AGCACCAGGG
6301 TGTCAAGCTG GCGGCCGATG GGGAGCGCCT CCAGATACAG GCCCCCAAGA ACGCCCTGAA
6361 CCCGAACCTG CTCGCTCGAA TCTCCGAGCA CAAAAGCACG ATCCTGACGA TGCTCCGTCA
6421 GAGACTCCCC GCAGAGTCCA TCGTGCCCGC CCCAGCCGAG CGGCACGTTC CGTTTCCTCT
6481 CACAGACATC CAAGGATCCT ACTGGCTGGG TCGGACAGGA GCGTTTACGG TCCCCAGCGG
6541 GATCCACGCC TATCGCGAAT ACGACTGTAC GGATCTCGAC GTGGCGAGGC TGAGCCGCGC
6601 CTTTCGGAAA GTCGTCGCGC GGCACGACAT GCTTCGGGCC CACACGCTGC CCGACATGAT
6661 GCAGGTGATC GAGCCTAAAG TCGACGCCGA CATCGAGATC ATCGATCTGC GCGGGCTCGA
6721 CCGGAGCACA CGGGAAGCGA GGCTCGTATC GTTGCGAGAT GCGATGTCGC ACCGCATCTA
6781 TGACACCGAG CGCCCTCCGC TCTATCACGT CGTCGCCGTT CGGCTGGACG AGCAGCAAAC
6841 CCGTCTCGTG CTCAGTATCG ATCTCATTAA CGTTGACCTA GGCAGCCTGT CCATCATCTT
6901  CAAGGATTGG CTCAGCTTCT ACGAAGATCC CGAGACCTCT CTCCCTGTCC TGGAGCTCTC
6961  GTACCGCGAC TATGTGCTCG CGCTGGAGTC TCGCAAGAAG TCTGAGGCGC ATCAACGATC
7021  GATGGATTAC TGGAAGCGGC GCGTCGCCGA GCTCCCACCT CCGCCGATGC TTCCGATGAA
7081  GGCCGATCCA TCTACCCTGA GGGAGATCCG CTTCCGGCAC ACGGAGCAAT GGCTGCCGTC
7141  GGACTCCTGG AGTCGATTGA AGCAGCGTGT CGGGGAGCGC GGGCTGACCC CGACGGGCGT
7201  CATTCTGGCT GCATTTTCCG AGGTGATCGG GCGCTGGAGC GCGAGCCCCC GGTTTACGCT
7261  CAACATAACG CTCTTCAACC GGCTCCCCGT CCATCCGCGC GTGAACGATA TCACCGGGGA
7321  CTTCACGTCG ATGGTCCTCC TGGACATCGA CACCACTCGC GACAAGAGCT TCGAACAGCG
7381  CGCTAAGCGT ATTCAAGAGC AGCTGTGGGA AGCGATGGAT CACTGCGACG TAAGCGGTAT
7441  CGAGGTCCAG CGAGAGGCCG CCCGGGTCCT GGGGATCCAA CGAGGCGCAT TGTTCCCCGT
7501  GGTGCTCACG AGCGCGCTCA ACCAGCAAGT CGTTGGTGTC ACCTCGCTGC AGAGGCTCGG
7561  CACTCCGGTG TACACCAGCA CGCAGACTCC TCAGCTGCTG CTGGATCATC AGCTCTACGA
7621  GCACGATGGG GACCTCGTCC TCGCGTGGGA CATCGTCGAC GGAGTGTTCC CGCCCGACCT
7681  TCTGGACGAC ATGCTCGAAG CGTACGTCGC TTTTCTCCGG CGGCTCACTG AGGAACCATG
7741  GAGTGAACAG ATGCGCTGTT CGCTTCCGCC TGCCCAGCTA GAAGCGCGGG CGAGCGCAAA
7801  CGAGACCAAC TCGCTGCTGA GCGAGCATAC GCTGCACGGC CTGTTCGCGG CGCGGGTCGA
7861  GCAGCTGCCT ATGCAGCTCG CCGTGGTGTC GGCGCGCAAG ACGCTCACGT ACGAAGAGCT
7921  TTCGCGCCGT TCGCGGCGAC TTGGCGCGCG GCTGCGCGAG CAGGGGGCAC GCCCGAACAC
7981  ATTGGTCGCG GTGGTGATGG AGAAAGGCTG GGAGCAGGTT GTCGCGGTTC TCGCGGTGCT
8041  CGAGTCAGGC GCGGCCTACG TGCCGATCGA TGCCGACCTA CCGGCGGAGC GTATCCACTA
8101  CCTCCTCGAT CATGGTGAGG TAAAGCTCGT GCTGACGCAG CCATGGCTGG ATGGCAAACT
8161  GTCATGGCCG CCGGGGATCC AGCGGCTGCT CGTGAGCGAT GCCGGCGTCG AAGGCGACGG
8221  CGACCAGCTT CCGATGATGC CCATTCAGAC ACCTTCGGAT CTCGCGTATG TCATCTACAC
8281  CTCGGGATCC ACAGGGTTGC CCAAGGGGGT GATGATCGAT CATCGGGGTG CCGTCAACAC
8341  CATCCTGGAC ATCAACGAGC GCTTCGAAAT AGGGCCCGGA GACAGAGTGC TGGCGCTCTC
8401  CTCGCTGAGC TTCGATCTCT CGGTCTACGA TGTGTTCGGG ATCCTGGCGG CGGGCGGTAC
8461  GATCGTGGTG CCGGACGCGT CCAAGCTGCG CGATCCGGCG CATTGGGCAG CGTTGATCGA
8521  ACGAGAGAAG GTGACGGTGT GGAACTCGGT GCCGGCGCTG ATGCGGATGC TCGTCGAGCA
8581  TTCCGAGGGT CGCCCCGATT CGCTCGCTAG GTCTCTGCGG CTTTCGCTGC TGAGCGGCGA
8641  CTGGATCCCG GTGGGCCTGC CTGGCGAGCT CCAGGCCATC AGGCCCGGCG TGTCGGTGAT
8701  CAGCCTGGGC GGGGCCACCG AAGCGTCGAT CTGGTCCATC GGGTACCCCG TGAGGAACGT
8761  CGATCCATCG TGGGCGAGCA TCCCCTACGG CCGTCCGCTG CGCAACCAGA CGTTCCACGT
8821  GCTCGATGAG GCGCTCGAAC CGCGCCCGGT CTGGGTTCCG GGGCAACTCT ACATTGGCGG
8881  GGTCGGACTG GCACTGGGCT ACTGGCGCGA TGAAGAGAAG ACGCGCAACA GCTTCCTCGT
8941  GCACCCCGAG ACCGGGGAGC GCCTCTACAA GACCGGCGAT CTGGGCCGCT ACCTGCCCGA
9001  TGGAAACATC GAGTTCATGG GGCGGGAGGA CAACCAAATC AAGCTTCGCG GATACCGCGT
9061  TGAGCTCGGG GAAATCGAGG AAACGCTCAA GTCGCATCCG AACGTACGCG ACGCGGTGAT
9121  TGTGCCCGTC GGGAACGACG CGGCGAACAA GCTCCTTCTA GCCTATGTGG TCCCGGAAGG
9181  CACACGGAGA CGCGCTGCCG AGCAGGACGC GAGCCTCAAG ACCGAGCGGG TCGACGCGAG
9241  AGCACACGCC GCCAAAGCGG ACGGATTGAG CGACGGCGAG AGGGTGCAGT TCAAGCTCGC
9301  TCGACACGGA CTCCGGAGGG ATCTGGACGG AAAGCCCGTC GTCGATCTGA CCGGGCTGGT
9361  TCCGCGGGAG GCGGGGCTGG ACGTCTACGC GCGTCGCCGT AGCGTCCGAA CGTTCCTCGA
9421  GGCCCCGATT CCATTTGTTG AATTCGGCCG ATTCCTGAGC TGCCTGAGCA GCGTGGAGCC
9481  CGACGGCGCG GCCCTTCCCA AATTCCGTTA TCCATCGGCT GGCAGCACGT ACCCGGTGCA
9541  AACCTACGCG TACGCCAAAT CCGGCCGCAT CGAGGGCGTG GACGAGGGCT TCTATTATTA
9601  CCACCCGTTC GAGCACCGTT TGCTGAAGGT CTCCGATCAC GGGATCGAGC GCGGAGCGCA
9661  CGTTCCGCAA AACTTCGACG TGTTCGATGA AGCGGCGTTC GGCCTCCTGT TCGTGGGCAG
9721  GATCGATGCC ATCGAGTCGC TGTATGGATC GTTGTCACGA GAATTCTGCC TGCTGGAGGC
9781  CGGATATATG GCGCAGCTCC TGATGGAGCA GGCGCCTTCC TGCAACATCG GCGTCTGTCC
9841  GGTGGGTCAA TTCGATTTTG AACAGGTTCG GCCGGTTCTC GACCTGCGGC ATTCGGACGT
9901  TTACGTGCAC GGCATGCTGG GCGGGCGGGT AGACCCGCGG CAGTTCCAGG TCTGTACGCT
9961  CGGTCAGGAT TCCTCACCGA GGCGCGCCAC GACGCGCGGC GCCCCTCCCG GCCGCGATCA
10021 GCACTTCGCC GATATCCTTC GCGACTTCTT GAGGACCAAA CTACCCGAGT ACATGGTGCC
10081 TACAGTCTTC GTGGAGCTCG ATGCGTTGCC GCTGACGTCC AACGGCAAGG TCGATCGTAA
10141 GGCCCTGCGC GAGCGGAAGG ATACCTCGTC GCCGCGGCAT TCGGGGCACA CGGCGCCACG
10201 GGACGCCTTG GAGGAGATCC TCGTTGCGGT CGTACGGGAG GTGCTCGGGC TGGAGGTGGT
10261 TGGGCTCCAG CAGAGCTTCG TCGATCTTGG TGCGACATCG ATTCACATCG TTCGCATGAG
10321 GAGTCTGTTG CAGAAGAGGC TGGATAGGGA GATCGCCATC ACCGAGTTGT TCCAGTACCC
10381 GAACCTCGGC TCGCTGGCGT CCGGTTTGCG CCGAGACTCG AAAGATCTAG AGCAGCGGCC
10441 GAACATGCAG GACCGAGTGG AGGCTCGGCG CAAGGGCAGG AGACGTAGCT AAGAGCGCCG
10501 AACAAAACCA GGCCGAGCGG GCCAATGAAC CGCAAGCCCG CCTGCGTCAC CCTGGGACTC
10561 ATCTGATCTG ATCGCGGGTA CGCGTCGCGG GTGTGCGCGT TGAGCCGTGT TGCTCGAACG
10621 CTGAGGAACG GTGAGCTCAT GGAAGAACAA GAGTCCTCCG CTATCGCAGT CATCGGCATG
10681 TCGGGCCGTT TTCCGGGGGC GCGGGATCTG GACGAATTCT GGAGGAACCT TCGAGACGGC
10741 ACGGAGGCCG TGCAGCGCTT CTCCGAGCAG GAGCTCGCGG CGTCCGGAGT CGACCCAGCG
10801 CTGGTGCTGG ACCCGAACTA CGTCCGGGCG GGCAGCGTGC TGGAAGATGT CGACCGGTTC
10861 GACGCTGCTT TCTTCGGCAT CAGCCCGCGC GAGGCAGAGC TCATGGATCC GCAGCACCGC
10921 ATCTTCATGG AATGCGCCTG GGAGGCGCTG GAGAACGCCG GATACGACCC GACAGCCTAC
10981 GAGGGCTCTA TCGGCGTGTA CGCCGGCGCC AACATGAGCT CGTACTTGAC GTCGAACCTC
11041 CACGAGCACC CAGCGATGAT GCGGTGGCCC GGCTGGTTTC AGACGTTGAT CGGCAACGAC
11101 AAGGATTACC TCGCGACCCA CGTCTCCTAC AGGCTGAATC TGAGAGGGCC GAGCATCTCC
11161 GTTCAAACTG CCTGCTCTAC CTCGCTCGTG GCGGTTCACT TGGCGTGCAT GAGCCTCCTG
11221 GACCGCGAGT GCGACATGGC GCTGGCCGGC GGGATTACCG TCCGGATCCC CCATCGAGCC
11281 GGCTATGTAT ATGCTGAGGG GGGCATCTTC TCTCCCGACG GCCATTGCCG GGCCTTCGAC
11341 GCCAAGGCGA ACGGCACGAT CATGGGCAAC GGCTGCGGGG TTGTCCTCCT GAAGCCGCTG
11401 GACCGGGCGC TCTCCGATGG TGATCCCGTC CGCGCGGTCA TCCTTGGGTC TGCCACAAAC
11461 AACGACGGAG CGAGGAAGAT CGGGTTCACT GCGCCCAGTG AGGTGGGCCA GGCGCAAGCG
11521 ATCATGGAGG CGCTGGCGCT GGCAGGGGTC GAGGCCCGGT CCATCCAATA CATCGAGACC
11581 CACGGGACCG GCACGCTGCT CGGAGACGCC ATCGAGACGG CGGCGTTGCG GCGGGTGTTC
11641 GATCGCGACG CTTCGACCCG GAGGTCTTGC GCGATCGGCT CCGTGAAGAC CGGCATCGGA
11701 CACCTCGAAT CGGCGGCTGG CATCGCCGGT TTGATCAAGA CGGTCTTGGC GCTGGAGCAC
11761 CGGCAGCTGC CGCCCAGCCT GAACTTCGAG TCTCCTAACC CATCGATCGA TTTCGCGAGC
11821 AGCCCGTTCT ACGTCAATAC CTCTCTTAAG GATTGGAATA CCGGCTCGAC TCCGCGGCGG
11881 GCCGGCGTCA GCTCGTTCGG GATCGGCGGC ACCAACGCCC ATGTCGTGCT GGAGGAAGCA
11941 CCCGCGGCGA AGCTTCCAGC CGCGGCGCCG GCGCGCTCTG CCGAGCTCTT CGTCGTCTCG
12001 GCCAAGAGCG CAGCGGCGCT GGATGCCGCG GCGGCACGGC TACGAGATCA TCTGCAGGCG
12061 CACCAGGGGC TTTCGTTGGG CGACGTCGCC TTCAGCCTGG CGACGACGCG CAGTCCCATG
12121 GAGCACCGGC TCGCGATGGC GGCACCGTCG CGCGAGGCGT TGCGAGAGGG GCTCGACGCA
12181 GCGGCGCGAG GCCAGACCCC GCCGGGCGCC GTGCGTGGCC GCTGCTCCCC AGGCAACGTG
12241 CCGAAGGTGG TCTTCGTCTT TCCCGGCCAG GGCTCTCAGT GGGTCGGTAT GGGCCGTCAG
12301 CTCCTGGCTG AGGAACCCGT CTTCCACGCG GCGCTTTCGG CGTGCGACCG GGCCATCCAG
12361 GCCGAAGCTG GTTGGTCGCT GCTCGCCGAG CTCGCCGCCG ACGAAGGGTC GTCCCAGATC
12421 GAGCGCATCG ACGTGGTGCA GCCGGTGCTG TTCGCGCTCG CGGTGGCATT TGCGGCGCTG
12481 TGGCGGTCGT GGGGTGTCGG GCCCGACGTC GTGATCGGCC ACAGCATGGG CGAGGTAGCC
12541 GCCGCGCATG TGGCCGGGGC GCTGTCGCTC GAGGATGCGG TGGCGATCAT CTGCCGGCGC
12601 AGCCGGCTGC TCCGGCGCAT CAGCGGTCAG GGCGAGATGG CGGTGACCGA GCTGTCGCTG
12661 GCCGAGGCCG AGGCAGCGCT CCGAGGCTAC GAGGATCGGG TGAGCGTGGC CGTGAGCAAC
12721 AGCCCGCGCT CGACGGTGCT CTCGGGCGAG CCGGCAGCGA TCGGCGAGGT GCTGTCGTCC
12781 CTGAACGCGA AGGGGGTGTT CTGCCGTCGG GTGAAGGTGG ATGTCGCCAG CCACAGCCCG
12841 CAGGTCGACC CGCTGCGCGA GGACCTCTTG GCAGCGCTGG GCGGGCTCCG GCCGCGTGCG
12901 GCTGCGGTGC CGATGCGCTC GACGGTGACG GGCGCCATGG TAGCGGGCCC GGAGCTCGGA
12961 GCGAATTACT GGATGAACAA TCTCAGGCAG CCTGTGCGCT TCGCCGAGGT AGTCCAGGCG
13021 CAGCTCCAAG GCGGCCACGG TCTGTTCGTG GAGATGAGCC CGCATCCGAT CCTAACGACT
13081 TCGGTCGAGG AGATGCGGCG CGCGGCCCAG CGGGCGGGCG CAGCGGTGGG CTCGCTGCGG
13141 CGAGGGCAGG ACGAGCGCCC GGCGATGCTG GAGGCGCTGG GCGCGCTGTG GGCGCAGGGC
13201 TACCCTGTAC CCTGGGGGCG GCTGTTTCCC GCGGGGGGGC GGCGGGTACC GCTGCCGACC
13261 TATCCCTGGC AGCGCGAGCG GTACTGGATC GAAGCGCCGG CCAAGAGCGC CGCGGGCGAT
13321 CGCCGCGGCG TGCGTGCGGG CGGTCACCCG CTCCTCGGTG AAATGCAGAC CCTATCAACC
13381 CAGACGAGCA CGCGGCTGTG GGAGACGACG CTGGATCTCA AGCGGCTGCC GTGGCTCGGC
13441 GACCACCGGG TGCAGGGAGC GGTCGTGTTT CCGGGCGCGG CGTACCTGGA GATGGCGATT
13501 TCGTCGGGGG CCGAGGCTTT GGGCGATGGC CCATTGCAGA TAACCGACGT GGTGCTCGCC
13561 GAGGCGCTGG CCTTCGCGGG CGACGCGGCG GTGTTGGTCC AGGTGGTGAC GACGGAGCAG
13621 CCGTCGGGAC GGCTGCAGTT CCAGATCGCG AGCCGGGCGC CGGGCGCTGG CCACGCGTCC
13681 TTCCGGGTCC ACGCTCGCGG CGCGTTGCTC CGAGTGGAGC GCACCGAGGT CCCGGCTGGG
13741 CTTACGCTTT CCGCCGTGCG CGCACGGCTC CAGGCCAGCA TGCCCGCCGC GGCCACCTAC
13801 GCGGAGCTGA CCGAGATGGG GCTGCAGTAC GGCCCTGCCT TCCAGGGGAT TGCTGAGCTA
13861 TGGCGCGGTG AGGGCGAGGC GCTGGGACGG GTACGCCTGC CCGACGCGGC CGGCTCGGCA
13921 GCGGAGTATC GGTTGCATCC TGCGCTGCTG GACGCGTGCT TCCAGGTCGT CGGCAGCCTC
13981 TTCGCCGGCG GTGGCGAGGC GACGCCGTGG GTGCCCGTGG AAGTGGGCTC GCTGCGGCTC
14041 TTGCAGCGGC CTTCGGGGGA GCTGTGGTGC CATGCGCGCG TCGTGAACCA CGGGCGCCAA
14101 ACCCCCGATC GGCAGGGCGC CGACTTTTGG GTGGTCGACA GCTCGGGTGC AGTGGTCGCC
14161 GAAGTCAGCG GGCTCGTGGC GCAGCGGCTT CCGGGAGGGG TGCGCCGGCG CGAAGAAGAC
14221 GATTGGTTCC TGGAGCTCGA GTGGGAACCC GCAGCGGTCG GCACAGCCAA GGTCAACGCG
14281 GGCCGGTGGC TGCTCCTCGG CGGCGGCGGT GGGCTCGGCG CCGCGTTGCG CTCGATGCTG
14341 GAGGCCGGCG GCCATGCCGT CGTCCATGCG GCAGAGAGCA ACACGAGCGC TGCCGGCGTA
14401 CGCGCGCTCC TGGCAAAGGC CTTTGACGGC CAGGCTCCGA CGGCGGTGGT GCACCTCGGC
14461 AGCCTCGATG GGGGTGGCGA GCTCGACCCA GGGCTCGGGG CGCAAGGCGC ATTGGACGCG
14521 CCCCGGAGCG CCGACGTCAG TCCCGATGCC CTCGATCCGG CGCTGGTACG TGGCTGTGAC
14581 AGCGTGCTCT GGACCGTGCA GGCCCTGGCC GGCATGGGCT TTCGAGACGC CCCGCGATTG
14641 TGGCTTCTGA CCCGCGGCGC ACAGGCCGTC GGCGCCGGCG ACGTCTCCGT GACACAGGCA
14701 CCGCTGCTGG GGCTGGGCCG CGTCATCGCC ATGGAGCACG CGGATCTGCG CTGCGCTCGG
14761 GTCGACCTCG ATCCGACCCG GCCCGATGGG GAGCTCGGTG CCCTGCTGGC CGAGCTGCTG
14821 GCCGACGACG CCGAAGCGGA AGTCGCGTTG CGCGGTGGCG AGCGATGCGT CGCTCGGATC
14881 GTCCGCCGGC AGCCCGAGAC CCGGCCCCGG GGGAGGATCG AGAGCTGCGT TCCGACCGAC
14941 GTCACCATCC GCGCGGACAG CACCTACCTT GTGACCGGCG GTCTGGGTGG GCTCGGTCTG
15001 AGCGTGGCCG GATGGCTGGC CGAGCGCGGC GCTGGTCACC TGGTGCTGGT GGGCCGCTCC
15061 GGCGCGGCGA GCGTGGAGCA ACGGGCAGCC GTCGCGGCGC TCGAGGCCCG CGGCGCGCGC
15121 GTCACCGTGG CGAAGGCAGA TGTCGCCGAT CGGGCGCAGC TCGAGCGGAT CCTCCGCGAG
15181 GTTACCACGT CGGGGATGCC GCTGCGGGGC GTCGTCCATG CGGCCGGCAT CTTGGACGAC
15241 GGGCTGCTGA TGCAGCAGAC TCCCGCGCGG TTTCGTAAGG TGATGGCGCC CAAGGTCCAG
15301 GGGGCCTTGC ACCTGCACGC GTTGACGCGC GAAGCGCCGC TTTCCTTCTT CGTGCTGTAC
15361 GCTTCGGGAG TAGGGCTCTT GGGCTCGCCG GGCCAGGGCA ACTACGCCGC GGCCAACACG
15421 TTCCTCGACG CTCTGGCGCA CCACCGGAGG GCGCAGGGGC TGCCAGCGTT GAGCGTCGAC
15481 TGGGGCCTGT TCGCGGAGGT GGGCATGGCG GCCGCGCAGG AAGATCGCGG CGCGCGGCTG
15541 GTCTCCCGCG GAATGCGGAG CCTCACCCCC GACGAGGGGC TGTCCGCTCT GGCACGGCTG
15601 CTCGAAAGCG GCCGCGTGCA GGTGGGGGTG ATGCCGGTGA ACCCGCGGCT GTGGGTGGAG
15661 CTCTACCCCG CGGCGGCGTC TTCGCGAATG TTGTCGCGCC TGGTGACGGC GCATCGCGCG
15721 AGCGCCGGCG GGCCAGCCGG GGACGGGGAC CTGCTCCGCC GCCTCGCTGC TGCCGAGCCG
15781 AGCGCGCGGA GCGGGCTCCT GGAGCCGCTC CTCCGCGCGC AGATCTCGCA GGTGCTGCGC
15841 CTCCCCGAGG GCAAGATCGA GGTGGACGCC CCGCTCACGA GCCTGGGCAT GAACTCGCTG
15901 ATGGGGCTCG AGCTGCGCAA CCGCATCGAG GCCATGCTGG GCATCACCGT ACCGGCAACG
15961 CTGTTGTGGA CCTATCCCAC GGTGGCGGCG CTGAGCGGGC ATCTGGCGCG GGAGGCATGC
16021 GAAGCCGCTC CTGTGGAGTC ACCGCACACC ACCGCCGATT CTGCTGTCGA GATCGAGGAG
16081 ATGTCGCAGG ACGATCTGAC GCAGTTGATC GCAGCAAAAT TCAAGGCGCT TACATGACTA
16141 CTCGCGGTCC TACGGCACAG CAGAATCCGC TGAAACAAGC GGCCATCATC ATTCAGCGGC
16201 TGGAGGAGCG GCTCGCTGGG CTCGCACAGG CGGAGCTGGA ACGGACCGAG CCGATCGCCA
16261 TCGTCGGTAT CGGCTGCCGC TTCCCTGGCG GTGCGGACGC TCCGGAAGCG TTTTGGGAGC
16321 TGCTCGACGC GGAGCGCGAC GCGGTCCAGC CGCTCGACAG GCGCTGGGCG CTGGTAGGTG
16381 TCGCTCCCGT CGAGGCCGTG CCGCACTGGG CGGGGCTGCT CACCGAGCCG ATAGATTGCT
16441 TCGATGCTGC GTTCTTCGGC ATCTCGCCTC GGGAGGCGCG ATCGCTCGAC CCGCAGCATC
16501 GTCTGTTGCT GGAGGTCGCT TGGGAGGGGC TCGAGGACGC CGGTATCCCG CCCCGGTCCA
16561 TCGACGGGAG CCGCACCGGT GTGTTCGTCG GCGCTTTCAC GGCGGACTAC GCGCGCACGG
16621 TCGCTCGGTT GCCGCGCGAG GAGCGAGACG CGTACAGCGC CACCGGCAAC ATGCTCAGCA
16681 TCGCCGCCGG ACGGCTGTCG TACACGCTGG GGCTGCAGGG ACCTTGCCTG ACCGTCGACA
16741 CGGCGTGCTC GTCATCGCTG GTGGCGATTC ACCTCGCCTG CCGCAGCCTG CGCGCAGGAG
16801 AGAGCGATCT CGCGTTGGCG GGAGGGGTCA GCACGCTCCT CTCCCCCGAC ATGATGGAAG
16861 CCGCGGCGCG CACGCAAGCG CTGTCGCCCG ATGGTCGTTG CCGGACCTTC GATGCTTCGG
16921 CCAACGGGTT CGTCCGTGGC GAGGGCTGTG GCCTGGTCGT CCTCAAACGG CTCTCCGACG
16981 CGCAACGGGA TGGCGACCGC ATCTGGGCGC TGATCCGGGG CTCGGCCATC AACCATGATG
17041 GCCGGTCGAC CGGGTTGACC GCGCCCAACG TGCTGGCTCA GGAGACGGTC TTGCGCGAGG
17101 CGCTGCGGAG CGCCCACGTC GAAGCTGGGG CCGTCGATTA CGTCGAGACC CACGGAACAG
17161 GGACCTCGCT GGGCGATCCC ATCGAGGTCG AGGCGCTGCG GGCGACGGTG GGGCCGGCGC
17221 GCTCCGACGG CACACGCTGC GTGCTGGGCG CGGTGAAGAC CAACATCGGC CATCTCGAGG
17281 CCGCGGCAGG CGTAGCGGGC CTGATCAAGG CAGCGCTTTC GCTGACGCAC GAGCGCATCC
17341 CGAGAAACCT CAACTTCCGC ACGCTCAATC CGCGGATCCG GCTCGAGGGC AGCGCGCTCG
17401 CGTTGGCGAC CGAGCCGGTG CCGTGGCCGC GCACGGACCG TCCGCGCTTC GCGGGGGTGA
17461 GCTCGTTCGG GATGAGCGGA ACGAACGCGC ATGTGGTGCT GGAAGAGGCG CCGGCGGTGG
17521 AGCTGTGGCC TGCCGCGCCG GAGCGCTCGG CGGAGCTTTT GGTGCTGTCG GGCAAGAGCG
17581 AGGGGGCGCT CGACGCGCAG GCGGCGCGGC TGCGCGAGCA CCTGGACATG CACCCGGAGC
17641 TCGGGCTCGG GGACGTGGCG TTCAGCCTGG CGACGACGCG CAGCGCGATG ACCCACCGGC
17701 TCGCGGTGGC GGTGACGTCG CGCGAGGGGC TGCTGGCGGC GCTTTCGGCC GTGGCGCAGG
17761 GGCAGACGCC GGCGGGGGCG GCGCGCTGCA TCGCGAGCTC CTCGCGCGGC AAGCTGGCGT
17821 TGCTGTTCAC CGGACAGGGC GCGCAGACGC CGGGCATGGG CCGGGGGCTC TGCGCGGCGT
17881 GGCCAGCGTT CCGGGAGGCG TTCGACCGGT GCGTGACGCT GTTCGACCGG GAGCTGGACC
17941 GCCCGCTGCG CGAGGTGATG TGGGCGGAGG CGGGGAGCGC CGAGTCGTTG TTGCTGGACC
18001 AGACGGCGTT CACCCAGCCC GCGCTCTTCG CGGTGGAGTA CGCGCTGACG GCGCTGTGGC
18061 GGTCGTGGGG CGTAGAGCCG GAGCTCCTGG TTGGGCATAG CATCGGGGAG CTGGTGGCGG
18121 CGTGCGTGGC GGGGGTGTTC TCGCTGGAAG ATGGGGTGAG GCTCGTGGCG GCGCGCGGGC
18181 GGCTGATGCA GGGGCTCTCG GCGGGCGGCG CGATGGTGTC GCTCGGAGCG CCGGAGGCGG
18241 AGGTGGCCGC GGCGGTGGCG CCGCACGCGG CGTGGGTGTC GATCGCGGCG GTCAATGGGC
18301 CGGAGCAGGT GGTGATCGCG GGCGTGGAGC AAGCGGTGCA GGCGATCGCG GCGGGGTTCG
18361 CGGCGCGCGG CGTGCGCACC AAGCGGCTGC ATGTCTCGCA CGCGTTCCAC TCGCCGCTGA
18421 TGGAACCGAT GCTGGAGGAG TTCGGGCGGG TGGCGGCGTC GGTGACGTAC CGGCGGCCAA
18481 GCGTTTCGCT GGTGAGCAAC CTGAGCGGGA AGGTGGTCAC GGACGAGCTG AGCGCGCCGG
18541 GCTACTGGGT GCGGCACGTG CGGGAGGCGG TGCGCTTCGC GGACGGGGTG AAGGCGCTGC
18601 ACGAAGCCGG CGCGGGCACG TTCCTCGAAG TGGGCCCGAA GCCGACGCTG CTCGGCCTGT
18661 TGCCAGCTTG CCTGCCGGAG GCGGAGCCGA CGTTGCTGGC GTCGTTGCGC GCCGGGCGCG
13721 AGGAGGCTGC GGGGGTGCTC GAGGCGCTGG GCAGGCTGTG GGCCGCTGGC GGCTCGGTCA
18781 GCTGGCCGGG CGTCTTCCCC ACGGCTGGGC GGCGGGTGCC GCTGCCGACC TATCCGTGGC
18841 AGCGGCAGCG GTACTGGATC GAGGCGCCGG CCGAAGGGCT CGGAGCCACG GCCGCCGATG
18901 CGCTGGCGCA GTGGTTCTAC CGGGTGGACT GGCCCGAGAT GCCTCGCTCA TCCGTGGATT
18961 CGCGGCGAGC CCGGTCCGGC GGGTGGCTGG TGCTGGCCGA CCGGGGTGGA GTCGGGGAGG
19021 CGGCCGCGGC GGCGCTTTCG TCGCAGGGAT GTTCGTGCGC CGTGCTCCAT GCGCCCGCCG
19081 AGGCCTCCGC GGTCGCCGAG CAGGTGACCC AGGCCCTCGG TGGCCGCAAC GACTGGCAGG
19141 GGGTGCTGTA CCTGTGGGGT CTGGACGCCG TCGTGGAGGC GGGGGCATCG GCCGAAGAGG
19201 TCGGCAAAGT CACCCATCTT GCCACGGCGC CGGTGCTCGC GCTGATTCAG GCGGTGGGCA
19261 CGGGGCCGCG CTCACCCCGG CTCTGGATCG TGACCCGAGG GGCCTGCACG GTGGGCGGCG
19321 AGCCTGACGC TGCCCCGTGT CAGGCGGCGC TGTGGGGTAT GGGCCGGGTC GCGGCGCTGG
19381 AGCATCCCGG CTCCTGGGGC GGGCTCGTGG ACCTGGATCC GGAGGAGAGC CCGACGGAGG
19441 TCGAGGCCCT GGTGGCCGAG CTGCTTTCGC CGGACGCCGA GGATCAGCTG GCATTCCGCC
19501 AGGGGCGCCG GCGCGCAGCG CGGCTCGTGG CCGCCCCACC GGAGGGAAAC GCAGCGCCGG
19561 TGTCGCTGTC TGCGGAGGGG AGTTACTTGG TGACGGGTGG GCTGGGCGCC CTTGGCCTCC
19621 TCGTTGCGCG GTGGTTGGTG GAGCGCGGGG CGGGGCACCT TGTGCTGATC AGCCGGCACG
19681 GATTGCCCGA CCGCGAGGAA TGGGGCCGAG ATCAGCCGCC AGAGGTGCGC GCGCGCATTG
19741 CGGCGATCGA GGCGCTGGAG GCGCAGGGCG CGCGGGTCAC CGTGGCGGCG GTCGACGTGG
19801 CCGATGCCGA AGGCATGGCG GCGCTCTTGG CGGCCGTCGA GCCGCCGCTG CGGGGGGTCG
19861 TGCACGCCGC GGGTCTGCTC GACGACGGGC TGCTGGCCCA CCAGGACGCC GGTCGGCTCG
19921 CCCGGGTGTT GCGCCCCAAG GTGGAGGGGG CATGGGTGCT GCACACCCTT ACCCGCGAGC
19981 AGCCGCTGGA CCTCTTCGTA CTGTTTTCCT CGGCGTCGGG CGTCTTCGGC TCGATCGGCC
20041 AGGGCAGCTA CGCGGCAGGC AATGCCTTTT TGGACGCGCT GGCGGACCTC CGTCGAACGC
20101 AGGGGCTCGC CGCCCTGAGC ATCGCCTGGG GCCTGTGGGC GGAGGGGGGG ATGGGCTCGC
20161 AGGCGCAGCG CCGGGAACAT GAGGCATCGG GAATCTGGGC GATGCCGACG AGTCGTGCCC
20221 TGGCGGCGAT GGAATGGCTG CTCGGTACGC GCGCGACGCA GCGCGTGGTC ATCCAGATGG
20281 ATTGGGCCCA TGCGGGAGCG GCTCCGCGCG ACGCGAGCCG AGGCCGCTTC TGGGATCGGC
20341 TGGTAACTGT CACGAAAGCG GCCTCCTCCT CGGCCGTGCC AGCTGTAGAG CGCTGGCGCA
20401 ACGCGTCTGT TGTGGAGACC CGCTCGGCGC TCTACGAGCT TGTGCGCGGC GTGGTCGCCG
20461 GGGTGATGGG CTTTACCGAC CAAGGCACGC TCGACGTGCG ACGAGGCTTC GCCGAGCAGG
20521 GCCTCGACTC CCTGATGGCT GTGGAGATCC GCAAACGGCT TCAGGGTGAG CTGGGTATGC
20581 CGCTGTCGGC GACGCTGGCG TTCGACCATC CGACCGTGGA GCGGCTGGTG GAATACTTGC
20641 TGAGCCAGGC GCTGGAGCTG CAGGACCGCA CCGACGTGCG AAGCGTTCGG TTGCCGGCGA
20701 CAGAGGACCC GATCGCCATC GTGGGTGCCG CCTGCCGCTT CCCGGGCGGG GTCGAGGACC
20761 TGGAGTCCTA CTGGCAGCTG TTGACCGAGG GCGTGGTGGT CAGCACCGAG GTGCCGGCCG
20821 ACCGGTGGAA TGGGGCAGAC GGGCGCGGCC CCGGCTCGGG AGAGGCTCCG AGACAGACCT
20881 ACGTGCCCAG GGGTGGCTTT CTGCGCGAGG TGGAGACGTT CGATGCGGCG TTCTTCCACA
20941 TCTCGCCTCG GGAGGCGATG AGCCTGGACC CGCAACAGCG GCTGCTGCTG GAAGTGAGCT
21001 GGGAGGCGAT CGAGCGCGCG GGCCAGGACC CGTCGGCGCT GCGCGAGAGC CCCACGGGCG
21061 TGTTCGTGGG CGCGGGCCCC AACGAATATG CCGAGCGGGT GCAGGACCTC GCCGATGAGG
21121 CGGCGGGGCT CTACAGCGGC ACCGGCAACA TGCTCAGCGT TGCGGCGGGA CGGCTGTCAT
21181 TTTTCCTGGG CCTGCACGGG CCGACCCTGG CTGTGGATAC GGCGTGCTCC TCGTCGCTCG
21241 TGGCGCTGCA CCTCGGCTGC CAGAGCTTGC GACGGGGCGA GTGCGACCAA GCCCTGGTTG
21301 GCGGGGTCAA CATGCTGCTC TCGCCGAAGA CCTTCGCGCT GCTCTCACGG ATGCACGCGC
21361 TTTCGCCCGG CGGGCGGTGC AAGACGTTCT CGGCCGACGC GGACGGCTAC GCGCGGGCCG
21421 AGGGCTGCGC CGTGGTGGTG CTCAAGCGGC TCTCCGACGC GCAGCGCGAC CGCGACCCCA
21481 TCCTGGCGGT GATCCGGGGT ACGGCGATCA ATCATGATGG CCCGAGCAGC GGGCTGACAG
21541 TGCCCAGCGG CCCTGCCCAG GAGGCGCTGT TACGCCAGGC GCTGGCGCAC GCAGGGGTGG
21601 TTCCGGCCGA CGTCGATTTC GTGGAATGCC ACGGGACCGG GACGGCGCTG GGCGACCCGA
21661 TCGAGGTGCG GGCGCTGAGC GACGTGTACG GGCAAGCCCG CCCTGCGGAC CGACCGCTGA
21721 TCCTGGGAGC CGCCAAGGCC AACCTTGGGC ACATGGAGCC CGCGGCGGGC CTGGCCGGCT
21781 TGCTCAAGGC GGTGCTCGCG CTGGGGCAAG AGCAAATACC AGCCCAGCCG GAGCTGGGCG
21841 AGCTCAACCC GCTCTTGCCG TGGGAGGCGC TGCCGGTGGC GGTGGCCCGC GCAGCGGTGC
21901 CGTGGCCGCG CACGGACCGT CCGCGCTTCG CGGGGGTGAG CTCGTTCGGG ATGAGCGGAA
21961 CGAACGCGCA TGTGGTGCTG GAAGAGGCGC CGGCGGTGGA GCTGTGGCCT GCCGCGCCGG
22021 AGCGCTCGGC GGAGCTTTTG GTGCTGTCGG GCAAGAGCGA GGGGGCGCTC GACGCGCAGG
22081 CGGCGCGGCT GCGCGAGCAC CTGGACATGC ACCCGGAGCT CGGGCTCGGG GACGTGGCGT
22141 TCAGCCTGGC GACGACGCGC AGCGCGATGA ACCACCGGCT CGCGGTGGCG GTGACGTCGC
22201 GCGAGGGGCT GCTGGCGGCG CTTTCGGCCG TGGCGCAGGG GCAGACGCCG CCGGGGGCGG
22261 CGCGCTGCAT CGCGAGCTCG TCGCGCGGCA AGCTGGCGTT CCTGTTCACC GGACAGGGCG
22321 CGCAGACGCC GGGCATGGGC CGGGGGCTTT GCGCGGCGTG GCCAGCGTTC CGAGAGGCGT
22381 TCGACCGGTG CGTGGCGCTG TTCGACCGGG AGCTGGACCG CCCGCTGTGC GAGGTGATGT
22441 GGGCGGAGCC GGGGAGCGCC GAGTCGTTGT TGCTCGACCA GACGGCGTTC ACCCAGCCCG
22501 CGCTCTTCAC GGTGGAGTAC GCGCTGACGG CGCTGTGGCG GTCGTGGGGC GTAGAGCCGG
22561 AGCTGGTGGC TGGGCATAGC GCCGGGGAGC TGGTGGCGGC GTGCGTGGCG GGGGTGTTCT
22621 CGCTGGAAGA TGGGGTGAGG CTCGTGGCGG CGCGCGGGCG GCTGATGCAG GGGCTCTCGG
22681 CGGGCGGCGC GATGGTGTCG CTCGGAGCGC CGGAGGCGGA GGTGGCCGCG GCGGTGGCGC
22741 CGCACGCGGC GTGGGTGTCG ATCGCGGCGG TCAATGGGCC GGAGCAGGTG GTGATCGCGG
22801 GCGTGGAGCA AGCGGTGCAG GCGATCGCGG CGGGGTTCGC GGCGCGCGGC GTGCGCACCA
22861 AGCGGCTGCA TGTCTCGCAC GCATCCCACT CGCCGCTGAT GGAACCGATG CTGGAGGAGT
22921 TCGGGCGGGT GGCGGCGTCG GTGACGTACC GGCGGCCAAG CGTTTCGCTG GTGAGCAACC
22981 TGAGCGGGAA GGTGGTCACG GACGAGCTGA GCGCGCCGGG CTACTGGGTG CGGCACGTGC
23041 GGGAGGCGGT GCGCTTCGCG GACGGGGTGA AGGCGCTGCA CGAAGCCGGC GCGGGGACGT
23101 TCCTCGAAGT GGGCCCGAAG CCGACGCTGC TCGGCCTGTT GCCAGCTTGC CTGCCGGAGG
23161 CGGAGCCGAC GCTGCTGGCG TCGTTGCGCG CCGGGCGCGA GGAGGCTGCG GGGGTGCTCG
23221 AGGCGCTGGG CAGGCTGTGG GCCGCCGGCG GCTCGGTCAG CTGGCCGGGC GTCTTCCCCA
23281 CGGCTGGGCG GCGGGTGCCG CTGCCGACCT ATCCGTGGCA GCGGCAGCGG TACTGGCCCG
23341 ACATCGAGCC TGACAGCCGT CGCCACGCAG CCGCGGATCC GACCCAAGGC TGGTTCTATC
23401 GCGTGGACTG GCCGGAGATA CCTCGCAGCC TCCAGAAATC AGAGGAGGCG AGCCGCGGGA
23461 GCTGGCTGGT ATTGGCGGAT AAGGGTGGAG TCGGCGAGGC GGTCGCTGCA GCGCTGTCGA
23521 CACGTGGACT TCCATGCGTC GTGCTCCATG CGCCGGCAGA GACATCCGCG ACCGCCGAGC
23581 TGGTGACCGA GGCTGCCGGC GGTCGAAGCG ATTGGCAGGT AGTGCTCTAC CTGTGGGGTC
23641 TGGACGCCGT CGTCGGCGCG GAGGCGTCGA TCGATGAGAT CGGCGACGCG ACCCGTCGTG
23701 CTACCGCGCC GGTGCTCGGC TTGGCTCGGT TTCTGAGCAC CGTGTCTTGT TCGCCCCGAC
23761 TCTGGGTCGT GACCCGGGGG GCATGCATCG TTGGCGACGA GCCTGCGATC GCCCCTTGTC
23821 AGGCGGCGTT ATGGGGCATG GGCCGGGTGG CGGCGCTCGA GCATCCCGGG GCCTGGGGCG
23881 GGCTCGTGGA CCTGGATCCC CGAGCGAGCC CGCCCCAAGC CAGCCCGATC GACGGCGAGA
23941 TGCTCGTCAC CGAGCTATTG TCGCAGGAGA CCGAGGACCA GCTCGCCTTC CGCCATGGGC
24001 GCCGGCACGC GGCACGGCTG GTGGCCGCCC CGCCACGGGG GGAAGCGGCA CCGGCGTCGC
24061 TGTCTGCGGA GGCGAGCTAC CTGGTGACGG GAGGCCTCGG TGGGCTGGGC CTGATCGTGG
24121 CCCAGTGGCT GGTGGAGCTG GGAGCGCGGC ACTTGGTGCT GACCAGCCGG CGCGGGTTGC
24181 CCGACCGGCA GGCGTGGCGC GAGCAGCAGC CGCCTGAGAT CCGCGCGCGG ATCGCAGCGG
24241 TCGAGGCGCT GGAGGCGCGG GGTGCACGGG TGACCGTGGC AGCGGTGGAC GTGGCCGACG
24301 TCGAACCGAT GACAGCGCTG GTTTCGTCGG TCGAGCCCCC GCTGCGAGGG GTGGTGCACG
24361 CCGCTGGCGT CAGCGTCATG CGTCCACTGG CGGAGACGGA CGAGACCCTG CTCGAGTCGG
24421 TGCTCCGTCC CAAGGTGGCC GGGAGCTGGC TGCTGCACCG GCTGCTGCAC GGCCGGCCTC
24481 TCGACCTGTT CGTGCTGTTC TCGTCGGGCG CAGCGGTGTG GGGTAGCCAT AGCCAGGGTG
24541 CGTACGCGGC GGCCAACGCT TTCCTCGACG GGCTCGCGCA TCTTCGGCGT TCGCAATCGC
24601 TGCCTGCGTT GAGCGTCGCG TGGGGTCTGT GGGCCGAGGG AGGCATGGCG GACGCGGAGG
24661 CTCATGCACG TCTGAGCGAC ATCGGGGTTC TGCCCATGTC GACGTCGGCA GCGTTGTCGG
24721 CGCTCCAGCG CCTGGTGGAG ACCGGCGCGG CTCAGCGCAC GGTGACCCGG ATGGACTGGG
24781 CGCGCTTCGC GCCGGTGTAC ACCGCTCGAG GGCGTCGCAA CCTGCTTTCG GCGCTGGTCG
24841 CAGGGCGCGA CATCATCGCG CCTTCCCCTC CGGCGGCAGC AACCCGGAAC TGGCGTGGCC
24901 TGTCCGTTGC GGAAGCCCGC ATGGCTCTGC ACGAGGTCGT CCATGGGGCC GTCGCTCGGG
24961 TGCTGGGCTT CCTCGACCCG AGCGCGCTCG ATCCTGGGAT GGGGTTCAAT GAGCAGGGCC
25021 TCGACTCGTT GATGGCGGTG GAGATCCGCA ACCTCCTTCA GGCTGAGCTG GACGTGCGGC
25081 TTTCGACGAC GCTGGCCTTT GATCATCCGA CGGTACAGCG GCTGGTGGAG CATCTGCTCG
25141 TCGATGTACT GAAGCTGGAG GATCGCAGCG ACACCCAGCA TGTTCGGTCG TTGGCGTCAG
25201 ACGAGCCCAT CGCCATCGTG GGAGCCGCCT GCCGCTTCCC GGGCGGGGTG GAGGACCTGG
25261 AGTCCTACTG GCAGCTGTTG GCCGAGGGCG TGGTGGTCAG CGCCGAGGTG CCGGCCGACC
25321 GGTGGGATGC GGCGGACTGG TACGACCCTG ATCCGGAGAT CCCAGGCCGG ACTTACGTGA
25381 CCAAAGGCGC CTTCCTGCGC GATTTGCAGA GATTGGATGC GACCTTCTTC CGCATCTCGC
25441 CTCGCGAGGC GATGAGCCTC GACCCGCAGC AGCGGTTGCT CCTGGAGGTA AGCTGGGAGG
25501 CGCTCGAGAG CGCGGGTATC GCTCCGGATA CGCTGCGAGA TAGCCCCACC GGGGTGTTCG
25561 TGGGTGCGGG GCCCAATGAG TACTACACGC AGCGGCTGCG AGGCTTCACC GACGGAGCGG
25621 CAGGGCTGTA CGGCGGCACC GGGAACATGC TCAGCGTTGC GGCTGGACGG CTGTCGTTTT
25681 TCCTGGGTCT GCACGGCCCG ACGCTGGCCA TGGATACGGC GTGCTCGTCC TCCCTGGTCG
25741 CGCTGCACCT CGCCTGCCAG AGCCTGCGAC TGGGCGAGTG CGATCAAGCG CTGGTTGGCG
25801 GGGTCAACGT GCTGCTCGCG CCGGAGACCT TCGTGCTGCT CTCACGGATG CGCGCGCTTT
25861 CGCCCGACGG GCGGTGCAAG ACGTTCTCGG CCGACGCGGA CGGCTACGCG CGGGGCGAGG
25921 GGTGCGCCGT GGTGGTGCTC AAGCGGCTGC GCGATGCGCA GCGCGCCGGC GACTCCATCC
25981 TGGCGCTGAT CCGGGGAAGC GCGGTGAACC ACGACGGCCC GAGCAGCGGG CTGACCGTGC
26041 CCAACGGACC CGCCCAGCAA GCATTGCTGC GCCAGGCGCT TTCGCAAGCA GGCGTGTCTC
26101 CGGTCGACGT TGATTTTGTG GAGTGTCACG GGACAGGGAC GGCGCTGGGC GACCCGATCG
26161 AGGTGCAGGC GCTGAGCGAG GTGTATGGTC CAGGGCGCTC CGAGGATCGA CCGCTGGTGC
26221 TGGGGGCCGT CAAGGCCAAC GTCGCGCATC TGGAGGCGGC ATCCGGCTTG GCCAGCCTGC
26281 TCAAGGCCGT GCTTGCGCTG CGGCACGAGC AGATCCCGGC CCAGCCGGAG CTGGGGGAGC
26341 TCAACCCGCA CTTGCCGTGG AACACGCTGC CGGTGGCGGT GCCACGTAAG GCGGTGCCGT
26401 GGGGGCGCGG CGCACGGCCG CGTCGGGCCG GCGTGAGCGC GTTCGGGTTG AGCGGAACCA
26461 ACGTGCATGT CGTGCTGGAG GAGGCACCGG AGGTGGAGCT GGTGCCCGCG GCGCCGGCGC
26521 GACCGGTGGA GCTGGTTGTG CTATCGGCCA AGAGCGCGGC GGCGCTGGAC GCCGCGGCGG
26581 AACGGCTCTC GGCGCACCTG TCCGCGCACC CGGAGCTGAG CCTCGGCGAC GTGGCGTTCA
26641 GCCTGGCGAC GACGCGCAGC CCGATGGAGC ACCGGCTCGC CATCGCGACG ACCTCGCGCG
26701 AGGCCCTGCG AGGCGCGCTG GACGCCGCGG CGCAGCGGCA GACGCCGCAG GGCGCGGTGC
26761 GCGGCAAGGC CGTGTCCTCA CGCGGTAAGT TGGCTTTCCT GTTCACCGGA CAGGGCGCGC
26821 AAATGCCGGG CATGGGCCGT GGGCTGTACG AGGCGTGGCC AGCCTTCCGG GAGGCGTTCG
26881 ACCGGTGCGT GGCGCTCTTC GATCGGGAGC TCGACCAGCC TCTGCGCGAG GTGATGTGGG
26941 CTGCGCCGGG CCTCGCTCAG GCGGCGCGGC TCGATCAGAC CGCGTACGCG CAGCCGGCTC
27001 TCTTTGCGCT GGAGTACGCG CTGGCTGCCC TGTGGCGTTC GTGGGGCGTG GAGCCGCACG
27061 TACTCCTCGG TCATAGCATC GGCGAGCTGG TCGCCGCCTG CGTGGCGGGC GTGTTCTCGC
27121 TCGAAGACGC GGTGAGGTTG GTGGCCGCGC GCGGGCGGCT GATGCAGGCG CTGCCCGCCG
27181 GCGGTGCCAT GGTCGCCATC GCAGCGTCCG AGGCCGAGGT GGCCGCCTCC GTGGCACCCC
27241 ACGCCGCCAC GGTGTCGATC GCCGCGGTCA ACGGTCCTGA CGCCGTCGTG ATCGCTGGCG
27301 CCGAGGTACA GGTGCTCGCC CTCGGCGCGA CGTTCGCGGC GCGTGGGATA CGCACGAAGA
27361 GGCTCGCCGT CTCCCATGCG TTCCACTCGC CGCTCATGGA TCCGATGCTG GAAGACTTCC
27421 AGCGGGTCGC TGCGACGATC GCGTACCGCG CGCCAGACCG CCCGGTGGTG TCGAATGTCA
27481 CCGGCCACGT CGCAGGCCCC GAGATCGCCA CGCCCGAGTA TTGGGTCCGG CATGTGCGAA
27541 GCGCCGTGCG CTTCGGCGAT GGGGCAAAGG CGTTGCATGC CGCGGGTGCC GCCACGTTCG
27601 TCGAGATTGG CCCGAAGCCG GTCCTGCTCG GGCTATTGCC AGCGTGCCTC GGGGAAGCGG
27661 ACGCGGTCCT CGTGCCGTCG CTACGCGCGG ACCGCTCGGA ATGCGAGGTG GTCCTCGCGG
27721 CGCTCGGGAC TTGGTATGCC TGGGGGGGTG CGCTCGACTG GAAGGGCGTG TTCCCCGATG
27781 GCGCGCGCCG CGTGGCTCTG CCCATGTATC CATGGCAGCG TGAGCGCCAT TGGATGGACC
27841 TCACCCCGCG AAGCGCCGCG CCTGCAGGGA TCGCAGGTCG CTGGCCGCTG GCTGGTGTCG
27901 GGCTCTGCAT GCCCGGCGCT GTGTTGCACC ACGTGCTCTC GATCGGACCA CGCCATCAGC
27961 CCTTCCTCGG TGATCACCTC GTGTTTGGCA AGGTGGTGGT GCCCGGCGCC TTTCATGTCG
28021 CGGTGATCCT CAGCATCGCC GCCGAGCGCT GGCCCGAGCG GGCGATCGAG CTGACAGGCG
28081 TGGAGTTCCT GAAGGCGATC GCGATGGAGC CCGACCAGGA GGTCGAGCTC CACGCCGTGC
28141 TCACCCCCGA AGCCGCCGGG GATGGCTACC TGTTCGAGCT GGCGACCCTG GCGGCGCCGG
28201 AGACCGAACG CCGATGGACG ACCCACGCCC GCGGTCGGGT GCAGCCGACA GACGGCGCGC
28261 CCGGCGCGTT GCCGCGCCTC GAGGTGCTGG AGGACCGCGC GATCCAGCCC CTCGACTTCG
28321 CCGGATTCCT CGACAGGTTA TCGGCGGTGC GGATCGGCTG GGGTCCGCTT TGGCGATGGC
28381 TGCAGGACGG GCGCGTCGGC GACGAGGCCT CGCTTGCCAC CCTCGTGCCG ACCTATCCGA
28441 ACGCCCACGA CGTGGCGCCC TTGCACCCGA TCCTGCTGGA CAACGGCTTT GCGGTGAGCC
28501 TGCTGGCAAC CCGGAGCGAG CCGGAGGACG ACGGGACGCC CCCGCTGCCG TTCGCCGTGG
28561 AACGGGTGCG GTGGTGGCGG GCGCCGGTTG GAAGGGTGCG GTGTGGCGGC GTGCCGCGGT
28621 CGCAGGCATT CGGTGTCTCG AGCTTCGTGC TGGTCGACGA AACTGGCGAG GTGGTCGCTG
28681 AGGTGGAGGG ATTTGTTTGC CGCCGGGCGC CGCGAGAGGT GTTCCTGCGG CAGGAGTCGG
28741 GCGCGTCGAC TGCAGCCTTG TACCGCCTCG ACTGGCCCGA AGCCCCCTTG CCCGATGCGC
28801 CTGCGGAACG GATGGAGGAG AGCTGGGTCG TGGTGGCAGC ACCTGGCTCG GAGATGGCCG
28861 CGGCGCTCGC AACACGGCTC AACCGCTGCG TACTCGCCGA ACCCAAAGGC CTCGAGGCGG
28921 CCCTCGCGGG GGTGTCTCCC GCAGGTGTGA TCTGCCTCTG GGAACCTGGA GCCCACGAGG
28981 AAGCTCCGGC GGCGGCGCAG CGTGTGGCGA CCGAGGGCCT TTCGGTGGTG CAGGCGCTCA
29041 GGGATCGCGC GGTGCGCCTG TGGTGGGTGA CCACGGGCGC CGTGGCTGTC GAGGCCGGTG
29101 AGCGGGTGCA GGTCGCCACA GCGCCGGTAT GGGGCCTGGG CCGGACAGTG ATGCAGGAGC
29161 GCCCGGAGCT CAGCTGCACT CTGGTGGATT TGGAGCCGGA GGTCGATGCC GCGCGTTCAG
29221 CTGACGTTCT GCTGCGGGAG CTCGGTCGCG CTGACGACGA GACCCAGGTG GTTTTCCGTT
29281 CCGGAGAGCG CCGCGTAGCG CGGCTGGTCA AAGCGACAAC CCCCGAAGGG CTCTTGGTCC
29341 CTGACGCAGA ATCCTATCGA CTGGAGGCTG GGCAGAAGGG CACATTGGAC CAGCTCCGCC
29401 TCGCGCCGGC ACAGCGCCGG GCACCCGGCC CGGGCGAGGT CGAGATCAAG GTAACCGCCT
29461 CGGGGCTCAA CTTCCGGACC GTCCTCGCTG TGCTGGGAAT GTATCCGGGC GACGCTGGGC
29521 CGATGGGCGG AGATTGTGCC GGTATCGTCA CGGCGGTGGG CCAGGGGGTG CACCACCTCT
29581 CGGTCGGCGA TGCTGTCATG ACGCTGGGGA CGTTGCATCG ATTCGTCACG GTCCACGCGC
29641 GGCTGGTGGT CCGGCAGCCT GCAGGGCTGA CTCCCGCGCA GGCAGCTACG GTGCCGGTTG
29701 CGTTCCTGAC GGCCTGGCTC GCTCTGCACG ACCTGGGGAA TCTGCGGCGC GGCGAGCGGG
29761 TGCTGATCCA TGCTGCGGCC GGCGGCGTGG GCATGGCCGC GGTGCAAATC GCCCGATGGA
29821 TAGGGGCCGA GGTGTTCGCC ACGGCGAGCC CGTCCAAGTG GGCAGCGGTT CAGGCCATGG
29881 GCGTGCCGCG CACGCACATC GCCAGCTCGC GGACGCTGGA GTTTGCTGAG ACGTTCCGGC
29941 AGGTCACCGG CGGCCGGGGC GTGGACGTGG TGCTCAACGC GCTGGCCGGC GAGTTCGTGG
30001 ACGCGAGCCT GTCCCTGCTG ACGACGGGCG GGCGGTTCCT CGAGATGGGC AAGACCGACA
30061 TACGGGATCG AGCCGCGGTC GCGGCGGCGC ATCCCGGTGT TCGCTATCGG GTATTCGACA
30121 TCCTGGAGCT CGCTCCGGAT CGAACTCGAG AGATCCTCGA GCGCGTGGTC GAGGGCTTTG
30181 CTGCGGGACA TCTGCGCGCA TTGCCGGTGC ATGCGTTCGC GATCACCAAG GCCGAGGCAG
30241 CGTTTCGGTT CATGGCGCAA GCGCGGCATC AGGGCAAGGT CGTGCTGCTG CCGGCGCCCT
30301 CCGCAGCGCC CTTGGCGCCG ACGGGCACCG TACTGCTGAC CGGTGGGCTG GGAGCGTTGG
30361 GGCTCCACGT GGCCCGCTGG CTCGCCCAGC AGGGCGCGCC GCACATGGTG CTCACAGGTC
30421 GGCGGGGCCT GGATACGCCG GGCGCTGCCA AAGCCGTCGC GGAGATCGAA GCGCTCGGCG
30481 CTCGGGTGAC GATCGCGGCG TCGGATGTCG CCGATCGGAA CGCGCTGGAG GCTGTGCTCC
30541 AGGCCATTCC GGCGGAGTGG CCGTTACAGG GCGTGATCCA TGCAGCCGGA GCGCTCGATG
30601 ATGGTGTGCT TGATGAGCAG ACCACCGACC GCTTCTCGCG GGTGCTGGCA CCGAAGGTGA
30661 CTGGCGCCTG GAATCTGCAT GAGCTCACGG CGGGCAACGA TCTCGCTTTC TTCGTGCTGT
30721 TCTCCTCCAT GTCGGGGCTC TTGGGCTCGG CCGGGCAGTC CAACTATGCG GCGGCCAACA
30781 CCTTCCTCGA CGCGCTGGCC GCGCATCGGC GGGCCGAAGG CCTGGCGGCG CAGAGCCTCG
30841 CGTGGGGCCC ATGGTCGGAC GGAGGCATGG CAGCGGGGCT CAGCGCGGCG CTGCAGGCGC
30901 GGCTCGCTCG GCATGGGATG GGAGCGCTGT CGCCCGCTCA GGGCACCGCG CTGCTCGGGC
30961 AGGCGCTGGC TCGGCCGGAA ACGCAGCTCG GGGCGATGTC GCTCGACGTG CGTGCGGCAA
31021 GCCAAGCTTC GGGAGCGGCA GTGCCGCCTG TGTGGCGCGC GCTGGTGCGC GCGGAGGCGC
31081 GCCATGCGGC GGCTGGGGCG CAGGGGGCAT TGGCCGCGCG CCTTGGGGCG CTGCCCGAGG
31141 CGCGTCGCGC CGACGAGGTG CGCAAGGTCG TGCAGGCCGA GATCGCGCGC GTGCTTTCAT
31201 GGGGCGCCGC GAGCGCCGTG CCCGTCGATC GGCCGCTGTC GGACTTGGGC CTCGACTCGC
31261 TCACGGCGGT GGAGCTGCGC AACGTGCTCG GCCAGCGGGT GGGTGCGACG CTGCCGGCGA
31321 CGCTGGCATT CGATCACCCG ACGGTCGACG CGCTCACGCG CTGGCTGCTC GATAAGGTCC
31381 TGGCCGTGGC CGAGCCGAGC GTATCGCCCG CAAAGTCGTC GCCGCAGGTC GCCCTCGACG
31441 AGCCCATTGC GGTGATCGGC ATCGGCTGCC GTTTCCCAGG CGGCGTGACC GATCCGGAGT
31501 CGTTTTGGCG GCTGCTCGAA GAGGGCAGCG ATGCCGTCGT CGAGGTGCCG CATGAGCGAT
31561 GGGACATCGA CGCGTTCTAT GATCCGGATC CGGATGTGCG CGGCAAGATG ACGACACGCT
31621 TTGGCGGCTT CCTGTCCGAT ATCGACCGGT TCGAGCCGGC CTTCTTCGGC ATCTCGCCGC
31681 GCGAAGCGAC GACCATGGAT CCGCAGCAGC GGCTGCTCCT GGAGACGAGC TGGGAGGCGT
31741 TCGAGCGCGC CGGGATTTTG CCCGAGCGGC TGATGGGCAG CGATACCGGC GTGTTCGTGG
31801 GGCTCTTCTA CCAGGAGTAC GCTGCGCTCG CCGGCGGCAT CGAGGCGTTC GATGGCTATC
31861 TAGGCACCGG CACCACGGCC AGCGTCGCCT CGGGCAGGAT CTCTTATGTG CTCGGGCTAA
31921 AGGGGCCGAG CCTGACGGTG GACACCGCGT GCTCCTCGTC GCTGGTCGCG GTGCACCTGG
31981 CCTGCCAGGC GCTGCGGCGG GGCGAGTGTT CGGTGGCGCT GGCCGGCGGC GTGGCGCTGA
32041 TGCTCACGCC GGCGACGTTC GTGGAGTTCA GCCGGCTGCG AGGCCTGGCT CCCGACGGAC
32101 GGTGCAAGAG CTTCTCGGCC GCAGCCGACG GCGTGGGGTG GAGCGAAGGC TGCGCCATGC
32161 TCCTGCTCAA ACCGCTTCGC GATGCTCAGC GCGATGGGGA TCCGATCCTG GCGGTGATCC
32221 GCGGCACCGC GGTGAACCAG GATGGGCGCA GCAACGGGCT GACGGCGCCC AACGGGTCGT
32281 CGCAGCAAGA GGTGATCCGT CGGGCCCTGG AGCAGGCGGG GCTGGCTCCG GCGGACGTCA
32341 GCTACGTCGA GTGCCACGGC ACCGGCACGA CGTTGGGCGA CCCCATCGAA GTGCAGGCCC
32401 TGGGCGCCGT GCTGGCACAG GGGCGACCCT CGGACCGGCC GCTCGTGATC GGGTCGGTGA
32461 AGTCCAATAT CGGACATACG CAGGCTGCGG CGGGCGTGGC CGGTGTCATC AAGGTGGCGC
32521 TGGCGCTCGA GCGCGGGCTT ATCCCGAGGA GCCTGCATTT CGACGCGCCC AATCCGCACA
32581 TTCCGTGGTC GGAGCTCGCC GTGCAGGTGG CCGCCAAACC CGTCGAATGG ACGAGAAACG
32641 GCGCGCCGCG ACGAGCCGGG GTGAGCTCGT TTGGCGTCAG CGGGACCAAC GCGCACGTGG
32701 TGCTGGAGGA GGCGCCAGCG GCGGCGTTCG CGCCCGCGGC GGCGCGTTCA GCGGAGCTTT
32761 TCGTGCTGTC GGCGAAGAGC GCCGCGGCGC TGGACGCGCA GGCGGCGCGG CTTTCGGCGC
32821 ATGTCGTTGC GCACCCGGAG CTCGGCCTCG GCGACCTGGC GTTCAGCCTG GCGACGACCC
32881 GCAGCCCGAT GACGTACCGG CTCGCGGTGG CGGCGACCTC GCGCGAGGCG CTGTCTGCGG
32941 CGCTCGACAC AGCGGCGCAG GGGCAGGCGC CGCCCGCAGC GGCTCGCGGC CACGCTTCCA
33001 CAGGCAGCGC CCCAAAGGTG GTTTTCGTCT TTCCTGGCCA GGGCTCCCAG TGGCTGGGCA
33061 TGGGCCAAAA GCTCCTCTCG GAGGAGCCCG TCTTCCGCGA CGCGCTCTCG GCGTGTGACC
33121 GAGCGATTCA GGCCGAAGCC GGCTGGTCGC TGCTCGCCGA GCTCGCGGCC GATGAGACCA
33181 CCTCGCAGCT CGGCCGCATC GACGTGGTGC AGCCGGCGCT GTTCGCGATC GAGGTCGCGC
33241 TGTCGGCGCT GTGGCGGTCG TGGGGCGTCG AGCCGGATGC AGTGGTAGGC CACAGCATGG
33301 GCGAAGTGGC GGCCGCGCAC GTCGCCGGCG CCCTGTCGCT CGAGGATGCT GTAGCGATCA
33361 TCTGCCGGCG CAGCCTGCTG CTGCGGCGGA TCAGCGGCCA AGGCGAGATG GCGGTCGTCG
33421 AGCTCTCCCT GGCCGAGGCC GAGGCAGCGC TCCTGGGCTA CGAAGATCGG CTCAGCGTGG
33481 CGGTGAGCAA CAGCCCGCGA TCGACGGTGC TGGCGGGCGA GCCGGCAGCG CTCGCAGAGG
33541 TGCTGGCGAT CCTTGCGGCA AAGGGGGTGT TCTGCCGTCG AGTCAAGGTG GACGTCGCCA
33601 GCCACAGCCC ACAGATCGAC CCGCTGCGCG ACGAGCTATT GGCAGCATTG GGCGAGCTCG
33661 AGCCGCGACA AGCGACCGTG TCGATGCGCT CGACGGTGAC GAGCACGATC GTGGCGGGCC
33721 CGGAGCTCGT GGCGAGCTAC TGGGCGGACA ACGTTCGACA GCCGGTGCGC TTCGCCGAAG
33781 CGGTGCAATC GTTGATGGAA GGCGGTCATG GGCTGTTCGT GGAGATGAGC CCGCATCCGA
33841 TCCTGACGAC GTCGGTCGAG GAGATCCGAC GGGCGACGAA GCGGGAGGGA GTCGCGGTGG
33901 GCTCGTTGCG GCGTGGACAG GACGAGCGCC TGTCCATGTT GGAGGCGCTG GGAGCGCTCT
33961 GGGTACACGG CCAGGCGGTG GGCTGGGAGC GGCTGTTCTC CGCGGGCGGC GCGGGCCTCC
34021 GTCGCGTGCC GCTGCCGACC TATCCCTGGC AGCGCGAGCG GTACTGGGTC GAAGCGCCGA
34081 CCGGCGGCGC GGCGAGCGGC AGCCGCTTTG CTCATGCGGG CAGTCACCCG CTCCTGGGTG
34141 AAATGCAGAC CCTGTCGACC CAGAGGAGCA CGCGCGTGTG GGAGACGACG CTGGATCTCA
34201 AACGGCTGCC GTGGCTCGGC GATCACCGGG TGCAGGGGGC GGTCGTGTTC CCGGGCGCGG
34261 CGTACCTGGA GATGGCGCTT TCGTCTGGGG CCGAGGCCTT GGGTGACGGT CCGCTCCAGG
34321 TCAGCGATGT GGTGCTCGCC GAGGCGCTGG CCTTCGCGGA TGATACGCCG GTGGCGGTGC
34381 AGGTCATGGC GACCGAGGAG CGACCAGGCC GCCTGCAATT CCACGTTGCG AGCCGGGTGC
34441 CGGGCCACGG CCGTGCTGCC TTTCGAAGCC ATGCCCGCGG GGTGCTGCGC CAGACCGAGC
34501 GCGCCGAGGT CCCGGCGAGG CTGGATCTGG CCGCGCTTCG TGCCCGGCTT CAGGCCAGCG
34561 CACCCGCTGC GGCTACCTAT GCGGCGCTGG CCGAGATGGG GCTCGAGTAC GGCCCAGCGT
34621 TCCAGGGGCT TGTCGAGCTG TGGCGGGGGG AGGGCGAGGC GCTGGGACGT GTGCGGCTCC
34681 CCGAGGCCGC CGGCTCCCCA GCCGCGTGCC GGCTCCACCC CGCGCTCTTG GATGCGTGCT
34741 TCCACGTGAG CAGCGCCTTC GCTGACCGCG GCGAGGCGAC GCCATGGGTA CCCGTCGAAA
34801 TCGGCTCGCT GCGGTGGTTC CAGCGGCCGT CGGGGGAGCT GTGGTGTCAT GCGCGGAGCG
34861 TGAGCCACGG AAAGCCAACA CCCGATCGGC GGAGTACCGA CTTTTGGGTG GTCGACAGCA
34921 CGGGCGCGAT CGTCGCCGAG ATCTCCGGGC TCGTGGCGCA GCGGCTCGCG GGAGGTGTAC
34981 GCCGGCGCGA AGAAGACGAC TGGTTCATGG AGCCGGCTTG GGAACCGACC GCGGTCCCCG
35041 GATCCGAGGT CACGGCGGGC CGGTGGCTGC TCATCGGCTC GGGCGGCGGG CTCGGCGCTG
35101 CGCTCTACTC GGCGCTGACG GAAGCTGGCC ATTCCGTCGT CCACGCGACA GGGCACGGCA
35161 CGAGCGCCGC CGGGTTGCAG GCACTCCTGA CGGCGTCCTT CGACGGCCAG GCCCCGACGT
35221 CGGTGGTGCA CCTCGGCAGC CTCGATGAGC GTGGCGTGCT CGACGCGGAT GCCCCCTTCG
35281 ACGCCGATGC CCTCGAGGAG TCGCTGGTGC GCGGCTGCGA CAGCGTGCTC TGGACCGTGC
35341 AGGCCGTGGC CGGGGCGGGC TTCCGAGATC CTCCGCGGTT GTGGCTCGTG ACACGCGGCG
35401 CTCAGGCCAT CGGCGCCGGC GACGTCTCCG TGGCGCAAGC GCCGCTCCTG GGGCTGGGCC
35461 GCGTTATCGC CTTGGAGCAC GCCGAGCTGC GCTGCGCTCG GATCGACCTC GATCCAGCGC
35521 GGCGCGACGG AGAGGTCGAT GAGCTGCTTG CCGAGCTGTT GGCCGACGAC GCCGAGGAGG
35581 AAGTCGCGTT TCGCGGCGGT GAGCGGCGCG TGGCCCGGCT CGTCCGAAGG CTGCCCGAGA
35641 CCGACTGCCG AGAGAAAATC GAGCCCGCGG AAGGCCGGCC GTTCCGGCTG GAGATCGATG
35701 GGTCCGGCGT GCTCGACGAC CTGGTGCTCC GAGCCACGGA GCGGCGCCCT CCTGGCCCGG
35761 GCGAGGTCGA GATCGCCGTC GAGGCGGCGG GGCTCAACTT TCTCGACGTG ATGAGGGCCA
35821 TGGGGATCTA CCCTGGGCCC GGGGACGGTC CGGTTGCGCT GGGCGCCGAG TGCTCCGGCC
35881 GAATTGTCGC GATGGGCGAA GGTGTCGAGA GCCTTCGTAT CGGCCAGGAC GTCGTGGCCG
35941 TCGCGCCCTT CAGTTTCGGC ACCCACGTCA CCATCGACGC CCGGATGGTC GCACCTCGCC
36001 CCGCGGCGCT GACGGCCGCG CAGGCAGCCG CGCTGCCCGT CGCATTCATG ACGGCCTGGT
36061 ACGGTCTCGT CCATCTGGGG AGGCTCCGGG CCGGCGAGCG CGTGCTCATC CACTCGGCGA
36121 CGGGGGGCAC CGGGCTCGCT GCTGTGCAGA TCGCCCGCCA CCTCGGCGCG GAGATATTTG
36181 CGACCGCTGG TACGCCGGAG AAGCGGGCGT GGCTGCGCGA GCAGGGGATC GCGCACGTGA
36241 TGGACTCGCG GTCGCTGGAC TTCGCCGAGC AAGTGCTGGC CGCGACGAAG GGCGAGGGGG
36301 TCGACGTCGT GTTGAACTCG CTGTCTGGCG CCGCGATCGA CGCGAGCCTT GCGACCCTCG
36361 TGCCGGACGG CCGCTTCATC GAGCTCGGCA AGACGGACAT CTATGCAGAT CGCTCGCTGG
36421 GGCTCGCTCA CTTTAGGAAG AGCCTGTCCT ACAGCGCCGT CGATCTTGCG GGTTTGGCCG
36481 TGCGTCGGCC CGAGCGCGTC GCAGCGCTGC TGGCGGAGGT GGTGGACCTG CTCGCACGGG
36541 GAGCGCTGCA GCCGCTTCCG GTAGAGATCT TCCCCCTCTC GCGGGCCGCG GACGCGTTCC
36601 GGAAAATGGC GCAAGCGCAG CATCTCGGGA AGCTCGTGCT CGCGCTGGAG GACCCGGACG
36661 TGCGGATCCG CGTTCCGGGC GAATCCGGCG TCGCCATCCG CGCGGACGGC ACCTACCTCG
36721 TGACCGGCGG TCTGGGTGGG CTCGGTCTGA GCGTGGCTGG ATGGCTGGCC GAGCAGGGGG
36781 CTGGGCATCT GGTGCTGGTG GGCCGCTCCG GTGCGGTGAG CGCGGAGCAG CAGACGGCTG
36841 TCGCCGCGCT CGAGGCGCAC GGCGCGCGTG TCACGGTAGC GAGGGCAGAC GTCGCCGATC
36901 GGGCGCAGAT CGAGCGGATC CTCCGCGAGG TTACCGCGTC GGGGATGCCG CTCCGCGGCG
36961 TCGTTCATGC GGCCGGTATC CTGGACGACG GGCTGCTGAT GCAGCAAACC CCCGCGCGGT
37021 TCCGCGCGGT CATGGCGCCC AAGGTCCGAG GGGCCTTGCA CCTGCATGCG TTGACACGCG
37081 AAGCGCCGCT CTCCTTCTTC GTGCTGTACG CTTCGGGAGC AGGGCTCTTG GGCTCGCCGG
37141 GCCAGGGCAA CTACGCCGCG GCCAACACGT TCCTCGACGC TCTGGCACAC CACCGGAGGG
37201 CGCAGGGGCT GCCAGCATTG AGCATCGACT GGGGCCTGTT CGCGGACGTG GGTTTGGCCG
37261 CCGGGCAGCA AAATCGCGGC GCACGGCTGG TCACCCGCGG GACGCGGAGC CTCACCCCCG
37321 ACGAAGGGCT GTGGGCGCTC GAGCGTCTGC TCGACGGCGA TCGCACCCAG GCCGGGGTCA
37381 TGCCGTTCGA CGTGCGGCAG TGGGTGGAGT TCTACCCGGC GGCGGCATCT TCGCGGAGGT
37441 TGTCGCGGCT GGTGACGGCA CGGCGCGTGG CTTCCGGTCG GCTCGCCGGG GATCGGGACC
37501 TGCTCGAACG GCTCGCCACC GCCGAGGCGG GCGCGCGGGC AGGAATGCTG CAGGAGGTCG
37561 TGCGCGCGCA GGTCTCGCAG GTGCTGCGCC TCCCCGAAGG CAAGCTCGAC GTGGATGCGC
37621 CGCTCACGAG CCTGGGAATG GACTCGCTGA TGGGGCTAGA GCTGCGCAAC CGCATCGAGG
37681 CCGTGCTCGG CATCACCATG CCGGCGACCC TGCTGTGGAC CTACCCCACG GTGGCAGCGC
37741 TGAGTGCGCA TCTGGCTTCT CATGTCGTCT CTACGGGGGA TGGGGAATCC GCGCGCCCGC
37801 CGGATACAGG GAACGTGGCT CCAATGACCC ACGAAGTCGC TTCGCTCGAC GAAGACGGGT
37861 TGTTCGCGTT GATTGATGAG TCACTCGCGC GTGCGGGAAA GAGGTGATTG CGTGACAGAC
37921 CGAGAAGGCC AGCTCCTGGA GCGCTTGCGT GAGGTTACTC TGGCCCTTCG CAAGACGCTG
37981 AACGAGCGCG ATACCCTGGA GCTCGAGAAG ACCGAGCCGA TCGCCATCGT GGGGATCGGC
38041 TGCCGCTTCC CCGGCGGAGC GGGCACTCCG GAGGCGTTCT GGGAGCTGCT CGACGACGGG
38101 CGCGACGCGA TCCGGCCGCT CGAGGAGCGC TGGGCGCTCG TAGGTGTCGA CCCAGGCGAC
38161 GACGTACCGC GCTGGGCGGG GCTGCTCACC GAAGCCATCG ACGGCTTCGA CGCCGCGTTC
38221 TTCGGTATCG CCCCCCGGGA GGCACGGTCG CTCGACCCGC AGCATCGCTT GCTGCTGGAG
38281 GTCGCCTGGG AGGGGTTCGA AGACGCCGGC ATCCCGCCTA GGTCCCTCGT CGGGAGCCGC
38341 ACCGGCGTGT TCGTCGGCGT CTGCGCCACG GAGTATCTCC ACGCCGCCGT CGCGCACCAG
38401 CCGCGCGAAG AGCGGGACGC GTACAGCACC ACCGGCAACA TGCTCAGCAT CGCCGCCGGA
38461 CGGCTATCGT ACACGCTGGG GCTGCAGGGA CCTTGCCTGA CCGTCGACAC GGCGTGCTCG
38521 TCATCGCTGG TGGCCATTCA CCTCGCCTGC CGCAGCCTGC GCGCTCGAGA GAGCGATCTC
38581 GCGCTGGCGG GAGGGGTCAA CATGCTTCTC TCCCCCGACA CGATGCGAGC TCTGGCGCGC
38641 ACCCAGGCGC TGTCGCCCAA TGGCCGTTGC CAGACCTTCG ACGCGTCGGC CAACGGGTTC
38701 GTCCGTGGGG AGGGCTGCGG TCTGATCGTG CTCAAGCGAT TGAGCGACGC GCGGCGGGAT
38761 GGGGACCGGA TCTGGGCGCT GATCCGAGGA TCGGCCATCA ATCAGGACGG CCGGTCGACG
38821 GGGTTGACGG CGCCCAACGT GCTCGCCCAG GGGGCGCTCT TGCGCGAGGC GCTGCGGAAC
38881 GCCGGCGTCG AGGCCGAGGC CATCGGTTAC ATCGAGACCC ACGGGGCGGC GACCTCGCTG
38941 GGCGACCCCA TCGAGATCGA AGCGCTGCGC ACCGTGGTGG GGCCGGCGCG AGCCGACGGA
39001 GCGCGCTGCG TGCTGGGCGC GGTGAAGACC AACCTCGGCC ACCTGGAGGG CGCTGCCGGC
39061 GTGGCGGGCC TGATCAAGGC TACACTTTCG CTACATCACG AGCGCATCCC GAGGAACCTC
39121 AACTTTCGTA CGCTCAATCC GCGGATCCGG ATCGAGGGGA CCGCGCTCGC GTTGGCGACC
39181 GAACCGGTGC CCTGGCCGCG GACGGGCCGG ACGCGCTTCG CGGGAGTGAG CTCGTTCGGG
39241 ATGAGCGGGA CCAACGCGCA TGTGGTGTTG GAGGAGGCGC CGGCGGTGGA GCCTGAGGCC
39301 GCGGCCCCCG AGCGCGCTGC GGAGCTGTTC GTCCTGTCGG CGAAGAGCGT GGCGGCGCTG
39361 GATGCGCAGG CAGCCCGGCT GCGGGACCAC CTGGAGAAGC ATGTCGAGCT TGGCCTCGGC
39421 GATGTGGCGT TCAGCCTGGC GACGACGCGC AGCGCGATGG AGCACCGGCT GGCGGTGGCC
39481 GCGAGCTCGC GCGAGGCGCT GCGAGGGGCG CTTTCGGCCG CAGCGCAGGG GCATACGCCG
39541 CCGGGAGCCG TGCGTGGGCG GGCCTCCGGC GGCAGCGCGC CGAAGGTGGT CTTCGTGTTT
39601 CCCGGCCAGG GCTCGCAGTG GGTGGGCATG GGCCGAAAGC TCATGGCCGA AGAGCCGGTC
39661 TTCCGGGCGG CGCTGGAGGG TTGCGACCGG GCCATCGAGG CGGAAGCGGG CTGGTCGCTG
39721 CTCGGGGAGC TCTCCGCCGA CGAGGCCGCC TCGCAGCTCG GGCGCATCGA CGTGGTTCAG
39781 CCGGTGCTCT TCGCCATGGA AGTAGCGCTT TCTGCGCTGT GGCGGTCGTG GGGAGTGGAG
39841 CCGGAAGCGG TGGTGGGCCA CAGCATGGGC GAGGTGGCGG CGGCGCACGT GGCCGGCGCG
39901 CTGTCGCTCG AGGACGCGGT GGCGATCATC TGCCGGCGCA GCCGGCTGCT GCGGCGGATC
39961 AGCGGTCAGG GCGAGATGGC GCTGGTCGAG CTGTCGCTGG AGGAGGCCGA GGCGGCGCTG
40021 CGTGGCCATG AGGGTCGGCT GAGCGTGGCG GTGAGCAACA GCCCGCGCTC GACCGTGCTC
40081 GCAGGCGAGC CGGCGGCGCT CTCGGAGGTG CTGGCGGCGC TGACGGCCAA GGGGGTGTTC
40141 TGGCGGCAGG TGAAGGTGGA CGTCGCCAGC CATAGCCCGC AGGTCGACCC GCTGCGCGAA
40201 GAGCTGATCG CGGCGCTGGG GGCGATCCGG CCGCGAGCGG CTGCGGTGCC GATGCGCTCG
40261 ACGGTGACGG GCGGGGTGAT CGCGGGTCCG GAGCTCGGTG CGAGCTACTG GGCGGACAAT
40321 CTTCGGCAGC CGGTGCGCTT CGCTGCGGCG GCGCAAGCGC TGCTGGAAGG TGGCCCCACG
40381 CTGTTCATCG AGATGAGCCC GCACCCGATC CTGGTGCCGC CCCTGGACGA GATCCAGACG
40441 GCGGTCGAGC AAGGGGGCGC TGCGGTGGGC TCGCTGCGGC GAGGGCAGGA CGAGCGCGCG
40501 ACGCTGCTGG AGGCGCTGGG GACGCTGTGG GCGTCCGGCT ATCCGGTGAG CTGGGCTCGG
40561 CTGTTCCCCG CGGGCGGCAG GCGGGTTCCG CTGCCGACCT ATCCCTGGCA GCACGAGCGG
40621 TGCTGGATCG AGGTCGAGCC TGACGCCCGC CGCCTCGCCG CAGCCGACCC CACCAAGGAC
40681 TGGTTCTACC GGACGGACTG GCCCGAGGTG CCCCGCGCCG CCCCGAAATC GGAGACAGCT
40741 CATGGGAGCT GGCTGCTGTT GGCCGACAGG GGTGGGGTCG GCGAGGCGGT CGCTGCAGCG
40801 CTGTCGACGC GCGGACTTTC CTGCACCGTG CTTCATGCGT CGGCTGACGC CTCCACCGTC
40861 GCCGAGCAGG TATCCGAAGC TGCCAGTCGC CGAAACGACT GGCAGGGAGT CCTCTACCTG
40921 TGGGGCCTCG ACGCCGTCGT CGATGCTGGG GCATCGGCCG ACGAAGTCAG CGAGGCTACC
40981 CGCCGTGCCA CCGCACCCGT CCTTGGGCTG GTTCGATTCC TGAGCGCTGC GCCCCATCCT
41041 CCTCGCTTCT GGGTGGTGAC CCGCGGGGCA TGCACGGTGG GCGGCGAGCC AGAGGTCTCT
41101 CTTTGCCAAG CGGCGTTGTG GGGCCTCGCG CGCGTCGTGG CGCTGGAGCA TCCCGCTGCC
41161 TGGGGTGGCC TCGTGGACCT GGATCCTCAG AAGAGCCCGA CGGAGATCGA GCCCCTGGTG
41221 GCCGAGCTGC TTTCGCCGGA CGCCGAGGAT CAACTGGCGT TCCGCAGCGG TCGCCGGCAC
41281 GCAGCACGCC TTGTAGCCGC CCCGCCGGAG GGCGACGTCG CACCGATATC GCTGTCCGCG
41341 GAGGGAAGCT ACCTGGTGAC GGGTGGGCTG GGTGGCCTTG GTCTGCTCGT GGCTCGGTGG
41401 CTGGTGGAGC GGGGAGCTCG ACATCTGGTG CTCACCAGCC GGCACGGGCT GCCAGAGCGA
41461 CAGGCGTCGG GCGGAGAGCA GCCGCCGGAG GCCCGCGCGC GCATCGCAGC GGTCGAGGGG
41521 CTGGAAGCGC AGGGCGCGCG GGTGACCGTG GCAGCGGTGG ATGTCGCCGA GGCCGATCCC
41581 ATGACGGCGC TGCTGGCCGC CATCGAGCCC CCGTTGCGCG GGGTGGTGCA CGCCGCCGGC
41641 GTCTTCCCCG TGCGTCCCCT GGCGGAGACG GACGAGGCCC TGCTGGAGTC GGTGCTCCGT
41701 CCCAAGGTGG CCGGGAGCTG GCTGCTGCAC CGGCTGCTGC GCGACCGGCC TCTCGACCTG
41761 TTCGTGCTGT TCTCGTCGGG CGCGGCGGTG TGGGGTGGCA AAGGCCAAGG CGCATACGCC
41821 GCGGCCAATG CGTTCCTCGA CGGGCTCGCG CACCATCGCC GCGCGCACTC CCTGCCGGCG
41881 TTGAGCCTCG CCTGGGGCCT ATGGGCCGAG GGAGGCGTGG TTGATGCAAA GGCTCATGCA
41941 CGTCTGAGCG ACATCGGAGT CCTGCCCATG GCCACGGGGC CGGCCTTGTC GGCGCTGGAG
42001 CGCCTGGTGA ACACCAGCGC TGTCCAGCGT TCGGTCACAC GGATGGACTG GGCGCGCTTC
42061 GCGCCGGTCT ATGCCGCGCG AGGGCGGCGC AACTTGCTTT CGGCTCTGGT CGCGGAGGAC
42121 GAGCGCACTG CGTCTCCCCC GGTGCCGACG GCAAACCGGA TCTGGCGCGG CCTGTCCGTT
42181 GCGGAGAGCC GCTCAGCCCT CTACGAGCTC GTTCGCGGCA TCGTCGCCCG GGTGCTGGGC
42241 TTCTCCGACC CGGGCGCGCT CGACGTCGGC CGAGGCTTCG CCGAGCAGGG GCTCGACTCC
42301 CTGATGGCTC TGGAGATCCG TAACCGCCTT CAGCGCGAGC TGGGCGAACG GCTGTCGGCG
42361 ACTCTGGCCT TCGACCACCC GACGGTGGAG CGGCTGGTGG CGCATCTCCT CACCGACGTG
42421 CTGAAGCTGG AGGACCGGAG CGACACCCGG CACATCCGGT CGGTGGCGGC GGATGACGAC
42481 ATCGCCATCG TCGGTGCCGC CTGCCGGTTC CCGGGCGGGG ATGAGGGCCT GGAGACATAC
42541 TGGCGGCATC TGGCCGAGGG CATGGTGGTC AGCACCGAGG TGCCAGCCGA CCGGTGGCGC
42601 GCGGCGGACT GGTACGACCC CGATCCGGAG GTTCCGGGCC GGACCTATGT GGCCAAGGGG
42661 GCCTTCCTCC GCGATGTGCG CAGCTTGGAT GCGGCGTTCT TCTCCATCTC CCCTCGTGAG
42721 GCGATGAGCC TGGACCCGCA ACAGCGGCTG TTGCTGGAGG TGAGCTGGGA GGCGATCGAG
42781 CGCGCTGGCC AGGACCCGAT GGCGCTGCGC GAGAGCGCCA CGGGCGTGTT CGTGGGCATG
42841 ATCGGGAGCG AGCACGCCGA GCGGGTGCAG GGCCTCGACG ACGACGCGGC GTTGCTGTAC
42901 GGCACCACCG GCAACCTGCT CAGCGTCGCC GCTGGACGGC TGTCGTTCTT CCTGGGTCTG
42961 CACGGCCCGA CGATGACGGT GGACACCGCG TGCTCGTCGT CGCTGGTGGC GTTGCACCTC
43021 GCCTGCCAGA GCCTGCGATT GGGCGAGTGC GACCAGGCAC TGGCCGGCGG GTCCAGCGTG
43081 CTTTTGTCGC CGCGGTCATT CGTCGCGGCA TCGCGCATGC GTTTGCTTTC GCCAGATGGG
43141 CGGTGCAAGA CGTTCTCGGC CGCTGCAGAC GGCTTTGCGC GGGCCGAGGG CTGCGCCGTG
43201 GTGGTGCTCA AGCGGCTCCG TGACGCGCAG CGCGACCGCG ACCCCATCCT GGCGGTGGTC
43261 CGGAGCACGG CGATCAACCA CGATGGCCCG AGCAGCGGGC TCACGGTGCC CAGCGGTCCT
43321 GCCCAGCAGG CGTTGCTAGG CCAGGCGCTG GCGCAAGCGG GCGTGGCACC GGCCGAGGTC
43381 GATTTCGTGG AGTGCCACGG GACGGGGACA GCGCTGGGTG ACCCGATCGA GGTGCAGGCG
43441 CTGGGCGCGG TGTATGGCCG GGGCCGCCCC GCGGAGCGGC CGCTCTGGCT GGGCGCTGTC
43501 AAGGCCAACC TCGGCCACCT GGAGGCCGCG GCGGGCTTGG CCGGCGTGCT CAAGGTGCTC
43561 TTGGCGCTGG AGCACGAGCA GATTCCGGCT CAACCGGAGC TCGACGAGCT CAACCCGCAC
43621 ATCCCGTGGG CAGAGCTGCC AGTGGCCGTT GTCCGCGCGG CGGTCCCCTG GCCGCGCGGC
43681 GCGCGCCCGC GTCGTGCAGG CGTGAGCGCT TTCGGCCTGA GCGGGACCAA CGCGCATGTG
43741 GTGTTGGAGG AGGCGCCGGC GGTGGAGCCT GAGGCCGCGG CCCCCGAGCG CGCTGCGGAG
43801 CTGTTCGTCC TGTCGGCGAA GAGCGTGGCG GCGCTGGATG CGCAGGCAGC CCGGCTGCGG
43861 GATCATCTGG AGAAGCATGT CGAGCTTGGC CTCGGCGATG TGGCGTTCAG CCTGGCGACG
43921 ACGCGCAGCG CGATGGAGCA CCGGCTGGCG GTGGCCGCGA GCTCGCGCGA GGCGCTGCGA
43981 GGGGCGCTTT CGGCCGCAGC GCAGGGGCAT ACGCCGCCGG GAGCCGTGCG TGGGCGGGCC
44041 TCCGGCGGCA GCGCGCCGAA GGTGGTCTTC GTGTTTCCCG GCCAGGGCTC GCAGTGGGTG
44101 GGCATGGGCC GAAAGCTCAT GGCCGAAGAG CCGGTCTTCC GGGCGGCGCT GGAGGGTTGC
44161 GACCGGGCCA TCGAGGCGGA AGCGGGCTGG TCGCTGCTCG GGGAGCTCTC CGCCGACGAG
44221 GCCGCCTCGC AGCTCGGGCG CATCGACGTG GTTCAGCCGG TGCTCTTCGC CGTGGAAGTA
44281 GCGCTTTCAG CGCTGTGGCG GTCGTGGGGA GTGGAGCCGG AAGCGGTGGT GGGCCACAGC
44341 ATGGGCGAGG TTGCGGCGGC GCACGTGGCC GGCGCGCTGT CGCTCGAGGA TGCGGTGGCG
44401 ATCATCTGCC GGCGCAGCCG GCTGCTGCGG CGGATCAGCG GTCAGGGCGA GATGGCGCTG
44461 GTCGAGCTGT CGCTGGAGGA GGCCGAGGCG GCGCTGCGTG GCCATGAGGG TCGGCTGAGC
44521 GTGGCGGTGA GCAACAGCCC GCGCTCGACC GTGCTCGCAG GCGAGCCGGC GGCGCTCTCG
44581 GAGGTGCTGG CGGCGCTGAC GGCCAAGGGG GTGTTCTGGC GGCAGGTGAA GGTGGACGTC
44641 GCCAGCCATA GCCCGCAGGT CGACCCGCTG CGCGAAGAGC TGGTCGCGGC GCTGGGAGCG
44701 ATCCGGCCGC GAGCGGCTGC GGTGCCGATG CGCTCGACGG TGACGGGCGG GGTGATTGCG
44761 GGTCCGGAGC TCGGTGCGAG CTACTGGGCG GACAATCTTC GGCAGCCGGT GCGCTTCGCT
44821 GCGGCGGCGC AAGCGCTGCT GGAAGGTGGC CCCACGCTGT TCATCGAGAT GAGCCCGCAC
44881 CCGATCCTGG TGCCGCCTCT GGACGAGATC CAGACGGCGG TCGAGCAAGG GGGCGCTGCG
44941 GTGGGCTCGC TGCGGCGAGG GCAGGACGAG CGCGCGACGC TGCTGGAGGC GCTGGGGACG
45001 CTGTGGGCGT CCGGCTATCC GGTGAGCTGG GCTCGGCTGT TCCCCGCGGG CGGCAGGCGG
45061 GTTCCGCTGC CGACCTATCC CTGGCAGCAC GAGCGGTACT GGATCGAGGA CAGCGTGCAT
45121 GGGTCGAAGC CCTCGCTGCG GCTTCGGCAG CTTCATAACG GCGCCACGGA CCATCCGCTG
45181 CTCGGGGCTC CATTGCTCGT CTCGGCGCGA CCCGGAGCTC ACTTGTGGGA GCAAGCGCTG
45241 AGCGACGAGA GGCTATCCTA TCTTTCGGAA CATAGGGTCC ATGGCGAAGC CGTGTTGCCC
45301 AGCGCGGCGT ATGTAGAGAT GGCGCTCGCC GCCGGCGTAG ATCTCTATGG CGCGGCGACG
45361 CTGGTGCTGG AGCAGCTGGC GCTCGAGCGA GCCCTCGCCG TGCCTTCCGA AGGCGGACGC
45421 ATCGTGCAAG TGGCCCTCAG CGAAGAAGGG CCCGGTCGGG CCTCATTCCA GGTATCGAGC
45481 CGTGAGGAGG CAGGTAGAAG CTGGGTTCGG CACGCCACGG GGCACGTGTG TAGCGACCAG
45541 AGCTCAGCAG TGGGAGCGTT GAAGGAAGCT CCGTGGGAGA TTCAACAGCG ATGTCCGAGC
45601 GTCCTGTCGT CGGAGGCGCT CTATCCGCTG CTCAACGAGC ACGCCCTCGA CTATGGCCCC
45661 TGCTTCCAGG GTGTGGAGCA GGTGTGGCTC GGCACGGGGG AGGTGCTCGG CCGGGTACGC
45721 TTGCCAGAAG ACATGGCATC CTCAAGTGGC GCCTATCGGA TTCATCCCGC CTTGTTGGAT
45781 GCATGTTTTC AAGTGCTGAC CGCGCTGCTC ACCACGCCGG AATCCATCGA GATTCGGAGG
45841 CGGCTGACGG ATCTCCACGA ACCGGATCTC CCGCGGTCCA GGGCTCCGGT GAATCAAGCG
45901 GTGAGTGACA CCTGGCTGTG GGACGCCGCG CTGGACGGTG GACGGCGCCA GAGCGCGAGC
45961 GTGCCCGTCG ACCTGGTGCT CGGCAGCTTC CACGCGAAGT GGGAGGTCAT GGATCGCCTC
46021 GCGCAGACGT ACATCATCCG CACTCTCCGC ACATGGAACG TCTTCTGCGC TGCTGGAGAG
46081 CGTCACACGA TAGACGAGTT GCTCGTCAGG CTCCAAATCT CTGCTGTCTA CAGGAAGGTC
46141 ATCAAGCGAT GGATGGATCA CCTTGTCGCG ATCGGCGTCC TTGTAGGGGA CGGAGAGCAT
46201 CTTGTGAGCT CTCAGCCGCT GCCGGAGCAT GATTGGGCGG CGGTGCTCGA GGAGGCCGCG
46261 ACGGTGTTCG CCGACCTCCC AGTCCTACTT GAGTGGTGCA AGTTTGCCGG GGAACGGCTC
46321 GCGGACGTGT TGACCGGGAA GACGCTGGCG CTCGAGATCC TCTTCCCTGG CGGCTCGTTC
46381 GATATGGCGG AGCGAATCTA TCAAGATTCG CCCATCGCCC GTTACTCGAA CGGCATCGTG
46441 CGCGGTGTCG TCGAGTCGGC GGCGCGGGTG GTAGCACCGT CGGGAACGTT CAGCATCTTG
46501 GAGATCGGAG CAGGGACGGG CGCGACCACC GCCGCCGTCC TCCCGGTGTT GCTGCCTGAC
46561 CGGACAGAAT ACCATTTCAC CGATGTTTCT CCGCTCTTCC TTGCTCGTGC GGAGCAAAGA
46621 TTTCGAGATC ATCCATTCCT GAAGTATGGT ATTCTGGATA TCGACCAGGA GCCAGCTGGC
46681 CAGGGATACG CACATCAGAA GTTCGACGTC ATCGTCGCGG CCAACGTCAT CCATGCGACC
46741 CGCGATATAA GAGCCACGGC GAAGCGTCTC CTGTCGTTGC TCGCGCCCGG AGGCCTTCTG
46801 GTGCTGGTCG AGGGCACAGG GCATCCGATC TGGTTCGATA TCACCACGGG ATTGATCGAG
46861 GGGTGGCAGA AGTACGAAGA TGATCTTCGT ACCGACCATC CGCTCCTGCC TGCTCGGACC
46921 TGGTGTGACG TCCTGCGCCG GGTAGGCTTT GCGGATGCCG TGAGTCTGCC AGGCGACGGA
46981 TCTCCGGCGG GGATCCTCGG ACAGCACGTG ATCCTCTCGC GCGCTCCGGG CATAGCAGGA
47041 GCCGCTTGTG ACAGCTCCGG TGAGTCGGCG ACCGAATCGC CGGCCGCGCG TGCAGTACGG
47101 CAGGAATGGG CCGATGGCTC CGCTGACGGC GTCCATCGGA TGGCGTTGGA GAGAATGTAC
47161 TTCCACCGCC GGCCGGGCCG GCAGGTTTGG GTCCACGGTC GATTGGGTAC CGGTGGAGGC
47221 GCGTTCACGA AGGCGCTCAC TGGAGATCTG CTCCTGTTCG AAGAGACCGG GCAGGTCGTG
47281 GCAGAGGTTC AGGGGCTCCG CCTGCCGCAG CTCGAGGCTT CTGCTTTCGC GCCGCGGGAC
47341 CCGCGGGAAG AGTGGTTGTA CGCGTTGGAA TGGCAGCGCA AAGACCCTAT ACCAGAGGCT
47401 CCGGCAGCCG CGTCTTCTTC CACCGCGGGG GCTTGGCTCG TGCTGATGGA CCAGGGCGGG
47461 ACAGGCGCTG CGCTCGTATC GCTGCTGGAA GGGCGAGGCG AGGCGTGCGT GCGCGTCGTC
47521 GCGGGTACGG CATACGCCTG CCTCGCGCCG GGGCTGTATC AAGTCGATCC GGCGCAGCCA
47581 GATGGCTTTC ATACCCTGCT CCGCGATGCA TTCGGCGAGG ACCGGATGTG CCGCGCGGTA
47641 GTGCATATGT GGAGCCTTGA TGCGAAGGCA GCAGGGGAGA GGACGACAGC GGAGTCGCTT
47701 CAGGCCGATC AACTCCTGGG GAGCCTGAGC GCGCTTTCTC TGGTGCAGGC GCTGGTGCGC
47761 CGGAGGTGGC GCAACATGCC GCGACTTTGG CTCTTGACCC GCGCCGTGCA TGCGGTGGGC
47821 GCGGAGGACG CAGCGGCCTC GGTGGCGCAG GCGCCGGTGT GGGGCCTCGG TCGGACGCTC
47881 GCGCTCGAGC ATCCAGAGCT GCGGTGCACG CTCGTGGACG TGAACCCGGC GCCGTCTCCA
47941 GAGGACGCAG CTGCACTCGC GGTGGAGCTC GGGGCGAGCG ACAGAGAGGA CCAGATCGCA
48001 TTGCGCTCGA ATGGCCGCTA CGTGGCGCGC CTCGTGCGGA GCTCCTTTTC CGGCAAGCCT
48061 GCTACGGATT GCGGCATCCG GGCGGACGGC AGTTATGTGA TCACCGATGG CATGGGGAGA
48121 GTGGGGCTCT CGGTCGCGCA ATGGATGGTG ATGCAGGGGG CCCGCCATGT GGTGCTCGTG
48181 GATCGCGGCG GCGCTTCCGA CGCCTCCCGG GATGCCCTCC GGTCCATGGC CGAGGCTGGC
48241 GCAGAGGTGC AGATCGTGGA GGCCGACGTG GCTCGGCGCG TCGATGTCGC TCGGCTTCTC
48301 TCGAAGATCG AACCGTCGAT GCCGCCGCTT CGGGGGATCG TGTACGTGGA CGGGACCTTC
48361 CAGGGCGACT CCTCGATGCT GGAGCTGGAT GCCCATCGCT TCAAGGAGTG GATGTATCCC
48421 AAGGTGCTCG GAGCGTGGAA CCTGCACGCG CTGACCAGGG ATAGATCGCT GGACTTCTTC
48481 GTCCTGTACT CCTCGGGCAC CTCGCTTCTG GGCTTGCCCG GACAGGGGAG CCGCGCCGCC
48541 GGTGACGCCT TCTTGGACGC CATCGCGCAT CACCGGTGTA GGCTGGGCCT CACAGCGATG
48601 AGCATCAACT GGGGATTGCT CTCCGAAGCA TCATCGCCGG CGACCCCGAA CGACGGCGGC
48661 GCACGGCTCC AATACCGGGG GATGGAAGGT CTCACGCTGG AGCAGGGAGC GGAGGCGCTC
48721 GGGCGCTTGC TCGCACAACC CAGGGCGCAG GTAGGGGTAA TGCGGCTGAA TCTGCGCCAG
48781 TGGCTGGAGT TCTATCCCAA CGCGGCCCGA CTGGCGCTGT GGGCGGAGTT GCTGAAGGAG
48841 CGTGACCGCA CCGACCGGAG CGCGTCGAAC GCATCGAACC TGCGCGAGGC GCTGCAGAGC
48901 GCCAGGCCCG AAGATCGTCA GTTGGTTCTG GAGAAGGACT TGAGCGAGCT GTTGGGGCGG
48961 GGGCTGCGCC TTCCGCCGGA GAGGATCGAG CGGCACGTGC CGTTCAGCAA TCTCGGCATG
49021 GACTCGTTGA TAGGCCTGGA GCTCCGCAAC CGCATCGAGG CCGCGCTCGG CATCACCGTG
49081 CCGGCGACCC TGCTATGGAC TTACCCTACC GTAGCAGCTC TGAGCGGGAA CCTGCTAGAT
49141 ATTCTGTTCC CGAATGCCGG CGCGACTCAC GCTCCGGCCA CCGAGCGGGA GAAGAGCTTC
49201 GAGAACGATG CCGCAGATCT CGAGGCTCTG CGGGGTATGA CGGACGAGCA GAAGGACGCG
49261 TTGCTCGCCG AAAAGCTGGC GCAGCTCGCG CAGATCGTTG GTGAGTAAGG GACTGAGGGA
49321 GTATGGCGAC CACGAATGCC GGGAAGCTTG AGCATGCCCT TCTGCTCATG GACAAGCTTG
49381 CGAAAAAGAA CGCGTCTTTG GAGCAAGAGC GGACCGAGCC GATCGCCATC ATAGGTATTG
49441 GCTGCCGCTT CCCCGGCGGA GCGGACACTC CGGAGGCATT CTGGGAGCTG CTCGACTCGG
49501 GCCGAGACGC GGTCCAGCCG CTCGACCGGC GCTGGGCGCT GGTCGGCGTC CATCCCAGCG
49561 AGGAGGTGCC GCGCTGGGCC GGACTGCTCA CCGAGGCGGT GGACGGCTTC GACGCCGCGT
49621 TCTTTGGCAC CTCGCCTCGG GAGGCGCGGT CGCTCGATCC TCAGCAACGC CTGCTGCTGG
49681 AGGTCACCTG GGAAGGGCTC GAGGACGCCG GCATCGCACC CCAGTCCCTC GACGGCAGCC
49741 GCACCGGGGT ATTCCTGGGC GCATGCAGCA GCGACTACTC GCATACCGTT GCGCAACAGC
49801 GGCGCGAGGA GCAGGACGCG TACGACATCA CCGGCAATAC GCTCAGCGTC GCCGCCGGAC
49861 GGTTGTCTTA TACGCTAGGG CTGCAGGGAC CCTGCCTGAC CGTCGACACG GCCTGCTCGT
49921 CGTCGCTCGT GGCCATCCAC CTTGCCTGCC GCAGCCTGCG CGCTCGCGAG AGCGATCTCG
49981 CGCTGGCGGG GGGCGTCAAC ATGCTCCTTT CGTCCAAGAC GATGATAATG CTGGGGCGCA
50041 TCCAGGCGCT GTCGCCCGAT GGCCACTGCC GGACATTCGA CGCCTCGGCC AACGGGTTCG
50101 TCCGTGGGGA GGGCTGCGGT ATGGTCGTGC TCAAACGGCT CTCCGACGCC CAGCGACATG
50161 GCGATCGGAT CTGGGCTCTG ATCCGGGGTT CGGCCATGAA TCAGGATGGC CGGTCGACAG
50221 GGTTGATGGC ACCCAATGTG CTCGCTCAGG AGGCGCTCTT ACGCCAGGCG CTGCAGAGCG
50281 CTCGCGTCGA CGCCGGGGCC ATCGATTATG TCGAGACCCA CGGAACGGGG ACCTCGCTCG
50341 GCGACCCGAT CGAGGTCGAT GCGCTGCGTG CCGTGATGGG GCCGGCGCGG GCCGATGGGA
50401 GCCGCTGCGT GCTGGGCGCA GTGAAGACCA ACCTCGGCCA CCTGGAGGGC GCTGCAGGCG
50461 TGGCGGGTTT GATCAAGGCG GCGCTGGCTC TGCACCACGA ATCGATCCCG CGAAACCTCC
50521 ATTTTCACAC GCTCAATCCG CGGATCCGGA TCGAGGGGAC CGCGCTCGCG CTGGCGACGG
50581 AGCCGGTGCC GTGGCCGCGG GCGGGCCGAC CGCGCTTCGC GGGGGTGAGC GCGTTCGGCC
50641 TCAGCGGCAC CAACGTCCAT GTCGTGCTGG AGGAGGCGCC GGCCACGGTG CTCGCACCGG
50701 CGACGCCGGG GCGCTCAGCA GAGCTTTTGG TGCTGTCGGC GAAGAGCACC GCCGCGCTGG
50761 ACGCACAGGC GGCGCGGCTC TCAGCGCACA TCGCCGCGTA CCCGGAGCAG GGCCTCGGAG
50821 ACGTCGCGTT CAGCCTGGTA GCGACGCGGA GCCCGATGGA GCACCGGCTC GCGGTGGCGG
50881 CGACCTCGCG CGAGGCGCTG CGAAGCGCGC TGGAAGCTGC GGCGCAGGGG CAGACCCCGG
50941 CAGGCGCGGC GCGCGGCAGG GCCGCTTCCT CGCCCGGCAA GCTCGCCTTC CTGTTCGCCG
51001 GGCAGGGCGC GCAGGTGCCG GGCATGGGCC GTGGGTTGTG GGAGGCGTGG CCGGCGTTCC
51061 GCGAGACCTT CGACCGGTGC GTCACGCTCT TCGACCGGGA GCTCCATCAG CCGCTCTGCG
51121 AGGTGATGTG GGCCGAGCCG GGCAGCAGCA GGTCGTCGTT GCTGGACCAG ACGGCATTCA
51181 CCCAGCCGGC GCTCTTTGCG CTGGAGTACG CGCTGGCCGC GCTCTTCCGG TCGTGGGGCG
51241 TGGAGCCGGA GCTCATCGCT GGCCATAGCC TCGGCGAGCT GGTGGCCGCC TGCGTGGCGG
51301 GTGTGTTCTC CCTCGAGGAC GCCGTGCGCT TGGTGGTCGC GCGCGGCCGG TTGATGCAGG
51361 CGCTGCCGGC CGGCGGTGCG ATGGTATCGA TCGCCGCGCC GGAGGCCGAC GTGGCTGCCG
51421 CGGTGGCGCC GCACGCAGCG TCGGTGTCGA TCGCGGCAGT CAATGGGCCG GAGCAGGTGG
51481 TGATCGCGGG CGCCGAGAAA TTCGTGCAGC AGATCGCGGC GGCGTTCGCG GCGCGGGGGG
51541 CGCGAACCAA ACCGCTGCAT GTTTCGCACG CGTTCCACTC GCCGCTCATG GATCCGATGC
51601 TGGAGGCGTT CCGGCGGGTG ACCGAGTCGG TGACGTATCG GCGGCCTTCG ATGGCGCTGG
51661 TGAGCAACCT GAGCGGGAAG CCCTGCACGG ATGAGGTGTG CGCGCCGGGT TACTGGGTGC
51721 GTCACGCGCG AGAGGCGGTG CGCTTCGCGG ACGGCGTGAA GGCGCTGCAC GCGGCCGGTG
51781 CGGGCATCTT CGTCGAGGTG GGCCCGAAGC CGGCGCTGCT CGGCCTTTTG CCGGCCTGCC
51841 TGCCGGATGC CAGGCCGGTG CTGCTCCCAG CGTCGCGCGC CGGGCGTGAC GAGGCTGCGA
51901 GCGCGCTGGA GGCGCTGGGT GGGTTCTGGG TCGTCGGTGG ATCGGTCACC TGGTCGGGTG
51961 TCTTCCCTTC GGGCGGACGG CGGGTACCGC TGCCAACCTA TCCCTGGCAG CGCGAGCGTT
52021 ACTGGATCGA AGCGCCGGTC GATGGTGAGG CGGACGGCAT CGGCCGTGCT CAGGCGGGGG
52081 ACCACCCCCT TCTGGGTGAA GCCTTTTCCG TGTCGACCCA TGCCGGTCTG CGCCTGTGGG
52141 AGACGACGCT GGACCGAAAG CGGCTGCCGT GGCTCGGCGA GCACCGGGCG CAGGGGGAGG
52201 TCGTGTTTCC TGGCGCCGGG TACCTGGAGA TGGCGCTGTC GTCGGGGGCC GAGATCTTGG
52261 GCGATGGACC GATCCAGGTC ACGGATGTGG TGCTCATCGA GACGCTGACC TTCGCGGGCG
52321 ATACGGCGGT ACCGGTCCAG GTGGTGACGA CCGAGGAGCG ACCGGGACGG CTGCGGTTCC
52381 AGGTAGCGAG TCGGGAGCCG GGGGCACGTC GCGCGTCCTT CCGGATCCAC GCCCGCGGCG
52441 TGCTGCGCCG GGTCGGGCGC GCCGAGACCC CGGCGAGGTT GAACCTCGCC GCCCTGCGCG
52501 CCCGGCTTCA TGCCGCCGTG CCCGCTGCGG CTATCTATGG GGCGCTCGCC GAGATGGGGC
52561 TTCAATACGG CCCGGCGTTG CGGGGGCTCG CCGAGCTGTG GCGGGGTGAG GGCGAGGCGC
52621 TGGGCAGAGT GAGACTGCCT GAGTCCGCCG GCTCCGCGAC AGCCTACCAG CTGCATCCGG
52681 TGCTGCTGGA CGCGTGCGTC CAAATGATTG TTGGCGCGTT CGCCGATCGC GATGAGGCGA
52741 CGCCGTGGGC GCCGGTGGAG GTGGGCTCGG TGCGGCTGTT CCAGCGGTCT CCTGGGGAGC
52801 TATGGTGCCA TGCGCGCGTC GTGAGCGATG GTCAACAGGC CCCCAGCCGG TGGAGCGCCG
52861 ACTTTGAGTT GATGGACGGT ACGGGCGCGG TGGTCGCCGA GATCTCCCGG CTGGTGGTGG
52921 AGCGGCTTGC GAGCGGTGTA CGCCGGCGCG ACGCAGACGA CTGGTTCCTG GAGCTGGATT
52981 GGGAGCCCGC GGCGCTCGAG GGGCCCAAGA TCACAGCCGG CCGGTGGCTG CTGCTCGGCG
53041 AGGGTGGTGG GCTCGGGCGC TCGTTGTGCT CAGCGCTGAA GGCCGCCGGC CATGTCGTCG
53101 TCCACGCCGC GGGGGACGAC ACGAGCGCTG CAGGAATGCG CGCGCTCCTG GCCAACGCGT
53161 TCGACGGCCA GGCCCCGACG GCCGTGGTGC ACCTCAGCAG CCTCGACGGG GGCGGCCAGC
53221 TCGACCCGGG GCTCGGGGCG CAGGGCGCGC TCGACGCGCC CCGGAGCCCA GATGTCGATG
53281 CCGATGCCCT CGAGTCGGCG CTGATGCGTG GTTGCGACAG CGTGCTCTCC CTGGTGCAAG
53341 CGCTGGTCGG CATGGACCTC CGAAATGCGC CGCGGCTGTG GCTTTTGACC CGCGGGGCTC
53401 AGGCGGCCGC CGCCGGCGAT GTCTCCGTGG TGCAAGCGCC GCTGTTGGGG CTGGGCCGCA
53461 CCATCGCCTT GGAGCACGCC GAGCTGCGCT GTATCAGCGT CGACCTCGAT CCAGCCCAGC
53521 CTGAAGGGGA AGCCGATGCT TTGCTGGCCG AGCTACTTGC AGATGATGCC GAGGAGGAGG
53581 TCGCGCTGCG CGGTGGCGAG CGGTTTGTTG CGCGGCTCGT CCACCGGCTG CCCGAGGCTC
53641 AACGCCGGGA GAAGATCGCG CCCGCCGGTG ACAGGCCGTT CCGGCTAGAG ATCGATGAAC
53701 CCGGCGTGCT GGACCAACTG GTGCTCCGGG CCACGGGGCG GCGCGCTCCT GGTCCGGGCG
53761 AGGTCGAGAT CGCCGTCGAA GCGGCGGGGC TCGACTCCAT CGACATCCAG CTGGCGGTGG
53821 GCGTTGCTCC CAATGACCTG CCTGGAGGAG AAATCGAGCC GTCGGTGCTC GGAAGCGAGT
53881 GCGCCGGGCG CATCGTCGCT GTGGGCGAGG GCGTGAACGG CCTTGTGGTG GGCCAGCCGG
53941 TGATCGCCCT TGCGGCGGGA GTATTTGCTA CCCATGTCAC CACGTCGGCC ACGCTGGTGT
54001 TGCCTCGGCC TCTGGGGCTC TCGGCGACCG AGGCGGCCGC GATGCCCCTC GCGTATTTGA
54061 CGGCCTGGTA CGCCCTCGAC AAGGTCGCCC ACCTGCAGGC GGGGGAGCGG GTGCTGATCC
54121 GTGCGGAGGC CGGTGGTATC GGTCTTTGCG CGGTGCGATG GGCGCAGCGC GTGGGCGCCG
54181 AGGTGTATGC GACCGCCGAC ACGCCCGAGA AACGTGCCTA CCTGGAGTCG CTGGGCGTGC
54241 GGTACGTGAG CGATTCCCGC TCGGGCCGGT TCGCCGCAGA CGTGCATGCA TGGACGGACG
54301 GCGAGGGTGT GGACGTCGTG CTCGACTCGC TTTCGGGCGA GCACATCGAC AAGAGCCTCA
54361 TGGTCCTGCG CGCCTGTGGC CGCCTTGTGA AGCTGGGCAG GCGCGACGAC TGCGCCGACA
54421 CGCAGCCTGG GCTGCCGCCG CTCCTACGGA ATTTTTCCTT CTCGCAGGTG GACTTGCGGG
54481 GAATGATGCT CGATCAACCG GCGAGGATCC GTGCGCTCCT CGACGAGCTG TTCGGGTTGG
54541 TCGCAGCCGG TGCCATCAGC CCACTGGGGT CGGGGTTGCG CGTTGGCGGA TCCCTCACGC
54601 CACCGCCGGT CGAGACCTTC CCGATCTCTC GCGCAGCCGA GGCATTCCGG AGGATGGCGC
54661 AAGGACAGCA TCTCGGGAAG CTCGTGCTCA CGCTGGACGA CCCGGAGGTG CGGATCCGCG
54721 CTCCGGCCGA ATCCAGCGTC GCCGTCCGCG CGGACGGCAC CTACCTTGTG ACCGGCGGTC
54781 TGGGTGGGCT CGGTCTGCGC GTGGCCGGAT GGCTGGCCGA GCGGGGCGCG GGGCAACTGG
54841 TGCTGGTGGG CCGCTCCGGT GCGGCGAGCG CAGAGCAGCG AGCCGCCGTG GCGGCGCTAG
54901 AGGCCCACGG CGCGCGCGTC ACGGTGGCGA AAGCGGATGT CGCCGATCGG TCACAGATCG
54961 AGCGGGTCCT CCGCGAGGTT ACCGCGTCGG GGATGCCGCT GCGGGGTGTC GTGCATGCGG
55021 CAGGTCTTGT GGATGACGGG CTGCTGATGC AGCAGACTCC GGCGCGGCTC CGCACGGTGA
55081 TGGGACCTAA GGTCCAGGGA GCCTTGCACT TGCACACGCT GACACGCGAA GCGCCTCTTT
55141 CCTTCTTCGT GCTGTACGCT TCTGCAGCTG GGCTGTTCGG CTCGCCAGGC CAGGGCAACT
55201 ATGCCGCAGC CAACGCGTTC CTCGACGCCC TTTCGCATCA CCGCAGGGCG CACGGCCTGC
55261 CGGCGCTGAG CATCGACTGG GGCATGTTCA CGGAGGTGGG GATGGCCGTT GCGCAAGAAA
55321 ACCGTGGCGC GCGGCTGATC TCTCGCGGGA TGCGGGGCAT CACCCCCGAT GAGGGTCTGT
55381 CAGCTCTGGC GCGCTTGCTC GAGGGTGATC GCGTGCAGAC GGGGGTGATA CCGATCACTC
55441 CGCGGCAGTG GGTGGAGTTC TACCCGGCAA CAGCGGCCTC ACGGAGGTTG TCGCGGCTGG
55501 TGACCACGCA GCGCGCGGTT GCTGATCGGA CCGCCGGGGA TCGGGACCTG CTCGAACAGC
55561 TTGCCTCGGC TGAGCCGAGC GCGCGGGCGG GGCTGCTGCA GGACGTCGTG CGCGTGCAGG
55621 TCTCGCATGT GCTGCGTCTC CCTGAAGACA AGATCGAGGT GGATGCCCCG CTCTCGAGCA
55681 TGGGCATGGA CTCGCTGATG AGCCTGGAGC TGCGCAACCG CATCGAGGCT GCGCTGGGCG
55741 TCGCCGCGCC TGCAGCCTTG GGGTGGACGT ACCCAACGGT AGCAGCGATA ACGCGCTGGC
55801 TGCTCGACGA CGCCCTCGCC GTCCGGCTTG GCGGCGGGTC GGACACGGAC GAATCGACGG
55861 CAAGCGCCGG ATCGTTCGTC CACGTCCTCC GCTTTCGTCC TGTCGTCAAG CCGCGGGCTC
55921 GTCTCTTCTG TTTTCACGGT TCTGGCGGCT CGCCCGAGGG CTTCCGTTCC TGGTCGGAGA
55981 AGTCTGAGTG GAGCGATCTG GAAATCGTGG CCATGTGGCA CGATCGCAGC CTCGCCTCCG
56041 AGGACGCGCC TGGTAAGAAG TACGTCCAAG AGGCGGCCTC GCTGATTCAG CACTATGCAG
56101 ACGCACCGTT TGCGTTAGTA GGGTTCAGCC TGGGTGTCCG GTTCGTCATG GGGACAGCCG
56161 TGGAGCTCGC TAGTCGTTCC GGCGCACCGG CTCCGCTGGC CGTTTTTGCG TTGGGCGGCA
56221 GCTTGATCTC TTCTTCAGAG ATCACCCCGG AGATGGAGAC CGATATAATA GCCAAGCTCT
56281 TCTTCCGAAA TGCCGCGGGT TTCGTGCGAT CCACCCAACA AGTTCAGGCC GATGCTCGCG
56341 CAGACAAGGT CATCACAGAC ACCATGGTGG CTCCGGCCCC CGGGGACTCG AAGGAGCCCC
56401 CCTCGAAGAT CGCGGTCCCT ATCGTCGCCA TCGCCGGCTC GGACGATGTG ATCGTGCCTC
56461 CAAGCGACGT TCAGGATCTA CAATCTCGCA CCACGGAGCG CTTCTATATG CATCTCCTTC
56521 CCGGAGATCA CGAGTTTCTC GTCGATCGAG GGCGCGAGAT CATGCACATC GTCGACTCGC
56581 ATCTCAATCC GCTGCTCGCC GCGAGGACGA CGTCGTCAGG CCCCGCGTTC GAGGCAAAAT
56641 GATGGCAGCC TCCCTCGGGC GCGCGAGATG GTTGGGAGCA GCGTGGGTGC TGGTGGCCGG
56701 CGGCAGGCAG CGGAGGCTCA TGAGCCTTCC TGGAAGTTTG CAGCATAGGA GATTTTATGA
56761 CACAGGAGCA AGCGAATCAG AGTGAGACGA AGCCTGCTTT CGACTTCAAG CCGTTCGCGC
56821 CTGGGTACGC GGAGGACCCG TTTCCCGCGA TCGAGCGCCT GAGAGAGGCA ACCCCCATCT
56881 TCTACTGGGA TGAAGGCCGC TCCTGGGTCC TCACCCGATA CCACGACGTG TCGGCGGTGT
56941 TCCGCGACGA ACGCTTCGCG GTCAGTCGAG AAGAATGGGA ATCGAGCGCG GAGTACTCGT
57001 CGGCCATTCC CGAGCTCAGC GATATGAAGA AGTACGGATT GTTCGGGCTG CCGCCGGAGG
57061 ATCACGCTCG GGTCCGCAAG CTCGTCAACC CATCGTTTAC GTCACGCGCG ATCGACCTGC
57121 TGCGCGCCGA AATACAGCGC ACCGTCGACC AGCTGCTCGA TGCTCGCTCC GGACAAGAGG
57181 AGTTCGACGT TGTGCGGGAT TACGCGGAGG GAATCCCGAT GCGTGCGATC AGCGCTCTGT
57241 TGAAGGTTCC GGCCGAGTGT GACGAGAAGT TCCGTCGCTT CGGCTCGGCG ACTGCGCGCG
57301 CGCTCGGCGT GGGTTTGGTG CCCCGGGTCG ATGAGGAGAC CAAGACCCTG GTCGCGTCCG
57361 TCACCGAGGG GCTCGCGCTG CTCCATGGCG TCCTCGATGA GCGGCGCAGG AACCCGCTCG
57421 AAAATGACGT CTTGACGATG CTGCTTCAGG CCGAGGCCGA CGGCAGCAGG CTGAGCACGA
57481 AGGAGCTGGT CGCGCTCGTG GGTGCGATTA TCGCTGCTGG CACCGATACC ACGATCTACC
57541 TTATCGCGTT CGCTGTGCTC AACCTGCTGC GGTCGCCCGA GGCGCTCGAG CTGGTGAAGG
57601 CCGAGCCCGG GCTCATGAGG AACGCGCTCG ATGAGGTGCT CCGCTTCGAC AATATCCTCA
57661 GAATAGGAAC TGTGCGTTTC GCCAGGCAGG ACCTGGAGTA CTGCGGGGCA TCGATCAAGA
57721 AAGGGGAGAT GGTCTTTCTC CTGATCCCGA GCGCCCTGAG AGATGGGACT GTATTCTCCA
57781 GGCCAGACGT GTTTGATGTG CGACGGGACA CGAGCGCGAG CCTCGCGTAC GGTAGAGGCC
57841 CCCATGTCTG CCCCGGGGTG TCCCTTGCTC GCCTCGAGGC GGAGATCGCC GTGGGCACCA
57901 TCTTCCGTAG GTTCCCCGAG ATGAAGCTGA AAGAAACTCC CGTGTTTGGA TACCACCCCG
57961 CGTTCCGGAA CATCGAATCA CTCAACGTCA TCTTGAAGCC CTCCAAAGCT GGATAACTCG
58021 CGGGGGCATC GCTTCCCGAA CCTCATTCTT TCATGATGCA ACTCGCGCGC GGGTGCTGTC
58081 TGCCGCGGGT GCGATTCGAT CCAGCGGACA AGCCCATTGT CAGCGCGCGA AGATCGAATC
58141 CACGGCCCGG AGAAGAGCCC GATGGCGAGC CCGTCCGGGT AACGTCGGAA GAAGTGCCGG
58201 GCGCCGCCCT GGGAGCGCAA AGCTCGCTCG CTCGCGCTCA GCGCGCCGCT TGCCATGTCC
58261 GGCCCTGCAC CCGCACCGAG GAGCCACCCG CCCTGATGCA CGGCCTCACC GAGCGGCAGG
58321 TTCTGCTCTC GCTCGTCGCC CTCGCGCTCG TCCTCCTGAC CGCGCGCGCC TTCGGCGAGC
58381 TCGCGCGGCG GCTGCGCCAG CCCGAGGTGC TCGGCGAGCT CTTCGGCGGC GTGGTGCTGG
58441 GCCCGTCCGT CGTCGGCGCG CTCGCTCCTG GGTTCCATCG AGTCCTCTTC CAGGATCCGG
58501 CGGTCGGGGG CGTGCTCTCC GGCATCTCCT GGATAGGCGC GCTCGTCCTG CTGCTCATGG
58561 CGGGTATCGA GGTCGATGTG AGCATTCTAC GCAAGGAGGC GCGCCCCGGG GCGCTCTCGG
58621 CGCTCGGCGC GATCGCGCCC CCGCTGCGCA CGCCGGGCCC GCTGGTGCAG CGCATGCAGG
58681 GCACGTTGAC GTGGGATCTC GACGTCTCGC CGCGACGCTC TGCGCAAGCC TGAGCCTCGG
58741 CGCCTGCTCG TACACCTCGC CGGTGCTCGC TCCGCCCGCG GACATCCGGC CGCCCCCCGC
58801 GGCCCAGCTC GAGCCGGACT CGCCGGATGA CGAGGCCGAC GAGGCGCTCC GCCCGTTCCG
58861 CGACGCGATC GCCGCGTACT CGGAGGCCGT TCGGTGGGCG GAGGCGGCGC AGCGGCCGCG
58921 GCTGGAGAGC CTCGTGCGGC TCGCGATCGT GCGGCTGGGC AAGGCGCTCG ACAAGGCACC
58981 TTTCGCGCAC ACGACGGCCG GCGTCTCCCA GATCGCCGGC AGACTTCCCC AGAAAACGAA
59041 TGCGGTCTGG TTCGATGTCG CCGCCCGGTA CGCGAGCTTC CGCGCGGCGA CGGAGCACGC
59101 GCTCCGCGAC GCGGCGTCGG CCACGGAGGC GCTCGCGGCC GGCCCGTACC GCGGATCGAG
59161 CAGCGTGTCC GCTGCCGTAG GGGAGTTTCG GGGGGAGGCG GCGCGCCTTC ACCCCGCGGA
59221 CCGCGTACCC GCGTCCGACC AGCAGATCCT GACCGCGCTG CGCGCAGCCG AGCGGGCGCT
59281 CATCGCGCTC TACACCGCGT TCGCCCGTGA GGAGTGAGCC TCTCTCGGGC GCAGCCGAGC
59341 GGCGGCGTGC CGGTTGTTCC CTCTTCGCAA CCATGACCGG AGCCGCGCCC GGTCCGCGCA
59401 GCGGCTAGCG CGCGTCGAGG CAGAGAGCGC TGGAGCGACA GGCGACGACC CGCCCGAGGG
59461 TGTCGAACGG ATTGCCGCAG CCCTCATTGC GGATCCCCTC CAGACACTCG TTCAGCGCCT
59521 TGGCGTCGAT GCCGCCTGGG CACTCGCCGA AGGTCAGCTC GTCGCGCCAG TCGGATCGGA
59581 TCTTGTTCGA GCACGCATCC TTGCTCGAAT ACTCCCGGTC TTGTCCGATG TTGTTGCACC
59641 GCGCCTCGCG GTCGCACCGC GCCGCCACGA TGCTATCGAC GGCGCTGCCG ACTGGCACCG
59701 GCGCCTCGCC TTGCGCGCCA CCCGGGGTTT GCGCCTCCCC GCCTGACCGC TTTTCGCCGC
59761 CGCACGCCGC CGCGAGCAGG CTCATTCCCG ACATCGAGAT CAGGCCCACG ACCAGTTTCC
59821 CAGCAATCTT TTGCATGGCT TCCCCTCCCT CACGACACGT CACATCAGAG ATTCTCCGCT
59881 CGGCTCGTCG GTTCGACAGC CGGCGACGGC CACGAGCAGA ACCGTCCCCG ACCAGAACAG
59941 CCGCATGCGG GTTTCTCGCA GCATGCCACG ACATCCTTGC GACTAGCGTG CCTCCGCTCG
60001 TGCCGAGATC GGCTGTCCTG TGCGACGGCA ATGTCCTGCG ATCGGCCGGG CAGGATCGAC
60061 CGACACGGGC GCCGGGCTGG AGGTGCCGCC ACGGGCTCGA AATGCGCTGT GGCAGGCGCC
60121 TCCATGCCCG CTGCCGGGAA CGCAGCGCCC GGCCAGCCTC GGGGCGACGC TGCGAACGGG
60181 AGATGCTCCC GGAGAGGCGC CGGGCACAGC CGAGCGCCGT CACCACCGTG CGCACTCGTG
60241 AGCGCTAGCT CCTCGGCATA GAAGAGACCG TCACTCCCGG TCCGTGTAGG CGATCGTGCT
60301 GATCAGCGCG TCCTCCGCCT GACGCGAGTC GAGCCGGGTA TGCTGCACGA CGATGGGCAC
60361 GTCCGATTCG ATCACGCTGG CATAGTCCGT ATCGCGCGGG ATCGGCTCGG GGTCGGTCAG
60421 ATCGTTGAAC CGGACGTGCC GGGTGCGCCT CGCTGGAACG GTCACCCGGT ACGGCCCGGC
60481 GGGGTCGCGG TCGCTGAAGT AGACGGTGAT GGCGACCTGC GCGTCCCGGT CCGACGCATT
60541 CAACAGGCAG GCCGTCTCAT GGCTCGTCAT CTGCGGCTCA GGTCCGTTGC TCCGGCCTGG
60601 GATGTAGCCC TCTGCGATTG CCCAGCGCGT CCGCCCGATC GGCTTGTCCA TGTGTCCTCC
60661 CTCCTGGCTC CTCTTTGGCA GCCTCCCTCT GCTGTCCAGG TGCGACGGCC TCTTCGCTCG
60721 ACGCGCTCGG GGCTCCATGG CTGAGAATCC TCGCCGAGCG CTCCTTGCCG ACCGGCGCGC
60781 TGAGCGCCGA CGGGCCTTGA AAGCACGCGA CCGGACACGG GATGCCGGCG CGACGAGGCC
60841 GCCCCGCGTC TGATCCCGAT CGTGGCATCA CGACGTCCGC CGACGCCTCG GCAGGCCGGC
60901 GTGAGCGCTG CGCGGTCATG GTCGTCCTCG CGTCACCGCC ACCCGCCGAT TCACATCCCA
60961 CCGCGGCACG ACGCTTGCTC AAACCGCGAC GACACGGCCG GGCGGCTGTG GTACCGGCCA
61021 GCCCGGACGC GAGGCCCGAG AGGGACAGTG GGTCCGCCGT GAAGCAGAGA GGCGATCGAG
61081 GTGGTGAGAT GAAACACGTT GACACGGGCC GACGAGTCGG CCGCCGGATA GGGCTCACGC
61141 TCGGTCTCCT CGCGAGCATG GCGCTCGCCG GCTGCGGCGG CCCGAGCGAG AAGACCGTGC
61201 AGGGCACGCG GCTCGCGCCC GGCGCCGATG CGCACGTCAC CGCCGACGTC GACGCCGACG
61261 CCGCGACCAC GCGGCTGGCG GTGGACGTCG TTCACCTCTC GCCGCCCGAG CGGATCGAGG
61321 CCGGCAGCGA GCGGTTCGTC GTCTGGCAGC GTCCGAACTC CGAGTCCCCG TGGCTACGGG
61381 TCGGAGTGCT CGACTACAAC GCTGCCAGCC GAAGAGGCAA GCTGGCCGAG ACGACCGTGC
61441 CGCATGCCAA CTTCGAGCTG CTCATCACCG TCGAGAAGCA GAGCAGCCCT CAGTCGCCAT
61501 CGTCTGCCGC CGTCATCGGG CCGACGTCCG TCGGGTAACA TCGCGCTATC AGCAGCGCTG
61561 AGCCCGCCAG CATGCCCCAG AGCCCTGCCT CGATCGCTTT CCCCATCATC CGTGCGCACT
61621 CCTCCAGCGA CGGCCGCGTC AAAGCAACCG CCGTGCCGGC GCGGCTCTAC GTGCGCGACA
61681 GGAGAGCGTC CTAGCGCGGC CTGCGCATCG CTGGAAGGAT CGGCGGAGCA TGGAGAAAGA
61741 ATCGAGGATC GCGATCTACG GCGCCGTCGC CGCCAACGTG GCGATCGCGG CGGTCAAGTT
61801 CATCGCCGCC GCCGTGACCG GCAGCTCTGC GATGCTCTCC GAGGGCGTGC ACTCCCTCGT
61861 CGATACCGCA GACGGGCTCC TCCTCCTGGT CGGCAAGCAC CGGAGCGCCC GCCCGCCCGA
61921 CGCCGAGCAT CCGTTCGGCC ACGGCAAGGA GCTCTATTTC TGGACGCTGA TCGTCGCCAT
61981 CATGATCTTC GCCGCGGGCG GCGGCGTCTC GATCTACGAA GGGATCTTGC ACCTCTTGCA
62041 CCCGCGCTCG ATCGAGGATC CGACGTGGAA CTACGTTGTC CTCGGCGCAG CGGCCGTCTT
62101 CGAGGGGACG TCGCTCGCCA TCTCGATCCA CGAGTTCAAG AAGAAAGACG GACAGGGCTA
62161 CGTCGCGGCG ATGCGGTCCA GCAAGGACCC GACGACGTTC ACGATCGTCC TGGAGGATTC
62221 CGCGGCGCTC GCCGGGCTCG CCATCGCCTT CCTCGGCGTC TGGCTTGGGC ACCGCCTGGG
62281 AAACCCCTAC CTCGACGGCG CGGCGTCGAT CGGCATCGGC CTCGTGCTCG CCGCGGTCGC
62341 GGTCTTCCTC GCCAGCCAGA GCCGTGGACT CCTCGTAGGG GAGAGCGCGG ACAGGGAGCT
62401 CCTCGCCGCG ATCCGCGCGC TCGCCAGCGC AGATCCTGGC GTGTCGGCGG TGGGGCGGCC
62461 CCTGACGATG CACTTCGGTC CGCACGAAGT CCTGGTCGTG CTGCGCATCG AGTTCGACGC
62521 CGCGCTCACG GCGTCCGGGG TCGCGGAGGC GATCGAGCGA ATCGAGACAC GGATACGGAG
62581 CGAGCGACCC GACGTGAAGC ACATCTACGT CGAGGCCAGG TCGCTCCACC AGCGCGCGAG
62641 GGCGTGACGC GCCGTGGAGA GACCGCTCGC GGCCTCCGCC ATCCTCCGCG GCGCCCGGGC
62701 TCGGGTAGCC CTCGCAGCAG GGCGCGCCTG GCGGGCAAAC CGTGAAGACG TCGTCCTTCG
62761 ACGCGAGGTA CGCTGGTTGC AAGTTGTCAC GCCGTATCGC GAGGTCCGGC AGCGCCGGAG
62821 CCCGGGCGGT CCGGGCGCAC GAAGGCCCGG CGAGCGCGGG CTTCGAGGGG GCGACGTCAT
62881 GAGGAAGGGC AGGGCGCATG GGGCGATGCT CGGCGGGCGA GAGGACGGCT GGCGTCGCGG
62941 CCTCCCCGGC GCCGGCGCGC TTCGCGCCGC GCTCCAGCGC GGTCGCTCGC GCGATCTCGC
63001 CCGGCGCCGG CTCATCGCCG CCGTGTCCCT CACCGGCGGC GCCAGCATGG CGGTCGTCTC
63061 GCTGTTCCAG CTCGGGATCA TCGAGCACCT GCCCGATCCT CCGCTTCCAG GGTTCGATTC
63121 GGCCAAGGTG ACGAGCTCCG ATATCGCGTT CGGGCTCACG ATGCCGGACG CGCCGCTCGC
63181 GCTCACCAGC TTCGCGTCCA ACCTGGCGCT GGCTGGCTGG GGAGGCGCCG AGCGCGCCAG
63241 GAACACCCCC TGGATCCCCG TCGCCGTGGC GGCCAAGGCG GCCGTCGAGG CGGCCGTGTC
63301 CGGATGGCTC CTCGTCCAGA TGCGACGGCG GGAGAGGGCC TGGTGCGCGT ACTGCCTGGT
63361 CGCCATGGCG GCCAACATGG CCGTGTTCGC GCTCTCGCTC CCGGAAGGGT GGGCGGCGCT
63421 GAGGAAGGCG CGAGCGCGCT CGTGACAGGG CCGTGCGGGC GCCGCGGCCA TCGGAGGCCG
63481 GCGTGCACCC GCTCCGTCAC GCCCCGGCCC GCGCCGCGGT GAGCTGCCGC GGACAGGGCG
63541 CGTACCGTGG ACCCCGCACG CGCCGCGTCG ACGGACATCC CCGGCGGCTC GCGCGGCGCG
63601 GCCGGCGCAA CTCCGGCCCG CCGCCGGGCA TCGACATCTC CCGCGAGCAA GGGCACTCCG
63661 CTCCTGCCCG CGTCCGCGAA CGATGGCTGC GCTGTTTCCA CCCTGGAGCA ACTCCGTTTA
63721 CCGCGTGGCG CTCGTCGGGC TCATCGCCTC GGCGGGCGGC GCCATCCTCG CGCTCATGAT
63781 CTACGTCCGC ACGCCGTGGA AGCGATACCA GTTCGAGCCC GTCGATCAGC CGGTGCAGTT
63841 CGATCACCGC CATCACGTGC AGGACGATGG CATCGATTGC GTCTACTGCC ACACCACGGT
63901 GACCCGCTCG CCGACGGCGG GGATGCCGCC GACGGCCACG TGCATGGGGT GCCACAGCCA
63961 GATCTGGAAT CAGAGCGTCA TGCTCGAGCC CGTGCGGCGG AGCTGGTTCT CCGGCATGCC
64021 GATCCCGTGG AACCGGGTGA ACTCCGTGCC CGACTTCGTT TATTTCAACC ACGCGATTCA
64081 CGTGAACAAG GGCGTGGGCT GCGTGAGCTG CCACGGGCGC GTGGACGAGA TGGCGGCCGT
64141 CTACAAGGTG GCGCCGATGA CGATGGGCTG GTGCCTGGAG TGCCATCGCC TGCCGGAGCC
64201 GCACCTGCGC CCGCTCTCCG CGATCACCGA CATGCGCTGG GACCCGGGGG AACGGAGGGA
64261 CGAGCTCGGG GCGAAGCTCG CGAAGGAGTA CGGGGTCCGG CGGCTCACGC ACTGCACAGC
64321 GTGCCATCGA TGAACGATGA ACAGGGGATC TCCGTGAAAG ACGCAGATGA GATGAAGGAA
64381 TGGTGGCTAG AAGCGCTCGG GCCGGCGGGA GAGCGCGCGT CCTACAGGCT GCTGGCGCCG
64441 CTCATCGAGA GCCCGGAGCT CCGCGCGCTC GCCGCGGGCG AACCGCCCCG GGGCGTGGAC
64501 GAGCCGGCGG GCGTCAGCCG CCGCGCGCTG CTCAAGCTGC TCGGCGCGAG CATGGCGCTC
64561 GCCGGCGTCG CGGGCTGCAC CCCGCATGAG CCCGAGAAGA TCCTGCCGTA CAACGAGACC
64621 CCGCCCGGCG TCGTGCCGGG TCTCTCCCAG TCCTACGCGA CGAGCATGGT GCTCGACGGG
64681 TATGCCATGG GCCTCCTCGC CAAGAGCTAC GCGGGGCGGC CCATCAAGAT CGAGGGCAAC
64741 CCCGCGCACC CGGCGAGCCT CGGCGCGACC GGCGTCCACG AGCAGGCCTC GATCCTCTCG
64801 CTGTACGACC CGTACCGCGC GCGCGCGCCG ACGCGCGGCG GCCAGGTCGC GTCGTGGGAG
64861 GCGCTCTCCG CGCGCTTCGG CGGCGACCGC GAGGACGGCG GCGCTGGCCT CCGCTTCGTC
64921 CTCCAGCCCA CGAGCTCGCC CCTCATCGCC GCGCTGATCG AGCGCGTCCG GCGCAGGTTC
64981 CCCGGCGCGC GGTTCACCTT CTGGTCGCCG GTCCACGCCG AGCAAGCGCT CGAAGGCGCG
65041 CGGGCGGCGC TCGGCCTCAG GCTCTTGCCT CAGCTCGACT TCGACCAGGC CGAGGTGATC
65101 CTCGCCCTGG ACGCGGACTT CCTCGCGGAC ATGCCGTTCA GCGTGCGCTA TGCGCGCGAC
65161 TTCGCCGCGC GCCGCCGACC CGCGAGCCCG GCGGCGGCCA TGAACCGCCT CTACGTCGCG
65221 GAGGCGATGT TCACGCCCAC GGGGACGCTC GCCGACCACC GGCTCCGCGT GCGGCCCGCC
65281 GAGGTCGCGC GCGTCGCGGC CGGCGTCGCG GCGGAGCTCG TGCACGGCCT CGGCCTGCGC
65341 CCGCGCGGGA TCACGGACGC CGACGCCGCC GCGCTGCGCG CGCTCCGCCC CCCGGACGGC
65401 GAGGGGCACG GCGCCTTCGT CCGGGCGCTC GCGCGCGATC TCGCGCGCGC GGGGGGCGCC
65461 GGCGTCGCCG TCGTCGGCGA CGGCCAGCCG CCCATCGTCC ACGCCCTCGG GCACGTCATC
65521 AACGCCGCGC TCCGCAGCCG GGCGGCCTGG ATGGTCGATC CTGTGCTGAT CGACGCGGGC
65581 CCCTCCACGC AGGGCTTCTC CGAGCTCGTC GGCGAGCTCG GGCGCGGCGC GGTCGACACC
65641 TGATCCTCCT CGACGTGAAC CCCGTGTACG CCGCGCCGGC CGACGTCGAT TTCGCGGGCC
65701 TCCTCGCGCG CGTGCCCACG AGCTTGAAGG CCGGGCTCTA CGACGACGAG ACCGCCCGCG
65761 CTTGCACGTG GTTCGTGCCG ACCCGGCATT ACCTCGAGTC GTGGGGGGAC GCGCGGGCGT
65821 ACGACGGGAC GGTCTCGTTC GTGCAACCCC TCGTCCGGCC GCTGTTCGAC GGCCGGGCGG
65881 TGCCCGAGCT GCTCGCCGTC TTCGCGGGGG ACGAGCGCCC GGATCCCCGG CTGCTGCTGC
65941 GCGAGCACTG GCGCGGCGCG CGCGGAGAGG CGGATTTCGA GGCCTTCTGG GGCGAGGCAT
66001 TGAAGCGCGG CTTCCTCCCT GACAGCGCCC GGCCGAGGCA GACACCGGAT CTCGCGCCGG
66061 CCGACCTCGC CAAGGAGCTC GCGCGGCTCG CCGCCGCGCC GCGGCCGGCC GGCGGCGCGC
66121 TCGACGTGGC GTTCCTCAGG TCGCCGTCGG TCCACGACGG CAGGTTCGCC AACAACCCCT
66181 GGCTGCAAGA GCTCCCGCGG CCGATCACCA GGCTCACCTG GGGCAACGCC GCCATGATGA
66241 GCGCGGCGAC CGCGGCGCGG CTCGGCGTCG AGCGCGGCGA TGTCGTCGAG CTCGCGCTGC
66301 GCGGCCGTAC GATCGAGATC CCGGCCGTCG TCGTCCGCGG GCACGCCGAC GACGTGATCA
66361 GCGTCGACCT CGGCTACGGG CGCGACGCCG GCGAGGAGGT CGCGCGCGGG GTGGGCGTGT
66421 CGGCGTATCG GATCCGCCCG TCCGACGCGC GGTGGTTCGC GGGGGGCCTC TCCGTGAGGA
66481 AGACCGGCGC CACGGCCGCG CTCGCGCTGG CTCAGATCGA GCTGTCCCAG CACGACCGTC
66541 CCATCGCGCT CCGGAGGACG CTGCCGCAGT ACCGTGAACA GCCCGGTTTC GCGGAGGAGC
66601 ACAAGGGGCC GGTCCGCTCG ATCCTGCCGG AGGTCGAGTA CACCGGCGCG CAATGGGCGA
66661 TGTCCATCGA CATGTCGATC TGCACCGGGT GCTCCTCGTG CGTCGTGGCC TGTCAGGCCG
66721 AGAACAACGT CCTCGTCGTC GGCAAGGAGG AGGTGATGCA CGGCCGCGAG ATGCAGTGGT
66781 TGCGGATCGA TCAGTACTTC GAGGGTGGAG GCGACGAGGT GAGCGTCGTC AACCAGCCGA
66841 TGCTCTGCCA GCACTGCGAG AAGGCGCCGT GCGAGTACGT CTGTCCGGTG AACGCGACGG
66901 TCCACAGCCC CGATGGCCTC AACGAGATGA TCTACAACCG ATGCATCGGG ACGCGCTTTT
66961 GCTCCAACAA CTGTCCGTAC AAGATCCGGC GGTTCAATTT CTTCGACTAC AATGCCCACG
67021 TCCCGTACAA CGCCGGCCTC CGCAGGCTCC AGCGCAACCC GGACGTCACC GTCCGCGCCC
67081 GCGGCGTCAT GGAGAAATGC ACGTACTGCG TGCAGCGGAT CCGAGAGGCG GACATCCGCG
67141 CGCAGATCGA GCGGCGGCCG CTCCGGCCGG GCGAGGTGGT CACCGCCTGC CAGCAGGCCT
67201 GTCCGACCGG CGCGATCCAG TTCGGGTCGC TGGATCACGC GGATACAAAG ATGGTCGCGT
67261 GGCGCAGGGA GCCGCGCGCG TACGCCGTGC TCCACGACCT CGGCACCCGG CCGCGGACGG
67321 AGTACCTCGC CAAGATCGAG AACCCGAACC CGGGGCTCGG GGCGGAGGGC GCCGAGAGGC
67381 GACCCGGAGC CCCGAGCGTC AAACCCGCGC TCGGGGCGGA GGGCGCCGAG AGGCGACCCG
67441 GAGCCCCGAG CGTCAAACCG GAGATTGAAT GAGCCATGGC GGGCCCGCTC ATCCTGGACG
67501 CACCGACCGA CGATCAGCTG TCGAAGCAGC TCCTCGAGCC GGTATGGAAG CCGCGCTCCC
67561 GGCTCGGCTG GATGCTCGCG TTCGGGCTCG CGCTCGGCGG CACGGGCCTG CTCTTCCTCG
67621 CGATCACCTA CACCGTCCTC ACCGGGATCG GCGTGTGGGG CAACAACATC CCGGTCGCCT
67681 GGGCCTTCGC GATCACCAAC TTCGTCTGGT GGATCGGGAT CGGCCACGCC GGGACGTTCA
67741 TCTCCGCGAT CCTCCTCCTG CTCGAGCAGA AGTGGCGGAC GAGCATCAAC CGCTTCGCCG
67801 AGGCGATGAC GCTCTTCGCG GTCGTCCAGG CCGGCCTCTT TCCGGTCCTC CACCTCGGCC
67861 GCCCCTGGTT CGCCTACTGG ATCTTCCCGT ACCCCGCGAC GATGCAGGTG TGGCCGCAGT
67921 TCCGGAGCGC GCTGCCGTGG GACGCCGCCG CGATCGCGAC CTACTTCACG GTGTCGCTCC
67981 TGTTCTGGTA CATGGGCCTC GTCCCGGATC TGGCGGCGCT GCGCGACCAC GCCCCGGGCC
68041 GCGTCCGGCG GGTGATCTAC GGGCTCATGT CGTTCGGCTG GCACGGCGCG GCCGACCACT
68101 TCCGGCATTA CCGGGTGCTG TACGGGCTGC TCGCGGGGCT CGCGACGCCC CTCGTCGTCT
68161 CGGTGCACTC GATCGTGAGC AGCGATTTCG CGATCGCCCT GGTGCCCGGC TGGCACTCGA
68221 CGCTCTTTCC GCCGTTCTTC GTCGCGGGCG CGATCTTCTC CGGGTTCGCG ATGGTGCTCA
68281 CGCTGCTCAT CCCGGTGCGG CGGATCTACG GGCTCCATAA CGTCGTGACC GCGCGCCACC
68341 TCGACGATCT CGCGAAGATG ACGCTCGTGA CCGGCTGGAT CGTCATCCTC TCGTACATCA
68401 TCGAGAACTT CCTCGCCTGG TACAGCGGCT CGGCGTACGA GATGCATCAG TTTTTCCAGA
68461 CGCGCCTGCA CGGCCCGAAC AGCGCCGCCT ACTGGGCCCA GCACGTCTGC AACGTGCTCG
68521 TCATCCAGCT CCTCTGGAGC GAGCGGATCC GGACGAGCCC CGTCGCGCTC TGGCTCATCT
68581 CCCTCCTGGT CAACGTCGGG ATGTGGAGCG AGCGGTTCAC GCTCATCGTG ATGTCGCTCG
68641 AGCAAGAGTT CCTCCCGTCC AAGTGGCACG GCTACAGCCC GACGTGGGTG GACTGGAGCC
68701 TCTTCATCGG GTCAGGCGGC TTCTTCATGC TCCTGTTCCT GAGCTTTTTG CGCGTCTTTC
68761 CGTTCATCCC CGTCGCGGAG GTCAAGGAGC TCAACCATGA AGAGCTGGAG AAGGCTCGGG
68821 GCGAGGGGGG CCGCTGATGG AGACCGGAAT GCTCGGCGAG TTCGATGACC CGGAGGCGAT
68881 GCTCCATGCG ATCCGAGAGC TCAGGCGGCG CGGCTACCGC CGGGTGGAAG CGTTCACGCC
68941 CTATCCGGTG AAGGGGCTCG ACGAGGCGCT CGGCCTCCCG CGCTCGAACC TCAACCGGAT
69001 GGTGCTGCCC TTCGCGATCC TGGGGGTCGT GGGCGGCTAC TTCGTCCAGT GGTTCTGCAA
69061 CGCTTTCCAC TATCCGCTGA ACGTGGGCGG GCGCCCGCTG AACTCGGCGC CGGCGTTCAT
69121 CCCGATCACG TTCGAGATGG GGGTGCTCTC CACCTCGATC TTCGGCGTGC TCATCGGCTT
69181 TTACCTGACG AGGCTGCCGA GGCTCTACCT CCCGCTCTTC GACGCCCCGG GCTTCGAGCG
69241 CGTCACGCTG GATCGGTTTC TGGTCGGGCT CGACGACACG GAACCTTCCT TCTCGAGCGC
69301 CCAGGCGGAG CGCGACCTCC TCGCGCTCGG CGCCCGGCGC GTCGTCGTCG CGAGGAGGCG
69361 CGAGGAGCCA TGAGGGCCGG CGCCCCGGCT CGCCCTCTCG GGCGCGCGCT CGCGCCGTTC
69421 GCCCTCGTCC TGCTCGCCGG GTGCCGCGAG AAGGTGCTGC CCGAGCCGGA CTTCGAGCGG
69481 ATGATCCGCC AGGAGAAATA CGGACTCTGG GAGCCGTGCG AGCACTTCGA CGACGGCCGC
69541 GCGATGCAGC ACCCGCCCGA GGGGACCGTC GCGCGCGGGC GCGTCACCGG GCCGCCCGGC
69601 TATCTCCAGG GCGTCCTCGA CGGGGCGTAC GTCACGGAGG TGCCGCTCTT GCTCACGGTC
69661 GAGCTCGTGC AGCGCGGCCG GCAGCGCTTC GAGACCTTCT GCGCGCCGTG CCACGGGATC
69721 CTCGGCGACG GCAGCTCGCG CGTGGCGACG AACATGACGC TGCGCCCGCC CCCGTCGCTC
69781 ATCGGACCCG AGGCGCGGAG CTTCCCGCCG GGCAGGATCT ACCAGGTCAT CATCGAGGGC
69841 TACGGCCTGA TGCCGCGCTA CTCGGACGAT CTGCCCGACA TCGAAGAGCG CTGGGCCGTG
69901 GTCGCCTACG TGAAGGCGCT TCAGCTGAGC CGCGGAGTGG CCGCGGGCGC CCTCCCGCCA
69961 GCGCTCCGCG GCCGGGCAGA GCAGGAGCTG CGATGAACAG GGATGCCATC GAGTACAAGG
70021 GCGGCGCGAC GATCGCGGCC TCGCTCGCGA TCGCGGCGCT CGGCGCGGTC GCCGCGATCG
70081 TCGGCGGCTT CGTCGATCTC CGCCGGTTCT TCTTCTCGTA CCTCGCCGCG TGGTCGTTCG
70141 CGGTGTTTCT GTCCGTGGGC GCGCTCGTCA CGCTCCTCAC CTGCAACGCC ATGCGCGCGG
70201 GCTGGCCCAC GGCGGTGCGC CGCCTCCTCG AGACGATGGT GGCGCCGCTG CCTCTGCTCG
70261 CGGCGCTCTC CGCGCCGATC CTGGTCGGCC TGGACACGCT GTATCCGTGG ATGCACCCCG
70321 AGCGGATCGC CGGCGAGCAC GCGCGGCGCA TCCTCGAGCA CAGGGCGCCC TACTTCAATC
70381 CAGGCTTCTT CGTCGTGCGC TCGGCGATCT ACTTCGCGAT CTGGATCGCC GTCGCCCTCG
70441 TGCTCCGCCG GCGATCGTTC GCGCAGGACC GTGAGCCGAG GGCCGACGTC AAGGACGCGA
70501 TGTATGGCCT GAGCGGCGCC ATGCTGCCGG TCGTGGCGAT CACGATCGTC TTCTCGTCGT
70561 TCGACTGGCT CATGTCCCTC GACGCGACCT GGTACTCGAC GATGTTCCCG GTCTACGTGT
70621 TCGCGAGCGC CTTCGTGACC GCCGTCGGCG CGCTCACGGT CCTCTCGTAT GCCGCGCAGA
70681 CGTCCGGCTA CCTCGCGAGG CTGAACGACT CGCACTATTA CGCGCTCGGG CGGCTGCTCC
70741 TCGCGTTCAC GATATTCTGG GCCTATGCGG CCTATTTCCA GTTCATGTTG ATCTGGATCG
70801 CGAACAAGCC CGATGAGGTC GCCTTCTTCC TCGACCGCTG GGAAGGGCCC TGGCGGCCGA
70861 CCTCCGTGCT CGTCGTCCTC ACGCGGTTCG TCGTCCCGTT CCTGATCCTG ATGTCGTACG
70921 CGATCAAGCG GCGCCCGCGC CAGCTCTCGT GGATGGCGCT CTGGGTCGTC GTCTCCGGCT
70981 ACATCGACTT TCACTGGCTC GTGGTGCCGG CGACAGGGCG CCACGGGTTC GCCTATCACT
71041 GGCTCGACCT CGCGACCCTG TGCGTCGTGG GCGGCCTCTC GACCGCGTTC GCCGCGTGGC
71101 GGCTGCGAGG GCGGCCGGTG GTCCCGGTCC ACGACCCGCG GCTCGAAGAG GCCTTTGCGT
71161 ACCGGAGCAT ATGATGTTCC GTTTCCGTCA CAGCGAGGTT CGCCAGGAGG AGGACACGCT
71221 CCCCTGGGGG CGCGTGATCC TCGCGTTCGC CGTCGTGCTC GCGATCGGCG GCGCGCTGAC
71281 GCTCTGGGCC TGGCTCGCGA TGCGGGCCCG CGAGGCGGAT CTGCGGCCCT CCCTCGCGTT
71341 CCCCGAGAAG GATCTCGGGC CGCGGCGCGA GGTCGGCATG GTCCAGCAGT CGCTGTTCGA
71401 CGAGGCGCGC CTGGGCCAGC AGCTCGTCGA CGCGCAGCGC GCGGAGCTCC GCCGCTTCGG
71461 CGTCGTCGAT CGGGAGAGGG GCATCGTGAG CATCCCGATC GACGACGCGA TCGAGCTCAT
71521 GGTGGCGGGG GGCGCGCGAT GAGCCGGGCC GTCGCCGTGG CCCTCCTGCT GGCAGCCGGC
71581 CTCGTGTCGC GCCCGGGCGC CGCGTCCGAG CCCGAGCGCG CGCGCCCCGC GCTGGGCCCG
71641 TCCGCGGCCG ACGCCGCGCC GGCGAGCGAC GGGTCCGGCG CGGAGGAGCC GCCCGAAGGC
71701 GCCTTCCTGG AGCCCACGCG CGGGGTGGAC ATCGAGGAGC GCCTCGGCCG CCCGGTGGAC
71761 CGCGAGCTCG CCTTCACCGA CATGGACGGG CGGCGGGTGC GCCTCGGCGA CTACTTCGCC
71821 GACGGCAAGC CCCTCCTCCT CGTCCTCGCG TACTACCGGT GTCCCGCGCT GTGCGGCCTC
71881 GTGCTGCGCG GCGCCGTCGA GGGGCTGAAG CTCCTCCCGT ACCGGCTCGG CGAGCAGTTC
71941 CACGCGCTCA CGGTCAGCTT CGACCCGCGC GAGCGCCCGG CGGCCGCDD
实施例2
黄色粘球菌表达载体的构建
噬菌体MX8的,提供整合与附着功能的DNA被插入到商业上获得pACYC184(New England Biolabs公司)。如salm等人,1998年2月,在细菌学杂志(J.Bact.)180(3):614-621所述,一个大约2360bp的质粒pPLH343的MfeI-SaaI片段被分离,并连接到质粒pACYC184的大的EcoRI-XmnI限制片段上。形成的环状DNA为大约6Kb,被称之为质粒pKOS35-77。
质粒pKOS35-77作为一个很便利的质粒,在环氧噻酮PKS基因启动子的控制下表达本发明的重组PKS基因。在一个例证性实施方案中,整个的环氧噻酮PK5基和它的内源启动子一起,被以一个或几个片段插入质粒中以得到本发明的表达载体。
本发明还提供了表达载体,其中本发明的重组基因在黄色粘球菌启动子的控制下。为构建一个例证性的质粒,黄色粘球菌(M.Xanthus)pilA基因的启动子被作为PCR扩增产物分离出来。如Wu和Kaiser,于1997年12月在细菌学杂志.179(24):7748-7758所述,含有pilA基因启动子的质粒Pswu357与PCR引物Seq1和Mxpill引物混合:
Seq1:5’-AGCGGATAACAATTTCACACAGGAAACAGC-3’
Mxpill:5’-TTAATTAAGAGAAGGTTGCAACGGGGGGC-3’
使用标准的PCR条件扩增,得到一个~800bp的片段。用限制酶KpnI裂解片段,并连接到商业上得到的质粒pLitmus 28C  (New Englmd.Biolabs公司)大的kpnI-EcoRV限制性片段上。得到的环状DNA被命名为pKOS35-71B。
自质粒pKOS35-71B的pilA基因的启动子作为一个约800bp的EcoRV-SnaBI限制性片段被分离出来,并与质粒pKOS35-77的大的MscI限制性片段连接,得到一个约6.8kb大小的环状DNA。因为约800bp的片段可以以两个方向连接,连接产生了两种同样大小的质粒,被命名为质粒pKOS35-82.1和pKOS35-82.2。这些质粒的限制性位点和功能图谱如图3所示。
质粒pKOS35-82.1和pKOS35-82.2可以作为本发明载体的很方便的起始材料,其中重组PKS基因被置于黄色粘球菌pilA基因启动子的控制下。这些质粒在紧靠启动子转录起始位点的下游有一个单一的PacI限制酶识别序列。在一个例证性实施方案中,不带自身同源启动子的完整的环氧噻酮PKS基因启动子被以一个或更多片段插入到质粒的PacI位点,生成本发明的表达载体。
这些质粒中的pilA序列如下所示
CGACGCAGGTGAAGCTGCTTCGTGTGCTCCAGGAGCGGAAGGTGAAGCCGGTCGGCAGCGCCGCGGAGATTC
CCTTCCAGGCGCGTGTCATCGCGGCAACGAACCGGCGGCTCGAAGCCGAAGTAAAGGCCGGACGCTTTCGTG
AGGACCTCTTCTACCGGCTCAACGTCATCACGTTGGAGCTGCCTCCACTGCGCGAGCGTTCCGGCGACGTGT
CGTTGCTGGCGAACTACTTCCTGTCCAGACTGTCGGAGGAGTTGGGGCGACCCGGTCTGCGTTTCTCCCCCG
AGACACTGGGGCTATTGGAGCGCTATCCCTTCCCAGGCAACGTGCGGCAGCTGCAGAACATGGTGGAGCGGG
CCGCGACCCTGTCGGATTCAGACCTCCTGGGGCCCTCCACGCTTCCACCCGCAGTGCGGGGCGATACAGACC
CCGCCGTGCGTCCCGTGGAGGGCAGTGAGCCAGGGCTGGTGGCGGGCTTCAACCTGGAGCGGCATCTCGACG
ACAGCGAGCGGCGCTATCTCGTCGCGGCGATGAAGCAGGCCGGGGGCGTGAAGACCCGTGCTGCGGAGTTGC
TGGGCCTTTCGTTCCGTTCATTCCGCTACCGGTTGGCCAAGCATGGGCTGACGGATGACTTGGAGCCCGGGA
GCGCTTCGGATGCGTAGGCTGATCGACAGTTATCGTCAGCGTCACTGCCGAATTTTGTCAGCCCTGGACCCA
TCCTCGCCGAGGGGATTGTTCCAAGCCTTGAGAATTGGGGGGCTTGGAGTGCGCACCTGGGTTGGCATGCGT
AGTGCTAATCCCATCCGCGGGCGCAGTGCCCCCCGTTGCAACCTTCTCTTAATTAA
为制备本发明的重组黄色粘球菌宿主细胞,在CYE培养基中培养该黄色粘球菌(Myxococcus xanthus)细胞(Campos和Zusman,1975,黄色粘球菌的发育调节:effect of 3′:5’-cyclic Amp,ADP and nutrition,Pro.Natl.Acad.Sci USA72:518-522[3′:5’环腺苷酸,ADP和营养的作用,美国科学院院报]72:J518-522),在30℃,300rpm下,培养至100klett。剩下的过程除非另外说明,是在25℃下进行的。(离心8000rpm,10分钟,SS34或SA600转子)在去离子水中沉淀细胞,并悬浮。再次沉淀细胞,并悬浮在原始体积1/100的体积中。
将DNA(1到2μl)在室温,400ohm,25μFD,0.65V,持续时间范围8.8-9.4的范围内,电穿孔转移到细胞中。DNA应该是无盐的,因此应该再悬浮在蒸馏水和去离子水中,或者用0.025μm的VS型薄膜(millipore公司)透析。对于低效的电穿孔来说,斑点透析所述的DNA,并在CYE培养基中过度生长,电穿孔后加1ML的CYE培养基,用另外1.5mL的CYE在小管中中收集细胞,此前加入到50ML的三角摇瓶中(总体积2.5mL)。使细胞在30到32℃,300rpm生长4到8小时(或过夜)以使选择性标记得到表达。然后,将细胞涂在带选择条件的CYE软琼脂平板上。如果选择性标记是卡那霉素,那么每μgDNA通常可以得到103到105个细胞。如果选择性标记是链霉素,那么它必须包含在顶层琼脂中,因为它能够结合琼脂。
通过这种方法,本发明的重组DNA表达载体被电穿转入粘球菌宿主细胞中,它在细胞中表达本发明的重组PKS,并产生环氧噻酮,环氧噻酮衍生物,和其它由它们所编码的新的聚酮化合物。
实施例3
用于黄色粘球菌中环氧噻酮表达的细菌人工染色体的构建。
为了在异源宿主中表达环氧噻酮PKS和修饰酶基因,通过发酵黄色粘球菌,生产环氧噻酮,这种细菌与纤维堆囊菌密切相关,并且有许多克隆载体可使用,也可以根据本发明的方法使用黄色粘球菌。因为黄色粘球菌和纤维堆囊菌都是粘细菌,预料它们会共同使用基因表达,翻译调控和翻译后修饰(如果有的话)的元件,因此增加了来自纤维堆囊菌的epo基因可在黄色粘球菌中表达产生环氧噻酮的可能性。黄色粘球菌也已经利用基因克隆和表达。可以通过电穿孔导入DNA,可以使用大量的导入外源DNA所需的载体和遗传,包括令其稳定插入染色体的那些。最后,黄色粘球菌可相对容易地在发酵器中的复合培养基中生长,并可在需要时,通过操作来提高基因表达的水平。
为将环氧噻酮基因簇导入黄色粘球菌中,可以应用本发明的粘粒和同源重组,将环氧噻酮基因簇导入染色体中,组装完整的基因簇别。也可以选用将完整的环氧噻酮基因簇克隆到细菌人工染色体(BAC)上,然后转导进入黄色粘球菌,以整合进入染色体中。
为从粘粒pKOS35-70.1A2和pKOS35-79.85组装基因簇,从这些粘粒所得到的小的同源区被导入黄色粘球菌中以提供基因簇2片段的重组位点。如图4所示,制备了质粒pKOS35-154和pKOS90-22以导入这些重组位点。在黄色粘球菌染色体中组装环氧噻酮基因簇的策略如图5所示。开始时,在细菌染色体中选择一个不会破坏任何基因或转录单位的中性位点。这样的区域在devS基因的下游,它不影响黄色粘球菌的生长或发育。第一质粒,pKOS35-154被用DraI切割成线性并电穿孔转入黄色粘球菌中。这个质粒含有两个靠近环氧噻酮基因簇的两上片段的dev位点的两个区域。卡那霉素抗性标记和galk基因被插入到epo基因区间。如果DNA通过以dev区序列为同源区的双重组重组进dev区中,将有卡那霉素抗性克隆生长起来。菌株K35-59,含有少量的环氧噻酮基因簇,它允许pKOS35-79.85重组。因为pKOS35-79.85上和K35-159上的的抗性标记一样,一个四环素转座子被转到粘粒中,筛选含有插入卡那霉素标记中的转座子的粘粒。粘粒pKOS90-23被电穿孔导入k35-159中,筛选土霉素抗性克隆创建菌株K35-174。为从粘粒中移除不需要的区域,仅仅留下环氧噻酮基因,将细胞涂在含1%半乳糖的CYE平板上。galk基因的存在使细胞对1%半乳糖敏感。半乳糖抗性克隆K35-174代表了这种细胞,它们通过重组,或者galk基因中发生突变失去了galk标记,如果发生了重组,那么半乳糖抗性菌株就会对卡那霉素和土霉素敏感。对两种抗生素敏感的菌株被通过southern杂交分析证实。正确的菌株被得以证实,并命名为K35-175,它含有的基因簇从组件7,通过两个可读框到epoL基因。
为了从组件7导入组件1,再重更一次上述的过程。质粒pKOS90-22被用DraI线性化,并电穿孔导入K35-175中,创建K35-180。用四环素抗性的pKOS35-70.1A2,pKOS90-38电穿孔转化该菌株,并筛选对土霉素抗性的克隆。产生的菌株是K35-185。现在通过对1%半乳糖抗性筛选含有整个环氧噻酮基因族的重组子,结果得到菌株K35-188。这个菌株含有所有的环氧噻酮基因,以及所有可能的启动子。发酵这个菌株并检测环氧噻酮A和B的产生。
为将整个基因簇作为一个片段克隆,构建了一个细菌人工染色体BAC文库。首先,SMP44细胞被包理在标脂糖中,并根据BIO-RAD基因组DNA插入试剂盒的方法裂解。DNA插入片段被用限制酶例如Sau3AI或者HindIII进行部分消化,在FIGE或者CHEF胶上电泳。通过从琼脂糖上电洗脱DNA片段,或者选用琼脂酶降解所述的琼脂糖分离DNA片段,这种选择分离该片段的方法参见strong等人,1997,Nucleic Acids Res(核酸研究)19:3959-3961。DNA连接进入合适的酶裂解的BAC(pBelBACII)中。pBeloBACII的图谱显示如下。
Figure C9981567800841
DNA通过电穿孔转入DH10B细胞中,获得一个纤维堆囊粘菌基因组文库,方法参见Sheng等人,1995,Nucleic Acids Res(核酸研究),23:1990-1996。使用来自环氧噻酮基因簇的NRPS区作为探针来筛选克隆。挑选出阳性克隆,分离DNA,通过限制性分析证明完整的基因簇的存在。这个阳性克隆被命名为pKOS35-178.
为制备可用来导入pKOS35-178的菌株,构建了pKOS35-164质粒,它含有dev位侧边的环氧噻酮基因簇上游和下游的同源区,并且含有卡那霉素抗性galk弹夹,它与pKOS90-22和pKOS35-154同系。这个质粒被用DraI切成线状,电穿孔导入M.xanthaS中,根据Kafeshi等人,1995 Mol.Microbiol.15:483-494.(分子微生物学)报道的方法进行,得到K35-183菌株。质粒pKOS35-178可以通过电穿孔或者噬菌体P1的转导导入K35-183中,并筛选氯霉素抗性克隆。可选地,含有pRP4接合转移起点的pKOS35-178质粒可以构建DNA,用于从大肠杆菌向K35-183中的转移。这个质粒的构建是先构建一个含有来自RP4的oriT区和来自pACYC184的四环素抗性标记的转座子,然后在体内或体外,将转座子转座到pKOS35-178上。这个质粒转化进入S17-1,并经接合转移导入黄色粘球菌。菌株K35-190在1%半乳糖存在的条件下生长,以筛选第二个重组。该菌株含有所有的环氧噻酮基因和所有可用的启动子。发酵这个菌株,并检测环氧噻酮A和B的产生。
除了将pKOS35-178整合进dev位点外,还使用来自粘细菌噬菌体MX8或者MX9的整合功能整合进一个噬菌体附着位点。构建了一个转座子,它含有来自MX8或者MX9的整合基因和附着位点,以及来自pACYC184的四环素基因。这个转座子的另一种样式中是仅仅具有附着位点。在这一样式中,整合基因是反式提供的,经一个电穿孔共转移的含有整合酶基因的质粒,或者从组成型启动子的电穿孔转化菌株表达的,比如mgl启动好表达的整合酶蛋白(参见Margrini等人,1999年7月,J.Bact(细菌学杂志).181(13):4062-4070,)来完成。一旦构建了转座子,将其转座到pKOS35-178上,创建pKOS35-191。将这个质粒导入上述的黄色粘球菌中。该菌株含有所有的环氧噻酮基因和所有可用的启动子。发酵这个菌株,检测环氧噻酮A和B的产生。
一旦环氧噻酮基因被构建到黄色粘球菌菌株中,对基因簇的任何部分的操作,例如改变启动子或交换组件,都可以通过卡那霉素抗性和galk序列弹夹来实现。
将含有epo基因的黄色粘球菌培养物生长在许多种培养基中,检测环氧噻酮的产生。如果环氧噻酮(特别是B或者C)产生的水平太低,不能用于大规模发酵,则可使如下所述的用于提升链霉菌中产生水平的方法,提高菌株的表达水平的。
实施例4
链霉菌表达载体的构建
本发明提供了在链霉菌宿主中,组件式(MODULAR)聚酮化合物合成酶基因异源表达的重组表达载体。这些载体包括使用actI启动子的表达载体,该启动子受基因actII ORF4的调节,使得当生成的细胞进入稳定期后,其调节表达处于高水平上。
这些载体中可用的是质粒pRM1和pRM5,以及它们的衍生物,如pCKJ,它是稳定的,低拷贝,带有放线菌中的硫链霉素抗性标记的质粒。这些质粒可容纳插入大片段的克隆DNA,被用于在天蓝色链霉菌和淡青紫链霉菌中表达DEBS PKS,在淡青紫链霉菌中表达苦霉素PKS基因和oleandomycin PKS基因。参见美国专利号5,712,146。本领域的技术人员可以认识到,淡青紫链霉菌中表达直到晚期生长时期制造tRNA,这种tRNA识别亮氨酸的TTA密码子,如果所要的蛋白是在早期产的,那么可进行合适的密码子修饰。
Figure C9981567800861
质粒pCK7。
另一个载体质粒pSET152的衍生物,含有actII ORF4 PactI表达系统,但是带有apramycin抗性筛选标记。这些载体含有attP位点和放线菌噬菌体phic31的整合酶基因,不能在链霉菌宿主细胞中自主复制,但是在导入宿主细胞后,在phic31的附着位点处通过位点专一性重组,整合到染色体中。pCK7和pSET152的衍生物,以及从各个质粒表达的不同的PKS基因被一起用于缩聚酮的异源产生。参见1999年4月16日递交的美国专利申请序列号60/129,731专利申请。
质粒图:pKOSO10-153,一种pSET152衍生物。
很明显需要开发在链霉菌中起使用的环氧噻酮PKS的表达载体。现在环氧噻酮化合物可在生长缓慢,遗传上上可改变的纤维堆囊菌细胞中产生,或者通过合成而制备。链霉菌,它是一种产生70%的所有已知抗生素和重要的复杂聚酮化合物的细菌,它是非常好的产生环氧噻酮和环氧噻酮衍生物的宿主。淡青紫链霉菌和天蓝色链霉菌被开发用于表达异源的PKS系统。这些生物能稳定地保持克隆的异源PKS基因,在控制条件下高水平地表达它们,以及修饰相关的PKS蛋白质(例如,磷酸泛酰巯基亚胺化),因此它们能够产生这些基因编码的聚酮化合物。而且,这些宿主含有必需的产生聚酮化合物合成的底物的途径,例如丙二酰基辅酶和甲基丙二酰基辅酶A。对于这些宿主可以利用多种克降和表达载体,以及外源DNA大片段的导入和稳定保存的方法。相对于缓慢生长的纤维堆囊菌宿主来说,淡青紫链霉菌和天蓝色链霉菌(S.lividans和S.coeliclor)在许多种培养基上生长良好,适于在发酵器中高水平产生聚酮化合物。许多种方法可以提高产量,包括搅拌方法以增加表达的速度,提高前体的供应等,以增加表达的速度,提高前体的供应等等。长期以来证明对链霉菌中许多种其它聚酮化合物有效的,许多种增加聚酮化合物滴度的方法,可用于本发明的产环氧噻酮和环氧噻酮衍生物的缩主细胞。
为通过发酵在异源链霉菌缩主细胞中生产环氧噻酮,环氧噻酮基因(包括NRPS组件)被以两个片段克隆到pCK7(装载结构域到组件6)和pKOSO10-153(组件7到9)衍生物中。这两种质粒被导入淡青紫链霉菌中,以用来筛选硫链丝菌素和阿泊拉霉素的抗性。在这种安排中,pCK7衍生物自主复制,而pKOS010-153衍生物整合到染色体中。在两个载体中,环氧噻酮基因的表达受质粒内的存在的actI启动子的控制。
为提高克隆的效果,两个环氧噻酮克隆编码片段(一个是经组件6装载结构域,一个是组件7到9)与ery PKS组件5的KS结构域N端片段的翻译融合的形式进行克隆。使用KS5作为第一个翻译序列从这个启动子显示高水平的表达,参见Jacobsen等人,1998年生物化学Biochemistry,37:4928-4934。一个提供很大便利的BasBI位点存在于一个DNA片段中,该片段编码氨基酸序列EPIAV,EPIAV在许多KS的区域是高度保守的,包括epoA编码的和epoE中组件7的KS编码区。
含有环氧噻酮PKS的装载结构域和组件1到组件6的表达载体被命名为pKOS039-124,而组件7到9的表达载体被命名为pKOS039-126。本领域中的技术人员可以认识到,其它的载体和载体构件可用来制备同样的载体。因为本发明的优选的表达载体,如下所述衍生自pKOS039-124和PKOS039-126,根据布达佩斯条约的规定已经被保藏,下面只对质粒pKOS039-124和pKOS039-126的构建作一概述。
eryKS5接头编码序列作为来自质粒pKOS10-153的~0.4kb的PacI-BglII片段被克隆到pKOS039-98质粒中,构建质粒pKOS039-117。一大约8.7kb的来自粘粒pKOS35-70.1A2的片段,插入到EcoRI-XbaI消化的质粒pLItmus28上,从而将eryKS5接头的编码序列连接到环氧噻酮装载结构域的编码序列上。所得质粒的~3.4kb的BsaBI-NotI和~3.7kb的NotI-HindIII限制性片段,插入到BsaBI-HindIII消化的质粒pKOS039-117上,构建质粒pKOS039-120。质粒pKOS039-120的~7kb的PacI-XbaI限制性片段被插入到质粒pKA018上,构建质粒pKOS039-123。将粘粒pKOS35-70.1A2的~34kb的XbaI-AvrII限制性片段与pKOS039-123的~21.1kb的AvrII-XbaI限制性片段连接,构建了最终的pKOS039-124表达载体。
质粒表达载体pKOS039-126的构建流程如下所述。首先,经过BglII-NotI双酶切消化pKOS35-70.4所得约6.9kb片段与NotI-HindIII双酶切消化pKOS35-79.85所得约5.9kb片段克隆至用BglII-HindIII双酶切消化的质粒pLitmus28上,构建质粒pKOS039-119,将粘粒pKOS35-70.4和pKOS35-79.85得到组件7的编码序列连接。将NdeI-NheI双酶切消化粘粒pKOS35-79.85所得约12kb片段克隆至用NdeI-XbaI双酶切消化的pKOS039-119质粒载体上,构建得到质粒pKOS039-122。
为了将eryKS5接头编码序列与组件7编码序列融合,由BsaBI-Ngl II双酶切消化粘粒pKOS35-70.4所得约1kb片段克隆至用BsaBI-Ncl I双酶切消化的pKOS039-117质粒载体上,构建质粒pKOS039-121。由Avr II酶切消化pKOS039-122所得约21.5kb片段克隆至用Avr II-Xbal双酶切消化的pKOS039-121质粒载体上,构建得到质粒pKOS039-125。由PacI-EcoRI双酶切消化pKOS039-125所得约21.8kb片段被连接至用PacI-EcoRI双酶切消化质粒载体pKOS039-44所得大小约为9kb的片段上,构建质粒pKOS039-126。
利用相应的药物抗性筛选标记,将质粒pKOS039-124和pKOS126依次导入淡青紫链霉菌K4-114菌株中。因为质粒pKOS039-126在链霉菌中不能自主复制,只有发生质粒与染色体在phiC31的attB位点发生位点特异性重组的细胞才能在抗性筛选培养基中存活。因为质粒会稳定整合,不需要对阿泊拉霉素抗性进行持续的筛选。如果愿意可以在培养基中保持抗性成分。培养基中仍含有硫链丝菌肽(thiostrepton),以保证对质粒pKOS039-124的持续筛选。质粒pKOS039-124和质粒pKOS039-126被转入淡青紫链霉菌中,培养含有质粒的转化子并进行环氧噻酮产量测定。最初的测定没有发现环氧噻酮。
为了提高这些载体表达环氧噻酮的产量,用环氧噻酮PKS基因替代了eryKS5接头序列区,所得载体被转入天蓝色链霉菌(Streptomyces coelicolor)CH999中。为了利用PCR的方法扩增epoA基因编码序列,利用了以下两条引物:
N39-73,
5’-GCTTAATTAAGGAGGACACATATGCCCGTCGTGGCGGGATCGTCC-3’;
N39-74,5’-GCGGATCCTCGAATCACCGCCAATATC-3’。
模板DNA来自粘粒pKOS35-70.8A3。用限制性内切酶PacI和BamHI消化所得的约0.8kb PCR产物,再与质粒pKOS039-120约2.4kb BamHI-NotI酶切片段及约6.4kb PacI-NotI酶切片段相连接,构建质粒pKOS039-136。为了分别构建epoA,epoB,epoC,和epoD基因的表达载体,质粒pKOS039-136约5kbPacI-AvrII酶切片段被连至用PacI-AvrII酶切质粒pKOS039-124所得的约50kb片段上,构建表达质粒pKOS039-124R。质粒pKOS039-124R已遵循布达佩斯条约并受该条约保护,保藏于美国典型培养物中心(ATCC),保藏号为——。
为了PCR扩增epoE基因编码序列,设计了以下两个寡核苷酸引物:
N39-67A;N39-68,
N39-67A,5′-GCTTAATTAAGGAGGACACATATGACCGACCGAGAAGGCCAGCTC-CTGGA-3′,
N39-68,5′-GGACCTAGGCGGGATGCCGGCGTCT-3′.
模板DNA来自于粘粒pKOS35-70.1A2。所得的约0.4kb扩增产物用限制性内切酶PacI和AvrII消化,并被分别连至约29.5kb的PacI-AvrII酶切消化pKOS039-126载体片段上,构建质粒pKOS039-126R,或约23.8kb的PacI-AvrII酶切消化pKOS039-125载体片段上,得到质粒pKOS039-125R。质粒pKOS039-126R已按照布达佩斯条约保藏在美国典型培养物中心(ATCC,保藏号为——。
pKOS039-124R和pKOS039-126R质粒对(同样的还有pKOS039-124和pKOS039-126质粒对)含有完整的epoA,epoB,epoC,epoD,epoE,epoF,epoK和epoL基因。最后的两个基因位于质粒pKOS039-126R(同样的还有质粒pKOS039-126);然而,为了确保这些基因能够高水平表达,本发明的另一表达载体,质粒pKOS039-141(Fig 8)中的epoK和epoL基因被置于ermE*启动子调控之下。
为了PCR扩增epoK基因编码序列,设计了以下寡核苷酸引物:
N39-69,5′-AGGCATGCATATGACCCAGGAGCAAGCGAATCAGAGTG-3′;
N39-70,5′CCAAGCTTTATCCAGCTTTGGAGGGCTTCAAG-3′.
为了PCR扩增epoL基因编码序列,设计了以下寡核苷酸引物:
N39-71A,5′GTAAGCTTAGGAGGACACATATGATGCAACTCGCGCGCGGGTG-3′;
N39-72,5′-GCCTGCAGGCTCAGGCTTGCGCAGAGCGT-3′.
用于扩增的模板DNA来自于粘粒pKOS35-79.85。PCR产物被亚克隆至PCR-script以便进行序列分析。然后,分别用NdeI-HindIII和HindIII-EcoRI限制性内切酶酶切所得克隆,分离得到epoK基因片段和epoL基因片段,并连至经NdeI-EcoRI双酶切质粒pKOS039-134B所得的约6kb片段上,构建出质粒pKOS039-140。质粒pKOS039-134B含有ermE启动子。质粒pKOS039-140经NheI-PstI双酶切所得约2.4kb酶切片段被克隆至经XbaI-PstI消化的质粒pSAM-Hyg上,构建出质粒pKOS039-141。质粒pSAM2衍生物含有潮霉素抗性转移基因。
构建另一种质粒pKOS039-126R,向没有epoK和epoL基因的表达载体上提供epoE和epoF基因。质粒pKOS039-12(图9)的构建流程如下。质粒pXH106(见参考文献J.Bact.,1991,173:5573-5577)经限制性内切酶StuI和BamHI双酶切,分离出含有xylE及潮霉素抗性转移基因的约2.8kb酶切片段,克隆至用EcoRV-BglII酶切的质粒pLitmus28上。所得质粒的约2.8kb NcoI-AvrII限制性片段与质粒pKOS039-125R的约18kb PacI-BspHI酶切片段及质粒pKOS039-42的约9kb SpeI-PacI酶切片段相互连接,构建质粒pKOS045-12。
为了构建只含有epoL基因的表达载体,质粒pKOS039-141经限制性内切酶NdeI不完全消化,分离出约9kb NdeI酶切片段,所述的片段自我环化连接,生成质粒pKOS039-150。
于是,将以上构建的各种载体以多种组合分别转入天蓝色链霉菌CH999和淡青紫链霉菌K4-114中,转化的宿主细胞分别培养于固体平板和液体培养基上(R5培养基,即不含琼脂的R2YE培养基)。典型的发酵条件如下。首先,含有50μg/l硫链丝菌肽(thiostrepton)的约5mL种子培养液接种后在30℃培养2天。然后,取大约1-2mL的种子培养液转接到含50μg/l硫链丝菌肽和1mM半胱氨酸的50mL生产培养液中,于30℃培养5天。同时,用种子培养液在固体平板(该平板含有与生产培养液相同的成分,并添加10mM丙酸盐)上接种,于30℃培养9天。
对一些天蓝色链霉菌培养物及培养液进行环氧噻酮产量分析。液体培养物用等体积的乙酸乙酯抽提3次,合并有机相并蒸发浓缩,残余物经乙腈溶解,用于LC/MS分析测定。固体琼脂培养基切碎后用等体积丙酮抽提2次,合并丙酮相,经蒸发浓缩成含水泥浆,再用等体积乙酸乙酯抽提3次,合并有机相并蒸发浓缩,残余物经乙腈溶解,用于LC/MS分析测定。
利用LC质谱测定法可以估计环氧噻酮的产量。从分析型HPLC紫外检测仪流出的样品等量分配至Perkin Elmer/Sciex API100LC质谱仪和Alltech 500蒸发光谱散射检测仪上进行测定。样品上样于4.6×150mm反相HPLC柱(MetaChem5m ODS-3 Inertsil),用水平衡,流速为1.0mL/min。UV检测仪的波长设在250nm。样品组分先用H20洗脱1min,然后用0-100%乙腈梯度洗脱10分钟。在该洗脱条件下,环氧噻酮A会在10.2分钟后洗脱下来,环氧噻酮B会在10.5分钟后洗脱下来。利用大气化学离子源,喷口及环压分别为75V和350V,分辨率为0.1amu的质谱仪进一步测定并确证了这些组分的可靠性。在这些条件下,环氧噻酮A的[M+H]值显示为494.4amu,在476.4,318.3和306.4amu处有可观察到的碎片。环氧噻酮B的[M+H]值显示为508.4amu,在490.4,320.3和302.4amu处有可观察到的碎片。
含有pKOS039-124R和pKOS039-126R质粒对或pKOS039-124和pKOS039-126R质粒对的转化子产生可检测量的环氧噻酮A和环氧噻酮B。含有这些质粒对及附加质粒pKOS039-141的转化子也产生相同量的环氧噻酮A和环氧噻酮B,表明在该实验条件下,附加epoK和epoL基因拷贝是非必需的。因此,当重组epoA,epoB,epoC,epoD,epoE,epoF,epoK和epoL基因存在时,这些转化子可生产环氧噻酮A和B。观测结果表明,没有丙酸盐时,环氧噻酮A和B的比例会增加。
含有pKOS039-124R和pKOS045-12质粒对的转化子产生环氧噻酮C和D,同样含有该质粒对和质粒pKOS039-150的转化子也可以产生环氧噻酮C和D。这些结果显示在该实验条件下,附加epoL基因拷贝对于形成C-12-C-13双键是非必需的。这些结果表明有可能单独的环氧噻酮PKS基因即可完成双健的形成,也有可能天蓝色链霉菌表达一种基因产物,能够将环氧噻酮G和H转变成为环氧噻酮C和D。因此,当重组epoA,epoB,epoC,epoD,epoE,和epoF基因存在时,这些转化子可生产环氧噻酮C和D。
这里所述的环氧噻酮PKS异源表达被认为代表的是在重组宿主细胞中已被表达的最大蛋白及活性酶类复合体的重组表达。可生产环氧噻酮的天蓝色链霉菌转化子所显示的生长状态表明,环氧噻酮PKS基因或其产物,或是环氧噻酮,抑制了细胞的生长,或在某种程度上对细胞有毒害作用。任何此类抑制或毒害活性皆有可能归因于细胞内环氧噻酮的积累,据认为天然的纤维堆囊菌生产细胞可能含有某种转运蛋白,影响着环氧噻酮向细胞外的转运。此类转运子基因被认为存在于epoK基因及上述基因下游的开放可读框中。因此,本发明提供的链霉菌及其它宿主细胞含有编码一个或多个产物的重组基因包括该区域的所有开放可读框编码序列。
例如,每个可读框编码序列皆可克隆在ermE*启动子之后,参见参考文献Stassi等人,1998年,Appl.Microbiol.Biotechnol(应用微生物生物技术).49:725-731,通过噬菌体phiC31的attB位点进行位点特异性重组,pSAM2系列质粒载体能够整合进入天蓝色链霉菌和淡青紫链霉菌中,参见参考文献Smokyina等人.,1990,Gene 94:53-59。携带潮霉素抗性基因的pSAM2系列质粒载体经改造,携带后面接有多克隆位点的ermE*启动子。PCR得到得每个下游开放可读框编码序列克隆至质粒载体后,被导入宿主细胞中(已含有pKOS039-124R和pKOS039-126R,或本发明其它表达载体),用潮霉素抗性进行筛选。分析那些携带每个epoK基因下游单个基因的克隆中,增加环氧噻酮的产量。
以下介绍了其它一些有关另外的发酵及株系改良的方法。在多种构建体中PKS基因的表达水平可以通过分析比较其mRNAS水平与相同宿主中类似表达载体上其它异源PKS mRNA水平(如苦霉素)加以检测(通过定量RT-PCR)。如果有一种环氧噻酮转录子生产不足,可以将相应的DNA片断在不同的表达载体上克隆增强其表达。例如,假如一个或者多个基因产物的生物合成限速的话,任何一或多个环氧噻酮PKS基因多重拷贝均能导入细胞。如果产量低的原因不是因为PKS基因的低水平表达(在RNA水平),可采用每种重要的商业化发酵产物产量改良中常用的经验式的突变及筛选方法加以提高。将孢子暴露在UV、X-射线中,或用化学诱导突变剂处理,将单个幸存菌斑涂板,并转接后进行小规模发酵实验以检测产量。尽管这个过程可以自动化,还可以用易感菌类Mucor hiemalis作为试验有机体,检测数千个菌斑的环氧噻酮生产量。
增加环氧噻酮产量的另一种方法是将环氧噻酮PKS装载结构域的KSY结构域转变成KSQ结构域。这种装载结构域的变换方法有许多种,其中一种示意途径,但非限定性的如下。本发明的pKOS39-124R质粒可以方便作为起始材料。为了扩增构建过程中有用的DNA片段,使用了下列4条寡核苷酸引物:
N39-83:5′-CCGGTATCCACCGCGACACACGGC-3′,
N39-84:5′-GCCAGTCGTCCTCGCTCGTGGCCGTTC-3′,
和如上所述的N39-73以及N39-74。由引物N39-73和N39-83,引物N39-74和N39-84扩增所得的PCR片段各自用PacI-BamHI双酶切,并连接至约3.1kb的质粒pKOS39-120PacI-BamHI片段上,构建得到质粒pKOS039-148。约0.8kb的pKOS039-148 PacI-BamHI限制性酶切片段(含有这两个PCR产物)与质粒pKOS039-120的约2.4kb BamHI-NotI片段及约6.4kb PacI-NotI片段相连接,构建得到pKOS39-136Q。约5kb的质粒pKOSO39-136Q PacI-AvrII片段与约50kb的质粒pKOS039-124 PacI-AvrII限制性酶切片段相连接,构建得到质粒pKOS39-124Q。然后将质粒pKOS039-124Q与pKOS039-126R转化至天蓝色链霉菌CH999中,以产生环氧噻酮。
从epoA到epoF,随意加上epoK或epoK与epoL,这些基因的克隆及表达就足以完成环氧噻酮化合物的合成,并且C-12H至C-12甲基类型的合成似乎也与天然宿主中的所见相类似(A∶B::2∶1)。这个比率显示组件4的AT结构域更接近类似于丙二酰而不是甲基丙二酰特异性AT共有结构域。因此,环氧噻酮D和B的产生量要比它们对应的C-12未甲基化配对物C和A要少。本发明提供了专门产生环氧噻酮D和/或B的PKS基因。特别地,多种来源中具有的甲基丙二酰CoA特异性AT结构域(例如,narbonolide PKS,纳巴霉素rapamycin PKS,及以上所列的其它一些PKS)可以用来替代天然生成的组件4的AT结构域。这种调换可以通过将相应DNA序列的定向克隆至环氧噻酮PKS编码DNA片段的合适位点、或者通过同源重组进行基因重排来实现。
对于通过同源重组进行基因重排,待调换的供体序列被置在穿梭载体上,并且其侧翼序列至少有1kb全长要与epo组件4的AT结构域编码DNA相匹配。同源区的交叉重组导致epo AT4结构域与穿梭载体上的相应区域发生调换。因为pKOS039-124和pKOS039-124R含有AT4编码序列,它们可被用作宿主DNA用于调换。临近的DNA片段被克隆至一个大肠杆菌E.coli系列具温度敏感型复制特征的质粒上。异源AT结构域可以沿正确方向被克隆在这些质粒上,位于同源区之间作为弹夹,从而能够同时完成数个AT调换。通过将重构质粒(pKOS039-124*或pKOS039-124R)和pKOS039-126或pKOS-39-126R一起导入天蓝色链霉菌和/或淡青紫链霉菌中,以测试它们合成环氧噻酮B的能力。
因为携带不同基因置换的株系与株系之间的聚酮化合物效价的多样性,本发明提供了一系列异源甲基丙二酰CoA特异性AT结构域,以确保产生的环氧噻酮D在效价上等同于上述天蓝色链霉菌宿主中产生的环氧噻酮C和D混合物。其外,供体基因的大片段可被用于置换,除了AT结构域之外,还包括对应于完整组件的临近上游区及下游区序列。如果完整的组件被用于置换,可以从实施例中得到完整的KS,甲基丙二酰AT,DH,KR,ACP的编码DNA序列,并不仅限于纳巴霉素PKS的第十组件编码DNA序列,或FK-520PKS的第一或第五组件。
实施例5
EpoK的异源表达及环氧噻酮D向环氧噻酮B的转化
这个实施例叙述了epoK基因在大肠杆菌中的表达载体的构建。EpoK基因产物在大肠杆菌中作为与多聚组氨酸靶(his tag)共表达成融合蛋白的形式进行表达。纯化融合蛋白后,用于环氧噻酮D向环氧噻酮B的转化。
构建的质粒所编码的融合蛋白中,所含的6组氨酸残基既可融合在EpoK的氨基末端,也可融合在EpoK的羧基末端。下列寡核苷酸被用于质粒的构建:
55-101.a-1:
5′-AAAAACATATGCACCACCACCACCACCACATGACACAGGAGCAAGCGAAT-CAGAGTGAG-3′,
55-101.b:
5′AAAAAGGATCCTTAATCCAGCTTTGGAGGGCTT-3′,
55-101.c:
5′-AAAAACATATGACACAGGAGCAAGCGAAT-3′,and
55-101.d:
5′-AAAAAGGATCCTTAGTGGTGGTGGTGGTGGTGTCCAGCTTTGGAGGGCTTC-AAGATGAC-3′.
利用引物55-101.a-1和引物55-101.b,构建了编码氨基酸末端标记融合蛋白,Pkos55-121的质粒,利用引物55-101.c和引物55-101.d,在含有pKOS35-83.5为模板的PCR反应中构建了羧基末端编码区的质粒pKOS55-129。质粒pKOS35-83.5含有约5kb NotI酶切片段,该片段含有被连在pBluesCriptSKII+(Stratagene)上的epoK基因。PCR产物经限制性内切酶BamHI和NdeI双切,连至同样用BamHI和NdeI双切的pET22b(Invitrogen)上。所得两个质粒经测序,确证在PCR扩增过程中没有引入突变。按本领域常规方法进行蛋白质凝胶。
EpoK的纯化按以下方法进行。质粒pKOS55-121和pKOS55-129被转入含有groELS表达质粒pREP4-groELS的BL21(DE3)菌株中(Casper等人,1994,Cellular and Molecular Biology[细胞分子生物学]40(5):635-644)。菌株接种至加有2mM MgSO4,1%葡萄糖,20mg维生素B1,5mg FeCl2,4mg CaCl2和50mg乙酰丙酸的250mL M9培养基中。当培养物生长至OD600位于0.4-O.6之间时,加入终浓度为1mM的IPTG进行诱导表达,培养物可继续生长2小时后收集菌体。菌体收集后,冻于-80℃。冻存的菌体细胞重悬于10mL缓冲液1中(5mM咪唑,500mM NaCl,和45mM Tris pH7.6),用超声波破碎细胞三次,每次15秒,超声波强度设为8。细胞碎片经SS-34转子于16,000rpm离心30分钟。移去上清液,16000rpm离心30分钟。上清置入5mL的镍柱(Novagen),然后用50mL的缓冲液1洗脱(Novagen)。EpoK用从5mM到1M梯度的咪唑稀释。含有EpoK的部分被收集并用1L的透析缓冲液透析两次(45mM的TrispH7.6,0.2mM的DTT,0.1mM的EDTA,和20%的甘油)。等分的样品在液氮中冷冻并——80℃保存。蛋白制备物的纯度大于90%。
如下述方法进行EpoK的测定(见Betlach等人.,生物化学(1998)37:14937通过引用被在此合并)。简而言之,反应包括50mM的Tris(pH7.5),21μM的菠菜铁氧化还原蛋白,0.132单位的菠菜铁氧化还原蛋白:NADP+氧化还原酶,0.8单位的葡萄糖6磷酸脱氢酶,1.4μM的NADP,和7.1mM的葡萄糖6磷酸,100或200μM的环氧噻酮D(S.Danishefsky公司惠赠),和1.7μM的氨基酸末端组氨酸标记EpoK或1.6μM的羧基末端组氨酸标记EpoK总体积为100μl。反应体系在30℃温育67分钟并在90℃两分钟来终止反应。通过离心除去不溶的物质,50μL的上清液通过LC/MC进行分析。HPLC条件为:Metachem5μODS-3 Inersil(4.6×150mm);80%的水1分钟,用100%的MeCN 10分钟流速1mL/min,用UV(λmax=250nm),ELSD,和MS测定。在这些条件下,在11.6分钟洗脱出环氧噻酮D,且9.3分钟时洗脱出环氧噻酮B。LC/MC被获得通过使用带有孔和环的气压化学离子化源,分别在1amu的团溶液中设置为20V和250V电压。在这些条件下,环氧噻酮E在m/z493处表现[M+H]峰,并有491和320处可见碎片峰。
含EpoK以及环氧噻酮D的反应物包括在对照中不存在的化合物其表现相同的保持时间,分子量,以及分子片段模式环氧噻酮B。环氧噻酮D的浓度为100μM时,氨基和羧基末端组氨酸标记的EpoK能够分别转化82%和58%为环氧噻酮B。在浓度为200μM时,能够分别转化44%和21%为环氧噻酮B。这些结果表明EpoK能够将环氧噻酮D转化为环氧噻酮B。
实施例6
化学生物合成修饰环氧噻酮
此实施例描述了一系列由本发明提供的硫酯通过化学生物合成来产生环氧噻酮衍生物。来自纤维堆囊粘菌的用于环氧噻酮生物合成的基因簇的DNA序列表明了PKS的启动涉及多肽和核酸成分的混合物。启动涉及带有丙二酰CoA的装载区域的类PKS部分的装载,接着,进行脱羧化和带有半胱氨酸的组件一的装载,然后,浓缩来形成酶联的N-乙酰基半胱氨酸。环化形成一个二氢噻唑,然后再被氧化形成一个酶联2-甲基噻唑-4-羧酸盐,其为装载区和NRPS的产物。甲基丙二酰CoA通过组件2的酮合成酶的浓缩,提供了如下列表所示的组件的底物。
本发明提供了化学生物合成产生环氧噻酮衍生物的方法和试剂,其相似的方式为PCT公开号99/03986和97/02358中加以描述。它提供了两种类型的底物:NRPS产物的类似物,以及组件2底物的类似物同带有突变的NRPS-样的结构域的PKS酶一起使用,组件3底物被与带有组件2的突变KS区域的PKS酶一起使用。
下图示出用作带有修饰的失活NRPS的环氧噻酮PSK的底物的组件2底物(N-乙酰基半胱胺硫酯):
通过相关羧酸的激化和用N-乙酰基半胱胺处理来制备组件2底物。激活的方法包括氯酸的形成,混合的酸酐的形成,或与浓缩试剂例如碳二亚胺的反应。
当作NAc硫酯用作带有KS2敲除的环氧噻酮PKS的底物的组件3底物为:
Figure C9981567800971
这些化合物通过三步法被制备。首先,乙醛用Witting试剂或其等同物处理来形成取代的丙烯酸酯。这些酯被皂化为酸,其然后被活化并用N-乙酰基半胱胺处理。
形成组件2和组件3的反应式如下所示。其他的适于产生通过环氧噻酮PKS用于多肽合成的起始物质的化合物被显示于表2中如羧酸(或可被转化为羧酸的乙醛)其被转化为用于提供给本发明宿主的N-乙酰基半胱胺。
A.噻吩-3-羧基N-乙酰基半胱胺硫酯
干燥的四氢呋喃的2mL噻吩-3-羧酸(128mg)溶液在惰性气体中被用三乙胺(0.25mL)和联苯磷酰基叠氮化物(0.50mL)。1小时后,加入N-乙酰基半胱胺(0.25mL),并且该反应进行12小时。混合物倒入水中并用等体积的乙酸提取三次。有机提取物被联合,依次用水,1N HCl,饱和CuSO4和盐水,然后用MgSO4,在真空中过滤和浓缩。在SiO2上使用醚层析,然后,通过乙烷基醋酸盐提供纯的化合物,通过标准的方法对其结晶。
呋喃--羧基N-乙酰基半胱胺硫酯
干燥的四氢呋喃的2mL呋喃-3-羧酸(112mg)溶液在惰性气体中被用三乙胺(0.25mL)和联苯磷酰基叠氮化物(0.50mL)。1小时后,加入N-乙酰基半胱胺(0.25mL),并且该反应进行12小时。混合物倒入水中并用等体积的乙酸提取三次。有机提取物被联合,依次用水,1N HCl,饱和CuSO4和盐水,然后用MgSO4,在真空中过滤和浓缩。在SiO2上使用醚层析,然后通过乙烷基醋酸盐提供纯的化合物,通过标准的方法对其结晶。
吡咯-2-羧基N-乙酰基半胱胺硫酯
干燥的四氢呋喃的2mL吡咯-2-羧酸(112mg)溶液,在惰性气体中被用三乙胺(0.25mL)和联苯磷酰基叠氮化物(0.50mL)。1小时后,加入N-乙酰基半胱胺(0.25mL),并且该反应进行12小时。混合物倒入水中并用等体积的乙酸提取三次。合并有机提取物,依次用水,1N HCl,饱和CuSO4和盐水,然后用MgSO4,在真空中过滤和浓缩。在SiO2上使用醚层析,然后通过乙烷基醋酸盐提供纯的化合物,通过标准的方法对其结晶。
2-甲基-3-(3-噻吩基)丙烯酸盐N-乙酰基半胱胺硫酯
(1)乙烷基2-甲基-3-(3-噻吩基)丙烯酸盐:干燥的四氢呋喃(20mL)吡咯-3-carboxaldehyde(1.12g)和(乙氧羰基亚乙基)三苯正膦(4.3)的混合物被逆流加热16小时。混合物被冷却到室温并在真空中浓缩干燥。将固体残基悬浮在1∶1的醚/乙烷中,并过滤除去三苯磷化氢。滤出物通过SiO2使用1∶1的醚/乙烷过滤提供这种产物(1.78g,91%)作为淡黄色油。
(2)2-甲基-3-(3-噻吩基)丙烯酸:来自(1)的酯倍溶解于甲醇(5mL)和8N KOH(5mL)并回流加热30分钟。混合物被冷却到室温,用水稀释,并用酯洗涤两次。液相用1N HCl酸化,然后用等体积的酯提取三次。合并有机提取物,然后用MgSO4干燥,用2∶1的醚/乙烷结晶提供无色针体。
(3)2-甲基-3-(3-噻吩基)丙烯酸盐N-乙酰基半胱胺硫酯:干燥的四氢呋喃的2mL2-甲基-3-(3-噻吩基)丙烯酸(168mg)溶液在惰性气体中用三乙胺(0.56mL)和联苯磷酰基叠氮化物(0.45mL)。15分钟后,加入N-乙酰基半胱胺(0.15mL),并且该反应进行4小时。混合物倒入水中并用等体积的乙酸提取三次。合并有机提取物,依次用水,1N HCl,饱和CuSO4和盐水,然后用MgSO4,在真空中过滤和浓缩。在SiO2上使用醚层析然后通过乙烷基醋酸盐提供纯的化合物,通过标准的方法对其结晶。
将上述的化合物提供到含有本发明的重组环氧噻酮PKS的宿主细胞培养物中,其中的组件2的NRPS或KS区通过诱变,制备相应的本发明的环氧噻酮衍生物。
实施例7
在纤维堆囊菌SMP44中产生环氧噻酮和环氧噻酮衍生物
本发明提供了一系列重组的纤维堆囊粘菌宿主细胞,它与自然环氧噻酮的产生者如产生环氧噻酮衍生物的宿主细胞相比,产生较少的复合环氧噻酮的混合物。此实施例描述了该菌株的构建,通过描述如何产生仅生产环氧噻酮C和D不产生A和B的菌株。为了构建此菌株,在epoK基因中制备一个失活突变。使用含有NotI片段靠近epoK基因的质粒Pkos35-83.5,将来自Tn5的卡那霉素和博来霉素抗性标记结合到epoK基因的ScaI位点,构建pKOS90-55。抗性标记的定位是在转录卡那霉素启动子处,开始启动epoK的下游基因的表达。换言之,突变是非极性的。接着,来自RP4的联合运输的起点被结合于pKOS90-55来产生pKOS90-63。可将这个质粒导入S17-1,并同SMP44结合。在如前面所述的在腐草霉素平皿上筛选转化结合子。可选择的是,可利用上述用于黄色粘球菌的条件完成质粒的电穿孔。
因为有三个用于黄色粘球菌转导阶段,一个可以将DNA从黄色粘球菌运输到SMP44。首先在黄色粘球菌中通过线性化质粒pKOS90-55构建epoK基因突变子,并电穿孔进入黄色粘球菌中。筛选卡那抗性克隆,该克隆具有一个epoK的基因置换。用Mx9,Mx8,Mx4 ts 18 hft hrm噬菌体感染此菌株,产生噬菌体溶解物。此溶解物再分别被感染到SMP44,筛选腐草霉素抗性克隆。一旦构建了菌株,,如下文所述的标准的发酵方法能够用于产生环氧噻酮C和D。
在S42培养基上制备纤维堆囊菌宿主细胞的新鲜平皿。S42培养基含有色氨酸,0.5g/L,MgSO4 1.5g/L;HEPES,12g/L,琼脂,12g/L,用脱去离子水。S42培养基的pH用KOH调为7.4。为了制备S42培养基,在121℃自动裂解至少30分钟后,加入下述的成分(每升):CaCl2,1g;K2HPO4,0.06g;铁柠檬酸盐,0.008g;葡萄糖,3.5g;硫酸铵,0.5g:用液体培养基35mL;以及假如200mg/mL的卡那霉素以防止污染。32℃培养4-7天,或直到橙色堆囊(sorangia)在表面出现。
为了制备种子培养物来接种琼脂平皿/生物反应器,接着进行下面的方法。移去琼脂上的橙色的纤维堆囊菌细胞斑(大约5mm2)并转到带有38mm硅泡沫盖片的250mL带挡板的瓶中,其含有50mL的豆浆培养基,该培养基含有马铃薯淀粉,8g;脱脂豆粉,2g;酵母提取物,2g;铁(III)钠盐EDTA,0.008g;MgSO4.7H2O,1g;CaCl2.2H2O,1g;葡萄糖,2g;HEPES缓冲液,11.5g。使用去离子水,pH用10%KOH调为7.4。加入2-3滴抗泡剂B来阻止产泡。在蹄槽瓶中30℃250RPM培养4-5天。培养物将显现出橙色。此种子培养物可被反复扩大次培养,来接种在生产培养基的期望体积中。
同样的制备物可与带有下列成分的培养基1一起使用(每升):CaCl2.2H2O,1g;酵母提取物,2g;豆蛋白,2g;FeEDTA,0.008g;MgSO4.7H2O,1g;HEPES,11.5g;pH用10%KOH调为7.4,在121℃下自动裂解至少30分钟后,加入8mL的灭菌的40%的葡萄糖。用250mL带有金属薄片覆盖的的Spring瓶代替baffle瓶。加入2-3滴抗泡剂B来阻止产泡。在蹄槽瓶中30℃以及250RPM下培养7天。整个50mL扩大次培养到500mL的新鲜培养基中,在具有38mm硅泡沫盖片的,带挡板的窄颈Fernbach瓶中将0.5mL的抗泡剂加到培养物中。在相同的条件下培养2-3天。使用至少10%的接种体来用于生物反应器的培养。
为了在固体培养基上培养,可以使用以下的操作。制备(每升CNS培养基)含有KNO3,0.5g;Na2HPO4,0.25g;MgSO4.7H2O,1g;FeCl2,0.01g;HEPES,2.4g;琼脂,1.5g;以及无菌Whatman过滤纸。当琼脂没有完全固化时,在表面上放置一个无菌的过滤纸盘。当平皿干燥后,加入足够的种子培养物来完全覆盖表面(大约1mL)。用无菌环或涂布器均匀涂布,并32℃放入培养器培养7天。收获平皿。
为了在5L生物反应器中生产,采用下面的操作。发酵可在B.Braun BisetatMD-1%L生物反应器中进行。制备4L的生产培养基(与不含HEPES缓冲液的用于种子培养的豆粉培养基相同)。加入2%(体积对体积)XAD-16吸收树脂,不洗涤且不处理,例如,每50mL的生产培养基中加入1mL的XAD。使用2.5NH2SO4用作酸瓶,10%KOH作为碱瓶,50%的抗泡剂B作为抗泡瓶。为了样品的检测,确定使接触培养基的管道系统有一个小的开口,以允许XAD通过通道,收集每日的样品。在自动裂解之前,搅动混合物完全来均匀成分。校准pH探针和检测溶解氧的探针,以确保其正确的功能。使用一个小的约3英寸长的抗泡探针。对于瓶子来说,使用可以无菌焊接的,但在样品出口使用硅树脂管道系统。确定所有安装是安全的,管道系统被用C-夹子嵌住,但不是太紧。不要夹住管道系统来对冷凝器排放。将与任意开口管道连接的0.2μm过滤盘接触空气。使大的ACRO 50过滤盘用于大的管道系统。制备一个无菌空瓶用于接种。121℃无菌自动裂解90分钟。一旦反应停止自动裂解,通过各自的泵通过将管道系统与酸,碱和抗泡剂接触。释放夹子,确认管道系统没有被焊接死。将温度探测器贴在控制单元上。使反应器冷却,同时通过空气入口以较低的空气流速喷射空气。
在确定泵在工作,且没有流速和阻塞问题,将水池连接到水配头的软管上,并排气冷凝器。确定水套接近满负荷。设定温度为32℃。将pH,D.O.,和抗泡剂探针连接到主要的控制单元上。测试抗泡剂的正确功能。将pH调整为7.4。将搅拌速度设成400RPM。使用空气和氮气校准D.O.探针。调整使用发酵操作速率的空气流动,例如1LPM(升/分钟)。为了控制溶解氧的水平,调整参数在喷流之下使得搅拌被抵消,使空气的的水平保持在50%的D.O值。基于控制单元的设置,设置最小和最大的搅拌分别为400到1000RPM。如有必要,调整设置。
在接种入发酵容器之前,检测种子培养物的任意可能的污染。纤维堆囊菌细胞是棒状的,像一个柱子,在细胞的相对的末端带有2个大的不同的环形真液泡。其长最大约5倍细胞的宽度。使用10%(最小)的接种体积,例如,400mL加入4L的生产培养基。从容器中取出最初的样品,并检测小试的pH。如果在发酵容器pH和小试的pH的差别大于等于0.1单位,再校正1点。将deadband校正到0.1。取每日的25mL样品注明发酵pH,小试pH,温度,D.O.,气流,搅拌,酸,碱,以及抗泡剂水平。如有必要调整pH。在收获之前允许发酵7天。化合物的提取和分析大体上如上面实施例4所述的。简而言之,发酵培养物用乙烷基醋酸盐洗涤两次,浓缩干燥提取物,并溶解/悬浮在约500μL的Me-CNH2O(1∶1)中。样品被装在5ML的,预先用Me-CN H2O(1∶1)平衡的BakerbondODS SPE柱中。此柱用1mL的同种溶剂,然后是2mL的Me-CN洗涤。浓缩MeCN洗脱液至干燥。样品(50μl)通过在含有Beckman System Gold HPLC和PE S和配有气压化学离子源的API10LC单quadrapole MS-based检测仪的系统上进行HPLC/MS分析。环和孔电压被分别设置为75V和300。应用m/z290-330和450-550的双重范围扫描。HPLC条件:Metachem 5μODS-3Intersil(4.6×150mm);100%的水1分钟,然后用100%的MeCN多于10分钟流速1mL/min。在这种条件下,0.2分钟时洗脱出环氧噻酮A,且其在m/z494(M+H),476(M+H-H2O),318,和306处有特征离子。
实施例8
作为抗癌试剂的环氧噻酮衍生物
上述通式(I)经过以下显示的新环氧噻酮衍生物能够做为有效的的抗癌试剂,并且可用于治疗不同形式的包括乳房,卵巢,和肺癌的癌症病人。
环氧噻酮的结构与活性的关系建立在微管蛋白结合方式上(参见Nicolalou等人,1007,Angew.Chem.Int.Ed.Engl.36:2097-2103)如下所示:
Figure C9981567801011
A)(3S)构形是重要的;B)4,4-ethano基团并不耐受;C)(6R,7S)构型是重要的,8,8-二甲基基团并不耐受;E)环氧化合物对于微管蛋白的聚合并不重要,但可能与细胞毒活性相关;环氧化合物结构可能很重要;R基团是重要的;两个链烯几何结构是耐受的;F)(15S)构型的重要性;G)较大的还原活性基团;H)氧气替代耐受;I)替代的重要性;J)杂环是重要的。
因此,这个SAR表明C1-C8的分子片段的修饰对活性有强烈影响,而分子的剩余部分对于改变相对耐受。C1-C8部分的取代立体化学的改变,或移去其功能能够导致活性的显著减少。环氧噻酮衍生化合物A-H的区别在于,对于环氧噻酮不敏感部分的分子修饰并具有优良的生物活性,但赋予较好的药代动力学特性,能改善亲脂和抗菌谱。
通过改变选择性参与环氧噻酮生物合成的基因,并伴随着化学修饰来制备得到这些新的衍生物。通过基因工程制备的9-羟基-环氧噻酮衍生物能通过用三碳酰氯或1,1′羰基二咪唑,在一个碱基存在下处理用以产生碳酸盐衍生物(化合物D)。以相似的方式,9,11-二羟基环氧噻酮衍生物,根据C-7羟基的话对其进行适当保护,能产生碳酸盐衍生物(化合物F)。带有羟胺的9含氧环氧噻酮的选择性氧化时,通过还原(在氢或硼氢化氰存在下的Raney镍)产生9-氨基类似物。将这些9-氨基衍生物在碱基存在下与p-硝基苯氯仿反应,然后与氢化物反应产生氨基甲酸盐衍生物(化合物E)。同样,氨基甲酸盐化合物G,如果存在上述C-7羟基并对其进行适当保护,能够制得9-氨基-11羟基-环氧噻酮衍生物。
合成路线如下所示。
A部分。环氧噻酮D-7,9-环化碳酸盐
将溶解于5mL亚甲基氯化物中的254mg环氧噻酮D溶液加入在一个圆底烧瓶中。冰浴冷却,然后加入0.3mL三乙基胺。在该溶液中加入104mg三碳酰氯。移走冰浴,混合物在氮气下搅拌5小时。所述溶液用20mL亚甲基氯稀释,然后用稀释的羧酸盐溶液洗涤。该有机溶剂用硫酸镁干燥并过滤。通过蒸馏干燥,分离环氧噻酮D-7,9-环化羧酸盐。
B部分。环氧噻酮D-7,9-环化氨基甲酸盐
(i)9-氨基环氧噻酮D
将溶解于5mL甲醇中的252mg 9-含氧环氧噻酮D加入一个圆底烧瓶中。加入0.5ML 50%羟胺于水中以及0.1mL乙酸,混合物在室温下搅拌过夜。在减压条件下移走溶剂,从而产生9-肟-环氧噻酮D。在冰浴条件下,向溶于5mL四氢呋喃(THF)的该9肟化合物中加入0.25mL1M的溶于THF中的硼氢化氰溶液。混合物反应1小时后,移走冰浴,溶液慢慢到加热至室温。加入1mL乙酸,在减压条件按下移走溶剂。残余物溶解在30mL亚甲基氯中,并用饱和氯化钠溶液洗涤。有机层被分离并用硫酸镁干燥过滤。通过蒸馏产生9-氨基环氧噻酮D。
(ii)环氧噻酮D-7,9-环化氨基甲酸盐
向溶解于5mL亚甲基氯化物中的250mg 9-氨基-环氧噻酮D中加入110mg4-硝基苯氯化物,然后加入1mL三乙基胺。溶液在室温下搅拌16小时。用25mL亚甲基氯化物稀释。溶液用饱和氯化钠溶液洗涤,有机层被分离并用硫酸镁干燥过滤。过滤后,溶液通过减压蒸馏。残基溶解在10mL干燥的THF中。在冰浴条件下加入40mg(60%分散于矿物油中)氢化钠。移走冰浴,混合物搅拌16小时。加入一半体积的的乙酸,溶液通过减压蒸馏干燥。残余物在溶解于50mL亚甲基氯化物稀释,并用饱和氯化钠溶液洗涤。有机层被分离并用硫酸镁干燥过滤。过滤后,有机溶剂通过减压蒸馏干燥。在硅胶柱中纯化分离出环氧噻酮D-7,9-氨基甲酸盐。
本发明已经通过书面以及实施例进行了描述,本领域技术人员将意识到本发明能够实际应用于很多实施方案中,上述描述和实施例适仅用于说明的目的,并非对下述权利要求进行限制。

Claims (36)

1.分离或者重组的宿主细胞,它含有的核酸编码表达纤维堆囊菌环氧噻酮聚酮化合物合成酶(PKS),但是不含有编码表达纤维堆囊菌基因epoK基因产物的核酸,从而所述的宿主细胞产生环氧噻酮C和/或环氧噻酮D而不产生环氧噻酮A或环氧噻酮B。
2.权利要求1所述的宿主细胞,所述宿主细胞是堆囊菌细胞,或者
粘球胞菌(myxococcus)细胞,或者
假单胞菌(pseudomonas)细胞,或者
链霉菌(Strepomyces)细胞。
3.根据权利要求1所述的细胞,其中该细胞不含有纤维堆囊菌epoK基因。
4.根据权利要求1所述的细胞,其中该细胞含有改变了的纤维堆囊菌epoK基因,该改变了的epoK基因产生的基因产物不会将环氧噻酮C转化为环氧噻酮A或者将环氧噻酮D转化为环氧噻酮B。
5.根据权利要求1所述的细胞,其中该细胞产生环氧噻酮C和环氧噻酮D。
6.根据权利要求1所述的细胞,其中所述核酸包括epoA,epoB,epoC,epoD,epoE,epoF基因。
7.根据权利要求1所述的细胞,其中所述核酸包括改变了的epoD添加组件4转酰基酶(AT)结构域编码序列。
8.根据权利要求7所述的细胞,其中所述改变了的AT结构域编码序列导致了该细胞仅产生环氧噻酮D。
9.根据权利要求2所述的细胞,它是链霉菌(Strepomyces)细胞。
10.根据权利要求3所述的细胞,它是链霉菌(Strepomyces)细胞。
11.根据权利要求5所述的细胞,它是链霉菌(Strepomyces)细胞。
12.根据权利要求2所述的细胞,它是粘球菌(myxococcus)细胞。
13.根据权利要求3所述的细胞,它是粘球菌(myxococcus)细胞。
14.根据权利要求5所述的细胞,它是粘球菌(myxococcus)细胞。
15.权利要求1所述的细胞,其中所述细胞产生环氧噻酮D而不产生环氧噻酮B。
16.一种产生环氧噻酮C和/或者环氧噻酮D的方法,该方法包括在一定条件下培养权利要求1所述的细胞,其中表达所述核酸从而获得功能PKS。
17.根据权利要求16所述的方法,其中产生环氧噻酮C和环氧噻酮D。
18.根据权利要求16所述的方法,其中产生环氧噻酮D。
19.一种重组的纤维堆囊菌宿主细胞,由于epoK基因突变,它产生环氧噻酮C和/或环氧噻酮D而不产生环氧噻酮A或环氧噻酮B。
20.根据权利要求19所述的细胞,其中该细胞产生环氧噻酮C和环氧噻酮D。
21.根据权利要求19所述的细胞,其中所述突变的epoK基因包括相对于未突变epoK基因的缺失。
22.根据权利要求19所述的细胞,其中所述突变的epoK基因是通过随机突变产生的。
23.根据权利要求19所述的细胞,其中所述突变的epoK基因是通过同源重组产生的。
24.如权利要求19所述的重组宿主细胞,
由于epoD中的突变改变了添加组件4转酰基酶(AT)结构域的特异性,它能够产生环氧噻酮C,但是不能产生环氧噻酮A,B或者D,或者
由于epoD中的突变改变了添加组件4 AT结构域的特异性,它能够产生环氧噻酮D,但是不能产生环氧噻酮A,B或者C。
25.一种产生环氧噻酮D的方法,该方法包括培养如权利要求24所述的细胞。
26.重组的纤维堆囊菌细胞或者粘球胞菌宿主细胞,它表达纤维堆囊菌环氧噻酮聚酮化合物合成酶(PKS)基因,但是不表达有功能的纤维堆囊菌epoK基因产物,可选择地含有一个或者更多整合进它们的染色体DNA中的或者在染色体外表达载体上的所述环氧噻酮聚酮化合物合成酶(PKS)基因,其中该重组的纤维堆囊菌细胞或者粘球胞菌宿主细胞产生环氧噻酮C和/或环氧噻酮D而不产生环氧噻酮A或环氧噻酮B。
27.根据权利要求26所述的细胞,其中该细胞产生环氧噻酮C和环氧噻酮D。
28.根据权利要求26所述的细胞,其中该细胞不含有纤维堆囊菌epoK基因。
29.根据权利要求26所述的细胞,其中该细胞含有改变了的纤维堆囊菌epoK基因,该改变了的epoK基因产生的基因产物不会将环氧噻酮C转化为环氧噻酮A或者将环氧噻酮D转化为环氧噻酮B。
30.根据权利要求26所述的细胞,它含有epoA,epoB,epoC,epoD,epoE和epoF PKS基因。
31.根据权利要求30所述的细胞,其中所述epoD基因包括改变了的添加组件4转酰基酶(AT)结构域编码序列。
32.根据权利要求31所述的细胞,其中所述改变了的AT结构域编码序列导致了该细胞仅产生环氧噻酮D。
33.一种产生环氧噻酮C和/或者环氧噻酮D的方法,包括培养如权利要求26所述的细胞。
34.根据权利要求33的方法,其中产生环氧噻酮C和环氧噻酮D。
35.根据权利要求33的方法,其中产生环氧噻酮D。
36.一种重组的纤维堆囊菌宿主细胞,由于突变失活或删除了甲oK基因,它产生环氧噻酮D而不产生环氧噻酮B。
CNB998156787A 1998-11-20 1999-11-19 产生环氧噻酮及其衍生物的重组方法和材料 Expired - Fee Related CN100381566C (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US10940198P 1998-11-20 1998-11-20
US60/109,401 1998-11-20
US11938699P 1999-02-10 1999-02-10
US60/119,386 1999-02-10
US12262099P 1999-03-03 1999-03-03
US60/122,620 1999-03-03
US13056099P 1999-04-22 1999-04-22
US60/130,560 1999-04-22
PCT/US1999/027438 WO2000031247A2 (en) 1998-11-20 1999-11-19 Recombinant methods and materials for producing epothilone and epothilone derivatives

Publications (2)

Publication Number Publication Date
CN1333820A CN1333820A (zh) 2002-01-30
CN100381566C true CN100381566C (zh) 2008-04-16

Family

ID=27493695

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB998156787A Expired - Fee Related CN100381566C (zh) 1998-11-20 1999-11-19 产生环氧噻酮及其衍生物的重组方法和材料

Country Status (10)

Country Link
US (7) US6303342B1 (zh)
EP (1) EP1135470A2 (zh)
JP (2) JP4662635B2 (zh)
KR (3) KR20070087132A (zh)
CN (1) CN100381566C (zh)
AU (1) AU768220B2 (zh)
CA (1) CA2350189A1 (zh)
IL (2) IL143069A0 (zh)
NZ (1) NZ511722A (zh)
WO (1) WO2000031247A2 (zh)

Families Citing this family (160)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998022461A1 (de) 1996-11-18 1998-05-28 GESELLSCHAFT FüR BIOTECHNOLOGISCHE FORSCHUNG MBH (GBF) Epothilone c, d, e und f, deren herstellung und deren verwendung als cytostatische mittel bzw. als pflanzenschutzmittel
CA2273083C (en) 1996-12-03 2012-09-18 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto, analogues and uses thereof
US6204388B1 (en) * 1996-12-03 2001-03-20 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto and analogues thereof
US20050043376A1 (en) * 1996-12-03 2005-02-24 Danishefsky Samuel J. Synthesis of epothilones, intermediates thereto, analogues and uses thereof
US6399789B1 (en) 1996-12-18 2002-06-04 Kosan Biosciences, Inc. Multi-plasmid method for preparing large libraries of polyketides and non-ribosomal peptides
US6605599B1 (en) 1997-07-08 2003-08-12 Bristol-Myers Squibb Company Epothilone derivatives
US6365749B1 (en) 1997-12-04 2002-04-02 Bristol-Myers Squibb Company Process for the preparation of ring-opened epothilone intermediates which are useful for the preparation of epothilone analogs
FR2775187B1 (fr) * 1998-02-25 2003-02-21 Novartis Ag Utilisation de l'epothilone b pour la fabrication d'une preparation pharmaceutique antiproliferative et d'une composition comprenant l'epothilone b comme agent antiproliferatif in vivo
US6399638B1 (en) 1998-04-21 2002-06-04 Bristol-Myers Squibb Company 12,13-modified epothilone derivatives
US6498257B1 (en) 1998-04-21 2002-12-24 Bristol-Myers Squibb Company 2,3-olefinic epothilone derivatives
DE19826988A1 (de) 1998-06-18 1999-12-23 Biotechnolog Forschung Gmbh Epothilon-Nebenkomponenten
US6121029A (en) 1998-06-18 2000-09-19 Novartis Ag Genes for the biosynthesis of epothilones
DE19846493A1 (de) * 1998-10-09 2000-04-13 Biotechnolog Forschung Gmbh DNA-Sequenzen für die enzymatische Synthese von Polyketid- oder Heteropolyketidverbindungen
US6303342B1 (en) 1998-11-20 2001-10-16 Kason Biosciences, Inc. Recombinant methods and materials for producing epothilones C and D
US6410301B1 (en) 1998-11-20 2002-06-25 Kosan Biosciences, Inc. Myxococcus host cells for the production of epothilones
HUP0200296A2 (en) * 1998-12-23 2002-05-29 Bristol Myers Squibb Co Microbial transformation method for the preparation of an epothilone
US6596875B2 (en) 2000-02-07 2003-07-22 James David White Method for synthesizing epothilones and epothilone analogs
WO2000063361A2 (en) * 1999-04-16 2000-10-26 Kosan Biosciences, Inc. A multi-plasmid method for preparing large libraries of polyketides and non-ribosomal peptides
DE60026563D1 (de) * 1999-10-25 2006-05-04 Kosan Biosciences Inc Herstellung von polyketiden
ATE356216T1 (de) * 1999-10-27 2007-03-15 Kosan Biosciences Inc Heterologe herstellung von polyketiden
US6518421B1 (en) 2000-03-20 2003-02-11 Bristol-Myers Squibb Company Process for the preparation of epothilone analogs
US6589968B2 (en) 2001-02-13 2003-07-08 Kosan Biosciences, Inc. Epothilone compounds and methods for making and using the same
US8618085B2 (en) * 2000-04-28 2013-12-31 Koasn Biosciences Incorporated Therapeutic formulations of desoxyepothilones
NZ521788A (en) * 2000-04-28 2007-04-27 Kosan Biosciences Inc Production of polyketides
US6998256B2 (en) 2000-04-28 2006-02-14 Kosan Biosciences, Inc. Methods of obtaining epothilone D using crystallization and /or by the culture of cells in the presence of methyl oleate
AU2001275012A1 (en) 2000-05-30 2001-12-11 Kosan Biosciences, Inc. Design of polyketide synthase genes
US20020137152A1 (en) * 2000-07-25 2002-09-26 Daniel Santi Fermentation process for epothilones
AU2001283275A1 (en) * 2000-08-09 2002-02-18 Kosan Biosciences, Inc. Bio-intermediates for use in the chemical synthesis of polyketides
US20020128213A1 (en) * 2000-09-25 2002-09-12 Leonard Katz Sixteen-membered macrolide compounds
US7257562B2 (en) 2000-10-13 2007-08-14 Thallion Pharmaceuticals Inc. High throughput method for discovery of gene clusters
US20030077759A1 (en) * 2000-12-28 2003-04-24 Zhihao Hu Plasmids for polyketide production
KR20030071853A (ko) 2001-01-25 2003-09-06 브리스톨-마이어스스퀴브컴파니 에포틸론 유사체를 함유한 비경구용 제제
ES2304240T3 (es) 2001-01-25 2008-10-01 Bristol-Myers Squibb Company Procedimientos para la preparacion de preparaciones farmaceuticas que contienen analogos de epotilona para el tratamiento de cancer.
WO2002058699A1 (en) 2001-01-25 2002-08-01 Bristol-Myers Squibb Company Pharmaceutical forms of epothilones for oral administration
US6893859B2 (en) 2001-02-13 2005-05-17 Kosan Biosciences, Inc. Epothilone derivatives and methods for making and using the same
CN1610549A (zh) 2001-02-20 2005-04-27 布里斯托尔-迈尔斯斯奎布公司 用于治疗难治肿瘤的埃坡霉素衍生物
CN1774253A (zh) 2001-02-20 2006-05-17 布里斯托尔-迈尔斯斯奎布公司 用环氧丙酯酮衍生物治疗顽固性肿瘤
ES2384789T3 (es) 2001-03-14 2012-07-12 Bristol-Myers Squibb Company Combinación de un análogo de epotilona y agentes quimioterapéuticos para el tratamiento de enfermedades proliferativas
US6906188B2 (en) * 2001-04-30 2005-06-14 State Of Oregon Acting By And Through The State Board Of Higher Education On Behalf Of Oregon State University Method for synthesizing epothilones and epothilone analogs
US20070203346A1 (en) * 2001-04-30 2007-08-30 Oregon State University Method for synthesizing epothilones and epothilone analogs
EP1392664A4 (en) 2001-06-01 2005-01-26 Bristol Myers Squibb Co EPOTHILONE DERIVATIVES
TWI315982B (en) 2001-07-19 2009-10-21 Novartis Ag Combinations comprising epothilones and pharmaceutical uses thereof
US20030153053A1 (en) * 2001-08-06 2003-08-14 Ralph Reid Methods for altering polyketide synthase genes
US7070964B2 (en) * 2001-11-15 2006-07-04 Kosan Biosciences Incorporated Epothilone compounds and methods for making the same
US7189549B2 (en) * 2002-06-14 2007-03-13 Kosan Biosciences, Inc. Recombinant polynucleotides encoding pro-geldanamycin producing polyketide synthase and accessory proteins, and uses thereof
KR20040078123A (ko) 2002-01-14 2004-09-08 노파르티스 아게 에포틸론 및 대사길항물질을 포함하는 조합물
ATE380861T1 (de) * 2002-02-25 2007-12-15 Kosan Biosciences Inc Modulation der verteilung artverwandter sekundärer metaboliten
ES2337134T3 (es) 2002-03-12 2010-04-21 Bristol-Myers Squibb Company Derivados de c3-ciano-epotilona.
US7211593B2 (en) 2002-03-12 2007-05-01 Bristol-Myers Squibb Co. C12-cyano epothilone derivatives
TW200403994A (en) 2002-04-04 2004-03-16 Bristol Myers Squibb Co Oral administration of EPOTHILONES
TW200400191A (en) 2002-05-15 2004-01-01 Bristol Myers Squibb Co Pharmaceutical compositions and methods of using C-21 modified epothilone derivatives
JP2006514681A (ja) * 2002-05-20 2006-05-11 コーザン バイオサイエンシス インコーポレイテッド エポチロンdの投与方法
US7008936B2 (en) 2002-06-14 2006-03-07 Bristol-Myers Squibb Company Combination of epothilone analogs and chemotherapeutic agents for the treatment of proliferative diseases
US7427493B2 (en) 2002-06-28 2008-09-23 Kosan Biosciences Incorporated Recombinant genes for polyketide modifying enzymes
WO2004015088A2 (en) * 2002-08-13 2004-02-19 Kosan Biosciences, Inc. Transposon-based transformation system
WO2004018635A2 (en) * 2002-08-21 2004-03-04 Kosan Biosciences, Inc. Myxococcus xanthus bacteriophage mx9 transformation and integration system
US7649006B2 (en) 2002-08-23 2010-01-19 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto and analogues thereof
DK1506203T3 (da) 2002-08-23 2007-05-14 Sloan Kettering Inst Cancer Syntese af epothiloner, mellemprodukter deraf, analoger deraf og anvendelser deraf
US6921769B2 (en) 2002-08-23 2005-07-26 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto and analogues thereof
RS20050235A (en) 2002-09-23 2007-06-04 Bristol Myers Squibb Company, Methods for the preparation, isolation and purification of epothilone b, and x-ray crystal structures of epothilone b
CN100359014C (zh) * 2003-01-28 2008-01-02 北京华昊中天生物技术有限公司 一类新型埃坡霉素化合物及其制备方法和用途
US20050171167A1 (en) * 2003-11-04 2005-08-04 Haby Thomas A. Process and formulation containing epothilones and analogs thereof
US20050215604A1 (en) * 2004-03-26 2005-09-29 Kosan Biosciences, Inc. Combination therapies with epothilones and carboplatin
NZ549925A (en) 2004-04-07 2010-08-27 Novartis Ag Inhibitors of IAP
US7595187B2 (en) * 2004-11-12 2009-09-29 Wyeth Elaiophylin biosynthetic gene cluster
US20060211736A1 (en) * 2005-01-13 2006-09-21 Wisconsin Alumni Research Foundation Glutarimide-containing polyketide analogs and methods thereof
CA2597647A1 (en) 2005-02-11 2007-08-02 University Of Southern California Method of expressing proteins with disulfide bridges
KR100681811B1 (ko) * 2005-03-15 2007-02-12 성균관대학교산학협력단 생물학적 대사부산물의 효율적인 제거를 통한 유용 이차대사산물의 제조방법
WO2006122408A1 (en) 2005-05-18 2006-11-23 Aegera Therapeutics Inc. Bir domain binding compounds
GB0510390D0 (en) 2005-05-20 2005-06-29 Novartis Ag Organic compounds
WO2007038459A2 (en) 2005-09-27 2007-04-05 Novartis Ag Carboxyamine compounds and their use in the treatment of hdac dependent diseases
JP2009516671A (ja) 2005-11-21 2009-04-23 ノバルティス アクチエンゲゼルシャフト mTOR阻害剤を使用する神経内分泌腫瘍処置
GB0605120D0 (en) 2006-03-14 2006-04-26 Novartis Ag Organic Compounds
CN102671196B (zh) 2006-04-05 2014-12-03 诺华股份有限公司 用于治疗癌症的治疗剂的组合
RU2452492C2 (ru) 2006-04-05 2012-06-10 Новартис Аг КОМБИНАЦИИ, ВКЛЮЧАЮЩИЕ ИНГИБИТОРЫ Bcr-Abl/c-Kit/PDGF-R TK, ДЛЯ ЛЕЧЕНИЯ РАКА
EP2029156A4 (en) * 2006-05-01 2010-07-21 Univ Southern California POLY THERAPY FOR TREATING CANCER
EP2272511A1 (en) 2006-05-09 2011-01-12 Novartis AG Combination comprising an iron chelator and an anti-neoplastic agent and use thereof
SG10201407457UA (en) 2006-05-16 2014-12-30 Pharmascience Inc Iap bir domain binding compounds
EP2081933B1 (en) 2006-09-29 2011-03-23 Novartis AG Pyrazolopyrimidines as pi3k lipid kinase inhibitors
WO2008100985A2 (en) 2007-02-15 2008-08-21 Novartis Ag Combination of lbh589 with other therapeutic agents for treating cancer
WO2008119134A1 (en) * 2007-04-02 2008-10-09 Newsouth Innovations Pty Limited Methods for producing secondary metabolites
KR100901164B1 (ko) * 2007-07-16 2009-06-04 성균관대학교산학협력단 이종 세포 유래의 프로피오닐―CoA 신테타제 유전자로형질전환된 에포틸론 생산균주 및 이를 이용한 에포틸론의제조방법
EP2268612B1 (en) 2008-03-24 2014-08-20 Novartis AG Arylsulfonamide-based matrix metalloprotease inhibitors
NZ588069A (en) 2008-03-26 2012-06-29 Novartis Ag Hydroxamate-based inhibitors of deacetylases b
EP2254995A4 (en) * 2008-03-28 2011-05-25 Univ California PRODUCTION OF DICARBOXYLIC ACIDS USING SYNTHASE POLYCTICIDES
EA021758B1 (ru) 2008-04-24 2015-08-31 Бристол-Маерс Сквибб Компани Способ лечения болезни альцгеймера
JP2011519860A (ja) * 2008-04-29 2011-07-14 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア ポリケチドシンターゼを使用するバイオ燃料の生成
US8802394B2 (en) 2008-11-13 2014-08-12 Radu O. Minea Method of expressing proteins with disulfide bridges with enhanced yields and activity
WO2010083617A1 (en) 2009-01-21 2010-07-29 Oncalis Ag Pyrazolopyrimidines as protein kinase inhibitors
PL2391366T3 (pl) 2009-01-29 2013-04-30 Novartis Ag Podstawione benzimidazole do leczenia gwiaździaków
PL2445903T3 (pl) 2009-06-26 2014-08-29 Novartis Ag 1,3-Di-podstawione pochodne imidazolidyn-2-onu jako inhibitory CYP 17
US8389526B2 (en) 2009-08-07 2013-03-05 Novartis Ag 3-heteroarylmethyl-imidazo[1,2-b]pyridazin-6-yl derivatives
AU2010283806A1 (en) 2009-08-12 2012-03-01 Novartis Ag Heterocyclic hydrazone compounds and their uses to treat cancer and inflammation
AU2010284972A1 (en) 2009-08-20 2012-03-08 Novartis Ag Heterocyclic oxime compounds
EA201200321A1 (ru) 2009-08-26 2012-09-28 Новартис Аг Тетразамещенные гетероарильные соединения и их применение в качестве модуляторов mdm2 и/или mdm4
NZ599565A (en) 2009-11-04 2013-05-31 Novartis Ag Heterocyclic sulfonamide derivatives useful as mek inhibitors
MX349513B (es) 2009-11-13 2017-08-02 Amgen Inc * Materiales y metodos para el tratamiento o prevencion de enfermedades asociadas al her-3.
BR112012013735A2 (pt) 2009-12-08 2019-09-24 Novartis Ag derivados heterocícilicos de sulfonamida
CU24130B1 (es) 2009-12-22 2015-09-29 Novartis Ag Isoquinolinonas y quinazolinonas sustituidas
US8440693B2 (en) 2009-12-22 2013-05-14 Novartis Ag Substituted isoquinolinones and quinazolinones
CN102985439B9 (zh) 2010-02-12 2016-08-03 制药科学股份有限公司 Iap bir结构域结合化合物
US20110300150A1 (en) 2010-05-18 2011-12-08 Scott Eliasof Compositions and methods for treatment of autoimmune and other disease
UA112517C2 (uk) 2010-07-06 2016-09-26 Новартіс Аг Тетрагідропіридопіримідинові похідні
US20120156130A1 (en) 2010-08-06 2012-06-21 Thore Hettmann Use of her3 binding agents in prostate treatment
US8946260B2 (en) 2010-09-16 2015-02-03 Novartis Ag 17α-hydroxylase/C17,20-lyase inhibitors
US8852902B2 (en) 2010-11-22 2014-10-07 The Regents Of The University Of California Producing a trimethylpentanoic acid using hybrid polyketide synthases
US20120196770A1 (en) 2011-01-28 2012-08-02 Amyris, Inc. Gel-encapsulated microcolony screening
US20130324526A1 (en) 2011-02-10 2013-12-05 Novartis Ag [1,2,4] triazolo [4,3-b] pyridazine compounds as inhibitors of the c-met tyrosine kinase
EP2702052B1 (en) 2011-04-28 2017-10-18 Novartis AG 17alpha-hydroxylase/c17,20-lyase inhibitors
CN103518136A (zh) 2011-05-13 2014-01-15 阿迈瑞斯公司 用于检测水不混溶性化合物的微生物生成的方法和组合物
IN2014DN00123A (zh) 2011-06-09 2015-05-22 Novartis Ag
US8859535B2 (en) 2011-06-20 2014-10-14 Novartis Ag Hydroxy substituted isoquinolinone derivatives
EP2721007B1 (en) 2011-06-20 2015-04-29 Novartis AG Cyclohexyl isoquinolinone compounds
WO2013001445A1 (en) 2011-06-27 2013-01-03 Novartis Ag Solid forms and salts of tetrahydro-pyrido-pyrimidine derivatives
BR112014006223A8 (pt) 2011-09-15 2018-01-09 Novartis Ag 3-(quinolin-6-iltio)-[1,2,4-triazol[4,3-a] piradinas 6-substituídas, seus usos, composições farmacêuticas, e combinação
EP2785717B1 (en) 2011-11-29 2016-01-13 Novartis AG Pyrazolopyrrolidine compounds
WO2013093850A1 (en) 2011-12-22 2013-06-27 Novartis Ag Quinoline derivatives
AU2012356083B2 (en) 2011-12-22 2015-01-22 Novartis Ag Dihydro-benzo-oxazine and dihydro-pyrido-oxazine derivatives
KR20140107573A (ko) 2011-12-23 2014-09-04 노파르티스 아게 Bcl2와 결합 파트너의 상호작용을 억제하기 위한 화합물
CN104125953A (zh) 2011-12-23 2014-10-29 诺华股份有限公司 用于抑制bcl2与结合配偶体相互作用的化合物
CN104125954A (zh) 2011-12-23 2014-10-29 诺华股份有限公司 用于抑制bcl2与结合配偶体相互作用的化合物
AU2012355619A1 (en) 2011-12-23 2014-07-17 Novartis Ag Compounds for inhibiting the interaction of BCL2 with binding partners
MX2014007725A (es) 2011-12-23 2015-01-12 Novartis Ag Compuestos para inhibir la interaccion de bcl2 con los componentes de enlace.
UY34591A (es) 2012-01-26 2013-09-02 Novartis Ag Compuestos de imidazopirrolidinona
BR112014027584B1 (pt) 2012-05-15 2023-01-24 Novartis Ag Uso de inibidores da atividade de abl1, abl2 e bcr-abl1, e composição farmacêutica
MX2014013373A (es) 2012-05-15 2015-08-14 Novartis Ag Derivados de benzamida para inhibir la actividad de abl1, abl2 y bcr-abl1.
BR112014027244A2 (pt) 2012-05-15 2017-06-27 Novartis Ag derivados de benzamida para inibição da atividade de abl1, abl2 e bcr-abl1
CA2868958C (en) 2012-05-15 2020-09-01 Novartis Ag Benzamide derivatives for inhibiting the activity of abl1, abl2 and bcr-abl1
JP6171003B2 (ja) 2012-05-24 2017-07-26 ノバルティス アーゲー ピロロピロリジノン化合物
EP2861256B1 (en) 2012-06-15 2019-10-23 The Brigham and Women's Hospital, Inc. Compositions for treating cancer and methods for making the same
US10090498B2 (en) 2012-06-24 2018-10-02 SeeScan, Inc. Modular battery pack apparatus, systems, and methods including viral data and/or code transfer
US10927382B2 (en) 2012-08-07 2021-02-23 Amyris, Inc. Methods for stabilizing production of acetyl-coenzyme a derived compounds
MD20150043A2 (ro) 2012-10-02 2015-08-31 Epitherapeutics Aps Inhibitori ai histon-demetilazelor
TW201422625A (zh) 2012-11-26 2014-06-16 Novartis Ag 二氫-吡啶并-□衍生物之固體形式
WO2014115077A1 (en) 2013-01-22 2014-07-31 Novartis Ag Substituted purinone compounds
WO2014115080A1 (en) 2013-01-22 2014-07-31 Novartis Ag Pyrazolo[3,4-d]pyrimidinone compounds as inhibitors of the p53/mdm2 interaction
WO2014128612A1 (en) 2013-02-20 2014-08-28 Novartis Ag Quinazolin-4-one derivatives
TR201808599T4 (tr) 2013-02-27 2018-07-23 Gilead Sciences Inc Histon demetilaz inhibitörleri.
EP2971027B1 (en) 2013-03-15 2019-01-30 Amyris, Inc. Use of phosphoketolase and phosphotransacetylase for production of acetyl-coenzyme a derived compounds
US20150018376A1 (en) 2013-05-17 2015-01-15 Novartis Ag Pyrimidin-4-yl)oxy)-1h-indole-1-carboxamide derivatives and use thereof
UY35675A (es) 2013-07-24 2015-02-27 Novartis Ag Derivados sustituidos de quinazolin-4-ona
US10563229B2 (en) 2013-08-07 2020-02-18 Amyris, Inc. Methods for stabilizing production of acetyl-coenzyme a derived compounds
WO2015022664A1 (en) 2013-08-14 2015-02-19 Novartis Ag Compounds and compositions as inhibitors of mek
WO2015022663A1 (en) 2013-08-14 2015-02-19 Novartis Ag Compounds and compositions as inhibitors of mek
US9227969B2 (en) 2013-08-14 2016-01-05 Novartis Ag Compounds and compositions as inhibitors of MEK
AU2014321419B2 (en) 2013-09-22 2017-06-15 Sunshine Lake Pharma Co., Ltd. Substituted aminopyrimidine compounds and methods of use
US10233431B2 (en) 2014-02-26 2019-03-19 The Regents Of The University Of California Producing 3-hydroxycarboxylic acid and ketone using polyketide synthases
US9403801B2 (en) 2014-03-28 2016-08-02 Calitor Sciences, Llc Substituted heteroaryl compounds and methods of use
US20170369444A1 (en) 2014-03-31 2017-12-28 Marc Labelle Inhibitors of histone demethylases
CN106470681A (zh) 2014-04-03 2017-03-01 茵维特丝肿瘤学私营有限责任公司 超分子组合治疗药物
KR101606635B1 (ko) * 2014-06-02 2016-03-28 이화여자대학교 산학협력단 에포틸론 발현 카세트 및 이의 용도
KR101601424B1 (ko) * 2014-06-02 2016-03-09 이화여자대학교 산학협력단 에포틸론 발현용 벡터 및 이의 용도
BR112017003442A2 (pt) 2014-08-27 2017-11-28 Gilead Sciences Inc compostos e métodos para inibir histona desmetilases
WO2016210350A1 (en) 2015-06-25 2016-12-29 Amyris, Inc. Maltose dependent degrons, maltose-responsive promoters, stabilization constructs, and their use in production of non-catabolic compounds
WO2017044434A1 (en) 2015-09-11 2017-03-16 Sunshine Lake Pharma Co., Ltd. Substituted heteroaryl compounds and methods of use
EP3710006A4 (en) 2017-11-19 2021-09-01 Sunshine Lake Pharma Co., Ltd. SUBSTITUTED HETEROARYL COMPOUNDS AND THEIR METHODS OF USE
EP3740468A4 (en) 2018-01-20 2021-10-06 Sunshine Lake Pharma Co., Ltd. SUBSTITUTED AMINOPYRIMIDINE COMPOUNDS AND METHOD OF USING
CN108658949B (zh) * 2018-06-29 2021-05-25 云南大学 一种用作抗肿瘤药物的化合物及其生产方法
FR3087650B1 (fr) 2018-10-31 2021-01-29 Bio Even Flavine adenine dinucleotide (fad) pour son utilisation pour la prevention et/ou le traitement de cancer
CN113969255A (zh) * 2020-07-24 2022-01-25 北京华昊中天生物医药股份有限公司 生产脱环氧埃坡霉素b的重组菌及其用途

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998022461A1 (de) * 1996-11-18 1998-05-28 GESELLSCHAFT FüR BIOTECHNOLOGISCHE FORSCHUNG MBH (GBF) Epothilone c, d, e und f, deren herstellung und deren verwendung als cytostatische mittel bzw. als pflanzenschutzmittel
WO1998025929A1 (en) * 1996-12-13 1998-06-18 Novartis Ag Epothilone analogs
CN1305530A (zh) * 1998-06-18 2001-07-25 诺瓦提斯公司 用于epothilone生物合成的基因

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8608080D0 (en) 1986-04-02 1986-05-08 Fujisawa Pharmaceutical Co Solid dispersion composition
US5252474A (en) 1989-03-31 1993-10-12 Merck & Co., Inc. Cloning genes from Streptomyces avermitilis for avermectin biosynthesis and the methods for their use
KR0159766B1 (ko) 1989-10-16 1998-12-01 후지사와 토모키치로 양모제 조성물
GB8925797D0 (en) 1989-11-15 1990-01-04 Fisons Plc Compositions
WO1993013663A1 (en) 1992-01-17 1993-07-22 Abbott Laboratories Method of directing biosynthesis of specific polyketides
US5824513A (en) 1991-01-17 1998-10-20 Abbott Laboratories Recombinant DNA method for producing erythromycin analogs
ES2161213T3 (es) 1991-03-01 2001-12-01 Syngenta Participations Ag Procedimiento para la manipulacion genetica de mixobacterias.
DE4138042C2 (de) 1991-11-19 1993-10-14 Biotechnolog Forschung Gmbh Epothilone, deren Herstellungsverfahren sowie diese Verbindungen enthaltende Mittel
US5264355A (en) 1992-07-02 1993-11-23 Merck & Co., Inc. Methlating enzyme from streptomyces MA6858
US5672491A (en) 1993-09-20 1997-09-30 The Leland Stanford Junior University Recombinant production of novel polyketides
US5712146A (en) 1993-09-20 1998-01-27 The Leland Stanford Junior University Recombinant combinatorial genetic library for the production of novel polyketides
JPH09505983A (ja) 1993-09-20 1997-06-17 ザ リーランド スタンフォード ジュニア ユニバーシティ 新規ポリケチドの組換え産生
US6066721A (en) 1995-07-06 2000-05-23 Stanford University Method to produce novel polyketides
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
EP1493814A1 (en) 1995-07-06 2005-01-05 The Leland Stanford Junior University Cell-free synthesis of polyketides
CA2232230C (en) 1995-10-13 2005-06-28 Ralph H. Lambalot Phosphopantetheinyl transferases and uses thereof
DE59609305D1 (de) 1995-11-17 2002-07-11 Biotechnolog Forschung Gmbh Epothilon-Derivate und deren Herstellung
US5776735A (en) 1995-12-04 1998-07-07 Pfizer Inc. Process for dienone macrolides
US5998194A (en) 1995-12-21 1999-12-07 Abbott Laboratories Polyketide-associated sugar biosynthesis genes
US5783431A (en) 1996-04-24 1998-07-21 Chromaxome Corporation Methods for generating and screening novel metabolic pathways
US5969145A (en) 1996-08-30 1999-10-19 Novartis Ag Process for the production of epothilones and intermediate products within the process
JP2001500851A (ja) 1996-08-30 2001-01-23 ノバルティス アクチエンゲゼルシャフト エポシロンの製造法および製造過程中に得られる中間生産物
CA2273083C (en) 1996-12-03 2012-09-18 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto, analogues and uses thereof
US6380394B1 (en) 1996-12-13 2002-04-30 The Scripps Research Institute Epothilone analogs
US6033883A (en) 1996-12-18 2000-03-07 Kosan Biosciences, Inc. Production of polyketides in bacteria and yeast
AU732909B2 (en) 1997-04-30 2001-05-03 Board Of Trustees Of The Leland Stanford Junior University Combinatorial polyketide libraries produced using a modular PKS gene cluster as scaffold
US6605599B1 (en) 1997-07-08 2003-08-12 Bristol-Myers Squibb Company Epothilone derivatives
US6262340B1 (en) 1997-07-10 2001-07-17 Kosan Biosciences, Inc. Production of polyketides in plants
ATE368036T1 (de) 1997-08-09 2007-08-15 Bayer Schering Pharma Ag Neue epothilon-derivate, verfahren zu deren herstellung und ihre pharmazeutische verwendung
DE19741899A1 (de) 1997-09-22 1999-03-25 Hahl Erwin Gmbh Kunststoffborsten für die Waschbürsten von automatischen Autowaschanlagen
US6365749B1 (en) 1997-12-04 2002-04-02 Bristol-Myers Squibb Company Process for the preparation of ring-opened epothilone intermediates which are useful for the preparation of epothilone analogs
US6090601A (en) 1998-01-23 2000-07-18 Kosan Bioscience Sorangium polyketide synthase
US6280999B1 (en) * 1998-01-23 2001-08-28 Kosan Bioscience Sorangium polyketide synthases and encoding DNA therefor
RU2214246C2 (ru) 1998-02-05 2003-10-20 Новартис Аг Содержащие эпотилон композиции
DE19804673A1 (de) 1998-02-06 1999-08-12 Studiengesellschaft Kohle Mbh Verfahren zur Darstellung makrocyclischer Produkte durch ringschliessende Diin-Metathese
US6194181B1 (en) 1998-02-19 2001-02-27 Novartis Ag Fermentative preparation process for and crystal forms of cytostatics
NZ506742A (en) 1998-02-25 2003-09-26 Sloan Kettering Inst Cancer Synthesis of desoxyepothilones and hydroxy acid derivative intermediates
FR2775187B1 (fr) 1998-02-25 2003-02-21 Novartis Ag Utilisation de l'epothilone b pour la fabrication d'une preparation pharmaceutique antiproliferative et d'une composition comprenant l'epothilone b comme agent antiproliferatif in vivo
US6399638B1 (en) 1998-04-21 2002-06-04 Bristol-Myers Squibb Company 12,13-modified epothilone derivatives
US6498257B1 (en) 1998-04-21 2002-12-24 Bristol-Myers Squibb Company 2,3-olefinic epothilone derivatives
US6121029A (en) 1998-06-18 2000-09-19 Novartis Ag Genes for the biosynthesis of epothilones
DE19826988A1 (de) 1998-06-18 1999-12-23 Biotechnolog Forschung Gmbh Epothilon-Nebenkomponenten
AU4775299A (en) 1998-06-22 2000-01-10 Nicolaou, Kyriacos Costa Desmethyl epothilones
WO2000000485A1 (de) 1998-06-30 2000-01-06 Schering Aktiengesellschaft Epothilon-derivate, verfahren zu deren herstellung, zwischenprodukte und ihre pharmazeutische verwendung
AU765821B2 (en) 1998-07-02 2003-10-02 Board Of Regents Of The Leland Stanford Junior University, The Methods for making polyketides
DE19846493A1 (de) * 1998-10-09 2000-04-13 Biotechnolog Forschung Gmbh DNA-Sequenzen für die enzymatische Synthese von Polyketid- oder Heteropolyketidverbindungen
US6303342B1 (en) * 1998-11-20 2001-10-16 Kason Biosciences, Inc. Recombinant methods and materials for producing epothilones C and D
US6410301B1 (en) 1998-11-20 2002-06-25 Kosan Biosciences, Inc. Myxococcus host cells for the production of epothilones
NZ521788A (en) 2000-04-28 2007-04-27 Kosan Biosciences Inc Production of polyketides
US6589968B2 (en) 2001-02-13 2003-07-08 Kosan Biosciences, Inc. Epothilone compounds and methods for making and using the same
US6489314B1 (en) 2001-04-03 2002-12-03 Kosan Biosciences, Inc. Epothilone derivatives and methods for making and using the same
US6998256B2 (en) 2000-04-28 2006-02-14 Kosan Biosciences, Inc. Methods of obtaining epothilone D using crystallization and /or by the culture of cells in the presence of methyl oleate
US6893859B2 (en) 2001-02-13 2005-05-17 Kosan Biosciences, Inc. Epothilone derivatives and methods for making and using the same
AU2002338336A1 (en) 2001-04-03 2002-10-21 Kosan Biosciences, Inc. Epothilone derivatives and methods for making and using the same
EP3318214B1 (en) 2017-04-21 2020-04-15 Siemens Healthcare GmbH Medical imaging device with smartglasses and method for supporting a person using a medical imaging device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998022461A1 (de) * 1996-11-18 1998-05-28 GESELLSCHAFT FüR BIOTECHNOLOGISCHE FORSCHUNG MBH (GBF) Epothilone c, d, e und f, deren herstellung und deren verwendung als cytostatische mittel bzw. als pflanzenschutzmittel
WO1998025929A1 (en) * 1996-12-13 1998-06-18 Novartis Ag Epothilone analogs
CN1305530A (zh) * 1998-06-18 2001-07-25 诺瓦提斯公司 用于epothilone生物合成的基因

Also Published As

Publication number Publication date
KR100716272B1 (ko) 2007-05-09
US7732186B2 (en) 2010-06-08
IL143069A0 (en) 2002-04-21
JP2007097595A (ja) 2007-04-19
WO2000031247A2 (en) 2000-06-02
KR20010093103A (ko) 2001-10-27
US6303342B1 (en) 2001-10-16
EP1135470A2 (en) 2001-09-26
US7402421B2 (en) 2008-07-22
AU768220B2 (en) 2003-12-04
JP2002530107A (ja) 2002-09-17
US20090170172A1 (en) 2009-07-02
WO2000031247A3 (en) 2000-12-07
US6921650B1 (en) 2005-07-26
US7129071B1 (en) 2006-10-31
KR100851418B1 (ko) 2008-08-08
US6858411B1 (en) 2005-02-22
AU1737700A (en) 2000-06-13
NZ511722A (en) 2004-05-28
US20040253697A1 (en) 2004-12-16
KR20070087132A (ko) 2007-08-27
IL143069A (en) 2008-06-05
KR20060124789A (ko) 2006-12-05
JP4662635B2 (ja) 2011-03-30
US6583290B1 (en) 2003-06-24
CA2350189A1 (en) 2000-06-02
CN1333820A (zh) 2002-01-30

Similar Documents

Publication Publication Date Title
CN100381566C (zh) 产生环氧噻酮及其衍生物的重组方法和材料
US6410301B1 (en) Myxococcus host cells for the production of epothilones
US7323573B2 (en) Production of polyketides
AU2001295195B2 (en) Myxococcus host cells for the production of epothilones
KR20070033979A (ko) 플라디에놀라이드의 생합성에 관여하는 폴리펩티드를코딩하는 dna
AU2001295195A1 (en) Myxococcus host cells for the production of epothilones
CA2506669A1 (en) Borrelidin-producing polyketide synthase and its uses
CN101809030A (zh) 硫肽前体蛋白质、编码该蛋白质的基因及其用途
CN101818158B (zh) Fr901464的生物合成基因簇
MXPA01005097A (en) Recombinant methods and materials for producing epothilone and epothilone derivatives
US7364877B2 (en) Polynucleotides encoding disorazole polyketide synthase polypeptides
CN101173268A (zh) 一种抗肿瘤药物埃博霉素全长基因簇的表达体系
CN107541523B (zh) 曲张链丝菌素生物合成基因簇及其应用
KR20100089370A (ko) 슈도노카디아 오토트로피카의 신규한 폴리엔 생합성 유전자
AU2007200160A1 (en) Heterologous production of polyketides

Legal Events

Date Code Title Description
C06 Publication
C10 Entry into substantive examination
PB01 Publication
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080416

Termination date: 20111119