附图简要说明
图1是人Dan、人Gremlin、人Cerberus和人Beer的氨基酸序列比较示意图。箭头指示半胱氨酸骨架。
图2总结了从对各种组织进行TGF-β结合蛋白基因,具体是人Beer基因表达研究获得的结果。使用半定量逆转录-聚合酶链式反应(RT-PCR)方法,从由总RNA合成的第一链cDNA扩增该基因的一部分(在实施例2A中有更为详细的描述)。
图3总结了使用与小鼠Beer转录本互补的cRNA探针进行小鼠胚胎切片RNA原位杂交所获得的结果(在实施例2B中有更为详细的描述)。A组为10.5dpc胚胎的横向切片。B组是12.5dpc胚胎的纵向切片,C组和D组是15.5dpc胚胎的纵向切片。
图4说明了通过Western印迹分析显示的三种不同多克隆抗体对于它们各自抗原的特异性(在实施例4中有更详细地描述)。图4A显示了抗人Beer抗体对于人Beer抗原,而非人Dan或人Gremlin的特异反应性。图4B显示了抗人Gremlin抗体对于人Gremlin抗原,而非人Beer或人Dan的特异反应性。图4C显示了抗人Dan抗体对于人Dan抗原,而非人Beer或人Gremlin的特异反应性。
图5说明了通过Western印迹分析显示的TGF-β结合蛋白Beer对BMP-5和BMP-6,而非BMP-4的选择性(在实施例5中有更详细地描述)。
图6阐明了TGF-β结合蛋白Beer与BMP-5之间的离子相互作用具有15-30nM范围的解离常数。
发明详述
定义
在详细陈述本发明之前,阐明某些术语的定义并列出和定义下文将用到的缩写,可能对于本发明的理解是有用的。
“分子”应理解为包括蛋白质或肽(例如抗体、重组结合伴侣(bindingpartner)、具有期望结合亲和性的肽)、核酸(例如DNA、RNA、嵌合核酸分子和核酸类似物PNA);和有机或无机化合物。
“TGF-β”应理解为包括任何已知或新的TGF-β超家族成员,该TGF-β超家族也包括骨形态发生蛋白质(BMP)。
“TGF-β受体”应理解为是指对于TGF-β超家族(包括骨形态发生蛋白质(BMP))的特定成员具有特异性的受体。
“TGF-β结合蛋白”应理解为是指对于TGF-β超家族(包括骨形态发生蛋白质(BMP))的特定成员或子集具有特异结合亲和性的蛋白质。TGF-β结合蛋白的具体例子包括SEQ ID NOs.1、5、7、9、11、13和15所编码的蛋白质。
抑制“TGF-β结合蛋白与TGF-β蛋白质家族和骨形态发生蛋白质(BMP)的结合”应理解为是指,通过除去TGF-β或阻止TGF-β与TGF-β结合蛋白结合,从而允许激活TGF-β或骨形态发生蛋白质(BMP),或允许TGF-β家族成员包括骨形态发生蛋白质(BMP)与其各自的受体结合的分子。该抑制可以通过例如抑制TGF-β结合蛋白与TGF-β超家族的特定成员结合的分子来实现。
“载体”是指能够指导目的蛋白质表达的装置。载体必须包括可操作地与目的基因连接的转录启动子元件。载体可以由脱氧核糖核酸(“DNA”)、核糖核酸(“RNA”)、或两者的结合(例如DNA-RNA嵌合物) 组成。任选地,载体可以包括聚腺苷酸化序列、一或多个限制性位点、以及一或多个选择标记例如新霉素磷酸转移酶或潮霉素磷酸转移酶。此外,依据所选宿主细胞和所用载体,还可以在本文所述的载体中并入其它遗传元件例如复制起点、其它的核酸限制性位点、增强子、赋予转录可诱导性的序列、和选择标记。
“分离的核酸分子”是非整合在生物体基因组DNA中的核酸分子。例如,从真核细胞的基因组DNA中分离的编码TGF-β结合蛋白的DNA分子即是分离的DNA分子。分离的核酸分子的另一个例子是非整合在生物体基因组中的化学合成核酸分子。该分离核酸分子可以是基因组DNA、cDNA、RNA,或至少部分由核酸类似物组成。
“分离的多肽”是基本上不带有污染细胞成分例如本质上与该多肽相联的碳水化合物、脂质或其它蛋白性质杂质的多肽。在某些实施方案中,如果看起来一个特定的蛋白质制品在考马斯亮兰染色的SDS-PAGE凝胶上表现为单一条带,则它含有分离的多肽。当指有机分子时,“分离的”意味着采用本领域熟知方法(例如NMR、熔点法)测定时,该化合物具有大于90%的纯度。
“硬化性狭窄(Sclerostenosis)”是Hansen(1967)用以指一种疾病的术语(Hansen,H.G.,Sklerosteose.In:Opitz,H.;Schmid,F.,Handbuch der Kinderheikunde.Berlin:Springer(出版)61967,第351-355页),该疾病类似于范布肯姆全身性骨化层肥厚病,但可能有如下不同:骨改变的放射性表现,和许多案例中食指和中指的不对称皮肤并指(趾)现象的存在。在该疾病中下颌具有不寻常的正方形外观。
“人源化抗体”是重组蛋白质,其中鼠单克隆抗体的互补决定区已从鼠免疫球蛋白的重和轻可变链转移至人的可变区。
正如本文所用,“抗体片段”是指抗体的部分例如F(ab’)2、F(ab)2、Fab’、Fab等等。无论结构如何,抗体片段与完整抗体所识别的相同抗原结合。例如,抗TGF-β结合蛋白单克隆抗体片段与TGF-β结合蛋白表位结合。
术语“抗体片段”也包括通过结合特异抗原形成复合物来象抗体一 样起作用的任何合成蛋白质或遗传工程蛋白质。例如,抗体片段包括由轻链可变区构成的分离片段、由重链和轻链可变区构成的“Fv”片段、通过肽接头连接轻链可变区和重链可变区的重组单链多肽分子(“sFv蛋白质”)、和由模拟高变区的氨基酸残基构成的最小识别单位。
“可检测标记(label)”是可以和抗体部分结合产生对于诊断有用的分子的分子或原子。可检测标记的例子包括螯合剂、光敏剂、放射性同位素、荧光试剂、顺磁离子、酶和其它标记物(marker)部分。
如本文所用,“免疫结合物(immunoconjugate)”是含有抗TGF-β结合蛋白抗体或抗体片段,和可检测标记的分子。免疫结合物在结合(conjugation)之后具有与结合之前大致上相同的,或仅轻微降低的结合TGF-β结合蛋白的能力。
缩写:TGF-β-“转化生长因子-β”;TGF-βBP-“转化生长因子-β结合蛋白”(一种代表性的TGF-βBP称为“人Beer”);BMP-“骨形态发生蛋白质”;PCR-“聚合酶链式反应”;RT-PCR-在第一步使用逆转录酶(RT)将RNA首先转录成DNA的PCR方法;cDNA-通过将RNA序列拷贝成DNA形式所产生的任何DNA。
如上所述,本发明提供一种新的TGF-β结合蛋白类型,以及用于增加恒温动物的骨矿质含量的方法和组合物。简单地说,本发明以如下意外发现为基础:编码TGF-β结合蛋白家族一个新成员的基因的突变导致了稀有疾病(硬化性狭窄),该疾病的特征在于与正常个体相比患者骨矿质含量高了1-4倍。因此,正如以下将更为详细地讨论的,该发现导致开发了可以用于筛选抑制TGF-β结合蛋白与TGF-β蛋白质家族和骨形态发生蛋白质(BMP)相结合的分子的方法,以及使用这些分子增加恒温动物(包括例如人)的骨矿质含量的方法。
对称为硬化性狭窄的疾病的讨论
硬化性狭窄是Hansen(1967)应用于一种疾病的术语(Hansen,H.G.,Sklerosteose.In:Opitz,H.;Schmid,F.,Handbuch der Kinderheikunde.Berlin:Springer(出版)6 1967,第351-355页),该疾病类似于范布肯姆全身性骨化层肥厚病,但骨改变的放射性表现可能不同,而且在许多案例中存在食指和中指的不对称皮肤并指(趾)现象。
现已知道硬化性狭窄是一种以成年时期广泛播散性骨硬化损伤(disseminated sclerotic lesions of the bone)为特征的常染色体半显性疾病。该疾病是进行性的。硬化性狭窄还有一个与并指(趾)(两个或多个指(趾)融合在一起)相关的发育问题。硬化性狭窄综合征与巨型身高相关,许多患病个体达到6英尺高或更高。纯合子的骨矿质含量可以比正常个体高1-6倍,而且骨矿质密度可以比正常值(例如,从未患病同胞获得的值)高1-4倍。
硬化性狭窄综合征主要在南非荷兰人血统的Afrikaaner人中发生。在Afrikaaner群体中大约1/140的个体是该突变基因的携带者(杂合子)。该突变表现出100%的外显率。关于不带有相关病理学特征(并指(趾)或头骨过度生长)的杂合子中骨矿质密度增加也有轶事报道。
目前,似乎在硬化性狭窄中还没有垂体-下丘脑轴的异常。尤其是,似乎还没有生长激素和可的松的过度产生。此外,在患病个体中性激素水平正常。然而,骨更新标记(bone turnover markers)(成骨细胞特异性碱性磷酸酶、骨钙素、I型原胶原C’前肽(PICP),以及总的碱性磷酸酶;(见Comier,C.,Curr.Opin.in Rheu.7:243,1995))指示有与该疾病相关的高成骨细胞活性(hyperosteoblastic activity),但破骨细胞活性正常至轻微降低,这是用骨吸收标记(吡啶啉、脱氧吡啶啉、N-端肽、尿羟脯氨酸、血浆酒石酸抗性酸性磷酸酶和半乳糖基羟赖氨酸(见Comier,同上))测量的。
硬化性狭窄的特征在于在患病个体的一生中全身骨骼骨的持续沉积。在纯合子中骨矿质的持续沉积导致在缺乏机械刺激感受器的骨骼区域(头骨、颌、颅骨)中骨的过度生长。在患硬化性狭窄的纯合子中,头骨的过度生长导致颅压迫,并最终由于脑干所受到的过高流体静压导致死亡。在骨骼的所有其它部分,出现普通性和弥散性硬化。长骨的皮质区极大 地增厚,导致骨长度的显著增加。小梁连接(trabecular connections)增厚,而这又增加了小梁骨的强度。硬化骨表现出不寻常的X射线不透性。
正如实施例1中将更详细描述的,负责硬化性狭窄综合征的这种稀有遗传突变定位在人第17号染色体编码TGF-β结合蛋白家族一个新成员的区域(该新成员的一个代表性例子称为“人Beer”)。如下文将更为详细地描述的,基于该发现,骨矿化机制获得了更为全面的理解,从而允许开发测定增加骨矿化的分子的方法,以及这些分子在增加骨矿质含量和治疗或预防许多疾病中的应用。
TGF-β超家族
转化生长因子-β(TGF-β)超家族包含各种(在二级和三级水平上)具有共同的序列元件和结构基序的生长因子。已知该蛋白质家族在众多的细胞类型上执行着广泛的生物学反应。其中许多在胚胎发育期间模式的形成和组织的特化中发挥着重要作用;在成年个体中它们参与例如伤口愈合和骨修复及骨重塑,以及免疫系统的调节。除了三种TGF-β外,该超家族还包括骨形态发生蛋白质(BMP)、活化素、抑制素、生长和分化因子(GDF)以及胶质来源的神经营养因子(GDNF)。通过将特定蛋白质划入普通亚家族的一般序列特征,建立初级分类。由于较小群体的成员间更为严格的序列保守性,在亚家族中进行其它分层是可能的。在某些情况中,例如对于BMP-5、BMP-6和BMP-7,这可以是此较小群体成员间的高达75%的氨基酸同源性。这种一致性水平使得单个代表性序列即可说明将此子群体与较大家族的其它成员分开的此子群体的关键生化元件。
TGF-β通过诱导I型和II型受体形成异寡聚体复合物(hetero-oligomeric complexes)来实现信号转导。已经测定了TGF-β2的晶体结构。TGF-β2的通常折叠形式含有一个由三个二硫桥形成的稳定紧凑的半胱氨酸节状结构。通过一个二硫桥稳定的二聚化是反向平行的。
TGF-β家族成员通过结合具有内在丝氨酸/苏氨酸激酶活性的受体来 起始其细胞作用。该受体家族由两个亚家族组成,表示为I型和II型受体。TGF-β家族的每个成员均与I型和II型受体的一个特征性组合相结合,这两种受体均是信号转导所必需的。在目前的TGF-β受体激活模型中,首先TGF-β与II型受体(TbR-II)结合,这以具有激活的激酶活性的寡聚形式在细胞膜中发生。之后,在缺乏TbR-II时不能与配体结合的I型受体(TbR-I)被吸收进该复合物中。然后,主要在近膜区的富含甘氨酸和丝氨酸残基的域(GS域)中TbR-II使TbR-I磷酸化,并由此激活TbR-I。
迄今已鉴定了7种I型受体和5种II型受体。
骨形态发生蛋白质(BMP)是决定人体骨矿质
密度的关键调节蛋白质
骨形成理解方面的主要进展是骨形态发生蛋白质(BMP),又称生骨蛋白质(OP)的鉴定,该蛋白质调节体内软骨和骨的分化。BMP/OP通过一连串级联事件诱导软骨内的骨分化,这些事件包括软骨的形成、软骨的过量生长和钙化、血管入侵、成骨细胞的分化、和骨的形成。如上所述,BMP/OP(BMP 2-14,和生骨蛋白1和2即OP-1和OP-2)是TGF-β超家族的成员。BMP/OP亚家族成员之间的惊人进化保守性提示,它们在动物的正常发育和机能中是关键的。而且,多种形式的BMP/OP的存在引出一个重要问题,即关于此明显冗余的生物学意义的问题。BMP/OP除了在胎儿之后(postfetal)的软骨形成和骨生成中起作用外,还在骨骼形成(包括颅面(craniofacial)组织和牙组织的发育)以及实质器官包括肾的胚胎发育和器官形成中起着多种作用。现在我们知道,自然界依靠着剪裁的共同(但稀少)的分子机制来实现特化组织和器官的形成。BMP/OP超家族是自然界简约性的一个很好例子,即通过使用在高度保守羧基端区域的氨基酸基序中具有微小变异的分子同种型(isoform)来规划多种特化功能。
BMP的拮抗作用
BMP亚家族和活化素亚家族均受到明显的翻译后调节。存在一个复杂的细胞外控制系统,籍此合成并输出一个高亲和性拮抗剂,随后该拮抗剂选择性地与BMP或活化素形成复合物以破坏它们的生物学活性(W.C.Smith(1999)TIG 15(1)3-6)。已经鉴定了许多这种天然拮抗剂,而且基于序列差异百分数,由于缺乏一级序列的保守性,它们似乎是独立进化的。目前还没有关于这类蛋白质的结构研究。这些拮抗剂的研究突出显示,其明显偏好与BMP-2和BMP-4相互作用,并中和之。而且,不同拮抗剂的抑制机制似乎不同(S.Iemura等(1998)美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)95,9337-9342)。
新的TGF-β结合蛋白
1.TGF-β结合蛋白的背景
如上所述,本发明提供一种新的TGF-β结合蛋白类型,当与人DAN、人Gremlin和人Cerberus以及SCGF(美国专利5,780,263)相比时此新TGF-β结合蛋白类型具有几乎一致的半胱氨酸(二硫键)支架,但核苷酸水平上几乎没有同源性(背景知识一般参见Hsu,D.R.,Economides,A.N.,Wang,X.,Eimon,P.M.,Harland,R.M.,“非洲爪蟾属背部化(dorsalizing)因子Gremlin鉴定了一个拮抗BMP活性的新分泌蛋白质家族”,分子细胞(Molecular Cell)1:673-683,1998)。
该新TGF-β结合蛋白类型的一个代表性例子在SEQ ID NOs.1、5、9、11、13和15中公开。还应当理解,这类结合蛋白的代表性成员包括TGF-β结合蛋白变体(例如SEQ ID NOs.5和7)。本文中所使用的“TGF-β结合蛋白变体基因”是指编码具有SEQ ID Nos:2、10、12、14或16的修饰氨基酸序列的多肽的核酸分子。该变体包括天然存在的TGF-β结合蛋白基因多态性或等位基因变体,以及含有这些氨基酸序列的保守氨基酸替换的合成基因。TGF-β结合蛋白基因的其它变体形式是含有上述核苷酸序列的插入或缺失的核酸分子。TGF-β结合蛋白变体基因可以通过确定该基因是否能与具有SEQ ID Nos:1、5、7、9、11、13或15的核苷酸序列在严紧条件下杂交来鉴定。此外,TGF-β结合蛋白变体基因应编码具有 半胱氨酸骨架(backbone)的蛋白质。
作为一种替代方法,TGF-β结合蛋白变体基因可以通过序列比较来鉴定。正如本文中所用的,当以获得最大对应(correspondence)的方式对比(aligning)时,如果两个氨基酸序列的氨基酸残基相同,则这两个氨基酸序列具有“100%的氨基酸序列一致性”。同样,当以获得最大对应的方式对比时,如果两个核苷酸序列的核苷酸残基相同,则这两个核苷酸序列具有“100%的核苷酸序列一致性”。序列比较可以采用标准软件程序例如DNASTAR(Madison,Wisconsin)生产的LASERGENE生物信息计算软件包中包括的那些程序来进行。其它通过确定最佳对比来比较两个核苷酸或氨基酸序列的方法是本领域技术人员所熟知的(见例如Peruski和Peruski,因特网和新生物学:基因组和分子研究的工具(The Internetand the New Biology:Tools for Genomic and Molecular Research),(ASM Press公司,1997);Wu等(编),“核酸及蛋白质的信息高速公路和计算机数据库”,基因生物技术方法(Methods in GeneBiotechnology),第123-151页(CRC Press公司,1997);和Bishop(编)人类基因组计算指南(Guide to Human Genome Computing)第2版(Academic Press公司,1998))。
TGF-β结合蛋白变体应与SEQ ID Nos:2、6、10、12、14或16有至少50%的氨基酸序列一致性,优选高于60%、65%、70%、75%、80%、85%、90%或95%的一致性。或者,TGF-β结合蛋白变体可以通过与SEQ ID Nos:1、5、9、11、13或15有至少70%的核苷酸序列一致性来鉴定。而且,本发明还设想了与SEQ ID NO:1有大于75%、80%、85%、90%或95%一致性的TGF-β结合蛋白基因变体。无论使用何种鉴定TGF-β结合蛋白变体基因或TGF-β结合蛋白变体的具体方法,TGF-β结合蛋白变体或由TGF-β结合蛋白基因变体编码的多肽均可以从功能上通过例如其结合TGF-β蛋白质家族选定成员和/或抑制该成员的信号转导的能力来表征,或通过其特异结合抗TGF-β结合蛋白抗体的能力来表征。
本发明包括TGF-β结合蛋白基因的功能性片段。在本发明范畴内,TGF-β结合蛋白基因的“功能性片段”是指编码TGF-β结合蛋白多肽的(1) 具有上述功能活性,或(2)特异地与抗TGF-β结合蛋白抗体结合的部分的核酸分子。例如,本文所述TGF-β结合蛋白基因的功能性片段包含SEQ IDNos:1、5、9、11、13或15核苷酸序列的一部分。
2.TGF-β结合蛋白基因的分离
编码结合蛋白基因的DNA分子可以通过使用基于例如SEQ ID No:1的寡核苷酸探针,筛选人cDNA或基因组文库来获得。
例如,cDNA文库制备的第一步是采用本领域技术人员所熟知的方法分离RNA。一般地,RNA的分离技术必需提供用于破碎细胞的方法、抑制RNA酶指导的RNA降解的手段、以及从DNA、蛋白质和多糖污染物中分离RNA的方法。例如,总RNA可以通过如下步骤获得:在液氮中冷冻组织,用研钵和研棒磨碎此冷冻组织以裂解细胞,用酚/氯仿溶液抽提该研碎组织以去除蛋白质,并通过用氯化锂选择性沉淀从剩余的杂质中分离出RNA(见例如Ausubel等(编),精编分子生物学实验指南(Short Protocolsin Molecular Biology),第三版,第4-1至4-6页(John Wiley & Sons1995)[“Ausubel(1995)”];Wu等,基因生物技术方法,第33-41页(CRC出版公司1997)[“Wu(1997)”])。
或者,总RNA可以通过如下步骤分离:用异硫氰酸胍抽提研碎组织,用有机溶剂抽提,并使用差速离心从污染物中分离RNA(见例如Ausubel(1995)第4-1至4-6页;Wu(1997)第33-41页)。
为了构建cDNA文库,必需从总RNA制品中分离poly(A)+RNA。可以通过使用oligo(dT)-纤维素层析标准技术从总RNA中分离poly(A)+RNA(见例如Ausubel(1995)第4-11至4-12页)。
采用本领域技术人员熟知的技术从poly(A)+RNA合成双链cDNA分子。(见例如Wu(1997)第41-46页)。而且,可以使用商业上可获得的试剂盒来合成双链cDNA分子。例如,这些试剂盒可以获自Life Technologies公司(Gaithersburg,Maryland),CLONTECH Laboratories公司(PaloAlto,California),Promega公司(Madison,Wisconsin)和StratageneCloning Systems(La Jolla,California)。
可以对用以获得TGF-β结合蛋白cDNA克隆的这种基本方法进行修改,方法是构建富集TGF-β结合蛋白特异性cDNA分子的扣除cDNA文库。构建扣除文库的技术是本领域技术人员所熟知的(见例如,Sargent,“差异表达基因的分离(Isolation of Differentially ExpressionGenes)”,酶学方法(Meth.Enzymol.)152:423,1987,以及Wu等(编)“扣除和完整表达cDNA文库的构建和筛选(Construction and Screeningof Substracted and Complete Expression cDNA Libraries)”基因生物技术方法(Methods in Gene Biotechnology),第20-65页(CRC出版公司,1997))。
多种克隆载体适合用于cDNA文库的构建。例如,可以在来源于噬菌体的载体如λgt10载体中制备cDNA文库(见例如,Huynh等,“在λgt10和λgt11中构建和筛选cDNA文库(Constructing and Screening cDNALibraries inλgt10 andλgt11)”,DNA克隆:实用方法(DNA Cloning:A Practical Approach)第I卷,Glover(编),第49页(IRL Press,1985);Wu(1997)第47-52页)。
或者,可以将双链cDNA分子插入质粒载体如pBluescript载体(Stratagene Cloning Systems;La Jolla,California),λGEM-4(Promega公司;Madison,Wisconsin)或其它商业可获得的载体。合适的克隆载体还可以从美国典型培养物保藏中心(Rockville,Maryland)获得。
为了扩增克隆的cDNA分子,采用标准技术将cDNA文库插入原核宿主中。例如,可以将cDNA文库导入大肠杆菌DH5感受态细胞中,该细胞可以从Life Technologies公司(Gaithersburg,Maryland)获得。
可以通过本领域熟知的方法制备人类基因组DNA文库(见例如Ausubel(1995)第5-1至5-6页;Wu(1997)第307-327页)。基因组DNA可以通过如下步骤分离:用去污剂Sarkosyl裂解组织,蛋白酶K消化裂解物,通过离心从裂解物中清除不溶性碎片,使用异丙醇从裂解物中沉淀核酸,并在氯化铯密度梯度上纯化重悬的DNA。
可以通过基因组DNA的随机剪切或通过用限制性内切酶部分消化基 因组DNA,获得适合用于产生基因组文库的DNA片段。根据常规技术,例如使用限制性酶消化提供合适的末端、使用碱性磷酸酶处理以避免DNA分子不合要求的连接、并用合适的连接酶进行连接,可以将基因组DNA片段插入载体如噬菌体或粘粒载体中。用于这些操作的技术是本领域所熟知的(见例如Ausubel(1995)第5-1至5-6页;Wu(1997)第307-327页)。
编码TGF-β结合蛋白的核酸分子还可以使用具有基于上述人TGF-β结合蛋白基因之核苷酸序列的核苷酸序列的寡核苷酸引物采取聚合酶链式反应(PCR)来获得。用PCR筛选文库的一般方法参见例如,Yu等“使用聚合酶链式反应筛选噬菌体文库(Use of Polymerase Chain Reactionto Screen Phage Libraries)”,分子生物学方法(Methods in MolecularBiology)第15卷:PCR操作指南:目前的方法和应用(PCR Protocols:Current Methods and Applications),White(编)第211-215页(Humama出版公司,1993)。而且,使用PCR分离相关基因的技术描述于例如Preston“简并寡核苷酸引物和聚合酶链式反应在克隆基因家族成员中的应用(Use of Degenerate Oligonucleotide Primes and the PolymeraseChain Reaction to Clone Gene Family Member)”,分子生物学方法,第15卷:PCR操作指南:目前的方法和应用,White(编)第317-337页(Humama出版公司,1993)。
或者,可以从商业途径例如Research Genetics(Huntsville,AL)和美国典型培养物保藏中心(Rokville,Maryland)获得人类基因组文库。
可以采用标准方法(见例如Ausubel(1995)第6-1至6-11页),用基于SEQ ID No:1的一或多个多核苷酸探针筛选含有cDNA或基因组克隆的文库。
按下述方法制备的抗TGF-β结合蛋白抗体也可以用来从cDNA文库中分离编码TGF-β结合蛋白基因的DNA序列。例如,可以使用该抗体筛选λgt11表达文库,或者可以在杂交体选择和翻译(hybrid selection andtranslation)后使用该抗体进行免疫筛选(见例如Ausubel(1995)第6-12 至6-16页;Margolis等“用抗体和蛋白质探针筛选λ表达文库(Screeningλexpression libraries with antibody and protein probes)”,DNA克隆2:表达系统(DNA Cloning 2:Expression Systems)第2版,Glover等(编)第1-14页(牛津大学出版社1995))。
TGF-β结合蛋白cDNA或TGF-β结合蛋白基因组片段的序列可以采用标准方法确定。而且,可以采用成熟技术如缺失分析(deletion analysis)(一般参见Ausubel(1995)),实现对含有TGF-β结合蛋白启动子或调节元件的基因组片段的鉴定。
作为替代方法,可以通过采用相互引发(mutually priming)的长寡核苷酸以及本文所述的核苷酸序列,合成DNA分子,获得TGF-β结合蛋白基因(见例如Ausubel(1995)第8-8至8-9页)。使用聚合酶链式反应的已有技术使得能够合成长至少2千碱基对的DNA分子(Adang等,植物分子生物学(Plant Molec.Biol.)21:1131,1993;Bambot等,PCR方法和应用(PCR Methods and Applications)2:266,1993;Dillon等,“聚合酶链式反应在快速构建合成基因中的应用(Use of thePolymerase Chain Reaction for the Rapid Construction of SyntheticGenes)”,分子生物学方法,第15卷:PCR操作指南:目前的方法和应用,White(编)第263-268页(Humama出版公司,1993);Holowachuk等,PCR方法应用(PCR Methods Appl.)4:299,1995)。
3.TGF-β结合蛋白基因的制备
可以通过采用上述程序,利用具有基于SEQ ID NO:1、5、9、11、13或15的核苷酸序列的多核苷酸探针,筛选各种cDNA或基因组文库,来获得编码TGF-β结合蛋白基因变体的核酸分子。也可以通过合成构建TGF-β结合蛋白基因变体。例如,可以设计一个核酸分子,其编码与SEQ IDNos:2、6、8、10、12、14或16的氨基酸序列相比具有保守氨基酸改变的多肽。即,可以获得含有SEQ ID Nos:2、6、8、10、12、14或16的一或多个氨基酸替换的变体,其中TGF-β结合蛋白氨基酸序列中的烷基氨基酸由烷基氨基酸替代,TGF-β结合蛋白氨基酸序列中的芳香族氨基酸 由芳香族氨基酸替代,TGF-β结合蛋白氨基酸序列中的含硫氨基酸由含硫氨基酸替代,TGF-β结合蛋白氨基酸序列中的含羟基氨基酸由含羟基氨基酸替代,TGF-β结合蛋白氨基酸序列中的酸性氨基酸由酸性氨基酸替代,TGF-β结合蛋白氨基酸序列中的碱性氨基酸由碱性氨基酸替代,或TGF-β结合蛋白氨基酸序列中的二碱基(dibasic)单羧基氨基酸由二碱基单羧基氨基酸替代。
在通常的氨基酸中,例如,“保守氨基酸替代”可通过下列每组内的氨基酸之间的替代来说明:(1)甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸,(2)苯丙氨酸、酪氨酸和色氨酸,(3)丝氨酸和苏氨酸,(4)天冬氨酸和谷氨酸,(5)谷氨酰胺和天冬酰胺,和(6)赖氨酸、精氨酸和组氨酸。在进行这些替换时,重要的是尽可能维持图1描画的半胱氨酸骨架。
TGF-β结合蛋白氨基酸序列中的保守氨基酸改变可以通过用核苷酸替代SEQ ID NO:1中所示的核苷酸来引入。这种“保守氨基酸”变体可以通过例如寡核苷酸指导的诱变、接头分区诱变、使用聚合酶链式反应进行的诱变等等获得(见Ausubel(1995)第8-10至8-22页;以及McPherson(编),定向诱变:实践方法(Directed Mutagenesis:A PracticalApproach)(IRL出版社1991))。这些变体的功能性能力可以采用标准方法例如本文所述试验方法来测定。或者,TGF-β结合蛋白变体多肽可以通过其特异结合抗TGF-β结合蛋白抗体的能力来鉴定。
可以进行核酸分子的常规缺失分析以获得编码TGF-β结合蛋白多肽的核酸分子的“功能性片段”。作为一个说明例子,可以用Bal3 I核酸酶消化具有SEQ ID NO:1核苷酸序列的DNA分子,获得一系列嵌套缺失。然后以正确的阅读框将这些片段插入表达载体,分离表达的多肽并检测其活性,或检测其结合抗TGF-β结合蛋白抗体的能力。外切核酸酶消化的一个替代方法是使用寡核苷酸指导的诱变引入缺失或终止密码子以规定产生期望片段。或者,可以使用聚合酶链式反应合成TGF-β结合蛋白基因的特定片段。
用于蛋白质功能分析的标准技术描述于例如,Treuter等,分子普通遗传学(Molec.Gen.Genet.)240:113,1993;Content等,“人干扰 素诱导的42kDa 2-5A合成酶的表达和初步缺失分析”,生物干扰素系统,关于干扰素系统的ISIR-TNO会议报告(Biological Interferon Systems,Proceedings of ISIR-TNO Meeting on Interferon Systems),Cantell(编),第65-72页(Nijhoff 1987);Herschman,“EGF受体”,动物细胞增殖控制(Control of Animal Cell Proliferation),第I卷,Boynton等(编)第169-199(Academic Press 1985);Coumaileau等,生物化学杂志(J.Biol.Chem.)270:29270,1995;Fukunaga等,生物化学杂志,270:25291,1995;Yamaguchi等,生物化学药物学(Biochem.Pharmacol.)50:1295,1995;和Meisel等,植物分子生物学(Plant Molec.Biol.)30:1,1996。
本发明还考虑到具有保守氨基酸改变的TGF-β结合蛋白基因功能片段。
可以通过按如上所述方法确定与SEQ ID Nos:1、5、9、1、13或15以及2、6、10、12、14或16的核苷酸和氨基酸序列的一致性水平,以结构为基础鉴定TGF-β结合蛋白变体基因。基于结构鉴定变体基因的一个替代方法是,确定编码可能的TGF-β结合蛋白基因变体的核酸分子是否能在严紧条件下与具有SEQ ID Nos:1、5、9、11、13或15,或其长度不少于15或20个核苷酸的部分的核苷酸序列的核酸分子杂交。作为严紧杂交条件的举例说明,在如下缓冲液中55-60℃孵育过夜,具有TGF-β结合蛋白变体序列的核酸分子可以与具有SEQ ID NO:1序列的核酸分子的片段结合,该缓冲液含有例如5×SSPE(1×SSPE=180mM氯化钠,10mM磷酸钠,1mM EDTA(pH7.7)),5×Denhardt氏液(100×Denhardt氏液=2%(w/v)牛血清白蛋白,2%(w/v)Ficoll,2%(w/v)聚乙烯吡咯烷酮)和0.5%SDS。高度严紧的杂交后洗涤典型地是在0.5×SSC(1×SSC=150mM氯化钠,15mM柠檬酸三钠)或0.5×SSPE中于55-60℃进行的。
无论TGF-β结合蛋白基因变体的具体核苷酸序列如何,该基因都编码能够用其功能活性或其特异结合抗TGF-β结合蛋白抗体的能力来表征的多肽。更具体地,TGF-β结合蛋白基因变体编码的多肽表现出本文所述人TGF-β结合蛋白基因所编码多肽的活性的至少50%,优选60%、70%、 80%或90%以上。
4.在培养细胞中产生TGF-β结合蛋白
为了表达TGF-β结合蛋白基因,在表达载体中编码该多肽的核酸分子必需可操作地与控制转录表达的调节序列连接,之后导入宿主细胞中。除了转录调节序列例如启动子和增强子,表达载体还可包括翻译调节序列和适用于筛选携带该表达载体的细胞的标记基因。
适用于在真核细胞中产生外源蛋白质的表达载体典型地含有(1)编码细菌复制原点和抗生素抗性标记的原核DNA元件,以为表达载体在细菌宿主中的生长和筛选作准备;(2)控制转录起始的真核DNA元件,例如启动子;和(3)控制转录本加工的DNA元件,例如转录终止/多腺苷酸化序列。
本发明的TGF-β结合蛋白优选在哺乳动物细胞中表达。哺乳动物宿主细胞的例子包括非洲绿猴肾细胞(Vero;ATCC CRL 1587),人胚胎肾细胞(293-HEK;ATCC CRL 1573),新生仓鼠肾细胞(BHK-21;ATCC CRL8544);犬肾细胞(MDCK;ATCC CCL 34),中国仓鼠卵巢细胞(CHO-K1;ATCC CCL 61),大鼠垂体细胞(GH1;ATCC CCL 82),Hela S3细胞(ATCCCCL 2.2),大鼠肝癌细胞(H-4-II-E;ATCC CRL 1548),SV40转化的猴肾细胞(COS-1;ATCC CRL 1650)和鼠胚胎细胞(NIH-3T3;ATCC CRL 1658)。
对于哺乳动物宿主,转录和翻译调节信号可以来自病毒,例如腺病毒、牛乳头瘤病毒、猿猴病毒等等,在这些病毒中这些调节信号与具有高水平表达的特定基因相联系。适合的转录和翻译调节序列还可以从哺乳动物基因例如肌动蛋白、胶原蛋白、肌球蛋白和金属硫蛋白基因获得。
转录调节序列包括足以指导RNA合成起始的启动子区域。适合的真核启动子包括小鼠金属硫蛋白I基因的启动子[Hamer等,分子应用遗传学杂志(J.Molec.Appl.Genet.)1:273,1982],疱疹病毒的TK启动子[McKnight,细胞(Cell)31:355,1982],SV40早期启动子[Benoist等,自然(Nature)290:304,1981],Rous肉瘤病毒启动子[Gorman等,美国国家科学院院刊79:6777,1982],巨细胞病毒启动子[Foecking等, 基因(Gene)45:101,1980],和小鼠乳腺瘤病毒启动子(一般见,Etcheverry,“工程蛋白质在哺乳动物细胞培养物中的表达(Expressionof Engineered Proteins in Mammalian Cell Culture)”,蛋白质工程:原理和实践(Protein Engineering:Principles and Practice),Cleland等(编)第163-181页(John Wiley & Sons公司,1996))。
或者,如果一种原核启动子受到真核启动子的调节,则可以使用该原核启动子,例如噬菌体T3 RNA聚合酶启动子来控制TGF-β结合蛋白基因在哺乳动物细胞中的表达(Zhou等,分子细胞生物学(Mol.Cell Biol.)10:4529,1990;Kaufman等,核酸研究(Nucl.Acids Res.)19:4485,1991)。
TGF-β结合蛋白基因还可以在细菌、酵母、昆虫或植物细胞中表达。可以用以在原核宿主细胞中表达TGF-β结合蛋白多肽的适合启动子是本领域技术人员所熟知的,包括能识别T4、T3、Sp6和T7聚合酶的启动子,λ噬菌体的PR和PL启动子,大肠杆菌的trp、recA、热休克、lacUV5、tac、lpp-lacSpr、phoA和lacZ启动子,枯草芽孢杆菌(B.subtiis)的启动子,芽孢杆菌属(Bacillus)噬菌体的启动子,链霉菌属(Streptomyces)的启动子,λ噬菌体的int启动子,pBR322的bla启动子,以及氯霉素乙酰转移酶基因的CAT启动子。原核启动子的综述见Glick,J.Ind.Microbiol.1:277,1987;Watson等,基因分子生物学(MolecularBiology of the Gene)第4版(Benjamin Cummins 1987);以及Ausubel等(1995)。
优选的原核宿主包括大肠杆菌和枯草芽孢杆菌(Bacillussubtilus)。适合的大肠杆菌菌株包括BL21(DE3)、BL21(DE3)pLysS、BL21(DE3)pLysE、DH1、DH4I、DH5、DH5I、DH5IF’、DH5IMCR、DH10B、DH10B/p3、DH11S、C600、HB101、JM101、JM105、JM109、JM110、K38、RR1、Y1088、Y1089、CSH18、ER1451和ER1647(见例如Brown(编)MolecularBiology Labfax(Academic出版社1991))。合适的枯草芽孢杆菌菌株包括BR151、YB886、MI119、MI120和B170(见例如Hardy,“芽孢杆菌克隆方法”,DNA克隆:实践方法(DNA Cloning:A Practical Approach), Glover(编)(IRL出版社1985))。
在原核宿主中表达蛋白质的方法是本领域技术人员所熟知的(见例如William等,“应用质粒载体在大肠杆菌中表达外源蛋白质以及特异性多克隆抗体的纯化”,DNA克隆2:表达系统,第2版,Glover等(编)第15页(牛津大学出版社1995);Ward等,“抗体的遗传操作和表达”,单克隆抗体:原则和应用(Monoclonal Antibodies:Principles andApplications),第137页(Wiley-Liss公司,1995);和Georgiou,“细菌中蛋白质的表达”,蛋白质工程:原理和实践,Cleland等(编)第101页(John Wiley & Sons公司,1996))。
杆状病毒系统提供了一种将克隆TGF-β结合蛋白基因导入昆虫细胞的有效手段。合适的表达载体以苜蓿银纹夜蛾(Autographacalifornica)多核型多角体病毒(AcMNPV)为基础,并含有熟知的启动子例如果蝇(Drosophila)热休克蛋白质(hsp)70启动子、苜蓿银纹夜蛾多核型多角体病毒的立即早期基因启动子(ie-1)和迟早期39K启动子、杆状病毒p10启动子、和果蝇金属硫蛋白启动子。合适的昆虫宿主细胞包括来源于IPLB-sf-21的细胞系,一种草地夜蛾(Spodopterafrugiperda)蛹卵巢细胞系,例如Sf9(ATCC CRL 1711),Sf21AE和Sf21(Invitrogen公司;San Diego,CA),以及果蝇Schneider-2细胞。用于在杆状病毒系统中产生重组蛋白质的确立技术参见Bailey等,“杆状病毒载体的操作(Manipulation of Baculovirus Vectors)”,分子生物学方法(Methods in Molecular Biology)第7卷:基因转移和表达实验指南(Gene Transfer and Expression Protocols),Murray(编)第147-168页(The Humana出版公司1991);Patel等,“杆状病毒表达系统”,DNA克隆2:表达系统,第2版,Glover等(编)第205-244页(牛津大学出版社1995);Ausubel(1995)第16-37至16-57页,Richardson(编)杆状病毒表达实验指南(Baculovirus ExpressionProtocols)(The Humana出版公司1995);以及Lucknow,“昆虫细胞表达技术(Insect Cell Expression Technology)”,蛋白质工程:原理和实践,Cleland等(编),第183-218页(John Wiley & Sons公司 1996)。
用于酵母中表达的启动子包括来源于GAL1(半乳糖)、PGK(磷酸甘油酸激酶)、ADH(醇脱氢酶)、AOX1(醇氧化酶)、HIS4(组氨醇脱氢酶)等的启动子。已经设计了许多酵母克隆载体,而且这些载体均容易获得。这些载体包括基于YIp的载体如YIp5,YRp载体如YRp17,YEp载体如YEp13,和YCp载体如YCp19。本领域技术人员将理解有许多种合适载体可以用于酵母细胞中的表达。
还可以将表达载体导入植物原生质体、完整的植物组织、或分离的植物细胞。培养植物组织的一般方法参见例如Miki等,“向植物导入外源DNA的方法(Procedures for Introducing Foreign DNA into Plants”,植物分子生物学和生物技术方法(Methods in Plant Molecualr Biologyand Biotechnology),Glick等(编),第67-88页(CRC出版社1993)。
可以采用各种标准技术将表达载体导入宿主细胞,这些技术包括磷酸钙转染、脂质体介导的转染、微粒介导的递送、电穿孔等等。优选地,对转染细胞进行筛选和增殖,以提供含有稳定整合在宿主细胞基因组中的表达载体的重组宿主细胞。将载体导入真核细胞的技术和使用显性选择标记筛选这些稳定转化体的技术描述于例如Ausubel(1995)和Murray(编)基因转移和表达实验指南(Humana出版社1991)。Ausubel(1995)也提供了用于将表达载体导入细菌、酵母、昆虫和植物细胞的方法。
表达和回收哺乳动物细胞系统产生的外源蛋白质的一般方法参见例如Etcheverry,“工程蛋白质在哺乳动物细胞培养物中的表达”,蛋白质工程:原理和实践,Cleland等(编),第163页(Wiley-Liss公司,1996)。回收细菌系统产生的蛋白质的标准技术参见例如Grisshammer等,“从大肠杆菌细胞中纯化过量产生的蛋白质”,DNA克隆2:表达系统,第2版,Glover等(编),第59-92页(牛津大学出版社1995)。用于从杆状病毒系统中分离重组蛋白质的已确立方法描述于例如Richardson(编),杆状病毒表达实验指南(Baculovirus Expression Protocols)(The Humana出版公司,1995)。
更为一般地,可以通过标准技术分离TGF-β结合蛋白,例如亲和层 析、大小排阻层析、离子交换层析、HPLC等等。本领域技术人员可以设计分离和纯化TGF-β结合蛋白的其它变化方法。例如可以使用按如下描述获得的抗TGF-β结合蛋白抗体,通过免疫亲和纯化分离大量蛋白质。
5.抗TGF-β结合蛋白抗体的产生
例如,可以使用表达载体的产物作为抗原来获得抗TGF-β结合蛋白抗体。尤其有用的抗TGF-β结合蛋白抗体“特异结合”SEQ ID Nos:2、6、10、12、14或16的TGF-β结合蛋白,而不与其它TGF-β结合蛋白例如Dan、Cerberus、SCGF或Gremlin结合。本发明抗体(包括其片段和衍生物)可以是多克隆抗体,或尤其是单克隆抗体。该抗体可以属于任何免疫球蛋白类型,即可以是例如IgG,如IgG1、IgG2、IgG3、IgG4;IgE;IgM;或IgA抗体。该抗体可以是动物例如哺乳动物来源的,可以是例如小鼠、大鼠、人或其它灵长类动物的抗体。如果需要,该抗体可以是内化抗体(internalising antibody)。
可以采用本领域技术人员所熟知的方法制备抗重组TGF-β结合蛋白的多克隆抗体(见例如,Green等,“多克隆抗血清的制备”,免疫化学实验指南(Immunochemical Protocols)(Manson,编),第1-5页(Humana出版社1992);Williams等,“采用质粒载体在大肠杆菌中表达外源蛋白质以及特异性多克隆抗体的纯化”,DNA克隆2:表达系统,第2版,Glover等(编),第15页(牛津大学出版社1995))。尽管多克隆抗体典型地是在动物例如大鼠、小鼠、兔、山羊或绵羊中产生的,但本发明的抗TGF-β结合蛋白抗体也可以来源于非人灵长类动物的抗体。在狒狒中产生诊断上和治疗上有用的抗体的一般技术可以参见例如Goldenberg等,国际专利申请公开文本WO 91/11465(1991),Losman等,国际癌症杂志(Int.J.Cancer)46:310,1990。
所述抗体应至少含有一个可变区结构域。该可变区结构域可以是任意大小或氨基酸组成,并且一般在构架序列中包含至少一个负责抗原结合的高变氨基酸序列。一般地,术语可变(V)区结构域可以是免疫球蛋白重(VH)链和/或轻(VL)链可变结构域的任何适合配置。因此,例如V 区结构域可以是单体,是能够以可接受的亲和性独立地与抗原结合的VH或VL结构域。或者,V区结构域可以是二体,含有VH-VH、VH-VL或VL-VL二聚物,其中VH和VL链以非共价形式相连(以下缩写为FV)。然而,如果需要,这些链可以直接地例如通过两个可变结构域之间的二硫键,或通过接头例如肽接头共价偶联,以形成单链结构域(以下缩写为scFv)。
可变区结构域可以是任何天然存在的可变结构域,或其工程版本。工程版本是指采用重组DNA工程技术构建的可变区结构域。该工程版本包括那些例如通过在或向天然抗体的氨基酸序列中插入、缺失或改变,从天然抗体可变区产生的可变区结构域。这种类型的具体例子包括那些含有至少一个CDR并任选含有来自一个抗体的一或多个构架氨基酸和来自第二个抗体的该可变区结构域的其余部分的工程可变区结构域。
可变区结构域可以在C端氨基酸上共价连接至少一个其它抗体结构域或其片段。因此,例如当VH域存在于可变区结构域中时,其可以与免疫球蛋白的CH1域或其片段连接。同样,VL域可以与CK域或其片段连接。以此方式,例如抗体可以是Fab片段,其中抗原结合域含有在C端分别共价连接了CH1和CK域的相关的VH和VL结构域。CH1域可以再增加两个氨基酸,例如用以提供如同Fab’片段中的铰链区结构域,或提供其它结构域例如抗体CH2和CH3域。
抗体片段的另一种形式是编码单个互补决定区(CDR)的多肽。CDR肽(“最小识别单位”)可以通过构建编码目的抗体的CDR的基因来获得。该基因的制备方法例如使用聚合酶链式反应从产生抗体的细胞的RNA合成可变区(见例如Larrick等,方法:酶学方法手册(Methods:A Companionto Methods in Enzymology)2:106,1991;Courtenay-Luck,“单克隆抗体的遗传操作”,单克隆抗体:生产、工程化和临床应用(MonoclonalAntibodies:Production,Engineering and Clinical Application),Ritter等(编),第166页(剑桥大学出版社1995);和Ward等,“抗体的遗传操作和表达”,单克隆抗体:原理和应用,Birch等(编),第137页(Wiley-Liss公司1995))。
用于本发明的抗体一般可以是单克隆的(通过常规免疫和细胞融合程 序制备的),或者对于片段而言是通过采用任何合适的标准化学技术例如还原或酶裂解和/或消化,例如通过胃蛋白酶处理获得的。
更具体地,可以利用各种技术产生单克隆抗TGF-β结合蛋白抗体。啮齿类动物的针对特异抗原的单克隆抗体可以通过本领域技术人员所熟知的方法获得(见例如Kohler等,自然256:495,1975;和Coligan等(编),当代免疫学实验指南(Current Protocols in Immunology),1∶2.5.1-2.6.7(John Wiley & Sons 1991)[“Coligan”];Picksley等,“针对大肠杆菌中所表达蛋白质的单克隆抗体的产生(Production ofmonoclonal antibodies against proteins expressed in E.coli.)”,DNA克隆2:表达系统,第2版,Glover等(编)第93页(牛津大学出版社1995))。
简单地说,单克隆抗体可以通过如下步骤获得:给小鼠注射含有TGF-β结合蛋白基因产物的组合物,通过取出血清样品验证存在抗体的产生,取出脾脏以获得B淋巴细胞,融合B淋巴细胞和骨髓瘤细胞产生杂交瘤,克隆杂交瘤,筛选产生抗该抗原的抗体的阳性克隆,培养产生抗该抗原抗体的克隆,并从杂交瘤培养物中分离该抗体。
此外,本发明抗TGF-β结合蛋白抗体也可以来源于人单克隆抗体。从经遗传改造应答抗原刺激产生特异人抗体的转基因小鼠获得人单克隆抗体。在该技术中,人的重链和轻链座位元件被导入胚胎干细胞系来源的小鼠株中,其中该胚胎干细胞系含有被定向破坏的内源性重链和轻链座位。该转基因小鼠可以合成特异针对人抗原的人抗体,而且该小鼠可以用于产生分泌人抗体的杂交瘤。从转基因小鼠获得人抗体的方法描述于例如Green等,自然遗传学(Nature Genet.)7:13,1994;Lonberg等,自然368:856,1994;和Taylor等,国际免疫学(Int.Immun.)6:579,1994。
可以通过各种成熟的技术从杂交瘤培养物中分离和纯化单克隆抗体。这些分离技术包括用A蛋白Sepharose进行的亲和层析、大小排阻层析、和离子交换层析(见例如Coligan,第2.7.1-2.7.12页和第2.9.1-2.9.3页;Baines等,“免疫球蛋白G(IgG)的纯化”,分子生物学方法,第10 卷,第79-104页(The Humana出版公司1992))。
对于特定应用,可能希望制备抗TGF-β结合蛋白抗体的片段。这些抗体片段可以通过例如抗体的蛋白水解来获得。可以通过常规方法将整个抗体进行胃蛋白酶或木瓜蛋白酶消化,获得抗体片段。作为一个说明例子,可以通过胃蛋白酶酶解抗体提供称为F(ab’)2的5S片段,产生抗体片段。可以使用巯基还原剂进一步裂解该片段,产生单价3.5S Fab’片段。任选地,可以使用封闭二硫键断裂所产生巯基的基团,进行该裂解反应。作为替代方法,使用胃蛋白酶酶解直接产生两个单价Fab片段和一个Fc片段。这些方法描述于例如Goldenberg,美国专利4,331,647;Nisonoff等,Arch Biochem.Biophys.89:230,1960;Porter,生物化学杂志(Biochem.J.)73:119,1959;Edelman等,酶学方法(Methodsin Enzymology)1:422(Academic出版社1967);和Coligan第2.8.1-2.8.10页和第2.10.-2.10.4页。
还可以使用其它裂解抗体的方法,例如分离重链以形成单价轻-重链片段,片段的进一步裂解,或其它酶的、化学的或遗传的技术,只要这些片段能与完整抗体所识别的抗原结合即可。
或者,抗体可以是通过使用重组DNA技术,包括对编码抗体可变和/或恒定区的DNA的操作和再表达,获得的重组或工程抗体。这些DNA是已知的和/或可以容易地从DNA文库包括例如噬菌体抗体文库获得(见Chiswell,D J和McCafferty,J.Tibtech.10 80-84(1992)),或如果需要,可以合成这些DNA。可以使用标准的分子生物学和/或化学方法测序和操作该DNA,以便例如按需要引入密码子创造半胱氨酸残基、或修改、添加或缺失其它氨基酸或结构域。
由此,可以制备一或多个含有该DNA的可复制表达载体,并用以转化合适的细胞系,例如非产病毒性(non-producing)杂交瘤细胞系如小鼠NSO系或细菌如大肠杆菌系,在其中进行抗体的生产。为了获得有效转录和翻译,每个载体中的该DNA序列应该包括合适的调节序列,尤其是可操作地与可变结构域序列连接的启动子和前导序列。用于通过此方式生产抗体的具体方法一般是熟知的,并且是常规使用的。例如,由 Maniatis等描述的基本分子生物学程序(分子克隆(MolecularBiology),Cold Spring Harbor Laboratoty,纽约,1989);DNA测序可以按Sanger等的描述(PNAS 74,5463,(1977))和AmershamInternational plc测序手册进行;而位点定向诱变可以根据Kramer等(核酸研究12,9441,(1984))的方法和Anglian生物技术有限公司手册来进行。此外,还有许多出版物详细描述了适用于通过操作DNA、构建表达载体和转化合适细胞来制备抗体的技术,例如由Mountain A和Adair,J R在生物技术和遗传工程综述(Biotechnology and GeneticEngineering Reviews)(Tombs,MP编,10,第1章,1992,Intercept,Andover,英国)中和国际专利说明书WO91/09967中所评论的。
如果需要,根据本发明的抗体可以具有与之相连的一或多个效应或报道分子,而且本发明扩展到这些修饰蛋白质。效应或报道分子可以通过任何可利用的氨基酸侧链、末端氨基酸或,如果存在的话位于抗体中的糖功能基团,与抗体相连,当然总是假设这并不会对该分子的结合性质和最终有效性产生不利影响。具体的功能基团包括例如任何游离的氨基、亚氨基、巯基、羟基、羧基或醛基。抗体与效应和/或报道分子的连接可以通过这些基团和效应或报道分子中的合适功能基团来实现。该连接可以是直接的或间接的,通过间隔基团或桥连基团实现。
效应分子包括例如抗肿瘤剂、毒素(例如细菌或植物来源的酶活性毒素和其片段,如篦麻毒素和其片段)、生物学活性蛋白质例如酶、核酸和其片段如DNA、RNA和它们的片段、天然存在的和合成的聚合物如多糖和聚烷撑聚合物(polyalkylene polymer)如聚(乙二醇)和其衍生物、放射性核素尤其是放射性碘、和螯合金属。合适的报道基团包括螯合金属、荧光化合物或可以通过NMR或ESR光谱学检测的化合物。
具体的抗肿瘤剂包括细胞毒性和细胞抑制试剂,例如烷化剂如氮芥(nitrogen mustard)(如苯丁酸氮芥、美法仑、氮芥(mechlorethamine)、环磷酰胺或乌拉莫司汀)和其衍生物、三亚乙基磷酰胺、三亚乙基硫代磷酰胺、白消安、或顺铂;抗代谢物例如氨甲蝶呤、氟尿嘧啶、5-氟脱氧尿苷、阿糖胞苷、巯基嘌呤、硫代鸟嘌呤、氟 乙酸或氟柠檬酸;抗生素,例如博来霉素(如博来霉素硫酸盐)、阿霉素、道诺红霉素、丝裂霉素(如丝裂霉素C)、放线菌素(如放线菌素D)、普卡霉素、加利车霉素(calichaemicin)和其衍生物、或埃斯波霉素和其衍生物;有丝分裂抑制剂例如表鬼臼毒素吡喃葡糖苷、长春新碱或长春碱和它们的衍生物;生物碱,例如玫瑰树碱;多元醇例如taxicin-I或taxicin-II;激素例如雄激素(如屈他雄酮或睾内脂)、孕酮(如醋酸甲地孕酮或醋酸甲羟孕酮)、雌激素(二甲基己烯雌酚二磷酸酯(dimethylstiblestrol diphosphate)、聚磷酸雌二醇或雌二醇氮芥磷酸酯(estramustine phosphate))或抗雌激素(如三苯氧胺);蒽醌例如米托蒽醌;脲例如羟基脲;肼例如甲基苄肼;或咪唑例如达卡巴嗪。
尤其有用的效应基团是加利车霉素和其衍生物(见例如南非专利说明书85/8794、88/8127和90/2839)。
鏊合金属包括具有2-8(包括2和8)配位数的正二价或三价(di-ortripositive)金属鏊合物。该金属的具体例子包括锝(Tc)、铼(Re)、钴(Co)、铜(Cu)、金(Au)、银(Ag)、铅(Pb)、铋(Bi)、铟(In)、镓(Ga)、钇(Y)、铽(Tb)、钆(Gd)和钪(Sc)。一般地,该金属优选是放射性核素。具体的放射性核素包括99mTc、186Re、188Re、58Co、60Co、67Cu、195Au、199Au、 110Ag、203Pb、206Bi、207Bi、111In、67Ga、68Ga、88Y、90Y、160Tb、153Gd和47Sc。
该鏊合金属可以是例如被任何适合的多齿鏊合剂鏊合的上述金属类型之一,这些鏊合剂例如无环或环状多胺、多醚(如冠醚和其衍生物);聚酰胺;卟啉;和碳环衍生物(carbocyclic derivatives)。
一般地,鏊合剂的类型取决于所用金属。然而,在根据本发明的偶联物中一组尤其有用的鏊合剂是无环多胺和环状多胺,特别是聚氨基羧酸(polyaminocarboxylic acid)例如二亚乙基三胺五乙酸和其衍生物,和大环胺(macrocyclic amine)例如环状三氮杂(aza)和四氮杂衍生物(例如国际专利说明书WO 92/22583中所描述的);以及聚酰胺,特别是去铁铵和其衍生物。
因此,例如当希望在抗体中使用巯基作为连接点时,这可以通过与存在于效应或报道分子中的巯基反应性基团反应来实现。这些基团的例子 包括á-卤羧酸或酯(á-halcarboxylic acid or ester)例如碘乙酰胺、二酰亚胺例如顺丁烯二酰亚胺、乙烯砜、或二硫化物。这些和其它合适的连接程序一般地和更为具体地描述于国际专利说明书WO 93/06231、WO92/22583、WO 90/091195和WO 89/01476。
筛选增加骨密度的分子的方法
如上所讨论的,本发明提供用于筛选和/或分离能够增加骨密度的化合物的方法。例如,在本发明的一个方面中,提供用于确定所选分子是否能够增加骨矿质含量的方法,包括步骤:(a)将所选分子与TGF-β结合蛋白和TGF-β蛋白质家族的一个选定成员混合,(b)测定该所选分子是否刺激了通过TGF-β蛋白质家族进行的信号转导、或抑制了TGF-β结合蛋白与TGF-β蛋白质家族的结合。在某些实施方案中,该分子增强TGF-β作为间充质细胞分化的正调节物起作用的能力。
在本发明的其它方面,提供用于确定所选分子是否能够增加骨矿质含量的方法,包括步骤(a)将所选分子暴露于表达TGF-β结合蛋白的细胞,和(b)测定所述暴露细胞的TGF-β结合蛋白的表达(或活性)是否降低,并由此确定该化合物是否具有增加骨矿质含量的能力。在一个实施方案中,该细胞选自从骨活组织检查获得的自发转化或未转化正常人骨和大鼠顶骨的成骨细胞。该方法可以通过许多种试验形式来完成,包括例如对流免疫电泳(CIEP)、放射免疫测定、放射免疫沉淀、酶联免疫吸附测定(ELISA)、斑点印迹试验、抑制或竞争试验、以及三明治试验(sandwichassays)(见美国专利4,376,110和4,486,530;也见抗体:实验室手册(Antibodies:A Laboratory Manual),同上)。
在以下的实施例5和6中提供了这些试验方法的代表性实施方案。简单地说,首先将TGF-β超家族的家族成员或TGF-β结合蛋白与固相支持物结合,随后加入候选分子。然后,向该测试试验中加入标记的TGF-β超家族的家族成员或TGF-β结合蛋白,洗涤固相支持物,并测定该固体支持物上结合的或标记的TGF-β超家族成员或TGF-β结合蛋白的量。本文所描述的适用于增加骨矿质含量的分子是那些以统计学上显著的方 式降低TGF-β结合蛋白与TGF-β超家族的一个或多个成员结合的分子。明显地,在本发明中适用的试验方法应不限于实施例2和3中所描述的实施方案。尤其是,可以改变许多参数,例如通过TGF-β与固相支持物的结合,或完全去除固相等方式来改变。
在本发明的其它方面,提供用于确定所选分子是否能够增加骨矿质含量的方法,包括步骤:(a)将所选分子暴露于表达TGF-β的细胞,和(b)测定所述暴露细胞的TGF-β活性是否发生改变,并由此确定该化合物是否具有增加骨矿质含量的能力。与上述方法相同,可以利用多种方法来评价由于所选测试化合物导致的TGF-β结合蛋白表达的改变。
例如,在本发明的一个方面,提供确定所选分子是否能够增加骨矿质含量的方法,包括步骤:(a)将所选分子与TGF-β结合蛋白和TGF-β蛋白质家族的一个选定成员混合,(b)测定该所选分子是否上调了TGF-β蛋白质家族的信号转导、或抑制了TGF-β结合蛋白与TGF-β蛋白质家族的结合。在某些实施方案中,该分子增强TGF-β作为间充质细胞(mechemchymal cell)分化的正调节物起作用的能力。
与上述方法相同,可以利用许多种方法来评价由于所选测试化合物引起的TGF-β刺激作用。以下实施例6中提供了一个这样的代表性方法(也见Durham等,Endo.136:1374-1380)。
在本发明的再其它方面,提供确定所选分子是否能增加骨矿质含量的方法,包括步骤:测定所选分子是否抑制TGF-β结合蛋白与骨或其类似物的结合。如本文中所用的,应当理解骨或其类似物是指羟基磷灰石、或由粉状形式的骨、压碎的骨或完整的骨构成的表面。与上述方法相同,可以利用许多种方法来评价对TGF-β结合蛋白定位到骨基质的抑制。以下实施例7中提供了一个这样的代表性方法。
应当指出的是,尽管本文列举的这些方法可以指对单一测试分子的分析,但本发明并不应由此受到限制。尤其是,所选分子可以包含在化合物的混合物中。因此,所列举的方法可以进一步包含步骤:分离抑制TGF-β结合蛋白与TGF-β家族成员结合的分子。
候选分子
对许多种分子都可以测试其抑制TGF-β结合蛋白与TGF-β家族成员结合的能力。代表性例子包括有机分子、蛋白质或肽、和核酸分子,以下将作更为详细的讨论。尽管从以下讨论来看,明显地本文所述候选分子可以用于本文所述的测定,但也应易于明了这些分子还可以用于各种诊断和治疗应用。
1.有机分子
对于许多有机分子都可以测定其抑制TGF-β结合蛋白与TGF-β家族成员结合的能力。
例如,在本发明的一个实施方案中,合适的有机分子选自化学制品库(chemical library),其中对化学制品作单独测定,或选自组合化学制品库,其中对多个化合物同时进行测定,然后展开以确定和分离具有最高活性的化合物。
这些组合化学制品库的典型例子包括由如下文献描述的组合化学制品库:Agrafiotis等,“自动产生具有期望性质的化学化合物的系统和方法(System and method of automatically generating chemical compoundswith desired properties)”,美国专利5,463,564;Armstrong,R.W.,“通过应用多成分组合阵列合成法合成有机化合物组合阵列(Synthesisof combinatorial arrays of organic compounds through the use ofmultiple component combinatorial array syntheses)”,WO95/02566;Baldwin,J.J.等,“磺胺衍生物和其应用”,WO 95/24186;Baldwin,J.J.等,“组合二氢苯并吡喃库(combinatorial dihydrobenzopyranlibrary)”,WO 95/30642;Brenner,S.,“用于制备组合库的新试剂盒”,WO 95/16918;Chenera,B.等,“树脂结合的芳香族碳环化合物的文库制备”,WO 95/16712;Ellman,J.A.,“在固体支持物上固相和组合合成苯(并)二氮
类化合物库”,美国专利5,288,514;Felder,E.等,“新组合化合物文库”,WO 95/16209;Lerner,R.等,“编码的组合化学文库”,WO 93/20242;Pavia,M.R.等,“从结构上各异的通用文库制备和筛选药物学上有用的非肽化合物的一种方法”,WO 95/04277;Summerton,J.E. 和D.D.Weller,“吗啉代-亚基组合文库和方法”,美国专利5,506,337;Holmes,C.,“用于固相合成thiazolidinones、matathiazanones和它们的衍生物的方法”,WO 96/00148;Phillips,G.B.和G.P.Wei,“固相合成苯并咪唑”,Tet.Letters 37:4887-90,1996;Ruhland,B.等,“结构各异的β内酰胺的固体支持组合合成”,美国化学学会杂志(J.Amer.Chem.Soc.)111:253-4,1996;Look,G.C.等,“从4-噻唑烷组合文库中鉴定环加氧酶-1的抑制物”,Bioorg and Med.Chem.Letters 6:707-12,1996。
2.蛋白质和肽
广泛的蛋白质和肽同样可以用作TGF-β结合蛋白与TGF-β家族成员结合的抑制物候选分子。
a.组合肽文库
可以通过组合肽文库的筛选获得可能是TGF-β结合蛋白与TGF-β家族成员结合的抑制物的肽分子。这些文库可以由本领域技术人员制备(见例如美国专利4,528,266和4,359,535以及专利合作条约公开文本WO 92/15679、WO 92/15677、WO 90/07862、WO 90/02809)或从商业途径购买(例如New England Biolabs Ph.D.TM噬菌体展示肽文库试剂盒)。
b.抗体
考虑到本文提供的此公开,可以容易地制备抑制TGF-β结合蛋白与TGF-β家族成员结合的抗体。在本发明范围内,抗体被理解为包括单克隆抗体、多克隆抗体、抗独特型抗体、抗体片段(例如Fab和F(ab’)2、Fv可变区、或互补决定区)。正如以上所讨论的,如果抗体以大于或等于107M-1,优选大于或等于108M-1的Ka与TGF-β结合蛋白或特定的TGF-β家族成员结合,而不与或以小于或等于106M-1的Ka与其它的TGF-β结合蛋白结合,则该抗体被理解为是特异针对TGF-β结合蛋白或特定的TGF-β家族成员的。而且,本发明的抗体应当阻断或抑制TGF-β结合蛋白与TGF-β家族成员的结合。
本领域普通技术人员可以容易地确定单克隆抗体或结合伴侣 (partner)的亲和力,以及结合的抑制(见Scatchard,Ann.N.Y.Acad.Sci.51:660-672,1949)。
简单地说,本领域普通技术人员可以容易地从各种恒温动物例如马、奶牛、各种家禽、兔、小鼠或大鼠产生多克隆抗体。典型地,使用TGF-β结合蛋白或其13-20个氨基酸的独特肽(优选通过使用戊二醛形成的交联与匙孔血蓝蛋白偶联),联合佐剂例如Freund完全或不完全佐剂一起,通过腹膜内、肌肉内、眼内、或皮下注射免疫动物。几次加强免疫后,收集血清样品并检测其对所述蛋白质或肽的反应性。尤其优选的多克隆抗血清将在一个这些试验中给出至少高于背景三倍的信号。依据动物对蛋白质的反应性,一旦动物的效价达到平台,则通过每周给动物放血或抽血可以容易地获得更大量的抗血清。
单克隆抗体还可以容易地采用常规技术产生(见以参考文献方式并入本文的美国专利RE 32,011、4,902,614、4,543,439和4,411,993;也见单克隆抗体,杂交瘤:生物学分析中的一个方面(MonoclonalAntibodies,Hybridomas:A New Dimension in BiologicalAnalyses),Plenum出版社,Kennett,McKearn和Bechtol(编),1980;和抗体:实验室手册(Antibodies:A Laboratoty Manual),Harlow和Lane(编),Cold Spring Harbor Laboratory出版,1988,该文献也以参考文献方式并入本文)。
简单地说,在一个实施方案中,按以上描述,用TGF-β结合蛋白或其部分免疫受试动物例如大鼠或小鼠。为了增强最终所获的免疫应答,可以将该蛋白与佐剂例如Freund完全或不完全佐剂混合。在最初免疫后的一至三周之间,可以再用一次加强免疫对动物进行再免疫,并使用以上描述的试验检测其对蛋白质的反应性。一旦动物对注射蛋白质的反应性达到平台,即可将其处死,并收获含有大量B细胞的器官例如脾和淋巴结。
从被免疫动物获得的细胞可以通过病毒例如埃-巴二氏病毒(EBV)感染而永生化(见Glasky和Reading,杂交瘤(Hybridoma)8(4):377-389,1989)。或者,在一个优选的实施方案中,为了产生分泌单克隆抗体的“杂 交瘤”,将收获的脾和/或淋巴结细胞悬浮物与合适的骨髓瘤细胞融合。合适的骨髓瘤系包括例如NS-1(ATCC TIB 18)和P3X63-Ag 8.653(ATCCCRL 1580)。
在融合后,可以将细胞置于含有合适培养基例如RPMI 1640或DMEM(Dulbecoo氏修改的Eagles培养基)(JRH Biosciences,Lenexa,Kansas)以及添加成分例如胎牛血清(即FBS,来自Hyclone,Logan,Utah,或JRH Biosciences)的培养板中。此外,该培养基应含有选择性地允许脾和骨髓瘤融合细胞生长的试剂例如HAT(次黄嘌呤、氨基喋呤和胸苷)(Sigma Chemical公司,St.Louis,Missouri)。在大约7天后,可以对所获的融合细胞或杂交瘤进行筛选,以确定抗TGF-β结合蛋白(取决于所用抗原),并阻断或抑制TGF-β结合蛋白与TGF-β家族成员结合的抗体的存在。
有许多种试验可以用以确定抗本发明蛋白质的抗体的存在,包括例如对流免疫电泳、放射免疫测定、放射免疫沉淀、酶联免疫吸附测定(ELISA)、斑点印迹试验、Western印迹、免疫沉淀、抑制或竞争试验、以及三明治试验(见例如美国专利4,376,110和4,486,530;也见抗体:实验室手册(Antibodies:A Laboratory Manual),Harlow和Lane(编),Cold Spring Harbor Laboratory出版,1988)。几次克隆稀释和再次试验之后,可以分离产生抗目的蛋白质抗体的杂交瘤。
也可以使用其它技术构建单克隆抗体(见William D.Huse等,“在λ噬菌体中产生具有免疫球蛋白谱的大型组合文库”,科学(Science)246:1275-1281,1989年12月;也见L.Sastry等,“在大肠杆菌中克隆免疫球蛋白的所有组成成分以产生单克隆催化抗体:重链可变区特异性cDNA文库的构建”,美国国家科学院院刊86:5728-5732,1989年8月;还见Michelle Alting-Mees等,“单克隆表达文库:杂交瘤的一种快速替代法”,分子生物学策略(Strategies in Molecular Biology)3:1-9,1990年1月)。这些文献描述了可从Stratagene(La Jolla,California)获得的一个商业系统,该商业系统能够通过重组技术产生抗体。简单地说,从B细胞群体分离mRNA,用以在λImmunoZap(H)和λ ImmunoZap(L)载体中构建重链和轻链免疫球蛋白cDNA表达文库。这些载体可以单独进行筛选,也可以共表达以形成Fab片段或抗体(见Huse等,同上;也见Sastry等,同上)。随后可以将阳性噬菌斑转变成允许从大肠杆菌高水平表达单克隆片段的非裂解性质粒。
同样,也可以采用常规酶消化,或重组DNA技术以插入编码特异结合抗体的基因的可变区,构建抗体的部分或片段例如Fab和Fv片段。在一个实施方案中,使用针对可变区的核苷酸引物从产生目的单克隆抗体的杂交瘤扩增编码可变区的基因。这些引物可以由本领域普通技术人员合成,或可以从商业途径购买。Stratagene(La Jolla,California)出售针对小鼠和人可变区的引物,包括尤其是针对VHa、VHb、VHc、VHd、CHl、VL和CL区的引物。可以使用这些引物扩增重链或轻链可变区,然后可以将其分别插入载体例如ImmunoZAPTM H或ImmunoZAPTM L(Stratagene)。之后这些载体可以被导入基于大肠杆菌、酵母或哺乳动物的系统中进行表达。使用这些技术,可以产生大量含有融合的VH和VL域的单链蛋白质(见Bird等,科学242:423-426,1988)。此外,可以使用这些技术在不改变抗体结合特异性的情况下,将“鼠”抗体改变成“人”抗体。
一旦获得合适的抗体,即可以通过本领域普通技术人员熟知的许多技术对其进行分离或纯化(见抗体:实验室手册,Harlow和Lane(编),ColdSpring Harbor Laboratory出版社,1988)。合适的技术包括肽或蛋白质亲和柱、HPLC或RP-HPLC、在A蛋白或G蛋白柱上纯化、或任何这些技术的组合。
c.突变的TGF-β结合蛋白
正如本文和如下实施例(例如实施例8和9)中所描述的,与天然TGF-β结合蛋白阻断特定TGF-β家族成员活性的能力竞争的TGF-β结合蛋白修改版本应该会导致骨密度的增加。因此,结合TGF-β家族成员但不抑制该TGF-β家族成员功能的TGF-β结合蛋白突变体将符合此标准。该突变版本必须有效地与TGF-β结合蛋白的内源性抑制功能相竞争。
d.蛋白质的产生
尽管本文已提供了各种基因(或其部分),但应该理解,在本发明的 范围内,对一或多个这些基因的提及包括与这些基因基本相同的这些基因的衍生物(以及,如果合适的话,包括由这些基因和它们的衍生物编码的蛋白质(包括肽和多肽))。正如本文所用的,如果(a)一个核苷酸序列来源于上述基因的编码区并包括例如该序列的若干部分或以上所讨论序列的等位基因变异,或者编码抑制TGF-β结合蛋白与TGF-β家族成员结合的分子,(b)核苷酸序列能够与本发明的核苷酸序列在中、高或极高的严紧条件下杂交(见Sambrook等,分子克隆:实验室手册(MolecularCloning:A Laboratory Mannual),第2版,Cold Spring HarborLaboratory出版社,纽约,1989),或(c)由于遗传密码子的原因,DNA序列与(a)或(b)中所定义的DNA序列是简并的,则该核苷酸序列被认为是“基本相同的”。而且,本文公开的核酸分子包括互补和非互补序列,前提是该序列在其它方面符合本文提出的标准。在本发明的范围内,高严紧性是指标准杂交条件(例如,5×SSPE,0.5%SDS,65℃,或相当的条件)。
使用例如P/C Gene或Intelligenetics软件包(Intelligenetics,Mountain View,California)的疏水性绘图功能,或根据Kyte和Doolittle(分子生物学杂志(J.Mol.Biol.)157:105-132,1982)描述的方法,本文所述核酸分子编码的蛋白质的结构可以从一级翻译产物预测。
本发明蛋白质可以以酸式盐或碱式盐的形式,或以中性形式制备。此外,单个氨基酸残基可以通过氧化或还原进行修饰。而且,可以在氨基酸和核酸序列上进行各种替代、缺失或添加,其净效应是保持或进一步增强或降低突变或野生型蛋白的生物学活性。而且,例如由于遗传密码子的简并性,在编码相同氨基酸序列的核苷酸序列中,可以有相当多的变异。
本文公开的蛋白质的其它衍生物包括该蛋白质与其它蛋白质或多肽的结合物。这可以通过例如合成其加入可能有利于蛋白质纯化或鉴定的N-端或C-端融合蛋白来实现(见美国专利4,851,341;也见Hopp等,Bio/Technology 6:1204,1988)。或者,可以构建诸如Flag/TGF-β结合 蛋白的融合蛋白,以有助于该蛋白质的鉴定、表达和分析。
本发明蛋白质可以采用本文所述的多种技术构建。而且,可以通过合成含有突变序列的寡核苷酸在特定位置引入突变,而且该寡核苷酸的两侧具有限制性位点,使得其能够与该天然序列片段连接。连接之后,所获的重组序列编码具有期望的氨基酸插入、替换或缺失的衍生物。
或者,可以使用寡核苷酸指导的位点特异性(或片段特异性)诱变程序,提供根据要求的替换、缺失或插入改变了特定密码子的改变基因。进行如上所述改变的示例性方法公开于Walder等(基因42:133,1986);Bauer等(基因37:73,1985);Craik(BioTechniques,1985年1月,12-19);Smith等(遗传工程:原理和方法(Genetic Engineering:Principles and Methods),Plenum出版社,1981);和Sambrook等(同上)。还可以通过使用与所期望缺失相邻的方便限制性内切核酸酶位点,构建缺失或截短的蛋白质衍生物(例如可溶性细胞外部分)。在限制性消化后,可以补平突出端、然后重新连接该DNA。进行如上所述改变的典型方法公开于Sambrook等(分子克隆:实验室指南,第2版,Cold SpringHarbor Laboratory出版社,1989)。
在本发明核酸分子中产生的突变优选保持编码序列的阅读框。而且这些突变优选不形成能够杂交产生mRNA二级结构例如环或发夹结构的互补区,这些二级结构将对mRNA的翻译产生不利影响。尽管可以预先决定突变位点,但并不必预先决定突变本身的性质。例如,为了筛选在指定位点具有最佳特性的突变,可以在靶密码子处进行随机诱变,然后筛选具有指明生物学活性的表达突变体。或者,可以通过合成如下寡核苷酸在特定位置引入突变,该寡核苷酸含有突变序列,而且两翼具有使其能够与该天然序列的片段连接的限制性位点。连接后,所获的重组序列编码具有期望的氨基酸插入、替换或缺失的衍生物。
也可以采用PCR诱变技术、化学诱变技术(Drinkwater和Klinedinst,PNAS 83:3402-3406,1986)、强制核苷酸错误掺入(forced nucleotidemisincorportation)(例如Liao和Wise基因88:107-111,1990)、或使用随机诱变处理的寡核苷酸(Horwitz等,基因组(Genome)3:112-117, 1989)来构建编码本发明蛋白质的核酸分子。
本发明还提供通过培养含有能表达上述基因的载体的宿主细胞对上述基因进行的操作和表达。这些载体或载体结构包括合成的或cDNA来源的,可操作地与合适的转录或翻译调节元件连接的,编码目的蛋白质的核酸分子。合适的调节元件可以从各种来源获得,包括细菌、真菌、病毒、哺乳动物、昆虫或植物基因。适合调节元件的选择取决于所选择的宿主细胞,而且可以容易地由本领域普通技术人员完成。调节元件的例子包括:转录启动子和增强子或RNA聚合酶结合序列、转录终止子、以及核糖体结合序列,包括翻译起始信号。
编码上述任一种蛋白质的核酸分子可以容易地由许多种原核和真核宿主细胞表达,这些宿主细胞包括细菌、哺乳动物、酵母或其它真菌、病毒、昆虫、或植物细胞。转化或转染这些细胞以表达外源DNA的方法是本领域所熟知的(见例如Itakura等,美国专利4,704,362;Hinnen等,美国国家科学院院刊75:1929-1933,1978;Murray等,美国专利4,801,542;Upshall等,美国专利4,935,349;Hagen等,美国专利4,784,950;Axel等,美国专利4,399,216;Goeddel等,美国专利4,766,075;和Sambrook等,分子克隆:实验室手册,第2版,Cold SpringHarbor Laboratory出版社,1989;对于植物细胞,见Czako和Marton,植物生理学(Plant Physiol.)104;1067-1071,1994;和Paszkowski等,生物技术(Biotech.)24:387-392,1992)。
适于实施本发明的细菌宿主细胞包括大肠杆菌(E.coli)、枯草芽孢杆菌(B.subtilis),鼠伤寒沙门氏杆菌(Salmonella typhimurium),和假单胞菌属(Pseudomonas)、链霉菌属(streptomyces)和葡萄球菌属(staphylococcus)的各个种,以及本领域普通技术人员熟知的许多其它细菌种。细菌宿主细胞的代表性例子包括DH5α(Stratagene,La Jolla,California)。
细菌表达载体优选含有在宿主细胞中起作用的启动子、一或多个表型选择标记、以及细菌复制原点。典型的启动子包括β-内酰胺酶(青霉素酶)和乳糖启动子系统(见Chang等,自然275:615,1978)、T7 RNA聚 合酶启动子(Studier等,酶学方法(Meth.Enzymol.)185:60-89,1990)、λ启动子(Elyin等,基因87:123-126,1990)、trp启动子(Nichols和Yanofsky,酶学方法101:155,1983)和tac启动子(Russell等,基因20:231,1982)。典型的选择标记包括各种抗生素抗性标记例如卡那霉素或氨苄青霉素抗性基因。适用于转化宿主细胞的许多质粒是本领域所熟知的,包括尤其是pBR322(见Bolivar等,基因2:95,1977),pUC质粒pUC18、pUC19、pUC118、pUC119(见Messing,酶学方法101:20-77,1983;和Vieira和Messing,基因19:259-268,1982),和pNH8A、pNH16a、pNH18a,以及Bluescript M13(Stratagene,La Jolla,California)。
适用于实施本发明的酵母和真菌宿主细胞包括尤其是Saccharomycespombe、酿酒酵母(Saccharomyces cerevisiae)、毕赤酵母属(Pichia)或克鲁维酵母菌属(kluyveromyces)、以及曲霉属(Aspergillus)的各个种(McKnight等,美国专利4,935,349)。对于酵母和真菌而言,适合的表达载体包括尤其是用于酵母的YCp50(ATCC 37419)、和amdS克隆载体pV3(Turnbull,Bio/Technology 7:169,1989)、YRp7(Struhl等,美国国家科学院院刊76:1035-1039,1978)、YEp13(Broach等,基因8:121-133,1979)、pJDB249和pJDB219(Beggs,自然275:104-108,1978),以及它们的衍生物。
用于酵母的优选启动子包括来自酵母糖酵解基因(Hitzeman等,生物化学杂志(J.Biol.Chem.)255:12073-12080,1980;Alber和Kawasaki,分子应用遗传学杂志(J.Mol.Appl.Genet.)1:419-434,1982)或醇脱氢酶基因(Young等,用于产生化学制品的微生物遗传工程(Genetic Engineering of Microorganisms for Chemicals),Hollaender等(编),第355页,Plenum,纽约,1982;Ammerer,酶学方法(Meth.Enzymol.)101:192-201,1983)的启动子。对于真菌载体有用的启动子的例子包括那些来源于构巢曲霉(Aspergillus nidulans)糖酵解基因的启动子,例如adh3启动子(McKnight等,EMBO J.4:2093-2099,1985)。该表达单元还可以包括转录终止子。适合的终止子的一个例子是adh3终止子(McKnight等,同上,1985)。
如同细菌载体一样,酵母载体一般也包括选择标记,其可以是表现显性表型的许多基因中的任意一种,条件是对于该显性表型存在一种能够筛选转化体的表型试验。优选的选择标记是那些补充宿主细胞的营养缺陷、提供抗生素抗性或使细胞能够利用特殊碳源的选择标记,包括leu2(Broach等,同上)、ura3(Botstein等,基因8:17,1979)或his3(Struhl等,同上)。另一个适合的选择标记是赋予酵母细胞氯霉素抗性的cat基因。
用于转化真菌的技术在文献中有很好的说明,见例如Beggs(同上)、Hinnen等(美国国家科学院院刊75:1929-1933,1978)、Yelton等(美国国家科学院院刊81:1740-1747,1984)和Russell(自然301:167-169,1983)。宿主细胞的基因型可以含有由表达载体上存在的选择标记弥补的遗传缺陷。对于具体宿主和选择标记的选择是本领域熟知的。
转化酵母的方法也是本领域普通技术人员所熟知的。例如,通过制备带有DNA的酵母原生质球(见Hinnen等,美国PNAS 75:1929,1978)或通过用碱式盐(alkaline salts)例如LiCl处理(见Itoh等,细菌学杂志(J.Bacteriology)153:163,1983),可以容易地实现转化。真菌转化还可以采用聚乙二醇按Cullen等描述的方法(Bio/Technology5:369,1987)进行。
病毒载体包括那些含有指导编码上述目的蛋白质的分离核酸分子表达的启动子的病毒载体。在本发明的范围中可以使用许多种启动子,包括例如诸如MoMLV LTR、RSV LTR、Friend MuLV LTR的启动子、腺病毒启动子(Ohno等,科学265:781-784,1994)、新霉素磷酸转移酶启动子/增强子、细小病毒晚期启动子(Koering等,人类基因治疗(Hum.GeneTherap.)5:457-463,1994)、疱疹TK启动子、SV40启动子、金属硫蛋白IIa基因增强子/启动子、巨细胞病毒的立即早期启动子、和巨细胞病毒的立即晚期启动子。在本发明尤其优选的实施方案中,该启动子是组织特异性启动子(见例如WO 91/02805;EP 0,415,731;和WO 90/07936)。适合的组织特异性启动子的代表性例子包括神经特异性烯醇化酶启动子、血小板来源的生长因子β的启动子、骨形态发生蛋白质启动子、人 α1-chimaerin启动子、突触蛋白I启动子和突触蛋白II启动子。除了上述启动子外,为了靶向病毒、细菌、真菌或寄生物感染的特定细胞或组织,还可以使用其它的病毒特异性启动子(例如逆转录病毒启动子,包括以上提到的逆转录病毒启动子以及其它启动子如HSV启动子),肝炎、疱疹(例如EBV)、和细菌、真菌或寄生物(例如疟疾)的特异性启动子。
适用于实施本发明的哺乳动物细胞包括尤其是COS、CHO、SaOS、骨肉瘤细胞、KS483、MG-63、原始成骨细胞、和人或哺乳动物的骨髓基质。用于实施本发明的哺乳动物表达载体包括能够指导克隆基因或cDNA转录的启动子。优选的启动子包括病毒启动子和细胞启动子。骨特异性启动子包括骨唾液酸蛋白(sialo-protein)和骨钙蛋白启动子。病毒启动子包括巨细胞病毒立即早期启动子(Boshart等,细胞(Cell)41:521-530,1985)、巨细胞病毒立即晚期启动子、SV40启动子(Subramani等,分子细胞生物学(Mol.Cell Biol.)1:854-864,1981)、MMTV LTR、RSV LTR、金属硫蛋白-1、腺病毒E1a。细胞启动子包括小鼠金属硫蛋白-1启动子(Palmiter等,美国专利4,579,821)、小鼠VK启动子(Bergman等,美国国家科学院院刊81:7041-7045,1983;Grant等,核酸研究15:5496,1987)和小鼠VH启动子(Loh等,细胞33:85-93,1983)。启动子的选择至少部分地取决于所期望的表达水平或待转染的受体细胞系。
这些表达载体还可以含有一套位于启动子下游以及编码目的肽或蛋白质的DNA序列上游的RNA拼接位点。优选的RNA拼接位点可以从腺病毒和/或免疫球蛋白基因获得。在该表达载体中还含有位于目的编码序列下游的聚腺苷酸化信号。适合的聚腺苷酸化信号包括SV40的早期或晚期聚腺苷酸化信号(Kaufman和Sharp,同上)、腺病毒5 E1B区的聚腺苷酸化信号和人生长激素基因终止子(DeNoto等,核酸研究9:3719-3730,1981)。该表达载体可以包括位于启动子和RNA拼接位点之间的非编码病毒前导序列,例如腺病毒2的三联前导序列。优选的载体还可以包括增强子序列例如SV40增强子。表达载体还可以包括编码腺病毒VA RNAs的序列。适合的表达载体可以从商业途径获得(例如Stratagene,La Jolla,California)。
含有克隆DNA的载体结构可以通过例如磷酸钙介导的转染(Wigler等,细胞14:725,1978;Corsaro和Pearson,体细胞遗传学(Somatic CellGenetics)7:603,1981;Graham和Van der Eb,病毒学(Virology)52:456,1973)、电穿孔(Neumann等,EMBO J.1:841-845,1982)或DEAE-葡聚糖介导的转染(Ausubel等(编)当代分子生物学实验指南(Current Protocols in Molecular Biology),John Wiley & Sons公司,纽约,1987)导入培养的哺乳动物细胞中。为了鉴定稳定整合了克隆DNA的细胞,一般将选择标记与目的基因或cDNA一起导入细胞。用于哺乳动物培养细胞的优选选择标记包括赋予药物例如新霉素、潮霉素和氨甲蝶呤抗性的基因。该选择标记可以是可扩增的选择标记。优选的可扩增选择标记是DHFR基因和新霉素抗性基因。选择标记的综述见Thilly(哺乳动物细胞技术(Mammalian Cell Technology),ButterworthPublishers,Stoneham,Massachusetts,该文献以参考文献形式并入本文)。
在开始表达目的DNA序列之前,使含有适合载体的哺乳动物细胞生长一段时间,典型地是1-2天。然后应用药物筛选选择以稳定方式表达选择标记的细胞的生长。对于可扩增选择标记转染的细胞,可以逐步增加药物浓度以选择增加的克隆序列拷贝数,由此选择增加的表达水平。选择和筛选以期望形式或以期望水平产生目的蛋白质的表达导入序列的细胞。然后可以克隆满足这些标准的细胞,并按比例放大用于生产。
用于转染哺乳动物细胞的操作是本领域普通技术人员所熟知的。典型的方法包括磷酸钙介导的转染、电穿孔、脂转染、逆转录病毒、腺病毒和原生质体融合介导的转染(见Sambrook等,同上)。裸载体结构也可以在注射至哺乳动物(或其它动物)的肌肉中后被肌细胞或其它适合的细胞摄取。
根据本说明书,本领域已知的许多昆虫宿主细胞也可以用于本发明。例如,Atkinson等(Pestic.Sci.28:215-224,1990)综述了杆状病毒作为在昆虫细胞中表达外源DNA序列的载体的应用。
根据本说明书,本领域已知的许多植物宿主细胞也可以用于本发明。 例如Sinkar等(J.Biosci.(Bangalore)11:47-58,1987)综述了毛根农杆菌(Agrobacterium rhizogenes)作为在植物细胞中表达基因的载体的应用。
在本发明的相关方面,可以在其生殖细胞和体细胞含有编码目的蛋白质的基因,而且该基因可操作地与对于该基因表达有效的启动子相连的转基因动物中,表达本发明的蛋白质。或者,以类似的方式,可以制备缺乏目的基因的转基因动物(例如,“基因敲除”小鼠)。可以在各种非人类动物,包括小鼠、大鼠、兔、绵羊、狗、山羊和猪中制备这样的转基因动物(见Hammer等,自然315:680-683,1985;Palmiter等,科学222:809-814,1983;Brinster等,美国国家科学院院刊82:4438-4442,1985;Palmiter和Brinster,细胞41:343-345,1985,和美国专利5,175,383、5,087,571、4,736,866、5,387,742、5,347,075、5,221,778和5,175,384)。简单地说,通过例如微注射,将包括待表达的核酸分子以及适合定位的表达控制序列的表达载体导入受精卵的原核中。注射DNA的整合通过组织样品DNA的印迹分析来检测。优选将导入的DNA并入动物的生殖系中,以便其可以被传递给该动物的后代。组织特异性表达可以通过使用组织特异性启动子,或通过使用允许转基因有调节地表达的诱导型启动子例如金属硫蛋白基因启动子(Palmiter等,1983,同上)来实现。
可以通过尤其是培养适合的宿主和载体系统产生本发明重组翻译产物,分离蛋白质。为了分离目的蛋白质,然后可以通过各种纯化程序,处理该细胞系的上清液,或者当蛋白质不分泌到上清液中时处理蛋白质包涵体或整个细胞。例如,首先可以采用商业上可获得的蛋白质浓缩滤器例如Amicon或Millipore Pellicon超滤装置,浓缩上清液。浓缩之后,可以将浓缩物加到适合的纯化基质例如与适合支持物结合的抗蛋白质抗体上。或者,可以使用阴离子或阳离子交换树脂来纯化蛋白质。作为再一种替代方法,可以使用一或多个反相高效液相色谱层析(RP-HPLC)步骤来进一步纯化该蛋白质。分离本发明蛋白质的其它方法是本领域技术人员所熟知的。
如果根据SDS-PAGE分析以及之后的考马斯亮兰染色,未检测到其它(非目的)蛋白质,则在本发明的范围中该蛋白质被认为是“分离的”。在其它实施方案中,该目的蛋白质可以是分离的,以致根据SDS-PAGE分析以及之后的银染检测不到其它(非目的)蛋白质。
3.核酸分子
在本发明的其它方面,提供能够抑制TGF-β结合蛋白与TGF-β家族成员结合的核酸分子。例如,在一个实施方案中,提供特异抑制TGF-β结合蛋白核酸序列表达的反义寡核苷酸分子(一般见,Hirashima等,RNA的分子生物学:新的前景(Molecular Biology of RNA:NewPerspectives)(M.Inouye和B.S.Dudock编,1987,Academic出版社,San Diego,第401页);寡核苷酸:基因表达的反义抑制物(Oligonucleotides:Antisense Inhibitors of Gene Expression)(J.S.Cohen编,1989,MacMillan出版社,伦敦);Stein和Cheng,科学261:1004-1012,1993;WO 95/10607;美国专利5,359,051;WO 92/06693;和EP-A2-612844)。简单地说,构建这些分子以使它们与转录的TGF-β结合蛋白mRNA序列的一个区域互补,并能够形成Watson-Crick碱基配对。所导致的双链核酸将干扰该mRNA的随后加工,由此阻止蛋白质的合成(见实施例10)。
在本发明的其它方面,提供能够抑制TGF-β结合蛋白结合TGF-β家族成员的核酶。本文所用的“核酶”旨在包括含有用于特异识别的反义序列和RNA切割酶活性的RNA分子。该催化链可以以高于化学计量的浓度切割靶RNA中的特异位点。许多种核酶可以用于本发明范围中,包括例如锤头核酶(如描绘于Forster和Symons,细胞48:211-220,1987;Haseloff和Gerlach,自然328:596-600,1988;Walbot和Bruening,自然334:196,1988;Haseloff和Gerlach,自然334:585,1988);发夹核酶(例如描述于Haseloff等,1993年10月19日公布的美国专利5,254,678;以及Hempel等,1990年3月26日出版的欧洲专利公开文本0 360 257);以及基于四膜虫(Tetrahymena)核糖体RNA的核酶(见 Cech等,美国专利4,987,071)。本发明核酶典型地由RNA构成,但也可以由DNA、核酸类似物(例如硫代磷酸酯)或它们的嵌合物(例如DNA/RNA/RNA)构成。
4.标记(labels)
上文和下文中描述的基因产物和所有的候选分子均可以用各种化合物标记,这些化合物包括例如荧光分子、毒素和放射性核素。荧光分子的典型例子包括荧光素、藻胆色素蛋白例如藻红蛋白、罗丹明、得克萨斯红和荧光素酶。毒素的典型例子包括蓖麻毒素、相思豆毒蛋白、白喉毒素、霍乱毒素、gelonin、美洲商陆抗病毒蛋白、tritin、志贺菌毒素和假单胞菌外毒素A。放射性核素的典型例子包括Cu-64、Ga-67、Ga-68、Zr-89、Ru-97、Tc-99m、Rh-105、Pd-109、In-111、I-123、I-125、I-131、Re-186、Re-188、Au-198、Au-199、Pb-203、At-211、Pb-212和Bi-212。此外,上述抗体也可以与配体结合对的一个配偶体标记或结合。代表性例子包括抗生物素蛋白-生物素和核黄素-核黄素结合蛋白。
用以上提及的代表性标记结合或标记本文所述分子的方法可以容易地由本领域普通技术人员完成(见单端孢菌毒素抗体偶联物,美国专利4,744,981;抗体偶联物,美国专利5,106,951;荧光物质和标记技术,美国专利4,018,884;用于诊断和治疗的金属放射性核素标记的蛋白质,美国专利4,897,255;和用于改良鏊合动力学的金属放射性核素鏊合的化合物,美国专利4,988,496;也见Inman,酶学方法(Methods inEnzymology)第34卷,亲和技术,酶纯化:B部分,Jakoby和Wilchek(编),Academic出版社,纽约,第30页,1974;也见Wilchek和Bayer,“生物分析应用中的抗生物素蛋白-生物素复合物”,分析生物化学(Anal.Biochem.)171:1-32,1988)。
药物组合物
如上所述,本发明还提供各种药物组合物,其含有一个抑制TGF-β结合蛋白结合TGF-β家族成员的上述分子,以及药物学上或生理上可接 受的载体、赋形剂或稀释剂。一般地,此载体在使用剂量和浓度时对于受体是无毒性的。通常,这些组合物的制备需要该治疗剂与如下物质合并:缓冲液、抗氧化剂例如抗坏血酸、低分子量(少于约10个残基)多肽、蛋白质、氨基酸、糖包括葡萄糖、蔗糖或葡聚糖、鏊合剂例如EDTA、谷胱甘肽、及其它稳定剂和赋形剂。中性缓冲盐或与非特异性血清白蛋白混合的盐是典型的适合稀释剂。
此外,可以制备用于各种不同途径给药的本发明药物组合物。而且,可以将本发明药物组合物和提供该药物组合物使用说明的包装材料一起置于容器中。一般地,该说明包括一个描述该药剂浓度的明确表述,以及在某些实施方案中,还包括对重新构成该药物组合物可能是必须的赋形剂成分或稀释剂(例如水、盐或PBS)的相对量的描述。
治疗方法
本发明还提供增加骨矿质含量和矿质密度的方法。简单地说,有许多病症会导致骨矿质含量的降低,包括例如疾病、遗传诱因、导致骨使用缺乏(例如由于骨折)的事故、导致骨吸收或杀死骨形成细胞的治疗、以及正常老化。通过使用抑制TGF-β结合蛋白与TGF-β家族成员结合的本文所述分子,可以治疗或预防这些病症。如本文所使用的,应当理解,如果在选定位置骨矿质含量以统计学显著的方式(例如超过一倍半的标准差)获得增加,则骨矿质含量增加了。
导致骨矿质含量降低的多种病症均可以使用本文所述分子治疗。患有这些病症的患者可以通过使用熟知技术(见例如Harrison氏内科医学原理(Harrison’s Principles of Internal Medicine),McGraw-Hill公司)进行临床诊断来识别。可以治疗的疾病的代表性例子包括其中存在骨的不正常生长或发育的发育异常。这些病症的代表性例子包括软骨发育不全、锁骨颅骨发育不良、内生软骨瘤病、纤维性结构不良、戈谢病、低磷佝偻病、Marfan病、遗传性多发性外生骨疣(multiple hereditaryexotoses)、多发性神经纤维瘤、成骨不全、骨硬化病、脆弱性骨硬化、硬化损害(sclerotic lesions)、骨折、牙周病、假关节和生脓性骨髓 炎(pyogenic oseomyelitis)。
其它可以治疗或预防的病症包括许多引起骨质减少(即,造成骨矿质含量或密度比青年时期的峰值骨骼矿质含量低一个以上标准差的病症)的原因。这些病症的代表性例子包括贫血状态、类固醇引起的疾病、肝素造成的疾病、骨髓疾病、坏血病、营养不良、钙缺乏症、特发性骨质疏松症、先天性骨质减少或骨质疏松症、醇中毒、慢性肝疾病、衰老、绝经后状态、月经稀发、闭经、妊娠、糖尿病、甲状腺功能亢进、库欣病、肢端肥大症、性腺功能减退症、不活动或废用(immobilization anddisuse)、反射交感性营养不良综合征、短暂性区域骨质疏松和骨软化。
在本发明的一个方面,可以通过给恒温动物施用治疗上有效量的抑制TGF-β结合蛋白与TGF-β家族成员结合的分子,来增加骨矿质含量或密度。可以治疗的恒温动物的例子包括脊椎动物和哺乳动物,包括例如马、奶牛、猪、绵羊、狗、猫、大鼠和小鼠。治疗分子的代表性例子包括核酶、核酶基因、反义寡核苷酸和抗体(例如人源化抗体)。
在本发明的其它方面,提供用于增加骨密度的方法,包括步骤:向返回骨的细胞导入指导抑制TGF-β结合蛋白结合TGF-β家族成员的分子表达的载体,并给恒温动物施用该含有载体的细胞。简单地说,返回骨的细胞可以直接从患者的骨(例如CD34+、成骨细胞、骨细胞等从骨髓获得的细胞)、外周血或培养物获得。
将指导抑制TGF-β结合蛋白与TGF-β家族成员结合的分子表达的载体导入细胞中。适合载体的典型例子包括病毒载体例如疱疹病毒载体(例如美国专利5,288,641)、腺病毒载体(例如WO 94/26914、WO 93/9191;Kolls等,PNAS 91(1):215-219,1994;Kass-Eisler等,PNAS90(24):11498-502,1993;Guzman等,血液循环(Circulation)88(6):2832-48,1993;Guzman等,Cir.Res.73(6):1202-1207,1993;Zabner等,细胞75(2):207-216,1993;Li等,人类基因治疗4(4):403-409,1993;Caillaud等,欧洲神经科学杂志(Eur.J.Neurosci.)5(10):1287-1291,1993;Vincent等,Nat.Genet.5(2):130-134,1993;Jaffe等,Nat.Genet.1(5):372-378,1992;和Levrero等,基因 101(2):195-202,1991)、腺伴随病毒载体(WO 95/13365;Flotte等,PNAS 90(22):10613-10617,1993)、杆状病毒载体、细小病毒载体(Koering等,人类基因治疗5:457-463,1994),痘病毒载体(Panicali和Paoletti,PNAS 79:4927-4931,1982;和Ozaki等,Biochem.Biophys.Res.Comm.193(2):653-660,1993)、和逆转录病毒(例如EP 0,415,731;WO90/07936;WO 91/0285;WO 94/03622;WO 93/25698;WO 93/25234;美国专利5,219,740;WO 93/11230;WO 93/10218)。同样可以构建含有混合的不同病毒或非病毒来源的不同元件(例如启动子、包膜序列(envelope sequence)等)的病毒载体。在各种实施方案中,病毒载体本身或含有病毒载体的病毒颗粒均可以用于以下描述的方法和组合物中。
在本发明的其它实施方案中,可以通过各种技术施用编码抑制TGF-β结合蛋白与TGF-β家族成员结合的分子的核酸分子本身,这些技术包括例如施用与聚L-赖氨酸DNA复合物偶联的脱唾液酸血清类粘蛋白(ASOR)(Cristano等,PNAS 92122-92126,1993)、与灭活腺病毒相连的DNA(Curiel等,人类基因治疗3(2):147-154,1992);细胞转染剂介导的导入(DMRIE-DOPE,Vical,California);直接DNA注射(Acsadi等,自然352:815-818,1991);DNA配体(Wu等,生物化学杂志(J.Biol.Chem.)246:16985-16987,1989);脂转染(Felgner等,美国国家科学院院刊84:7413-7417,1989);脂质体(Pickering等,Circ.89(1):13-21,1994;和Wang等,PNAS 84:7851-7855,1987);微粒轰击(Williams等,PNAS 88:2726-2730,1991);和单独(Vile和Hart,癌症研究(CancerRes.)53:3860-3864,1993)或利用PEG-核酸复合物直接递送编码该蛋白质的核酸分子本身。
可以由本发明载体表达的分子的代表性例子包括核酶和反义分子,它们每一种均已在上文中作了更为详细的讨论。
可以直接通过使用X射线(例如双能X射线吸收测量术,或“DEXA”),或通过从骨更新标志(成骨细胞特异性碱性磷酸酶、骨钙蛋白、I型原胶C’原前肽(PICP)、和总的碱性磷酸酶;见Comier,C.,Curr.Opin.in Rheu.7:243,1995)或骨吸收标志(吡啶啉、脱氧吡啶啉、N-端肽、尿羟脯氨 酸、血浆酒石酸(tartate)抗性酸性磷酸酶和半乳糖基羟赖氨酸;见Comier,同上)进行的推导,确定骨矿质含量的增加。还可以从体重或利用其它方法(见Guinness-Hey,Metab.Bone Dis.and Rel.Res.5:177-181,1984)计算骨质的量。
正如本领域技术人员所明了的,给药的量和频率当然将取决于诸如所治疗的指征的性质和严重程度、期望的反应、患者的情况等等因素。典型地,本发明组合物可以通过以上提及的各种技术来施用。
我们提供以下实施例作为说明,而非限制。
实施例10
反义介导的Beer失活
以重叠形式制备具有17个核苷酸的反义寡核苷酸,方式是第一个寡核苷酸的5’末端与Beer转录本的翻译起始AUG重叠,然后相继的寡核苷酸的5’末端在相对Beer AUG的5’方向上前移5个核苷酸(一直到50个核苷酸之外)。使用了相同的碱基组成设计和制备相应的对照寡核苷酸,但其序列被重新分布以抑制其与编码mRNA的任何有效杂交。通过阳离子脂质递送(P.L.Felgner,美国国家科学院院刊84:7413,1987),将试剂递送至测试细胞系统中。在100ul减少血清培养基(Opti-MEM 1减少血清培养基;Life Technologies,Gaithersburg MD)中加入2ug反义寡核苷酸,并将其与(6ul)脂转染试剂(Lipofectin reagent)(LifeTechnologies,Gaithersburg MD)在此100ul减少血清培养基中混合。混合这些物质,室温下30分钟使其形成复合物,并将该混合物加到预先接种的MC3T3E21或KS483细胞中。培养这些细胞,并回收mRNA。使用RT-PCR以及Beer特异性引物监测Beer的mRNA。此外,将分开的实验孔收集起来,并通过实施例4所述的Western印迹方法鉴定蛋白质的水平。收获细胞,将其重悬在裂解缓冲液(50mM Tris pH 7.5,20mM NaCl,1mM EDTA,1%SDS)中,并收集可溶性蛋白质。将该物质加到10-20%的梯度变性SDS PAGE上。把分离的蛋白质转移至硝酸纤维素膜上并按以上所述使用抗体试剂进行Western印迹。平行地,向同样的培养物加入对照寡核苷酸,并重复实验操作。如果使用反义寡核苷酸进行的该处理与拼凑的对照寡核苷酸相比导致mRNA或蛋白质水平50%的变化,则Beer mRNA或蛋白质水平的降低被认为是有意义的。该方法使得能够选择性地失活基因以及在随后的组织培养模型中出现矿化结表型特征。
序列
SEQ ID No.1:人Beer cDNA(完整编码区加5′和3′UTRs)
SEQ ID No.2:人BEER蛋白质(全序列)
SEQ ID No.3:含有硬化性狭窄无义突变的人Beer cDNA
SEQ ID No.4:从硬化性狭窄(Scleroeteosis)获得的截短人Beer蛋白质
SEQ ID No.5:编码蛋白质变体的人Beer cDNA(V10I)
SEQ ID No.6:人Beer蛋白质变体(V10I)
SEQ ID No.7:编码蛋白质变体的人Beer cDNA(P38R)
SEQ ID No.8:人Beer蛋白质变体(p38R)
SEQ ID No.9:Vervet Beer cDNA(完整编码区)
SEQ ID No.10:Vervet Beer蛋白质(全序列)
SEQ ID No.11:小鼠Beer cDNA(仅有编码区)
SEQ ID No.12:小鼠Beer蛋白质(全序列)
SEQ ID No.13:大鼠Beer cDNA(完整编码区加上5′UTR)
SEQ ID No.14:大鼠Beer蛋白质(全序列)
SEQ ID No.15:牛Beer cDNA(部份编码序列)
SEQ ID No.16:牛Beer蛋白质(部分序列—缺信号序列和末尾的6个残基)
SEQ ID No.17:用以制备小鼠Beer转基因的Mlul-Avill限制性片段
SEQ ID No.18:人Beer基因组序列(该基因有2个外显子,位于第161-427位和第3186-5219位)
从前面的描述,应该理解,尽管为了说明的目的本文描述了本发明的具体实施方案,但可以进行各种修改而不偏离本发明的精神和范畴。因此,本发明仅受附及权利要求的限制。
序列表
<110>Brunkow,Mary E.
Galas,David J.
Kovacevich,Brian
Mulligan,John T.
Paeper,Bryan W.
Van Ness,Jeffrey
Winkler,David G.
<120>增加骨矿化的组合物和方法
<130>240083.508
<140>US
<141>1999-11-24
<160>41
<170>FastSEQ for Windows Version 3.0
<210>1
<211>2301
<212>DNA
<213>人(Homo sapien)
<400>1
agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac 60
tggccctgtg tctcgtctgc ctgctggtac acacagcctt ccgtgtagtg gagggccagg 120
ggtggcaggc gttcaagaat gatgccacgg aaatcatccc cgagctcgga gagtaccccg 180
agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc 240
ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact 300
tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt 360
gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt 420
ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc 480
agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt 540
gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg 600
aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca 660
accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc 720
gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat 780
atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga 840
atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg 900
gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct 960
ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta 1020
agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc 1080
cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg 1140
caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac 1200
tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa 1260
taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg 1320
cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc 1380
caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa 1440
caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac 1500
tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac 1560
ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt 1620
ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg 1680
acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg 1740
ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga 1800
caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc 1860
tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt 1920
gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa 1980
aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt 2040
tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc 2100
ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat 2160
atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt 2220
aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag 2280
acaatgaatc atgaccgaaa g 2301
<210>2
<211>213
<212>PRT
<213>人
<400>2
Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr
1 5 10 15
Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp
20 25 30
Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro
35 40 45
Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg
50 55 60
Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys
65 70 75 80
Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser
85 90 95
Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala
100 105 110
Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser
115 120 125
Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val
130 135 140
Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg
145 150 155 160
Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln
165 170 175
Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly
180 185 190
Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu
195 200 205
Leu Glu Asn Ala Tyr
210
<210>3
<211>2301
<212>DNA
<213>人
<400>3
agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac 60
tggccctgtg tctcgtctgc ctgctggtac acacagcctt ccgtgtagtg gagggctagg 120
ggtggcaggc gttcaagaat gatgccacgg aaatcatccc cgagctcgga gagtaccccg 180
agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc 240
ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact 300
tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt 360
gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt 420
ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc 480
agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt 540
gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg 600
aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca 660
accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc 720
gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat 780
atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga 840
atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg 900
gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct 960
ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta 1020
agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc 1080
cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg 1140
caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac 1200
tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa 1260
taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg 1320
cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc 1380
caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa 1440
caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac 1500
tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac 1560
ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt 1620
ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg 1680
acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg 1740
ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga 1800
caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc 1860
tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt 1920
gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa 1980
aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt 2040
tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc 2100
ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat 2160
atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt 2220
aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag 2280
acaatgaatc atgaccgaaa g 2301
<210>4
<211>23
<212>PRT
<213>人
<400>4
Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr
1 5 10 15
Ala Phe Arg Val Val Glu Gly
20
<210>5
<211>2301
<212>DNA
<213>人
<400>5
agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac 60
tggccctgtg tctcatctgc ctgctggtac acacagcctt ccgtgtagtg gagggccagg 120
ggtggcaggc gttcaagaat gatgccacgg aaatcatccg cgagctcgga gagtaccccg 180
agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc 240
ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact 300
tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt 360
gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt 420
ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc 480
agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt 540
gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg 600
aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca 660
accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc 720
gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat 780
atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga 840
atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg 900
gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct 960
ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta 1020
agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc 1080
cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg 1140
caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac 1200
tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa 1260
taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg 1320
cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc 1380
caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa 1440
caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac 1500
tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac 1560
ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt 1620
ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg 1680
acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg 1740
ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga 1800
caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc 1860
tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt 1920
gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa 1980
aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt 2040
tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc 2100
ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat 2160
atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt 2220
aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag 2280
acaatgaatc atgaccgaaa g 2301
<210>6
<211>213
<212>PRT
<213>人
<400>6
Met Gln Leu Pro Leu Ala Leu Cys Leu Ile Cys Leu Leu Val His Thr
1 5 10 15
Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp
20 25 30
Ala Thr Glu Ile Ile Arg Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro
35 40 45
Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg
50 55 60
Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys
65 70 75 80
Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser
85 90 95
Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala
100 105 110
Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser
115 120 125
Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val
130 135 140
Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg
145 150 155 160
Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln
165 170 175
Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly
180 185 190
Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu
195 200 205
Leu Glu Asn Ala Tyr
210
<210>7
<211>2301
<212>DNA
<213>人
<400>7
agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac 60
tggccctgtg tctcgtctgc ctgctggtac acacagcctt ccgtgtagtg gagggccagg 120
ggtggcaggc gttcaagaat gatgccacgg aaatcatccg cgagctcgga gagtaccccg 180
agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc 240
ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact 300
tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt 360
gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt 420
ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc 480
agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt 540
gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg 600
aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca 660
accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc 720
gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat 780
atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga 840
atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg 900
gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct 960
ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta 1020
agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc 1080
cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg 1140
caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac 1200
tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa 1260
taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg 1320
cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc 1380
caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa 1440
caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac 1500
tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac 1560
ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt 1620
ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg 1680
acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg 1740
ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga 1800
caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc 1860
tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt 1920
gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa 1980
aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt 2040
tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc 2100
ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat 2160
atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt 2220
aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag 2280
acaatgaatc atgaccgaaa g 2301
<210>8
<211>213
<212>PRT
<213>人
<400>8
Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr
1 5 10 15
Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp
20 25 30
Ala Thr Glu Ile Ile Arg Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro
35 40 45
Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg
50 55 60
Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys
65 70 75 80
Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser
85 90 95
Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala
100 105 110
Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser
115 120 125
Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val
130 135 140
Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg
145 150 155 160
Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln
165 170 175
Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly
180 185 190
Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu
195 200 205
Leu Glu Asn Ala Tyr
210
<210>9
<211>642
<212>DNA
<213>Cercopithecus pygerythrus
<400>9
atgcagctcc cactggccct gtgtcttgtc tgcctgctgg tacacgcagc cttccgtgta 60
gtggagggcc aggggtggca ggccttcaag aatgatgcca cggaaatcat ccccgagctc 120
ggagagtacc ccgagcctcc accggagctg gagaacaaca agaccatgaa ccgggcggag 180
aatggagggc ggcctcccca ccaccccttt gagaccaaag acgtgtccga gtacagctgc 240
cgagagctgc acttcacccg ctacgtgacc gatgggccgt gccgcagcgc caagccagtc 300
accgagttgg tgtgctccgg ccagtgcggc ccggcacgcc tgctgcccaa cgccatcggc 360
cgcggcaagt ggtggcgccc gagtgggccc gacttccgct gcatccccga ccgctaccgc 420
gcgcagcgtg tgcagctgct gtgtcccggt ggtgccgcgc cgcgcgcgcg caaggtgcgc 480
ctggtggcct cgtgcaagtg caagcgcctc acccgcttcc acaaccagtc ggagctcaag 540
gacttcggtc ccgaggccgc tcggccgcag aagggccgga agccgcggcc ccgcgcccgg 600
ggggccaaag ccaatcaggc cgagctggag aacgcctact ag 642
<210>10
<211>213
<212>PRT
<213>Cercopithecus pygerythrus
<400>10
Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Ala
1 5 10 15
Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp
20 25 30
Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro
35 40 45
Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg
50 55 60
Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys
65 70 75 80
Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser
85 90 95
Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala
100 105 110
Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser
115 120 125
Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val
130 135 140
Gln Leu Leu Cys Pro Gly Gly Ala Ala Pro Arg Ala Arg Lys Val Arg
145 150 155 160
Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln
165 170 175
Ser Glu Leu Lys Asp Phe Gly Pro Glu Ala Ala Arg Pro Gln Lys Gly
180 185 190
Arg Lys Pro Arg Pro Arg Ala Arg Gly Ala Lys Ala Asn Gln Ala Glu
195 200 205
Leu Glu Asn Ala Tyr
210
<210>11
<211>638
<212>DNA
<213>台湾鼷鼠(Mus musulus)
<400>11
atgcagccct cactagcccc gtgcctcatc tgcctacttg tgcacgctgc cttctgtgct 60
gtggagggcc aggggtggca agccttcagg aatgatgcca cagaggtcat cccagggctt 120
ggagagtacc ccgagcctcc tcctgagaac aaccagacca tgaaccgggc ggagaatgga 180
ggcagacctc cccaccatcc ctatgacgcc aaaggtgtgt ccgagtacag ctgccgcgag 240
ctgcactaca cccgcttcct gacagacggc ccatgccgca gcgccaagcc ggtcaccgag 300
ttggtgtgct ccggccagtg cggccccgcg cggctgctgc ccaacgccat cgggcgcgtg 360
aagtggtggc gcccgaacgg accggatttc cgctgcatcc cggatcgcta ccgcgcgcag 420
cgggtgcagc tgctgtgccc cgggggcgcg gcgccgcgct cgcgcaaggt gcgtctggtg 480
gcctcgtgca agtgcaagcg cctcacccgc ttccacaacc agtcggagct caaggacttc 540
gggccggaga ccgcgcggcc gcagaagggt cgcaagccgc ggcccggcgc ccggggagcc 600
aaagccaacc aggcggagct ggagaacgcc tactagag 638
<210>12
<211>211
<212>PRT
<213>台湾鼷鼠
<400>12
Met Gln Pro Ser Leu Ala Pro Cys Leu Ile Cys Leu Leu Val His Ala
1 5 10 15
Ala Phe Cys Ala Val Glu Gly Gln Gly Trp Gln Ala Phe Arg Asn Asp
20 25 30
Ala Thr Glu Val Ile Pro Gly Leu Gly Glu Tyr Pro Glu Pro Pro Pro
35 40 45
Glu Asn Asn Gln Thr Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro
50 55 60
His His Pro Tyr Asp Ala Lys Asp Val Ser Glu Tyr Ser Cys Arg Glu
65 70 75 80
Leu His Tyr Thr Arg Phe Leu Thr Asp Gly Pro Cys Arg Ser Ala Lys
85 90 95
Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala Arg Leu
100 105 110
Leu Pro Asn Ala Ile Gly Arg Val Lys Trp Trp Arg Pro Asn Gly Pro
115 120 125
Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu
130 135 140
Leu Cys Pro Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val
145 150 155 160
Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu
165 170 175
Leu Lys Asp Phe Gly Pro Glu Thr Ala Arg Pro Gln Lys Gly Arg Lys
180 185 190
Pro Arg Pro Gly Ala Arg Gly Ala Lys Ala Asn Gln Ala Glu Leu Glu
195 200 205
Asn Ala Tyr
210
<210>13
<211>674
<212>DNA
<213>褐鼠(Rattus norvegicus)
<400>13
gaggaccgag tgcccttcct ccttctggca ccatgcagct ctcactagcc ccttgccttg 60
cctgcctgct tgtacatgca gccttcgttg ctgtggagag ccaggggtgg caagccttca 120
agaatgatgc cacagaaatc atcccgggac tcagagagta cccagagcct cctcaggaac 180
tagagaacaa ccagaccatg aaccgggccg agaacggagg cagacccccc caccatcctt 240
atgacaccaa agacgtgtcc gagtacagct gccgcgagct gcactacacc cgcttcgtga 300
ccgacggccc gtgccgcagt gccaagccgg tcaccgagtt ggtgtgctcg ggccagtgcg 360
gccccgcgcg gctgctgccc aacgccatcg ggcgcgtgaa gtggtggcgc ccgaacggac 420
ccgacttccg ctgcatcccg gatcgctacc gcgcgcagcg ggtgcagctg ctgtgccccg 480
gcggcgcggc gccgcgctcg cgcaaggtgc gtctggtggc ctcgtgcaag tgcaagcgcc 540
tcacccgctt ccacaaccag tcggagctca aggacttcgg acctgagacc gcgcggccgc 600
agaagggtcg caagccgcgg ccccgcgccc ggggagccaa agccaaccag gcggagctgg 660
agaacgccta ctag 674
<210>14
<211>213
<212>PRT
<213>褐鼠
<400>14
Met Gln Leu Ser Leu Ala Pro Cys Leu Ala Cys Leu Leu Val His Ala
1 5 10 15
Ala Phe Val Ala Val Glu Ser Gln Gly Trp Gln Ala Phe Lys Asn Asp
20 25 30
Ala Thr Glu Ile Ile Pro Gly Leu Arg Glu Tyr Pro Glu pro Pro Gln
35 40 45
Glu Leu Glu Asn Asn Gln Thr Met Asn Arg Ala Glu Asn Gly Gly Arg
50 55 60
Pro Pro His His Pro Tyr Asp Thr Lys Asp Val Ser Glu Tyr Ser Cys
65 70 75 80
Arg Glu Leu His Tyr Thr Arg Phe Val Thr Asp Gly Pro Cys Arg Ser
85 90 95
Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala
100 105 110
Arg Leu Leu Pro Asn Ala Ile Gly Arg Val Lys Trp Trp Arg Pro Asn
115 120 125
Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val
130 135 140
Gln Leu Leu Cys Pro Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg
145 150 155 160
Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg phe His Asn Gln
165 170 175
Ser Glu Leu Lys Asp Phe Gly Pro Glu Thr Ala Arg Pro Gln Lys Gly
180 185 190
Arg Lys Pro Arg Pro Arg Ala Arg Gly Ala Lys Ala Asn Gln Ala Glu
195 200 205
Leu Glu Asn Ala Tyr
210
<210>15
<211>532
<212>DNA
<213>Bos torus
<400>15
agaatgatgc cacagaaatc atccccgagc tgggcgagta ccccgagcct ctgccagagc 60
tgaacaacaa gaccatgaac cgggcggaga acggagggag acctccccac cacccctttg 120
agaccaaaga cgcctccgag tacagctgcc gggagctgca cttcacccgc tacgtgaccg 180
atgggccgtg ccgcagcgcc aagccggtca ccgagctggt gtgctcgggc cagtgcggcc 240
cggcgcgcct gctgcccaac gccatcggcc gcggcaagtg gtggcgccca agcgggcccg 300
acttccgctg catccccgac cgctaccgcg cgcagcgggt gcagctgttg tgtcctggcg 360
gcgcggcgcc gcgcgcgcgc aaggtgcgcc tggtggcctc gtgcaagtgc aagcgcctca 420
ctcgcttcca caaccagtcc gagctcaagg acttcgggcc cgaggccgcg cggccgcaaa 480
cgggccggaa gctgcggccc cgcgcccggg gcaccaaagc cagccgggcc ga 532
<210>16
<211>176
<212>PRT
<213>Bos torus
<400>16
Asn Asp Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro
1 5 10 15
Leu Pro Glu Leu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly
20 25 30
Arg Pro Pro His His Pro Phe Glu Thr Lys Asp Ala Ser Glu Tyr Ser
35 40 45
Cys Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg
50 55 60
Ser Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro
65 70 75 80
Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro
85 90 95
Ser Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg
100 105 110
Val Gln Leu Leu Cys Pro Gly Gly Ala Ala Pro Arg Ala Arg Lys Val
115 120 125
Arg Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn
130 135 140
Gln Ser Glu Leu Lys Asp Phe Gly Pro Glu Ala Ala Arg Pro Gln Thr
145 150 155 160
Gly Arg Lys Leu Arg Pro Arg Ala Arg Gly Thr Lys Ala Ser Arg Ala
165 170 175
<210>17
<211>35828
<212>DNA
<213>台湾鼷鼠
<220>
<221>其它特征
<222>(1)...(35828)
<223>n=A,T,C or G
<400>17
cgcgttttgg tgagcagcaa tattgcgctt cgatgagcct tggcgttgag attgatacct 60
ctgctgcaca aaaggcaatc gaccgagctg gaccagcgca ttcgtgacac cgtctccttc 120
gaacttattc gcaatggagt gtcattcatc aaggacngcc tgatcgcaaa tggtgctatc 180
cacgcagcgg caatcgaaaa ccctcagccg gtgaccaata tctacaacat cagccttggt 240
atcctgcgtg atgagccagc gcagaacaag gtaaccgtca gtgccgataa gttcaaagtt 300
aaacctggtg ttgataccaa cattgaaacg ttgatcgaaa acgcgctgaa aaacgctgct 360
gaatgtgcgg cgctggatgt cacaaagcaa atggcagcag acaagaaagc gatggatgaa 420
ctggcttcct atgtccgcac ggccatcatg atggaatgtt tccccggtgg tgttatctgg 480
cagcagtgcc gtcgatagta tgcaattgat aattattatc atttgcgggt cctttccggc 540
gatccgcctt gttacggggc ggcgacctcg cgggttttcg ctatttatga aaattttccg 600
gtttaaggcg tttccgttct tcttcgtcat aacttaatgt ttttatttaa aataccctct 660
gaaaagaaag gaaacgacag gtgctgaaag cgagcttttt ggcctctgtc gtttcctttc 720
tctgtttttg tccgtggaat gaacaatgga agtcaacaaa aagcagagct tatcgatgat 780
aagcggtcaa acatgagaat tcgcggccgc ataatacgac tcactatagg gatcgacgcc 840
tactccccgc gcatgaagcg gaggagctgg actccgcatg cccagagacg ccccccaacc 900
cccaaagtgc ctgacctcag cctctaccag ctctggcttg ggcttgggcg gggtcaaggc 960
taccacgttc tcttaacagg tggctgggct gtctcttggc cgcgcgtcat gtgacagctg 1020
cctagttctg cagtgaggtc accgtggaat gtctgccttc gttgccatgg caacgggatg 1080
acgttacaat ctgggtgtgg agcttttcct gtccgtgtca ggaaatccaa ataccctaaa 1140
ataccctaga agaggaagta gctgagccaa ggctttcctg gcttctccag ataaagtttg 1200
acttagatgg aaaaaaacaa aatgataaag acccgagcca tctgaaaatt cctcctaatt 1260
gcaccactag gaaatgtgta tattattgag ctcgtatgtg ttcttatttt aaaaagaaaa 1320
ctttagtcat gttattaata agaatttctc agcagtggga gagaaccaat attaacacca 1380
agataaaagt tggcatgatc cacattgcag gaagatccac gttgggtttt catgaatgtg 1440
aagaccccat ttattaaagt cctaagctct gtttttgcac actaggaagc gatggccggg 1500
atggctgagg ggctgtaagg atctttcaat gtcttacatg tgtgtttcct gtcctgcacc 1560
taggacctgc tgcctagcct gcagcagagc cagaggggtt tcacatgatt agtctcagac 1620
acttgggggc aggttgcatg tactgcatcg cttatttcca tacggagcac ctactatgtg 1680
tcaaacacca tatggtgttc actcttcaga acggtggtgg tcatcatggt gcatttgctg 1740
acggttggat tggtggtaga gagctgagat atatggacgc actcttcagc attctgtcaa 1800
cgtggctgtg cattcttgct cctgagcaag tggctaaaca gactcacagg gtcagcctcc 1860
agctcagtcg ctgcatagtc ttagggaacc tctcccagtc ctccctacct caactatcca 1920
agaagccagg gggcttggcg gtctcaggag cctgcttgct gggggacagg ttgttgagtt 1980
ttatctgcag taggttgcct aggcatagtg tcaggactga tggctgcctt ggagaacaca 2040
tcctttgccc tctatgcaaa tctgaccttg acatgggggc gctgctcagc tgggaggatc 2100
aactgcatac ctaaagccaa gcctaaagct tcttcgtcca cctgaaactc ctggaccaag 2160
gggcttccgg cacatcctct caggccagtg agggagtctg tgtgagctgc actttccaat 2220
ctcagggcgt gagaggcaga gggaggtggg ggcagagcct tgcagctctt tcctcccatc 2280
tggacagcgc tctggctcag cagcccatat gagcacaggc acatccccac cccaccccca 2340
cctttcctgt cctgcagaat ttaggctctg ttcacggggg gggggggggg ggggcagtcc 2400
tatcctctct taggtagaca ggactctgca ggagacactg ctttgtaaga tactgcagtt 2460
taaatttgga tgttgtgagg ggaaagcgaa gggcctcttt gaccattcag tcaaggtacc 2520
ttctaactcc catcgtattg gggggctact ctagtgctag acattgcaga gagcctcaga 2580
actgtagtta ccagtgtggt aggattgatc cttcagggag cctgacatgt gacagttcca 2640
ttcttcaccc agtcaccgaa catttattca gtacctaccc cgtaacaggc accgtagcag 2700
gtactgaggg acggaccact caaagaactg acagaccgaa gccttggaat ataaacacca 2760
aagcatcagg ctctgccaac agaacactct ttaacactca ggccctttaa cactcaggac 2820
ccccaccccc accccaagca gttggcactg ctatccacat tttacagaga ggaaaaacta 2880
ggcacaggac gatataagtg gcttgcttaa gcttgtctgc atggtaaatg gcagggctgg 2940
attgagaccc agacattcca actctagggt ctatttttct tttttctcgt tgttcgaatc 3000
tgggtcttac tgggtaaact caggctagcc tcacactcat atccttctcc catggcttac 3060
gagtgctagg attccaggtg tgtgctacca tgtctgactc cctgtagctt gtctatacca 3120
tcctcacaac ataggaattg tgatagcagc acacacaccg gaaggagctg gggaaatccc 3180
acagagggct ccgcaggatg acaggcgaat gcctacacag aaggtgggga agggaagcag 3240
agggaacagc atgggcgtgg gaccacaagt ctatttgggg aagctgccgg taaccgtata 3300
tggctggggt gaggggagag gtcatgagat gaggcaggaa gagccacagc aggcagcggg 3360
tacgggctcc ttattgccaa gaggctcgga tcttcctcct cttcctcctt ccggggctgc 3420
ctgttcattt tccaccactg cctcccatcc aggtctgtgg ctcaggacat cacccagctg 3480
cagaaactgg gcatcaccca cgtcctgaat gctgccgagg gcaggtcctt catgcacgtc 3540
aacaccagtg ctagcttcta cgaggattct ggcatcacct acttgggcat caaggccaat 3600
gatacgcagg agttcaacct cagtgcttac tttgaaaggg ccacagattt cattgaccag 3660
gcgctggccc ataaaaatgg taaggaacgt acattccggc acccatggag cgtaagccct 3720
ctgggacctg cttcctccaa agaggccccc acttgaaaaa ggttccagaa agatcccaaa 3780
atatgccacc aactagggat taagtgtcct acatgtgagc cgatgggggc cactgcatat 3840
agtctgtgcc atagacatga caatggataa taatatttca gacagagagc aggagttagg 3900
tagctgtgct cctttccctt taattgagtg tgcccatttt tttattcatg tatgtgtata 3960
catgtgtgtg cacacatgcc ataggttgat actgaacacc gtcttcaatc gttccccacc 4020
ccaccttatt ttttgaggca gggtctcttc cctgatcctg gggctcattg gtttatctag 4080
gctgctggcc agtgagctct ggagttctgc ttttctctac ctccctagcc ctgggactgc 4140
aggggcatgt gctgggccag gcttttatgt cgcgttgggg atctgaactt aggtccctag 4200
gcctgagcac cgtaaagact ctgccacatc cccagcctgt ttgagcaagt gaaccattcc 4260
ccagaattcc cccagtgggg ctttcctacc cttttattgg ctaggcattc atgagtggtc 4320
acctcgccag aggaatgagt ggccacgact ggctcagggt cagcagccta gagatactgg 4380
gttaagtctt cctgccgctc gctccctgca gccgcagaca gaaagtagga ctgaatgaga 4440
gctggctagt ggtcagacag gacagaaggc tgagagggtc acagggcaga tgtcagcaga 4500
gcagacaggt tctccctctg tgggggaggg gtggcccact gcaggtgtaa ttggccttct 4560
ttgtgctcca tagaggcttc ctgggtacac agcagcttcc ctgtcctggt gattcccaaa 4620
gagaactccc taccactgga cttacagaag ttctattgac tggtgtaacg gttcaacagc 4680
tttggctctt ggtggacggt gcatactgct gtatcagctc aagagctcat tcacgaatga 4740
acacacacac acacacacac acacacacac acacaagcta attttgatat gccttaacta 4800
gctcagtgac tgggcatttc tgaacatccc tgaagttagc acacatttcc ctctggtgtt 4860
cctggcttaa caccttctaa atctatattt tatctttgct gccctgttac cttctgagaa 4920
gcccctaggg ccacttccct tcgcacctac attgctggat ggtttctctc ctgcagctct 4980
taaatctgat ccctctgcct ctgagccatg ggaacagccc aataactgag ttagacataa 5040
aaacgtctct agccaaaact tcagctaaat ttagacaata aatcttactg gttgtggaat 5100
ccttaagatt cttcatgacc tccttcacat ggcacgagta tgaagcttta ttacaattgt 5160
ttattgatca aactaactca taaaaagcca gttgtctttc acctgctcaa ggaaggaaca 5220
aaattcatcc ttaactgatc tgtgcacctt gcacaatcca tacgaatatc ttaagagtac 5280
taagattttg gttgtgagag tcacatgtta cagaatgtac agctttgaca aggtgcatcc 5340
ttgggatgcc gaagtgacct gctgttccag ccccctacct tctgaggctg ttttggaagc 5400
aatgctctgg aagcaacttt aggaggtagg atgctggaac agcgggtcac ttcagcatcc 5460
cgatgacgaa tcccgtcaaa gctgtacatt ctgtaacaga ctgggaaagc tgcagacttt 5520
aaggccaggg ccctatggtc cctcttaatc cctgtcacac ccaacccgag cccttctcct 5580
ccagccgttc tgtgcttctc actctggata gatggagaac acggccttgc tagttaaagg 5640
agtgaggctt cacccttctc acatggcagt ggttggtcat cctcattcag ggaactctgg 5700
ggcattctgc ctttacttcc tctttttgga ctacagggaa tatatgctga cttgttttga 5760
ccttgtgtat ggggagactg gatctttggt ctggaatgtt tcctgctagt ttttccccat 5820
cctttggcaa accctatcta tatcttacca ctaggcatag tggccctcgt tctggagcct 5880
gccttcaggc tggttctcgg ggaccatgtc cctggtttct ccccagcata tggtgttcac 5940
agtgttcact gcgggtggtt gctgaacaaa gcggggattg catcccagag ctccggtgcc 6000
ttgtgggtac actgctaaga taaaatggat actggcctct ctctgaccac ttgcagagct 6060
ctggtgcctt gtgggtacac tgctaagata aaatggatac tggcctctct ctatccactt 6120
gcaggactct agggaacagg aatccattac tgagaaaacc aggggctagg agcagggagg 6180
tagctgggca gctgaagtgc ttggcgacta accaatgaat accagagttt ggatctctag 6240
aatactctta aaatctgggt gggcagagtg gcctgcctgt aatcccagaa ctcgggaggc 6300
ggagacaggg aatcatcaga gcaaactggc taaccagaat agcaaaacac tgagctctgg 6360
gctctgtgag agatcctgcc ttaacatata agagagagaa taaaacattg aagaagacag 6420
tagatgccaa ttttaagccc ccacatgcac atggacaagt gtgcgtttga acacacatat 6480
gcactcatgt gaaccaggca tgcacactcg ggcttatcac acacataatt tgaaagagag 6540
agtgagagag gagagtgcac attagagttc acaggaaagt gtgagtgagc acacccatgc 6600
acacagacat gtgtgccagg gagtaggaaa ggagcctggg tttgtgtata agagggagcc 6660
atcatgtgtt tctaaggagg gcgtgtgaag gaggcgttgt gtgggctggg actggagcat 6720
ggttgtaact gagcatgctc cctgtgggaa acaggagggt ggccaccctg cagagggtcc 6780
cactgtccag cgggatcagt aaaagcccct gctgagaact ttaggtaata gccagagaga 6840
gaaaggtagg aaagtggggg gactcccatc tctgatgtag gaggatctgg gcaagtagag 6900
gtgcgtttga ggtagaaaga ggggtgcaga ggagatgctc ttaattctgg gtcagcagtt 6960
tctttccaaa taatgcctgt gaggaggtgt aggtggtggc cattcactca ctcagcagag 7020
ggatgatgat gcccggtgga tgctggaaat ggccgagcat caaccctggc tctggaagaa 7080
ctccatcttt cagaaggaga gtggatctgt gtatggccag cggggtcaca ggtgcttggg 7140
gcccctgggg gactcctagc actgggtgat gtttatcgag tgctcttgtg tgccaggcac 7200
tggcctgggg ctttgtttct gtctctgttt tgtttcgttt tttgagacag actcttgcta 7260
tgtatccgtg tcaatcttgg aatctcactg catagcccag gctgcggaga gaggggaggg 7320
caataggcct tgtaagcaag ccacacttca gagactagac tccaccctgc gaatgatgac 7380
aggtcagagc tgagttccgg aagatttttt ttccagctgc caggtggagt gtggagtggc 7440
agctagcggc aagggtagag ggcgagctcc ctgtgcagga gaaatgcaag caagagatgg 7500
caagccagtg agttaagcat tctgtgtggg gagcaggtgg atgaagagag aggctgggct 7560
ttcgcctctg gggggggggt gaggggtggg gatgaggtga gaggagggca gctccctgca 7620
gtgtgatgag atttttcctg acagtgacct ttggcctctc cctcccccac ttcccttctt 7680
tcctttcttc ccaccattgc tttccttgtc cttgagaaat tctgagtttc cacttcactg 7740
gtgatgcaga cggaaacaga agccgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 7800
gtgtgtgtgt ttgtgtgtat gtgtgtgtgt gtgtttgtgt gtatgtgtgt cagtgggaat 7860
ggctcatagt ctgcaggaag gtgggcagga aggaataagc tgtaggctga ggcagtgtgg 7920
gatgcaggga gagaggagag gagggatacc agagaaggaa attaagggag ctacaagagg 7980
gcattgttgg ggtgtgtgtg tgtgtgtgtt gtttatattt gtattggaaa tacattcttt 8040
taaaaaatac ttatccattt atttattttt atgtgcacgt gtgtgtgcct gcatgagttc 8100
atgtgtgcca cgtgtgtgcg ggaacccttg gaggccacaa gggggcatct gatcccctgg 8160
aactggagtt ggaggaggtt gtgagtcccc tgacatgttt gctgggaact gaaccccggt 8220
cctatgcaag agcaggaagt gcagttatct gctgagccat ctctccagtc ctgaaatcca 8280
ttctcttaaa atacacgtgg cagagacatg atgggattta cgtatggatt taatgtggcg 8340
gtcattaagt tccggcacag gcaagcacct gtaaagccat caccacaacc gcaacagtga 8400
atgtgaccat cacccccatg ttcttcatgt cccctgtccc ctccatcctc cattctcaag 8460
cacctcttgc tctgcctctg tcgctggaga acagtgtgca tctgcacact cttatgtcag 8520
tgaagtcaca cagcctgcac cccttcctgg tctgagtatt tgggttctga ctctgctatc 8580
acacactact gtactgcatt ctctcgctct ctttttttaa acatattttt atttgtttgt 8640
gtgtatgcac atgtgccaca tgtgtacaga tactatggag gccagaagag gccatggccg 8700
tccctggagc tggagttaca ggcagcgtgt gagctgcctg gtgtgggtgc tgggaaccaa 8760
acttgaatct aaagcaagca cttttaactg ctgaggcagc tctcagtacc cttcttcatt 8820
tctccgcctg ggttccattg tatggacaca tgtagctaga atatcttgct tatctaatta 8880
tgtacattgt tttgtgctaa gagagagtaa tgctctatag cctgagctgg cctcaacctt 8940
gccatcctcc tgcctcagcc tcctcctcct gagtgctagg atgacaggcg agtggtaact 9000
tacatggttt catgttttgt tcaagactga aggataacat tcatacagag aaggtctggg 9060
tcacaaagtg tgcagttcac tgaatggcac aacccgtgat caagaaacaa aactcagggg 9120
ctggagagat ggcactgact gctcttccag aggtccggag ttcaattccc agcaaccaca 9180
tggtggctca cagccatcta taacgagatc tgacgccctc ttctggtgtg tctgaagaca 9240
gctacagtgt actcacataa aataaataaa tctttaaaac acacacacac acacaattac 9300
caccccagaa agcccactcc atgttccctc ccacgtctct gcctacagta ctcccaggtt 9360
accactgttc aggcttctaa caacctggtt tacttgggcc tcttttctgc tctgtggagc 9420
cacacatttg tgtgcctcat acacgttctt tctagtaagt tgcatattac tctgcgtttt 9480
tacatgtatt tatttattgt agttgtgtgt gcgtgtgggc ccatgcatgg cacagtgtgt 9540
ggggatgtca gagtattgtg aacaggggac agttcttttc ttcaatcatg tgggttccag 9600
aggttgaact caggtcatca tgtgtggcag caaatgcctt tacccactga gacatctcca 9660
tattcttttt ttttcccctg aggtgggggc ttgttccata gcccaaactg gctttgcact 9720
tgcagttcaa agtgactccc tgtctccacc tcttagagta ttggaattac gatgtgtact 9780
accacacctg actggatcat taattctttg atgggggcgg ggaagcgcac atgctgcagg 9840
tgaagggatg actggactgg acatgagcgt ggaagccaga gaacagcttc agtctaatgc 9900
tctcccaact gagctatttc ggtttgccag agaacaactt acagaaagtt ctcagtgcca 9960
tgtggattcg gggttggagt tcaactcatc agcttgacat tggctcctct acccactgag 10020
ccttctcact actctctacc tagatcatta attctttttt aaaaagactt attagggggc 10080
tggagagatg gctcagccgt taagagcacc gaatgccctt ccagaggtcc tgagttcaat 10140
tcccagcatg ccattgctgg gcagtagggg gcgcaggtgt tcaacgtgag tagctgttgc 10200
cagttttccg cggtggagaa cctcttgaca ccctgctgtc cctggtcatt ctgggtgggt 10260
gcatggtgat atgcttgttg tatggaagac tttgactgtt acagtgaagt tgggcttcca 10320
cagttaccac gtctcccctg tttcttgcag gccgggtgct tgtccattgc cgcgagggct 10380
acagccgctc cccaacgcta gttatcgcct acctcatgat gcggcagaag atggacgtca 10440
agtctgctct gagtactgtg aggcagaatc gtgagatcgg ccccaacgat ggcttcctgg 10500
cccaactctg ccagctcaat gacagactag ccaaggaggg caaggtgaaa ctctagggtg 10560
cccacagcct cttttgcaga ggtctgactg ggagggccct ggcagccatg tttaggaaac 10620
acagtatacc cactccctgc accaccagac acgtgcccac atctgtccca ctctggtcct 10680
cgggggccac tccaccctta gggagcacat gaagaagctc cctaagaagt tctgctcctt 10740
agccatcctt tcctgtaatt tatgtctctc cctgaggtga ggttcaggtt tatgtccctg 10800
tctgtggcat agatacatct cagtgaccca gggtgggagg gctatcaggg tgcatggccc 10860
gggacacggg cactcttcat gacccctccc ccacctgggt tcttcctgtg tggtccagaa 10920
ccacgagcct ggtaaaggaa ctatgcaaac acaggccctg acctccccat gtctgttcct 10980
ggtcctcaca gcccgacacg ccctgctgag gcagacgaat gacattaagt tctgaagcag 11040
agtggagata gattagtgac tagatttcca aaaagaagga aaaaaaaggc tgcattttaa 11100
aattatttcc ttagaattaa agatactaca taggggccct tgggtaagca aatccatttt 11160
tcccagaggc tatcttgatt ctttggaatg tttaaagtgt gccttgccag agagcttacg 11220
atctatatct gctgcttcag agccttccct gaggatggct ctgttccttt gcttgttaga 11280
agagcgatgc cttgggcagg gtttccccct tttcagaata cagggtgtaa agtccagcct 11340
attacaaaca aacaaacaaa caaacaaaca aaggacctcc atttggagaa ttgcaaggat 11400
tttatcctga attatagtgt tggtgagttc aagtcatcac gccaagtgct tgccatcctg 11460
gttgctattc taagaataat taggaggagg aacctagcca attgcagctc atgtccgtgg 11520
gtgtgtgcac gggtgcatat gttggaaggg gtgcctgtcc ccttggggac agaaggaaaa 11580
tgaaaggccc ctctgctcac cctggccatt tacgggaggc tctgctggtt ccacggtgtc 11640
tgtgcaggat cctgaaactg actcgctgga cagaaacgag acttggcggc accatgagaa 11700
tggagagaga gagagcaaag aaagaaacag cctttaaaag aactttctaa gggtggtttt 11760
tgaacctcgc tggaccttgt atgtgtgcac atttgccaga gattgaacat aatcctcttg 11820
ggacttcacg ttctcattat ttgtatgtct ccggggtcac gcagagccgt cagccaccac 11880
cccagcaccc ggcacatagg cgtctcataa aagcccattt tatgagaacc agagctgttt 11940
gagtaccccg tgtatagaga gagttgttgt cgtggggcac ccggatccca gcagcctggt 12000
tgcctgcctg taggatgtct tacaggagtt tgcagagaaa ccttccttgg agggaaagaa 12060
atatcaggga tttttgttga atatttcaaa ttcagcttta agtgtaagac tcagcagtgt 12120
tcatggttaa ggtaaggaac atgccttttc cagagctgct gcaagaggca ggagaagcag 12180
acctgtctta ggatgtcact cccagggtaa agacctctga tcacagcagg agcagagctg 12240
tgcagcctgg atggtcattg tcccctattc tgtgtgacca cagcaaccct ggtcacatag 12300
ggctggtcat cctttttttt tttttttttt tttttttttg gcccagaatg aagtgaccat 12360
agccaagttg tgtacctcag tctttagttt ccaagcggct ctcttgctca atacaatgtg 12420
catttcaaaa taacactgta gagttgacag aactggttca tgtgttatga gagaggaaaa 12480
gagaggaaag aacaaaacaa aacaaaacac cacaaaccaa aaacatctgg gctagccagg 12540
catgattgca atgtctacag gcccagttca tgagaggcag agacaggaag accgccgaaa 12600
ggtcaaggat agcatggtct acgtatcgag actccagcca gggctacggt cccaagatcc 12660
taggttttgg attttgggct ttggtttttg agacagggtt tctctgtgta gccctggctg 12720
tcctggaact cgctctgtag accaggctgg cctcaaactt agagatctgc ctgactctgc 12780
ctttgagggc tgggacgaat gccaccactg cccaactaag attccattaa aaaaaaaaaa 12840
agttcaagat aattaagagt tgccagctcg ttaaagctaa gtagaagcag tctcaggcct 12900
gctgcttgag gctgttcttg gcttggacct gaaatctgcc cccaacagtg tccaagtgca 12960
catgactttg agccatctcc agagaaggaa gtgaaaattg tggctcccca gtcgattggg 13020
acacagtctc tctttgtcta ggtaacacat ggtgacacat agcattgaac tctccactct 13080
gagggtgggt ttccctcccc ctgcctcttc tgggttggtc accccatagg acagccacag 13140
gacagtcact agcacctact ggaaacctct ttgtgggaac atgaagaaag agcctttggg 13200
agattcctgg ctttccatta gggctgaaag tacaacggtt cttggttggc tttgcctcgt 13260
gtttataaaa ctagctacta ttcttcaggt aaaataccga tgttgtggaa aagccaaccc 13320
cgtggctgcc cgtgagtagg gggtggggtt gggaatcctg gatagtgttc tatccatgga 13380
aagtggtgga ataggaatta agggtgttcc cccccccccc aacctcttcc tcagacccag 13440
ccactttcta tgacttataa acatccaggt aaaaattaca aacataaaaa tggtttctct 13500
tctcaatctt ctaaagtctg cctgcctttt ccaggggtag gtctgtttct ttgctgttct 13560
attgtcttga gagcacagac taacacttac caaatgaggg aactcttggc ccatactaag 13620
gctcttctgg gctccagcac tcttaagtta ttttaagaat tctcacttgg cctttagcac 13680
acccgccacc cccaagtggg tgtggataat gccatggcca gcagggggca ctgttgaggc 13740
gggtgccttt ccaccttaag ttgcttatag tatttaagat gctaaatgtt ttaatcaaga 13800
gaagcactga tcttataata cgaggataag agattttctc acaggaaatt gtctttttca 13860
taattctttt acaggctttg tcctgatcgt agcatagaga gaatagctgg atatttaact 13920
tgtattccat tttcctctgc cagcgttagg ttaactccgt aaaaagtgat tcagtggacc 13980
gaagaggctc agagggcagg ggatggtggg gtgaggcaga gcactgtcac ctgccaggca 14040
tgggaggtcc tgccatccgg gaggaaaagg aaagtttagc ctctagtcta ccaccagtgt 14100
taacgcactc taaagttgta accaaaataa atgtcttaca ttacaaagac gtctgttttg 14160
tgtttccttt tgtgtgtttg ggctttttat gtgtgcttta taactgctgt ggtggtgctg 14220
ttgttagttt tgaggtagga tctcaggctg gccttgaact tctgatcgcc tgcccctgcc 14280
cctgcccctg cccctgtccc tgcctccaag tgctaggact aaaagcacat gccaccacac 14340
cagtacagca tttttctaac atttaaaaat aatcacctag gggctggaga gagggttcca 14400
gctaagagtg cacactgctc ttgggtagga cctgagttta gttcccagaa cctatactgg 14460
gtggctccag gtccagagga tccaggacct ctggcctcca tgggcatctg ctcttagcac 14520
atacccacat acagatacac acataaaaat aaaatgaagc ctttaaaaac ctcctaaaac 14580
ctagcccttg gaggtacgac tctggaaagc tggcatactg tgtaagtcca tctcatggtg 14640
ttctggctaa cgtaagactt acagagacag aaaagaactc agggtgtgct gggggttggg 14700
atggaggaag agggatgagt agggggagca cggggaactt gggcagtgaa aattctttgc 14760
aggacactag aggaggataa ataccagtca ttgcacccac tactggacaa ctccagggaa 14820
ttatgctggg tgaaaagaga aggccccagg tattggctgc attggctgca tttgcgtaac 14880
atttttttaa attgaaaaga aaaagatgta aatcaaggtt agatgagtgg ttgctgtgag 14940
ctgagagctg gggtgagtga gacatgtgga caactccatc aaaaagcgac agaaagaacg 15000
ggctgtggtg acagctacct ctaatctcca cctccgggag gtgatcaagg ttagccctca 15060
gctagcctgt ggtgcatgag accctgtttc aaaaacttta ataaagaaat aatgaaaaaa 15120
gacatcaggg cagatccttg gggccaaagg cggacaggcg agtctcgtgg taaggtcgtg 15180
tagaagcgga tgcatgagca cgtgccgcag gcatcatgag agagccctag gtaagtaagg 15240
atggatgtga gtgtgtcggc gtcggcgcac tgcacgtcct ggctgtggtg ctggactggc 15300
atctttggtg agctgtggag gggaaatggg tagggagatc ataaaatccc tccgaattat 15360
ttcaagaact gtctattaca attatctcaa aatattaaaa aaaaagaaga attaaaaaac 15420
aaaaaaccta tccaggtgtg gtggtgtgca cctatagcca cgggcacttg gaaagctgga 15480
gcaagaggat ggcgagtttg aaggtatctg gggctgtaca gcaagaccgt cgtccccaaa 15540
ccaaaccaaa cagcaaaccc attatgtcac acaagagtgt ttatagtgag cggcctcgct 15600
gagagcatgg ggtgggggtg ggggtggggg acagaaatat ctaaactgca gtcaataggg 15660
atccactgag accctggggc ttgactgcag cttaaccttg ggaaatgata agggttttgt 15720
gttgagtaaa agcatcgatt actgacttaa cctcaaatga agaaaaagaa aaaaagaaaa 15780
caacaaaagc caaaccaagg ggctggtgag atggctcagt gggtaagagc acccgactgc 15840
tcttccgaag gtccagagtt caaatcccag caaccacatg gtggctcaca accatctgta 15900
acgagatatg atgccctctt ctggtgtgtc tgaagacagc tacagtgtac ttacatataa 15960
taaataaatc ttaaaaaaaa aaaaaaaaaa aaaagccaaa ccgagcaaac caggccccca 16020
aacagaaggc aggcacgacg gcaggcacca cgagccatcc tgtgaaaagg cagggctacc 16080
catgggccga ggagggtcca gagagatagg ctggtaagct cagtttctct gtataccctt 16140
tttcttgttg acactacttc aattacagat aaaataacaa ataaacaaaa tctagagcct 16200
ggccactctc tgctcgcttg atttttcctg ttacgtccag caggtggcgg aagtgttcca 16260
aggacagatc gcatcattaa ggtggccagc ataatctccc atcagcaggt ggtgctgtga 16320
gaaccattat ggtgctcaca gaatcccggg cccaggagct gccctctccc aagtctggag 16380
caataggaaa gctttctggc ccagacaggg ttaacagtcc acattccaga gcaggggaaa 16440
aggagactgg aggtcacaga caaaagggcc agcttctaac aacttcacag ctctggtagg 16500
agagatagat cacccccaac aatggccaca gctggttttg tctgccccga aggaaactga 16560
cttaggaagc aggtatcaga gtccccttcc tgaggggact tctgtctgcc ttgtaaagct 16620
gtcagagcag ctgcattgat gtgtgggtga cagaagatga aaaggaggac ccaggcagat 16680
cgccacagat ggaccggcca cttacaagtc gaggcaggtg gcagagcctt gcagaagctc 16740
tgcaggtgga cgacactgat tcattaccca gttagcatac cacagcgggc taggcggacc 16800
acagcctcct tcccagtctt cctccagggc tggggagtcc tccaaccttc tgtctcagtg 16860
cagcttccgc cagcccctcc tccttttgca cctcaggtgt gaaccctccc tcctctcctt 16920
ctccctgtgg catggccctc ctgctactgc aggctgagca ttggatttct ttgtgcttag 16980
atagacctga gatggctttc tgatttatat atatatatcc atcccttgga tcttacatct 17040
aggacccaga gctgtttgtg ataccataag aggctgggga gatgatatgg taagagtgct 17100
tgctgtacaa gcatgaagac atgagttcga atccccagca accatgtgga aaaataacct 17160
tctaacctca gagttgaggg gaaaggcagg tggattctgg gggcttactg gccagctagc 17220
cagcctaacc taaatgtctc agtcagagat cctgtctcag ggaataactt gggagaatga 17280
ctgagaaaga cacctcctca ggtctcccat gcacccacac agacacacgg ggggggggta 17340
atgtaataag ctaagaaata atgagggaaa tgattttttg ctaagaaatg aaattctgtg 17400
ttggccgcaa gaagcctggc cagggaagga actgcctttg gcacaccagc ctataagtca 17460
ccatgagttc cctggctaag aatcacatgt aatggagccc aggtccctct tgcctggtgg 17520
ttgcctctcc cactggtttt gaagagaaat tcaagagaga tctccttggt cagaattgta 17580
ggtgctgagc aatgtggagc tggggtcaat gggattcctt taaaggcatc cttcccaggg 17640
ctgggtcata cttcaatagt agggtgcttg cacagcaagc gtgagaccct aggttagagt 17700
ccccagaatc tgcccccaac cccccaaaaa ggcatccttc tgcctctggg tgggtggggg 17760
gagcaaacac ctttaactaa gaccattagc tggcaggggt aacaaatgac cttggctaga 17820
ggaatttggt caagctggat tccgccttct gtagaagccc cacttgtttc ctttgttaag 17880
ctggcccaca gtttgttttg agaatgcctg aggggcccag ggagccagac aattaaaagc 17940
caagctcatt ttgatatctg aaaaccacag cctgactgcc ctgcccgtgg gaggtactgg 18000
gagagctggc tgtgtccctg cctcaccaac gccccccccc ccaacacaca ctcctcgggt 18060
cacctgggag gtgccagcag caatttggaa gtttactgag cttgagaagt cttgggaggg 18120
ctgacgctaa gcacacccct tctccacccc cccccacccc acccccgtga ggaggagggt 18180
gaggaaacat gggaccagcc ctgctccagc ccgtccttat tggctggcat gaggcagagg 18240
gggctttaaa aaggcaaccg tatctaggct ggacactgga gcctgtgcta ccgagtgccc 18300
tcctccacct ggcagcatgc agccctcact agccccgtgc ctcatctgcc tacttgtgca 18360
cgctgccttc tgtgctgtgg agggccaggg gtggcaagcc ttcaggaatg atgccacaga 18420
ggtcatccca gggcttggag agtaccccga gcctcctcct gagaacaacc agaccatgaa 18480
ccgggcggag aatggaggca gacctcccca ccatccctat gacgccaaag gtacgggatg 18540
aagaagcaca ttagtggggg ggggggtcct gggaggtgac tggggtggtt ttagcatctt 18600
cttcagaggt ttgtgtgggt ggctagcctc tgctacatca gggcagggac acatttgcct 18660
ggaagaatac tagcacagca ttagaacctg gagggcagca ttggggggct ggtagagagc 18720
acccaaggca gggtggaggc tgaggtcagc cgaagctggc attaacacgg gcatgggctt 18780
gtatgatggt ccagagaatc tcctcctaag gatgaggaca caggtcagat ctagctgctg 18840
accagtgggg aagtgatatg gtgaggctgg atgccagatg ccatccatgg ctgtactata 18900
tcccacatga ccaccacatg aggtaaagaa ggccccagct tgaagatgga gaaaccgaga 18960
ggctcctgag ataaagtcac ctgggagtaa gaagagctga gactggaagc tggtttgatc 19020
cagatgcaag gcaaccctag attgggtttg ggtgggaacc tgaagccagg aggaatccct 19080
ttagttcccc cttgcccagg gtctgctcaa tgagcccaga gggttagcat taaaagaaca 19140
gggtttgtag gtggcatgtg acatgagggg cagctgagtg aaatgtcccc tgtatgagca 19200
caggtggcac cacttgccct gagcttgcac cctgacccca gctttgcctc attcctgagg 19260
acagcagaaa ctgtggaggc agagccagca cagagagatg cctggggtgg gggtgggggt 19320
atcacgcacg gaactagcag caatgaatgg ggtggggtgg cagctggagg gacactccag 19380
agaaatgacc ttgctggtca ccatttgtgt gggaggagag ctcattttcc agcttgccac 19440
cacatgctgt ccctcctgtc tcctagccag taagggatgt ggaggaaagg gccaccccaa 19500
aggagcatgc aatgcagtca cgtttttgca gaggaagtgc ttgacctaag ggcactattc 19560
ttggaaagcc ccaaaactag tccttccctg ggcaaacagg cctcccccac ataccacctc 19620
tgcaggggtg agtaaattaa gccagccaca gaagggtggc aaggcctaca cctcccccct 19680
gttgtgcccc cccccccccc gtgaaggtgc atcctggcct ctgcccctct ggctttggta 19740
ctgggatttt ttttttcctt ttatgtcata ttgatcctga caccatggaa cttttggagg 19800
tagacaggac ccacacatgg attagttaaa agcctcccat ccatctaagc tcatggtagg 19860
agatagagca tgtccaagag aggagggcag gcatcagacc tagaagatat ggctgggcat 19920
ccaacccaat ctccttcccc ggagaacaga ctctaagtca gatccagcca cccttgagta 19980
accagctcaa ggtacacaga acaagagagt ctggtataca gcaggtgcta aacaaatgct 20040
tgtggtagca aaagctatag gttttgggtc agaactccga cccaagtcgc gagtgaagag 20100
cgaaaggccc tctactcgcc accgccccgc ccccacctgg ggtcctataa cagatcactt 20160
tcacccttgc gggagccaga gagccctggc atcctaggta gccccccccg cccccccccc 20220
gcaagcagcc cagccctgcc tttggggcaa gttcttttct cagcctggac ctgtgataat 20280
gagggggttg gacgcgccgc ctttggtcgc tttcaagtct aatgaattct tatccctacc 20340
acctgccctt ctaccccgct cctccacagc agctgtcctg atttattacc ttcaattaac 20400
ctccactcct ttctccatct cctgggatac cgcccctgtc ccagtggctg gtaaaggagc 20460
ttaggaagga ccagagccag gtgtggctag aggctaccag gcagggctgg ggatgaggag 20520
ctaaactgga agagtgtttg gttagtaggc acaaagcctt gggtgggatc cctagtaccg 20580
gagaagtgga gatgggcgct gagaagttca agaccatcca tccttaacta cacagccagt 20640
ttgaggccag cctgggctac ataaaaaccc aatctcaaaa gctgccaatt ctgattctgt 20700
gccacgtagt gcccgatgta atagtggatg aagtcgttga atcctggggc aacctatttt 20760
acagatgtgg ggaaaagcaa ctttaagtac cctgcccaca gatcacaaag aaagtaagtg 20820
acagagctcc agtgtttcat ccctgggttc caaggacagg gagagagaag ccagggtggg 20880
atctcactgc tccccggtgc ctccttccta taatccatac agattcgaaa gcgcagggca 20940
ggtttggaaa aagagagaag ggtggaagga gcagaccagt ctggcctagg ctgcagcccc 21000
tcacgcatcc ctctctccgc agatgtgtcc gagtacagct gccgcgagct gcactacacc 21060
cgcttcctga cagacggccc atgccgcagc gccaagccgg tcaccgagtt ggtgtgctcc 21120
ggccagtgcg gccccgcgcg gctgctgccc aacgccatcg ggcgcgtgaa gtggtggcgc 21180
ccgaacggac cggatttccg ctgcatcccg gatcgctacc gcgcgcagcg ggtgcagctg 21240
ctgtgccccg ggggcgcggc gccgcgctcg cgcaaggtgc gtctggtggc ctcgtgcaag 21300
tgcaagcgcc tcacccgctt ccacaaccag tcggagctca aggacttcgg gccggagacc 21360
gcgcggccgc agaagggtcg caagccgcgg cccggcgccc ggggagccaa agccaaccag 21420
gcggagctgg agaacgccta ctagagcgag cccgcgccta tgcagccccc gcgcgatccg 21480
attcgttttc agtgtaaagc ctgcagccca ggccaggggt gccaaacttt ccagaccgtg 21540
tggagttccc agcccagtag agaccgcagg tccttctgcc cgctgcgggg gatggggagg 21600
gggtggggtt cccgcgggcc aggagaggaa gcttgagtcc cagactctgc ctagccccgg 21660
gtgggatggg ggtctttcta ccctcgccgg acctatacag gacaaggcag tgtttccacc 21720
ttaaagggaa gggagtgtgg aacgaaagac ctgggactgg ttatggacgt acagtaagat 21780
ctactccttc cacccaaatg taaagcctgc gtgggctaga tagggtttct gaccctgacc 21840
tggccactga gtgtgatgtt gggctacgtg gttctctttt ggtacggtct tctttgtaaa 21900
atagggaccg gaactctgct gagattccaa ggattggggt accccgtgta gactggtgag 21960
agagaggaga acaggggagg ggttagggga gagattgtgg tgggcaaccg cctagaagaa 22020
gctgtttgtt ggctcccagc ctcgccgcct cagaggtttg gcttccccca ctccttcctc 22080
tcaaatctgc cttcaaatcc atatctggga tagggaaggc cagggtccga gagatggtgg 22140
aagggccaga aatcacactc ctggcccccc gaagagcagt gtcccgcccc caactgcctt 22200
gtcatattgt aaagggattt tctacacaac agtttaaggt cgttggagga aactgggctt 22260
gccagtcacc tcccatcctt gtcccttgcc aggacaccac ctcctgcctg ccacccacgg 22320
acacatttct gtctagaaac agagcgtcgt cgtgctgtcc tctgagacag catatcttac 22380
attaaaaaga ataatacggg gggggggggc ggagggcgca agtgttatac atatgctgag 22440
aagctgtcag gcgccacagc accacccaca atctttttgt aaatcatttc cagacacctc 22500
ttactttctg tgtagatttt aattgttaaa aggggaggag agagagcgtt tgtaacagaa 22560
gcacatggag gggggggtag gggggttggg gctggtgagt ttggcgaact ttccatgtga 22620
gactcatcca caaagactga aagccgcgtt ttttttttta agagttcagt gacatattta 22680
ttttctcatt taagttattt atgccaacat ttttttcttg tagagaaagg cagtgttaat 22740
atcgctttgt gaagcacaag tgtgtgtggt tttttgtttt ttgttttttc cccgaccaga 22800
ggcattgtta ataaagacaa tgaatctcga gcaggaggct gtggtcttgt tttgtcaacc 22860
acacacaatg tctcgccact gtcatctcac tcccttccct tggtcacaag acccaaacct 22920
tgacaacacc tccgactgct ctctggtagc ccttgtggca atacgtgttt cctttgaaaa 22980
gtcacattca tcctttcctt tgcaaacctg gctctcattc cccagctggg tcatcgtcat 23040
accctcaccc cagcctccct ttagctgacc actctccaca ctgtcttcca aaagtgcacg 23100
tttcaccgag ccagttccct ggtccaggtc atcccattgc tcctccttgc tccagaccct 23160
tctcccacaa agatgttcat ctcccactcc atcaagcccc agtggccctg cggctatccc 23220
tgtctcttca gttagctgaa tctacttgct gacaccacat gaattccttc ccctgtctta 23280
aggttcatgg aactcttgcc tgcccctgaa ccttccagga ctgtcccagc gtctgatgtg 23340
tcctctctct tgtaaagccc caccccacta tttgattccc aattctagat cttcccttgt 23400
tcattccttc acgggatagt gtctcatctg gccaagtcct gcttgatatt gggataaatg 23460
caaagccaag tacaattgag gaccagttca tcattgggcc aagctttttc aaaatgtgaa 23520
ttttacacct atagaagtgt aaaagccttc caaagcagag gcaatgcctg gctcttcctt 23580
caacatcagg gctcctgctt tatgggtctg gtggggtagt acattcataa acccaacact 23640
aggggtgtga aagcaagatg attgggagtt cgaggccaat cttggctatg aggccctgtc 23700
tcaacctctc ctccctccct ccagggtttt gttttgtttt gtttttttga tttgaaactg 23760
caacacttta aatccagtca agtgcatctt tgcgtgaggg gaactctatc cctaatataa 23820
gcttccatct tgatttgtgt atgtgcacac tgggggttga acctgggcct ttgtacctgc 23880
cgggcaagct ctctactgct ctaaacccag ccctcactgg ctttctgttt caactcccaa 23940
tgaattcccc taaatgaatt atcaatatca tgtctttgaa aaataccatt gagtgctgct 24000
ggtgtccctg tggttccaga ttccaggaag gacttttcag ggaatccagg catcctgaag 24060
aatgtcttag agcaggaggc catggagacc ttggccagcc ccacaaggca gtgtggtgca 24120
gagggtgagg atggaggcag gcttgcaatt gaagctgaga cagggtactc aggattaaaa 24180
agcttccccc aaaacaattc caagatcagt tcctggtact tgcacctgtt cagctatgca 24240
gagcccagtg ggcataggtg aagacaccgg ttgtactgtc atgtactaac tgtgcttcag 24300
agccggcaga gacaaataat gttatggtga ccccagggga cagtgattcc agaaggaaca 24360
cagaagagag tgctgctaga ggctgcctga aggagaaggg gtcccagact ctctaagcaa 24420
agactccact cacataaaga cacaggctga gcagagctgg ccgtggatgc agggagccca 24480
tccaccatcc tttagcatgc ccttgtattc ccatcacatg ccagggatga ggggcatcag 24540
agagtccaag tgatgcccaa acccaaacac acctaggact tgctttctgg gacagacaga 24600
tgcaggagag actaggttgg gctgtgatcc cattaccaca aagagggaaa aaacaaaaaa 24660
caaacaaaca aacaaaaaaa aacaaaacaa aacaaaaaaa aacccaaggt ccaaattgta 24720
ggtcaggtta gagtttattt atggaaagtt atattctacc tccatggggt ctacaaggct 24780
ggcgcccatc agaaagaaca aacaacaggc tgatctggga ggggtggtac tctatggcag 24840
ggagcacgtg tgcttggggt acagccagac acggggcttg tattaatcac agggcttgta 24900
ttaataggct gagagtcaag cagacagaga gacagaagga aacacacaca cacacacaca 24960
cacacacaca cacacacaca catgcacaca ccactcactt ctcactcgaa gagcccctac 25020
ttacattcta agaacaaacc attcctcctc ataaaggaga caaagttgca gaaacccaaa 25080
agagccacag ggtccccact ctctttgaaa tgacttggac ttgttgcagg gaagacagag 25140
gggtctgcag aggcttcctg ggtgacccag agccacagac actgaaatct ggtgctgaga 25200
cctgtataaa ccctcttcca caggttccct gaaaggagcc cacattcccc aaccctgtct 25260
cctgaccact gaggatgaga gcacttgggc cttccccatt cttggagtgc accctggttt 25320
ccccatctga gggcacatga ggtctcaggt cttgggaaag ttccacaagt attgaaagtg 25380
ttcttgtttt gtttgtgatt taatttaggt gtatgagtgc ttttgcttga atatatgcct 25440
gtgtagcatt tacaagcctg gtgcctgagg agatcagaag atggcatcag ataccctgga 25500
actggacttg cagacagtta tgagccactg tgtgggtgct aggaacagaa cctggatcct 25560
ccggaagagc agacagccag cgctcttagc cactaagcca tcactgaggt tctttctgtg 25620
gctaaagaga caggagacaa aggagagttt cttttagtca ataggaccat gaatgttcct 25680
cgtaacgtga gactagggca gggtgatccc ccagtgacac cgatggccct gtgtagttat 25740
tagcagctct agtcttattc cttaataagt cccagtttgg ggcaggagat atgtattccc 25800
tgctttgaag tggctgaggt ccagttatct acttccaagt acttgtttct ctttctggag 25860
ttggggaagc tccctgcctg cctgtaaatg tgtccattct tcaaccttag acaagatcac 25920
tttccctgag cagtcaggcc agtccaaagc ccttcaattt agctttcata aggaacaccc 25980
cttttgttgg gtggaggtag cacttgcctt gaatcccagc attaagaagg cagagacagt 26040
cggatctctg tgagttcaca gccagcctgg tctacggagt gagttccaag acagccaggc 26100
ctacacagag aaaccctgtc tcgaaaaaaa caaaaacaaa agaaataaag aaaaagaaaa 26160
caaaaacgaa caaacagaaa aacaagccag agtgtttgtc cccgtatttt attaatcata 26220
tttttgtccc tttgccattt tagactaaaa gactcgggaa agcaggtctc tctctgtttc 26280
tcatccggac acacccagaa ccagatgtat ggaagatggc taatgtgctg cagttgcaca 26340
tctggggctg ggtggattgg ttagatggca tgggctgggt gtggttacga tgactgcagg 26400
agcaaggagt atgtggtgca tagcaaacga ggaagtttgc acagaacaac actgtgtgta 26460
ctgatgtgca ggtatgggca catgcaagca gaagccaagg gacagcctta gggtagtgtt 26520
tccacagacc cctcccccct tttaacatgg gcatctctca ttggcctgga gcttgccaac 26580
tgggctgggc tggctagctt gtaggtccca gggatctgca tatctctgcc tccctagtgc 26640
tgggattaca gtcatatatg agcacacctg gcttttttat gtgggttctg ggctttgaac 26700
ccagatctga gtgcttgcaa ggcaatcggt tgaatgactg cttcatctcc ccagaccctg 26760
ggattctact ttctattaaa gtatttctat taaatcaatg agcccctgcc cctgcactca 26820
gcagttctta ggcctgctga gagtcaagtg gggagtgaga gcaagcctcg agaccccatc 26880
agcgaagcag aggacaaaga aatgaaaact tgggattcga ggctcgggat atggagatac 26940
agaaagggtc agggaaggaa atgaaccaga tgaatagagg caggaagggt agggccctgc 27000
atacatggaa cctggtgtac atgttatctg catggggttt gcattgcaat ggctcttcag 27060
caggttcacc acactgggaa acagaagcca aaaagaagag taggtggtgt tggagtcaga 27120
tactgtcagt catgcctgaa gaaatggaag caattaacga tgcgccgcaa ttaggatatt 27180
agctccctga agaaaggcaa gaagctgggc tgtgggcact gaagggagct ttgaatgatg 27240
tcacattctc tgtatgccta gcagggcagt attggagact gagacttgac ttgtgtgtcc 27300
atatgattcc tccttttcct acagtcatct ggggctcctg agcttcgtcc ttgtccaaga 27360
acctggagct ggcagtgggc agctgcagtg atagatgtct gcaagaaaga tctgaaaaga 27420
gggaggaaga tgaaggaccc agaggaccac cgacctctgc tgcctgacaa agctgcagga 27480
ccagtctctc ctacagatgg gagacagagg cgagagatga atggtcaggg gaggagtcag 27540
agaaaggaga gggtgaggca gagaccaaag gagggaaaca cttgtgctct acagctactg 27600
actgagtacc agctgcgtgg cagacagcca atgccaaggc tcggctgatc atggcacctc 27660
gtgggactcc tagcccagtg ctggcagagg ggagtgctga atggtgcatg gtttggatat 27720
gatctgaatg tggtccagcc ctagtttcct tccagttgct gggataaagc accctgacca 27780
aagctacttt tttgtttgtt tgttttggtt tggttttgtt tggtttttcg aggcagggtt 27840
tctctgtatc accctagctg tcctggaact cactctgtag accaggctgg cctcgaactc 27900
agaaatcccc ctgcctctgc ctcctaagtg ctggaattaa aggcctgcgc caccactgcc 27960
ggcccaaagc tactttaaga gagagagagg aatgtataag tattataatt ccaggttata 28020
gttcattgct gtagaattgg agtcttcata ttccaggtaa tctcccacag acatgccaca 28080
aaacaacctg ttctacgaaa tctctcatgg actcccttcc ccagtaattc taaactgtgt 28140
caaatctaca agaaatagtg acagtcacag tctctaacgt tttgggcatg agtctgaagt 28200
ctcattgcta agtactggga agatgaaaac tttacctagt gtcagcattt ggagcagagc 28260
ctttgggatt tgagatggtc ttttgcagag ctcctaatgg ctacatggag agagggggcc 28320
tgggagagac ccatacacct tttgctgcct tatgtcacct gacctgctcc ttgggaagct 28380
ctagcaagaa ggccttccct ggatcaccca ccaccttgca cctccagaac tcagagccaa 28440
attaaacttt cttgttactg tcgtcaaagc acagtcggtc tgggttgtat cactgtcaat 28500
gggaaacaga cttgcctgga tggataactt gtacattgca taatgtctag aaatgaaaag 28560
tcctatagag aaaaagaaaa ttagctggca cacagataga ggccctggag gaggctggct 28620
ttgtcctccc cgaggaggtg gcgagtaagg tgtaaatgtt catggatgta aatgggccca 28680
tatatgaggg tctggggtaa caagaaggcc tgtgaatata aagcactgaa ggtatgtcta 28740
gtctggagaa ggtcactaca gagagttctc caactcagtg cccatacaca cacacacaca 28800
cacacacaca cacacacaca cacacacaca ccacaaagaa aaaaaggaag aaaaatctga 28860
gagcaagtac agtacttaaa attgtgtgat tgtgtgtgtg actctgatgt cacatgctca 28920
tcttgcccta tgagttgaaa accaaatggc ccctgagagg cataacaacc acactgttgg 28980
ctgtgtgctc acgtttttct taaagcgtct gtctggtttg ctgctagcat caggcagact 29040
tgcagcagac tacatatgct cagccctgaa gtccttctag ggtgcatgtc tcttcagaat 29100
ttcagaaagt catctgtggc tccaggaccg cctgcactct ccctctgccg cgaggctgca 29160
gactctaggc tggggtggaa gcaacgctta cctctgggac aagtataaca tgttggcttt 29220
tctttccctc tgtggctcca acctggacat aaaatagatg caagctgtgt aataaatatt 29280
tcctcccgtc cacttagttc tcaacaataa ctactctgag agcacttatt aataggtggc 29340
ttagacataa gctttggctc attcccccac tagctcttac ttctttaact ctttcaaacc 29400
attctgtgtc ttccacatgg ttagttacct ctccttccat cctggttcgc ttcttccttc 29460
gagtcgccct cagtgtctct aggtgatgct tgtaagatat tctttctaca aagctgagag 29520
tggtggcact ctgggagttc aaagccagcc tgatctacac agcaagctcc aggatatcca 29580
gggcaatgtt gggaaaacct ttctcaaaca aaaagagggg ttcagttgtc aggaggagac 29640
ccatgggtta agaagtctag acgagccatg gtgatgcata cctttcatcc aagcacttag 29700
gaggcaaaga aaggtgaaac tctttgactt tgaggccagc taggttacat agtgataccc 29760
tgcttagtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtaatt taaaagtcta 29820
aaaatgcatt cttttaaaaa tatgtataag tatttgcctg cacatatgta tgtatgtatg 29880
tataccatgt gtgtgtctgg tgctgaagga ctaggcatag actccctaga actagagtca 29940
tagacagttg tgacactccc caacccccca ccatgtgggt gcttgaagct aaactcctgt 30000
cctttgtaaa gcagcaggtg tctatgaacc ctgaaccatc tctccagtct ccagatgtgc 30060
attctcaaag aggagtcctt catatttccc taaactgaac atccttatca gtgagcatcc 30120
tcgagtcacc aaagctactg caaaccctct tagggaacat tcactattca cttctacttg 30180
gctcatgaaa cttaagtaca cacacacaaa cacacacaca cacacagagt catgcactca 30240
caaaagcatg catgtacacc attcttatta gactatgctt tgctaaaaga ctttcctaga 30300
tactttaaaa catcacttct gccttttggt gggcaggttc caagattggt actggcgtac 30360
tggaaactga acaaggtaga gatctagaaa tcacagcagg tcagaagggc cagcctgtac 30420
aagagagagt tccacacctt ccaggaacac tgagcagggg gctgggacct tgcctctcag 30480
cccaagaaac tagtgcgttt cctgtatgca tgcctctcag agattccata agatctgcct 30540
tctgccataa gatctcctgc atccagacaa gcctagggga agttgagagg ctgcctgagt 30600
ctctcccaca ggccccttct tgcctggcag tattttttta tctggaggag aggaatcagg 30660
gtgggaatga tcaaatacaa ttatcaagga aaaagtaaaa aacatatata tatatatatt 30720
aactgatcta gggagctggc tcagcagtta agagttctgg ctgcccttgc ttcagatctt 30780
gctttgattc ccagcaccca catgatggct ttcaactgta tctctgcttc caggggatcc 30840
aacagcctct tctgacctcc atagacaaga cctagtcctc tgcaagagca ccaaatgctc 30900
ttatctgttg atccatctct ctagcctcat gccagatcat ttaaaactac tggacactgt 30960
cccattttac gaagatgtca ctgcccagtc atttgccatg agtggatatt tcgattcttt 31020
ctatgttctc acccttgcaa tttataagaa agatatctgc atttgtctcc tgagagaaca 31080
aagggtggag ggctactgag atggctctag gggtaaaggt gcttgccaca aaatctgaca 31140
acttaagttt ggtcttggaa tccacatggt ggagagagag aagagattcc cgtaagttgt 31200
cctcaaactt cccacacatg tgctgtggct tatgtgtaac cccaataagt aaagatagtt 31260
ttaaacacta cataaggtag ggtttcttca tgaccccaag gaatgatgcc cctgatagag 31320
cttatgctga aaccccatct ccattgtgcc atctggaaag agacaattgc atcccggaaa 31380
cagaatcttc atgaatggat taatgagcta ttaagaaagt ggcttggtta ttgcacatgc 31440
tggcggcgta atgacctcca ccatgatgtt atccagcatg aaggtcctca ccagaagtca 31500
tacaaatctt cttaggcttc cagagtcgtg agcaaaaaaa gcacacctct aaataaatta 31560
actagcctca ggtagttaac caccgaaaat gaaccaaggc agttctaata caaaaccact 31620
tcccttccct gttcaaacca cagtgcccta ttatctaaaa gataaacttc aagccaagct 31680
tttaggttgc cagtatttat gtaacaacaa ggcccgttga cacacatctg taactcctag 31740
tactgggcct caggggcaga gacaggtgga gccctggagt ttgaattcca ggttctgtga 31800
gaaactctgt ctgaaaagac aatatggtga gtgacccggg aggatatctg atattgactt 31860
ctggccaaca cacagccatc tctgcacatc tgtagttgca agccttttgc actaagtttg 31920
gccagagtca gagtttgcaa gtgtttgtgg actgaatgca cgtgttgctg gtgatctaca 31980
aagtcaccct ccttctcaag ctagcagcac tggcttcggc cagctgctca ttcaagcctc 32040
tttgcagagt catcacgggg atgggggagc agggcccctc cctagaacac caagcctgtg 32100
gttgtttatt caggacatta ttgagggcca agatgacaga taactctatc acttggccaa 32160
cagtcgggtg ttgcggtgtt aggttatttc tgtgtctgca gaaaacagtg caacctggac 32220
aaaagaaata aatgatatca tttttcattc aggcaactag attccgtggt acaaaaggct 32280
ccctggggaa cgaggccggg acagcgcggc tcctgagtcg ctatttccgt ctgtcaactt 32340
ctctaatctc ttgatttcct ccctctgtct gtttccttcc tcttgctggg gcccagtgga 32400
gtctgtgtac tcacagggag gagggtggca aagccctggt cctctacggg ctgggggaag 32460
gggggaagct gtcggcccag tgactttttc ccctttctct ttttcttaga aaccagtctc 32520
aatttaagat aatgagtctc ctcattcacg tgtgctcact attcataggg acttatccac 32580
ccccgccctg tcaatctggc taagtaagac aagtcaaatt taaaagggaa cgtttttcta 32640
aaaatgtggc tggaccgtgt gccggcacga aaccagggat ggcggtctaa gttacatgct 32700
ctctgccagc cccggtgcct tttcctttcg gaaaggagac ccggaggtaa aacgaagttg 32760
ccaacttttg atgatggtgt gcgccgggtg actctttaaa atgtcatcca tacctgggat 32820
agggaaggct cttcagggag tcatctagcc ctcccttcag gaaaagattc cacttccggt 32880
ttagttagct tccacctggt cccttatccg ctgtctctgc ccactagtcc tcatccatcc 32940
ggtttccgcc ctcatccacc ttgccctttt agttcctaga aagcagcacc gtagtcttgg 33000
caggtgggcc attggtcact ccgctaccac tgttaccatg gccaccaagg tgtcatttaa 33060
atatgagctc actgagtcct gcgggatggc ttggttggta atatgcttgc tgcaaaatcg 33120
tgagaactgg agttcaattc ccagcacatg gatgtatttc cagcacctgg aaggcaggga 33180
gcagagatct taaagctcct ggccagacag cccagcctaa ttagtaatca gtgagagacc 33240
ctgtctcaag aaacaagatg gaacatcaaa ggtcaacctc ttgtctccac acacacaaat 33300
acacacatgc acatacatcc acacacaggc aaacacatgc acacacctga acaccctcca 33360
caaatacata cataaaaaaa taaatacata cacacataca tacatacacc aacattccct 33420
ctccttagtc tcctggctac gctcttgtca cccccactaa ggcttcaact tcttctattt 33480
cttcatcttg actcctctgt actttgcatg ccttttccag caaaggcttt tctttaaatc 33540
tccgtcattc ataaactccc tctaaatttc ttcccctgcc cttttctttc tctctaggga 33600
gataaagaca cacactacaa agtcaccgtg ggaccagttt attcacccac ccacccctgc 33660
ttctgttcat ccggccagct aagtagtcca acctctctgg tgctgtaccc tggaccctgg 33720
cttcaccaca gctcctccat gctacccagc cctgcaaacc ttcagcctag cctctggttc 33780
tccaaccagc acaggcccag tctggcttct atgtcctaga aatctccttc attctctcca 33840
tttccctcct gaatctacca ccttctttct cccttctcct gacctctaat gtcttggtca 33900
aacgattaca aggaagccaa tgaaattagc agtttggggt acctcagagt cagcagggga 33960
gctgggatga attcacattt ccaggccttt gctttgctcc ccggattctg acaggcagtt 34020
ccgaagctga gtccaggaag ctgaatttaa aatcacactc cagctgggtt ctgaggcagc 34080
cctaccacat cagctggccc tgactgagct gtgtctgggt ggcagtggtg ctggtggtgc 34140
tggtggtgct ggtggtggtg gtggtggtgg tggtggtggt ggtggtggtg tgtgtgtgtg 34200
ttttctgctt ttacaaaact tttctaattc ttatacaaag gacaaatctg cctcatatag 34260
gcagaaagat gacttatgcc tatataagat ataaagatga ctttatgcca cttattagca 34320
atagttactg tcaaaagtaa ttctatttat acacccttat acatggtatt gcttttgttg 34380
gagactctaa aatccagatt atgtatttaa aaaaaaattc cccagtcctt aaaaggtgaa 34440
gaatggaccc agatagaagg tcacggcaca agtatggagt cggagtgtgg agtcctgcca 34500
atggtctgga cagaagcatc cagagagggt ccaagacaaa tgcctcgcct cctaaggaac 34560
actggcagcc ctgatgaggt accagagatt gctaagtgga ggaatacagg atcagaccca 34620
tggaggggct taaagcgtga ctgtagcagc cctccgctga ggggctccag gtgggcgccc 34680
aaggtgctgc agtgggagcc acatgagagg tgatgtcttg gagtcacctc gggtaccatt 34740
gtttagggag gtggggattt gtggtgtgga gacaggcagc ctcaaggatg cttttcaaca 34800
atggttgatg agttggaact aaaacagggg ccatcacact ggctcccata gctctgggct 34860
tgccagcttc cacatctgcc ccccaccccc tgtctggcac cagctcaagc tctgtgattc 34920
tacacatcca aaagaggaag agtagcctac tgggcatgcc acctcttctg gaccatcagg 34980
tgagagtgtg gcaagcccta ggctcctgtc caggatgcag ggctgccaga taggatgctc 35040
agctatctcc tgagctggaa ctattttagg aataaggatt atgcccgccc ggggttggcc 35100
agcaccccag cagcctgtgc ttgcgtaaaa gcaagtgctg ttgatttatc taaaaacaga 35160
gccgtggacc cacccacagg acaagtatgt atgcatctgt ttcatgtatc tgaaaagcga 35220
cacaaccatt tttcacatca tggcatcttc ctaaccccca ttcttttttg ttttgttttt 35280
ttgagacagg gtttctctgt gtagtcctgg ctgtcctgga actcactttg tagaccaggc 35340
tggcctcgaa ctcagaaatc ctgggattaa aggtgtgtgc caccacgccc ggccctaacc 35400
cccattctta atggtgatcc agtggttgaa atttcgggcc acacacatgt ccattaggga 35460
ttagctgctg tcttctgagc tacctggtac aatctttatc ccctggggcc tgggctcctg 35520
atccctgact cgggcccgat caagtccagt tcctgggccc gatcaagtcc agttcctggg 35580
cccgaacaag tccagtccct agctcgatta gctcatcctg gctccctggc ctgttcttac 35640
ttacactctt ccccttgctc tggacttgtt gctttcttta ctcaagttgt ctgccacagt 35700
ccctaagcca cctctgtaag acaactaaga taatacttcc ctcaagcacg gaaagtcctg 35760
agtcaccaca ccctctggag gtgtgtggac acatgttcat gcgtgtggtt gcgcttacgt 35820
acgtgtgc 35828
<210>18
<211>9301
<212>DNA
<213>人
<400>18
tagaggagaa gtctttgggg agggtttgct ctgagcacac ccctttccct ccctccgggg 60
ctgagggaaa catgggacca gccctgcccc agcctgtcct cattggctgg catgaagcag 120
agaggggctt taaaaaggcg accgtgtctc ggctggagac cagagcctgt gctactggaa 180
ggtggcgtgc cctcctctgg ctggtaccat gcagctccca ctggccctgt gtctcgtctg 240
cctgctggta cacacagcct tccgtgtagt ggagggccag gggtggcagg cgttcaagaa 300
tgatgccacg gaaatcatcc ccgagctcgg agagtacccc gagcctccac cggagctgga 360
gaacaacaag accatgaacc gggcggagaa cggagggcgg cctccccacc acccctttga 420
gaccaaaggt atggggtgga ggagagaatt cttagtaaaa gatcctgggg aggttttaga 480
aacttctctt tgggaggctt ggaagactgg ggtagaccca gtgaagattg ctggcctctg 540
ccagcactgg tcgaggaaca gtcttgcctg gaggtggggg aagaatggct cgctggtgca 600
gccttcaaat tcaggtgcag aggcatgagg caacagacgc tggtgagagc ccagggcagg 660
gaggacgctg gggtggtgag ggtatggcat cagggcatca gaacaggctc aggggctcag 720
aaaagaaaag gtttcaaaga atctcctcct gggaatatag gagccacgtc cagctgctgg 780
taccactggg aagggaacaa ggtaagggag cctcccatcc acagaacagc acctgtgggg 840
caccggacac tctatgctgg tggtggctgt ccccaccaca cagacccaca tcatggaatc 900
cccaggaggt gaacccccag ctcgaagggg aagaaacagg ttccaggcac tcagtaactt 960
ggtagtgaga agagctgagg tgtgaacctg gtttgatcca actgcaagat agccctggtg 1020
tgtggggggg tgtgggggac agatctccac aaagcagtgg ggaggaaggc cagagaggca 1080
cccctgcagt gtgcattgcc catggcctgc ccagggagct ggcacttgaa ggaatgggag 1140
ttttcggcac agttttagcc ccLgacatgg gtgcagctga gtccaggccc tggaggggag 1200
agcagcatcc tctgtgcagg agtagggaca tctgtcctca gcagccaccc cagtcccaac 1260
cttgcctcat tccaggggag ggagaaggaa gaggaaccct gggttcctgg tcaggcctgc 1320
acagagaagc ccaggtgaca gtgtgcatct ggctctataa ttggcaggaa tcctgaggcc 1380
atgggggcgt ctgaaatgac acttcagact aagagcttcc ctgtcctctg gccattatcc 1440
aggtggcaga gaagtccact gcccaggctc ctggacccca gccctccccg cctcacaacc 1500
tgttgggact atggggtgct aaaaagggca actgcatggg aggccagcca ggaccctccg 1560
tcttcaaaat ggaggacaag ggcgcctccc cccacagctc cccttctagg caaggtcagc 1620
tgggctccag cgactgcctg aagggctgta aggaacccaa acacaaaatg tccaccttgc 1680
tggactccca cgagaggcca cagcccctga ggaagccaca tgctcaaaac aaagtcatga 1740
tctgcagagg aagtgcctgg cctaggggcg ctattctcga aaagccgcaa aatgccccct 1800
tccctgggca aatgcccccc tgaccacaca cacattccag ccctgcagag gtgaggatgc 1860
aaaccagccc acagaccaga aagcagcccc agacgatggc agtggccaca tctcccctgc 1920
tgtgcttgct cttcagagtg ggggtggggg gtggccttct ctgtcccctc tctggtttgg 1980
tcttaagact atttttcatt ctttcttgtc acattggaac tatccccatg aaacctttgg 2040
gggtggactg gtactcacac gacgaccagc tatttaaaaa gctcccaccc atctaagtcc 2100
accataggag acatggtcaa ggtgtgtgca ggggatcagg ccaggcctcg gagcccaatc 2160
tctgcctgcc cagggagtat caccatgagg cgcccattca gataacacag aacaagaaat 2220
gtgcccagca gagagccagg tcaatgtttg tggcagctga acctgtaggt tttgggtcag 2280
agctcagggc ccctatggta ggaaagtaac gacagtaaaa agcagccctc agctccatcc 2340
cccagcccag cctcccatgg atgctcgaac gcagagcctc cactcttgcc ggagccaaaa 2400
ggtgctggga ccccagggaa gtggagtccg gagatgcagc ccagcctttt gggcaagttc 2460
ttttctctgg ctgggcctca gtattctcat tgataatgag ggggttggac acactgcctt 2520
tgattccttt caagtctaat gaattcctgt cctgatcacc tccccttcag tccctcgcct 2580
ccacagcagc tgccctgatt tattaccttc aattaacctc tactcctttc tccatcccct 2640
gtccacccct cccaagtggc tggaaaagga atttgggaga agccagagcc aggcagaagg 2700
tgtgctgagt acttaccctg cccaggccag ggaccctgcg gcacaagtgt ggcttaaatc 2760
ataagaagac cccagaagag aaatgataat aataatacat aacagccgac gctttcagct 2820
atatgtgcca aatggtattt tctgcattgc gtgtgtaatg gattaactcg caatgcttgg 2880
ggcggcccat tttgcagaca ggaagaagag agaggttaag gaacttgccc aagatgacac 2940
ctgcagtgag cgatggagcc ctggtgtttg aaccccagca gtcatttggc tccgagggga 3000
cagggtgcgc aggagagctt tccaccagct ctagagcatc tgggaccttc ctgcaataga 3060
tgttcagggg caaaagcctc tggagacagg cttggcaaaa gcagggctgg ggtggagaga 3120
gacgggccgg tccagggcag gggtggccag gcgggcggcc accctcacgc gcgcctctct 3180
ccacagacgt gtccgagtac agctgccgcg agctgcactt cacccgctac gtgaccgatg 3240
ggccgtgccg cagcgccaag ccggtcaccg agctggtgtg ctccggccag tgcggcccgg 3300
cgcgcctgct gcccaacgcc atcggccgcg gcaagtggtg gcgacctagt gggcccgact 3360
tccgctgcat ccccgaccgc taccgcgcgc agcgcgtgca gctgctgtgt cccggtggtg 3420
aggcgccgcg cgcgcgcaag gtgcgcctgg tggcctcgtg caagtgcaag cgcctcaccc 3480
gcttccacaa ccagtcggag ctcaaggact tcgggaccga ggccgctcgg ccgcagaagg 3540
gccggaagcc gcggccccgc gcccggagcg ccaaagccaa ccaggccgag ctggagaacg 3600
cctactagag cccgcccgcg cccctcccca ccggcgggcg ccccggccct gaacccgcgc 3660
cccacatttc tgtcctctgc gcgtggtttg attgtttata tttcattgta aatgcctgca 3720
acccagggca gggggctgag accttccagg ccctgaggaa tcccgggcgc cggcaaggcc 3780
cccctcagcc cgccagctga ggggtcccac ggggcagggg agggaattga gagtcacaga 3840
cactgagcca cgcagccccg cctctggggc cgcctacctt tgctggtccc acttcagagg 3900
aggcagaaat ggaagcattt tcaccgccct ggggttttaa gggagcggtg tgggagtggg 3960
aaagtccagg gactggttaa gaaagttgga taagattccc ccttgcacct cgctgcccat 4020
cagaaagcct gaggcgtgcc cagagcacaa gactgggggc aactgtagat gtggtttcta 4080
gtcctggctc tgccactaac ttgctgtgta accttgaact acacaattct ccttcgggac 4140
ctcaatttcc actttgtaaa atgagggtgg aggtgggaat aggatctcga ggagactatt 4200
ggcatatgat tccaaggact ccagtgcctt ttgaatgggc agaggtgaga gagagagaga 4260
gaaagagaga gaatgaatgc agttgcattg attcagtgcc aaggtcactt ccagaattca 4320
gagttgtgat gctctcttct gacagccaaa gatgaaaaac aaacagaaaa aaaaaagtaa 4380
agagtctatt tatggctgac atatttacgg ctgacaaact cctggaagaa gctatgctgc 4440
ttcccagcct ggcttccccg gatgtttggc tacctccacc cctccatctc aaagaaataa 4500
catcatccat tggggtagaa aaggagaggg tccgagggtg gtgggaggga tagaaatcac 4560
atccgcccca acttcccaaa gagcagcatc cctcccccga cccatagcca tgttttaaag 4620
tcaccttccg aagagaagtg aaaggttcaa ggacactggc cttgcaggcc cgagggagca 4680
gccatcacaa actcacagac cagcacatcc cttttgagac accgccttct gcccaccact 4740
cacggacaca tttctgccta gaaaacagct tcttactgct cttacatgtg atggcatatc 4800
ttacactaaa agaatattat tgggggaaaa actacaagtg ctgtacatat gctgagaaac 4860
tgcagagcat aatagctgcc acccaaaaat ctttttgaaa atcatttcca gacaacctct 4920
tactttctgt gtagttttta attgttaaaa aaaaaaagtt ttaaacagaa gcacatgaca 4980
tatgaaagcc tgcaggactg gtcgtttttt tggcaattct tccacgtggg acttgtccac 5040
aagaatgaaa gtagtggttt ttaaagagtt aagttacata tttattttct cacttaagtt 5100
atttatgcaa aagtttttct tgtagagaat gacaatgtta atattgcttt atgaattaac 5160
agtctgttct tccagagtcc agagacattg ttaataaaga caatgaatca tgaccgaaag 5220
gatgtggtct cattttgtca accacacatg acgtcatttc tgtcaaagtt gacacccttc 5280
tcttggtcac tagagctcca accttggaca cacctttgac tgctctctgg tggcccttgt 5340
ggcaattatg tcttcctttg aaaagtcatg tttatccctt cctttccaaa cccagaccgc 5400
atttcttcac ccagggcatg gtaataacct cagccttgta tccttttagc agcctcccct 5460
ccatgctggc ttccaaaatg ctgttctcat tgtatcactc ccctgctcaa aagccttcca 5520
tagctccccc ttgcccagga tcaagtgcag tttccctatc tgacatggga ggccttctct 5580
gcttgactcc cacctcccac tccaccaagc ttcctactga ctccaaatgg tcatgcagat 5640
ccctgcttcc ttagtttgcc atccacactt agcaccccca ataactaatc ctctttcttt 5700
aggattcaca ttacttgtca tctcttcccc taaccttcca gagatgttcc aatctcccat 5760
gatccctctc tcctctgagg ttccagcccc ttttgtctac accactactt tggttcctaa 5820
ttctgttttc catttgacag tcattcatgg aggaccagcc tggccaagtc ctgcttagta 5880
ctggcataga caacacaaag ccaagtacaa ttcaggacca gctcacagga aacttcatct 5940
tcttcgaagt gtggatttga tgcctcctgg gtagaaatgt aggatcttca aaagtgggcc 6000
agcctcctgc acttctctca aagtctcgcc tccccaaggt gtcttaatag tgctggatgc 6060
tagctgagtt agcatcttca gatgaagagt aaccctaaag ttactcttca gttgccctaa 6120
ggtgggatgg tcaactggaa agctttaaat taagtccagc ctaccttggg ggaacccacc 6180
cccacaaaga aagctgaggt ccctcctgat gacttgtcag tttaactacc aataacccac 6240
ttgaattaat catcatcatc aagtctttga taggtgtgag tgggtatcag tggccggtcc 6300
cttcctgggg ctccagcccc cgaggaggcc tcagtgagcc cctgcagaaa atccatgcat 6360
catgagtgtc tcagggccca gaatatgaga gcaggtagga aacagagaca tcttccatcc 6420
ctgagaggca gtgcggtcca gtgggtgggg acacgggctc tgggtcaggt ttgtgttgtt 6480
tgtttgtttg ttttgagaca gagtctcgct ctattgccca ggctggagtg cagtgtcaca 6540
atctcggctt actgcaactt ctgccttccc ggattcaagt gattctcctg cctcagcctc 6600
cagagtagct gggattacag gtgcgtgcca ccacgcctgg ctaatttttg tatttttgat 6660
agagacgggg tttcaccatg ttggccaggc tagtctcgaa ctcttgacct caagtgatct 6720
gcctgcctcg gcctcccaaa gtgctgggat tacaggcgtg agccaccaca cccagcccca 6780
ggttggtgtt tgaatctgag gagactgaag caccaagggg ttaaatgttt tgcccacagc 6840
catacttggg ctcagttcct tgccctaccc ctcacttgag ctgcttagaa cctggtgggc 6900
acatgggcaa taaccaggtc acactgtttt gtaccaagtg ttatgggaat ccaagatagg 6960
agtaatttgc tctgtggagg ggatgaggga tagtggttag ggaaagcttc acaaagtggg 7020
tgttgcttag agattttcca ggtggagaag ggggcttcta ggcagaaggc atagcccaag 7080
caaagactgc aagtgcatgg ctgctcatgg gtagaagaga atccaccatt cctcaacatg 7140
taccgagtcc ttgccatgtg caaggcaaca tgggggtacc aggaattcca agcaatgtcc 7200
aaacctaggg tctgctttct gggacctgaa gatacaggat ggatcagccc aggctgcaat 7260
cccattacca cgagggggaa aaaaacctga aggctaaatt gtaggtcggg ttagaggtta 7320
tttatggaaa gttatattct acctacatgg ggtctataag cctggcgcca atcagaaaag 7380
gaacaaacaa cagacctagc tgggaggggc agcattttgt tgtagggggc ggggcacatg 7440
ttctgggggt acagccagac tcagggcttg tattaatagt ctgagagtaa gacagacaga 7500
gggatagaag gaaataggtc cctttctctc tctctctctc tctctctctc actctctctc 7560
tctctcacac acacacacag acacacacac acgctctgta ggggtctact tatgctccaa 7620
gtacaaatca ggccacattt acacaaggag gtaaaggaaa agaacgttgg aggagccaca 7680
ggaccccaaa attccctgtt ttccttgaat caggcaggac ttacgcagct gggagggtgg 7740
agagcctgca gaagccacct gcgagtaagc caagttcaga gtcacagaca ccaaaagctg 7800
gtgccatgtc ccacacccgc ccacctccca cctgctcctt gacacagccc tgtgctccac 7860
aacccggctc ccagatcatt gattatagct ctggggcctg caccgtcctt cctgccacat 7920
ccccacccca ttcttggaac ctgccctctg tcttctccct tgtccaaggg caggcaaggg 7980
ctcagctatt gggcagcttt gaccaacagc tgaggctcct tttgtggctg gagatgcagg 8040
aggcagggga atattcctct tagtcaatgc gaccatgtgc ctggtttgcc cagggtggtc 8100
tcgtttacac ctgtaggcca agcgtaatta ttaacagctc ccacttctac tctaaaaaat 8160
gacccaatct gggcagtaaa ttatatggtg cccatgctat taagagctgc aacttgctgg 8220
gcgtggtggc tcacacctgt aatcccagta ctttgggacg tcaaggcggg tggatcacct 8280
gaggtcacga gttagagact ggcctggcca gcatggcaaa accccatctt tactaaaaat 8340
acaaaaatta gcaaggcatg gtggcatgca cctgtaatcc caggtactcg ggaggctgag 8400
acaggagaat ggcttgaacc caggaggcag aggttgcagt gagccaagat tgtgccactg 8460
ccctccagcc ctggcaacag agcaagactt catctcaaaa gaaaaaggat actgtcaatc 8520
actgcaggaa gaacccaggt aatgaatgag gagaagagag gggctgagtc accatagtgg 8580
cagcaccgac tcctgcagga aaggcgagac actgggtcat gggtactgaa gggtgccctg 8640
aatgacgttc tgctttagag accgaacctg agccctgaaa gtgcatgcct gttcatgggt 8700
gagagactaa attcatcatt ccttggcagg tactgaatcc tttcttacgg ctgccctcca 8760
atgcccaatt tccctacaat tgtctggggt gcctaagctt ctgcccacca agagggccag 8820
agctggcagc gagcagctgc aggtaggaga gataggtacc cataagggag gtgggaaaga 8880
gagatggaag gagaggggtg cagagcacac acctcccctg cctgacaact tcctgagggc 8940
tggtcatgcc agcagattta aggcggaggc aggggagatg gggcgggaga ggaagtgaaa 9000
aaggagaggg tggggatgga gaggaagaga gggtgatcat tcattcattc cattgctact 9060
gactggatgc cagctgtgag ccaggcacca ccctagctct gggcatgtgg ttgtaatctt 9120
ggagcctcat ggagctcaca gggagtgctg gcaaggagat ggataatgga cggataacaa 9180
ataaacattt agtacaatgt ccgggaatgg aaagttctcg aaagaaaaat aaagctggtg 9240
agcatataga cagccctgaa ggcggccagg ccaggcattt ctgaggaggt ggcatttgag 9300
c 9301
<210>19
<211>21
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>19
ccggagctgg agaacaacaa g 21
<210>20
<211>19
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>20
gcactggccg gagcacacc 19
<210>21
<211>23
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>21
aggccaaccg cgagaagatg acc 23
<210>22
<211>21
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>22
gaagtccagg gcgacgtagc a 21
<210>23
<211>25
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>23
aagcttggta ccatgcagctcccac 25
<210>24
<211>50
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>24
aagcttctac ttgtcatcgt cgtccttgta gtcgtaggcg ttctccagct 50
<210>25
<211>19
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>25
gcactggccg gagcacacc 19
<210>26
<211>39
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>26
gtcgtcggat ccatggggtg gcaggcgttc aagaatgat 39
<210>27
<211>57
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>27
gtcgtcaagc ttctacttgt catcgtcctt gtagtcgtag gcgttctcca gctcggc 57
<210>28
<211>29
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>28
gacttggatc ccaggggtgg caggcgttc 29
<210>29
<211>29
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>29
agcataagct tctagtaggc gttctccag 29
<210>30
<211>29
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>30
gacttggatc cgaagggaaa aagaaaggg 29
<210>31
<211>29
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>31
agcataagct tttaatccaa atcgatgga 29
<210>32
<211>33
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>32
actacgagct cggccccacc acccatcaac aag 33
<210>33
<211>34
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>33
acttagaagc tttcagtcct cagccccctc ttcc 34
<210>34
<211>66
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>34
aatctggatc cataacttcg tatagcatac attatacgaa gttatctgca ggattcgagg 60
gcccct 66
<210>35
<211>82
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>35
aatctgaatt ccaccggtgt taattaaata acttcgtata atgtatgcta tacgaagtta 60
tagatctaga gtcagcttct ga 82
<210>36
<211>62
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>36
atttaggtga cactatagaa ctcgagcagc tgaagcttaa ccacatggtg gctcacaacc 60
at 62
<210>37
<211>54
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>37
aacgacggcc agtgaatccg taatcatggt catgctgcca ggtggaggag ggca 54
<210>38
<211>31 <212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>38
attaccaccg gtgacacccg cttcctgaca g 31
<210>39
<211>61
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>39
attacttaat taaacatggc gcgccatatg gccggcccct aattgcggcg catcgttaat 60
t 61
<210>40
<211>34
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>40
attacggccg gccgcaaagg aattcaagat ctga 34
<210>41
<211>34
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>41
attacggcgc gcccctcaca ggccgcaccc agct 34