WO1998001579A1 - System for detecting protein-protein interactions - Google Patents

System for detecting protein-protein interactions Download PDF

Info

Publication number
WO1998001579A1
WO1998001579A1 PCT/FR1997/001133 FR9701133W WO9801579A1 WO 1998001579 A1 WO1998001579 A1 WO 1998001579A1 FR 9701133 W FR9701133 W FR 9701133W WO 9801579 A1 WO9801579 A1 WO 9801579A1
Authority
WO
WIPO (PCT)
Prior art keywords
protein
mutated
mutation
sequence
operator
Prior art date
Application number
PCT/FR1997/001133
Other languages
French (fr)
Inventor
Michèle GRANGER
Manfred Schnarr
Original Assignee
Centre National De La Recherche Scientifique
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National De La Recherche Scientifique filed Critical Centre National De La Recherche Scientifique
Priority to EP97930586A priority Critical patent/EP0909331A1/en
Publication of WO1998001579A1 publication Critical patent/WO1998001579A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1055Protein x Protein interaction, e.g. two hybrid selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/73Fusion polypeptide containing domain for protein-protein interaction containing coiled-coiled motif (leucine zippers)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Definitions

  • the subject of the invention is a system for detecting protein-protein interactions, and more particularly DNA sequences for the implementation of this system, as well as cellular hosts containing said DNA sequences.
  • Such systems have been recently developed using yeast as a host and activation of the transcription of a specific gene as a "probe” (see Fields and Sternglanz, 1994). However, although already well used, this system has certain limits.
  • the other major difficulty consists in identifying proteins Y which interact with a protein X provided with a domain of activation of the transcription, since, in this case, the target protein (Gal4-X or LexA-X) will give a signal constitutive activation in the absence of any protein Y.
  • Gal4 is a modular protein of 881 amino acids with at least two functional domains.
  • a DNA binding domain comprising amino acids 1-94 and a transcription activation domain.
  • the activation function is in fact distributed over three different segments of the protein, namely 94-106, 148-196 and 768-881 (Marmorstein et al., 1992).
  • the structure of Gal4j.65 involved in a complex with DNA has been determined by X-ray crystallography (Marmorstein et al., 1992) while the structure of the activation domain remains very poorly defined.
  • the double-hybrid technique also allows the identification of an unknown partner from the moment when one is in possession of the gene for the target protein X.
  • the team by Stanley Fields was the first to exploit this possibility (Chien et a, 1991) by creating fusions between the activation domain 768-881 of Gal4 and protein sequences encoded by DNA fragments from a library of Genomic yeast DNA. This time, the activation domain was placed at the NH2-terminal end of this family of fusion proteins, in order to facilitate the construction of the hybrid proteins.
  • LexA is a protein of 202 amino acids, composed of two domains linked by a hinge region of approximately 30 amino acids. The first 70 amino acids constitute the DNA binding domain (Hurstel et al, 1986; Fogh et al, 1994) and amino acids 100 to 202 form the protein dimerization domain (Schnarr et al., 1985) . LexA recognizes sites palindromic DNA (SOS operators) and several adjacent operators can be occupied in a cooperative manner (Lloubès et al, 1991).
  • LexA as a DNA binding medium can have several advantages.
  • .LexA belongs to a heterologous organism (Escherichia coli), does not affect the growth of yeast, has no residual transcriptional activity (like segment 94-106 of Gal4) and can be used in strains of yeast gal + . Therefore, one of the hybrid proteins (usually the one containing the activation domain) can be placed under the control of Gal4. Thus, the hybrid protein will be expressed only in the presence of galactose, but not in the presence of glucose.
  • the field of activation used by Roger Brent's team also comes from Escherichia coli. It is one of the artificial activator domains isolated by Ma and Ptashne (1987b).
  • This domain (named B42) has a lower activation potential than the activation domains of Gal4 or VP16, which makes it possible to avoid the problems of toxicity linked to a possible "squelching" (the titration of an element essential of the transcription machinery by an activation domain).
  • a recent description of the double-hybrid system based on the use of LexA can be found in Golemis et al (1996) and Golemis and Brent (1996).
  • the double-hybrid system shows a strong polarity for the Myc / Max couple.
  • Myc is fixed on DBD and Max on AD
  • Max is fixed on DBD and Myc on AD
  • an activation is observed in agreement with biochemical data showing that the two proteins interact.
  • the indicator bacterial strain is deficient in LexA and carries the lacZ gene under the control of an SOS operator recognized by LexA (the sulA operator).
  • the hybrid protein placed under the control of the lacUVS promoter inducible by 1TPTG, is produced from a plasmid so as to be able to adapt the quantity of protein to experimental needs.
  • This system is perfectly suited to the study of a homodimeric complex, but its use becomes laborious the moment one wants to study the heterodimerization between two different proteins capable of also forming homodimers.
  • the invention particularly aims to solve the difficulties presented by the systems of the prior art and, in particular, the invention aims to allow the study of heterodimerization.
  • the subject of the invention is a system allowing the detection of interaction between two grafted proteins, by visualizing the repression of transcription and not by activating transcription. Unlike the yeast system, a protein with intrinsic activating activity could be used.
  • the subject of the invention is a system for detecting protein-protein interactions using a bacterium (Escherichia coli) as a host organism, commonly used in all molecular biology laboratories.
  • a bacterium Esscherichia coli
  • the subject of the invention is a system for detecting protein-protein interactions avoiding the problem of addressing fusion proteins in the nucleus as is the case in yeast, thanks to the non-compartmentalisation of E . coli, in particular the absence of a structured nucleus.
  • the subject of the invention is a system suitable for studying the interactions of proteins located in the cytoplasmic membrane.
  • the subject of the invention is a test (repression of transcription) potentially allowing the identification of proteins interacting with the activation domains of transcription factors, among which there are many oncogenic products involved in carcinogenesis, such as Jun, Fos. or ⁇ ts family members.
  • the subject of the invention is a system for studying protein-protein interaction (determination of interaction forces, identification of structural or sequence elements important for this interaction, analysis of the specificity of the interaction) more reliable than the yeast system (Estojak et al. 1995).
  • the subject of the invention is a system for studying protein-protein interaction making it possible to detect interactions when the "hook" protein (the one for which the partner (s) is sought) has intrinsic capacities for activating transcription ( Bartel et al. 1993, Golemis and Brent 1996, Golemis et al 1996) and this occurs quite frequently (Ma and Ptashne 1988), and therefore the invention relates to a system allowing the study of the interactions of a " true "domain of transcription activation;
  • the subject of the invention is a protein-protein interaction detection system allowing the examination of a large number of clones (> 10 6 ) thanks to the transfection efficiency of E. Coli which is clearly greater than that of yeast (of the order of 1000 times) and thus the screening of cDNA or genomic DNA libraries.
  • the invention relates to the use of a DNA sequence comprising:
  • nucleotide sequence being under the control of the above promoter comprising the above mutated operator containing two sequences and deriving from an operator containing two inverted repeated sequences (palindrome), this operator being such that, in the non-mutated state (wild), it leads to the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of said inverted repeat sequences via their DNA binding site, this mutated operator being such that the one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated in a silent manner or comprises a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it one specifically recognizes the sequence comprising the mutation 1, the other the sequence which is in the wild state, or which is mutated in a silent manner or which comprises a mutation 2, the homodi
  • heterodimers comprising:
  • a regulatory protein for example LexA, regulates the expression of genes in vivo by binding to specific sequences located upstream of these genes (operator sequences).
  • the operator used in the context of the invention is a mutated operator deriving from a non-mutated operator which is such that, in the wild, its sequences are palindromic (repeated inverted) and recognized by homodimers of the regulatory protein .
  • the regulatory protein for example LexA, is organized into two domains, a DNA binding domain which specifically recognizes operator sequences and a dimerization domain through which the interactions between two protein monomers stabilize the interaction of dimers on DNA. Each monomer is fixed on a half-operator. By “half-operator” is meant the sequence specifically recognized by each monomer.
  • the operator sequence recognized by a regulatory protein has been modified so that a half-operator remaining wild will be recognized by the wild regulatory protein, for example LexA, while the other half operator will be mutated and recognized by a mutated form of the regulatory protein.
  • Each of these DNA binding domains can be fused to protein domains capable of heterodimerizing and any interaction between these domains is measured by a more or less significant repression of the indicator gene (also designated by "reporter gene”).
  • indicator gene is meant: - Or a gene coding for a protein whose activity on the one hand is revealed by the color which it confers on the bacterial clones producing it and on the other hand can be quantitatively measured, for example the lacZ gene, the gene coding for luciferase,
  • bacterium dies, for example the sulA gene.
  • the toxic gene is a gene coding for resistance to an antibiotic
  • the mixed operator op408 / opWT is placed in the promoter of the gene coding for the repressor of this antibiotic resistance gene.
  • homodimers denotes non-covalent associations of proteins in which the protein-protein interaction domains are identical and covalently linked to heterologous or homologous protein binding domains of DNA, which are themselves identical or different.
  • heterodimers non-covalent associations of proteins in which the protein-protein interaction domains are different and covalently linked to heterologous or homologous protein binding domains of DNA, which are themselves identical or different.
  • silent mutation carried by one of the operator's sequences is meant a mutation which does not affect the recognition of said sequence by the wild-type regulatory protein.
  • mutant 2 carried by the operator sequence is meant a mutation different from mutation 1, and which is such that the sequence comprising said mutation 2 is recognized by a regulatory protein which is not capable of recognizing the sequence carrying the mutation 1, the mutation 1 itself being as recognized by a regulatory protein which is not capable of recognizing the sequence carrying the mutation 2.
  • protein-protein interaction we mean the non-covalent assembly of two (or more) proteins by Van der Waals interaction (electrostatic interactions between opposite charges, hydrogen bonds, interactions hydrophobic). The area masked by such an interaction is generally from 1400 to 1600 A ° 2 (for a review see: J. Janin "Principles of protein / protein recognition from structure to thermodynamics” 1995, Biochemistry 27: 497-505).
  • DNA binding domain of a protein is defined the part of the protein whose integrity is essential for its non-covalent attachment to DNA.
  • interaction detection is meant a method for visualizing an interaction between two proteins.
  • protein capable of recognizing the sequence of an operator designates a protein capable of making non-covalent bonds with a particular DNA sequence.
  • binding domain fused to a protein designates a protein domain linked by a peptide bond to another protein or protein domain.
  • the regulatory protein is devoid of its dimerization domain, which can however be tolerated if the interactions resulting from the presence of the dimerization domain are weaker than those which it is desired to bring into play. evidence.
  • the invention also relates to a DNA sequence comprising:
  • a mutated operator said nucleotide sequence being under the control of a promoter comprising a mutated operator containing two sequences and deriving from an operator containing two inverted repeat sequences (palindrome), this operator being such that, in the non-mutated state (wild), it leads to the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of said inverted repeat sequences via their DNA binding site, this mutated operator being such that the one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated in a silent manner or comprises a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it recognizes s one specifically the sequence with mutation 1, the other the sequence which is in the wild, or which is mutated in a silent manner or which contains a mutation 2, the homodimers
  • the invention relates to a DNA sequence characterized in that it comprises a mutated operator containing two sequences and derived from an operator containing two inverted repeat sequences (palindrome), one of these two sequences being mutated, and the another being in the wild.
  • the mutated sequence can be upstream or downstream of the sequence in the wild.
  • mutated operator contains the following sequence:
  • the CCGT and ACAG sequences correspond to the CTGT and ACAG sequences of the non-mutated operator respectively.
  • the present invention relates to a DNA sequence characterized in that the nucleotide sequence coding for the indicator protein is the lacZ gene in E. coli, coding for ⁇ -galactosidase, the mutated operator contains two sequences and is derived from an operator containing two inverted repeat sequences (palindrome), one of these two sequences being mutated, and the other being in the wild, the mutated sequence preferably being that located downstream of the sequence in the wild, the wild sequence being recognized specifically by the wild LexA protein or by a fragment of LexA containing the DNA binding site, in particular a fragment defined by positions 1 to x of LexA, x varying from 69 to 87, and in particular by fragments 1 to 69 or 1 to 87 of .LexA, and the mutated sequence being recognized by the mutated LexA protein or by a mutated fragment of LexA containing the DNA binding site, in particular a mutated fragment of LexA corresponding to that defined by positions 1 to x of LexA
  • dimerization domain is meant the part of the protein whose integrity is essential for non-covalent interaction with itself (homodimer) or with another dimerization domain (heterodimer).
  • the present invention also relates to a complex between - a DNA sequence comprising a nucleotide sequence coding for an indicator protein, said nucleotide sequence being under the control of a promoter comprising a mutated operator containing two sequences and derived from an operator containing two inverted repeat sequences (palindrome), this operator being such that, in the non-mutated (wild) state, it results in the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of the said inverted repeat sequences via their DNA binding site, this mutated operator being such that one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated silently or contains a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it specifically recognizes one the sequence comprising the mutation 1, the other the sequence which is in the
  • the first monomer being such that it contains a first fusion protein containing the site of attachment to the DNA of a regulatory protein capable of specifically recognizing the sequence of the mutated operator containing the mutation 1, the aforementioned site of fixation being fused to one of the two proteins or to one of the two protein domains, involved in the above interactions,
  • the second monomer being such that it contains a second fusion protein containing the DNA binding site of a regulatory protein capable of specifically recognizing the sequence not mutated, or mutated silently or comprising the mutation 2 of the mutated operator, the above-mentioned binding site being fused to the other of the two proteins or to the other of the two protein domains, involved in the above interactions.
  • the invention also relates to a cell host containing a DNA sequence as described above.
  • the invention also relates to a method for detecting and quantifying interactions between two proteins or protein fragments, characterized
  • nucleotide sequences coding for the first and the second monomer respectively containing a first and a second fusion protein as defined above are brought into contact with a DNA sequence as described above, and
  • the invention relates to a method for identifying a protein interacting with a specific protein, characterized
  • genomic library containing in particular DNA fragments, and in particular cDNA, each capable of coding for a protein interacting with the determined protein, each of the different elements of the genomic library being respectively fused to the sequence coding for a protein regulatory as defined above,
  • the indicator gene is lacZ and has been placed under the control of a promoter / operator sequence characterized in that the operator has been mutated as indicated below.
  • This strain makes it possible to identify, on the basis of the color of the bacterial clones, the existence of protein-protein interactions between two proteins or protein domains fused respectively to the DNA binding domain of wild LexA and LexA408 as described below. This strain makes it possible to quantify and analyze this interaction by mutagenesis.
  • screening a DNA library requires the analysis of at least 10 ⁇ clones. This implies obtaining on an appropriate solid indicator medium (as indicated in FIG. 5) and the experiment of 10 ⁇ bacterial colonies whose color should be checked (white or pink in the event of interaction and red in the absence of interaction) . Although theoretically feasible, this is very costly not only in time, but also in disposable equipment.
  • the following selection system is advantageously used.
  • the protein-protein interactions are no longer visualized on the basis of the color of the bacterial clones, but on the simple fact of their existence. Indeed, if the indicator gene is replaced by a gene coding for a toxic protein:
  • the bacteria can then divide and give rise to a colony on solid culture medium.
  • the toxic gene used is the sulA gene. It codes for a protein, SULA, an inhibitor of cell division. In its presence, the bacteria no longer divides and dies.
  • Figure 1 relates to the principle of operation of the double-hybrid system in E. coli
  • the system is based on the fact that a mutated operator containing 1/2 wild operator (WT) and 1/2 mutated operator (408) is only recognized by a mixed LexAWT / .LexA408 dimer.
  • An indicator gene (lacZ represented by an empty rectangle) was put under the control of this mixed operator (represented by a black rectangle for the non-mutated and annotated WT part and by a hatched rectangle for the mutated and annotated part 408).
  • Proteins or subdomains of proteins X and Y capable of interacting are fused to the DNA binding domains of LexAi-87WT (represented by a black sphere) and LexAi-g7408 (represented by a hatched sphere).
  • LexAi-g7WT- X (represented by a hatched rectangle connected to a hatched sphere) and LexA 1-87408- Y (represented by a black rectangle connected to a black sphere) are cloned on compatible plasmids and their expression is controlled by a inducible promoter (lacUV5, Oertel-Buchheit P., Lamerichs RMJN, Schnarr M. and Granger-Schnarr M. 1990 Mol. Gen. Broom. 222: 40-48 Genetic analysis of the LexA repressor: isolation and characterization of LexA (Def) mutant proteins.).
  • the plasmids are represented by circles, a thickened part of which is separated into two, one represents the gene coding for the proteins, LexA ⁇ _87WT-X or LexA 1-87408-Y and the other for their promoter sequence, lacUV5).
  • These proteins, LexAi-87WT-X and LexAi-87408-Y can exist either in free form in the bacteria, or in form linked to DNA (represented by a black rectangle linked to a gray sphere interlaced with a hatched rectangle linked to a hatched sphere themselves connected to the black and hatched rectangles representing the mixed operator described above.).
  • the LacUV5 promoter is itself under the control of a regulatory protein, the lactose repressor (represented by a square with rounded corners and segmented into boxes).
  • the gene coding for this repressor (lacl gene) is cloned on an episome, factor F '(Willetts N. and Skurray R. in E. coli and Salmonella Typhimurium, Cellular and Molecular Biology Ed. Neidhardt FC 1987, pp 1110-1133 and Oertel-Buccheit et al 1990) itself represented by an arc of a circle.
  • the lactose repressor can exist either in free form in the bacterium, or in form linked to DNA (represented by a square with rounded corners and segmented in cartons linked to the promoter sequences, lacUV5 described above).
  • LexA means that the strain is devoid of endogenous LexA.
  • Figure 2 shows the construction of the indicator strain for the implementation of a double hybrid system in E. coli.
  • the plasmid pRS415 (represented by the circle containing inside the indication "pRS415" (SIMONS RW, HOUMAN F. & KLECKNER N. (1987). Improved single and multicopy lac-based cloning vectors for protein and operon fusions. Gene 52: 85-96) carries the lacZ gene, lacking a promoter / operator region (represented by a thickening of the line) and two unique cleavage sites for two restriction enzymes EcoRI and BamHI. "Lac” means that this plasmid is incapable of produce the lacZ gene product since it lacks a promoter / operator sequence. This plasmid is cut by these two enzymes and then ligated to an oligonucleotide of 70 base pairs (70 mer and represented by a black rectangle) whose sequence is the next one :
  • this oligonucleotide thus introduces before the lacZ gene a promoter / operator sequence allowing the lacZ gene to be transcribed and regulated by the mixed operator as defined in the legend for figure 1.
  • This ligation by an arrow between the plasmid and the 70mer creates the plasmid pGC202 (represented by the circle
  • “Lac” means that this plasmid is now capable of producing the lacZ gene product since it is provided with a promoter / operator sequence.
  • the indicator gene thus formed (represented by a black rectangle for the promoter / operator sequence and by a white rectangle for the lacZ gene) is then transferred to the DNA of a lambda phage ( ⁇ ) by a double recombination event between l Plasma and phage DNA (double recombination event is understood to mean a complex molecular mechanism occurring in vivo and resulting in the exchange of DNA fragments between partially homologous molecules, this is shown in the figure by two crosses between the plasmid pGC 202 and a line symbolizing the phage DNA) giving rise to the phage ⁇ GC 202.
  • This phage has the capacity to integrate into the bacterial chromosome by a complex mechanism taking place in vivo (Elledge et al. 1991).
  • the advantage of this system lies in the fact that the indicator gene will be on the bacterial chromosome and no longer on a plasmid, which makes it possible to use the plasmid vectors as a vehicle for fusion proteins.
  • Figure 3 concerns the characterization of the SU202 strain as a function of the quantity of proteins present in the cell.
  • the variation in the quantity of proteins is obtained by cultivating the bacteria in the presence of variable concentrations of IPTG, the genes coding for the chimeric proteins being under the control of the inducible promoter lacUV5.
  • the ⁇ -galactosidase units are measured according to the method described by Miller (1972).
  • the relative expression of ⁇ -galactosidase is calculated by making the ratio between the ⁇ -galactosidase units measured in the presence of the expression vectors and those measured in their absence, the latter correspond to the non-repressed state of the lacZ gene.
  • the white squares correspond to the values measured when the strain contains a plasmid expressing LexA 1-87408-cJunZip (pDL606, see Figures 6 and 7).
  • the white circles correspond to the values measured when the strain contains a plasmid expressing the DNA binding domain alone (JWL96, Little JW and Hill SA (1985) Deletion within the hinge region of a specifies DNA-binding protein Proc. Natl. Acad. Sci USA, 22: 2301-2305).
  • the white triangles correspond to the values measured when the strain contains a plasmid expressing LexAi-g7WT-cFosZip (pMS404, see Figures 8 and 9).
  • the black squares correspond to the values measured when the strain contains both the plasmid expressing the domain DNA binding alone (JWL96) and that expressing LexAi-87408-cJunZi ⁇ (pDL606, see Figures 6 and 7).
  • the black circles correspond to the values measured when the strain contains both the plasmid expressing LexAi-87408-cJunZip (pDL606, see Figures 6 and 7) and that expressing LexAi-87WT-cFosZip (pMS404, see Figures 8 and 9).
  • Figure 4 represents the bacterial strain SU202 which makes it possible to selectively measure the heterodimerization of fusion proteins capable of homodimerizing.
  • Fos leucine zipper mutants were constructed in the laboratory, these mutants acquired the ability to homodimerize (unlike Fos leucine zipper, which is incapable of this). Four of these mutants are used here and are described in: Porte D., Oertel-Buccheit P., Granger-Schnarr M. and Schnarr M. 1995 J. Biol. Chem. 22Q: 22721-22730 Fos leucine zipper variants with increased association capacity, These are:
  • the number of units measured remains constant, indicating that the gene coding for ⁇ -galactosidase is completely expressed, when the number of units measured decreases, this means that the gene coding for ⁇ -galactosidase is repressed , the intensity of the repression being a function both of the amount of protein present in the cell (it increases when the concentration of IPTG increases) and of the interaction strength of the proteins with each other.
  • strain SU202 (as described in this claim) does not "respond" to homodimerization (lacZ controlled by a mixed operator WT / 408).
  • This staining means that the ⁇ -galactosidase gene is not repressed by the fusion proteins and that the enzyme produced ferments the lactose in the medium.
  • the bacteria cotransformed by the two plasmids grow white, the ⁇ -galactosidase gene is suppressed.
  • Figure 6 shows the map of plasmid pDL606 (for cloning the "hook").
  • the restriction sites indicated are unique sites.
  • Ap represents the gene coding for resistance to ampicillin, p15, at the origin of replication of the plasmid.
  • the vector is of pACYC type (New England Biolabs, Inc): pACYC177.
  • Figure 7 shows the sequence of part of the plasmid pDL606 coding for the fusion protein LexAi-87408-cJunZip. The indicated sites make it possible to locate oneself on the map of figure 6.
  • Figure 8 shows the map of plasmid pMS404.
  • the restriction sites indicated are unique sites.
  • Tet represents the gene coding for resistance to tetracycline, Ori the origin of replication of the plasmid.
  • the vector is of the pUC type (New England Biolabs, Inc).
  • Figure 9 shows the sequence of part of the plasmid pMS404 encoding the fusion protein LexAi-87WT-cFosZip. The indicated sites make it possible to locate oneself on the map of figure 8.
  • Figure 10 shows the map of plasmid pL23B (plasmid vector for bank cloning for SU202). The restriction sites indicated are unique sites. Tet represents the gene coding for resistance to tetracycline, Ori the origin of replication of the plasmid.
  • This plasmid carries the DNA binding domain of a LexA mutant, LexA 1-823 (G-> S mutation in position 23). This mutation does not affect recognition specificity (LexA23 recognizes the same sequence as LexAWT) but does affect the strength with which this protein / DNA interaction occurs. In fact, to improve the system, we found that by decreasing the force of interaction between LexA and DNA, we gained in sensitivity.
  • This plasmid is intended for the cloning of a library.
  • Figure 11 shows the sequence of part of the plasmid pL23B coding for LexA 1-8723.
  • the bank can be cloned behind LexAi-8723 using one of the following unique sites: Xhol, EcoRI, Sfil. Downstream of these sites, three stop codons (TAA) were inserted into the three reading frames in order to limit the fusion protein. The indicated sites make it possible to locate oneself on the map of figure 10.
  • the double-hybrid system in E. coli is based on the use of LexA, a bacterial repressor. Wild LexA specifically recognizes and in the form of dimers a palindromic sequence of 16 base pairs, CTGT (N) 8 ACAG, called operator. The 4 external base pairs are highly conserved, while the central motif is more variable.
  • Each LexA monomer is composed of a DNA binding domain which recognizes the CTGT sequence and a dimerization domain essential for binding to DNA since the DNA binding domain lacking a dimerization domain, only fixes DNA very weakly.
  • LexA408 carries a triple mutation (P40 ⁇ A, N41- »S, A42 ⁇ S) and recognizes the following sequence CCGT (N) 8 ACGG.
  • the system according to the present invention is based on the fact that a mutated operator containing 1/2 wild-type operator and 1/2 mutated operator is recognized only by a mixed LexAWT / LexA408 dimer.
  • An indicator gene (lacZ) also designated by reporter gene was put under the control of this operator. Proteins or subdomains of proteins X and Y capable of interacting are then fused to the DNA binding domains, LexA _87WT and LexA ⁇ _ 87408.
  • FIG. 1 illustrates this system. LexA ⁇ _87WT-X and LexA ⁇ _87408-Y are cloned on compatible plasmids and their expression is controlled by an inducible promoter (lacUVS).
  • the indicator strain overexpressing the repressor of the lactose promoter (since lacF ⁇ ), one can then modulate the expression of LexA ⁇ _87WT-X and LexA ⁇ _87408-Y by adding variable concentrations of the inducer IPTG.
  • This system has two main uses:
  • I) - X and Y can be proteins or protein domains characterized and interacting with each other, they then give the hybrid proteins the ability to bind stably to DNA and thus repress the lacZ gene.
  • Such an interaction can be visualized on an appropriate indicator medium (for example Mac Conkey and described below) and can also be quantified by assaying the lacZ gene product, ⁇ -galactosidase according to the method described by Miller JH, 1972 "Experiments in Molecular Genetics, Cold Spring Harbor Lab. Cold Spring Harbor, NY); it is thus possible:
  • - X is a protein or a protein domain capable of interacting with a protein (s) still unknown that we want to identify.
  • a bank is then grafted onto Y (or X), this bank being cointroduced into the indicator strain with the gene coding for the hybrid protein for which the partner or partners are sought.
  • Any element of the coding bank for a protein or a protein domain interacting with X (or Y) gives rise to a bacterial clone whose color on an appropriate medium is different from those for which there is no interaction. This or these elements are then identified by sequencing.
  • the plasmid pRS415 carrying the lacZ gene devoid of promoter / operator region (Simons RW, Houman F. & Kleckner N. (1987). Improved single and multicopy lac-based cloning vectors for protein and operon fusions. Gene 5_2: 85-96 .) is open to EcoRI / BamHI restriction sites. Between these two unique restriction sites, the following double-stranded oligonucleotide has been inserted:
  • the strain JL1434 (LexA (Def), Lac "), transformed by the plasmids pGC202, was infected by the bacteriophage ⁇ d (Lac ⁇ ⁇ Hochschild A. & Ptashne M. (1988). Interaction at a distance between ⁇ repressors disrupts gene activation Nature 226: 353-357) whose genome carries immediately to the left of a lacZ gene devoid of promoter and initiation codon (ATG) of translation, a sequence derived from the vector pBR322 and which is also found to the left of the EcoRI cloning site of the plasmid pRS415 (see figure 2).
  • the lacZ gene is found under the control of the promoter / clone operator in pGC202 giving rise to phage ⁇ GC 202.
  • isolating lysogenic bacteria is to obtain stable integration of the recombinant phage into the bacterial chromosome, which is then in the prophage state. This is done from a second infection of the bacteria JL1434 with mini-preparations of the phage previously obtained in order to get rid of the initial plasmid and thus to ensure that the Lac character "* " is well carried by the phage.
  • the recombinant ⁇ phages After infection of the JL1434 strain, the recombinant ⁇ phages begin a lysogenic cycle which leads to stable integration by site-specific recombination of their genomes (and therefore of the lacZ gene controlled by the promoter / operator element described above) in the bacterial chromosome, at the att b site between the gay and organic operons.
  • the lysogenic Lac " * * SU202 strain was thus isolated.
  • This indicator strain carries the genes for resistance to Kanamycin and Chloramphenicol.
  • the genes coding for the hybrid proteins are carried by two compatible plasmid vectors carrying different origins of replication (pMBl or pl5A) as well as the selection for two different markers (tet ⁇ or amp ⁇ ) thus making it possible to maintain them simultaneously in the same bacterium. host.
  • the indicator strain SU202 was tested with the following chimeric proteins LexAi-87408-cJunZip and LexAi-87WT-cFosZip, they consist of the DNA binding domain (mutant 408 or wild-type (WT)) of the repressor LexA (aa 1 -87) and of the dimerization domain (leucine slide or "leucine zipper") of the oncoproteins cJun (aa 277-315) and cFos (aa 102-200).
  • FIG. 6 represents a map of the entire plasmid accompanied by the unique restriction sites
  • the vector is a pACYC177 (New England Biolabs, Inc.); it carries resistance to ampicillin and pi 5 A as the origin of replication.
  • FIG. 7 represents the part of the sequence of this plasmid corresponding to the fusion protein, this sequence being identifiable on the general map using the restriction sites.
  • FIG. 8 represents a map of the whole of the plasmid accompanied by the unique restriction sites
  • the vector is a plasmid related to a pBR322 (New England Biolabs, Inc.); it carries resistance to tetracycline and pMB1 as the origin of replication.
  • FIG. 9 represents the part of the sequence of this plasmid corresponding to the fusion protein, this sequence being identifiable on the general map using the restriction sites.
  • the genes encoding these two fusion proteins are controlled by the inducible promoter lacUV5.
  • lacUV5. The indicator strains overexpressing this repressor (since lacl' ⁇ ), make it possible to modulate the expression of LexAi- 87408-cJunZip and LexAi-87WT-cFosZip in the presence of different concentrations of inducer (IPTG).
  • the SU 202 strain is transformed either with each of the plasmids carrying the genes coding for the fusion proteins LexA ⁇ _87408-cJunZip and LexAi- 87WT-cFosZip or cotransformed with the two plasmids.
  • the transformed cells are left overnight at room temperature in LB (Maniatis et al.) Added respectively with either kanamycin, chloramphenicol, ampicillin or kanamycin, chloramphenicol, tetracycline or the four antibiotics: kanamycin, chloramphenicol, ampicillin and tetracycline, before d 'be spread on McConkey medium containing the same antibiotics.
  • Figure 5 shows, after transplanting onto the same box, the results obtained.
  • This type of culture medium contains inter alia lactose which is hydrolyzed by ⁇ -galactosidase to allolactose.
  • allolactose is the natural inducer of the lactose promoter, when the bacteria having one or both genes coding for the chimeric proteins are cultured on this medium, these are partially induced. It is estimated that the induction corresponds to that which one observed in LB medium supplemented with 10 " 5 M in IPTG. A significant difference was observed in the coloration of the bacterial clones indicating that the indicator strain constructed met the defined criteria, in fact:
  • the ⁇ -galactosidase is therefore not produced by the cells; this double transformation allows the cell to simultaneously produce the two chimeric proteins LexAi-87408-cJunZip and .LexAi-87WT-cFosZip; the absence of production of ⁇ -galactosidase indicates that the heterodimer LexA i -87408- cJunZip / LexA ⁇ _87WT-cFosZip, is unlike homodimers, capable of repressing the lacZ gene.
  • This indicator strain is therefore very functional, it makes it possible to highlight protein / protein interactions on the simple basis of the color of the clones, it is very specific and makes it possible to discriminate between homo- and heterodimerization.
  • the efficiency with which the indicator gene is suppressed can be quantitatively measured by in vitro assay of ⁇ -galactosidase activity. This test is carried out under the conditions described by Miller J.H. (1972) in Experiments in molecular genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY
  • the values of the dosages described represent the average of at least three independent experiments and are carried out in the presence of variable concentrations of IPTG.
  • This strain can also be used to identify the determinants of these interactions either by random mutagenesis or by site-directed mutagenesis. For example, it was hypothesized that the specificity of heterodimerization between the zippers of Jun and Fos was due to the non-homodimerization of the zipper of Fos. This strain made it possible to show that this was not the case since Fos mutants capable of homodimerizing did not lose this specificity ( Figure 4).
  • the cells transformed only by the plasmids coding for the Fos mutants grow red on McConkey medium. Homodimerization is therefore not detected in this strain.
  • the bacteria also produce LexAi-87408-cJunZip, they grow white if the Fos mutants are improved in their protein / protein interaction compared to wild Fos, and pink if the Fos mutants are less good.
  • the intensity of the color is always inversely proportional to the capacity for heterodimerization ( ⁇ -galactosidase assay).
  • strain SU202 Use of the strain SU202 to identify the partner (s) of a protein or a characterized protein domain
  • FIG. 10 represents a map of the whole of the plasmid accompanied by the unique restriction sites, the vector is a plasmid related to a pBR322 (New England Biolabs, Inc.) it carries resistance to tetracycline and pMB1 as the origin of replication.
  • FIG. 11 represents the part of the sequence of this plasmid corresponding to the fusion protein, this sequence being identifiable on the general map using the restriction sites.
  • the two plasmids are simultaneously introduced into the SU202 strain and the transformed bacteria are:
  • Each clone carries a different library element coding for a different protein or protein domain, when this protein or protein domain is capable of establishing protein / protein interactions with the "hook", it gives rise to a clone white or pink among a carpet of red clones, which represent all the elements of the library coding for proteins or protein domains which do not interact with the hook.
  • This modification consists in introducing a point mutation in the natural operator sequence of sulA:
  • CTGTACATCCATACAG WT operator
  • CCGTACATCCATACAG mixed operator 408 / WT.
  • the sulA gene is in vivo repressed by LexA, the introduction of the op408 mutation prevents this repression, the gene product is then synthesized and the bacteria die, making the selection of such a construction impossible. It is therefore necessary to find a means other than suppression to control the production of SULA.
  • STOP codon is a specific sequence of three base pairs serving as a stop signal for the translational machinery.
  • a suppressor tRNA is tRNA capable of recognizing a STOP codon and of allowing further translation.
  • the bacterial host (SU202) which is used being carrying the suppressor tRNA SupE which, in place of the STOP codons (UAG), introduces a Glutamine residue, two to four glutamine residues have been replaced by TAG codons .
  • the sulA gene nailed into a plasmid was given by S. Cole (Institut Pasteur, Paris).
  • the STOP TAG codons were introduced at the level of Glutamines 42,47 on the one hand, and 42,47 55 and 56 on the other hand, giving rise to constructions called respectively sulA 2STOP and sulA 4STOP.
  • the 408 mutation was then introduced by the same mutagenesis process and identical results were obtained with sulA 2STOP and sulA 4STOP.
  • the constructions obtained were called op408 / opWT sulA 2STOP and op408 / opWT sulA 4STOP.
  • op408 / opWT sulA 2STOP or op408 / opWT sulA 4STOP can be introduced into the strain SU202 if they are co-transformed with plasmids carrying the genes coding for the fusion proteins LexA _ 7408- cJunZip and .LexA ⁇ _g7WT -cFosZip.
  • the sulA operation is not busy and the STOP codons are "read" by the suppressor tRNA, SupE.
  • the SULA protein is produced and causes the death of the bacteria.
  • the heterodimers LexA ⁇ _87408cJunZip / LexA -87 WT-cFosZip are able to bind to the operator of sulA and thus prevent the production of the protein SULA, the bacteria can divide and give rise to clones.

Abstract

The invention concerns the use of a DNA sequence comprising: a nucleotide sequence coding for an indicator protein (indicator gene); a promoter; a mutated operator; the said nucleotide sequence being under the control of the said promoter comprising the said mutated operator containing two sequences and deriving from an operator containing two inverted repeat sequences (palindrome), this mutated operator being such that one of its sequences is mutated (mutation 1), while the other is for instance wild. The transcription of the indicator gene is repressed by controlling proteins in the form of heterodimers via their DNA binding sites, each monomer of these heterodimers being such that it recognises specifically one the sequence comprising mutation 1, the other the wild sequence, in particular for detecting interactions between two proteins, these interactions being revealed when there is repression of the transcription of the said indicator gene, this repression resulting from the formation of heterodimers.

Description

SYSTEME DE DETECTION DES INTERACTIONS PROTEINE-PROTEINEPROTEIN-PROTEIN INTERACTION DETECTION SYSTEM
L'invention a pour objet un système de détection des interactions protéine- protéine, et plus particulièrement des séquences d'ADN pour la mise en oeuvre de ce système, ainsi que des hôtes cellulaires contenant lesdites séquences d'ADN.The subject of the invention is a system for detecting protein-protein interactions, and more particularly DNA sequences for the implementation of this system, as well as cellular hosts containing said DNA sequences.
Les interactions protéine-protéine jouent un rôle fondamental chez les organismes vivants supérieurs tant au niveau du développement normal de l'organisme qu'au niveau de certaines situations pathologiques. Les méthodes biochimiques et biophysiques existantes exigent d'une part que les différents partenaires aient été préalablement identifiés et, d'autre part, nécessitent de grandes quantités de protéines (donc leur clonage et leur purification). Il est donc indispensable de disposer d'outils permettant de réaliser l'étape initiale, c'est-à-dire permettant d'identifier et de cloner des protéines interagissant entre elles. De tels systèmes ont été récemment développés en utilisant la levure comme hôte et l'activation de la transcription d'un gène spécifique comme "sonde" (voir Fields et Sternglanz, 1994). Cependant, quoique déjà bien utilisé, ce système présente certaines limites.Protein-protein interactions play a fundamental role in higher living organisms, both in terms of the normal development of the organism and in certain pathological situations. The existing biochemical and biophysical methods require on the one hand that the different partners have been previously identified and, on the other hand, require large quantities of proteins (therefore their cloning and their purification). It is therefore essential to have tools enabling the initial step to be carried out, that is to say allowing the identification and cloning of proteins interacting with one another. Such systems have been recently developed using yeast as a host and activation of the transcription of a specific gene as a "probe" (see Fields and Sternglanz, 1994). However, although already well used, this system has certain limits.
L'étude de ces interactions protéine-protéine peut se faire en utilisant des techniques biochimiques et biophysiques in vitro. Mais celles-ci ne sont concevables que lorsque les protéines sont clonées et peuvent être produites et purifiées en grande quantité. D'autre part, elles ne permettent pas d'identifier de nouveau partenaire d'interaction.The study of these protein-protein interactions can be done using biochemical and biophysical techniques in vitro. But these are only conceivable when the proteins are cloned and can be produced and purified in large quantities. On the other hand, they do not identify a new interaction partner.
Une alternative attrayante aux méthodes biochimiques consiste en une utilisation de banques d'expression d'ADNc (reflétant l'ensemble des ARN messagers) ou d'ADN génomique. L'avantage de ces stratégies réside dans le fait que les gènes des protéines ainsi identifiées sont immédiatement disponibles (pour une comparaison de ces méthodes voir Phizicky et Fields, 1995). Parmi les méthodes s'appuyant sur l'utilisation de banques d'expression, on peut distinguer celles qui utilisent une sélection in vitro (comme la révélation de plages de lyse par une protéine purifiée et marquée radioactivement interagissant avec une protéine inconnue) de celles utilisant une sélection in vivo. Dans ce dernier domaine, des progrès sensibles ont pu être réalisés grâce à la technique du "double-hybride" dans la levure (Ma et Ptashne, 1988; Fields et Song, 1989; Chien et al , 1991; Gyuris et al , 1993; Durfee et al , 1993; Vojtek et al , 1993; Le Douarin et al , 1995). Dans le système développé par Fields et Song (1989), permettant d'identifier in vivo chez la levure des protéines interagissant entre elles, une protéine X connue est greffée sur un domaine de fixation à l'ADN (Gal4 ou , LexA) et on cherche une deuxième protéine Y (greffée sur un domaine de l'activation ou "AD-activation domain" de la transcription) capable d'interagir avec la protéine X et de provoquer ainsi l'activation de la transcription. Dans une revue, Fields S. et Sternglanz R. ("The two-hybrid system: an assay for protein-protein interaction" (1994) TIG, JLQ:286-292) discutent les possibilités et les limites de cette méthode. Une des limites est que les deux protéines hybrides doivent parvenir dans le noyau de la cellule. L'autre difficulté majeure consiste à identifier des protéines Y qui interagissent avec une protéine X pourvue d'un domaine d 'activation de la transcription, puisque, dans ce cas, la protéine cible (Gal4-X ou LexA-X) donnera un signal d 'activation constitutif en absence de toute protéine Y.An attractive alternative to biochemical methods consists in the use of cDNA expression libraries (reflecting all of the messenger RNAs) or genomic DNA. The advantage of these strategies lies in the fact that the genes of the proteins thus identified are immediately available (for a comparison of these methods see Phizicky and Fields, 1995). Among the methods based on the use of expression libraries, one can distinguish those which use in vitro selection (such as the revelation of lysis plaques by a purified and radioactively labeled protein interacting with an unknown protein) from those using in vivo selection. In this latter area, significant progress has been made thanks to the "double-hybrid" technique in yeast (Ma and Ptashne, 1988; Fields and Song, 1989; Chien et al, 1991; Gyuris et al, 1993; Durfee et al, 1993; Vojtek et al, 1993; Le Douarin et al, 1995). In the system developed by Fields and Song (1989), which makes it possible to identify interacting proteins in yeast in vivo, a known protein X is grafted onto a DNA binding domain (Gal4 or, LexA) and is looking for a second protein Y (grafted onto an activation domain or "AD-activation domain" of transcription) capable of interacting with protein X and thus causing activation of transcription. In a review, Fields S. and Sternglanz R. ("The two-hybrid system: an assay for protein-protein interaction" (1994) TIG, JLQ: 286-292) discuss the possibilities and limits of this method. One of the limits is that the two hybrid proteins must reach the nucleus of the cell. The other major difficulty consists in identifying proteins Y which interact with a protein X provided with a domain of activation of the transcription, since, in this case, the target protein (Gal4-X or LexA-X) will give a signal constitutive activation in the absence of any protein Y.
S 'agissant de Gal4 comme support de fixation à l'ADN, elle a été initialement mise au point en utilisant le domaine de fixation à l'ADN ou DBD ("DNA binding domain") de la protéine Gal4 (Ma et Ptashne, 1988; Fields et Song, 1989). Gal4 est une protéine modulaire de 881 acides aminés possédant au moins deux domaines fonctionnels. Un domaine de fixation à l'ADN comprenant les acides aminés 1-94 et un domaine d'activation de la transcription. La fonction d'activation est en fait répartie sur trois segments différents de la protéine, à savoir 94-106, 148-196 et 768-881 (Marmorstein et al. , 1992). La structure de Gal4j.65 impliquée dans un complexe avec l'ADN a été déterminée par cristallographique aux rayons X (Marmorstein et al., 1992) tandis que la structure du domaine d'activation reste très mal définie.Acting on Gal4 as a DNA binding support, it was initially developed using the DNA binding domain or DBD ("DNA binding domain") of the Gal4 protein (Ma and Ptashne, 1988 ; Fields and Song, 1989). Gal4 is a modular protein of 881 amino acids with at least two functional domains. A DNA binding domain comprising amino acids 1-94 and a transcription activation domain. The activation function is in fact distributed over three different segments of the protein, namely 94-106, 148-196 and 768-881 (Marmorstein et al., 1992). The structure of Gal4j.65 involved in a complex with DNA has been determined by X-ray crystallography (Marmorstein et al., 1992) while the structure of the activation domain remains very poorly defined.
Ainsi, Fields et Song (1989) ont greffé, d'une part la protéine SNF1 (une sérine/thréonine kinase) sur Gal4ι _j47, et d'autre part la protéine SNF4 sur le domaine d'activation 768-881 de Gal4. Aucune des deux protéines hybrides, Gal4ι_i47-SNF1 ou SNF4-Gal47-5g_ggι seules n'étaient capable d'activer la transcription du gène reporter lacZ placé sous le contrôle du promoteur G ALI . Par contre la coexpression des deux protéines hybrides a abouti à une activation de la transcription notable (180 unités), bien que nettement inférieure à l'activation observée avec la protéine Gal4 entière (4000 unités). Cette différence est imputable, d'une part à l'absence du domaine d'activation comprenant les acides aminés 148-196 et, d'autre part, au fait que l'interaction entre SNF1 et SNF4 ne remplace pas complètement une liaison covalente entre les deux domaines de Gal4. Une fusion directe entre Gal4ι .j47 et Gal476 _ggι provoque en effet seulement une réduction d'un facteur 2 par rapport à Gal4 entier (Ma et Ptashne, 1987a).Thus, Fields and Song (1989) grafted, on the one hand the SNF1 protein (a serine / threonine kinase) on Gal4ι _j47, and on the other hand the SNF4 protein on the activation domain 768-881 of Gal4. Neither of the two hybrid proteins, Gal4ι_i47-SNF1 or SNF4-Gal47-5g_ggι alone were capable of activating the transcription of the reporter gene lacZ placed under the control of the G ALI promoter. On the other hand, the coexpression of the two hybrid proteins resulted in a notable transcription activation (180 units), although clearly less than the activation observed with the whole Gal4 protein (4000 units). This difference is attributable, on the one hand to the absence of the activation domain comprising amino acids 148-196 and, on the other hand, to the fact that the interaction between SNF1 and SNF4 does not completely replace a covalent bond between the two areas of Gal4. A direct merger between Gal4ι .j47 and Gal476 _ggι indeed only causes a reduction of a factor 2 compared to whole Gal4 (Ma and Ptashne, 1987a).
Depuis, des dizaines de couples de protéines X,Y ont été testées. De nombreuses combinaisons sont capables de restituer un activateur fonctionnel de la transcription (pour une revue, voir Bartel et a , 1993).Since then, dozens of pairs of proteins X, Y have been tested. Many combinations are capable of restoring a functional activator of transcription (for a review, see Bartel et a, 1993).
Outre l'analyse de l'interaction d'un couple de protéines connues, la technique du double-hybride permet également l'identification d'un partenaire inconnu du moment où on est en possession du gène de la protéine cible X. L'équipe de Stanley Fields a été la première à exploiter cette possibilité (Chien et a , 1991) en créant des fusions entre le domaine d'activation 768-881 de Gal4 et des séquences protéiques codées par des fragments d'ADN d'une banque d'ADN génomique de levure. Cette fois-ci, le domaine d'activation a été placé en extrémité NH2-terminale de cette famille de protéines de fusion, afin de faciliter la construction des protéines hybrides.In addition to the analysis of the interaction of a pair of known proteins, the double-hybrid technique also allows the identification of an unknown partner from the moment when one is in possession of the gene for the target protein X. The team by Stanley Fields was the first to exploit this possibility (Chien et a, 1991) by creating fusions between the activation domain 768-881 of Gal4 and protein sequences encoded by DNA fragments from a library of Genomic yeast DNA. This time, the activation domain was placed at the NH2-terminal end of this family of fusion proteins, in order to facilitate the construction of the hybrid proteins.
Afin d'éviter un trop grand nombre de clones faux-positifs, il est préférable d'insérer la banque dans le plasmide portant le domaine d'activation, puisque Ma et Ptashne (1987b) avaient montré auparavant, que de nombreux fragments protéiques fusionnés aux 147 premiers acides aminés de Gal4 étaient capables d'activer la transcription.In order to avoid too large a number of false-positive clones, it is preferable to insert the library into the plasmid carrying the activation domain, since Ma and Ptashne (1987b) had shown before, that numerous protein fragments fused to The first 147 amino acids in Gal4 were able to activate transcription.
Depuis l'article de Chien et al. (1991) les souches et plasmides utilisés ont évolué. Notamment la combinaison d'une sélection métabolique associée à un crible lacZ s'est généralisée. Tandis que Chien et al. (1991) travaillaient uniquement sur la base du crible lacZ, des approches plus récentes utilisent également l'acquisition de la capacité à pousser sur un milieu manquant soit d'histidine, soit de leucine. En principe seules les cellules portant une protéine hybride issue de la banque, capable d'activer l'expression du gène de sélection (His3, Leu2) via une interaction X,Y formeront des colonies sur boîte. Une telle sélection permet l'analyse d'un plus grand nombre de clones.Since the article by Chien et al. (1991) the strains and plasmids used have evolved. In particular, the combination of metabolic selection associated with a lacZ screen has become widespread. While Chien et al. (1991) only worked on the lacZ screen, more recent approaches also use the acquisition of the ability to grow on a medium lacking either histidine or leucine. In principle, only cells carrying a hybrid protein from the library, capable of activating the expression of the selection gene (His3, Leu2) via an X, Y interaction will form colonies on dishes. Such a selection allows the analysis of a larger number of clones.
Parallèlement à Gal41.147 comme support de fixation à l'ADN, l'équipe de Roger Brent (Harvard Médical School) a introduit le répresseur LexA d'Escherichia coli comme support (Golemis et Brent, 1992 ; Gyuris et a , 1993).In addition to Gal41.147 as a support for attachment to DNA, the team of Roger Brent (Harvard Medical School) introduced the repressor LexA of Escherichia coli as a support (Golemis and Brent, 1992; Gyuris et a, 1993).
LexA est une protéine de 202 acides aminés, composée de deux domaines reliés par une région charnière d'environ 30 acides aminés. Les 70 premiers acides aminés constituent le domaine de fixation à l'ADN (Hurstel et al , 1986; Fogh et al, 1994) et les acides aminés 100 à 202 forment le domaine de dimérisation de la protéine (Schnarr et al. , 1985). LexA reconnaît des sites palindromiques sur l'ADN (les opérateurs SOS) et plusieurs opérateurs adjacents peuvent être occupés d'une façon coopérative (Lloubès et al , 1991).LexA is a protein of 202 amino acids, composed of two domains linked by a hinge region of approximately 30 amino acids. The first 70 amino acids constitute the DNA binding domain (Hurstel et al, 1986; Fogh et al, 1994) and amino acids 100 to 202 form the protein dimerization domain (Schnarr et al., 1985) . LexA recognizes sites palindromic DNA (SOS operators) and several adjacent operators can be occupied in a cooperative manner (Lloubès et al, 1991).
L'utilisation de LexA comme support de fixation à l'ADN peut avoir plusieurs avantages. .LexA appartient à un organisme hétérologue {Escherichia coli), n'affecte pas la croissance de la levure, ne possède pas d'activité transcriptionnelle résiduelle (comme le segment 94-106 de Gal4) et peut être utilisé dans des souches de levure gal+. De ce fait, une des protéines hybrides (généralement celle contenant le domaine d'activation) peut être placée sous le contrôle de Gal4. Ainsi, la protéine hybride sera exprimée uniquement en présence de galactose, mais pas en présence de glucose. .Le domaine d'activation utilisé par l'équipe de Roger Brent est également issu à'Escherichia coli. Il s'agit d'un des domaines activateurs artificiels isolés par Ma et Ptashne (1987b). Ce domaine (nommé B42) possède un potentiel d'activation plus faible que les domaines d'activation de Gal4 ou de VP16, ce qui permet d'éviter les problèmes de toxicité liés à un éventuel "squelching" (la titration d'un élément essentiel de la machinerie de transcription par un domaine d'activation). Une description récente du système double-hybride s 'appuyant sur l'utilisation de LexA se trouve dans Golemis et al (1996) et Golemis et Brent (1996).Using LexA as a DNA binding medium can have several advantages. .LexA belongs to a heterologous organism (Escherichia coli), does not affect the growth of yeast, has no residual transcriptional activity (like segment 94-106 of Gal4) and can be used in strains of yeast gal + . Therefore, one of the hybrid proteins (usually the one containing the activation domain) can be placed under the control of Gal4. Thus, the hybrid protein will be expressed only in the presence of galactose, but not in the presence of glucose. The field of activation used by Roger Brent's team also comes from Escherichia coli. It is one of the artificial activator domains isolated by Ma and Ptashne (1987b). This domain (named B42) has a lower activation potential than the activation domains of Gal4 or VP16, which makes it possible to avoid the problems of toxicity linked to a possible "squelching" (the titration of an element essential of the transcription machinery by an activation domain). A recent description of the double-hybrid system based on the use of LexA can be found in Golemis et al (1996) and Golemis and Brent (1996).
Malgré la fréquence d'utilisation des différents .systèmes double-hybride, peu d'études ont été menées cherchant à corréler des données obtenues in vivo avec des mesures d'affinité in vitro. Estojak et al. (1995) ont cherché à établir une telle corrélation dans le cas de plusieurs protéines à hélice-loop-hélice (Myc, Max, Mxi) et dans le cas de mutants du répresseur lambda. Leurs résultats sont quelque peu décevants.Despite the frequency of use of the various double-hybrid systems, few studies have been carried out seeking to correlate data obtained in vivo with affinity measurements in vitro. Estojak et al. (1995) sought to establish such a correlation in the case of several helix-loop-helix proteins (Myc, Max, Mxi) and in the case of mutants of the lambda repressor. Their results are somewhat disappointing.
En effet, le système double-hybride montre une forte polarité pour le couple Myc/Max. .Lorsque Myc est fixé sur DBD et Max sur AD, aucune activation de la transcription n'est observée. Par contre, lorsque Max est fixé sur DBD et Myc sur AD, on observe une activation en accord avec des données biochimiques montrant que les deux protéines interagissent. Lorsque cette dernière géométrie est utilisée avec des reporters lacZ ayant un nombre variable d'opérateurs en amont du gène, la hiérarchie des affinités apparentes in vivo entre les couples Max/Myc et Max/Mxi n'est pas la même selon le reporter utilisé.Indeed, the double-hybrid system shows a strong polarity for the Myc / Max couple. When Myc is fixed on DBD and Max on AD, no activation of transcription is observed. On the other hand, when Max is fixed on DBD and Myc on AD, an activation is observed in agreement with biochemical data showing that the two proteins interact. When the latter geometry is used with lacZ reporters having a variable number of operators upstream of the gene, the hierarchy of apparent affinities in vivo between the Max / Myc and Max / Mxi couples is not the same depending on the reporter used.
La situation est encore plus confuse dans le cas des mutants du répresseur lambda. Des mutants ayant une capacité de dimérisation fortement amoindrie activent certains gènes reporters mieux que la protéine sauvage (Estojak et al. , 1995). Par ailleurs, bien que tous les variants activent assez fortement le gène lacZ, trois sur quatre sont incapables d'activer le gène leu2 et auraient, de ce fait, échappé à une sélection sur milieu dépourvu de leucine. En conclusion, Estojak et al. (1995) estiment qu'aucun gène reporter montre une corrélation satisfaisante avec les affinités mesurées in vitro.The situation is even more confused in the case of mutants of the lambda repressor. Mutants with a greatly reduced dimerization capacity activate certain reporter genes better than the wild-type protein (Estojak et al., 1995). Furthermore, although all the variants activate the lacZ gene quite strongly, three out of four are unable to activate the leu2 gene and would therefore have fact, escaped a selection on medium deprived of leucine. In conclusion, Estojak et al. (1995) consider that no reporter gene shows a satisfactory correlation with the affinities measured in vitro.
Etant donné la complexité de l'assemblage d'un complexe d'initiation de la transcription chez les eucaryotes (voir : Hori et Carey, 1994 ; Maldonado et Reinberg, 1995) qui mobilise au moins une trentaine de protéines différentes, et le fonctionnement toujours mal compris des activateurs de la transcription, ces résultats ne sont pas tellement surprenants.Given the complexity of assembling a transcription initiation complex in eukaryotes (see: Hori and Carey, 1994; Maldonado and Reinberg, 1995) which mobilizes at least thirty different proteins, and the functioning always misunderstood of transcription activators, these results are not so surprising.
LexA est le répresseur du système SOS chez E.coli. LexA, composé de deux domaines, est inactivé in vivo suite à des dommages sur l'ADN par un clivage protéolytique localisé entre les deux domaines (pour une revue sur LexA, voir Schnarr et Granger-Schnarr, 1993). La séparation du domaine de fixation à l'ADN du domaine de dimérisation entraîne alors une diminution de l'affinité pour l'ADN d'environ 1000-fois, ne permettant plus une répression transcriptionnelle efficace. D'autre part, la constante de dimérisation de LexA (KA = 2 x 104 M-l) est relativement faible (Schnarr et al , 1985), ce qui suggère que la greffe d'un domaine de dimérisation hétérologue à affinité modeste devrait reconstituer un répresseur hybride fonctionnel. Schmidt-Dôrr et al (1991) ont pu montrer en effet que la fusion de la glissière à leucine ("leucine-zipper") de l'oncoprotéine Jun à LexAι_g7 restaure une répression transcriptionnelle. Par contre, la fusion de la glissière à leucine Fos ("leucine- zipper Fos"), qui est incapable de conférer l'homodimérisation, ne restaure pas la répression (Porte et al , 1995). En partant de cette observation, la partie glissière de Fos ("Fos-zipper") de la protéine de fusion a ensuite été mutagénéisée, afin de caractériser les anti-déterminants de l'homodimérisation de Fos (Porte et al. , 1995).LexA is the repressor of the SOS system at E.coli. LexA, composed of two domains, is inactivated in vivo following damage to DNA by a proteolytic cleavage located between the two domains (for a review on LexA, see Schnarr and Granger-Schnarr, 1993). The separation of the DNA binding domain from the dimerization domain then leads to a decrease in affinity for DNA of approximately 1000-fold, no longer allowing efficient transcriptional repression. On the other hand, the dimerization constant of LexA (KA = 2 x 104 Ml) is relatively low (Schnarr et al, 1985), which suggests that the transplant of a heterologous dimerization domain with modest affinity should reconstitute a repressor functional hybrid. Schmidt-Dôrr et al (1991) were able to show that the fusion of the leucine zipper ("leucine-zipper") from the Jun oncoprotein to LexAι_g7 restores transcriptional repression. On the other hand, the fusion of the leucine slide Fos ("leucine-zipper Fos"), which is unable to confer homodimerization, does not restore repression (Porte et al, 1995). On the basis of this observation, the Fos zipper part ("Fos-zipper") of the fusion protein was then mutagenized, in order to characterize the anti-determinants of Fos homodimerization (Porte et al., 1995).
La souche bactérienne indicatrice est déficiente en LexA et porte le gène lacZ sous le contrôle d'un opérateur SOS reconnu par LexA (l'opérateur sulA). La protéine hybride, placée sous le contrôle du promoteur lacUVS inductible par 1TPTG, est produite à partir d'un plasmide de façon à pouvoir adapter la quantité de protéine aux nécessités expérimentales. Ce système est parfaitement adapté à l'étude d'un complexe homodimérique, mais son utilisation devient laborieuse du moment où l'on veut étudier l'hétérodimérisation entre deux protéines différentes capables de former également des homodimères.The indicator bacterial strain is deficient in LexA and carries the lacZ gene under the control of an SOS operator recognized by LexA (the sulA operator). The hybrid protein, placed under the control of the lacUVS promoter inducible by 1TPTG, is produced from a plasmid so as to be able to adapt the quantity of protein to experimental needs. This system is perfectly suited to the study of a homodimeric complex, but its use becomes laborious the moment one wants to study the heterodimerization between two different proteins capable of also forming homodimers.
Parallèlement au système LexA, l'équipe de James Hu a développé une approche voisine en utilisant le domaine de fixation à l'ADN du répresseur lambda (Hu, 1995). L'avantage de ce système est d'offrir les possibilités de sélection du phage lambda. Son inconvénient réside dans le fait que le domaine de fixation à l'ADN du répresseur lambda contient déjà un élément de dimérisation (l'hélice 5), qui peut masquer l'effet de domaines de dimérisation hétérologues relativement faibles.In addition to the LexA system, James Hu's team has developed a similar approach using the DNA binding domain of the lambda repressor (Hu, 1995). The advantage of this system is to offer the possibilities of selecting the lambda phage. Its disadvantage lies in the fact that the domain of attachment to the DNA of the lambda repressor already contains a dimerization element (helix 5), which can mask the effect of relatively weak heterologous dimerization domains.
L'invention a notamment pour objet de résoudre les difficultés présentées par les systèmes de l'art antérieur et, en particulier, l'invention a pour but de permettre l'étude de l'hétérodimérisation.The invention particularly aims to solve the difficulties presented by the systems of the prior art and, in particular, the invention aims to allow the study of heterodimerization.
L'invention a pour objet un système permettant la détection d'interaction entre deux protéines greffées, par visualisation de la répression de la transcription et non pas par une activation de la transcription. En effet, contrairement au système levure, une protéine ayant une activité activatrice intrinsèque pourrait être utilisée.The subject of the invention is a system allowing the detection of interaction between two grafted proteins, by visualizing the repression of transcription and not by activating transcription. Unlike the yeast system, a protein with intrinsic activating activity could be used.
L'invention a pour objet un système de détection des interactions protéine- protéine à l'aide d'une bactérie (Escherichia coli) comme organisme hôte, couramment utilisée dans tous les laboratoires de biologie moléculaire.The subject of the invention is a system for detecting protein-protein interactions using a bacterium (Escherichia coli) as a host organism, commonly used in all molecular biology laboratories.
L'invention a pour objet un système de détection des interactions protéine- protéine évitant le problème de l'adressage des protéines de fusion dans le noyau comme c'est le cas dans la levure et ce, grâce à la non-compartimentation d'E. coli, notamment à l'absence d'un noyau structuré.The subject of the invention is a system for detecting protein-protein interactions avoiding the problem of addressing fusion proteins in the nucleus as is the case in yeast, thanks to the non-compartmentalisation of E . coli, in particular the absence of a structured nucleus.
L'invention a pour objet un système adapté à l'étude des interactions de protéines situées dans la membrane cytoplasmique.The subject of the invention is a system suitable for studying the interactions of proteins located in the cytoplasmic membrane.
L'invention a pour objet un test (répression de la transcription) permettant potentiellement l'identification de protéines interagissant avec les domaines d'activation des facteurs de transcription, parmi lesquels on trouve de nombreux produits oncogéniques impliqués dans la cancérogénèse, comme Jun, Fos ou les membres de la famille Εts.The subject of the invention is a test (repression of transcription) potentially allowing the identification of proteins interacting with the activation domains of transcription factors, among which there are many oncogenic products involved in carcinogenesis, such as Jun, Fos. or Εts family members.
L'invention a pour objet un système d'étude d'interaction protéine- protéine (détermination des forces d'interaction, identification des éléments de structure ou de séquence importants pour cette interaction, analyse de la spécificité de l'interaction) plus fiable que le système levure (Estojak et al. 1995).The subject of the invention is a system for studying protein-protein interaction (determination of interaction forces, identification of structural or sequence elements important for this interaction, analysis of the specificity of the interaction) more reliable than the yeast system (Estojak et al. 1995).
L'invention a pour objet un système d'étude d'interaction protéine- protéine permettant de détecter des interactions lorsque la protéine "hameçon" (celle pour laquelle on recherche le ou les partenaires) a des capacités intrinsèques d'activation de la transcription (revues Bartel et al. 1993, Golemis et Brent 1996, Golemis et al 1996) et ceci se produisant assez fréquemment (Ma et Ptashne 1988), et donc l'invention a pour objet un système permettant l'étude des interactions d'un "vrai" domaine d'activation de la transcription ; L'invention a pour objet un système de détection d'interaction protéine- protéine permettant l'examen d'un grand nombre de clones ( > 106) grâce à l'efficacité de transfection de E. Coli qui est nettement supérieure à celle de la levure (de l'ordre de 1 000 fois) et ainsi le criblage de banques d'ADNc ou d'ADN génomique.The subject of the invention is a system for studying protein-protein interaction making it possible to detect interactions when the "hook" protein (the one for which the partner (s) is sought) has intrinsic capacities for activating transcription ( Bartel et al. 1993, Golemis and Brent 1996, Golemis et al 1996) and this occurs quite frequently (Ma and Ptashne 1988), and therefore the invention relates to a system allowing the study of the interactions of a " true "domain of transcription activation; The subject of the invention is a protein-protein interaction detection system allowing the examination of a large number of clones (> 10 6 ) thanks to the transfection efficiency of E. Coli which is clearly greater than that of yeast (of the order of 1000 times) and thus the screening of cDNA or genomic DNA libraries.
L'invention concerne l'utilisation d'une séquence d'ADN comprenant :The invention relates to the use of a DNA sequence comprising:
- une séquence nucléotidique codant pour une protéine indicatrice (gène indicateur),- a nucleotide sequence coding for an indicator protein (indicator gene),
- un promoteur,- a promoter,
- un opérateur muté, ladite séquence nucléotidique étant sous le contrôle du susdit promoteur comprenant le susdit opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1 , la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être formés à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur,a mutated operator, said nucleotide sequence being under the control of the above promoter comprising the above mutated operator containing two sequences and deriving from an operator containing two inverted repeated sequences (palindrome), this operator being such that, in the non-mutated state (wild), it leads to the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of said inverted repeat sequences via their DNA binding site, this mutated operator being such that the one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated in a silent manner or comprises a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it one specifically recognizes the sequence comprising the mutation 1, the other the sequence which is in the wild state, or which is mutated in a silent manner or which comprises a mutation 2, the homodimers capable of being formed from each monomers being incapable of repressing the transcription of the above-mentioned indicator gene,
- pour détecter ou quantifier des interactions entre deux protéines ou domaines protéiques, ou cribler des protéines ou domaines protéiques présentant des interactions avec une protéine ou domaine protéique déterminé(e), ces interactions étant révélées lorsqu'il y a répression de la transcription du susdit gène indicateur, cette répression résultant de la formation d'hétérodimères comprenant :- to detect or quantify interactions between two proteins or protein domains, or to screen proteins or protein domains exhibiting interactions with a specific protein or protein domain, these interactions being revealed when there is repression of the transcription of the above indicator gene, this repression resulting from the formation of heterodimers comprising:
1) un premier monomère contenant une première protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence de l'opérateur muté contenant la mutation 1, le susdit site de fixation étant fusionné à l'une des deux protéines ou à l'un des deux domaines protéiques, impliqué(e) dans les susdites interactions, 2) un deuxième monomère contenant une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2 de l'opérateur muté, le susdit site de fixation étant fusionné à l'autre des deux protéines ou à l'autre des deux domaines protéiques, impliqué(e) dans les susdites interactions.1) a first monomer containing a first fusion protein containing the DNA binding site of a regulatory protein capable of specifically recognizing the sequence of the mutated operator containing the mutation 1, the above-mentioned binding site being fused to the '' one of the two proteins or one of the two protein domains, involved in the above interactions, 2) a second monomer containing a second fusion protein containing the DNA binding site of a regulatory protein capable of specifically recognizing the sequence not mutated, or mutated silently or comprising the mutation 2 of the mutated operator, the above-mentioned binding site being fused to the other of the two proteins or to the other of the two protein domains, involved in the above interactions.
L'utilisation selon l'invention repose sur le fait qu'une protéine régulatrice, par exemple LexA, régule in vivo l'expression de gènes en se fixant sur des séquences spécifiques situées en amont de ces gènes (séquences opérateur).The use according to the invention is based on the fact that a regulatory protein, for example LexA, regulates the expression of genes in vivo by binding to specific sequences located upstream of these genes (operator sequences).
L'opérateur utilisé dans le cadre de l'invention est un opérateur muté dérivant d'un opérateur non muté qui est tel que, à l'état sauvage, ses séquences sont palindromiques (répétées inversées) et reconnues par des homodimères de la protéine régulatrice. La protéine régulatrice, par exemple LexA, est organisée en deux domaines, un domaine de fixation à l'ADN qui reconnaît spécifiquement les séquences opérateur et un domaine de dimérisation par lequel se font les interactions entre deux monomères protéiques stabilisant l'interaction des dimères sur l'ADN. Chaque monomère se fixe sur un demi-opérateur. Par "demi-opérateur" on désigne la séquence spécifiquement reconnue par chaque monomère. Ces séquences spécifiques sont identiques dans le cadre d'un opérateur sauvage ou doublement muté, et différentes dans le cadre d'un opérateur muté.The operator used in the context of the invention is a mutated operator deriving from a non-mutated operator which is such that, in the wild, its sequences are palindromic (repeated inverted) and recognized by homodimers of the regulatory protein . The regulatory protein, for example LexA, is organized into two domains, a DNA binding domain which specifically recognizes operator sequences and a dimerization domain through which the interactions between two protein monomers stabilize the interaction of dimers on DNA. Each monomer is fixed on a half-operator. By "half-operator" is meant the sequence specifically recognized by each monomer. These specific sequences are identical in the context of a wild-type or doubly mutated operator, and different in the context of a mutated operator.
Cette fixation est renforcée par l'existence de contacts entre les domaines de dimérisation de chaque monomère. Le domaine de fixation à l'ADN seul (dépourvu du domaine de dimérisation) est incapable de fixer efficacement l'opérateur et donc de réguler l'expression d'un gène. Si on remplace le domaine de dimérisation de LexA par des motifs protéiques hétérologues mais susceptibles d'interagir, on restitue l'activité régulatrice de LexA.This fixation is reinforced by the existence of contacts between the dimerization domains of each monomer. The DNA binding domain alone (devoid of the dimerization domain) is incapable of efficiently fixing the operator and therefore of regulating the expression of a gene. If the dimerization domain of LexA is replaced by heterologous but capable of interacting protein motifs, the regulatory activity of LexA is restored.
Ceci étant, dans le cadre de l'invention, la séquence opérateur reconnue par une protéine régulatrice, par exemple LexA, a été modifiée de telle sorte qu'un demi-opérateur restant sauvage sera reconnu par la protéine régulatrice sauvage, par exemple LexA, tandis que l'autre demi-opérateur sera muté et reconnu par une forme mutée de la protéine régulatrice.However, in the context of the invention, the operator sequence recognized by a regulatory protein, for example LexA, has been modified so that a half-operator remaining wild will be recognized by the wild regulatory protein, for example LexA, while the other half operator will be mutated and recognized by a mutated form of the regulatory protein.
Chacun de ces domaines de fixation à l'ADN peut être fusionné à des domaines protéiques susceptibles d'hétérodimériser et toute interaction entre ces domaines est mesurée par une répression plus ou moins importante du gène indicateur (également désigné par "gène reporter").Each of these DNA binding domains can be fused to protein domains capable of heterodimerizing and any interaction between these domains is measured by a more or less significant repression of the indicator gene (also designated by "reporter gene").
On entend par gène indicateur : - soit un gène codant pour une protéine dont l'activité d'une part est révélée par la couleur qu'elle confère aux clones bactériens la produisant et d'autre part peut être dosée quantitativement, par exemple le gène lacZ, le gène codant pour la luciférase,By indicator gene is meant: - Or a gene coding for a protein whose activity on the one hand is revealed by the color which it confers on the bacterial clones producing it and on the other hand can be quantitatively measured, for example the lacZ gene, the gene coding for luciferase,
- soit un gène codant pour une protéine toxique pour la bactérie de telle sorte que si la protéine est produite, la bactérie meure, par exemple le gène sulA.- or a gene coding for a protein toxic to the bacterium so that if the protein is produced, the bacterium dies, for example the sulA gene.
On peut également utiliser un système pour lequel :We can also use a system for which:
- le gène toxique est un gène codant pour une résistance à un antibiotique,- the toxic gene is a gene coding for resistance to an antibiotic,
- l'opérateur mixte op408/opWT est placé dans le promoteur du gène codant pour le répresseur de ce gène de résistance à un antibiotique.- the mixed operator op408 / opWT is placed in the promoter of the gene coding for the repressor of this antibiotic resistance gene.
En absence d'interaction entre LexA408-X et LexAWT-Y, le répresseur du gène en question est produit, la bactérie ne peut pas pousser sur un milieu de culture contenant cet antibiotique. Dans le cas contraire, la synthèse du répresseur n'a pas lieu, le gène de résistance à l'antibiotique est produit et les bactéries donnent lieu à des colonies sur un milieu de culture contenant cet antibiotique.In the absence of interaction between LexA408-X and LexAWT-Y, the repressor of the gene in question is produced, the bacteria cannot grow on a culture medium containing this antibiotic. Otherwise, the synthesis of the repressor does not take place, the antibiotic resistance gene is produced and the bacteria give rise to colonies on a culture medium containing this antibiotic.
Par "homodimères", on désigne des associations non covalentes de protéines dans lesquelles les domaines d'interaction protéine-protéine sont identiques et liés de façon covalente à des domaines protéiques hétérologues ou homologues de fixation de l'ADN, eux-mêmes identiques ou différents.The term “homodimers” denotes non-covalent associations of proteins in which the protein-protein interaction domains are identical and covalently linked to heterologous or homologous protein binding domains of DNA, which are themselves identical or different. .
Par "hétérodimères", on désigne des associations non covalentes de protéines dans lesquelles les domaines d'interaction protéine-protéine sont différents et liés de façon covalente à des domaines protéiques hétérologues ou homologues de fixation de l'ADN, eux-mêmes identiques ou différents.By "heterodimers" is meant non-covalent associations of proteins in which the protein-protein interaction domains are different and covalently linked to heterologous or homologous protein binding domains of DNA, which are themselves identical or different. .
Par "mutation silencieuse portée par l'une des séquences de l'opérateur", on désigne une mutation qui n'affecte pas la reconnaissance de ladite séquence par la protéine régulatrice sauvage.By "silent mutation carried by one of the operator's sequences" is meant a mutation which does not affect the recognition of said sequence by the wild-type regulatory protein.
Par "mutation 2 portée par la séquence de l'opérateur", on désigne une mutation différente de la mutation 1 , et qui est telle que la séquence comportant ladite mutation 2 est reconnue par une protéine régulatrice non susceptible de reconnaître la séquence portant la mutation 1, la mutation 1 étant elle-même telle qu'elle est reconnue par une protéine régulatrice qui n'est pas susceptible de reconnaître la séquence portant la mutation 2.By “mutation 2 carried by the operator sequence”, is meant a mutation different from mutation 1, and which is such that the sequence comprising said mutation 2 is recognized by a regulatory protein which is not capable of recognizing the sequence carrying the mutation 1, the mutation 1 itself being as recognized by a regulatory protein which is not capable of recognizing the sequence carrying the mutation 2.
Par "interaction protéine-protéine", on désigne l'assemblage non covalent de deux (ou plusieurs) protéines par interaction Van der Waals (interactions électrostatiques entre charges opposées, liaisons hydrogène, interactions hydrophobes). La surface masquée par une telle interaction est généralement de 1400 à 1600 A°2 (pour une revue voir: J. Janin "Principles of protein/protein récognition from structure to thermodynamics " 1995, Biochimie 27:497-505).By “protein-protein interaction”, we mean the non-covalent assembly of two (or more) proteins by Van der Waals interaction (electrostatic interactions between opposite charges, hydrogen bonds, interactions hydrophobic). The area masked by such an interaction is generally from 1400 to 1600 A ° 2 (for a review see: J. Janin "Principles of protein / protein recognition from structure to thermodynamics" 1995, Biochemistry 27: 497-505).
Par "domaine de fixation à l'ADN d'une protéine", on définit la partie de la protéine dont l'intégrité est indispensable à sa fixation non covalente à l'ADN.By "DNA binding domain of a protein" is defined the part of the protein whose integrity is essential for its non-covalent attachment to DNA.
Par "détection de l'interaction", on désigne une méthode permettant de visualiser une interaction entre deux protéines.By "interaction detection" is meant a method for visualizing an interaction between two proteins.
Par "quantification de l'interaction", on désigne une méthode permettant de chiffrer la force de cette interaction.By "quantification of the interaction", we designate a method allowing to quantify the strength of this interaction.
L'expression "protéine susceptible de reconnaître la séquence d'un opérateur" désigne une protéine capable de faire des liaisons non covalentes avec une séquence particulière d'ADN.The expression "protein capable of recognizing the sequence of an operator" designates a protein capable of making non-covalent bonds with a particular DNA sequence.
L'expression "domaine de fixation fusionné à une protéine" désigne un domaine protéique relié par une liaison peptidique à une autre protéine ou domaine de protéine.The expression “binding domain fused to a protein” designates a protein domain linked by a peptide bond to another protein or protein domain.
Selon un mode de réalisation avantageux de l'invention, la protéine régulatrice est dépourvue de son domaine de dimérisation, lequel peut toutefois être toléré si les interactions résultant de la présence du domaine de dimérisation sont plus faibles que celles que l'on veut mettre en évidence.According to an advantageous embodiment of the invention, the regulatory protein is devoid of its dimerization domain, which can however be tolerated if the interactions resulting from the presence of the dimerization domain are weaker than those which it is desired to bring into play. evidence.
L'invention a également pour objet une séquence d'ADN comprenant :The invention also relates to a DNA sequence comprising:
- une séquence nucléotidique codant pour une protéine indicatrice (gène indicateur),- a nucleotide sequence coding for an indicator protein (indicator gene),
- un promoteur,- a promoter,
- un opérateur muté, ladite séquence nucléotidique étant sous le contrôle d'un promoteur comprenant un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1, la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être formés à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur, ladite mutation 1 étant en outre telle qu'elle est reconnue spécifiquement par une protéine régulatrice comportant un site de fixation à l'ADN entrant dans la constitution d'une première protéine de fusion, lequel site de fixation est fusionné avec une protéine ou un domaine protéique susceptible d'interagir avec une autre protéine ou un autre domaine protéique entrant dans la constitution d'une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2.a mutated operator, said nucleotide sequence being under the control of a promoter comprising a mutated operator containing two sequences and deriving from an operator containing two inverted repeat sequences (palindrome), this operator being such that, in the non-mutated state (wild), it leads to the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of said inverted repeat sequences via their DNA binding site, this mutated operator being such that the one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated in a silent manner or comprises a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it recognizes s one specifically the sequence with mutation 1, the other the sequence which is in the wild, or which is mutated in a silent manner or which contains a mutation 2, the homodimers capable of being formed from each of the monomers being incapable of repressing the transcription of the above-mentioned indicator gene, said mutation 1 being further as it is specifically recognized by a regulatory protein comprising a DNA binding site forming part of a first fusion protein, which binding site is fused with a protein or protein domain capable of interact with another protein or another protein domain forming part of a second fusion protein containing the DNA binding site of a regulatory protein capable of specifically recognizing the non-mutated sequence, or mutated silently or with mutation 2.
L'invention concerne une séquence d'ADN caractérisée en ce qu'elle comprend un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), l'une de ces deux séquences étant mutée, et l'autre étant à l'état sauvage.The invention relates to a DNA sequence characterized in that it comprises a mutated operator containing two sequences and derived from an operator containing two inverted repeat sequences (palindrome), one of these two sequences being mutated, and the another being in the wild.
La séquence mutée peut être en amont ou en aval de la séquence à l'état sauvage.The mutated sequence can be upstream or downstream of the sequence in the wild.
L'invention a également pour objet une séquence d'ADN caractérisée en ce que l'opérateur muté contient les séquences suivantes :The invention also relates to a DNA sequence characterized in that the mutated operator contains the following sequences:
CCGT et ACAGCCGT and ACAG
espacées par une séquence d'environ 3 à environ 20 nucléotides, et notamment de 8 à 12, et avantageusement 8 nucléotides, et notamment caractérisée en ce que l'opérateur muté contient la séquence suivante :spaced apart by a sequence of approximately 3 to approximately 20 nucleotides, and in particular from 8 to 12, and advantageously 8 nucleotides, and in particular characterized in that the mutated operator contains the following sequence:
5'-CGGAAπCAATAGGGπGATCTTTGTTGTCACTGGATGTACCGTACATCCATACAGTAACTCACAGGGGC-3'5'-CGGAAπCAATAGGGπGATCTTTGTTGTCACTGGATGTACCGTACATCCATACAGTAACTCACAGGGGC-3 '
Les séquences CCGT et ACAG correspondent aux séquences respectivement CTGT et ACAG de l'opérateur non muté.The CCGT and ACAG sequences correspond to the CTGT and ACAG sequences of the non-mutated operator respectively.
La présente invention concerne une séquence d'ADN caractérisée en ce que la séquence nucléotidique codant pour la protéine indicatrice est le gène lacZ chez E. coli, codant pour la β-galactosidase, l'opérateur muté contient deux séquences et dérive d'un opérateur contenant deux séquences répétées inversées (palindrome), l'une de ces deux séquences étant mutée, et l'autre étant à l'état sauvage, la séquence mutée étant de préférence celle située en aval de la séquence à l'état sauvage, la séquence sauvage étant reconnue spécifiquement par la protéine LexA sauvage ou par un fragment de LexA contenant le site de fixation à l'ADN notamment un fragment défini par les positions 1 à x de LexA, x variant de 69 à 87, et notamment par les fragments 1 à 69 ou 1 à 87 de .LexA, et la séquence mutée étant reconnue par la protéine LexA mutée ou par un fragment muté de LexA contenant le site de fixation à l'ADN, notamment un fragment muté de LexA correspondant à celui défini par les positions 1 à x de LexA, x variant de 69 à 87, et notamment par les fragments 1 à 69 ou 1 à 87, et les mutations de LexA étant avantageusement P40 → A, N41 → S, A42 -» S, le domaine de dimérisation de .LexA étant absent à la fois de LexA ou du fragment de LexA et de LexA muté ou du fragment muté de LexA.The present invention relates to a DNA sequence characterized in that the nucleotide sequence coding for the indicator protein is the lacZ gene in E. coli, coding for β-galactosidase, the mutated operator contains two sequences and is derived from an operator containing two inverted repeat sequences (palindrome), one of these two sequences being mutated, and the other being in the wild, the mutated sequence preferably being that located downstream of the sequence in the wild, the wild sequence being recognized specifically by the wild LexA protein or by a fragment of LexA containing the DNA binding site, in particular a fragment defined by positions 1 to x of LexA, x varying from 69 to 87, and in particular by fragments 1 to 69 or 1 to 87 of .LexA, and the mutated sequence being recognized by the mutated LexA protein or by a mutated fragment of LexA containing the DNA binding site, in particular a mutated fragment of LexA corresponding to that defined by positions 1 to x of LexA, x varying from 69 to 87, and in particular by fragments 1 to 69 or 1 to 87, and the mutations of LexA being advantageously P40 → A, N41 → S, A42 - »S, the dimerization domain of .LexA being absent from both LexA or the fragment of LexA and mutated LexA or the mutated fragment of LexA.
Les trois mutations simultanées P40 — » A, N41 → S, A42 → S dans LexA donnent lieu à un mutant désigné par LexA408.The three simultaneous mutations P40 - »A, N41 → S, A42 → S in LexA give rise to a mutant designated by LexA408.
Par "domaine de dimérisation", on désigne la partie de la protéine dont l'intégrité est indispensable à l'interaction non covalente avec elle-même (homodimère) ou avec un autre domaine de dimérisation (hétérodimère).By "dimerization domain" is meant the part of the protein whose integrity is essential for non-covalent interaction with itself (homodimer) or with another dimerization domain (heterodimer).
Il est nécessaire que le domaine de dimérisation de .LexA et de LexA408 ou du fragment utilisé de LexA et de LexA408 soient absents sinon lorsque les deux protéines (LexA et LexA408) sont coexprimees dans l'hôte cellulaire impliqué dans l'invention, le gène indicateur serait réprimé.It is necessary that the dimerization domain of .LexA and of LexA408 or of the fragment used of LexA and of LexA408 are absent otherwise when the two proteins (LexA and LexA408) are coexpressed in the cellular host implicated in the invention, the gene indicator would be suppressed.
La présente invention a également pour objet un complexe entre - une séquence d'ADN comprenant une séquence nucléotidique codant pour une protéine indicatrice, ladite séquence nucléotidique étant sous le contrôle d'un promoteur comprenant un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1, la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être fournis à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur,The present invention also relates to a complex between - a DNA sequence comprising a nucleotide sequence coding for an indicator protein, said nucleotide sequence being under the control of a promoter comprising a mutated operator containing two sequences and derived from an operator containing two inverted repeat sequences (palindrome), this operator being such that, in the non-mutated (wild) state, it results in the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of the said inverted repeat sequences via their DNA binding site, this mutated operator being such that one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated silently or contains a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it specifically recognizes one the sequence comprising the mutation 1, the other the sequence which is in the wild state , or which is transferred in a silent way or which includes a mutation 2, the homodimers capable of being supplied from each of the monomers being incapable of repressing the transcription of the above-mentioned indicator gene,
- et des hétérodimères dont les monomères les constituant (respectivement premier monomère et deuxième monomère) sont impliqués entre eux dans une interaction protéine/protéine :- and heterodimers whose monomers constituting them (respectively first monomer and second monomer) are involved between them in a protein / protein interaction:
1) le premier monomère étant tel qu'il contient une première protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence de l'opérateur muté contenant la mutation 1 , le susdit site de fixation étant fusionné à l'une des deux protéines ou à l'un des deux domaines protéiques, impliqué(e) dans les susdites interactions,1) the first monomer being such that it contains a first fusion protein containing the site of attachment to the DNA of a regulatory protein capable of specifically recognizing the sequence of the mutated operator containing the mutation 1, the aforementioned site of fixation being fused to one of the two proteins or to one of the two protein domains, involved in the above interactions,
2) le deuxième monomère étant tel qu'il contient une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2 de l'opérateur muté, le susdit site de fixation étant fusionné à l'autre des deux protéines ou à l'autre des deux domaines protéiques, impliqué(e) dans les susdites interactions.2) the second monomer being such that it contains a second fusion protein containing the DNA binding site of a regulatory protein capable of specifically recognizing the sequence not mutated, or mutated silently or comprising the mutation 2 of the mutated operator, the above-mentioned binding site being fused to the other of the two proteins or to the other of the two protein domains, involved in the above interactions.
La présente invention concerne également un complexe caractérisé en ce que :The present invention also relates to a complex characterized in that:
- la séquence d'ADN est telle que définie ci-dessus et en ce que- the DNA sequence is as defined above and in that
- les hétérodimères contiennent :- the heterodimers contain:
1) un monomère contenant une première protéine de fusion contenant le site de fixation à l'ADN de LexA muté ou d'un fragment muté de LexA reconnaissant la séquence de l'opérateur muté contenant la mutation 1 , lequel site de fixation est fusionné avec une protéine déterminée ou un fragment protéique déterminé susceptible d'être impliqué dans une interaction tel que décrite ci-dessus, laquelle protéine ou lequel domaine protéique contient par exemple un domaine d'activation ou de dimérisation,1) a monomer containing a first fusion protein containing the DNA binding site of mutated LexA or of a mutated fragment of LexA recognizing the sequence of the mutated operator containing mutation 1, which binding site is fused with a specific protein or a specific protein fragment capable of being involved in an interaction as described above, which protein or which protein domain contains, for example, an activation or dimerization domain,
2) un monomère contenant une deuxième protéine de fusion contenant le site de fixation à l'ADN de LexA sauvage, ou porteur d'une mutation silencieuse ou d'une mutation 2 ou d'un fragment de LexA reconnaissant la séquence non mutée de LexA ou mutée de façon silencieuse ou comportant une mutation 2, lequel site de fixation est fusionné avec une protéine déterminée ou un fragment protéique déterminé, contenant par exemple une protéine ou un domaine protéique susceptible d'interagir avec la protéine ou le fragment protéique défini en 1) ou avec les susdits domaines d'activation ou de dimérisation.2) a monomer containing a second fusion protein containing the binding site to DNA of wild LexA, or carrying a silent mutation or a mutation 2 or a fragment of LexA recognizing the non-mutated sequence of LexA or mutated in a silent manner or comprising a mutation 2, which binding site is fused with a specific protein or a specific protein fragment, containing for example a protein or a protein domain capable of interacting with the protein or the fragment protein defined in 1) or with the above domains of activation or dimerization.
L'invention a également pour objet un hôte cellulaire contenant une séquence d'ADN telle que décrite ci-dessus.The invention also relates to a cell host containing a DNA sequence as described above.
L'invention a également pour objet un procédé pour détecter et quantifier des interactions entre deux protéines ou fragments de protéines, caractériséThe invention also relates to a method for detecting and quantifying interactions between two proteins or protein fragments, characterized
- en ce que l'on met en présence des séquences nucléotidiques codant respectivement pour le premier et le deuxième monomère contenant respectivement une première et une deuxième protéine de fusion telle que définie ci-dessus avec une séquence d'ADN telle que décrite précédemment, et- in that the nucleotide sequences coding for the first and the second monomer respectively containing a first and a second fusion protein as defined above are brought into contact with a DNA sequence as described above, and
- en ce que l'on détecte l'éventuelle répression de la transcription du gène indicateur tel que défini ci-dessus, notamment par transfection d'un hôte cellulaire tel que décrit ci-dessus, avec des vecteurs contenant, d'une part, les susdites séquences nucléotidiques codant respectivement pour le premier et le deuxième monomère contenant respectivement la première et la deuxième protéine de fusion et, d'autre part, les éléments nécessaires à l'expression des susdits monomères.- in that the possible repression of the transcription of the indicator gene as defined above is detected, in particular by transfection of a cellular host as described above, with vectors containing, on the one hand, the above nucleotide sequences coding respectively for the first and the second monomer respectively containing the first and the second fusion protein and, on the other hand, the elements necessary for the expression of the said monomers.
L'invention concerne un procédé pour identifier une protéine interagissant avec une protéine déterminée, caractériséThe invention relates to a method for identifying a protein interacting with a specific protein, characterized
- en ce que l'on met en présence les éléments suivants :- in the presence of the following elements:
. une séquence nucléotidique codant pour un premier monomère contenant une première protéine de fusion entre, d'une part, une protéine régulatrice selon l'invention et, d'autre part, la protéine déterminée,. a nucleotide sequence coding for a first monomer containing a first fusion protein between, on the one hand, a regulatory protein according to the invention and, on the other hand, the determined protein,
. une banque génomique, contenant notamment des fragments d'ADN, et notamment d'ADNc, chacun étant susceptible de coder pour une protéine interagissant avec la protéine déterminée, chacun des différents éléments de la banque génomique étant respectivement fusionné à la séquence codant pour une protéine régulatrice telle que définie ci-dessus,. a genomic library, containing in particular DNA fragments, and in particular cDNA, each capable of coding for a protein interacting with the determined protein, each of the different elements of the genomic library being respectively fused to the sequence coding for a protein regulatory as defined above,
. une séquence d'ADN selon l'invention, et. a DNA sequence according to the invention, and
- en ce que l'on détecte l'éventuelle répression de la transcription de la séquence nucléotidique codant pour une protéine indicatrice telle que décrite ci- dessus, notamment par transfection d'un hôte cellulaire selon la présente invention, d'une part, avec un vecteur contenant la séquence nucléotidique codant pour le susdit premier monomère contenant la première protéine de fusion et, d'autre part, un ensemble de vecteurs contenant une séquence nucléotidique codant pour un deuxième monomère contenant une deuxième protéine de fusion, chaque séquence nucléotidique codant pour chaque deuxième monomère contenant la séquence nucléotidique codant pour la protéine régulatrice selon la présente invention, et en aval de celle-ci l'un des éléments d'ADN de la susdite banque, tous les vecteurs contenant en outre les éléments nécessaires à l'expression des susdits monomères.- in that the possible repression of the transcription of the nucleotide sequence coding for an indicator protein as described above is detected, in particular by transfection of a cellular host according to the present invention, on the one hand, with a vector containing the nucleotide sequence coding for the above first monomer containing the first fusion protein and, on the other hand, a set of vectors containing a nucleotide sequence coding for a second monomer containing a second fusion protein, each nucleotide sequence coding for every second monomer containing the nucleotide sequence coding for the regulatory protein according to the present invention, and downstream of this one of the DNA elements of the above-mentioned library, all the vectors further containing the elements necessary for the expression of the aforesaid monomers.
Ce procédé fait l'objet de l'exemple ci-après. Dans cet exemple, le gène indicateur est lacZ et a été placé sous le contrôle d'une séquence promoteur/opérateur caractérisée en ce que l'opérateur a été muté comme indiqué ci-après. Ceci a donné lieu à la construction d'une souche indicatrice (SU202). Cette souche permet d'identifier, sur la base de la couleur des clones bactériens, l'existence d'interactions protéine-protéine entre deux protéines ou domaines protéiques fusionnés respectivement au domaine de fixation à l'ADN de LexA sauvage et LexA408 tels que décrits ci-après. Cette souche permet de quantifier et d'analyser par mutagenèse cette interaction.This process is the subject of the example below. In this example, the indicator gene is lacZ and has been placed under the control of a promoter / operator sequence characterized in that the operator has been mutated as indicated below. This gave rise to the construction of an indicator strain (SU202). This strain makes it possible to identify, on the basis of the color of the bacterial clones, the existence of protein-protein interactions between two proteins or protein domains fused respectively to the DNA binding domain of wild LexA and LexA408 as described below. This strain makes it possible to quantify and analyze this interaction by mutagenesis.
Cependant, le criblage d'une banque d'ADN nécessite l'analyse au minimum de 10^ clones. Ceci implique l'obtention sur milieu solide indicateur approprié (comme indiqué sur la figure 5) et l'expérience de 10^ colonies bactériennes dont il faudrait vérifier la couleur (blanches ou roses en cas d'interaction et rouges en absence d'interaction). Bien que théoriquement faisable, ceci est très coûteux non seulement en temps, mais également en matériel jetable.However, screening a DNA library requires the analysis of at least 10 ^ clones. This implies obtaining on an appropriate solid indicator medium (as indicated in FIG. 5) and the experiment of 10 ^ bacterial colonies whose color should be checked (white or pink in the event of interaction and red in the absence of interaction) . Although theoretically feasible, this is very costly not only in time, but also in disposable equipment.
Pour identifier de nouvelles interactions, on a avantageusement recours au système de sélection suivant. Dans ce type d'application, les interactions protéine-protéine ne sont plus visualisées sur la base de la couleur des clones bactériens, mais sur le simple fait de leur existence. En effet, si le gène indicateur est remplacé par un gène codant pour une protéine toxique :To identify new interactions, the following selection system is advantageously used. In this type of application, the protein-protein interactions are no longer visualized on the basis of the color of the bacterial clones, but on the simple fact of their existence. Indeed, if the indicator gene is replaced by a gene coding for a toxic protein:
- l'absence d'interaction protéine-protéine entre les parties Y et X de LexAι_ 7W -Y et de LexAι_g7408-X (comme décrit dans la figure 1) entraîne la production de la protéine toxique et donc la mort de la bactérie,the absence of protein-protein interaction between parts Y and X of LexAι_ 7W -Y and of LexAι_g7408-X (as described in FIG. 1) leads to the production of the toxic protein and therefore the death of the bacteria,
- l'existence de ces interactions entraîne la répression du gène toxique, la bactérie peut alors se diviser et donner lieu à une colonie sur milieu de culture solide.- the existence of these interactions leads to the repression of the toxic gene, the bacteria can then divide and give rise to a colony on solid culture medium.
Un tel système basé sur la survie des bactéries est bien évidemment plus facile à mettre en oeuvre. Il est cependant évident que, comme dans tous les systèmes de sélection, il faut compter avec ce que l'on appelle des "faux positifs", c'est-à-dire des clones qui survivent pour des raisons autres que celles que l'on identifier, par exemple, des mutations spontanées qui inactivent le produit du gène toxique. Pour lever cette ambiguïté, on utilise la souche indicatrice SU202. En effet, seuls les clones poussant blancs ou roses sont considérés comme "vrai positifs", les clones survivants dus à une mutation dans le gène toxique étant incapables de réprimer LacZ et poussant rouges.Such a system based on the survival of bacteria is obviously easier to implement. However, it is obvious that, as in all selection systems, there are so-called "false positives", that is to say clones which survive for reasons other than those we identify, for example, spontaneous mutations that inactivate the toxic gene product. To remove this ambiguity, use the indicator strain SU202. Indeed, only the clones growing white or pink are considered "true positive", the surviving clones due to a mutation in the toxic gene being unable to repress LacZ and growing red.
Le gène toxique utilisé est le gène sulA. Il code pour une protéine, SULA, inhibitrice de la division cellulaire. En sa présence, la bactérie ne se divise plus et meurt.The toxic gene used is the sulA gene. It codes for a protein, SULA, an inhibitor of cell division. In its presence, the bacteria no longer divides and dies.
Pour l'instant, la construction consistant à mettre sulA sous le contrôle d'un opérateur muté a été menée à bien. En utilisant le système modèle décrit ci-après avec les protéines hybrides de LexAι_g7408-cJunZip et LexAι_ 7WT- cFosZip, on a montré que le système fonctionne. En effet, la constniction (sulA sous le contrôle d'un opérateur muté) ne peut être propagée dans un hôte bactérien que si celui-ci porte également les gènes codant pour les protéines hybrides de LexAι_g7408-cJunZip et LexAι_g7WT-cFosZip.So far, the construction of putting sulA under the control of a transferred operator has been completed. Using the model system described below with the hybrid proteins of LexAι_g7408-cJunZip and LexAι_ 7WT-cFosZip, it has been shown that the system works. Indeed, the constniction (sulA under the control of a mutated operator) can only be propagated in a bacterial host if it also carries the genes coding for the hybrid proteins of LexAι_g7408-cJunZip and LexAι_g7WT-cFosZip.
La mise en évidence de nouvelles interactions protéine-protéine nécessite la constitution d'une banque d'ADN liguée en fusion à la suite du domaine de fixation. Pour cela, on a constitué une banque d'ADN qui est liguée en fusion à la suite du domaine de fixation à l'ADN de LexA sauvage ou d'un mutant de LexA reconnaissant la partie sauvage de l'opérateur mais avec une affinité moindre tels que ceux portant une des mutations suivantes G — » D ou G — > S en position 23 (réf. 21). Cette alternative a pour but de limiter l'apparition de clones "faux positifs" qui peuvent être dus à une interaction homodimérique trop forte d'une protéine ou domaine protéique présent dans la banque.The discovery of new protein-protein interactions requires the constitution of a DNA library ligated in fusion following the binding domain. For this, a DNA library was formed which is ligated in fusion following the DNA binding domain of wild LexA or of a LexA mutant recognizing the wild part of the operator but with a lower affinity. such as those carrying one of the following mutations G - »D or G -> S in position 23 (ref. 21). The purpose of this alternative is to limit the appearance of "false positive" clones which may be due to too strong homodimeric interaction of a protein or protein domain present in the library.
Description des figures :Description of the figures:
- Figure 1 : la Figure 1 concerne le principe du fonctionnement du système double-hybride chez E. coli- Figure 1: Figure 1 relates to the principle of operation of the double-hybrid system in E. coli
Le système est basé sur le fait qu'un opérateur muté contenant 1/2 opérateur sauvage (WT) et 1/2 opérateur muté (408) n'est reconnu que par un dimère mixte LexAWT/.LexA408. Un gène indicateur (lacZ représenté par un rectangle vide) a été mis sous le contrôle de cet opérateur mixte (représenté par un rectangle noir pour la partie non mutée et annotée WT et par un rectangle hachuré pour la partie mutée et annotée 408). Des protéines ou des sous domaines de protéines X et Y susceptibles d'interagir sont fusionnés aux domaines de fixation à l'ADN de LexAi-87WT (représenté par une sphère noire) et de LexAi-g7408 (représentée par une sphère hachurée). .LexAi-g7WT- X (représenté par un rectangle hachuré relié à une sphère hachurée) et LexA 1-87408- Y(représenté par un rectangle noir relié à une sphère noire) sont clones sur des plasmides compatibles et leur expression est contrôlée par un promoteur inductible (lacUV5, Oertel-Buchheit P., Lamerichs R.M.J.N. , Schnarr M. and Granger-Schnarr M. 1990 Mol. Gen. Genêt. 222:40-48 Genetic analysis of the LexA repressor: isolation and characterization of LexA(Def) mutant proteins.). .Les plasmides sont représentés par des cercles dont une partie épaissie est séparée en deux, l'une représente le gène codant pour les protéines, LexAι_87WT-X ou LexA 1-87408- Y et l'autre pour leur séquence promoteur, lacUV5). Ces protéines, LexAi-87WT-X et LexAi-87408-Y peuvent exister soit sous forme libre dans la bactérie, soit sous forme liée à l'ADN (représentée par un rectangle noir relié à une sphère grisée entrelacé avec un rectangle hachuré relié à une sphère hachurée eux mêmes reliés aux rectangles noirs et hachurés représentant l'opérateur mixte ci-dessus décrit.). Le promoteur LacUV5 est lui même sous le contrôle d'une protéine régulatrice, le répresseur lactose (représenté par un carré aux coins arrondis et segmenté en cartiers). Le gène codant pour ce répresseur (gène lacl) est clone sur un épisome, le facteur F' (Willetts N. and Skurray R. in E. coli and Salmonella Typhimurium, Cellular and Molecular Biology Ed. Neidhardt F.C. 1987, pp 1110-1133 et Oertel- Buccheit et al 1990) lui même représenté par un arc de cercle. Le répresseur lactose peut exister soit sous forme libre dans la bactérie, soit sous forme liée à l'ADN (représenté par un carré aux coins arrondis et segmenté en cartiers relié aux séquences promoteurs, lacUV5 décrites ci-dessus). Le terme LexA(Def) signifie que la souche est dépourvue de LexA endogène.The system is based on the fact that a mutated operator containing 1/2 wild operator (WT) and 1/2 mutated operator (408) is only recognized by a mixed LexAWT / .LexA408 dimer. An indicator gene (lacZ represented by an empty rectangle) was put under the control of this mixed operator (represented by a black rectangle for the non-mutated and annotated WT part and by a hatched rectangle for the mutated and annotated part 408). Proteins or subdomains of proteins X and Y capable of interacting are fused to the DNA binding domains of LexAi-87WT (represented by a black sphere) and LexAi-g7408 (represented by a hatched sphere). .LexAi-g7WT- X (represented by a hatched rectangle connected to a hatched sphere) and LexA 1-87408- Y (represented by a black rectangle connected to a black sphere) are cloned on compatible plasmids and their expression is controlled by a inducible promoter (lacUV5, Oertel-Buchheit P., Lamerichs RMJN, Schnarr M. and Granger-Schnarr M. 1990 Mol. Gen. Broom. 222: 40-48 Genetic analysis of the LexA repressor: isolation and characterization of LexA (Def) mutant proteins.). The plasmids are represented by circles, a thickened part of which is separated into two, one represents the gene coding for the proteins, LexAι_87WT-X or LexA 1-87408-Y and the other for their promoter sequence, lacUV5). These proteins, LexAi-87WT-X and LexAi-87408-Y can exist either in free form in the bacteria, or in form linked to DNA (represented by a black rectangle linked to a gray sphere interlaced with a hatched rectangle linked to a hatched sphere themselves connected to the black and hatched rectangles representing the mixed operator described above.). The LacUV5 promoter is itself under the control of a regulatory protein, the lactose repressor (represented by a square with rounded corners and segmented into boxes). The gene coding for this repressor (lacl gene) is cloned on an episome, factor F '(Willetts N. and Skurray R. in E. coli and Salmonella Typhimurium, Cellular and Molecular Biology Ed. Neidhardt FC 1987, pp 1110-1133 and Oertel-Buccheit et al 1990) itself represented by an arc of a circle. The lactose repressor can exist either in free form in the bacterium, or in form linked to DNA (represented by a square with rounded corners and segmented in cartons linked to the promoter sequences, lacUV5 described above). The term LexA (Def) means that the strain is devoid of endogenous LexA.
- Figure 2 : la Figure 2 représente la construction de la souche indicatrice pour la mise en oeuvre d'un système double hybride chez E. coli.- Figure 2: Figure 2 shows the construction of the indicator strain for the implementation of a double hybrid system in E. coli.
Le plasmide pRS415 (représenté par le cercle contenant à l'intérieur l'indication "pRS415" (SIMONS R.W., HOUMAN F. & KLECKNER N. (1987). Improved single and multicopy lac-based cloning vectors for protein and operon fusions. Gène 52:85-96) porte le gène lacZ, dépourvu de région promoteur/opérateur (représenté par un épaississement du trait) et deux sites uniques de coupure pour deux enzymes de restriction EcoRI et BamHI. "Lac " signifie que ce plasmide est incapable de produire le produit du gène lacZ puisqu'il est dépourvu d'une séquence promoteur/opérateur. Ce plasmide est coupé par ces deux enzymes puis ligué à un oligonucléotide de 70 paires de bases (70mer et représenté par un rectangle noir) dont la séquence est la suivante :The plasmid pRS415 (represented by the circle containing inside the indication "pRS415" (SIMONS RW, HOUMAN F. & KLECKNER N. (1987). Improved single and multicopy lac-based cloning vectors for protein and operon fusions. Gene 52: 85-96) carries the lacZ gene, lacking a promoter / operator region (represented by a thickening of the line) and two unique cleavage sites for two restriction enzymes EcoRI and BamHI. "Lac" means that this plasmid is incapable of produce the lacZ gene product since it lacks a promoter / operator sequence. This plasmid is cut by these two enzymes and then ligated to an oligonucleotide of 70 base pairs (70 mer and represented by a black rectangle) whose sequence is the next one :
GAATTCAATAGGGTTGATCTTTGTTGTCACTGGATGTACCGTACA TCCATACAGTAACTCACAGGGGCACCCTAGG-3' cet oligonucléotide introduit ainsi devant le gène lacZ une séquence promoteur/opérateur permettant au gène lacZ d'être transcript et régulé par l'opérateur mixte tel qu'il est défini dans la légende de la figure 1. Cette ligation symbolisée par une flèche entre le plasmide et le 70mer crée le plasmide pGC202 (représenté par le cercleGAATTCAATAGGGTTGATCTTTGTTGTCACTGGATGTACCGTACA TCCATACAGTAACTCACAGGGGCACCCTAGG-3 'this oligonucleotide thus introduces before the lacZ gene a promoter / operator sequence allowing the lacZ gene to be transcribed and regulated by the mixed operator as defined in the legend for figure 1. This ligation by an arrow between the plasmid and the 70mer creates the plasmid pGC202 (represented by the circle
-I- contenant à l'intérieur l'indication "pGC202"). "Lac " signifie que ce plasmide est maintenant capable de produire le produit du gène lacZ puisqu'il est pourvu d'une séquence promoteur/opérateur. Le gène indicateur ainsi constitué (représenté par un rectangle noir pour la séquence promoteur/opérateur et par un rectangle blanc pour le gène lacZ) est ensuite transféré sur l'ADN d'un phage lambda (λ) par un double événement de recombinaison entre l'ADN plasmique et phagique (on entend par double événement de recombinaison un mécanisme moléculaire complexe se produisant in vivo et aboutissant à l'échange de fragments d'ADN entre des molécules partiellement homologues, ceci est matérialisé sur la figure par deux croix entre le plasmide pGC 202 et une droite symbolisant l'ADN du phage) donnant lieu au phage λGC 202. Ce phage a la capacité de s'intégrer dans le chromosome bactérien par un mécanisme complexe ayant lieu in vivo (Elledge et al. 1991). L'intérêt de ce système réside dans le fait que le gène indicateur sera sur le chromosome bactérien et non plus sur un plasmide, ce qui permet d'utiliser les vecteurs plasmidiques comme véhicule des protéines de fusion .-I- containing inside the indication "pGC202"). "Lac" means that this plasmid is now capable of producing the lacZ gene product since it is provided with a promoter / operator sequence. The indicator gene thus formed (represented by a black rectangle for the promoter / operator sequence and by a white rectangle for the lacZ gene) is then transferred to the DNA of a lambda phage (λ) by a double recombination event between l Plasma and phage DNA (double recombination event is understood to mean a complex molecular mechanism occurring in vivo and resulting in the exchange of DNA fragments between partially homologous molecules, this is shown in the figure by two crosses between the plasmid pGC 202 and a line symbolizing the phage DNA) giving rise to the phage λGC 202. This phage has the capacity to integrate into the bacterial chromosome by a complex mechanism taking place in vivo (Elledge et al. 1991). The advantage of this system lies in the fact that the indicator gene will be on the bacterial chromosome and no longer on a plasmid, which makes it possible to use the plasmid vectors as a vehicle for fusion proteins.
- Figure 3 : la Figure 3 concerne la caractérisation de la souche SU202 en fonction de la quantité de protéines présentes dans la cellule.- Figure 3: Figure 3 concerns the characterization of the SU202 strain as a function of the quantity of proteins present in the cell.
En abscisse, figurent les concentrations en IPTG (M) et en ordonnées, l'expression relative de la β-galactosidase.On the abscissa are the concentrations of IPTG (M) and on the ordinate, the relative expression of β-galactosidase.
La variation de la quantité de protéines est obtenue en cultivant les bactéries en présence de concentrations variables en IPTG, les gènes codants pour les protéines chimères étant sous le contrôle du promoteur inductible lacUV5. Les unités β-galactosidases sont mesurées selon la méthode décrite par Miller (1972). L'express ion relative de la β-galactosidase est calculée en faisant le rapport entre les unités β-galactosidases mesurées en présence des vecteurs d'expression et celles mesurées en leur absence, ces dernières correspondent à l'état non réprimé du gène lacZ. .Les carrés blancs correspondent aux valeurs mesurées lorsque la souche contient un plasmide exprimant LexA 1-87408- cJunZip (pDL606, voir figures 6 et 7). Les cercles blancs correspondent aux valeurs mesurées lorsque la souche contient un plasmide exprimant le domaine de fixation à l'ADN seul (JWL96, Little JW and Hill S.A. (1985) Deletion within the hinge région of a spécifie DNA-binding protein Proc. Natl. Acad. Sci USA, 22:2301-2305). Les triangles blancs correspondent aux valeurs mesurées lorsque la souche contient un plasmide exprimant LexAi-g7WT-cFosZip (pMS404, voir figures 8 et 9). Les carrés noirs correspondent aux valeurs mesurées lorsque la souche contient à la fois le plasmide exprimant le domaine de fixation à l'ADN seul (JWL96) et celui exprimant LexAi-87408-cJunZiρ (pDL606, voir figures 6 et 7). Les cercles noirs correspondent aux valeurs mesurées lorsque la souche contient à la fois le plasmide exprimant LexAi- 87408-cJunZip (pDL606, voir figures 6 et 7) et celui exprimant LexAi-87WT- cFosZip (pMS404, voir figures 8 et 9).The variation in the quantity of proteins is obtained by cultivating the bacteria in the presence of variable concentrations of IPTG, the genes coding for the chimeric proteins being under the control of the inducible promoter lacUV5. The β-galactosidase units are measured according to the method described by Miller (1972). The relative expression of β-galactosidase is calculated by making the ratio between the β-galactosidase units measured in the presence of the expression vectors and those measured in their absence, the latter correspond to the non-repressed state of the lacZ gene. The white squares correspond to the values measured when the strain contains a plasmid expressing LexA 1-87408-cJunZip (pDL606, see Figures 6 and 7). The white circles correspond to the values measured when the strain contains a plasmid expressing the DNA binding domain alone (JWL96, Little JW and Hill SA (1985) Deletion within the hinge region of a specifies DNA-binding protein Proc. Natl. Acad. Sci USA, 22: 2301-2305). The white triangles correspond to the values measured when the strain contains a plasmid expressing LexAi-g7WT-cFosZip (pMS404, see Figures 8 and 9). The black squares correspond to the values measured when the strain contains both the plasmid expressing the domain DNA binding alone (JWL96) and that expressing LexAi-87408-cJunZiρ (pDL606, see Figures 6 and 7). The black circles correspond to the values measured when the strain contains both the plasmid expressing LexAi-87408-cJunZip (pDL606, see Figures 6 and 7) and that expressing LexAi-87WT-cFosZip (pMS404, see Figures 8 and 9).
- Figure 4 : la Figure 4 représente la souche bactérienne SU202 qui permet de mesurer sélectivement l'hétérodimérisation de protéines de fusion susceptibles d'homodimériser.- Figure 4: Figure 4 represents the bacterial strain SU202 which makes it possible to selectively measure the heterodimerization of fusion proteins capable of homodimerizing.
En abscisse, figurent les concentrations en IPTG (M) et en ordonnées, l'expression relative de la β-galactosidase.On the abscissa are the concentrations of IPTG (M) and on the ordinate, the relative expression of β-galactosidase.
Des mutants de la glissière à leucine ("leucine zipper") de Fos ont été construits au laboratoire, ces mutants ont acquis la capacité à homodimériser (contrairement au leucine zipper de Fos qui lui en est incapable). Quatre de ces mutants sont utilisés ici et sont décrits dans: Porte D., Oertel-Buccheit P., Granger-Schnarr M. and Schnarr M. 1995 J. Biol. Chem. 22Q:22721-22730 Fos leucine zipper variants with increased association capacity, Il s'agit :Fos leucine zipper mutants were constructed in the laboratory, these mutants acquired the ability to homodimerize (unlike Fos leucine zipper, which is incapable of this). Four of these mutants are used here and are described in: Porte D., Oertel-Buccheit P., Granger-Schnarr M. and Schnarr M. 1995 J. Biol. Chem. 22Q: 22721-22730 Fos leucine zipper variants with increased association capacity, These are:
* d'un mutant pour lequel les cinq positions "a" de la glissière ("zipper") (définies dans Porte et al 1995) sont occupées par des résidus leucine (LexAi-87WT-cFosZipLLLLL) et qui est représenté par des cercles blancs dans les figures 4 A, B et C,* a mutant for which the five positions "a" of the slide ("zipper") (defined in Porte et al 1995) are occupied by leucine residues (LexAi-87WT-cFosZipLLLLL) and which is represented by white circles in Figures 4 A, B and C,
* d'un mutant pour lequel les cinq positions "a" de la glissière ("zipper") (définies dans Porte et al. 1995) sont occupées successivement par deux valines, une isoleucine, une phénylalanine et une valine (LexAi-87WT- cFosZipWIFV) et qui est représenté par des cercles noirs dans les figures 4A, B et C,* of a mutant for which the five positions "a" of the slide ("zipper") (defined in Porte et al. 1995) are successively occupied by two valines, an isoleucine, a phenylalanine and a valine (LexAi-87WT- cFosZipWIFV) and which is represented by black circles in FIGS. 4A, B and C,
* d'un mutant pour lequel les cinq positions "a" de la glissière ("zipper") (définies dans Porte et al. 1995) sont occupées successivement par deux isoleucines, une leucine et deux isoleucines (LexAi-87WT-cFosZipIILII) et qui est représenté par des carrés blancs dans les figures 4A, B et C,* a mutant for which the five positions "a" of the slide ("zipper") (defined in Porte et al. 1995) are successively occupied by two isoleucines, a leucine and two isoleucines (LexAi-87WT-cFosZipIILII) and which is represented by white squares in Figures 4A, B and C,
* d'un mutant pour lequel les cinq positions "a" de la glissière ("zipper") (définies dans Porte et al. 1995) sont occupées successivement par une isoleucine, une leucine, une phénylalanine, une leucine et une phénylalanine (LexAi-87WT-cFosZipILFLF) et qui est représenté par des carrés noirs dans les figures 4A, B et C,* a mutant for which the five positions "a" of the slide ("zipper") (defined in Porte et al. 1995) are successively occupied by an isoleucine, a leucine, a phenylalanine, a leucine and a phenylalanine (LexAi -87WT-cFosZipILFLF) and which is represented by black squares in FIGS. 4A, B and C,
* les triangles noirs représentent LexAi-87WT-cFosZip sauvage,* the black triangles represent wild LexAi-87WT-cFosZip,
* les courbes en pointillés représentent les mesures faites en absence de plasmide. Chacune de ces constructions est soit introduite séparément dans les souches bactériennes indicatrices (figure 4A pour la souche SU202 et 4B pour la souche SU101) soit co-introduites avec la protéine de fusion LexAi-87408- cJunZip (figure 4C). L'activité β-galactosidase est ensuite mesurée dans les conditions décrites par Miller et al 1972 en fonction de concentrations variables en IPTG. En absence de protéine, le nombre d'unités mesurées reste constant, indiquant que le gène codant pour la β-galactosidase est complètement exprimé, lorsque le nombre d'unités mesurées diminue, cela signifie que le gène codant pour la β-galactosidase est réprimé, l'intensité de la répression étant fonction à la fois de la quantité de protéine présente dans la cellule (elle augmente lorsque l'on augmente la concentration en IPTG) et de la force d'interaction des protéines entre elles.* the dotted curves represent the measurements made in the absence of plasmid. Each of these constructions is either introduced separately into the indicator bacterial strains (FIG. 4A for the strain SU202 and 4B for the strain SU101) or co-introduced with the fusion protein LexAi-87408-cJunZip (FIG. 4C). The β-galactosidase activity is then measured under the conditions described by Miller et al 1972 as a function of variable concentrations of IPTG. In the absence of protein, the number of units measured remains constant, indicating that the gene coding for β-galactosidase is completely expressed, when the number of units measured decreases, this means that the gene coding for β-galactosidase is repressed , the intensity of the repression being a function both of the amount of protein present in the cell (it increases when the concentration of IPTG increases) and of the interaction strength of the proteins with each other.
A- La souche SU202 (comme décrite dans cette revendication) ne "répond" pas à l'homodimérisation (lacZ contrôlé par un opérateur mixte WT/408).A- The strain SU202 (as described in this claim) does not "respond" to homodimerization (lacZ controlled by a mixed operator WT / 408).
B- L'homodimérisation des différentes protéines est mise en évidence dans une souche (SU101) dans laquelle lacZ est contrôlé par un opérateur WTC-La souche SU202 mesure sélectivement leur hétérodimérisation avec LexA408JunZipB- The homodimerization of the various proteins is demonstrated in a strain (SU101) in which lacZ is controlled by a WTC operator -The strain SU202 selectively measures their heterodimerization with LexA408JunZip
- Figure 5 : sur la Figure 5, on voit que la souche SU 202 est transformée soit avec chacun des plasmides portant les gènes codant pour les protéines de fusion LexAi-87408-cJunZip et LexAj_87WT-cFosZip soit cotransformée avec les deux plasmides. Les cellules transformées sont laissées une nuit à température ambiante dans du LB additionné respectivement soit de kanamycine, chloramphenicol, ampicilline soit de kanamycine, chloramphenicol, tétracycline soit des quatre antibiotiques: kanamycine, chloramphenicol, ampicilline et tétracycline, avant d'être étalées sur milieu solide McConkey contenant les mêmes antibiotiques. Les cellules transformées par un seul des deux plasmides poussent rouges. Cette coloration signifie que le gène de la β-galactosidase n'est pas réprimé par les protéines de fusion et que l'enzyme produit fermente le lactose du milieu. Les bactéries cotransformées par les deux plasmides poussent blanches, le gène de la β-galactosidase est réprimé.- Figure 5: in Figure 5, we see that the SU 202 strain is transformed either with each of the plasmids carrying the genes coding for the fusion proteins LexAi-87408-cJunZip and LexA j _87WT-cFosZip is cotransformed with the two plasmids. The transformed cells are left overnight at room temperature in LB supplemented with either kanamycin, chloramphenicol, ampicillin or kanamycin, chloramphenicol, tetracycline or the four antibiotics: kanamycin, chloramphenicol, ampicillin and tetracycline, before being spread on solid medium. McConkey containing the same antibiotics. Cells transformed by only one of the two plasmids grow red. This staining means that the β-galactosidase gene is not repressed by the fusion proteins and that the enzyme produced ferments the lactose in the medium. The bacteria cotransformed by the two plasmids grow white, the β-galactosidase gene is suppressed.
- Figure 6 : la Figure 6 représente la carte du plasmide pDL606 (pour le clonage de "l'hameçon"). Les sites de restrictions indiqués sont des sites uniques. Ap représente la gène codant pour la résistance à l'ampicilline, pl5A l'origine de replication du plasmide. Le vecteur est de type pACYC (New England Biolabs, Inc) : pACYC177. - Figure 7 : la Figure 7 représente la séquence d'une partie du plasmide pDL606 codant pour la protéine de fusion LexAi-87408-cJunZip. Les sites indiqués permettent de se repérer sur la carte de la figure 6.- Figure 6: Figure 6 shows the map of plasmid pDL606 (for cloning the "hook"). The restriction sites indicated are unique sites. Ap represents the gene coding for resistance to ampicillin, p15, at the origin of replication of the plasmid. The vector is of pACYC type (New England Biolabs, Inc): pACYC177. - Figure 7: Figure 7 shows the sequence of part of the plasmid pDL606 coding for the fusion protein LexAi-87408-cJunZip. The indicated sites make it possible to locate oneself on the map of figure 6.
- Figure 8 : la Figure 8 représente la carte du plasmide pMS404. Les sites de restriction indiqués sont des sites uniques. Tet représente le gène codant pour la résistance à la tétracycline, Ori l'origine de replication du plasmide. Le vecteur est de type pUC (New England Biolabs, Inc).- Figure 8: Figure 8 shows the map of plasmid pMS404. The restriction sites indicated are unique sites. Tet represents the gene coding for resistance to tetracycline, Ori the origin of replication of the plasmid. The vector is of the pUC type (New England Biolabs, Inc).
- Figure 9 : la Figure 9 représente la séquence d'une partie du plasmide pMS404 codant pour la protéine de fusion LexAi-87WT-cFosZip. Les sites indiqués permettent de se repérer sur la carte de la figure 8.- Figure 9: Figure 9 shows the sequence of part of the plasmid pMS404 encoding the fusion protein LexAi-87WT-cFosZip. The indicated sites make it possible to locate oneself on the map of figure 8.
- Figure 10 : la Figure 10 représente la carte du plasmide pL23B (vecteur plasmidique pour clonage de banque pour SU202). Les sites de restriction indiqués sont des sites uniques. Tet représente le gène codant pour la résistance à la tétracycline, Ori l'origine de replication du plasmide. Ce plasmide porte le domaine de fixation à l'ADN d'un mutant de LexA, LexA 1-823 (mutation G- > S en position 23). Cette mutation n'affecte pas la spécificité de reconnaissance (LexA23 reconnaît la même séquence que LexAWT) mais affecte la force avec laquelle cette interaction protéine/ADN se produit. En effet, pour améliorer le système, nous avons trouvé qu'en diminuant la force d'interaction entre LexA et l'ADN, on gagnait en sensibilité. Ce plasmide est prévu pour le clonage d'une banque.- Figure 10: Figure 10 shows the map of plasmid pL23B (plasmid vector for bank cloning for SU202). The restriction sites indicated are unique sites. Tet represents the gene coding for resistance to tetracycline, Ori the origin of replication of the plasmid. This plasmid carries the DNA binding domain of a LexA mutant, LexA 1-823 (G-> S mutation in position 23). This mutation does not affect recognition specificity (LexA23 recognizes the same sequence as LexAWT) but does affect the strength with which this protein / DNA interaction occurs. In fact, to improve the system, we found that by decreasing the force of interaction between LexA and DNA, we gained in sensitivity. This plasmid is intended for the cloning of a library.
- Figure 11 : la Figure 11 représente la séquence d'une partie du plasmide pL23B codant pour LexA 1-8723. La banque peut être clonée derrière LexAi-8723 en utilisant l'un des sites uniques suivants: Xhol, EcoRI, Sfil. En aval de ces sites trois codons stops (TAA) ont été insérés dans les trois cadres de lecture afin de limiter la protéine de fusion. Les sites indiqués permettent de se repérer sur la carte de la figure 10.- Figure 11: Figure 11 shows the sequence of part of the plasmid pL23B coding for LexA 1-8723. The bank can be cloned behind LexAi-8723 using one of the following unique sites: Xhol, EcoRI, Sfil. Downstream of these sites, three stop codons (TAA) were inserted into the three reading frames in order to limit the fusion protein. The indicated sites make it possible to locate oneself on the map of figure 10.
L'invention sera complétée par la description détaillée et les exemples qui suivent, donnés à titre illustratif et non limitatif.The invention will be supplemented by the detailed description and the examples which follow, given by way of illustration and not limitation.
Principe du fonctionnement du système double-hybride chez E. coli Le système double-hybride chez E. coli est basé sur l'utilisation de LexA, répresseur bactérien. LexA sauvage reconnaît spécifiquement et sous forme de dimères une séquence palindromique de 16 paires de bases, CTGT (N)8 ACAG, appelée opérateur. Les 4 paires de bases externes sont fortement conservées, alors que le motif central est plus variable. Chaque monomère de LexA est composé d'un domaine de fixation à l'ADN qui reconnaît la séquence CTGT et d'un domaine de dimérisation indispensable à la fixation sur l'ADN puisque le domaine de fixation à l'ADN dépourvu de domaine de dimérisation, ne fixe que très faiblement l'ADN.Principle of the double-hybrid system in E. coli The double-hybrid system in E. coli is based on the use of LexA, a bacterial repressor. Wild LexA specifically recognizes and in the form of dimers a palindromic sequence of 16 base pairs, CTGT (N) 8 ACAG, called operator. The 4 external base pairs are highly conserved, while the central motif is more variable. Each LexA monomer is composed of a DNA binding domain which recognizes the CTGT sequence and a dimerization domain essential for binding to DNA since the DNA binding domain lacking a dimerization domain, only fixes DNA very weakly.
La littérature décrit des mutants de .LexA ayant une nouvelle spécificité de fixation à l'ADN. Celui qui a été utilisé, LexA408, porte une triple mutation (P40→A, N41-»S, A42→S) et reconnaît la séquence suivante CCGT (N)8 ACGG.The literature describes mutants of .LexA having a new specificity for binding to DNA. The one that was used, LexA408, carries a triple mutation (P40 → A, N41- »S, A42 → S) and recognizes the following sequence CCGT (N) 8 ACGG.
Le système selon la présente invention est basé sur le fait qu'un opérateur muté contenant 1/2 opérateur sauvage et 1/2 opérateur muté n'est reconnu que par un dimère mixte LexAWT/LexA408. Un gène indicateur (lacZ) également désigné par gène reporter a été mis sous le contrôle de cet opérateur. Des protéines ou des sous domaines de protéines X et Y susceptibles d'interagir sont ensuite fusionnés aux domaines de fixation à l'ADN, LexA _87WT et de LexAι_ 87408. La figure 1 illustre ce système. LexAι_87WT-X et LexAι_87408-Y sont clones sur des plasmides compatibles et leur expression est contrôlée par un promoteur inductible (lacUVS). La souche indicatrice surexprimant le répresseur du promoteur lactose (puisque lacF\), on peut alors moduler l'expression de LexAι_87WT-X et LexAι_87408-Y en ajoutant des concentrations variables de l'inducteur IPTG.The system according to the present invention is based on the fact that a mutated operator containing 1/2 wild-type operator and 1/2 mutated operator is recognized only by a mixed LexAWT / LexA408 dimer. An indicator gene (lacZ) also designated by reporter gene was put under the control of this operator. Proteins or subdomains of proteins X and Y capable of interacting are then fused to the DNA binding domains, LexA _87WT and LexAι_ 87408. FIG. 1 illustrates this system. LexAι_87WT-X and LexAι_87408-Y are cloned on compatible plasmids and their expression is controlled by an inducible promoter (lacUVS). The indicator strain overexpressing the repressor of the lactose promoter (since lacF \), one can then modulate the expression of LexAι_87WT-X and LexAι_87408-Y by adding variable concentrations of the inducer IPTG.
Ce système a deux utilisations principales:This system has two main uses:
I)- X et Y peuvent être des protéines ou des domaines de protéines caractérisés et interagissants entre eux, ils confèrent alors aux protéines hybrides la capacité de se fixer de façon stable sur l'ADN et ainsi de réprimer le gène lacZ. Une telle interaction peut être visualisée sur un milieu indicateur approprié (par exemple Mac Conkey et décrit ci-après) et peut également être quantifiée par dosage du produit du gène lacZ, la β-galactosidase selon la méthode décrite par Miller J.H., 1972 "Experiments in Molecular Genetics, Cold Spring Harbor Lab. Cold Spring Harbor, NY) ; il est ainsi possible :I) - X and Y can be proteins or protein domains characterized and interacting with each other, they then give the hybrid proteins the ability to bind stably to DNA and thus repress the lacZ gene. Such an interaction can be visualized on an appropriate indicator medium (for example Mac Conkey and described below) and can also be quantified by assaying the lacZ gene product, β-galactosidase according to the method described by Miller JH, 1972 "Experiments in Molecular Genetics, Cold Spring Harbor Lab. Cold Spring Harbor, NY); it is thus possible:
1) de quantifier la force de cette interaction ;1) quantify the strength of this interaction;
2) d'identifier les déterminants de cette interaction (par mutagenèse par exemple) ;2) to identify the determinants of this interaction (by mutagenesis for example);
3) d'identifier des molécules capables d'interférer avec cette interaction et susceptibles d'être utilisées in vivo ; petites molécules susceptibles d'être mises dans le milieu de culture et de passer à travers la paroi bactérienne.3) to identify molecules capable of interfering with this interaction and capable of being used in vivo; small molecules that can be put in the culture medium and pass through the bacterial wall.
II)- X (ou Y) est une protéine ou un domaine de protéine susceptible d'interagir avec une ou des protéine(s) encore inconnue(s) que l'on veut identifier. On greffe alors sur Y (ou X) une banque, cette banque étant cointroduite dans la souche indicatrice avec le gène codant pour la protéine hybride dont on cherche le ou les partenaires. Tout élément de la banque codant pour une protéine ou un domaine de protéine interagissant avec X (ou Y) donne lieu à un clone bactérien dont la couleur sur milieu approprié est différente de ceux pour lesquels il n'y a pas d'interaction. Ce ou ces éléments sont alors identifiés par séquençage.II) - X (or Y) is a protein or a protein domain capable of interacting with a protein (s) still unknown that we want to identify. A bank is then grafted onto Y (or X), this bank being cointroduced into the indicator strain with the gene coding for the hybrid protein for which the partner or partners are sought. Any element of the coding bank for a protein or a protein domain interacting with X (or Y) gives rise to a bacterial clone whose color on an appropriate medium is different from those for which there is no interaction. This or these elements are then identified by sequencing.
EXEMPLE 1 :EXAMPLE 1:
Construction de la souche indicatrice pour la mise en oeuvre d'un système double hybride chez E. coliConstruction of the indicator strain for the implementation of a double hybrid system in E. coli
Cette construction nécessite :This construction requires:
1) le clonage de lacZ sous le contrôle d'un promoteur régulé par un opérateur de type CCGT (N)8 ACAG;1) cloning of lacZ under the control of a promoter regulated by an operator of the CCGT (N) 8 ACAG type;
2) de faire passer cette construction sur le chromose d'un hôte bactérien délété de son opéron lactose, déficient en LexA chromosomique et exprimant le répresseur lactose, souche JL1434 (Little J.W. & Hill S.A. 1985 Deletions within a hinge région of a spécifie DNA-binding protein. Proc. Natl. Acad. Sci. USA £2:2301-2305 et ceci par l'intermédiaire d'un phage lambda (Figure 2).2) to pass this construction on the chromose of a bacterial host deleted from its lactose operon, deficient in chromosomal LexA and expressing the lactose repressor, strain JL1434 (Little JW & Hill SA 1985 Deletions within a hinge region of a specifies DNA- binding protein, Proc Natl, Acad Sci, USA £ 2: 2301-2305 and this via a lambda phage (Figure 2).
1. Construction de plasmides portant le gène lacZ placé sous le contrôle d'un opérateur muté WT / 4081. Construction of plasmids carrying the lacZ gene placed under the control of a mutated operator WT / 408
Le plasmide pRS415 portant le gène lacZ, dépourvu de région promoteur/opérateur (Simons R.W., Houman F. & Kleckner N. (1987). Improved single and multicopy lac-based cloning vectors for protein and operon fusions. Gène 5_2:85-96.) est ouvert aux sites de restriction EcoRI/BamHI. Entre ces deux sites uniques de restriction, a été inséré l' oligonucléotide double brin suivant:The plasmid pRS415 carrying the lacZ gene, devoid of promoter / operator region (Simons RW, Houman F. & Kleckner N. (1987). Improved single and multicopy lac-based cloning vectors for protein and operon fusions. Gene 5_2: 85-96 .) is open to EcoRI / BamHI restriction sites. Between these two unique restriction sites, the following double-stranded oligonucleotide has been inserted:
S,-GAATTC>VATAGGGTTGATCTTTGTTGTCACTGGATGTACCGTACATCCATACAGT ^ACTCACAGGGC.CACCCTAGG-3'S , -GAATTC> VATAGGGTTGATCTTTGTTGTCACTGGATGTACCGTACATCCATACAGT ^ ACTCACAGGGC.CACCCTAGG-3 '
(bases en caractère gras = éléments du promoteur, bases soulignées = opérateur) créant ainsi le plasmide pGC202.(bases in bold = promoter elements, underlined bases = operator) thus creating the plasmid pGC202.
2. Isolement de bactériophages Lac + recombinants2. Isolation of Recombinant Lac + Bacteriophages
La souche JL1434 (LexA(Def), Lac"), transformée par les plasmides pGC202, a été infectée par le bactériophage λφd (Lac~< Hochschild A. & Ptashne M. (1988). Interaction at a distance between λ repressors disrupts gène activation. Nature 226:353-357) dont le génome porte immédiatement à gauche d'un gène lacZ dépourvu de promoteur et de codon d'initiation (ATG) de la traduction, une séquence dérivant du vecteur pBR322 et que l'on retrouve également à gauche du site de clonage EcoRI du plasmide pRS415 (voir figure 2). Grâce aux séquences homologues situées de part et d'autre de la séquence "promoteur/opérateur/initiateur" et suite à un double événement de recombinaison entre l'ADN plasmique et phagique, le gène lacZ se retrouve sous le contrôle de la région promoteur/opérateur clone dans pGC202 donnant lieu au phage λGC 202.The strain JL1434 (LexA (Def), Lac "), transformed by the plasmids pGC202, was infected by the bacteriophage λφd (Lac ~ <Hochschild A. & Ptashne M. (1988). Interaction at a distance between λ repressors disrupts gene activation Nature 226: 353-357) whose genome carries immediately to the left of a lacZ gene devoid of promoter and initiation codon (ATG) of translation, a sequence derived from the vector pBR322 and which is also found to the left of the EcoRI cloning site of the plasmid pRS415 (see figure 2). Thanks to the homologous sequences located on either side of the "promoter / operator / initiator" sequence and following a double recombination event between the plasma and phage DNA, the lacZ gene is found under the control of the promoter / clone operator in pGC202 giving rise to phage λGC 202.
3. Isolement de bactéries lysogènes pour les bactériophages Lac+ recombinants3. Isolation of Lysogenic Bacteria for Recombinant Lac + Bacteriophages
L'isolement de bactéries lysogènes a pour but d'obtenir l'intégration stable du phage recombinant dans le chromosome bactérien, qui s'y trouve alors à l'état de prophage. Ceci se fait à partir d'une deuxième infection des bactéries JL1434 avec des minipréparations du phage précédemment obtenu afin de se débarrasser du plasmide initial et de s'assurer ainsi que le caractère Lac"*" est bien porté par le phage.The purpose of isolating lysogenic bacteria is to obtain stable integration of the recombinant phage into the bacterial chromosome, which is then in the prophage state. This is done from a second infection of the bacteria JL1434 with mini-preparations of the phage previously obtained in order to get rid of the initial plasmid and thus to ensure that the Lac character "* " is well carried by the phage.
Après infection de la souche JL1434, les phages λ recombinants commencent un cycle lysogène qui conduit à l'intégration stable par recombinaison site-spécifique de leurs génomes (et donc du gène lacZ contrôlés par l'élément promoteurs/opérateurs décrit ci-dessus) dans le chromosome bactérien, au niveau du site att b entre les opérons gai et bio. La souche lysogène Lac"** SU202 a ainsi été isolée. Cette souche indicatrice porte les gènes de résistance à la Kanamycine et au Chloramphenicol.After infection of the JL1434 strain, the recombinant λ phages begin a lysogenic cycle which leads to stable integration by site-specific recombination of their genomes (and therefore of the lacZ gene controlled by the promoter / operator element described above) in the bacterial chromosome, at the att b site between the gay and organic operons. The lysogenic Lac " * * SU202 strain was thus isolated. This indicator strain carries the genes for resistance to Kanamycin and Chloramphenicol.
Description des plasmides porteurs des protéines hybridesDescription of the plasmids carrying the hybrid proteins
Les gènes codant pour les protéines hybrides sont portés par deux vecteurs plasmidiques compatibles portant des origines de replication différentes (pMBl ou pl5A) ainsi que la sélection pour deux marqueurs différents (tet^ ou amp^ ) rendant ainsi possible leur maintien simultané dans la même bactérie hôte.The genes coding for the hybrid proteins are carried by two compatible plasmid vectors carrying different origins of replication (pMBl or pl5A) as well as the selection for two different markers (tet ^ or amp ^) thus making it possible to maintain them simultaneously in the same bacterium. host.
Utilisation de la souche SU202 pour identifier et quantifier des interactions protéine/protéineUse of the SU202 strain to identify and quantify protein / protein interactions
La souche indicatrice SU202 a été testée avec les protéines chimères suivantes LexAi-87408-cJunZip et LexAi-87WT-cFosZip, elles sont constituées du domaine de fixation à l'ADN (mutant 408 ou sauvage (WT)) du répresseur LexA (aa 1-87) et du domaine de dimérisation (glissière à leucine ou "leucine zipper") des oncoprotéines cJun (aa 277-315) et cFos (aa 102-200).The indicator strain SU202 was tested with the following chimeric proteins LexAi-87408-cJunZip and LexAi-87WT-cFosZip, they consist of the DNA binding domain (mutant 408 or wild-type (WT)) of the repressor LexA (aa 1 -87) and of the dimerization domain (leucine slide or "leucine zipper") of the oncoproteins cJun (aa 277-315) and cFos (aa 102-200).
Le gène codant pour LexAi-87408-cJunZiρ est porté par le plasmide pDL606 (voir figures 6 et 7). La figure 6 représente une carte de l'ensemble du plasmide accompagné des sites uniques de restriction, le vecteur est un pACYC177 (New England Biolabs, Inc.) ; il porte la résistance à l' ampicilline et pi 5 A comme origine de replication. La figure 7 représente la partie de la séquence de ce plasmide correspondant à la protéine de fusion, cette séquence étant repérable sur la carte générale à l'aide des sites de restriction.The gene coding for LexAi-87408-cJunZiρ is carried by the plasmid pDL606 (see Figures 6 and 7). FIG. 6 represents a map of the entire plasmid accompanied by the unique restriction sites, the vector is a pACYC177 (New England Biolabs, Inc.); it carries resistance to ampicillin and pi 5 A as the origin of replication. FIG. 7 represents the part of the sequence of this plasmid corresponding to the fusion protein, this sequence being identifiable on the general map using the restriction sites.
Le gène codant pour LexAι_87WT-cFosZip est porté par le plasmide pMS404 (voir figures 8 et 9). La figure 8 représente une carte de l'ensemble du plasmide accompagné des sites uniques de restriction, le vecteur est un plasmide apparenté à un pBR322 (New England Biolabs, Inc.) ; il porte la résistance à la tétracycline et pMBl comme origine de replication. La figure 9 représente la partie de la séquence de ce plasmide correspondant à la protéine de fusion, cette séquence étant repérable sur la carte générale à l'aide des sites de restriction.The gene coding for LexAι_87WT-cFosZip is carried by the plasmid pMS404 (see Figures 8 and 9). FIG. 8 represents a map of the whole of the plasmid accompanied by the unique restriction sites, the vector is a plasmid related to a pBR322 (New England Biolabs, Inc.); it carries resistance to tetracycline and pMB1 as the origin of replication. FIG. 9 represents the part of the sequence of this plasmid corresponding to the fusion protein, this sequence being identifiable on the general map using the restriction sites.
Ces domaines de dimérisation sont tels que les homodimères Jun Jun sont beaucoup moins stables que les hétérodimères Jun Fos, mais cependant davantage que les homodimères Fos/Fos qui n'existent pas in vivo (Sassone- Corsi P. , Ransone L.J., Lamph W.W. & Verma I.M. (1988). Direct interaction between fos and jun nuclear oncoproteins: rôle of the "leucine-zipper" domain. Nature (London) 2 :692-695.).These dimerization domains are such that the Jun Jun homodimers are much less stable than the Jun Fos heterodimers, but nevertheless more than the Fos / Fos homodimers which do not exist in vivo (Sassone- Corsi P., Ransone LJ, Lamph WW & Verma IM (1988). Direct interaction between fos and jun nuclear oncoproteins: role of the "leucine-zipper" domain. Nature (London) 2: 692-695.).
Les gènes codant pour ces deux protéines de fusion sont contrôlés par le promoteur inductible lacUV5. Les souches indicatrices surexp imant ce répresseur (puisque lacl'ï), permettent de moduler l'expression de LexAi- 87408-cJunZip et LexAi-87WT-cFosZip en présence de différentes concentrations en inducteur (IPTG).The genes encoding these two fusion proteins are controlled by the inducible promoter lacUV5. The indicator strains overexpressing this repressor (since lacl'ï), make it possible to modulate the expression of LexAi- 87408-cJunZip and LexAi-87WT-cFosZip in the presence of different concentrations of inducer (IPTG).
Test qualitatifQualitative test
La souche SU 202 est transformée soit avec chacun des plasmides portant les gènes codant pour les protéines de fusion LexAι_87408-cJunZip et LexAi- 87WT-cFosZip soit cotransformée avec les deux plasmides. Les cellules transformées sont laissées une nuit à température ambiante dans du LB (Maniatis et al.) additionné respectivement soit de kanamycine, chloramphenicol, ampicilline soit de kanamycine, chloramphenicol, tétracycline soit des quatre antibiotiques: kanamycine, chloramphenicol, ampicilline et tétracycline, avant d'être étalées sur milieu McConkey contenant les mêmes antibiotiques. La figure 5 montre, après repiquage sur une même boîte, les résultats obtenus.The SU 202 strain is transformed either with each of the plasmids carrying the genes coding for the fusion proteins LexAι_87408-cJunZip and LexAi- 87WT-cFosZip or cotransformed with the two plasmids. The transformed cells are left overnight at room temperature in LB (Maniatis et al.) Added respectively with either kanamycin, chloramphenicol, ampicillin or kanamycin, chloramphenicol, tetracycline or the four antibiotics: kanamycin, chloramphenicol, ampicillin and tetracycline, before d 'be spread on McConkey medium containing the same antibiotics. Figure 5 shows, after transplanting onto the same box, the results obtained.
Ce type de milieu de culture contient entre autre du lactose qui est hydrolyse par la β-galactosidase en allolactose. L' allolactose étant l'inducteur naturel du promoteur lactose, lorsque les bactéries possédant l'un ou les deux gènes codant pour les protéines chimères sont cultivées sur ce milieu, ceux-ci sont partiellement induits. On estime que l'induction correspond à celle que l'on observe en milieu LB additionné de 10"5 M en IPTG. II a été observé une différence importante dans la coloration des clones bactériens indiquant que la souche indicatrice construite répondait aux critères définis, en effet :This type of culture medium contains inter alia lactose which is hydrolyzed by β-galactosidase to allolactose. As allolactose is the natural inducer of the lactose promoter, when the bacteria having one or both genes coding for the chimeric proteins are cultured on this medium, these are partially induced. It is estimated that the induction corresponds to that which one observed in LB medium supplemented with 10 " 5 M in IPTG. A significant difference was observed in the coloration of the bacterial clones indicating that the indicator strain constructed met the defined criteria, in fact:
- les cellules transformées par un seul des deux plasmides poussent rouges; cette coloration signifie que le gène de la β-galactosidase n'est pas réprimé par les protéines chimères et que l'enzyme produit fermente le lactose du milieu; dans le cas LexAi-87408-cJunZip, les homodimères qui sont susceptibles de se former sont incapables in vivo de reconnaître l'opérateur muté et donc de réprimer le gène lacZ. En ce qui concerne la glissière à leucine ("leucine zipper") de Fos, la réponse était attendue puisqu'il n'homodimérise que très mal;- cells transformed by only one of the two plasmids grow red; this coloration means that the β-galactosidase gene is not repressed by the chimeric proteins and that the enzyme produced ferments the lactose in the medium; in the case LexAi-87408-cJunZip, the homodimers which are capable of forming are incapable in vivo of recognizing the mutated operator and therefore of repressing the lacZ gene. Regarding the leucine zipper ("leucine zipper") from Fos, the answer was expected since it only very poorly moderates;
- les bactéries cotransformées par les deux plasmides poussent blanches, la β-galactosidase n'est donc pas produite par les cellules; cette double transformation permet à la cellule de produire simultanément les deux protéines chimères LexAi-87408-cJunZip et .LexAi-87WT-cFosZip; l'absence de production de la β-galactosidase indique que l'hétérodimère LexA i -87408- cJunZip/LexAι_87WT-cFosZip, est contrairement aux homodimères, capable de réprimer le gène lacZ.- the bacteria cotransformed by the two plasmids grow white, the β-galactosidase is therefore not produced by the cells; this double transformation allows the cell to simultaneously produce the two chimeric proteins LexAi-87408-cJunZip and .LexAi-87WT-cFosZip; the absence of production of β-galactosidase indicates that the heterodimer LexA i -87408- cJunZip / LexAι_87WT-cFosZip, is unlike homodimers, capable of repressing the lacZ gene.
Cette souche indicatrice est donc bien fonctionnelle, elle permet de mettre en évidence des interactions protéine/protéine sur la simple base de la couleur des clones, elle est très spécifique et permet de discriminer entre homo- et hétérodimérisation.This indicator strain is therefore very functional, it makes it possible to highlight protein / protein interactions on the simple basis of the color of the clones, it is very specific and makes it possible to discriminate between homo- and heterodimerization.
Test quantitatifQuantitative test
L'efficacité avec laquelle le gène indicateur est réprimée peut être mesurée quantitativement par dosage in vitro de l'activité β-galactosidase. Ce test est effectué dans les conditions décrites par Miller J.H. (1972) dans Experiments in molecular genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor, NYThe efficiency with which the indicator gene is suppressed can be quantitatively measured by in vitro assay of β-galactosidase activity. This test is carried out under the conditions described by Miller J.H. (1972) in Experiments in molecular genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY
.Les valeurs des dosages décrits représentent la moyenne d'au moins trois expériences indépendantes et sont réalisées en présence de concentrations variables en IPTG.The values of the dosages described represent the average of at least three independent experiments and are carried out in the presence of variable concentrations of IPTG.
La figure 3 montre que:Figure 3 shows that:
* quelle que soit la concentration en IPTG, la souche non transformée produit le même nombre d'unités β-galactosidase (en moyenne 2500 unités);* whatever the IPTG concentration, the unprocessed strain produces the same number of β-galactosidase units (on average 2,500 units);
* lorsqu'elle est transformée avec le plasmide codant pour LexAi-87WT- cFosZip et quelle que soit la concentration en IPTG (c'est-à-dire même en surexprimant la protéine chimère), le nombre d'unités ne varie pas; * lorsqu'elle porte les deux protéines chimères, on observe une répression très forte du gène reporter ( le nombre d'unités β-galactosidase chute à 20 pour les concentrations 10" et 10"3 M en IPTG);* when it is transformed with the plasmid coding for LexAi-87WT-cFosZip and whatever the IPTG concentration (that is to say even by overexpressing the chimeric protein), the number of units does not vary; * when it carries the two chimeric proteins, a very strong repression of the reporter gene is observed (the number of β-galactosidase units drops to 20 for the 10 "and 10 " 3M concentrations in IPTG);
* cette répression est due à l'interaction spécifique entre les parties glissière à leucine ("leucine zippers") des protéines chimères aboutissant à la formation d'hétérodimères actifs, et non pas à la simple coexistence de deux protéines chimères dont les domaines de liaison à l'ADN seraient capables de se fixer indépendamment sur chaque demi site de l'opérateur muté; en effet, lorsque la souche porte le gène codant pour le domaine de fixation à l'ADN WT de LexA dépourvu de son domaine de dimérisation et celui codant pour LexAi- 87408-cJunZip, on n'observe pas de répression du gène reporter.* This repression is due to the specific interaction between the leucine zipper parts ("leucine zippers") of the chimeric proteins leading to the formation of active heterodimers, and not to the simple coexistence of two chimeric proteins including the binding domains. to DNA would be able to attach independently to each half site of the mutated operator; in fact, when the strain carries the gene coding for the WT DNA binding domain of LexA devoid of its dimerization domain and that coding for LexAi-87408-cJunZip, no repression of the reporter gene is observed.
On dispose donc d'un test permettant de mettre en évidence des interactions protéine/protéine utilisable comme crible mais aussi avec la possibilité de mesurer et de comparer la force de ces interactions.We therefore have a test which makes it possible to demonstrate protein / protein interactions which can be used as a screen but also with the possibility of measuring and comparing the strength of these interactions.
Recherche et identification de mutants affectés dans ces interactionsSearch and identification of mutants affected in these interactions
Cette souche peut être également utilisée pour identifier les déterminants de ces interactions soit par mutagenèse aléatoire soit par mutagenèse dirigée. Par exemple, il avait été émis l'hypothèse que la spécificité d'hétérodimérisation entre les glissières ("zippers") de Jun et de Fos était due à la non homodimérisation de la glissière ("zipper") de Fos. Cette souche a permis de montrer que tel n'était pas le cas puisque de mutants de Fos capables d'homodimériser n'ont pas perdu cette spécificité (figure 4).This strain can also be used to identify the determinants of these interactions either by random mutagenesis or by site-directed mutagenesis. For example, it was hypothesized that the specificity of heterodimerization between the zippers of Jun and Fos was due to the non-homodimerization of the zipper of Fos. This strain made it possible to show that this was not the case since Fos mutants capable of homodimerizing did not lose this specificity (Figure 4).
Les cellules transformées uniquement par les plasmides codant pour les mutants de Fos poussent rouges sur milieu McConkey. L'homodimérisation n'est donc pas détectée dans cette souche.The cells transformed only by the plasmids coding for the Fos mutants grow red on McConkey medium. Homodimerization is therefore not detected in this strain.
Dans le cas où les bactéries produisent en plus LexAi-87408-cJunZip, elles poussent blanches si les mutants de Fos sont améliorés dans leur interaction protéine/protéine par rapport à Fos sauvage, et roses si les mutants de Fos sont moins bons. L'intensité de la couleur est toujours inversement proportionnelle à la capacité d'hétérodimérisation (dosage β-galactosidase).In the case where the bacteria also produce LexAi-87408-cJunZip, they grow white if the Fos mutants are improved in their protein / protein interaction compared to wild Fos, and pink if the Fos mutants are less good. The intensity of the color is always inversely proportional to the capacity for heterodimerization (β-galactosidase assay).
Utilisation de la souche SU202 pour identifier le ou les partenaires d'une protéine ou d'un domaine protéique caractériséUse of the strain SU202 to identify the partner (s) of a protein or a characterized protein domain
Deux plasmides sont utilisés:Two plasmids are used:
1- le plasmide portant la protéine ou le domaine de protéine caractérisé pour lequel on veut identifier le ou les partenaires fusionné(s) au domaine de fixation à l'ADN de LexA408, pDL606 : constituant "l'hameçon" . 2- le plasmide portant la banque, pLE23B (voir figures 10 et 11). La figure 10 représente une carte de l'ensemble du plasmide accompagné des sites uniques de restriction, le vecteur est un plasmide apparenté à un pBR322 (New England Biolabs, Inc.) il porte la résistance à la tétracycline et pMBl comme origine de replication. La figure 11 représente la partie de la séquence de ce plasmide correspondant à la protéine de fusion, cette séquence étant repérable sur la carte générale à l'aide des sites de restriction.1- the plasmid carrying the protein or the protein domain characterized for which it is desired to identify the partner (s) fused to the DNA binding domain of LexA408, pDL606: constituting the "hook". 2- the plasmid carrying the bank, pLE23B (see FIGS. 10 and 11). FIG. 10 represents a map of the whole of the plasmid accompanied by the unique restriction sites, the vector is a plasmid related to a pBR322 (New England Biolabs, Inc.) it carries resistance to tetracycline and pMB1 as the origin of replication. FIG. 11 represents the part of the sequence of this plasmid corresponding to the fusion protein, this sequence being identifiable on the general map using the restriction sites.
.Les deux plasmides sont simultanément introduits dans la souche SU202 et les bactéries transformées sont :The two plasmids are simultaneously introduced into the SU202 strain and the transformed bacteria are:
- soit directement sélectionnées sur milieu solide LB + antibiotiques (kanamycine, chloramphenicol, ampicilline et tétracycline), les clones positifs étant ensuite révélés par répliques des boîtes sur milieu indicateur McConkey + les mêmes antibiotiques,- either directly selected on solid medium LB + antibiotics (kanamycin, chloramphenicol, ampicillin and tetracycline), the positive clones then being revealed by replicating the dishes on McConkey indicator medium + the same antibiotics,
- soit sélectionnées en milieu liquide LB + antibiotiques (kanamycine, chloramphenicol, ampicilline et tétracycline) pendant une nuit, puis révélées par étalement des cultures sur milieu indicateur McConkey + les mêmes antibiotiques.- either selected in LB liquid medium + antibiotics (kanamycin, chloramphenicol, ampicillin and tetracycline) overnight, then revealed by spreading the cultures on McConkey indicator medium + the same antibiotics.
Chaque clone porte un élément de banque différent codant pour une protéine ou un domaine de protéine différent, lorsque cette protéine ou ce domaine de protéine est susceptible d'établir des interactions protéine/protéine avec "l'hameçon", il donne lieu à un clone blanc ou rosé parmi un tapis de clones rouges, qui eux représentent tous les éléments de la banque codant pour des protéines ou des domaines de protéine n' interagissant pas avec l'hameçon.Each clone carries a different library element coding for a different protein or protein domain, when this protein or protein domain is capable of establishing protein / protein interactions with the "hook", it gives rise to a clone white or pink among a carpet of red clones, which represent all the elements of the library coding for proteins or protein domains which do not interact with the hook.
La constitution de la banque passe par l'intermédiaire d'une navette phage Elledge S.J. et al , 1991, Proc. Natl. Acad. Sci. USA, .88:1731-1735. "λYes: multifunctional cDNA expression vector for the isolation of gènes by complémentation of yeast and E. coli mutations".The constitution of the bank takes place via a phage shuttle Elledge S.J. et al, 1991, Proc. Natl. Acad. Sci. USA, .88: 1731-1735. "λYes: multifunctional cDNA expression vector for the isolation of genes by complementation of yeast and E. coli mutations".
EXEMPLE 2 :EXAMPLE 2:
Construction du système de sélection mettant en oeuvre un gène indicateur codant pour une protéine toxique :Construction of the selection system using an indicator gene coding for a toxic protein:
Modification de la séquence opérateur du gène sulA de manière à rendre son expression dépendante d'interactions hétérodimériques entre des protéines ou domaines protéiques X et Y fusionnés respectivement aux domaines de fixation à l'ADN de .LexA408 et .LexAWT.Modification of the operator sequence of the sulA gene so as to make its expression dependent on heterodimeric interactions between proteins or protein domains X and Y fused respectively to the DNA binding domains of .LexA408 and .LexAWT.
Cette modification consiste à introduire une mutation ponctuelle dans la séquence opérateur naturelle de sulA :This modification consists in introducing a point mutation in the natural operator sequence of sulA:
CTGTACATCCATACAG = opérateur WT, CCGTACATCCATACAG = opérateur mixte 408/WT.CTGTACATCCATACAG = WT operator, CCGTACATCCATACAG = mixed operator 408 / WT.
I gène sulA est in vivo réprimé par LexA, l'introduction de la mutation op408 empêche cette répression, le produit du gène est alors synthétisé et les bactéries meurent, rendant impossible la sélection d'une telle construction. Il est donc nécessaire de trouver un moyen autre que la répression pour contrôler la production de SULA.The sulA gene is in vivo repressed by LexA, the introduction of the op408 mutation prevents this repression, the gene product is then synthesized and the bacteria die, making the selection of such a construction impossible. It is therefore necessary to find a means other than suppression to control the production of SULA.
Préalablement à l'instauration de cette mutation, on a introduit de deux à quatre codons STOP dans la phase codante de sulA (un codon STOP est une séquence spécifique de trois paires de bases servant de signal d'arrêt à la machinerie traductionnelle). Ainsi, seule une protéine tronquée inactive est produite et ceci permet l'instauration de la mutation op408.Prior to the establishment of this mutation, two to four STOP codons were introduced into the coding phase of sulA (a STOP codon is a specific sequence of three base pairs serving as a stop signal for the translational machinery). Thus, only an inactive truncated protein is produced and this allows the establishment of the op408 mutation.
Lorsque le système est mis en oeuvre, il suffit d'utiliser un hôte bactérien porteur d'un ARNt suppresseur de ce codon STOP (un ARNt suppresseur est ARNt capable de reconnaître un codon STOP et de permettre la poursuite de la traduction). L'hôte bactérien (SU202) que l'on utilise étant porteur de l'ARNt suppresseur SupE qui, à la place des codons STOP (UAG), introduit un résidu Glutamine, on a remplacé de deux à quatre résidus glutamine par des codons TAG.When the system is implemented, it suffices to use a bacterial host carrying a suppressor tRNA of this STOP codon (a suppressor tRNA is tRNA capable of recognizing a STOP codon and of allowing further translation). The bacterial host (SU202) which is used being carrying the suppressor tRNA SupE which, in place of the STOP codons (UAG), introduces a Glutamine residue, two to four glutamine residues have been replaced by TAG codons .
Le gène sulA cloué dans un plasmide a été donné par S. Cole (Institut Pasteur, Paris). On a introduit les codons STOP TAG au niveau des Glutamines 42,47 d'une part, et 42,47 55 et 56 d'autre part, donnant lieu à des constructions appelées respectivement sulA 2STOP et sulA 4STOP. Ceci a été réalisé par mutagenèse dirigée selon la méthode décrite par Eckstein (Nakamaye, K. et Eckstein, F. Nucleic Acids Res. 1986, 14:9679-9698) et en utilisant un kit commercialisé par la société Amersham.The sulA gene nailed into a plasmid was given by S. Cole (Institut Pasteur, Paris). The STOP TAG codons were introduced at the level of Glutamines 42,47 on the one hand, and 42,47 55 and 56 on the other hand, giving rise to constructions called respectively sulA 2STOP and sulA 4STOP. This was carried out by site-directed mutagenesis according to the method described by Eckstein (Nakamaye, K. and Eckstein, F. Nucleic Acids Res. 1986, 14: 9679-9698) and using a kit sold by the company Amersham.
La mutation 408 a ensuite été introduite par le même procédé de mutagenèse et des résultats identiques ont été obtenus avec sulA 2STOP et sulA 4STOP. Les constructions obtenues ont été appelées op408/opWT sulA 2STOP et op408/opWT sulA 4STOP.The 408 mutation was then introduced by the same mutagenesis process and identical results were obtained with sulA 2STOP and sulA 4STOP. The constructions obtained were called op408 / opWT sulA 2STOP and op408 / opWT sulA 4STOP.
Mise en oeuvre du système de sélection ;Implementation of the selection system;
Le système a été testé dans la souche SU202 portant un ARNt suppresseur, SupE. Les résultats suivants ont été observés. i) op408/opWT sulA 2STOP ou op408/opWT sulA 4STOP ne peuvent pas être introduits dans la souche. En effet, quelle que soit la méthode de transformation utilisée (chlorure de calcium ou electroporation), aucun clone n'a été obtenu, alors qu'un plasmide identique mais ne portant pas la construction donne lieu à 200 ou 2000 clones par nanogramme de plasmide selon la méthode de transformation utilisée ; ii) par contre, op408/opWT sulA 2STOP ou op408/opWT sulA 4STOP peuvent être introduits dans la souche SU202 s'ils sont co-transformés avec des plasmides portant les gènes codant pour les protéine de fusion LexA _ 7408- cJunZip et .LexAι_g7WT-cFosZip.The system was tested in the SU202 strain carrying a suppressor tRNA, SupE. The following results have been observed. i) op408 / opWT sulA 2STOP or op408 / opWT sulA 4STOP cannot be introduced into the strain. Indeed, whatever the transformation method used (calcium chloride or electroporation), no clone was obtained, while an identical plasmid but not carrying the construction gives rise to 200 or 2000 clones per nanogram of plasmid depending on the transformation method used; ii) on the other hand, op408 / opWT sulA 2STOP or op408 / opWT sulA 4STOP can be introduced into the strain SU202 if they are co-transformed with plasmids carrying the genes coding for the fusion proteins LexA _ 7408- cJunZip and .LexAι_g7WT -cFosZip.
Dans la première expérience, l'opération de sulA n'est pas occupé et les codons STOP sont "lus" par l'ARNt suppresseur, SupE. La protéine SULA est produite et provoque la mort de la bactérie.In the first experiment, the sulA operation is not busy and the STOP codons are "read" by the suppressor tRNA, SupE. The SULA protein is produced and causes the death of the bacteria.
Dans la deuxième expérience, les hétérodimères LexAι_87408cJunZip / LexA -87 WT-cFosZip sont capables de se fixer sur l'opérateur de sulA et empêchent ainsi la production de la protéine SULA, la bactérie peut se diviser et donner lieu à des clones. In the second experiment, the heterodimers LexAι_87408cJunZip / LexA -87 WT-cFosZip are able to bind to the operator of sulA and thus prevent the production of the protein SULA, the bacteria can divide and give rise to clones.
REFERENCESREFERENCES
1. Bartel, P.L., Chien, C.-T. , Sternglanz, R. & Fields, S. (1993) "Using the two-hybrid system to detect protein-protein interactions", In: Cellular Interactions in Development: A practical approach (Oxford University Press, Oxford) pp. 153-179.1. Bartel, P.L., Chien, C.-T. , Sternglanz, R. & Fields, S. (1993) "Using the two-hybrid system to detect protein-protein interactions", In: Cellular Interactions in Development: A practical approach (Oxford University Press, Oxford) pp. 153-179.
2. Chien, C.-T., Bartel, P.L., Sternglanz, R. & Fields, S. (1991), "The two-hybrid system: A method to identify and clone gènes for proteins that interact with a protein of interest", Proc. Natl Acad. Sel USA .88:9578-9582.2. Chien, C.-T., Bartel, PL, Sternglanz, R. & Fields, S. (1991), "The two-hybrid system: A method to identify and clone genes for proteins that interact with a protein of interest ", Proc. Natl Acad. Salt USA. 88: 9578-9582.
3. Durfee, T., Becherer, K., Chen, P.-L. , Yeh, S. -H. , Yang, Y. , Kilburn, A.E., Lee, W.-H. & Elledge, S.J. (1993), "The retinoblastoma protein associâtes with the protein phosphatase type 1 catalytic subunit" , Gènes and Dev. 2:555-569.3. Durfee, T., Becherer, K., Chen, P.-L. , Yeh, S. -H. , Yang, Y., Kilburn, A.E., Lee, W.-H. & Elledge, S.J. (1993), "The retinoblastoma protein associâtes with the protein phosphatase type 1 catalytic subunit", Genes and Dev. 2: 555-569.
4. Estojak, J., Brent, R. & Golemis, E.A. (1995), "Corrélation of two- hybrid affinity data with in vitro measurements" , Mol. Cell Biol. JL5_:5820- 5829.4. Estojak, J., Brent, R. & Golemis, E.A. (1995), "Correlation of two- hybrid affinity data with in vitro measurements", Mol. Cell Biol. JL5_: 5820-5829.
5. Fields, S. & Song, O.-K. (1989) "A novel genetic system to detect protein-protein interactions" , Nature 2fiû:245-246.5. Fields, S. & Song, O.-K. (1989) "A novel genetic system to detect protein-protein interactions", Nature 2fiû: 245-246.
6. Fogh, R.H., Ottleben, G., Ruterjans, H., Schnarr, M. , Boelens, R. & Kaptein, R. (1994), "Solution structure of the LexA repressor DNA binding domain: détermination by 1H NMR spectroscopy", EMBO J. .0:3936-3944.6. Fogh, RH, Ottleben, G., Ruterjans, H., Schnarr, M., Boelens, R. & Kaptein, R. (1994), "Solution structure of the LexA repressor DNA binding domain: determination by 1H NMR spectroscopy ", EMBO J.. 0: 3936-3944.
7. Golemis, E.A. & Brent, R. (1992), "Fused protein domains inhibit DNA binding by LexA", Mol. Cell Biol. 12:3006-3014.7. Golemis, E.A. & Brent, R. (1992), "Fused protein domains inhibit DNA binding by LexA", Mol. Cell Biol. 12: 3006-3014.
8. Golemis, E.A. & Brent, R. (1996), "The interaction trap", In: Two- hybrid Systems: A practical approach (Oxford University Press, Oxford) Chapter 4.8. Golemis, E.A. & Brent, R. (1996), "The interaction trap", In: Two- hybrid Systems: A practical approach (Oxford University Press, Oxford) Chapter 4.
9. Golemis, E.A., Gyuris, J. & Brent, R. (1996), "Interaction trap/two- hybrid system to identify interacting proteins", In: Current Protocols in Molecular Biology, John Wiley & Sons, New York (Eds: Ausubel, F. , Brent, R. , Kingston, R. , Moore, D., Seidmann, J., Smith, J.A. & Struhl, K.) Unit 20.1.9. Golemis, EA, Gyuris, J. & Brent, R. (1996), "Interaction trap / two- hybrid system to identify interacting proteins", In: Current Protocols in Molecular Biology, John Wiley & Sons, New York (Eds : Ausubel, F., Brent, R., Kingston, R., Moore, D., Seidmann, J., Smith, JA & Struhl, K.) Unit 20.1.
10. Gyuris, J. , Golemis, E.A., Chertkov, H. & Brent, R. (1993) "Cdil, a human Gl and S phase protein phosphatase that associâtes with Cdk2", Cell 25:791-803.10. Gyuris, J., Golemis, E.A., Chertkov, H. & Brent, R. (1993) "Cdil, a human Gl and S phase protein phosphatase that associâtes with Cdk2", Cell 25: 791-803.
11. Hori, R. & Carey, M. (1994) "The rôle of activators in assembly of RNA polymerase II transcription complexes", Current Opinion in Genetics and Dev. 4:236-244.11. Hori, R. & Carey, M. (1994) "The role of activators in assembly of RNA polymerase II transcription complexes", Current Opinion in Genetics and Dev. 4: 236-244.
12. Hu, J.C. (1995) "Repressor fusions as a tool to study protein-protein interactions", Structure 2:431-433.12. Hu, J.C. (1995) "Repressor fusions as a tool to study protein-protein interactions", Structure 2: 431-433.
13. Hurstel, S. , Granger-Schnarr, M. , Daune, M. & Schnarr, M. (1986), "In vitro binding of LexA repressor to DNA: évidence for the involvement of the amino-terminal domain", EMBO J. 5:793-798.13. Hurstel, S., Granger-Schnarr, M., Daune, M. & Schnarr, M. (1986), "In vitro binding of LexA repressor to DNA: evidence for the involvement of the amino-terminal domain", EMBO J. 5: 793-798.
14. Le Douarin, B., Pierrat, B., vom Baur, E., Chambon, P. & Losson, R. (1995) "A new version of the two-hybrid assay for détection of protein- protein interactions", Nucl. Acids Res. .22: 876-878.14. Le Douarin, B., Pierrat, B., vom Baur, E., Chambon, P. & Losson, R. (1995) "A new version of the two-hybrid assay for detection of protein- protein interactions", Nucl. Acids Res. .22: 876-878.
15. Lloubès, R., Granger-Schnarr, M. , Lazdunski, C. & Schnarr, M. (1991), "Interaction of a regulatory protein with a DNA target containing two overlapping binding sites", J. Biol Chem. 2^:2303-2312.15. Lloubès, R., Granger-Schnarr, M., Lazdunski, C. & Schnarr, M. (1991), "Interaction of a regulatory protein with a DNA target containing two overlapping binding sites", J. Biol Chem. 2 ^: 2303-2312.
16. Ma, J. & Ptashne, M. (1987a), "Deletion analysis of Gal4 defines two transcrptional activating segments", Cell 48:847-853.16. Ma, J. & Ptashne, M. (1987a), "Deletion analysis of Gal4 defines two transcrptional activating segments", Cell 48: 847-853.
17. Ma, J. & Ptashne, M. (1987b), "A new class of yeast transcriptional activators", Cell 51: 113-119.17. Ma, J. & Ptashne, M. (1987b), "A new class of yeast transcriptional activators", Cell 51: 113-119.
18. Ma, J. & Ptashne, M. (1988), "Converting a eucaryotic transcriptional inhibitor into an activator", Cell .55:443-446.18. Ma, J. & Ptashne, M. (1988), "Converting a eukaryotic transcriptional inhibitor into an activator", Cell .55: 443-446.
19. Maldonado, E. & Reinberg, D. (1995), "News on initiation and elongation of transcription by RNA polymerase II", Current Opinion in Cell Biol 2:352-361. 20. Marmorstein, R. , Carey, M., Ptashne, M. & Harrison, S.C. (1992), "DNA récognition by Gal4: structure of a protein-DNA complex" , Nature 256:408-414.19. Maldonado, E. & Reinberg, D. (1995), "News on initiation and elongation of transcription by RNA polymerase II", Current Opinion in Cell Biol 2: 352-361. 20. Marmorstein, R., Carey, M., Ptashne, M. & Harrison, SC (1992), "DNA recognition by Gal4: structure of a protein-DNA complex", Nature 256: 408-414.
21. Oertel-Buchheit, P. , Lamerichs, R., Schnarr, M. & Granger-Schnarr, M. (1990), "Genetic analysis of the LexA repressor: isolation and characterization of LexA (Def) mutant proteins", Mol Gen. Genêt. 223:40-48.21. Oertel-Buchheit, P., Lamerichs, R., Schnarr, M. & Granger-Schnarr, M. (1990), "Genetic analysis of the LexA repressor: isolation and characterization of LexA (Def) mutant proteins", Mol Gen. Broom. 223: 40-48.
22. Phizicky, E.M. & Fields, S. (1995), "Protein-protein interactions: methods for détection and analysis", Microbiol. Rev. 55:94-123.22. Phizicky, E.M. & Fields, S. (1995), "Protein-protein interactions: methods for detection and analysis", Microbiol. Rev. 55: 94-123.
23. Porte, D. , Oertel-Buchheit, P., Granger-Schnarr, M. & Schnarr, M. (1995), "Fos leucine zipper variants with increased association capacity", J. Biol. Chem. 22Q:22721-22730.23. Porte, D., Oertel-Buchheit, P., Granger-Schnarr, M. & Schnarr, M. (1995), "Fos leucine zipper variants with increased association capacity", J. Biol. Chem. 22Q: 22721-22730.
24. Schmidt-Dôrr, T., Oertel-Buchheit, P., Pernelle, C, Bracco, L., Schnarr, M. & Granger-Schnarr, M. (1991), "Construction, purification and characterization of a hybrid protein comprising the DNA binding domain of the LexA repressor and the Jun leucine zipper", Biochemistry 3_Q:9657-9664.24. Schmidt-Dôrr, T., Oertel-Buchheit, P., Pernelle, C, Bracco, L., Schnarr, M. & Granger-Schnarr, M. (1991), "Construction, purification and characterization of a hybrid protein comprising the DNA binding domain of the LexA repressor and the Jun leucine zipper ", Biochemistry 3_Q: 9657-9664.
25. Schnarr, M. & Granger-Schnarr, M. (1993), "LexA, the self-cleaving transcriptional repressor of the SOS System", Nucleic Acids and Mol. Biol 7: 170-189 (Eds. F. Eckstein & D.M.J. Lilley)25. Schnarr, M. & Granger-Schnarr, M. (1993), "LexA, the self-cleaving transcriptional repressor of the SOS System", Nucleic Acids and Mol. Biol 7: 170-189 (Eds. F. Eckstein & D.M.J. Lilley)
26. Schnarr, M., Pouyet, J. , Granger-Schnarr, M. & Daune, M. (1985), "Large-scale purification, oligomerization equilibria, and spécifie interaction of the LexA repressor of Escherichia coli", Biochemistry 24:2812-2818.26. Schnarr, M., Pouyet, J., Granger-Schnarr, M. & Daune, M. (1985), "Large-scale purification, oligomerization equilibria, and specifies interaction of the LexA repressor of Escherichia coli", Biochemistry 24 : 2812-2818.
27. Vojtek, A.B., Hollenberg, S.M. & Cooper, J. A. (1993), "Mammalian Ras interacts directly with the serine/threonine kinase Raf" , Cell 24:205-214. 27. Vojtek, A.B., Hollenberg, S.M. & Cooper, J. A. (1993), "Mammalian Ras interacts directly with the serine / threonine kinase Raf", Cell 24: 205-214.

Claims

REVENDICATIONS
1- Utilisation d'une séquence d'ADN comprenant :1- Use of a DNA sequence comprising:
- une séquence nucléotidique codant pour une protéine indicatrice (gène indicateur),- a nucleotide sequence coding for an indicator protein (indicator gene),
- un promoteur,- a promoter,
- un opérateur muté, ladite séquence nucléotidique étant sous le contrôle du susdit promoteur comprenant le susdit opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1 , la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1 , l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être formés à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur,a mutated operator, said nucleotide sequence being under the control of the above promoter comprising the above mutated operator containing two sequences and deriving from an operator containing two inverted repeated sequences (palindrome), this operator being such that, in the non-mutated state (wild), it leads to the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of said inverted repeat sequences via their DNA binding site, this mutated operator being such that the one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated in a silent manner or comprises a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it one specifically recognizes the sequence comprising the mutation 1, the other the sequence which is in the wild state, or which is mutated in a silent manner or which comprises a mutation 2, the homodimers capable of being formed from each monomers being incapable of repressing the transcription of the above-mentioned indicator gene,
- pour détecter ou quantifier des interactions entre deux protéines ou domaines protéiques, ou cribler des protéines ou domaines protéiques présentant des interactions avec une protéine ou domaine protéique déterminé(e), ces interactions étant révélées lorsqu'il y a répression de la transcription du susdit gène indicateur, cette répression résultant de la formation d'hétérodimères comprenant :- to detect or quantify interactions between two proteins or protein domains, or to screen proteins or protein domains exhibiting interactions with a specific protein or protein domain, these interactions being revealed when there is repression of the transcription of the above indicator gene, this repression resulting from the formation of heterodimers comprising:
1) un premier monomère contenant une première protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence de l'opérateur muté contenant la mutation 1, le susdit site de fixation étant fusionné à l'une des deux protéines ou à l'un des deux domaines protéiques, impliqué(e) dans les susdites interactions,1) a first monomer containing a first fusion protein containing the DNA binding site of a regulatory protein capable of specifically recognizing the sequence of the mutated operator containing the mutation 1, the above-mentioned binding site being fused to the '' one of the two proteins or one of the two protein domains, involved in the above interactions,
2) un deuxième monomère contenant une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2 de l'opérateur muté, le susdit site de fixation étant fusionné à l'autre des deux protéines ou à l'autre des deux domaines protéiques, impliqué(e) dans les susdites interactions.2) a second monomer containing a second fusion protein containing the DNA binding site of a regulatory protein capable of specifically recognizing the sequence not mutated, or mutated so silent or comprising the mutation 2 of the mutated operator, the aforementioned binding site being fused to the other of the two proteins or to the other of the two protein domains, involved in the above interactions.
2. Séquence d'ADN comprenant :2. DNA sequence comprising:
- une séquence nucléotidique codant pour une protéine indicatrice (gène indicateur),- a nucleotide sequence coding for an indicator protein (indicator gene),
- un promoteur,- a promoter,
- un opérateur muté, ladite séquence nucléotidique étant sous le contrôle d'un promoteur comprenant un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1 , la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être formés à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur, ladite mutation 1 étant en outre telle qu'elle est reconnue spécifiquement par une protéine régulatrice comportant un site de fixation à l'ADN entrant dans la constitution d'une première protéine de fusion, lequel site de fixation est fusionné avec une protéine ou un domaine protéique susceptible d'interagir avec une autre protéine ou un autre domaine protéique entrant dans la constitution d'une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2.a mutated operator, said nucleotide sequence being under the control of a promoter comprising a mutated operator containing two sequences and deriving from an operator containing two inverted repeat sequences (palindrome), this operator being such that, in the non-mutated state (wild), it leads to the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of said inverted repeat sequences via their DNA binding site, this mutated operator being such that the one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated in a silent manner or comprises a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it recognizes specifically one the sequence comprising the mutation 1, the other the sequence which is in the wild state, or which is mutated in a silent manner or which comprises a mutation 2, the homodimers capable of being formed from each of the monomers being incapable of repressing the transcription of the above-mentioned indicator gene, said mutation 1 being further such that it is specifically recognized by a regulatory protein comprising a site for attachment to the DNA entering into the constitution of a first fusion protein, which binding site is fused with a protein or protein domain capable of interacting with another protein or another protein domain forming part of a second fusion protein containing the DNA binding site of a protein regulatory capable of specifically recognizing the sequence not mutated, or mutated silently or comprising the mutation 2.
3. Séquence d'ADN selon la revendication 2, caractérisée en ce qu'elle comprend un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), l'une de ces deux séquences étant mutée, et l'autre étant à l'état sauvage. 3. DNA sequence according to claim 2, characterized in that it comprises a mutated operator containing two sequences and deriving from an operator containing two reverse repeated sequences (palindrome), one of these two sequences being mutated, and the other being in the wild.
4. Séquence d'ADN selon l'une des revendications 2 ou 3, caractérisée en ce que l'opérateur muté contient les séquences suivantes :4. DNA sequence according to one of claims 2 or 3, characterized in that the mutated operator contains the following sequences:
CCGT et ACAGCCGT and ACAG
espacées par une séquence d'environ 3 à environ 20 nucléotides, et notamment de 8 à 12, et avantageusement 8 nucléotides, et notamment caractérisée en ce que l'opérateur muté contient la séquence suivante :spaced apart by a sequence of approximately 3 to approximately 20 nucleotides, and in particular from 8 to 12, and advantageously 8 nucleotides, and in particular characterized in that the mutated operator contains the following sequence:
5 ' -CGGAATTC A ATAGGGTTGATCTTTGTTGTCACTGGATGT ACCGTACATCCATACAGTAACTCACAGGGGC-3'5 '-CGGAATTC TO ATAGGGTTGATCTTTGTTGTCACTGGATGT ACCGTACATCCATACAGTAACTCACAGGGGC-3'
5. Séquence d'ADN selon l'une des revendications 3 à 4, caractérisée en ce que la séquence nucléotidique codant pour la protéine indicatrice est le gène lacZ chez E. coli, codant pour la β-galactosidase, l'opérateur muté contient deux séquences et dérive d'un opérateur contenant deux séquences répétées inversées (palindrome), l'une de ces deux séquences étant mutée, et l'autre étant à l'état sauvage, la séquence mutée étant de préférence celle située en aval de la séquence à l'état sauvage, la séquence sauvage étant reconnue spécifiquement par la protéine .LexA sauvage ou par un fragment de LexA contenant le site de fixation à l'ADN notamment un fragment défini par les positions 1 à x de LexA, x variant de 69 à 87, et notamment par les fragments 1 à 69 ou 1 à 87 de LexA, et la séquence mutée étant reconnue par la protéine LexA mutée ou par un fragment muté de LexA contenant le site de fixation à l'ADN, notamment un fragment muté de LexA correspondant à celui défini par les positions 1 à x de LexA, x variant de 69 à 87, et notamment par les fragments 1 à 69 ou 1 à 87, et les mutations de LexA étant avantageusement P40 -→ A, N41 → S, A42 → S, le domaine de dimérisation de LexA étant absent à la fois de LexA ou du fragment de LexA et de LexA muté ou du fragment muté de LexA.5. DNA sequence according to one of claims 3 to 4, characterized in that the nucleotide sequence coding for the indicator protein is the lacZ gene in E. coli, coding for β-galactosidase, the mutated operator contains two sequences and derivative of an operator containing two inverted repeat sequences (palindrome), one of these two sequences being mutated, and the other being in the wild state, the mutated sequence preferably being that located downstream of the sequence in the wild, the wild-type sequence being recognized specifically by the wild .LexA protein or by a LexA fragment containing the DNA binding site, in particular a fragment defined by positions 1 to x of LexA, x varying from 69 to 87, and in particular by fragments 1 to 69 or 1 to 87 of LexA, and the mutated sequence being recognized by the mutated LexA protein or by a mutated fragment of LexA containing the DNA binding site, in particular a mutated fragment from Le xA corresponding to that defined by positions 1 to x of LexA, x varying from 69 to 87, and in particular by fragments 1 to 69 or 1 to 87, and the mutations of LexA being advantageously P40 - → A, N41 → S, A42 → S, the dimerization domain of LexA being absent from both LexA or from the fragment of LexA and from mutated LexA or from the mutated fragment from LexA.
6. Complexe entre6. Complex between
- une séquence d'ADN comprenant une séquence nucléotidique codant pour une protéine indicatrice, ladite séquence nucléotidique étant sous le contrôle d'un promoteur comprenant un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1, la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être fournis à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur,a DNA sequence comprising a nucleotide sequence coding for an indicator protein, said nucleotide sequence being under the control of a promoter comprising a mutated operator containing two sequences and deriving from an operator containing two inverted repeat sequences (palindrome), this operator being such that, in the non-mutated (wild) state, it causes the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of said inverted repeat sequences via their binding site to the DNA, this mutated operator being such that one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated silently or contains a different mutation (mutation 2) from the said mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it specifically recognizes one of the sequences comprising the mutation 1, the other the sequence which is in the wild state, or which is mutated in a silent manner or which comprises a mutation 2, the homodimers capable of being supplied from each of the monomers being incapable of repressing the transcription of the above-mentioned indicator gene,
- et des hétérodimères dont les monomères les constituant (respectivement premier monomère et deuxième monomère) sont impliqués entre eux dans une interaction protéine/protéine :- and heterodimers whose monomers constituting them (respectively first monomer and second monomer) are involved between them in a protein / protein interaction:
1) le premier monomère étant tel qu'il contient une première protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence de l'opérateur muté contenant la mutation 1 , le susdit site de fixation étant fusionné à l'une des deux protéines ou à l'un des deux domaines protéiques, impliqué(e) dans les susdites interactions,1) the first monomer being such that it contains a first fusion protein containing the site of attachment to the DNA of a regulatory protein capable of specifically recognizing the sequence of the mutated operator containing the mutation 1, the aforementioned site of fixation being fused to one of the two proteins or to one of the two protein domains, involved in the above interactions,
2) le deuxième monomère étant tel qu'il contient une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2 de l'opérateur muté, le susdit site de fixation étant fusionné à l'autre des deux protéines ou à l'autre des deux domaines protéiques, impliqué(e) dans les susdites interactions.2) the second monomer being such that it contains a second fusion protein containing the DNA binding site of a regulatory protein capable of specifically recognizing the sequence not mutated, or mutated silently or comprising the mutation 2 of the mutated operator, the above-mentioned binding site being fused to the other of the two proteins or to the other of the two protein domains, involved in the above interactions.
7. Complexe selon la revendication 6, caractérisé en ce que :7. Complex according to claim 6, characterized in that:
- la séquence d'ADN est telle que définie selon l'une quelconque des revendications 3 à 5, et en ce que- the DNA sequence is as defined according to any one of claims 3 to 5, and in that
- les hétérodimères contiennent :- the heterodimers contain:
1) un monomère contenant une première protéine de fusion contenant le site de fixation à l'ADN de LexA muté ou d'un fragment muté de LexA reconnaissant la séquence de l'opérateur muté contenant la mutation 1, lequel site de fixation est fusionné avec une protéine déterminée ou un fragment protéique déterminé susceptible d'être impliqué dans une interaction selon la revendication 1 , laquelle protéine ou lequel domaine protéique contient par exemple un domaine d'activation ou de dimérisation,1) a monomer containing a first fusion protein containing the DNA binding site of mutated LexA or of a mutated fragment of LexA recognizing the sequence of the mutated operator containing mutation 1, which binding site is fused with a specific protein or fragment determined protein capable of being involved in an interaction according to claim 1, which protein or which protein domain contains, for example, an activation or dimerization domain,
2) un monomère contenant une deuxième protéine de fusion contenant le site de fixation à l'ADN de LexA sauvage, ou porteur d'une mutation silencieuse ou d'une mutation 2 ou d'un fragment de LexA reconnaissant la séquence non mutée de .LexA ou mutée de façon silencieuse ou comportant une mutation 2, lequel site de fixation est fusionné avec une protéine déterminée ou un fragment protéique déterminé, contenant par exemple une protéine ou un domaine protéique susceptible d'interagir avec la protéine ou le fragment protéique défini en 1) ou avec les susdits domaines d'activation ou de dimérisation.2) a monomer containing a second fusion protein containing the site of attachment to DNA of wild LexA, or carrying a silent mutation or a mutation 2 or a fragment of LexA recognizing the non-mutated sequence of. LexA or mutated in a silent manner or comprising a mutation 2, which binding site is fused with a specific protein or a specific protein fragment, containing for example a protein or a protein domain capable of interacting with the protein or the protein fragment defined in 1) or with the above fields of activation or dimerization.
8. Hôte cellulaire contenant une séquence d'ADN selon la revendication 2.8. Cell host containing a DNA sequence according to claim 2.
9. Procédé pour détecter et quantifier des interactions entre deux protéines ou fragments de protéines, caractérisé9. Method for detecting and quantifying interactions between two proteins or protein fragments, characterized
- en ce que l'on met en présence des séquences nucléotidiques codant respectivement pour le premier et le deuxième monomère contenant respectivement une première et une deuxième protéine de fusion telle que définie dans la revendication 1, avec une séquence d'ADN selon l'une quelconque des revendications 2 à 5, et- in that one puts in the presence of the nucleotide sequences coding respectively for the first and the second monomer respectively containing a first and a second fusion protein as defined in claim 1, with a DNA sequence according to one any of claims 2 to 5, and
- en ce que l'on détecte l'éventuelle répression de la transcription du gène indicateur tel que défini à la revendication 1, notamment par transfection d'un hôte cellulaire selon la revendication 8, avec des vecteurs contenant, d'une part, les susdites séquences nucléotidiques codant respectivement pour le premier et le deuxième monomère contenant respectivement la première et la deuxième protéine de fusion et, d'autre part, les éléments nécessaires à l'expression des susdits monomères.- in that the possible repression of the transcription of the indicator gene as defined in claim 1 is detected, in particular by transfection of a cellular host according to claim 8, with vectors containing, on the one hand, the the above nucleotide sequences coding respectively for the first and the second monomer containing respectively the first and the second fusion protein and, on the other hand, the elements necessary for the expression of the said monomers.
10. Procédé pour identifier une protéine interagissant avec une protéine déterminée, caractérisé10. Method for identifying a protein interacting with a determined protein, characterized
- en ce que l'on met en présence les éléments suivants :- in the presence of the following elements:
. une séquence nucléotidique codant pour un premier monomère contenant une première protéine de fusion entre, d'une part, une protéine régulatrice selon la revendication 1 et, d'autre part, la protéine déterminée, . a nucleotide sequence coding for a first monomer containing a first fusion protein between, on the one hand, a regulatory protein according to claim 1 and, on the other hand, the determined protein,
. une banque génomique, contenant notamment des fragments d'ADN, et notamment d'ADNc, chacun étant susceptible de coder pour une protéine interagissant avec la protéine déterminée, chacun des différents éléments de la banque génomique étant respectivement fusionné à la séquence codant pour une protéine régulatrice selon la revendication 1 ,. a genomic library, containing in particular DNA fragments, and in particular cDNA, each capable of coding for a protein interacting with the determined protein, each of the different elements of the genomic library being respectively fused to the sequence coding for a protein regulator according to claim 1,
. une séquence d'ADN selon l'une quelconque des revendications 2 à 5, et. a DNA sequence according to any one of claims 2 to 5, and
- en ce que l'on détecte l'éventuelle répression de la transcription de la séquence nucléotidique codant pour une protéine indicatrice selon la revendication 1 , notamment par transfection d'un hôte cellulaire selon la revendication 8, d'une part, avec un vecteur contenant la séquence nucléotidique codant pour le susdit premier monomère contenant la première protéine de fusion et, d'autre part, un ensemble de vecteurs contenant une séquence nucléotidique codant pour un deuxième monomère contenant une deuxième protéine de fusion, chaque séquence nucléotidique codant pour chaque deuxième monomère contenant la séquence nucléotidique codant pour la protéine régulatrice selon la revendication 1, et en aval de celle-ci l'un des éléments d'ADN de la susdite banque, tous les vecteurs contenant en outre les éléments nécessaires à l'expression des susdits monomères. - in that the possible repression of the transcription of the nucleotide sequence coding for an indicator protein according to claim 1 is detected, in particular by transfection of a cellular host according to claim 8, on the one hand, with a vector containing the nucleotide sequence coding for the above first monomer containing the first fusion protein and, on the other hand, a set of vectors containing a nucleotide sequence coding for a second monomer containing a second fusion protein, each nucleotide sequence coding for each second monomer containing the nucleotide sequence coding for the regulatory protein according to claim 1, and downstream thereof one of the DNA elements of the aforementioned library, all the vectors further containing the elements necessary for the expression of the aforesaid monomers.
PCT/FR1997/001133 1996-07-04 1997-06-25 System for detecting protein-protein interactions WO1998001579A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP97930586A EP0909331A1 (en) 1996-07-04 1997-06-25 System for detecting protein-protein interactions

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9608337A FR2750705B1 (en) 1996-07-04 1996-07-04 PROTEIN-PROTEIN INTERACTION DETECTION SYSTEM
FR96/08337 1996-07-04

Publications (1)

Publication Number Publication Date
WO1998001579A1 true WO1998001579A1 (en) 1998-01-15

Family

ID=9493710

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR1997/001133 WO1998001579A1 (en) 1996-07-04 1997-06-25 System for detecting protein-protein interactions

Country Status (3)

Country Link
EP (1) EP0909331A1 (en)
FR (1) FR2750705B1 (en)
WO (1) WO1998001579A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8383589B2 (en) 2007-07-09 2013-02-26 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Aegyptin and uses thereof

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2861742B1 (en) * 2003-10-31 2006-02-24 Centre Nat Rech Scient LIGANDS OF THE MYCOBATERIAN REPRESSOR ETR, SELECTION METHODS AND APPLICATIONS
FR2861745A1 (en) * 2003-10-31 2005-05-06 Centre Nat Rech Scient Selecting compounds that inhibit the mycobacterial EthR repressor, useful in treatment of tuberculosis and leprosy, improve efficiency of conversion of ethionamide to its active form

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5283173A (en) * 1990-01-24 1994-02-01 The Research Foundation Of State University Of New York System to detect protein-protein interactions
WO1994010307A1 (en) * 1992-10-29 1994-05-11 Medical Research Council Transcription factor dp-1

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5283173A (en) * 1990-01-24 1994-02-01 The Research Foundation Of State University Of New York System to detect protein-protein interactions
WO1994010307A1 (en) * 1992-10-29 1994-05-11 Medical Research Council Transcription factor dp-1

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
COLE: "Characterisation of the promoter ....", MOLECULAR & GENERAL GENETICS, vol. 189, no. 3, 1983, BERLIN, pages 400 - 404, XP000197163 *
FEILDS ET AL.: "The two-hybrid system : an assay ....", TRENDS IN GENETICS, vol. 10, no. 8, August 1994 (1994-08-01), pages 286 - 292, XP000647708 *
LITTLE ET AL.: "Deletions within a hinge region ....", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCE USA, vol. 82, April 1985 (1985-04-01), WASHINGTON DC, pages 2301 - 2305, XP000647703 *
OERTEL-BUCHHEIT ET AL.: "Genetic analysis of the LexA repressor: ....", MOLECULAR & GENERAL GENETICS, vol. 223, 1990, BERLIN, pages 40 - 48, XP000647715 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8383589B2 (en) 2007-07-09 2013-02-26 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Aegyptin and uses thereof
US8980859B2 (en) 2007-07-09 2015-03-17 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Aegyptin and uses thereof
US9441022B2 (en) 2007-07-09 2016-09-13 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Aegyptin and uses thereof

Also Published As

Publication number Publication date
FR2750705A1 (en) 1998-01-09
FR2750705B1 (en) 1998-10-30
EP0909331A1 (en) 1999-04-21

Similar Documents

Publication Publication Date Title
Guarente Strategies for the identification of interacting proteins.
US7393318B2 (en) Methods and compositions for interaction trap assays
US20090130676A1 (en) Interaction trap systems for detecting protein interactions
US6333154B1 (en) Bacterial multi-hybrid system and applications thereof
CA2274608C (en) Prokaryotic two-hybrid system
NZ502795A (en) Method of identifying molecular interactions employing counterselection and at least two hybrid molecules or two hybrid systems
WO2012125445A2 (en) Small molecule-dependent inteins and uses thereof
US5322801A (en) Protein partner screening assays and uses thereof
US20020119498A1 (en) Methods and compositions for interaction trap assays
Ladant et al. Genetic systems for analyzing protein–protein interactions in bacteria
Zafar et al. Protein–Protein Interactions Between σ70 Region 4 of RNA Polymerase and Escherichia coli SoxS, a Transcription Activator That Functions by the Prerecruitment Mechanism: Evidence for “Off-DNA” and “On-DNA” Interactions
US20030113749A1 (en) Interaction trap systems for detecting protein interactions
Bunker et al. Identification of a cDNA for SSRP1, an HMG-box protein, by interaction with the c-Myc oncoprotein in a novel bacterial expression screen
EP2190989B1 (en) Method for manufacturing a modified peptide
EP0909331A1 (en) System for detecting protein-protein interactions
US6326150B1 (en) Yeast interaction trap assay
Hays et al. Two-hybrid system for characterization of protein-protein interactions in E. coli
WO1991016456A1 (en) Screening assays for compounds which inhibit the binding of c-myc to dna
Maier et al. Quantitative real-time PCR as a sensitive protein–protein interaction quantification method and a partial solution for non-accessible autoactivator and false-negative molecule analysis in the yeast two-hybrid system
FR2734567A1 (en) CHIMERIC PROTEINS ACTIVATING POLYMERASE III TRANSCRIPTION, THEIR USE FOR THE DETECTION AND ANALYSIS OF INTERACTIONS BETWEEN PROTEINS, AND GENES ENCODING THE SAME
van der Ploeg et al. Chapter In vivo bacterial morphogenetic protein interactions
WO2001073108A2 (en) A bacterial two-hybrid system for protein interaction screening
WO2001000866A1 (en) An in vivo library-versus-library selection of optimized protein-protein interactions
Rosamond 15 Two-Hybrid Analysis of Protein-Protein Interactions in Yeast
Chibi A yeast 2-hybrid screen to identify and characterize interaction partners of the cancer associated protein Retinoblastoma binding protein 6

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FI FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1997930586

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1997930586

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 09214299

Country of ref document: US

WWW Wipo information: withdrawn in national office

Ref document number: 1997930586

Country of ref document: EP