Research Collection Doctoral Thesis Solution structures of tandem RRMs of CPEB proteins free and bound to RNA reveal An unprecendented arrangement ot the RRMs and a novel mode of RNA recognition Author(s): Afroz, Tariq Publication Date: 2013 Permanent Link: https://doi.org/10.3929/ethz-a-010015924 Rights / License: In Copyright - Non-Commercial Use Permitted This page was generated automatically upon download from the ETH Zurich Research Collection. For more information please consult the Terms of use. ETH Library
DISS. ETH No. 21289 Solution structures of tandem RRMs of CPEB proteins free and bound to RNA reveal an unprecendented arrangement of the RRMs and a novel mode of RNA recognition A thesis submitted to attain the degree of DOCTOR OF SCIENCES of ETH ZURICH (Dr. sc. ETH ZURICH) presented by TARIQ AFROZ M.Sc. (Biotechnology), Indian Institute of Technology, Bombay, India born on 04.05.1983 citizen of India accepted on the recommendation of Prof. Dr. Frédéric Allain Prof. Dr. Rudolf Glockshuber Prof. Dr. Raúl Méndez Prof. Dr. Andres Ramos 2013
SUMMARY Gene regulation has often been likened to a symphony, a work of art. The individual components come together with precision to steer a cell to its decided fate. It is startling how gene regulation is a key method for control of most biological phenomena. It is not surprising that small alterations in the regulation of gene expression can have serious consequences and has often been implicated in the development of many diseases. RNA binding proteins control gene expression at different levels. These proteins recognize specific cis-elements on the mrna, which in turn results in the recruitment or displacement of activators or repressors of a specific pathway. For instance translational repression is often mediated by proteins binding to the 3 -UTR of the mrna. This is reversible and is generally achieved by either the removal of a repressor from its binding site on the mrna or in some cases via remodeling of the repression complexes triggered by an external stimulus. Hence, it is important to study protein-rna interactions, which would lead to better understanding of the regulatory pathways both for research and drug development. In this study, we performed extensive structural work by solution NMR spectroscopy to characterize the CPEB family of RNA binding proteins that regulate gene expression at the level of translation via cytoplasmic polyadenylation. By solving the structures of the RNA binding domains of two human CPEB paralogs in the free state and in complex with the target RNA, we could obtain a detailed insight into the RNA recognition mode at the molecular level. Structures of CPEB1 and CPEB4 RRMs in the free state reveal an unprecedented arrangement of the two RRMs, creating a positively charged RNA binding groove between them. However, unique features in the structure of CPEB1 make this family member distant to other CPEB paralogs. The structures of the CPEB1 and CPEB4 RRMs in complex with the RNA shows the importance of relative domain orientation that leads to the binding of a short pentanucleotide RNA by the two domains in a sandwich fashion. In addition, the structure reveals the sequence specific protein-rna interactions, which could be validated by polyadenylation assays in xenopus oocytes. The unexpected structural features deepen our existing knowledge regarding the principles underlying the protein-rna recognition by multidomain proteins. Moreover, the knowledge gained about the sequence specificity can now be used to predict and/or identify the unknown mrna targets of CPEB proteins expanding their functional realm in diverse biological pathways. Furthermore, since CPEB proteins have been implicated in cancer progession, specific inhibitors can be designed based on the structural knowledge and tested in vivo for anti-tumorigenesis.
ZUSAMMENFASSUNG Genregulation wir oft mit einer Symphonie, einem musikalischem Kunstwerk verglichen. Einzelne Komponenten kommen mit Präzision zusammen und lenken das Schicksal einer Zelle in eine bestimmte Richtung. Es ist beachtlich, welch wichtige Bedeutung die Genregulation in der Steuerung vieler biologischer Phaenomene einnimmt. Folglich ist es wenig erstaunlich, dass selbst kleine Veränderungen im Prozess der Genregulation schwerwiegende Konsequenzen für das Schicksal einer Zelle haben koennen, und zudem häufig eine entscheidende Rolle in der Entwicklung von Krankheiten spielen. RNA bindende Proteine kontrollieren die Genexpression auf verschiedenen Ebenen. Diese Proteine erkennen spezifisch cis-elemente im mrna-transkript, und veranlassen damit die Rekrutierung oder den Austausch von Aktivatoren bzw. Repressoren. Translationsinhibierung wird zum Beispiel häufig über Proteine vermittelt, die an die 3'-UTR der Boten-RNA binden. Dieser Prozess ist reversibel und wird generell vermittelt, indem Repressoren von ihren Bindungsstellen auf dem mrna-transkript entfernt werden. In seltenen Fällen kann es allerdings auch über eine von externen Stimuli ausgelöste Remodellierung des Repressorkomplexes kommen. Um ein detailiertes Verständnis über regulatorische Prozesse von intrazellulären Signalwegen zu erlangen, ist es äusserst wichtig Protein-RNA Interaktionen zu studieren. Strukturaufklärungen von RNA Bindeproteinen leisten ferner einen wichtigen Beitrag zur Entwicklung von Pharmakophoren, aber auch zur Forschung allgemein. Mittels NMR Spektroskopie war es uns möglich, intensive strukturelle Studien zur Charakterisierung von RNA bindenden Proteinen der CPEB Familie durchzuführen. CPE Bindeproteine regulieren die Genexpression auf Translationsebene über cytoplasmatische Polyadenylierung. Mit der Strukturaufklärung beider RNA-Bindungsdomänen der CPEB Paraloge CPEB1 und CPEB4 ist es uns gelungen, den Wirkungsmechanismus zwischen Protein und RNA auf molekularer Ebene zu entschlüsseln. Für beide Strukturen konnten wir eine neuartige Anordnung der beiden Domänen zueinander nachweisen, die eine positiv geladene RNA-Bindungsfurche ausbilden. Trotz dieser Gemeinsamkeiten konnten wir einzigartige Strukturmerkmale bei CPEB1 aufdecken, die dieses Protein von Paralogen aus der Familie der CPE Bindeproteine unterscheiden. Mit der Struktur der RNA- Erkennungsmotive von CPEB4, gebunden an RNA, wird die entscheidende Rolle der relativen Anordnung beider Domänen zueinander deutlich. Diese erlaubt die Bindung eines kurzen Pentanukleotids, welches durch beide Domaenen erkannt und flankiert wird. Zusätzlich offenbart die Struktur des Protein-RNA Komplexes die sequenzspezifische Interaktion zwischen Protein und RNA, die zudem mit Polyadenylierungsassays in Xenopus
Oozyten validiert werden konnte. Diese strukturellen Eigenschaften bestätigen die bisherigen Annahmen über die Prinzipien, die der Erkennung von RNA Sequenzen durch Multidomänen Proteine zugrunde liegen. Zudem kann das erlangte Wissen über die Sequenzspezifität von Proteinen der CPEB Familie dazu genutzt werden, um mrna-zielsequenzen zu prognostizieren und/oder zu identifizieren. Ferner ist zu erwähnen, dass CPE Bindeproteine eine zentrale Rolle in der Tumorgenese einnehmen. Mit der Struktur von CPEB1 und CPEB4 stehen wichtige Anhaltspunkte zum Design spezifischer Inhibitoren zur Verfügung, die anschliessend in vivo auf anti-progressive Wirkung getestet werden können.