Supporting Information

Ähnliche Dokumente
Dendrogramm der Primaten

Bezeichnung Sequenz Verwendung

Cell Biology Gravitational Biology

Genannotation bei Prokaryoten

A- Zugabe von 180µl Pufferlösung und Proteinase K, Inkubation bei 56 C. B- Zugabe von 200µl einer zweiten Pufferlösung, Inkubation bei 70 C

Biologie. Ausbildungsrichtung: Agrarwirtschaft. Dienstag, 26. Mai 2009

Material MATERIAL 3.1 Oligonukleotide

HLA-READY GENE ABC Low

Anhang. Bedeutung Bezeichnung Rs + Nukleotidsequenz (5-3 ) Mutationsprimer Asp 29 Glu

HLA-READY GENE A Low SSP HLA-A low resolution

Evidence of strobilurine resistant isolates of A. solani and A. alternata in Germany

Sigma-Aldrich Chemie GmbH, München Merck Biosciences, Darmstadt. Thermo Hybaid GmbH, Ulm Roche Diagnostics GmbH, Mannheim

8. Translation. Konzepte: Translation benötigt trnas und Ribosomen. Genetischer Code. Initiation - Elongation - Termination

von Dipl. Math. (FH) Klaus Lange Primzahlen im Aufbau der DNS

6. DNA -Bakteriengenetik

Wasser-Bindung und Transport: durch Ladung, Aquaporine,.. Diese 8 AS sind für den Menschen essenziell, d.h. er muss sie über die Nahrung aufnehmen:

Primer zum Nachweis eukaryoter DNA (Kontroll-PCR) Primer Sequenz Ziel-Gen Produktgröße T a

MODUL 2.36 KLINISCHE CHEMIE UND LABORDIAGNOSTIK. TAG 6: HLA-Typisierung

2. MATERIAL UND METHODEN

Aminosäurebestimmung im Kochschinken

Aminosäurenanalytik. Probenvorbereitung Eiweißfällung, Oxidation und Hydrolyse Karl-Heinz Jansen SYKAM CHROMATOGRAPHIE

Molekularbiologie II. Rekombinante PCR Zielgerichtete Mutagenese Heterologe Expression His-Tag Aufreinigung BIOCHEMISCHES ANFÄNGERPRAKTIKUM

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014

Praktikum Biochemie Einführung in die Molekularbiologie. Bettina Siebers

Aufgabe 2: (Aminosäuren)

Plasmidisolierung. Mit Plasmiden können Sie Gene in Organismen einschleusen und so deren Eigenschaften verändern.

Molekulargenetische Experimente IV: Plasmidpräparation

...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-...

Praktikum Molekularbiologie, 5. Semester, BT 12 Martin Sievers, Gottfried Dasen und Tobias Wermelinger RT 418

Anhang. 1. Verwendete Abkürzungen

TCC CCA GTG AAG ACC TCC TCA GAG TCC GAC TCT. 56 C 67 siehe oben siehe oben siehe oben 56 C 66 CCG GCG CCA TTC TAT CC CGA GAA TCT GAC GCA GG 56 C 738

2 Materialien. Materialien Histondeacetylaseinhibitoren (HDIs) Sigma-Aldrich, Deutschland. 2.2 Zelllinien und Zellkultur.

Patente in der Biotechnologie. VPP-Düsseldorf März-20

Wenn Russland kein Gas mehr liefert

Anwendungsbericht zur Herstellung des Proteins GST-GFP-NLS

Die chemische Natur der Pigmente aus photosynthetischen Reaktionszentren von Rhodospirillum ruhrum G-9+

Nucleoside. Adenosin Triphosphat (AMP, ADP ATP) Adenosin Cytidin Guanosin Thymidin

Tube Analyzer LogViewer 2.3

DNS-Modell Best.-Nr

GEBRAUCHSANLEITUNG. Glutatione Agarose Resin

Das neue Volume-Flag S (Scannen erforderlich)

Biochemisches Grundpraktikum. Elektrophoretische Trennung von Proteinen

Kapitel 2: Modellierung. Programmieren in Haskell 1


7 Anhang. Tabelle I: Zusammensetzung der Restriktionsansätze.

Milenia Hybridetect. Detection of DNA and Protein

Quantitative Massenspektrometrie: Anwendungsbeispiele

Übung 11 Genregulation bei Prokaryoten

Remote Control - LeCroy Oszilloskop WaveSurfer 3000 mit LabVIEW via VICP LAN-Schnittstelle

Geometrie und Bedeutung: Kap 5

VORANGEGANGENE MODELLE

Handbuch. Artologik EZ-Equip. Plug-in für EZbooking version 3.2. Artisan Global Software

(einsatz (2/1) (transponiere 12 endlos)) (einsatz (4/1) endlos) :+: (einsatz (6/1) endlos )))

2. Konstruktion und Charakterisierung einer stx 2 -Mutante im E. coli-stamm O157:H

WAS IST DER KOMPARATIV: = The comparative

Webalizer HOWTO. Stand:

4.1. Physikalische Kartierung eines STS-Markers aus dem KPNA2-Gen

Professionelle Seminare im Bereich MS-Office

Material. 3 Material. 3.1 Reagenzien

Application Bulletin

Johannes Gutenberg-Universität Mainz Fachbereich Biologie, Institut für Zoologie Leitung: Prof. Dr. Wolfrum Datum: 15. April 2005

Grundideen der Gentechnik

Praktikum Biochemie Biotechnologie (Molekularbiologie & Biochemie) Bettina Siebers

Erweiterung der Aufgabe. Die Notenberechnung soll nicht nur für einen Schüler, sondern für bis zu 35 Schüler gehen:

Methodensammlung der Bund/Länder-Arbeitsgemeinschaft Gentechnik. PCR- Nachweis von E. coli B- und BL21- Stämmen


OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Musterlösung - Übung 5 Vorlesung Bio-Engineering Sommersemester 2008

PCR (polymerase chain reaction)

4.1. Herstellung, Aufreinigung und Nachweis eines CD33-spezifischen IgM-Antikörpers

DNA Sequenzierung. Transkriptionsstart bestimmen PCR

CarMedia. Bedienungsanleitung Instruction manual. AC-Services Albert-Schweitzer-Str Hockenheim

Listening Comprehension: Talking about language learning

MOL.504 Analyse von DNA- und Proteinsequenzen

Algorithms & Datastructures Midterm Test 1

Protokoll Praktikum für Humanbiologie Studenten

Einkommensaufbau mit FFI:

Translation benötigt trnas und Ribosomen. Genetischer Code. Initiation Elongation Termination

E. coli B, F -, dcm, ompt, hsds(r B- m B- ), galλ (DE3) [Codon + ]

CABLE TESTER. Manual DN-14003

MARKET DATA CIRCULAR DATA AMENDMENT

Titration einer Säure mit einer Base

Study guide written by René Koglbauer

ANALYTISCHE CHEMIE I. Trennmethoden. 1. Grundlagen Chromatographie WS 2004/2005

VGM. VGM information. HAMBURG SÜD VGM WEB PORTAL USER GUIDE June 2016

Nitrogen Oxides. O = Lachgas =Stickoxydul =Distickstoffoxid = Nitrous Oxide N 2. Nitrogen oxides

Transkript:

Supporting Information Wiley-VCH 2013 69451 Weinheim, Germany Recoding the Genetic Code with Selenocysteine** Markus J. Brçcker, Joanne M. L. Ho, George M. Church, Dieter Sçll,* and Patrick ODonoghue* ange_201308584_sm_miscellaneous_information.pdf

Supporting Online Material Supporting Text We examined the recoding behavior of the two Tyr codons (UAC and UAU) in detail in comparison to the canonical Sec-codon UGA (Figure S4). UAC is one of the best recoders because it produces ~10-fold more pure Sec-containing FDHH compared to the wild-type gene, whereas UAU yields 9.4-fold more full-length FDHH than wild-type but only about 80% of the FDHH produced contains Sec at 140 as determined by specific BV reduction activity and ICP-MS (Tables S1 and S3) To test the role of SECIS in sense-codon recoding, we constructed three disabled SECIS constructs (i.e., SECIS-BAD as in [1] ). For each codon, UGA, UAC and UAU, these SECIS disabled constructs failed to produce active Sec-containing FDHH (Figure S4A, column 4), but western blot analysis shows that although the wild-type UGA SECIS-BAD construct gives a 15.5 kda product, indicating release-factor mediated termination, full-length FDHH is observed for both the 140UAC and 140UAU constructs. The same is observed in the absence of cognate trna Sec and/or with a disabled SECIS. The results demonstrate that the sense-codon recoded Sec insertion is SECIS and trna Sec dependent, but production of full-length FDHH is not for sense codons. The E. coli MH5 contains an intact genomic copy of trna Sec UCA (wild-type), which explains Sec insertion at UGA in sample 2 (Figure S4 A,B). This trna is unable to translate Sec at UAU and UAC codons. These data further show that in the absence of any component of the recoding machinery (trna Sec NNN and/or SECIS), normal EF-Tu mediated translation is unencumbered, but that once all components (Sec-tRNA Sec NNN, SECIS) are expressed, the meaning of the sense codon can be mostly (for UAU) or completely converted (for UAC) to Sec. The data underscore the fact that sense-codon mediated Sec insertion produces far more protein than UGA-encoded Sec, because the release factor still competes with Sec-tRNA Sec UCA as evidenced by detectable truncated FDHH (at 140) (lane 3, Figure S4). Supporting Materials and Methods Construction of strains The initial sela deletion strain JS1 was constructed by replacing the sela gene with a kanamycin cassette in E. coli strain BW25113 as described [2] and genomic insertion of the T7 polymerase by P1 transduction. [3] The kanamycin resistance marker of E. coli strain JS1 was then excised by FLP recombinase-mediated homologous recombination between the FRT sites flanking the Km R cassette, upon transformation of the JS1 strain with plasmid pcp20 [4] resulting in the markerless

E. coli ΔselA strain JS2. Thereupon the selb gene was deleted using a λ Red recombinase / Flp recombinase as previously described. [2] The resulting markerless ΔselA ΔselB double deletion strain was denoted MH3. [5] A markerless deletion of fdhf from the MH3 strain resulted in the ΔselA ΔselB ΔfdhF triple deletion strain MH5. [5] Construction of vector systems pacyc -[E. coli sela+selb]. The gene encoding E. coli sela was PCR amplified from chromosomal E. coli DH10B (Invitrogen) with primers SELA-F (5 -CAT GCC ATG GCA ACC GAA ACG CGT TCC CTC TAT AGT-3 ) and SELA-R (5 -ATA AGA ATG CGG CCG CTT ATT TCA ACA ACA TCT C-3 ). After digestion with NcoI and NotI, the PCR product was ligated into pacyc-duet1 to yield pacyc-[e. coli sela]. Next, the gene encoding E. coli selb was amplified from chromosomal E. coli DH10B (Invitrogen) using primers SELB-F (5 -GGA ATT CCA TGA TTA TTG CGA CTG CCG GAC-3 ) and SELB-R (5 -CCG CTC GAG TTA TTT TTC CGG AAA TAA TAA-3 ) and ligated into NdeI/XhoI-digested pacyc-[e. coli sela] to yield pacyc-[e. coli sela+selb]. pgfib-[e. coli trna Sec ] variants. The gene sequence encoding for E. coli selc was generated by hybridization of overlapping oligonucleotides selcf (5 -AAT TCG GAA GAT CGT CGT CTC CGG TGA GGC GGC TGG ACT TCA AAT CCA GTT GGG GCC GCC AGC GGT CCC GGG CAG GTT CGA CTC CTG TGA TCT TCC GCC AG-3 ) and selcr (5 -GAT CCT GGC GGA AGA TCA CAG GAG TCG AAC CTG CCC GGG ACC GCT GGC GGC CCC AAC TGG ATT TGA AGT CCA GCC GCC TCA CCG GAG ACG ACG ATC TTC CAG-3 ) and was ligated into the EcoRI and BamHI sites of pgfib under the control of a lpp promoter. The opal anticodon TCA was changed to each of the 64 anticodons of the genetic code by site directed mutagenesis resulting in the 63 constructs pgfib-[e. coli trna Sec NNN]. prsf-[e. coli sers-fdhf ] variants. The gene sers was amplified from chromosomal DNA of E. coli DH10B (Invitrogen) with primers ECSERS-F (5 -GGA ATT CAT TAA TAT GCT CGA TCC CAA TCT G-3 ) and ECSERS-R (5 -CCG CTC GAG TTA GCC AAT ATA TTC CAG-3 ). The PCR product was digested with AseI and XhoI and ligated into prsf-duet1 cut with NdeI and XhoI to yield prsf-[e. coli sers]. Next, the fdhf gene encoding the formate dehydrogenase H (FDHH) was amplified from chromosomal E. coli K12 DNA using primers FDHF-F (5 -GGA ATT CGA AAA AAG TCG TCA CGG TTT-3 ) and FDHF-R (5 -CCC AAG CTT TTA CGC CAG TGC CGC TTC GC-3 ). The PCR product was digested with EcoRI and HindIII and ligated into EcoRI/HindIII cut prsf-[e. coli sers], resulting in prsf-[e. coli sers-fdhf] encoding for N- terminally 6xHis tagged FDHH. The opal codon TGA encoding Sec at amino acid position 140 of

FDHH was changed to each of the 63 other codons by site directed mutagenesis resulting in the 64 constructs prsf-[e. coli sers-fdhf 140NNN]. For the three fdhf variants 140UGA, 140UAU and 140UAC the SECIS motif was disabled by introduction of three point mutations by site directed mutagenesis using the primer pairs UGASEC-F (5 -AC TGC TGC GCT CGT GTC TGA CAC GGC CCA TCG GAT GGA GGT CTG GAC CAA TCG GTC GG-3 ) and UGASEC-R (5 -CC GAC GCA TTG GTC CAG ACC TCC ATC CGA TGG GCC GTG TCA GAC ACG AGC GCA GCA GTG-3 ),UAUSEC-F (5 -AC TGC TGC GCT CGT GTC TAT CAC GGC CCA TCG GAT GGA GGT CTG GAC CAA TCG GTC GG-3 ) and UAUSEC-R (5 - CC GAC GCA TTG GTC CAG ACC TCC ATC CGA TGG GCC GTG ATA GAC ACG AGC GCA GCA GTG-3 ) as well as UACSEC-F (5 -AC TGC TGC GCT CGT GTC TAC CAC GGC CCA TCG GAT GGA GGT CTG GAC CAA TCG GTC GG-3 ) and UACSEC-R (5 -CC GAC CGA TTG GTC CAG ACC TCC ATC CGA TGG GCC GTG GTA GAC ACG AGC GCA GCAGT9-3 ).The resulting vector constructs were denoted prsf-[e. coli sers-fdhf 140UGA SECIS-BAD], prsf-[e. coli sers-fdhf 140UAU SECIS-BAD] and prsf-[e. coli sers-fdhf 140UAC SECIS-BAD]. prsf-[human TrxR] variants. The gene TXNRD1 encoding the isoform 1 of the human thioredoxin reductase 1 was synthesized as a codon optimized variant for expression in E. coli (Geneart/Invitrogen). An E. coli fdhf SECIS element (TCG GTT GCA GGT CTG CAC CAA TCG TTA GCC TAT GCG GCC) was added at the 3 -UTR as described previously. [6] The gene sequence TXNRD1+Secis was synthesized (Invitrogen) and cut from the commercial vector pmk-rq using the restriction endonucleases EcoRI and HindIII and ligated into the EcoRI and HindIII sites of prsf-duet1 vector resulting in prsf-[humtrxr 550UGA]. The penultimate codon UGA at position 550 was changed to UAC by site directed mutagenesis using the primers TRXUACF (5 -CGT AGC GGT GCG TCC ATC CTG CAA GCA GGA TGC TAC GGC TAA TAA TCG GTT GCA GG-3 ) and TRXUACR (5 -CC TGC AAC CGA TTA TTA GCC GTA GCA TCC TGC TTG CAG GAT GGA CGC ACC GCT ACG-3 ) resulting in prsf-[humantrxr 550UAC]. In vivo FDHH activity assay. E. coli triple deletion strain MH5 containing the plasmid pacyc- [E. coli sela+selb] was co-transformed with prsf-[e. coli sers-fdhf 140NNN] and pgfib- [trna Sec NNN] vectors each encoding one out of the 64 codon variants of fdhf and one out of the 64 trna Sec variants with the cognate anticodon. Cells were grown on LB medium supplemented with the according antibiotics. Overnight cultures of these clones were plated on LB agar plates supplemented with 10 µm IPTG, 1 µm Na2MoO4, 1 µm Na2SeO3 and 50 mm sodium formate as described earlier [3, 7] and grown anaerobically at 37 C overnight. The plates were then overlaid with a top agar containing 1 mg ml -1 benzyl viologen, 250 mm sodium

formate and 25 mm KH2PO4 ph 7.0. The appearance of a purple color indicates catalytically active FDHH, which requires Sec insertion at position 140. Production and purification of E. coli FDHH variants Protein production. 64 fdhf 140NNN variants were individually overexpressed from the plasmids prsf-[e. coli sers-fdhf 140NNN] in E. coli strain MH5 that had been co-transformed with the plasmids pacyc-[e. coli sela+selb] and the complementary pgfib-[trna Sec NNN] constructs. Starting from a single colony after transformation, cells were grown at 37 C in 1 L LB selective medium supplemented with 10 µm sodium selenite. At an A600 = 1.2 the temperature was shifted to 20 C and protein expression was then induced at an A600 = 1.5 with 100 µm IPTG and continued for 18 h at 20 C. [8] Protein purification. Starting with cell harvest all procedures were carried under anaerobic conditions (90% N2, 5% H2, 5% CO2) in an anaerobic tent (Coy Laboratories). After the cells were harvested by centrifugation, the cell pellet was re-suspended in 25 ml lysis buffer (100 mm HEPES/NaOH, 100 mm NaCl, ph 7.2, 10% glycerol, 30 mm imidazole) (buffers were kept in the anaerobic tent). The cells were supplemented with 2 mm 2-mercapto ethanol and lysozyme (0.05 mg/ml) and subsequently disrupted by sonication. The centrifuged lysate purified using 1 ml Ni-NTA resin (Qiagen) in a gravity flow column equilibrated with 100 ml lysis buffer. After washing with 150 ml lysis buffer the proteins were eluted with 3 x 1 ml elution buffer (100 mm HEPES/NaOH, 100 mm NaCl, ph 7.2, 10% glycerol, 230 mm imidazole). Up to 10 mg FDHH were purified from 1 L of culture. Protein concentration was assessed according to the Bradford protein assay (Bio-Rad) at 595 nm throughout. In vitro FDHH activity assay. Enzymatic activity of FDHH was accessed colorimetrically by determination of formate dependent benzyl viologen (BV) reduction over time. 50-100 pmol of FDHH was incubated with 50 mm sodium formate and 5 mm BV in lysis buffer (see Purification of FDHH) under anaerobic conditions. The assay mixture was transferred to 500 µl anaerobic sealed Quartz glass cuvettes and BV reduction recorded at 578 nm in a Nanodrop-2000c (Thermo Scientific). To determine the concentration of reduced BV formed by FDHH catalysis an extinction coefficient of 11,000 M -1 cm-1 was used. [9] Assays were carried out in quadruplicate. Specific benzyl viologen reduction activity of FDHH was calculated as formation of nmols of reduced BV per 1 nmol FDHH per minute at 25 C. Western blot analysis of FDHH expression. fdhf 140NNN variants were expressed in 25 ml cultures under the same conditions as described above. 1 ml samples were 2 h after induction

with IPTG (100 µm). After centrifugation the cells were re-suspended in 1x SDS loading buffer (250 mm Tris/HCl ph 6.8, 40%v/v glycerol, 10% w/v SDS, 0.05 % w/v bromphenol blue, 5 % 2- mercapto ethanol) and 10 µl loaded per lane (SDS-Page). The blot was carried out with a Trans- Blot SD Semi-Dry Western transfer cell (Biorad). Anti-His antibodies (Goat Anti-Rabbit HRP) were purchased from Invitrogen. Chemiluminescent signal detection was performed on a ChemiDoc TM MP system (Biorad). Production and purification of recombinant human TrxR variants TrxR production. The human thioredoxin reductase 1 TrxR1 variants TrxR1 550UGA and Trx1 550UAC were overexpressed from the plasmids prsf-[humtrxr 550UGA] and prsf- [humtrxr 550UAC] in E. coli strain MH5 that had been co-transformed with the plasmids pacyc-[e. coli sela+selb] and the complementary pgfib-[trna Sec UCA] and pgfib-[trna Sec GUA] constructs. Starting from a single colony after transformation cells were grown at 37 C in 1 L LB selective medium supplemented with 10 µm sodium selenite. At an A600 = 1.2 the temperature was shifted to 20 C and protein expression was then induced at an A600 = 1.5 with 100 µm IPTG and continued for 18 h at 20 C. [8] TrxR purification. Starting with cell harvest all procedures were carried under anaerobic conditions (90% N2, 5% H2, 5% CO2) in an anaerobic tent (Coy Laboratories). After the cells were harvested by centrifugation, the cell pellet was resuspended in 25 ml phosphate buffer (100 mm potassium phosphate, ph 7.2, 10% glycerol) (buffers were kept in the anaerobic tent). The cells were supplemented with lysozyme (0.05 mg/ml) and subsequently disrupted by sonication. The centrifuged lysate was purified using 1 ml Ni-NTA resin (Qiagen) in a gravity flow column equilibrated with 100 ml phosphate buffer. After washing with 150 ml phosphate buffer supplemented with 45 mm imidazole the proteins were eluted with 3 x 1 ml phosphate buffer in the presence of 230 mm imidazole. Up to 2.5 mg TrxR1 was purified from 1 L of culture. Protein concentration was assessed according to the Bradford protein assay (Bio-Rad) at 595 nm. In vitro TrxR activity assay Enzymatic activity of TrxR1variants was accessed colorimetrically by following NADPH dependent reduction of Ellman s reagent (5.5 -dithio-bis(2-nitrobenzoic acid); DTNB) over time. 5-10 pmol of TrxR1 were incubated with 5 mm NADPH and 5 mm DTNB in phosphate buffer (see Purification of TrxR1) under anaerobic conditions. The assay mixture was transferred to 500 µl anaerobic sealed Quartz glass cuvettes and DTNB reduction recorded at 412 nm in a Nanodrop-2000c (Thermo Scientific). Two-electron reduction of DTNB yields two molecules of

nitro-thio benzoate (NTB). To determine the concentration of reduced NTB formed by TrxR1 catalysis an extinction coefficient of 13,600 M -1 cm-1 was used according to. [10] Assays were carried out in quadruplicate. Specific DTNB reduction activity of TrxR1 was calculated as formation of nmols of reduced BV by 1 nmol TrxR1 per minute at 20 C. Mass spectrometry of E. coli FDHH and human TrxR Mass spectrometric analyses of purified FDHH and TrxR variants were performed at the W. M. Keck Biotechnology Resource Laboratory at the Yale University. Proteins were alkylated, digested with trypsin and GluC and subjected to LC-MS/MS using an XL-Orbitrap mass spectrometer. ICP-MS spectroscopic quantitation of Se in FDHH and TrxR variants Induced coupled plasma (ICP) mass spectroscopy was performed to quantify the amount of selenium per amount of protein for FDHH and TrxR variants. A defined amount of protein samples (10µg) was transferred to Teflon vials, dried for four hours at 95 C and incubated twice with 200µL H2O2 (pure) and 800µL nitric acid (HNO3, 8N) at 95 C overnight. Subsequently, samples were resuspended in 5% nitric acid containing two ppb of the internal standard 115 indium. Likewise, samples containing exactly defined amounts of selenite (Na2SO3) and BSA as a non-selenoprotein background were prepared for calibration. All samples were subjected to ICP-MS using an Element XR spectrometer (Thermo Scientific). For data analyses the Sequence Thermo Element ICP-MS/GD-MS 3.1 software was used. Experimental parameters were set to detect the selenium isotopes 77 Se (exact mass 76.9194), 78 Se (77.9168) and 82 Se (81.9162) and the internal standard 115 indium (114.9033). Selenium isotope 80 Se was not searched for due to interference with the ionized argon gas (Ar2 + 79.896). Medium range (MR) and high range (HR) signals were recorded. Supporting figure legends Figure S1. Western blot of fdhf 140NNN expression. Anti-His Western blot using cytosolic extracts of E. coli MH5 after overnight expression of FDHH variants 140UGA, 140AGA, 140ACC, 140ACU, 140AGG, 140AGA, 140CGA, 140CUA, 140AUA, 140UAU, and 140UAC. Full-length FDHH (80.6kDa) and the truncation product at position 140 (15.5kDa) are indicated. Figure S2. SDS-Page analysis of purified, recoded FDHH 140NNN variants. 64 FDHH 140NNN variants, each containing a different codon at amino acid position 140, were produced in the presence of trna Sec NNN carrying the cognate anticodon and purified. 10 µl of each FDHH

variant was loaded onto a 4-20% gradient SDS-Page gel. The labeling NN / N,N,N,N indicates the codon at position 140. The relative molecular mass of the size marker is indicated. Figure S3. MS/MS spectra showing identification of Sec140-containing peptides expressed from the fdhf 140NNN variants. Peptide identifications are summarized in Table S2. Figure S4. Sense codon recoding requires complete Sec machinery. A) In vivo assay of FDHH activity in E. coli MH5 cells complemented with the FDHH variants 140UGA (row 1), 140UAU (row 2) or 140UAC (row 3), SelA and SelB. Several conditions were tested: without trna Sec NNN and disabled SECIS (-/-, column 1); without trna Sec NNN and intact SECIS (-/+); with trna Sec NNN overexpressed and intact SECIS (+/+, column 3); with trna Sec NNN over-expressed and disabled SECIS (+/-, column 4). B) A western blot (anti-his) of cytosolic extracts of E. coli MH5 strains 1-12 shows the result of a 2-hour expression of the His-tagged FDHH variants. Samples 1-12 (in A) correspond to lanes 1-12 (in B). Full length FDHH (80.6 kda) and the truncation product at position 140 (15.5 kda) are indicated. *Sample 2 (in A), and lane 2 (in B) show residual Sec insertion directed from the intact genomic copy of trna Sec UCA (wild-type) in E. coli MH5. Figure S5. A) Codon usage versus recoding plot. The Sec recoding capacity (%) of each codon as determined by specific BV reduction activity of E. coli FDHH 140NNN variants is plotted against the codon usage of E. coli K12 (in absolute number of genomic codons). E. coli MH5 used for the recoding study is derived from E. coli strain BW25113 which originates from E. coli K12. Codon usage is from the Codon Usage Database. [11] B) Aminoacyl-tRNA abundance versus recoding. The Sec recoding capacity (%) of each codon as determined by specific BV reduction activity of E. coli FDHH 140NNN variants is plotted against the abundance of aa-trna isoacceptors in E. coli K12 (%). The abundance of aa-trna isoacceptors was calculated from the absolute numbers for each trna per E. coli cell [12] and the level of aminoacylation during logarithmic growth. [13] Supporting References [1] K. E. Sandman, D. F. Tardiff, L. A. Neely, C. J. Noren, Nucleic Acids Res. 2003, 31, 2234-2241. [2] K. A. Datsenko, B. L. Wanner, Proc. Natl. Acad. Sci. USA 2000, 97, 6640-6645. [3] J. Yuan, S. Palioura, J. C. Salazar, D. Su, P. O'Donoghue, M. J. Hohn, A. M. Cardoso, W. B. Whitman, D. Söll, Proc. Natl. Acad. Sci. USA 2006, 103, 18923-18927. [4] J. Yuan, M. J. Hohn, R. L. Sherrer, S. Palioura, D. Su, D. Söll, FEBS Lett. 2010, 584, 2857-2861.

[5] C. Aldag, M. J. Bröcker, M. J. Hohn, L. Prat, G. Hammond, A. Plummer, D. Söll, Angew. Chem. Int. Ed. 2013, 52, 1441-1445. [6] J. Xu, V. Croitoru, D. Rutishauser, Q. Cheng, E. S. Arnér, Nucleic Acids Res. 2013. [7] Y. Araiso, S. Palioura, R. Ishitani, R. L. Sherrer, P. O'Donoghue, J. Yuan, H. Oshikane, N. Domae, J. Defranco, D. Soll, O. Nureki, Nucleic Acids Res. 2008, 36, 1187-1199. [8] O. Rengby, L. Johansson, L. A. Carlson, E. Serini, A. Vlamis-Gardikas, P. Karsnas, E. S. Arner, Appl. Environ. Microbiol. 2004, 70, 5159-5167. [9] M. J. Axley, D. A. Grahame, T. C. Stadtman, J. Biol. Chem. 1990, 265, 18213-18218. [10] E. S. Arnér, A. Holmgren, Curr. Protoc. Toxicol. 2001, Chapter 7, Unit 7 4. [11] Y. Nakamura, T. Gojobori, T. Ikemura, Nucleic Acids Res. 2000, 28, 292. [12] H. Dong, L. Nilsson, C. G. Kurland, J. Mol. Biol. 1996, 260, 649-663. [13] K. A. Dittmar, M. A. Sorensen, J. Elf, M. Ehrenberg, T. Pan, EMBO Rep. 2005, 6, 151-157.

Table S1. Specific activities and yield of recoded formate dehydrogenase FDHH variants. FDH H variant 140NNN specific activity [n nmol BV min -1 1nmol FDH H -1 ] 25 C, ph 7.2 relative activity [% of FDH H UGA140] yield [mg FDH H L -1 culture] rel. yield [n-fold of FDH H 140 UGA]] UUU Phe 107.5 ±13.4 60 ±8 11.2 10.2 UUC Phe 84.5 ±19.0 47 ±11 10.5 9.5 UUA Leu 48.2 ±1.3 27 ±1 9.6 8.7 UUG Leu 112.0 ±19.4 70 ±11 13.1 11.9 UCU Ser 24.6 ±1.9 14 ±1 8.5 7.7 UCC Ser 21.3 ±1.4 12 ±1 9.4 8.5 UCA Ser 79.0 ±6.2 44 ±4 8.8 8.0 UCG Ser 85.8 ±5.3 48 ±3 5.2 4.7 UAU Tyr 153.8 ±8.2 86 ±5 10.3 9.4 UAC Tyr 179.7 ±10.1 100 ±6 10.9 9.9 UAA Stop ochre 184.5 ±15.5 103 ±9 1.3 1.2 UAG Stop amber 179.7 ±5.3 100 ±3 1.3 1.2 UGU Cys 164.0 ±27.8 91 ±16 12.4 11.3 UGC Cys 73.6 ±4.8 41 ±3 13.1 11.9 UGA Stop opal 179.7 ±0.9 100 ±1 1.1 1.0 UGG Trp 179.0 ±17.6 100 ±10 4.6 4.2 CUU Leu 91.7 ±5.7 51 ±4 10.5 9.5 CUC Leu 105.3 ±7.2 59 ±4 10.1 9.2 CUA Leu 25.1 ±8.5 14 ±5 10.4 9.5 CUG Leu 99.0 ±7.5 55 ±4 12.2 11.1 CCU Pro 170.4 ±9.3 95 ±5 9.9 9.0 CCC Pro n.d. n.d. 10.3 9.4 CCA Pro 51.4 ±3.4 29 ±2 10.6 9.6 CCG Pro 153.9 ±12.2 86 ±7 10.1 9.2 CAU His 46.9 ±4.0 26 ±2 9.7 8.8 CAC His n.d. n.d. 10.0 9.1 CAA Gln 67.2 ±3.7 37 ±2 9.8 8.9 CAG Gln 121.9 ±2.1 68 ±1 10.9 9.9 CGU Arg 59.8 ±4.8 33 ± 3 10.2 9.3

CGC Arg 44.3 ±3.0 25 ±2 0.5 0.5 CGA Arg n.d. n.d. n.d. n.d. CGG Arg 79.5 ±4.5 44 ±3 3.3 3.0 AUU Ile 129.0 ±4.0 72 ±2 8.1 7.4 AUC Ile 92.3 ±4.6 52 ±3 1.5 1.4 AUA Ile 177.3 ±14.2 99 ±8 10.2 9.3 AUG Met 72.3 ±9.8 40 ±5 12.8 11.6 ACU Thr 96.2 ±3.0 54 ±2 11.1 10.1 ACC Thr 163.5 ±14.2 91 ±8 8.9 8.1 ACA Thr 65.4 ±1.9 36 ±1 9.8 8.9 ACG Thr 169,0 ±19.4 94 ±11 13.8 12.5 AAU Asn 179.7 ±17.3 100 ±10 8.0 7.3 AAC Asn 62.9 ±7.0 35 ±4 11.2 10.1 AAA Lys 61.6 ±7.8 34 ±4 11.8 10.7 AAG Lys 169.8 ±10.7 95 ±6 10.9 9.9 AGU Ser n.d. n.d. 1.1 1.0 AGC Ser 46.2 ±2.6 26 ±1 7.1 6.4 AGA Arg 82.4 ±3.5 46 ±2 10.8 9.8 AGG Arg n.d. n.d. n.d. n.d. GUU Val 178.1 ±5.9 99 ±3 10.2 9.3 GUC Val 100.6 ±3.4 56 ±2 10.5 9.1 GUA Val 177.0 ±9.9 99 ±6 10.1 9.2 GUG Val 177.8 ±14.2 99 ±8 9.6 8.7 GCU Ala 175.7 ±10.6 98 ±6 9.7 8.8 GCC Ala 41.3 ±0.6 23 ±1 9.3 8.4 GCA Ala 48.5 ±4.2 27 ±2 10.5 9.5 GCG Ala 87.7 ±2.7 49 ±2 10.1 9.2 GAU Asp 93.8 ±5.9 52 ±3 2.1 1.9 GAC Asp 27.4 ±1.6 15 ±1 9.5 8.6 GAA Glu 62.7 ±2.1 35 ±1 9.9 9.0 GAG Glu 83.0 ±6.4 46 ±4 10.3 9.4 GGU Gly 45.8 ±1.9 26 ±1 6.2 5.6 GGC Gly n.d. n.d. 7.0 6.4

GGA Gly 39.7 ±1.4 22 ±1 5.4 4.9 GGG Gly 81.1 ±6.9 45 ±4 5.6 5.1 64 FDHH variants were produced (each from a fdhh 140NNN gene with a different triplet at codon 140) and co-expressed with a trna Sec NNN containing the cognate anticodon. The yield of each variant per liter culture and the specific Sec-dependent benzyl viologen reduction activity were determined. Experiments were repeated in quadruplicate; no codon dependent effect on cell growth was observable. Specific activity (initial velocity of BV reduction per nmol of FDHH) is listed in absolute value; Relative activity (± standard deviation) refers to wild type FDHH (produced from fdhf 140UGA and trna Sec UCA) activity set to 100%; Relative yield refers to n-fold increase/decrease compared to fdhf 140UGA set to 1.0; n.d., no activity detectable. Table S2A. Classification of recoding behavior of codons listed according to MS/MS analysis. i) peptide with Sec identified at position 140 ii) peptide with canonical AA identified at position 140 iii) peptide with Sec and canonical AA identified at position 140 iv) no peptide containing residue 140 observed codon codon AA id by codon codon AA id by codon codon AA id by codon codon AA id by canonical MS/MS meaning MS/MS meaning MS/MS meaning MS/MS meaning n.d. stop opal UGA Sec Ser UCC Ser* Ser AGC Sec/Ser stop ochre UAA stop amber UAG Sec Cys UGC Cys* Glu GAA Sec/Glu Ser UCG n.d. Phe UUC Sec Pro CCC Pro Cys UGU n.d. Tyr UAC Sec His CAC His His CAU n.d. Trp UGG Sec Gln CAA Gln* Gln CAG n.d. Leu CUC Sec Ile AUU Ile* Ile AUA n.d. Pro CCU Sec Lys AAA Lys* Met AUG n.d. Thr ACC Sec Ala GCA Ala* Asn AAU n.d. Lys AAG Sec Gly GGC Gly Arg AGA n.d. Val GUU Sec Ala GCU n.d. Ala GCC Sec Asp GAU n.d. Glu GAG n.d. Gly GGG n.d.

*Indicates that FDHH variant is known to contain both canonical AA and Sec (Table S1, Figure 1, Figure 2), but Sec-containing peptide was not detected by MS/MS. n.d. indicates peptide containing AA140 was not detected my MS/MS analysis. Table S2B. Summary of peptides containing FDHH residue 140 identified my MS/MS analysis. FDH H140NNN variant peptide sequence** peptide identity score** peptide identity/homology score threshold stop opal UGA R.VCHGPSVAGLHQSVGNGAMSNAINEIDNTDLVFVFGYNPADSHPIVANHVINAK.R + Oxidation (M); SE_IAN_Cys (C) 17.51 12.92 stop amber UAG R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 23.87 13.91 Phe UUC R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 30.86 16.07 Ser UCC R.VSHGPSVAGLHQSVGNGAMSNAINE.I 73.34 16.35 Tyr UAC R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 35.37 13.50 Cys UGC R.VCHGPSVAGLHQSVGNGAMSNAINE.I 48.87 16.10 Trp UGG R.VCHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M); SE_IAN_Cys (C) 24.63 13.70 Leu CUC R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 32.00 13.11 Pro CCU R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 26.24 14.02 Pro CCC R.VPHGPSVAGLHQSVGNGAMSNAINE.I 46.58 16.60 His CAC R.VHHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M) 71.46 16.08 Gln CAA R.VNHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M) 25.02 16.06 Ile AUU R.VIHGPSVAGLHQSVGNGAMSNAINE.I 70.01 16.14 Thr ACC R.VCHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M); SE_IAN_Cys (C) 29.87 13.07 Lys AAA K.HGPSVAGLHQSVGNGAMSNAINEIDNTDLVFVFGYNPADSHPIVANHVINAK.R 66.60 16.05 Lys AAG R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 20.99 13.02 Ser AGC a) R.VSHGPSVAGLHQSVGNGAMSNAINE.I b) R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 55.66 23.08 16.03 16.03 Val GUU R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 27.69 13.27 Glu GAA a) R.VEHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M) b) R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 89.87 37.43 16.16 16.16 Ala GCC R.VCHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M); SE_IAN_Cys (C) 33.68 16.94 Ala GCA R.VAHGPSVAGLHQSVGNGAMSNAINE.I 57.46 16.07

Gly GGC R.VGHGPSVAGLHQSVGNGAMSNAINE.I 61.73 16.15 Mass spectrometric characterization of 35 FDHH protein variants that were produced from the fdhf 140NNN constructs indicated by the codon listed FDHH samples were alkylated to protect the Sec moiety, digested by trypsin and GluC and analyzed by LC-MS/MS on a XL-Orbitrap mass spectrometer. A) FDHH samples were allocated into four groups: i) variants for which either only Sec or ii) only canonical AAs or iii) Sec and the canonical AA were detected at position 140; iv) variants for which the peptide covering position 140 was not detected in the MS experiment. In all cases, peptides identifying full length FDHH were unambiguously assigned, even if the peptide including position 140 was not detected. B) The AA sequence of the peptide containing residue 140, the identity score and the identity/homology score threshold are indicated. Sec was identified by MASCOT as a modification of the canonical amino acid Cysteine, i.e., Se_IAN_Cys; selenium alkylation IAN Cys (Se-CH2-CONH2). **The peptide including residue 140 identified with the highest identity score is shown. Table S3. ICP-MS Se content determination for FDHH and TrxR variants. Protein sample protein (nmol) selenium detected (nmol) Sec occupancy [%] FDH H UGA opal 6,427 6.426 99.9 FDH H UAU Tyr 7.529 5.971 79.3 FDH H UAC Tyr 7.503 7.375 98.3 FDH H CCU Pro 7.574 6.752 89.1 FDH H CCC Pro 9.047 0.013 1.4 FDH H ACG Thr 7.516 5.784 76.9 FDH H GUA Val 7.570 6.441 85.1 FDH H GUG Val 7.554 4.722 62.5 TrxR UGA opal 4.348 4.283 98.5 TrxR UAC Tyr 3.224 3.065 95.1 The Sec-occupancy is calculated as a ratio of the amount of Se detected by ICP-MS to the amount of protein in each sample. Protein samples for FDHH indicate the codon used position 140 and the canonical meaning of the codon. TrxR samples indicate the codon at position 550 and the canonical codon meaning. In all cases, Sec occupancy of at or close to 100% indicate complete reassignment of the codon meaning to Sec. These values correlate with the specific activity measurements in Table S1, Figure 2, and Figure 3.

Zusatzinformationen Zusatztext Für die beiden Tyr-Codons UAC und UAU haben wir das Umkodierungsverhalte im Vergleich zum regulären Sec-Codon UGA im Detail analysiert (Abbildung S4). UAC ist eines der am besten rekodierbaren Codons, da es zu ~10fach gesteigerter Ausbeute an reinem Sec-FDHH im Vergleich zum Wildtyp führt. Im Vergleih dazu resultiert UAU in 9,4-fach gesteigerter FDHH- Ausbeute, allerdings werden lediglich etwa 80% der FDHH als Sec-Spezies produziert, wie anhand der spezifischen BV-Reduktionsaktivität und ICP-MS bestimmt wurde (Tabellen S1, S3). Um den Einfluss des SECIS-Elements auf die Umkdoierung von Sense-Codons zu untersuchen, wurden drei Konstrukte mit deaktiviertem SECIS-Element hergestellt (siehe SECIS-BAD wie in [1] ). Bei keinem der Codons UGA, UAC und UAU konnte mit einem inaktivierten SECIS- Element katalytisch aktive, Sec-FDHH produziert werden (Abbildung S4A, Reihe 4). Allerdings zeigten Western-Blots, dass, obwohl das Wildtyp FDHH 140UGA-Konstrukt zu einem verkürzten Protein von 15,5 kda führte, beide Tyr-Codons 140UAC und 140UAU in vollständigem FDHH von 80,6 kda resultierten. Dieselben Beobachtungen wurden in der Anwesenheit von komplementärer trna Sec und/oder and/or mit inaktiviertem SECIS-Element gemacht. Die Resultate zeigen, dass die Umkodierung von Sense-Codons zu Sec sowohl vom SECIS- Element als auch von trna Sec abhängt du ansonsten die Translation von vollständigem, aber Sec-freiem FDHH-Protein erfolgt. Da der E. coli-stamm MH5 eine intakte, genomische Kopie von trna Sec UCA (Wildtyp) enthält, kommt es in Probe 2 zu Sec-Einbau (Abbildung S4 A,B). Diese trna ist allerdings nicht in der Lage Sec an UAU und UAC Codons zu translatieren. Die Ergebnisse weisen darauf hin, dass die Abwesenheit einzelner Komponenten des Sec- Translationsapparates keine Einfluss auf die reguläre, EF-Tu-vermittelte Translation ausüben, wohingegen die Expression aller Komponenten (Sec-tRNA Sec NNN, SECIS) die Umkodierung von Sense-Codons nahezu (UAU) vollständig (UAC) ermöglicht. Die Daten unterstreichen weiterhin die Tatsache, dass Sense-Codon-basierter Sec-Einbau zu erheblich gesteigerter Proteinproduktion im Vergleich zu UGA-Codon-basierter Sec-Insertion führt was auf die Konkurrenz von Terminationsfaktor RF2 mit Sec-tRNA Sec UCA zurückzuführen ist und anhand von vorzeitig terminierter Translation an Position von FDHH ersichtlich ist (Spur 3, Abbildung S4).

Material und Methoden Konstruktion von E. coli Stämmen Der ursprüngliche sela Deletionsstamm JS1 wurde durch den Austausch des sela Gens mit eines Kanamycinkassette in E. coli Stamm BW25113 [2] und anschließende genomische Insertion einer T7 Polymerase durch P1 Transduktion erzeugt. [3] Der Kanamycinresitenzmarker wurde anschließend durch homolge Rekombination mit einer FLP-Rekombinase (mittels homologer Sequenzen an den FRT Loci, die flankierend zur Km R Kassette lagen) nach der Transformation des JS1 Stammes mit dem Plasmid pcp20 entfernt. [4] Der daraus resultierende markerlose E. coli ΔselA Stamm wurde als JS2 bezeichnet. Das selb Gen wurde mittels λ Red Rekombinase / Flp Rekombinase entfernt. [2] Der resultierende markerlose ΔselAΔselB Doppeldeletionsstamm wude als MH3 bezeichnet. [5] Eine weitere markerlose des fdhf Gens aus MH3 führte schließlich zum ΔselAΔselBΔfdhF Dreifachdeletionsstamm MH5. [5] Konstruktion der Vektorsysteme pacyc -[E. coli sela+selb]. Das E. coli sela Gen wurde per PCR von chromosomaler E. coli DH10B (Invitrogen) DNA mit den Primer SELA-F (5 -CAT GCC ATG GCA ACC GAA ACG CGT TCC CTC TAT AGT-3 ) und SELA-R (5 -ATA AGA ATG CGG CCG CTT ATT TCA ACA ACA TCT C-3 ) amplifiziert. Nach dem Verdau mit NcoI und NotI, wurde das PCR-Produkt in den pacyc-duet1-vektor ligiert. Das resultierende Plasmide wurde als pacyc-[e. coli sela] bezeichnet. Daraufhin, wurde das E. coli selb Gen ebenfalls von chromosomaler E. coli DH10B (Invitrogen) DNA amplifiziert; hierzu dienten die Primer: SELB-F (5 -GGA ATT CCA TGA TTA TTG CGA CTG CCG GAC-3 ) und SELB-R (5 -CCG CTC GAG TTA TTT TTC CGG AAA TAA TAA-3 ) Das Fragment wurde in den mit NdeI/XhoI verdauten pacyc-[e. coli sela]-vektor ligiertund ergab pacyc-[e. coli sela+selb]. Varianten von pgfib-[e. coli trna Sec ]. ie Gensequenz für E. coli selc wurde duch Hybridiesierung der überlappenden Olgionukleotide selcf (5 -AAT TCG GAA GAT CGT CGT CTC CGG TGA GGC GGC TGG ACT TCA AAT CCA GTT GGG GCC GCC AGC GGT CCC GGG CAG GTT CGA CTC CTG TGA TCT TCC GCC AG-3 ) und selcr (5 -GAT CCT GGC GGA AGA TCA CAG GAG TCG AAC CTG CCC GGG ACC GCT GGC GGC CCC AAC TGG ATT TGA AGT CCA GCC GCC TCA CCG GAG ACG ACG ATC TTC CAG-3 ) erzeugt und in den mit EcoRI und BamHI verdauten pgfib-vektor unter der Kontrolle eines lpp Promotors kloniert. Das Opal-Anticodon wurde mittels gerichteter Mutagenese zu jedem der 63 möglichen Anticodon des genetischen Codes mutagenisiert. Die so erhaltenen 64 Konstrukte wurden als GFIB-[E. coli trna Sec NNN] bezeichnet.

Varianten von prsf-[e. coli sers-fdhf ]. Das E. coli sers Gen wurde von chromosomaler E. coli DH10B (Invitrogen) DNA mit den Primern ECSERS-F (5 -GGA ATT CAT TAA TAT GCT CGA TCC CAA TCT G-3 ) und ECSERS-R (5 -CCG CTC GAG TTA GCC AAT ATA TTC CAG-3 ) amplifiziert. Das PCR-Produkt wurde anschließend nach dem Verdau mit AseI und XhoI in den Vektor prsf-duet1 zu prsf-[e. coli sers] ligiert. Als nächstes wurde das E. coli fdhf Gen, welches die Formaitdehydrogenase H (FDHH) kodiert, von chromosomaler E. coli K12 DNA mit den Primern FDHF-F (5 -GGA ATT CGA AAA AAG TCG TCA CGG TTT-3 ) und FDHF-R (5 - CCC AAG CTT TTA CGC CAG TGC CGC TTC GC-3 ) amplifiziert. Das PCR-Produkt wurde mit EcoRI und HindIII verdaut und in prsf-[e. coli sers] ligiert. Der resultierende prsf-[e. coli sers-fdhf]-vektor kodiert für N-terminal 6xHis markiertes FDHH. Das Opal-Codon, welches Sec an Positio 140 kodiert wurde mit gerichteter Mutagenese zu allen möglichen 63 weiteren Codons mutagenisiert. Die so erhaltenen 64 Konstrukte wurden als prsf-[e. coli sers-fdhf 140NNN] bezecihnet. Für die drei fdhf Varianten 140UGA, 140UAU und 140UAC wurde das SECIS-Element durch drei Punktmutationen deaktiviert; dazu die folgenden Primer verwendet: UGASEC-F (5 -AC TGC TGC GCT CGT GTC TGA CAC GGC CCA TCG GAT GGA GGT CTG GAC CAA TCG GTC GG-3 ) und UGASEC-R (5 -CC GAC GCA TTG GTC CAG ACC TCC ATC CGA TGG GCC GTG TCA GAC ACG AGC GCA GCA GTG-3 ),UAUSEC-F (5 -AC TGC TGC GCT CGT GTC TAT CAC GGC CCA TCG GAT GGA GGT CTG GAC CAA TCG GTC GG-3 ) und UAUSEC-R (5 - CC GAC GCA TTG GTC CAG ACC TCC ATC CGA TGG GCC GTG ATA GAC ACG AGC GCA GCA GTG-3 ) sowie UACSEC-F (5 -AC TGC TGC GCT CGT GTC TAC CAC GGC CCA TCG GAT GGA GGT CTG GAC CAA TCG GTC GG-3 ) und UACSEC-R (5 -CC GAC CGA TTG GTC CAG ACC TCC ATC CGA TGG GCC GTG GTA GAC ACG AGC GCA GCAGT9-3 ). Die hieraus resultierenden Vektorkonstrukte wurden als prsf-[e. coli sers-fdhf 140UGA SECIS- BAD], prsf-[e. coli sers-fdhf 140UAU SECIS-BAD] und prsf-[e. coli sers-fdhf 140UAC SECIS- BAD] bezeichnet. Varianten von prsf-[humanes TrxR]. Das Gen TXNRD1, welches für die Isoform 1 der humanen Thioredoxinreduktase 1 kodiert, wurde als codonoptimierte Variante für die Expression in E. coli verwendet (Geneart/Invitrogen). Ein E. coli fdhf SECIS element (TCG GTT GCA GGT CTG CAC CAA TCG TTA GCC TAT GCG GCC) wurde in der 3 -UTR angefügt wie zuvor beschrieben. [6] Die Gensequenz TXNRD1+Secis wurde von synthetisiert (Invitrogen) und mit EcoRI und HindIII aus dem kommerziellen Vektor pmk-rq herausgeschnitten und in den prsf-duet1-vektor ligiert. Das resultierende Konstrukt wurde als prsf-[humtrxr 550UGA] bezeichnet. Das UGA-Codon an der vorletzten Position 550 wurde mittels gerichteter

Mutagenese unter Verwendung der Primer TRXUACF (5 -CGT AGC GGT GCG TCC ATC CTG CAA GCA GGA TGC TAC GGC TAA TAA TCG GTT GCA GG-3 ) und TRXUACR (5 -CC TGC AAC CGA TTA TTA GCC GTA GCA TCC TGC TTG CAG GAT GGA CGC ACC GCT ACG-3 ) zu UAC mutagenisiert. Das daraus resultierende Konstrukt wurde als prsf- [humantrxr 550UAC] bezeichnet. In vivo FDHH Aktivitätstest. Der E. coli Dreifachdeletionsstamm MH5 wurde mit den Vektoren pacyc-[e. coli sela+selb], prsf-[e. coli sers-fdhf 140NNN] und dem jeweils komplementären pgfib-[trna Sec NNN]-Konstrukt kotransformiert, so dass jeweils eine der 64 Codonvarianten von fdhf mit der komplementären trna Sec Variante vorlagen. Die Zellen wurden in LB- Selektionsmedium kultiviert und Übernachkulturen der Klone auf LB-Agarplatten ausgestrichen, die mit 10 µm IPTG, 1 µm Na2MoO4, 1 µm Na2SeO3 und 50 mm Natriumformiat versetzt waren ausplattiert [3, 7] und anschließend anaerob bei 37 C für 24 Stunden inkubiert. Danach wurden die Agarplatten mit einem Topagar übrschichtet, der 1 mg ml -1 Benzylviologen, 250 mm Natriumformiat und 25 mm KH2PO4 ph 7.0 enthielt. Violettfärbung der Zellkolonien zeigt katalytisch aktive FDHH an, wofür Sec-Einbau an Position 140 erforderlich ist. Produktion und Reinigung von E. coli FDHH Varianten Protein Produktion. 64 fdhf 140NNN Varianten wurden individuell von den Plasmiden prsf- [E. coli sers-fdhf 140NNN] in E. coli MH5 in Gegenwart des Vektors pacyc-[e. coli sela+selb] und der komplemetären pgfib-[trna Sec NNN] Konstrukte überproduziert. Ausgehend von einer Einzelkolonie nach der Plasmid-Transformation wurden die Zellen in 1L LB Selektionsmedium, welches 10µM Natriumselenit enhielt, bei 37 C kultiviert. Bei A600 = 1,2 wurde die Temperatur auf 20 C reduziert und die Proteinüberproduktion durch Zugabe von 100µM IPTG bei A600 = 1,5 induziert. Die Kultivierung wurde für 18 Stunden bei 20 C fortgesetzt. [8] Protein Reinigung. Ausgehend von der Zellernete wurden alle Schritte unter anaeroben Bedingungen (90% N2, 5% H2, 5% CO2) in einem Anaerobenzelt (Coy Laboratories) durchgeführt. Nachdem die Zellen per Zentrifugation sedimentiert wurden, wurden sie in 25 ml Lysispuffer (100 mm HEPES/NaOH, 100 mm NaCl, ph 7.2, 10% Glycerin, 30 mm Imidazol) resuspendiert (Puffer wurden im Anaerobenzelt gelagert). Vor dem Aufschluss durch Ultraschall wurden die Zellen mit Lysozym (0.05 mg/ml) versetzt. FDHH aus dem nach erneuter Zentrifugation erhaltenen cytosolischen Extrakt wurde auf 1 ml Ni-NTA His-Tag Affinitätsmaterial (Qiagen) in einer mit 100 ml Lysispuffer äquilibrierten Tröpfelsäule gereinigt. Nachdem die Säule mit 150 ml Lysispuffer, der mit 45 mm Imidazol versetzt war,

gewaschen wurde, wurden die Proteine in 3 x 1 ml Elutionspuffer (100 mm HEPES/NaOH, 100 mm NaCl, ph 7.2, 10% Glycerin, 230 mm Imidazol) eluiert. Bis zu 10 mg FDHH konnten aus 1 L Kulturvolumen gereinigt werden. Zur Proteinkonzentrationsbestimmung wurde der Bradford Proteinassay (Bio-Rad) bei 595 nmverwendet. In vitro FDHH Aktivitätstest. Die Enzymaktivität von FDHH wurde colorimetrisch als Formiatabhängige Reduktion von Benzylviologen (BV) bestimmt. 50-100 pmol FDHH wurden mit 50 mm Natriumformiat und 5 mm BV in Lysispuffer (siehe Reinigung von FDHH) unter anaeroben Bedingungen inkubiert. Die Reaktionsmischungen wurden in 500 µl verschließbare Quartzküvetten transferiert und die BV-Reduktion bei 578 nm mit einem Nanodrop-2000c (Thermo Scientific) aufgezeichnet. Um die Konzentration an durch die FDHH-Aktivität reduzierten BV zu bestimmen, wurde der Extinktionskoeffizient 11,000 M -1 cm-1 verwendet. [9] Aktivitätstests wurden vierfach wiederholt. Die spezifische Aktivität der BV-Reduktion durch FDHH wurde als nmol reduziertes BV pro 1 nmol FDHH pro Minute bei 20 C bestimmt. Western-Blot Analysen zur Expression von FDHH. fdhf 140NNN Varianten wurden in 25mL Kulturvolumen unter den zuvor beschriebenen Bedingungen exprimiert. 1 ml Proben wurden 2 Stunden nach Induktion mit 100µM IPTG entnommen. Nach der Zentrifugation wurden die Zellen in 1x SDS Ladepufferr (250 mm Tris/HCl ph 6.8, 40%v/v Glycerin, 10% w/v SDS, 0.05 % w/v Bromphenolblau, 5 % 2-Mercaptoethanol) aufgenommen und jeweils 10 µl pro Bahn auf ein SDS-Page-Gel aufgetragen. Der Blot wurde mit einer Trans-Blot SD Semi-Dry Western Transferapparatus (Biorad) durchgeführt. Anti-His-Antikörper (Ziege Anti-Kaninchen HRP) wurden von Invitrogen bezogen. Die Detektion von Chemilumineszenzsignalen erfolgtemit einem ChemiDoc TM MP System (Biorad). Produktion und Reinigung von rekombinanter humaner TrxR Varianten Produktion von TrxR. Die Varianten TrxR1 550UGA und Trx1 550UAC der humanen Thioredoxinreduktase wurden mit den Plasmiden prsf-[humtrxr 550UGA] und prsf- [humtrxr 550UAC] in E. coli MH5 in Gegenwart des Vektors pacyc-[e. coli sela+selb] und der komplementären pgfib-[trna Sec UCA] und pgfib-[trna Sec GUA] Konstrukte überproduziert. Ausgehend von einer Einzelkolonie nach der Plasmid-Transformation wurden die Zellen in 1L LB Selektionsmedium, welches 10µM Natriumselenit enhielt, bei 37 C kultiviert. Bei A600 = 1,2 wurde die Temperatur auf 20 C reduziert und die Proteinüberproduktion durch Zugabe von 100µM IPTG bei A600 = 1,5 induziert. Die Kultivierung wurde für 18 Stunden bei 20 C fortgesetzt. [8]

Reinigung von TrxR. Ausgehend von der Zellernete wurden alle Schritte unter anaeroben Bedingungen (90% N2, 5% H2, 5% CO2) in einem Anaerobenzelt (Coy Laboratories) durchgeführt. Nachdem die Zellen per Zentrifugation sedimentiert wurden, wurden sie in 25 ml Phosphatpuffer (100 mm Kaliumphosphat, ph 7.2, 10% Glycerinl) resuspendiert (Puffer wurden im Anaerobenzelt gelagert). Vor dem Aufschluss durch Ultraschall wurden die Zellen mit Lysozym (0.05 mg/ml) versetzt. TrxR aus dem nach erneuter Zentrifugation erhaltenen cytosolischen Extrakt wurde auf 1 ml Ni-NTA His-Tag Affinitätsmaterial (Qiagen) in einer mit 100 ml Phosphatpuffer äquilibrierten Tröpfelsäule gereinigt. Nachdem die Säule mit 150 ml Phosphatpuffer, der mit 45 mm Imidazol versetzt war, gewaschen wurde, wurden die Proteine in 3 x 1 ml Phosphatpuffer in Gegenwart von 230M Imidazol eluiert. Bis zu 2,5 mg TrxR1 konnten aus 1 L Kulturvolumen gereinigt werden. Zur Proteinkonzentrationsbestimmung wurde der Bradford Proteinassay (Bio-Rad) bei 595 nmverwendet. In vitro TrxR Aktivitätstest. Die Enzymatische Aktivität der TrxR Varianten wurde colorimetrisch als NADPH- und zeitabhängige Reduktion von Ellmansreagenz (5.5 -dithiobis(2-nitrobenzoic acid); DTNB). 5-10 pmol TrxR1 wurden mit 5 mm NADPH und 5 mm DTNB in Phosphatpuffer (siehe Reinigung von TrxR1) unter anaeroben Bedingungen inkubiert. Die Reaktionsmischung wurde in 500 µl verschließbare Quartzküvetten überführt und die DTNB- Reduktion bei 412 nm mit einem Nanodrop-2000c (Thermo Scientific) verfolgt. Die Reduktion von DTNB mit zwei Elektronen hat die Bildung von zwei Molekülen Nitrothiobenzoat (NTB) zu Folge. Um die Konzentration an NTB, das aufgrund von TrxR-Aktivität gebildet wurde, zu bestimmen, wurde ein Extinktionskoeffizient von 13,600 M -1 cm-1 in Übereinstimmung mit früheren Angaben verwendet. [10] Aktivitätstests wurden vierfach wiederholt. Die spezifische Aktivität der DTNB-Reduktion durch TrxR1 wurde als nmol reduziertem DTNB pro 1 nmol TrxR1 pro Minute bei 20 C bestimmt. Massenspektrometrische Analyse von E. coli FDHH und humaner TrxR Die Massenspektrometrische Untersuchung von gereinigten FDHH und TrxR Proben wurde am W. M. Keck Biotechnology Resource Laboratory der Yale Universität durchgeführt. Die Protein wurden zum Schutz der Selenolreste alkyliert, mit Trypsin und GluC verdaut und anschließend per LC-MS/MS auf einem XL-Orbitrap Massenspekrometer analysiert. ICP-MS spektroskopische Bestimmung von Se in FDHH und TrxR Variants Der Selengehalt gereinigter FDHH und TrxR Varianten wurde mittels induktiver gekoppelter (ICP) Massenspektrometrie bestimmt. Eine genau definierte Menge Protein (10µg) wurde in Teflonröhrchen für vier Stunden bei 95 C getrocknet und anschließende zweimal mit 200µL

reinem H2O2 und 800µL Salpetersäure (HNO3, 8N) bei 95 C über Nacht inkubiert. Anschließend, wurden die Proben in 5%iger Salpetersäure, welche 2ppb des Elements 115 Indium als internen Standard enthielt, resuspendiert. Zur Kalibrierung wurden BSA Proben, die genau definierte Mengen an Selenit (Na2SO3) enhielten, verwendet. Alle Proben wurden auf einem Element XR ICP-Spektrometer (Thermo Scientific) vermessen. Zur Datenanalyse wurde die Software Sequence Thermo Element ICP-MS/GD-MS 3.1 verwendet. Die Selenisotope 77 Se (exacte Masse 76,9194), 78 Se (77,9168) und 82 Se (81,9162) sowie der interne Standard 115 Indium (114,9033) wurden detektiert. Das Selenisotop 80 Se wurde nicht detektiert, da dessen Masse mit der des ionisierten Argon Trägergases interferiert (Ar2 + 79,896). Signale der Medium-Range (MR) und High-Range (HR) Bandweite wurden aufgezeichnet. Legende (Zusatzabbildungen) Abbildung S1. Western-Blot Analyse der Expression von fdhf 140NNN Konstrukten. Anti-His Western-Blots wurden mit cytosolischen Extrakten von E. coli MH5 nach 18 Stunden Expression der FDHH Varianten 140UGA, 140AGA, 140ACC, 140ACU, 140AGG, 140AGA, 140CGA, 140CUA, 140AUA, 140UAU, und 140UAC durchgeführt. Vollständiges FDHH (80.6kDa) und das frühzeitig an Position 140 abgebrochene Translationsprodukt (15.5kDa) sind markiert. Abbildung S2. Analyse von 64 verschiedenen, gereinigten, rekodierten FDHH 140NNN Varianten mittels SDS-Page. 64 fdhf 140NNN Konstrukte mit jeweils anderem Codon an Position 140 wurden in Gegenwart von trna Sec NNN mit dem komplemetären Anitcodon exprimiert. 10 µl von jeder FDHH Variante wurden auf einen SDS-Page Gel (4-20% Polyacrylaidgradient) aufgetrennt. Die Beschriftung NN/N,N,N,N beschreibt das Codon an Position 140. Die relative molekulare Masse der Proteine des Größenstandards ist angegeben. Abbildung S3. Identifikation von Sec an Position 140 für FDHH 140NNN Varianten mittels MS/MS. Informationen zur Identifikation der jeweiligen Peptide sind in Tabelle S2 zusammengefasst. Abbildung S4. Für die Rekodierung von Sense-Codons ist der vollstänige Sec- Translationsappart erforderlich. A) In vivo FDHH Aktivitätstest in E. coli MH5 Zellen, die mit den FDHH Varianten 140UGA (Reihe 1), 140UAU (Reihe 2) oder 140UAC (Reihe 3), SelA und SelB komplementiert wurden. Unterschiedliche Kombinationen wurden getestet: In Abwesenheit von trna Sec NNN und mit inaktiviertem SECIS (-/-, Spalte 1); ohne trna Sec NNN und mit intaktem SECIS (-/+, Spalte 2); mit überexpremierter trna Sec NNN und intaktem SECIS (+/+, Spalte 3); mit

überexpremierter trna Sec NNN und inaktiviertem SECIS (+/-, Spalte 4). B) Western-Blot (anti-his) mit cytosolischen Extrakten von E. coli MH5 Stämmen nach zweistündiger Expression von 6xHis-markierten FDHH Varianten. Die Proben 1-12 in A) entsprechen den Gelbahnen 1-12 in B). Vollständiges FDHH (80.6 kda) und vorzeitig in Position 140 terminiertes Translationsprodukt (15.5 kda) sind hervorgehoben. *Sec-Insertion bei Probe 2 in A) und Spur 2 in B) ist auf die genomische Kopie von Wildtyp trna Sec UCA in E. coli MH5 zurückzufühen. Abbildung S5. A) Das Diagramm zeigt die genomische Häufigkeit von Codons aufgetragen gegen deren Rekodierbarkeit. Die Effizienz der Umkodierung zu Sec (%) wurde für jedes Codon als spezifische Aktivität der jeweiligen FDHH 140NNN Varianten bestimmt und gegen die Häufigkeit (in absoluten Zahlen) jedes Codons im Genom von E. coli K12 aufgetragen. Der Stamm E. coli MH5, welcher in dieser Studie verwendet wurde, basiert auf dem E. coli Stamm BW25113, welcher wiederum auf E. coli K12 zurückgeht. Die Angaben zur genomischen Häufigkeit von Codons basieren auf der Codon Usage Database. [11] B) Das Diagramm zeigt die Häufigkeit von Aminoacyl-tRNA Spezies aufgetragen gegen die Rekodierbarkeit von Codons. Die Effizienz der Umkodierung zu Sec (%) wurde für jedes Codon als spezifische Aktivität der jeweiligen FDHH 140NNN Varianten bestimmt und gegen die Häufigkeit der entsprechenden Aminoacyl-tRNA-Isoakzeptorspezies in E. coli K12 (%)aufgetragen. Die Häufigkeit der Aminoacyl-tRNA-Isoakzeptoren wurde aus der absoluten Anzahl jeder trna pro E. coli Zelle [12] und deren jeweiligem Grad der Aminoacylierung während der logarithmischen Wachstumsphase berechnet. [13]

Zusätzliche Quellenangaben [1] K. E. Sandman, D. F. Tardiff, L. A. Neely, C. J. Noren, Nucleic Acids Res. 2003, 31, 2234-2241. [2] K. A. Datsenko, B. L. Wanner, Proc. Natl. Acad. Sci. USA 2000, 97, 6640-6645. [3] J. Yuan, S. Palioura, J. C. Salazar, D. Su, P. O'Donoghue, M. J. Hohn, A. M. Cardoso, W. B. Whitman, D. Söll, Proc. Natl. Acad. Sci. USA 2006, 103, 18923-18927. [4] J. Yuan, M. J. Hohn, R. L. Sherrer, S. Palioura, D. Su, D. Söll, FEBS Lett. 2010, 584, 2857-2861. [5] C. Aldag, M. J. Bröcker, M. J. Hohn, L. Prat, G. Hammond, A. Plummer, D. Söll, Angew. Chem. Int. Ed. 2013, 52, 1441-1445. [6] J. Xu, V. Croitoru, D. Rutishauser, Q. Cheng, E. S. Arnér, Nucleic Acids Res. 2013. [7] Y. Araiso, S. Palioura, R. Ishitani, R. L. Sherrer, P. O'Donoghue, J. Yuan, H. Oshikane, N. Domae, J. Defranco, D. Soll, O. Nureki, Nucleic Acids Res. 2008, 36, 1187-1199. [8] O. Rengby, L. Johansson, L. A. Carlson, E. Serini, A. Vlamis-Gardikas, P. Karsnas, E. S. Arner, Appl. Environ. Microbiol. 2004, 70, 5159-5167. [9] M. J. Axley, D. A. Grahame, T. C. Stadtman, J. Biol. Chem. 1990, 265, 18213-18218. [10] E. S. Arnér, A. Holmgren, Curr. Protoc. Toxicol. 2001, Chapter 7, Unit 7 4. [11] Y. Nakamura, T. Gojobori, T. Ikemura, Nucleic Acids Res. 2000, 28, 292. [12] H. Dong, L. Nilsson, C. G. Kurland, J. Mol. Biol. 1996, 260, 649-663. [13] K. A. Dittmar, M. A. Sorensen, J. Elf, M. Ehrenberg, T. Pan, EMBO Rep. 2005, 6, 151-157.

Tabelle S1. Spezifische Aktivitäten und Ausbeuten der rekodierten FDHH Varianten. FDH H Variante 140NNN Spezifische Aktivität [n nmol BV min -1 1nmol FDH H -1 ] 25 C, ph 7.2 Relative Aktivität [% von FDH H UGA140] Ausbeute [mg FDH H L -1 Kultur] Relative Ausbeute [n-fach von FDH H 140 UGA] UUU Phe 107,5 ±13,4 60 ±8 11,2 10,2 UUC Phe 84,5 ±19,0 47 ±11 10,5 9,5 UUA Leu 48,2 ±1,3 27 ±1 9,6 8,7 UUG Leu 112,0 ±19,4 70 ±11 13,1 11,9 UCU Ser 24,6 ±1,9 14 ±1 8,5 7,7 UCC Ser 21,3 ±1,4 12 ±1 9,4 8,5 UCA Ser 79,0 ±6,2 44 ±4 8,8 8,0 UCG Ser 85,8 ±5,3 48 ±3 5,2 4,7 UAU Tyr 153,8 ±8,2 86 ±5 10,3 9,4 UAC Tyr 179,7 ±10,1 100 ±6 10,9 9,9 UAA Stop ochre 184,5 ±15,5 103 ±9 1,3 1,2 UAG Stop amber 179,7 ±5,3 100 ±3 1,3 1,2 UGU Cys 164,0 ±27,8 91 ±16 12,4 11,3 UGC Cys 73,6 ±4,8 41 ±3 13,1 11,9 UGA Stop opal 179,7 ±0,9 100 ±1 1,1 1,0 UGG Trp 179,0 ±17,6 100 ±10 4,6 4,2 CUU Leu 91,7 ±5,7 51 ±4 10,5 9,5 CUC Leu 105,3 ±7,2 59 ±4 10,1 9,2 CUA Leu 25,1 ±8,5 14 ±5 10,4 9,5 CUG Leu 99,0 ±7,5 55 ±4 12,2 11,1 CCU Pro 170,4 ±9,3 95 ±5 9,9 9,0 CCC Pro n.d. n.d. 10,3 9,4 CCA Pro 51,4 ±3,4 29 ±2 10,6 9,6 CCG Pro 153,9 ±12,2 86 ±7 10,1 9,2 CAU His 46,9 ±4,0 26 ±2 9,7 8,8 CAC His n.d. n.d. 10,0 9,1 CAA Gln 67,2 ±3,7 37 ±2 9,8 8,9 CAG Gln 121,9 ±2,1 68 ±1 10,9 9,9 CGU Arg 59,8 ±4,8 33 ± 3 10,2 9,3

CGC Arg 44,3 ±3,0 25 ±2 0,5 0,5 CGA Arg n.d. n.d. n.d. n.d. CGG Arg 79,5 ±4,5 44 ±3 3,3 3,0 AUU Ile 129,0 ±4,0 72 ±2 8,1 7,4 AUC Ile 92,3 ±4,6 52 ±3 1,5 1,4 AUA Ile 177,3 ±14,2 99 ±8 10,2 9,3 AUG Met 72,3 ±9,8 40 ±5 12,8 11,6 ACU Thr 96,2 ±3,0 54 ±2 11,1 10,1 ACC Thr 163,5 ±14,2 91 ±8 8,9 8,1 ACA Thr 65,4 ±1,9 36 ±1 9,8 8,9 ACG Thr 169,0 ±19,4 94 ±11 13,8 12,5 AAU Asn 179,7 ±17,3 100 ±10 8,0 7,3 AAC Asn 62,9 ±7,0 35 ±4 11,2 10,1 AAA Lys 61,6 ±7,8 34 ±4 11,8 10,7 AAG Lys 169,8 ±10,7 95 ±6 10,9 9,9 AGU Ser n.d. n.d. 1,1 1,0 AGC Ser 46,2 ±2,6 26 ±1 7,1 6,4 AGA Arg 82,4 ±3,5 46 ±2 10,8 9,8 AGG Arg n.d. n.d. n.d. n.d. GUU Val 178,1 ±5,9 99 ±3 10,2 9,3 GUC Val 100,6 ±3,4 56 ±2 10,5 9,1 GUA Val 177,0 ±9,9 99 ±6 10,1 9,2 GUG Val 177,8 ±14,2 99 ±8 9,6 8,7 GCU Ala 175,7 ±10,6 98 ±6 9,7 8,8 GCC Ala 41,3 ±0,6 23 ±1 9,3 8,4 GCA Ala 48,5 ±4,2 27 ±2 10,5 9,5 GCG Ala 87,7 ±2,7 49 ±2 10,1 9,2 GAU Asp 93,8 ±5,9 52 ±3 2,1 1,9 GAC Asp 27,4 ±1,6 15 ±1 9,5 8,6 GAA Glu 62,7 ±2,1 35 ±1 9,9 9,0 GAG Glu 83,0 ±6,4 46 ±4 10,3 9,4 GGU Gly 45,8 ±1,9 26 ±1 6,2 5,6 GGC Gly n.d. n.d. 7,0 6,4

GGA Gly 39,7 ±1,4 22 ±1 5,4 4,9 GGG Gly 81,1 ±6,9 45 ±4 5,6 5,1 64 FDHH Varianten (jeweils von einem fdhf 140NNN-Konstrukt mit einem der 64 unterschiedlichen Codons an Position 140) wurden in Gegenwart der komplementären trna Sec NNN produziert und gereinigt und die Proteinausbeuten pro Liter Kulturvolumen und die spezifischen Sec-abhängigen BV-Reduktionsaktivitäten ermittelt. Die Experimente wurden in vierfacher Wiederholung durchgeführt und es wurde kein codonabhängier Effekt auf das Zellwachstum beobachtet. Spezifische Aktivität (Initiale Geschwindigkeit der B-Reduktion pro nmol FDHH) ist in absoluten Werten angegeben; Relative Aktivität (± Standard Abweichung) bezogen auf Wildtyp FDHH (produziert mit dem Konstrukt fdhf 140UGA und trna Sec UCA) dessen Aktivität als 100% definiert wurde; Relative Ausbeute bezieht sich auf n-fache Zunahmen/Abnahme im Vergleich zu Wildtyp fdhf 140UGA dessen Ausbeute als 1,0 definiert wurde; n.d., keine messbare Aktivität.

Tabelle S2A. Einteilung der Rekodierbarkeit von Codons basierend auf MS/MS Analysen. i) Peptid identifiziert mit Sec an Position 140 ii) Peptid identifiziert mit kanonischer AS an Position 140 iii) Peptide mit Sec und kanonischer AS an Position 140 iv) kein Peptid für Position 140 identifiziert Codon Codon AS in Codon Codon AS in Codon Codon AA in Codon Codon AS in kanonische MS/MS Bedeutung MS/MS Bedeutung MS/MS Bedeutung MS/MS Bedeutung n.d. stop opal UGA Sec Ser UCC Ser* Ser AGC Sec/Ser stop ochre UAA stop amber UAG Sec Cys UGC Cys* Glu GAA Sec/Glu Ser UCG n.d. Phe UUC Sec Pro CCC Pro Cys UGU n.d. Tyr UAC Sec His CAC His His CAU n.d. Trp UGG Sec Gln CAA Gln* Gln CAG n.d. Leu CUC Sec Ile AUU Ile* Ile AUA n.d. Pro CCU Sec Lys AAA Lys* Met AUG n.d. Thr ACC Sec Ala GCA Ala* Asn AAU n.d. Lys AAG Sec Gly GGC Gly Arg AGA n.d. Val GUU Sec Ala GCU n.d. Ala GCC Sec Asp GAU n.d. Glu GAG n.d. Gly GGG n.d. *Diese FDHH Varianten enthalten aufgrund von unvollständiger Rekodierung sowohl Sec als auch die entsprechende kanonische Aminosäure (Tabelle S1, Abbildungen 1 und 2); allerdings wurde das Sec-Peptid nicht per MS/MS detektiert. n.d. Für diese Peptide konnte das Peptid, welches Position 140 enthält, nicht per MS/MS detektiert werden.

Tabelle S2B. Liste alle Peptide für die FDHH Position 140 per MS/MS identifiziert wurde. FDH H140NNN Variante Peptidsequenz** Peptididentitätsindex ** Peptididentitäts- /Homologiechwelle stop opal UGA R.VCHGPSVAGLHQSVGNGAMSNAINEIDNTDLVFVFGYNPADSHPIVANHVINAK.R + Oxidation (M); SE_IAN_Cys (C) 17,51 12,92 stop amber UAG R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 23,87 13,91 Phe UUC R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 30,86 16,07 Ser UCC R.VSHGPSVAGLHQSVGNGAMSNAINE.I 73,34 16,35 Tyr UAC R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 35,37 13,50 Cys UGC R.VCHGPSVAGLHQSVGNGAMSNAINE.I 48,87 16,10 Trp UGG R.VCHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M); SE_IAN_Cys (C) 24,63 13,70 Leu CUC R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 32,00 13,11 Pro CCU R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 26,24 14,02 Pro CCC R.VPHGPSVAGLHQSVGNGAMSNAINE.I 46,58 16,60 His CAC R.VHHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M) 71,46 16,08 Gln CAA R.VNHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M) 25,02 16,06 Ile AUU R.VIHGPSVAGLHQSVGNGAMSNAINE.I 70,01 16,14 Thr ACC R.VCHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M); SE_IAN_Cys (C) 29,87 13,07 Lys AAA K.HGPSVAGLHQSVGNGAMSNAINEIDNTDLVFVFGYNPADSHPIVANHVINAK.R 66,60 16,05 Lys AAG R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 20,99 13,02 Ser AGC a) R.VSHGPSVAGLHQSVGNGAMSNAINE.I b) R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 55,66 23,08 16,03 16,03 Val GUU R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 27,69 13,27 Glu GAA a) R.VEHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M) b) R.VCHGPSVAGLHQSVGNGAMSNAINE.I + SE_IAN_Cys (C) 89,87 37,43 16,16 16,16 Ala GCC R.VCHGPSVAGLHQSVGNGAMSNAINE.I + Oxidation (M); SE_IAN_Cys (C) 33,68 16,94 Ala GCA R.VAHGPSVAGLHQSVGNGAMSNAINE.I 57,46 16,07 Gly GGC R.VGHGPSVAGLHQSVGNGAMSNAINE.I 61,73 16,15 Massenspektrometrische Charakterisierung von 35 FDHH 140NNN Varianten. Die FDHH Proben wurden alkyliert um den Selenolgruppe von Sec zu schützen, mit Trypsin und GluC verdaut und per LC-MS/MS mit einem XL-Orbitrap Massenspektrometer analysiert. A) Die FDHH ließen sich in vier Gruppen einteile: i) Varianten, die entweder ausschließlich Sec oder ii) ausschließlich eine kanonische Aminosäure oder iii) Sec und eine kanonische Aminosäure an

Position 140 enthielten wurden detektiert. iv) Varianten für welche per LC-MS/MS kein Peptid, das die Position 140 abdeckt detektiert wurde. Für alle dargestellten Proben wurde vollständiges FDHH gesichert nachgewiesen. B) Aminosäuresequenz der Peptide, welche Position 140 abdecken; sowohl der Peptididentitätsindex als auch die Peptididentitäts- /Homolgieschwelle sind eingetragen. Sec wurde mit Hilfe der MASCOT Software als Modifikation der kanonischen Aminosäure Cysteine identifiziert. Se_IAN_Cys; Selen Alkylierung von Cys (Se-CH2-CONH2). **Das Peptid, welches Position 140 mit dem höchsten Identitätsindex abdeckt, ist dargestellt.

Tabelle S3. Selen-Bestimmung per ICP-MS für FDHH und TrxR. Proteinprobe Protein (nmol) Selen (nmol) Sec-Einbau [%] FDH H UGA opal 6,427 6,426 99,9 FDH H UAU Tyr 7,529 5,971 79,3 FDH H UAC Tyr 7,503 7,375 98,3 FDH H CCU Pro 7,574 6,752 89,1 FDH H CCC Pro 9,047 0,013 1,4 FDH H ACG Thr 7,516 5,784 76,9 FDH H GUA Val 7,570 6,441 85,1 FDH H GUG Val 7,554 4,722 62,5 TrxR UGA opal 4,348 4,283 98,5 TrxR UAC Tyr 3,224 3,065 95,1 Der Sec-Einbau wurde aus dem Verhältnis des per ICP-MS quantifizierten Selens und der jeweiligen genauen Menge an Protein pro Probe ermittelt. Für die FDHH- und TrxR-Konstrukte ist das jeweilige mrna-codon an Position 140 bzw. 550 und dessen jeweilige kanonische Bedeutung angeben. Sec-Einbau von nahezu 100% zeigt die vollständige Rekodierung der ursprünglichen Bedeutung eines Codons zu Sec an. Die Messwerte befinden sich in Übereinstimmung mit den zuvor bestimmten spezifischen Aktivitäten (Tabelle S1, Abbildungen 2 und 3).