The beginning and the end of gene expression
Abstract
Summary of thesis:
Gene expression -- the synthesis of RNA and protein -- requires most of the cell's energy and is a highly regulated process at all its levels. In this thesis, regulation of gene expression has been studied at three different levels: transcription initiation, translation initiation, and RNA post-transcriptional processing.
The study of transcription initiation focuses on how the RNA polymerase (RNAP) takes the step from promoter binding to promoter escape. Before reaching promoter escape, RNAP may undergo abortive initiation, in which the nascent RNA transcript is released from RNAP. Using a thermodynamic model of transcription initiation, we have shown that the manner in which RNAP translocates during initial transcription explains the observed variation in promoter escape efficiency on the N25 promoter. The key variable for linking translocation of RNAP during initiation and promoter escape efficiency was the sequence of the RNA 3’ dinucleotide, and not the free energy of the DNA bubble which had been postulated by others. We continued with an investigation of the kinetics of initial transcription, where we combined two lines of separate experimental evidence (single-molecule and bulk transcription studies) to identify the rate constants for the key steps in initial transcription. This led to the finding that the speed of pause-free transcription during initiation is the same for initial transcription as reported for transcription elongation.
The study of translation initiation centered on the problem of expressing a human gene in E. coli, and specifically on the known bottleneck caused by the binding of the ribosome to a folded translation initiation region on messenger RNA. We introduced silent mutations in the interferon alpha gene predicted to reduce the free energy of RNA secondary structures at the ribosome binding site. This approach led to increased amount of gene transcript, indicating that translation initiation may regulate transcript stability of interferon alpha in an E. coli host.
The work on RNA processing covered the process of 3’ cleavage and polyadenylation of eukaryote RNAs. We analyzed RNA sequencing data to identify polyadenylation sites in transcripts from different cell compartments across 12 human cell lines. We found over 160.000 polyadenylation sites, 80% of which were previously not annotated. In addition we found an unexpected enrichment of polyadenylation sites in intronic regions of nuclear RNA. Norsk:
Genuttrykk, syntese av RNA og protein, krever mesteparten av cellens energi og er regulert på flere nivåer. I denne avhandlingen har vi undersøkt regulering av genuttrykk på tre av disse nivåene: initiering av transkripsjon, initiering av translasjon, og post-prosessering av RNA.
Studiet av initiering av transkripsjon har fokusert på hvordan RNA polymerase (RNAP) tar steget fra å være bundet til promoter til den river seg løs for å transkribere DNA-sekvensen nedstrøms (promoterunslippelse). Før RNAP unslipper promoteren kan den gjennomgå såkalt avbrytende initiering, der korte RNA sekvenser blir produsert gjentatte ganger uten at RNAP klarer å bryte løs fra promoteren. Ved å bruke en termodynamisk modell for translasjon har vi vist at forskjell i likevekt i translasjons-steget korrelerer med hvor effektivt RNAP klarer å unslippe promoteren. Den viktigste nye forklarende variabelen i denne modellen var dinukleotiden i 3’ enden til RNA, og ikke den frie energien til DNA boblen som tidligere har blitt foreslått. Vi har videre undersøkt initiell transkripsjon med en kinetisk modell, der vi har kombinert forskjellige eksperimentelle data for å finne rate-konstantene til reaksjonene som foregår i initiell transkripsjon. Vi fant derved at hastigheten på initiell transkripsjon (før promoterunslipping) er lik hastigheten etter initiell transkripsjon, til tross for at RNAP er bundet til promoter under initiell transkripsjon.
Studiet av initiell translasjon ble gjort i sammenheng med utfordringen som ligger i å uttrykke et humant gen i en vert, i dette tilfellet genet interferon alpha i E. coli. Spesifikt så vi på den delen av RNA der ribosomet binder seg for å initiere translasjon, og vi så på hvordan strukturen på RNA endrer seg med varierende gen-sekvens. Slik kunne vi velge ut gen-varianter som hadde mer eller mindre tendens til å ha en åpen RNA struktur rundt ribosomet sitt binde-sete. Eksperimenter med disse variantene viste at sekvenser med åpne strukturer førte til økt mengde transkript, som indikerer at initiering av translasjon kan regulere transkript-stabiliteten til interferon alpha uttrykt i E. coli.
Studiet av post-prosessering av RNA fokuserer på 3’ splitting og polyadenylering av eukaryot RNA. Vi analyserte RNA-seq data for å identifisere steder for polyadenylering i RNA fra forskjellige celle-kompartmenter i 12 humane celle-linjer. Vi fant over 160.000 steder for polyadenylering, derav var 80% ikke tidligere annotert. I tillegg fant vi en berikning i steder for polyadenylering i intron-sekvenser til nuklær RNA.