Vis enkel innførsel

dc.contributor.advisorMachado, Daniel
dc.contributor.advisorMárquez-Zavala, Elisa
dc.contributor.authorRøed, Elin Sandertun
dc.date.accessioned2023-07-12T17:21:08Z
dc.date.available2023-07-12T17:21:08Z
dc.date.issued2023
dc.identifierno.ntnu:inspera:138733117:46085520
dc.identifier.urihttps://hdl.handle.net/11250/3078441
dc.description.abstractCeller administrerer et ubegripelig antall reaksjonsveier og reaksjoner for å holde seg i live. For å sikre korrekt produksjon av reaktanter for de aktuelle forholdene er cellen avhengig av å regulere proteinaktivitet. Denne reguleringen utføres ofte transkripsjonelt, der aktiviteten til proteinet bestemmes av dets konsentrasjon som er kontrollert av hastigheten på genuttrykk. Imidlertid eksisterer det også flere posttranskripsjonelle reguleringsmåter, inkludert en mekanisme kalt allosterisk regulering. Allosterisk regulering er den reversible interaksjonen mellom et protein og en metabolitt som induserer et skifte i proteinets aktivitet. Dette skiftet er resultatet av en endret proteinaffinitet for et annet molekyl som forårsakes av konformasjonsendringer etter binding av metabolitten, ofte kalt effektormolekylet, til det allosteriske setet. Mens mekanismene for transkripsjonell regulering er grundig undersøkt og dokumentert, er tilfellet med allosterisk regulering noe annerledes. Historisk sett har posttranskripsjonell regulering blitt ansett som mindre viktig i proteinaktivitetmodulering. Dette er representert i den mangelfulle dokumentasjonen av allosterisk regulering, og i mangelen på en etablert, systematisk tilnærming til å studere slike interaksjoner. Til tross for økt utvikling av molekylærbiologiske verktøy, er det å oppdage allosteriske interaksjoner typisk svært arbeids- og ressurskrevende ved at det krever betydelige mengder tid, utstyr og tidligere kunnskap. Protein-metabolitt interaksjoner har imidlertid nylig blitt ansett som essensielle metabolske reguleringsmekanismer, noe som har motivert forskningsmiljøet til å finne mer hensiktsmessige og effektive måter å studere dette fenomenet på. I denne sammenhengen er bruken av beregningskraft for å avdekke hemmelighetene til det enorme interaksjonsomfanget spesielt tiltalende. Målet med denne oppgaven er å evaluere potensialet for å forutse allosteriske interaksjoner fra genomsekvenser, som representert ved sekvensen og strukturen til proteiner. For å oppnå dette målet ble data om proteinaktiverende og -hemmende metabolske interaksjoner hentet fra databasen BRENDA og satt sammen til et standardisert datasett. Dette datsettet består av 32 535 organismespesifikke interaksjoner mellom 3 097 proteiner og 1 002 metabolitter, og viser en trend av partisk regulering mot sentrale reaksjonsveier i karbonmetabolismen. Annotering av populære interaksjoner til et fylogenetisk tre avslørte både en taksonomisk bevaring og manglende dokumentasjon av allosterisk regulering. For å forutse interaksjoner fra proteinstruktur ble data om sekvensensielle og strukturelle trekk annotert til proteinene i databasen lastet ned. Disse trekkene inkluderte åtte forskjellige proteinklassifiserere: aktive seter, bindingsseter, konserverte seter, domener, familier, homologe superfamilier, PTMer, og repetisjoner. Disse proteintrekkene ble assosiert med interaksjonene i den sammensatte databasen, og assosiasjoner ble ytterligere kvantifisert via Fishers eksakte tester der en odds-ratio på 10 og justert p-verdi mindre enn 0,05 ble brukt som signifikante terskelverdier. Anrikningsanalysen identifiserte totalt 32 276 statistisk signifikante assosiasjoner. Familie og domene var de proteintrekkene som ble funnet til å være viktigst for å forutse metabolitt interaksjoner, og undersøkelse av en undergruppe av de sterkt og ekslusivt assosierte trekkene og interaksjonene viste at analysen identifiserte flere biologisk relevante forbindelser. Utvidelse av det fylogenetiske treet med foreslåtte interaksjoner bekreftet ytterligere gyldigheten av tilnærmingen, men forårsaket også identifiseringen av noen få falske positive konklusjoner. Til tross for denne unøyaktigheten ble målet med prosjektet oppnådd: assosiasjonen av proteintrekk med metabolitt interaksjoner viser at proteinsekvens og struktur, og dermed genomsekvens, har potensial som base for å forutse allosteriske interaksjoner.
dc.description.abstractCells orchestrate an incomprehensible number of pathways and reactions to stay alive. In order to ensure the correct production of reactants for the current conditions, the cell is dependent on protein-activity regulation. This regulation is often conducted transcriptionally, in which the activity of the protein is determined by its abundance as set by the rate of gene expression. However, there also exist several posttranscriptional modes of regulation, including a mechanism named allostery. Allosteric regulation is the reversible interaction between a protein and a metabolite which induces a shift in the protein's activity. This shift is the result of an altered affinity of the protein for another molecule caused by conformational changes following binding of the metabolite, often termed the effector molecule, to the allosteric site. While the mechanisms of transcriptional regulation are thoroughly researched and documented, the case of allostery is somewhat different. Historically, posttranscriptional regulation has been considered less important in the grand scheme of protein-activity modulation. This is represented in the poor documentation of allostery, and in the lack of an established, systematic approach to study and detect such interactions. Despite the increased development of molecular biology tools, discovering allosteric interactions is typically very laborious and resource-demanding work, requiring substantial amounts of time, equipment, and previous knowledge. The recent increased understanding of protein-metabolite interactions as essential modes of metabolic regulation has, however, motivated the research community to find more appropriate, efficient ways of studying this phenomenon. In this context, the use of computational power to uncover the secrets of the immense interaction space is especially appealing. The aim of this thesis is to evaluate the potential of predicting allosteric interactions from genome sequences, as represented by the sequence and structure of proteins. To achieve this aim, data on protein-activating and -inhibiting metabolic interactions was retrieved from the BRENDA database and assembled into a standardized dataset. This dataset consists of 32 535 organism-specific interactions among 3 097 proteins and 1 002 metabolites, and displays a trend of biased regulation towards central pathways of carbon metabolism. Annotation of common interactions to a phylogenetic tree revealed both a taxonomy-wise conservation and lacking documentation of allostery. In order to predict interactions from protein structure, data on protein sequence and structural features annotated to the proteins of the assembled database were downloaded. These features included eight different protein classifiers: active sites, binding sites, conserved sites, domains, families, homologous superfamilies, PTMs, and repeats. The protein features were associated with the interactions of the assembled database, and associations were further quantified through Fisher's exact tests using an odds ratio of 10 and an adjusted p-value less than 0.05 as the significant threshold values. The enrichment analysis identified in total 32 276 statistically significant associations. The feature types family and domain were found to be most important for the prediction of metabolite-interactions, and assessing a subgroup of the highly and exclusively associated features and interactions revealed that the approach identified several biologically justifiable connections. Extending the phylogenetic tree with predicted interactions further confirmed the validity of the approach, but also caused the identification of a few false-positive predictions. Despite this inaccuracy, the aim of the thesis was achieved: association of protein features with metabolite-interactions demonstrates that protein sequence and structure, and thereby genome sequence, has the potential for being used as a predictor of allosteric interactions.
dc.languageeng
dc.publisherNTNU
dc.titlePredicting Allosteric Regulation at Genome Scale
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel