Vis enkel innførsel

dc.contributor.advisorAlmaas, Eivind
dc.contributor.advisorSimensen, Vetle
dc.contributor.authorMonsson, Helge
dc.date.accessioned2023-11-08T18:19:52Z
dc.date.available2023-11-08T18:19:52Z
dc.date.issued2023
dc.identifierno.ntnu:inspera:140106117:37062570
dc.identifier.urihttps://hdl.handle.net/11250/3101514
dc.description.abstractInnhentning av biologiske data i form av store datasett har vore eit mål i biologifeltet de siste tiårene. Disse datasetta er store og komplekse, grunnet ma˚ten biologiske system har utviklet seg. Eit felt som søker å gjøre disse datasetta klarere og meir forståeleg er systembiologi. Det bruker ein heilskapeleg tilnærming av tilnærming av biologiske prosesser og forstår dem som samankobla system. Ein av underfelta til systembiologi er feltet for genomskala metabolsk modelering, som utnytter nettverksanalyse i kombinasjon med genomdata for å utvikle modeller for å kartlegge metabolismen til celler. Disse modellene, kjent som Genomskala Metabolske Modeller (GEMs), representerer spesifikke celler og er i stand til å predikere aktiviteten til metabolismen i cellen. Disse prediksjonene kalles for metabolske fluksfordelinger, der fluks er ein verdi som representerer den metabolkse strømmen igjennom ein reaksjon. Den beregner disse fluksprediksjonene ved å bruke fluksbalanse analyse (FBA) i kombinasjon med ein pseudoreaksjon som representerer cellens forbruk av metabolitter for vekst. Denne pseudoreaksjonen er biomasseobjektiv funksjonen (BOF). Skjønt BOF-ene til disse modelene er ofte statiske og endrer seg ikkje med faktorer som miljø og vekstrate. Dette er ein antagelse som ikkje gjenspeiler verkelegheiten. Eit tidligere studie har blitt gjort der de undersøkte om usikkerhet i den antatte biomasse komposisjonen hadde invirkning på fluksprediksjonene. Dette studiet vart derimot utført på ein model som er naturleg robust og derfor sannsynlegvis undervurderte effekten av usikkerhetsinjeksjonen. Den nåverende studien gjennomførte ein lignende analyse på ein meir begrensa modell med mindre robusthet, i form av eciML1515 til E. coli. Videre så implementerte den vekstrate spesifikke BOF-er for iML1515, basert på eksperimentell data, for å undersøke om nøyaktigheten til modellen auker med ein meir spesifikk BOF. Resultata til denne analysen fant at eciML1515 hadde ein høg grad av usikkerhetsspredning fra biomassekomposisjonen til biomasseproduksjon og visse metabolske reaksjonsveier. Begge modellene visste robusthet, men standard GEM hadde langt høgere grad av robusthet samanligna med ecIML1515 modellen. Disse resultata støtter ideen om at meir begrensa modeller, samanligna med standard GEMs, vil sannsynligvis være meir påverka av endringer i biomassekomposisjonen. Når det gjeld dei vekstrate spesifikke BOF-ene, så viste de generell forbedringer i nøyaktigheten til fluksprediksjonene for de fleste datasetta. Unntaket var for datasetta som tilhørte acetate, glukose og gluconate som kilde til karbon. Det var forventa at standard BOF-en skulle vise meir nøyaktig fluksprediksjon for glukose som karbon kilde da denne BOF-en er basert på data fra ein E. coli som brukte glukose som karbon kilde. Oppsummert, så konkluderer dette studiet med at usikkerhetsspredning for fluksprediksjoner vil mest sannsynleg auke jo meir begrensa modellene er. Dette kan derimot gjørast opp for med å implementere meir spesifikke BOF-er som bedre representerer biomasse komposisjo- nen under spesifikke forhold. Meir forskning burde utførast på faktorer som kan implementerast i GEMs, i tillegg til eit nærare studie på korleis biomasse komposisjonen påverkar fluksprediksjoner, med fokus på spesifikke reaksjonsveier i metabolismen.
dc.description.abstractThe collection of biological data in the form of large data sets has been an undertaking in the field of biology for the last few decades. Due to the nature of biological systems these data sets are large and complex. A field that seeks to make this data clearer and more understand- able is the field of systems biology, which utilises a holistic approach to biological processes, understanding them as interconnected systems. One of the sub-fields of systems biology is the field of genome scale metabolic modelling, which utilises network analysis in combination with genomic data in order to develop models for understanding the metabolism of cells. These mod- els, known as Genome Scale Metabolic Models (GEMs), are representative of specific cells and are capable of predicting the activity of pathways in the metabolic network of the cell. These predictions are known as metabolic flux distributions, where flux is a value representing the metabolic flow through a reaction. It calculates these flux predictions by utilising flux balance analysis (FBA) in conjunction with a pseudo-reaction that represents the cells consumption of metabolites for growth. This pseudo-reaction is the biomass objective function (BOF). However, the BOFs for the models are usually made to be static and unchanging with factors like growth rate and environment. This is an assumption that crucially does not reflect reality. A previous study researched how uncertainty in the biomass composition would impact the predicted flux distributions. However, this study was performed on a model that is naturally robust and therefore is likely to underestimate the impact of the uncertainty injections. The current study performed a similar analysis on a more restricted model with a lower degree of robustness, namely the eciML1515 model of E. coli. It then implemented growth rate-specific BOFs for the iML1515, based on experimental data sets, in order to study if the accuracy of the model increases with a more condition-dependent BOF. Results found that the eciML1515 displayed generally high degrees of propagation of uncertainty from the biomass composition to the biomass production, as well as some central metabolic pathways. While both models dis- played a level of robustness, the standard GEM was far more robust then the eciML1515 model. These results support the idea that more constrained models, compared to the standard GEMs, are likely to be more impacted by perturbations and alterations of the biomass composition. As for the growth rate-specific BOFs, they displayed a general improvement of accuracy on the flux distribution predictions for most of the experimental data sets. The exception to this was for the data sets corresponding to acetate, glucose and gluconate as carbon sources. For glucose this result was expected, as the standard BOF is based on specific data gathered from E. coli grown on glucose. In conclusion, this study finds that the uncertainty propagation of the models predicted flux distributions is very likely to increase the more restricted the models are. However, by imple- menting condition-specific BOFs and accounting for some of the variations caused by environ- ments and growth rate, the accuracy of GEMs can increase. More research should be done into environmental and conditional factors that can be accounted for in GEMs, as well as a closer study on how the biomass composition can impact flux distributions, focusing on specific path- ways in the metabolic network.
dc.languageeng
dc.publisherNTNU
dc.titleA Novel Approach to Address Uncertainty Propagation and Improve Biomass Composition Representation for Genome Scale Metabolic Modelling
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel