Vis enkel innførsel

dc.contributor.advisorAlmaas, Eivind
dc.contributor.advisorSchulz, Christian
dc.contributor.authorBråtelund, Signe
dc.date.accessioned2022-02-01T18:28:32Z
dc.date.available2022-02-01T18:28:32Z
dc.date.issued2021
dc.identifierno.ntnu:inspera:75551004:15993937
dc.identifier.urihttps://hdl.handle.net/11250/2976477
dc.description.abstractSystembiologi er et felt som har fått økende oppmerksomhet gjennom de siste to tiårene. Feltet baserer seg på en holistisk tilnærming, der komplekse biologiske systemer studeres i sin helhet i stedet for å reduseres til enkeltdeler. Dette er en interdisiplinær tilnærming som blant annet kombinerer biologi, statistikk og informatikk. Et viktig felt innen systembiologi er restriksjonsbasert modellering – en teknikk som nå er mye brukt innen medisin og bioteknologi. En populær type modell som brukes i restriksjonsbasert modellering er genomskala metabolske modeller (GEMer). GEMer er matematiske rekonstruksjoner av metabolske nettverk, der alle reaksjonene er basert på den studerte organismens genom. Alle reaksjoner og metabolitter er representert i et støkiometrisk rammeverk i en slik modell. Biomasseobjektivfunksjonen (BOF) er en viktig del av GEMer. Denne reaksjonen imiterer vekst ved å forbruke energi, makromolekylmonomerer og andre molekyler som utgjør biomassesammensetningen til en celle. Biomassegenerering, dvs. veksten til en organisme, er ikke bare en viktig del av resultatet i restriksjonsbasert analyse: maksimering av vekst anses å være det biologisk logiske målet, så en BOF brukes ofte som objektivfunksjon i restriksjonsbasert modellering. Støkiometrien til en BOF defineres av mengden av hver metabolitt som forbrukes i produksjonen av 1 g biomasse; dvs. alle stoffene en organisme trenger for å vokse. Dermed har BOFen stor innvirkning på prediksjonsresultater, noe som betyr at den bør være en mest mulig presis representasjon av biomassesammensetningen til den studerte organismen. På grunn av mangel på publikasjoner av den komplette biomassesammensetningen til organismer, importeres ofte BOFer fra tidligere GEMer, eller fra GEMer for beslektede organismer. Det er imidlertid store variasjoner i biomassesammensetning, selv mellom nært beslektede organismer, hvilket medfører unøyaktige prediksjoner i en GEM. En annen tilnærming som brukes mye i modellering er å basere innholdet av ulike deler av BOFen på ulike publikasjoner. For eksempel ved å importere proteininnhold og -sammensetning fra en proteomstudie og lipider fra en lipidomstudie. Selv om ulike studier skulle bruke samme stamme av organismen, vil det ofte være variasjoner i vekstbetingelser. Siden biomassesammensetning varierer betydelig med varierende vekstbetingelser, vil dette også resultere i potensielt unøyaktige prediksjoner. Hovedmålet med denne oppgaven er å konstruere vekstbetingelsesspesifikke biomasse-objektivfunksjoner for E. coli K-12 MG1655. For å gjøre dette, har vi dyrket E. coli under ulike kontrollerte vekstbetingelser og brukt et sett analytiske metoder til å måle hele den makromolekylære sammensetningen. Proteiner, karbohydrater, lipider, DNA og RNA er kvantifisert og vi har målt gjennomsnittlig 86 % av den totale biomassesammensetningen i alle kulturene. For proteiner og karbohydrater har vi også målt monomerfordelingen. På denne måten har vi oppnådd mer detaljerte målinger av karbohydrater enn tidligere publikasjoner. Videre, er målingene våre sammenlignbare med den biomassesammensetningen av E. coli i litteraturen som anses som gullstandard. Settet av eksperimentelle metoder er også testet på S. cerevisiae, S. salar og A. thaliana for å undersøke potensialet for å bruke metodene på andre organismer. Vi implementerte BOFene vi konstruerte for E. coli i modellen iML1515 – den ledende GEMen for E. coli K-12 MG1655. BOFen som var konstruert fra våre målinger av E. coli i eksponentiell vekst oppnådde 5 % mer nøyaktige prediksjoner enn en mer generell villtype BOF fra modellen. Simuleringer med de resterende BOFene ga biologisk rimelige prediksjoner for opptaksrater av begrensende næringsstoffer ved ulike vekstrater. Resultatene våre tilsier at prediksjonsnøyaktigheten til GEMer kan forbedres ved å direkte måle biomassesammensetningen til organismen som modelleres. Videre har vi vist at settet av metoder vi har foreslått er en enkel måte å bestemme biomassesammensetning for bruk i restriksjonsbasert modellering.
dc.description.abstractThe field of systems biology has enjoyed increasing popularity and recognition over the last two decades. The systems biology approach is holistic in that it studies complex biological systems, such as cells or organisms, as a whole instead of reduced to their isolated parts. This approach requires a multidisciplinary skill base including biology, informatics, and statistics. An important subfield of systems biology is constraint-based modelling, which has become a widely used research tool within medicine and biotechnology. A particularly important ingredient in constraint-based analysis is genome-scale metabolic models (GEMs). GEMs are mathematical reconstructions of metabolic networks where the presence of each metabolic reaction is based on the organism’s genome. All reactions and metabolites are represented in a stoichiometric framework. A key part of GEMs is the biomass objective function (BOF), which imitates biomass production by consuming energy, macromolecule monomers, and other molecules that make up the dry biomass composition of a cell. Biomass generation, i.e., the growth of an organism, is not just an important output in constraint-based analysis: growth maximisation is assumed to be the biologically logical goal, thus, the BOF is commonly used as the objective function. The stoichiometry of a BOF is defined by the amount of each metabolite that goes into 1 g of dry biomass, i.e., all compounds that the organism needs to grow. Consequently, the BOF has a great impact on prediction results and should therefore be an accurate representation of the biomass composition of the studied organism. Due to a lack of publications on complete molecular biomass compositions, BOFs are usually imported from previous GEMs or GEMs of related organisms. However, there can be a great variation in biomass composition, even between closely related organisms, which would cause inaccurate predictions in a GEM. Another approach commonly used in modelling is to base the content of various parts of the BOF on various publications. For example, by importing the protein content and composition from a proteomics study and the lipids from a lipidomics study. Even if the studies are using the same organism strain, an issue arising from this approach is that the growth conditions usually vary. As biomass composition also varies greatly between growth conditions for the same organism, this will also result in potential inaccuracies. The principal aim of this thesis is to construct condition-specific biomass objective functions for E. coli K-12 MG1655 based on experimental data. Consequently, we have grown E. coli under various controlled conditions and applied a set of analytical methods to measure the complete macromolecular composition. Proteins, carbohydrates, lipids, DNA, and RNA were quantified with an average total biomass recovery of 86 % for all cultures. The monomer distribution in proteins and carbohydrates was also measured directly achieving an increased resolution of carbohydrate monomers compared to what has been previously reported. Furthermore, our measurements are comparable to the gold-standard composition reported in literature for E. coli. The experimental pipeline was also applied to S. cerevisiae, S. salar, and A. thaliana to assess the potential for use on other organisms. The BOFs identified for E. coli were implemented to the iML1515 model – the leading GEM for E. coli K-12 MG1655. The BOF constructed from our measurements of E. coli growing exponentially had a 5 % increase in prediction accuracy compared to the more general wild-type BOF shipped with the model. Simulation of the remaining BOFs predicted biologically reasonable uptake rates of limiting nutrients at given growth rates. Our results show that there is a potential for increasing the prediction accuracy of GEMs by directly measuring the biomass composition of the modelled organism. Further, we show that the constructed measurement pipeline can easily be applied to determine such BOFs relevant for GEMs.  
dc.languageeng
dc.publisherNTNU
dc.titleMeasuring the Biomass Composition of Escherichia coli for Computational Applications
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail
Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel