Vis enkel innførsel

dc.contributor.advisorAlmaas, Eivind
dc.contributor.advisorVadstein, Olav
dc.contributor.advisorHall, Martina
dc.contributor.authorPettersen, Jakob Peder
dc.date.accessioned2023-06-08T12:37:59Z
dc.date.available2023-06-08T12:37:59Z
dc.date.issued2023
dc.identifier.isbn978-82-326-7111-3
dc.identifier.issn2703-8084
dc.identifier.urihttps://hdl.handle.net/11250/3070577
dc.description.abstractRecent advances in technology has enabled scientists to extract large amounts of data from biological experiments. Due to the scale of the data, computational analyses are required in order to arrive at meaningful interpretations of the biological system in question. In these kind of analyses, networks play an important role as they represent the entities in question and the relations between them. We will focus on three different applications of biological networks, each addressing challenges relevant to society. Aquaculture is considered to be part of the solution to feed a growing world population. As a part of this strategy, species such as cod, turbot and lobster have been considered and tried out for commercial production. However, these species have proven to be difficult to raise, in large part due to high mortality at the larva stage. This high mortality is suggested to be due to detrimental interactions between the fish larva and their surrounding microbes. We therefore study the interplay between microbes in an artificial seawater environment by constructing co-occurrence networks. From this analysis, we observe that bacteria occur together due to similar habitat preferences rather than directly having any effect on each other. Diseases such as allergy, cancer and autoimmune disorders often arise through complex interactions between the genetics of the patient and external environmental factors. In many cases, imbalances in gene regulation lead to disease progression. In order to study and obtain a better understanding of this process, we can apply differential gene co-expression networks which compare the gene expression between sick patients and healthy controls. We introduce csdR, an R package written to construct differential gene co-expression networks in a user friendly manner. We show that csdR is far better in terms of computational performance than existing implementations. Climate change has made summers in wine producing regions sunnier and warmer, resulting in more sugar in the grapes. This increased sugar concentration ultimately leads to higher alcohol content in the wine. We wish to counteract this alcohol increase and still preserve the sensory properties of high-quality wines. In order to predict how the yeasts convert grape must into wine, we create and apply genome-scale metabolic models (GEMs) which are network representations of the organism's metabolic reactions. We study a model which can predict the temperature effect on the metabolic behavior of yeast. This model needs experimental data in order to work. We show that the existing approach for incorporating the experimental data, fails to report that the data is insufficient for fitting the model and underestimates the uncertainty of the predictions. Therefore, we create a better approach for fitting the model which clearly shows the insufficiency of the existing training data. It has been suggested to use alternative yeasts other than the canonical wine yeast Saccharomyces cerevisiae, in order to reduce the alcohol content in wine. We therefore create GEMs of five non-Saccharomyces yeasts and simulate their wine brewing behavior. From the simulations, we predict that the yeast Metschnikowia pulcherrima can utilize the sugars in the must more efficiently due to a reaction the other yeasts do not have. This can be an explanation of previous experimental reports suggesting M. pulcherrima as a good candidate for brewing wine with reduced alcohol content. As a recurring trend throughout our research, we notice that the supply of high quality experimental data is the main limitation. We therefore encourage continued efforts and collaboration into production and management of large-scale biological data. Sammendrag: Teknologiske nyvinninger har gjort det mulig for forskere å hente store datamengder fra biologiske eksperimenter. Datamengdene er for store til at de kan behandles og tolkes manuelt, så det må brukes beregningskrevende analyser for å komme fram til nyttige svar. Til dette kan vi bruke nettverk som representerer de delene av systemet vi er interessert i, og relasjonene mellom dem. Vi vil fokusere på tre forskjellige bruksområder av biologiske nettverk og se på hvordan disse kan brukes til å løse samtidens utfordringer. For å skaffe mat til en økende verdensbefolkning, bør nye matkilder tas i bruk. Oppdrett av nye arter som torsk, kveite og hummer har blitt foreslått og prøvd ut for matproduksjon. Dessverre har dette vist seg vanskelig å få lønnsomt, blant annet på grunn av høy dødelighet i larvestadiet. Det har blitt foreslått at denne høye dødeligheten kan skyldes at et dårlig mikrobielt miljø rundt fisken bidrar til stress og sykdom. Derfor har vi valgt å studere samspillet mellom bakterier i et kunstig havmiljø ved å representere bakteriene i et nettverk basert på deres tilstedeværelse. Fra disse analysene finner vi at bakterier opptrer samtidig på grunn av felles miljøpreferanser i stedet for å ha en direkte effekt på hverandre. Sykdommer som allergi, kreft and autoimmune lidelser er ofte et resultat av et komplisert samspill mellom pasientens genetikk og ytre miljøfaktorer. I slike prosesser er det vanlig at svikt i genregulering bidrar til sykdomsutviklingen. For å få et bedre bilde av denne prosessen, kan vi bruke differensielle gen-koekspresjonsnettverk som sammenlikner genuttrykket mellom syke pasienter og friske kontrollpersoner. Vi introduserer csdR som er en R-pakke skrevet for å lage gen-koekspresjonsnettverk. Programvarepakken er skrevet for å være brukervennlig, og vi viser at den har langt bedre ytelse enn eksisterende implementasjoner. Som en følge av klimaendringer i vinproduserende områder har somrene blitt varmere og mer solfylte. Dette har i sin tur medført høyre innhold av sukker i druene som til slutt medfører høyere alkoholinnhold i ferdig vin. Vi ønsker å motvirke denne økningen i alkoholinnhold, samtidig som vinen holder høy smaksmessig kvalitet. For å forutse hvordan gjær konverterer druemost til vin, kan vi bruke genom-skala metabolske modeller (GEMer) som representerer organismens metabolske reaksjoner i et nettverk. Vi studerer en modell som kan forutsi metabolsk aktivitet under varierende temperatur. For at modellen skal fungerer, trenger den kalibrering fra eksperimentelle data. Vi viser at den eksisterende metoden for å tilpasse modellen ikke er i stand til å vise at de eksperimentelle dataene er utilstrekkelige og feilaktig undervurderer usikkerheten i resultatene. Vi introduserer derfor en forbedret metode for å tilpasse modellen, og denne metoden viser klart at de eksperimentelle dataene ikke er omfattende nok for å gi pålitelige predikasjoner. Bruk av alternative gjærstammer utenom den vanlige vingjæren Saccharomyces cerevisiae, har blitt foreslått som en løsning for å redusere alkoholinnholdet i vin. Derfor lager vi GEMer av fem forskjellige ikke-Saccharomyces gjær for å simulere deres egenskaper i å brygge vin. Fra disse simuleringene, forutser vi at gjærarten Metschnikowia pulcherrima kan utnytte sukkeret i druemosten mer effektivt enn de andre gjærstammene. Ifølge modellene er hovedgrunnen til dette at M. pulcherrima har en metabolsk reaksjon som ikke er i de andre gjærstammene. Denne observasjonen kan forklare hvorfor tidligere eksperimentelle rapporter har utpekt M. pulcherrima som en god kandidat for å brygge vin med redusert alkoholinnhold. Gjennomgående observerer vi at den største hindringen for å lage gode nettverksmodeller er tilgang til forsøksdata av høy kvalitet. Vi mener derfor at innsatsen og samarbeidet om innhenting and behandling av storskala biologiske data bør styrkes.en_US
dc.language.isoengen_US
dc.publisherNTNUen_US
dc.relation.ispartofseriesDoctoral theses at NTNU;2023:205
dc.relation.haspartPaper 1: Pettersen, Jakob Peder; Gundersen, Madeleine S.; Almaas, Eivind. Robust bacterial co-occurence community structures are independent of r- and K-selection history. Scientific Reports 2021 ;Volum 11 https://doi.org/10.1038/s41598-021-03018-z This article is licensed under a Creative Commons Attribution 4.0 International License (CC BY 4.0)en_US
dc.relation.haspartPaper 2: Pettersen, Jakob Peder; Almaas, Eivind. csdR, an R package for differential co-expression analysis. BMC Bioinformatics 2022 ;Volum 23. https://doi.org/10.1186/s12859-022-04605-1 This article is licensed under a Creative Commons Attribution 4.0 International License (CC BY 4.0)en_US
dc.relation.haspartPaper 3: Pettersen, Jakob Peder; Almaas, Eivind. Parameter inference for enzyme and temperature constrained genome-scale models. - the final published version is available in Scientific Reports 2023 ;Volum 13.(1) https://doi.org/10.1038/s41598-023-32982-x This article is licensed under a Creative Commons Attribution 4.0 International License (CC BY 4.0)en_US
dc.relation.haspartPaper 4: Pettersen, Jakob Peder; Castillo, Sandra; Jouhten, Paula; Almaas, Eivind. Genome-scale metabolic models reveal determinants of phenotypic differences in non-Saccharomyces yeasts https://doi.org/10.1101/2023.05.09.539830 The copyright holder for this preprint is the author/funder, who has granted bioRxiv a license to display the preprint in perpetuity. It is made available under a CC-BY-NC-ND 4.0 International license.en_US
dc.titleIntegrating large-scale data for biological network construction and analysisen_US
dc.typeDoctoral thesisen_US
dc.subject.nsiVDP::Technology: 500::Food science and technology: 600en_US


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel