Vis enkel innførsel

dc.contributor.advisorAlmaas, Eivind
dc.contributor.advisorSulheim, Snorre
dc.contributor.authorFossheim, Fredrik Aunaas
dc.date.accessioned2021-09-25T16:10:05Z
dc.date.available2021-09-25T16:10:05Z
dc.date.issued2020
dc.identifierno.ntnu:inspera:56744382:23868286
dc.identifier.urihttps://hdl.handle.net/11250/2782574
dc.description.abstractVi har i dette arbeidet utviklet og implementert en algoritme som konverterer informasjon om predikerte biosyntetiske genklustere (BGC'er) som gitt av antiSMASH til metabolske reaksjonsveier for bruk i genomskalamodeller (GEM'er). Nøyaktigheten til algoritmen blir evaluert gjennom en detaljert sammenligning med eksperimentelt bestemte metabolske reaksjonsveier for åtte BGCer. Vi rapporterer 82 % gjennomsnittlig nøyaktighet for PKS - og NRPS-domener generelt, som følge av 78% nøyaktighet i substratspesifisitet for forlenger-enheter, og 84 % nøyaktighet for kofaktorassosierte reaksjoner. Med denne algoritmen har vi også konstruert metabolske veier for alle T1PKS, transAT-PKS og NRPS BGCer som finnes i MIBiG-databasen. Basert på smCOG-definisjoner, var vi i stand til å forutsi syntese av den uvanlige forlenger-enheten metoksymalonyl-ACP. Fra andre smCOG-definisjoner ble det etablert en sammenheng mellom antall påviste glykosyltransferaser i en BGC, og antallet glykosylgrupper som deltok i den metabolske reaksjonsveien til sekundærmetabolitten. To andre tilleggsreaksjoner kunne også forutses på samme vis. For tilleggsreaksjoner som ikke er inkludert i de konstruerte metabolske reaksjonsveiene, prøver vi å belyse konsekvensen av dette. Vi diskuterer også de forskjellige hindringene man står overfor når man prøver å konstruere metabolske reaksjonsveier fra BGCer, samt utfordringer man møter ved modellering av sekundærmetabolisme generelt. Vi avslutter med å foreslå at SubClusterBLAST-funksjonaliteten til antiSMASH utvides til å omfatte ytterligere kjente tilleggsreaksjoner som finnes for PKS/NRPS. I tillegg foreslår vi å oppdatere databasene som brukes til prediksjon av NRPS/PKS modulspesifisitet, slik at prediksjonene som antiSMASH gir - og dermed de metabolske reaksjonsveiene som algoritmen produserer - blir mer tro til sine reelle motparter. Prosjektet er tilgjengelig fra: https://github.com/FredrikFossheim/MasterThesis
dc.description.abstract\noindent We have in this work developed, and implemented, an algorithm that converts information about predicted biosynthetic gene clusters (BGCs) as provided by antiSMASH into metabolic pathways for use in genome-scale metabolic models (GEMs). The accuracy of the algorithm is evaluated through a detailed comparison with experimentally determined pathways for eight BGCs. We report an overall 82% average accuracy for polyketide synthase (PKS) and nonribosomal peptide synthase (NRPS) domains in general, resulting from a 78 % accuracy in substrate specificity for extender units, and 84% accuracy for cofactor-associated reactions. With this algorithm, we have also constructed metabolic pathways for all T1PKS, transAT-PKS and NRPS BGCs that exist in the MIBiG database. Based on smCOG definitions, we were able to predict the synthesis of the uncommon extender unit methoxymalonyl-ACP. From other smCOG definitions, there was also established a relationship between the number of detected glycosyltransferases in a BGC, and the number of glycosyl groups that took part in the metabolic pathway of the secondary metabolite. Two other tailoring reactions were found to be predictable by the same means. For tailoring reactions that are not included in the constructed metabolic pathways, we attempt to elucidate the consequence of these. We also discuss the different obstacles one faces when attempting to construct metabolic pathways from BGCs, as well as those of modeling secondary metabolism in general. We end by suggesting that the SubClusterBLAST functionality of antiSMASH is expanded to include additional known tailoring reactions that are found for PKS/NRPS. In addition, we suggest updating the databases used for prediction of NRPS/PKS module specificity so that the predictions that antiSMASH makes - and in turn the metabolic pathways that the algorithm produces - are more true to their real life counterparts. The project is available from https://github.com/FredrikFossheim/MasterThesis
dc.language
dc.publisherNTNU
dc.titleConstructing Metabolic Pathways from Identified Biosynthetic Gene Clusters
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel