Show simple item record

dc.contributor.advisorGrasmair, Markus
dc.contributor.advisorNaumova, Valeriya
dc.contributor.authorStapnes, Mikal
dc.date.accessioned2021-09-15T17:25:58Z
dc.date.available2021-09-15T17:25:58Z
dc.date.issued2020
dc.identifierno.ntnu:inspera:55607230:9434238
dc.identifier.urihttps://hdl.handle.net/11250/2778338
dc.description.abstractEn av hundre norske kvinner kommer til å utvikle livmorhalskreft innen en alder av 75. Kreften er den tredje mest hyppige blant kvinner i alderen 25 til 49. De nordiske screeningprogramme for livmorhalskreft har en påvist effekt for å redusere forekomst og dødelighet av sykdommen. Likevel forblir det en utfordring å minimere underbehandling og overscreening. I denne oppgaven anser vi prediksjon av livmorhalskreft som et prognoseproblem. Vi oversetter en enkelt kvinnes screeninghistorikk til en glissen vektor og bruker denne som regressor for å predikere kvinnens fremtidige utvikling. Det resulterende datagrunnlaget er glissent, ujevnt observert og skjevfordelt. For å håndtere disse problemene implementerer vi toppmoderne metoder innen matrisefaktorisering. Vi validerer metoden på syntetiske data og kommenterer kritiske utfordringer knyttet til vår tilnærming. Til slutt bruker vi prediksjonsmodellene til å forutsi livmorhalskreft i data fra Kreftregisteret. Algoritmen identifiserer kvinner med økt risiko for sykdommen og oppnår en AUC på 0.78. Til slutt foreslår vi potensielle videre utviklinger av prosjektet.
dc.description.abstractOne percent of all Norwegian women will develop cervical cancer by the age of 75. It is the third most common cancer in women of ages 25 to 49. While the Nordic mass-screening programs for cervical cancer have a proven effect in reducing the incidence and mortality of the disease, it remains a challenge to minimize under-treatment and over-screening. In this thesis, we consider the early prediction of cervical cancer as a forecasting problem where the screening history of a single female is encoded as a sparse vector and used as a regressor. As the data is sparse, irregular, and heavily skewed, we employ state-of-the-art matrix factorization techniques along with temporal regularization to deduce robust trends in the data. We validate the method on synthetic data and identify critical challenges associated with our approach. The proposed classifiers are used to predict cervical cancer one year ahead in time in data collected by the Cancer Registry of Norway. Our resuls show that the classifiers meaningfully discern developing cases of cervical cancer and attain an AUC of 0.78. Finally, we propose future directions of the project.
dc.language
dc.publisherNTNU
dc.titleEarly Prediction of Cervical Cancer Using Matrix Factorization
dc.typeMaster thesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record