Statistisk analyse av celleprøver innen kreftdiagnose.: Multinomisk logistisk regresjon - modelltilpasning og prediksjon.
Master thesis
Permanent lenke
http://hdl.handle.net/11250/258828Utgivelsesdato
2007Metadata
Vis full innførselSamlinger
Sammendrag
Brystkreft og livmorhalskreft er to av de hyppigste kreftformene blant kvinner. Masteroppgaven omhandler disse to krefttypene, og problemstillinger løses ved å bruke medisinsk statistikk. To forskjellige datasett er brukt, det ene består av celleprøver fra brystsvulster og det andre består av celleprøver fra livmorhalsen. Målet er å best mulig kunne predikere en diagnose ut fra målte cytologiske kriterier i celleprøver.Celleprøver fra 133 kvinner med forskjellige typer brystsvulster er tatt med finnålsaspirasjonscytologi(FNAC). En rekke cytologiske kriterier er målt i celleprøvene, og disse blir forklaringsvariabler som skal brukes til å predikere svulsttype, som er en responsvariabel med tre diagnosegrupper. En multinomisk logistisk regresjonsmodell er tilpasset datasettet, og det viser seg at kjernepleomorfi, uregelmessig kalk, bipolare nakne kjerner, komplekse 3D-grupper og myoepitelceller er viktige forklaringsvariabler i klassifikasjonen. Prediksjon, kryssvalidering og en vurdering av diagnostiske nøyaktighetsmål har vist at modellen gir en god tilpasning til datamaterialet, også for nye observasjoner. Bootstrap er brukt for å undersøke validiteten av modellen. Vanligvis predikeres en observasjon til den diagnosegruppen som har høyest predikert sannsynlighet, men her undersøkes også hva som skjer dersom andre klassifikasjonsregler benyttes for å forbedre prediksjonen med hensyn på hvor alvorlig det er å gjøre ulike typer klassifikasjonsfeil.Kreftregisteret gjennomfører i Norge en masseundersøkelse av livmorhalsen til kvinner ved hjelp av celleprøver. Datamaterialet som er brukt i oppgaven inneholder 252 celleprøver fra 47 kvinner som fikk livmorhalskreft i år 2000 uten at kreften hadde blitt oppdaget i tidligere celleprøver. Prøvene er analysert på nytt både på laboratoriene de kom fra og av fire cytologer. Nye diagnoser er stilt, og cytologene har målt en rekke cytologiske kriterier. De ulike diagnosene er sammenlignet ved å bruke kappa som mål på enighet. Klyngeanalyse er brukt for å se på sammenhenger mellom celleprøver og sammenhenger mellom forklaringsvariablene, det viser seg at det er en klar sammenheng mellom forklaringsvariablene. Man kunne sannsynligvis ha tilpasset regresjonsmodeller for livmorhalsdatasettet, men det har imidlertid vært problemer med å sammenligne de forskjellige diagnosene med forklaringsvariablene. Videre arbeid med datamaterialet vil være mulig dersom det ryddes opp i disse problemene.