Show simple item record

dc.contributor.advisorNytrø, Øystein
dc.contributor.advisorSlaughter, Laura
dc.contributor.authorHusby, Haldor
dc.date.accessioned2015-10-06T08:29:50Z
dc.date.available2015-10-06T08:29:50Z
dc.date.created2014-07-07
dc.date.issued2014
dc.identifierntnudaim:10366
dc.identifier.urihttp://hdl.handle.net/11250/2352191
dc.description.abstractDet meste av dokumentasjon om behandlingen en pasient får ved et sykehus er i form av tekstlige dokumenter. Sentralt venekateter (SVK) er et viktig medisinsk utstyr som gir tilgang til blodbanen. Det er stor risiko for pasienten å ha SVK liggende lenge. I tillegg er dokumentasjon på hvilke pasienter som har SVK vanskelig å finne ved å bruke den strukturerte delen av EPJ. Forskningsprosjektet Evicare har hentet 45614 dokumenter hvor en del av disse dokumenter er sykepleierdokumentasjon. Prosjektet har lagd en ontologi for SVK, og utarbeidet en gullstandard for materialet. Gjennom gullstandarden er det 1356 dokumenter som har blitt merket med stell av SVK(CareCVC). Etter en manuell gjennomgang av disse dokumenter har vi funnet ut at 1141 filer innehar en eller flere emneoverskrifter av malen sykepleiere dokumenterer etter. Når vi ser på fordelingen av hvor i malen stell av CVK finnes, viser det seg at Del6 (Hud/vev/sår) i malen skiller seg ut, med 788 dokumenter. Prosjektet har identifisert 8219 sykepleiedokumenter som har data i Del6 (Hud/vev/sår). Dette danner korpus for studien. Vi har, på bakgrunn av disse dokumenter, lagd to datasett: et datasett som innehar all tekst innenfor malen, og ett datasett som kun inneholder data innenfor Del6 (Hud/vev/sår). For begge datasett har vi i tillegg brukt metoder for forbehandling av tekst, hentet fra språkteknologi, for å redusere variasjon i tekstmaterialet. Blant flere mulige har vi valgt å ekspandere forkortelser og å stemme, det vil si å redusere ord til en standardisert rotform. Vi har da totalt har tre datasett, uhildet dokumenter, dokumenter hvor en del av forkortelsene som finnes er ekspandert og til slutt dokumenter hvor stemming er foretatt etter at en del forkortelser er ekspandert. I tillegg har vi skilt dokumentene etter kjennskap til stell av SVK ved å bruke gullstandarden. Videre er hvert datasett delt opp i to deler, trening og test, med fordelingsnøkkelen 80 % og 20 % av filene som ble identifisert som sykepleiedokumenter. Læringsalgoritmen Naive Bayes er brukt for å klassifisere dokumentene. Resultatet viser at det å bruke hele dokumenter, uten endringer som forkortelser og stemming, innenfor malen gir precision på 51,5 %, recall på 22,3 % og F1-score på 31,1 %. Analysene viser at ekspandering av forkortelser isolert sett ikke forbedrer resultatet. Ved å foreta ekspandering av forkortelser og så stemming på delen som kun har data innenfor Del6, gir de beste resultatene for studien med precision 65,7 %, recall på 59,9 % og F1-score på 62,7 %. Resultatene bekrefter at klassifiseringen av stell av CVK blir bedre ved å se på deler av sykepleierdokumentasjonen i motsetning til alt innhold innenfor malen. Resultatene blir også bedre ved å foreta preprosessering som ekspandering av forkortelser og stemming. Vi har også funnet ut at hendelsen stell av SVK forekommer mest innenfor Del6 av sykepleiemalen.
dc.languagenob
dc.publisherNTNU
dc.subjectHelseinformatikk, For kandidater med informatikkfaglig bakgrunn
dc.titleKlassifisering av sykepleiejournalen - Kan kunnskap om sykepleiedokumenter forbedre gjenkjenning av hendelser knyttet til sentralvenekateterisering?
dc.typeMaster thesis
dc.source.pagenumber124


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record