Etablering av testsett for radiologer som tyder mammografibilder
Abstract
Effekten av mammografiscreeningprogrammer er avhengig av at radiologene har høy kompetanse. Et sentralt spørsmål er hvordan vedlikeholde og videreutvikle radiologenes tydekompetanse. Å benytte testsett for egentesting kan være et bidrag til å øke sensitiviteten på tyding av screeningmammogrammer, som et supplement til anbefalt kvalitetssikringsarbeid. Vi har etablert systemet OPTIMA som består av programvare for tyding av screeningmammogrammer, inklusive fire testsett bestående av 100 screeningundersøkelser. Systemet har et registreringssystem og en rapportmodul. Hvert testsett består av 100 screeningundersøkelser med mammogrammer fra én utstyrsleverandør; General Electric, Hologic, Philips Sectra eller Siemens. Testsettene består av sanne negative (85-75%) og sanne positive screeningundersøkelser (15-25%), tilfeldig valgt etter et randomisert utrekk fra den nasjonale mammografidatabasen. Mammogrammene er hentet fra fire ulike sykehus PACS og deretter anonymisert. Systemet samler informasjon om tyderrnes ferdigheter ved å benytte modifisert BI-RADS klassifisering benyttes for registrering av selekterte funn. OPTIMA gir umiddelbar tilbakemelding på testers ferdigheter sammenlignet med ”fasit”. Systemet gir mulighet for å gå tilbake og vurdere mammogrammene på nytt der eget tyderesultat eller BI-RADS klassifisering er i uoverensstemmelse med ”fasit”. Systemet gir mulighet for å benytte zoom og window/level i tydeprosessen. Radiologer bidro i planlegging, testing og ferdigstilling av systemet. Brukermedvirkning har vært hensiktsmessig for å utvikle og forbedre våre kravspesifikasjoner for sammensetning av testsettene, programvaren og innhold i registreringsløsningen. Detaljerte brukerkrav ble etablert for sikre at systemet var i henhold til radiologenes ønsker og behov. Gode brukerkrav og innspill har resultert i et brukervennlig system, noe radiologene bekrefter ved å gi programvaren høy score i brukervennlighetstesting. Fire radiologer har tydet ett testsett hver. Resultatene viser liten variasjon i seleksjon av de sanne positive funnene, men det var var interobservatørvariasjon i hvordan radiologene klassifiserte BI-RADS for sanne positive funn. Vi mener testsettene kan stimulere til læring og kompetanseutvikling for radiologers tyding av screeningmammogrammer, spesielt for å redusere variasjonen i BI-RADS klassifisering av funn.