Segmentation of Clinically Significant Prostate Cancer using Swin UNETR
Abstract
Prostatakreft er den vanligste kreftformen hos menn, og nøyaktig segmentering av klinisk signifikant prostatakreft fra magnetisk resonanstomografi (MR) er avgjørende for diagnose, behandlingsplanlegging og forbedring av pasientutfall. Denne oppgaven undersøker effektiviteten til Swin Transformer-basert UNETR (Swin UNETR)-modellen for prostatakreft segmentering og utforsker potensialet til selv-veiledet læring (SSL) og fleroppgave læring (MTL) for å forbedre ytelsen.
Eksperimenter viste konkurranseevnene til Swin UNETR, og oppnådde en lovende PI-CAI-score på 0,762 ved bruk av MTL med separate dekoderere for kjertel- og tumorsegmentering. Dette antyder Swin UNETRs potensial for prostatakreft segmentering, spesielt ved videre utforskning og finjustering. Begrensningene ved forhåndstrening med rotasjonsprediksjon med SSL ble anerkjent i oppgaven, noe som understreker behovet for å undersøke et bredere spekter av SSL-teknikker. MTL med separate dekoderere viste seg å være vellykket for å forbedre nøyaktigheten for tumorprediksjon, hvilket understreker viktigheten av nøye utformede MTL-rammeverk.
Fremtidige forskningsmuligheter inkluderer å utvide MTL til å predikere prostatasoner, utforske ulike SSL-teknikker som kontrastiv læring og bilderekonstruksjon, samt potensielt kombinere SSL med MTL for forhåndstrening. I tillegg anbefales det å innlemme datasett som Prostata 158 sammen med det nåværendedatasettet for å forbedre modellens generaliserbarhet.
Denne oppgaven bidrar til fremgangen innen dyp læring for prostatakreft segmentering ved å demonstrere effektiviteten til Swin UNETR og MTL, samtidig som den understreker potensialet for videre utforskning innen SSL og viktigheten av et bredere datagrunnlag. Prostate cancer is the most common form of cancer in men, and accurate segmentation of Clinically significant prostate cancer (csPCa) from Magnetic Resonance Imaging (MRI) is crucial for diagnosis, treatment planning, and improving patient outcomes. This thesis investigates the effectiveness of the Swin Transformer-based UNETR (Swin UNETR) model for csPCa segmentation and explores the potential of Self-supervised learning (SSL) and Multi-task learning (MTL) to enhance its performance.
Experiments demonstrated the competitiveness of Swin UNETR, achieving a promising PI-CAI score of 0.762 using MTL with separate decoders for gland and tumor segmentation. This suggests Swin UNETR’s potential for csPCa segmentation, particularly with further exploration and refinement.
The limitations of pre-training with rotation prediction for SSL were acknowledged, highlighting the need for investigating a broader range of SSL techniques. MTL with separate decoders proved successful in improving tumor prediction accuracy, underlining the importance of carefully designed MTL frameworks.
Future research opportunities include extending MTL to predict prostate zones, exploring various SSL techniques like contrastive learning and image reconstruction, and potentially combining SSL with MTL for pre-training. Additionally, incorporating datasets like Prostate 158 alongside the current dataset is recommendedto enhance model generalizability.
This thesis contributes to the advancement of deep learning for csPCa segmentation by demonstrating the effectiveness of Swin UNETR and MTL, while emphasizing the potential of further exploration in SSL and the importance of a broader data foundation.