dc.description.abstract | Bakgrunn og formål: Nøyaktig inntegning av målvolum og risikoorganer er avgjørende for resultatet av pasientbehandling med stråleterapi. Manuell inntegning av strukturer er kjent som den
største usikkerheten i stråleterapiprosessen. Automatisk segmentering ved bruk av kunstig intelligens (AI) kan gi en raskere og mer konsistent måte å tegne inn strukturer på. Målet med denne
studien var å undersøke to forskjellige AI-metoder for automatisk segmentering av relevante strukturer for strålebehandling av brystkreftpasienter. Dette inkluderte å evaluere en dyp læring (DL)-
thoraxmodell, implementert i et kommersielt doseplanleggingssystem, og å trene og teste maskinlæring (ML)-modeller, implementert i Python.
Materiale og metode: All pasientdata var fra venstresidig brystkreftpasienter som har blitt behandlet med ekstern stråleterapi med fotoner ved St. Olavs hospital, ved bruk av pustestyring.
DL-thoraxmodellen ble evaluert kvantitativt og klinisk for 20 pasienter ved å generere inntegninger
for hjertet, lungene, ryggmargen og spiserøret. For segmentering av brystbenet, venstre bryst og
hjertet, ble ML-modeller som bruker lineær støttevektorklassifisering trent med 20 og 30 pasienter
og evaluert kvantitativt. Dice score (DSC), Hausdorff-avstand (HD)-persentiler og gjennomsnittlig
HD (AVD) ble brukt til kvantitativ evaluering.
Resultater: DL-thoraxmodellen brukte i gjennomsnitt 3 minutter på å generere AI-segmenteringer
for én pasient. Gjennomsnittlig DSC for hjerte og lunger var henholdsvis 0,92 ± 0,02 og 0,97 ±
0,01; gjennomsnittlig AVD for hjerte og lunger var henholdsvis 2,9 ± 1,1 mm og 0,9 ± 0,4 mm.
I den kliniske analysen passerte de AI-genererte segmenteringene i 42 % av tilfellene for hjertet,
100 % av tilfellene for lungene, 85 % av tilfellene for ryggmargen og 70 % av tilfellene for spiserøret. Kjøretiden for ML-modellene var på 30 sekunder til 5 minutter. For modellene trent med
30 pasienter, var gjennomsnittlig DSC for brystbenet, venstre bryst og hjertet henholdsvis 0,65 ±
0,06, 0,64 ± 0,10 og 0,66 ± 0,05; gjennomsnittlig AVD for brystbenet, venstre bryst og hjertet var
henholdsvis 1,8 ± 0,6 mm, 2,3 ± 0,5 mm og 2,4 ± 0,5 mm.
Konklusjon: Strukturer kan enkelt tegnes inn med en DL-thoraxmodell for brystkreftpasienter.
Sammen med høy nøyaktighet var et stort flertall av segmenteringene klinisk aksepterte, og mange
av de ikke-aksepterte segmenteringene krevde kun mindre manuelle korreksjoner. Dette innebærer
at modellen har et potensiale til å forbedre både konsistensen og effektiviteten av segmentering
i klinisk praksis. ML-algoritmen kan lett trenes til å tegne inn strukturer for brystkreftpasienter;
ML-modellene må imidlertid forbedres ytterligere før de kan brukes i klinisk praksis. | |
dc.description.abstract | Background and purpose: Accurate segmentation of target volumes and organs at risk is critical
for the patient treatment outcome in radiotherapy. Manual segmentation of structures is known
as the largest uncertainty in the radiotherapy process. Auto-segmentation based on artificial intelligence (AI) may lead towards a faster and more consistent way of contouring. The aim of this
study was to investigate two different methods using AI for automatic segmentation of relevant
structures for radiotherapy treatment planning of breast cancer patients. This included evaluating
a deep learning (DL) thorax model, implemented in a commercial treatment planning system, and
training and testing machine learning (ML) models, implemented in Python.
Materials and method: All patient data was from left-sided breast cancer patients previously
treated with external photon beam radiotherapy at St. Olavs Hospital, using deep inspiration breath
hold. The DL thorax model was evaluated quantitatively and clinically for 20 patients by generating segmentations for the heart, the lungs, the spinal cord, and the esophagus. For segmentation
of the sternum, the left breast, and the heart, ML models using linear support vector classification
were trained with 20 and 30 patients and evaluated quantitatively. The Dice similarity coefficient
(DSC), percentile Hausdorff distances (HDs), and the average HD (AVD) were used for quantitative
evaluation.
Results: The DL thorax model used on average 3 minutes on generating AI segmentations for one
patient. The average DSC for the heart and lungs were 0,92 ± 0,02 and 0,97 ± 0,01, respectively;
the average AVD for the heart and the lungs were 2,9 ± 1,1 mm and 0,9 ± 0,4 mm, respectively.
In terms of clinical acceptability, the AI-generated segmentations passed in 42 % of the cases for
the heart, 100 % of the cases for the lungs, 85 % of the cases for the spinal cord, and 70 % of the
cases for the esophagus. The runtime for the ML models was on 30 seconds to 5 minutes. For the
models trained with 30 patients, the average DSC for the sternum, the left breast, and the heart
were 0,65 ± 0,06, 0,64 ± 0,10, and 0,66 ± 0,05, respectively; the average AVD for the sternum,
the left breast, and the heart were 1,8 ± 0,6 mm, 2,3 ± 0,5 mm, and 2,4 ± 0,5 mm, respectively.
Conclusion: Regions of interest (ROIs) can easily be contoured with a DL thorax model for breast
cancer patients. Along with high accuracy, a large majority of the segmentations were clinically
acceptable, and many of the non-accepted segmentations required minor manual corrections. This
implies that the model has the potential to improve both consistency and efficiency of segmentation
in the clinic. The ML algorithm can easily be trained to contour ROIs for breast cancer patients;
however, the ML models need further improvements in order to be clinically useful. | |