Kransarterie segmentering ved bruk av dyp læring
Master thesis
Permanent lenke
http://hdl.handle.net/11250/2625785Utgivelsesdato
2019Metadata
Vis full innførselSamlinger
Sammendrag
En metode for diagnostisering av hjerte-karsykdommer er å måle FFR (fractional flow reserve), som innebærer et lite kirurgisk inngrep. Ved å ekstrahere den geometriske strukturen av hjertets kransarterier fra CT bilder sammen med fluiddynamikk kan FFR bli målt automatisk. En automatisk måling av FFR vil kunne spare ressurser, kostnader og redusere helseriskoer for pasienten. Denne masteroppgaven omhandler hvordan den geometriske strukturen til kransarteriene kan ekstraheres automatisk gjennom CT bilder ved bruk av dyplæring modeller.
Modellene brukt i denne oppgaven er BVNet, BVNet3D og SegCaps. BVNet modellen bruker 2D skiver av CT bildene, men benytter seg av flere kanaler for å få en 3D effekt og den har lavere minnebruk fordi alle de matematiske operasjonene er 2D. Dette utforskes i ekperiment 1 som besto av å finne det optimale antall kanaler og steglengde for å forbedre BVNet modellen. I dette eksprimentet økte dice verdien med noen untak ved å øke kannal størrelsen og steglengde 2. Den modelen med best gjennomsnittlig Dice post verdi var med 7 kanaler og stride 2, men den inneholdt noen sprik mellom de sanne positive.
Den generelle BVNet modellen har 5 kanaler og steglengde 1 og er brukt i de andre eksprimentene, fordi den har lavere minnebruk og har den beste gjennomsnittlig Dice raw verdien.
BVNet3D modellen har samme arktitektur som BVNet modellen bortsett fra at alle de 2D matematiske operasjonene er byttet ut med 3D, som gjør at den får større minnebruk. SegCaps modellen bruker CapsuleNet til segmentering, og ble først brukt til dette i 2018.
CapsuleNet bruker vektorer framfor skalarer og egne strategier for å bestemme hvilke av capsulene i det neste laget som skal aktiveres, slik at de kan unngå å bruke maxPooling. Skalarer blir brukt av convolutional nettverk modeller som BVNet og BVNet3D.
Videre er modellene testet på forskjellige data spliter av kransarteriene, Aorta og portalvenen for å finne fordeler og ulemper ved de ulike modellene for binær klassifikasjon. Aorta er valgt på bakgrunn av at den har en stor tubulær struktur som betyr at den i utgangspunktet skal være lett å finne. Portalvenen er valgt for å undersøke om modellene kan bli brukt på årer generelt. BVNet modellen var best til å prediktere Aortaen best dice verdien i den fleste tilfeller rundt 90 %, hvor de andre modelene hadde mange falske positive prediksjoner. BVNet3D modelen hadde færre falske negative and flere falske positive prediksjoner for segmenteringen av kransearteriene og portal venene.
SegCaps modelen var dårligst, men viste et stort forbedringspotensial.
Det siste eksperimentet utforskes bruken av Frangi filteret, som blir brukt til finne årestrukturer. Målet med dette eksperimentet er for å finne ut om bruken av Frangi filteret kan gjøre BVNet modellen mer presis i å finne kransarteriene.
I del en av det siste eksperiment blir Frangi filterte benyttet på CT bildene som input på BVNet modellen. Resultatet hadde stor forskjell mellom dice verdiene for de ulike testbildene, som indikerer at de beste hyperparameterne ikke ble brukt til å generere Frangi filteret i fleste tilfeller.
I del to av Frangi filter eksperimentet blir både CT bilder og Frangi filteret CT bilder brukt som input på BVNet modellen. Resultatet økte ikke dice verdien, men forskjellen mellom den beste og værste prediksjonen ble redusert.
Modellene brukt i denne oppgaven ser lovende ut, men ingen av dem er gode nok til å bli brukt til å måle FFR uten videre utviklig. Measuring the fractional flow reserve (FFR) is one method used for diagnosing coronary artery disease (CAD), which involves a small invasive surgical procedure. By using both CT scans to extracting the geometric structure of the coronary artery and fluid dynamics, the measuring of FFR can be done automatically. This, in turn, will reduce the total cost, resources, and health risks. This thesis is focusing on extracting the geometrical structure of the coronary artery using deep learning models.
Models used in this thesis are BVNet, BVNet3D, and SegCaps. The BVNet model is using more channels to get a 3D effect, and it has less computation cost because all the mathematical operations are in 2D. This is explored in experiment 1, which consists of finding the optimal channel size and stride for getting the best BVNet model. The dice score is increased with some exceptions by increasing the channel size and by using stride 2. The model with 7 channels and stride 2 had the best mean Dice post score and smaller gaps between the true positive.
The general BVNet model with 5 channels and stride 1 are used in the other experiments, which had relatively low computational cost and the best mean Dice raw score.
The BVNet3D model is the BVNet model with all the 2D operations replaced with 3D, which increases the computational cost of this model.
The SegCaps model came in 2018 and uses CapsuleNet for segmentation. CapsuleNet is using vectors instead of scalers and routing strategies for avoiding the usage of maxPooling. The scalars are used by the conventional networks models, such as BVNet and BVNet3D.
Next, the models were tested on different data splits with the labels for the coronary artery, Aorta, and portal vein in order to find the benefits and disadvantages of these binary classification models. The Aorta has a large tubular structure, which should be easy to find. The portal vein is used in order to check if these models could be used on other vessels. The BVNet model was the best at predicting the Aorta with dice score in most cases around 90 %, where the other models contained a lot of false positive. BVNet3D model predictions have less false negative and more false positive for the coronary artery and portal vein.
The SegCaps model was the worst but showed huge improved potential.
The last experiment consisted of exploring the Frangi filter, which is used to enhance the vessel structure.
Past one of the experiment consisted of using The Frangi filtered CT slices as input for the BVNet model. There was a huge difference between the dice score of the test images, which indicates that the hyperparameters used to create the Frangi filtered CT images was not optimal for all the CT images.
Part two of the experiment consisted of using a combination of Frangi filtered CT and regular CT images as input. The result did not increase the dice score, but the variation between the best and worst prediction was reduced and had fewer gaps between the true positive.
These models seems promising, but none of the models tested in this thesis is good enough to measure the FFR without further development.