Vis enkel innførsel

dc.contributor.advisorJakobsen, Hugo Atle
dc.contributor.authorÅgotnes, Joachim
dc.date.accessioned2021-09-28T18:22:22Z
dc.date.available2021-09-28T18:22:22Z
dc.date.issued2020
dc.identifierno.ntnu:inspera:57621272:36848357
dc.identifier.urihttps://hdl.handle.net/11250/2785352
dc.description.abstractHovedformålet med denne oppgaven er å lage maskinlæringsmodeller for bruk i en allerede eksisterende bildeanalysekode for å kunne spore oljedråper i en turbulent strøm av vann. I tillegg, har prosjektet som mål å beskrive prosedyren for å lage og teste maskinlæringsmodeller med høy nøyaktighet. Eksperimentet består av en kolonne med turbuelent vann der en oljedråpe blir injisert i systemet. To høyhastighetskameraer blir brukt for å ta bilder av oljedråpene når de passerer kolonnen. Biledeanalysekoden prøver å spore dråpene i tillegg til datterdråpene hvis den første dråpen deler seg, men dette krever manuelle korreksjoner. I dette prosjektet blir det forsøkt å forbedre sporingen på dråpen ved hjelp av maskinlæringsmodeller. Tidligere ekseperimenter ble prossessert ved hjelp av bildeanalysekoden i tillegg til manuelle korreksjoner. To datasett ble lagd der den første beskriver delingen av dråper og det andre datasettet beskriver hvis to dråper er den samme. En rekke variabler relatert til dråpene i hvert bilde ble lagret. Denne dataen ble brukt for å lage maskinlæringsmodellene. Følgende maskinlæringsmodeller ble brukt i dette prosjektet: logistisk regresjon, diskriminerende analyse, K-nærmeste naboer, støttevektormaskiner og treensembler. For utforskning av data ble prinsipiell komponentanalyse brukt. Alle de forskjellige maskinlæringsmodellene har hyperparametere som er optimalisert ved hjelp av Bayesisk optimalisering med mål om å arealet under kurven (AUC) som er et mål på ytelse. De konstruerte modellene viser at treensembler er de beste og mest nøyaktige modellene for begge datasettene i tillegg til at modellene er mer nøyaktig enn den tidligere implementerte koden. Disse modellene ble implementert i bildeanalysekoden og testet på tre forskjellige, nye eksperimenter med forskjellig kompleksitet. Alle tre testene viser at den nye implementasjonen med maskinlæringsmodeller gir bedre resultater enn den gamle bildeanalysekoden. Dette gjør at det kreves mye mindre manuelle korreksjoner i hvert eksperiment, noe som sparer mye tid.
dc.description.abstractThe main object of the project is to create machine learning models for application in an already existing image analysis software to be able to track oil droplets in a turbulent flow of water. In addition, the project aims to clearly describe the procedure of creating machine learning models with high accuracy. Experiments consisting of a column of turbulent water where one oil droplet is injected into the system has been previously conducted. Two high-speed cameras record images when the droplet passes through the column. The image analysis software attempts to track the original droplet in addition to any daughter droplets if the original droplet breaks. Although it requires manual corrections to successfully track all of the droplets. This project aims to improve the current tracking software by introducing machine learning models. The previously recorded experiments were processed using an in-house developed image processing software. In addition, input was required to correct any software misclassifications. Two different data sets were created; the first one describes breakages and the second one describes if two droplets are the same. A series of variables related to the droplets in every frame were saved for every experiment. These data sets were used to create machine learning models. The supervised machine learning models used for this thesis were logistic regression, discriminant analysis, K-nearest neighbors, support vector machines, and tree ensembles. For data exploration, an unsupervised method called principal component analysis (PCA) was used. All of the different machine learning models have hyperparameters that are optimized by the use of Bayesian optimization with the objective of increasing a measurement of performance, namely the area under the curve (AUC). The resulting models show that tree ensembles models are the most appropriate models for both data sets and are improvements compared to the old image analysis software. These models were implemented in the already existing image analysis software and tested on three different cases with different complexity. The case studies show that the newly implemented machine learning models outperform the old tracking logic for all of the three cases. The input needed from the user to correct for any mistakes that the image analysis software does is greatly reduced.
dc.language
dc.publisherNTNU
dc.titleMachine Learning and Image Processing for the Study of Fluid Particle Breakage in Turbulent Flow
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel