dc.contributor.advisor | Stahl, Annette | |
dc.contributor.author | Kwizera, Fred | |
dc.date.accessioned | 2023-12-16T18:19:39Z | |
dc.date.available | 2023-12-16T18:19:39Z | |
dc.date.issued | 2023 | |
dc.identifier | no.ntnu:inspera:140443607:34490252 | |
dc.identifier.uri | https://hdl.handle.net/11250/3107892 | |
dc.description.abstract | Denne masteroppgaven utforsker potensialet for ikke-veiledet maskinlæring for
in-situ plankton bildeklassifisering. Oppgaven ble utformet for å adressere begrensningene i bildeklassifisering ved veiledet maskinlæring, hovedsakelig behovet for et omfattende annotert datasett og utfordringen med å klassifisere plankton som ikke er til stede i treningssettet. Ved å benytte Invariant Information
Clustering (IIC) og to varianter av Regularized Information Maximization (RIM),
overgikk studiet tidligere ulærte teknikker med 11%, og oppnådde en nøyaktighet
på 24.9% på NDSB-datasettet. En ny variant av RIM som bruker selektive bildetransformasjoner for augmentering ble introdusert, og overgikk ytelsen til IMSAT
metoden.
Normalized Mutual Information (NMI) viste seg å være en effektiv evalueringsmetrikk for ikke-veiledet metoder når datasettmerkene ikke er tilgjengelige. Til
tross for beregningsbegrensninger og antagelsen om kjente datasettklasser, indikerer funnene betydelig potensiale for ulærte maskinlæringsmetoder i plankton
bildeklassifisering.
Applikasjon for in-situ klassifisering krever et ekstra manuelt trinn etter klassifisering av en planktonekspert for å merke de klassifiserte gruppene. Til tross for
disse begrensningene, antyder resultatene lovende veier for fremtidig forskning.
De presenterte metodene markerer fremgang innen feltet for plankton bildeklassifisering, med potensielle fordeler for overvåking av marine økosystemer og studier
av miljøpåvirkninger. | |
dc.description.abstract | This thesis explores the potential of unsupervised machine learning methods for
in-situ plankton image classification. The research was driven by the need to overcome the limitations of supervised methods, which necessitate extensive annotated datasets and struggle with classifying unseen plankton. Employing Invariant
Information Clustering (IIC) and two variants of Regularized Information Maximization (RIM), outperforming previous unsupervised techniques by 11%, reaching
an accuracy of 24.9% on the NDSB dataset. A novel variant of RIM using selective
image transformations for augmentation was introduced, surpassing the performance of the IMSAT method.
Normalized Mutual Information (NMI) proved to be an effective evaluation metric
for unsupervised methods when dataset labels are not available. Despite computational constraints and the assumption of known dataset classes, the findings imply
a substantial potential for unsupervised machine learning methods in plankton
image classification.
Application for in-situ classification necessitates an additional manual post classification step by a plankton expert to label clusters. Despite these limitations, the
results suggest promising avenues for future research. The presented methods
mark an advancement in the field of plankton image classification, with potential
benefits for marine ecosystem monitoring and the study of environmental impacts. | |
dc.language | eng | |
dc.publisher | NTNU | |
dc.title | Mutual Information Maximization by Data Augmentation for Plankton Classification | |
dc.type | Master thesis | |