Mutual Information Maximization by Data Augmentation for Plankton Classification
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3107892Utgivelsesdato
2023Metadata
Vis full innførselSamlinger
Sammendrag
Denne masteroppgaven utforsker potensialet for ikke-veiledet maskinlæring forin-situ plankton bildeklassifisering. Oppgaven ble utformet for å adressere begrensningene i bildeklassifisering ved veiledet maskinlæring, hovedsakelig behovet for et omfattende annotert datasett og utfordringen med å klassifisere plankton som ikke er til stede i treningssettet. Ved å benytte Invariant InformationClustering (IIC) og to varianter av Regularized Information Maximization (RIM),overgikk studiet tidligere ulærte teknikker med 11%, og oppnådde en nøyaktighetpå 24.9% på NDSB-datasettet. En ny variant av RIM som bruker selektive bildetransformasjoner for augmentering ble introdusert, og overgikk ytelsen til IMSATmetoden.Normalized Mutual Information (NMI) viste seg å være en effektiv evalueringsmetrikk for ikke-veiledet metoder når datasettmerkene ikke er tilgjengelige. Tiltross for beregningsbegrensninger og antagelsen om kjente datasettklasser, indikerer funnene betydelig potensiale for ulærte maskinlæringsmetoder i planktonbildeklassifisering.Applikasjon for in-situ klassifisering krever et ekstra manuelt trinn etter klassifisering av en planktonekspert for å merke de klassifiserte gruppene. Til tross fordisse begrensningene, antyder resultatene lovende veier for fremtidig forskning.De presenterte metodene markerer fremgang innen feltet for plankton bildeklassifisering, med potensielle fordeler for overvåking av marine økosystemer og studierav miljøpåvirkninger. This thesis explores the potential of unsupervised machine learning methods forin-situ plankton image classification. The research was driven by the need to overcome the limitations of supervised methods, which necessitate extensive annotated datasets and struggle with classifying unseen plankton. Employing InvariantInformation Clustering (IIC) and two variants of Regularized Information Maximization (RIM), outperforming previous unsupervised techniques by 11%, reachingan accuracy of 24.9% on the NDSB dataset. A novel variant of RIM using selectiveimage transformations for augmentation was introduced, surpassing the performance of the IMSAT method.Normalized Mutual Information (NMI) proved to be an effective evaluation metricfor unsupervised methods when dataset labels are not available. Despite computational constraints and the assumption of known dataset classes, the findings implya substantial potential for unsupervised machine learning methods in planktonimage classification.Application for in-situ classification necessitates an additional manual post classification step by a plankton expert to label clusters. Despite these limitations, theresults suggest promising avenues for future research. The presented methodsmark an advancement in the field of plankton image classification, with potentialbenefits for marine ecosystem monitoring and the study of environmental impacts.