Machine learning for identification of features in ocean model and remote sensing data
Abstract
Å forutsi havdynamikk ved bruk av numeriske modeller er utfordrende på grunn av uforutsigbare ikke-lineariteter og begrenset tilgang til fysiske observasjoner. Havvirvler utgjør konseptuelle og praktiske utfordringer for teori og modeller. Å vite posisjonen og dimensjonene til mesoskala-virvler kan brukes som en del av observasjonene i assimilasjonsprosessen til modellen, noe som forbedrer dens robusthet og nøyaktighet. På grunn av fordelene av å vite karakteristikker som virvelens dimensjon og posisjon, var det av interesse å forske på nye maskinlæringsmetoder for å tolke data produsert av modeller (f.eks. SINMOD) eller observert gjennom fjernmålinger, for å gjenkjenne havfunksjoner som havverdier.
Fordi det ikke eksisterer en “passer-til-alt" maskinlæringsalgoritme, ble tre av de vanligste veiledet læringsalgoritmene evaluert: Støttevektormaskiner (SVM), beslutningstrær og Konvolusjonelt nevralt nettverk (CNN). På grunn av at modellene trenger en tilstrekkelig mengde treningsdata, ble det opprettet en annoteringsverktøy for å produsere en tilstrekkelig mengde data som inneholder gjenkjennbare trekk som gjenkjenner en virvel. Det endelige treningssettet inkluderte 2045 treningseksempler som inneholder variablene havoverflatehøyde, -temperatur og -havstrømmer. Etter en mindre undersøkelse av hvilke variabler som har sterkest sammenheng med utfallene av interesse, ble det funnet ut at havstrømsvektorene ga mye bedre ytelse, med eller uten bruk av havoverflatehøyde og temperatur. I en første test av maskinlæringsalgoritmer ble CNN funnet å være den som presterte best. En videre test av CNN arkitekturer undersøkte tre modifiserte versjoner av de originale CNN-arkitekturene: VGG, ResNet og Inception. Modellen som presterte best, ble funnet å være en enkel modifisering av en VGG-nettverksstruktur. Den endelige modellen kan brukes til å detektere et ensemble av såkalte glidende-vinduer (“sliding windows” på engelsk) på et større utvalgt område av havoverflatestrømmer. De endelige predikterte vinduene blir deretter slått sammen ved hjelp av grupperingsteknikker, som deretter etter-prosesseres ved hjelp av veletablerte flyt-felt-ligninger som Okubo-Weiss-parameteren (OW) og vortisitet for å gi mer presise grenser som innkapsler prediksjonene.
CNN-modellen fungerte bra da den ble testet på et sett som ikke ble brukt for trening, og nådde nøyaktighetsverdier over 96 \%. Det aggregerte systemet med prediksjon og etterprosessering ga tilfredsstillende resultater når de ble testet på både SINMOD og andre modell- og observasjonsdatasett. Etter å ha analysert systemets ytelse på tvers av datasettene, var det ubetydelige likheter mellom den assimilerte og observerte havdynamikken, selv om en lengre 15-måneders sammenligning så ut til å vise tilsynelatende sammenlignbare trender i virvelaktivitet på grunn av batymetri og sesongen. Predicting ocean dynamics using numerical models is challenging because of the unpredictable non-linearities and limited access to physical observations. Ocean eddies pose a complicated conceptual and practical challenges to theory and the models. Knowing the position and scale of mesoscale eddies can be used as a part of the observations in the assimilation process, improving the model's certainty and exactness. Due to the advantages such information, it was of interest to research novel machine learning methods to interpret data produced by models (e.g., SINMOD) or observed through remote measurements to recognize ocean features such as ocean eddies.
Because there is no "one fits all" machine learning (ML) algorithm, three of the most common supervised learning algorithms were evaluated: support vector machines (SVM), random forest, and Convolutional Neural Networks (CNN). Because the models need a sufficient amount of training samples, a data annotation application was created to generate a sufficient amount of training samples containing eddy features. The final training set included 2045 samples containing sea surface height, temperature, and ocean currents. After a smaller investigation of their ocean eddy predictability, an ensemble consisting of the ocean current vectors were found to provide much better performance without both sea surface height and temperature. In an initial trial of finding the best ML algorithm, CNN were found to be the best performing. The second trial examined three modified versions of the original CNN architectures: VGG, ResNet, and Inception. The best performing model was found to be a simplified modification of a VGG network structure. The final model could be used to detect multiple sliding windows on a selected grid of sea surface currents. The final predictions are merged using grouping techniques, which is further refined using well-established flow-field equations such as the Okubo-Weiss parameter and vorticity to provide more precise boundaries encapsulating the predictions.
The CNN model performed well when tested on a hold-out set of the training data, reaching accuracies above 96\%. The aggregated system of prediction and post-processing provided satisfactory results when tested on both SINMOD and other models and observational datasets. After analyzing the system's performance across the datasets, there were negligible similarities between the assimilated and observed ocean dynamics, although a year-long comparison seemed to find seemingly comparable trends in eddy activity due to bathymetry and the season.