Multivariabel Analyse av Havstrømmer i Barentshavet
Master thesis
Date
2019Metadata
Show full item recordCollections
- Institutt for marin teknikk [3564]
Abstract
Analyser for parameterreduksjon og prediksjon er utført på et hindcast datasett fra et bestemt område i Barentshavet. Tre analysemetoder, PCA, PLSR og GPR utføres på et utvalg scenarioer og datamengder. Principal Component Analysis (PCA) brukes på data fra to forskjellige romlige dimensjoner for å utforske parameterreduksjon og relasjoner mellom vind- og strømdata. De viser at havstrøm gjennom vannkolonnen er sterkt korrelert og velegnet for parameterreduksjon. Partial Least Squares Regression (PLSR) er et ananalyseverktøy som ligner PCA, men algoritmen er trent med hensyn til en spesifisert respons. Metoden utføres på datasett med ulike mengder data, hvor målinger er tatt hver time i 2, 5 og 10 år. To PLSR-teknikker brukes, estimering og prognoser. Estimering av strøm gjennom vannkolonnen utføres basert på prediktorvariabler som inneholder vind og havstrømmålinger på 0m, 10m og 20m. Det resulterende estimatet er ganske bra i de øverste lagene, men kvaliteten reduseres raskt mot bunnen. Dette kan observeres tydelig i tidsserier av rekonstruerte data og Mean Squared Error (MSE). Fra en dybde på rundt 100-150m og til bunnen, er estimatet ganske dårlig. Men det kan kanskje være godt nok til å brukes til prediksjon av drift av isberg, siden de flyter i overflaten og vanligvis har kjøl på max 200m. PLSR brukes også til prognoser. Disse er basert på historiske data gjennom hele vannsøylen. Prognosen er utført for en time fram i tid, og siden strømmen ikke endres veldig mye i løpet av en time, er resultatene fra disse analysene veldig gode. De viser at antall år med treningsdata inkludert, har en mindre enn forventet effekt på MSE og de resulterende tidsseriene. En tredje metode, Gaussian Process Regression (GPR) blir også utført på dataene. Denne metoden er ganske forskjellig fra PCA og PLSR, da den er ulineær og den lar dataene i mye høyere grad snakke for seg selv. GPR er brukt til estimering, og gir et mye bedre resultat enn ved PLSR. Havstrømmer mot bunnen får imidlertid fortsatt en moderat feil, og beregningstiden er betydelig, selv for relativt små datasett. Å kombinere metoder ved å utføre PCA og deretter GPR for å redusere beregningstiden foreslås. Analyses for parameter reduction and prediction are performed on a hindcast dataset from a specific location in the Barents Sea. Three methods, PCA, PLSR and GPR are applied to different scenarios, and a selection of data amounts. Principal Com- ponent Analysis (PCA) are applied to data from two different spatial dimensions in order to explore parameter reduction and relations in the wind- and current data. It shows that current data through the water depth are highly correlated and well suited for parameter reduction, while data in the horizontal direction are not. Partial Least Squares Regression (PLSR) is an analysis tool that is very similar to PCA, but the algorithm is trained with more consideration towards specified re- sponse variables. The method is performed on datasets including different amounts of data with measurements every hour for 2, 5 and 10 years. Two techniques are used, estimation and forecasting. Estimation of currents through the water column are done based on the predictor variables wind and currents at 0m, 10m and 20m. The resulting estimate is quite good in upper current layers, while its quality decrease fast towards the bottom. This is clearly seen in timeseries of reconstructed data and Mean Squared Error (MSE). At a depth of around 100m to 150m, the estimation is quite poor. However, as icebergs are floating in the surface, the es- timation might be good enough to help with iceberg drift predictions. PLSR is also used for forecasting, which is based on historic data through the entire water column. The forecast is made for one hour into the future, and as currents do not change very much in an hour, the results from these analyses are very good. They show that the number of years of training data included has a smaller effect than expected on the MSE and the resulting timeseries. A third method, Gaussian Process Regression (GPR) is applied to the data. This method is quite different from PCA and PLSR, as it is non-linear and it lets the data speak more for itself. GPR is used for estimation, and gives a much better result than PLSR. However, bottom currents still have a moderate error and the computation time is significant, even for small datasets. Combining methods by performing PCA and then GPR to reduce computation time is proposed.