Vis enkel innførsel

dc.contributor.advisorUtne, Ingrid Bouwer
dc.contributor.advisorJones, Alun
dc.contributor.authorKiær, Beatrice
dc.date.accessioned2022-10-14T17:19:44Z
dc.date.available2022-10-14T17:19:44Z
dc.date.issued2022
dc.identifierno.ntnu:inspera:106583545:25738769
dc.identifier.urihttps://hdl.handle.net/11250/3026222
dc.description.abstractRaske miljøendringer i Arktis, i form av varmere temperaturer og smelting av havis, fører til lengre navigasjonssesonger og alternative transportveier. Økt sjøtrafikk i de tøffe klimaforholdene fører til en høyere sannsynlighet for at ulykker inntreffer, hvilket truer mennesker og miljø. En grundig forståelse av aktivitetsutviklingen er nødvendig for å redusere disse truslene. Slik innsikt er imidlertid vanskelig å oppnå gjennom tidligere erfaringer da Arktis opprinnelig har vært utilgjengelig. Samtidig tilbyr dagens teknologi nye muligheter gjennom programvare og høykvalitetsdata fra sensorer og satellitter. Formålet med denne masteroppgaven er å undersøke hvordan maskinlæring (ML) og trafikkdata fra fartøy i sanntid kan brukes til å identifisere aktivitetstrender i Arktis og hvordan disse trendene henger sammen med arktiske klimaendringer, miljø og økologi. Metoden som presenteres følger stegene i en typisk ML-sekvens fra allokering og prosessering av data til implementering av to ML-modeller. I denne oppgaven er Arktis representert som et utvalgt område i Barentshavet. Den aktuelle perioden er mellom 2015 og 2021. Flere datakilder ble undersøkt for potensielle inngangsverdier til ML modellene, hvorav data om havtemperatur, havis, dybde, avstand til land og fiskefangst var de mest anvendelige i forhold til filstørrelse, tilgang og utstrekning. Dataene ble individuelt analysert og bearbeidet, og det endelige treningsdatasettet ble komponert gjennom aggregering til et forhåndsdefinert rutenett i tid og rom. Utgangsverdien for aktivitet ble definert fra trafikkdata gjennom to ulike case-studier. Treningsdataene fra hver case-studie ble brukt til å bygge en Random Forest (RF) modell og en Extreme Gradient Boosting (XGBoost) modell. Den første case-studien undersøkte predikering av aktivitet gjennom tilstedeværelse av fartøy, og den andre estimerte tettheten av fartøy innenfor en bestemt type skipsaktivitet. Resultatene viser at modellene hadde tilnærmet lik læringsprosess og predikerte med tilfredsstillende verdier av presisjon og dekning, i snitt på over 80% i begge case-studiene. Dette illustreter potensialet av å bruke ML for estimering av aktivitet med tilsvarende inngangsverdier. Prediksjon av tilstedeværelse oppnådde den beste samlede evalueringen med en F1-score på 87%. Uavhengig av utgangsverdi og type skipsaktivitet, hadde breddegrad størst innvirkning på prediksjonsresultatene. I motsetning til forventninger fra litteraturen ble det imidlertid verken observert en tydelig korrelasjon mellom aktivitetstetthet og klimatiske forhold, eller en økning i aktivitet over tid. Dette er mest sannsynlig knyttet til den korte tidsrammen undersøkt og høy tilstedeværelse av fartøy ved lavere breddegrader, hvor klimaendringene er mer stabile enn i nord. Læringsprosessen indikerte prediksjoner under usikkerhet når det romlige skillet mellom utgangsverdiene var mindre tydelig. Alternative områder og tidsrammer bør analyseres, og ytterligere undersøkelser av påvirkningsfaktorer for aktivitet er nødvendig for å øke modellens pålitelighet og fange opp trendene som forventet.
dc.description.abstractThe Arctic is undergoing rapid environmental changes by warmer temperatures and vanishing sea ice, leading to longer navigation seasons and alternative transportation routes. Increased maritime traffic in the harsh climate conditions leads to a higher probability of incidents that threaten people and the environment. A thorough understanding of the evolving activity is necessary to mitigate these threats. However, such insight is difficult to obtain from limited operational experiences as the region has historically been inaccessible. Meanwhile, today's technology offers new opportunities through software and high-quality data from sensors and satellites. The objective of this thesis is to investigate how machine learning (ML) and real-time vessel traffic data can be used for identifying activity trends in the Arctic and how these trends are connected with the Arctic climate changes, environment, and ecology. The proposed solution provides the necessary steps from data allocation and processing to ML model development. In this thesis, the Arctic is represented by a selected area of the Barents Sea. The relevant period is between 2015 and 2021. Numerous data sources were investigated for potential ML model predictors. Data about temperature, sea ice, ocean depth, distance to land, and fish catches were found to be the most applicable according to file size, access, and coverage. The data were individually analyzed and modified, and the final ML training data set was composed through aggregation by a created spatiotemporal grid. The prediction target of activity was extracted from vessel traffic data, from which two case studies of different activity viewpoints were defined. The training data of each case study were used to build a Random Forest (RF) classifier and an Extreme Gradient Boosting (XGBoost) classifier. Whereas the first case study investigated the prediction of vessel presence, the latter predicted the level of vessel density by operational industry. The prediction results show that the classifiers behaved similarly during learning and provided satisfactory performance in precision and recall, mostly above 80% in both case studies. This verifies the applicability of ML in terms of activity estimation. The detection of vessel presence achieved the best overall evaluation with an F1-score of 87%. Independently of target prediction and industry, latitude had the highest impact on prediction outcome. However, in contrast to expectations from the literature, neither a remarkable correlation between the activity density and climatic features nor an increase in activity over time was observed. This is most likely related to a short time frame investigated and a high concentration of vessel presence at the lower latitudes, where climatic changes are more stable than in the north. The learning process indicated predictions under uncertainty when the spatial separation between the target classes was less clear. Alternative regions and time frames should be analyzed, and further investigation of activity-influencing factors is needed to increase model confidence and capture the trends as expected.
dc.languageeng
dc.publisherNTNU
dc.titlePrediction of Vessel Activity in Arctic Waters using Supervised Learning Methods
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel