Vis enkel innførsel

dc.contributor.advisorEidsvik, Jo
dc.contributor.advisorRuud, Kristian Amundsen
dc.contributor.authorPadel, Johannes
dc.date.accessioned2023-09-27T17:21:05Z
dc.date.available2023-09-27T17:21:05Z
dc.date.issued2023
dc.identifierno.ntnu:inspera:140649151:35331084
dc.identifier.urihttps://hdl.handle.net/11250/3092531
dc.description.abstractDen globale handelen og økonomiske veksten er sterkt avhengig av shippingindustrien, der tørrbulkfrakt spiller en nøkkelrolle. Denne formen for frakt håndterer transport av løst bulkgods, som korn, jern og kull, og er avgjørende for ulike sektorer. Imidlertid står bransjen overfor utfordringer som skyldes volatiliteten i markedet, noe som gjør det utfordrende å nøyaktig predikere destinasjonene for skipene. Som et resultat lider planlegging, rutevalg og ressursallokering av diverse ineffektiviteter i markedet. For å håndtere disse utfordringene kan anvendelsen av maskinlæring betydelig forbedre driftseffektiviteten og beslutningstakingen i skipsfartsindustrien ved å mer nøyaktig predikere skipenes destinasjoner. Denne oppgaven undersøker bruken av maskinlæringsteknikker for å forutsi destinasjonene til tørrbulkskip i shippingindustrien. Studien fokuserer på flerklassifiseringsproblemet med å forutsi havn-til-havn, lastede og ballastreiser. En omfattende preprossesring av Automatic Identification System (AIS) signaler ble utført for å lage skipsbaner. Matematiske distanse modeller for baner ble brukt til å lage en innledende prediksjon, som ble brukt som variabel i maskinlæringsmodellen, sammen med annen relevant informasjon. XGBoost-algoritmen ble brukt for flerklassifiseringsoppgaven, med separate modeller opprettet for de største sub-segmentene av tørrbulkskip, nemlig Very Large Ore Carriers, Capesize, Panamax og Supramax. Modellenes ytelse ble evaluert ved hjelp av forskjellige metrikker, inkludert havnenøyaktighet, beslutningsnøyaktighet basert på havnefrekvens, klyngenøyaktighet, landsnøyaktighet, gjennomsnittlig feil i prediksjonsavstand, median feil i prediksjonsavstand, og Brier-scoren. Resultatene varierte betydelig, der nøyaktigheten for havne-prediksjon varierte mellom 50-82 \%, og for landsnøyaktighet mellom 75-96\%. Modellene presterte best på større skip, spesielt Very Large Ore Carriers for havn-til-havn-prediksjoner, og oppnådde det beste samlede resultatet med 82 \% nøyaktighet for Capesize ballastreiser. De lastede reisene var de vanskeligste å forutsi, med resultater som varierte mellom 24-64 \%. Permutasjonsvariabelbetydning og SHAP-verdier ble brukt til å undersøke variabelbetydning, og avslørte en korrelasjon mellom virkelige hendelser og modellens prediksjoner. Denne oppgaven bidrar til forståelsen av hvordan maskinlæring kan brukes til å forbedre driftseffektiviteten i shippingindustrien.
dc.description.abstractGlobal trade and economic growth greatly rely on the shipping industry, with a key role played by dry bulk shipping. This form of shipping deals with transporting loose bulk cargo, such as grains iron, and coal, and is crucial for various sectors. However, the industry encounters difficulties stemming from the volatile market conditions, which make it challenging to anticipate vessel destinations accurately. As a result, scheduling, routing, and resource allocation suffer from inefficiencies. To tackle these challenges, the application of machine learning can significantly enhance operational efficiency and decision-making in the shipping industry by more accurately predicting vessel destinations. This thesis investigates the application of machine learning techniques to predict the destinations of dry bulk vessels in the shipping industry. The study focuses on the multiclass classification problem of predicting port-to-port, laden, and ballast voyages. A comprehensive pre-processing of the Automatic Identification System signals was performed to create trajectories. Trajectory similarity measures were used to collect an initial prediction, which was used as a feature in the machine learning model, along with other relevant information. The XGBoost algorithm was employed for the classification task, with separate models created for the largest sub-segments of dry bulk vessels, namely Very Large Ore Carriers, Capesize, Panamax, and Supramax. The performance of the models was evaluated using various metrics, including port accuracy, port frequency-based decision accuracy, cluster accuracy, country accuracy, Average Prediction Distance Error, Median Prediction Distance Error, and the Brier score. The overall results varied between 50-83 \% for port prediction accuracy, and between 75-96 \% for country accuracy. The models performed best on larger vessels, particularly the Very Large Ore Carriers for port-to-port predictions, and achieved the best overall result of 83 \% accuracy for Capesize ballast voyages. The laden voyages where the hardest to predict, with results varying between 24-64 \%. Permutation feature importance and SHAP values were used to investigate feature importance, revealing a correlation between real-world events and the model's predictions. This thesis contributes to the understanding of how machine learning can be used to improve operational efficiency in the shipping industry.
dc.languageeng
dc.publisherNTNU
dc.titlePredicting Dry Bulk Vessel Destinations Using Historical AIS Data
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel