dc.description.abstractMålet med denne oppgaven er å undersøke hvorvidt maskinlæring ved hjelp av AIS, skips- og seilasdata kan brukes til å predikere hvor lang tid et skip vil bruke i havn. Undersøkelsen er gjort fra et havneperspektiv som betyr at en spesifikk havn og skipene som benytter seg av havnen er studert. Studiet omhandler råoljetankere som benytter seg av Mongstad havn, lokalisert på vestkysten av Norge. Dataen brukt i denne oppgaven kommer fra forskjellige kilder og er lastet ned fra Sea-web sin skipsdatabase og Kystverkets datavarehus. Et automatisk maskinlæringsverktøy ved navn Tree-Based Pipeline Optimization Tool (TPOT) som bruker genetisk programmering brukes for å finne gode maskinlæringsmodeller for den spesifikke dataen. Verktøyet søker gjennom tusenvis av maskinlæringsmodeller for å finne en god modell. Maskinlæringsmodellen som utvelges av TPOT brukes som den endelige modellen for å predikere ukjent data. Studiet har vist at det å predikere skipets tid i havn er en komplisert oppgave med mange skjulte variabler involvert. Selv om TPOT er et nyttig verktøy som hjelper brukeren å finne gode maskinlæringsmodeller uten å trenger forkunnskaper om dometet, så anbefales det å ha solid kunnskap når man arbeider med dette domenet pga. dens kompleksitet. Modellen klarte ikke å forstå hva som gjorde at skipene byttet kai, noe som resulterte i redusert prediksjonsnøyaktighet. På grunn av tidsbegrensninger fikk ikke TPOT nok tid til å konvergere. En bedre modell ville ha blitt funnet dersom TPOT hadde fått mer tid på seg. Det anbefales å gjøre lignende studier med tilgang til havnedokumenter eller annen havnerelatert informasjon. I tillegg AIS data brukes i større grad for å finne flere relasjoner i dataen. Dette vil danne et bedre grunnlag for å lykkes med prediksjonene.
dc.description.abstractThe goal of this thesis is to investigate to what extent supervised machine learning using features extracted from AIS, ship and voyage data can predict a ship’s turnaround time in port. The investigation is conducted from a port perspective, meaning that a specific port and the vessels calling the port is studied. The case study concerns crude oil tankers calling the Port of Mongstad located on the west coast of Norway. The data used in this thesis comes from multiple sources and is downloaded from the Sea-web ship database and the Norwegian Coastal Administration's data warehouse. An open source automated machine learning tool called Tree-Based Pipeline Optimization Tool (TPOT) employing genetic programming is used to find a feasible machine learning model for the problem at hand. It searches through thousands of machine learning pipelines to find a good model for the specified data. The machine learning model found by TPOT is used as the final model for the prediction task. The study has shown that predicting ship turnaround times is a convoluted task with many hidden variables. Although TPOT is a useful tool which helps the user find a good machine learning model without needing domain knowledge, high domain knowledge is recommended when working on this task due to its complexity. Especially the model's inability to understand why berth shifting happens caused a substantial loss of prediction accuracy. Furthermore, due to time constraints TPOT was not given enough time to converge. A better model would likely have been found had more time been available. It is recommended to conduct similar studies with access to port documents and/or port related data. In addition AIS data should be incorporated to a greater extent to find more relations in the data. This would create better circumstances for success.
dc.titlePredicting Ship Turnaround Times with Machine Learning
