Gaussian Processes for long-term trajectory prediction using historical AIS data
Abstract
For at autonome overflate-fartøyer (ASVer) skal kunne operere trygt er det essensielt med robuste antikollisjonssystemer. Slike systemer innebærer ikke bare at et fartøy må kunne reagere i det det oppstår farlige situasjoner, men også evnen til å proaktivt unngå situasjoner med høy risiko. Fartøyene er dermed nødt til å gjenkjenne ulike scenarioer og kunne planlegge for potensielle hendelser frem i tid. Denne fremtidsforståelsen er temaet i denne oppgaven, og målet er å utforske hvordan historisk data fra Automatisk Identifikasjonssystem (AIS) kan brukes til å predikere skips fremtidige bevegelser.
Mer spesifikt foreslår denne oppgaven to metoder som begge benytter Gaussiske Prosesser til å lære bevegelsesmønsteret til skip i ulike scenarier basert på historiske data. Motivasjonen bak bruken av Gaussiske Prosesser er basert på dens intuitive tolkning som en statistisk fordeling over funksjoner. En slik representasjon kan dermed naturlig innlemme usikkerhet knyttet til prediksjonene som en sentral del av modellen. Et Bayesiansk statistisk rammeverk brukes i tråd med Gaussiske Prosesser for å eksplisitt vurdere den underliggende usikkerheten.
Den første foreslåtte metoden bruker et rammeverk basert på Gaussiske Prosesser direkte for å modellere posisjon i banen som en funksjon av tid. Denne tilnærmingen fungerer rimelig bra, bortsett fra i nærvær av forgrenede trafikkfelt. Formuleringen av metoden gjør strenge antakelser om unimodalitet og er ikke i stand til å representere noen form for multimodal usikkerhet.
Som en mer indirekte tilnærming forsøker den andre metoden å bruke en Gaussisk Prosess til å beskrive en latent bevegelsesmodell og bruke den til å simulere baner numerisk. Denne formuleringen er langt mer fleksibel og er i teorien i stand til å uttrykke multimodale fordelinger for de predikerte banene. Å kombinere denne tilnærmingen med et prediksjonssystem basert på et Utvidet Kalman Filter (EKF) for å simulere baner fungerer bra så lenge banene er tilstrekkelig glatte, slik at en Taylor-approksimasjon av bevegelsesmodellen fungerer som en rimelig tilnærming. Disse antagelsene gjør imidlertid denne metoden mer skjør enn den første metoden.
Begge metodene testes grundig på et reelt AIS-datasett samlet fra Trondheimsfjorden i løpet av ett år, og den statistiske ytelsen til begge metodene sammenlignes. Konsistensen av usikkerhetsestimatene blir også testet for å undersøke om metodene er i stand til å nøyaktig kunne representere den underliggende usikkerheten. An essential aspect of safe operations of Autonomous Surface Vehicles (ASV) is a robust Collision Avoidance (COLAV) system. In addition to the ability to react to dangerous situations, it is also highly beneficial for the COLAV to be able to proactively avoid high-risk scenarios. In order to do so, the ASV requires solid situational awareness and the ability to understand how the future might unfold given a current scenario.
Predicting the future behaviour of surrounding vessels is the topic of this thesis. By utilizing historical data from Automatic Identification System (AIS), the goal is to predict the trajectories of vessels into the future.
Two methods based on a Gaussian Process (GP) framework are proposed. The GP's intuitive interpretation as a statistical distribution over functions allows the predictions to also incorporate uncertainty as a first-class citizen of the model. A Bayesian statistical framework is applied to always explicitly consider the underlying uncertainty when performing predictions.
The first proposed method directly applies the GP framework to model the trajectories as a function of time. This approach works reasonably well, except for in the presence of branching traffic lanes. This formulation makes strict assumptions about unimodality and is unable to represent any form of multimodal uncertainty.
As a more indirect approach, the second method attempts to use a GP to describe a latent motion model and use it to simulate trajectories numerically. This formulation is far more flexible and is, in theory, able to express multimodal trajectory distributions. Combining this approach with an Extended Kalman Filter (EKF)-based prediction scheme to simulate trajectories works well as long as the trajectories are sufficiently smooth, such that a Taylor approximation of the motion model serves as a reasonable approximation. These assumptions do, however, make this method more fragile than the first method.
Both methods are tested extensively on a real AIS dataset collected from the Trondheim fjord over the course of one year, and the statistical performance of both methods are compared. The consistency of the uncertainty estimates is also tested to investigate whether the methods are able to accurately represent the true underlying uncertainty.