Vis enkel innførsel

dc.contributor.advisorStahl, Annette
dc.contributor.advisorYip, Mauhing
dc.contributor.advisorMester, Rudolf
dc.contributor.authorFagerli, Anders Thallaug
dc.date.accessioned2022-10-01T17:25:52Z
dc.date.available2022-10-01T17:25:52Z
dc.date.issued2022
dc.identifierno.ntnu:inspera:102231297:44764664
dc.identifier.urihttps://hdl.handle.net/11250/3023122
dc.description.abstractÅ utforske og utnytte verdenshavene på en bærekraftig måte er avgjørende for å løse utfordringer som global oppvarming. Autonome undervannsroboter har som hensikt å erstatte menneskelige operatører i farlige undervannsmiljøer, samtidig som de effektivt kartlegger, utforsker og manipulerer undervannsstrukturer. Avgjørende for autonomi er evnen til å kartlegge omgivelsene, og denne oppgaven utforsker kartlegging av undervannsmiljøer med et monokulært kamera ved hjelp av dyp læring. En variasjonsautokoder betinget på bilder er implementert som en grunnlinje for å estimere dybden til scener, trent på syntetiske undervannsbilder med sann dybdedata. Den aleatoriske usikkerheten til prediksjonene blir i tillegg estimert, slik at prediksjonene kontinuerlig kan evalueres og brukes sammen med andre sannsynlighetsmodeller. Flere modifikasjoner av grunnlinjearkitekturen er foreslått, med den hensikt å forbedre dybdeestimering i undervannsmiljøer. En kantdetektor basert på den estimerte aleatoriske usikkerheten utledes, og tillater metoder for geometrisk utjevning for data som ellers er uegnet. I tillegg foreslås en ny metode for å ta i bruk sparsomlige målte dybdeestimater som ekstra data, der dataen slås sammen på flere skalaer i konvolusjonelle nevrale nettverk. Spatiotemporale nettverk blir også undersøkt, ved å ta i bruk flere temporale sammenhengende bilder som input til modellen. En metode for å lære bevegelsesfiltre i 2D spatiotemporale nettverk presenteres, og generering av geometrisk konsistente dybdeestimater mellom flere bilder blir også utforsket. Resultater på et syntetisk, fotorealistisk undervannsdatasett viser at mange av de foreslåtte modifikasjonene forbedrer ytelsen til grunnlinjen, både når det gjelder kvalitative og kvantitative resultater. Modellen er imidlertid kun evaluert på syntetiske data, og det gjenstår å se hvordan de foreslåtte modifikasjonene påvirker ytelsen i virkelige undervannsmiljøer.
dc.description.abstractExploring and utilizing the world's oceans in a sustainable manner is crucial for solving challenges such as global warming. Autonomous underwater robots aim to replace human operators in dangerous and harsh underwater environments while efficiently and sustainably surveying, exploring and acting on underwater structures. Essential for autonomy is the ability to map the surroundings, and this thesis explores the mapping of underwater environments with a monocular camera using deep learning. A conditional variational autoencoder (CVAE) conditioned on the deep features of images is implemented as a baseline for estimating the depth of scenes, trained in a supervised fashion on synthetic underwater images. The aleatoric uncertainty of its predictions is additionally estimated, allowing the predictions to be continuously evaluated and fused with other probabilistic models. Several modifications to the baseline architecture are proposed to improve depth estimation in underwater environments. An edge detector based on the estimated aleatoric uncertainty is derived, allowing smoothness priors on otherwise unsuited data for geometric smoothing. A novel method for incorporating auxiliary sparse depth is proposed, fusing sparse data at multiple scales in a late fusion scheme for convolutional neural networks. Spatiotemporal networks are also investigated, using multiple temporally adjacent images as input to the model. A pre-training scheme for learning motion filters in 2D spatiotemporal networks is presented, and the generation of geometrically consistent depth estimates between multiple views is also explored. Results on a synthetic, photorealistic underwater dataset show that many of the proposed modifications improve the performance of the baseline, both in terms of qualitative and quantitative results. However, the model is only evaluated on synthetic data, and it remains to be seen how the proposed modifications affect performance in actual underwater environments.
dc.languageeng
dc.publisherNTNU
dc.titleDeep Monocular Depth Estimation for Autonomous Underwater Vehicles
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail
Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel