Improving the semantic segmentation of historical aerial images of riverscapes using both data-centric and model-centric approaches.
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3024837Utgivelsesdato
2022Metadata
Vis full innførselSamlinger
Sammendrag
Menneskelig utbygging legger press på elvelandskapet, noe som setter bevaring av landområder og biologisk mangfold i en farlig situasjon. For å vurdere endringene og undersøke restaureringspotensialet, er det viktig å forstå forandringen av elver over tid. Denne vurderingen er utfordrende på grunn av mangel på data. Selv om det eksisterer historiske bilder av elvelandskap, krever forståelse av utviklingen av elven at det utføres klassifisering av landområder i elvelandskapsbildene. Manuell klassifisering av dataene er en tung og tidkrevende prosess og kan betraktes som flaskehalsen i analysen av elvenes utvikling.
Nylig har dype nevrale nett oppnådd overlegen ytelse på bildebehandlingsoppgaver. Det finnes forskning som har formulert landområdeklassifiseringen som en semantisk segmenteringsoppgave og løste den ved å bruke konvolusjonelle nevrale nett. Det er imidlertid svært få verk som fokuserer på historiske bilder i gråtoneskala, og resultatene av disse modellene må forbedres slik at modellene kan brukes til en storskalaanalyse.
Denne oppgaven bygger videre på det tidligere arbeidet utført av Dalsgård (2020), som foreslo en modell basert på dype konvolusjonelle nevrale nett for å predikere den semantiske segmenteringen av historiske flybilder av elvelandskap i Norge. Denne forskningen økte MIoU-prosenten over testsettene testsettene med 9,53% fra det tidligere arbeidet, noe som betyr at feilraten ble redusert med 26,84%. Denne forbedringen ble oppnådd ved å bruke både data-centric og model-centric metoder. Koden tilhørende denne oppgaven er tilgjengelig på: https://github.com/SaeidShamsaliei/river-segmentation Human developments are putting pressure on the riverscapes which endanger the conservation of the land types and biodiversity. To assess the changes and investigate the restoration potential, it is essential to understand the alteration of rivers over time. This assessment is challenging due to lack of data. Even though historical images of riverscapes exist, understanding the evolution of the river requires land cover classification of these riverscapes images. Manual classification of the data is a tedious and time-consuming process and can be considered as the bottleneck of the analysis of evolution of the rivers.
Recently, deep neural networks achieved superior performance on image processing tasks. There exists research which formulated the land cover classification as a semantic segmentation task and solved it using convolutional neural networks. However, very few works focused on historical grayscale images and the results of these models need to be improved, so that these models can be used for a large-scale analysis.
This thesis is built on top of the previous work done by Dalsgård (2020), which proposed a model based on deep convolutional neural networks to predict the semantic segmentation of historical aerial images of riverscapes in Norway. This research increased the MIoU of the test sets of the previous work by 9.53%, which means the error rate is reduced by 26.84%. This improvement was achieved by applying both data-centric and model-centric methods. The code of this thesis is available at: https://github.com/SaeidShamsaliei/river-segmentation