A Pixel-Based Approach for Creating Up-To-Date Training Data for Building Detection
Description
Full text not available
Abstract
Den raske utviklingen av maskinlærings- og dyplæringsmodeller har i nyere tid vært bemerkelsesverdig. Likevel krever slike modeller nøyaktige treningsdata av høy kvalitet for å yte sitt beste. Denne oppgaven utforsker potensialet ved å lage nye treningsdata for bygningsdeteksjon i flybilder ved å bruke pikselverdier for bygningstak. Tilnærmingen er svært eksperimentell og foreslår en ny state-of-the-art (SOTA) metode. Ved å trekke ut og analysere bygningstakpikselverdier i gamle treningsdata for bygningsdeteksjon, defineres gjennomsnittlige tak-RGB-verdier. Disse verdiene brukes deretter som en retningslinje for å simulere innhenting av nye flybilder som enn å ikke har oppdaterte bygningsfotavtrykk. Målet er å bruke eksisterende bygningsfotavtrykk og takpikselverdiene til å lage et nytt treningsdatasett med oppdatert bygningsfotavtrykksmerking uten avvik og geometrisk forvrengning forårsaket av radiell forskyvning i bildene. The fast evolution of machine learning and deep learning models in previous years has been remarkable. Still, such models require accurate and high-quality training data to perform at their best. This thesis explores the potential of creating new training data for building detection in aerial images by utilizing pixel values of building roofs. The approach is highly experimental and suggests a new state-of-the-art (SOTA) method. By extracting and analyzing building roof pixel values in old training data for building detection, mean roof RGB values are defined. These values are then used as a guideline to simulate acquiring new aerial images that do not yet have up-to-date building footprints. The goal is to use existing building footprints and the roof pixel values to create a new training data set with up-to-date building footprint labeling without the offset and geometric distortion caused by relief displacement in the images.