Vis enkel innførsel

dc.contributor.advisorGundersen, Odd Erik
dc.contributor.authorBjørnnes, Stein-Erik
dc.contributor.authorGjerde, Sindre Adolfsen
dc.date.accessioned2019-12-29T15:00:24Z
dc.date.issued2019
dc.identifierno.ntnu:inspera:36079153:5824145
dc.identifier.urihttp://hdl.handle.net/11250/2634461
dc.descriptionFull text not available
dc.description.abstractDette arbeidet forsøker å finne informasjon i dagligdagse bilder ved hjelp av dyp læring. Bildene er av TrønderEnergis elektriske nett, og informasjon avbildet i disse bildene brukes til å dokumentere nettet. For å hente ut informasjonen brukes en kombinasjon av optisk tegngjenkjenning (Optical Character Recognition - OCR) og objekgjenkjenning (Object Recognition - OR). En forstudie viste at de best egnede eksterne tjenestene var Google Vision for OCR og Microsoft Azure for OR. OR-modellen ble trent i flere iterasjoner med forskjellig taktikk. Et system ble laget som skulle slå sammen prediksjoner for OCR og OR til en felles prediksjon er lagt fram og evaluert. Underveis i prosessen ble det tydeliggjort en trend av bilder som ga bedre resultat enn andre. Til slutt ble systemet evaluert med et testsett hvor det ble undersøkt hvorvidt systemet klarte å gjenskape den faktiske infrastrukturen med alle nødvendige egenskaper. Den endelige konklusjonen ble at systemet viste gode resultater, men at de ikke var gode nok til å rettferdiggjøre muligheten til helautonomt system. Derimot ble det oppdaget at systemet kan være en reell kandidat til å bli brukt på en assisterende måte i dokumentasjonsprosessen.
dc.description.abstractThis work aims to find information in real world pictures using deep learning. The pictures are of TrønderEnergi's electrical grid, and the information in these pictures are used to document the grid. To extract the information a combination of Object Character Recognition (OCR) and Object Recognition (OR) was used. A preliminary experiment with an empirical success measure was conducted to determine the most suitable service provider for each service. Google's OCR service and Microsoft Azure's OR service were chosen. The OR model was trained in several iterations with different tactics. A system to aggregate OCR and OR predictions into one combined prediction is proposed and evaluated. From extraction results a trend arose, showing which pictures angles and which physical information representation yielded the best predictions. Finally, the system was evaluated on a test set, where the test was to see whether the system could recreate the electrical grid with all its properties. The final conclusion was that the system showed great promise in as a supportive tool for information extraction. Results were not good enough to justify a fully automated system in the delicate task of electrical grid documentation.
dc.languageeng
dc.publisherNTNU
dc.titleUsing deep learning to process images as basis for knowledge graph
dc.typeMaster thesis


Tilhørende fil(er)

FilerStørrelseFormatVis

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel