FinanceDoc2JSON: Parsing and structuring invoices and other financial documents with deep learning
Abstract
Denne oppgaven dokumenterer prosessen vår med å få en maskinlæringsmodell til å forstå finansielle dokumenter og tolke dem til JSON. Vi opprettet et datasett og evaluerte flere modeller, men endte opp med YoloV3 modellen for å finne feltene. Den endelige modellen finner riktige felter 57.56% ganger på testsettet vårt. This thesis documents our process of getting a machine learning model to un- derstand financial documents and parse them to JSON. We created a dataset and evaluated multiple models, but ended up with YoloV3 to locate the fields. The final model finds the correct fields 57.56% of times on our test set.