Mímir: a Norwegian Question Answering System for Searching Wikidata
Abstract
Semantiske web kunnskapsbaser inneholder veldig store datamengeder av in-formation som kan lett bli aksessert gjennom naturlig språk grensesnitt. Systemerfor å svare på spørsmål er en utvidelse til naturlig språk grensesnitt med målet åsvare på alle spørsmål en kan ha. Et problem med slike semantisk web grensesnitter at de vanligvis bare er tilgjengelige på engelsk. Det finnes noen kunnskapsbaseri dag som støtter flere språk sånn som Wikidata som vi kan ta fordel av. Hoved-målet for denne masteroppgaven er derfor å bruke de norske dataene tilgjengeligi Wikidata til å lage et enkelt norsk spesifikt system for å svare på brukerspørsmålog belyse utfordringer ved å implementere et slikt norskt system.Nøyaktighetstestene og systemanalysen utført viser validiteten til den presen-terte metoden. De norske inverterte indeksene kan bli brukt for videre utvikling avnorske systemer og viser fram veien mot norsk-spesifikke løsninger for systemerfor spørsmåls-svaring over kunnskapsbaser. Semantic Web Knowledge Bases contains massive amounts of information whichcan be easily accessed by creating natural language interfaces. Question Answer-ing systems are an extension to natural language interfaces with the goal of an-swering questions a user can conceive. A problem with such semantic web in-terfaces is that they usually require that the user knows the English language.However, some Knowledge Bases include multi-linguistic support such as Wikidatawhich we can take advantage of. The over-arching goal of this thesis is therefore toleverage the Norwegian data available in Wikidata to create a simple Norwegianspecific question answering system over Wikidata and illuminate the challengesof implementing a Norwegian specific system.The accuracy tests and system analysis performed shows the validity of thepresented approach. The inverted indexes provided also open up the path forfurther development using them and lay the footwork towards Norwegian specificsolutions for Question answering systems over Knowledge Bases.