Beregninger av Optimeringsproblemer i Statistisk Læring med TensorFlow
Abstract
Modeller i statistisk læring, spesielt Nevrale Nettverk, har blitt anvendt med stor suksess på en rekke problemer i Kunstig Intelligens. Denne oppgaven beskriver og demonstrerer TensorFlow, som er en softwarepakke laget for å forenkle modellformuleringer og beregninger i statistisk læring. Den første delen av prosjektet etablerer teorien bak statistisk læring og teorien bak de numeriske metodene som utgjør basisen for en beregning i TensorFlow. Den andre delen av oppgaven er dedikert til utregninger av spesifikke læringsproblemer i bildegjenkjenning og beregningsbasert lingvistikk. Hovedarkitekturene til modellene som blir brukt på begge problemene blir presentert, i tillegg til en evaluering av prestasjonen til de forskjellige modellene implementert i TensorFlow. Den konkluderende delen av oppgaven omhandler videre arbeid med fokus på å utvide TensorFlow for å løse en større klasse av læringsproblemer.