Riemannian Optimization for Deep Learning

Hellan, Ottar Passano

dc.contributor.advisor	Owren, Brynjulf
dc.contributor.author	Hellan, Ottar Passano
dc.date.accessioned	2022-11-25T18:21:46Z
dc.date.available	2022-11-25T18:21:46Z
dc.date.issued	2022
dc.identifier	no.ntnu:inspera:104646180:36318324
dc.identifier.uri	https://hdl.handle.net/11250/3034256
dc.description.abstract	Sentrale konsepter og strukturer i riemannsk optimering presenteres og diskuteres for å gi en uavhengig behandling av Riemannian gradient descent-metoden (RGD). Egenskaper ved RGD diskuteres og sammenliknes med de av euklidsk gradient descent, som RGD er en generalisering av. Mulige anvendelser av riemannsk optimering og RGD i feltet dyp læring diskuteres, samt nødvendige hensyn man må ta i implementering av disse. Enkle beregningseksperimenter for demonstrasjon gjøres med RGD for lav rang matrise-mangfoldigheten og den ortogonale gruppen til et CIFAR-10 bildeklassifiseringsproblem og et recurrent neural network problem med lange tidsavhengigheter.
dc.description.abstract	Central concepts and structures of Riemannian optimization are presented and discussed to give a self-contained treatment of the Riemannian gradient descent method (RGD). Properties of RGD are discussed and compared with those of euclidean gradient descent, which RGD is a generalization of. Possible applications of Riemannian optimization and RGD in the field of deep learning are discussed along with considerations one must make in implementations of such methods. Proof-of-concept computational experiments are made using RGD for the fixed-rank matrix manifold and the orthogonal group on CIFAR-10 image classification and a long time-dependence recurrent neural network problem.
dc.language	eng
dc.publisher	NTNU
dc.title	Riemannian Optimization for Deep Learning
dc.type	Master thesis

Tilhørende fil(er)

Filnavn:: no.ntnu:inspera:104646180:3631 ...
Størrelse:: 6.895Mb
Format:: PDF

Åpne

Filnavn:: no.ntnu:inspera:104646180:3631 ...
Størrelse:: 347.3Mb
Format:: application/zip

Åpne

Denne innførselen finnes i følgende samling(er)

Institutt for matematiske fag [2354]

Vis enkel innførsel