Vis enkel innførsel

dc.contributor.advisorGulla, Jon Atle
dc.contributor.advisorKille, Benjamin Uwe
dc.contributor.authorAndersen, Alexander Meldal
dc.date.accessioned2022-11-02T18:19:28Z
dc.date.available2022-11-02T18:19:28Z
dc.date.issued2022
dc.identifierno.ntnu:inspera:112296943:33622862
dc.identifier.urihttps://hdl.handle.net/11250/3029684
dc.description.abstractAggregering av sekvensiell input handler om å redusere et, potensielt veldig stort, sekvensielt datasett til enklere variabler. I industrien, og særlig innen bank og finans, er sekvensielle data veldig vanlige, som gjør dette til en høyst relevant oppgave. Grunnet at sekvensene av transaksjoner utvikles dynamisk over tid, i takt med at folk endrer hvordan de tjener og bruker penger, så kan en automatisk måte å definere slike aggregater potensielt spare mye manuelt arbeid. Vi foreslår to typer automatiske metoder for å gjenkjenne komplekse mønstre i sekvenser av transaksjoner. Den første innebærer å trene et autoenkoder-nevralt nettverk til å komprimere en sekvens til et gitt antall variabler, og den andre er å anvende Fourier-analyse. Begge metodene kan anvendes på store umerkede sekvensielle datamengder, for å effektivt kunne aggregere dem. Vi bruker data fra den virkelige verden for å evaluere metodene våre, ved å bruke aggregatene vi lager som input-variabler for trebaserte maskinlæringsalgoritmer på merket data. De automatiske metodene viser noe potensiale i å finne kjennetegnende informasjon, og autoenkoderen ser ut til å fange opp mer informasjon enn Fourier-analyse gjør, men de automatiske metodene klarer ikke å forbedre resultatene man får, når de blir sammenlignet med manuelt definerte aggregater.
dc.description.abstractSequential input aggregation is the task of condensing a, potentially very large, sequential dataset into simpler features. In the industry, particularly finance and banking, sequential data is common, making this a broadly relevant task. Due to the dynamic nature of transactions, and the way people spend and earn money, an automated way of defining such features could potentially save a lot of manual labor. We propose two kinds of automatic methods of recognizing complex patterns in sequences of transactions. The first method is fitting autoencoder recurrent neural networks to learn a fixed number of features, and the second is applying Fourier analysis. Both of these can be applied to large amounts of unlabeled, transactional data for effective aggregation of said data. Using real world data, we evaluate our aggregation methods, by using the aggregates as inputs for tree-based supervised learners. The automatic methods show some promise in recognizing features, with the autoencoders seemingly capturing more than the Fourier analysis, but the automatic methods could not yield any improvement when compared to manual feature engineering.
dc.languageeng
dc.publisherNTNU
dc.titleSequence Input Aggregation
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel