Vis enkel innførsel

dc.contributor.advisorGambäck, Björn
dc.contributor.authorHoang, Phi Thien
dc.contributor.authorLaskemoen, Jonas
dc.date.accessioned2021-09-15T16:25:26Z
dc.date.available2021-09-15T16:25:26Z
dc.date.issued2020
dc.identifierno.ntnu:inspera:57320302:11765395
dc.identifier.urihttps://hdl.handle.net/11250/2777914
dc.description.abstractFokuset for denne oppgaven er prediksjon av aksjekurser ved hjelp av lett tilgjengelige informasjonskilder. De fire presenterte forskningsspørsmålene er relatert til å identifisere mønstre i de innsamlede dataene (1), sammenlikne Long Short-Term Memory (LSTM) -baserte modeller med enklere grunnmodeller (2), analysere effekten av å introdusere en ny kontekstmodul til de LSTM-baserte modellene (3) og analysere effekten av generaliserende modeller (4). Tre grupper av data ble brukt, som representerer handelsdata, sentimentdata og trendscore-data. Ytelsen til modellene ble målt i form av gjennomsnittlig absolutt prosentvis feil (MAPE), gjennomsnittlig absolutt feil (MAE), gjennomsnittlig kvadratfeil (MSE) og retningsnøyaktighet (DA). Generelt var de LSTM-baserte modellene dårligere enn grunnmodellene og syntes å konvergere til en modell som alltid forutsier at neste pris skal være den nåværende prisen. Imidlertid klarte en LSTM-konfigurasjon å forbedre seg statistisk signifikant over en tilfeldig gjetningsmodell når det gjelder DA, men bare på tidsrammen relatert til testsettet. Uoverensstemmelsene på tvers av tidsrammene førte til konklusjonen at modellen ikke syntes egnet for praktisk bruk. Flere hypoteser som forklarer hvorfor denne oppgaven er så vanskelig som observert presenteres, hovedsakelig knyttet til de forskjellige egenskapene på tvers av tidsrammene; symbolisert av prisavvik, forskjeller mellom aksjer og mengden brukbar informasjon i tilgjengelige data.
dc.description.abstractThe focus of this thesis is stock price prediction using easily available sources of information. The four research questions presented are related to identifying patterns in the gathered data (1), comparing Long Short-Term Memory (LSTM) based models to simpler baseline models (2), analyzing the effect of introducing a novel context module to the LSTM based models (3) and analyzing the effects of generalizing models (4). Three groups of data were used, representing trading data, sentiment data and trendscore data. The performance of the models were measured in terms of mean absolute percentage error (MAPE), mean absolute error (MAE), mean squared error (MSE) and direction accuracy (DA). Generally, the LSTM based models were inferior to the baseline models and seemed to converge to the naive 1-step-behind model, a model that always predicts the next price to be the current price. However, one LSTM configuration managed to improve statistically significant over a random guessing model in terms of DA, although only on the time frame related to the test set. The inconsistencies across time frames led to the conclusion that the model did not seem suitable for practical use. Multiple hypotheses explaining why this task is as hard as witnessed are presented, mainly related to the varying properties across time frames; symbolized by the price variances, differences across stocks, and the amount of usable information in the available data.
dc.language
dc.publisherNTNU
dc.titlePredicting stock prices with Long Short-Term Memory based models using a combination of data sources
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail
Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel