Show simple item record

dc.contributor.advisorMolnár, Peter
dc.contributor.authorHatletvedt, Adrian
dc.contributor.authorSvingen, Petter
dc.date.accessioned2021-10-05T17:20:00Z
dc.date.available2021-10-05T17:20:00Z
dc.date.issued2021
dc.identifierno.ntnu:inspera:85279552:85282697
dc.identifier.urihttps://hdl.handle.net/11250/2787839
dc.description.abstractI denne oppgaven bruker vi Google søkevolum til å predikere den ukentlige avkastningen til industri-indekser i fem land, USA, Japan, Storbritannia, Frankrike og India. Fordi vi bruker et stort antall Google søkekategorier som forklaringsvariabler er alle prediksjonsmodellene valgt for å kunne håndtere høydimensjonalitetsdata. Vi benytter Principal Component Regression, Principal Component Random Forest Regression, Ridge Regression, Lasso, og Elastic Net som våre prediksjonsmodeller. Den beste modellen på kalibreringsdataen (første del av dataen for USA) ble Elastic Net modellen. En enkel long/short strategi basert på denne Elastic Net modellen oppnår bedre resultater enn den utvalgte referanseindeksen i alle de fem landene, etter å ha trukket fra transaksjonskostnader. Vi finner at modellen oppnår best resultater sammenlignet med referanseindeksen i nedgangstider. I tillegg finner vi at relasjonen mellom søkekategori og industriavkastning endres over tid, både i retning og i størrelse. Modellen vi har laget tar automatisk høyde for dette, ettersom den rekalibreres ukentlig. Avslutningsvis finner vi at den abnormale avkasntningen til modellen kun er svakt korrelert på kryss av landegrenser, noe som tyder på at vår metode er ekstra godt egnet i en multinasjonal porteføljestrategi.
dc.description.abstractIn this paper we analyse the usefulness of Google search data for predicting the returns of industry stock indices in five countries, the US, Japan, Great Britain, France and India. Since we use a large set of Google Trends categories as predictors, the forecasting models need to be able to deal with high-dimensional data. We therefore consider Principal Component Regression, Principal Component Random Forest Regression, Ridge Regression, Lasso, and Elastic Net as our prediction models. The best performing model in our calibration sample (the first part of the US data) is the Elastic Net. A simple long-short strategy based on the Elastic Net model significantly outperforms the stock market in all five countries, after including transaction costs. Furthermore, we find that the model achieves most of its excess returns during weeks where the overall stock market drops. We also find that over time, the relationship between a search category and industry returns can change both in magnitude and direction. Our model automatically accounts for this, since it is re-fitted every week. Lastly, we find that the abnormal returns of our model are only weakly correlated across countries, suggesting that our trading approach can be most beneficial when applied internationally.
dc.languageeng
dc.publisherNTNU
dc.titlePredicting financial markets with Google search categories
dc.typeMaster thesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record