Market Regime Adaptive Stock Prediction Models
Abstract
Å undersøke forskjeller mellom markedsperioder er et populært tema i økonomisk litteratur, med flere forslag til forskjellige optimale investeringsstrategier gitt effekten av forskjellene mellom markedsperioder. Selv om det forskes mye på algoritmer knyttet til aksje-prediksjon, er effekten av valget av data brukt til å trene disse modellen like viktig å forstå. Denne oppgaven prøver å kombinere maskinlæringsmodeller med økonomisk teori for å utføre en omfattende test av aksjeprediksjons-modeller som er trent på data fra forskjellige markedsperioder.
Forskjellige kvalitative og kvantitative metoder er brukt til å velge ut treningsperioder, med et fokus på resesjoner og bear-markeder. Kvantitative avkastnings-filtre, Long Short-Term Memory-modeller og Markovregresjon-modeller er brukt for å predikere forskjellige markedsperioder på ny data. En ensemble-modell for aksjeprediksjon som består av flere maskinlæringsalgoritmer blir brukt til å klassifisere aksjeselskaper som relativt over- eller under-presterende basert på ukentlig avkastning for å lage en long/short-portefølje.
Resultatene fra både prediksjon av markedsregimer og aksjekurser blir presentert. Prediksjon av markedsregimer viser seg å være vanskelig og fører til ustabile klassifiseringer. Disse modellene kan sannsynligvis forbedres med videre arbeid. Aksjemodellene trent på spesifikke markedsperioder viser seg å gi mye bedre avkastning når de brukes under lignende markedsperioder som de modellene ble trent på. Muligheten for en markedsperiode-adaptiv modell for aksjeprediksjon blir presentert, som er en kombinasjon av prediksjon av markedsperioder sammen med aksjeprediksjoner. Aksjemodellene trent på negative markedsperioder viser seg å fungere suboptimalt når den blir brukt på predikerte markedsregimer, som fører til at den adaptive modellen ikke fungerer som ønsket. Derimot viser aksjemodeller som er trent på positive markedsregimer statistisk signifikante resultater i forhold til modeller trent på all data, som viser verdien av å trene modeller på spesifikk data. Aksjemodellene gir også mye høyere ukentlig gjennomsnittsavkastning når de brukes under predikerte negative markedsregimer i motsetning til å alltid bruke modellene. Differences between market regimes are widely discussed in the economic literature, with different optimal investment strategies stemming from the effects of differences between regimes. Although research in stock prediction algorithms is abundant in literature, the effects of the choice of data used to train these models is just as important to understand. This thesis seeks to combine machine learning models with economic theory to thoroughly test stock prediction models which are trained on data from different kinds of market regimes.
Multiple qualitative and quantitative methods are used to choose training periods, with a focus on recessions and bear markets. Quantitative return filters, Long Short-Term Memory models and Markov switching models are used to predict different market regimes out-of-sample. An ensemble stock prediction model consisting of multiple machine learning algorithms is used to classify companies as relative over- or under-performers based on weekly stock price changes to construct a long-short portfolio.
The results of both the regime and the stock prediction are presented. Regime prediction proves to be difficult and shows unstable classifications, but may show promise with more work. Stock models trained on specific market periods show much higher returns when used in similar market periods. The possibility of a market regime adaptive stock prediction model is also presented, which is a combination of out-of-sample prediction of market regimes along with stock predictions. The performance of stock models trained on negative market periods is sub-par when used during predicted market regimes, resulting in an adaptive model not working as hoped. However, stock models trained on positive market regimes show statistically significant results compared to models trained on all data, showing the value in training models on specific market periods. Stock models are also shown to give much higher mean weekly returns when used during predicted negative market periods as opposed to trading all the time.