Stacking classifiers for improved order execution
Abstract
Langsiktige handelsstrategier tar ikke nødvendigvis hensyn til kortsiktige prisbevegelser kort tid før og etter markedsordre er plassert. I denne oppgaven introduserer vi et rammeverk for å finne det mest lønnsomme tidspunktet for ordreutførelse, som tillater en tidsforsinkelse i ordreutførelse. Vi tar hensyn til tap i profitt assosiert ved å forsinke ordrer, og estimerer strategiparametere ved å modellere den totale økningen i risikojustert avkastning. Ordreutførelsesmodellen er basert på en ny tilpasning av stablingsklassifiserings-metoden inkludert renset K-fold kryssvalidering. Siden vanlig kryssvalidering forårsaker datalekkasje når finansielle tidsserier brukes, tillater vår tilnærming at en stablingsklassifiserer kan trenes uten overvurdert valideringsfold-ytelse. Vår stablingsklassifiserings-implementering bruker prediksjonssannsynlighetene til en LightGBM og en tilfeldig skogklassifiserer som input til en logistisk regresjonsmodell. Vi viser at utførelses-strategien overpresterer den opprinnelige handelsstrategien vesentlig når det tas hensyn til handelskostnader, og at den reduserer det totale antallet ordre. Dette antyder at utførelsesstrategien er i stand til å komprimere handelsstrategier, slik at mindre handelskostnader påløper, samtidig som den opprettholder eller øker den risikojusterte avkastningen til handelsstrategien. Long time horizon trading strategies do not necessarily consider short-term price movements in the period shortly before and after orders are placed. In this thesis, we introduce a framework for finding the most profitable time to execute an order, allowing a time delay in the order of days. We consider the opportunity cost of delaying orders and estimate execution parameters by modeling the total increase in risk-adjusted return. The order execution model is based on a novel adaptation of the stacking classifier ensemble method that incorporates purged K-fold cross-validation. As regular cross-validation causes data leakage when financial time series are used, our approach allows a stacking classifier to be trained without over-exaggerated validation fold performances. Our stacking classifier implementation uses the prediction probabilities of a LightGBM and a random forest classifier as inputs into a logistic regression model. We show that the execution strategy substantially outperforms the original trading strategy when accounting for trading costs, and that it reduces the total number of orders. This implies that the execution strategy can compress trading strategies by lowering trading costs while sustaining or increasing their risk-adjusted return.