Estimating Value at Risk from implied volatilities using machine learning methods and quantile regression
Abstract
I denne studien foreslår vi en semi-parametrisk, sparsommelig Value at Risk-prognosemodell basert på kvantilregresjon og maskinlæringsmetoder, kombinert med markedspriser på opsjonskontrakter hentet fra over-the-counter valutakurs interbankmarkedet.
Value at risk (VaR) er et viktig risikomål som nå brukes mye av finansinstitusjoner. Verktøy for å måle VaR nøyaktig er derfor nødvendig for å kvantifisere risiko i finansmarkedene. Denne studien forsøker å forbedre eksisterende konsepter og ideer for å forutsi VaR ved hjelp av maskinlæring. To ulike konsepter brukes, ensemblemetoder og nevrale nettverk.
Implisitte volatiliteter brukes som forklaringsvariabler. Modellens fremtidsrettede natur, oppnådd ved bruk av implisitte volatiliteter, sikrer at ny informasjon raskt fremkommer i Value at Risk-estimatene.
De foreslåtte modellene oppnår gode estimater på tvers av alle kvantiler. Blant ensemblemodellene skiller light gradient-boosting machine modellen og categorical boosting modellen seg ut sammenlignet med QR-IM-modell. Begge modellene gir estimater som er bedre eller lik referansemodellen. De nevrale nettverksmodellene er generelt ganske ustabile og kan ha nytte av mer treningsdata og kanskje en bedre modellarkitektur. Modellkombinasjoner og optimalisering av hyperparameter bidrar begge til en kollektiv forbedring av predikasjonsevnen til modellene. In this study we propose a semi-parametric, parsimonious Value at Risk forecasting model based on quantile regression and machine learning methods, combined with readily available market prices of option contracts from the over-the-counter foreign exchange rate interbank market.
Value at risk (VaR) is an important risk measure now widely used by financial institutions. Tools for measuring VaR with high accuracy is therefore important to assess risk in financial markets. This study attempts to improve existing methods for predicting VaR using machine learning. We use two different methods, ensemble methods and neural networks.
Explanatory variables are implied volatilities with plausible economic interpretation. The forward-looking nature of the model, achieved by the application of implied volatilities as risk factors, ensures that new information is rapidly reflected in Value at Risk estimates.
The proposed models achieves good estimates across all quantiles. Among the ensemble models, the light gradient-boosting machine model and the categorical boosting model stand out compared to our base line QR-IM model. Both models yield estimates which are better or equal to those of the bench mark model. The neural network models are in general quite unstable and could benefit from more training data and perhaps a better model architecture. Model stacking and hyperparameter tuning contribute to an improved model in terms of the over all performance of the predictions.