Applying Machine Learning to Factor Investing in the Corporate Bond Market
Description
Full text not available
Abstract
Ved å anvende teknikker fra maskinlæring, utforsker vi effektiviteten av faktorinvestering i markedet for selskapsobligasjoner. Vår analyse tar for seg syv sentrale faktorer: Størrelse, Verdi, Kvalitet, Momentum, ESG, Rente og Likviditet, og fokuserer på dollar-denominerte investment grade- og high yield obligasjoner fra perioden 2016 til 2021. Vi anerkjenner kompleksiteten i obligasjonsmarkedet og mangelen på enighet om definisjonen av hver faktor. Derfor foreslår vi en rekke alternative definisjoner for hver faktor, og ved hjelp av en ensemble-tilnærming, hvor vi benytter oss av XGBoost, Permutation Importance, SHAP Values og Recursive Feature Elimination, for å identifisere de mest innflytelsesrike alternativene for hver faktor i forhold til å forklare avkastning. Selv om enkeltfaktorstrategier viser seg å være lovende, er effektiviteten deres varierende. For å fange opp det komplekse, ikke-lineære samspillet mellom faktorene, konstruerer vi i tillegg en XGBoost-multifaktormodell. Denne modellen genererer bemerkelsesverdige alfa-verdier på 5,09 for investment grade obligasjoner og 2,77 for high yield obligasjoner, ledsaget av solide Sharpe- og Sortino-verdier. Videre konstruerer vi lineære multifaktorporteføljer som også genererer positive alfaer og betydelige Sharpe-verdier, noe som understreker fordelene ved diversifisering. En vesentlig utfordring med vår metodikk er imidlertid den høye omløpshastigheten av obligasjoner i både enkeltfaktor- og multifaktorporteføljer, et problem som forsterkes av transaksjonskostnader. Dette er en viktig overveielse ved implementering av disse strategiene i en reell setting. Using machine learning techniques, we investigate the effectiveness of factor investing in the corporate bond market. The analysis encompasses seven notable factors: Size, Value, Quality, Momentum, ESG, Interest Rate, and Liquidity, and focuses on U.S.-denominated investment grade and high yield bonds from 2016 to 2021. Recognizing the complex nature of the bond market and its multiple factor interpretations, we propose and investigate a range of potential features within each factor. Through an ensemble approach, we use XGBoost, Permutation Importance, SHAP Values, and Recursive Feature Elimination to identify the features representing factors most influential in explaining returns. Although single-factor strategies show promise, their effectiveness is inconsistent. To capture the complex non-linear interactions among factors, we construct an XGBoost multi-factor model that combines these individual factors. This model yields noteworthy alphas of 5.09 for investment grade and 2.77 for high yield bonds, accompanied by Sharpe and Sortino ratios clearly above the benchmark index. Furthermore, we develop linear multi-factor portfolios generating positive alphas and substantial Sharpe ratios, highlighting the benefits of diversification. Nevertheless, a fundamental challenge emerges in the high turnover rates when considering transaction costs, which poses an obstacle to implementing these strategies in practical, real-world trading.