Financial Distress Prediction Using Machine Learning and XAI: Developing an Early Warning Model for Listed Nordic Corporations
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3023757Utgivelsesdato
2022Metadata
Vis full innførselSamlinger
Sammendrag
Denne oppgaven lanserer en forklarbar modell for tidlig varsling av økonomisk vanskeligstilthethos børsnoterte selskaper som er generaliserbar på tvers av landegrenser i Norden. En LightGradient Boosting Machine (LightGBM) og et kunstig nevralt nettverk måles opp mot en logistiskregresjonsmodell som referanse på et datasett bestående av kvartalsvis regnskapsdata, informasjonfra finansmarkedene og makroøkonomiske indikatorer. Etter datavask omfatter datasettet totalt639 børsnoterte nordiske selskaper i perioden Q1 2001 til Q2 2022. LightGBM utkonkurrererde andre modellene, og med en ROC-AUC-poengsum på 0.93 og F1-poengsum på 0.63, overgårreferansemodellen med en betydelig margin.
Vi fremlegger også et ende-til-ende-rammeverk for innsamling og prosessering av data som kangjenskapes for både akademiske og industrielle formål. Vi bruker en proxybasert definisjon på økonomisk vanskeligstilthet som er i tråd med finansiell intuisjon og bransjepraksis. Denne proxyen erbasert på forholdstall for solvens (rentedekningsgrad) og likviditet (likviditetsgrad 1), og i samsvarmed standard måltall for obligasjons- og låneforpliktelser.
Valg av inputvariabler og modellforklaring gjøres ved bruk av SHAP, et rammeverk for forklarbar kunstig intelligens, og resultatene viser tydelig at variabler relatert til likviditet, solvens ogselskapsstørrelse er av stor betydning for modellens output. Analysen avdekker også at inkludering av sesongmessighet, samt makro- og markedsinformasjon viser seg å være fordelaktig grunnetinteraksjonseffekter med andre variabler.
Kombinasjonen av følgende elementer skiller denne oppgaven fra tilsvarende arbeid: (i) Observasjon av sesongmessig variasjon på kvartalsbasis, noe som sjeldent belyses i relatert litteratur, (ii)det geografiske fokusområdet (Norden), (iii) inkludering av makro- og markedsvariabler som fangerselskapets omgivelser. I tillegg sammenlikner denne oppgaven to toppmoderne maskinlæringsmodeller og en anerkjent referansemodell, noe som bidrar til den komparative litteraturen. This paper proposes an explicable early warning model for financial distress which generalizesacross listed Nordic corporations. A Light Gradient Boosting Machine (LightGBM), an ArtificialNeural Network (ANN) and a benchmark Logistic Regression (LR) model are applied to a datasetconsisting of quarterly accounting data, information from financial markets, and indicators ofmacroeconomic trends. After cleaning, the dataset includes 639 listed Nordic companies in theperiod Q1 2001 to Q2 2022. LightGBM proves to be the superior model, achieving a ROC-AUCscore of 0.93 and an F1 score of 0.63, surpassing the benchmark model by a significant margin.
In addition, we propose an end-to-end framework for data collection and pre-processing, providing a transparent data treatment procedure which is replicable for both academic and industrialpurposes. We apply a proxy-based definition of financial distress in line with financial intuitionand industry practices. This proxy is based on measures of solvency (Interest Coverage Ratio) andliquidity (Current Ratio), in accordance with standard bond and loan covenants.
Feature selection and model explanation are performed using the explainable AI framework SHAP.Results clearly show that features related to liquidity, solvency, and size are highly important tothe output. The analysis also uncovers that including seasonality, macro and market informationproves advantageous due to interaction effects with other variables.
The combination of the following aspects sets this paper apart: (i) employing quarterly data,allowing us to study the problem on a finer scale and capture seasonality effects, which has rarelybeen recorded in related literature before, (ii) the geographical area of study (the Nordics), and(iii) the inclusion of macro and market variables which capture the environment surrounding thecompany. In addition, this paper offers a comparison of state-of-the art machine learning modelsand a renowned benchmark model, contributing to the body of comparative literature.