Interpretable Deep Learning for Bankruptcy Prediction

Kaspersen, Aleksander; Lindemark, Olav

dc.contributor.advisor	Næss, Arild Brandrud
dc.contributor.author	Kaspersen, Aleksander
dc.contributor.author	Lindemark, Olav
dc.date.accessioned	2022-09-20T17:23:33Z
dc.date.available	2022-09-20T17:23:33Z
dc.date.issued	2022
dc.identifier	no.ntnu:inspera:111624424:113376739
dc.identifier.uri	https://hdl.handle.net/11250/3020001
dc.description.abstract	Konkurs fører til betydelige tap for både næringsliv og samfunnet som helhet. Derfor har konkursprediksjon vært et viktig tema for akademikere, finansielle institusjoner, bedriftsledelse og andre interessenter. I de siste årene, har flere maskin- og dyplæringsmetoder med gode prediktive evner blitt utviklet. Likevel, på grunn av black–box–problemet, som medfører redusert tolkbarhet og pålitelighet, blir gjerne enklere maskinlæringsmodeller foretrukket for bruk i den virkelige verden. I denne oppgaven utforsker vi bruken av “Lang korttidsminne” (LSTM) nettverk, i stand til å bruke sekvensiell regnskapsdata for konkursprediksjon. For å forbedre tolkbarheten av LSTM nettverkene implementerte vi Shapley Additive Explanations-rammeverket (SHAP). Videre, for å evaluere de prediktive evnene til LSTM nettverkene, konstruer vi et rekurrent nevralt nettverk (RNN), og et flerlags forovermatet nevralt nettverk. Modellene blir trent på et datasett med små og mellomstore norske bedrifter (SMB). Datasettet består av 212 020 ukonsoliderte årsregnskap fra perioden 2006– 2019, som vi brukte til å konstruere 156 variabler. Kun en liten prosentandel av regnskapene (0,5665%) var klassifisert som konkurs i perioden, noe som betyr at datasettet er svært ubalansert. For å ta høyde for dette, ble en kostnadssensitiv læringsstrategi brukt i treningen av de nevrale nettverkene. LSTM-nettverket som brukte en sekvens på fire regnskapsår og alle variabler oppnådde en AUC og Brier score på respektive 0.9288 og 0.0477, en økning på 5,56% i AUC og reduksjon på 65,36% sammenlignet med det forovermatede nevrale nettverket. I tillegg oppnådde LSTM-nettverket som brukte en sekvens på fire regnskapsår og 30 variabler en økning på 1,74% i AUC sammenlignet med RNN. Dette indikerer at LSTM-nettverkene har høyere prediktive evner enn de andre nevrale nettverkene. Videre observerte vi en reduksjon av prediktive evner når vi reduserte sekvenslengden, noe som indikerer at lengre sekvenser av data øker LSTM-nettverkene sin evne til å predikere konkurs. For å øke tolkbarheten av LSTM-nettverkene, brukte vi SHAP-rammeverket for å forklare individuelle prediksjoner, samt for å gi innsikt til den generelle oppførselen til modellene. Videre sammenlignet vi om den lærte oppførselen til LSTM-nettverkene var i tråd med økonomisk teori. I tillegg diskuterte vi SHAP-rammeverkets evner fra et finansinstitusjons- og beslutningstakingsperspektiv. Funnene våre tyder på at SHAP-rammeverket øker tolkbarheten av dype nevrale nettverk, og derfor kan fasilitere bruk av komplekse, høytytende LSTM-nettverk for konkursprediksjon i næringslivet.
dc.description.abstract	The financial failure of a firm causes considerable losses to both the business community and society as a whole. Consequently, bankruptcy prediction has been a field of great interest and importance for academics and practitioners alike. In recent years, more opaque machine and deep learning methods have been developed, proven to have superior predictive performance compared to simpler machine learning models. Still, simpler bankruptcy prediction models are often preferred for use in practice due to the black box problem, encompassing reduced interpretability and trustworthiness. In this thesis we explore the use of long short-term memory (LSTM) networks capable of utilizing sequential accounting data for bankruptcy prediction, while focusing on interpretability using the Shapley Additive Explanations (SHAP) framework. Further, to evaluate the predictive performance of the LSTM networks, we create a recurrent neural network (RNN) and a fully connected feed-forward neural network. The networks are trained on a real-world dataset of Norwegian small and medium sized enterprises (SME). The dataset consists of 212 020 unconsolidated financial statements from 2006–2019, used to construct 156 predictor variables. Only a small percentage of the financial statements (0.5665%) were classified as bankrupt in the period, meaning the dataset is severely imbalanced. To account for this, we implement a cost-sensitive learning strategy in the training of all the deep neural networks. The LSTM network using a sequence of four accounting years and all features, obtained an AUC and a Brier score of 0.9288 and 0.0477, respectively. This was an increase of 5.56% in AUC and decrease of 65.36% in Brier score compared to the fully connected feed-forward neural network. Moreover, the LSTM network using a subset of 30 features and a sequence of four years achieved an increase of 1.74% in AUC compared to the RNN. This indicates that LSTM networks have higher predictive performance than the baseline neural networks. We further observed a decrease in predictive performance for each time step omitted from the LSTM networks, indicating that longer sequences of data better enables the LSTM networks to predict bankruptcy. To enhance model interpretability, we implement SHAP to explain individual predictions and to give insight into the general logic of the model. Moreover, we evaluate whether the learned behavior of the LSTM networks is consistent with economic theory and discuss the framework’s capabilities from a financial institution and decision-making perspective. Our findings suggest that SHAP increases the interpretability of deep neural networks, and therefore facilitates adoption of high-performing LSTM networks for bankruptcy prediction in the financial services sector.
dc.language	eng
dc.publisher	NTNU
dc.title	Interpretable Deep Learning for Bankruptcy Prediction
dc.type	Master thesis

Files in this item

Name:: no.ntnu:inspera:111624424:1133 ...
Size:: 9.992Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

NTNU Handelshøyskolen [1645]

Show simple item record