Konkursprediksjon for norske selskaper - En sammenligning av regresjonsmodeller og maskinlæringsteknikker
Abstract
Formålet med denne studien er å undersøke hvorvidt maskinlæringsteknikker er bedre i stand til å estimere modeller for konkursprediksjon enn tradisjonelle statistiske metoder. Konkursprediksjonsmodeller estimeres ved hjelp av tre maskinlæringsteknikker (nevrale nettverk, støttevektormaskiner og k-nærmeste naboer) og to regresjonsmetoder (logistisk regresjon og en generalisert additiv modell) for å se om og hvordan prediksjonsevnen kan forbedres. Studien undersøker også om modellers uavhengige variabler har innvirkning på prediksjonsevne ved å estimere modeller med tre ulike variabelsett: et basert på Norges Banks SEBRA-modell, et basert på Altmans Z-score-modell og et egenutviklet. Denne studien bidrar til litteraturen ved å benytte moderne konkursprediksjonsteknikker på et omfattende norsk datasett (samtlige årsregnskaper fra norske aksje- og allmennaksjeselskaper i perioden 2005 til 2012). Resultatene tyder på at den generaliserte additive modellen (GAM) er den av regresjonsmetodene som estimerer de beste modellene, mens nevrale nettverk (NN) er den best egnede maskinlæringsteknikken, uavhengig av hvilket variabelsett modellene baserer seg på. Modeller estimert ved GAM gir marginalt bedre prediksjonsevne enn modeller estimert ved NN, men forskjellen er ikke signifikant. Dessuten blir forskjellen mellom modeller basert på GAM og den best egnede maskinlæringsteknikken gradvis mindre jo flere variabler som benyttes i modellene.