Forecasting the Total Balance Sent to Debt Collection
Master thesis
Permanent lenke
http://hdl.handle.net/11250/2624616Utgivelsesdato
2019Metadata
Vis full innførselSamlinger
Sammendrag
Kredittkort har lenge vært en populær betalingsmetode og bruken vokser globalt. Kred-ittkortselskaper må stadig vurdere risikoen forbundet med pengeutlåning og en måte åmåle risiko i forbindelse med kredittkortutgifter er å spore antall inkassosaker over tid.Nøyaktige prediksjoner over antall kunder som blir sendt til inkasso i fremtiden vil derforvære svært interessant for kredittkortselskaper. Formålet med denne avhandlingen var åpredikere den totale balansen som blir sendt til inkasso hver måned for året 2019, basertpå historiske data fra SpareBank 1 Kredittkort AS i tidsperioden juli 2017 til september2018. I tillegg ønsket vi å bestemme hvilke faktorer som gjør at noen kunder er mer utsattfor mislighold.
Datasettet var longitudinelt med repeterende observasjoner hver måned for mer enn 500000 kredittkortkunder i Norge. En mixed effects logistisk regresjonsmodell ble konstruertog brukt som en klassifikator for å bestemme hvorvidt en kunde blir sendt til inkasso i engitt måned. Modellen ble deretter brukt til å klassifisere og telle antall inkassosaker i enmåned. Ved å multiplisere med gjenomsnittsbalansen en kunde skylder ga dette predik-sjoner for den totale balansen sendt til inkasso hver måned. Datasettet var svært ubalansertsiden de fleste kundene ikke blir sendt til inkasso. Vi brukte tilfeldig undersampling i til-legg til en metode for å justere outputen til en klassifikator. Modellen predikerte en økningi den totale balansen sendt til inkasso for året 2019. En mulig forbedring av modellen vilvære å samle tilleggsinformasjon for hver kunde som kan forklare hvorfor noen kunder ermer utsatt for mislighold. Dette kan blant annet være en kundes månedlige inntekt, andretyper usikret gjeld og sivilstatus. Credit cards have long been a popular form of payment method and the usage is growingworldwide. Credit card companies must constantly assess the risk of money lending andone way to measure risk in conjunction with credit card spending is to track the numberof debt collection cases over time. Accurate predictions of the number of customers sentto debt collection in the future is therefore of great interest to credit card companies. Theaim of this thesis was to forecast the total balance sent to debt collection each month forthe year 2019 based on historical data provided by SpareBank 1 Kredittkort AS in the timeperiod July 2017 to September 2018. Additionally, we aimed to determine factors thatmake some costumers more prone to delinquency in general.
The data provided was longitudinal with repeated measurements each month for more than500 000 credit card customers in Norway. A mixed effects logistic regression model wasmade and used as a classifier to determine whether a customer is sent to debt collection in agiven month. The model was then used to classify and count the number of debt collectioncases in a month. Multiplying with the average amount a customer owes gave predictionsfor total balance sent to debt collection each month. The data was highly imbalanced sincemost customers are not sent to debt collection. We used random undersampling as wellas a method to adjust the outputs of the classifier. The model forecasted an increase inthe total balance sent to debt collection for the year 2019. A possible improvement of themodel would be to collect additional personal information about each customer that couldpossibly explain why some customers are more prone to delinquency. These may includea customer’s monthly income, other types of unsecured debt and marital status.