Vis enkel innførsel

dc.contributor.advisorWahlstrøm, Ranik Raaen
dc.contributor.authorØdegård, Jesper
dc.contributor.authorMeek, Marcus André Glover
dc.date.accessioned2023-09-19T17:20:38Z
dc.date.available2023-09-19T17:20:38Z
dc.date.issued2023
dc.identifierno.ntnu:inspera:146720057:151630557
dc.identifier.urihttps://hdl.handle.net/11250/3090592
dc.description.abstractDenne avhandlingen er avgrenset til finansielle data om kunder fra en samarbeidende bank, og eksterne og makroøkonomiske data. Avhandlingen undersøker hvilke \\egenskaper hos lånekunder som kan påvirke sannsynligheten for kundefrafall ved hjelp av følgende maskinlæringsmetoder (ML) for prediksjon; Logistisk Regresjon og XGBoost. Variabel-analysene av SHAP og LASSO brukes for å forstå resultatene fra ML-modellene og variablenes betydning. Resultatene fra denne avhandlingen indikerer at alderen til lånekunder og kredittrisiko, som indikert av PD, er sentrale faktorer for å forklare kundefrafall. I tillegg påvirker følgende variabler sannsynligheten for kundefrafall betydelig; lån-til-verdi (LTV), tilbakebetalingsplan, kundens varighet og boligkreditt, sammen med andre moderat påvirkende variabler. Imidlertid viste variabler som er forventet å ha en innvirkning, slik som bostedsområde, størrelse på husholdninger og andre, ingen signifikant innflytelse. Egenskapene som påvirker frafall hos verdifulle kunder, var forskjellige fra de hos andre kunder. For verdifulle kunder hadde alderen til lånekunden mindre innvirkning, mens inntekt, DTI (gjeldsgrad) og lånebalanse hadde en mer betydelig rolle. Variabelanalysen bekrefter at eksterne og makroøkonomiske faktorer påvirker kundefrafall. Faktorer som boligprisindeks og styringsrente hadde betydning, spesielt for kunder med høyere verdi. Når det gjelder evnen til å forutsi kundefrafall ved hjelp av ML-metoder, viste både XGBoost og logistisk regresjon svake prediktive resultater. Det var derimot indikasjoner på at prediksjon av kundefrafall innenfor banker kunne gjøres med en økt mengde data og reduserte ubalanser. Konklusjonen er at denne avhandlingen bidrar til å forstå faktorene som påvirker kundefrafall blant lånekunder, og de prediktive evnene til ML-metoder på finansielle bankdata. Forbedringer i datakvalitet, modellprestasjon og innlemming av kvalitative data foreslås for fremtidige studier for å oppnå mer robuste og handlingsrettede resultater.
dc.description.abstractThis thesis is delimited to the financial data of customers in a bank with the help of a collaborative bank and external and macroeconomic data. The thesis investigates what characteristics in loan customers can influence the likelihood of their churn, with the help of prediction through the machine learning (ML) methods; Logistic Regression and XGBoost. The variable analysis of SHAP and LASSO are used to better understand the ML models and the importance of variables. The findings of this thesis indicate that the age of the loan customer and credit risk, as indicated by PD, are key factors in explaining customer churn. Additionally, loan-to-value (LTV), repayment plan, customer duration, and the loan balance of "boligkreditt", significantly influenced the likelihood of customer churn alongside other moderately impactful variables. However, variables that might be expected to have an impact, such as area of residence, size of the households and others showed no significant influence. The characteristics influencing churn in valuable customers differed from those in other customers. For valuable customers, the age of the loan customer had a lesser impact, while income, DTI, and repayment loan balance played a more significant role. The variable analysis confirms that external and macroeconomic factors influence customer churn. Factors such as the housing price index and policy rate held significance, especially for higher-valued customers. Regarding the ability to predict customer churn using ML methods, both XGBoost and LR showed weak predictive results. However, there were indications that churn predictions within banks could be made with an increased amount of data and reduced imbalances. In conclusion, this thesis contributes to understanding the factors influencing loan customers' churn and the predictive abilities of ML methods on financial banking data. Improvements in data quality, model performance, and incorporation of qualitative data are suggested for future studies to achieve more robust and actionable results.
dc.languageeng
dc.publisherNTNU
dc.titleExplainable Machine Learning for Customer Churn Prediction
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail
Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel