Estimation in credibility models using Bayesian hierarchical models
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3026024Utgivelsesdato
2022Metadata
Vis full innførselSamlinger
Sammendrag
Kredibilitetsteori gir både fundamentet og den originale modellen for hvordan forsikringsbransjen predikerer forventet tap og prisnivåer (Bühlmann & Gisler, 2005). I moderne statistikk ser vi at kredibilitetsteori gir en metode for estimering av tilfeldige effekter i generaliserte miksede lineære modeller. I denne oppgaven foreslår vi to alternative modeller som begge utvider den originale modellen. De foreslåtte modellene utvider også strukturen til en generalisert mikset lineær modell og betraktes som Bayesianske hierarkiske modeller. Den første modellen vi foreslår antar en normalfordeling på de tilfeldige effektene. Dette går lenger enn den originale modellen som kun gjør antakelser på det første og andre momentet til de tilfeldige effektene. Den andre foreslåtte modellen tar med seg antakelsene til den første modellen og bygger igjen videre på denne ved å anta at de faste effektene også har en sannsynlighetsfordeling. I likhet med de tilfeldige effektene, antar vi at de faste effektene er normalfordelte. I tillegg antar også denne modellen en apriorifordeling på variansen til de tilfeldige og faste effektene.
Kredibilitetsteori alene er ikke nok til å estimere parametere i de foreslåtte modellene. For den første foreslåtte modellen implementerer en variant av Monte Carlo expectation-maximization-algoritmen som er beskrevet i Levine and Casella (2001). For den andre modellen foreslås en implementering av Markov Chain Monte Carlo-algoritmen. Ved rangering av resultater fra den originale modellen, den første og den andre foreslåtte modellen, viser vi at den andre modellen kan slå den originale. Med andre ord, vi ser at en Bayesiansk hierarkisk modell med fordelinger på både de faste og tilfeldige effektene kan gjøre det bedre enn den originale modellen. Markov Chain Monte Carlo-algoritmen gir en beregningstung metode, og sammenlignet med den originale modellen, og dens metode, opplever vi treg konvergens. Avslutningsvis ser vi på alternativer for estimering og implementering som kan gi en metode som slår den originale modellen på resultater og samtidig tar hensyn til beregningstid. Credibility theory lays the foundations and provides the original model of how the insurance industry predicts expected loss and determines price levels (Bühlmann & Gisler, 2005). In the context of modern statistics, credibility theory is used to estimate random effects in a generalized linear mixed model. This thesis proposes two alternative models, serving as extensions to the original model. The proposed models extend the usual framework of a generalized linear mixed model, giving Bayesian hierarchical models. The first proposed model extends the distributional assumptions on the random effects by assuming that they are normally distributed. This extends the original model, which is restricted to assumptions only about the first and second moment of the random effect. The second proposed model keeps the distributional assumptions made in the previous model and extends this by adding assumptions on the fixed effects of the general linear mixed model. As with the random effects, we assume that the fixed effects are normally distributed. The last model also assumes a prior distribution on the variance parameters of the fixed and random effects.
Credibility theory is insufficient to estimate the parameters of the proposed models. For the first model, we implement a variation of the Monte Carlo expectation-maximization algorithm, as proposed in Levine and Casella (2001). For the last model, we employ Markov Chain Monte Carlo. Ranking the results from the three models, i.e. the original model and the two proposed extensions, we find that a Bayesian hierarchical model with prior distributions on both the fixed and random effects arguably outperforms the original model. Given the complexity of the Markov Chain Monte Carlo algorithm, we get a computer-intensive method, and compared to the original model and its estimation method, convergence is slow. Finally, we discuss alternatives for estimation and implementation that can yield a method outperforming the original model.