Analysing Nested Data with Multilevel Models

Bauer-Nilsen, Louise.

Bauer-Nilsen, Louise.

Bachelor thesis

Åpne

no.ntnu:inspera:56982622:30844272.pdf (6.988Mb)

Permanent lenke

https://hdl.handle.net/11250/2980254

Utgivelsesdato

2020

Metadata

Vis full innførsel

Samlinger

Institutt for matematiske fag [2531]

Sammendrag

For å analysere nestede datasett bruker vi metoden for flernivåmodellering. Med nestede datasett mener vi at vi har en naturlig gruppering i datasettet. Ved å bruke flernivåmodellering til å analysere dataen kan vi få innsikt i variasjon mellom og innad i grupper og forskjellen i variabilitet for de forskjellige flernivåmodellene. Vi bruker R-pakken lme4 og bruker funksjonen lmer() for å tilpasse de forskjellige flernivåmodellene. For de forskjellige modellene lar vi enten skjæringspunktet eller stigningstall variere. Dette gir oss tre forskjellige modeller, modellen med varierende skjæringspunkt, modellen med varierende stigningstall, og til sist, modellen hvor vi lar både stigningstall og skjæringspunkt variere. På modellene kan vi også legge til prediktorer på de forskjellige nivåene. Vi bruker et eksempel på radondata der vi vil måle radonnivåene i amerikanske hjem, dataen er strukturert slik at vi har husholdninger inni de forskjellige fylkene. Vi tilpasser dataene våre og kan se, etter modell sjekking, at en mer komplisert modell vil forbedre tilpasningen, og vi kan også observere variansen i de forskjellige nivåene.

To analyse nested data we use the method of multilevel modeling. By nested data we mean naturally structured groups within our data. With the information we receive by fitting multilevel models, we can illustrate how the group variances and the model variability change for the different multilevel models and how to analyse the output from R code. We use the R package lme4 and use the function lmer() to fit the different multilevel models. For the different models we allow either the intercept or slope of the model to vary. This gives us three different models, the random intercept model, the random slope model, or by allowing both to vary: random intercept, random slope model. For the different models we are able to add predictors at the different levels. We use an example of radon data where we want to measure the radon levels in US homes, the data is structured so that we have households nested within counties. We fit our data and observe with model checking that the model fit will improve with more complex models and calculate the explained variance at each level.

Utgiver

NTNU