The Importance of Mesh Resolution When Using the SPDE Approach

Røste, Julie

Røste, Julie

Master thesis

Åpne

no.ntnu:inspera:72373662:21626099.pdf (11.96Mb)

Permanent lenke

https://hdl.handle.net/11250/2778379

Utgivelsesdato

2020

Metadata

Vis full innførsel

Samlinger

Institutt for matematiske fag [2473]

Sammendrag

Målet med denne oppgaven er å undersøke viktigheten av oppløsningen til triangelnettet (eng: ``Mesh'') for SPDE-tilnærmingen til Lindgren et al. (2011). I denne tilnærmingen approksimeres et romlig Gaussisk felt (GRF) på et triangelnett.

Oppløsningen til dette nettet spiller en viktig rolle i å avgjøre den prediktive styrken, atferden til parameterestimatene, og tilpasningsevnen til dataen for SPDE-modellen. En høyere nettoppløsning gir bedre approksimasjoner, men på bekostning av høyere beregningstid. I tillegg til å øke oppløsningen til nettet så er det mulig å utvide nettet utover grensene til domenet for å redusere eventuelle grenseeffekter. Imidlertid gjør dette antallet noder i nettet øker, og gir derfor en høyere beregningstid. Det er derfor interessant å undersøke dette kompromisset mellom nøyaktigheten til approksimasjonene og beregningstiden. SPDE-modellen er mye brukt til romlig modellering, så mange brukere vil ha nytte av å finne retningslinjer for hvordan triangelnettet bør konstrueres.

Vi har gjort to case-studier, en med kontinuerlig data - logaritmisk transformert årlig nedbørsmengde over det kontinentale USA, og en med diskret data - utbredelse av videregående opplæring for kvinner i Kenya. En Gaussisk modell og en Binomisk modell blir brukt. Triangelnettet lages uavhengig av observasjonslokasjonene innenfor en gitt grense. Vi har variert to nettparametere, nemlig maksimal kantlengde mellom nettnoder, h, og ytre grenseutvidelse av nettet, r. For hver konfigurasjon beregner vi den prediktive styrken, atferden til parameterestimatene, og tilpasningsevnen til dataen.

Gjennom denne studien ser vi at økt nettoppløsningen gjennom h har størst innvirkning på resultatene, både når det gjelder prediktiv styrke og når parameterestimatene stabiliserer seg, men bare inntil en viss oppløsning. Nærmere bestemt ser en maksimal kantlengde på 1/12 av den romlige rekkevidden ρ tilstrekkelig ut for den Gaussiske dataen. For den Binomiske dataen er det tilstrekkelig med en lavere oppløsning på 1/4 av den romlige rekkevidden ρ. Å øke oppløsningen utover disse verdiene vil kun øke beregningstiden. Disse forslagene er bare retningslinjer for hvor man burde begynne når man lager triangelnett i SPDE-modellen, og det er derfor viktig å utforske nett med både finere og grovere oppløsning for å finne det optimale triangelnettet for et spesifikt problem.

The objective of this work is to investigate the importance of mesh resolution for the stochastic partial differential equation (SPDE) approach by Lindgren et al. (2011). In this approach, a Gaussian Random Field (GRF) is approximated on a mesh. The resolution of this mesh plays an important role in determining the predictive power, the behaviour of parameter estimates and the fitness of the model. A higher mesh resolution gives better approximations, but at the cost of longer runtime. In addition to increasing the resolution of the mesh, it is possible to extend the mesh beyond the boundary of the domain to reduce possible boundary effects. This, however, adds more nodes to the mesh and gives longer runtime. Therefore, it is interesting to investigate this trade-off between approximation accuracy and runtime. The SPDE approach is widely used for spatial modelling, so many users will benefit from finding guidelines on how to construct the mesh.

We have performed two case studies, one with continuous data - annual precipitation in the conterminous US, and one with count data - prevalence of secondary education for women in Kenya. A Gaussian model and a Binomial model are used. The mesh is created independently of the observation locations inside a given boundary. We have varied two mesh parameters, the maximum edge length between mesh nodes h and the outer boundary extension r. For each configuration, the elements of interest are computed.

Throughout this study, we find that increasing the mesh resolution through h has the strongest impact on the results, both in terms of predictive power, when the parameter estimates stabilize and for model fitness, but only up to a certain mesh resolution. Specifically, a maximum edge length of 1/12 of the spatial range seems to be sufficient for the Gaussian case. For the Binomial case, a lower resolution is sufficient with an h of 1/4 of the spatial range. Increasing the mesh resolution more than this will only increase the runtime. These suggestions are only guidelines on where to start when building the mesh, and thus it is important to explore meshes with both lower and higher resolutions to find the optimal mesh for a particular problem.

Utgiver

NTNU