Non-Stationary Spatial Random Walk Models on Graphs
Abstract
Besag-modellen er en romlig statistisk modell som er mye anvendt for data på grafstrukturer. Modellen er spesielt nyttig i tilfeller der tilang på data er begrenset, som ofte er tilfellet for helserelaterte undersøkelser på store romlige skalaer. En potensiell svakhet i Besag-modellen er den innehavende antagelsen om stasjonær romlig korrelasjon. Vi forsøker å forbedre dette ved å definere en alternativ modell med flere romlige presisjonsparametere som regulariseres med konservative gamma-priors, med intensjon å fange romlig korrelasjonsstrukturer mellom individuelle nodepar i den underliggende grafen. En slik økning i antall modellparametere vil kreve større datasett for å oppnå god inferens, noe vi løser med replikater over tid med en AR1-modell som fanger grunnleggende temporale korrelasjonsstrukturer. Den resulterende modellen er beregningskrevende, og diverse beregningsstrategier er derfor utviklet for å oppnå akseptabel beregningstid under trekking fra posteriori fordelingen. Egenskapene til modellen er utforsket gjennom anvendelser på simulerte data, og et dataset om dødelighetsrater i fastlandsprovinser i Spania mellom 1975 og 2022. Analysen inkluderer omfattende tolkning av inferens på parametere, og evaluering av prediktive egenskaper med sammenlikning til en temporal versjon av Besag-modellen. Vi utforsker også muligheter for å bruke den foreslåtte modellen til deteksjon av tilnærmet stasjonære nodegrupper. The Besag model is a spatial statistical model which is widely used for data on graph structures. It is especially useful in cases where access to data is limited, which is often true for health-related surveys on large spatial scales. A potential shortcoming of the Besag model is the inherent assumption of stationary spatial correlation. We attempt to remedy this by defining an alternative model with multiple spatial precision parameters regularized by conservative gamma-priors, with the intention of capturing spatial correlation structures between individual node-pairs in the underlying graph. Such an increased number of model parameters will inevitably require more data to get good parameter inference, which we solve with replicates over time using an AR1 model capable of capturing basic temporal correlation structure. The resulting model is computationally expensive, and various computational strategies are therefore developed to achieve acceptable computing times during posterior sampling. The properties of the model are explored through applications on simulated data, and on a dataset regarding mortality rates in the mainland provinces of Spain between 1975 and 2022. The analysis includes extensive interpretation of parameter inference, and evaluation of predictive abilities with comparison to a temporal version of the Besag model. We also explore possibilities of using the proposed model for detection of approximately stationary node groups.