Optimizing Groundwater Level Prediction: Improving Time-Series Reconstruction and Donor Site Selection Strategies
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3116262Utgivelsesdato
2023Metadata
Vis full innførselSamlinger
Beskrivelse
Full text not available
Sammendrag
Tidsserieprediksjon for grunnvannsnivå spiller en avgjørende rolle i vannressursforvaltningen, spesielt når data er begrenset. Den nåværende datadrevne estimeringen på uovervåkede steder ved bruk av komparativ regional analyse involverer rekonstruering av tidsserier basert på likhet med nærliggende referansestasjoner. Nøyaktigheten av disse spådommene kan imidlertid være avhengig av riktig utvalg av donorsteder. Hovedmålet med denne studien var å optimalisere utvalget av disse referansestedene og inkorporere stedsspesifikke kontroller (deskriptorer) for forsterket prediksjonsnøyaktighet.Først undersøkes effektiviteten av multi-orders hydrologisk posisjon (MOHP) data som supplerende funksjoner i prediksjon av grunnvannshodevarighetskurve (HDCs). En analyse av både predikerte og observerte HDC-er i rekonstruksjonsprosessen viste at MOHP-dataintegrasjon ikke forbedrer prediksjonsresultater. Videre antyder den marginale forbedringen observert med inkorporering av HDC-er at forbedring av HDCs prediksjonsnøyaktighet kanskje ikke er den fremste prioritet.For å bestemme optimale kriterier for å avgrense utvalget av potensielle donorsteder, ble det utført en omfattende vurdering av forskjellige stedsbeskrivelser. Funnene avslører at mindre begrensende områder generelt forbedrer prediksjonsnøyaktigheten på stedene som også er små ved denne kontrollen. Større begrensende områder er nødvendig når fokuset er på nettsteder som viser spesifikke deskriptorer. Selv om potensialet for å heve prediktiv R2 til 0,82 eksisterer, er det en utfordring å oppnå dette hengslet på valget av hvert nettsteds optimale kontroll, gitt forskjellen mellom kontroller på tvers av forskjellige nettsteder. Til tross for dette dukket det opp observerbare mønstre, for eksempel nødvendigheten av morfologirelaterte kontroller i områder som opplever morfologiske endringer.Utover kontrollvalg innebærer en alternativ strategi for å styrke prediksjonsnøyaktigheten å bruke den observerte likheten til tidsserier mellom to brønner. For dette ble en Random Forest Regression-modell utviklet for å forutsi likheten (R2) mellom to steder. Denne innovative tilnærmingen prioriterte de tre stedene med høyest likhet for tidsserierekonstruksjon, og kulminerte med en forbedring på 3 % i gjennomsnittlig R2 for den rekonstruerte tidsserien.Denne forskningen belyser det komplekse samspillet mellom stedsparametere i grunnvannsprediksjon og tar til orde for raffinerte metoder basert på referansebrønnvalg. Dessuten understreker det det transformative potensialet til maskinlæringsmetodologier, spesielt Random Forest Regression, når det gjelder å overskride tradisjonelle utfordringer i grunnvannsspådommer. Groundwater level time-series prediction plays a crucial role in water resource management, especially when data is limited. The current data-driven estimation at unmonitored sites using comparative regional analysis involves reconstructing time series based on similarity to neighboring reference stations. However, the accuracy of these predictions can be contingent on the appropriate selection of donor sites. The primary aim of this study was to optimize the selection of these reference sites and incorporating site-specific controls(descriptors) for bolstered prediction accuracy.First, the efficacy of multi-order hydrological position (MOHP) data as supplementary features in groundwater head duration curve (HDCs) prediction is examinated. An analysis of both predicted and observed HDCs in the reconstruction process revealed that MOHP data integration does not enhance prediction outcomes. Further, the marginal improvement observed with the incorporation of HDCs suggests that enhancing HDCs prediction accuracy may not be the foremost priority.To determine optimal criteria for refining the selection of potential donor sites, a comprehensive assessment of diverse site descriptors was conducted. The findings reveal that smaller limiting ranges generally enhance prediction accuracy at the sites that also small at this control. Larger limiting ranges are necessitated when the focus is on sites exhibiting specific descriptors. Although the potential to elevate predictive R2 to 0.82 exists, achieving this hinge on the selection of each site's optimal control, a challenge given the difference of controls across different sites. Despite this, observable patterns emerged, such as the necessity for morphology-related controls in areas experiencing morphological changes.Beyond control selection, an alternative strategy to bolster prediction accuracy involves using the observed similarity of time series between two wells. For this, a Random Forest Regression model was devised to predict the similarity (R2) between two sites. This innovative approach prioritized the three sites with the highest similarity for time-series reconstruction, culminating in a 3% enhancement in the mean R2 of the reconstructed time series.This research elucidates the complex interplay of site parameters in groundwater prediction and advocates for refined methodologies based on reference well selection. Moreover, it underscores the transformative potential of machine learning methodologies, notably Random Forest Regression, in transcending traditional challenges in groundwater level predictions.