The effect of preprocessing on autoencoder training and leakage detection scores using data from real-world water distribution network
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3167321Utgivelsesdato
2024Metadata
Vis full innførselSamlinger
Beskrivelse
Full text not available
Sammendrag
Bruken av maskinlæringsmodeller for lekkasjedeteksjon er et fremvoksende forskningsfelt. Det finnes likevel få omfattende studier der ekte, korrekt merkede data fra faktiske urbane vannsystemer er brukt. I denne artikkelen er det brukt fluks- og trykkdata fra sensorer i et urbant vannsystem, der data er samplet imens lekkasjer er simulert ved bruk av brannhydranter. Dataen ble preprosessert og brukt til å trene en autoencoder-modell, der rekonstruksjonsfeilen ble brukt til å implisere potensielle lekkasjer. Av flere grunner som er diskutert i artikkelen, scoret modellen lavt på viktige forvirringsmatrise-elementer. The usage of machine learning models for leakage detection is an emerging field of study. However, there are few comprehensive studies using real, correctly labeled data from actual urban water systems. In this paper, flow and pressure data from sensors in an urban water system has been sampled while simulating leaks using fire hydrants. The data was preprocessed and used to train an autoencoder model, in order to use reconstruction error to implicate potential leakages. Due to several factors discussed in the paper, such as the amount of data available, the model scored low on important confusion matrix elements.