Robustness of short-term load forecasting models for smart grids
Description
Full text not available
Abstract
Spenningsnivåer er en viktig faktor i den daglige driften av distribusjonsnett. Nå som smartgridet i Norge begynner å vokse med flere og flere sensorer innstallert i nettet, er det mulig å samle inn store mengder data. Disse dataene kan brukes sammen med maskinlæring for å predikere spenningsverdier, som igjen kan hjelpe nettselskaper med sin daglige drift.
Denne masteroppgaven tar for seg tre forskjellige maskinlæringsmodeller for å se på prediksjon av spenningsnivåer 24 timer frem i tid. Vi ser på en ARIMA, SARIMA og LSTM model, før vi undersøker nærmere den som har best resultater av disse tre. Distribusjonsnettet som er brukt i denne oppgaven er et syntetisk distribusjonsnett med ekte lastverdier i nettet. Vi kjører deretter en kalkulering av kraftflyt i nettverket for å få spenningsverdier tilsvarende ett år i tid. Resultatene blir presentert og diskutert opp mot hvordan et nettselskap kan bruke resultatene. Vår beste prediksjonsmodell har en Mean Absolute Percentage Error (MAPE) på ~1 - 1,5% i transformatorstasjonene i distribusjonsnettet.
Vi ser også på hvordan tap av dataverdier påvirker ytelsen til prediksjonsmodellen. Utviklingen av smartgrid fører til at mer og mer data vil bli overført mellom forskjellige steder. Dette kan igjen føre til tap av data. I våre resultater ser vi en klar økning i MAPE allerede når 10% av dataene forsvinner, og at det også øker enda mer når 25% forsvinner. Voltage levels in distribution grids are an important factor in the daily operations of a distribution grid. With smart grids emerging, more sensors are installed in the grid, allowing for collection of more data. This data coupled with machine learning methods can allow for forecasting of voltage values, helping the distribution grid operators (DSOs) in their daily operations.
This thesis looks at three different machine learning methods for short-term voltage forecasting. An ARIMA, SARIMA, and LSTM model is evaluated, before we look further into the one that performs best. The distribution grid used in this thesis is a synthetic power grid with real-life load data inserted to the grid. We then run a power flow of our grid to obtain voltage values that represent one year of values. The results are presented and discussed in the light of how a DSO could use this to their advantage. Our best performing model has a Mean Absolute Percentage Error (MAPE) of ~1 - 1,5% in the substations of our network.
Another key finding in this thesis is how loss of data values impact the performance of the forecasting model. The development of the smart grid also means that more data will be transmitted, allowing for more transmission errors of data. From our results, we see a clear increase in MAPE already from 10% data loss, and also evaluate how 25% data loss impacts the performance.