Prediksjon av strømpriser med lineær regresjon og LSTM-modeller
Abstract
I en tid der strømprisene i Norge har hatt både stor grad av volatilitet og i større grad blir påvirket av internasjonale forhold, er også presise prisprognoser blitt mer verdifulle. I denne sammenheng er det avgjørende å få en forståelse av hvilke faktorer som driver prisene og hvordan de kan modelleres. Det er nettopp dette vi har forsøkt å gjøre i denne oppgaven: Hvor godt predikerer ulike modeller historiske day-ahead-spotpriser i NO1 basert på et utvalg variabler? Ved hjelp av data fra de siste ti årene (2015-2024) og relevante variabler, har vi forsøkt å besvare problemstillingen.
Vi har utarbeidet både regresjonsmodeller og maskinlæringsmodeller for å predikere strømprisen. Disse inkluderer to prediktive regresjonsmodeller og to LSTM-modeller. Dataen vi har brukt i modellene inkluderer de uavhengige variablene: faktisk strømforbruk, planlagt produksjon, temperatur, kullpris, gasspris, oljepris og fyllingsgrad, og den avhengige variabelen: day-ahead spotpris NO1.
Etter en analyse av resultatene er det tydelig at ingen av modellene predikerer strømprisen tilfredsstillende og nøyaktig. Selv om LSTM-modellene predikerer bedre enn regresjonsmodellene, er det en tydelig tendens til overestimering og store avvik. Vi vurderer at modellene kan styrkes med bedre variabelvalg, forbedring av struktur i maskinlæringsmodeller og mer komplekse data. I tillegg er det aktuelt å se på andre typer modeller for å predikere strømprisene. At a time when electricity prices in Norway have experienced high volatility and are increasingly influenced by international factors, accurate price forecasts have become more valuable. In this context, it is crucial to understand which factors drive electricity prices and how these can be modeled. This is precisely what we have attempted to explore in this thesis: How well do different models predict historical day-ahead spot prices in NO1 based on a selected set of variables? Using data from the past ten years (2015–2024) and relevant explanatory variables, we have sought to answer this research question.
We developed both regression models and machine learning models to predict electricity prices. These include two predictive regression models and two LSTM models. The dataset used in the models includes the following independent variables: actual electricity consumption, scheduled production, temperature, coal price, gas price, oil price, and reservoir filling level, as well as the dependent variable: the day-ahead spot price in NO1.
After analyzing the results, it is clear that none of the models predict electricity prices with full accuracy or satisfactory precision. Although the LSTM models perform better than the regression models, there is a clear tendency toward overestimation and significant deviations. Based on this assessment, the models could be improved by selecting better variables, improving the structure of the machine learning models, and incorporating more complex data. Additionally, one may look towards different model selections to predict electricity prices.