Copula-Based Scenario Generation Routines for Improved Stability in Energy System Modeling
Abstract
For å redusere de pågående klimaendringene, står Europa nå overfor betydelige investeringer i fornybar energiproduksjon for å erstatte fossile brennstoffer. Myndigheter anvender energisystemmodellering for å ta informerte beslutninger angående valg av teknologier, lokasjoner og tidspunkt for energi-investeringer. Stokastisk programmering er et nyttig verktøy som kan brukes til å identifisere optimale løsninger på tvers av ulike operasjonelle scenarier som påvirkes av væravhengig produksjon fra fornybare energikilder. Imidlertid fører kombinasjonen av høy tidsmessig oppløsning og en lang optimeringshorisont til et omfattende og komplekst beslutningsrom for mulige løsninger.
Det er vanlig å trekke ut diskrete scenarier fra historiske tidsserier for å håndtere kompleksiteten i beslutningsrommet for energisystemmodeller. Å sikre stabilitet i løsninger på tvers av utvalgte scenarier er viktig på grunn av den iboende stokastisiteten i scenario-generering. Dette er avgjørende for å adressere den reelle usikkerheten i problemet, heller enn modellens tilnærming til den. Likevel kan det være utfordrende å identifisere korrelasjoner og mønstre i dataen som gjenspeiler reell usikkerhet. Dette kan påvirke stabiliteten i løsninger på tvers av de genererte scenariene. Mens tradisjonelle metoder for scenario-generering hovedsakelig hensyntar lineære korrelasjoner, kan det være ikke-lineære eller asymmetriske trender i dataen som disse metodene ikke klarer å fange opp.
I denne masteroppgaven designer vi derfor scenario-genereringsmetoder som forsøker å fange opp potensielt komplekse samvariasjoner mellom stokastiske variabler ved hjelp av copulaer. Disse copula-baserte metodene, kalt copula-matching (inspirert av moment-matching) og copula-strata (som bruker stratifisert utvalg), benytter empiriske copulaer og er implementert i energimodellen EMPIRE. Vi evaluerer ytelsen til disse metodene ved å gjennomføre stabilitetstester både in-sample og out-of-sample for ulike størrelser på scenario-treet. Deretter sammenligner vi dem med tilfeldig utvalg og andre ordinære tilnærminger basert på moment-matching og stratifisert utvalg.
Resultatene våre indikerer at copula-strata-metoden generelt viser den beste stabiliteten blant de undersøkte metodene. Videre viser funnene våre, i tråd med tidligere forskning, at bruk av kun 10 scenarier i scenario-treet ikke er tilstrekkelig for å oppnå stabilitet ved out-of-sample-testing. Stabiliteten øker betydelig når scenario-treet inkluderer 50 scenarier. Derimot ser vi at en ytterligere økning fra 50 til 100 scenarier ikke nødvendigvis forbedrer stabiliteten. I tillegg finner vi at stratifiserte utvalgsmetoder presterer bedre enn tilnærminger som baserer seg på at utvalg skal samsvare med de statistiske egenskapene til de underliggende distribusjonene, spesielt når størrelsen på scenario-treet er begrenset. With global warming intensifying, Europe faces the need for substantial investments in renewable energy production to facilitate the transition away from fossil fuels. Policymakers rely on energy system modeling to make informed decisions about the technologies, locations, and timing of energy investments. Stochastic programming is a valuable tool for identifying optimal solutions across various operational scenarios influenced by weather-dependent renewable energy production. However, combining high temporal resolution and a multi-decade optimization horizon results in a vast and complex decision space.
To manage the complex decision space of energy system modeling, a common approach is to extract discrete scenarios from historical time series. Given the stochastic nature of scenario generation, ensuring stable solutions across sampled scenarios is essential to make sure that the solutions mirror true uncertainty rather than the model's approximation of it. However, identifying correlations and patterns in the data that accurately reflect true uncertainty can be challenging. This might impact the stability of generated solutions. While traditional scenario generation methods primarily consider linear correlations, there may be non-linear or asymmetric trends in the data that these methods fail to describe.
In this thesis, we design scenario generation routines aimed at capturing potentially complex interdependencies among stochastic variables through the use of copulas. These copula-based methods, namely copula-matching (inspired by moment-matching) and copula-strata (employing stratified sampling), utilize empirical copulas and are implemented in the EMPIRE capacity expansion model. We assess their performance through in-sample and out-of-sample stability tests across different scenario tree sizes, and compare them against random sampling and other conventional moment-matching and stratified sampling approaches.
Our results show that the copula-strata method exhibits the highest overall stability among all methods examined. Additionally, in line with previous research, employing only 10 scenarios in the scenario tree proves insufficient for achieving out-of-sample stability. Stability improves significantly with 50 scenarios. However, our findings suggest that increasing to 100 scenarios does not necessarily provide further gains in stability compared to using 50 scenarios. Furthermore, we find that stratified sampling methods outperform techniques aiming to select samples that closely match the statistical characteristics of the underlying distributions, especially when the number of scenarios is limited.