Deep Learning for Fault Prediction in Offshore Wind Turbines
Abstract
Denne oppgaven beskriver et feilprediksjonssystem for offshore vindturbiner basert på SCADA data. Hensikten med systemet er å gi tidlig advarsel for kommende feil. Dette vil kunne bidra til reduserte vedlikeholdskostnader og økt fortjeneste ved å unngå tapt produksjon. En fullstendig arkitektur av systemet er beskrevet og implementert, inkludert datakilder, fremgangsmåte for merking av data, forbehandling av data, oppdeling i trenings-, test-, og valideingssett, klassifiseringskomponent, samt et alarmkontrollsystem. Hovedfokuset for oppgaven har vært å evaluere prestasjon for ulike klassifiseringskomponenter i systemet. Dyp læring har vist lovende resultater for tidsserieklassifisering, og flere klassifiseringsmodeller basert på dyp læring har blitt implementert som klassifiseringskomponenten av systemet. Disse er sammenlignet mot en “random forest”-modell, som er vurdert til å være “state-of-the-art” i dette domenet. De dyp læring-baserte modellene gir bedre resultater enn “random forest”-modellen på alle eksperimenter. Jeg viser at systemet kan detektere feil før de oppstår, men antallet falske alarmer som blir gitt, varierer stort mellom ulike feilkategorier. Noen feilkategorier viser seg å egnes bedre for å modelleres enn andre. Store forskjeller er også observert med hensyn til hvor lang tid i forveien vi ønsker å predikere en feil. Det er ikke mulig å kåre en definitiv vinner blant dyp læring-modellene, da de presterer bedre på ulike feilkategorier. Om resultatene fra denne oppgaven er gode nok til å rettferdiggjøre å produksjonssette et slikt system må vurderes nøye fra et forretningsperspektiv av domeneeksperter. Hovedbidraget for denne oppgaven er design og implementering av et komplett feilprediksjonssystem for offshore vindturbiner basert på SCADA data. I tillegg har flere dyp læring-baserte klassifiseringsmodeller vist å gi bedre resultater enn det som er vurdert til å være “state-of-the-art”. Flere innblikk i problem-spesifikke utfordringer er også gitt, med mål om å bidra til fremtidig arbeid. This thesis investigates the application of a deep learning-based fault predictionsystem for offshore wind turbines based on SCADA data. The goal of the systemis to provide early warning of faults, and thus reduce both the maintenance costs,as well as cost related to downtime.The machine learning components of the fault prediction system are describedcomplete with source code, including the labelling procedure, data sources, datapreprocessing, train/test/validation split procedure, classification component andalarm control system.Deep learning has shown great promise for time series classification problems,and several deep learning architectures are evaluated as the classification component of the system. These are then compared to a random forest model. Suchmodels are considered to be the state-of-the-art in this domain.The deep learning models show better performance than the random forestmodel on all experiments. I show that the system is able to detect faults inadvance, but the number of false alarms given in order to do so varies greatlywith different fault categories. Some fault categories are found to be bettersuited for modelling than others, and large variations in results are also observedwith regards to how long time in advance we want to be able to predict a fault.The performance of the investigated deep learning models varies across the faultcategories, and it is not possible to declare a ”winner” across the board.Whether the amount of faults predicted vs. the false alarm rate justify building a production version of the system, must be further evaluated from a businessperspective by domain experts.The primary contribution of this thesis is the design and implementation ofa complete fault prediction system for offshore wind turbines based on SCADAdata. Additionally, different deep learning architectures have been evaluated asthe classifier component of this system, and demonstrated ability to improve uponthe state-of-the-art. Additional problem-specific insights are also presented, inorder to facilitate future work in this area.