Machine Learning for Automatic Classification of Wind Turbines

Waaga, Espen

dc.contributor.advisor	Imsland, Lars Struen
dc.contributor.author	Waaga, Espen
dc.date.accessioned	2019-10-31T15:02:31Z
dc.date.issued	2019
dc.identifier	no.ntnu:inspera:35771502:38102842
dc.identifier.uri	http://hdl.handle.net/11250/2625676
dc.description.abstract	Ettersom vindparker vokser eksponentielt, er det nødvendig med økende grad av automatisk klassifisering av vindturbiner. Klyngeteknikker for å behandle datastrømmer i sanntid for alle de enkelte vindturbinene i drift er forventet å gi et tilstrekkelig nivå av automatisering. Målet med denne oppgaven er å gjøre utforskende arbeid for bruk av klyngeteknikker for overvåking av vindturbiner. Nærmere bestemt å utforske, forstå og oppsummere de praktiske implikasjonene ved bruk av klyngealgoritmer for automatisk klassifisering av vindturbiner. For å løse dette målet har et par klyngeteknikker for tidsserier blitt anvendt for å gruppere vindturbiner i forskjellige datasett som består av tidsserier med en eller flere variabler. Disse tidsseriene er alle hentet fra en faktisk vindpark i Norge, totalt fire datasett har blitt gruppert; to datasett bestående av tidsserier med bare en parameter, og to datasett bestående av tidsserier med flere parametere. En gjennomgang av litteraturen om tidsserieklynging har blitt presentert i rapporten og på bakgrunn av denne gjennomgangen har det blitt valgt ut et par klyngemetoder for å utforske de praktiske implikasjonene ved bruk av klyngeteknikker for automatisk klassifisering av vindturbiner. De valgte metodene er implementering av den hierarkiske klyngealgoritmen sammen med enten den euklidske avstanden eller dynamisk tidsfordreining (DTW) avstanden for sammenligning mellom tidsserier; dette grupperer tidsserier basert på enten likhet i tid eller likhet i form. Denne rapporten viste at ved å implementere klyngeteknikker på de forskjellige datasettene klarte den å klassifisere vindturbiner basert på deres ulikheter – dette inkluderer klassifisering av vindturbiner som opplever forskjellig temperatur i girkassen, generatorhastighet, kraftproduksjon og lokale vindforhold. Rapporten viste også at den euklidske avstanden effektivt kunne brukes i en oppskalert versjon, mens DTW-avstanden ikke kan på grunn av den kvadratiske tidskompleksiteten til DTW-algoritmen. For lengre tidsserier kan DTW-avstanden erstattes med euklidske avstanden, da målene for likhet i tid og likhet i form er mer eller mindre like. Denne oppgaven danner grunnlag for videre forskning av de praktiske implikasjonene ved bruk av klyngealgoritmer for automatisk klassifisering av vindturbiner.
dc.description.abstract	As wind parks are continuing to grow at an exponential rate, proper automatic classification of wind turbines is required. Clustering techniques to process the real-time data streams of all the individual wind turbines in operations are expected to provide a sufficient level of automation. The objective of this thesis is to do exploratory work for using clustering techniques for wind turbine condition-based monitoring. More specifically, to explore, understand and summarise the practical implications of using clustering algorithms for automatic classification of wind turbines. To solve this objective, a couple of time series clustering techniques have been applied to cluster different data sets which are comprised of either univariate or multivariate time series. These time series are all extracted from an actual wind park located in Norway. A total of four data sets have been clustered; two univariate and two multivariate data sets. A review of the literature concerning time series clustering has been presented in the thesis and based on the review, a couple of clustering methods has been selected to examine the practical implications of using clustering techniques for automatic classification of wind turbines. The selected methods are the implementation of the hierarchical clustering algorithm in conjunction with either the Euclidean distance or the dynamic time warping (DTW) distance as the similarity measure; this solves the clustering objectives of similarity in time and similarity in shape. This thesis showed that by clustering the different data sets – either the univariate or multivariate data set – it resulted in automatic classifications of wind turbines based on their dissimilarities - this includes classification of wind turbines experiencing different gearbox temperatures, generator speed, power production and local wind conditions. The thesis also showed that the Euclidean distance could effectively be used in a scaled-up version, whereas the DTW distance cannot because of the quadratic time complexity of the DTW algorithm. For longer time series, the DTW distance can be substituted with the Euclidean distance, as the objectives of similarity in time and similarity in shape are more similar. This thesis forms the basis for further research into the practical implications of using clustering algorithms for automatic classification of wind turbines.
dc.language	eng
dc.publisher	NTNU
dc.title	Machine Learning for Automatic Classification of Wind Turbines
dc.type	Master thesis

Tilhørende fil(er)

Filnavn:: no.ntnu:inspera:2523279.pdf
Størrelse:: 22.54Mb
Format:: PDF

Åpne

Filnavn:: no.ntnu:inspera:2523279.zip
Størrelse:: 8.681Mb
Format:: application/zip

Åpne

Denne innførselen finnes i følgende samling(er)

Institutt for teknisk kybernetikk [3758]

Vis enkel innførsel