dc.description.abstractI dette prosjektet analyserer vi muligheten til å anvende statistiske metoder for change-pointdeteksjon for å oppdage anomaliteter som forårsaker feil i industrielle instrumenter. I tillegg gir vi en oversikt over ulike metoder for anomalitetsdeteksjon som kan brukes til dette formålet. Løsningen som er foreslått her er modelldrevet. Vi foreslår å bruke change-pointdeteksjonsmetoder på historiske sensordata fra driften av en maskin for å identifisere mønstre som har ført til usikre forhold hvor maskinen har gått gjennom en uplanlagt shut-down tidligere. Løsningen som foreslås i dette arbeidet, har en semi-supervised natur. Vi antar at det er en endring i fordelingen av dataene i en tidsperiode med kjent lengde før feilene. Det antas at tidspunktet da endringen skjer er ukjent. Datapunktene som kommer før og etter endringen er henholdsvis normale og ikke-normale. Vi utvikler metoder for å finne signaler i dataene viss distribusjoner er mindre påvirket av de normale variasjonene i dataene enn av de ikke-normale endringene som forårsaker feil i systemet. Basert på disse signalene utvikles flere univariate prediktive modeller. Parametrene til de prediktive modellene bestemmes med en ad hoc tilnærming, ved bruk av den semi-supervisede merkingen av datapunktene. Metodene som presenteres i dette arbeidet er inspirert av og anvendt på et datasett levert av den norske DNV GL. Dataene kommer fra gasskompressorene og gassturbinene som brukes av en europeisk gassoverføringssystem-operatør. I dette arbeidet, som et originalt verk av forfatteren, er de følgende teoriene anvendt: Den vektorautoregressive modellen, metoden for change-pointdeteksjon, prinsipal komponent- og Box-Tiao-analyse, Mann-Whitney U-test, signalene discrepancy, leverage of influence og CUSUM-metoden. Disse verktøyene er kombinert for å skape ende-til-ende løsninger på problemet med sensorbasert feilforutsigelse i industrielle instrumenter. Forfatterens hovedbidrag er å kombinere alle metodene som presenteres i dette arbeidet til fire mulige ende-til-ende løsninger, og å teste og evaluere løsningene på simulerte og virkelige datasett. Her har vi underbygget eksistensen av informasjon som kan brukes til å forutsi feil i våre virkelige data og et potensial i de fremlagte metodene for å oppdage forskjellen mellom normal og ikke-normal oppførsel. Analysene i dette arbeidet kan forbedres gitt en lengre tidsramme. Oppnåelige forbedringer foreslås i dette arbeidet. Gitt de nåværende resultatene konkluderer vi med at bruk av metodene som presenteres her for feilprediksjon i vår forretningssak kan være økonomisk lønnsomt dersom den økonomiske verdien av en sann positiv prediksjon er mye større enn det økonomiske tapet av en falsk positiv prediksjon. Vi anbefaler videre arbeid om dette temaet ved å utføre en lignende multivariat analyse.
dc.description.abstractIn this work we analyze the possibility of applying statistical methods of changepoint detection for predicting failures in industrial instruments. In addition, we provide an overview over various methods of anomaly detection that can be applied for this purpose. The solution proposed here is model-driven. We propose to use methods of change-point detection on historical sensor data from the operation of a machine to identify patterns that have led to unsafe conditions under which the machine has gone through an unplanned shut-down in the past. The solution proposed in this work has a semi-supervised nature. We assume that there exists a change in the distribution of the data in a time period of known length prior to failures. It is assumed that the time of the change is unknown. The data points prior to and after this change are labeled as normal and non-normal, respectively. We develop methods to find signals in the data the distributions of which are less affected by the normal variations in the data than by the non-normal changes that cause failures. Based on these signals, several univariate predictive models are developed. The parameters of the predictive models are determined with an ad hoc approach, using the semisupervised labeling of the data points. The methods presented in this work are inspired by and applied to a data set provided by the Norwegian DNV GL. The data comes from the gas compressors and the gas turbines used by a European gas transmission system (GTS) operator. In this work, as an original work by the author, the theories of the vector autoregressive model, the offline changepoint detection method, the principal and the Box-Tiao analyses, the MannWhitney U test, the signals discrepancy, leverage and influence, the CUSUM method and statistical performance metrics have been combined to create endto-end solutions to the problem of sensor-based failure prediction in industrial instruments. The main contribution of the author is combining all the methods presented in this work into four possible end-to-end solutions and testing and evaluating the solutions on simulated and real-world data sets. Here we have underpinned the existence of predictive information in our real-world data and a potential in the presented methods for detecting the difference between normal and non-normal behaviour. Achievable improvements of the analyses performed are proposed in this work. Given the current results, we conclude that applying the methods presented here for failure prediction in our business case might be economically profitable if the economic value of a true positive prediction is much larger than the economic loss of a false positive prediction. We recommend further work on the subject by conducting a similar multivariate analysis.
dc.titleA Semi-Supervised Approach to the Application of Sensor-based ChangePoint Detection for Failure Prediction in Industrial Instruments
