A Comparative Analysis of Machine Learning models in Prognostics and Prediction of Remaining Useful Life of Aircraft Turbofan Engines
Abstract
I jakten på å forbedre sikkerheten og påliteligheten til komplekse industrielle systemer har teknologien for Prognostisk Helsestyring (PHM), spesielt dens komponenter for feildiagnose og prognose, funnet økende relevans i ulike bransjer. Fundamentalt for PHM-teknologien er forutsigelse av gjenværende levetid (RUL). En nøyaktig anslag av RUL fører ikke bare til forebygging av ulykker, men letter også optimal planlegging av utstyrvedlikehold i komplekse systemer. Denne strategiske forhåndsvurderingen kan redusere vedlikeholdskostnader og føre an i en mer systematisk tilnærming til prediktivt vedlikehold. Mens RUL-prediksjonsteknikker spenner fra modellbaserte til datadrevne tilnærminger, vinner sistnevnte, som etablerer forhold mellom RUL og historiske data gjennom en læringsbasert modell, oppmerksomhet på grunn av dens uavhengighet fra tidligere kunnskap.Byggende på denne grunnlaget går denne masteroppgaven inn i anvendelsen av maskinlæringsmodeller og kunstige nevrale nettverk for å predikere gjenværende levetid for turboviftemotorer, ved bruk av turbovifte-degraderingsdatasettet fra NASA som en case-studie. Forskningen starter med en introduksjon til prinsippene for prognostisk helsestyring og RUL, etablerer kontekst og relevans for studien. Påfølgende kapitler utforsker domenene for kunstig intelligens og understreker dets krysspunkter med maskinlæring og dyp læring. En omfattende oversikt over maskinlæringsparadigmer, inkludert veiledede og uveiledede metoder, er gitt, og dette legger grunnlaget for en grundig undersøkelse av ulike regresjonsmodeller. Gitt datasettets egenskaper og den kontinuerlige, merkede naturen til dataene, blir de teoretiske grunnlagene for regresjonsmodeller, inkludert lineær regresjon, polynomisk regresjon, støttevektorregresjon, beslutningstre og tilfeldig skogregresjon, sammen med kunstige nevrale nettverk, utdypet. Hver modell er grundig konstruert, kjørt på datasettet, og en detaljert sammenlignende analyse av resultater er gitt. Studien øker sin praktiske verdi ytterligere ved å adressere datavisualisering, funksjonsvalg, databehandling og hyperparameterjustering og fremhever de betydelige forbedringene som oppnås etter behandlingen, og styrker potensialet for maskinlæring og dyp læring innen prognostisering og prediksjon av gjenværende levetid. In the pursuit of enhancing the safety and reliability of complex industrial systems, Prognostics Health Management (PHM) technology, especially its components of fault diagnosis and prognosis, has found increasing relevance in various industries. Fundamental to PHM technology is the prediction of the Remaining Useful Life (RUL). An accurate estimation of RUL not only leads to accident prevention but also facilitates optimal equipment maintenance scheduling in complex systems. This strategic foresight can decrease maintenance costs and spearhead a more systematic approach to predictive maintenance. While RUL prediction techniques span from model-based to data-driven approaches, the latter, which establishes relationships between RUL and historical data through a learning-based model, is gaining attention due to its independence from prior knowledge. Building on this foundation, this master thesis delves into the application of machine learning models and artificial neural networks to predict the remaining useful life of turbofan engines, using the turbofan degradation dataset by NASA as a case study. The research starts with an introduction to the principles of prognostic health management and RUL, establishing the context and relevance of the study. Subsequent chapters explore the domains of artificial intelligence, underscoring its intersections with machine learning and deep learning. A comprehensive overview of machine learning paradigms, including supervised and unsupervised methodologies, is provided, setting the stage for a deep dive into various regression models. Given the dataset's properties and the continuous, labeled nature of the data, the theoretical foundations of regression models, including linear regression, polynomial regression, support vector regression, decision tree, and random forest regression, alongside artificial neural networks, are elaborated. Each model is thoroughly constructed, ran on the dataset, and a detailed comparative analysis of results is provided. The study further enhances its practical value by addressing data visualization, feature selection, data treatment, and hyperparameter tuning, highlighting the significant improvements achieved after treatment, reinforcing the potential of machine learning and deep learning in prognostics and prediction of remaining useful life.