Applications of machine learning, in reliability analysis, as an alternative to traditional survival models
Description
Full text not available
Abstract
Bruken av pålitelighets og levetidsdata, i operasjonsfasene av industrielle systemer, har økt de siste årene ettersom det kan betydelig redusere kostnader innenfor sikkerhet og vedlikehold. Dette har ført til en utvikling av pålitelighetsprogramvarer for styring og koordinering av slike data mellom operatører innenfor oljeindustrien. Et av disse programvarene er WellMaster, levert av ExproSoft, Trondheim. WellMaster lagrer levetidsdata, for diverse ventiler og undervannskomponenter, som kan bli søkt opp og analysert av en bruker.
Ettersom maskinlæring vokser, som et forskningsfelt, dukker det opp stadig flere metoder for å utføre levetidsanalyse på høydimensjonale, sensurete datasett. Størrelser som levetid, feilårsak og levetidsplott er ofte beregnet av pålitelighets-programvarer, som WellMaster, men de benytter seg stort sett bare av tradisjonelle levetidsmodeller. Denne masteroppgaven undersøker om populære maskinglæringsmodeller kan benyttes, som gunstige alternativer til tradisjonelle levetidsmodeller, til å predikere levetidsstørrelser.
Ved bruk av IPCW (Vock et al. 2016) blir det vist at maskinglæringsmodeller, tilegnet til regresjon, kan tilpasses høyre-sensurerte levetidsdatasett, akkurate slike som befinner seg i WellMaster og at IPCW er i stand til å redusere prediksjonsfeilen til disse modellene. Nøyaktighetene til de utvalgte maskinglæringsmodellene og de tradisjonelle modellene blir evaluert og det blir vist at random forest har høyest prediksjonsytelse.
Til slutt blir et levetidsplott for en individuell sikkerhetsventil generert ved bruk av en levetids-stacking metode, foreslått av (Zhong and Tibshirani 2019), og denne blir vist til å være homogen med en tradisjonell Kaplan-Meier plott. The use of reliability and survival data, in operational phases of industrial systems, has become more common over recent years due to its cost saving effects on safety and maintenance. This has lead to the rise of reliability software to manage and coordinate such data between multiple operators in the E\&P industry, one of which is WellMaster provided by ExproSoft, Trondheim. WellMaster stores failure data, from well and subsea equipment, which can be queried, analysed and summarized by a user.
As the field of machine learning is growing, newer methods to model and predict failure metrics, for high-dimensional, right-censored datasets, are constantly emerging. Reliability metrics such as time-to-failure (TTF), failure modes (cause of failure) and survival curves are commonly provided by reliability software, such as WellMaster, however they rely heavily on traditional survival models. This master's thesis investigates whether popular machine learning models can readily model these reliability metrics and provide a viable alternative to traditional models.
By using inverse probability of censoring weights (IPCW) (Vock et al. 2016) it is shown that ML regression models can be adapted for right-censored survival datasets, such as those provided by WellMaster, in order to reduce their predictive errors. The accuracy of both ML models and traditional reliability models are evaluated and it is shown that a random forest model provides the most accurate predictions. And as a final step, a survival curve is generated for an individual safety valve component, using a survival stacking method as suggested by (Zhong and Tibshirani 2019) and this curve is shown to be homogeneous to a survival curve generated by a more traditional Kaplan-Meier estimator.