Vis enkel innførsel

dc.contributor.advisorVatn, Jørn
dc.contributor.authorKolstad, Ole Henrik Aarum
dc.date.accessioned2019-10-19T14:00:14Z
dc.date.available2019-10-19T14:00:14Z
dc.date.issued2019
dc.identifier.urihttp://hdl.handle.net/11250/2623304
dc.description.abstractJernbaneselskap ansvarlige for infrastrukturen til jernbanen hyrer inspeksjonsfirmaer til å inspisere skinnene for å finne defekter. Inspeksjonsfirmaene bruker tog til å skanne skinnene ved hjelp av ultralyd i relativt høye hastigheter. Deretter utfører jernbaneselskapene manuelle inspeksjoner av de antatte defektene, fordi den initielle inspeksjonen ikke blir ansett som nøyaktig nok. Antallet falske positive, altså antatte defekter som ikke blir funnet under manuell inspeksjon, blant de antatte defektene er høyt og fører til unødvendige manuelle inspeksjoner. Jernbaneselskapene mottar de antatte egenskapene, samt visuelle representasjoner av ultralydsignalene, kalt "B-scans", av de antatte defektene. Målet med masteroppgaven var å redusere antallet falske positive ved å utvikle modeller, ved bruk av maskinlæring, i stand til å detektere om ultralydsignaler i et B-scan representerer en ekte defekt. Selskapet Bane NOR ble brukt som case og ga tilgang til inspeksjonsdata og B-scans. Analyser av dataene og semi-strukturerte intervjuer ble utført med case-selskapet for å fastslå detaljene til casen. Klassifisering, en "supervised learning"-metode, ble brukt til å trene modellene til å kjenne igjen mønstre som kjennetegner defekter i B-scannene. Før de kunne bli brukt til trening ble en delmengde av det totale antall B-scans valgt ut og prosessert. 7 prosesserings-steg ble utført for å transformere B-scannene til et format egnet til maskinlæring; det korrekte B-scannet ble valgt ut, rutenettet ble fjernet, delgrupper av sensorer ble valgt ut, farge ble fjernet, oppløsningen ble redusert, variabler ble valgt og til slutt konvertering til binære data. Modellene ble trent ved bruk av algoritmen Random forest og parameteret antall trær ble justert. 21 forskjellige kombinasjoner av delmengder og parameterverdier ble trent 3 ganger hver for å evaluere gjennomsnittlig prestasjon. 81 modeller ble trent totalt og prestasjonen ble evaluert ved bruk av "confusion matrix"-verdier, samt "Precision", "Recall" og "F1". Utviklingen av modeller kapable til å detektere defekter i jernbaneskinner var vellykket og fordelene og ulempene ved modellene er diskutert. Den optimale modellen avhenger av situasjonen og tre scenarioer er presentert. Den beste modellen hadde en nøyaktighet på 93.1% for å detektere defekter kombinert med en reduksjon i falske positive, altså unødvendige inspeksjoner spart, pålydende 36.9%. Økning i antallet eksempler og redusering av antallet variabler ble funnet å øke presetasjonen. Ytterligere arbeid er foreslått og forespurt for å forbedre og ta i bruk modellene.
dc.description.abstractRailway companies responsible for railway infrastructure hire inspection companies to inspect the rails for suspected flaws. The inspection companies use trains to scan the rails using ultrasound at relatively high speeds. Subsequently, the railway companies conduct manual inspections of the suspected flaws, due to the initial inspection not being sufficiently reliable. The number of false positives, i.e. suspected flaws not found during manual inspection, among the suspected flaws is high and are cause for unnecessary manual inspections. The railway companies receive predicted properties and visual representations of ultrasound signals, called "B-scans", of the suspected flaws. The aim of the thesis was to lower the amount of false positives by developing models, using machine learning, able to detect whether the ultrasound signals in a B-scan represent a true flaw. Case company Bane NOR provided inspection data and B-scans. Analysis of the provided data and semi-structured interviews with a case company contact was conducted to establish the details of the case. The supervised learning method of classification was used to train the models to recognize patterns in the B-scans indicative of flaws. Before subjected to training, a subset of B-scans was selected from the complete dataset and pre-processed. 7 steps of pre-processing was completed to transform the B-scans provided into a format suitable for machine learning; extracting the correct B-scan, removing grid lines, extracting sensor subsets, removing colour, reducing resolution, feature selection and binary conversion. The models were trained using the Random forest algorithm and the parameter of number of trees was tuned. 21 different combinations of subsets and parameter values were trained 3 times each to evaluate the average performance. 81 models were trained in total and the performance was evaluated using confusion matrix performance measures and Precision, Recall and F1. Models were successfully developed to detect flaws in railway rails and the advantages and disadvantages of the models are discussed. The optimal model depend on the situation and three scenarios are presented. The top performing model achieved a 93.1% accuracy of detecting flaws with a 36.9% reduction in false positives, i.e. redundant inspections saved. Performance was found to improve with increased number of samples and decreased number of features. Further work is suggested and requested to improve the results and apply the models.
dc.languageeng
dc.publisherNTNU
dc.titleModel for Detecting Flaws in Railway Rails using Machine Learning
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail
Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel