Resistivity Estimation Using Convolutional Neural Networks
Master thesis
Permanent lenke
https://hdl.handle.net/11250/2781093Utgivelsesdato
2021Metadata
Vis full innførselSamlinger
Sammendrag
Denne oppgaven undersøker egnetheten av å anvende 2D tverrsnitt av 3D kjerneprøver i form av CT-scan data sammen med konvolusjonelle nevrale nettverk(CNN) for å bygge modeller for prediksjon av resistivitet. En av de viktige rollene til resistivitet i olje- og gassindustrien er å indikere mengden av hydrokarboner fra en brønnlogg. I tillegg kan resistivitet anvendes i hydrogeologi til å lokalisere grunnvannsspeil, og estimere inntrengelsen av saltvann i grunnvannsakviferer. Dataen som er anvendt i oppgaven omfatter 2D tverrsnitt av 3D kjerneprøver i form av CT-scan data over et 142 meters intervall. Målet er da å hente bildetrekk og bildekarakteristikker fra CT-scan bildene for å estimere resistivitet, og dermed bidra til teknologisk utvikling innen geovitenskap og oljeindustrien. Ved å utføre robust modellering av resistivitet, åpnes muligheten til å tilføre ytterlig informasjon til geologer, som videre kan bidra til økonomisk og tidseffiktivitet. I oppgaven anvendes CNN, et av de mest teknisk aktuelle rammeverkene for modellering med bildedata. For å innstille hyperparameterne til CNN har biblioteket Keras blitt anvendt, noe som åpnet for automatisert maskinlæring ved å søke over et egendefinert søkeområde av CNN-hyperparametere. Det viste seg at størrelsen til datasettet var for liten, i tillegg til at kvaliteten var inkonsekvent. Dermed ble det anvendt regulariseringsmetoder i form av bildemodifisering for å forbedre kvaliteten og størrelsen av dataen. Bildemodifisering med 98% overlapp var anvendt for å utvide datasettstørrelsen, og i tillegg ble bildene snudd vertikalt og horisontalt for å øke robustheten. På den andre siden ble det problematisk med den overlappede dataen når datasettet skulle splittes. Dermed har vår strategi vært å bruke tre forskjellige datasettfordelinger for å fremheve viktigheten av splittelse av data. En grundig analyse av innstilling av hyperparametere resulterte i tre optimale CNN modeller, en fra hver datasettfordeling. Til slutt ble de tre optimale modellene brukt til å predikere et testsett som ble holdt utenfor treningen, hvorav den beste av de tre oppnådde en R-kvadrert på 0.51. This thesis investigates the suitability of utilizing 2D cross-sections of 3D core CT-scan data together with Convolutional Neural Networks to create models for prediction of resistivity. One of the important roles of resistivity in the Oil and Gas industry is to determine the hydrocarbon contents from well logs. Additionally, in hydrogeology, resistivity can be used to locate water tables and estimate the intrusion of salt water into fresh water aquifers. The data used in this thesis comprises 2D cross-sections of 3D core CT-scan data over a 142 meter interval. The aim is then to extract features from the images, and use these features to predict resistivity, thus contributing to technological development in geoscience and the oil industry. By performing robust modelling of resistivity, additional information can be provided to geologists, increasing time and economical efficiency. In this thesis the Convolutional Neural Network, a state-of-the-art framework for modelling with image data is used. To tune the CNN hyperparameters, Keras was used, which allowed for automated machine learning by searching over a pre-defined space for optimal CNN hyperparameters. The data set itself turned out to be too small and the quality, inconsistent, thus measures for regularization was used, mostly in the form of data augmentation to improve the data set quality and size. Data augmentation with 98% overlap was used to increase the data set size, as well as flipping the images vertically and horizontally for increased robustness. However, using augmentation with overlap resulted in an issue during splitting of the data into training, validation and test sets. Therefore three different data set distributions have been proposed to emphasize the importance of splitting of data. A thorough analysis of hyperparameter tuning resulted in three optimal models, one for each data set distribution. Finally, a holdout test set was predicted by all three optimal models, where the best of the three achieved an R-squared of 0.51.