Vis enkel innførsel

dc.contributor.advisorAndersson, Henrik
dc.contributor.advisorGrimstad, Bjarne
dc.contributor.advisorHotvedt, Mathilde
dc.contributor.authorSjulstad, Christine Foss
dc.contributor.authorAlmås, Ingeborg Victoria Aarsvold
dc.date.accessioned2021-09-14T17:06:19Z
dc.date.available2021-09-14T17:06:19Z
dc.date.issued2020
dc.identifierno.ntnu:inspera:55508684:57885758
dc.identifier.urihttps://hdl.handle.net/11250/2776924
dc.descriptionFull text not available
dc.description.abstractDenne avhandlingen forsøker å estimere to-fase-flyt for olje- og gassbrønner i sanntid ved bruk av den nyeste teknologien innenfor datadrevne og hybride modeller. Siden fokuset er på enkeltbrønner, modellerer vi brønnspesifikke prediksjonsmodeller. Vi vurderer oppstrømssektoren i petroleumsindustrien og foreslår to alternative metoder som sammenlignes i et studie. Litteraturen gir ingen anvisning på at tilsvarende forsøk har blitt gjennomført tidligere. Hovedformålet er å måle flytrater på en nøyaktig måte slik at en får et bedre beslutningsgrunnlag for produksjonen. De estimerte verdiene kan bidra til å erstatte feilmålinger eller fylle inn for manglende verdier i et eksisterende datasett eller i en kontinuerlig datastrøm. Modellene predikerer to-fase-flyt, nærmere bestemt gass- og væskerater, der væske er det samlede produktet av olje og vann. Det er nødvendig å modellere fysiske forhold for et sett av variabler for hver enkelt brønn. Vi beskriver disse relasjonene ved å benytte datadrevne teknikker, i form av nevrale nettverk, for å fange den bakenforliggende fysikken som er ikke-lineær og kompleks. Videre benyttes det Baysiansk optimering med en Tree-Structured Parzen Estimator for å justere hyperparameterne til de nevrale nettverkene. Vi etablerer to prediksjonsmodeller for å beskrive de fysiske relasjonene, den kombinerte og den modulære modellen. Den kombinerte modellen estimerer to-fase-flyt som en ren datadreven modell - i én enkelt omgang. Den modulære modellen, en hybrid variant, benytter imidlertid forkunnskaper om den indre strukturen til produksjonssystemet ved å dele estimeringsprosessen inn i to enkeltstående deler. I casestudiet benytter vi både genererte data fra en simuleringsprosedyre, og ekte produksjonsdata fra et petroleumsfelt på den norske kontinentalsokkelen. Det simulerte datasettet har en potensielt ubegrenset mengde av datapunkter og kvantifiserbare kvalitetsnivåer. Dette resulterer i et simuleringsrammeverk som tilrettelegger for et systematisk og kontrollert miljø for testing og utarbeidelse av estimeringsmodellene, på en måte som ikke er gjennomførbart for historiske brønndata. Gjennom å variere datakvaliteten (datamengde og grad av støy) observeres det at nøyaktigheten og robustheten øker i takt med en forbedring i datakvalitet for det simulerte tilfellet. Nøyaktigheten stagnerer til slutt mellom 1000 og 5000 datapunkter. Derimot indikerer resultatene fra historiske produksjonsdata at større datavolum ikke gir en betydelig fordel; modellene predikerer i gjennomsnitt like nøyaktig på små og store datasett. Dette strider mot etablert maskinlæringsteori. Gitt at vi ser på tidsserier, hevder vi at kun de nyeste målingene er representative for to-fase-flyten som predikeres i nær framtid, uavhengig av hvor mange datapunkter som er tilgjengelige. Vi konkluderer med at prediksjonsnøyaktigheten til den kombinerte og den modulære modellen er sammenlignbar. Dermed anbefaler vi å benytte den kombinerte modellen, da både formuleringen og implementeringen er av enklere karakter. Vi tester også to alternative måter å innføre pre-training på, der modellene initielt trenes på simulerte data, for deretter å finjusteres for en ekte brønn. I dette arbeidet konkluderer vi med at begge alternativene er ineffektive for den spesifikke simuleringsprosedyren som er innført. Avslutningsvis ser vi at de overordnede resultatene varierer fra brønn til brønn. For enkelte predikeres flytraten med høy presisjon (mindre enn 10 prosent feil), mens flyten for andre brønner ikke estimeres med en tilfredsstillende nøyaktighet. Disse variasjonene er i hovedsak knyttet til ulike karakteristikker i brønndataen. Alt i alt legger denne avhandlingen fram oppmuntrende og interessante resultater, noe som oppfordrer til videre forskning på området.
dc.description.abstractThis thesis attempts to estimate two-phase flows from oil and gas production wells in a real-time setting, using state-of-the-art data-driven and hybrid models. The focus is on the individual wells, building well-specific predictive models. We consider the upstream sector of the petroleum industry, and propose two alternative approaches for a comparative study that is yet to be seen in the related literature. The objective is to estimate accurate flow rates that can substitute either erroneous or missing values in an existing data set or a continuous data stream. This creates a better foundation for making decisions regarding the production. The final outputs from the models are the two-phase gas-liquid flow rates, where liquid is the combined product of oil and water. It is necessary to model the physical relationships between a set of variables for each well. We describe these relations with the use of data-driven techniques in the form of neural networks to capture the complex non-linear physics. Further, Bayesian optimization with a Tree-Structured Parzen Estimator is applied to tune the hyperparameters of the neural networks. Two types of predictive models are built for describing the physical relations, the combined and the modular model. The combined model estimates the two-phase flows as a pure data-driven approach - from input to output in a single operation. By separating the estimation process into two subcomponents, the modular model - a hybrid modular design methodology - applies prior knowledge about the internal structure of the production system. Both generated data from a simulation scheme, and real production data from an oil field situated at the Norwegian Continental Shelf are used in a case study. The simulated data set has a potentially unlimited amount of data and quantifiable levels of quality. This results in a simulation framework that facilitates a systematic, controlled, and self-contained research environment for developing and testing estimation models, in a way that historical petroleum production data does not. We vary the data quality (data amount and noise degree), and find that for the simulated data the accuracy and robustness of the models improve continuously with a higher degree of data quality. The improvement stagnates when a sufficiently large data set in the range 1,000 to 5,000 samples is reached. However, the results for the historical production data indicate that there is no significant benefit from increasing the data volume; the smaller and larger data sets result in equally accurate models on average. This contradicts the established machine learning theory. As we operate with time series, we argue that, regardless of how many prior samples that are available, only the most recent data points are truly representative for the two-phase flows of the immediate future. The predictive performances of the combined and modular models are comparable. Consequently, we suggest applying the combined model due to its simpler formulation and implementation. Also, we introduce two alternative pre-training regimes, where the models are initially trained on the simulated data, before fine-tuning them to a real well. In this work, we conclude that these pre-training alternatives are ineffective for the specific simulation scheme that is applied. Finally, the overall results vary for the real wells, demonstrating precise flow rates (errors less than 10 percent) for some wells, whereas the accuracy is not satisfactory for others. These variations are primarily attributed to distinctive data characteristics. Overall, this thesis presents encouraging and interesting findings, thus motivating further exploration.
dc.language
dc.publisherNTNU
dc.titleReal-Time Data-Driven and Hybrid Modeling of Two-Phase Flow in Oil and Gas Wells - A study on how data quality affects model accuracy and the application of neural networks for flow estimation
dc.typeMaster thesis


Tilhørende fil(er)

FilerStørrelseFormatVis

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel