Predicting parameters of the Piezocone Penetration Test in the Wadden sea using multi-task machine learning on reflection seismic data
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3078049Utgivelsesdato
2023Metadata
Vis full innførselSamlinger
Sammendrag
I forbindelse med vindkraftprosjektet Ten noorden van de Waddeneilanden Vindkraftsone (TNWWFZ) utarbeidet Sauvin, Klinkvort og Vardy (2021) en integrert grunnmodell der maskinlæring ble brukt for å estimere parametere fra trykksondering med poretrykksmåling (CPTu) på tvers av utvinklingsområdet. Fremgangsmåten var avhengig av både seismiske atributter og geologisk informerte enhet-tolkninger. I denne opgaven benyttes en konvolusjonell enkoder til å hente ut informasjon fra seismiske bilder automatisk for å predikere CPTu parametere. Målet er å undersøke om parameterprediksjonen kan utføres med en integrert løsning, der kun refleksjonsseismiske profiler mates inn i modellen. Overførbarheten av koden er undersøkt ved å trene beslutningstrær på den intermediære koderepresentasjonen. Et av beslutningstrærene gjenspeiler et som var testet i det orginale prosjektet, og brukes som referansepunkt for sammenlikning av representasjonsevnen til den intermediære koden i motsetning til de seismiske atributtene. Fleroppgavelæring blir brukt til å begrense koderepresentasjonen med en bi-oppgave av å gjennomføre auto-enkoding, med hensikt av å skape en mer generaliserbar kode. Den foreslåtte metoden er avhengig av kontinuerlige sekvenser av CPTu data, som har implikasjoner for sammensetningen av grunnsannhet-datasettet. Ved dannelsen av mindre delmengder av det totale datasettet, er effekten av fysisk avstand mellom de seismiske profilene og CPTu målingene undersøkt. Effekten av avstand utspilte seg i høyere varians av tapsverdier (loss) i test-datasettet som viser tegn til overtilpasning i enkoderen. Videre hadde bi-oppgaven, som skulle lede til mer generaliserbar kode, en negativ påvirkning på modellens ytelse. Høy grad av likhet mellom beslutningstrærne og den nevrale nettverk dekoderen støtter hypotesen om at enkoderen er overtilpasset. Det blir konkludert at den produserte koden ikke er generaliserbar til andre oppgaver enn å predikere CPTu. Tentative sammenlikninger antyder at integrerte metoder slik som den foreslåtte kan være brukbare for å predikere CPTu. On the Ten noorden van de Waddeneilanden Wind Farm Zone (TNWWFZ) project, Sauvin, Klinkvort, and Vardy, 2021 developed an integrated ground model which used machine learning to estimate parameters of the Cone Penetration Test (CPT) across the development area. The machine learning approach depended on seismic attributes and geologically informed soil unit interpretations. In this thesis, a convolutional encoder is adopted to extract features from the seismic image automatically for use in CPT parameter prediction. The aim is to investigate whether the parameter prediction can be performed in a fully integrated manner, solely using the reflection seismic profiles as input. The transferability of the encoded features is examined by training decision trees on the intermediary feature representation. One of these models mirrors a model that was tested on the Ten noorden van de Waddeneilanden Wind Farm Zone (TNWWFZ) project, and serve as a benchmark for comparison of the strength of the latent features opposed to the seismic attribute features. Multi-Task Learning (MTL) is used to further constrain the encoding with the auxiliary task of autoencoding, with the purpose of creating more generalized features. The proposed methodology requires continuous segments of Cone Penetration Test (CPT) which has implications for the construction of the ground truth dataset. In creating this dataset, the effect of physical distance between the seismic profiles and CPT measurements was also examined using subsets of the exhaustive dataset. The effect of distance introduced a higher degree of variability in the loss of the testing set, whilst revealing signs of overfitting in the encoder. Further, the auxiliary task intended to improve generalization had detrimental effect on the model performance. The high degree of similarity between the decision tree models and the neural network decoder supports the hypothesis that the encoder regularly overfits. It is concluded that the features that were produced were not generalizable to other tasks than prediciton of CPT. Tentative comparisons suggest that viable CPT prediction can be done in an integrated manner such as the proposed method.