Show simple item record

dc.contributor.advisorBerg, Carl
dc.contributor.advisorVaragnolo, Damiano
dc.contributor.advisorChawshin, Kurdistan
dc.contributor.authorNguyen, Nghia
dc.date.accessioned2021-10-13T17:28:38Z
dc.date.available2021-10-13T17:28:38Z
dc.date.issued2021
dc.identifierno.ntnu:inspera:85048116:46980762
dc.identifier.urihttps://hdl.handle.net/11250/2799904
dc.description.abstractI petroleumsgeologifeltet har ulike tilnærminger til maskinlæring vist at det finnes et substansielt potensial som kan supplere og på sikt erstatte konvensjonelle og arbeidsintensive metoder. Noen forfattere har for eksempel foreslått bruk av overvåkede læringsalgoritmer for å forutsi og klassifisere litofacies. Det er imidlertid noen situasjoner hvor det å kunne slå sammen maskinlæring med menneskelige innspill vil være fruktbart. I denne masteroppgaven fokuserer vi på ett spesifikt eksempel for behovet for en sammenslåing av maskinelle og menneskelige tolkninger. Mer spesifikt gir læringsalgoritmene oss en forvirringsmatrise (hva som har blitt feilkategorisert med hva, og hvor ofte) ved å klassifisere litofacies under en overvåkningsbasert metode. Dette kan brukes som input for utførelse av en hierarkisk sammenknytting (å betrakte to litofacies som ofte sammenblandes av maskinen). Denne måten å utføre hierarkisk sammenknytting på gir et trediagram kalt et dendrogram. Man kan også lage et analogt dendrogram: Geologer kan sammenligne to litofacier ved å betrakte forskjellige egenskaper ved bergartene. Dette menneskelige dendrogrammet kan naturligvis være topologisk forskjellig fra det maskinbaserte. Denne masteroppgaven fokuserer på hvordan man kan utnytte begge dendrogrammene til å øke geologers forståelse. Dette kan gjøres ved å ta i betraktning både de numeriske metodene sammen med den konvensjonelle som kilder til hvordan vi kan klassifisere litologien til visse brønner. Så vidt vi vet er å kombinere flere hierarkiske sammenknyttinger (eller dendrogrammer) en praktisk tilnærming til dette problemet, men noe som ofte har blitt oversett innen petroleumsgeologifeltet. Det overordnede målet til denne studien er dermed å undersøke hvordan man kan kombinere hierarkisk sammenknytting i en spesifikk case. Spesifikt brukes Min-trAnsiTive Combination of Hierarchical clusterings-metoden (MATCH) for å kombinere et maskinelt dendrogram med et dendrogram fra en geolog. Etter at det endelige dendrogrammet er ferdig, blir det visuelt sammenlignet med de opprinnelige dendrogrammene ved å plassere dem i et diagram kalt et tanglegram. Et slikt tanglegram har en tilbøyelighet til å være betydelig flokete, noe som er kjent som et tanglegram-layout-problem. Fokuset på å løse dette problemet har fått mye oppmerksomhet det siste tiåret og flere metoder er blitt foreslått, men de synes å være overforenklet og ineffektive når det gjelder å skape et minst mulig flokete tanglegram. Derfor har vi i dette arbeidet utviklet en ny «avflokingsmetode» som søker å finne en optimal løsning for tanglegram-layout-problemet. Resultatene viser at MATCH-metoden fungerer godt til å produsere et kombinert dendrogram, og den nye «avflokingsmetoden» lykkes i å finne bedre tanglegram-layouter sammenlignet med tidligere metoder.
dc.description.abstractIn the field of petroleum geology, the implementation of machine learning approaches has been showing considerable potential for supplementing and replacing conventional and labour-intensive approaches. For example, the idea of using supervised learning algorithms has been proposed by some authors to predict and classify lithofacies. In general, though, there are some situations where merging the machine learning approaches with human inputs is valuable. In this master thesis, we focus on one specific instance of this need for fusing interpretations from machines with interpretations from humans. More specifically, we consider that from the processes of classifying lithofacies in a supervised learning based way, the learning algorithms return a confusion matrix (i.e., what has been misclassified with what, and how often) which can be used as the input for performing hierarchical clustering (i.e., considering two lithofacies that are often mixed up by the machine as similar). This strategy of doing hierarchical clustering returns a tree-like diagram called a dendrogram. At the same time, humans can also produce an analogous dendrogram: geologists may indeed say that two lithofacies are similar by taking other types of data from rock properties into consideration. This human-based dendrogram might of course be topologically different from the former machine-based. This thesis focuses on the problem of how to utilize both of these dendrograms so to improve the understanding of the geologists, and in this way considering both the numerical methods together with the conventional one as sources for understanding how to classify the lithology of some wells. To the best of our knowledge, combining multiple hierarchical clusterings (or dendrograms) is a practical way to address this problem, but it has been overlooked in petroleum geosciences. The major aim of this study is thus to investigate how to combine hierarchical clusterings for a specific case. Specifically, the Min-trAnsiTive Combination of Hierarchical clusterings (MATCH) method is used to combine a dendrogram from the computational method with one from a geologist's perspective. After the final dendrogram is formed, it is visually compared with the primary dendrograms by placing them in a diagram called tanglegram. It is well known that this tanglegram shows a propensity to be significantly tangly, which is known as a tanglegram layout problem. Solving this problem has been received much attention in the past decade, and several methods have been proposed, but they seem to be oversimplistic and inefficient in terms of producing the least tangly tanglegram. Therefore, in this work we develop a new untangle method that seeks to find an optimal solution for the tanglegram layout problem. The results show that the MATCH method works well to produce the combined dendrogram, and the new untangle method succeeds in finding better layouts of tanglegrams compared to one of the other methods.
dc.languageeng
dc.publisherNTNU
dc.titleHierarchical Clustering Combination and an Algorithm to Solve the Tanglegram Layout Problem
dc.typeMaster thesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record