A Hybrid Multi-document Summarization System for Biomedical Articles
Abstract
Hovedmålet med dette arbeidet er å undersøke hvordan tekstsammendrag kan brukestil å støtte beslutningsprosesser i det biomedisinske domenet, spesielt for diagnostiseringcerebral parese. Maskinlæring har vist et stort potensiale for tidlig diagnostiseringav CP. For at medisinske eksperter skal forstå systemets prediksjoner bedrevil artikler relatert til algoritmens funn bli hentet ut. Automatisk oppsummeringav disse artiklene kan hjelpe medisinske eksperter med å spare verdifull tid og giviktig informasjon for å støtte beslutningen av den endelige diagnosen. De sisteårene har naturlig språkprosessering (NLP) sett betydelige fremskritt i bruken avnevrale nettverksbaserte metoder. Tilgjengeligheten av forhåndstrente språkmodellerhar resultert i en betydelig forbedring i automatisk tekstoppsummering. Det erimidlertid fortsatt utfordrende å lage tekstsammendrag av flere lange dokumenterinnen det biomedisinske domenet som er nær hvordan mennesker ville ha skrevetdem.
Vi presenterer et nytt system for oppsummering av flere biomedisinske dokumentersom består av en ekstraktiv-abstraktiv oppsummerer. Det ekstraktive stegetbenytter forskjellige teknikker innen text mining, mens det abstraktive trinnet benytteren forhåndstrent språkmodell. Vårt hovedfokus er den ekstraktive delen, da denmuliggjør oppsummering av flere dokumenter ved å redusere mengden tekst somsendes inn til den forhåndstrente modellen. Systemet skal håndtere overflødig ogmotstridende informasjon innenfor det biomedisinske domenet og produsere konsiseog konsistente sammendrag. For å finne det optimale oppsummeringssystemetgjennomfører vi et ablasjonsstudie. Dette studiet involverer eksperimenter med uliketeknikker innen representasjon, gruppering, scoring og utvelging av setninger. Evalueringenav det foreslåtte systemet vårt viser et stort potensiale for å støtte beslutningsprosesserinnen det biomedisinske domenet og validere prediksjoner framaskinlæringsmodeller. Oppsummeringene som genereres ser generelt bra ut, menlider imidlertid fortsatt av overflødig og motstridende informasjon, så disse gjenværendeutfordringene må løses i fremtidig arbeid. The main objective of this work is to investigate how text summarization can be usedto support decision-making in the biomedical domain, especially in the diagnosis ofcerebral palsy. Machine learning has shown great potential for the early diagnosisof CP. For the medical experts to better understand the system’s predictions, articlesrelated to the algorithm’s findings will be retrieved. Automatic summarization ofthese articles can help medical experts save valuable time and provide essential informationto support the decision of the final diagnosis. In recent years, natural languageprocessing has seen significant advances in the use of neural-network-basedmethods. The availability of pre-trained language models has resulted in a significantimprovement in automatic text summarization. However, it remains challengingto create text summaries of multiple long documents in the biomedical domain closeto how humans would have written them.
We propose a novel biomedical multi-document summarization system consistingof an extractive-abstractive summarizer. The extractive step utilizes varioustext mining techniques, while the abstractive step employs a pre-trained languagemodel. Our main focus is the extractive part, as it enables the summarization ofmultiple documents by reducing the input text of the pre-trained model. The systemshould handle redundant, complementary, and conflicting information withinthe biomedical domain and produce concise and consistent summaries. In orderto find the optimal summarization pipeline, we conduct an ablation study. Thisstudy involves experiments with different techniques within representation, clustering,scoring, and selection of sentences. The evaluation of our proposed approachsystem shows great potential for supporting decision-making within the biomedicaldomain and validating predictions from machine learning models. The generatedsummaries look generally good, although they still suffer from some redundancyand conflicting information, so the remaining challenges need to be solved in futurework.