Classifying European Court of Human Rights cases using transformer based models

Henrik, Hodnefjeld

dc.contributor.advisor	Ali, Shariq Imran
dc.contributor.advisor	Zenun, Kastrati
dc.contributor.author	Henrik, Hodnefjeld
dc.date.accessioned	2022-11-24T18:19:36Z
dc.date.available	2022-11-24T18:19:36Z
dc.date.issued	2022
dc.identifier	no.ntnu:inspera:112296943:24749335
dc.identifier.uri	https://hdl.handle.net/11250/3033966
dc.description.abstract	Modeller basert på transformers, som Bidirectional Encoder Representation from Transformers (BERT), har tradisjonelt ikke blitt brukt på tekstsekvenser med større lengde enn setninger. Å kjøre slike modeller har høye driftskostnader og krever mye minne. Slike transformer baserte modeller er ofte forhåndstrent på generaliserte språk, noe som gjør dem mindre effektive i språkspesifikke domener, for eksempel juridiske dokumenter. Innenfor fagfeltet for naturlig språkbehandling er det en økende interesse for å lage nyere modeller som kan håndtere mer komplekse inputsekvenser og domenespesifikke språk. Arbeidet i denne masteroppgaven bygger på den tidligere innsatsen som er gjort innen dokumentklassifisering, med fokus på det juridiske språket. Basert på våre undersøkelser av forskjellige BERT-modeller foreslår vi å bruke et bevegende skyvevindu tilnærming for å øke den normale maksimale sekvenslengden på modellene. Resultatene våre er validert av grundige empiriske eksperimenter der vi utkonkurrerer tidligere resultater på lignende oppgaver.
dc.description.abstract	Models based on transformers, such as Bidirectional Encoder Representation from Transformers (BERT), have traditionally not been applied to text sequences with greater length than that of sentences. Such models are computationally expensive and require a large amount of memory. Transformer-based models are also often pre-trained on generalized languages, which makes them less effective in language-specific domains, such as legal documents. In the field of natural language processing, there is a growing interest in creating newer models that can handle more complex input sequences and domain-specific languages. This work builds upon the previous efforts made within the domain of document classification, specifically concerning legal contexts. Based on our examinations of different models we propose using a sliding window approach to increase the normal maximum sequence length of models. Our results are validated by thorough empirical experiments in which we outperform previous results on similar tasks.
dc.language	eng
dc.publisher	NTNU
dc.title	Classifying European Court of Human Rights cases using transformer based models
dc.type	Master thesis

Tilhørende fil(er)

Filnavn:: no.ntnu:inspera:112296943:2474 ...
Størrelse:: 3.171Mb
Format:: PDF

Åpne

Denne innførselen finnes i følgende samling(er)

Institutt for datateknologi og informatikk [6622]

Vis enkel innførsel