Vis enkel innførsel

dc.contributor.advisorBergh, Arild
dc.contributor.advisorKnox, Benjamin James
dc.contributor.authorAasen, Ole Joachim Arnesen
dc.date.accessioned2023-12-12T18:19:54Z
dc.date.available2023-12-12T18:19:54Z
dc.date.issued2023
dc.identifierno.ntnu:inspera:139586733:39519392
dc.identifier.urihttps://hdl.handle.net/11250/3107222
dc.description.abstractUtviklingen innen språkmodeller, med modeller som GPT-3, har vist en enorm økning i deres potensial for å løse oppgaver innen språkbehandling. Samtidig som denne utivklingen er blitt tatt i bruk for å løse problemer er det blitt tydeliggjort dens potensiale for harme. Tidligere arbeid gjort innen disse områdene har hovedsaklig rettet seg mot høyressurs-språk som engelsk. denne masteroppgaven ser nærmere på hvordan språkmodeller presterer i det norske språk, et lavressurs-språk. For å se nærmere på hvilken trussel disse språkmodellene utgjør i konteksten påvirkningsoperasjoner i sosiale medier. Masteroppgaven starter med å danne et bilde på dagens fremste løsninger innen språkmodeller, og hvilke mulige roller disse modellene kan fylle i en påvirkningsoperasjon. Arbeidet i denne oppgaven starter med en innsamling data og implementasjon av ulike verktøy for å forsterke språkmodellenes evne til å generere norsk tekst. Forskningsmetoden brukt for å besvare oppgaven, og evaluere modellene er kombinerte metoder. Det samles inn kvantitative data gjennom evaluering av språkmodellene i ulike kontekster, kombinert med innhenting av deltakeres egne evalueringer i spørreskjema. Videre brukes intervjuer for å forstå hvilke opplevelser, observasjoner og vurderinger deltakerne har til bruk av språkmodeller. Denne masteroppgaven ønsker å avansere forskningen innen språkbehandling innen et lavressurs-språk. Ved å se nærmere på språkmodellers evner i et lavressurs-språk sikter oppgaven etter å bedre forstå om en lignende utvikling kan bli sett på norsk som på engelsk. Videre ønsker oppgaven å utforske bruken av språkmodeller for å kunne drive trening mot påvirkningsoperasjoner i lukkede sosiale nettverk.
dc.description.abstractThe advancement of language models, such as GPT-3, has showcased their tremendous potential in various natural language processing tasks, but also their potential for harmful misuse. However, the majority of research and development efforts have been concentrated on high-resource languages, leaving low-resource languages with limited access to the benefits of these models. This master thesis focuses on exploring the use of language models in Norwegian, a low-resource language. Addressing the threats these models pose in the context of influence operations in social media. The thesis begins by providing a literature review, examining the current state of language models, and the possible role of language models within the context of influence operations. The research methodology encompasses data collection, model-training, and evaluation. The data collection phase involves collecting relevant datasets, fine-tuning models and combining different tools to enable generation of text in Norwegian. The research employs a mixed-methods approach, combining quantitative analysis and qualitative investigations. The quantitative analysis entails evaluating the performance of language models across various contexts, assessing their ability to generate perceived authentic content, and analyzing user responses to such generated content. The qualitative investigations involve conducting interviews and surveys to gather insights from participants, aiming to understand their experiences, perceptions, and concerns regarding the use of language models. By investigating the use of language models in a low-resource language, this thesis aims to contribute to the advancement of natural language processing research in an underrepresented linguistic context. As well as exploring the use of these language models for training purposes in isolated social networks.
dc.languageeng
dc.publisherNTNU
dc.titleSmall languages and big models - Using ML to generate social media content for training purposes
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail
Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel