From Traits to Threats - Identification of Personality Traits for Individuals at Risk of Radicalisation on Social Media

Underhaug, Lars-Magnus

dc.contributor.advisor	Gambäck, Björn
dc.contributor.author	Underhaug, Lars-Magnus
dc.date.accessioned	2022-07-20T17:20:12Z
dc.date.available	2022-07-20T17:20:12Z
dc.date.issued	2022
dc.identifier	no.ntnu:inspera:102935593:33639972
dc.identifier.uri	https://hdl.handle.net/11250/3007374
dc.description.abstract	Sosiale medier har blitt et viktig verktøy for radikale grupperinger som muliggjør spredning av propaganda og rekruttering av individer til radikale miljøer. Gjennom spredningen av slikt innhold vil sårbare og nysgjerrige individer kunne eksponeres for informasjon som de i utgangspunktet ikke har oppsøkt. For enkelte vil denne eksponeringen kunne manifestere seg og lede til såkalt selvradikalisering. Mange sosiale medieplattformer har tatt grep i et forsøk på å begrense spredningen av radikalt innhold. Til tross for disse tiltakene er det, på det tidspunkt denne oppgaven er skrevet, fortsatt flere aktive radikale å finne på sosiale medier. Tidligere studier har vist at radikale brukere kan identifiseres på Twitter gjennom bruk av maskinlæringsmetoder og språkbehandlingsteknikker. Dette er ikke nødvendigvis den mest effektive tilnærmingen for å begrense veksten av radikale miljøer. Denne masteroppgaven argumenterer for at en mer naturlig tilnærming vil være å identifisere potensielle fremtidige radikale forut for radikalisering. Gjennom tilegning av kunnskap om disse individene vil man kunne jobbe proaktivt og begrense rekruttering. Denne masteroppgaven utforsker personlighetstrekkene til personer ansett å være sårbare for radikalisering i sosiale medier gjennom automatisk predikasjon av personlighetstrekk. Personlighetstrekkene ble målt med utgangspunkt i Big 5-modellen for personlighetstrekkene åpenhet, ekstraversjon, planmessighet, medmenneskelighet, og nevrotisisme . Tre datasett bestående av tweets og essayer merket med verdier for Big 5-personlighetstrekk ble samlet inn og brukt til å trene et utvalg av maskinlæringsmodeller. Videre ble det samlet inn, prosessert og annotert et datasett bestående av 15.195 tweets fra 259 Twitter-brukere ansett å være sårbare for radikalisering. Som en motvekt til dette datasettet ble også det samlet inn et datasett bestående av 25.624 tweets fra 259 ordinære, ikke-sårbare Twitter-brukere. De beste modellene for personlighetspredikasjon ble så valgt ut og brukt til å predikere personlighetstrekk for de to domenene. Et av hovedbidragene til denne oppgaven er en metode for identifisering av sosiale medier-brukere som anses å være sårbare for radikalisering. Metoden baserer seg på de sosiale nettverkene til allerede radikaliserte brukere og et sett med indikatorer på radikalisering, utformet med utgangspunkt i tidligere forskning. Utover dette bidrar oppgaven med en nyvinnende og grundig analyse av personlighetstrekkene til individer som anses å være sårbare for radikalisering, samt en analyse av hvordan disse personlighetstrekkene skiller seg fra ikke-sårbare personer. Resultatene viser at man gjennom bruk av den fremsatte datainnsamlings- og annoteringsmetoden kan identifisere brukere som er sårbare for radikalisering. Ved sammenligning av annotering fra to uavhengige personer oppnår metoden en innbyrdes annoteringsenighet på 0.83, målt ved Cohens Kappa. Videre analyse av de predikerte personlighetstrekkene viser at personer sårbare for radikalisering har lignende profil for personlighetstrekkene medmenneskelighet og planmessighet. Ved sammenligning av de predikerte personlighetstrekkene mot ikke-sårbare personer viser analysen forskjeller i distribusjon for personlighetstrekkene medmenneskelighet, åpenhet, og planmessighet. Disse resultatene indikerer at personligheten til personer sårbare for radikalisering kan være forskjellig fra ikke-sårbare personer.
dc.description.abstract	Social media have become a playground for radical communities, serving as a tool for spreading propaganda and recruiting new individuals to their cause. Vulnerable individuals and curious minds are being exposed to content which they may not have been deliberately perusing, which in turn contributes to their radicalisation process. Despite continuous efforts from social media platforms to restrict the publication of radical content, radical communities are still very much active on social media. Multiple studies have investigated the presence of radical communities on social media and successfully identified radicals on Twitter using methods of machine learning and natural language processing. However, identifying already radicalised individuals may not be the ideal starting point in countering these communities. This Thesis argues that a more natural approach would be to identify individuals before they are drawn into these communities. Understanding the process and factors leading up to radicalisation can provide important insight into the minds of those at risk of radicalisation and hinder further recruitment to radical communities. By using linguistic cues and methods of machine learning, this Thesis explores the personality traits of individuals considered to be at risk of Islamist radicalisation on Twitter. The personality traits were measured according to the Big 5 personality model for the traits agreeableness, extraversion, conscientiousness, neuroticism, and openness. A total of three pre-existing personality datasets, consisting of tweets and essays labelled with Big 5 personality scores, were accumulated and used for training personality prediction models. The best performing models were selected and used for personality prediction on a manually collected and annotated dataset consisting of 15,195 tweets from 259 Twitter users believed to be at risk of radicalisation. As a counterpoise, the predicted traits were compared to the traits of ordinary Twitter users, derived from on a randomly sampled dataset of consisting of 25,624 tweets from 259 non-radical Twitter users. This Thesis contributes by proposing a method for identifying users believed to be at risk of radicalisation on social media, by utilising the social media networks of already radicalised individuals and a set of indicators derived from related work on radicalisation. In addition, this Thesis provides a new to the field, in-depth analysis of the personality traits of Twitter users at risk of radicalisation and how they may differ from ordinary users. The results show that the proposed data collection and annotation scheme is able to successfully identify individuals at risk of radicalisation, yielding an inter-annotator agreement, measured by Cohen's Kappa, of 0.83. The analysis of the predicted personality traits shows that users at risk of radicalisation have common profiles for agreeableness and conscientiousness. When comparing the predicted traits to that of ordinary, non-radical Twitter users, the predictions show a marginal difference in distribution for agreeableness, openness, and conscientiousness, indicating a certain difference in personality between the two domains.
dc.language	eng
dc.publisher	NTNU
dc.title	From Traits to Threats - Identification of Personality Traits for Individuals at Risk of Radicalisation on Social Media
dc.type	Master thesis

Tilhørende fil(er)

Filnavn:: no.ntnu:inspera:102935593:3363 ...
Størrelse:: 8.579Mb
Format:: PDF

Åpne

Filnavn:: no.ntnu:inspera:102935593:3363 ...
Størrelse:: 1.236Mb
Format:: application/zip

Åpne

Denne innførselen finnes i følgende samling(er)

Institutt for datateknologi og informatikk [6553]

Vis enkel innførsel