A graph theoretical approach to online predator detection

Aarekol, Anna Fridtun

dc.contributor.advisor	Bours, Patrick
dc.contributor.advisor	Gajic, Natasa
dc.contributor.author	Aarekol, Anna Fridtun
dc.date.accessioned	2022-08-30T17:19:11Z
dc.date.available	2022-08-30T17:19:11Z
dc.date.issued	2022
dc.identifier	no.ntnu:inspera:107093487:33638546
dc.identifier.uri	https://hdl.handle.net/11250/3014533
dc.description.abstract	Mange barn bruker mye tid på nettet, enten de ser på videoer, spiller spill eller snakker med venner eller fremmede over sosiale medier. Mange ulike plattformer er skapt med barn som målgruppe. Dette har muliggjort at barn kan treffe nye venner og holde kontakt med de uten fysisk å møtes. Selv om disse plattformene kan bidra til å øke barns sosiale krets, kan de òg ha mørkere sider ved seg. Plattformer på nett gir tilgang til samtaler med barn for folk med dårlige hensikter. På disse plattformene kan overgripere komme i kontakt med barn med lav risiko for å bli avslørt. Denne masteravhandlingen forsøker å finne en metode for å gjenkjenne overgripere på nett ved hjelp av grafteori. Det eksisterer prosjekter som studerer deteksjon av overgripere på nett fra før av. Størsteparten av disse benytter tekstlig analyse, og flere kan vise til gode resultater. Analysene går ut på å finne ord eller fraseringer som er mer typisk for en overgriper å bruke enn et barn. Det er flere utfordringer med å analysere tekst i overgrepsdeteksjon. Når man lager et system for analyse av tekstmeldinger vil analysen kun fungere på det språket som systemet ble laget i. Det vil ikke være mulig å lage et deteksjonsprogram som kan fungere uavhengig av språket. En annen utfordring er mengden uformelt språk i tekstmeldinger. Tekstmeldinger inneholder gjerne mer slang, skrivefeil og generelt uformelt språk, som er utfordrende for maskiner å tolke. For å unngå utfordringene som er beskrevet i prosjekter med tekstanalyse for overgrepsdeteksjon, vil vi bruke grafteori for deteksjon av overgripere på nett. Et datasett fra en chatteplattform med barn som målgruppe, vil presenteres som en graf. Brukerne blir representert av noder, og meldingene som sendes mellom brukerene representeres av kanter. Hovedmålet med arbeidet er å finne ut om det mulig å gjenkjenne en overgriper ved å studere egenskapene til de ulike nodene i grafen. Vi har gjennom studiet designet og implementert et sett av funksjoner som har blitt brukt i flere forskjellige klyngealgoritmer. Fra resultatene av klyngealgoritmene har vi funnet flere brukere som vi anser som sannsynlige overgripere. Vi har til slutt studert anonymiserte tekstmeldinger som er sendt fra relevante brukere for å konkludere om de er overgriper eller ikke. Gjennom denne studien, har vi funnet ut at grafteori kan brukes som metode for overgrepsdeteksjon på nett. Videre bør både ikke-overvåket og overvåket maskinlæring i statiske og dynamiske grafer bli studert videre for å finne en mer presis metode for å finne brukere med unormal oppførsel.
dc.description.abstract	Many children spend much time online, watching videos, playing games, or talking with friends or strangers on social media. Many different online platforms are created targeted at children. The Internet has enabled kids to meet new friends and stay in touch with each other without physically meeting. Although these platforms may contribute significantly to children's social life, they may also pose threats to the children. The online platforms give easy access to conversations with children, even for people with bad intentions. On these platforms, predators can come in contact with children with a low risk of getting disclosed. This master thesis aims to find a method for recognizing predators online using a graph-theoretical approach. There are research projects that have already studied online predator detection. Most of the research in this area uses textual analysis for the task, many with promising results. The methods involve recognizing specific words or phrases that a predator would use that are unusual for children. There are multiple challenges with this approach. First, when making a predator detection system that analyses text, it can only function if used in the language it was developed for. It will be impossible to create such a system independent of the language. Secondly, the text messages on a chat platform are often informal and contain many slang words. This makes it challenging for machines to interpret what the messages mean. To avoid the challenges posed by the textual analysis, we use a graph-theoretical approach to detect predators online. Using a real-world data set collected from a social network for children, graph representations of the network will be used to detect predators. The users will be represented as nodes, and the messages between the users as edges. The main goal of the thesis is to study if it is possible to recognize a predator by studying the properties of the nodes in the graph. We have, throughout the study, designed and implemented a set of features that has been used in various clustering algorithms. From the results of the clustering algorithms, we have discovered multiple users that we considered likely to be predators. To assess some specific users in more detail, we studied anonymized text messages from relevant users and concluded whether the users were predators or not. We concluded that a graph theoretical approach can be used for online predator detection. However, in the future, both unsupervised and supervised learning in static and dynamic graphs should be studied further for predator detection to find more precise methods to find users with abnormal behavior.
dc.language	eng
dc.publisher	NTNU
dc.title	A graph theoretical approach to online predator detection
dc.type	Master thesis

Files in this item

Name:: no.ntnu:inspera:107093487:3363 ...
Size:: 27.40Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Institutt for informasjonssikkerhet og kommunikasjonsteknologi [2525]

Show simple item record