Cyber Grooming Detection: Human or Machine? Or Hybrid?
Master thesis
Permanent lenke
https://hdl.handle.net/11250/2984396Utgivelsesdato
2021Metadata
Vis full innførselSamlinger
Sammendrag
Den teknologiske utviklingen byr på mange nye muligheter. Med slike muligheterkommer også nye utfordringer. En av disse er cybergrooming. Predatorer utnytterdisse nye mulighetene som lar dem være til stede over alt i det digitale rom, for åetablere relasjoner til barn. Disse relasjonene blir videre misbrukt av predatorenefor å utføre seksuelle overgrep eller andre straffbare handlinger. Denne oppgaventar sikt på å oppdage utvidet kunnskap om egenskaper fra menneskelig analyse,som mennesker finner definerende ved predator-samtaler og ikke-predatorsamtaler.Egenskaper som potensielt kan benyttes til å forbedre cybergroomingdeteksjonssystemer.Det eksisterer cybergrooming-deteksjonssystemer som benytterseg av maskinlæringsalgoritmer, men det er begrenset hvor mye maskinlæringsalgoritmerklarer å lære seg på egen hånd. Det ble samlet inn menneskelige evalueringerav samtaler. Disse evalueringene ble sammen med de korresponderendesamtalene videre analysert for å oppdage trender, mønstre og egenskaper av definerendeart. Ingen egenskaper sto seg frem som absolutte i alle predator-samtaler,noe som betyr at en egenskap alene ikke med absolutt sikkerhet kan si om ensamtale potensielt er en predator-samtale eller ikke. Kombinasjoner av to ellerflere egenskaper ble funnet til å stort sett alltid være til stede i predator-samtaler.Flere egenskaper viste seg å være av definerende art. Noen egenskaper er aldersdefinerende,og andre definerer potensielt tiltenkte handlinger. Ikke-predatorsamtalerutgjorde mesteparten av evalueringene, og de fleste av disse var definertsom normale samtaler. Noen samtaler var også definert som seksuelle. For å potensieltkunne benytte disse egenskapene kan implementasjoner av ulike maskinlæringsmetoderinkluderes i eksisterende cybergrooming-deteksjonssystemer, somfor eksempel AiBA (Author input Behavioral Analysis). Egenskaper kan legges tili systemer på ulike måter for å forbedre deteksjon og hjelpe med deteksjon avpågående cybergrooming på et så tidlig tidspunkt som mulig. The technological evolution is providing new opportunities at fast pace. Such opportunitiesalso come with new challenges, one of which is cyber grooming. Predatorsare taking advantage of the new opportunities being present everywhere, establishingrelations to children. The relations are further misused by the predatorsto perform sexual abuse or other malicious actions. This thesis aims to discoverextended knowledge of features found from human analysis of predatory andnon-predatory chat conversations. Features of which potentially can be used toimprove cyber grooming detection systems. There exist cyber grooming detectionsystems utilizing machine learning algorithms, but machine learning algorithmscan only discover so much on their own. Human evaluations of conversationswere collected. The collected evaluations and corresponding conversations werefurther analyzed to discover trends, patterns and features of defining nature. Nofeature stood out as absolute in every predatory conversation, meaning one featurealone cannot with absolute certainty tell if a conversation is predatory ornon-predatory. Combinations of two or more features were, however, found toalmost always be present in predatory conversations. Several features showed tobe of a defining nature. Some features are age defining and others are definingpotentially intended actions. Non-predatory conversations constituted most of theevaluations, mostly being defined as normal conversations and some being sexualconversations. In order to potentially make use of the features, implementationsof various machine learning methods can be included in existing cyber groomingdetection systems, as for example AiBA (Author input Behavioral Analysis). Featurescan add to systems in different ways in order to improve detection and helpdetect ongoing cyber grooming at an earlier point of time.