Privacy Leaks in Recommender Lists: Exploring Obfuscation Techniques to Preserve Privacy

Barthold, Ingebjørg

dc.contributor.advisor	Özgöbek, Özlem
dc.contributor.author	Barthold, Ingebjørg
dc.date.accessioned	2023-12-12T18:19:56Z
dc.date.available	2023-12-12T18:19:56Z
dc.date.issued	2023
dc.identifier	no.ntnu:inspera:142737689:34371115
dc.identifier.uri	https://hdl.handle.net/11250/3107223
dc.description.abstract	Flesteparten av dagens digitale tjenester benytter en eller annen form for et anbefalingssystem. En stor ulempe med disse anbefalingssystemene er at de baserer seg på store mengder med persondata, noe som gjør dem utsatte for personvernangrep. Denne masteroppgaven tar for seg scenarioet der en angriper klarer å finne en brukers kjønn, utelukkende basert på brukerens filmanbefalinger. Det finnes verk som tar for seg personvern i anbefalingssystemer, men blant disse verkene er det manglende fokus på personvern i selve anbefalingslistene. Målet med denne oppgaven er derfor å finne og eksperimentere med teknikker som bytter ut "items" i anbefalingslister for å se om disse byttene kan vanskeliggjøre kjønnsklassifisering. Teknikkene som brukes for å endre på anbefalingslistene er basert på tidligere personvernarbeid i anbefalingssystemdomenet. I tillegg eksperimenterer arbeidet med en teknikk som er mer knyttet opp mot "tilfeldige funn" (kalt serendipity på engelsk). Denne teknikken baserer seg på å anbefale en bruker u "items" som er mislikt av brukere som er ulike bruker u, preferansemessig. Mer spesifisert kalles "tilfeldige funn"-teknikken for "k-Furthest Neighbor (kFN)". Anbefalingslistene som modifiseres er generert ved bruk av en filmdatabase ved navn MovieLens100K. Selve resultatene fra masterarbeidet fås ved å undersøke hvor relevante de modifiserte anbefalingslistene er, samt hvor bra de skjuler brukerens kjønn (kun mann og kvinne er tatt hensyn til). Resultatene viser at strategien som baserer seg på "tilfeldige funn" er den som gjør det best generelt, både med tanke på angrepsbeskyttelse og relevanse i anbefalingene. Videre peker resultatene også på at en høyere grad av modifisering, der modifiseringen medfører mindre personalisering, ikke nødvendigvis resulterer i mer personvernvennlige anbefalingslister. Masterens bidrag er dermed en utforskning av mangelen på personvernfokus i anbefalingslister, i kombinasjon med brukbare teknikker som kan danne grunnlaget for fremtidige tiltak.
dc.description.abstract	Recommender Systems have become an essential part of today’s online services, providing entertaining content to each individual user of a service. However, these systems require a vast amount of user data, making them vulnerable to privacy attacks. The focus of this thesis is on the attack that manages to infer a user’s gender based on a set of recommended movies for that given user. Even though earlier works have indeed focused on privacy in recommender systems, there is limited research on privacy-preserving techniques for recommender lists. The goal of this thesis is thus to experiment with obfuscation techniques, techniques that replace original items with new and "noisy" items, to prevent an adversary from being able to infer users’ genders. To do so, a set of obfuscation techniques discussed in earlier research, along with techniques traditionally used to introduce serendipity, are performed on recommender lists. These recommender lists are generated based on the MovieLens100K dataset. For each particular technique, the average gender leakage and recommender performance is measured. The final contributions of this work include an awareness of the missing privacy preservation in Recommender Systems, along with the techniques that can be used to lower the accuracy of gender inference attacks. The results of the thesis reveal that the serendipity-introducing technique based on the concept of "K furthest neighbors" is able to lower inference performance while simultaneously preserving some degree of personalization. Moreover, the results also show that an increasing degree of obfuscation that decreases the degree of personalization does not necessarily correspond to better privacy preservation.
dc.language	eng
dc.publisher	NTNU
dc.title	Privacy Leaks in Recommender Lists: Exploring Obfuscation Techniques to Preserve Privacy
dc.type	Master thesis

Tilhørende fil(er)

Filnavn:: no.ntnu:inspera:142737689:3437 ...
Størrelse:: 13.67Mb
Format:: PDF

Åpne

Denne innførselen finnes i følgende samling(er)

Institutt for datateknologi og informatikk [6558]

Vis enkel innførsel