Privacy Leaks in Recommender Lists: Exploring Obfuscation Techniques to Preserve Privacy
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3107223Utgivelsesdato
2023Metadata
Vis full innførselSamlinger
Sammendrag
Flesteparten av dagens digitale tjenester benytter en eller annen form for et anbefalingssystem. En stor ulempe med disse anbefalingssystemene er at de baserer seg påstore mengder med persondata, noe som gjør dem utsatte for personvernangrep. Dennemasteroppgaven tar for seg scenarioet der en angriper klarer å finne en brukers kjønn,utelukkende basert på brukerens filmanbefalinger. Det finnes verk som tar for seg personvern i anbefalingssystemer, men blant disse verkene er det manglende fokus på personverni selve anbefalingslistene. Målet med denne oppgaven er derfor å finne og eksperimenteremed teknikker som bytter ut "items" i anbefalingslister for å se om disse byttene kanvanskeliggjøre kjønnsklassifisering.Teknikkene som brukes for å endre på anbefalingslistene er basert på tidligere personvernarbeid i anbefalingssystemdomenet. I tillegg eksperimenterer arbeidet med enteknikk som er mer knyttet opp mot "tilfeldige funn" (kalt serendipity på engelsk). Denneteknikken baserer seg på å anbefale en bruker u "items" som er mislikt av brukere somer ulike bruker u, preferansemessig. Mer spesifisert kalles "tilfeldige funn"-teknikken for"k-Furthest Neighbor (kFN)". Anbefalingslistene som modifiseres er generert ved bruk aven filmdatabase ved navn MovieLens100K.Selve resultatene fra masterarbeidet fås ved å undersøke hvor relevante de modifiserteanbefalingslistene er, samt hvor bra de skjuler brukerens kjønn (kun mann og kvinneer tatt hensyn til). Resultatene viser at strategien som baserer seg på "tilfeldige funn"er den som gjør det best generelt, både med tanke på angrepsbeskyttelse og relevansei anbefalingene. Videre peker resultatene også på at en høyere grad av modifisering,der modifiseringen medfører mindre personalisering, ikke nødvendigvis resulterer i merpersonvernvennlige anbefalingslister.Masterens bidrag er dermed en utforskning av mangelen på personvernfokus i anbefalingslister, i kombinasjon med brukbare teknikker som kan danne grunnlaget forfremtidige tiltak. Recommender Systems have become an essential part of today’s online services, providingentertaining content to each individual user of a service. However, these systems requirea vast amount of user data, making them vulnerable to privacy attacks. The focusof this thesis is on the attack that manages to infer a user’s gender based on a set ofrecommended movies for that given user. Even though earlier works have indeed focusedon privacy in recommender systems, there is limited research on privacy-preservingtechniques for recommender lists. The goal of this thesis is thus to experiment withobfuscation techniques, techniques that replace original items with new and "noisy" items,to prevent an adversary from being able to infer users’ genders.To do so, a set of obfuscation techniques discussed in earlier research, along withtechniques traditionally used to introduce serendipity, are performed on recommenderlists. These recommender lists are generated based on the MovieLens100K dataset. Foreach particular technique, the average gender leakage and recommender performance ismeasured.The final contributions of this work include an awareness of the missing privacypreservation in Recommender Systems, along with the techniques that can be used tolower the accuracy of gender inference attacks. The results of the thesis reveal thatthe serendipity-introducing technique based on the concept of "K furthest neighbors"is able to lower inference performance while simultaneously preserving some degree ofpersonalization. Moreover, the results also show that an increasing degree of obfuscationthat decreases the degree of personalization does not necessarily correspond to betterprivacy preservation.