Privacy in Recommender Systems: Inferring User Personality Traits From Personalized Movie Recommendations
Abstract
Anbefalingssystemer er personaliserte systemer som samler inn brukerdata for å anbefale og skreddersy innhold. Denne masteroppgaven undersøker hvordan personlighetstrekk kan utledes fra personaliserte topp 10-filmanbefalinger for å undersøke potensiell lekkasje fra brukerdataen. Oppgaven utforsker effekten på treffsikkerheten av klassifikasjonen ved hjelp av ulike metoder, nærmere bestemt ulike inndelinger av personlighetstrekk, integrering av personlighetstrekk i et anbefalingssystem og resampling-teknikker. I eksperimentene ble det generert tilfeldige, vurderingsbaserte og personlighetsbaserte anbefalinger, og seks ulike klassifiseringsmetoder ble brukt til å utlede personlighetstrekk fra dem.
Funnene indikerer potensiell informasjonslekkasje av personlighet fra de personaliserte anbefalingene. Likevel ble det ikke observert noen konsekvente mønstre for personlighetstrekkene, ettersom ulike eksperimentelle oppsett ga forskjellige resultater. Videre ble det ikke observert noen signifikant forskjell i treffsikkerheten på klassifiseringen etter at personlighetstrekkene ble integrert i anbefalingssystemet. Disse funnene bidrar til å øke forståelsen av personvernhensyn i forbindelse med brukeranbefalinger og gir innsikt til fremtidig forskning på personvern i anbefalingssystemer. Recommender systems are personalized systems that collect data about the users to recommend and tailor the content. This thesis investigates inferring personality traits from personalized top 10 movie recommendations to investigate the potential leakage from this user data. The research explores the impact on classification accuracy using different strategies, namely various personality trait splits, integrating personality traits into recommender systems, and resampling techniques. In the experiments, random, rating-based, and personality-based recommendations were generated, and six separate classifiers were used to infer personality traits from them.
Findings indicate potential information leakage of personality from personalized recommendations. Still, no consistent pattern was observed across all personality traits, as different experimental setups gave different results. Additionally, no significant difference in classification accuracy was observed after incorporating the personality traits in the recommender system. These findings contribute to understanding privacy concerns from user recommendations and offer insights for future research in recommender system privacy.