Cryptographically Private Linear Regression
Abstract
Maskinlæring og stordatabehandling er viktige tema i den digitale verden, men her finnes det ufordringer med å holde dataene privat. I denne teksten skal vi se på hvordan en kan bruke homomorf kryptering for å holde både dataene og algoritmen brukt til å analysere privat. Vi skal se på lineær og logistisk regresjon, siden dette er kraftige verktøy som legger grunnlaget for mange andre algoritmer. Vi skal så lage en algoritme for å gjøre dette, og bevise at den er kryptografisk sikker. Til slutt skal vi lage en liten implementasjon av systemet mitt, for å vise at det er gjennomførbart i praksis. Machine learning and big data analysis are important topics in the digital world, but they come with privacy concerns. In this text, we will look at at how one can use homomorphic encryption to preserve the privacy of both the data and the algorithm used to analyze the data. We will look at at linear regression, and briefly at logistic regression, as these are powerful tools that lay the foundation for other algorithms. We will create an algorithm for how to do this, and then prove it secure. We will also look at a toy implementation of the system, to show proof of concept.