FishNet: A Unified Embedding For Salmon Recognition
Abstract
Dagens metoder for markering og sporing av oppdrettslaks baserer seg p˚a fysiskkontakt med fisken. Denne prosessen er b˚ade ineffektiv, stressende og potensieltskadelig for laksen. Bruken av dyp læring har de siste ˚arene gjort store fremskrittinnenfor ansiktsgjenkjennelse hos mennesker. I denne oppgaven beskriver viFishNet, et system som bruker dyp læring til individgjenkjenning av laks.
Systemet lærer en funksjon fra bilder av laksehoder til en kompakt vektor, derlikhet mellom vektorer tilsvarer likheter mellom laksen. Konvolusjonsnett brukestil ˚a direkte optimalisere disse vektorene ved hjelp av tripler av bilder. Systemetgjør ingen antagelser om hvilke deler av laksens hode som brukes til ˚a skille demfra hverandre.
Eksperimentene viser at teknikkene som brukes i moderne ansiktsgjenkjenningsprogrammerfungerer godt p˚a laks, og at man kan f˚a god ytelse med relativtsm˚a nevrale nett. Med en falsk positiv rate p˚a 1% har FishNet en sann positivrate p˚a 96%.
Denne oppgaven beskriver det første systemet som bruker ende til ende dyplæring for individgjenkjenning hos laks. Bildene brukt i oppgaven er fra kameraeri oppdrettsmærer, et miljø med mange varierende faktorer som p˚avirker bildekvaliteten. The current methods of individual salmon tagging and tracking rely on physicalinteraction with the fish. This process is inefficient, and can cause physical harmand stress for the salmon. The use of deep learning techniques has shown greatadvances in the field of human face recognition. In this thesis we describe a system,FishNet, that applies one of these techniques to the field of salmon recognition.
The system learns a mapping from images of salmon heads to a compact vectorembedding, where similarities between embeddings correspond to similaritiesbetween salmon. Convolutional neural networks are used to directly optimize theembeddings using tiplets of images. The system does not make any assumptionsas to which parts of the head that are useful for distinguishing them from eachother.
The experiments show that modern face recognition techniques work well onsalmon, and that good performance can be achieved with relatively small neuralnetwork models. With a false positive rate of 1%, FishNet achieves a true positiverate of 96%.
This thesis presents the first use of end-to-end deep learning techniques in thefield of salmon recognition. The images used are from cameras deployed in salmonfarming pens, an environment with many variable factors influencing the imagequality.