Efficient Perspective-n-Point With Graduated Non-Convexity for Outlier Robustness
Abstract
Perspective-n-Point (PnP) er et fundamentalt problem innen datasyn. Problemet dreier seg om å estimere posisjon og orientering av et kamera i en kjent situasjon. Mer bestemt så kjenner man et sett av tredimensjonale punkter og de tilsvarende punktene i et todimensjonalt bilde tatt av kameraet. Flere løsninger til problemet har blitt publisert, men mange metoder blir unøyaktige når dataene i datasettet er fulle av støy eller har ekstremverdier som skiller seg ut fra de resterende punktene. Det er derfor ønskelig med flere robuste metoder, altså metoder som klarer å håndtere slike vanskelige situasjoner.
Denne avhandlingen presenterer en ny metode for robust posisjons- og orienteringsestimering, kalt EPnP+GNC. Den nye metoden er en kombinasjon av den effektive metoden Effective Perspective-n-Point (EPnP) og optimaliseringsmetoden Graduated Non-Convexity (GNC). For å evaluere den nye metoden ble EPnP+GNC implementert i et programmeringsspråk, for så å bli testet i forskjellige situasjoner. I tillegg til EPnP+GNC ble også andre, mer veletablerte, metoder for posisjons- og orienteringsestimering testet for å kunne sammenligne resultatene.
Alt i alt viser resultatene av dette studiet at EPnP+GNC er en effektiv metode for estimering av posisjon og orientering. Denne nye metoden estimerer posisjon og orientering riktig, selv i datasett som inneholder høy prosentandel ekstremverdier. Resultatene er spesielt sterke i situasjoner med lite rotasjon i orienteringen. Testene viser også at EPnP+GNC har relativt høy hastighet. I tillegg peker resultatene mot at EPnP+GNC har et godt resultat sammenlignet med de andre metodene. EPnP+GNC viser et stort potensial for videre utvikling. The Perspective-n-Point (PnP) problem is a fundamental problem in computer vision of determining the position and orientation, i.e. the pose, of a camera in a 3D environment. Furthermore, this is based on a set of known 3D points and their corresponding 2D projections in an image. Several solutions to this problem have been proposed, but the accuracy decreases when the data is noisy or full of outliers that differ significantly from the other measurements. Therefore, there is a need for more robust methods of pose estimation, that is, methods that can handle data sets containing noisy measurements and large amounts of outliers.
This research presents a new method for robust pose estimation, called EPnP+GNC. The new method is a combination of the efficient pose estimation method Effective Perspective-n-Point (EPnP) with the outlier optimization method Graduated Non-Convexity (GNC). In order to assess the new method, EPnP+GNC was implemented in a programming language and tested in a variety of scenarios. In addition to EPnP+GNC, several existing methods of pose estimation were tested such that a comparison could be made.
Overall, the results of this study shows that EPnP+GNC is an effective pose estimation method. The method correctly calculates the pose in data sets with a high percentage of outliers, and has a relatively low running time. The results are particularly good in situations with small rotations. It also shows promising results when compared to other methods. EPnP+GNC has shown potential for further development.