Accuracy of Markerless Motion Capture: A Comperative Study
Bachelor thesis

Permanent lenke
https://hdl.handle.net/11250/3137513Utgivelsesdato
2024Metadata
Vis full innførselSamlinger
Sammendrag
Behovet for markørløs bevegelsesfangst innen animasjon, idrettslære og helsefeltet er stort. Tradisjonelle metoder krever markører festet på hud eller klær. Disse systemene krever betydelig plass, flere kameraer og tidskrevende markørplassering, som igjen krever betydelig kompetanse. Dette begrenser mulighetene for rask tilpasning, noe som kan være kritisk innen helsevesenet.
Dette forskningsprosjektet utforsker markørløs bevegelsesfangst, ved bruk av OpenPose, et prosjekt med åpen kildekode som ved hjelp av maskinlæring identifiserer nøkkelpunkter på menneskekroppen for å konstruere et todimensjonalt skjelett. Ved bruk av tre kameraer fra ulike synsvinkler, trianguleres bildene for å generere tredimensjonale koordinater.
Denne forskningsrapporten presenterer fem hovedbidrag:
1. Metoder for kamerakalibrering. 2. En metode for synkronisering av flere kamera. 3. Et rammeverk for triangulering av todimensjonale koordinater for å oppnå tredimensjonale koordinater. 4. Et sammenligningsgrunnlag for ulike modeller for nøkkelpunktsgjenkjenning. 5. Et sammenligningsgrunnlag mellom et markørbasert og markørløst system.
Kamerakalibreringen benyttet Zhang's metode, som resulterte i en reprojeksjonsfeil på 4,2 piksler. Ved bruk av "weighted Direct Linear Transformation" ble tredimensjonale estimater av leddsentrene generert, med variabel nøyaktighet avhengig av bevegelsens hastighet og retning. Resultatene ble sammenlignet med Qualisys, et veletablert markørbasert system. Analysen viste at 88,58% av dataene hadde en feilmargin under 40 mm. The need for markerless motion tracking systems in animation, sports, and health sectors is increasing. Traditional methods typically require markers placed on the human body or clothing. These systems require multicamera setups, consume time, and necessitate knowledge about marker placement. This reduces the recording efficiency, which can be crucial in various situations.
This thesis explores markerless motioncapture, utilizing OpenPose, an open-source project that uses machine learning to identify key points on the human body to construct a two-dimensional skeleton. By utilizing three cameras from different viewpoints, it is possible to triangulate the images, resulting in three-dimensional coordinates.
The thesis introduces five main contributions:
1. Methods for camera calibration. 2. A synchronization method for multiple cameras. 3. A framework for triangulation of two-dimensional points to three-dimensional coordinates. 4 .A basis for comparing different models for key-point estimation. 5. A basis for comparing marker-based and markerless systems.
The calibration process utilized Zhang's method, resulting in a reprojection error of 4.2 pixels. Using "weighted Direct Linear Transformation", three-dimensional estimations of the joint centers were generated, showing a variance in accuracy across motion speed and direction. The markerless results were compared against Qualisys, which was used as the ground truth due to its well-established foundation for motion capture. The analysis showed that 88.58% of the data had an error margin of less than 40 mm.