The application of voxel octrees for 3d video
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3095913Utgivelsesdato
2023Metadata
Vis full innførselSamlinger
Sammendrag
Med en økende interesse for VR og AR-utstyr har det åpnet opp nye muligheter for mer oppslukende video-opplevelser. Disse kan bl.a lages ved å ta opp video med dybdekameraer, og large disse i "voxel octree" datastrukturer. Denne oppgaven undersøker bruk av "voxel octree" for å levere oppslukende video-opplevelser tatt opp med dybdekamera. Målet er å undersøke muligheten til å bruke diverse metoder for å large "octrees" med tap - der unødvendig informasjon blir fjernet for å spare plass. To research-spørsmål blir presentert: (1) Hvorvidt det er mulig å redusere filstørrelsen på et "octree" ved å fjerne deler som ligner, og (2) hvorvidt det er mulig å bruke "Discrete Cosine Transform (DCT)" for å komprimere fargene i disse trærne.
Oppgaven presenterer en analyse av disse spørsmålene ved hjelp av eksperimenter og numerisk analyse av testmateriale. Resultatene viser at \Gls{dct} virker lovende som teknologi, og at substitusjon av trær trenger mer arbeid for å være lovende.
Oppgaven presenterer også nye teknikker for å lagre "voxel octree" med tap. Videre presenteres flere videre temaer som kan tas opp i senere arbeid, som hybrid-datastrukturer, bedre sammenligning av volumet i to trær, og bedre teknikker for å sammenligne fargen i to trær. The growing popularity of virtual reality (VR) and augmented reality (AR) headsets has opened up new opportunities for immersive video experiences. This thesis explores the potential of fully immersive video-like experiences using depth camera-based recordings, leveraging the voxel octree data structure for storing these recordings. The goal is to investigate the feasibility of lossy encoding methods for voxel octrees, aiming to achieve efficient video compression while preserving spatial and temporal similarities within the data.
Two main research questions are addressed: (1) the feasibility of lossy subtree substitution for encoding sparse voxel octrees, and (2) the suitability of Discrete Cosine Transform (DCT) for lossy encoding of color information in voxel octrees. The thesis presents a comprehensive analysis of these research questions through experiments and evaluations. The results demonstrate that while subtree substitution showed limitations, DCT encoding proved to be a promising technique for color compression in voxel octrees.
The thesis contributes novel methods for lossy encoding of voxel octrees and provides insights into the potential future directions for 3D video encoding. However, computational cost, the exploration of hybrid approaches (such as combining voxel octrees with B+-trees), better methods for performing octree comparison, and better ordering of color data before DCT compression remain as areas for further research and improvement.