Vis enkel innførsel

dc.contributor.advisorBach, Kerstin
dc.contributor.authorSkauge, Sigbjørn Nøst
dc.date.accessioned2021-10-03T16:39:31Z
dc.date.available2021-10-03T16:39:31Z
dc.date.issued2021
dc.identifierno.ntnu:inspera:74730513:21524353
dc.identifier.urihttps://hdl.handle.net/11250/2787248
dc.description.abstractHuman Activity Recognition er et studiefelt hvor menneskets bevegelse er i fokus. Dette gjelder under spesielle situasjoner, som trening, arbeid eller lignende, eller under hverdagslige aktiviteter. Feltet har nylig fått mer oppmerksomhet fra folk som driver med maksinlæring ettersom datasett har blitt lettere tilgjengelig. Datainnsamling har også tatt store steg i forskningsfeltet hvor enheter i Tingenes internett har blitt enklere å implementere. Denne masteroppgaven fokuserer på bygge en maskinlæringsmodell for å forstå menneskelig bevegelse i krevende fysisk aktivitet bedre. I tidligere studier ved Norges teknisk-naturfaglige universitet har ikke krevende fysisk aktivitet vært undersøkt. HUNT4 er den fjerde iterasjonen av Norges største befolkningsbaserte helseundersøkelse. Undersøkelsen er basert på innsamling av data gjennom spørre-undersøkelser og kliniske målinger. I tillegg be deltagere spurt om å delta i en annen datainnsamling ved å feste to aksellerometere på kroppen for en uke. Deltagerne fikk påsatt to Axivity AX3 sensorer. Den ene sensoren ble plassert ved korsryggen, mens den andre ble plassert midt på låret. Dette skapte et stort datasett som man prefererer å analysere med metoder fra maskinlæring. Denne oppgaven fokuserer på klassifisering av krevende fysisk aktivitet i en spesifikk del av HUNT4 datasettet. Denne delen, kalt UngHUNT, inneholder alle deltagere som var ungdommer under undersøkelsen. For å gjøre dette brukes metoder fra maskinlæring og algoritmen brukt i denne oppgaven er Extreme Gradient Boosting. Denne algoritmen ble valgt på grunn av dens manglende tilstedeværelse i relatert arbeid i studiefeltet. Dette ble funnet gjennom et literatursøk. For å optimalisere algoritmen for krevende fysisk aktivitet ble nye datasett som inneholder slik aktivitet laget. Kryssvalidering ble brukt for å unngå overtilpasning (overfitting). I tillegg ble feature selection, mix-in klassifisering og forskjellige vindusstørrelser i data testet for å forbedre maskinlæringsmodellens resultater. Hovedresultatene i denne oppgaven viser en maskinlæringsmodell som bruker data med tresekunders vindu. Denne modellen klarte å oppnå presisjon, recall og F1-score på henholdsvis 95.56%, 95.38% og 95.40%.
dc.description.abstractHuman Activity Recognition is a field of study focusing on the detection of human movements in particular situations (exercise, labor, etc) or in daily life. Recently, the field has received more attention from the machine learning community since there are more datasets openly available and the data collection with Internet of Things devices has become easier to implement. This study focuses on building a machine learning model to better understand peoples health through vigorous physical activity detection. In previous studies at the Department of Computer Science at the Norwegian University of Science and Technology, activity recognition with vigorous data have not yet been performed. HUNT4 is the fourth recurrence of the largest population based health study in Norway. The study is based upon the collection of data mainly through surveys and clinical measurements. In addition to the surveys, participants were invited to participate in another data collection by wearing body-worn sensors for one week. The participants wore two Axivity AX3 sensors, one on their lower back and the other on their thigh. This created a large dataset which would be preferable to analyse by using machine learning methods. This thesis focuses on detection of vigorous physical activity in a subset of the HUNT4 dataset, namely the UngHUNT data. The UngHUNT data contains accelerometer data from adolescents wearing the previously mentioned body-worn sensors. This thesis uses machine learning to classify vigorous activity in this data. The machine learning algorithm used in this study is Extreme Gradient Boosting. The algorithm was selected by recognizing it's missing coverage in previous work on vigorous activity through a review of relevant literature and it's well-known strong performance on inbalanced, real-world datasets. To optimize the machine learning model built, training datasets were created and cross validation was performed to avoid overfitting. To further improve the model, feature selection, mix-in classification and different window sizes for the data were tested. To train the model, curated datasets are used containing both in-lab data and out-of-lab data. This thesis's results show that the machine learning model using a static sliding 3-second window is able to separate vigorous from non-vigorous activity with a precision, recall and F1-score of 95.56%, 95.38% and 95.40% respectively.
dc.languageeng
dc.publisherNTNU
dc.titleVigorous Activity Detection in Human Activity Recognition
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel