Show simple item record

dc.contributor.advisorMolinas, Marta
dc.contributor.advisorCheema, Amandeep
dc.contributor.authorSletta, Øystein Stavnes
dc.date.accessioned2023-10-28T17:19:51Z
dc.date.available2023-10-28T17:19:51Z
dc.date.issued2023
dc.identifierno.ntnu:inspera:140443607:21383703
dc.identifier.urihttps://hdl.handle.net/11250/3099256
dc.description.abstractDeteksjon av stress fra biosignaler er et fremtidsrettet felt innen maskinlæring, men er fremdeles i tidlig utviklingsfase. Mangelen på offentlige datasett med stressmarkeringer er en flaskehals for videre forskningsprogresjon og utvikling av nye modeller som kan brukes av klinikere for helsetjenesteformål. Denne avhandlingen presenterer et nytt multimodalt Mental Stress datasett med tidsynkroniserte hjertelyd data (PCG), hjernebølge data (EEG) og markører fra aritmetisk test, annotert med State-Trait Anxiety Inventory (STAI) og Subjective Stress Assessment (SSA) poengsummer. Datasettets innsamlingsprotokoll og inklusjonskriterier diskuteres, og en datasettanalyse utføres. Datasettet er det første offentlige datasettet av sin type som kombinerer PCG-data og stressmarkeringer. Ved å bare bruke PCG-data og STAI-stressmarkeringer ble det laget fire maskinlæringsmodeller fra Mental Stress datasettet. Modellene består av wavelet scattering egenskaper fra PCG dataen sammen med enten en Extreme Gradient Boosting (XGB) eller en K-Nearest Neighbor (KNN) klassifiserer. Datasettopptakene ble delt inn i to binære annoteringssplitter, STAI-30-30 og STAI-35-20, som begge separerte STAI-poengsummene i en høy- og en lav-stressklasse. Modellene ble optimalisert med hensyn til asynkrone segmenteringslengder, scattering-nettverkparametere og klassifiseringshyperparameterverdier, og evaluert med hensyn til ytelse gjennom en 10 gangers kryssvalideringsprosedyre. KNN / STAI-30-30-modellen oppnådde en sensitivitet på 0,8846, spesifisitet på 0,7960, AUC på 0,8403 og nøyaktighet på 0,8412. XGB / STAI-30-30-modellen oppnådde en sensitivitet på 0,9000, spesifisitet på 0,8000, AUC på 0,8503 og nøyaktighet på 0,8510. KNN / STAI-35-20-modellen oppnådde en sensitivitet på 0,9881, spesifisitet på 0,7694, AUC på 0,8788 og nøyaktighet på 0,9078. Til slutt oppnådde XGB / STAI-35-20-modellen en sensitivitet på 0,9796, spesifisitet på 0,8801, AUC på 0,9298 og nøyaktighet på 0,9430. Ved å eliminere bruken av multimodale opptak ved bare å bruke PCG-data, reduseres kompleksiteten og kostnadene ved bruk av modellen, noe som gjør den egnet for hjemmeomsorg, fjernmedisin og helsetjenester på landsbygda. Avhandlingen introduserer en ny metode for å fjerne systematisk støy over spesifikke frekvensbånd ved hjelp av wavelet scattering fra utdata-egenskaps-vektorene som brukes i alle modell-pipelinene. Teknikken kalles egenskapseksklusjon og kan gjenbrukes i enhver wavelet scattering-egenskaps ekstraksjonsprosedyre fra 1D-signaler der systematisk støy er til stede i dataene. Basert på XGBoosts mål for viktighet av ulike features, har frekvensområder som er viktigst for å skille stressnivåer blitt funnet. Scattering-egenskaper knyttet til wavelets med senterfrekvenser i områdene 270-290 Hz og 380-390 Hz anses som mest betydningsfulle for modellens prediksjoner. Dette forklarer spesifikt hvor vi kan observere avvik i PCG-data for forskjellige stressklasser, og vil være svært nyttig for utformingen av lignende maskinlæringsmodeller i fremtidig forskning.
dc.description.abstractStress detection from biosignals is a prosperous field of machine learning still in early development. The lack of public datasets with stress labels is a bottleneck for further research progress and the creation of new models that can be used by clinicians for healthcare purposes. This thesis presents a new Multimodal Mental Stress dataset of time-synchronized phonocardiogram (PCG) data, electroencephalogram (EEG) data, and arithmetic test markers labeled with State-Trait Anxiety Inventory (STAI) and Subjective Stress Assessment (SSA) scores. The dataset's collection protocol and inclusion criteria are discussed, and a dataset analysis is conducted. The dataset is the first public dataset of its kind combining PCG data and stress labels. Focusing strictly on PCG data and STAI stress labels, four machine-learning models based on wavelet scattering features and Extreme Gradient Boosting (XGB) or K-Nearest Neighbor (KNN) classifiers were made from the Mental Stress Dataset. The dataset recordings were separated into two binary label splits, STAI-30-30 and STAI-35-20, binning STAI-scores into either a high- or low-stress class. Models were optimized with respect to asynchronous segmentation lengths, scattering network parameters, and classifier hyperparameter values and evaluated in performance over a 10-fold cross-validation procedure. The KNN / STAI-30-30 model achieved a sensitivity of 0.8846, specificity of 0.7960, AUC of 0.8403, and accuracy of 0.8412. The XGB / STAI-30-30 model achieved a sensitivity of 0.9000, specificity of 0.8000, AUC of 0.8503, and accuracy of 0.8510. The KNN / STAI-35-20 model achieved a sensitivity of 0.9881, specificity of 0.7694, AUC of 0.8788, and accuracy of 0.9078. Lastly, the XGB / STAI-35-20 model achieved a sensitivity of 0.9796, specificity of 0.8801, AUC of 0.9298, and accuracy of 0.9430. By only using PCG data and eliminating the use of multimodal recordings, the complexity and cost of using the model are reduced, making it suitable for home care, telemedicine, and rural healthcare centers. The thesis introduces a new framework for removing systematic noise over specific frequency bands through wavelet scattering from the output feature vectors used in all model pipelines. The technique is referred to as feature exclusion and is reusable on any wavelet scattering feature extraction procedure from 1D signals where systematic noise is present in the data. From the XGBoost feature importance metric, frequency ranges most important for stress state discrimination have been found. Scattering features connected to wavelets with center frequencies in the ranges 270-290 Hz and 380-390 Hz are found to be most important for the model's predictions. This explains specifically where we can see discrepancies in PCG data for different stress classes and will be very useful for designing similar machine-learning models in future research.
dc.languageeng
dc.publisherNTNU
dc.titleMental Stress Classification from Phonocardiogram Signals - A wavelet Scattering Approach on Asynchronously Segmented PCG
dc.typeMaster thesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record