Show simple item record

dc.contributor.advisorWestad, Frank
dc.contributor.authorKristiansen, Marie Pauline Strømme
dc.date.accessioned2019-10-31T15:11:12Z
dc.date.issued2019
dc.identifierno.ntnu:inspera:35771502:16868756
dc.identifier.urihttp://hdl.handle.net/11250/2625732
dc.description.abstractCerebral parese er en samlebetegnelse på tilstander med endret motorisk funksjon forårsaket av en permanent skade på hjernen. Påvirkningen denne skaden har på motorisk funksjon er veldig individuelt og er derfor vanskelig å diagnostisere tidlig. Studier har funnet en sammenheng mellom bevegelsesmønster hos spedbarn 9-13 uker etter termindato og CP. Forskningsgruppen InMotion på St. Olavs Hospital i Trondheim jobber med å utvikle digitale verktøy for å benytte denne sammenhenhengen i klinisk bruk. De har samlet inn 378 videoer av spedbarn i høy risiko for CP når de er 9-13 uker og utviklet en algoritme for å spore bevegelsene til spedbarna i videoene. Bevegelsene gis som tidsserier og disse tidsseriene brukes i denne masteroppgaven for å utvikle klassifiseringsfunksjoner som skal skille mellom CP og ikke-CP. For å regne ut egenskaper, eller features, for tidsseriene brukes et rammeverk kalt hctsa. Det regner ut og sammenlikner tusenvis av egenskaper og har innebygde funksjoner for seleksjon. Med dette rammeverket velges det ut 7606 egenskaper. Videre utvikles en PLS-DA modell som brukes for videre seleksjon. Egenskapene med høyest regresjonskoeffisienter i PLS-DA modellen velges ut og gir et nytt sett med 416 egenskaper. Denne prosessen gjentas og med en ny PLS-Da modell står 105 egenskaper igjen. Det er disse som brukes som input til klassifiseringsfunksjonene. Det er utviklet modeller av typen PLS-DA, PCA, SVM og Random Forest. Det er brukt både test sett validering og kryssvalidering, og alle modellene viser at noen av subjektene med CP er enkle å skille fra de andre og noen er vanskeligere. Det er mange underliggende faktorer som ikke er tatt hensyn til i denne oppgaven, som andre nevrologiske abnormaliteter, kjønn, alder og størrelse, som kan være årsaken til denne forskjellen i subjektene. Det kan også være tilfeldig, men det bør ses videre på. SVM og Random Forest modellene er testet med både PCA skårer og det oprinnelige egenskapssettet som input. De viser at dersom man bruker egenskapssettet direkte så vil modellene være sårbare for overfitting. Å bruke PCA skårer som input gjør at modellene blir mer generelle og sannsynligvis vil være bedre for klassifisering av nye subjekter. Ingen av klassifiseringsmodellene utviklet i denne masteroppgaven er gode nok for klinisk bruk, men de understreker flere utfordringer med denne typen klassifiseringsproblemer og kan brukes som base for videre utvikling. PLS-DA modellen med kryssvalidering har en spesifisitet på 100% og sensitivitet på 45.24%, noe som gjør det litt bedre enn de andre modellene men den lave sensitiviteten gjør at den fortsatt ikke god nok for klinisk bruk.
dc.description.abstractCerebral Palsy is a syndrome of motor impairment that results from a lesion occuring in the developing brain. The affect this lesion has on motoric function is individual, and early diagnosis is therefore a challenge. Studies have found a connection between movement qualitites at infants 9-13 weeks post term and CP. The research group InMotion at St. Olavs Hospital in Trondheim is working on developing digital tools for using this connection in diagnosis. They have a video collection of 378 infants at high risk of CP, and have developed an algorithm that tracks the movements in the videos. The movements are given as time series and these time series are used in this master thesis to develop classification functions to separate between CP and not CP. To compute features for the time series, a framework called hctsa is used. It computes thousands of features and compares them for feature selection. With this framework, 7606 features are extracted. Further a PLS-DA model is used for selection. The features with the highest absolute value for the weighted regression coefficients are selected and a new feature set is made of the 416 selected features. This process is repeated, and with selection from a new PLS-DA model 105 features remain in the final feature set. This is the feature set that is used as input to the classification functions. Classification models are developed of the type PLS-DA, PCA, SVM and Random Forest. Both test set validation and cross validation are used, and all the models show that some of the subjects with CP are easier to separate from the healthy than the others. There are many possible underlying sources of variation that is not accounted for in this thesis, i.e. other neurological abnormalities, gender, age and size. These may or may not influence the model, and further research should be done on this. The SVM and Random Forest models are tested on both PCA scores and the feature set as input. They show that using the feature set directly makes the models prone to overfitting. Using PCA scores as input makes the models more general and likely better for classification of new subjects. None of the classification models developed in this thesis are good enough for clinical use, but they point out several challenges with this type of classification problems and may be used as a basis for further research. The PLS-DA model with cross validation have a specificity of 100% and sensitivity of 45.24%, which makes it better than the other models in this thesis but the sensitivity must be higher for clinical use.
dc.languageeng
dc.publisherNTNU
dc.titleClassification and Interpretation of Cerebral Palsy-related movements by means of Multivariate Analysis
dc.typeMaster thesis


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record