Show simple item record

dc.contributor.advisorGambäck, Björn
dc.contributor.authorFrancis, Sander Emanuel Xavier Berglund
dc.date.accessioned2023-11-30T18:19:43Z
dc.date.available2023-11-30T18:19:43Z
dc.date.issued2023
dc.identifierno.ntnu:inspera:142737689:35282575
dc.identifier.urihttps://hdl.handle.net/11250/3105498
dc.description.abstractOmtrent 5% av den voksne befolkningen lider av depresjon, noe som gjør den psykiske lidelsen til en ledende bidragsyter til den totale sykdomsbyrden i verden. Selv om effektiv behandling finnes, får mindre en 25% av folk i lav- og mellominntektsland tilgang til behandling grunnet sosialt stigma og manglende innvestering i mental helse. Gjennom sosiale medier kan man lage innovative løsninger som kan bidra til å gi støtte og behandling i disse landene. En mulig løsning er å bruke automatisk gjenkjenning av depresjon for å tilby målrettet intervensjon og støtte. Automatisk gjenkjenning av depresjon på sosiale medier ble introdusert i 2013, og siden har maskinlæringsmodeller blitt brukt til å predikere depresjon blant brukere ved hjelp av språk og atferd. Målet med denne masteroppgaven er å bidra til forskningsfeltet innenfor automatisk depresjonsdeteksjon på sosiale medier ved å demonstrere fordelene ved å utnytte femfaktormodellen. Femfaktormodellen, eller Big Five, omfatter personlighetstrekkene åpenhet, planmessighet, nevrotisme, medmenneskelighet og ekstroversjon, og beskriver et overordnet mønster i adferden til et individ. Gjennom ett krossvalideringsparametersøk med fire forskjellige regresjonsmodeller i sammen med tre ulike språklig karakteristikker på data fra Facebook og Twitter, ble den beste modellen for predikering av hver av de fem trekkene identifisert. Deretter, ble disse modellene brukt for å generere personlighetstrekk for datasettene eRisk og RSDD, som inneholder data fra sosiale medier annotert med depresjon. I sammen med ulike språklige karakteristikker, ble personlighetstrekkene brukt for å predikere depresjon på sosiale medier. På eRisk datasettet ble resultatene konsistent forbedret ved å inkludere personlighetstrekk for en rekke modeller og karakteristikker. Disse funnene fremhever verdien av å inkludere personlighetstrekk for å forbedre nøyaktigheten og effektiviteten til automatiserte depresjonsdeteksjon på sosiale medier. Denne oppgaven gir også en mulig forklaring for resultatene gjennom en statistisk analyse av personlighetstrekkene blant brukere med depresjon sammenlignet med en kontrollgruppe. En rekke studier har vist en statistisk signifikant korrelasjon mellom depresjon og visse aspekter ved femfaktormodellen. Funnene fra den statistiske analysen viste en viss grad av samsvar med disse studiene. Spesielt viste kontrollgruppen statistisk høyere nivåer av ekstroversjon og statistisk lavere nivåer av nevrotisisme sammenlignet med deprimerte brukere.
dc.description.abstractDepression is a leading contributor to the burden of disease worldwide, with an estimated 5% of adults suffering from the negative impact on mood and behavior which comes with the mental health disorder. Effective treatments for depression exist, but due to social stigma and a lack of investment in mental health, more than 75% of people in low- and middle-income countries receive no treatment. Social media offer a unique avenue for innovative approaches to health care, which could help improve support and treatment in these resource-constrained regions. One approach to leveraging social media for this purpose is the Automatic Detection of Depression (ADoD). Machine learning techniques have been employed to develop models that utilize linguistic cues and social media behavior to accurately predict depression among users, thereby creating opportunities for targeted intervention and support. The aim of this Master’s thesis is to contribute to the field of ADoD by demonstrating the advantages of incorporating Big Five personality traits to enhance performance. The Big Five personality model describes an overarching pattern in an individual’s behavior through five independent traits: agreeableness, extroversion, conscientiousness, neuroticism, and openness. Through an exhaustive cross-validation grid search using linear regression, Support Vector Machine (SVM), XGBoost, Gaussian Processes (GP) and a fully connected Artificial Neural Network (ANN) with Bag-of-Words (BOW), Linguistic Inquiry and Word Count (LIWC), and transformer word embedding features on data from Facebook and Twitter, the best cross-media models for each Big Five trait was identified. These were used to derive personality traits for the eRisk and RSDD datasets, which contain social media data annotated with depression. The personality traits were then incorporated with BOW, LIWC, and word embedding features to predict depression on social media. On the eRisk dataset, the inclusion of personality traits consistently improved the performance across multiple features and models. These findings highlight the value of incorporating personality traits to enhance the accuracy and effectiveness of automated depression detection on social media. By conducting a statistical analysis of the personality traits of users with depression in comparison to a control group, this thesis also provides a reasonable explanation for the results. Several studies have found significant correlations between depression and certain aspects of the Big Five traits, and the findings of the statistical analysis demonstrated a certain degree of consistency with these studies. Notably, the depressed group displayed statistically lower levels of extroversion and statistically higher levels of neuroticism compared to individuals experiencing depression.
dc.languageeng
dc.publisherNTNU
dc.titleThe Personality of Depression - Utilizing Big Five Personality Traits to Detect Depression on Social Media
dc.typeMaster thesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record