EEG-Based Alcohol Detection System with AI Techniques: Towards the Design of BCI Systems for Driver Monitoring.
Abstract
Denne masteroppgaven undersøker muligheten for å detektere tilstedeværelsen av alkohol i elektroencefalografi (EEG)-signaler. I dag er alkoholpåvirket kjøring et verdensomspennende problem. Målet med dette prosjektet er å danne grunnlaget for en EEG-basert alkoholdetektor som videre kan brukes i et hjerne-datamaskin-grensesnitt system. Dette systemet kan potensielt hjelpe med å bekjempe problemet med alkoholpåvirket kjøring.
Et eksperiment ble designet hvor EEG-data fra 20 deltagere ble samlet inn. Deltagerne var både påvirket og upåvirket av alkohol under innsamlingen. Dataene ble samlet inn ved å bruke 16 EEG-kanaler, og hver deltager deltok på 2 innsamlingstimer. I den ene innsamlingstimen ble deltageren servert en alkoholholdig drikk med 0.45 g/kg etanol og appelsinjuice. I den andre timen fikk deltageren en tilsvarende drikke uten alkohol. Hver innsamlingstime varte i omtrent 66 minutter. I løpet av timen ble det samlet inn 5-minutters EEG-opptak, i tillegg til at deltageren ble bedt om å gjennomføre Flanker-testen. Promillen ble også målt. Under EEG-opptakene fikk deltageren beskjed om å sitte stille med åpne øyne, å slappe av, og å bevege seg så lite som mulig.
De innsamlede promilledataene ble analysert. Analysen indikerte at promilletoppen ikke ble nådd for de fleste av deltagerne. For at denne skal inkluderes burde deltagerne enten bli servert en konsentrert alkoholholdig drikke, eller så må de unngå å spise før innsamlingstimene. En statistisk analyse av Flanker-dataene ble gjennomført. Denne analysen viser at det er en signifikant nedgang i responstiden for alle deltagere etter alkoholinntak. Denne nedgangen er sannsynligvis forårsaket av impulsiviteten en person kan oppleve etter å ha drukket alkohol. Disse resultatene viser at deltagerne ble påvirket av den konsumerte alkoholen, og derfor er de innsamlede EEG-signalene deres mest sannsynlig også påvirket.
Tre klassifikatorer ble utviklet for å undersøke alkoholens effekt på EEG-signaler. To av disse var individuelle modeller. Den ene individuelle modellen delte EEG-dataene tilfeldig inn i et treningssett og testsett. Den andre modellen, en individuell modell på tvers av datainnsamlinger, sørget for å dele data fra samme 5-minutters opptak inn i enten treningssettet eller testsettet. De gjennomsnittlige nøyaktighetene for disse modellene var henholdsvis 100% og 90.7%. Selv om den tilfeldige individuelle modellen virker bedre basert på nøyaktighet alene, er den individuelle modellen på tvers av datainnsamlinger likevel sett på som den beste av disse. Det er fordi implementeringen av denne modellen er mer realistisk, og dette gjør modellen bedret egnet til bruk i det virkelige liv.
Den siste klassifikatoren er en generell modell. Denne modellen trente på data fra 19 deltagere, og ble testet på dataene fra den siste, usette deltageren. Den gjennomsnittlige nøyaktigheten til denne modellen var på 62.9%. I tillegg hadde modellen en lav presisjon og en lav gjenkalling. Dette tyder på at modellen har problemer med å klassifisere signaler som er påvirket av alkohol riktig. This thesis examines the possibility of detecting the presence of alcohol in electroencephalography (EEG) signals. Driving under the influence of alcohol is a global problem, and the purpose of this work is to contribute with the first steps towards designing an EEG-based alcohol detector to be utilised in an onboard brain-computer interface (BCI) system. This BCI system could help prevent the consequences of driving under the influence of alcohol.
An experiment was designed for collecting EEG signals from 20 participants, both while under the influence of alcohol and not. The data collected during the experiment was recorded using 16 EEG channels, and the participants partook in two recording sessions. In one session, the participants were presented with an alcoholic drink consisting of a mix of 0.45 g/kg ethanol and orange juice. In the other, they were presented with a non-alcoholic drink. During each 66-minute recording session, the participants were instructed to perform the Flanker task and their blood alcohol concentration (BAC) values were measured at specific points in time. This was in addition to 5-minute EEG recordings where the participants were instructed to sit still, while relaxing with their eyes open.
The analysis of the recorded BAC values showed that the BAC values after alcohol consumption increased over time. Most of the participants did not reach their peak BAC, which is the maximum point of BAC before it starts decreasing. To be able to capture the peak in the future, the participants should be instructed to not eat beforehand, or they should be given an undiluted alcoholic drink. A statistical analysis of the Flanker data shows that there is a significant decrease in the response time of the participants while under the influence of alcohol. This is likely caused by the disinhibition typically observed in people under the influence of alcohol. These results show that the participants were affected by the alcohol, and, therefore, their EEG signals are most likely affected as well.
To investigate the effect of alcohol on EEG signals, three classification models were developed to classify the collected signals. Two individual models were implemented. One is a random individual model which randomly splits the collected data into training and test sets. The other is an individual model across sessions which splits full 5-minute recordings into either the training or test set. The average accuracies of these models were 100% and 90.7%, respectively. Although the random individual model has a better accuracy, the individual model across sessions is seen as the best model since the implementation is more realistic. This makes it more applicable as a real-world alcohol detector.
The last classifier is a general model. This model trains on 19 participants and tests on the last, unseen participant. The average accuracy of this model was 62.9%. As indicated by low precision and recall values, the model has difficulties with classifying alcohol samples correctly.