Vis enkel innførsel

dc.contributor.advisorKrogstie, John
dc.contributor.authorLiodden, Henrik Tobias Munkeberg
dc.date.accessioned2021-09-15T16:31:58Z
dc.date.available2021-09-15T16:31:58Z
dc.date.issued2020
dc.identifierno.ntnu:inspera:57390197:32416434
dc.identifier.urihttps://hdl.handle.net/11250/2777946
dc.descriptionFull text not available
dc.description.abstractPå NTNU er det startet et prosjekt for å installere smarte sensorer i rom for å overvåke aktivitet og klima innendørs. Dataen som blir samlet kan bli brukt til å skaffe ny innsikt i bruksmønster. Denne masteroppgaven foreslår en artefakt som vil bli brukt til å utforske muligheten til å bruke dataen til prediktiv analyse, hovedsakelig rettet mot informasjon som er relevant for studenter. Artefakten ble produsert ved bruk av Apache Spark, et rammeverk for Big Data. To datatyper ble valgt til dette prosjektet, karbondioksidnivå og aktivitetsdata som måler antall personer som beveger seg ut og inn av rom. Karbondioksid er en faktor som er direkte relatert til menneskers kognitive evne. Basert på tidligere forskning om prediktib analyse på tidsserier ble algortimen "Random Forest Regression" valgt. Artefakten ble brukt til å finne et optimalt oppsett for denne algortimen og gjøre prediksjoner av sammenhengende uker for foskjellige rom på campus. Kvantitative data ble produsert for hvert rom og ytelse og presisjon ble evaluert. Metoden som ble fulgt i denne oppgaven var "Design Science Research Process", som er egnet til å utvikle og samtidig evaluere nye løsninger på problemer. På grunn av COVID-19 ble den tilgjengelige mengden data til masteroppgaven mindre enn planlagt. Et lite sett med rom måtte bli brukt og dermed ble også kvaliteten av resultatene begrenset. Funnene som ble gjort fra testene tilsier at store rom er mer egnet til prediktiv analyse for datatypene som ble valgt. Ved hjelp av grafer ble den predikerte uken sammenliknet med de faktiske verdiene. Her var det tydelig at for de små rommene ble det produsert enn helt ulik graf, men for de store rommene ble det produsert en tilnærmet lik kurve. Ytelsestestene viste at applikasjonen skalerte bra når mengden data økte. Underveis ble det oppdaget flere problemer med datasettet som gjaldt perioder med manglende data for sensorer og kvalitet på den oppsamlede dataen. Selv om det ble vist gode resultater i testene, er det foreslått videre arbeid for å verifisere resultatene når mer data og rom blir tilgjengelig.
dc.description.abstractAt NTNU, a project to install smart sensors in rooms to monitor activity and indoor climate has been started. The data collected may be used to get new insight into usage patterns. This thesis proposes an artifact that will be used to explore the possibility of using the data set to make predictive analysis, mainly focused on information that may be relevant for students. The artifact was developed using Apache Spark, a big data framework. Two data types were chosen for the project: carbon dioxide level, and footfall data measuring movement in and out of rooms. Carbon dioxide levels are one of the indoor climate factors directly related to cognitive performance. Based on a review of previous research on predictive analysis using time series, a random forest regression algorithm was chosen as the method. The artifact was used to find an optimal setup of random forest and make predictions of a week-long interval on different rooms at campus. Quantitative data was produced for each room and evaluated based on performance and precision. The research followed the Design Science Research Process, a method suitable for developing new solutions to problems and evaluating it. Due to COVID-19, the amount of data available for the research were smaller than anticipated. A small set of rooms had to be used, thus limiting the quality of the results. Findings from the tests suggest that large areas are more suited for predictive analysis of the chosen data types. Using graphs for comparison of the predicted and real value, it was clear that small rooms produced different graphs while the large rooms had a similar to identical curve. Performance tests showed that the application scaled well when increasing the data size. During the research, it was discovered multiple problems with the data set, regarding missing intervals for sensors and the quality of sensor readings. Further studies should be conducted when more data and rooms become available to verify the results of this thesis.
dc.language
dc.publisherNTNU
dc.titlePredictive modeling using time series data from carbon dioxide and footfall sensors in study areas
dc.typeMaster thesis


Tilhørende fil(er)

FilerStørrelseFormatVis

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel