• norsk
    • English
  • English 
    • norsk
    • English
  • Login
View Item 
  •   Home
  • Fakultet for informasjonsteknologi og elektroteknikk (IE)
  • Institutt for datateknologi og informatikk
  • View Item
  •   Home
  • Fakultet for informasjonsteknologi og elektroteknikk (IE)
  • Institutt for datateknologi og informatikk
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Leveraging Irregular Time Series Data for Enhanced IoT Sensor Classification in Smart Buildings

Østby, Lars Brodin
Master thesis
Thumbnail
View/Open
no.ntnu:inspera:187264004:46874447.pdf (9.625Mb)
URI
https://hdl.handle.net/11250/3157126
Date
2024
Metadata
Show full item record
Collections
  • Institutt for datateknologi og informatikk [7453]
Abstract
Mangel på etablerte navnekonvensjoner for IoT-sensorer (Internet of Things) i smart bygg kan resultere i varierte navnekonvensjoner mellom ulike bygninger. Dette kan komplisere prosessen med å integrere data fra ulike kilder inn i et felles administrasjonssystem. Denne masteroppgaven, utført i samarbeid med Piscada, tar for seg utfordringen med å klassifisere IoT-sensordata fra bygninger basert på tidsseriene de produserer. Hovedmålet var å utvikle et klassifiseringssystem som er i stand til å identifisere ulike typer sensorer, samtidig som det effektivt håndterer volumet, variasjonen og uregelmessighetene som naturlig kan følge data samlet inn fra ulike bygningsmiljøer. Ved å kategorisere og merke sensordata har systemet som formål å hjelpe til med å øke driftseffektiviteten, og legge til rette for bedre integrasjon av smart bygg i felles administrasjonssystemer.

Etablerte karakteristikk ekstraksjons biblioteker som Tsfresh, TSFEL og Catch22 ble testet, sammen med en ny ekstraksjonsmetode som benyttet seg direkte av den rå, uregelmessige dataen generert av hendelsesdrevne sensorer. Mens bibliotekene krever konvertering av uregelmessige til regelmessige intervaller, noe som kan føre til tap av informasjon, utnytter den nye metoden de irregulære intervallene som en karakteristisk av sensordataen. Denne metoden henter karakteristiske trekk fra ulike representasjoner av den samme tidsserien, slik som intervaller som funksjon av tid, forholdet mellom verdier og intervaller, og spesifikke interessante hendelser i dataen, slik som lengre intervaller og deres tilsvarende verdier. Ved å utnytte uregelmessighetene i dataen fanger metoden opp et mer nyansert bilde av tidsseriene.

Den irregulære intervall ekstraksjonsmetoden ga bedre ytelse ved klassifisering sammenlignet med de etablerte bibliotekene. Klassifisering av individuelle sensortyper viste seg å være vanskelig på grunn av høy variasjon innad i klassene, samt mye likhet og overlapp blant klassene, noe som gjorde klassifisering av grupperte sensor-klasser mer praktiske og presist. Klassifisering ble utført med en histogram gradient boosting modell, hvor den irregulære ekstraksjonsmetoden oppnådde best resultater. TSFEL viste også gode prestasjoner, mens Catch22 og Tsfresh hadde de laveste ytelsene totalt sett. Den irregulære metoden oppnådde en nøyaktighet på 96,47% for grupperte klasser, sammenlignet med 90,91% for TSFEL, og 87,41% og 87,22% henholdsvis for Tsfresh og Catch22. Presisjon og dekning ga videre en mer nyansert evaluering enn nøyaktighet, på grunnlag av en skjev klassefordeling, hvor den irregulære metoden presterer bedre enn de andre bibliotekene på tvers av alle klasser.

Prosjektet demonstrerer potensialet for å utnytte uregelmessighetene i hendelsesdrevne sensordata for å forbedre klassifisering prestasjoner. Den irregulære ekstraksjonsmetoden gir bedre ytelse sammenlignet med etablerte metoder, og fremhever potensialet av å beholde og utnytte irregulariteter i visse tilfeller. Fremtidig arbeid bør fokusere på å videreutvikle og forbedre den irregulære ekstraksjonsmetoden, utforske dyplæringsmodeller, samt håndtere ubalansen av klassene i datasettet ved bruk av metoder som er i stand til å håndtere overlappingen blant klassene. I tillegg anbefales det å utvikle kontekstspesifikke modeller samt strategier for data aggregering skreddersydd til bestemte driftsmiljøer.
 
A lack of a broader standardized naming conventions for IoT (Internet of Things) sensors in smart buildings can result in varied naming conventions between different buildings. This can complicate the process of integrating data from different sources into a common administration system. This thesis, conducted in collaboration with Piscada, addresses the challenge of classifying IoT sensor data from buildings based on their time series outputs. The primary goal was to develop a classification system capable of accurately identifying various types of sensors, while effectively handling the volume, variability, and irregularity inherent in data collected from diverse building environments. By accurately categorizing and labeling sensor data, the developed system aims to assist in enhancing operational efficiency and facilitating better integration within smart building management systems.

Established feature extraction libraries such as Tsfresh, TSFEL, and Catch22 were tested alongside a novel feature extraction method that directly utilizes the raw, irregular data generated by event-driven IoT sensors. While these libraries require resampling of irregular intervals, which can lead to a loss of valuable information, the novel approach leverages the irregular intervals as distinctive characteristics. This method extracts features from different representations of the time series, including intervals as a function of time, relationships between values and intervals, and significant events like longer intervals and their corresponding values. By adjusting feature extraction to account for irregularities, it captures more nuanced patterns within the data.

The results show that the novel feature extraction method enhanced classification accuracy compared to the established libraries. Classifying individual sensor types proved difficult due to high intra-class variance and inter-class similarity, making grouped sensor classifications more practical and effective. The classification was done using a histogram gradient boosting model, where the irregular feature extraction method showed the highest performance. TSFEL also performed well, while Catch22 and Tsfresh had the lowest performance overall. The irregular method achieved an accuracy of 96.47% for grouped classes, compared to 90.91% for TSFEL, and 87.41% and 87.22% for Tsfresh and Catch22, respectively. Precision and recall metrics further provided a more nuanced evaluation than accuracy due to the skewed class distribution, with the irregular method outperforming the other extraction libraries across all classes.

The study demonstrates the potential of leveraging the irregularities in event-driven sensor data for enhancing classification performance. The novel feature extraction method offers improvements over established methods, highlighting the importance of retaining and utilizing data irregularities in certain scenarios. Future work should focus on refining the feature extraction processes, exploring deep learning models, and addressing the class imbalance using methods capable of handling class overlap. Additionally, developing context-specific models tailored to particular operational environments and refining data aggregation strategies are recommended.
 
Publisher
NTNU

Contact Us | Send Feedback

Privacy policy
DSpace software copyright © 2002-2019  DuraSpace

Service from  Unit
 

 

Browse

ArchiveCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsDocument TypesJournalsThis CollectionBy Issue DateAuthorsTitlesSubjectsDocument TypesJournals

My Account

Login

Statistics

View Usage Statistics

Contact Us | Send Feedback

Privacy policy
DSpace software copyright © 2002-2019  DuraSpace

Service from  Unit