MIURA: Memory-efficient and Incrementally learning Unsupervised Real-time Anomaly detection for time series data
Abstract
Orange Business er en ledende leverandør av kritiske IT-løsninger og infrastruktur, og har som mål å tilby omfattende sanntidsovervåking og analyse av ulike systemmålinger. Selskapet ønsker et system som kan oppdage unormal atferd på tvers av ulike systemer for å kunne reagere raskt på hendelser. Hovedmålet med dette prosjektet var å utvide den dyplærningsbaserte løsningen for anomalideteksjon, RePAD2, med inkrementell læring for å undersøke hvordan det ville påvirke deteksjonsnøyaktigheten og tidseffektiviteten. Dette førte til utviklingen av MIURA. For å støtte MIURA var det behov for en datastrømmings- og visualiseringsarkitektur som muliggjorde rask og pålitelig dataoverføring, sammen med muligheten for å visualisere oppdagede anomalier. For å sette den foreslåtte løsningen i kontekst, ble det lagt vekt på å gjennomgå relevant litteratur, noe som førte til dypere innsikt i feltet anomalideteksjon. Vi har gjennomført evaluering ved bruk av en rekke tidsseriedatasett som ligger åpent på nett, hentet fra reelle datakilder, hvor vi evaluerte effekten ulike skaleringsmetoder har på deteksjonen. Resultatene viser at MIURA oppnår bedre deteksjonsnøyaktighet og tidseffektivitet sammenlignet med RePAD2 på dataset som viser mindre drastiske svingninger. Vi håper at det arbeidet som er blitt gjort i dette prosjektet vil bidra positivt til videre forskning. Av den grunn velger vi å åpne kildekoden til MIURA, scriptene brukt til evaluering, og annet relevant materiale. Hele kodebasen er tilgjengeliggjort på GitHub. Orange Business is a leading provider of critical IT solutions and infrastructure, aiming to provide extensive real-time monitoring and analysis of various system metrics. The company seeks a system capable of detecting abnormal behavior across different systems to enable rapid incident response. The main goal of this project was to extend the deep learning anomaly detection approach, RePAD2, with the concept of incremental learning and to investigate how it would affect detection accuracy and time efficiency. This led to the development of the MIURA approach. To support MIURA, a data streaming and visualization architecture was needed that would enable fast and reliable data transfer, along with the capability to visualize detected anomalies. To provide context to the proposed solution, a greater focus was placed on reviewing relevant literature, which led to deeper insights into the field of anomaly detection. We conducted a series of evaluations using several real-world open-source time series, where we evaluated what effect different scalers had on detection accuracy. The results show that the MIURA approach provides better detection accuracy and time efficiency compared to RePAD2 when a time series exhibit minor fluctuations. We hope that the work done in this project will benefit further research. Therefore, we have chosen to open source the code of MIURA, scripts used in evaluation, and other relevant material. The repository is made available on GitHub.