Likhetssøk i tidsserier

Barkhall, Håvard

Barkhall, Håvard

Master thesis

View/Open

14791_FULLTEXT.pdf (Locked)

14791_COVER.pdf (Locked)

URI

http://hdl.handle.net/11250/2615901

Date

2018

Metadata

Show full item record

Collections

Institutt for datateknologi og informatikk [6551]

Abstract

I denne masteroppgaven er det fokus på å kunne søke i tidsserier etter spesifikke mønstre. Dette med tanke på feilsøking i historikken til industrielle apparaturer.

Til denne oppgaven er det utdelt et sett med data, et knippe med tidsserier fra faktiske industrielle apparaturer, som har blitt overvåket i lengre tid. Hvordan kjenne igjen likheter i disse dataene og lignende er kjernen av problemet. Dataene er ikke veldig egnet til å søke i slik de er i utgangspunktet. Behovet for å omforme disse seriene til forenklede utgaver av seg selv er et av målene i denne oppgaven. Det finnes mange forskjellige algoritmer fra før, som angriper problemstillingen å sammenligne større sekvenser.

For denne oppgaven har det blitt benyttet en kjent metode for omforming av datasettene, bedre kjent som SAX, og en annen kjent datastruktur for å sammenligne dem, kjent som suffiksarray. Det er her forsøkt å strømlinjeforme prosessen slik at den skal operere i mest mulig en sekvens, og unngå mye frem og tilbake i datasettene. Ikke bare for å være effektiv i en operasjon, men også for å lett kunne dele opp oppgaven for å utføres i flere parallelle prosesser, da dette har blitt mer og mer viktig for å utnytte kraften til moderne datamaskiner.

Resultatene som kom ut denne oppgaven var ikke særlig positive, men setter lys på en del av problematikk rundt det å sammenligne store og uforutsigbare datasett.

Kan konkludere med at den spesifikke sammensetningen av metodene benyttet i dette prosjektet ikke nødvendigvis er verken det enkleste eller beste til å løse oppgaven. Dog kan noen av metodene muligens benyttes til lignenede oppgaver senere.

Publisher

NTNU