Likhetssøk i tidsserier
Abstract
I denne masteroppgaven er det fokus på å kunne søke i tidsserier etter spesifikke mønstre. Dette med tanke på feilsøking i historikken til industrielle apparaturer.
Til denne oppgaven er det utdelt et sett med data, et knippe med tidsserier fra faktiske industrielle apparaturer, som har blitt overvåket i lengre tid. Hvordan kjenne igjen likheter i disse dataene og lignende er kjernen av problemet. Dataene er ikke veldig egnet til å søke i slik de er i utgangspunktet. Behovet for å omforme disse seriene til forenklede utgaver av seg selv er et av målene i denne oppgaven. Det finnes mange forskjellige algoritmer fra før, som angriper problemstillingen å sammenligne større sekvenser.
For denne oppgaven har det blitt benyttet en kjent metode for omforming av datasettene, bedre kjent som SAX, og en annen kjent datastruktur for å sammenligne dem, kjent som suffiksarray. Det er her forsøkt å strømlinjeforme prosessen slik at den skal operere i mest mulig en sekvens, og unngå mye frem og tilbake i datasettene. Ikke bare for å være effektiv i en operasjon, men også for å lett kunne dele opp oppgaven for å utføres i flere parallelle prosesser, da dette har blitt mer og mer viktig for å utnytte kraften til moderne datamaskiner.
Resultatene som kom ut denne oppgaven var ikke særlig positive, men setter lys på en del av problematikk rundt det å sammenligne store og uforutsigbare datasett.
Kan konkludere med at den spesifikke sammensetningen av metodene benyttet i dette prosjektet ikke nødvendigvis er verken det enkleste eller beste til å løse oppgaven. Dog kan noen av metodene muligens benyttes til lignenede oppgaver senere.