Likhetssøk i tidsserier
Master thesis
Permanent lenke
http://hdl.handle.net/11250/2615901Utgivelsesdato
2018Metadata
Vis full innførselSamlinger
Sammendrag
I denne masteroppgaven er det fokus på å kunne søke i tidsserier etter spesifikke mønstre. Dette med tanke på feilsøking i historikken til industrielle apparaturer.
Til denne oppgaven er det utdelt et sett med data, et knippe med tidsserier fra faktiske industrielle apparaturer, som har blitt overvåket i lengre tid. Hvordan kjenne igjen likheter i disse dataene og lignende er kjernen av problemet. Dataene er ikke veldig egnet til å søke i slik de er i utgangspunktet. Behovet for å omforme disse seriene til forenklede utgaver av seg selv er et av målene i denne oppgaven. Det finnes mange forskjellige algoritmer fra før, som angriper problemstillingen å sammenligne større sekvenser.
For denne oppgaven har det blitt benyttet en kjent metode for omforming av datasettene, bedre kjent som SAX, og en annen kjent datastruktur for å sammenligne dem, kjent som suffiksarray. Det er her forsøkt å strømlinjeforme prosessen slik at den skal operere i mest mulig en sekvens, og unngå mye frem og tilbake i datasettene. Ikke bare for å være effektiv i en operasjon, men også for å lett kunne dele opp oppgaven for å utføres i flere parallelle prosesser, da dette har blitt mer og mer viktig for å utnytte kraften til moderne datamaskiner.
Resultatene som kom ut denne oppgaven var ikke særlig positive, men setter lys på en del av problematikk rundt det å sammenligne store og uforutsigbare datasett.
Kan konkludere med at den spesifikke sammensetningen av metodene benyttet i dette prosjektet ikke nødvendigvis er verken det enkleste eller beste til å løse oppgaven. Dog kan noen av metodene muligens benyttes til lignenede oppgaver senere.