Show simple item record

dc.contributor.advisorMyrvoll, Tor Andre
dc.contributor.authorKvalnes, Håkon Skjetne
dc.contributor.authorLysø, Magnus Stave
dc.date.accessioned2021-09-15T16:58:10Z
dc.date.available2021-09-15T16:58:10Z
dc.date.issued2020
dc.identifierno.ntnu:inspera:53184405:34527877
dc.identifier.urihttps://hdl.handle.net/11250/2778110
dc.description.abstractDenne masteroppgaven presenterer en sammenligning mellom to tid-frekvens transformasjoner ved å bruke dem i et klassifikasjonsproblem med et konvolusjonalt neuralt nettverk (CNN). De aktuelle transformasjonene er wavelet transformasjonen og den godt kjente og populære Short-time Fourier transformasjonen (STFT). Datasettet som brukes for å gjøre denne sammenligningen består av elleve forskjellige lyder, eller støy, som vanligvis finnes på byggeplasser. For å gjennomføre sammenligningen ekstraheres de to-dimensjonale matrisene, kjent som spektrogram og scaleograms, ved å bruke transformasjonene før et CNN blir trent opp med dem. Så blir forskjellige beregninger assosiert med dataklassifikasjon kalkulert med et testsett. Det er disse beregningene som til slutt sammenlignes. Sammenligning av resultater, basert på forskjellige konfigurasjoner av hver transformasjon vil gi en indikasjon på om en av transformasjonene kan utkonkurrere den andre. Resultatene indikerer at ingen av transformasjonene utkonkurrerer den andre direkte, men at det fortsatt er interessante resultater og forskjeller som kan observeres ved å se på isolerte beregninger. Begge transformasjonene har flere parametere som kan endres, og resultatene blir på grunn av dette helt avhengig av å velge passende konfigurasjoner for ekstraksjonene. Resultatene indikerer også at begge transformasjonene har gode oppløsningsutbytter mellom tid og frekvens for forskjellige klasser. Valget av korrekt transformasjon kan derfor argumenteres for å være høyst avhengig av hvilket datasett som brukes og at ingen transformasjon kan sies å være generelt bedre enn den andre.
dc.description.abstractThis thesis presents a comparison between two time-frequency transforms by using them in a classification problem with a convolutional neural network(CNN). The transforms in question are the wavelet transform and the well known and popular Short-time Fourier transform(STFT). The data used to conduct the comparison is a collection of eleven different sounds, or noises, traditionally found on construction sites. To be able to do a comparison, the twodimensional arrays known as spectograms and scaleograms are extracted from the transforms as features before a CNN is trained with them. The resulting metrics, associated with classification problems, are then compared for the different features using a test set of the data. This will indicate if one of the transforms outperform the other, based on different configuration parameters for each transforms. The results indicates that neither of the two transforms can outperform the other overall, but there is still interesting results and differences found by comparing different classification metrics isolated. Both transforms have several parameters that can be tuned, and the results are heavily dependant on choosing the optimal configurations for the feature extraction. The results indicate that the two transforms both have a favourable resolution trade-off in time and frequency for different classes. The choice of transform can therefore be argued to be dependent on the data itself and not the notion that one, in general, is superior to the other.
dc.languageeng
dc.publisherNTNU
dc.titleComparison of Wavelet Transforms and STFTs in Classification of Outdoor Noise
dc.typeMaster thesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record