dc.contributor.advisor | Myrvoll, Tor Andre | |
dc.contributor.author | Kvalnes, Håkon Skjetne | |
dc.contributor.author | Lysø, Magnus Stave | |
dc.date.accessioned | 2021-09-15T16:58:10Z | |
dc.date.available | 2021-09-15T16:58:10Z | |
dc.date.issued | 2020 | |
dc.identifier | no.ntnu:inspera:53184405:34527877 | |
dc.identifier.uri | https://hdl.handle.net/11250/2778110 | |
dc.description.abstract | Denne masteroppgaven presenterer en sammenligning mellom to tid-frekvens transformasjoner ved å bruke dem i et klassifikasjonsproblem med et konvolusjonalt neuralt nettverk (CNN).
De aktuelle transformasjonene er wavelet transformasjonen og den godt kjente og populære
Short-time Fourier transformasjonen (STFT). Datasettet som brukes for å gjøre denne sammenligningen består av elleve forskjellige lyder, eller støy, som vanligvis finnes på byggeplasser. For
å gjennomføre sammenligningen ekstraheres de to-dimensjonale matrisene, kjent som spektrogram og scaleograms, ved å bruke transformasjonene før et CNN blir trent opp med dem. Så
blir forskjellige beregninger assosiert med dataklassifikasjon kalkulert med et testsett. Det er
disse beregningene som til slutt sammenlignes. Sammenligning av resultater, basert på forskjellige konfigurasjoner av hver transformasjon vil gi en indikasjon på om en av transformasjonene
kan utkonkurrere den andre. Resultatene indikerer at ingen av transformasjonene utkonkurrerer den andre direkte, men at det fortsatt er interessante resultater og forskjeller som kan
observeres ved å se på isolerte beregninger. Begge transformasjonene har flere parametere som
kan endres, og resultatene blir på grunn av dette helt avhengig av å velge passende konfigurasjoner for ekstraksjonene. Resultatene indikerer også at begge transformasjonene har gode
oppløsningsutbytter mellom tid og frekvens for forskjellige klasser. Valget av korrekt transformasjon kan derfor argumenteres for å være høyst avhengig av hvilket datasett som brukes og
at ingen transformasjon kan sies å være generelt bedre enn den andre. | |
dc.description.abstract | This thesis presents a comparison between two time-frequency transforms by using them in a
classification problem with a convolutional neural network(CNN). The transforms in question are the wavelet transform and the well known and popular Short-time Fourier transform(STFT). The data used to conduct the comparison is a collection of eleven different sounds,
or noises, traditionally found on construction sites. To be able to do a comparison, the twodimensional arrays known as spectograms and scaleograms are extracted from the transforms
as features before a CNN is trained with them. The resulting metrics, associated with classification problems, are then compared for the different features using a test set of the data. This
will indicate if one of the transforms outperform the other, based on different configuration
parameters for each transforms. The results indicates that neither of the two transforms can
outperform the other overall, but there is still interesting results and differences found by comparing different classification metrics isolated. Both transforms have several parameters that
can be tuned, and the results are heavily dependant on choosing the optimal configurations
for the feature extraction. The results indicate that the two transforms both have a favourable
resolution trade-off in time and frequency for different classes. The choice of transform can
therefore be argued to be dependent on the data itself and not the notion that one, in general,
is superior to the other. | |
dc.language | eng | |
dc.publisher | NTNU | |
dc.title | Comparison of Wavelet Transforms and STFTs in Classification of Outdoor Noise | |
dc.type | Master thesis | |