Vis enkel innførsel

dc.contributor.advisorDutilleux, Guillaume
dc.contributor.authorHolkestad, Østen Finnes
dc.date.accessioned2021-09-15T17:11:37Z
dc.date.available2021-09-15T17:11:37Z
dc.date.issued2021
dc.identifierno.ntnu:inspera:77039769:26313573
dc.identifier.urihttps://hdl.handle.net/11250/2778190
dc.description.abstractEU sitt Habitat-direktiv seier at løkfrosken (eng. common spadefoot toad, lat. Pelobates fuscus fuscus (P. fuscus)) treng streng beskytting, og er plassert i direktivet sitt Anneks IV. Denne kategorien seier nettopp at arten må plasserast under eit strengt program for å beskytte den. Derfor kan ikkje-innvaderande metoder som akustisk monitorering vere ein mogleg måte å overvake arten i sitt habitat. Djup læring (eng. deep learning) vert brukt som ein mogleg måte å utvikle ein detektor av løkfrosken (basert på paringsropet til arten). Dataen som er brukt til å trene detektoren er samla inn over to år på to forskjellige område. Dei to områda er paringsområde for arten i tillegg til nokre andre anura, så all data var teken opp i heile paringsperioden. Dataen vart så transformert til spektrogram og brukt som inn-data til eit nevralt nettverk. Ved å bruke det konvolusjonelle nevrale nettverket EfficientNet klarte detektoren å oppnå ein presisjon (eng. precision) på 93.47% på kostnad av ein sann positiv-rate (eng. true positive rate) på 67.28%. I tillegg til dette oppnår detektoren ein falsk positiv-rate (eng. false positive rate) på 0.55%. Den låge falske positiv-raten er eit resultat av post-prosesseringa som vert gjort under testinga av modellen. Ei samanlikning av detektoren utvikla i denne masteroppgåva og ein tidlegare utvikla software-detektor vert også gjort. Software-detektoren oppnår sanne positiv-rater på mellom 53% og 73% og ein falsk positiv rate på 1.5%. Ein diskusjon vert gjort på deteksjonen av løkfrosken, og eksempel på sanne positive, falske positive og falske negative prediksjonar vert presentert. Måten dei faktiske tidene (eng. ground truth) frosken lagar lydar vert henta ut er funnen til å ikkje gi eit heilt eksakt innblikk i korleis modellen faktisk presterer, og moglege måtar å unngå dette i framtida vert presentert. I tillegg til ein detektor som kan brukast på paringsropet til vaksne individ, vil rapporten også sjå om ungdomsindivid av frosken kan verte funnen under vatn. Det har vorte funne tidligare at desse individa vokaliserer i si landbaserte fase av livet. På bakgrunn av denne kunnskapen vert det gjort ei studie på om ein djup læring-modell kan finne ut om den vokaliserer under vatn. Det vert ikkje gjort ein konkret konklusjon på om ungdomsindivid vokaliserer under vatn eller ikkje då modellen berre predikerer falske positive tilfelle. Grunnen til dette kan kome frå nokre grunnar som vert diskutert i rapporten. Vokaliseringane til ungdomsindivida burde derfor undersøkast nærare i framtida. Denne rapporten viser at det er mogleg å få pålitelege resultat både med tanke på falske positive og falske negative prediksjonar ved å bruke ein djup læring-basert detektor på paringsropet til løkfrosken. Derfor vil denne detektoren kunne brukast på langtidsopptak i forskjellige habitat for vern av arten.
dc.description.abstractThe EU’s Habitats Directive states that the common spadefoot toad (Pelobates fuscus fuscus (P. fuscus)) is in need of strict protection, being placed in the category known as Annex IV species. This category states that species must be placed under a strict protection regime. Therefore non-invasive methods such as acoustic monitoring could be a possible way to keep count of species in its habitats. Deep learning is presented as a possible way to develop a detector of the common spadefoot toad based on its advertisement calls. The data that is used to train the detector was collected over two years at two sites. The two sites act as breeding grounds for the spadefoot toad as well as a few other anuran species and the data was as such collected during the breeding periods. The data is transformed to spectrogram and is used as input to a neural network. Using the convolutional neural network architecture EfficientNet the detector developed in this paper achieves a precision of 93.47% at the expense of getting a true positive rate of 67.28%. In addition to this, the detector achieves a false positive rate of 0.55%. The low false positive rate comes from the way the post-processing is done when testing the model. A comparison with a software detector on the advertisement calls is also done. The software detector achieved true positive rates ranging between 53% and 73% and a false positive rate of 1.5%. A discussion is made on the detection of the common spadefoot toad, and examples of true and false positives as well as false negatives are presented. The way ground truth times are extracted from label files is found to not give an exact insight into how the model actually performs, and possible ways to avoid this in the future is presented. In addition to a detector used on the advertisement call of the adult specimens, the report also aims to find if the juvenile specimens vocalize underwater. It has been found earlier that the juvenile vocalizes in its terrestrial phase. Using this knowledge, a study of whether a deep learning model can find if it vocalizes underwater or not is performed. A concrete conclusion on whether the juvenile vocalizes underwater or not is not made, as the model only predicted sounds that were found to be false positives. The reason for this can come from a few different reasons which are discussed in greater detail. Juvenile vocalizations underwater should therefore be studied in the future. This report shows that it is possible to get reliable results both with regards to false positive and false negative predictions when using a deep learning-based detector on the advertisement call of the common spadefoot. Therefore the detector can be applied to long-term recordings in habitats for conservation purposes.
dc.languageeng
dc.publisherNTNU
dc.titleA deep learning based approach to detect the common spadefoot toad
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel