Using machine learning for advertisement detection in podcasts
Abstract
Bacheloren er skrevet av to dataingeniør studenter ved NTNU, våren 2022. Oppgaven er gitt over veiledet Donn Morrison, førstelektor ved NTNU. Oppgaven var å oppdage og annotere podcast lydfiler automatisk og dynamisk slik at reklame enkelt kan fjernes eller hoppes over. Vi hadde en hypotese om at lyd dataen fra reklame er unik nok til at den kan oppdages uten at vi trenger å bruke språk igjenkjenning. Denne hypotesen viste seg å være korrekt med unntak av testing på reklame med ukjente språk. This bachelor is written by two computer science students at NTNU, spring 2022. The task is issued and supervised by Donn Morrison, associate professor at NTNU. The task states that the aim is to make an artificial intelligence that can detect and annotate podcast audio files automatically and dynamically such that advertisements can be easily skipped or cropped from the file. We hypothesised that the sound data that exists in an advertisement would be different enough to distinguish without a special focus on the speech. This hypothesis turned out to be correct in our test cases except from when testing with new languages.