Analyse av Ulike Akustiske Taleegenskaper for Deteksjon av Artikulatoriske Attributter
Abstract
Arbeidet bak denne rapporten har omhandlet analysering av egendefinerte taleegenskapers potensial ved detektering av lydenheter (attributter). Et HTK-basert simuleringsverktøy har blitt utviklet for å kunne kartlegge egenskapenes evne til å frembringe gode gjenkjenningsresultater. En har undersøkt muligheten for forbedring av feilraten ved å representere talesignalet vha egenskapsvektorer som er tilpasset hver attributtdetektor. Utvelgelsen av vektorene er gjort ved subjektiv inspeksjon av attributtenes fordelingshistogram og kan dermed medføre menneskelige feilantagelser. Undersøkelsene som er blitt utført viser, som forventet, underlegne resultater sammenlignet med referansen, MFCC. En beskjeden forbedring oppnås ved tilegnelse av utvalgte subsett av egenskaper til hver attributtdeteksjon. Nærmere tester bekrefter usikkerheten rundt potensialet til de egendefinerte egenskapsvektorene. Det er dermed anbefalt å redefinere egenskapene og eventuelt velge ut et nytt sett med attributter. En bør i tillegg vurdere å utvikle en bedre teknikk for utvelgelse av egenskapene for å optimalisere gjenkjenningen.