Multilingual Poetry Generation
Abstract
I krysset mellom Natural Language Processing and Computational Creativity er diktgenerering en sammensatt oppgave, delvis på grunn av de forskjellige formene den kan ta og subjektiviteten til evalueringen. På grunn av deres iboende natur kan ikke poetiske tekster oversettes fra et språk til et annet ved å bruke maskinoversettelsesmodeller uten å miste for mye informasjon og egenskaper til diktet. Denne avhandlingen utforsker forskjellige løsninger for å generere poesi på flere språk.
Fire forskjellige modeller for dyp læring er utviklet for å produsere flerspråklig poesi, med fokus på egenskaper som grammatikalitet, meningsfullhet og poetikk i de resulterende tekstene. Det siste systemet - MultiLingual Poetry Generator - kombinerer en flerspråklig fonembasert med en språkspesifikk LSTM. Den er i stand til å gi ut poesi på både fransk og engelsk med en økning på 15,2% når det gjelder poetikk, vurdert av menneskelig evaluering.
Resultatene viser at det er mulig for en modell å lære og generere poesi på flere språk, og åpner for flerspråklig poesi-generasjon.