Generative AI for Rhythm-Infused Rap Lyrics: "Artificial amateurs aren’t at all amazing", but this might be
Master thesis

Permanent lenke
https://hdl.handle.net/11250/3172400Utgivelsesdato
2024Metadata
Vis full innførselSamlinger
Sammendrag
Når mange tenker på Kunstig intelligens (KI) så tenker de på ChatGPT, robotstøvsugere eller til og med Terminator. Det jeg tenker på er om en KI greier å rappe.
Denne masteroppgaven kommer til å utforske det nyeste innen for Kunstig Intelligens i musikk, med fokus på å skrive rap tekst med rytmisk forståelse. Med stor interesse for generativ KI og deres banebrytende potensialle innen for kreative felt, kommer denne forskningen til fokusere på en hovedutfording: eksisterende KI modeller greier ikke å gjenskape rytmiske mønstre og flow som er definerende for Hip Hop musikk. Målet er å fylle opp denne mangelen ved å utvikle en anvansert AI model som er i stand til å generere rap tekst som ikke bare rimer, men som følger de rytmiske mønstrene i rap.
Målet er todelt: Lage en automatisk transkripsjonssystem for rap tekst med rytmisk annontasjon og designe en AI model som skriver rytmiske rap tekster med god flow. Ved bruk av avanserte signal procceserings teknikker kommer transcribsjonssystemet til å identifisere takten i Hip Hop sanger og annontere det inn i teksten. Resultatet vil være et detaljert datasett som vil fungere som fundamentet for å trene KI modellen til å lage rap på lik linje som menneskeskapte sanger.
Viktige bidrag fra denne masteroppgaven innkluderer å finjustere eksisterende rap tekst generatorer, introdusere et datasett som er i stand til å representere nyansene i Engelsk rap, og utvikle an KI model som både er lyrisk og rytmisk. Funnene gjort i denne masteroppgaven avdekker at en KI modell kan gjenskape spesifikke rytmiske mønstere funnet i rap. Den har potensialle til å revolusjonere processen av Hip Hop låtskriving. Imponerende nok, har modellen min greidd å skrive rap tekster som nesten er umulig å skille fra tekster skrevet av mennesker.
I nok med det, masteroppgaven har også et stort fokus på å avdekke alle utfordringer og etiske hensyn nå som forskningen bak KI har utviklet seg så raskt. Mye av innsikten kan bane vei for nye gjennombrudd innenfor KI musikkgenerering. Can an AI spit some bars? Well, "Artificial amateurs aren’t at all amazing," but this might be.
This thesis explores the cutting-edge application of artificial intelligence in music generation, with a spotlight on crafting rap lyrics that showcase pronounced rhythmic perception. Driven by the explosive interest in generative AI and its game-changing potential in creative industries, this research tackles a key challenge: existing AI models often fall short in capturing the intricate rhythmic patterns that define rap music. Our work aims to fill this gap by developing an advanced AI model capable of generating rap lyrics that not only rhyme but also align seamlessly with the genre's rhythmic conventions.
The study is anchored around two main goals: creating an automatic transcription system for beat-annotated rap lyrics and designing an AI model adept at generating rhythmically coherent rap lyrics. Utilizing advanced signal processing techniques, our transcription system accurately identifies beats in rap tracks and annotates the lyrics, resulting in a detailed dataset of beat-annotated lyrics. This dataset serves as the foundation for training our AI model, which is then rigorously evaluated for its ability to replicate the rhythmic and rhyming qualities of human-composed rap.
Key contributions of this thesis include fine-tuning existing models for rap lyric generation, introducing a novel dataset representation that captures the nuances of English rap, and developing an AI model that integrates both lyrical and rhythmic elements. Our findings reveal that the AI model can skillfully replicate specific rhyming schemes and rhythmic patterns, showcasing its potential to revolutionize the process of rap music composition. Remarkably, the AI-generated lyrics were nearly indistinguishable from those written by humans!
This research not only pushes the boundaries of AI-generated music by emphasizing rhythmic elements but also addresses the accompanying challenges and ethical considerations. The insights gained from this work pave the way for future advancements in AI music generation, promising more sophisticated models and broader applications in the industry.