Vector Unit for Deeply-embedded, Low-power RISC-V Processors
Abstract
Dagens smarte verden er avhengig av at små datamaskiner bygges inn i ulike produkterfor å forbedre folks liv. Disse dypt innebygde enhetene forventes i økendegrad å gi høy ytelse samtidig som de er svært energieffektive, noe som representereren utfordring for tradisjonelle innebygde systemer.Tidligere forskning har antydet at vektorprosessering er en god løsning for åskalere ytelsen til innebygde enheter uten at det går på bekostning av energieffektiviteten.Selv om RISC-V ISA har fått mye oppmerksomhet de siste årene,mangler den eksisterende forskningen en grundig undersøkelse av nytten av envektorenhet basert på RISC-V vektor-ISA for innebygde enheter for å forbedreytelsen til dypt innebygde RISC-V-prosessorer og samtidig oppnå høy energieffektivitet.I dette arbeidet utvides en skalarkjerne i RISC-V med vektorprosessering for åimøtekomme behovet for høyere ytelse i dypt innebygde applikasjoner, med spesieltfokus på kunstig intelligens. Den ekstra funksjonaliteten verifiseres mot en signaturhentet fra en RISC-V ISA-simulator. PPA-målingene til den nye løsningenevalueres og sammenlignes med den skalære baseline. Ytelsen til viktige kjernermåles ved hjelp av syklusnøyaktig simulering. Arealet måles etter logikksynteseved hjelp av den nyeste 22 nm FD-SOI-teknologien fra GlobalFoundaries. Effektog energi etter syntese beregnes ved hjelp av koblingsaktivitet hentet fra simuleringen.Benchmarking av et matrisemultiplikasjonsprogram viser at den foreslåtte løsningengir overlegen ytelse og energieffektivitet, ettersom den oppnår opptil 25Xbedre ytelse med en reduksjon i energiforbruket på 15,5X sammenlignet medskalarbaseline. Selv om strømforbruket øker med 59 %, holder det seg godt innenfordet akseptable budsjettet for dypt innebygde enheter. I tillegg observeresen betydelig arealøkning på 3,4X, men i en moderne SoC bør dette være ubetydeligsammenlignet med andre chipkomponenter. Vi konkluderer derfor med atden foreslåtte løsningen er svært lovende når det gjelder å øke ytelsen til dyptinnebygde RISC-V-prosessorer. Today’s smart world depends on the pervasive embedding of tiny computers invarious products to improve people’s lives. These deeply embedded devices areincreasingly expected to provide high performance while staying highly energyefficient,representing a challenge for traditional embedded systems.Prior research has suggested that vector processing is a good solution to scalethe performance of embedded devices without compromising energy efficiency.Although the RISC-V ISA has gained much traction in recent years, the existingresearch lacks a thorough investigation of the utility of a vector unit based onembedded-class RISC-V vector ISA to improve the performance of deeply embeddedRISC-V processors while having high energy efficiency.In this work, an ultra-low-power RISC-V scalar core is extended with vectorprocessing capabilities to address the need for higher performance of deeply embeddedapplications, with a special focus on AI. The added functionality is verifiedagainst a signature extracted from a RISC-V ISA simulator. The PPA metrics ofthe created solution are evaluated and compared to the scalar baseline. The performanceof important kernels is measured using cycle-accurate simulation. Thearea is measured after logic synthesis using state-of-the-art 22nm FD-SOI technologyfrom GlobalFoundaries. Post-synthesis power and energy are calculated usingswitching activity extracted from the simulation.Benchmarking a matrix multiplication program demonstrates superior performanceand energy efficiency of the proposed solution as it achieves up to 25Xperformance gain with a reduction in energy by a factor of 15.5X compared tothe scalar baseline. Although power consumption increases by 59%, it stays wellwithin the acceptable budget of deeply embedded devices. Moreover, a considerablearea increase by a factor of 3.4X is observed; however, in a modern SoC, thisshould be insignificant compared to other chip components. Therefore, this workconcludes that the proposed solution is highly promising for efficiently increasingthe performance of deeply embedded RISC-V processors.