A Low Power Parallel RISC-V Processor in 22nm FDSOI Technology for Medical Ultrasound
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3025706Utgivelsesdato
2022Metadata
Vis full innførselSamlinger
Sammendrag
I medisinsk ultralyd blir signalene tradisjonelt filtrert relativt kraftig med analogefiltre i proben før de sendes videre til en ekstern prosesseringsenhet. Ved ̊a i stedetdigitalisere signalene og deretter gjøre den digitale prosesseringen internt i selveproben vil programmereren ha tilgang til mye mer ufiltrert data. Det store problemetmed ̊a skulle gjøre hele prosesseringen i proben er det lave effektbudsjettet p ̊a knappe3W for ̊a holde proben under 40°C og samtidig prosessere data fra 10 000 prober meden punktprøvingsfrekvens p ̊a 10MHz. PicoRV32, en arealeffektiv RISC-V-basertprosessor er i dette prosjektet ombygd til ̊a støtte flere kjerner for ̊a løse detteproblemet. Designet er syntesert i en 22nm FDSOI (Fully Depleted Silicon OnInsulator) teknologi for ̊a estimere effekt og størrelse.Designet er satt opp med et distribuert minne hvor hver kjerne har en egen min-neblokk. Denne løsningen fungerer bra for ̊a filtrere signalene fra transducerne sidenhver transducer hører til under en enkelt kjerne. Siden det ikke er noen kommu-nikasjon mellom kjernene, blir det problemer n ̊ar det trengs data fra flere kjerner.Prosessoren kjører matrisemultiplikasjon p ̊a 6.9 CPI (Clocks Per Instruction) perkjerne med en dynamisk effekt p ̊a 12.3μW per MIMD (Multiple Instruction Multi-ple Data) kjerne og 12.1μW per SIMD (Single Instruction Multiple Data) kjerne veden klokkefrekvens p ̊a 10MHz. Ved 500MHz klokkefrekvens bruker de henholdsvis 613og 605μW per kjerne. Areale per kjerne er estimert til 5800μm2 per MIMD kjerneog 5500μm2 per SIMD kjerne. Siden disse effektestimatene er relativt lave i forholdtil budsjettet p ̊a 3W selv med mange kjerner vil denne type system være interessanti fremtidige ultralydprober. Medical ultrasound data is traditionally filtered in the probe using analog filtersbefore sending the less extensive filtered data to an external processing device. Bydigitizing the signal from the ultrasound transducers, doing digital filtering andprocessing directly in the probe, the programmer has access to more unfiltered data.The big problem is the tight power budget at 3W set to keep the probe relatively cold,lower than 40°C, while at the same time process the data from 10 000 transducersat a 10MHz sample rate. Picorv32, an area effective RISC-V based processor, hasin this project been rebuilt as a multicore processor in order to perform this massiveprocessing problem. The design is synthesized in a 22nm FDSOI (Fully DepletedSilicon On Insulator) technology to extract estimates for power and area.The design is based on distributed memory, where each core has its own memoryblock. This works very well for the primary digital filtering of the signals as the datafrom each probe belongs to a single core. As there is no interconnection between thecores implemented, problems arise when data sharing between the cores is needed.The processor is able to do matrix multiplication at 6.9 CPI (Clocks Per Instruction)per core, with a dynamic power estimate of 12.3μW per MIMD (Multiple InstructionMultiple Data) core and 12.1μW per SIMD (Single Instruction Multiple Data) coreat a 10MHz clock frequency. At 500MHz the power estimates are 605μW for theSIMD cores and 613μW for the MIMD cores. The area per core is estimated to5800μm2 per MIMD core and 5500μm2 per SIMD core. As these power estimatesare relatively low compared to the 3W power budget even with many cores, thistype of system could prove useful in future ultrasound probes.