A Structured Approach to Autonomous Driving in Simulated Environments
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3030758Utgivelsesdato
2022Metadata
Vis full innførselSamlinger
Sammendrag
Autonome kjøretøy har gjort betydelig fremgang og fått mye oppmerksomhet de siste årene. Denneavhandlingen undersøker en ny tilnærming til simulert autonom kjøring med fokus på sikkerhet. Deter for tiden to forskjellige grupper av tilnærminger til autonome kjøretøy; ende-til-ende tilnærmingerog strukturerte tilnærminger. En strukturert tilnærming er valgt i denne avhandlingen fordi hvermodul kan testes og sertifiseres. Dette er avgjørende for systemets sikkerhet og vesentlige aspekterfor de største interessentene.
Simuleringsmiljøet CARLA er valgt som simuleringsmiljø for dette systemet. CARLA tilbyr etbredt utvalg av sensorer. Semantiske kamera er en av disse sensorene, og det blir bruket til å lageen fugleperspektivsensor som brukes i denne avhandlingen. CARLA opererer med mange semantiskeklasser som ikke er relevante for kjøring. Derfor er de semantiske klassene inndelt i fire nyesemantiske klasser: vei, objekt i bevegelse, ikke kjørbart objekt og uinteressant. Det modifisertefugleperspektivet brukes til å lage et kompakt, men tilstrekkelig representasjon av miljøet.Sentrum av ego-kjøretøyet i den modifiserte fugleperspektivsensoren sender ut simulerte strålerfor likt fordelte vinkler rundt kjøretøyets senter, som slutter når de treffer et objekt i bevegelseeller et objekt som ikke kan kjøres. Disse simulerte strålene brukes til å beregne avstander mellomden ytre overflaten av kjøretøyet og andre bevegelige objekter og ikke kjørbare objekter. Dennerepresentasjonen av mellommiljøet utvides ytterligere ved å legge til den semantiske klassen ogden relative hastigheten til treffpunktene. Denne representasjonen av mellommiljøet inneholderikke informasjon om kjøretøyets midlertidige målposisjon. For å inkludere denne informasjonen,inkluderes et potensialfelt som inneholder informasjon om den midlertidige målposisjonen til egokjøretøyet.Potensialfeltet skapes også fra det modifiserte fugleperspektivet.
Planlegging krever muligheten til å forutsi hvordan det autonome kjøretøyet vil bevege seg gittnoe informasjon om miljøet rundt kjøretøyet. Ikke-holonomiske begrensninger (eng: nonholonomicconstraints) begrenser bevegelsen til kjøretøy, og derfor er det avgjørende å designe en bevegelsesmodellsom forutsier mulige veier som tilfredsstiller disse begrensningene. Utformingen av bevegelsesmodellengjøres ved først å utføre systemidentifikasjon av drivverket og styreinngangen til denomvendte radiusen til den sirkulære banen som kjøretøyet følger. Den komplette bevegelsesmodellengjør det mulig å lage gjennomførbare planer basert på kontrollhandlingssekvenser (eng: controlaction sequences). Kontrollhandlingssekvensen er et tidssegment av styrings- og gasssignaler overen begrenset tid. Disse kontrollhandlingssekvensene kan beskrives kompakt med et lite antall parametere,i denne avhandlingen blir dette kalt lokale planparametre (eng: local plan parameters) idenne avhandlingen. I prinsippet kan slike lokale planparametre velges tilfeldig, testes for gjennomførbarhet(kollisjoner må unngås), og rangeres i forhold til egnede kvalitetstrekk. Det nåværendearbeidet trener en agent til å generere egnede lokale planparametre basert på miljøbeskrivelsen. Tildette formålet bruker systemet imitasjonslæring (eng: imitasjon learning) og forsterkende læring(reinforcement learning). Den beste kortsiktige planen utføres ved å bruke lateral og langsgåendekontroll eller ved å bare utføre den underliggende kontrollhandlingssekvensen. Den valgte kortsiktigeplanen utføres i en kort periode før det autonome kjøretøyet oppretter en ny kortsiktig plan.
Dette resulterer i et autonomt kjøretøy som trygt kan kjøre gjennom en testrute med forskjelligehindringer. Det er enkelt å teste og sertifisere hver komponent i hele systemet. Resultatene viser ogsåat det autonome kjøretøyet kjører på stier som ligner clothoider (eng: clothoids) i kurvene. Autonomous vehicles have made significant progress and gained much attention in the last years.This thesis studies a new approach for simulated autonomous driving with a focus on safety. Thereare currently two different families of approaches to autonomous vehicles; end-to-end approachesand structured approaches. A structured approach is selected for this thesis because each modulecan be tested and certified. These are crucial for the system’s safety and essential aspects for theprominent stakeholders.
The simulation environment CARLA is selected as the simulation environment for this system.CARLA offers a wide variety of sensors. A semantic camera is one of these sensors, and it is usedto create a bird´s eye view sensor that is used in this thesis. CARLA operates with many semanticclasses that are not relevant for driving. Therefore, the semantic classes are mapped into four newsemantic classes: road, moving object, not driveable object, and don’t care. This modified bird´s eyeview is used to create a compact but sufficient intermediate representation of the environment.The center of the ego vehicle in the modified bird’s eye view sensor sends out simulated rays forequally distributed angles around the vehicle’s center, which end when they hit a moving object or anot driveable object. These simulated rays are used to calculate distances between the outer surfaceof the vehicle and other moving objects and not driveable objects. This intermediate environmentrepresentation is further extended by adding the semantic class and the relative velocity of the hitpoints. This intermediate environment representation does not contain information about the temporarygoal pose of the vehicle. To include this information, a potential field containing informationabout the temporary goal pose of the ego vehicle is included. The potential field is also created fromthe modified bird´s eye view.
Planning requires the possibility of predicting how the autonomous vehicle will move for some controlaction signals. Nonholonomic constraints restrict the motion of vehicles, and therefore it is crucialto design a motion model that predicts feasible short-term plans that satisfies these restrictions.The design of the physical vehicle motion model is done by first performing system identificationof the drive train and the steering input to the inverse radius of the circular path that the vehicleis following. The complete physical vehicle motion model makes it possible to create feasible shorttermplans based on control action sequences. The control action sequence is a time segment of thesteering and throttle signals over a limited time. These control action sequences can be compactlydescribed by a small number of parameters, called local plan parameters in this thesis. In principle,such local plan parameters can be randomly chosen, tested for feasibility (collisions need to beavoided), and ranked in terms of suitable quality measures. However, the present work aims totrain an agent to generate a small set of suitable local plan parameters based on the environmentdescription. For this purpose, the system uses imitation learning and reinforcement learning. Thebest short-term plan is executed by applying lateral and longitudinal control or to simply executethe underlying control action sequence. The selected short-term plan is executed for a short timeperiod before the autonomous vehicle creates a new short-term plan.
This results in an autonomous vehicle that is able to safely drive through a testing route withdifferent obstacles. It is easy to test and certify each component of the complete system. The resultsalso show that the autonomous vehicle drives on paths similar to clothoids in the curves.