Reinforced InterFuser for end-to-end autonomous driving in simulated environments
Abstract
Reinforced InterFuser presenteres som en metode for å utnytte nyere sensorfusjonsmetoder i en "reinforcement learning" kontektst for ende-til-ende autonom kjøring i simulerte miljøer. Arkitekturen bruker en forhåndstrent InterFuser modell, samt en spesialtilpasset InterFuser modell som en visuell enkoder til en standard "reinforcement learning" algoritme og sammenlignes med en grunnleggende RL agent's treningsprosess og kjøreatferd. Sikkerhetsmekanismer dedusert fra eksplisitte prediksjoner fra InterFuser modellen utforskes også for å finne fordelene med ekstra sikkerhetsmekanismer på en RL agent.
Metoden viser lovende resultater for spesifikke konfigurasjoner av å bruke InterFuser arkitekturen som en visuell enkoder, og overgår den grunnleggende agenten på ukjente evalueringsruter etter en begrenset mengde trening. Å bruke sikkerhetsmekanismer til Reinforced InterFuser forbedrer evnen til å stoppe ved røde lys og unngå kollisjoner, og forbedrer agentens evne til å navigere gjennom ukjente utfordrende scenarioer. Reinforced InterFuser is presented as an approach for utilizing recent sensor fusion approaches in reinforcement learning for end-to-end autonomous driving in simulated environments. The architecture uses both a pre-trained and a custom-trained InterFuser model as a visual encoder to a standard reinforcement learning agent and is compared to a baseline RL agent's training performance. Safety mechanisms deduced from explicit predictions from the InterFuser model is also explored to gauge the benefits of additional safety mechanisms applied to an RL agent.
The approach shows promising results for specific configurations of utilizing the InterFuser architecture as a visual encoder, outperforming the baseline agent on unseen evaluation routes after a limited amount of training. Applying safety mechanisms to Reinforced InterFuser vastly improves the ability to stop at red lights and avoid collisions, improving the agent's ability to navigate through unseen challenging scenarios.