Data-driven Policy Transfer with Imprecise Perception Simulation
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F18%3A00322428" target="_blank" >RIV/68407700:21230/18:00322428 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/68407700:21730/18:00322428
Výsledek na webu
<a href="http://cmp.felk.cvut.cz/pub/cmp/articles/svoboda/Pecka-Zimermann-Petrlik-Svoboda-IEEE-RAL-2018.pdf" target="_blank" >http://cmp.felk.cvut.cz/pub/cmp/articles/svoboda/Pecka-Zimermann-Petrlik-Svoboda-IEEE-RAL-2018.pdf</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/LRA.2018.2857927" target="_blank" >10.1109/LRA.2018.2857927</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Data-driven Policy Transfer with Imprecise Perception Simulation
Popis výsledku v původním jazyce
This paper presents a complete pipeline for learning continuous motion control policies for a mobile robot when only a non-differentiable physics simulator of robot-terrain interactions is available. The multi-modal state estimation of the robot is also complex and difficult to simulate, so we simultaneously learn a generative model which refines simulator outputs. We propose a coarse-to-fine learning paradigm, where the coarse motion planning is alternated with guided learning and policy transfer to the real robot. The policy is jointly optimized with the generative model. We evaluate the method on a real-world platform.
Název v anglickém jazyce
Data-driven Policy Transfer with Imprecise Perception Simulation
Popis výsledku anglicky
This paper presents a complete pipeline for learning continuous motion control policies for a mobile robot when only a non-differentiable physics simulator of robot-terrain interactions is available. The multi-modal state estimation of the robot is also complex and difficult to simulate, so we simultaneously learn a generative model which refines simulator outputs. We propose a coarse-to-fine learning paradigm, where the coarse motion planning is alternated with guided learning and policy transfer to the real robot. The policy is jointly optimized with the generative model. We evaluate the method on a real-world platform.
Klasifikace
Druh
J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS
CEP obor
—
OECD FORD obor
20204 - Robotics and automatic control
Návaznosti výsledku
Projekt
<a href="/cs/project/GA17-08842S" target="_blank" >GA17-08842S: Robustní plánování a řízení pohybu na nerovném terénu</a><br>
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
IEEE Robotics and Automation Letters
ISSN
2377-3766
e-ISSN
2377-3766
Svazek periodika
3
Číslo periodika v rámci svazku
4
Stát vydavatele periodika
US - Spojené státy americké
Počet stran výsledku
6
Strana od-do
3916-3921
Kód UT WoS článku
000441444700031
EID výsledku v databázi Scopus
2-s2.0-85063308179