Learning Complex Motion Planning Policies
Project goals
In the project, we aim to address motion planning for robotic systems such as multi-legged walking in complex tasks of traversing unstructured terrain or climbing a wall. The proposed approach is to exploit the capabilities of learnable locomotion controllers to build a set of locomotion skills applicable in complex motion tasks. We plan to investigate biologically inspired locomotion control based on the coupling of neural oscillators to develop neural-based locomotion controllers with high plasticity capable of learning multiple gaits. We further plan to employ precise motion planning to synthesis motion planning policies using learning techniques such as hierarchical temporal memory. Complementary, we propose to combine global, less accurate models with a more precise local model using inter-basin actions and employ methods of deep reinforcement learning to provide smooth transitions between locally stable regions of individual motion controllers. We aim to establish complex analyses of the proposed approaches and experimentally verify them in scenarios with real robotic systems.
Keywords
motion planningcentral pattern generatorcomplex motion tasksroboticscontinuous learning
Public support
Provider
Czech Science Foundation
Programme
International projects
Call for proposals
SGA0202100007
Main participants
České vysoké učení technické v Praze / Fakulta elektrotechnická
Contest type
VS - Public tender
Contract ID
21-33041J
Alternative language
Project name in Czech
Učení plánování pohybu ve složitých úlohách
Annotation in Czech
V navrhovaném projektu se zaměřujeme na plánování pohybu robotických systémů, jako jsou kráčející roboty, ve složitých úlohách procházení nestrukturovaným terénem nebo lezení po stěně. V projektu navrhujeme využít schopností učitelných přístupů řízení lokomoce k vytvoření sady pohybových dovedností použitelných ve složitých pohybových úlohách. Navrhujeme využít biologicky inspirové generátory pohybových vzorů s cílem vytvořit generátor, který bude možné naučit různé pohybové vzory. V projektu také plánujeme využít metody přesného plánování pohybu v pro syntézu politik plánování pohybu technikami učení, jako je hierarchická časová paměť. Navrhovaný komplementární přístup je založen na kombinaci globálních, méně přesných modelů, s přesnějšími lokálními modely a nalezením plynulých přechodů mezi jednotlivými lokálními modely jednotlivých politik řízení metodami hlubokého posilovaného učení. Cílem projektu je stanovení vlastností vyvinutých algoritmů a jejich experimentální ověření v realistických scénářích se skutečnými robotickými systémy.
Scientific branches
R&D category
ZV - Basic research
OECD FORD - main branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - secondary branch
—
OECD FORD - another secondary branch
—
AF - Documentation, librarianship, work with information
BC - Theory and management systems
BD - Information theory
IN - Informatics
Solution timeline
Realization period - beginning
Jan 1, 2021
Realization period - end
Dec 31, 2023
Project status
—
Latest support payment
Mar 6, 2023
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP24-GA0-GC-R
Data delivery date
May 21, 2024
Finance
Total approved costs
6,038 thou. CZK
Public financial support
5,739 thou. CZK
Other public sources
291 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
6 038 CZK thou.
Public support
5 739 CZK thou.
95%
Provider
Czech Science Foundation
OECD FORD
Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Solution period
01. 01. 2021 - 31. 12. 2023