Une équipe de recherche conjointe de l'Université technique de Munich (TUM), de Carnegie Mellon University et de NYU a publié MotionDisco, un framework révolutionnaire permettant aux robots humanoïdes de découvrir et d'exécuter de manière autonome des compétences complexes de loco-manipulation à long horizon, sans aucune démonstration humaine.
L'article, publié sur arXiv (2606.06139) le 7 juin 2026, aborde l'un des problèmes les plus difficiles de l'IA incarnée : comment générer des mouvements corporels diversifiés et riches en contacts—comme grimper sur des tables en transportant des objets, naviguer dans des environnements encombrés ou ramasser des boîtes sous des tables—sans dépendre de la collecte coûteuse et chronophage de données par téléopération.
Fonctionnement de MotionDisco
MotionDisco associe deux composants clés : une recherche évolutive guidée par LLM sur des séquences d'interactions de contact, et un optimiseur séquentiel efficace de trajectoires kinodynamiques avec stratégie d'élagage. Le LLM propose des mutations aux plans de contact en fonction des descriptions de tâches et des retours de faisabilité, tandis que l'optimiseur de trajectoires valide si le mouvement proposé est physiquement réalisable. Ce processus en boucle fermée permet la découverte rapide de comportements nouveaux et dynamiquement viables dans diverses tâches à long horizon.
Déploiement réel
Les chercheurs sont allés au-delà de la simulation en entraînant des politiques de suivi par apprentissage par renforcement sur les trajectoires découvertes et en les transférant avec succès à un véritable robot humanoïde. Cela représente le tout premier déploiement de compétences de loco-manipulation humanoïde à long horizon découvertes entièrement par recherche évolutive automatisée—une étape majeure vers des robots capables d'apprendre des compétences physiques de manière indépendante.
Le framework a été développé au ATARI Lab de la TUM, dirigé par le Prof. Majid Khadiv, avec la co-supervision de la Prof. Cordelia Schmid et la collaboration de la Prof. Angela Dai (TUM) et du Prof. Aaron M. Johnson (CMU).

