EG
Une vue rapprochée d'une main robotique effectuant l'assemblage précis de petits composants électroniques
ResearchJune 14, 2026Embodied Global Team

Xiaomi Open-Source l'Intégralité du Pipeline de Post-Entraînement pour le Modèle VLA : Précision Sub-Millimétrique avec Seulement 20 Heures de Données

Xiaomi open-source le pipeline complet de post-entraînement en conditions réelles pour son modèle VLA Xiaomi-Robotics-0, permettant aux robots de maîtriser des tâches de précision sub-millimétrique avec seulement ~20 heures de données — accélérant considérablement l'acquisition de compétences en IA incarnée.

Reading in French

Xiaomi a apporté une contribution significative à la communauté de l'IA incarnée en open-sourçant l'intégralité du pipeline de post-entraînement en conditions réelles pour son grand modèle Vision-Langage-Action (VLA), Xiaomi-Robotics-0.

La publication open-source couvre l'ensemble du pipeline, de la collecte de données au fine-tuning du modèle, permettant aux chercheurs et développeurs de reproduire et d'enrichir l'approche de Xiaomi. L'équipe a démontré qu'avec seulement environ 20 heures de données spécifiques à une tâche, un robot pouvait maîtriser des tâches de précision complexes telles que le rangement d'écouteurs — une opération nécessitant une précision d'alignement sub-millimétrique.

Cela représente une réduction spectaculaire des besoins en données pour l'acquisition de compétences. La programmation robotique traditionnelle nécessite souvent des milliers d'heures de démonstrations ou un apprentissage par renforcement approfondi en simulation. L'approche de Xiaomi montre qu'avec la bonne méthodologie de post-entraînement, les robots peuvent apprendre des compétences complexes à partir de quantités relativement modestes de données réelles.