EG
Diagramme d'architecture Humanoid-GPT montrant l'approche de mise à l'échelle des données de mouvement
ResearchJune 11, 2026Galbot Inc., Tsinghua University, Shanghai Jiao Tong University, Peking University

Galbot et Tsinghua Dévoilent Humanoid-GPT: Un Corpus de 2 Milliards d'Images Permet le Suivi de Mouvement Zero-Shot

Les chercheurs de Galbot et de l'Université de Tsinghua présentent Humanoid-GPT, un Transformer de style GPT entraîné sur un corpus de 2 milliards d'images de mouvement pour le contrôle de robot humanoïde corps entier. Contrairement aux trackers MLP superficiels limités par la rareté des données, Humanoid-GPT atteint une généralisation zero-shot sans précédent.

#humanoid-robot#motion-tracking#scaling#galbot#tsinghua#arXiv#transformer#zero-shot
Reading in French

Les chercheurs de Galbot et de l'Université de Tsinghua ont présenté Humanoid-GPT, une approche innovante pour le suivi du mouvement des robots humanoïdes qui tire parti de données à grande échelle et d'une architecture transformer moderne.

La Révolution du Scaling dans le Suivi de Mouvement

Humanoid-GPT est pré-entraîné sur un corpus de mouvement de 2 milliards d'images, unifiant tous les principaux ensembles de données de capture de mouvement. Cela représente plus de 200× plus grand que les ensembles d'entraînement précédents.

Briser le Trade-off Agilité-Généralisation

Les traceurs de mouvement précédents souffrent d'un trade-off entre agilité et généralisation. Humanoid-GPT brise ce trade-off grâce à une mise à l'échelle systématique.

Résultats Clés

  • Généralisation zero-shot aux mouvements non vus
  • Suivi de comportements hautement dynamiques
  • Transformateur génératif unique
  • 96%+ de taux de succès sur tests réels
Source: arXiv:2606.03985
Language: French- Showing content in French