EG
Diagrama general del marco MotionDisco que muestra el flujo de búsqueda evolutiva guiada por LLM para el descubrimiento de movimientos de loco-manipulación en robots humanoides
ResearchJune 9, 2026Embodied Global Team

MotionDisco: Investigadores de TUM logran un avance en loco-manipulación humanoide mediante búsqueda evolutiva automatizada

Investigadores de la Universidad Técnica de Múnich, Carnegie Mellon University y NYU han presentado MotionDisco, un novedoso marco que permite a los robots humanoides descubrir de forma autónoma habilidades complejas de loco-manipulación desde cero, sin demostraciones humanas ni teleoperación. Publicado en arXiv (2606.06139), el sistema combina búsqueda evolutiva guiada por LLM con optimización secuencial de trayectorias kinodinámicas, logrando el primer despliegue exitoso de descubrimiento de movimiento totalmente automatizado en un robot humanoide real.

Reading in Spanish

Un equipo conjunto de investigación de la Universidad Técnica de Múnich (TUM), Carnegie Mellon University y New York University ha publicado MotionDisco, un marco revolucionario que permite a los robots humanoides descubrir y ejecutar de forma autónoma habilidades complejas de loco-manipulación de largo horizonte sin ninguna demostración humana.

El artículo, publicado en arXiv (2606.06139) el 7 de junio de 2026, aborda uno de los problemas más desafiantes en IA incorporada: cómo generar movimientos corporales diversos y ricos en contacto—como subirse a mesas transportando objetos, navegar entornos desordenados o recoger cajas debajo de mesas—sin depender de la costosa y lenta recolección de datos por teleoperación.

Cómo funciona MotionDisco

MotionDisco combina dos componentes clave: una búsqueda evolutiva guiada por LLM sobre secuencias de interacciones de contacto, y un eficiente optimizador secuencial de trayectorias kinodinámicas con estrategia de poda. El LLM propone mutaciones a los planes de contacto basándose en descripciones de tareas y retroalimentación de viabilidad, mientras que el optimizador de trayectorias valida si el movimiento propuesto es físicamente realizable. Este proceso de circuito cerrado permite el descubrimiento rápido de comportamientos novedosos y dinámicamente viables en diversas tareas de largo horizonte.

Despliegue en el mundo real

Los investigadores fueron más allá de la simulación al entrenar políticas de seguimiento por aprendizaje por refuerzo sobre las trayectorias descubiertas y transferirlas con éxito a un robot humanoide real. Esto representa el primer despliegue de habilidades de loco-manipulación humanoide de largo horizonte descubiertas completamente mediante búsqueda evolutiva automatizada, un hito significativo hacia robots que pueden aprender habilidades físicas de forma independiente.

El marco fue desarrollado en el ATARI Lab de TUM, dirigido por el Prof. Majid Khadiv, con la co-supervisión de la Prof. Cordelia Schmid y la colaboración de la Prof. Angela Dai (TUM) y el Prof. Aaron M. Johnson (CMU).

Language: Spanish- Showing content in Spanish