Los investigadores han presentado OMG (Generación de Movimiento Omni-Modal), un marco integral para el control universal de robots humanoides. El trabajo aborda un desafío fundamental en robótica: permitir un control flexible y adaptativo que pueda aprovechar múltiples tipos de señales de entrada para generar movimiento natural de cuerpo completo.
La arquitectura central refleja la estructura de los sistemas motores biológicos. El módulo cerebral escalable soporta entradas de condición multi-modales, incluyendo comandos de lenguaje natural, señales de audio y movimientos de referencia humanos. El módulo de cerebelo de seguimiento de movimiento reactivo asegura la ejecución precisa de los planes de movimiento generados.
Los investigadores desarrollaron una tubería de curación y anotación de datos cuidadosamente diseñada para obtener datos de entrenamiento de alta calidad. El backbone de generación de movimiento basado en difusión soporta lenguaje, audio y movimiento de referencia humano como entradas condicionales. Los experimentos demuestran que OMG logra rendimiento de vanguardia como controlador de cuerpo completo y full-modal.
