Un documento de posición publicado en arXiv desafía el paradigma dominante en la investigación de inteligencia incorporada. El equipo de Motoniq y colaboradores argumenta que simplemente escalar modelos de Visión-Lenguaje-Acción (VLA) y modelos mundiales no puede lograr inteligencia robótica de propósito general.
El documento identifica cuatro componentes críticos que faltan en los enfoques actuales: Motor de Datos Físicos con Aut etiquetado Incorporado, Reorientación de Preservación de Tareas Entre Encarnaciones, Modelos Mundiales Fundamentados en Física, y Ciclos de Implementación de Auto-mejora.
Según los investigadores, los robots actuales aún dependen en gran medida de datos de entrenamiento pre-organizados, la supervisión de video no puede traducirse directamente a acciones ejecutables por robots, y los modelos mundiales existentes a menudo no preservan variables físicas críticas como contacto, fuerza y respuesta de materiales.
Los autores sugieren que el camino a seguir requiere construir un motor de datos físicos que unifique fuentes de datos heterogéneas en una estructura física subyacente común.
Artículo: https://arxiv.org/abs/2606.06556
