Un equipo de investigación con sede en China ha lanzado Embodied-R1.5, un Modelo Fundamental Corpóreo (EFM) unificado que integra capacidades integrales de razonamiento corpóreo en una sola arquitectura, logrando resultados de vanguardia en la mayoría de los principales benchmarks de IA corpórea.
El artículo, titulado "Embodied-R1.5: Evolving Physical Intelligence via Embodied Foundation Models", fue publicado en arXiv el 9 de junio (arXiv:2606.11324). Liderado por el primer autor Yifu Yuan, estudiante de doctorado en el Laboratorio de Aprendizaje por Refuerzo Profundo de la Universidad de Tianjin, el trabajo representa un avance significativo en la investigación abierta de IA corpórea.
Innovaciones Técnicas Clave
Embodied-R1.5 introduce tres pipelines automatizados de construcción de datos que generaron un conjunto de datos de entrenamiento de más de 15 mil millones de tokens, expandiendo significativamente la cobertura de datos para capacidades corpóreas críticas.
Una característica destacada es el marco de circuito cerrado Planificador-Verificador-Corrector (PGC), que permite que un solo modelo ejecute y se autocorrija de forma autónoma en tareas de largo horizonte sin intervención humana.
Rendimiento en Benchmarks
Con solo 8 mil millones de parámetros, Embodied-R1.5 alcanza SOTA en 16 de 24 benchmarks de VLM corpóreo, superando modelos propietarios líderes como Gemini-Robotics-ER-1.5 de Google DeepMind y GPT-5.4 de OpenAI.
Publicación Completa de Código Abierto
En un cambio notable respecto a la investigación típica de IA corpórea de código cerrado, el equipo ha publicado los pesos del modelo, conjuntos de datos, código de entrenamiento y EmbodiedEvalKit en Hugging Face y GitHub.
