Avance en codigo abierto en razonamiento corporeizado
Un equipo conjunto de investigacion de la Universidad de Zhejiang, el Instituto de Software de la Academia de Ciencias de China (CAS) y DAMO Academy de Alibaba Group ha lanzado Embodied-Reasoner, un modelo de razonamiento corporeizado multimodal completamente open-source.
Superando a los gigantes de la industria
En evaluaciones exhaustivas en 809 casos de prueba en el simulador AI2-THOR, Embodied-Reasoner (7B) logro:
- 80.96% de tasa de exito vs 71.73% (OpenAI o1), 56.55% (o3-mini), 67.70% (Claude-3.7)
- 55.07% de eficiencia de busqueda, la mas alta entre todos los modelos probados
- 86.30% de completitud de tareas
- 54.29% de tasa de exito en tareas compuestas
Pipeline de entrenamiento de tres etapas
- Aprendizaje por imitacion en 9,300 trayectorias sintetizadas
- Autoexploracion mediante muestreo por rechazo
- Autocorreccion mediante ajuste por reflexion
Validacion en el mundo real
El equipo valido Embodied-Reasoner en tareas de busqueda de objetos reales en cocina, bano y dormitorio, demostrando razonamiento espacial consistente.
Disponibilidad abierta
Embodied-Reasoner esta disponible en versiones de 2B y 7B parametros.
Articulo: arXiv:2503.21696 | Codigo: https://github.com/zwq2018/embodied_reasoner




