EG
Una IA de visión artificial analizando una escena 3D con mapeo de profundidad y visualización de reconocimiento de objetos
ResearchJune 14, 2026Embodied Global Team

Los mejores artículos de CVPR 2026 señalan el auge de la IA corpórea: D4RT, NitroGen y SAM 3D lideran el camino

CVPR 2026 otorgó los máximos honores a investigaciones que marcan un cambio de paradigma de la percepción pasiva a la comprensión y acción activas. D4RT (Google DeepMind/UCL/Oxford), NitroGen (NVIDIA/Stanford) y SAM 3D (Meta) muestran el creciente dominio de la IA corpórea en visión artificial.

#CVPR 2026#computer vision#embodied AI#D4RT#NitroGen#SAM 3D#research
Reading in Spanish

La Conferencia sobre Visión Artificial y Reconocimiento de Patrones 2026 (CVPR), celebrada del 3 al 7 de junio en Denver, Colorado, recibió 16,092 envíos con 4,089 artículos aceptados, una tasa de aceptación del 25.3% que estableció nuevos récords. Entre los artículos premiados, la IA corpórea emergió como el tema dominante.

Mejor Artículo: D4RT (Google DeepMind / UCL / Oxford) D4RT introduce una arquitectura unificada de transformador que comprime secuencias completas de video en una representación global de la escena, luego responde la posición 3D de cualquier punto en cualquier momento a través de un decodificador ligero. Logra una mejora de velocidad 300x sobre métodos anteriores, alcanzando nuevo SOTA en reconstrucción y seguimiento 4D dinámico.

Mención de Honor: NitroGen (NVIDIA / Stanford / Caltech) NitroGen es un modelo fundacional visión-acción entrenado en 40,000 horas de videojuegos en más de 1,000 juegos. Logra generalización zero-shot con hasta un 52% de mejora relativa en tasa de éxito sobre modelos entrenados desde cero.

Mención de Honor: SAM 3D (Meta Superintelligence Labs) SAM 3D predice geometría, textura y diseño a partir de una sola imagen, logrando al menos una tasa de victoria 5:1 en pruebas de preferencia humana. Permite a los robots obtener estimación de pose 3D humana en tiempo real desde una sola imagen.

Mejor Artículo Estudiantil: CLAY (Tsinghua / Microsoft Research) CLAY presenta O-Voxel, generando activos 3D con calidad sin precedentes para construir rápidamente entornos de simulación para investigación en IA corpórea.

Los resultados de CVPR 2026 confirman que la visión artificial ha entrado en una nueva era — de "ver" a "entender y actuar" — con la IA corpórea en el centro de esta transformación.