Investigadores del KAIST han desarrollado VOTP (Etiquetado de Preferencia de Transporte Óptimo Basado en Video), un método que permite a los robots aprender criterios de juicio humano con solo 10 videos etiquetados. La investigación fue aceptada en ICML 2026 y seleccionada para presentación Oral—una distinción otorgada a solo 168 artículos de 23.918 envíos (0,7%). VOTP aborda este cuello de botella utilizando matemáticas de transporte óptimo para inferir preferencias para pares de videos sin etiquetar. En experimentos, VOTP con solo 10 etiquetas superó a las políticas entrenadas con recompensas de verdad fundamental.

ResearchJune 12, 2026•Embodied Global Team
El Método VOTP de KAIST Permite a los Robots Aprender el Juicio Humano con Solo 10 Videos
El método VOTP de KAIST logra aceptación Oral en ICML 2026 al permitir que los robots aprendan juicio humano de solo 10 videos usando matemáticas de transporte óptimo.
#kaist#votp#icml-2026#preference-learning#reinforcement-learning#embodied-ai
Reading in Spanish
Language: Spanish- Showing content in Spanish
Trending Now
Industry
LG CNS and LX Pantos Partner to Build Next-Generation Unmanned Warehouse with Humanoid Robots
Jun 11, 2026 · 0 views

Research
X Square Robot Open-Sources XRZero-G0 Framework for Scalable Robot Learning
Jun 10, 2026 · 0 views
Research
Human Archive Raises $8.2M to Train Robots Using India's Gig Economy Workers
Jun 7, 2026 · 0 views
Industry
The Economist Highlights Ningbo as the Unlikely Heart of Global Humanoid Robot Component Supply Chain
Jun 7, 2026 · 0 views
More in Research
Research
GenHOI: Zero-Shot Humanoid-Object Interaction by Imitating Generated Videos
Jun 13, 2026
Research
MIT Ultrasound Wristband Tracks Every Finger Movement, Controls Robot Hand in Real Time
Jun 13, 2026
Research
Generalist AI Unveils GEN-0: Embodied Foundation Model That Scales with Physical Interaction
Jun 13, 2026