EG
Ilustración conceptual de la era de los robots con investigadores de KAIST
ResearchJune 12, 2026Embodied Global Team

El Método VOTP de KAIST Permite a los Robots Aprender el Juicio Humano con Solo 10 Videos

El método VOTP de KAIST logra aceptación Oral en ICML 2026 al permitir que los robots aprendan juicio humano de solo 10 videos usando matemáticas de transporte óptimo.

#kaist#votp#icml-2026#preference-learning#reinforcement-learning#embodied-ai
Reading in Spanish

Investigadores del KAIST han desarrollado VOTP (Etiquetado de Preferencia de Transporte Óptimo Basado en Video), un método que permite a los robots aprender criterios de juicio humano con solo 10 videos etiquetados. La investigación fue aceptada en ICML 2026 y seleccionada para presentación Oral—una distinción otorgada a solo 168 artículos de 23.918 envíos (0,7%). VOTP aborda este cuello de botella utilizando matemáticas de transporte óptimo para inferir preferencias para pares de videos sin etiquetar. En experimentos, VOTP con solo 10 etiquetas superó a las políticas entrenadas con recompensas de verdad fundamental.

Language: Spanish- Showing content in Spanish