LoongForge de Baidu Baige ha logrado un avance en la optimizacion del entrenamiento del modelo VLA GR00T N1.6 de NVIDIA, logrando hasta 2.3x de rendimiento de entrenamiento y acortando el ciclo total de entrenamiento en un 56.6 por ciento.
A medida que los robots humanoides se aceleran hacia la industrializacion, los modelos VLA se han convertido en una via tecnica central para la inteligencia incorporada. La serie GR00T N de NVIDIA utiliza Cosmos-Reason-2B como nucleo de percepcion multimodal e introduce un backbone DiT de 32 capas.
LoongForge aborda los cuellos de botella mediante tuberias IO inteligentes, optimizacion de comunicacion y programacion de operadores, logrando 2.3x de rendimiento y una reduccion del 56.6 por ciento en el tiempo de entrenamiento.

