Le 12 juin 2026, lors de la 8e Conférence BAAI à Pékin, le directeur de BAAI (Académie d'Intelligence Artificielle de Pékin), Wang Zhongyuan, a dévoilé Physis-v0.1, le premier modèle de base mondial général.
Contrairement aux grands modèles de langage ou multimodaux traditionnels qui se contentent de mettre à l'échelle les paramètres, Physis-v0.1 est un cadre unifié intégrant la perception, la simulation et le contrôle. Il établit des correspondances continues entre l'espace physique et les atomes d'action, prédisant le prochain état physique à partir d'entrées multimodales incluant vidéo, RGB-D, nuages de points 3D et retour force-tactile.
Le modèle possède quatre capacités principales : la justesse physique (garantissant que les prédictions respectent les lois physiques), la traçabilité causale (liant les actions à leurs conséquences), la cohérence à long terme (maintien de la cohérence sur des séquences étendues) et la généralisation universelle (adaptation à divers scénarios).
Physis-v0.1 prend en charge plus de 50 scénarios physiques complexes pour le raisonnement et la généralisation à long terme. Il peut être adapté à la robotique, la génération vidéo, les jeux, la simulation industrielle et d'autres domaines d'application physique réelle, fournissant un support fondamental pour l'intelligence incarnée et les cas d'usage industriels sérieux.
Wang Zhongyuan a souligné que Physis-v0.1 représente un changement de paradigme passant des « modèles de langage qui parlent du monde » aux « modèles du monde qui comprennent et prédisent le monde physique ». Le modèle permet un pipeline de bout en bout « voir — comprendre — agir » réutilisable à travers différentes incarnations et scénarios.
Parallèlement à Physis-v0.1, BAAI a également publié le modèle mondial RoboBrain Orca-v0, qui adopte un paradigme de « prédiction du prochain état » plutôt que la prédiction traditionnelle du prochain jeton/image/action, progressant vers une cognition de type humain avec des représentations d'état physique unifiées.
Cette annonce signale l'ambition croissante de la Chine dans la course aux modèles du monde, positionnant BAAI aux côtés d'acteurs mondiaux comme NVIDIA (Cosmos), Google DeepMind et d'autres qui cherchent à construire la couche d'intelligence fondamentale pour l'IA physique.
