2026年6月3日から7日までコロラド州デンバーで開催されたCVPR 2026は、16,092件の投稿から4,089件の論文が採択され(採択率25.3%)、新記録を樹立した。受賞論文の中でも、具現化AIが支配的なテーマとして浮上した。
最優秀論文:D4RT(Google DeepMind / UCL / オックスフォード大学) D4RTは統合トランスフォーマーアーキテクチャを導入し、ビデオシーケンス全体をグローバルシーン表現に圧縮し、軽量デコーダーを介して任意の時点の任意の点の3D位置を回答する。従来手法と比較して300倍の速度向上を達成し、動的4D再構成と追跡で新たなSOTAに到達した。
優秀論文賞( honorable mention):NitroGen(NVIDIA / スタンフォード大学 / Caltech) NitroGenは1,000以上のゲームにおける40,000時間のプレイ動画で訓練されたビジョン・アクション基盤モデル。ゼロショット汎化を達成し、タスク成功率で最大52%の相対的改善を示した。
優秀論文賞:SAM 3D(Meta Superintelligence Labs) MetaのSegment Anythingシリーズの3D拡張版。単一画像から幾何学、テクスチャ、レイアウトを予測し、人間の嗜好テストで少なくとも5:1の勝利率を達成。高価な深度センサーなしでロボットがリアルタイムの3D人物姿勢推定を可能にする。
最優秀学生論文:CLAY(清華大学 / マイクロソフトリサーチ) CLAYはO-Voxelを導入し、前例のない品質の3Dアセットを生成。具現化AI研究のためのシミュレーション環境を迅速に構築する。
CVPR 2026の結果は、コンピュータビジョンが「見る」から「理解し行動する」という新たな時代に入ったことを確認し、具現化AIがこの変革の中心にあることを示している。
