EG
深度マッピングと物体認識の可視化で3Dシーンを分析するコンピュータビジョンAI
ResearchJune 14, 2026Embodied Global Team

CVPR 2026最優秀論文が示す具現化AIの台頭:D4RT、NitroGen、SAM 3Dが先導

CVPR 2026は、受動的知覚から能動的理解と行動へのパラダイムシフトを示す研究に最高栄誉を授与した。D4RT(Google DeepMind/UCL/オックスフォード)、NitroGen(NVIDIA/スタンフォード)、SAM 3D(Meta)は、コンピュータビジョンにおける具現化AIの支配力の高まりを示している。

#CVPR 2026#computer vision#embodied AI#D4RT#NitroGen#SAM 3D#research
Reading in JA

2026年6月3日から7日までコロラド州デンバーで開催されたCVPR 2026は、16,092件の投稿から4,089件の論文が採択され(採択率25.3%)、新記録を樹立した。受賞論文の中でも、具現化AIが支配的なテーマとして浮上した。

最優秀論文:D4RT(Google DeepMind / UCL / オックスフォード大学) D4RTは統合トランスフォーマーアーキテクチャを導入し、ビデオシーケンス全体をグローバルシーン表現に圧縮し、軽量デコーダーを介して任意の時点の任意の点の3D位置を回答する。従来手法と比較して300倍の速度向上を達成し、動的4D再構成と追跡で新たなSOTAに到達した。

優秀論文賞( honorable mention):NitroGen(NVIDIA / スタンフォード大学 / Caltech) NitroGenは1,000以上のゲームにおける40,000時間のプレイ動画で訓練されたビジョン・アクション基盤モデル。ゼロショット汎化を達成し、タスク成功率で最大52%の相対的改善を示した。

優秀論文賞:SAM 3D(Meta Superintelligence Labs) MetaのSegment Anythingシリーズの3D拡張版。単一画像から幾何学、テクスチャ、レイアウトを予測し、人間の嗜好テストで少なくとも5:1の勝利率を達成。高価な深度センサーなしでロボットがリアルタイムの3D人物姿勢推定を可能にする。

最優秀学生論文:CLAY(清華大学 / マイクロソフトリサーチ) CLAYはO-Voxelを導入し、前例のない品質の3Dアセットを生成。具現化AI研究のためのシミュレーション環境を迅速に構築する。

CVPR 2026の結果は、コンピュータビジョンが「見る」から「理解し行動する」という新たな時代に入ったことを確認し、具現化AIがこの変革の中心にあることを示している。