具身推論のオープンソースブレークスルー
浙江大学コンピュータ科学部、中国科学院ソフトウェア研究所、アリババグループDAMOアカデミーの共同研究チームが、対話型物理タスクにo1スタイルの深い思考をもたらす完全オープンソースのマルチモーダル具身推論モデルEmbodied-Reasonerを公開。
業界大手を凌駕
AI2-THORシミュレーターでの809テストケースの評価において、Embodied-Reasoner(7B)は以下を達成:
- 80.96%のタスク成功率(OpenAI o1 71.73%、o3-mini 56.55%を上回る)
- 55.07%の探索効率(全テストモデル中最高)
- 86.30%のタスク完全性
- 54.29%の複合マルチステップタスク成功率
三段階トレーニングパイプライン
- 9,300の合成軌跡での模倣学習
- 拒否サンプリングによる自己探索
- リフレクションチューニングによる自己修正
実世界での検証
キッチン、バスルーム、寝室での実世界物体探索タスクで一貫した空間推論を実証。
オープンな提供
2Bおよび7Bパラメータバージョンで利用可能。
論文: arXiv:2503.21696 | コード: https://github.com/zwq2018/embodied_reasoner




