EG
AI2-THORシミュレータ環境における推論と相互作用の軌跡を示すEmbodied-Reasonerフレームワーク
ResearchJune 18, 2026Stax

Embodied-Reasoner:浙江大学·中科院·阿里巴巴がOpenAI o1を凌ぐ推論モデルをオープンソース化

浙江大学、中国科学院、阿里巴巴ダモアカデミーの共同チームが、マルチモーダル具身推論モデルEmbodied-Reasonerをオープンソース化。AI2-THORシミュレーターで80.96%のタスク成功率を達成し、OpenAI o1(71.73%)、o3-mini(56.55%)、Claude-3.7(67.70%)を凌駕。高度な視覚探索、空間推論、自己修正能力を備える。

#embodied reasoning#open source#AI2-THOR#deep thinking#Zhejiang University#Alibaba#CAS
Reading in JA

具身推論のオープンソースブレークスルー

浙江大学コンピュータ科学部、中国科学院ソフトウェア研究所、アリババグループDAMOアカデミーの共同研究チームが、対話型物理タスクにo1スタイルの深い思考をもたらす完全オープンソースのマルチモーダル具身推論モデルEmbodied-Reasonerを公開。

業界大手を凌駕

AI2-THORシミュレーターでの809テストケースの評価において、Embodied-Reasoner(7B)は以下を達成:

  • 80.96%のタスク成功率(OpenAI o1 71.73%、o3-mini 56.55%を上回る)
  • 55.07%の探索効率(全テストモデル中最高)
  • 86.30%のタスク完全性
  • 54.29%の複合マルチステップタスク成功率

三段階トレーニングパイプライン

  1. 9,300の合成軌跡での模倣学習
  2. 拒否サンプリングによる自己探索
  3. リフレクションチューニングによる自己修正

実世界での検証

キッチン、バスルーム、寝室での実世界物体探索タスクで一貫した空間推論を実証。

オープンな提供

2Bおよび7Bパラメータバージョンで利用可能。

論文: arXiv:2503.21696 | コード: https://github.com/zwq2018/embodied_reasoner

Language: JA- Showing content in JA