EG
DexBenchベンチマークフレームワークを中心としたRLWRLDとNvidiaの協力発表
ResearchJune 9, 2026Embodied Global Team

RLWRLDとNvidia、人型ロボット之国之手标准化に向けたDexBenchを開始

フィジカルAI企業RLWRLDはNvidiaと協力し、ヒューマノイドロボットの器用さパフォーマンスを評価する普遍的ベンチマークであるDexBenchを開始しました。このイニシアチブは、器用な操作能力を測定・比較するための標準化された指標の欠如に対処することを目的としています。

Reading in JA

RLWRLDとNvidia、ヒューマン・デクステリティの標準化に向けて協力

フィジカルAI企業RLWRLDはNvidiaと協力し、DexBench(器用さパフォーマンスを評価する普遍的ベンチマーク)、器用な操作トレーニングのデータ標準、Nvidia Isaac LabおよびIsaac Lab-Arenaオープンフレームワークへの深い統合という3つの柱に焦点を当てた、次世代産業標準を開発するためのイニシアチブを開始しました。

器用さの課題

精密組立、選別、包装などの微細なタスクを実行できるヒューマノイドロボットの器用な操作は、ヒューマノイドAI開発における決定的なフロンティアとして浮上しています。しかし、業界は依然として、ヒューマノイドの器用さパフォーマンスを客観的に測定・比較するための共通フレームワークと、スケールで器用な操作モデルをトレーニングするための共有データ標準の両方を欠いています。

DexBench:二重検証フレームワーク

RLWRLDのDexBenchベンチマークはNvidiaのIsaac Lab-Arena環境に統合され、シミュレーションと現実環境の両方で器用さパフォーマンスを検証するシステムを確立します。

DexBenchは18の主要アトミックタスクにまたがる5つのコア評価ドメインを定義します:

  • グラスピング多様性:成功したグラスの多様性を測定
  • 空間精度:位置精度を評価
  • 時間精度:時間的一貫性を評価
  • 接触精度:力と接触品質を測定
  • 文脈認識:環境適応性をテスト

RLDX-1基盤モデルのパフォーマンス

RLDX-1(RLWRLDのヒューマノイド器用操作のための基盤モデル)は、RoboCasa Kitchen、RoboCasa GR-1 Tabletop、LIBERO-Plusを含む8つの確立されたシミュレーションベンチマークで最先端のパフォーマンスを示し、Nvidia GR00T N1.6やPhysical Intelligence π0.5などのフロンティアモデルを上回りました。