研究者は、構造化されていない現実世界で多様な動的タスクを実行できる統一フレームワークであるVAIC(Vision Guided Agile Interaction Control)を導入しました。
VAICの中核的な革新は、2段階蒸留パラダイムにあります。まず、特権的な教師ポリシーが正確なオブジェクト運動学と正確な環境状態を使用して多様なインタラクションスキルをマスターします。次に、デプロイ可能な学生ポリシーが、全身追跡を複数の軸にわたる速度目標と各フレームのインタラクション指標に置き換えることでこれらの能力を蒸留します。
システムの成功の鍵は、生の深度ストリームと固有受容から観測不可能なオブジェクトのダイナミクスを暗黙的に推測する再帰的なオブジェクト適応モジュールです。
現実世界の評価により、単一のVAICポリシーが箱運び、カートインタラクション、スケボーディングなど非常に多様な動的タスクを首尾よく実行し、ベースラインアプローチを一貫して上回り、自动運転型人型ロボットの展開を前進させることが実証されています。
