PhysVLA:視覚-言語-行動モデルに物理認識をもたらす
2026年6月11日にarXivで発表された論文がPhysVLAを紹介。再トレーニング不要でVLAモデルに物理認識を追加する推論時フレームワーク。
物理的ギャップ
VLAモデルは物理原理を明示的に適用せず、深刻なギャップが存在。
仕組み
二層補正メカニズム:
- フェーズ認識有限状態マシン
- 選択的オイラー=ラグランジュゲート
オーバーヘッドは1ms未満。
結果
- 成功率:絶対値+17%(全タスクで後退なし)
- 安定性:+19%
- 実ロボット:+50%


