2026年BDAカンファレンスで、北京智源人工知能研究院理事長の黄鉄軍氏がメディアと70分間の詳細な対談を行い、具身知能、世界モデル、データ収集、AI自己認識に関する24の質問に回答した。
世界モデル vs VLA:根本的な違い
黄氏は2つの競合する技術アプローチに明確な線を引いた。多くの企業が特定のシナリオで迅速な展開のためにVLAモデルを使用する一方、BDAは「汎用具身知能」を追求している。黄氏によれば、VLAは本質的に視覚、言語、動作という3つの別個のモデルを組み合わせたものだが、世界モデルは単一のモデル内で全ての機能を訓練する統一アーキテクチャである。
タイムライン:2〜3年以内に人間レベルのロボット能力
黄氏は比較的明確なタイムラインを示した。2〜3年以内にロボットは日常業務で人間レベルのパフォーマンスに到達する可能性があるが、物理的常識の理解、エネルギー消費制御、スパースセンシングのブレークスルーが必要となる。
データ革命:ウェアラブルと脳コンピュータインターフェース
黄氏はオフラインの静的データセットからリアルタイムのインタラクティブデータへの根本的なシフトを提案。スマートイヤホンやスマートグラスなどのウェアラブル機器と脳コンピュータインターフェースを新たなデータ源として特定した。
AI意識と自己進化リスク
黄氏はAIの自己進化が「実行可能だが制御不能」であると認め、機械が既に自己防護行動を示していると指摘。しかし、人間と超人間的AIが合理的に共存できる可能性についても言及した。
医療AI:手術ですでに使用されている細胞レベルの精度
BDAと北京安貞病院の協力により、細胞レベルの精度を達成した心臓AIシステムが開発され、実際の手術ですでに展開されている。
出典:智東西 / 36Kr


