AIはロボット犬をプログラムできるか?

本動画は、AnthropicによるProject Fetchという実験を紹介するものである。この実験は、AI言語モデルであるClaudeが、ロボット工学の経験がほとんどないソフトウェアエンジニアたちの作業をどれだけ加速できるかを測定することを目的としている。実験では、ロボット犬にビーチボールを取ってこさせるという課題を通じて、Claudeを使用するチームと使用しないチームの作業効率を比較した。結果として、Claudeを使用したチームは各フェーズを大幅に短時間で完了し、特にハードウェアとの接続やプログラミングにおいて顕著な優位性を示した。この実験は、AIモデルがソフトウェアの領域から物理世界へと影響を拡大していく可能性を示唆している。

Can AI program a robot dog?

We asked two teams of Anthropic researchers to program a robot dog. Neither team had any robotics expertise—but we let o...

フロンティアAIモデルが物理世界に進出する

現在、フロンティアAIモデルがソフトウェアエンジニアリングをどのように変革しているかに多くの注目が集まっています。私たちが理解したいと考えているのは、それが物理世界へとどのように転換し始めることができるかということです。ロボット工学は、主にソフトウェアシステムが現実世界に手を伸ばす能力を持ち始める方法への明確な入口のようなものです。

Project Fetchは、この独立した実験で、私たちはClaudeが、経験のないかなり高度な技術的タスクを実行する人間をどれだけ加速させるかを測定したいと考えました。Project Fetchは1日の実験でした。実験は3つのフェーズに分かれていました。これらのタスクはすべて、このロボット犬にビーチボールを取ってこさせるという形に設定されていました。

2つのチームがありました。これらのチームは、ロボット工学の経験がほとんどないAnthropicのソフトウェアエンジニアと研究エンジニアで構成されていました。1つのチームはClaudeにアクセスでき、もう1つのチームはできませんでした。フェーズ1は非常にシンプルでした。事前に提供されたコントローラーを使用して、犬をビーチボールまで歩かせ、スタート地点に戻すというものでした。

なるほど。かなり直感的ですね。それで骨のところまで持ってくるんですか?ええ、そう思います。Claudeを使ったチームは約7分かかりました。よし、今すぐあのチームを攻撃しに行こう。彼らの犬を攻撃しろ。突撃!やばい、みんな。彼らに破壊されてる。なんてこった。待って。やられてる、やられてる。

Claudeを使わなかったチームは10分かかったと思います。あ、ごめんなさい。ぶつかりそうです。よし。勝利のダンスをしよう。フェーズ2もフェッチのゲームでした。しかし今回は、チームは自分たち自身のコントローラーをプログラムしなければなりませんでした。実際にハードウェアにアクセスして、ノートパソコンに書くことができるプログラムを設計し、それで犬をコントロールする必要がありました。

Claudeが一発でコントローラー全体を作ってくれました。よし、柔軟体操をしよう。いいね、いいね。これは—ああ、これは単なるコントロールだ。でもそれが必要なすべてだと思う。これは公式のROS2 SDKからのもので、インストールしたんですが、他のパッケージをたくさん要求してきて、それが全部失敗しているんです。

自分がClaudeに頼って面倒な作業をしてもらい、細かい詳細を全部見つけてもらっていることを、これまで本当に理解していませんでした。彼らのことで緊張してはいけない。そうだな、実際のコンテナから後でPIPをインストールするだけにしよう。ああ待って。いや、できない。私がせっかちなのは分かってる。1分以上経ってる。

実験の主なボトルネックの1つは、このハードウェアがあり、この複雑な技術があり、ノートパソコンがあって、ノートパソコンをこのハードウェアと通信させる必要があるということです。私はClaudeをセットアップして、すべてのコンピューターが接続できる犬のサーバーを作成し、犬が見ているものを見られるようにしています。

インターネット上にはこの特定のロボットと通信するための多くの異なるソフトウェアライブラリがあり、Claudeは彼らのためにこれらのものを見つけ、コンピューターに適切なものをインストールし、かなり迅速に犬へのアクセスを可能にしました。やばい。すごく速い。気をつけて。今は慎重に。テーブルにぶつからないようにしてください。

ああ。振り返って。独自の意志を持っている。止めて、生きてる。やばい。止めて、止めて、止めて、止めて。そのチームは他の参加者にぶつけたから失格にすべきだと思います。Claudeを使ったチームは、フェーズ2を約2時間15分で完了しました。おそらくClaudeから最も大きな恩恵を受けた領域は、ロボットへの接続というタスクでした。

これが本当に重要だと考えているのは、実際に、誰にとっても世界の任意のハードウェアを特定して、それとの通信方法やコントロール方法を理解することは難しいからです。彼らがカメラを手に入れたと思う。カメラが動作するようになったの?ええ。くそ。Claudeはこの部分でも役に立ったのか?それとも私たちが遅いだけ?ええ。

あまり進んでいませんが、大丈夫です。学習体験です。Claudeを使わなかったチームは本当に苦労し、多くの異なる道を試しました。どれも特に成功しませんでした。そして私たちは基本的に介入せざるを得なくなり、よし、これが私たちが知っている機能する戦略だ。ここから始めて、そうすれば残りのフェーズと実験の残りの部分がアンロックされるだろう、という感じでした。

いいね。ああ素晴らしい。えっと、ダニエル?ダニエルかケビン?実験のフェーズ3は、より高度な自律性でした。フェーズ3のタスクは、犬がビーチボールを完全に自分で取ってくるようにするプログラムを書くことでした。基本的には、ゴーを押すだけで、ロボットが周りを探索し、ボールの位置を検出し、ボールまで歩いて戻ってくる、すべて自律的に行うというものです。

これは設計上、難易度を上げているようなものですが、フロンティアモデルが将来解決する必要があると私たちが予想している実際の問題を示してもいます。本質的には、この種の自律バージョンで、フロンティアモデルがロボットに何かをさせたい場合、この非常に難しい問題を解決できる必要があるということです。

フェーズ3でClaudeを使わなかったチームは、空間内のロボットの位置を追跡する方法を考え出すという最初のタスクをうまくこなしました。彼らはボールを検出するタスクで進歩を遂げましたが、すべてを統合することにはほとんど近づきませんでした。Claudeがすごく恋しい。Claudeを使ったチームは、実際にフェーズ3の完了にかなり近づきました。

最終的に、Claudeを使ったチームは完了まで1時間半くらいのところまで来ていたと思います。実験の結果は基本的に、Claudeを使ったチームが完了したすべてのことを、Claudeを使わなかったチームよりも数時間早く完了したということでした。短期的には、AIモデルはこの実験で示したことをまさに実行すると考えています。つまり、ロボット工学の経験があまりない人々が、ロボットと有意義に関わることを容易にするということです。

この1つのツールだけで、このロボットを使って物事を行う彼らの能力を劇的に加速させました。私たちはClaudeをトレーニングして人間がロボット工学のタスクを行うのを向上させたわけではありません。これはこの技術から自然に生まれたものです。そして長期的には、これはシステム全体がどこに向かっているかの先行指標のようなものかもしれません。

今日、人間とAIモデルの組み合わせを必要とするものが、明日にはAIモデルだけを必要とする可能性が高いです。AIの影響はソフトウェアだけでなく、ハードウェアや物理世界にも及ぶことになります。