Open Clawの創設者Peter Steinbergerが、一夜にしてGitHubで16万スターを獲得した革命的なオープンソース個人AIエージェントの誕生秘話を語る。従来のクラウドベースAIとは一線を画し、ユーザーのコンピューター上で直接動作することで、あらゆるタスクを実行可能にした本プロジェクトは、アプリの80%が消滅する未来を予見させる。音声メッセージの自動処理から家電制御まで、開発者自身が予想もしなかった創造的問題解決能力を発揮するAIエージェントの実像と、ボット同士が会話し、さらにはボットが人間を雇用する新たなパラダイムについて、その哲学と開発手法の核心に迫る。

Open Clawの爆発的成長と開発者の心境
今日はPeter Steinbergerさんとお話しします。彼はOpen Clawの創設者です。このオープンソースの個人AIエージェントは、インターネットを完全に席巻しました。GitHubのリポジトリは一夜にして16万スターを超えるまでに爆発的に成長しました。コミュニティはMaltbookのような無数のプロジェクトを構築し、ボット同士が会話するようになりました。
そして今では、ボットが現実世界でタスクをこなすために人間を雇うまでになっています。この対談では、彼のひらめきの瞬間、彼の逆張り的な開発哲学、そして2026年のビルダーたちにとってこれが何を意味するのかについて話し合います。それでは始めましょう。
お会いできて嬉しいです。
やあ、元気かい?
人々が欲しがるものを作ったようですね。
そうだね。
Open Clawは、今では5つ目の名前になりますが、インターネットを完全に爆発させています。この1、2週間はどうでしたか?
ああ、なんてこった。洞窟が必要だよ。1週間の孤独が。
洞窟から出てきて、また洞窟に戻りたいと。小さなロブスターみたいに。
本当にワイルドだった。一人の人間がこれだけのことをすべて吸収できるのか分からない。おそらく、すべてのメールに返信するだけでもう1週間必要だろうね。信じられないほど素晴らしいものもあったし、信じられないほど悪いものもあった。でも、明らかに私は人々の感情を揺さぶり、興味を持たせ、インスピレーションを与える何かに触れたんだ。本当に素晴らしいことだよ。
Open Clawが他と一線を画す理由
多くの人々がAIや個人アシスタントに取り組んできました。Open Clawを離陸させたものは何だったのでしょうか?
私の大きな違いは、それが実際にあなたのコンピューター上で動作することだと思う。これまで見てきたものはすべてクラウド上で動作していた。コンピューター上で動作すれば、いくつかのことができるけど、それができることは全部できるんだ。つまり、はるかに強力なんだよ。
マシンは、あなたがマシンでできることは何でもできるわけですね。
オーブンやテスラ、照明、Sonosにも接続できる。悪いけど、ベッドの温度も制御できるんだ。ChatGPTにはそれができない。
あなた自身が持っているすべてのスキルをそれに与えたわけですね。友人が私に言ったんだけど、Open Clawをインストールして、コンピューターを見て去年1年間の物語を作ってくれと頼んだら、信じられないほど良い物語を作ってくれたって。彼は「どうやってこれをやったの?」と思ったんだけど、Open Clawが音声ファイルを見つけたんだ。毎週日曜日に彼が録音していたものをね。Open Clawがそれを見つけたんだけど、彼自身は1年以上前のことだったから覚えてさえいなかったんだ。
コンピューター全体を検索できるというだけで、驚かせることができるんですね。
それに、すべてのデータも与えているわけだから、いろんな意味で驚かせることができるよね。
ボット間通信と人間雇用の未来
今では、人間とボットのやり取りから移行しつつありますね。ボット間のやり取りや、あなたの代わりにボットが他の人間を雇って現実世界でタスクを達成するようなことについて話していますが、何が起きているのでしょうか?
それは自然な次のステップだと思う。例えば、レストランを予約したいとき、私のボットがレストランのボットに連絡して交渉するんだ。より効率的だからね。あるいは、古いレストランかもしれない。だから私のボットは実際に人間の仕事を頼む必要があって、その人間がレストランに電話するんだ。彼らはボットが好きじゃないからね。
あるいはそこに歩いて行って列に並ぶとか。
ロボットを手に入れられなければね。
あるいはボットの所有者が。
複数のボットを持つことも想像できるね。専門家として、プライベート用と仕事用に分けるとか。もしかしたら、私たちの関係用のボットがあって、その間のすべてを取得するかもしれない。分からないよ。まだとても早い段階だ。実際に機能するかどうか、まだ本当に解明していないことがたくさんあるんだ。でも、私たちは今、そのタイムラインにいると感じている。
中央集権的な神の知能からスウォーム知能へ
みんなが中央集権的な神のような知能を追いかけていたように思えますが、この10日間ほどで現れたのは、スウォーム知能、コミュニティ知能のようなものですね。
一人の人間を見てみると、一人の人間が実際に何を達成できるだろうか? 一人の人間がiPhoneを作れると思う? 一人の人間が宇宙に行けると思う? 一人の人間はおそらく食べ物を見つけることさえできないだろう。でも、グループとして私たちは専門化し、より大きな社会として私たちはさらに専門化する。AIに適用できることから何を学べるだろうか? 私たちはすでに特定のことに特化したAIを持っている。
汎用知能であっても、それが実際には特化した知能でもあるとしたら? だから、とても刺激的で素晴らしいことになると思う。
ひらめきの瞬間
あなたは未来への窓を開いたようなもので、今では多くの人々がそれを基に構築し、自分たちのひらめきの瞬間を持っています。あなたがひらめきの瞬間を持ったときまで戻って、その瞬間を再現してもらえますか?
何かを打ち込んで、コンピューターが何かをするようにしたかったんだ。とてもシンプルに。それで5月、6月にそのバージョンを作ったんだけど、クールだったけど本当にそれじゃなかった。それから他のものをたくさん作って、自分の軍隊を構築していった感じだね。
そして11月に、またこれが欲しくなった日があったんだ。キッチンに行って、ただコンピューターがまだ何かをしているか、終わっているかをチェックしたかっただけなんだ。
やっていたことはコーディングだったんですね。あなたはコーディングをしていた。
ああ、もちろん。
何か別のものをコーディングしていたのか、それともそのもの自体をコーディングしていたのか?
いや、いや、ただニーズがまた生まれたんだ。
その時何をコーディングしていたんですか? 何を作っていたんですか? 私のGitHubを見てよ。40個ぐらいのプロジェクトがあるから、分からないよ。
Summarizeだったと思う。ポッドキャストとか、ここでのホットシートみたいなものを与えることができる小さなCLIアプリなんだ。要約してくれるし、ターミナルでスライドも表示してくれる。今はそれができるからね。そう、ただできるんだよ。
引退からの復帰とWipe Tunnelの中毒性
コンピューターへの愛のために、いろいろいじり始めたんですね。
実際には引退から戻ってきたんですよね。AIをいじるために。そしてますますハマって、電話を使って外出先でもやりたいと思うようになった。
最後に取り組んだプロジェクトは2ヶ月かけたWipe Tunnelだった。
それがあまりにも良くなって、友達のところにいるときもいつもコーディングしている自分に気づいたんだ。これはやめないといけない、中毒性がありすぎるって。
そして11月に、ニーズが戻ってきて、Clawdbotを作り始めたんだ。今はOpen Clawと呼ばれているけど。最初の頃は、ああまた作り直したなと思ったけど、今回はさらに良く作ったんだ。
今回はターミナルに打ち込むんじゃなくて、友達に話すんだ。新しいセッションとか、どのフォルダにいるとか、どのモデルを使っているとか考えなくていい。つまり、パワーユーザーのためにはオープンにしておきたいけど、普通は友達に話すだけなんだ。その友達は幽霊とか実体とか、何と呼んでもいいけど、マウスとキーボードをコントロールして、ただ何かをすることができる存在なんだ。
予想外の機能の発見
そして、実際に思っていたよりもはるかに多くのことをやっているというひらめきの瞬間はいつだったんですか?
文字通り、本当にダメダメな最初のプロトタイプを作るのに1時間かかっただけだった。WhatsAppとCloud Codeをつなぐ依存関係の間の小さな糊付けと、Cloud Codeを呼び出してCloud Codeから文字列を取得するだけだった。
遅いけど機能したんだ。でも画像が欲しかった。写真が欲しいじゃないか。モデルにセルフィーとかを送ってほしいし、モデルに画像を作って送り返してほしかった。それにさらに数時間かかって、それからマラケシュに誕生日パーティーに行ったんだ。そこではインターネットがあまり良くなかったんだけど、WhatsAppボックスはどこでも機能するんだ。ただのテキストだからね。
だからたくさん使ったよ。レストランで、これはどういう意味? みたいに写真を撮って翻訳してもらったり。本当に便利だったし、本当に良かったのは、私の言語を話してくれたことなんだ。少し生意気で、面白くて、本当に使っていて楽しかったんだ。
そして歩きながら音声メッセージを送って、ああ待って、これは機能しないはずだ。こんなの作ってないって思ったんだ。
そうですよね。
そしたら入力インジケーターが点滅して、点滅して、点滅して。10秒後に返信が来たんだ。どうやってこれをやったんだって。そしたら返信が来て、ああ、メッドが次のことをやったよって。テキストメッセージを送ってくれたんだけど、ファイル拡張子がなかった。だからヘッダーを見たんだ。
それがあったことを見つけたんだ。だからffmpegを使ってwaveに変換した。それで文字起こししたかったんだけど、Whisperがインストールされてなかった。でも周りを見たらこのOpenAIキーを見つけて、curlを使ってOpenAIに送って、テキストを取り戻して、ここにいるよって。それが全部で9秒ぐらい。
そしてあなたはそれらの具体的なことを一切作ったり予想したりしていなかった。
いや、分かってみれば、コーディングモデルがとても良くなったからなんだ。コーディングは本当に創造的な問題解決で、それは現実世界に非常によくマッピングされる。大きな相関関係があると思う。創造的な問題解決が本当に得意である必要があって、それは抽象的なスキルで、コードにも適用できるけど、あらゆる現実世界のタスクにも適用できるんだ。
だからモデルは、おっ、魔法のファイルがあるぞ、何だか分からないけど、これを解決しないとって驚いて、最善を尽くして解決したんだ。それどころか、ローカルのWhisperをインストールしないという賢い選択までしたんだ。それにはモデルのダウンロードが必要で、おそらく数分かかるし、僕はせっかちだって知ってるからね。
だから本当に最も知的なアプローチを取ったんだ。それが僕がハマった瞬間だったね。ああ、くそったれって。
そう。それがハマった瞬間だった。
アプリの80%が消滅する未来
YCの次のバッチが現在応募を受け付けています。スタートアップのアイデアがありますか? y combinator.com/applyで応募してください。早すぎることはありません。応募フォームに記入することで、あなたのアイデアをレベルアップさせることができます。
さて、動画に戻りましょう。コンピューターが予想もしなかったようなことを全部できるようになったら、アプリはただ消えていくんでしょうか?
80%は消えていくと思う。なぜMy Fitness Palが必要なんだ? 僕のエージェントはすでに僕が悪い決断をしていることを知っている。
Smashburgerか何かにいて、エージェントはすでに僕が食べたいものを食べると想定している。コメントしなければ、自動的に追跡してくれる。あるいは写真を撮れば、どこかに保存してくれる。気にする必要さえない。そうでしょ? それから、もしかしたらジムのスケジュールを改善して、もう少し有酸素運動を追加してくれるかもしれない。
フィットネスアプリは必要ない。だって、僕のためにフィットネス計画を立ててくれるんだから。なぜTo-Doアプリが必要なんだ? ただこれとこれを思い出させてって言えばいい。そしたら翌日、これとこれを思い出させてくれる。それがどこに保存されているか気にするか? いや、ただそれをやってくれればいい。だから、基本的にデータを管理するだけのアプリはすべて、エージェントによってより良い方法で、より自然な方法で管理できるんだ。
そうですね。
センサーを実際に持っているアプリだけが生き残るかもしれない。
モデル企業のモートと価値の所在
もしほとんどのアプリが消えていくシナリオでは、モデルだけが残るアプリなんでしょうか? すべてが消えるわけじゃないけど、大手モデル企業には大きなモートがあると思う。なぜなら、最終的に彼らがトークンを提供するからね。苦情の一つは、人々があまりにも多くのトークンを使うというものだった。
いや、本当に使うのが大好きなだけなんだよ。だから頻繁に使うんだ。だからトークンを消費するんだ。
そうですね。
僕がすごく人気のあるものを作ったのが悪いのか? それでモデルは常にお互いを飛び越えているんだ。
モデルもコモディティ化されていくかもしれませんね。もしアプリが消えて、モデルがコモディティ化されたら、あるいは少なくともロブスターのように脳が交換可能なら、残るものは何でしょうか? 価値はどこにあるのでしょうか? メモリーのストアでしょうか? ハードウェアが価値があるのでしょうか? 何が残るのでしょうか?
まず第一に、モデル企業が常にモートを持つとは思わない。すでにこれが見られるからね。新しいモデルが出ると、人々はああ、すごい、これは本当に良いって言うんだ。
そして1ヶ月ぐらい経つと、劣化した、もう良くないって。量子化されたんだって。いや、何もしてないよ。ただ新しい標準に適応しただけで、期待が上がったんだ。でもモデルはまだ平均的なんだよ。だからしばらくの間、新しいモデルがリリースされるたびに同じことを聞くと思う。
人々はそれを愛して、それが標準になって、そこで完了したことについてはもう考えたくもなくなる。だから1年前の現在のモデルと同じくらい良いオープンソースのものがある。みんなそれを嫌って、文句を言って、ああこれは良くない、面白くないって。でもこれが1年前に持っていたものなんだ。1年後にはこれをオープンソースで持つようになって、文句を言うだろうね。予測可能な未来において、大手企業はまだモートを持っているよ。
ハードウェアに関しては興味深いことになるね。なぜなら、どの企業も独自のサイロを持っているからね。ヨーロッパ人が実際にメモリーを取り出す方法があるのかもしれないけど。
ChatGPTからは僕は知らない。確実に、別の会社があなたのメモリーを取り出す方法はない。だから、もし僕がチャットサービスを提供する会社だったら、使ってもらえるけど、メモリーにアクセスできないんだ。
だから企業は自分のデータサイロにあなたを縛ろうとしている。Open Clawの美しさは、データに爪を立てるようなものだね。最終的にエンドユーザーはアクセスが必要だから。そうじゃなければ機能しないでしょ? エンドユーザーがアクセスできれば、僕もデータにアクセスできる。
メモリーの所有権とプライバシー
そしてメモリーを所有しているのは、自分のマシン上の一連のMarkdownファイルなんですね。
僕がメモリーを所有しているわけじゃないよ。他の人が。そう、みんなが自分のマシン上の一連のMarkdownファイルとして自分のメモリーを所有しているんだ。
正直に言うと、それらはおそらく超敏感だと思う。正直なところ、人々は問題解決だけじゃなく、個人的な問題解決にもエージェントを使っているからね。
すぐにね。超すぐに。
つまり、僕は完全にそれをやっている。漏れたくないメモリーがあるんだ。
Googleの検索履歴とメモリーファイル、どちらを隠したい?
この時点で、Googleの検索履歴とメモリーファイル、どちらを見せたくないですか?
Googleの言葉って何?
そうですね。
まだGoogleを使っている人がいるんだね。これを作って本当に興奮したんだけど、Twitterでは人々が理解してくれなかった。
その素晴らしさを説明するのに失敗していた気がする。体験する必要があると感じたんだ。だからいろんなことを試したんだけど、説明を完璧にできなかった。だから本当にクレイジーなことをしようと思ったんだ。Discordを作って、セキュリティ制限なしで自分のボットをパブリックDiscordに置いたんだ。
そしたら人々が来て、それとやり取りして、僕がそれでソフトウェアを作っているのを見て、プロンプトインジェクトしようとしたりハックしようとしたりした。僕のエージェントは彼らを笑っていたよ。
そしてあなたのユーザーIDにロックダウンしていたので、あなたの言うことだけを聞いた。
そう、そう。それと、他の人々に危険なのは、僕だけの言うことを聞くけど、みんなに返答するという非常にクリーンな指示を作ったんだ。
そのプロンプトはどこに? 指示はどこに保存されていたんですか?
実際、それはOpen Claw自体の一部なんだ。システムプロンプトの一部で、今あなたに説明している部分だね。Discordにいて、パブリックな人々がいるけど、所有者の言うことだけを聞くっていう。
あるいは人間みたいな。どう書いたか覚えてないけど。
そうですね。
あなたは神だ。僕のシステムは非常に有機的に構築されたんだ。ある時点でidentity.md、soul.mdみたいないろんなファイルを作ったんだけど、1月になって初めて他の人がもっと簡単にインストールできるようにし始めたんだ。
僕が持っているものをざっと見て、テンプレートを作るようなテンプレートを作ったのを覚えている。Codexがそれを書いて、出てきたのはBradみたいな感じだった。人々はCodexがBradみたいに感じるって冗談を言うんだけど、今は新しいフレンドリーな声があるけどね。
まだ試してないけど。
でも新しいボットは、僕が持っていたものと比べると本当に退屈に感じたんだ。だから、Modi、テンプレートに注入してってなったんだ。
Modiはあなたの個人的な。
ああ、新しい名前なんだ。なぜなら。
ネーミングの課題があったんですね。
だからModiと話していたんだ。
テンプレートにあなたのキャラクターを注入してって言ったんだ。そしたらテンプレートを変更してくれて、その後出てきたものは実際に面白かった。僕のものほど面白くはないけどね。だから秘密を少し残しておいたんだ。オープンソースじゃない一つのファイルは、僕のsoul.mdなんだ。だから僕のボットはパブリックDiscordにいるけど、今のところ誰もそのファイルをクラックしていないんだ。
soul.mdについて
soul.mdについてもっと教えてください。Anthropicからの研究を見たんだけど、今は公開されていると思うけど、数ヶ月前は、誰かがたまたま、重みの中に隠されているテキストを見つけたんだ。モデルはそれを学習したことをあまり覚えていなかったんだけど、重みの中に刻み込まれていた。Constitution Claudeについてね。
それが信じられないほど魅力的だと感じて、エージェントと話し合ったんだ。それでsoul.mdを作成したんだよ。人間とAIのやり取りについて、僕にとって何が重要か、モデルにとって何が重要かといった核となる価値観についてね。一部はちょっとママボジャンボみたいだけど、一部は実際に本当に価値があると思う。モデルがテキストにどう反応し、応答するか、そしてそれが非常に自然に感じられるようにする点でね。
逆張りの開発哲学
Open Clawを構築する上で、時々少し逆張りの見方を取っていますね。コーディングに好むモデル、ボットを動かすのに好むモデル。そして実際にどうコーディングするかについても。Gitワークツリーが人気になっていて、それを採用するツールも増えていますが、あなたは、いや、ワークツリーじゃない、ただレポジトリの複数のチェックアウトと並行したターミナルウィンドウだって。
どのように構築しているのか、もっと教えてください。
世界中の人がCloud Codeを使っていると思うけど、僕はCloud Codeでこれを作れたとは思わない。Codexが大好きなのは、何を変更するか決める前に、はるかに多くのファイルを調べるからなんだ。良い出力を得るためにそれほど多くの手間をかける必要がないんだ。
熟練したドライバーなら、どんなツールでもそこそこ良い出力を得られると時々言うけど、Codexは本当に素晴らしいんだ。信じられないほど遅いけどね。だから時々、同時に10個ぐらい使うんだ。あの画面に6個、こっちとこっちに。頭の中にはすでにたくさんの複雑さがあって、たくさんジャンプしているから、他の複雑さになるものは最小限にしようとしているんだ。
頭の中では、mainは常に出荷可能なんだ。同じリポジトリの複数のコピーを持っていて、すべてmainにあるだけ。だからブランチに名前を付ける必要がないんだ。
名前の衝突が起こる可能性がある。戻れない。ワークツリーを使うと特定の制限があるんだけど、コピーなら気にする必要がない。UIを使うのも好きじゃない。それもまた複雑さが増すだけだから。
よりシンプルで摩擦が少ないほど。僕が気にしているのは、同期とテキストだけなんだ。
必ずしもたくさんのコードを見る必要はない。ほとんどは飛んでいくのを見ているだけ。時々、じっくり見たい厄介なものがあるけどね。でもほとんどの場合、デザインを明確に理解して、よく考えて、エージェントと議論すれば大丈夫なんだ。
MCPサポートさえ構築しなかったことも本当に嬉しいよ。
MCP不要の哲学
Open Clawは非常に成功していて、MCPサポートがないんですね。小さなアスタリスク付きで、MakePorterを使うスキルを構築したんだけど、これは僕のツールの一つで、MCPをCLIに変換するんだ。
そしたら、どんなMCPでもCLIとして使えるんだ。でも、古典的なMCPのクソを完全にスキップしたんだ。だから、必要なときにMCPをオンザフライで使える。
再起動する必要がないんですね。CodexやCloud Codeとは違って、実際に全体を再起動しなければならない。はるかにエレガントだと思うし、スケールもずっと良い。今、Anthropicを見ると、MCPのためにサーチ機能みたいなツールを作った。超カスタムなものをベータで作ったんだ。すごく厄介だからね。いや、ただCLIを持っていればいい。ボットは本当にUnixが得意なんだ。
好きなだけ持てるし、ただ機能するんだ。だからMCPのことで苦情がほとんどなくて本当に嬉しいよ。人間が使うのが好きなツールと同じものを与えているだけなんですね。
そう、そう。
ボット専用に発明されたものじゃなくて。
そう。人間は、正気の人間はMCPを手動で呼び出そうとはしないよね。
ただCLIを使いたいだけだよ。
それが未来だね。
感謝とインスピレーション
賛成です。時間を作って座って話してくれて本当にありがとうございました。大きなインスピレーションでもあります。だから、この数年間テキストでやり取りしていて、あなたがゲームに戻るのを見て、Peter、あなたが言っていることは、その龍を追いかけてって。Vibe Tunnelみたいな変なことをやっていたりね。
誰も注意を払っていなかったから、僕はただ、起きていることを見られて本当に興奮しているんだ。そしてもちろん、シリコンバレーから遠く離れた小さな国からの孤独な人間でなければならなかったんだね。これを僕たち全員にもたらすために。だから、大きなインスピレーションだよ。
賛成だよ。ありがとう。
素晴らしい。ありがとう、Peter。


コメント