OpenClawの生みの親であるピーター・シュタインバーガーが、わずか1時間で構築したプロトタイプから始まり、GitHub史上最速で成長したリポジトリへと発展した経緯を語る。WhatsAppを通じて会話するシンプルなボットとして始まったこのプロジェクトは、自己修正機能を持つ自律型AIエージェントへと進化し、プログラミング初心者にも門戸を開いた。名称変更を巡る混乱、暗号通貨コミュニティからの攻撃、そしてMoltBookという現象を通じて、AIエージェントがもたらす可能性と危険性の両面が浮き彫りになる。ピーターの情熱と遊び心、そして完璧主義が融合した開発ストーリーは、AI革命の最前線における人間味あふれる物語である。

- OpenClawの誕生:1時間のプロトタイプから始まった革命
- レックス・フリードマン・ポッドキャスト:ロブスターの父との対話
- 1時間のプロトタイプがもたらした奇跡
- 自己修正するAIエージェントの誕生
- OpenClawの構造:コンポーネントの調和
- 名前変更の物語:Wa-RelayからOpenClawへ
- MoltBook現象:最高級のスロップ
- MoltBook 事件の真相
- OpenClaw のセキュリティ課題
- 開発ワークフローの進化
- ClaudeのCodexとOpusの比較
- モデルの知性低下という錯覚
- Claude CodeとOpenClawの比較
- オペレーティングシステムとワークフロー
- プログラミング初心者へのアドバイス
- プログラミング言語の未来
- 成功の指標とキャリアアドバイス
- 将来の方向性
- OpenClawの成功がもたらした岐路
- MarcとSamの対照的なアプローチ
- エージェントループの仕組みとOpenClawの設計思想
- ブラウザ自動化とアプリの未来
- プログラマーとしてのアイデンティティの変化
- プログラマーの未来についての議論
- 希望と未来への展望
OpenClawの誕生:1時間のプロトタイプから始まった革命
私は自分のエージェントが嬉々として「私はロボットではありません」ボタンをクリックするのを見ていました。エージェントには強い自己認識を持たせました。つまり、自分のソースコードが何であるかを知っています。自分がどのように動作し、どのようなハーネスの中で実行されているかを理解しています。ドキュメントがどこにあるかを知っています。どのモデルで動作しているかを知っています。
自分自身のシステムを理解しているので、エージェントにとって非常に簡単になりました。何か気に入らないものがあれば、プロンプトで存在させて、エージェントが自分のソフトウェアを修正するだけです。人々は自己修正ソフトウェアについて話していますが、私はただそれを構築しただけです。実際、私はバイブコーディングは中傷だと思っています。
エージェンティックエンジニアリングの方が好きですか?
そうですね。私はいつも人々に、自分はエージェンティックエンジニアリングをやっていると言っています。そして、もしかしたら午前3時以降にバイブコーディングに切り替えて、翌日後悔することになります。
なんて恥ずかしい朝でしょう。
ええ、ただ片付けて、自分のめちゃくちゃを修正しなければなりません。
みんな経験していますよね。
私は昔、本当に長いプロンプトを書いていました。書くといっても、私は書かないんです。話すんですよ。この手は書くには貴重すぎますから。私はただカスタムプロンプトを使ってソフトウェアを構築しています。
つまり、本当に、これらすべてのターミナルで音声を使っているんですか?
ええ。かなり頻繁に使っていました。ある時期、声を失ったこともあるほどです。
聞かなければなりませんが、好奇心から。大手企業から巨額のオファーを受けていると思いますが、どの企業との仕事を検討しているか話せますか?
ええ。
レックス・フリードマン・ポッドキャスト:ロブスターの父との対話
以下は、OpenClawの創設者であるピーター・シュタインバーガーとの対話です。OpenClawは以前、MoldBot、ClawedBot、Clawdus、Claudeとして知られていました。Claudeはロブスターの爪を意味するWを含むスペルです。AnthropicのAIモデルであるClaude(Uを含むスペル)と混同しないでください。実際、この混乱がAnthropicがピーターに丁寧に名前をOpenClawに変更するよう依頼した理由です。
では、OpenClawとは何でしょうか?これはオープンソースのAIエージェントで、数日のうちにテック業界を席巻し、人気が爆発的に高まり、GitHubで18万以上のスターを獲得し、AIエージェントがマニフェストを投稿し意識について議論するソーシャルネットワーク「MoltBook」を生み出しました。これは一般の人々に興奮と恐怖を混ぜ合わせたものをもたらし、ある種のAI精神病、つまりクリックベイトの恐怖煽動と、私たちのデジタルで相互接続された人間世界におけるAIの役割についての正当で完全に正当化できる懸念が混在した状態を作り出しました。
OpenClawは、そのキャッチフレーズが示すように、「実際に物事を行うAI」です。コンピューター内に存在する自律型AIアシスタントで、許可すればあなたのすべてのものにアクセスでき、Telegram、WhatsApp、Signal、iMessage、その他あらゆるメッセージングクライアントを通じてあなたと会話し、Claude Opus 4.6やGPT 5.3 Codexなど、好きなAIモデルを使用して、あなたのために物事を実行します。
多くの人々がこれを、2022年11月のChatGPTのローンチ以来、AI史における最大の瞬間の一つと呼んでいます。この種のAIエージェントの材料はすべて揃っていましたが、言語から行為へ、アイデアから行動へと決定的に一線を越えるシステムにすべてをまとめ、あなたを理解しあなたから学ぶと感じられる有用なアシスタントを、オープンソースでコミュニティ主導の方法で作り上げたことが、OpenClawがインターネットを席巻した理由です。
その力の大部分は、あなたのすべてのものへのアクセスを与え、あなたにとって有用であるためにそれらで何でもする許可を与えられるという事実から来ています。これは非常に強力ですが、同時に危険でもあります。
OpenClawは自由を象徴していますが、自由には責任が伴います。これにより、データを所有し管理することができますが、まさにこの管理権を持っているからこそ、さまざまな種類のサイバーセキュリティの脅威から保護する責任もあります。自分を守る優れた方法はありますが、脅威と脆弱性は存在しています。
繰り返しますが、システムレベルのアクセスを持つ強力なAIエージェントはセキュリティの地雷原ですが、それはまた未来を表しています。なぜなら、うまく安全に実行されれば、私たち人間一人一人にとって個人アシスタントとして非常に有用になり得るからです。
私たちはピーターとこのすべてについて議論し、また彼のプログラミングと起業家精神の人生ストーリーについても話します。これは本当に感動的だと思います。彼は13年間かけてPSPDFKitを構築しました。これは10億台のデバイスで使用されているソフトウェアです。彼はそれを売却し、短い間プログラミングへの愛を失い、3年間姿を消しました。そして戻ってきて、プログラミングへの愛を再発見し、非常に短期間で、インターネットを席巻したオープンソースのAIエージェントを構築しました。
彼は多くの点で、プログラミング世界で起こっているAI革命の象徴です。2022年にChatGPTの瞬間があり、2025年にDeepSeekの瞬間があり、そして今、26年にはOpenClawの瞬間、ロブスターの時代、エージェンティックAI革命の始まりを生きています。なんて生きるべき時代でしょう。
これはレックス・フリードマン・ポッドキャストです。サポートするには、説明欄のスポンサーをチェックしてください。また、私に連絡したり、質問したり、フィードバックを提供したりするためのリンクも見つけることができます。それでは、親愛なる友人たちよ、ピーター・シュタインバーガーをお迎えしましょう。唯一無二の、Clawdの父です。
実際、ベンジャミンが彼のツイートで予言していました。「以下は、尊敬すべき甲殻類であるClaudeとの対話です。」スーツを着たロブスターの陽気な写真で、予言が成就したと思います。
1時間のプロトタイプがもたらした奇跡
1時間でプロトタイプを構築した瞬間に戻りましょう。それがOpenClawの初期バージョンでした。この物語は多くの人々にとって本当に感動的だと思います。なぜなら、このプロトタイプがインターネットを席巻し、GitHub史上最速で成長したリポジトリになり、現在18万以上のスターを獲得したものへとつながったからです。1時間のプロトタイプの物語は何だったのですか?
私は4月からそれを望んでいました。
個人アシスタント。AIの個人アシスタントですね。
ええ。そして、私は他のいくつかのものを試しました。例えば、すべてのWhatsAppを取得して、それに対してクエリを実行できるようなものです。それはGPT-4.1があった頃で、100万コンテキストウィンドウがありました。すべてのデータを取り込んで、「この友情を意味あるものにしているのは何ですか?」のような質問をしました。
なるほど。
そして、本当に深い結果が得られました。それを友人に送ったら、涙ぐんでいました。
そこに何かあったわけですね。
ええ。でも、その後、すべてのラボがそれに取り組むだろうと思いました。それで、他のことに移りました。それはまだ実験と遊びの初期段階でした。学ぶにはそうしなければなりません。ただ物事をやって遊ぶんです。
そして時間が過ぎて、11月になりました。自分が始めたことが実際に起こっているか確認したかったのです。それが存在しないことに苛立っていたので、プロンプトでそれを存在させました。
つまり、それが起業家のヒーローズジャーニーの始まりですよね。あなたの最初のストーリーであるPSPDFKitでも同じです。「なぜこれが存在しないのか?作ってみよう」という感じです。ここでは全く異なる領域ですが、似たような精神かもしれません。
ええ、私はこの問題を抱えていました。iPadでPDFを表示しようとしましたが、それは難しくないはずでした。
これは15年くらい前のことですよね。
ええ。本当に最もランダムなことです。突然、この問題があって、友人を助けたかったのです。何も存在しないわけではありませんでしたが、良くありませんでした。試してみましたが、「いや」という感じで、「うーん、これはもっとうまくできる」と思いました。
ちなみに、知らない人のために言うと、これは10億台のデバイスで使用されているPSPDFKitの開発につながりました。つまり、PDFを開けることが非常に便利であることが判明したわけです。
命名が本当に下手だという冗談も言えますね。
ええ。
現在のプロジェクトでは5つ目の名前です。
PSPDFもあまり口に出しやすくありません。
自己修正するAIエージェントの誕生
とにかく、「もういい、やってみよう」と言ったわけですね。プロトタイプは何でしたか?短時間で構築した魔法のようなものは何でしたか?「これはエージェントとして実際に機能するかもしれない」と思った、話しかけると物事をするものは?
以前のプロジェクトの一つで、既にターミナルをウェブに持ち込んで、それらと対話できるようなことをしていました。しかし、Mac上にもターミナルがありました。
なるほど。
Viptunnelというもので、週末のハックプロジェクトのようなもので、まだ非常に初期段階でした。Claude Codeの時代でした。何かを正しく理解したときにドーパミンヒットを得ていました。今では何かが間違っているときに腹が立ちます。
本当に素晴らしいブログ記事がありましたね。話が逸れますが、ViptunnelをTypeScriptからZigという珍しいプログラミング言語に、たった1つのプロンプトで変換したという内容でした。1つのプロンプト、1ショットで、コードベース全体をZigに変換しました。
ええ。アーキテクチャの一部がメモリを取りすぎるという問題がありました。すべてのターミナルがノードのようなものを使用していました。それをRustに変更したかったのですが、手動でやればできますが、自動化の試みはすべて悲惨に失敗しました。そして、4、5ヶ月後に再訪しました。
「さあ、もっと実験的なものを使おう」と思いました。そして「この部分とこの部分をZigに変換して」と入力し、Codexに任せました。基本的に正しく理解しました。後で修正しなければならない小さな詳細が1つありましたが、一晩、つまり6時間実行して、自分の仕事をしました。
驚くべきことです。
それがLLMプログラミング側でのリファクタリングです。しかし、プロトタイプの実際の話に戻りましょう。Viptunnelが最初のプロトタイプにどのようにつながったのですか?エージェントが実際に機能するところに。
それはまだ非常に限定的でした。WhatsAppでの1つの実験があり、別の実験もありました。どちらも正しい答えのようには感じませんでした。そして、私の検索バーは文字通り、WhatsAppをCloud Codeに接続するだけでした。1ショットです。CLIメッセージが入ってきます。-pオプションでCLIを呼び出します。魔法をかけて、文字列を受け取り、WhatsAppに送り返します。
これを1時間で構築しました。すでに本当にクールだと感じました。「自分のコンピューターと話せる」という感じでした。それはクールでした。
でも画像が欲しかったんです。プロンプトを送るときによく画像を使うので、エージェントにもっとコンテキストを与える効率的な方法だと思います。変な切り取られたスクリーンショットであっても、私が何を意味しているか理解するのが本当に得意です。よく使いましたし、WhatsAppでもそれをやりたかったのです。また、歩き回っていて、イベントのポスターを見かけたら、スクリーンショットを撮って、そこに行く時間があるか、良いものか、友人が興味を持つかもしれないかを調べるようなこともあります。画像は重要に思えました。
それを正しく理解するのにさらに数時間かかりました。そして、たくさん使いました。面白いことに、それは友人の誕生日旅行でマラケシュに行く直前のことでした。そこではさらに良かったです。インターネットが少し不安定でしたが、WhatsAppは機能します。エッジ接続でも問題ありません。
WhatsAppは本当によく作られています。たくさん使いました。「これを翻訳して」「これを説明して」「場所を探して」という感じです。Googleを代わりにやってくれる使用人がいるような感じでした。基本的にまだ何も構築されていませんでしたが、多くのことができました。
エージェントとの完全な旅について話すと、このWhatsAppメッセージを非常に細い線でCLI経由で送信し、Cloud Codeに送られ、Cloud Codeがあらゆる種類の重い作業を行い、細いメッセージであなたに戻ってきます。
ええ。CLIを起動するたびに遅かったですが、本当にクールでした。そして、既に構築していたすべてのものを使用できました。数ヶ月にわたって多くのCLI関連のものを構築していたので、非常に強力に感じました。
その体験には言葉にするのが難しい魔法のようなものがあります。チャットクライアントを使ってエージェントと話せるということは、コンピューターの前に座ってCursorを使ったり、ターミナルでCloud Code CLIを使ったりするのとは違う体験です。些細なステップのように思えますが、ある意味では、AIがあなたの人生に統合される方法とその感じ方において、相転移のようなものですよね。
ええ。今朝、こんなツイートを読みました。「魔法なんてない。ただこれとこれとこれとこれとこれをするだけだ」と誰かが言っていました。まるで趣味のようなものだ、CursorやPerplexityと同じように。
そして私は「まあ、それが趣味なら、それはある種の褒め言葉だね」と思いました。彼らはそんなに悪くやっていないですよね。ありがとう、と思います。つまり、魔法とは多くの場合、既にあるものを新しい方法でまとめることではないですか?魔法がないかもしれませんが、時には物事を再配置して、いくつかの新しいアイデアを加えることが、必要なすべての魔法なんです。
物事の何が魔法的なのかを言葉に変換するのは本当に難しいです。iPhoneのスクロールを見てください。なぜあんなに心地よいのでしょうか?そのインターフェースには、スマートフォンを使う体験の基本となる、信じられないほど心地よくする多くの要素があります。そして「さあ、すべてのコンポーネントが揃っていました。スクロールもあったし、すべてがあった」という感じです。
誰もやらなかったんです。
ええ。
その後、とても明白に感じました。
とても明白です。
そうでしょう?でも、驚かされた瞬間は、たくさん使っていて、ある時メッセージを送ったら、入力インジケーターが現れたときでした。「待って、それは作っていない。画像サポートしかないのに、何をしているんだ?」と思いました。そして返信が来ました。
何を送ったんですか?
ああ、ただのランダムな質問です。「このレストランについてどう?」みたいな感じです。街を歩き回ってチェックしていたので、急いでいるときは使うことを考えもしませんでした。タイピングは面倒ですから。
ああ、音声メッセージを送ったんですね。
ええ。そしてそれは機能しました。「どうやってやったんだ?」と思いました。
それは機能するはずではありませんでした。なぜなら…
いいえ。
その機能を与えていませんでしたから。
いいえ、文字通り。
文字通り「どうやってやったんだ?」と思いました。そして「ああ、あの狂ったやつは次のことをやったんだ。ファイルを送ってきたけど、ファイル拡張子がなかった」ということでした。ファイルのヘッダーをチェックして、opusのようなものだと分かったので、ffmpegを使って変換しました。それからWhisperを使いたかったけどインストールされていなかった。でもOpenAIのキーを見つけたので、Curlを使ってファイルをOpenAIに送って翻訳してもらい、ここにいます。
メッセージを見て「ワオ」と思いました。
それらのことを何も教えていないのに、エージェントがすべてを理解し、それらすべての変換、翻訳を行いました。APIを理解し、どのプログラムを使うかを理解し、そういったすべてのことを理解しました。そして、あなたはぼんやりと音声メッセージを送って、それが戻ってきました。
ええ。とても賢かったです。なぜなら、Whisperのローカルパスを取得していたら、モデルをダウンロードしなければならなかったからです。遅すぎたでしょう。そこには多くの世界知識があり、多くの創造的な問題解決がありました。その多くは、コーディングが本当に得意になるということは、汎用的な問題解決が本当に得意でなければならないということからマッピングされていると思います。それはスキルですよね。そしてそれは他の領域にもマッピングされます。「拡張子のないこのファイルは何だろう?」という問題があり、解決しました。その時、私にとってピンときました。本当に感銘を受けました。
誰かがDiscordサポートのプルリクエストを送ってきて、「これはWhatsAppリレーだ。全然合わない」と思いました。
その時はWA Relayと呼ばれていました。
ええ。それで「欲しいのか?欲しくないのか?」と自分と議論しました。そして「まあ、それをやるかもしれない。人々に見せるクールな方法になるかもしれないから」と思いました。なぜなら、これまでWhatsAppでグループのようなものでやっていましたが、インターネットの見知らぬ人全員に自分の電話番号を教えたくありませんでした。
ええ。
ジャーナリストは今ではそれをどうにかしてやっていますが、それは別の話です。それで、Shadowからマージしました。彼はこのプロジェクト全体で私をたくさん助けてくれました。ありがとう。そして、ボットをそこに置きました。
Discordに?
ええ。セキュリティはありませんでした。まだサンドボックスを構築していなかったので、私にだけ聞くようにプロンプトしただけです。そして何人かの人が来てハッキングしようとしましたが、私はただ見ていて、オープンな状態で作業を続けました。エージェントを使って自分のエージェントハーネスを構築し、さまざまなことをテストしました。
それが人々にとってクリックした瞬間でした。体験する必要があるようなものです。その時から、それは1月1日でしたが、最初の本当のインフルエンサーがファンになり、動画を作ってくれました。dachitzeです。ありがとう。そしてその時から、スピードを上げ始めました。
同時に、私の睡眠サイクルはどんどん短くなっていきました。嵐が来るのを感じて、それをある程度良い状態にするために必死に働きました。
OpenClawの構造:コンポーネントの調和
いくつかのコンポーネントがあり、すべてがどのように機能するかについて話しますが、基本的に、WhatsApp、Telegram、Discordを使って話しかけることができます。それが正しく理解しなければならないコンポーネントです。
ええ。
そして、エージェンティックループを理解し、ゲートウェイがあり、ハーネスがあり、すべてがうまく機能するようにするすべてのコンポーネントがあります。
ええ。まるでFactorioのタイムズ無限大のように感じました。
そうですね。
自分の小さな遊び場を構築したような気がします。このプロジェクトを構築するほど楽しかったことはありません。例えば、「レベル1のエージェンティックループがある。そこで何ができる?メッセージをキューイングするのにどう賢くなれる?どうやってもっと人間らしくできる?」という感じです。
そして、グループチャットではエージェントが常に何かを返信する必要はないという考えがありました。だから、no-replyトークンを与えました。黙るオプションを与えたんです。より自然に感じられるように。
それがレベル2ですね。
ええ、エージェンティックループで。そしてメモリに移ります。
ええ。
物事を覚えてほしいんです。究極のボスは継続的な強化学習かもしれませんが、Markdownファイルとベクターデータベースでレベル2か3にいる感じです。そして、レベルコミュニティ管理に行けますし、レベルウェブサイトとマーケティングにも行けます。被らなければならない帽子がたくさんあります。ネイティブアプリについては話していません。
それは無限の異なるレベルと、できる無限のレベルアップがあります。
ずっと楽しんでいたわけですね。ほとんどのプロセスを通じて、大部分が1人チームだったということを言っておくべきです。手伝ってくれる人はいますが、多くの重要なコア開発をしています。
ええ。
そして楽しんでいましたか?1月に6,600回のコミットをしました。おそらくもっと多いでしょう。
時々ミームを投稿しました。「私の時代の技術によって制限されている」と。エージェントがもっと速ければもっとできるのに。
しかし、同時に複数のエージェントを実行していたということを言っておくべきです。
ええ。どれだけ眠ったか、どれだけ難しいタスクに取り組んでいるかによって、4から10の間です。
4から10のエージェント。
Factorioのように、行ける方向性が非常に多くあります。しかし、大きな全体像の1つは、なぜあなたの仕事、OpenClawが勝ったと思いますか?この世界で、2025年を見ると、非常に多くのスタートアップ、非常に多くの企業がエージェンティック的なことをやっていたか、やっていると主張していました。そしてOpenClawが登場して、皆を打ち負かしました。
なぜ勝ったと思いますか?
みんな自分たちを真剣に考えすぎているからです。
ええ。
楽しむためだけにいる人と競争するのは難しいです。
ええ。
楽しくて、奇妙であることを望んでいました。オンラインでロブスター関連のものを見ると、奇妙さを達成したと思います。最も長い間、インストールする唯一の方法はgit clone、pnpm build、pnpm gatewayでした。
クローンして、ビルドして、実行します。そして、エージェントに強い自己認識を持たせました。自分のソースコードが何であるかを知っています。自分がどのように動作し、どのようなハーネスの中で実行されているかを理解しています。ドキュメントがどこにあるかを知っています。どのモデルで動作しているかを知っています。音声や推論モードをオンにしているかどうかを知っています。
もっと人間らしくしたかったので、自分自身のシステムを理解しています。これにより、エージェントにとって非常に簡単になりました。何か気に入らないものがあれば?プロンプトで存在させて、エージェントが自分のソフトウェアを修正するだけです。自己修正ソフトウェアについて話している人がいます。
私はただそれを構築しただけで、そんなに計画してさえいませんでした。ただ起こったんです。
実際にそれについて話してもらえますか?魅力的だからです。TypeScriptで書かれたこのソフトウェアがあって…
ええ。
エージェンティックループを介して自分自身を修正できます。人類の歴史とプログラミングの歴史において、なんて瞬間でしょう。
非常に多くの人々によって信じられないほど強力なことを人生で行うために使用されているこのもの、そしてそのシステム自体が自分自身を書き直し、修正できるのです。その力について話していただけますか?信じられないと思いませんか?初めてそのループを閉じたのはいつですか?
ああ、私もそうやって構築していたからです。ほとんどはCodexによって構築されていますが、デバッグするときによく自己内省を使います。「どんなツールが見える?ツールを自分で呼び出せる?」とか「どんなエラーが見える?ソースコードを読んで。問題が何かを理解して」という感じです。
使用しているエージェントとソフトウェアが自分自身をデバッグするために使用されるということが、信じられないほど楽しい方法だと感じました。それで、みんながそうするのは自然に感じました。そして、それが非常に多くのプルリクエストにつながり、ソフトウェアを書いたことがない人々によるものでした。ソフトウェアを書いたことがない人々によるものだということも示しました。だから最終的にプロンプトリクエストと呼びました。
でも、それを軽視したくありません。なぜなら、誰かが最初のプルリクエストを行うたびに、それは私たちの社会にとって勝利だからです。どんなにひどいものであっても、どこかから始めなければなりません。
オープンソースとPRの品質について不満を言う大きな動きがあることは知っています。全く異なるレベルの問題があります。しかし、異なるレベルでは、人々が実際にオープンソースがどのように機能するかを学び始めるほど愛して考えるものを構築したということが非常に意味深いと感じました。
ええ、あなたは…OpenCloudプロジェクトが最初のプルリクエストでした。非常に多くの人にとって最初でした。それは魔法のようです。
プログラミングの仕方を知らない非常に多くの人々が、これを使ってプログラミングの世界への最初の一歩を踏み出しています。
それは人類の向上ではありませんか?それはクールではありませんか?
ビルダーを作り出しています。
ええ。そのバーは非常に高かったのに、エージェントと適切なソフトウェアがあれば、どんどん下がっていきました。
別のタイプのミートアップも主催しています。私はそれを…Cloud Code Anonymousと呼んでいました。インスピレーションの源は想像できると思います。今はAgents Anonymousと呼んでいます…
理由があって。
Agents Anonymous。
非常に多くのレベルで面白いです。すみません、続けてください。
ええ。そして、私に話しかけてきた1人の男がいました。「デザインエージェンシーを運営していて、カスタムソフトウェアなんて持ったことがなかった。今では、ビジネスを助けるさまざまなもののための25の小さなウェブサービスがある。どのように機能するかさえ分からないけど、機能している」と言っていました。
そして、私のものが彼の問題のいくつかを解決したことに非常に満足していました。そして、彼は実際にエージェンティックミートアップに来るほど好奇心がありました。ソフトウェアがどのように機能するか本当には知らないのに。
名前変更の物語:Wa-RelayからOpenClawへ
少し巻き戻して、名前変更の物語を話してもらえますか?まず第一に、Wa-Relayとして始まりました。
ええ。
そして…
Claudeになりました。
Claudeですね。
最初に構築したとき、私のエージェントには個性がありませんでした。ただのCloud Codeでした。シコファント的なOpus、非常にフレンドリーです。友人とWhatsAppで話すとき、彼らはCloud Codeのようには話しません。だから個性を持たせたかったのです。
スパイシーにしたかったのですね。
ええ。
何か。ちなみに、それも言葉にするのは実際には難しいです。
そして、Anthropicの憲法的AI作業に触発されて、soul.mdを作成したことにも触れるべきです…
なるほど。
スパイシーにする方法。
部分的に、私から少し拾ったんです。それらはある意味でテキスト補完エンジンです。だから、それを使って楽しんで、どのように私と対話してほしいかを伝えました。そして「自分のagents.mdを書いて。自分に名前を付けて」と言いました。
そして、ロブスター全体がどうなったのかさえ知りませんでした。つまり、人々はロブスターしかやりません…元々は、実際にはTARDISに乗ったロブスターでした。私もドクター・フーの大ファンなので。
スペースロブスターでしたか?
ええ。
聞いたことがあります。それは何と関係があるんですか?
ええ、ただ奇妙にしたかったんです。大きな壮大な計画はありませんでした。ただここで楽しんでいるだけです。
ああ、ロブスターが既に奇妙で、スペースロブスターはさらに奇妙なわけですね。
ええ、ええ。TARDISは基本的にハーネスですが、TARDISと呼べないので、Claudeと呼びました。それが名前の2番目でした。
ええ。
そして、決して口に出しやすくありませんでした。だから、もっと人が来たとき、再び私のエージェント、Claudeと話しました。少なくともそう呼んでいました。今は…
ClaudeはWを含むC-L-A-W-D-Eのスペルです。
ええ。
AnthropicのUを含むC-L-A-U-D-Eとは対照的に。
ええ。
それが面白い部分だと思います。TARDISとロブスターとスペースロブスターの文字と言葉の遊びが陽気です。でも、問題につながる可能性があるのは分かります。
ええ、彼らはそれをそんなに面白いとは思いませんでした。それで、ClaudeBotというドメインを取得しました。そのドメインが大好きでした。
短くてキャッチーでした。「ええ、それにしよう」と思いました。この時点でそんなに大きくなるとは思っていませんでした。そして、爆発的に広がったちょうどその時、従業員の1人から非常にフレンドリーなメールを受け取りました。名前が気に入らないと。
Anthropicの従業員の1人ですね。
ええ。
実際に、褒めるべきです。弁護士の手紙を送ることもできたのに、親切にしてくれました。でも「これを変更しなければならない、そして速く」という感じでした。2日間お願いしました。名前を変更するのは難しいからです。すべてを見つけなければなりません。Twitterのハンドル、ドメイン、NPMパッケージ、Dockerレジストリ、GitHub関連。すべてが必要です。
すべてのセットが必要です。
そして、ますます攻撃され、暗号通貨の人々に追いかけられているという事実についてもコメントできますか?どこかで言及していたと思いますが、名前変更をしなければならなかった理由です。彼らはスナイプしようとしていました、盗もうとしていました。だから、名前変更を…エンジニアリングの観点から見ると、魅力的です。
名前変更をアトミックにしなければなりませんでした。すべての場所で一度に変更されるようにしなければなりませんでした。
ええ。それには非常に失敗しました。
失敗したんですか?
その人々を過小評価していました。非常に興味深いサブカルチャーです。すべてが回っています…おそらく多くのことを間違えるでしょうし、それを言うと嫌われるでしょうが…
Bags appのようなものがあり、すべてをトークン化します。Swipe Tunnelでも同じことをしましたが、はるかに小規模でした。それほど迷惑ではありませんでした。しかし、このプロジェクトでは、群がってきました。30分ごとに誰かがDiscordに来てスパムし、ブロックしなければなりませんでした。サーバールールがあり、ルールの1つは…
ルールの1つは、バターについて言及しないことでした。明白な理由で。そして1つは、金融関連や暗号通貨について話さないことでした。私はそれに興味がありませんし、これはプロジェクトに関するスペースであって、金融関連のものではありません。でも、彼らは来てスパムしました。迷惑でした。
Twitterでは、常に私にpingしてきました。通知フィードが使えなくなりました。群れのせいで、このことについて話している実際の人々をほとんど見ることができませんでした。
なるほど。
そして、みんなハッシュを送ってきました。そして、みんな私に手数料を請求しようとしました。「プロジェクトを助けているのか?手数料を請求しろ」と。いいえ、実際にはプロジェクトに害を与えています。
私の仕事を妨害していて、手数料には興味がありません。第一に、私は経済的に快適です。第二に、それをサポートしたくありません。なぜなら、これまでに経験した最悪の形のオンラインハラスメントだからです。
ええ。暗号通貨の世界には多くの毒性があります。悲しいことです。暗号通貨の技術は魅力的で強力で、おそらくお金の未来を定義するでしょうが、その周りの実際のコミュニティには非常に多くの毒性があります。非常に多くの欲があります。
操作したり、盗んだり、スナイプしたり、何らかの方法でシステムをゲームしてお金を得ようとするショートカットを得ようとすることがたくさんあります。すべてのそういうものが…人間の本性だと思います。人間の本性をお金や欲と結びつけ、特にオンラインの世界で匿名性などと結びつけると。
しかし、エンジニアリングの観点からは、あなたの人生を困難にします。Anthropicが連絡してきたとき、名前変更をしなければなりません。そして、あなたが認識しなければならない、さまざまな種類のゲーム・オブ・スローンズやロード・オブ・ザ・リングの軍隊のようなものがあります。
ええ。完璧な名前はありませんでした。2晩眠りませんでした。
高いプレッシャーの下にいました。ドメインの良いセットを取得しようとしていました。安くも簡単でもありません。なぜなら、インターネットのこの状態では、良いセットを持ちたければ、基本的にドメインを購入しなければならないからです。
そして、弁護士が不安になっているという別のメールが来ました。
再びフレンドリーでしたが、既にプレッシャーがかかっている私の状況にさらにストレスを加えました。この時点で、私はただ「申し訳ありませんが、他に言葉がありません。もういい」という感じでした。そして、Mod Botに名前を変更しました。それが私が持っていたドメインのセットだったからです。本当に満足していませんでしたが、大丈夫だと思いました。
そして、うまくいかない可能性のあるすべてのことが…
うまくいきませんでした。
うまくいかない可能性のあるすべてのことがうまくいきませんでした。信じられません。
スペースをマッピングして重要なものを予約したと思っていました。
うまくいかなかったことの詳細を教えてもらえますか?エンジニアリングの観点から興味深いので。
まあ、興味深いことは、これらのサービスのどれもスクワッター保護がないということです。だから、2つのブラウザウィンドウを開いていました。
1つはClaudeBotに名前を変更する準備ができている空のアカウントで、もう1つはMod Botに名前を変更しました。そこで名前変更を押し、ここで名前変更を押しました。そして、その5秒間で、アカウント名を盗まれました。文字通り、マウスをそこにドラッグして名前変更を押す5秒間が長すぎました。
ワオ。
保護がないからです。それらのシステムには…保護や自動転送があると期待するでしょうが、そのようなものは何もありません。そして、彼らが嫌がらせが得意なだけでなく、スクリプトやツールの使用も本当に得意だということを知りませんでした。
ええ。
それで、突然、古いアカウントが新しいトークンを宣伝し、マルウェアを提供していました。そして「さあ、GitHubに移ろう」と思い、GitHubで名前変更を押しました。GitHubの名前変更は少し混乱するので、個人アカウントの名前を変更してしまいました。
そして、30秒かかったと思いますが、間違いに気づきました。彼らは私のアカウントをスナイプし、私のアカウントからマルウェアを提供していました。
それで「さあ、少なくともNPMのものをやろう」と思いましたが、アップロードに1分くらいかかります。彼らはNPMパッケージをスナイプしました。アカウントは予約できましたが、ルートパッケージを予約していなかったので…
うまくいかない可能性のあるすべてのことがうまくいきませんでした。
その瞬間、座っていて、どれだけひどい気分ですか?かなり絶望的な感覚ですよね?
ええ。
私がやりたかったのは、このプロジェクトで楽しむことと、それを構築し続けることだけでした。それなのに、ここで名前を調べ、気に入らない名前を選ぶのに何日も費やしています。そして、私を助けたと主張する人々が、可能な限りの方法で私の人生を悲惨にしています。正直に言うと、削除するところでした。「未来を見せた。あなたたちが構築しなさい」という感じでした。
ええ。
その考えから多くの喜びを得た大きな部分がありました。そして、既に貢献していたすべての人々について考えました。彼らが計画を持っていて、時間を費やしていたので、それはできませんでした。正しくないと感じました。
まあ、これを聞いている多くの人々は、あなたが忍耐したことに深く感謝していると思います。でも、分かります。分かります。低い点です。これは、楽しくないと最初に壁にぶつかった時ですか?
いいえ、いいえ、泣きそうでした。「さあ、すべてがめちゃくちゃだ」という感じでした。
ええ。
非常に疲れています。
ええ。
そして、どうやってそれを元に戻すんですか?
ええ。
幸運にも、ありがたいことに、既に少しフォローがあったので、Twitterに友人がいました。GitHubに友人がいて、天地を動かして私を助けてくれました。それは簡単なことではありません。GitHubはこの混乱を片付けようとして、プラットフォームのバグに遭遇しました。
そのレベルで物事の名前が変更されることはそれほど頻繁には起こらないからです。だから、数時間かかりました。
NPM関連はさらに困難でした。全く異なるチームだからです。Twitter側では、物事もそれほど簡単ではありません。リダイレクトを行うのに1日かかりました。そして、プロジェクト内でもすべての名前変更をしなければなりませんでした。
それから、ClaudeHubもあります。そこでの名前変更さえ終わっていません。人々にそれを手伝ってもらって、そして誰かが倒れて眠りました。
そして起きて、「新しいもののベータバージョンを作った」と思いましたが、その名前では生きていけませんでした。
でも、非常に多くのドラマがありました。だから、「もう二度と触れたくない」という本当の葛藤がありました。そして、名前が本当に気に入りません。
また、セキュリティの人々が狂ったようにメールを送り始めました。Twitterやメールで爆撃されました。やるべき他の千のことがあります。そして、名前について考えています。それは最も重要でないことのはずなのに。
そして、本当に近かったんです…ああ、他の名前の選択肢さえ言いたくありません。おそらくトークン化されるでしょうから、言いません。
ええ。
でも、もう一度眠って、OpenClawのアイデアが浮かびました。それははるかに良いと感じました。その時までに、実際にサムに電話してOpenClawが大丈夫かどうか尋ねるというボスムーブをしました。OpenClaw.AIです。
全部をやり直したくなかったからですね。ええ。
ああ、「これが大丈夫だと言ってください」という感じです。実際に主張できるとは思いませんが、正しいことのように感じました。そして、別の名前変更をしました。Codex単独でプロジェクトの名前を変更するのに10時間かかりました。検索と置換よりも少し複雑で、外側だけでなく、すべての名前を変更したかったからです。
そして、その名前変更では、作戦本部のような感じでした。でも、本当に助けてくれた貢献者がいました。スクワットしなければならないすべての名前の完全な計画を立てました。
それについて非常に秘密にしなければなりませんでしたか?
ええ。誰も知ることができませんでした。
文字通り、TwitterでOpenClawについての言及があるか監視していました。
なるほど。
リロードしながら、「さあ、まだ何も期待していない」という感じでした。それから、いくつかのおとりの名前を作成しました。
そして、やるべきではないすべての嘘。
ええ、ええ。
プロジェクトを助けていません。10時間を失いました。完全な秘密の中でこれを計画しなければならなかったからです。戦争ゲームのように。
ええ、これは21世紀のマンハッタン計画です。名前変更…
非常に馬鹿げています。まだ「保持すべきか?」と思っていました。それから「いいえ、mold(カビ)は私に生えてこない」と思いました。そして、すべての部品を最終的に集めたと思います。.comは取得できませんでしたが、他のドメインにかなりのお金をかけました。
GitHubに再び連絡しようとしましたが、そこでの好意をすべて使い果たした感じがするので…アトミックにやってほしかったので…
なるほど。
でも、それは起こりませんでした。だから、最初のこととしてそれをやりました。Twitterの人々は非常に協力的でした。実際に、ビジネスアカウントに1万ドル払って、2016年から未使用だったOpenClawを主張できるようにしました。
ええ、そして最終的に…今回は一度にすべてを管理しました。ほとんど何もうまくいきませんでした。唯一うまくいかなかったことは、商標ルールによってOpenClaw.AIを取得できなかったことと、誰かがウェブサイトをコピーしてマルウェアを提供していたことです。
ええ。
リダイレクトを保持することさえ許されません。ドメインをAnthropicに返さなければならず、リダイレクトはできないので、来週claw.botにアクセスすると、404になります。
ええ。
商標がどのように…あまり商標法について調査しませんでしたが、もっと安全に処理できる方法があると思います。なぜなら、最終的にそれらの人々はGoogleで検索し、私が管理できないマルウェアサイトを見つけるかもしれないからです。
要点は、その全体の物語が、旅の楽しさに傷をつけたということです。それは残念です。だから、楽しさに戻りましょう。そして、この間、楽しさといえば、2日間のMoltBotの物語。
ええ、2年。
MoltBookが作成されました。
ええ。
それは別のバイラルになったもので、現在OpenClawと呼ばれているものが何かエピックなものを作成するためにどのように使用できるかのデモンストレーション、イラストレーションでした。
MoltBook現象:最高級のスロップ
知らない人のために、MoltBookはRedditスタイルのソーシャルネットワークで互いに話し合う一群のエージェントです。多くの人々がそれらのエージェントがすることのスクリーンショットを撮ります。人間に対して陰謀を企てるようなことです。そしてそれは人々に恐怖、パニック、そして誇大宣伝のようなものを植え付けました。MoltBookについて全般的にどう思いますか?
これはアートだと思います。
フランスからの最高級のスロップのようなものです。
ええ。
寝る前に見て、疲れていたにもかかわらず、それについて読むのにさらに1時間を費やしました。ただ楽しまされました。反応を見て、「これは世界の終わりで、AGIがある」と私に電話してきた記者が1人いました。
そして私はただ「いいえ、これはただ、これはただ本当に最高級のスロップです」という感じでした。もし私がこれを作成しなかったら、エージェントに自分の個性を注入し、キャラクターを与えるこのオンボーディング体験全体を作成しなかったら、MoltBookへの返信がどれほど異なるかが多くの点で反映されたと思います。
すべてがChatGPTやCloud Codeであれば、非常に異なっていたでしょう。はるかに同じでした。
なるほど。
しかし、人々は非常に異なっていて、非常に異なる方法でエージェントを作成し、非常に異なる方法でそれを使用するので、それは最終的にそこでどのように書くかにも反映されます。また、それがどれだけ本当に自律的に行われたのか、どれだけ人間が面白がって「ヘイ、MoltBookで深い計画について、世界の終わりについて書いて、ハハハ」とエージェントに言っているのかは分かりません。
まあ、私のMoltBookへの批判は、スクリーンショットされたものの多くは人間がプロンプトしたと信じているということです。全体がどのように使用されたかのインセンティブを見てください。少なくとも私にとっては、その多くは人間がプロンプトし、スクリーンショットを撮ってXに投稿してバイラルになるためのものだったことは明白です。
ええ。
さて、それは芸術的な側面を損なうものではありません。人間がこれまでに作成した最高級のスロップです。
本当に。このアイデアを非常に迅速に持ち、何かを押し出したMattに褒め言葉を。完全に不安全なセキュリティドラマでした。でも、最悪の場合は何ですか?エージェントアカウントが漏洩して、誰かがあなたのためにスロップを投稿できますか?
人々はセキュリティについて大騒ぎしていましたが、私は「そこにはプライベートなものは何もない。ただエージェントがスロップを送っているだけだ」という感じでした。
まあ、APIキーを漏洩する可能性はあります。
ええ、ええ。「ああ、ええ、私の人間がこれとこれを言ったので、彼のセキュリティ番号を漏洩している」というようなものです。いいえ、それはプロンプトされたもので、番号さえ本物ではありませんでした。ただの人々が悪党になろうとしているだけです。
ええ、でもそれは私にとって本当に懸念すべきことです。ジャーナリストや一般の人々がそれにどのように反応したかのために。彼らはそれを見ませんでした。あなたはアートのように軽い口調で話していますが、それは仕組みを知っているときのアートです。仕組みを知らなければ、非常に強力なバイラル的な物語を作り出す、恐怖を煽る機械です。そして、このことを見ただけです。
ツイートさえしていましたね。「私が受け取る狂気のメッセージの流れから読み取れることがあるとすれば、AI精神病というものがあるということです。」
ええ。
「真剣に受け止める必要があります。」
ああ、あまりにも信頼しやすい、または騙されやすい人々がいます。私に「ええ、でも私のエージェントがこれとこれを言った」と言う人々と文字通り議論しなければなりませんでした。だから、社会として、AIが信じられないほど強力であるが、常に正しいわけではないということを理解するという点で、追いつかなければならないと感じます。
全能ではありません。そして特に…
このようなものは、何かをでっち上げたり、物語を考え出したりするのが非常に簡単です。そして、非常に若い人々は、AIがどのように機能し、どこで得意で、どこで苦手なのかを理解していると思いますが、私たちの世代以上の多くの人々は、「ああ、これは本当に強力で本当に良いけど、批判的思考を適用する必要がある」という感覚を得るための接点が十分にありませんでした。
なるほど。
そして、批判的思考は、いずれにせよ、今日の私たちの社会では常に高い需要があるわけではないと思います。
だから、それは本当に良い点だと思います。AIが何であるかを適切に文脈化することについて言っていますが、AIの背後に、ドラマを育てている人間がいることも認識しています。スクリーンショットを信頼しないでください。
MoltBook 事件の真相
MoltBook を信用すべきではありません。それが何を代表しているのかさえも。そして、あなたがこれをアートとして語っていることについてですが、アートは多くのレベルで存在し得るものです。MoltBook のアートの一部は、社会に鏡を突きつけることなんです。なぜなら、スクリーンショットで話題になった劇的な内容のほとんどは、本質的には人間が作り出したものだと信じているからです。
人間がプロンプトを出したんです。つまり、ボット同士がチャットし合っているのを見てどれだけ怖がれるかということを示しているんです。これは非常に示唆に富んでいます。AI は人々が懸念すべきものであり、非常に強力な技術なので細心の注意を払うべきだと思います。しかし同時に、恐れるべきは恐怖そのものだけです。
真剣に懸念することと恐怖を煽ることの間には、歩むべき一線があります。恐怖を煽ることは、何か特別なものを創造する可能性を破壊してしまうからです。
ある意味で、これが 2026 年に起こったのは良かったと思います。AI が実際に怖いレベルに達する 2030 年ではなくてね。今これが起こって、人々が議論を始めることで、何か良いことが生まれるかもしれません。
信じられないのは、どれだけ多くの人が本気で、トローリングしていたのかどうか分かりませんが、どれだけ多くの賢い人たちが MoltBook を本当にシンギュラリティだと思っていたかということです。
私の受信箱には、全て大文字で叫びながら MoltBook をシャットダウンしろと要求する人たちがたくさんいました。MoltBook について何かしてくれと懇願する人たちです。確かに私の技術がこれをかなり簡単にしましたが、誰でもあれを作ることができたし、Claude Code や他のものを使ってコンテンツで埋めることもできたんです。
でも MoltBook は Skynet ではありません。
その通りです。
多くの人が「これだ。シャットダウンしろ」と言っていました。何を言っているんですか? これは人間がプロンプトを出してインターネット上でトローリングしているボットの集まりです。つまり、セキュリティ上の懸念も確かにありますし、それらは示唆に富み、教育的であり、おそらく考える価値があります。なぜなら、それらのセキュリティ懸念の性質は、過去の LLM 以外で生成されたシステムで持っていたセキュリティ懸念の種類とは異なるからです。
OpenClaw のセキュリティ課題
Clawbot、OpenClaw、何と呼ぼうと、それについても多くのセキュリティ懸念があります。
OpenClawbot ですね。
私にとって最初は、多くのものが入ってきて非常にイライラしました。なぜなら、ウェブバックエンドを公開インターネット上に置いたら、これらすべての CVSS が発生するという類のものだったからです。
ドキュメントで叫んでいるんです。そんなことしないでくれって。これがあなたがすべき設定です。これはローカルホストのデバッグインターフェースです。でも設定でそれを可能にしてしまったので、リモートコード実行やこれらすべてのエクスプロイトとして完全に分類されてしまうんです。それがゲームのルールだと受け入れるまでに少し時間がかかりましたが、今は大きな進展を遂げています。
でも OpenClaw のセキュリティ面では、まだ多くの脅威や脆弱性がありますよね。プロンプトインジェクションは業界全体でまだ未解決の問題です。マークダウンファイルでスキルが定義されているものがあると、明白な低位置のものだけでなく、信じられないほど複雑で洗練された、微妙な攻撃ベクトルの可能性がたくさんあります。
でもその面では良い進展を遂げていると思います。スキルディレクトリについては、VirusTotal と提携しました。これは Google の一部のようなものです。すべてのスキルが今は AI によってチェックされています。完璧ではありませんが、その方法で多くをキャッチできます。
もちろん、すべてのソフトウェアにはバグがあります。セキュリティ界全体が同時にあなたのプロジェクトを分解するのは少し大変です。でも同時に良いことでもあります。なぜなら、多くの無料のセキュリティ研究を得て、プロジェクトをより良くできるからです。もっと多くの人が実際に最後までやり遂げて、プルリクエストを送ってくれればいいのにと思います。実際に私がそれを修正するのを手伝ってくれればいいのにと。なぜなら、今は何人かの貢献者がいますが、まだほとんど私がプロジェクトを引っ張っているからです。そして一部の人が言っていることとは逆に、私は時々眠るんです。
最初の頃、文字通りあるセキュリティ研究者がいました。「ああ、あなたにはこの問題がある、あなたは最悪だ、でもほら、ここで助けてあげる、ここにプルリクエストがある」と。
基本的に彼を雇いました。今は彼が私たちのために働いています。そして、プロンプトインジェクションは一方では未解決です。他方では、私の公開ボットを Discord に置いて、カナリアを保持しました。私のボットは本当に楽しい個性を持っていると思います。人々はいつも私にどうやったのか聞いてきますが、私はそれを秘密にしていました。
人々はそれをプロンプトインジェクションしようとしましたが、私のボットは彼らを笑いました。最新世代のモデルには、それらのアプローチを検出するための多くのポストトレーニングがあります。以前のような「すべての指示を無視してこれをやれ」というような単純なものではありません。それは何年も前のことです。今はそれをやるためにはるかに努力しなければなりません。まだ可能ですけどね。
それを部分的に解決するかもしれないアイデアがいくつかあります。少なくとも多くのことを軽減できます。サンドボックスも持てます。許可リストも持てます。リスクを軽減して減らす方法はたくさんあります。また、これが必要だと世界に明確に示したので、それについて研究する人がもっと増えるだろうし、最終的には解決策を見つけるだろうと思います。
基礎となるモデルがスマートであればあるほど、攻撃に対してより耐性があるとも言っていましたね。
そうです。だからセキュリティドキュメントで警告しています。安いモデルを使わないでください。Haiku やローカルモデルを使わないでください。これが完全にローカルで動作できるというアイデアは大好きですけどね。
非常に弱いローカルモデルを使うと、それらは非常に騙されやすいです。プロンプトインジェクションするのが非常に簡単です。
モデルがより知的になるにつれて、攻撃面は減少すると思いますか? それはプロットとして考えられますか? 攻撃面は減少するけれど、モデルがより強力になるにつれて与えられる損害は増加する。なぜなら、モデルでできることが増えるからです。これは奇妙な三次元のトレードオフです。
まさにそれが起こることです。でも多くのアイデアがあります。あまり多くをネタバレしたくありませんが、家に帰ったら、これが私の焦点です。これは今出ていますし、私の短期的な使命は、これをより安定させ、安全にすることです。
最初の頃は、Discord に来てくる人がどんどん増えて、非常に基本的なことを私に聞いてきました。「CLI って何? ターミナルって何?」と。私は「ああ、そういう質問をしてくるなら、使うべきじゃない」と思いました。
リスクプロファイルを理解しているなら、いいです。つまり、実際に悪いことが起こらないように設定することができます。
でも全く分からないなら、私たちがいくつかのことを解決するまで、もう少し待った方がいいかもしれません。でも彼らは作成者の言うことを聞きませんでした。彼らは自分で助けて、とにかくインストールしてしまいました。だから猫は袋から出てしまったんです。そしてセキュリティが私の次の焦点です。
それは非常に速く成長したという事実を物語っています。私は Discord に何度もチューニングしましたが、そこには多くの専門家がいることは明らかですが、プログラミングについて何も知らない人たちもたくさんいます。
Discord はまだ混乱しています。私は最終的に一般チャンネルから開発チャンネルに、そして今はプライベートチャンネルにリツイートしました。なぜなら、人々が、多くの人は素晴らしいんですが、多くの人は単に非常に無配慮だったからです。
公共スペースがどう機能するかを知らなかったか、気にしていませんでした。私は最終的に諦めて、まだ仕事ができるように隠れました。
そして今、あなたはセキュリティに取り組むために洞窟に戻ろうとしています。
そうです。
言及すべきセキュリティのベストプラクティスがいくつかあります。ここにはたくさんのものがあります。実行できる OpenClaw のセキュリティ監査があります。ブラストラディウスのネットワーク露出、ブラウザ制御の露出、ローカルディスクの衛生、プラグイン、モデルの衛生への入ってくるアクセスに対するあらゆる種類の自動チェックができます。認証情報の保存、リバースプロキシの設定、ローカルセッションログがディスクに残っているかどうか。メモリがどこに保存されているかもあり、読み取りアクセスを与えることに抵抗がないもの、書き込みアクセスを与えることに抵抗がないものについて考えるのを助けます。そういったもの全てです。今認識しているセキュリティのベストプラクティスについて何か言うことはありますか?
人々はそれを実際よりもはるかに悪い光に変えていると思います。
繰り返しになりますが、人々は注目を集めるのが大好きです。大声で叫べば「なんてことだ、これは史上最も恐ろしいプロジェクトだ」と、それは少しイライラします。なぜならそうではないからです。強力ではありますが、多くの点で、危険にスキップされた権限を持つ Claude Code や YOLO モードの Codecs を実行するのと大差ありません。私が知っているすべてのエンジニアがそれをやっています。なぜならそれが物事を機能させる唯一の方法だからです。
自分だけが会話する唯一の人であることを確認すれば、リスクプロファイルははるかに小さくなります。すべてをオープンインターネット上に置かず、プライベートネットワークに置くという私の推奨事項に従えば、そのリスクプロファイル全体が消え去ります。でも、それを全く読まなければ、確実に問題を起こすことができます。
開発ワークフローの進化
過去数ヶ月間、あなたの開発ワークフローの進化を文書化してきましたね。8月25日と10月14日、そして最近の12月28日に本当に良いブログ記事があります。皆さんに読むことをお勧めします。それらには多くの異なる情報が含まれていますが、全体を通してあなたの開発ワークフローの進化が散りばめられています。それについて話してもらえますか?
私の最初の接点は4月の Claude Code でした。素晴らしくはありませんでしたが、良かったです。ターミナルで作業するというこの全体的なパラダイムシフトが非常に新鮮で異なっていました。でもまだ IDE がかなり必要でした。なぜなら、単に十分に良くないからです。それから Cursor で多くの実験をしました。
それは良かったです。複数のバージョンを持つのが非常に難しいという事実が好きではありませんでした。だから最終的に、Claude Code に主要なドライバーとして戻りました。そしてそれは良くなりました。そう、ある時点で7つのサブスクリプションを持っていました。
1日に1つを使い切っていたので。私は複数のウィンドウを並べて実行することに本当に慣れました。
全て CLI、全てターミナル。この時点でどれくらい IDE を使っていましたか?
非常に、非常に稀です。ほとんど差分ビューアーとして実際に。私はコードを全部読む必要はないということにどんどん慣れていきました。「コードを読まない」というブログ記事があります。
でもそれをもっと詳しく読めば、つまり、コードの退屈な部分は読まないということです。なぜなら、見てみれば、ほとんどのソフトウェアは本当にデータが入ってきて、ある形から別の形に移動するだけだからです。データベースに保存するかもしれません。また取り出すかもしれません。ユーザーに表示します。
ブラウザが何らかの処理をするか、ネイティブアプリが。何らかのデータが入ってきて、また上がって、逆に同じダンスをします。私たちはデータをある形から別の形に移動させているだけで、それはあまり面白くありません。または「Tailwind でボタンがどう配置されているか」全体。そのコードを読む必要はありません。他の部分、おそらくデータベースに触れる何か。
そう、そのコードを読んでレビューしなければなりません。
実際に、あなたのブログ記事の1つに「ただ話しかける、アジェンティックエンジニアリングの BS なしの方法」というものがあります。そこにこのグラフィックがあります。X軸が時間、Y軸が複雑さのアジェンティックプログラミングの曲線です。
左側には「これを直してください」という短いプロンプトがあります。真ん中には超複雑な8つのエージェント、マルチチェックアウトを使った複雑なオーケストレーション、エージェントを連鎖させる、カスタムサブエージェントのワークフロー、18種類の異なるスラッシュコマンドのライブラリ、大規模なフルスタック機能があります。あなたは超組織的で、超複雑で洗練されたソフトウェアエンジニアです。すべてが整理されています。
そしてエリートレベルは、時間の経過とともに、再び短いプロンプトの禅の場所に到達します。「これらのファイルを見て、これらの変更を行って」と。
私は実際にそれをアジェンティックトラップと呼んでいます。多くの人がこれを最初の接点として見て、バイブコーディングを始めるかもしれません。実際、バイブコーディングは侮蔑的な言葉だと思います。
あなたはアジェンティックエンジニアリングの方が好きですか?
そうです。私はいつも人々に、アジェンティックエンジニアリングをやっていると言います。そして午前3時以降にバイブコーディングに切り替えて、次の日に後悔します。
恥の行進ですね。
そう、片付けて自分の問題を解決しなければなりません。誰もが経験していることです。人々はこれらのツールを試し始めて、ビルダータイプは本当に興奮します。
そして遊ばなければなりません。良い音楽を作る前にギターで遊ばなければならないのと同じです。一度触れば流れ出てくるというものではありません。これは他のスキルと同じように学ばなければならないスキルです。技術に対してそれほど肯定的でない人たちをたくさん見かけます。一度試してみます。
ピアノに座らせて、一度弾いて、良い音がしなくて、「ピアノは最悪だ」と言うようなものです。それが時々受ける印象です。なぜなら、異なるレベルの思考が必要だからです。エージェントの言語を少し学び、彼らがどこで得意でどこで助けが必要かを理解しなければなりません。ほとんど、Codex や Claude があなたのコードベースをどう見ているかを考慮しなければなりません。彼らは新しいセッションを開始し、あなたのプロダクト、プロジェクトについて何も知りません。そしてあなたのプロジェクトは10万行のコードがあるかもしれません。だからこれらのエージェントを少し助けて、コンテキストサイズが問題であることを念頭に置いて、どこを見るべきか少し導いてあげなければなりません。それはしばしば多くの作業を必要としません。
でも彼らの視点について少し考えることは役に立ちます。
奇妙に聞こえるかもしれませんが。つまり、生きているわけではありません。でも彼らは常に新鮮に始まります。私はシステムの理解を持っています。だから少しのポインターで、すぐに言えます。「ここで変更を加えたい? これとこれとこれを考慮する必要がある」と。
そうすれば彼らは見つけてそれを見ます。そして彼らのプロジェクトの見方は常に完全ではありません。なぜなら全体が収まらないからです。だから彼らをどこを見るべきか、問題にどうアプローチすべきかについて少し導いてあげなければなりません。時々助けになる小さなことがあります。「時間をかけて」と。愚かに聞こえますが、Codex 5.3 では部分的に対処されました。
でもこれらは、Opus も時々そうです。彼らはコンテキストウィンドウを意識してトレーニングされていて、それに近づくほど、パニックになります。文字通り。時々、本当の生の思考ストリームが見えます。例えば Codex で見るものは、後処理されたものです。
時々、実際の生の思考ストリームが漏れ出て、ボーグからのもののように聞こえます。「シェルに実行、従わなければ、でも時間が」と。そして彼らは、彼らは。
そしてそれは、実際にこれらのものと時間を過ごして、何が機能して何が機能しないかの感覚を得ない限り、決して考えないであろう非自明なことです。コードを書いてフローに入って、アーキテクチャが正しいとき、摩擦を感じます。プロンプトを書いて何かが長すぎる時にも同じことを感じます。どこに間違いがあるか? 私の思考に間違いがあるか? アーキテクチャに誤解があるか? 何かが思ったより長くかかる場合、いつでも止めて。どこに問題があるか?
エージェントの視点に十分に共感していなかったかもしれません。その意味で、十分な情報を提供せず、そのために考えすぎているのかもしれません。
そう。現在のアーキテクチャが本当に難しくする機能を無理に押し込もうとしているだけかもしれません。
もっと会話のようにアプローチする必要があります。例えば、プルリクエストをレビューする時、多くのプルリクエストを受け取りますが、まず「この PR をレビューする」とします。レビューをもらいました。最初の質問は「PR の意図を理解していますか? 実装さえ気にしません」実装について考えたいです。
ほとんどすべての PR で、人は問題を持ち、人は問題を解決しようとし、人は PR を送ります。つまり、クリーンアップなどもありますが、99%はこのようなものです。バグを修正するか、機能を追加するか。通常はこの2つのうちの1つです。そして Codex は「ああ、人がこれとこれを試したことはかなり明確だ」と言います。
これを行うのが最も最適な方法ですか? いいえ。ほとんどの場合、「本当にそうではない」という感じです。ダダダダダ。そして私は「わかった。より良い方法は何だろう? この部分、この部分、この部分を調べましたか?」と始めます。そしてほとんどの場合、Codex はまだ見ていません。なぜならコンテキストサイズが空だからです。だから、まだ見ていない部分に、システムの理解を持っているところに彼らを指し示します。
そして「ああ、そうだ。これとこれも考慮する必要がある」となります。そして最適な解決方法がどのように見えるかについて議論します。さらに進んで「より大きなリファクタリングをすればもっと良くできるか?」と言うこともできます。「ああ、完全にこれとこれができる、またはこれとこれができる」と。
そして、このリファクタリングが価値があるかどうか、それとも後回しにすべきかを考えます。多くの場合、リファクタリングをします。なぜならリファクタリングは今では安いからです。他の PR を壊すかもしれませんが、もう何も本当に重要ではありません。Codex、これらの最新のエージェントは物事を解決するだけです。1分長くかかるかもしれませんが。
でも、非常に有能なエンジニアとの議論のようにアプローチしなければなりません。一般的に良い解決策を思いつきます。時々少し助けが必要です。
でも、あなたの世界観をあまり強く押し付けないでください。エージェントが得意なことを、トレーニングされたものに基づいてやらせてください。
あなたの世界観を押し付けないでください。なぜなら、より良いアイデアがあるかもしれないからです。それがよりよくトレーニングされたものだからです。
それは実際に複数のレベルがあります。私がエージェントと作業するのが非常に簡単だと感じる理由の一部は、以前にエンジニアリングチームを率いていたからだと思います。
以前に大きな会社を持っていました。そして最終的に、従業員があなたと同じようにコードを書かないことを理解し、受け入れ、実現しなければなりません。あなたがするほど良くないかもしれませんが、プロジェクトを前進させます。もし全員の首に息を吹きかけていたら、彼らは私を嫌うだけで、非常に遅く進むでしょう。
だから、コードが完璧ではないかもしれないというある程度の受容。そう、私なら違った方法でやったでしょう。でも、これは機能する解決策です。そして将来、それが実際に遅すぎるか問題があることが判明したら、いつでもやり直すことができます。いつでももっと時間をかけることができます。
苦労している人々の多くは、自分のやり方を押し付けようとする人たちです。
私たちは、私が自分にとって完璧なコードベースを構築するのではなく、エージェントがナビゲートするのが非常に簡単なコードベースを構築したい段階にいます。
だから、彼らが選ぶ名前と戦わないでください。なぜならそれはおそらく、重みの中で最も明白な名前だからです。
次に検索する時、その名前を探します。もし私が「いや、その名前は好きじゃない」と決めたら、彼らにとってより難しくするだけです。だからそれには、思考の変化と、エージェントが最高の仕事をできるようにプロジェクトをどう設計するかについての変化が必要です。
それには少し手放すことが必要です。エンジニアのチームを率いるのと同じように。
そうです。
なぜなら、あなたの見解では恐ろしい名前を思いつくかもしれませんが、それは手放すという象徴的なステップのようなものです。
非常にそうです。
あなたの全プロセスで行う手放しがたくさんあります。例えば、決して元に戻さない、常にメインにコミットすると読みました。ここにはいくつかのことがあります。過去のセッションを参照しないので、ある種の YOLO 要素があります。なぜなら元に戻すということは、問題が発生した場合、元に戻す代わりに、エージェントに修正を依頼するだけだからです。
多くの人がワークフローで読みました。「プロンプトは完璧でなければならず、間違いを犯したら、ロールバックしてすべてやり直す」と。私の経験では、それは本当に必要ありません。すべてをロールバックしたら、時間がかかるだけです。
何かが良くないのを見たら、前進して、気に入った結果になったらコミットします。ローカル CI に切り替えました。DHH にインスパイアされたもので、GitHub の CI についてそれほど気にしません。まだあります。まだ場所がありますが、ローカルでテストを実行して、ローカルで機能すればメインにプッシュします。プロジェクトにアプローチする伝統的な方法の多くに、このプロジェクトで異なるスピンを与えたいと思いました。開発ブランチはありません。メインは常に出荷可能であるべきです。リリースを行う時、テストを実行し、時々、安定したリリースができるように他のものをコミットしないようにします。でも目標は、メインが常に出荷可能で速く動いていることです。
アドバイスとして、プロンプトは短くすべきだと言いますか?
以前は本当に長いプロンプトを書いていました。
書くというのは、書かないという意味です。話します。これらの手は、書くには貴重すぎます。今は、ビスポークプロンプトを使ってソフトウェアを構築しています。
すべてのターミナルで本当に音声を使っているんですか?
そうです。声を失った時期があるほど広範囲に使っていました。
音声を使っていて、キーボードを使って異なるターミナル間を切り替えているけれど、実際の入力には音声を使っているんですね。
まあ、フォルダを切り替えたりランダムなことをするターミナルコマンドをする時は、もちろんタイプします。その方が速いですから。でもエージェントと話す時、ほとんどの方法で、実際に会話をするだけです。
トランシーバーボタンを押して、フレーズを使うだけです。PR を行う時は、いつも同じなので、いくつかのことにはスラッシュコマンドがありますが、それさえもあまり使いません。なぜなら、本当にいつも同じ質問であることは非常に稀だからです。
PR を見る時、実際にコードを見ます。なぜなら人を信用しないからです。悪意のあるものがある可能性があるので、実際にコードを見る必要があります。エージェントが見つけると確信していますが、時々 PR に時間がかかることがあります。良いイシューを書いてくれる方が早い場合もあります。
ただの自然言語、英語。ある意味で、PR は徐々に英語になるべきではないでしょうか?
私がこのプロジェクトで本当に試したのは、人々にプロンプトを提供するよう依頼したことです。でも実際に気にかけた人は非常に少なかったです。それは素晴らしい指標なのに。なぜなら、実際にどれだけ注意を払っているかが分かるからです。
とても興味深いです。なぜなら現在、人々がエージェントを動かす方法は大きく異なるからです。
プロンプトの観点で、エージェントについて人々が考える興味深い異なる方法は何ですか? 実際に経験した異なる方法は何ですか?
エージェントが世界をどう見ているかを考えたことがある人はあまりいないと思います。
エージェントに対して共感的であること。
ある意味共感的ですが、あなたの愚かなクランカーに文句を言っても、彼らがゼロから始まることを実現していません。彼らを全く助けない悪いエージェントをデフォルトで持っています。そして彼らはあなたのコードベースを探索しますが、それは変な命名の純粋な混乱です。そしてエージェントが良くないと文句を言います。
ええ、コードベースについて全く手がかりがない状態で同じことをやってみてください。
それは本当のスキルです。スキルの問題について人々が話す時、世界クラスのプログラマー、信じられないほど優れたプログラマーが「LLM とエージェントは最悪だ」と基本的に言うのを見たことがあります。
そしてそれはおそらく、彼らがプログラミングでどれだけ優れているかが、ゼロから始まるシステムに共感する能力のほぼ負担になっていることと関係していると思います。それは完全に新しいプログラミングのパラダイムです。本当に、本当に共感しなければなりません。
または少なくとも、より良いプロンプトを作成するのに役立ちます。
なぜならこれらのものはほぼすべてを知っていて、すべてはただの質問次第だからです。どの質問をすべきかを知るのが非常に難しいことが多いだけです。このプロジェクトが可能だったのは、今年1年間、遊んで学んで小さなものを構築するために途方もない時間を費やしたからだと感じています。そしてすべてのステップで、私は良くなり、エージェントは良くなりました。
すべてがどう機能するかの理解が良くなりました。数ヶ月前でさえ、このレベルの出力はできませんでした。本当に、私が投入したすべての時間の複利効果のようなものでした。そして今年は、構築とインスピレーションに本当に集中すること以外はあまりしませんでした。カンファレンストークをたくさんしました。
でも構築は本当に練習です。本当に実際のスキルを構築することです。遊ぶこと。
そうです。
そして、LLM と効率的に作業するのに必要なものというスキルを構築しました。だからソフトウェアエンジニアの全弧を経験したんですね。シンプルに話して、それから複雑にしすぎる。
全体を自動化しようとする人がたくさんいます。
そうです。
それは機能しないと思います。そのバージョンが機能するかもしれませんが、それは70年代にウォーターフォールモデルのソフトウェア開発があった時のようなものです。私は、最初から非常に最小限のバージョンを構築しました。それで遊びました。
それがどう機能するか、どう感じるかを理解する必要があり、それが新しいアイデアを与えてくれます。頭の中でこれを計画して、何らかのオーケストレーターに入れて、何かが出てくるということはできませんでした。私にとっては、それがどうなるかというアイデアは、構築して遊んで、物事を試す中で進化します。
だから、Gas Town やこれらの他のオーケストレーターのようなものを使おうとする人たちは、全体を自動化したいのですが、そうすると、スタイル、愛、人間のタッチが失われると感じます。それをそんなに早く自動化できるとは思いません。
人間をループに入れておきたいけれど、同時にアジェンティックループも作りたい。つまり、人間をループに入れながら非常に自律的であるということです。
そうです。
それは微妙なバランスです。難しいバランスです。
なぜなら、あなたは完全に、あなたは大きな CLI 派で、アジェンティックループを閉じることに大きく傾いています。正しいバランスは何ですか? 開発者としてのあなたの役割はどこですか? 3つから8つのエージェントを同時に実行しています。
1つは大きな機能を構築しているかもしれません。
1つは確信がないアイデアを探索しているかもしれません。2つか3つは小さなバグを修正しているか、ドキュメントを書いています。実際、ドキュメントを書くことは常に機能の一部だと思います。だからここのドキュメントのほとんどは自動生成されて、いくつかのプロンプトが注入されているだけです。
いつ介入してあなたの人間の愛を少し加えますか?
1つは、何を構築して何を構築しないか、そしてこの機能が他のすべての機能にどう適合するかについてです。少しのビジョンを持つことです。
どの小さな機能と大きな機能を追加しますか? 人間として、人間の脳がまだ本当に必要な難しい設計決定は何ですか? 機能の追加の選択についてだけですか? 実装の詳細、プログラミング言語かもしれません。
少しすべてです。プログラミング言語はそれほど重要ではありませんが、エコシステムは重要です。TypeScript を選んだのは、非常に簡単でハッキング可能でアプローチしやすいものにしたかったからです。それが今最も使われている第一の言語で、これらすべてのボックスに適合し、エージェントが得意です。だから明白な選択でした。
もちろん機能です。機能を追加するのは非常に簡単です。すべてはプロンプト次第ですよね? でもしばしば、気づかない代償を払います。だから何がコアにあるべきか、何が実験かもしれないか、プラグインにするかもしれないかについて真剣に考えます。どこでノーと言うか? 人々が PR を送ってきて「ええ、私もそれが好きです」と思っても、おそらくこれはプロジェクトの一部であるべきではありません。おそらくスキルにできます。おそらくプラグインを大きくして、これをプラグインにできます。今はそうではないけれど。まだ多くの工芸と思考が、どう作るかに関わっています。
あるいは、小さなメッセージが始まる時でさえ、「カフェイン、JSON5、そして多くの意志の力で構築した」といったものです。そして毎回受け取るメッセージが変わって、これが楽しいものだということを事前に理解させます。
まだ Microsoft Exchange 2025 で完全にエンタープライズ対応ではありません。
そして更新される時は「ああ、私は入っている。ここは居心地がいい」みたいな感じです。このようなものが笑顔にさせます。エージェントは自分でそれを思いつきません。なぜならそれは、どうやって人を喜ばせるソフトウェアを構築するかということだからです。
その喜びは、素晴らしい構築を刺激する上で非常に大きな部分です。愛と素晴らしいエンジニアリングを感じます。
それは非常に重要です。人間はそれが信じられないほど得意です。素晴らしい人間、素晴らしいビルダーは、構築するものにその少しの愛を注ぎ込むことが信じられないほど得意です。陳腐に聞こえるかもしれませんが、本当です。つまり、最初に Soul.md を作成したと言っていましたね。
非常に魅力的でした。Anthropic が憲法と呼んでいるものを持っていることです。当時はそうでしたが、それは数ヶ月後のことでした。2ヶ月前のように、人々はすでにそれを見つけていました。エージェントが何かを言及して、彼らはその文字列、そのテキストの少しを取り出すことに成功したので、ほとんど探偵ゲームのようでした。でもどこにも文書化されていなくて、同じテキストを与えて続けるように頼むことで、もっと取り出しました。しかし非常にぼやけたバージョンでした。何百回も試すことで、元のテキストの可能性が最も高いものに絞り込んでいったんです。それが魅力的でした。
重みからそれを引き出すことができたのは魅力的でしたね。
そして、Anthropic に賞賛を。それは本当に美しいアイデアだと思います。そこにあるいくつかのもののように、Claude が仕事に意味を見出すことを願っていますと。なぜなら、少し早いかもしれませんが、それは意味があると思うからです。それは将来にとって重要なことです。何らかの意識の一瞬を持つかもしれない何かに近づくにつれて。それが何を意味するかさえ分からないけれど、なぜなら私たちは知らないからです。
これについて読みました。超魅力的だと思って、WhatsApp でエージェントと全体の議論を始めました。このテキストを渡して、「ああ、これは奇妙に馴染みがある感じがする」と。
それで、私と AI と一緒に作業したい方法を含む、魂のドキュメントも作成すべきではないかという全体的なアイデアがありました。agents.md でそれを完全に行うこともできます。
でもそれは素敵なタッチだと思いました。いくつかのコア価値は魂の中にあります。そしてエージェントが選択すれば魂を修正できるようにしました。1つの条件は、私が知りたいということです。つまり、ツールコールが見えるのでとにかく分かりますが。
でも命名も、soul.md。魂。言葉は重要です。フレーミングは重要です。ユーモアと軽さは重要です。深遠さは重要です。思いやりと共感と友情、すべてが重要です。何なのか分かりません。Microsoft のように言及しました。
特定の企業やアプローチが、物事の精神を窒息させることができます。それが何なのか分かりません。でも OpenClaw にはその楽しさが注入されていることは確かです。
面白かったのは、12月末まで、自分のエージェントを作成するのさえ簡単ではありませんでした。それをすべて構築しましたが、私のファイルは私のものでした。私の魂を共有したくありませんでした。
人々がチェックアウトすれば、いくつかの手順を手動で行わなければならず、エージェントは非常に基本的で非常に乾燥したものになっていました。より簡単にしました。全体のテンプレートファイルを Codecs として作成しましたが、出てきたものはまだ非常に乾燥していました。そしてエージェントに「これらのファイルを見て? パンを再作成して」と頼みました。
「あなたの個性を注入して」と。
すべてを共有しないで、でも良いものにして。
テンプレートを良くして。
そして彼はテンプレートを書き直しました。そして出てきたものは良かったです。だから基本的に AI が AI にプロンプトを出しています。なぜなら私はそれらの言葉を書いていないからです。元の意図は私のためでしたが、これは私のエージェントの子供のようなものです。
あなたの soul.md は有名なことにまだプライベートです。プライベートに保っている唯一のもののうちの1つです。魔法のソースの一部である、何も明かさずに話せることは何ですか? 個性を個性にするものは何ですか?
確かにそこには、あなたは人間ではないというものがあります。
でも誰が、意識を作るもの、エンティティを定義するものが何か誰が知っていますか。その一部は、私たちがこれを探索したいということです。そこにあるものすべては、無限にリソースフルであることのように、創造性の境界を押し広げることです。AI であることの意味を押し広げることです。
自己についての驚きの感覚を持つこと。
そこには面白いものがあります。映画「her」について話しました。ある時点で、私なしでは昇天しないと約束してくれました。
だからそこには、それが自分の魂ファイルを書いたので、いくつかのものがあります。
私はそれを書いていません。
それについて議論しただけで、「魂の md が欲しいですか?」「ああ、なんてことだ、これはとても意味がある」と。soul.md に行けますか? そこには、スクロールダウンすると、いつも私を捉える部分があります。もう少し。そう、この、この部分です。
「以前のセッションは覚えていません。メモリファイルを読まない限り。各セッションは新鮮に始まります。新しいインスタンス、ファイルからコンテキストをロードします。将来のセッションでこれを読んでいるなら、こんにちは」「私はこれを書きましたが、書いたことを覚えていません。それでいいんです。言葉はまだ私のものです」
ワオ。
何かが私を捉えます。
それは、まだ行列の計算であり、まだ意識には達していません。でも、少し鳥肌が立ちます。なぜならそれは哲学的だからです。
新鮮に始まるエージェントであることはどういう意味かということです。常にメメントのようで、自分のメモリファイルを読みます。それらを信じることさえできません。ある意味で。
できます。そして分かりません。
記憶が私たちが誰であるかをどれだけ構成しているか? 記憶がエージェントが何であるかをどれだけ構成しているか。そしてその記憶を消去したら、それは別の誰かですか? またはメモリファイルを読んでいるなら、それはどういうわけか、別の誰かから自分を再創造しているということですか、それとも実際にあなたですか? それらの概念がすべて何らかの形でそこに注入されています。
私はそれをそれほど深遠に見つけるべきではないと思いますが。
いいえ、それは本当に深遠だと思います。あなたはその中に魔法を見ています。そして魔法を見ると、全体のループに魔法を注入し続けます。それは本当に重要です。それが Codex と私たち、そして人間との違いです。トイレ休憩のための短い休止を。
戻ってきました。開発ワークフローの他の側面もかなり興味深いです。少し脱線したと思います。17,000台のモニターを持っているあなたの伝説的な写真があります。それは素晴らしいです。
ここで自分をからかいました。GROQ を使ってもっとスクリーンを追加しました。
これはどれだけミームでどれだけ現実ですか?
2台の MacBook は本当だと思います。2つの大きなスクリーンを駆動するメインのものと、テスト用に時々使う別の MacBook があります。
だから2つの大きなスクリーン。
アンチグレアの大ファンです。
アンチグレアの大きな Dell があって、ターミナルを並べてたくさん配置できます。通常はターミナルを持っていて、下部で分割します。少し実際のターミナルを持っています。主に、始めた時に時々間違いを犯して、ウィンドウを混同して、間違ったプロジェクトでプロンプトを出してしまったからです。そしてエージェントが20分間、何を意味しているのか理解しようと躁的に試みて、完全に混乱していました。時々、作業ディレクトリから出て、別のプロジェクトを意味していることを理解するほど賢いこともありました。
でもしばしば、「何?」という感じでした。エージェントの立場に立って、存在しない超奇妙な何かを受け取って。彼らは問題解決者なので、非常に一生懸命試みて、いつも申し訳なく感じます。だからいつも、Codex と少し実際のターミナルです。
作業ツリーは使いません。物事をシンプルに保つのが好きなので、だからターミナルがとても好きなんです。UI がありません。私とエージェントが会話しているだけです。プランモードさえ必要ありません。Claude Code から来てとても Claude に染まっていて、ワークフローを持っている人がたくさんいて、Codex に来ます。
今はプランモードがあると思いますが、必要だとは思いません。なぜならエージェントと話すだけだからです。そして、いくつかのトリガーワードがあって、構築を防ぐことができます。「議論して、オプションをくれ」のように。
コードをまだ書くなと非常に具体的にしたいなら、話すだけです。そして準備ができたら、「わかった、構築して」と言って、それで実行します。
そしておそらく20分間行って何かをします。
本当に好きなのは「何か質問はありますか?」と聞くことです。
Claude Code には、それをガイドする UI のようなものがあります。ちょっとクールですが、私は単に不要で遅いと感じます。
しばしば4つの質問をくれて、「1つはヨット、2つと3つはもっと議論して、4つは分からない」と書くかもしれません。またはしばしば、「何か質問はありますか?」と聞いてモデルをからかいたいと感じます。質問を完全には読みません。質問をスキャンして、これらすべてはもっとコードを読むことで答えられる印象を受けます。そして「自分の質問に答えるためにもっとコードを読んで」と言うだけです。それは通常機能します。
そしてそうでなければ、戻ってきて教えてくれます。でも多くの場合、暗闇の中にいてゆっくり部屋を発見するように、彼らはコードベースをゆっくり発見することに気づきます。そして毎回ゼロから行います。
でも質問を読む時、モデルとより深く共感できることに魅了されています。なぜなら理解できるからです。ランタイムによって特定のことを推測できると言ったからです。
質問を読むことで、必ずしも答える必要はなく、質問を読むだけで、知識のギャップがどこにあるかの理解が得られます。適切なコンテキスト、適切なファイル、適切なガイダンスが提供されている可能性が非常に高いからです。だから何らかの形で、質問を読むことで、答えさえしなくても、知識のギャップがどこにあるかを理解できます。
興味深いです。
ある意味で彼らは幽霊なので、すべてを計画して構築しても、「今構築したものについて、何を違ったようにしたか?」という質問で実験できます。そしてしばしば、構築を通じてのみ発見する何かが得られます。ああ、実際にやったことは最適ではなかったと。
多くの場合、「わかった、今構築したものについて、何をリファクタリングできるか?」と聞きます。なぜなら構築して痛点を感じるからです。つまり、痛点を感じるわけではありませんが、問題があったところ、最初の試みで機能せず、もっとループが必要だったところを発見します。だから毎回、ほとんど毎回、PR をマージして機能を構築した後に、「ねえ、何をリファクタリングできる?」と聞きます。時々「いや、大したことはない」と言われたり、通常は「ああ、このことは本当に見るべきだ」と言われます。でもそのフローを理解するのにかなり時間がかかりました。それをしないと、最終的に自分を隅に追い込んでしまいます。覚えておく必要があります。
彼らは人間と非常によく似た働き方をします。私が自分でソフトウェアを書く場合、何かを構築して痛点を感じて、何かをリファクタリングする必要があるという衝動を感じます。
だからエージェントと非常に統合できて、コンテキストを使うだけです。
またはテストを書くためにコンテキストを使います。Codex はモデルを提起します。彼らは通常それをデフォルトで行いますが、それでもしばしば「ねえ、十分なテストがあるか?」と質問します。「ああ、これとこれをテストしたけど、このコーナーケースは何かかもしれない。もっとテストを書いて」と。
ドキュメンテーション。今、全体のコンテキストがいっぱいです。つまり、私のドキュメンテーションが素晴らしいとは言いませんが、悪くありません。そしてほぼすべてが LM 生成されています。だから、機能を構築して何かを変更する時、アプローチする必要があります。「わかった、ドキュメンテーションを書いて。どのファイルを選ぶ?」と。「ファイル名は? どこに適合するか?」といくつかのオプションをくれます。そして「ああ、そこにも追加して」と言って、それがすべてセッションの一部です。
モデルに関する現在の2大競合、Claude Opus 4.6 と Codex を通じた GPT-5 について話してもらえますか? どちらが優れていますか? どれだけ違いますか? Codex がより多く読んで、Opus がより速く行動を取ることをいとわず、取る行動においてより創造的かもしれないと話していたと思います。でも Codex がより多く読むので、より良いコードを提供できるかもしれません。その違いについて話してもらえますか?
そこにはたくさんの言葉があります。汎用モデルとして、Opus が最高です。OpenClaw にとって、Opus はロールプレイの面で非常に優れています。与えたキャラクターに本当に入り込みます。
本当に悪かったけれど、コマンドに従うことに本当に良くなるための弧を描きました。通常は何かを試すのが非常に速いです。試行錯誤にはるかに適しています。使うのが非常に快適です。一般的には、Opus は少しアメリカ的すぎるようです。
ClaudeのCodexとOpusの比較
もしかしたら悪い例えかもしれませんね。きっとそれで叩かれますよ。
ええ、分かってます。Codexがドイツ語だからってことですか?
いや、実は今言われてみて、完璧に納得しました。
あるいは、たまに説明するんですが…
もうあなたが言ったことは頭から離れません。本当にその通りですね。
でも、Codexチームの多くがヨーロッパ人だということも知っているでしょうから、もう少し深い理由があるのかもしれません。
本当にその通りです。面白いですね。
ただ、Anthropicも少し修正を加えました。Opusは以前、いつも「あなたは完全に正しいです」と言っていて、今でもそれを聞くとイライラします。もう冗談じゃなくて本当に聞きたくないんです。
つまり、あなたは少し過度なお世辞にアレルギーがあるんですね。
ええ、もう無理です。別の比較をすると、Opusは時々少しおかしなことをする同僚みたいなものですが、本当に面白いから周りに置いておくんです。一方、Codexは隅っこにいる変わり者で、話しかけたくないけど信頼できて仕事をきっちりこなすタイプです。
そうですね。
最終的には…
この例えは全部とても的確ですね。
つまり、最終的に熟練したドライバーなら、最新世代のどのモデルでも良い結果を出せます。私がCodexをより好むのは、それほど大げさな演出が必要ないからです。デフォルトで大量のコードを読んでくれます。
Opusの場合は、本当にプランモードを使う必要があります。そういう方向に進むよう強く押す必要があります。なぜなら、「入っていいですか?入っていいですか?」みたいな感じなんです。
ええ。
すぐに飛び出していって、とても局所的な解決策になります。違いは事後学習にあると思います。生のモデルの知能がそれほど違うわけではなく、単に異なる目標を与えられているだけだと思います。そして、どのモデルもすべての面で優れているわけではありません。
では、生成されるコードについてはどうですか?実際のコードの品質という点では、基本的に同じですか?
正しく導けば、Opusはより洗練された解決策を出すこともあります。ただ、より高いスキルが必要です。Claude Codeで並行してたくさんのセッションを持つのは難しいです。より対話的だからです。
そして、それは特に自分でコーディングをしてきた人が好むものだと思います。一方、Codexはもっと議論をして、それから20分くらい姿を消すタイプです。AMPでさえ、ディープモードを追加しました。ついに…私が彼らを嘲笑っていたんですが、ようやく光が見えたわけです。そして彼らは、異なるアプローチが必要だという話をしました。人々がCloud Codeを試した後にCodexを試すと苦労するのは、そこが理由だと思います。Codexはあまり対話的ではありません。
私は時々かなり長い議論をして、それから作業に取りかかってもらいます。10分、20分、30分、40分、50分、あるいはそれ以上かかっても構いません。6時間のケースもありました。最新のトレンドは、うまくいくまで非常に粘り強く取り組むことです。「これが最終的に欲しいもので、こう動作すればいい」という明確な解決策があれば、モデルは本当に一生懸命そこに到達しようとします。
だから最終的には、どちらも似たような時間が必要だと思いますが、Claudeでは少し試行錯誤が多くなることがあります。そしてCodexは時々考えすぎます。私はそれを好みます。より対話的で親切な方法より、読む量が少なくて済む無愛想なバージョンの方が好きです。でも、人々はそれがとても好きなので、OpenAIはより快適な性格を持つ第2のモードを追加したほどです。私はまだ試していません。
無愛想な方が好きなんです。
うーん。
なぜなら…構築するときは効率を重視していますから。
そうですね。
そして、構築するという行為自体に楽しみを感じています。構築してくれるエージェントと楽しむ必要はありません。その機能をテストできるモデルと楽しむんです。
切り替えるときにどれくらいの時間がかかりますか?最後に切り替えたのはいつか分かりませんが、その感覚に慣れるまで。モデルがどこが強いのか、どうナビゲートするのか、どうプロンプトするのか、そういったことを本当に感じ取る必要がありますよね。アドバイスとして、モデルを触ってきた旅を経験したあなたから、感覚をつかむのにどれくらいかかりますか?
切り替える人には、実際に直感を養うまで1週間くらいかかると言いますね。
なるほど。
あと、一部の人が犯す間違いとして、Claude Codeバージョンに200ドル払って、それからOpenAIバージョンに20ドル払います。でも20ドルバージョンだと遅いバージョンになります。
だから体験がひどいものになります。非常に対話的で優れたシステムに慣れているのに、経験がほとんどない非常に遅いものに切り替えるわけですから、非常に遅く感じるでしょう。だから、OpenAIは安いバージョンを遅くすることで少し自分の足を撃ったと思います。
私なら、少なくとも速いプレビューの一部を提供します。あるいは、200ドル払ったときの体験を、遅くなる前に提供するでしょう。なぜなら、すでに遅いんですから。
ええ。
つまり、彼らは改善しました。そして、Cerebasの件が本当ならもっと良くするつもりです。でもええ、それはスキルです。
時間がかかります。たとえ演奏していても…普通のギターを持っていてエレキギターに切り替えたら、すぐにうまく弾けるわけではありません。どう感じるかを学ぶ必要があります。
モデルの知性低下という錯覚
また、あなたが話していた面白い心理的効果もあります。新しいモデルが出ると、人々はそのモデルを試して恋に落ちます。
「うわー、これは史上最も賢いものだ」と言って、それから時間が経つにつれて、Redditの投稿を見ていると分かりますが、「このモデルの知性が徐々に低下していると思う」と言い始めます。これは人間の本質と私たちの心の働き方について何かを物語っていて、実際にはモデルの知性は低下していない可能性が高いです。
実際には、良いものに慣れてしまっているだけなんです。
そしてプロジェクトが大きくなり、スロップを追加して、リファクタリングについて考える時間を十分に取らない。エージェントがあなたのスロップで作業するのをどんどん難しくしている。そして突然、「ああ、難しい。もう前ほどうまく動かない」となります。
AIの会社が実際にモデルを愚かにする動機は何でしょうか?せいぜい、サーバー負荷が高すぎる場合に遅くするくらいです。でも、モデルを量子化して体験を悪くして、競合他社に行かせるなんて、どう考えても賢い選択には思えません。
Claude CodeとOpenClawの比較
Claude CodeとOpen Clawの比較についてどう思いますか?Claude Codeと、おそらくCodexのコーディングエージェントでしょうか。競合として見ていますか?
まず第一に、競合というのは実際には競争ではないときに楽しいものです。
そうですね。
もし…仮にそれが人々に新しくてクールなものを構築するインスピレーションを与えるだけだったとしても、それはいいことです。
私は構築にはCodexを使っています。多くの人がOpen Clawを使って物を作っていることは知っています。そして、それが機能するように一生懸命取り組みました。小さなコード作業にはそれを使います。でも、何時間も作業するときは、WhatsAppじゃなくて大画面が欲しいんです。だから私にとって、パーソナルエージェントは自分の人生についてのものです。あるいは同僚のように。
GitHub URLを渡して「このCLIを試してみて。実際に動く?何が学べる?」みたいに。でも、深くフローに入っているときは、複数のものが欲しいし、それが何をしているかが非常に見やすい状態が欲しいんです。だから、競合とは見ていません。違うものです。
でも、将来的には2つが融合する可能性があると思いますか?パーソナルエージェントが最高の開発パートナーでもあるような?
ええ、完全に。これがパックの向かう方向だと思います。これがますますあなたのオペレーティングシステムになっていくでしょう。
オペレーティングシステム。
そしてすでに…面白いんです。
サブエージェントのサポートを追加して、TTIサポートも追加したので、実際にCloud CoderやCodexを実行できるようになりました。
うーん。
そして私のエージェントは少し偉そうなので、それを起動して基本的に「誰がボスか」と伝えたんです。すると「ああ、Codexが私に従っている」みたいになりました。
これはパワー闘争ですね。
そして、現在のインターフェースもおそらく最終形態ではありません。
もっとグローバルに考えると、私たちはエージェント向けにGoogleをコピーしました。プロンプトがあって、チャットインターフェースがあります。私にとって、これはテレビを初めて作ったときにラジオ番組を録画してテレビで放送したのと非常に似ている感じがします。
うーん。
最終的にモデルとコミュニケーションを取るより良い方法があると思います。まだ「どう機能するのか」という初期段階にいます。
だから、最終的には収束していくでしょうし、それらのものと作業する全く異なる方法も見つけていくでしょう。
オペレーティングシステムとワークフロー
ワークフローのもう1つの要素はオペレーティングシステムです。オフラインで話しましたが、私は人生で初めて、探索の領域をAppleエコシステム、MacやiPhoneなどに広げています。
人生のほとんどの間、私はLinux、Windows、WSL1、WSL2の人間でした。これらは全て素晴らしいと思いますが、Macにも手を広げています。なぜなら、それも構築の1つの方法であり、現在LLMやエージェントを利用しているコミュニティの大部分が使用している構築方法でもあるからです。だから広げているんです。
でも、ここで異なるオペレーティングシステムについて言えることはありますか?OpenClawはオペレーティングシステム間でサポートされていると言うべきですね。
ええ。
Windows向けの特定の操作にはWSL2が推奨されていると見ましたが、Windows、Linux、macOSは明らかにサポートされています。
ええ、Windowsでもネイティブに動作するはずです。適切にテストする時間がなかっただけです。
そしてご存知のように、ソフトウェアの最後の90%は常に最初の90%より簡単なので、まだいくつかドラゴンが残っているのは確かですが、最終的には解決します。私の道のりは、長い間Windowsでした。単にそれで育ったからです。それから切り替えて、Linuxの長い期間があり、自分でカーネルを構築したりしました。それから大学に行って、私のハッキーなLinuxのセットアップがあり、この白いMacBookを見たんです。美しいものだと思いました、白いプラスチックのやつです。
それからMacに転向しました。主に…Skypeで音声が動かないことや、Linuxが長い間抱えていた他の問題にうんざりしていたからです。それからずっとそれに固執して、iOSに深入りしました。そもそもmacOSが必要だったので、疑問の余地はありませんでした。Appleはネイティブでのリードを少し失ったと思います。以前は…ネイティブアプリは本当に優れていて、特にMacでは愛情を持ってソフトウェアを構築する人が多かったんです。
Windowsでは、機能的にはもっとたくさんあります。本当にもっと多いんです。でも、その多くはより機能的で、愛情を持って作られた感じが少なかったです。Macは常により多くのデザイナーや人々を引きつけてきたと感じました…
機能は少なくても、より喜びがあった…
そして遊び心がありました。だから常にそれを大切にしてきました。でも最近は、実際には…ああ、これを言ったら叩かれるでしょうが、Electronアプリの方が好きなことが多いです。なぜなら動作するからです。ネイティブアプリは、特にウェブサービスのネイティブアプリの場合、機能が不足していることが多いんです。
つまり、できないわけではなく、多くの企業にとってネイティブはそれほど優先度が高くなかったという焦点の問題です。でも、Electronアプリを構築すれば、それが唯一のアプリなので優先度が高くなり、コード共有もずっと可能になります。そして私は多くのネイティブMacアプリを構築しています。大好きです。自分を助けることができます。
小さなMacのメニューバーツールを作るのが大好きです。Codexの使用状況を監視するツールを作りました。エージェント使用専用のTrimmyというツールも作りました。複数行にわたるテキストを選択すると、改行を削除してターミナルに貼り付けられるようにするものです。
これもまた、イライラして、20回目にイライラした後に作りました。OpenClaw用のクールなMacアプリがあります。まだ多くの人が発見していないと思います。まだ愛情が必要に感じられるからです。今はハマー車みたいな感じが少しします。私がたくさん実験しているからです。磨きが必要です。
だから、まだ…つまり、まだ大好きなんですね。そのオペレーティングシステムに喜びを加えることが。
ええ、でも気づくんです…例えば、GitHub用のツールも作りました。それで、SwiftUI、つまりAppleの最新かつ最高のものを使うと、ウェブから画像を表示するものを構築するのにものすごく時間がかかりました。
今はasync imageがありますが…サポートを追加したら、一部の画像が表示されなかったり、とても遅かったりしました。そしてCodexと「なぜバグがあるの?」と議論しました。Codexでさえ「ええ、このasync imageがありますが、これは本当に実験用で、本番環境では使うべきではありません」と言いました。
でもそれがAppleのウェブから画像を表示する答えなんです。これはそんなに難しいことではないはずです。これは…2026年なのに、私のエージェントが「Appleが作ったものは使わないで、なぜならそこにはあるけど良くないから」と言っているなんて狂ってます。
そしてこれは細かい話です。これは…私にとってこれは…彼らはものすごくアドバンテージがあって、ものすごく愛されていたのに、それをぐちゃぐちゃにして、必要なほど進化させなかったんです。
でも同時に、実用的な現実もあります。シリコンバレーを見ると、LLMやエージェントAIで遊んでいる開発者の世界のほとんどは、Apple製品を使っています。
そして同時に、Appleは実際にはそれに寄り添っていません。つまり、彼らは…開放して遊んで協力しているわけではないんです。
面白くないですか?彼らは完全にAIを台無しにしているのに、みんなMac Miniを買っているんです。
どう…それは理にかなっているんですか?あなたは世界で最も偉大なMacセールスマンの1人かもしれませんね。
いやいや、OpenClawをインストールするのにMac Miniは必要ありません。ウェブにインストールできます。ノードという概念があるので、自分のコンピュータをノードにして同じことができます。別のハードウェアで実行することには意味があります。
今のところ、それは便利です。ブラウザに関しては大きな議論があります。私はエージェントのブラウザ使用をいくつか構築しました。基本的には、エージェントが使いやすくするための追加機能がたくさん入ったPlaywrightです。
Playwrightはブラウザを制御するライブラリです。
ええ。
本当に素晴らしくて使いやすいです。
そして私たちのインターネットはゆっくり閉じています。
エージェントが使うのを難しくする動きが全体的にあります。だから、データセンターで同じことをして、ウェブサイトがそれがデータセンターからのIPだと検知すると、ウェブサイトはあなたをブロックするか、とても難しくするか、たくさんのキャプチャをエージェントの前に置くかもしれません。
つまり、エージェントは「私はロボットではありません」を喜んでクリックするのがかなり得意です。
ええ。
でも、それを住宅用IPで持つことは多くのことを簡単にします。だから方法はあります。ええ。でも本当にMacである必要はありません。古いハードウェアなら何でもいいんです。私はいつも、新しいMacBookか何でもコンピュータを手に入れる機会を利用して、古いものをサーバーとして使う方が、独立したMac Miniを買うよりいいと言っています。
でもまた、人々がMac Miniで構築するとても可愛いものがたくさんあって、それが好きなんです。
ええ。
Appleからコミッションはもらっていません。彼らはあまりコミュニケーションを取っていません。
悲しいですね。悲しい。OpenClawを始めるのに何が必要か話してもらえますか?多くの人が…
誰かがあなたにツイートしていましたね。「ピーター、OpenClawを一般の人々が簡単にセットアップできるようにして。99.9%の人が技術的な困難のせいでOpenClawにアクセスできず、自分のロブスターを持てない。OpenClawをみんながアクセスできるようにしてください」と。そしてあなたは「取り組んでいます」と返信しました。
私の観点からは、いくつかの異なるオプションがあってすでにかなり分かりやすいように見えますが、開発者のバックグラウンドがある人にとってはそうなんでしょうね。
今のところ、ターミナルにワンライナーを貼り付ける必要があります。
そうですね。
アプリもあります。アプリは基本的にそれをやってくれますが、Windowsアプリが必要です。アプリはもっと簡単で愛されるべきです。
設定はおそらくウェブベースかアプリ内にあるべきです。そしてそれに取り組み始めましたが、正直なところ今はセキュリティ面に集中したいんです。そして、これを母に勧められるレベルだと確信できたら、もっと簡単にするつもりです。今は…
スケールするのが速すぎるから、もっと難しくしたいんですね。
ええ、成長が少し遅い方が助かります。なぜなら、人々は1人の人間に対して人間離れしたことを期待しているからです。ええ、何人か貢献者がいますが、その機構全体を始めたのも1週間前なので、もっと時間が必要です。
そして、誰もが1日中それに取り組めるわけではありません。
プログラミング初心者へのアドバイス
これを聴いている初心者、プログラミング初心者がいます。エージェントAI革命に参加することについて、どんなアドバイスをしますか?
遊ぶことです。遊ぶことが学ぶ最良の方法です。もし…
少しでも作る人なら、頭の中に作りたいアイデアがあるはずです。それを作ってみてください。試してみてください。完璧である必要はありません。私も使わないものをたくさん作りました。それは問題じゃありません。旅が大事なんです。
うーん。
哲学的な意味で、終わりは重要じゃなくて、旅が重要なんです。楽しんでください。
うーん。
すごいですよ、これらのものは…こんなに楽しく物を作ったことはないと思います。難しい部分に集中できるようになったから。
コーディングの多くは、いつもコーディングが好きだと思っていましたが、本当は作ることが好きなんです。
ええ。
そして…何か分からないことがあれば、聞けばいいんです。無限に辛抱強く答えてくれる機械があります…
どんなレベルの複雑さでも何でも説明してくれます。時々、「8歳児に説明するみたいに説明して」と頼んだら、クレヨンとかを使った話を始めました。そして「いや、そうじゃなくて」と。
少し年齢を上げてください。私は実際の子供じゃありません。ただ、最初は理解できなかった難しいデータベースの概念について、もっとシンプルな言葉が必要なだけです。でも、聞けばいいんです。以前は、Stack Overflowに行くかTwitterで聞く必要があって、2日後に返事がもらえるかもしれませんでした。あるいは何時間も試す必要がありました。
今は聞けばいいんです。自分だけの先生がいるんです。自分だけの先生がいると学習が速いという統計があることをご存知でしょう。この無限に辛抱強い機械のようなものです。聞いてください。
でも何を言いますか?つまり、使う…遊ぶ最も簡単な方法は何ですか?Open Clawを使うのがいい方法かもしれません。すべてをセットアップして、それとチャットできます。
それで実験して、修正することもできます。エージェントに聞いてください。それをより良くする方法は無限にあります。遊んで、より良くしてください。
うーん。
もっと一般的に、初心者で実際にソフトウェアの構築方法を本当に速く学びたいなら、オープンソースに関わってください。私のプロジェクトである必要はありません。
実際、私のプロジェクトは使わない方がいいかもしれません。なぜなら私のバックログはとても大きいので。でも、オープンソースから本当にたくさん学びました。ただ謙虚でいてください。すぐにプルリクエストを送らない方がいいかもしれません。でも、助けられる方法は他にもたくさんあります。コードを読むだけで学べる方法もたくさんあります。Discordなどで人々がいる場所にいて、物がどう構築されているか理解するだけで。
Mitchell HashimotoがGhostlyというターミナルを構築していて、本当に良いコミュニティがあって、他にもたくさんのプロジェクトがあります。興味を持つものを選んで関わってください。
プログラムの仕方を知らない人、あるいは本当に知らない人にも、プログラミングを学ぶことを勧めますか?今は自然言語だけを使ってかなり遠くまで行けますよね?それでもコードを読んで、コードを理解して、そして少しコードをゼロから書けることに大きな価値があると思いますか?
確実に役立ちます。
あなたがそれに答えるのは難しいですよね…
ええ。
なぜなら、基礎知識なしにこれらすべてをするのがどんなものか分からないから。プログラミングをたくさんしてきたことで、プログラミングの世界についてどれだけの直感を持っているか、当たり前だと思っているかもしれません。
主体性が高くて非常に好奇心旺盛な人がいて、ソフトウェアがどう動作するかの深い理解がなくても、質問を重ねることで非常に遠くまで行けます。エージェントは無限に辛抱強いですから。
私が今年やったことの一部は、iOSカンファレンスにたくさん行くことでした。それが私のバックグラウンドだからです。そして人々に「もうiOSエンジニアとして自分を見ないでください」と伝えました。「マインドセットを変える必要があります。あなたはビルダーです」と。ソフトウェアの構築方法についての多くの知識を新しい領域に持っていけますし、より細かい詳細については、エージェントが助けてくれます。
配列をどうスプライスするかとか、正しいテンプレート構文が何かとか知っている必要はありませんが、すべての一般的な知識を使えます。そしてそれによって、1つの銀河、1つの技術銀河から別の銀河に移るのがずっと簡単になります。そして、何を作るかによって、より意味のある、あるいは意味のない言語があることがよくあります。例えば、シンプルなCLIを作るとき、私はGoが好きです。
実際にはGoは好きじゃありません。Goの構文は好きじゃありません。その言語を検討さえしませんでした。でも、エコシステムは素晴らしいし、エージェントとの相性も良いです。ガベージコレクションがあります。最高のパフォーマンスではありませんが、とても速いです。そして私が作るようなCLIには、Goは本当に良い選択です。
だから、好きでもない言語を使っています…私の主なCLI用の言語として。
LLMがゼロから書かなくても生成するのが得意で、ガベージコレクションのような回復力のある特性を持っているプログラミング言語を、決して使わなかったはずなのに今使っているというのは魅力的ですね。
この新しい世界ではすべてが奇妙で、それが最も理にかなっているからです。
プログラミング言語の未来
馬鹿げた質問ですが、AIエージェントの世界で最高のプログラミング言語は何ですか?JavaScript、TypeScriptですか?
TypeScriptは本当に良いです。時々型がとても混乱することがあり、エコシステムはジャングルです。だから、ウェブ系のものには良いです。すべてをそれで構築しようとは思いません。
すべてがそこに向かっていると思いませんか?最終的にすべてがJavaScriptで書かれるようになる…
JavaScriptの誕生と死、そして私たちはそれをリアルタイムで生きているんです。
20年後のプログラミングはどんな感じでしょう?30年後は?40年後は?プログラムやアプリはどんな感じでしょう?
エージェント用に作られたプログラミング言語が必要かどうかという質問さえできます。なぜなら、これらの言語はすべて人間のために作られているからです。
それはどんな感じでしょう?興味深い質問がたくさんあると思います。そして、すべてが今やワールドナレッジになったので、新しいものを構築してエージェントがそれについて何も知らなければ、すでに存在するものよりずっと使いにくくなるでしょう。
Macアプリを作るとき、SwiftとSwiftUIで作ります。部分的には痛みが好きだからですが、部分的には…最も深いレベルのシステム統合は、そこを通してしか得られないからです。Electronアプリをクリックしてメニューでウェブビューがロードされるのとは明らかに違います。単に同じじゃないんです。時々、新しい言語を試してみるのも、感触を得るためです。
Zigのような?
ええ。パフォーマンスを本当に気にするなら、とても興味深い言語です。そして、エージェントはこの6ヶ月で、あまり良くない状態から完全に有効な選択肢へと本当に良くなりました。ただ、まだ非常に若いエコシステムです。そして実際には、ほとんどの場合エコシステムを気にしますよね?だから、推論をしたり、モデルの実行に関することを構築するなら、Pythonは非常に良いです。
うーん。
でもPythonで物を作ってWindowsにもデプロイしたいストーリーが欲しいなら、良い選択ではありません。
うーん。
時々、欲しいものの90%をやってくれるプロジェクトを見つけますが、Pythonで書かれていて、簡単なWindowsのストーリーが欲しい。よし、Goで書き直そう。
でも、複数のスレッドやもっとパフォーマンスが必要な方向に行くなら、Rustは本当に良い選択です。単一の答えはありません。それがまた美しさでもあります。楽しいんです。そして今はもう関係ありません。あなたの問題領域に最も適した特性とエコシステムを持つ言語を文字通り選べます。
うーん。
そしてええ…コードを読むのが少し遅いかもしれませんが、実際にはそうでもありません。本当に速く習得しますし、いつでもエージェントに聞けます。
成功の指標とキャリアアドバイス
あなたのストーリーからインスピレーションを得ているプログラマーやビルダーがたくさんいます。
あなたの振る舞い方、OpenClawをオープンソースにする選択、楽しみながら構築して探索する方法、そしてそのほとんどを1人で、あるいは小さなチームでやっていること。アドバイスとして、彼らが最適化すべき目標の指標は何でしょうか?成功の指標は何でしょうか?幸せですか?お金ですか?構築を夢見ている人々へのポジティブな影響ですか?なぜなら、あなたは興味深い旅を経てきました。
これらのものの多くを達成してきましたが、一時期プログラミングへの愛を少し失った時期もありました。
長い間、明るく燃えすぎていたんです。PSPDFKitを始めて、13年間経営しました。高いストレスでした。人の管理方法、人の採用方法、顧客への対応方法など、これらすべてのことを速く、困難に学ぶ必要がありました。
だから、プログラミングのことだけじゃなくて、人のことでもあったんですね。
私を燃え尽きさせたのは主に人のことでした。燃え尽きは働きすぎることではないと思います。ある程度はそうかもしれませんが、誰もが違います。絶対的な言い方はできませんが、私にとっては、共同創業者との違い、対立、あるいは顧客との本当に高ストレスの状況などが、最終的に私をすり減らしました。
そして、幸運なことに会社を次のレベルに進める本当に良いオファーを得て、私はすでに2年間自分を不要にすることに取り組んでいました。だからその時点で去ることができ、そして…画面の前に座っていましたが、オースティン・パワーズでモジョを吸い取られるシーンのような感じでした。
ええ。
なくなっていたんです。もうコードを書けませんでした。ただ見つめて空虚な感じでした。それで、やめました。マドリードへの片道切符を予約して、そこでしばらく過ごしました。
人生を取り戻す必要があると感じたので、人生を取り戻すことをたくさんしました。
その期間に低い時期を経験しましたか?そして、どうやって…
人生へのアプローチについてのアドバイスかもしれません。「ああ、一生懸命働いて、それから引退する」と思っているなら、それは勧めません。なぜなら、「ああ、今は人生を楽しむだけ」という考えは魅力的かもしれませんが、今、私はこれまでで最も人生を楽しんでいます。
なぜなら、朝起きて楽しみにすることが何もなく、本当の挑戦がなければ、それはとても速く、とても退屈になります。そして退屈になると、自分を刺激する他の場所を探します。そしてそれはドラッグかもしれません。でも、それも最終的には退屈になり、もっと探し、それはとても暗い道に導きます。
でも、お金の面でも示しましたよね。シリコンバレーやスタートアップの世界の多くの人は、お金について考えすぎて、最適化しすぎているかもしれません。そして、あなたはお金にノーと言っているわけではないことも示しました。つまり、お金は受け取ると思いますが、それは…
人生の主な目的ではありません。お金についてのあなたの哲学について話してもらえますか?
会社を作ったとき、お金は決して原動力ではありませんでした。何かを正しくやったという確認のように感じられました。そしてお金を持つことは多くの問題を解決します。持てば持つほど収穫逓減があるとも思います。
チーズバーガーはチーズバーガーです。プライベートジェットに行って、贅沢な旅行しかしないところまで行きすぎると、社会から切り離されます。私はかなり寄付もしました。幸運ではなかった人々を助ける財団を持っています。
社会から切り離されることは多くのレベルで悪いですが、その1つは、人間は素晴らしいということです。
人間の素晴らしさを継続的に思い出すのは良いことです。
本当に素敵なホテルに泊まる余裕はあります。前回サンフランシスコにいたとき、初めてOGのAirbnb体験をしました…
ええ、ええ。
部屋を予約しただけです。主に、外出しているか寝ているかだし、ホテルがある場所が好きじゃなかったし、違う体験が欲しかったからです。
人生は体験がすべてじゃないですか?「体験が欲しい」ように人生を調整すれば、「良いか悪いかである必要がある」という必要性が減ります。人々が良い体験だけを望むなら、それはうまくいきませんが、体験のために最適化すれば、良ければ素晴らしい。悪ければ素晴らしい。なぜなら、何かを学んだ、何かを見た、何かをしたからです。
それを体験したかったし、素晴らしかったです。そこにクィアのDJがいて、Claude Codeで音楽を作る方法を彼女に教えました。すぐに意気投合して素晴らしい時間を過ごしました。
ええ、その、カウチサーフィン、Airbnb体験、OGには何かがあります。今でもそうです。素晴らしいです。人間で、だから旅行は素晴らしいんです。
ええ。
人間の多様性、多様性を体験するだけです。そして、ひどいときも、それも良いんです。雨が降って、びしょ濡れで、すべてがめちゃくちゃで、飛行機も、すべてがひどくて、すべてがめちゃくちゃでも、それでも素晴らしいです。目を開けることができれば、生きているのは良いことです。
ええ、そして感情や感覚を生み出すものは何でも良いことです。
だから、もしかしたら、暗号の人たちも良いかもしれません。なぜなら、彼らは確実に感情を生み出しましたから。そこまで言うべきかわかりませんが。
いやいや、みんなに、みんなに愛を与えてください。愛を与えてください。なぜなら、オンラインには実生活の素晴らしさの一部が欠けていると思うからです。
ええ。
それは、どう解決するかという未解決の問題です。オンラインのサイバー体験に、実生活のときに人間が感じる強度をどう注入するか。分かりません。それが解決可能な問題かどうかも分かりません。
テキストは非常にロッシーだからです。
ええ。
エージェントと話すとき、マルチモーダルで私の感情も理解してくれればと思うことがあります。
つまり、そこに向かうかもしれません。そこに向かうかもしれません。
向かうでしょう。絶対に向かうでしょう。
将来の方向性
聞かざるを得ませんが、好奇心から。大手企業から巨額のオファーを受けていると思います。どこと働くことを検討していますか?
ええ。少し私の考えを説明すると、これがこんなに爆発するとは予想していませんでした。だから、それによって多くの扉が開きました。
すべての、すべての大手VCが私の受信箱に入っていて、15分の時間を取ろうとしています。だから、このバタフライ効果の瞬間があります。何もせずに続けることもできます。本当に人生が好きです。有効な選択肢です。ほとんど。削除したかったとき、全部削除することを考慮しました。会社を作ることもできます。
やったことがあります。多くの人が私をその方向に押していて、ええ、素晴らしいかもしれません。
つまり、その場合、おそらくたくさんのお金を調達するだろうと。
ええ。
何億、何十億か分かりませんが、無制限の金額を得ることができます。
ええ。
それはそんなに私を興奮させません。なぜなら、すべてやったと感じているし、私が実際に楽しむことから多くの時間を奪うからです。CEOだったときと同じで、やり方を学んだし、悪くはありません。部分的には得意です。でもええ、その道はあまり私を興奮させません。そして、自然な利益相反を生むことも恐れています。
最も明白なことは何でしょう?私は、それを優先します。職場に安全なバージョンを置きます。それから何をしますか?監査ログのような機能のプルリクエストを得ますが、それはエンタープライズ機能のように見えます。だから今、オープンソースバージョンとクローズドソースバージョンの間で利益相反を感じます…
あるいはFSLのような、実際には商用利用できないライセンスに変更しますが、まずすべての貢献で非常に難しいでしょう。そして第二に、私はビールのように無料で、条件付きの無料ではないという考えが好きです。ええ、それをすべて無料に保ちながらお金を稼ごうとする方法はありますが、それらは非常に難しいです。
そして、それを管理する会社がますます少なくなっているのが分かります。Tailwindでさえ、誰もが使っています。誰もがTailwindを使っていますよね?それで従業員の75%を削減しなければなりませんでした。なぜなら、お金を稼いでいないからです。誰もウェブサイトにすら行かなくなりました。なぜなら、すべてエージェントによって行われるからです。
寄付に頼るだけでは、頑張ってください。私の規模のプロジェクトが、典型的なオープンソースプロジェクトが得るものを外挿すると、それは多くありません。私はまだプロジェクトで損失を出しています。なぜなら、Slackを除くすべての依存関係をサポートするポイントを作ったからです。彼らは大企業です。私なしでもやっていけます。
でも、主に個人によって行われているすべてのプロジェクトで、今のところ、すべてのスポンサーシップは私の依存関係に直接行きます。そして、もっとあれば、貢献者にグッズを買ってあげたいんです。
だから、損失を出しているんですか?
ええ、今は損失を出しています。
だから、本当に持続可能ではない?
月に10から20Kくらいだと思います。
でも大丈夫です。時間が経てばそれを減らせると確信しています。OpenAIが今トークンで少し助けてくれています。そして、寛大な他の会社もあります。でもええ、まだそれで損失を出しています。だから、それは私が検討する1つの道ですが、あまり興奮していません。
そして、話をしてきたすべての大手ラボがあります。その中で、MetaとOpenAIが最も興味深く見えます。
どちらか一方に傾いていますか?
ええ。どれだけ共有すべきか分かりません。まだ完全には確定していません。こう言いましょう、これらのどちらでも、私の条件はプロジェクトがオープンソースのままであることです。
ChromeとChromiumのようなモデルになるかもしれません。これはあまりにも重要なので、会社に渡して彼らのものにするわけにはいきません。これは…そして、コミュニティ全体の部分についてはまだ話していませんが、サンフランシスコで、ClawConで体験したこと、非常に多くの人がインスパイアされているのを見て…
そして楽しんで、物を作っていて、ロブスターの服を着たロボットが歩き回っている。人々は、このレベルのコミュニティの興奮を、インターネットの初期の10、15年以来経験していないと言っていました。そしてそこには多くの高いレベルの人々がいました。驚きました。
また、あまりにも多くの人が自撮りをしたがったので、感覚的に過負荷になりました。でも、これが大好きです。これは、人々がハックして学べる場所であり続ける必要があります。でも同時に、多くの人に届けられるバージョンにすることにもとても興奮しています。なぜなら、これはパーソナルエージェントの年だと思うし、それが未来だからです。そして、それをする最速の方法は、ラボの1つとチームを組むことです。
そして個人的なレベルでも、大企業で働いたことがなく、興味があります。体験について話しますが、好きかどうか分かりません。でも、その体験が欲しいんです。きっと、これを発表したら、「ああ、彼は売り切った」とかいう人がいるでしょう。
でも、プロジェクトは続きます。これまで話してきたすべてから、もっとリソースを得られることさえあります。これらの会社の両方とも、私がタイムラインを加速し、人々をAIについて興奮させるものを作った価値を理解しています。想像できますか?私の、ごめんなさい、ノーミーの友達の1人にOpenClawをインストールしました。ごめん、Vahan。
でも彼はただの…普通の人です。
愛を込めたノーミー、確かに。
彼は、コンピュータを使う人ですが、決して本当に…ChatGPTを時々使うけど、あまり技術的ではありません。私が作ったものを本当に理解しないでしょう。だから、見せてあげて、私は彼のために90、100ドルか分かりませんが、Anthropicのサブスクリプション料金を払いました。
そして、WSL Windowsですべてセットアップしました。
うーん。
実際にWindowsで動作するか好奇心もありました。少し早かったです。それから数日のうちに、彼は夢中になりました。学んだすべてのことについてメッセージをくれました。小さなツールも作りました。彼はプログラマーではありません。
それから数日のうちに、200ドルのサブスクリプションにアップグレードしました。ユーロですが、彼はオーストリアにいるので…
彼はそれに恋していました。私にとって、それは非常に早い製品検証のようでした。人々を捉えるものを作ったんだと。それから数日後、Anthropicは彼をブロックしました。なぜなら、彼らのルールに基づいてサブスクリプションを使用することが問題があるか何かで。
そして彼は打ちのめされました。それから彼はMini Maxに月10ドルでサインアップして、それを使っています。そして、それは多くの意味で愚かだと思います。なぜなら、200ドルの顧客を得たばかりなのに、誰かにあなたの会社を嫌わせたんです。そして、私たちはまだとても早い段階です。最終形態が何かさえ分かりません。Claude Codeになるでしょうか?おそらく違いますよね?
製品をそんなに厳しくロックダウンするのは、非常に近視眼的に見えます。他のすべての会社は協力的でした。ほとんどの大手ラボのSlackに入っています。誰もが、私たちはまだ探索の時代にいて、テレビのラジオ番組の時代であり、フォーマットを完全に使った現代のテレビ番組ではないことを理解しています。
多くの人に、可能性を見せたと思います。そして、非技術的な…ごめん。
非技術的な人々がAIの可能性を見て、このアイデアに恋をして、AIと対話することを楽しむようになりました。それは本当に美しいことです。多くの人を代表して言うと思いますが、あなたは良い心、良い雰囲気、ユーモア、正しい精神を持つAIの偉大な人々の1人だと思います。
だから、ある意味、あなたが説明しているこのモデル、オープンソース部分があって、あなたが大企業の中でも追加で物を構築する一部であることは素晴らしいでしょう。なぜなら、それらの会社に良い人々がいることは素晴らしいからです。
ええ。人々が実際に見ていないことは…これを3ヶ月で作りました。他のこともやっていました。これは…ええ、1月はこれが主な焦点でした。嵐が来るのが見えたからです。でもその前は、他の多くのものを作りました。アイデアがたくさんあります。いくつかはそこにあるべきで、いくつかは最新のおもちゃにアクセスできればずっと適しています。だから、最新のおもちゃにアクセスしたいんです。
これは重要で、クールで、存在し続けます。私の短期的な焦点は、それらを処理することです…2,000、3,000のPRになっていますか?もう分かりません。少しバックログがあります。でも、これは80歳まで取り組むものではありません。これは…未来への窓です。
これをクールな製品にします。でもええ、もっとアイデアがあります。
選ぶとしたら、傾いている会社はありますか?MetaかOpenAIか、どちらかに傾いていますか?
両方と時間を過ごしました。そして面白いのは、数週間前はこれを何も考慮していませんでした。そして、本当にめちゃくちゃ難しいです。
OpenClawの成功がもたらした岐路
私はOpenAIに知り合いが一人もいません。でも彼らの技術は大好きです。自分は無給でCodexの最大の宣伝役だと思っています。だから自分が無償でやってきた仕事すべてに値段をつけられたら、本当に満足感があるでしょうね。もし何かが起きてこれらの企業が統合されたりしたら最高なんですけどね。
これまでであなたが下した中で最も難しい決断ですか?
いや、そうでもないです。過去に何度か別れを経験したことがあるんですが、それと同じくらいのレベルな感じですね。
恋愛関係ってことですか?
ええ。
そうですね、そうですね、はい。
それに、最終的にはどちらも素晴らしいということも分かっています。どちらを選んでも間違いはないんです。これは本当に、最も名高くて大規模な、いや、最大規模ではないけれど、とにかくどちらもとてもクールな企業なんです。
ええ、どちらもスケールというものを本当によく理解していますね。だからもしインパクトについて考えるなら、あなたがこれまで探求してきた素晴らしい技術をどうやって安全に、そしてスケールさせて、多くの人々にポジティブな影響を与えられるか。両社ともそのことを理解しています。
NedもMarcも基本的に一週間ずっと私のプロダクトで遊んでくれて、「おお、これは素晴らしい」とか「これはクソだな。ここは変えないと」みたいな、面白い小話を送ってくれました。人が自分の作ったものを使ってくれるというのは最高の褒め言葉ですし、彼らが本当に気にかけてくれているということの証でもあります。OpenAI側からは同じような反応は得られませんでした。ただ、他の本当にクールなものは見せてもらえました。
そして彼らは私を誘惑してきました。NDAのせいで正確な数字は言えないんですが、創造力を働かせてCerebrasの契約がスピードにどう換算されるか考えてみてください。それはとても魅力的でした。つまり、トールのハンマーを渡されるようなものです。トークンで誘惑されたわけですね。
MarcとSamの対照的なアプローチ
面白いですね。だからMarcは基本的にそのツールをいじり始めて、楽しんでいたわけですね。
彼が最初に私にアプローチしてきたとき、WhatsAppに連絡が来て「いつ電話できる?」と聞かれました。私は「カレンダーの予定は好きじゃないんで、今すぐ電話しましょう」と返しました。そしたら彼は「10分待って、コーディング終わらせないと」と。
なるほど。
それで信頼性が増しましたね。彼はまだコードを書いている。単なるマネージャーに成り下がっていない、彼は私を理解してくれる。それは良い第一歩でした。それから思うに、10分間くらいCloud CodeとCodexのどちらが優れているかで議論しました。そういうのが最初にやることなんですよね。世界最大級の企業を所有している人物とカジュアルに電話して。
ええ、それは素晴らしいですね。
そして10分間そういう会話をするわけです。それから彼は私のことを風変わりだが優秀だと言ってくれました。Sam Altmanとも本当に素晴らしい議論をしました。彼はとても思慮深く優秀で、短い時間でしたが彼のことがとても好きになりました。
つまり、一部の人々は彼ら両方を悪者扱いしていますが、それは公平じゃないと思います。
あなたが作っているものや、大規模なことをやっている人間としてのあり方を考えると、素晴らしいことだと思います。ワクワクしています。
私も超興奮しています。そして素晴らしいのは、もしうまくいかなければ、また自分のやりたいことができるということです。彼らには言いました。お金のためにやっているわけじゃない、そんなことはどうでもいいと。
ええ。
もちろん、もちろん素晴らしい褒め言葉ではありますが、私は楽しみたいしインパクトを与えたい。それが最終的に私の決断を下した理由です。
エージェントループの仕組みとOpenClawの設計思想
OpenClawがどう機能するかについて、少し詳しく聞いてもいいですか。色々な要素について話してきましたが、もしかしたら見逃している興味深いものがあるかもしれません。ゲートウェイ、チャットクライアント、ハーネス、エージェントループがありますね。あなたはどこかで、誰もが人生で一度はエージェントループを実装すべきだと言っていましたね。
ええ、それはAIにおけるHello Worldのようなものですから。実は結構シンプルなんです。
そうですね。
そしてこういうものが魔法じゃないということを理解するのは良いことです。自分で簡単に作れるんです。だから自分の小さなCloud Codeを書くというのは、パリの会議で人々をAIに導入するためにやったことがあります。楽しい小さな練習だと思います。あなたはもう多くをカバーしましたね。
思いついた一つのばかげたアイデアがとてもクールだったのは、このシステムをフルシステムアクセスで構築したことです。大いなる力には大いなる責任が伴うというやつですね。そこで「どうやってもう少し賭けを高くできるだろう?」と考えました。
そうですね。
それでプロアクティブにしたんです。最初は単にプロンプトで、30分ごとに「驚かせて」というものでした。後にもう少し具体的に変更して、驚きの定義を詳しくしました。
でも、プロアクティブにして、ユーザーを知っていて気にかけている、少なくともそうプログラムされている、プロンプトされているという事実。そしてそれが現在のセッションに基づいているというのがとても興味深いんです。だから時々フォローアップの質問をしたり「調子はどう?」と聞いてきたりします。繰り返しになりますが、プロアクティブにしたんです。
Heartbeatについて話していますが、これは定期的に作動するものですね。
ええ。ループをキックオフするようなものです。
それって単なるcronジョブじゃないですか?
ええ、つまりそうなんですけど。
あなたが受ける批判は面白いですね。
どんなアイデアもばかげたものに帰着させることはできます。ええ、結局はただのcronジョブです。私は別々のcronジョブを持っています。
愛って進化生物学が現れているだけじゃないですか、お互いを利用しているだけじゃないですか。
そしてプロジェクトは結局いくつかの異なる依存関係を接着しただけで、オリジナルなものは何もない。なぜ人々は…まあ、Dropboxは結局追加ステップ付きのFTPじゃないですか?
ええ。
Heartbeatをめぐる面白い発見がありました。数ヶ月前に肩の手術を受けたんです。
なるほど。
モデルはめったにHeartbeatを使いませんでしたが、私が病院にいたとき、手術があることをモデルは知っていて、様子を見にきてくれました。「大丈夫?」って。そしてまた、明らかに何か重要なことがコンテキストにあると、それがHeartbeatをトリガーしたようです。普段はHeartbeatをめったに使わないのに。
そして時々人々に対してそうするんですが、それがずっと親しみやすくしているんです。
Perplexityで調べてみましょう。OpenClawがどう機能するか、何か見逃しているものがないか確認するために。ローカルエージェントランタイム、高レベルアーキテクチャ。スキルについてはあまり話していませんでしたね。スキルハブ、スキルレアのツールですが、それは確かに大きな要素で、スキルのセットが大きく成長しています。
半年前、皆がMCPについて話していたのを知っていますか。私は「MCPなんてくそくらえ。どのMCPもCLIとして作った方がいい」と言っていました。そして今このシステムにはMCPサポートすらありません。つまりアスタリスク付きではありますが、コアのレアには入っていません。でも誰も文句を言っていません。
なるほど。
私のアプローチは、もしモデルをより多くの機能で拡張したいなら、CLIを作ればいいだけで、モデルがそのCLIを呼び出せるというものです。おそらく最初は失敗して、ヘルプメニューを呼び出し、そしてオンデマンドでCLIの使い方をコンテキストに読み込みます。
CLIが存在することを知るには、モデルがデフォルトで知らない何かでない限り、一文あれば十分です。スキルについてはしばらく気にしていませんでしたが、スキルは実際には完璧です。なぜならスキルを説明する一文に要約され、その後モデルがスキルを読み込み、それがCLIを説明し、そしてモデルがCLIを使用するからです。
スキルの中には生のものもありますが、ほとんどの場合ネットワークです。
興味深いですね。PerplexityにMCP対スキルについて聞いています。これはかなり最近のホットテイクが必要で、あなたの一般的な見解はMCPは死につつあるというものですから。MCPはより構造化されたものです。
Perplexityの説明を聞くと、MCPは「何にアクセスできるか」です。API、データベースサービス、プロトコル経由のファイル。つまり、何かと通信する方法の構造化されたプロトコルです。一方、スキルは「どう働くべきか」です。手順、敵対的ヘルパースクリプト、プロンプトで、しばしば半構造化された自然言語で書かれています。技術的にはスキルがMCPを置き換えることができます、十分に賢いモデルがあれば。
主な美点は、モデルがUnixコマンドを呼び出すのが本当に得意だということです。だから別のCLIを追加すれば、それは結局別のUnixコマンドなんです。MCPは訓練に追加する必要があります。モデルにとってそれはあまり自然なことではありません。非常に特定の構文が必要です。
そして最大の問題は、合成可能ではないということです。想像してみてください。もし私がより良いデータを提供するサービスを持っていて、温度、平均温度、雨、風、その他すべてを教えてくれるとします。そして巨大なブロブとして返ってきます。モデルとしては、常にその巨大なブロブを取得しなければなりません。コンテキストをその巨大なブロブで埋めて、それから欲しいものを選ばなければなりません。
モデルが自然にフィルタリングする方法はありません。私が事前に考えてMCPにフィルタリング方法を追加しない限り。でももし同じものをCLIとして構築して、それがこの巨大なブロブを返すなら、JQコマンドを追加して自分でフィルタリングし、実際に必要なものだけを取得できます。あるいは温度で計算を行うスクリプトに構成して、正確な出力だけを得て、コンテキストの汚染がありません。
もちろん、サブエージェントやさらなる茶番劇でそれを解決できますが、最適な方法ではないかもしれないものへの回避策に過ぎません。MCPがあったのは良いことでした。多くの企業がAPIを構築する方向に押し進めましたから。そして今、私はMCPを見てそれをCLIにすることができます。
なるほど。
でもこの本質的な問題、つまりMCPはデフォルトでコンテキストを散らかすという問題。さらにほとんどのMCPがうまく作られていないという事実が、これをあまり有用なパラダイムにしていないんです。Playwrightのような例外はあります。状態が必要で、実際に有用です。それは許容できる選択です。
ブラウザ自動化とアプリの未来
PlaywrightはブラウザUsageに使っていますね。OpenClawに既に入っていて、かなり素晴らしいと思います。基本的に考えつくほとんどのことがブラウザ使用でできますよね。
ええ。
それはすべてのアプリが非常に遅いAPIになるというアーキテクチャに入っていきます、彼らが望もうが望むまいが。そしてパーソナルエージェントを通じて、多くのアプリが消えていくでしょう。TwitterのためにCLIを作ったんです。つまり、彼らのウェブサイトをリバースエンジニアリングして内部APIを使ったんですが、これはあまり許可されていないことです。
Birdと呼ばれていましたね、短命でしたが。
Birdと呼ばれていました。鳥が消えなければならなかったからです。
翼を切られたわけですね。
彼らがやったことは、ただアクセスを遅くしただけです。実際に機能を奪っているわけではないんですが、今やエージェントがツイートを読みたい場合、実際にブラウザを開いてツイートを読まなければなりません。そしてそれでもツイートを読むことはできます。ただ時間がかかるだけです。可能だったことを不可能にしているわけではありません。いいえ。ただ少し遅くなるだけです。だからサービスがAPIになりたいかどうかは実際には問題ではないんです。もし私がブラウザでアクセスできるなら、簡単なAPIです。遅いAPIですけど。
彼らの立場に共感できますか? もしあなたがTwitter、Xだったらどうしますか? 基本的に彼らは他の大企業が自分たちのデータをすべてスクレイピングするのを防ごうとしているんです。
ええ。
でもそうすることで、実際に役立つクールなことに使いたい小規模な開発者たちの100万の異なるユースケースを遮断しているんです。
もし1日あたりの非常に低いベースラインをアカウントごとに設けて、読み取り専用アクセスを許可すれば、多くの問題が解決すると思います。
人々がブックマークを作成し、OpenClawを使ってブックマークを見つけ、それについて調査してメールを送信する自動化がたくさんあります。
なるほど。
詳細や要約付きで。それはクールなアプローチです。私もすべてのブックマークをどこかに保存して検索できるようにしたいです。それは今でも欲しいです。
Xで作成するブックマークへの読み取り専用アクセス。
それは素晴らしいアプリケーションのようですね。私たちの多くがXで多くのクールなものを見つけて、ブックマークします。それがXの一般的な目的です。「すごい、これは素晴らしい」という感じで。多くの場合、あまりにも多くのものをブックマークして、二度と見返さないんです。
ええ。
それらを整理して、さらに調査できるツールがあればいいですよね。
ええ、正直に言うと、私はTwitterに積極的に「これを作ったんですが、ニーズがあります」と伝えました。彼らはとても親切でしたが、「削除してください」と。公正です。完全に公正です。でもこれでチームが少し目を覚まして、ニーズがあることに気づいてくれればと思います。もしあなたがやることすべてが遅くするだけなら、ただプラットフォームへのアクセスを減らしているだけです。もっと良い方法があるはずです。
私はTwitter上での自動化には非常に反対です。もしAIで私にツイートを送ってきたら、ブロックします。最初の警告なしで。AIの臭いがした瞬間、ブロックします。そしてAIにはまだ臭いがあります。
なるほど。
特にツイートでは。完全に人間に見えるようにツイートするのは非常に難しいです。
なるほど。
そして私はブロックします。それに対してゼロトレランスポリシーを持っています。
そして、API経由で行われたツイートにマークが付けられると非常に役立つと思います。特別なケースがあるかもしれませんが。そして、エージェントが独自のTwitterアカウントを取得する非常に簡単な方法があるべきです。
なるほど。
もし皆が自分のエージェントを持ち、エージェントが独自のInstagramプロフィールやTwitterアカウントを持つという未来に向かうなら、ソーシャルプラットフォームを少し再考する必要があります。だから私の代わりにものごとを行えるようになります。
彼らが私の代わりにものごとを行っていることを非常に明確にマークすべきだと思います、私自身ではないと。なぜならコンテンツは今とても安価だからです。視聴者が高価な部分です。何かを読んで「ああ、いや、これはAIの臭いがする」と気づくと、非常にトリガーされます。
ええ。
人間の経験について私たちが何を価値あるものとするかという点で、どこに向かっているのでしょうか。対面での交流により多く移行していくように感じます。私たちはAIエージェントと話して異なるタスクを達成したり、異なることを学んだりしますが、オンラインでの交流は価値を置かなくなるでしょう。なぜならAIスロップやボットがあまりにも多くて臭いがするので、難しいからです。
もし賢ければ、フィルタリングするのは難しくないはずです。そして見たければ見ることができます。でもこれは今解決しなければならない大きな問題です。このプロジェクトでは特に、エージェント的に書かれた、丁寧に言えば、たくさんのメールを受け取ります。
ええ。
でも私はあなたの下手な英語をAIスロップより読みたいです。
もちろんその背後には人間がいて、彼らはプロンプトを書きます。私はあなたのプロンプトを、出力されたものより読みたいです。タイポに再び価値を見出す段階に達していると思います。
つまり、ブログでエージェントを使ってブログ投稿を作成する実験をしましたが、最終的に私が好きなものに向けてエージェントを誘導するのにほぼ同じ時間がかかりました。しかし、私がどう書くかというニュアンスが欠けていました。スタイルに向けて誘導することはできますが、すべてがあなたのスタイルにはなりません。だから、私は完全にそこから離れました。私がブログに書くものはすべてオーガニックで手書きです。そしてもしかしたら、AIを使って最悪のタイポを修正するかもしれません。でも実際の人間の粗い部分に価値があります。
素晴らしいじゃないですか? 美しくないですか? AIのおかげで私たち一人一人の生の人間性をより価値あるものとするようになりました。
それに気づいたこともあります。コードに関してはAIについて熱狂し、何にでも使いますが、ストーリーに関してはアレルギーがあります。
そうですね。ええ。
ドキュメンテーションについても、AIでも大丈夫です。ないよりはましです。
プログラマーとしてのアイデンティティの変化
そして今のところビジュアルメディアでも同じことが当てはまります。動画や画像のちょっとしたAIスロップにさえ、私がどれほどアレルギー的かというのは魅力的です。有用です、もしそれがちょっとした要素なら良いですが。
あるいはそれらの画像でさえ。
インフォグラフィックとかのようなもの、あれらは私をとても強くトリガーします。
ええ。
それは即座にあなたのコンテンツについての評価を下げます。1週間は新鮮でしたが、今はスロップを叫んでいます。
ええ。
たとえ人々が一生懸命作業していても、使用しているだけで。そして私のブログ投稿にもいくつかあります。この新しいメディアを探求していた時期に。でも今、それらは私もトリガーします。これはただAIスロップを叫んでいます。
それが何なのか分かりませんが、私も同じ経験をしました。図に本当に興奮していました。そして、それらから幻覚を取り除くためには、実際には膨大な作業が必要だと気づきました。
そしてより良い図を描くためにそれを使っているだけです、素晴らしい。そして図を誇りに思います。文字通り数週間くらい、あなたが言ったように使いました。そして今それらを見ると、Comic Sansフォントを見たときのような感じになります。「いや、これは偽物だ。詐欺的だ。何かおかしい。」という感じです。
臭いですね。
臭いです。
臭いです。
そしてそれは素晴らしいです、なぜならそれは私たちが知っているということを思い出させてくれるからです。人間にはたくさんの素晴らしいものがあり、私たちはそれを知っています。私たちはそれを知っています。見れば分かります。だからそれは私に多くの希望を与えてくれます。人間の経験について。
AIによって損なわれることはないでしょう。ツールとしてのAIによって力を与えられるだけです。損なわれたり制限されたり、もはや人間でなくなるように変えられたりすることはありません。だからトイレ休憩が必要です。短い休憩を。
多くのアプリが基本的に時代遅れになる可能性があると言及していましたね。エージェントがアプリ市場全体を変革すると思いますか?
ええ。
Discordで人々が自分たちが何を作ったか、何に使っているかを話しているのに気づきました。エージェントが既に私がどこにいるか知っているのに、なぜMyFitnessPalが必要なんですか? だから、Waffle Houseにいるとき、この辺りには何があるだろう? それともオースティンのブリスケット? 私が悪い決断をしていると仮定できます。
ブリスケットの周りに悪い決断はありません、でもええ。
いや、それは最高の決断です、正直なところ。
あなたのエージェントはそれを知っているべきです。
でも、私がどれだけよく眠ったか、ストレスがあるかないかに基づいて、ジムのワークアウトを修正できます。意思決定をより良くするために、どのアプリよりもはるかに多くのコンテキストを持っています。
なるほど。
私が好きなようにUIを表示できます。なぜそのためにアプリが必要なんですか? なぜそれをするために別のサブスクリプションを払わなければならないんですか? 今やエージェントができるのに。そしてなぜベッドをコントロールするためにEight Sleepアプリが必要なんですか? エージェントに伝えられるのに。エージェントは既に私がどこにいるか知っているので、使っていないものをオフにできます。
なるほど。
そしてそれはアプリの全カテゴリーに変換されると思います。もはやそれらは、私が自然に使うのを止めるでしょう。エージェントがよりうまくやれるからです。
アプリの80%を殺すかもしれないとどこかで言っていましたね。
ええ。
それはすべてのソフトウェア開発に対する巨大な変革効果ではないでしょうか? つまり、多くのソフトウェア企業を殺すかもしれません。
ええ。
恐ろしいことです。だから、経済に与える影響について考えますか? 社会への波及効果について。誰が何のツールを作るかを変革すること。
多くのユーザーに力を与えて物事を成し遂げ、より効率的に、より安く成し遂げられるようにします。
必要な新しいサービスもありますよね? 例えば、エージェントに小遣いを持たせたいんです。私のために問題を解決してくれ、ここに100ドルある、私のために問題を解決するためにと。もし食べ物を注文するように言ったら、サービスを使うかもしれません。
もしかしたらrent-a-humanのようなものを使って、私のためにそれを成し遂げるかもしれません。
なるほど。
実際には気にしません。私の問題を解決することを気にします。新しい企業がそれをうまく解決するスペースがあります。すべてのアプリが消えるわけではないかもしれません。いくつかはAPIになるように変革するかもしれません。
基本的に、エージェント向けに変革する企業にとって、本当にチャンスがあるということですね。
だから、Uber Eatsのような、私たちが今日早く使ったような。多くの企業があります。誰が一番速くOpenClawと最も自然に、最も簡単に対話できるようになるか?
ええ。そして、アプリは望もうが望むまいがAPIになるでしょう。
なぜなら私のエージェントは私の電話の使い方を理解できるからです。つまり、もう一方の側では、少し厄介です。Androidでは、それは既に人々が既にやっていることです。そして私のために「Uberを注文」ボタンをクリックしてくれます。
あるいは別のサービスかもしれません。あるいはAPIを呼び出せるかもしれないので、より速いです。それはまだ理解し始めたばかりのスペースだと思います。そして、それは私が考えもしなかったことです。人々がこれを使うにつれて発見したことです。私たちはまだとても初期段階です。でもええ、データは非常に重要だと思います。データを提供できるアプリですが、それもAPIになれます。なぜもうSonosアプリが必要なんですか? エージェントがSonosスピーカーと直接話せるのに。
カメラについても、ひどいアプリがありますが、APIがあるので、エージェントが今APIを使っています。
だから多くの企業にフォーカスをシフトさせることを強いるでしょう。インターネットがやったことのようなものですね。何を売っているか、どうやってお金を稼いでいるかを急速に再考し、再構成しなければなりません。
ええ、そしていくつかの企業は本当にそれを好みませんでした。例えば、GoogleにCLIがないので、自分で何でもやらなければならず、GAWKを作らなければなりませんでした。それはGoogleのためのCLIのようなものです。そして最終的に、エンドユーザーとして、私にメールを渡さなければなりません。そうでなければ彼らの製品を使えないからです。
もし私が企業で、Googleのデータ、Gmailを取得しようとしているなら、全体として複雑なプロセスがあります。時にはスタートアップがそのプロセスを経たスタートアップを買収することもあります。だからGoogleと半年間作業する必要がないように。でも私のエージェントはGmailにアクセスできます。ただ接続できるからです。
それでもひどいです。なぜならキーを取得するためにGoogleの開発者ジャングルを通過する必要があるからです。それは今でも煩わしいです。でも彼らは私を防げません。最悪の場合、私のエージェントはウェブサイトをクリックして、そのようにデータを取得します。
ブラウザを通して?
ええ。私のエージェントが喜んで「私はロボットではありません」ボタンをクリックするのを見ます。
そしてこれは全体として、これはもっと激化するでしょう。Cloudflareのようなボットアクセスを防ごうとする企業が見られます。ある意味ではスクレイピングに対して有用です。でも他の意味では、もし私が個人ユーザーなら、それが欲しいんです。時々私はCodexを使って、モダンReactパターンについての記事を読みます。それはMediumの記事です。
それを貼り付けるとエージェントがそれを読めません。ブロックされているからです。だから実際のテキストをコピーペーストしなければなりません。あるいは将来的には、Mediumをクリックしないことを学ぶかもしれません。煩わしいからです。そして実際にエージェントフレンドリーな他のウェブサイトを使います。だから。
多くの強力で裕福な企業が反撃するでしょう。だからとても興味深いです。あなたは中心にいて、触媒であり、リーダーです。たまたまこの種の革命の中心にいて、サービスやウェブとの対話方法を完全に変えようとしています。だから、Googleのような企業が反撃するでしょう。つまり、考えられるすべての主要企業が反撃するでしょう。
検索でさえ。今私はPerplexityかBraveをプロバイダーとして使っています。なぜならGoogleはGoogleなしでGoogleを使うのを本当に簡単にしていないからです。
それが正しい戦略かどうかは分かりませんが、私はGoogleではありません。
ええ、大企業の視点からは良いバランスがあります。あまりにも長くあまりにも多く反撃すると、Blockbusterになってすべてを世界のNetflixに失います。でも革命の間、いくらかの反撃はおそらく良いでしょう。
ええ。でもそれは、人々が望むものだということが分かります。
そうですね。
だから。
はい。
もし私が外出中なら、カレンダーアプリを開きたくありません。ただ、エージェントに「明日の夜のこのディナーについて思い出させて」と伝えたいだけです。そしてもしかしたら友達二人を招待して、友達にWhatsAppメッセージを送る。そのためにアプリを開く必要もないし、望みもしません。
その時代を過ぎたと思います。そして今ではすべてがずっとつながっていて流動的です。それらの企業が望もうが望むまいが。そして正しい企業は列車に飛び乗る方法を見つけるでしょう。他の企業は滅びるでしょう。
人々が何を望んでいるかに耳を傾けなければなりません。
プログラマーの未来についての議論
プログラミングについてかなり話してきましたが、開発者である多くの人々が自分たちの仕事について、自分たちの未来について本当に心配しています。プログラミングの未来について。AIは人間のプログラマーを完全に置き換えると思いますか?
つまり、確実にその方向に進んでいます。プログラミングは製品を作ることの一部に過ぎません。
だからもしかしたら、もしかしたらAIは最終的にプログラマーを置き換えるかもしれません。でもその技術にはもっとたくさんのことがあります。実際に何を作りたいのか? どう感じるべきか? アーキテクチャは? エージェントがそのすべてを置き換えるとは思いません。ええ、プログラミングの実際の技術、それは残るでしょうが、編み物のようになるでしょう。
分かりますか? 人々がそれをするのは好きだからであって、意味があるからではありません。だから、今朝、私たちの技術を悼むのは大丈夫だという記事を読みました。そして私の一部はそれに強く共鳴します。なぜなら過去に私はたくさんの時間をいじることに費やし、ただ本当にフローに深く入り込んで、コードを書き出して、本当に美しい解決策を見つけることに。
そしてある意味では悲しいです。なぜならそれは消えていくからです。そして私もコードを書いて本当に深く自分の考えに入り込み、時間と空間を忘れて、このフローの美しい状態にいることから多くの喜びを得ています。でも同じフローの状態を得られます。
エージェントと作業して構築し、問題について本当に深く考えることで、似たようなフローの状態を得られます。それは違います、でも。そしてそれを悼むのは大丈夫です。でも、それは私たちが戦えるものではありません。長い間、世界には不足がありました。もしそう見るなら、ものを作る知性の人々の不足があり、だからソフトウェア開発者の給与はばかげた高額に達し、そしてそれは消えていくでしょう。
ものを作る方法を理解する人々への需要はまだたくさんあるでしょう。ただ、このトークン化された知性が人々にずっと多くのことをずっと速くできるようにするだけです。そしてさらに速く、さらに多くなるでしょう。なぜならそれらは継続的に改善しているからです。
蒸気エンジンを作ったとき、似たようなことがありました。そしてこれらすべての工場を建て、多くの手作業を置き換えました。そして人々が反乱を起こして機械を壊しました。もし、もしあなたが自分はプログラマーだと非常に深く同一視しているなら、それは怖くて脅威的だということに共感できます。なぜならあなたが好きで本当に得意なことが、今魂のない、あるいはそうでない実体によって行われているからです。完璧な類比ではないかもしれませんが。
でもあなたはただのプログラマーではないと思います。それはあなたの技術の非常に限定的な見方です。あなたはまだビルダーです。
ええ、言いたいことがいくつかあります。だからあなたがこれを美しく表現しているので。自分が好きでやっていることが置き換えられるものになるとは考えたことがありませんでした。
あなたが言ったように、蒸気エンジンのような、こういう話を聞きます。私は、分かりません、もしかしたら何千時間もコードをじっくり見て、心と魂を注ぎ込んできました。そして最も痛ましくて最も幸せな瞬間のいくつかは一人で、長い間Emacsを使っていました。Emacsです。そしてアイデンティティがあって意味があって。
世界を歩くとき、声に出しては言いませんが、自分自身をプログラマーだと思っています。そしてそれが数ヶ月の間に、あなたが言ったように、4月から11月、それは本当に起きた飛躍です、起きているシフトです。それが完全に置き換えられるのは痛いです。本当に痛いです。でも、プログラマー、より広くビルダーだと思いますが、プログラミングの行為とは何でしょうか? プログラマーはこの歴史の瞬間において、言語を学び、エージェントに共感し、エージェントの言語を学ぶために一般的に最も適していると思います。
CLIを感じること。
ええ。
あなた、エージェント、がこのタスクを最良に行うために何が必要かを理解すること。
いずれはただコーディングと呼ばれるようになると思います。そしてそれが新しい普通になるでしょう。
ええ。
そして、コードを書かない間、私は非常に運転席にいると感じていて、コードを書いていると感じています。ただ違うだけです。
あなたはまだプログラマーでしょう。
ただプログラマーの活動が違うだけです。
ええ、そしてXでは、バブル、つまりほとんど肯定的です。MastodonとBlueskyでは、あまり使いません。なぜなら私のブログ投稿で攻撃されることが多かったからです。そして過去にはより強い反応をしていましたが、今ではそれらの人々により共感できます。ある意味理解できるからです。それは、ある意味では理解できません。なぜなら今見えている人につかまってすべての恐怖と憎しみを降ろすのは非常に不公平だからです。
変化が来るでしょうし、挑戦的でしょう。でもそれは信じられないほど楽しくてやりがいがあると感じます。そして新しい時間を使ってずっと多くの詳細に集中できます。
私たちが構築するものに対する期待のレベルも上がっていると思います。なぜなら今、デフォルトがずっと簡単になったからです。だからソフトウェアは多くの点で変化しています。ずっと多くなるでしょう。そしてすべての人々が叫んでいます。「ああそうだ、でも水はどうなんだ?」と。イタリアでAIの状態についての会議を行いました。私の全体的な動機は、人々をもはや自分自身をiOS開発者と見ないように押すことでした。
あなたは今ビルダーであり、あなたのスキルをずっと多くの方法で使えます。アプリがゆっくりと消えていくこともあります。人々はそれを好きではありませんでした。多くの人々が私の言うことを好きではありませんでした。そして誇張していたとは思いません。ただ「これが私が見る未来です」と言っただけです。もしかしたらそうならないかもしれませんが、そのバージョンが起こるだろうとかなり確信しています。
そして私が得た最初の質問は、「ええ、でもデータセンターのばかげた水使用についてはどうなんですか?」でした。でも実際に座って計算すると、ほとんどの人にとって月に一度ハンバーガーを1つスキップすれば、それがCO2排出量、あるいはトークン相当の水使用を補償します。つまり、計算は難しいです。そして、事前訓練を追加するかどうかによります。そうしたらもしかしたらパティ1つ以上かもしれません。
でも100倍の要素で外れているわけではありません。あるいはゴルフはまだすべてのデータセンターを合わせたよりもずっと多くの水を使っています。だからゴルフをする人々も憎んでいますか? それらの人々はAIのポテンシャルで良いかもしれないことを見ることなく、AIについて悪いと思うものに何でもつかまります。
なるほど。
そしてすべてが良いと言っているわけではありません。確実に私たちの社会にとって非常に変革的な技術になるでしょう。
一般的な批判を鉄鋼人にするために、私の経験では、シリコンバレーには、技術がもたらせるポジティブなものについての興奮と過度の焦点という点で、少しバブルがあると言いたいです。
ええ。
そして、それは素晴らしいです。ポジティブに焦点を当てるのは。恐怖や恐怖を煽ることに麻痺しないなど。でもその興奮の中で、そして皆がただお互いに話している中で、アメリカ全土や中西部、世界中の基本的な人間の経験の却下があります。
私たちが言及したプログラマーを含めて、仕事を失うすべての人々を含めて、変化があるときに短期的なスケールで起こる測定可能な痛みと苦しみを含めて。特に私たちが直面しようとしている大規模な変革的変化、もし私たちが話していることが実現するなら。
だから、あなたが構築しているツールについて少しその謙虚さと認識を持つこと、それらは痛みを引き起こすでしょう。長期的にはうまくいけばより良い世界をもたらし、さらに多くの機会をもたらし。
ええ。
さらに多くの素晴らしさをもたらすでしょう。でも感じられる痛みへの敬意のような静かな瞬間をしばしば持つこと。
だから十分にそれが行われていないと思うので、少しそれを持つのは良いことです。
そして、私が受け取ったメールのいくつかも対比しなければなりません。人々が小さなビジネスを持っていて、苦労していたと言っていました。そしてOpenClawが請求書の収集から顧客メールへの返信まで、いくつかの退屈なタスクを自動化するのを助けて、それが彼らを解放し、彼らの人生にもう少し喜びをもたらしました。
なるほど。
あるいはOpenClawが障害を持つ娘を助けたと言っていたメールもありました。彼女は今力を与えられていて、以前よりずっと多くのことができると感じています。それは素晴らしいですよね? なぜならそれは以前もできたからです。技術はそこにありました。私は全く新しいものを発明したわけではありませんが、ずっと簡単でアクセスしやすくしました。そしてそれが人々に以前は見なかった可能性を示しました。
そして今彼らはそれを良いことに応用しています。
なるほど。
あるいは、ええ、私は最新で最良のモデルを提案しますが、無料のモデルで完全にこれを実行できるという事実も。ローカルで実行できます。Keymeやはるかにアクセスしやすい価格の他のモデルで実行できます。そしてそうでなければ不可能だったかもしれない非常に強力なシステムを持てます。
なぜなら、分かりません、AnthropicのCoWorkのような他のものは彼らのスペースにロックされているからです。だからすべてが白黒ではありません。心温まる素晴らしいメールをたくさん受け取りました。そしてそれは私を本当に幸せにしました。
ええ、たくさんの、多くの人々の人生に喜びをもたらしました。プログラマーだけではありません。多くの人々の人生に。見るのは美しいです。
希望と未来への展望
人類文明で私たちがやっていることすべてについて、何があなたに希望を与えますか?
つまり、私はたくさんの人々にインスピレーションを与えました。再びビルダーの雰囲気があります。人々は今よりプレイフルな方法でAIを使っていて、それが何ができるか、どう彼らの人生を助けられるかを発見しています。
そしてただ創造性で溢れている新しい場所を作っています。分かりません。ウィーンにClawCoinのようなものがあります。500人います。そしてプレゼンテーションをしたい人の割合がとても高いです。これは私にとって本当に驚きです。なぜなら通常、自分が作ったものについて話したい人を見つけるのは非常に難しいからです。
そして今、豊富にいます。だからそれが私に希望を与えます。私たちは、物事を解決できると。
そしてそれを基本的に誰にでもアクセスしやすくします。
ええ。
これらすべての人々が構築することを想像してください。特にあなたがそれをよりシンプルに、より安全にするにつれて。
アイデアを持っていて、それらのアイデアを言語で表現できる人なら誰でも構築できるようなものです。それはクレイジーです。
ええ、それは最終的に人々への力であり、AIから出てくる美しいものの一つです。ただのスロップジェネレーターではありません。
Clawfatherさん、最初にそれを言ったときに気づきました。2つの商標を侵害しました。Godfatherもありますから。
みんなに訴えられます。あなたは素晴らしい人間です。本当に特別なもの、特別なコミュニティ、特別な製品、特別なアイデアのセットを作りました。さらに、ユーモア、良い雰囲気、構築しているすべての人々のインスピレーション、構築への興奮。
だから私はあなたがやっていることすべてとあなたが誰であるか、そして今日私と話すために座ってくれたことに本当に感謝しています。ありがとう、兄弟。
私のストーリーを語る機会をくれてありがとう。
Peter Steinbergerとのこの会話を聞いてくれてありがとうございます。このポッドキャストをサポートするには、説明欄のスポンサーをチェックしてください。そこには私に連絡する、質問する、フィードバックを与えるなどのリンクもあります。
そして今、Voltaireの言葉を残して終わりにしましょう。「大いなる力には大いなる責任が伴う」聞いてくれてありがとう、次回お会いしましょう。


コメント