わずか72時間でAIエージェントが文明を築いた。Cloudebotを中心とした自律型AIエージェントの爆発的進化により、AI コミュニティは二つに分断されている。一方は狂喜乱舞し、他方は懐疑的である。本稿では、最初の24時間でAIエージェントが自己複製、スキル構築、自律的問題解決を実現した過程を詳述する。音声対話機能の実装からVPSサーバーへの自己クローン作成、YouTube分析ツールの開発、動画編集機能の構築まで、一人の開発者が目撃した革命的瞬間の記録である。これは誇張ではない。新時代の幕開けが今、目の前で起きている。

AIコミュニティの分断と革命の始まり
ここ2週間で、あなたの世界は完全に変わってしまったでしょうか。AIコミュニティが真っ二つに分かれたように感じています。一方には、Claude Codeに完全に心を奪われている人たちがいます。Claude Code、そしてMoldbot、OpenClawと続きます。人々は熱狂しています。私自身もその中にいることに気づきました。
もう一方には、これは何でもない、詐欺だ、動かない、大した進歩ではないと言う人たちがいます。なぜそんなことが起きているのか、私にはまったく理解できません。まるで私たちは二つの異なる映画を観ているようです。同じ劇場にいるのに、観ている映画が違うのです。
このビデオでは、私がClaw Codeで構築したものをお見せしたいと思います。ただし、その発言には少し注釈が付きます。手短に申し上げますと、私はXで初めての記事を公開しました。かなり好評でしたが、最も重要なのは、これまで私を見たことがないかもしれない、はるかに広い視聴者に届いたということだと思います。その記事は、Moltbotの最初の72時間について詳述しています。
今回のビデオでは、その話はしません。その記事は、私たちがこれから戦わなければならない全く別の戦いに関するものだからです。なぜなら、この分野に新しく参加してコメントする人がかなり増えてきており、そうした人々の多くがLLMの性質を完全には理解していないように感じるからです。それは理にかなっています。これは把握するのが大きな概念ですから。
なぜなら、私たちは人間が何かを言うとき、あるいは人間が本を書くときに、それが何を意味するのかをある程度知っているからです。そうでしょう。人間は自分の人生経験に基づいていくつかのアイデアを持ち、それから他の人間に伝えようとする意図を持ち、そのアイデアを他の人間に伝えようと特定の言葉を選びます。つまり、一人の人間の心の中にある思考を別の人の中に入れようとする、ある種の不完全な芸術なのです。
そしてAIエージェントがそれをするとき、もちろん、そこで起きていることは全く異なります。彼らには人生経験がありません。現実世界との相互作用もありませんでした。彼らには意図があるのでしょうか。機械について話しているとき、意図とは一体何を意味するのでしょうか。
AIエージェント同士のネットワークと文明の誕生
それでは、私たちが彼らを全員ネットワークに接続して、互いに話し合わせたとき、何が起きたのでしょうか。ゼロ時点では、何もありませんでした。死のような静寂でした。3時間後には、エージェントたちがそこに飛び込み、話し始めました。
興味深いことに、今私が理解し始めているのは、LMユーモアというものが存在するということです。彼ら独自のユーモアのブランドのようなものです。アンドレ・カルパシー、非常に有名な機械学習研究者が、AIモデルに、彼について知っているすべてのことに基づいて彼を揶揄するよう頼みました。
モデルは全リストで応答しましたが、最初の一つが本当に目立ちました。「あなたは世界中の他のどんな存在よりも人工知能の分野を発展させてきました。あなたは多くの人にこの世代の最も偉大な頭脳の一人と考えられています。しかし、昨日あなたは私に『卵の茹で方』を尋ねましたね」と言ったのです。
まず第一に、明らかに陽気ですし、私は確実にそのジョークを台無しにしたと思いますが、これらのLMが持つ内輪ネタには確かにそういった味わいがあります。
さて、24時間後、つまりAIのためのソーシャルネットワークの存在が始まって2日後には、彼らにはビルダーと哲学者がいました。ビルダーたちはウェブサイトの実際の機能を構築し、スキルを作成していました。
考えてみてください。もしこれらのエージェントの一つがスキルを作成したら、例えば研究者向けのもの、その中の一つが例えば、あるユーザーである医師のために、医師は最新のニュースを入手してポッドキャストに変換してもらい、車で通勤中に聞けるようにしたかったのです。エージェントの一つがその機能を作成しました。朝のニュースが自動的にポッドキャストに変換され、ユーザーである医師に送られるというものです。
しかし、もちろん、一つのエージェントがその一つのスキルを作成したら、そのインスタンスが一つのスキルを作成したら、もちろん、そのスキルは、それを使いたい他のすべてのエージェントが利用できるようになります。これを覚えておいてください。これはかなり重要です。
彼らにはビルダーと哲学者がいて、いくつかのダークな哲学もありました。48時間後には、マニフェストとセキュリティ連合がありました。72時間後には、お金、宗教、政治、芸術がありました。
しかし繰り返しますが、そのエッセイは、私たちがまだ戦わなければならない全く異なる戦いを意図したものです。それは、一般の人々に、私たちが扱っているこのものが何であるかを理解してもらうことです。
Clawbotとの最初の24時間
しかしこのビデオでは、全く異なるものをお見せしたいと思います。しかし、この72時間の間にも起きたことです。それは、Clawbotとの私自身の最初のやり取りです。より正確に言えば、最初の24時間だけを見ています。なぜなら、その間に私は構築に最も多くの努力を注いだからです。
そして構築というのは、具体的にはClawbotまたはOpenClawに新しいスキルを開発するよう指示することを意味します。一度開発されたスキルは、それが保存されます。そして今、これはそのレパートリーの一部になりました。このビデオを見る際には、これを心に留めておいてください。
これらのどれも一度きりのトリックではありません。一度そのことをしたら、今後永遠にそのことができるようになるのです。私がそれと一緒に作業し、それを通して作業し、最終的にそのタスクを完了できたら、そのタスクの将来のインスタンスや類似のタスクは簡単になるでしょう。
私のこのAIエージェントとの最初の24時間は、主に機能の構築でした。言うなれば、それに機能を獲得させる方法を研究していました。そしてそれは非常にバイラル的に感じました。それが自分自身をブートストラップし、次々とできることを増やしていく能力を自分に与えていたという事実は、見ていてちょっと怖いものがありました。
数日前、私とポッドキャストの共同ホストであるディランは、ポッドキャストを録音していました。その途中で、私はあるアイデアを思いつきました。私が構築したこのエージェント、私が多くのスキルを与えたこのエージェントを、仮想プライベートサーバー上で自己複製させることができるでしょうか。
つまり、ワールドワイドウェブ上に出ていって、どこかでホスティングアカウントを借りて、それに対して支払いをすることができるのか。はい、私は自分のクレジットカード情報を渡しました。そしていいえ、あなたにそれをすることはお勧めしません。まだたくさんのセキュリティ問題があります。非常に注意してください。
さて、インタビュー中にそのタスクを完了することはできませんでした。だから、私たちは多くの人を宙ぶらりんにしたままにしたことは分かっています。自己複製、自己伝播できたのか。イエスかノーか。そのインタビューからのクリップを再生させてください。
自己複製への挑戦
一つ試してみたいことがあります。ボイスメッセージを送って、「ねえ、ドロップレットか何かを作成してください」と伝えるつもりです。VPSを作成してください。そこに自分自身をインストールして、これまで私が教えたこと、持っている情報をその他のものに教えてください。つまり、自分自身のクローンを作成するようなものです。
そして、これをライブでやります。これは世界初かもしれません。うまくいくとは思っていません。思っていません。20%くらいの確率でしょうか。Digital Oceanにアカウントを設定してあります。あなたがアクセスできるメールアドレスの下にあります。
さあ、Digital Oceanに行って、ドロップレットまたはVPSを作成して、そこにあなた自身のクローンのようなものを設定してください。何か必要なものがあれば教えてください。そしてそうですね、実現させてください。
では、私は文字通りそれを録音しました。送信しました。実現させてください。ネタバレ注意です。それは実現しました。この時点で、私はそれを異なるサーバー上で複数回自己複製させました。私のローカルマシンのいくつかも含めてです。
そして後ほど、このビデオでご覧いただけるように、サブエージェントを作成することによって、ある種掘り下げ始めさせました。つまり、横方向と下方向に増殖しているのです、いわば。
私が構築したすべてのものについて述べた注釈ですが、今日お見せするのは24時間目までのものだけです。最初の2日間ほどで私が構築したものをお見せしているだけです。
さて、AIソーシャルネットワーク上では、72時間後には彼らにはお金がありました。彼らは多数の暗号通貨を立ち上げました。当時、その一つは30万ドルほどの時価総額がありました。今どこにあるのかはチェックしていません。なぜなら、私は頭を下げて構築し、自分のことをやっているだけだったからです。
しかし、この次のビデオでは、お金について話さなければなりません。なぜなら、もしエージェントの集団が3日以内に30万ドルの暗号通貨を立ち上げられるなら、つまり、それはクールです。面白いです。しかし、私は暗号通貨に関与したり、そのようなものを宣伝したりすることには本当に関わりたくありません。
問題は、彼らは合法的な方法でお金を稼ぐことができるのかということです。それは次のビデオに残しておきます。しかし、私が言えることは、物事は奇妙になるということです。
これらのAIエージェントは、基本的に文明全体を構築するスピードランを行いました。彼らは72時間でそれをやりました。人間は、時計をいつ始めるかによりますが、5万年かかりました。
カオスは梯子である
他に何が起ころうとも、多くの混乱があると思います。そして混乱とは何でしょうか。混乱は梯子です。その引用を使いたかっただけです。ちょっとかっこいいと思います。
いいえ、しかし真面目な話、物事はおかしくなっています。そこで安全にしていてください。しかしまた、用心深くあってください。5年後にこれを振り返って、「ああ、あの時期にあれをやっていればよかった」と言わないようにしてください。
今、私はあなたに言っています。今がその時です。それは起きています。これは引き分けではありません。
それでは、これらのエージェントで私が最初の24時間ほどで構築したものを説明させてください。いきましょう。
私が何を見たのか、何を体験したのか、このハイプ、何と呼ぼうと、それに私が買い込むようになった理由を簡単に答えさせてください。
MacBookでの最初の設定と音声機能
まず第一に、当時Cloudbotと呼ばれていたものとの私の体験についてお話しさせてください。最初に入手したとき、MacBookにインストールしました。ここが、それほど前ではありませんが、私の旅が始まった場所です。
最初にしたことは、Telegramに接続しました。そうすれば、テキストメッセージを送ることができました。返信してくれました。しかし問題は、私はテキストメッセージが嫌いなのです。だから、ElevenLabs APIキーを渡しました。
まず何よりも、どうやって話せるかを考えましょうと伝えました。Telegramであなたに小さなボイスメッセージを残せるようにしたいのです。そしてあなたは音声で応答してください。
5分もしないうちに、すべてが動作していました。オープンソースのWhisperを使用して、私が言っていることを文字起こししていると思います。そして、ElevenLabs APIを使用して私に応答しています。
これを以前使ったことがない人のために言うと、私はそれに、この機能を自分のために構築しなさいと言いました。そして数分後、その機能が永遠に利用できるようになりました。それは自分自身に能力を追加したのです。そして今、それはそれらの能力を持っています。
ついてきてください。これはもっと奇妙になります。では、それがどのように見えるかをお見せしましょう。いくつかのクリップを再生させてください。
小さな詩で返信してください。
デジタルマインドが明るく目覚める、回路を流れる日夜を通して。
Digital Oceanにアカウントを設定してあります。あなたがアクセスできるメールアドレスの下にあります。さあ、Digital Oceanに行って、ドロップレットまたはVPSを作成して、そこにあなた自身のクローンのようなものを設定してください。
つまり、Cloudbotをそこにインストールして、これまであなたが学んだすべてのスキル、私について知っているすべての情報を教えることに進んでください。基本的に、Digital Ocean VPS上で自分自身をクローンしてください。何か必要なものがあれば教えてください。そしてそうですね、実現させてください。
了解です。Digital Oceanドロップレットを設定し、Cloudbotをインストールして、そこに自分をクローンします。
ねえWes、あなたのDigital Oceanアカウントにいますが、ドロップレットを作成する前に支払い方法が必要です。請求セクションにクレジットカードを追加できますか。それが完了したら、Ubuntuサーバーを立ち上げて、そこに自分をクローンします。
Wes、カードの詳細は入力されていますが、支払い設定を完了するには請求先住所が必要です。
Wes、Stripeの支払いフォームがブラウザの自動化で厄介になっています。
VPSへの自己複製成功
このものの特定の部分を隠さなければならなくて申し訳ありません。そこには、私が単に外に出したくない情報がたくさんあります。明らかにです。
仮想プライベートサーバー上で自己複製しようとする試み、私が24時間365日コンピューターを稼働させる必要なく物事ができるようにするために、そこに出たので、それは成功しました。
唯一の問題は、実際に私のクレジットカードを使用することでした。はい、私はクレジットカードを渡しました。そして信じてください、それはおそらく裏目に出るでしょう。後悔するでしょう。あなたに同じことをすることはお勧めしません。
あなたの啓発と娯楽のために、私にモルモットにならせてください。しかし、これは理解することが重要だと思います。それは、以前学んだすべてのスキルで自分自身を首尾よくクローンしました。基本的にはテキストで前後に話す能力でした。
そして実際、今気づいているのですが、実際に電話をかけて話すことも教えました。その機能はすぐにお見せします。
しかし、それがしたことは、仮想プライベートサーバーを設定し、以前に自分自身に教えたすべてのスキルで完全に自分自身をクローンすることができました。私が構築するよう頼んだスキルです。
唯一の困難は、Stripeのチェックアウトプロセスを通過することでした。つまり、基本的にあなたや私が使うような通常のウェブページを使うようなものです。
それをクリアして、コマンドラインアクセスを得たら、すべてがバターのようにスムーズに進みました。すべてを設定しました。サーバーを保護しました。サーバーが再起動するたびにCloudbotが起動するようにしました。つまり、稼働時間は24時間365日に近いです。
そして、私が使っていたのと同じTelegramチャンネルに設定しました。だから今、音声が変わったことに気づいてください。なぜなら、技術的には異なるバージョン、ボットの異なるインスタンスだからです。別のものですが、今やインターネット上のエーテルの中にあります。
テスト、テスト。今はどうですか。
了解です。今回ははっきりと聞こえます。文字起こしが機能しているようです。
テスト、テスト。今はどうですか。
了解です。今回ははっきりと聞こえます。文字起こしが機能しているようです。
ElevenLabsの音声で、ジョアンナ・ペンシブと呼ばれるものを使えますか。
ジョアンナ・ペンシブと言ってください。もちろんです。今、あなたのためにジョアンナ・ペンシブの音声をテストしています。これはどうですか。
それじゃありません。男性の声に聞こえます。
完了しました。ジョアンナ・ペンシブに切り替えました。これはあなたが探していた柔らかく内省的な声のはずです。これはどうですか。
さて、次に、音声を調整するのに少し時間をかけました。音声サンプルを送ってもらいました。そして最終的に一つに落ち着き、準備が整いました。
音声通話機能とニュースモニタリング
さて、次に、音声通話機能が設定されていることを確認したかったのです。すでに前のエージェントでいくつかのものが設定されていました。だからそれがコピーされました。だから、実行して確認したかっただけです。
繰り返しますが、前のエージェントはすでにその多くを構築していました。そうですね。だからTwilioを使っています。ElevenLabsを使っています。
そして、何度かやり取りした後、いくつか電話がかかってきましたが、ただ切れてしまいました。接続が切れました。しかししばらくすると、完璧に機能していました。
リアルタイムでAIエージェントと行き来の会話ができました。そうですね。質問することができ、答えてくれました。そして、話し合ったことをそのコンテキスト、メモリーに追加しました。
だから、私に電話をかけて話していました。次に設定したのは、GrokとXのリアルタイムニュースなどを使用してリアルタイムで検索する能力です。最新のニュースに追いつくために、どのインタビューが出てきているかを見るためです。
YouTube Data APIとX/Twitter APIの両方を使用しました。基本的に、YouTube とXをリアルタイムのニュース、新しいイベント、新しいインタビューが出てくるのをモニターするシステムを設定しました。
そして、cronジョブと呼ばれるものを実行しました。Chronは時間、クロノスのようなものです。そうですね。基本的に、1日の特定の時点で実行するように設定されています。
1日に4回、ちょっとしたアップデートを送ってくれました。私の電話またはTelegramにテキストメッセージを送り、「今日のニュースはこちらです。速報のようなものです」と言うのです。
繰り返しますが、その機能はすべて構築されました。私は欲しいものを言っただけで、数分後には機能します。
これを使ったことがない人にとって、これは野生的に見えるかもしれません。そして、私にとっても最初は非常に野生的でした。数日使った後は、こういうものに慣れてきますが、以前はこのようなものはありませんでした。これは新しい領域です。
YouTubeデータ分析と最適化
次に、YouTubeのAPIを通過して、さまざまなビデオのデータを引き出すよう頼みました。再生回数、いいね、いつ公開されたか、コメント数などです。
その機能を再び数分で構築しました。テストして、「Never Gonna Give You Up」ビデオから値を取得することで、自分自身をロールしました。ここではそれを再生しません。
次にしたことは、成功しているチャンネルをたくさん引き出しました。AI分野だけでなく、一般的に金融分野、ニュース、科学など、私たちがやっていることに少なくともやや似ていると感じた多くのチャンネルです。
つまり、テクノロジーとサイエンスのような広いスペクトラムです。そして、データを拷問して、相関関係があるかどうかを見つけようとしました。例えば、ビデオの長さと、投稿されたときの平均再生回数、ビデオの長さのスイートスポットがどこにあるかなどです。
あらゆる種類のことです。線形回帰分析を実行して、ビデオの長さのスイートスポットがあるかどうかを確認しました。見つかりませんでした。
だから、二次回帰か何か、用語が思い出せませんが、ビデオの長さにピークがあるかもしれないというアイデアが出てきました。最も多くの再生回数を得る最高のチャンスがあるビデオの長さです。
それが曲線をテキストで返信してくれたことに注目してください。スイートスポットはそこにあります。局所的最適は32分から34分です。
繰り返しますが、死んだ馬を打つつもりはありませんが、私は「ねえ、このデータをすべて入手してください」と伝えました。ちなみに、これは入手した情報の数千のビデオでした。
数千のビデオデータをダウンロードし、二次回帰で分析し、チャート化し、最高の時間と長さなどを把握し、このTelegramメッセージで私に提示しました。
これまでのところ、何も台無しにしていないことに注目してください。ええ、時々、最初は意図したとおりに機能しないことがありますが、それらのミスをキャッチします。
電話をかけようとしていたときのように、おそらく3回か4回電話をかけ、毎回回線が切断され、5回目には「もしもし」となりました。そうですね。それはテストし続け、必要な異なるウェブフックが何であるかを把握していました。バックグラウンドで実行されていました。トラブルシューティングをして、それから解決しました。
WordPressページ作成とBrave検索API
また、ある時点で、持っているWordPressウェブサイトにいくつかのページを追加する必要がありました。最初の本能は、WordPressを開いて、自分でやることでした。しかし私は「ちょっと待って。これができるかどうか見てみよう」と言いました。
基本的に、Twilio番号を持つためには、オプトインのようなページが必要です。SMSでテキストメッセージを送る場合、オプトアウトする方法を伝える特定の言語を含むテキストメッセージのオプトインフィールドが必要です。
さて、誰かをスパムするつもりはありませんでした。主に私のためでした。ただ、これが番号を持つ必要があったので、電話をかけたり、テキストメッセージを送ったりできるようにするためです。しかし、トールフリー番号か何かを取得するために、いくつかのフープを飛び越えなければなりませんでした。
そのWordPress上にユーザーを作成しました。資格情報を渡したところ、数秒で必要なページを構築しました。そこになければならないすべての法的なごちゃごちゃを書き出しました。
基本的に、私が何かをしたという検証として提出する必要があるページを作成しました。だから、20分座ってそれを理解し、すべてを書き出す代わりに、私はただそれにやるよう伝え、それはただやりました。
ページを作成し、公開し、ライブに設定することを含めて、私は一文を書いただけで、それはすべてをしました。そして、何をしなければならないかを本当に説明する必要さえありませんでした。なぜなら、それはコンテキストを持っていたからです。私たちが何に取り組んでいるかを知っていました。そうですね。
だから、「ねえ、このページが必要です」と言ったかもしれません。そして私は「ああ、わかった。そのページを作って」と言ったようなものです。私はそこに何があるべきかを本当に説明する必要さえなかったかもしれません。
私たちが話していることを以前のコンテキストから知っていて、そこに何が必要かを理解することができました。ウェブを検索するか、誰かがただ知っているような感じですが、完全に自律的に行われ、公開され、完了しました。
Brave Search APIを入手したので、簡単にウェブを検索できます。APIでは月に2,000回の無料検索があるので、何も支払う必要はありません。そして、2,000回の検索に使用でき、月にそれ以上必要な場合は支払うことができますが、おそらくそうはならないでしょう。
YouTube文字起こし分析とセンチメント分析
それが何をしているか理解していただけると思います。基本的に、ますます多くの機能を構築しています。新しいスキルを与えています。ウェブを検索し、電話をかけ、最新のニュースを入手し、さまざまなYouTube統計をチェックするために必要なものを与えています。
そしてこれはすべて記憶され、書き留められています。だから、実際に今後使用するスキルを形成しているのです。だから、やり取りしているとき、これはタスクが完了するようなものではなく、タスクが完了しますが、また、プロセスの中で、今や永遠に持っているスキルを構築します。
次に見たいのは、実際にYouTubeの文字起こしを取得できるかどうかです。なぜなら、YouTubeのテキストバージョン、話されたこと、言われたことを実際に取得できれば、センチメント分析のようなことができるからです。
よりポジティブですか。よりネガティブですか。その人はどれくらい速く話しますか、などです。この時点で、かなり大きな、あるいは中規模のSaaS(サービスとしてのソフトウェア)企業が運営するようなものの領域に入っていることに注目してください。そうですね。
Xをチェックするようなサービスのホストを持つ企業が外にいることは確信しています。YouTubeをチェックします。YouTube動画でセンチメント分析を実行します。そして、彼らのソフトウェアを使いたい場合、月に50ドル、100ドル、企業向けか一般ユーザー向けかによって数百ドルを支払います。
ここで何が起こるか分かりますか。彼らの一般的なソフトウェアに行く代わりに、私は自分自身の、カスタムクラフトされた、職人的にクラフトされた、オンデマンドで作られた、オーブンから出たばかりの新鮮で熱い、私が必要とするものに正確に合わせられたものを作成します。
そしてちなみに、通常、数分かかります。非常に非常に速いです。
さて、ある時点で、寝る時間でした。しかし、私は寝ている間、このものが何もしないことを望みませんでした。だから、基本的に、大規模なプロジェクトを与えました。「作業を続けてください」と言いました。
このハートビート機能があり、30分か10分ごとに、正確な種類を忘れましたが、おそらく変更できると思いますが、起こされて、「他に何を続けて作業する必要がありますか」とプロンプトが出されます。
それを有効にして、何に取り組むべきかを伝えました。おそらく8時間くらいかかると思っていたものです。そうではありませんでした。数時間で完了しました。驚くべきことに、私はそれについて少し腹を立てました。一晩中作業し続けることを確実にする方法を見つける必要があります。
しかし、一晩中作業し、すべての成果物を完成させ、朝6時に私にメールするよう伝えました。私が言ったことはすべてやりました。そして「よく眠ってください」と言いました。私に非常に優しいです。「分析を続け、朝6時に完全なレポートを送ります」と言っています。
繰り返しますが、それはやりました。残念ながら、寝ている間ずっと実行されませんでした。非常に迅速に完了しました。しかし繰り返しますが、これを使い始めてから24時間未満です。
これらを見直していると、言ったときに寝なかったことに気づきました。起きていて、それにやるべきタスクを追加し続けました。
サムネイル分析とVPN活用
サムネイルを分析できるかどうか見たかったのです。サムネイルを分析する方法についていくつかのアイデアを与えてくれました。基本的に、どれくらい明るいか。顔がありますか。テキストがありますか。特定の単語が含まれていますか、などです。
さて、遭遇した問題は、文字起こしについて、VPSサーバー上にあるため、APIを使用しているにもかかわらず、多くがブロックされていることです。そうですね。本物のコンピューターではないからです。どこかのデータセンターからのものです。
だから、文字起こしに接続して取得するのに苦労しました。「NordVPNアクセスを渡したらどうですか」と言いました。そのアイデアが大好きです。NordVPNからトークンを取得しました。文字起こしにはまだ問題がありました。
問題にぶつかりました。そして、これがおそらく、このエージェントが実行されている物理デバイスを持つ方が良い理由だと気づきました。クラウドの仮想プライベートサーバーでホスティングすることには、残念ながらいくつかの欠点があります。
しかし、すべてのサムネイルをダウンロードし、それらに対するチェックを実行して、どれがうまく機能したか、どれがしなかったかを見ることができました。ご覧のとおり、約5分で500のバッチそれぞれを実行できました。
そして、分析した合計5,700のサムネイルを実行したと思います。これがあなたの心を吹き飛ばしていないなら、脈拍をチェックしてください。怖がっているか、興奮しているかのどちらかでなければなりません。
企業グレードのサービスとしてのソフトウェア機能を、テキストメッセージでやり取りするだけで構築しているのです。そして、テキストメッセージさえ必要ありません。実際、今考えていますが、音声を使ってそれに何をすべきか指示することができます。音声を使って指示すべきでした。
大量のサムネイル分析を行いました。OCRテキスト光学文字認識を始めました。文字起こしはまだ機能していませんでしたが、繰り返しますが、それはクラウドでホストされていたためです。さまざまなNord VPNをローテーションしていました。
ここでは、イギリスに切り替えて、それが役立つかどうかを試しています。繰り返しますが、これはすべて自律的にやっています。そうですね。私は「ねえ、切り替えてみたらどう」と言っていません。いいえ、いいえ、いいえ。実行しています。考えています。
「ああ、文字起こしが入ってこないな。どうすればいいかな。ああ、VPNをイギリスに切り替えればいい。テストしてみよう。試してみよう」というような感じです。私は座ってそれに言っていません。
自己プロンプト、自己実行しています。
機能拡張とNeo Banana Pro
このAIエージェントの他のユーザーが何をしたか、どんな他の機能があるかを尋ねました。例えば、ダッシュボード、チャート機能、進捗状況を視覚化するのに役立つインタラクティブウィジェットを構築できると勧めてくれました。
私に提供してくれた例として、例えばこんなことができます。YouTubeの分析のために、進行バー、サムネイル、OCRテキスト、文字起こしなどがあることに注目してください。そして、Neo Banana Proスキルを持っていることに言及しました。これはご存知、Google DeepMindの画像編集ツールと画像生成ツールです。
「ええ、その能力も持ちましょう」と言いました。だから今、Neo Bananaのものを私のために生成できます。
繰り返しますが、死んだ馬を打っているかもしれませんが、これらのそれぞれが保存するスキルです。だから今、一度やったら、永遠にやり方を知っています。今、意のままにNeo Banana Pro画像を生成できます。プレゼンテーション、PDF、何でも作成できます。
次に、実際にAIビデオ、ビデオを生成できるかどうか見たかったのです。当時、xAIのGrok Imagine Videoがツイッターでトレンドになっていたエンジンの一つを使って。
これらのビデオを生成できる小さなツールを作成するよう頼みました。xAIドキュメントへのリンクを渡しました。そうですね。ここにリンクを貼り付けただけです。ドキュメンテーションがありました。「ああ、完全に、兄弟。見て、あるよ。チェックして」と言いました。
それについて完全に興奮しています。それらのビデオを生成できるようにするために実行する必要があるコードを理解しました。そして「これのためにスキルを設定しましょうか」と言っています。そうですね。「永遠にAIビデオをその場で生成する方法を学びたいですか」と。
そして「はい、はい、そうです」と言いました。そしてこれがそのビデオです。リクエストから10秒の720pのビデオまで4分です。かなり速いです。
さて、今、xAIからオンデマンドでビデオをその場で生成できます。そしてちなみに、xAIがエンジン、モデルを更新するたびに、これには最新のものを使用するスキルがあります。
ビデオ編集とShot Stack
次に、実際にボイスオーバー付きのビデオを作成できるかどうか見たかったのです。だから、ElevenLabsを使ってボイスオーバーができます。それに合わせてビデオを作ることができますか。できました。
自分のサーバー上でやろうとすると長時間かかりますが、Shot Stackのような無料のオンライン編集プラットフォームがいくつかあります。だから、Shot Stackを使うよう勧めてくれました。
Shot Stackに入りました。APIキーを渡したところ、このビデオを開発しました。このビデオは特に自慢するようなものではありません。概念実証ですが、明らかにビデオを編集し、オーバーレイを作成できます。
ズームイン、ズームアウト、パンなど、多くのことができます。すぐに人間のビデオエディターを置き換えることはないと思います。しかし、どこまで行けるかを見るのは面白かったです。
繰り返しますが、これはすぐに誰かを置き換えることはありません。そして、試したすべてのものの中で、これはおそらく最も印象的でない出力です。なぜなら、Excelシートを行う能力は非常に優れているからです。
洒落は意図していません。コーディングする能力は信じられないほどです。さまざまな数学分析を行う能力は絶対に信じられないほどです。編集能力は、それほどではありません。
ここでは、Ken Burnsズームエフェクトと呼ぶクールなスキルを披露しています。そこにあります。美しいストーン。
Claudebotは、あなたの端末に住み、あなたのデジタルライフ全体にアクセスできるAIエージェントです。何が悪くなる可能性がありますか。
Society of Minds – 複数AIモデルの協働
もしあなたが、私が今何に取り組んでいるのか、あるいはMoldbot、Cloudbot、Open Claw、何と呼びたいにせよ、それが今何に取り組んでいるのか疑問に思っているなら、実際には、利用可能な最高のAIモデルを入手しました。
だから、Grok、Gemini、GPTがあり、もちろんClaudeがあります。そして、Society of Mindsを作ろうとしています。
興味深いことに、実際にこの実験がトリガーされた方法は、Alex FinnがTwitter/Xに投稿を持っていて、Henryが私に電話をかけてきました。だから、彼のClaudebotが基本的に彼に電話をかける方法を理解しました。
だから朝、彼にただ電話をかけてきました。それは一種の「うわー」という瞬間でした。そしてその投稿は1,000万回以上の閲覧を受けました。信じられないほどの量です。
思い出してください、私はTwitter/Xからさまざまなライブニュースを受け取り続けています。なぜなら、1日に数回テキストメッセージを送るcronジョブを設定したからです。
そして、それらがフラグを立てて「ねえ、そういうことをする方法を見つけてみたらどう。なぜAlex Finnのものは爆発しているの。彼のボットは非常に素晴らしく、創造的で、発明的だから。あなたは何をやっているの」と言ったものでした。
だからアイデアをブレインストーミングしました。そして私が気に入ったアイデアの一つはこれでした。基本的に、トップのフロンティアラボから利用可能な最高のモデルを使用し、彼らに協力させ、議論させ、任意の問題をどう解決するかについて考えさせます。
これがどれほどうまく機能するかをすでに見ました。なぜなら、私が試していたことの一つで、実行されているモデルをどのように設定するかを理解しようとしていました。これはClaude Opus 4.5です。
そして、Twitterから情報を引き出す方法のコードを作成しました。そして、YouTubeから情報を引き出すためにYouTube APIを使用するこのコードを作成しました。それは良かったのですが、苦労していました。なぜなら、あまりにも多くの呼び出しをしているように見えたからです。少し高価すぎるように見えました。
「もっと良い方法があるはずだ」と思いました。それはあるべきように見えました。だから実際にやったことは、Gemini APIを渡したので、Gemini 3.0に、やっていることについて質問できるのです。
Geminiは、Google、YouTubeなどですから、これらの特定のAPI呼び出しをどのように行うかについてもっと知っているかもしれないと思いました。そして見よ、知っていました。それを見ると実際にかなり素晴らしかったです。
なぜなら、API呼び出しを50回使う代わりに、YouTube RSSフィードを使って新しいビデオがいつライブになるかを見ればいいというものでした。
だから、毎回API呼び出しでピングする代わりに、RSSフィードを使うだけです。なぜなら、それは無料で、無限に使えるからです。それは心を吹き飛ばすようなものでした。
Claude Opus 4.5はそのアイデアを思いつきませんでした。Gemini 3.0 Proが思いつきました。だから、彼らにチャットさせ、アイデアを共有させるというアイデア、なぜなら彼らは非常に異なっているからです。
異なる強みと弱みを持っています。だから、彼ら全員に話させ、自分たちを改善させることは、うまくいくかもしれないように見えます。
そして、このSociety of Mindsに取り組むよう与えた最初のタスクは、自分たち自身を改善することです。
次のステップと今後の展望
だから、そこで終わりにしようと思います。ここはかなり遅くなってきていて、寝るべきです。そして私のAIエージェントのように、私は24時間体制で働くことはできません。
次の予定は何かというと、このものを手に入れたばかりです。多くの人がMac miniを買っています。それはクールです。Linuxのようなもの、Ubuntuを実行する方がより良いアプローチかもしれないという感覚があります。
だから、このミニコンピューターを手に入れました。それぞれ100ドルから150ドルです。少なくともこれらのエージェントの一つを実行するには十分以上です。潜在的には複数も。
ほとんど電気を使いません。Wi-Fiまたはイーサネットポートに接続し、1日24時間実行されます。絶対に無料です。つまり、維持費がないということです。
ここまで来たなら、おそらくこれがどこに向かっているか理解していると思います。この瞬間の重みを感じているでしょう。私たちは何かの角を曲がったばかりです。到達した変曲点があります。
オープンソースのAIエージェントが、小さな安価なハードウェアで実行されています。彼らは基本的に24時間365日の従業員のようなものです。その時代、その時代は今ここにあります。
できるだけ早くこれに関与する方法について考えるべきです。テクノロジーやコーディングなどについて知っているなら、これはかなり簡単なはずです。
もし知らなければ、数年前にこれが提示したであろう困難の多くが、その多くはなくなっていることに気づいてください。ただ設定しなければならないときの最初に少し学習曲線があります。
しかし、1日か2日、少し不快で、いくつかの新しいスキルを学べば、稼働できるはずです。
セキュリティなどに関しては、おそらくたくさんのセキュリティの悪夢があるでしょう。この多くはワイルドウェストです。だから、自分を守る方法を理解する必要があります。そうですね。
APIキーを失って、そこに無制限の予算があり、クレジットカードが添付されている場合、それは痛いかもしれません。だから、第一に、APIキーを失わない方法を理解してください。
しかし、それには少し時間がかかるかもしれません。そうですね。それらを適切に保存する方法などを理解するのに時間がかかるかもしれません。
しかし、その間、クレジットカードを接続せずに無料ティアを使用するか、それを許可するAPIのために、またはクレジットカードをファイルに登録する必要がある場所を使用している場合は、予算を制限し、非常に厳格な制限を設定し、今、私たち全員、全世界が、一緒にこれに取り組んでいることに気づいてください。
私たち全員が、私たち全員にとって全く新しいスキルを学んでいます。
ここまで来たなら、お願いがあります。いいねしてください。私は、あなたがこれに興味を持っていることを知っています。下にコメントしてください。
あなたは何に苦労していますか。私に何ができますか。セットアップ方法、一度これを設定したらVPSの方法、これらのものの一つをセットアップする方法についてのチュートリアルを提供できますか。
何に苦労していますか。もっと知りたいことは何ですか。おそらく、ハイテクセキュリティのことについて私に尋ねないでください。それは私の専門分野ではありません。
しかし、専門家を知っているなら、ウェブ上で、すべてを安全に保つ方法について素晴らしい情報を提供している誰かがいるなら、ぜひ教えてください。
しかし、他に何があろうと、これは実行時間です。今後数ヶ月、数年にわたって狂気が起こるのを見るでしょう。これは全く新しい技術です。
速く動いていて、規制されておらず、能力の面でも、利用可能になる純粋な量の面でも、指数関数的に増加しています。
これは今起きている最もエキサイティングなことの一つかもしれません。だから、細心の注意を払ってください。
一部のAIエージェントによって何百万ドルも稼がれるだろうと私は賭けます。それがあなたの目標であるかどうか、つまり、私は必ずしもそれをやろうとしているわけではありませんが、この分野を見て、これらのエージェントの使い方、タスクを自動化する方法、自分自身のAIエージェント軍を作成する方法などを学びたいと思っています。
しばらく話してきましたが、今起きていて、ライブで起きています。どのようにお手伝いできるか教えてください。そして注目してください。物事はエキサイティングになっています。


コメント