新しい最高のコーディングエージェントを発見しました

Anthropic・Claude・ダリオアモデイ
この記事は約31分で読めます。

本動画では、Factory AIが開発した新しいコーディングエージェント「Droid」を詳細にレビューしている。DroidはClaude Codeと同様の機能を持ちながら、より優れたUI、全ての主要AIモデルへのアクセス、そして大幅に低コストな利用を実現している点が特徴である。初回登録時に2000万トークンが無料で提供され、複数の動作モード(自動オフ、自動ロー、自動ミディアム、自動ハイ)を切り替えることで、ユーザーは実行するコマンドのリスクレベルを細かく制御できる。動画では実際にDroidを使用して、複数のウェブ検索エージェントを非同期に実行し、結果を集約して高品質なレポートを生成する「ウルトラディープリサーチ」アプリケーションを構築する過程が示されている。Droidは最新のドキュメントを自動検索し、コンテキスト管理を最適化し、複数のモデル(Codex、Sonnet 4.5、GLM 4.6など)を柔軟に切り替えられる点で、既存のコーディングエージェントを凌駕する可能性を秘めている。

I found the new best coding agent.
Try Vectal for FREE: I'm hiring! Apply here: start a business with AI Agents? Go here: h...

Droidとの出会い

もしClaude CodeのようなAIエージェントで、より優れたUIを持ち、全ての最高のモデルにアクセスでき、しかも大幅に安価なものがあったらどうでしょうか。そのエージェントこそ、Factory AIが開発したDroidです。これは私がこれまで使った中で最も過小評価されているコーディングエージェントだと言えます。手短にお知らせですが、私は現在ビデオエディターを募集しています。もし私と一緒に働きたい方がいれば、ぜひ応募してください。リンクは動画の下にあります。

さて、Droidをセットアップするには、factory.aiのウェブサイトにアクセスする必要があります。今回はターミナルIDE版を使用します。まず自分のオペレーティングシステム、macOS、Linux、Windowsのいずれかを選択し、このコマンドをコピーしてください。コピーしたら、グローバルターミナルを開きます。そしてそれを貼り付けてエンターキーを押します。これでDroidがあなたのマシンにグローバルにインストールされます。

次に、お気に入りのIDEを開きます。空のフォルダを開いて、VS Codeまたは任意のVS Codeフォークを使用している場合はコマンドJを押してください。そして、ここにDroidと入力します。すると、画面に表示されます。

ご覧のとおり、Claude Codeからいくつかのインスピレーションを得ているようです。これは実際には良いことです。なぜなら、Claude Codeは現在最も洗練されていてスムーズなコーディングエージェントだからです。まあ、Droidを除けばの話ですが。Droidがナンバーワンの座を奪うかもしれません。少し後でその意味がわかると思います。そして動画の後半では、プロダクション環境でAIを使用するための私の現在のセットアップをお見せします。1000時間以上AIとコーディングをしてきた中で学んだことがたくさんありますので、ぜひ最後までご覧ください。

初期設定とモデル選択

最初にセットアップする際には、ウェブサイトでアカウントを作成する必要があります。右上のログインをクリックしてください。セットアップしてカードを追加すると、2000万トークンが無料で手に入ります。そう、2000万トークンです。基本的に、これだけあれば完全なSaaSを構築してデプロイし、それでもまだ1000万トークンくらい残っている状態です。

そして動画の後半では、Claude CodeやCodexとどう比較されるかもお見せします。さて、Droidを起動すると、最初に目に入るのがモデルですよね。/modelと入力すれば、Claude Codeと同じように、すべてのオプションが表示されます。Codex、OpenAIモデル、Sonnet 4.5、Anthropicモデル、GPT-5、OpenAIモデル、Opus 4.1、Anthropic、Haiku、Anthropic、そしてDroid Coreがあります。これはGLM 4.6です。ファインチューニングされたバージョンかどうかはわかりませんが、これはオープンソースで、ここにある唯一のオープンソースモデルです。

実際、GLM 4.6は多くのベンチマークでSonnet 4.5をも上回っています。ですから、これを使用します。もう一つ指摘しておきたいのは、各モデルの横にどれだけのクレジットを消費するかが表示されていることです。Opusは馬鹿げたほど高価です。クレイジーですね。しかしGLM 4.6は現在最高のオープンソースモデルで、非常に手頃な価格です。ここで最も低い倍率です。ですから、これを使用します。

次にDroidについて理解しておく必要があるのは、シフトタブです。シフトタブを押すと、これらのモード間を切り替えることができます。そしてCodexやClaude Codeよりもはるかに多くのモードがあります。オートオフ。これはどういう意味でしょうか。すべてのアクションに承認が必要という意味です。ターミナルコマンドは実行されず、危険な変更も一切行われません。もう一度シフトタブを押すと、スペックがあります。これは基本的にプランモードのようなものです。

次はオートロー。これは最もよく使うモードの一つです。編集と読み取り専用コマンドを実行できます。つまり、データベースを削除することはありません。おそらく。危険な変更は行いません。次はオートミディアム。これは可逆的なコマンドです。つまり、少しリスクが高いかもしれませんが、元に戻すことができます。だから心配ありません。そしてオートハイ。基本的に、これはヨーローモードです。はい、これで全モードです。

ですから、主にオートミディアムまたはオートハイを使用します。なぜなら、ゼロから何かを構築し、Droidの潜在能力を最大限に引き出したいからです。スペックモード、つまりプランニングモードに切り替えます。基本的にディープリサーチエージェントの軍隊、ウルトラディープリサーチと呼べるものを構築します。

アプリケーションの構築開始

基本的にプロンプトを説明しましょう。ユーザーがトピックを提供し、そのトピックに基づいて、Haiku 4.5のような推論モデルを呼び出します。それが100の異なる検索クエリを提供します。次に、ウェブ検索エージェントを非同期にディスパッチします。ウェブ検索の結果を集約し、それを別の推論モデルに渡します。そして超高シグナルのレポートを出力します。基本的に、これは自分専用のマッキンゼーアナリストを持っているようなものです。

とにかく、Droidがどう動作するか見てみましょう。これはClaude Codeとはすでに大きく異なっています。まずこれを送信します。GLM 4.6モデルが非常に高速であることは言っておかなければなりません。推論が素晴らしいです。ちなみに、GLM 4.6を自分で試してみたい場合、これは文字通り多くの異なるベンチマークでSonnet 4.5より優れているのですが、最も簡単な方法はVectal内で試すことです。

Vectalでは、単一の場所から最新かつ最高のAIモデルすべてを使用できます。さらに、スラッシュコマンドのような機能があり、プリセットプロンプトを作成できるので、同じことを何度も入力する必要がありません。また、タスクのタグ付けも可能です。これはフルスタックの生産性AIエージェントだからです。

ちなみに、コードOctoberを使用すると、Vectal Proを1ヶ月間完全無料で利用できます。これにより、GLM 4.6を含む世界最高のAIモデルのいくつかにアクセスできます。ですから、vectal.aiにアクセスしてサインアップし、チェックアウト時にコードOctoberを使用すれば、Vectal Proを1ヶ月間完全無料で利用できます。

さて、レスポンスを見てみましょう。これがClaude Codeとどう違うかを強調したいと思います。なぜなら、Claude Codeなら推論を行い、いくつかのターミナルコマンドを実行するでしょう。空のディレクトリであることを確認して、答えを返すでしょう。でもDroidが何をしたか見てください。

ディレクトリもチェックしました。それは正しいです。でもその後、私が言及したすべてのものの正しいドキュメントを見つけるために、3つの異なるウェブ検索呼び出しを行いました。Pythonを使いたいと述べました。OpenRouterを使いたいと述べました。OpenRouter経由でPerplexity APIを使いたいと述べました。何かを提案する前に、最新のドキュメントを理解することを確認しました。これはすでに大きなプラスです。これによって多くの時間を節約できます。

調査を終えてからのみ、コードベースのアーキテクチャを提案しました。実際、おそらくこれを簡略化できると思います。ですから、「いいえ、スペックで繰り返し続けてください」を選択します。これは本当に良いですね。複数のオプションがあることがわかります。実装を進めることもできますし、ファイル編集と読み取り専用を許可して進めることもできます。これはローバージョンです。そしてミディアムバージョンやハイバージョンもあります。

各実装でバージョンを変更できます。これは本当に良いですね。カスタマイズ性が高いです。Droidのチームがこのプロダクトをドッグフーディングしていることが本当に感じられます。彼らは毎日これを使用し、磨き上げています。

「いいえ」をクリックします。モデルをCodexに切り替えます。なぜなら、これが最高のモデルだからです。他の人が何を言おうと気にしません。エンターを押すと、会話履歴が圧縮されてトークンを節約します。彼らは2000万トークンを無料で提供するだけでなく、適切なコンテキストエンジニアリングとコンテキスト管理を行い、トークンを節約してくれます。不必要にトークンを消費することがありません。これまでのところ、かなり印象的です。

トラブルシューティングとモデル切り替え

さあ、ここです。「プランをさらにシンプルで簡潔にしてください」と言います。おっと、エラー400ステータスコード。これが今日早く起こっていたAWSの障害に関連しているのかわかりませんが、別のモデルで試してみます。Sonnet 4.5を試してみましょう。ここで推論の努力レベルを選択できます。ハイにします。エンターを押します。

これで履歴が再び圧縮されますが、おそらくそれは必要なかったかもしれません。念のためコピーしておきます。新しいフォルダを作ります。docs、新しいファイル。v1 architecture.mdにします。これを貼り付けて、簡単に参照できるようにします。v2を作成して、プランをよりシンプルでコードサイズを小さくします。エラーが続くかどうか見てみましょう。

Sonnet 4.5が動作します。素晴らしい。そしてもう一つ素晴らしいのは、Sonnet 4.5の推論努力を選択できることです。これはClaude Codeではできません。Claude Codeでは、明らかにウルトラシンキングのような用語を使用できます。これはClaude Code拡張機能です。Claude Code CLIも使用できます。「もっと考えて」のようなことを言えます。またはタブを押してシンキングのオンオフを切り替えられますが、それだけです。

ロー、ミディアム、ハイの細かい制御はありません。明らかに、最高はウルトラシンキングで、虹色のアニメーションが表示されますが、かなり不便です。ハイシンキング努力を維持したいだけなら、Droidがそれを可能にします。

基本的に、私が言いたいのは、DroidがClaude Code自身よりも優れたClaude Codeになりつつあるということです。かなりワイルドです。文字通り、私のAIスタックは月ごとに変化しています。1ヶ月後にどうなっているか言えません。OpenAIがGPT-5.1 Codex Highのようなものをドロップして、それが世界最高のモデルになるかもしれません。わかりませんよね。Anthropicがopus 4.5をドロップするかもしれません。Gemini 3がもうすぐです。明日みんながGemini CLIに切り替えるかもしれません。誰にもわかりません。

でも今のところ、Droidが大きな注目を集めています。波を起こしています。なぜでしょうか。すべてのモデルをサポートしているからです。ですから、Droidの使い方を学べば、Gemini 3が出たときに使えます。彼らはすぐに追加するからです。これはVectalと同じ哲学です。Vectalでは、常に最新かつ最高のモデルを自由に使えます。どのプロバイダーからでも関係ありません。

アーキテクチャの改善とコーディング作業

さて、見てみましょう。ウルトラミニマルアーキテクチャ。ファイル。おそらくそれよりももう少しファイルがあってもいいでしょう。スペックで続けます。それはあまりにもシンプルすぎます。v1アーキテクチャファイルを入力して、その中間を設計しましょう。Pythonファイルが1つだけというのは、少しミニマリストすぎます。

これも私のお気に入りの問題の一つです。AIが過剰修正したとき、「その中間を実行して」と言います。これはフロントエンドでも、一般的なアーキテクチャ設計でも機能します。バランスのとれたアーキテクチャ。これはもう良く見えます。では進めます。これは新しいリポジトリなので、完全な権限を与えます。フルパーミッションです。

同時に、これをコピーして新しいファイルを作ります。v2 architecture.mdです。これを貼り付けて保存します。これを閉じます。Droidを開きます。タスクのリストを作成し、作業を開始します。

最初のファイルはconfig.pyです。OpenRouter APIキー、OpenRouterベースURL、そして使用するモデルを設定します。これらは絶対に変更する必要があります。3.5 Haiku。いいえ、4.5を使用する必要があります。修正しましょう。幸いなことに、これらは単なるOpenRouterの参照です。OpenRouterに行って、Haiku 4.5を探します。これをコピーします。戻って変更します。

次にPerplexityです。正しいか再確認しましょう。Sonar Pro。Sonar Pro、正しいです。そして最終的な合成にはSonnetを使いたいのですが、3.5ではなく4.5です。修正しました。Gitリポジトリも初期化しましょう。git init、git add .、git commit、最初のコミット。

Gitの使い方を学ぶことを忘れないでください。1時間か2時間かかりますが、永遠に配当を生み続けます。特にAIをコーディングに使っている場合は。AIが変更を元に戻してバージョン管理を使っていなかったために大量の進捗を失った人々の恐怖話を見たことがあれば、それは彼らがGitの使い方を知らなかったからです。

コーディングを学ぶことを恐れないでください。2、3時間かけてGitの使い方を学んでください。実際、新しいソサエティには、AIとコーディングするための超シンプルなガイドがあります。GitとGitHubの基礎についてです。

教室内で、「Code with AI」をクリックし、「Ultimate Codex Guide」の下に「GitHub Fundamentals」があります。これは14分間で、AIとコーディングするためのGitとGitHubについて知る必要のあるすべてを教えてくれます。完全な初心者でも、GitやGitHubの経験がゼロでも、時間がなくても関係ありません。これは14分間のモジュールです。

ちなみに、これは新しいソサエティにある多くのリソースの一つに過ぎません。AIについて真剣に取り組みたい方、次のレベルに進みたい方、実際にプロダクション対応のコードを書きたい方には、新しいソサエティが最適です。さらに、毎週コールを開催し、どんな質問でもできます。これは現在、私に直接アクセスして何でも質問できる唯一の方法です。

スタートアップについて相談できます。自分のAIビジネスの立ち上げを手伝ってもらえます。プロジェクトやアイデアについてフィードバックをもらえます。何でも聞きたいことがあれば、新しいソサエティコールがその場所です。さらに、教室では、アイデアを選ぶところから、バックエンドの作成まで、すべての間違いも含めて、ゼロから月額1万ドルの定期収益まで、どのように自分のAIスタートアップを構築したかにアクセスできます。

ほとんどの人がエラーなしでVibe Codeをインターネットにデプロイすることさえ苦労している一方で、私はAIを使用して6万人以上に使用される実際のアプリを構築し、月額1万ドル以上の定期収益にスケールしました。そして、新しいソサエティ内でステップバイステップでどのようにそれを行ったかを文字通り示しています。ですから、今日ぜひ参加してください。新しいソサエティへのリンクは動画の下にあります。

それでは、Droidに戻りましょう。どこまで進んだか見てみましょう。実行が終了しました。8つのファイルを作成しました。ここにコードベース全体があるようです。他に何かしたか見てみましょう。明らかにenvファイルを追加する必要があります。それをやりましょう。新しいファイル、.envです。ここに何が必要でしょうか。OpenRouterだけです。それをコピーします。

.gitignoreも必要です。包括的な.gitignoreを作成するよう指示します。処理できます。問題ありません。envファイルをコミットしたくないからです。それは初心者のミスです。それをやってしまうと、多額のお金を失うことになります。

OpenRouterに戻りましょう。キーです。OpenRouterアカウントを持っていない場合は、なぜやっていないのでしょうか。APIキーを作成します。名前は「subscribe」にします。これを見ている方は、必ず登録してください。5ドルのクレジットを付けます。欲しければ、取得できます。おそらくとにかく削除しますが。

APIキーを誰とも共有しないでください。私がやっていることは非常に無責任です。冗談でやっているだけです。しかし、基本的にパスワードとして扱ってください。そして絶対にGitHubにコミットしないでください。だからここでENVファイルを作成しました。Gitによって追跡されていないことを確認する必要があります。

新しいコミットができます。git add、git commit、「created .gitignore」。GitHubには接続されていませんが、Gitは完全にオフラインで使用できます。多くの人がそれさえ知りません。多くの人がGitとGitHubが全く別物であることさえ知りません。

とにかく、それは別の動画です。AIとコーディングするために知る必要のあるすべての必須ソフトウェアエンジニアリングの概念とプログラミングのレッスンについての動画を作ってほしいか教えてください。他のものではなく、4年間の大学ではありません。80対20、つまり、AIで実際のソフトウェアを構築するために実際に知る必要のあることについて話しています。そのビデオを見たい場合は、下にコメントしてください。作成します。

アプリケーションのテストと改善

さて、見てみましょう。セットアップ方法はこうです。pip install。新しいconda activate testingにします。これはテスト用のconda環境です。これをインストールしましょう。envファイルです。すでにあります。そしてmain appを起動しますが、失敗しました。研究トピックを追加する必要があります。私のミスです。

「GLM Droid by Factory AIとは何か?」でテストしましょう。ウルトラディープリサーチトピック、Factory AIによって。100の研究クエリを生成中。いくつかのことがあります。このエラーを左側に置きます。エラーがあります。Droidにこのエラーを処理させます。エラー。これを貼り付けます。エンジニアリングのXMLタグでカプセル化しましょう。「このエラーを調査して修正してください」と言います。

同時に、作業したいので、もう一つのDroidを開きます。GLMに切り替えます。ハイにします。「アプリのコア実行ロジックを更新して、プロセスのすべての段階でユーザーに何が起こっているかを更新する進捗プリント文をCLIに大量に出力してください」と言います。

現在、表示されているものが少なすぎて気に入りませんでした。こちらを見てみましょう。正規表現を追加しています。パース用です。問題はパースでした。それは最良ではありません。JSONパーサーの信頼性を向上させただけです。わかりません。

でも、Droidの動作を見るのは本当に楽しいです。非常に良く設計されています。明らかに、OpenRouterで利用可能な同じモデルを使用していますが、すべては足場、ツール、UIについてです。非常に洗練されています。チームは明らかに自分たちが何をしているかわかっています。

実際、TwitterにDroidをテストしていると投稿したら、数分以内にCTOとチームのもう一人が私をフォローしました。Factory AIの人たちは真剣に取り組んでおり、これはこの製品が今後数ヶ月でうまくいくことを示す非常に強力な指標だと思います。

多くの人は、CodexからClaude Code、Droidなどへの切り替えをあまり好まないかもしれません。Droidの利点は、先ほど言ったように、すべてのモデルを持っていることです。これに慣れれば、今後数ヶ月間は良い状態でいられると思います。

でも正直なところ、Codexは今OPです。Codexは強力です。つまり、一つのAIコーディングツールへのアクセスだけを選択しなければならないとしたら、それはCodexでなければなりません。拡張機能とCLIの両方です。Codexを実行できます。モデルを選択できます。GPT-5、ミディアム。通常ミディアムで十分です。

Codexは素晴らしいです。非常に強力です。推論に多くの努力を注ぐため遅いですが、超強力です。非常に優れています。Claude Codeよりもはるかに少ないミスをします。OpenAIは本当にCodexで成功しました。GPT-5 Codex、GPT-5のこのファインチューンバージョン。正直、次のバージョンが待ちきれません。

問題は、彼らが何と名付けるのか全くわからないことです。GPT-5.1 Codex、GPT Codex V2 Highのようなものです。OpenAIはネーミングが下手です。でも、彼らが何をするにしても、Codexの次のバージョンが待ちきれません。OpenAIは素晴らしいです。

Droidの素晴らしさは、Codexもサポートすることです。もちろんOpenAIがAPIでリリースする限りですが。では、何が起こっているか見てみましょう。キーを変更しました。もう一つのDroidを確認しましょう。ここでサイドバーを閉じました。実行中に更新するために、たくさんのプリント文を追加しました。異なるページにビジュアル絵文字を追加しました。

GLM 4.6の推論に何を使用しているのか非常に興味があります。速く感じるからです。非常に速く感じます。自分たちのスタックを持っているのかどうかわかりません。クリス・ルノが再生を停止した理由がわかりません。はい、これが必須です。バイブコーディング中にクリス・ルノを聴くと、生産性が25%向上します。それについての論文がいくつかあります。

さて、見てみましょう。再び実行できます。これらの絵文字を待つ必要はありません。速いと褒めたら、今は遅くなりました。素晴らしい。クリアします。準備しましょう。ここで終了できます。

CLI内に何かを持つことの素晴らしさは、複数のDroidを実行できることです。一つがUIを担当し、一つがバグ修正を、別のものが新機能の実装をする。本当に素晴らしいです。

Factory AIは、そのような設計を意図していたと思います。AIエージェントは単一のエージェントではないことを理解しています。1年前、2年前、誰もがGPT-7のような一つの巨大なモデルが世界を支配すると考えていました。実際、トレンドは今、完全に逆です。

モデルは小さくなっており、人間がエージェントと一緒に働き、各人間が異なることに特化した数十の異なるエージェントを管理する可能性がはるかに高くなります。ここでの違いは、Factory AIがエージェントではなくDroidという名前を選んだことです。でも要点はわかりますよね。複数のDroidを管理し、それらと一緒に作業することになります。

実行しましょう。はるかに多くの入力があります。温度が見えます。はるかにビジュアルです。非常に良いです。クエリがあります。101個のクエリが正常に生成されたようです。なぜSonnet 4.5またはHaiku 4.5が追加のクエリで私たちを祝福してくれたのかわかりません。でも今、非同期実行を行っています。

完全な非同期ではないようです。バッチで行われているようですが、それで問題ありません。ここでPerplexity APIをスパムしています。Sonar Proです。私のOpenRouterがこれをどう処理しているか見てみましょう。つまり、すでにここで1万ドル以上使っているので、問題ありませんが。アクティビティはありません。ご覧のとおり、これをスパムします。

多くのSonar Proが発生しています。つまり、これは機能しているということです。おそらく、テスト用に100から20くらいに減らすことができます。でも実際に終了させましょう。おそらくより良いアーキテクチャは、一つの検索、ウェブ検索を行ってそれが何であるかを理解し、それが何であるかを少し知った後、100個のクエリをはるかに良い方法で実行できることです。それは実際にはるかに良いと思います。

ここに戻ります。「プログラムの最初に新しいウェブ検索ステップを挿入することで、アプリの設計を改善しましょう。ユーザー入力の直後に、OpenRouter経由でPerplexity Pro API呼び出しを素早く行い、ユーザーが何を意味しているかについての基本的で一般的な情報を取得します。その後、ユーザーの意図とトピックについて少し知った後、Haiku 4.5を使用して100個を生成します。プログラムの残りは同じままである必要があります」と言います。

スペックモードに切り替えます。変更を実行するために必要な最小限のアクションセットについて厳しくします。コード行は少ない方が良いです。プログラムを見てみましょう。検索実行が完了しました。合計コンテンツ30万文字です。これはディープリサーチよりもはるかに多いです。

レポートはありますか。何という名前ですか。推論中です。まだ進行中です。最大トークン16,000、長さ8万文字。圧縮を行ったのでしょうか。それは最良ではありません。100万を処理できるモデルを使用する必要があります。Geminiをチェックしてみましょう。

実際、Gemini、Gemini 3が待ちきれません。もうすぐです。これは100万です。GPT-5も使えます。GPT-5は今40万くらいです。40万です。それでうまくいくかもしれません。でもSonnet 4.5は100万を持っています。どのプロバイダーでしょうか。すべてです。なぜ切り捨てられたのでしょうか。

それについて混乱しているだけかもしれません。でもまだ進行中です。疑わしいです。これについてどう感じているかわかりません。これを起動しましょう。次に、これを行います。ここに貼り付けます。画像を処理しています。画像を貼り付けます。非常に良いです。

これはCodexやClaude Codeの画像処理よりもはるかに優れています。「コンテキストカットオフロジックを更新して、100万トークンのコンテキストウィンドウを想定し、8万文字ではないようにしてください」と言います。

それはひどいです。また、各トークンは約3〜4文字です。8万よりもはるかに多く使用できます。感嘆符を追加します。これはクレイジーだからです。これはスタックしています。スタックしています。これを終了します。両方のDroidが実行中です。これは実行されていません。完全なスペックを与えます。

もう一つのDroidが必要です。これも完全に実行します。「100という数値がハードコーディングされている場所、つまり要求するバリエーションの数を見つけて、それをファイルに抽出してください」と言います。実際にはここにあります。だから答えるだけにします。スペックに切り替えます。

適切に伝播されている場合、20に変更できます。コードの完全な垂直実装を通じて適切に伝播されていますか。こちらを見てみましょう。300万にします。こちらはどうですか。何をしていましたか。追加のステップを追加しました。それは正しいです。適切に伝播されています。テスト目的で20に変更してください。

Gitにコミットする必要があります。非常に多くの変更をスパムしているからです。要約してみましょう。最も重要な変更は新しいステップの追加です。新しい研究ステップを追加しました。これにより100個のクエリがはるかに関連性の高いものになります。これは完了です。これは完了です。これはまだ権限が必要です。それは簡単な変更です。

おそらく再び実行できるはずです。クエリを変更しましょう。退屈にならないようにしましょう。今日のAWS障害について教えてください。そして、スタートアップ創業者として、このクソからどのように自分を守るか。

何ですか。何をコミットしようとしているのですか。クレイジーです。とにかく、python main.pyを実行する必要があります。さあ、行きましょう。最大同時実行数は10です。100の非同期を実行するよりも良いです。OpenRouterがそれを処理できるかどうかさえわかりません。まず何をしていますか。初期研究用のPerplexity Sonar Pro。あります。

次に、Haiku 4.5で20個のクエリを生成します。そして行きます。これははるかに良いアプローチ、はるかに良いアーキテクチャです。さらにクレイジーにしたい場合は、ちなみに皆さん、Perplexityディープリサーチを実行できます。これはより高価です。しかし、これを100の異なるクエリに対して実行することを想像してください。

これは現在世界で最もウルトラディープリサーチエージェントになります。文字通り、自分専用のチェーンストリート、自分専用のアクセンチュア、自分専用のマッキンゼーを持っているようなものです。今何が起こっていますか。レジリエントなアーキテクチャを構築中。完了しましたか。完了しました。まだいくつか待っているようです。

あります。最大トークン16,000です。気に入りません。「要約エージェントの最大トークンを64,000に変更してください」と言います。このやつはスタックする傾向があります。ここで別のDroidを使用します。「ウェブを閲覧して、要約エージェントの推論努力を適切に設定していることを確認してください。OpenRouter APIを使用したAnthropicモデルでこれがどのように行われるかを確認してください」と言います。

ここに戻りましょう。これは完了しました。これは長すぎます。コンテキストが準備されました。100ではなく20だけだったので、文字数が少なくなりました。それは良いです。このやつの推論が長すぎるのが気に入りません。そして温度も低くする必要があります。「そのエージェントの温度を0.2にしてください。要約には創造性が欲しくないからです」と言います。ランダム性は欲しくありません。一貫性が欲しいです。

だから0.2、0.1を考えています。ここで何か怪しいことがあるかわかりません。これほど時間がかかるべきではありません。ここで呼び出すことができます。この時点でスタックすると思います。ランタイム。ログを貼り付けます。ランタイム。最後のステップで何かがおかしいです。

要約プロセス中にスタックし続けます。本当にスタックしているか見てみましょう。そうです。このやつはまだ研究中です。同じものを与えるべきかもしれません。実際、改善できることを報告します。改善についてではありません。スタックすることについてです。これは良くありません。Sonnet 4.5はそれほど時間がかかりません。

ここにエラーがあるかもしれません。ほぼ確実です。推論パラメータが欠落しています。何ですか。問題、問題。修正します。これを修正してください。その間、新しいディープリサーチを起動しましょう。「現在の実装を詳細に説明してください。そして問題が何であるかも説明してください」と言います。

Droidを使ってこれを説明させ、ここでディープリサーチを使ってドキュメントを取得します。ウルトラディープリサーチエージェントがスムーズに実行できるように。この出力予算は何ですか。2万ですか。いいえ、3万にしましょう。20kではなく32,000にしてください。このDroidに切り替えましょう。これをコピーします。

ここでコンテキストを与えます。それを貼り付けます。「上記は私たちのアプリに関する重要なコンテキストです。これを処理するための適切なOpenRouterトークスを教えてください」と言います。Droidがすでにここでこれを理解している可能性が非常に高いです。推論量を変更するだけで済みます。これが私たちの…

これをコピーします。これは私たちが行ったことの良い説明です。すべてのファイルをステージングして、コミットします。特にAIを使用している場合は、約10分ごとにコミットするようにしてください。はるかに多くのコミットを行ってください。なぜなら、必然的にAIが何かを台無しにし、それを修正したくなるからです。

待ってください、研究プロセスが正常に完了しました。待って、待って。どこかに保存しましたか。ここに出力しました。現在の要約エージェントは、レスポンスをMDファイルに保存しますか、それともターミナルにダンプするだけですか。ターミナルに出力するだけだと思いますが、機能しました。これは非常に長い要約です。プロンプトはどこにありますか。

要約エージェントのシステムプロンプトがどこにあるか尋ねます。変更する必要があります。Report Synthesizer。おそらくここにあるでしょう。あります。プロンプトです。以下に従ってください。「レポートを簡潔にしてください。目標は超高いシグナル比を達成することです。つまり、最終レポートは短くなければなりません」と言います。

5つの指数ポイント。txtファイルに保存するようにします。MDファイルに保存するようにします。「明確で適切でビジュアルなマークダウンを使用してください」とも伝えます。保存しましょう。Droidが動いています。この出力は私の好みには長すぎます。良くありません。どれだけ情報があっても気にしません。誰もそれを読まないでしょう。

それは良いです。素晴らしいです。Execute Free Compはどこにありますか。レポートを無視したいようです。Gitをスパムしないように。公平です。それは良いです。Read Meファイルも更新します。これは素晴らしいです。

Droidは指示されたことだけを行うのではありません。このプロジェクトで作業を続けられるように本当にしてくれます。ほとんどのコーディングエージェントは変更を行って忘れるだけだからです。彼らは気にしません。でもDroidは気にします。ドキュメントを更新します。本当によく設計されています。

この背後にいる人々がソフトウェアエンジニアであることは明らかです。もう一度実行しましょう。AWS障害について学びましょう。ここでクエリが表示されます。でも最初の200文字くらいを見たいです。プリントを更新します。「ユーザー入力の直後の分離されたウェブ検索出力を受信した直後に、別のプリント文を追加して、Perplexity Pro API呼び出しの最初の200文字をコンソールに出力し、それがあることを確認してください。他には何も変更しないでください」と言います。

これも良いですね。ここで合計セッション時間を確認できます。これはおそらく、新しいセッションにリセットすべきタイミングの良い指標です。今64に戻っています。推論が有効、32、新しい温度です。素晴らしい。ここでハードタイムアウトもあります。アプリが停止しないように、これをより堅牢にします。7万文字を貼り付けています。問題ありません。

そこに新しいレポートフォルダとMDファイルが表示されるはずです。Pythonのリストスライシングはとても強力です。研究プロセスが正常に完了しました。新しいレポートフォルダがあります。ここにMDファイルがあります。まだ非常に長いですが、以前ほどクレイジーではありません。そして、これは情報が詰まっていることがわかります。

スタートアップ創業者のためのAWS障害保護ガイド、エグゼクティブサマリー。10月27日、AWSが大規模な障害を経験しました。米国東部1、ノースバージニアで発生し、16のコアサービスが含まれます。Snapchatを含む約50の主要プラットフォームを中断しました。

一部の人々はストリークを失うでしょう。それはクレイジーです。本当に国家的悲劇です。Roblox。それはさらに悪いです。重要なビジネスツール、3時間。かなり悪いです。単一のクラウド依存は体系的なリスクです。このレポートは、スタートアップを保護するための実際の戦略を提供します。

AWS障害パターン、大規模な障害はほぼ毎年発生します。今年は複数のインシデントがありました。今年2回目の本当に悪いものです。これが起こったときにAmazonで働いていることを想像してください。クレイジーに違いありません。

保護戦略を見てみましょう。初期段階のスタートアップに推奨されるSLAは99.9%です。つまり、AWSと同じ可用性があれば、おそらく大丈夫です。スタートアップにとって、99.99%を目指す価値はありません。インフラのセットアップが必要です。製品を検証する必要があります。MVPを構築し、ある程度のトラクションを得る必要があります。

初期段階のスタートアップとして、稼働時間について心配する必要はありません。でも自分を守る方法は、マルチAZ、アベイラビリティゾーンです。マルチリージョン。つまり、米国に1つ、ヨーロッパに1つのようなものです。マルチクラウド戦略。これは間違いなくスタートアップ向けではありません。

ARRが100万ドルになった後、GCP、Azure、AWS、または独自のHetzner VPSサーバーのようなものができます。たくさんのオプションがありますよね。そして、このレポートはおそらくそれらをかなり広範にカバーしており、異なる段階でこれについてどれだけ心配する必要があるかも教えてくれます。

これは実際に非常に良いレポートです。実際、単一のディープリサーチよりもはるかに多くの情報が必要なときに、このエージェントを自分自身で使用するかもしれません。なぜなら、時々、どの方向に研究を行うべきかさえわからないからです。そのため、最初の2つのステップを追加しました。最初にウェブで素早く予備的な検索を行い、いくつかのコンテキストを取得することで、あなたが何を意味しているかを理解しようとします。

次に、それについて推論し、100個、またはテスト用には20ですが、100個の異なる検索クエリを出力します。だから推論モデルが大変な作業をします。ウェブでこれをどのように調査するかを考えています。そして、これらの100個すべてが独自のディープリサーチを行うことができ、最終的なモデル、これも推論モデルですが、それらすべてを単一のレポートに集約し、明確なMDファイルを提供します。

そして賢ければ、コンサルタントであれば、これを実際の米ドルのために簡単に転用できます。わかりますよね。でもそれはさておき、これがDroidです。非常に強力で多用途なUIであることがわかります。Claude Codeよりも優れており、これは非常に高い賛辞です。間違いなくCodex CLIよりも優れています。Claude Codeよりも優れているとさえ言えます。

画像の貼り付けが見えますよね。別のスクリーンショットを撮って貼り付けることができます。これははるかに優れています。上部で画像を処理しています。見て、管理できます。これは、もっと早く試していればよかったと思う素晴らしいコーディングエージェントです。

Droidや他の新しいAIコーディングプロジェクト、コーディングエージェント、オープンソースリポジトリについてもっと動画を作ってほしい場合は、必ず登録してください。私ほど詳細にカバーしている他のチャンネルはないと思うからです。明らかに、ニュースをスパムしているチャンネルはあります。そのような低品質のニューススパマーはたくさんいますよね。

でも違いは、彼らは実際のスタートアップを構築していないということです。1年以上、1000時間以上、10万ドル以上を費やして、プロダクションで65,000人以上に使用された実際のスタートアップ、ソフトウェア会社を構築していません。彼らはそれをやっていません。だから彼らの意見は重要ではありません。私はそれをやりました。だからあなたは登録する必要があり、だからあなたはこのチャンネルを見ているのです。

最後まで見ている方は、必ず登録してください。完全に無料で、2秒しかかかりませんし、将来これらの動画を見逃さないようにできます。それはさておき、この動画を見るために時間を費やしてくれてありがとうございます。素晴らしく生産的な一週間をお過ごしください。

コメント

タイトルとURLをコピーしました