GStackは、Y CombinatorのCEOであるガリー・タンが開発した、Claude Codeを本格的なAIエンジニアリングチームに変えるオープンソースフレームワークである。従来のコーディングエージェントが「賢いが方向性を見失いやすい」という課題を抱えていたのに対し、GStackは人間のチーム開発と同様に役割・プロセス・レビューを組み込むことで、エージェントに実務レベルの仕事をさせることを可能にした。タンは2ヶ月間で、かつて2年・1000万ドル・10人のエンジニアを要したPosterous相当のプロダクトをほぼ一人で構築し、その過程で得た知見をGStackに結晶化させた。オフィスアワーやCEOレビュー、敵対的レビュー、デザイン生成、QA自動化まで28以上のコマンドを備え、並列開発セッションで1日50件ものPRを処理できる開発体制を実現する。ボトルネックはモデルの知能ではなく、適切な構造化と指示の与え方にあるという哲学のもと、GStackは「薄いハーネス、厚いスキル」アプローチで開発者の生産性を劇的に引き上げる。

はじめに
こんにちは、Y CombinatorのCEO兼社長のガリーです。私はエンジニアでもあり、キャリアの最初の10年間はフルタイムでソフトウェアを開発していました。スタンフォード大学でコンピュータシステムエンジニアリングを学び、その後Palantirの10人目の社員として入社し、エンジニア、デザイナー、プロダクトマネージャーを兼任しました。
その後、マイクロブログプラットフォームのPosterousを共同創業し、Twitterに売却しました。また、YCの内部ソーシャルプラットフォーム兼ナレッジベースであるBookfaceの最初のバージョンも構築しました。つまり、これまでのキャリアで大量のコードを書いてきたわけですが、今ここで皆さんにお伝えしたいのは、私たちは全く新しいソフトウェア構築の時代、つまりエージェント時代に突入しているということです。
エージェントに実際の仕事をさせる方法は、人間が常にやってきた方法と同じなんです。役割を持ったチームとして、プロセスを経て、レビューを行う。この考え方を具現化するために、3週間前にGStackを構築しました。そして今では、Ruby on Railsよりも多くのGitHubスターを獲得しています。
このビデオでは、GStackがどのようにエージェントを使った開発を支援できるかを説明したいと思います。私は過去2ヶ月間、2013年以来の量のコーディングをしました。2013年は、エンジニアとして本当に、本当に懸命に働いた最後の年でした。
Claude Codeとの出会い
1月にClaude Codeを使い始めたのは、アンドレイ・カルパシーやボリス・チャーニーのような人たちが、もう手動でコードを書くことは一切ないと言っているのを聞いた後でした。そして完全にハマってしまいました。その過程で、Posterousで共同創業者と10人のエンジニアチームと共に2年かけて構築したものを、基本的に全て構築してしまいました。つまり、私のスタートアップPosterousで2年、1000万ドル、10人のエンジニアをかけて構築したものを、基本的に全て作り上げたのです。
ただし、箱から出したままの状態では、モデルは彷徨ってしまいます。データをよく理解していないので、推測してしまうんです。そして、そのスケールでの推測が、もっともらしく見えるコードを生成するものの、密かに壊れているという事態を招くのです。
ここでのボトルネックはモデルの知能ではありません。モデルを正しく設定しさえすれば、彼らはすでにあなたのコードベースで素晴らしい仕事をするのに十分賢いのです。
GStackの哲学
これは逆なんです。足場は些細なほど薄くあるべきです。GStackは、私が実装した「薄いハーネス、厚いスキル」アプローチです。Claude Codeをあなたのためのエンジニアリングチームに変える、私が構築したオープンソースリポジトリです。専門家チームのように振る舞うスキル群なのです。
オフィスアワーはそうしたスキルの1つです。これは実際、私たちがYCでパートナーとして、スタートアップとオフィスアワーを行う際に経験することを正確にモデル化したものです。構築を始める前に、プロダクトを再定義するための6つの核心的な質問を投げかけることから始まります。
では、どのように機能するか見せましょう。
実際の使用例:税務アプリの構築
GStackを始めるのに最適な方法は、実はConductorです。クイックスタートに入ります。GStackは実際、今Conductorに組み込まれています。GStackをクリックするだけです。
今日は税務アプリを作ります。Gmailに入って、全ての1099フォームを取り出すアプリです。今日が税務申告日ですからね。
GStackは実際、一連のスキルです。最初に使用するのはオフィスアワーと呼ばれるものです。これは実際、16人のYCパートナーが何年もかけて磨き上げてきた、何千、何万時間もの経験を蒸留したバージョンです。私たちがYCで毎日行っていることの10%の強度に蒸留したものです。
ご覧の通り、Conductorは実際、あなたをそこに直接入れてくれます。今、私たちはYCのオフィスアワーにいます。そして私は、人々がGmailや金融機関から全ての1099フォームを取得するのを助けるスタートアップを作ろうとしています。
多くの銀行は新しい税務書類をメールで送ってくれますが、送らない銀行もあります。なので、ユーザーの受信箱を検索し、同時にURLを受け付けて、1099 int PDFを検索してダウンロードする必要があります。
いいですね。これが私たちのスタートアップアイデアです。人々の税務申告を助けるためのもので、実は昨日私自身が対処しなければならなかったことなんです。
オフィスアワースキルの実行
ユーザーはスタートアップアイデアについてオフィスアワーをしたいと思っています。オフィスアワーが始まっています。お気づきかもしれませんが、ガリーモードがオンになっています。これが実際に行うのは、全ての推論トレースを表示することです。これがGStackを使う上で私が本当に気に入っている点の1つです。
Conductorを使うと、モデルが考えていることを正確に見ることができます。今はちょうど始まったばかりですが、今からコンテキストを構築し始めます。なるほど、これは初期コミットを持つ新規プロジェクトです。事前のデザインドキュメントはありません。スタートアップモードです。
ここで最初に起こるのがこれです。オフィスアワーのスキルを持つモデルは、多くの思考を行います。時にはウェブを検索して、あなたが何をしようとしているのかを理解しようとします。
他の全てを決定する質問がこちらです。誰かが実際にこれを欲しがっているという最も強力な証拠は何ですか。これは実際、プロジェクトXに取り組むべきか、あるいはあのスタートアップに取り組むべきかを決める際に、自分自身に問いかけるべき最も重要な質問の1つです。
私は実際、最近これを経験しました。なので、それをクリックします。つい先日この経験をしました。正確に何が起きたのですか。銀行口座はいくつあり、どれが1099を送ってきましたか。
いくつかあります。そして、それらを探し出すプロセスは実際、非常に苦痛です。
なるほど、痛みは本物ですが、結果は摩擦と苛立ちであって、実際の罰則ではありません。
まあ、正直なところ、会計士が私に苛立ちのメールを送ってきます。時には電話がかかってくることもあります。彼らは自分の仕事をしようとしているだけで、私はそれを助けるはずなのです。そして、私は5つ以上の口座を持っています。
これは実際、本当に興味深いことです。TurboTaxやH&R Blockには実際1099インポート機能があり、Plaidは銀行に接続します。なぜそれらがあなたのために解決していないのですか。
答えると、こう言いました。「ユーザーは単なる書類取得者以上のものを考えています。これをファネルとして見ているのです。フックは『全ての1099を見つけます』というもので、即座の痛みを解決します。しかし拡張は、書類を手に入れたので、実際に税務申告の準備をしましょう、つまり税務申告代行者とのマッチメイキングとリード生成です。」
これは典型的なウェッジ戦略です。これは単なる書類集約だけよりも実際、より興味深いビジネスモデルです。1099の集約には月額2ドルか5ドル、あるいは年間で2ドルか5ドルを請求できるかもしれませんが、実際には税務申告代行者との取引の一定割合を請求できます。それは10倍以上になるかもしれません。
これは実際、オフィスアワーの非常にクールな部分です。私は自分自身のために楽しみでこれを構築するかもしれません。なぜなら、毎年これをしなければならないからです。そして、これは実際、オフィスアワーとGStackを使う上で最も楽しい部分の1つです。これはレールに乗った何かというよりも、モデルとの会話のようなものなんです。
もしただ入ってきて、モデルにそのまま指示を与えたら、つまり元々のことをタイプしただけなら、1099を見つける必要があると、それはそれを実行します。文字通りそれを実行しますが、ユーザーは誰か、これは何か、ビジネスモデルは何か、誰がこれを欲しがっているのか、痛みのポイントは何か、どのように機能するのか、といったことは考えません。これが私たちが毎日、たくさんの創業者とオフィスアワーで行っていることで、私たちはかなり得意ですが、このスキルも同様です。
アプローチの検討
改訂されたAIブラウザ自動化。GStackブラウザスタイルでは、ユーザーがログインし、その後AIが税務書類にナビゲートしてPDFをダウンロードします。ユーザーはそれが起こるのを見守ります。
それは正しいと思います。見てみましょう。これは私にとって非常に興味深いことです。私は構築のプロセスについて少し学んでいる気がします。普段、人々と常にオフィスアワーをしているのにもかかわらず。
これは前提3への鋭い反論です。あなたは正しい。私はGStackブラウザを持っていて、あなたが説明しているアプローチは本当に賢いです。モデルはユーザーがログインし、AIが引き継ぎ、税務書類にナビゲートし、1099を見つけてダウンロードする、というものでしょう。Plaidも保存された認証情報も不要です。ユーザーは可視ブラウザで全体のプロセスを見守ります。
私が気に入っているのは、それが彼らの実際のブラウザで起こるということです。クラウドで起こるのではありません。クラウドは単に他人のコンピュータですから。GStackが次第に可能にしている素晴らしいことの1つは、実際にCodexを使って、ここにあるかもしれない全てのクレイジーなバグを解決できることです。今すぐにはやりませんが、自宅で自分で取り組む際にできることです。
Claude Codeの考え方は、デフォルトでClaudeを使うということです。そしてOpus 4.6は一種のADHD的なCEOだと思います。彼は一緒にビールを飲みたくなるような人で、10億のアイデアを持っていますが、状況が厳しくなったら、自閉症的なCTO、つまりCodexを呼ばなければなりません。
さて、今はスキップします。なぜなら、実際にはかなり近づいているからです。基本的に私たちはプランモードにいて、オフィスアワーは多くのことが考慮されたプランから始めるのを助けてくれます。
ここに実際、本当にクールな例があります。実際に考え抜いて、3つの異なるアプローチがあります。最初のアプローチは、Gmail認証、その後税務書類を検索(通知ではなく)、その後1099を発行する銀行のチェックリストを出力します。
最初はブラウザ自動化はありません。労力は小さく、リスクも小さいです。それを見ると、興味深く聞こえますが、実際に取り組むほど大きくは聞こえません。自分でできそうです。
次はフルスタックのGmailとAIブラウザ自動化、そしてCPAマーケットプレイスを使用したものです。
これは実際に私が望んでいるもののように聞こえます。そして、箱の外で考えています。「なるほど、アプローチCはどうでしょうか。CPAファーストで市場投入を反転させる。」Bが正しいように思います。
そして実際、私は時々この追加のことを加えるのが好きです。アイデアがあるとき、アプローチの1つが私に訴えかけてくるとき、でも他のことを考えます。「なるほど、Bが気に入っていますが、実際、ブラウザインタラクションを使ってGoogle認証を完全にスキップし、ユーザーにGmailを開いてもらうだけにできます。そしてGStackブラウザのバージョンがGmailを使って自動的に1099を検索できます。」
それと同時に、ユーザーに他にどの銀行を持っているか尋ねることもできます。
また、これは私に起こることですが、すでにCPAを持っている場合は、メールから見つけることができます。そしてあなたが私なら、おそらくすでに特定の口座についてCPAから催促のメールをたくさん受け取っているでしょう。
私たちはオフィスアワーの終わりに近づいていますが、ご覧の通り、すでに何かやりたいかもしれない半分煮詰まった大雑把なアイデアから進みました。
これが実際に良いスタートアップアイデアだと言っているわけではありませんが、これがどこまで進んだかがわかります。認証から始まり、CPAの催促メールという方向で始まりましたが、最終的には、ブラウザを持っていて、ブラウザ自動化を使って受信箱を検索し、ダウンロードする必要のある全ての1099を見つけられることに気づきました。
また、LLMを使ってどの銀行ポータルに追加する必要があるかを尋ね、あなたのアカウントでログインして実際にPDFをダウンロードし、その後CPAにメールを送ることもできます。
ブラウザ自動化とコーディングの新時代
だから私はこのブラウザ自動化が本当に好きです。これは非常に型破りで独特な、この問題を解決する方法です。そしてコーディングモデルについての驚くべきことは、1年前、2年前、さらには3ヶ月前でさえ、誰かがこれを試そうとするかどうか、私には明確ではなかったということです。
それが今の私たちの時代について最も興味深いことだと思います。アイデアを持って、それまで決してできなかったほど先に進むことができるのです。率直に言って、時々オフィスアワーを使って、3回に1回くらいの割合でその最後に辿り着いて、「わかった、これは意味をなさない」と言います。
オフィスアワーには実際、実現可能性の側面があることに気づくでしょう。それは、スタートアップと一緒にオフィスアワーで働く際に私が本当に誇りに思っていることの1つです。世界がどのように機能するか、何が機能するかについて非常に強い意見を持っています。そして、Opus 4.6がそれを反映して、あなたのスタートアップやプロダクトアイデアが何であるべきかを理解しようと助けてくれるのを見るのは、非常に興味深いです。
敵対的レビューと改善
今行っているのは、複数ステップの敵対的レビューです。あなたのアイデアを試練にかけようとしています。ご覧の通り、すでに多くのことを見つけていて、自動修正しようとしています。
失敗処理がありません。プライバシーセクションがありません。2要素認証の引き継ぎに提案された解決策がありません。実際にこれらのことを自動入力しようとします。できる場合は実行します。
私たちのドキュメントは2ラウンドの敵対的レビューを生き延びました。そして16の問題を自動的に捉えて修正しました。なので、このデザインドキュメントを承認します。
ご覧の通り、敵対的レビューはスコアを10点満点中6点から8点に改善し、後で心配できる3つの残った問題があります。
デザインショットガン
敵対的レビューをロックして、これら全ての問題に対処したので、通常なら私はプランCEOレビューを実行しますが、代わりにデザインショットガンに直接ジャンプすると思います。これは私の最も楽しい使い方の1つです。これはバッグに入っているたくさんの異なるデザインツールの1つに過ぎません。
ここでたくさんの異なるビューがあることがわかりました。実際に何をデザインしたいですか。メインのチェックリストダッシュボードをやりましょう。
デザインチェックは私のビジュアルブレインストーミングツールです。実際に複数のAIバージョンを生成し、それについて質問します。3つの方向性があります。約60秒かかります。
実際にOpenAI Codexに委託します。Codexは画像生成を使用できます。さて、3つのバージョンがあります。コマンドセンター、フレンドリープログレス、スプリットビューです。見てみましょう。
エージェントに調理させて、約5分後に戻ってきます。
デザインオプションの評価
素晴らしい。エージェントが調理を終えました。これが得られたものです。税務書類を追跡するためのコマンドセンターに表示される実際のページの3つの異なるオプションを得ました。1つずつ見てみましょう。オプションA、B、Cがあります。
これがコマンドセンターの1つです。ダッシュボードがあります。すべての詳細があります。これはかなり良く見えます。ここで抽出できれば、すべての銀行とすべての1099、それらがどこから来ているのか、そしてそれらのステータスがわかります。かなり良いです。これには5つ星のうち4つをつけます。
オプションBははるかにフレンドリーです。オプションAはLinuxハッカーなら本当に気に入ると思います。しかしオプションBは、普通の人々にとってよりフレンドリーだと思います。だから、5をつけるかもしれません。それが選択かもしれません。
それでは、オプションCを見てみましょう。これは必要以上に複雑にしています。だから本当にこれはやりません。オプションBでいきましょう。
そして素晴らしいことに、気に入らなければ、フィードバックを入力できます。再生成をクリックできます。しかしこの場合、オプションBで進み、続けます。
それが戻ってきます。ご覧の通り、オプションBを選択します。そこにあります。進捗リング付きのフレンドリーなカードベースのアプローチ。良い直感です。バリアントBがロックインされました。
GStackの全体像
せっかくなので、それは28の異なるコマンドのうちの2つに過ぎません。現在7万以上のスターを獲得しています。そして、使っている人々の中には、Claude Codeを使うときに時間の80から90パーセントをオフィスアワー、プラン、CEOレビュー、オートプランで過ごしていると話す人もいます。
これがそのスプリントプロセスが実際にどのように機能するかの大まかなビューです。すでにオフィスアワーについて話しましたが、多くのやり取りをしたくない場合、詳細に入りたくない場合は、オートプランを作成しました。これは基本的に私のデフォルトの推奨事項を使用して、CEO、エンジニアリング、デザイン、開発者エクスペリエンスのレビューを経由させます。これらは、私があなただったらやるであろうことにプログラムされています。
コードが実際に完成した後に使用できるたくさんのデザインスキルがあります。Claude Codeは実際、プランで承認をクリックすると構築します。その後、コードを書き終わったら、レビューを実行できます。これはスタッフレベルのバグキャッチングサービスで、作業を試練にかけ、フルコードレビューを行い、プランモードにはなかったかもしれないバグを見つけます。
そして最もクールな部分は、実際に膨大な量のコードだと思いますが、PlaywrightとChromiumの周りにCLIを書きました。つまり、そこには実際にヘッドありとヘッドレスのブラウザ全体があります。それは私がClaude Codeを使ってスピードアップしていたときの本当の魔法の瞬間でした。
レベル7のソフトウェアファクトリー
レベル8のソフトウェアファクトリーに到達しようとするというアイデアがあります。GStackはレベル8には到達させませんが、レベル7には到達させると思います。それは、異なるプロジェクトで複数のConductorウィンドウを実行でき、時には同じプロジェクトで3つか4つ全て同時に実行できるところです。
これらは並列のPR、並列のブランチ、並列の異なる機能で、すべてほぼ同時にランディングできます。そして私が遭遇したボトルネックの1つは、エージェントが計画、デザイン、コーディングの全ての作業を行うと、私がそこに座ってQAを行っていることに気づいたことです。おそらくソフトウェア開発の中で最も楽しくない部分です。
だから、それを自動化しようとすることが私にとって非常に、非常に重要になりました。そして実行したとき、Claude in Chrome MCPは私が今まで使った中で最悪のソフトウェアの1つでした。アクションを実行しようとするたびに、考えて、考えて、考えます。狂ったようなコンテキストの肥大化がありました。多くの場合、何もしませんでしたが、機能しているときでさえ、アクションを実行するのに2、3秒かかりました。
そして、GStackの他の全てのスキルを使ってSLQAとSLbrowseツールを作成できたことに驚きました。基本的にPlaywrightをCLIレベルでラップしました。そして今、あなたのClaude Codeとあらゆるエージェントが実際にブラウザを使用できます。
ブラウザを使用できるだけでなく、スクリーンショットを撮ることができます。複雑なインタラクションができます。クリックできます。入力できます。今ではメディアのダウンロード、最終的には完全な回帰テストの実行、CSSの更新、JavaScriptであれCSSであれ、実際のブラウザバグの問題を評価することもできます。
そして最後に、shipツールがあります。これはPRがメインにランディングする準備ができているか確認する前の最後のステップです。そして、これが実際に私の働き方です。
並列開発ワークフロー
私は10から15の並列Claude Codeセッションを同時に実行します。1つのセッションでは全く新しいアイデアについてオフィスアワーを実行しているかもしれません。そして実際、今では数万のスターを持つ複数のオープンソースプロジェクトがあります。そして、おそらく今レビュー待ちのPRが約400あります。
だから、各プロジェクトに対して常に1つか2つのセッションをアクティブにして、コミュニティから得ているオープンソースの修正を評価して取り込んでいます。そしてそれを波で評価します。
今AIコーディングで本当に怖いことの1つは、サプライチェーン攻撃です。だから私は本当に、本当にパラノイアになっています。しかし素晴らしいことは、GStackが私を守ってくれることです。
私にはもうToDoリストがありません。出現したことの1つは、アイデアがあるとき、あるいはユーザーからバグレポートを受け取ったとき、あるいはGStackやGBrainで誰かが不満を持っているのをXで見たときに、Conductorでプラスアイコンをクリックするだけです。
新しいワークツリーを作成し、これらのそれぞれが新しい作業アイテムです。そして私がしなければならないのは、オフィスアワーを実行し、CEOレビュー、エンドレビュー、敵対的レビューを実行し、通常のプロセスを実行するだけです。ランディングする準備ができたらランディングします。そしてその日にあるミーティングの数に応じて、1日に10、15、20、時には50のPRを処理できます。
おわりに
以上です。GStackは今すぐ利用可能です。github.com/gritan/GStackにアクセスしてください。officehoursを実行すると、私たちがYCで創業者と行っている実際のプロダクト思考のバージョンが得られます。
私たちに実際に会う前に、同様の反論と同様の再定義が行われます。ぜひ試してみて、どう思うか教えてください。
これはソフトウェアを構築する歴史上最も素晴らしい時代です。構築への障壁が崩壊しました。残された唯一の質問は、あなたは何を構築するつもりかということです。解き放つ時が来ました。人々が欲しがるものを作りましょう。


コメント