本動画は、GPT-5.1 Codex MaxとGemini 3を並行活用する革新的なバイブコーディングワークフローを紹介している。従来のソフトウェアエンジニアリングでは専門知識が必須だったが、現在はこれらのAIツールを適切に組み合わせることで、高校中退の17歳でも複雑なアプリケーション開発が可能になっている。Codex Maxは精密な実装に優れ、Gemini 3は大局的な視点と複雑性の理解に長けており、両者を相互に補完させることであらゆるソフトウェア開発タスクを解決できる。動画では実例として、Nano Banana Proモデルを使用したYouTubeサムネイル生成アプリの開発プロセスを詳細に解説し、アイデア出しからシステムプロンプト設計、実装までの全工程を公開している。重要なのはコーディングスキルではなく、適切な意思決定と資本配分能力であり、AI時代のエンジニアは専門作業者から戦略的な資本配分者へと役割転換すべきだと主張している。

バイブコーディングの新時代へようこそ
こんにちは、チャンネルへようこそ。この動画では、私にとって非常にうまく機能しているバイブコーディングのワークフローについてお話ししたいと思います。ちょうど先週、ソフトウェアエンジニアリングの時代において巨大な飛躍を遂げたと思っています。以前は、ほんの2週間前、3週間前まで、ソフトウェアエンジニアリングで実際に自分が何をしているのか理解している必要がありました。
データベース設計についてある程度理解している必要がありましたし、優れたセキュリティと堅牢性を確保する方法も理解していなければなりませんでした。そして、構築しているプラットフォームのアーキテクチャと、情報の流れにどのように統合するかを理解する必要がありました。それが先週変わったんです。GPT-5.1 Codex MaxとGemini 3の組み合わせにより、正式に変わりました。もう自分が何をしているのか実際に理解している必要はないと思います。
これらのツールを使用するかなり堅牢なプロセスがあって、それらを直感的で信頼性の高い方法で使用している限り、本当に自分が何をしているのか知る必要はありません。ツールにどうプロンプトを出すかを理解して、進みたい方向性について一般的な理解を持っているだけでいいんです。
数日前に私は声明を出しました。地球上のほぼ誰でも今やエンジニアレベルの価値を社会に提供できるようになったと。もしかしたら、あなたは最高のエンジニアではないかもしれません。アンドレ・カルパシーレベルで価値を提供できないかもしれませんが、そこに到達するでしょう。それは深遠なことです。今日の私たちの状況からそう遠くはありません。
二つのモデルの強みを理解する
ここでCodex Maxを見て、Gemini 3と比較してみましょう。これらのモデルについて重要なのは、Gemini 3が非常に大きな事前学習モデルだということです。事前学習のスケーリングパラダイムがまだ機能することの証明のようなものです。6兆パラメータのモデルで、ある種の世界モデルを持っています。環境内の自己認識がより高いモデルの一つです。
自分が置かれている環境内での自己モデルが優れています。このため、はるかに汎用的になる能力があります。実際に異なるものの複雑性とニュアンスを他のモデルよりもはるかによく理解しています。一方で、GPT-5.1 Codex Maxモデルがあります。これはメスのようなものです。基本的には、非常に効果的なエンジニアです。
本当に深く入り込んで、コードベースの問題空間を極めて良く精査できます。これらのモデルには異なる強みと弱点があります。Gemini 3は必ずしもCodex Maxがやっていることを最も得意とするわけではありませんし、Codex Maxも必ずしもGemini 3がやることを最も得意とするわけではありません。しかし組み合わせると、これらのモデルは私が投げかけた問題をすべて解決してくれます、少なくとも私の場合は。そしてかなり深遠な程度でそれを行います。
お見せしたいワークフローは、これらのモデルを一緒に使用する組み合わせです。これらのモデルに精通している方なら、すでにどのように機能するかヒントを得ているかもしれません。私はGPT-5 Codex Maxをバックエンドとして使用しています。バックエンドにはこれらのモデルの組み合わせを使用します。なぜなら、GeminiはGPT-5.1 Codex Maxとは異なる視点からシステムを見る能力があるからです。
このモデルは人間のエンジニアと同様にトンネルビジョンに陥ることがあります。人間のエンジニアは問題空間で作業を始め、修正しようとしている問題を見つけ出すことができますが、トンネルビジョンに陥ってしまい、作業している内容の特定の側面を異なるレンズから見ることが難しくなることがあります。
そして、Codexに渡すことができます。Codex Maxから作業しようとしている問題のプロンプトを取り出し、それをコピー&ペーストしてGemini 3に渡すことができます。Gemini 3はまったく異なるレンズから見ることができ、異なる世界観、より高レベルの枠組みで物事を複雑な動的システムとして見ることができ、実際にその問題を解決できます。プロンプトを返してくれて、合理的な解決策を提供します。それをCodex Maxに戻すと、本当にうまく機能します。
フロントエンドデザインにおけるGeminiの強み
ご存じかもしれませんが、Geminiはフロントエンドデザインを実際に得意とする最初のモデルです。ユーザーインターフェースの作成がかなり得意です。これは明らかに暗号取引プラットフォームのようなワンショットのUIです。ご覧のとおり、悪くありません。かなり良いです。明らかに完璧ではありません。おそらく改善の余地はあります。削除できるものもあるでしょう。
かなり多くのことが起こっていますが、全体的に私が今まで見た中で最悪というわけではありませんよね。こちらが別の例です。フルスクリーンでズームインしましょう。シンプルなデザインです。これは実際にかなり堅実だと思います。クリックするボタンもあまり多くありません。かなりクリーンで、非常にシンプルでミニマリスティックです。それが私が構築したいUIの種類なんです。
この動画では、私がものを構築するプロセスを順を追って説明し、これらのツールを並行してどのように使用して、私が投げかけることができるあらゆるソフトウェアエンジニアリングタスクをほぼ解決しているかを示したいと思います。繰り返しますが、以前の動画でも触れましたが、今はある種のパラダイムシフトの中にいると思います。高校中退の17歳の若者でも、基本的に今やソフトウェアを構築できるようになりました。
前進し続ける根性と決意、そして英語を読む能力さえあれば、できます。本当にそれくらいシンプルです。英語を読むことができて、ただやり抜く根性があれば、かなり複雑なものを構築できます。明らかに、ある程度のドメイン知識があれば、おそらくもう少し早く進めるでしょう。少し楽になりますが、これをやりながら学ぶことができます。
ソフトウェアの構築方法を知らなくても、構築を始められます。そして構築しながら、ああ、アーキテクチャはこういう風になっているべきなんだ、データベースはこういう風に構造化されるべきなんだ、これらがこういう風に動作するはずなんだと理解し始めることができます。そしてその場で学べます。
それが最善の方法だと思います。バイブ学習が今後誰もがいつでも学ぶ方法になると思います。AIのような強力なテクノロジーを使って。とにかく、始めましょう。
実践:サムネイル生成アプリの開発
この例では、新しいNano Banana Proモデルを使用して、YouTubeの興味深いサムネイルを設計できる基本的なアプリを作成したいと思います。タイトルの推奨やディスクリプションの内容も提供してくれるかもしれません。どうなるか見てみましょう。
私がよくやることは、チャットの音声入力をオンにすることです。これの音声認識はGoogleのものよりもはるかに優れていて、タイピングする必要がありません。私は怠け者ですから。いや、でも本当に、話すときの実効ビットレートは、タイピングしているときよりもはるかに高いんです。話しているときの方が、より多くの複雑性とニュアンス、詳細をはるかに速く伝えることができます。また、話す能力の向上にも役立ちます。だから私は音声入力を使うのが好きなんです。
Googleの最新Nano Banana Proを使用して、サムネイルデザインアプリを作成したいと思います。特定のタイプのサムネイルデザインを、特定の時期の最新クリエイターのものに似せる能力を持たせたいです。たとえば、今日のエンターテインメント分野での最新クリエイターはMr. Beastで、彼のサムネイルは今日ある種の見た目をしています。しかし2028年には、最新クリエイターは別の誰かになり、その時のサムネイルは異なる見た目になるでしょう。私のシステムがその時の最新かつ最高のサムネイルデザインに適応できるようにしたいです。
そして、これをYouTubeやビジネス、コンテンツ作成、収益化に関連するすべての異なるニッチ、エンターテインメント、健康、富、人間関係など、あなたが関連すると思うあらゆる異なるドメインで実行できるようにしたいです。
基本的に、考えていた最初のアイデアを入力して、ゴーをクリックして何が返ってくるか見てみます。この時点で私がよくやることは、Geminiのモデルは特定のことが本当に得意で、チャットのモデルは他のことが本当に得意なので、この二つを組み合わせて、連携して使うのが好きです。実際にやってみます。これをコピーして、Geminiに行って、シンキングモードなどすべて良い設定になっていることを確認して、送信します。そして両方のものを読んで、それぞれから気に入ったものを選びます。
これは実際にプロジェクト、プラットフォーム、何と呼んでもいいですが、作業を始める完璧な方法だと思います。そして、気に入ったものを選び始めて、お互いからプロンプトを交換できます。ChatGPTからの出力を取ってGeminiに入れ、Geminiからの出力を取ってChatGPTに入れます。構築したいプラットフォームが完全に洗練されるまでこれを続けます。その時点で、agents.mdファイルのシステムプロンプトの構築を始めます。
システムプロンプトの重要性
ご存じないかもしれませんが、agents.mdファイルはAIコーディングエージェント用のシステムプロンプトのようなものです。私がよくやることは、agents.mdファイルを本当に洗練させることです。本当に本当に本当によく考え抜かれた、構造化された、まとまったシステムプロンプトをagents.mdファイルに用意します。コーディングエージェントが文字通り最初から最後まで、このプラットフォームの構築方法、私が望むすべてのことを正確に知るようにして、基本的に放っておくことができるようにします。
つまり、基本的にアイデアについてChatGPTと話をするんです。ビジョンを説明して、同じことをGoogleにも説明します。そして彼らに互いに説明し返してもらいます。なぜなら、彼らはこの時点で私よりもおそらく専門家だからです。ですよね?
今、実際のチャットインターフェースに行って、agents.mdファイルが見えますか、プロジェクトを説明してくださいと言います。Codexでも同じことをします、すでに開いています。そしてこのワークフローを続けます。アイデアの発想から実際にものを構築するところまで、GPT-5とGemini 3を並行して使用します。
その理由は、繰り返しますが、Geminiはこの非常に大きなチャンキーなモデルで、非常に深い理解を持っていて、物事を見る異なる方法が優れているからです。そして、Codexモデルはコーディングが非常に得意です。だからモデルと二つの間の洞察を再結合するんです。
プロダクトビジョン、アーキテクチャ。実際、このためにはGeminiから始めようと思います。いや、待って。これを構築するための最良のアプローチを計画してください。基本的に、ChatGPTに最良のアプローチを計画させます。そして実際にこれを取ってGeminiに貼り付けて、これが最良のアプローチですかと聞きます。
今、私がこれらのシステムをプロンプトする方法、それらを一緒にどう使用するかについて、覚えておいてください。これを行うのにスキルは必要ありません。読み書きができればいいだけです。読み書きができれば、これができます。それが今の私たちの状況で驚くべきことです。そして、文字通り誰でも読み書きができれば、この動画を見れば、これができます。それほど簡単なんです。
この動画のステップに従うだけです。必要なら巻き戻してください。すべてここにあります。15歳でもこれができます。80歳でもおそらくこれができます。今はテクノロジーを使うのがとても簡単になっています。このAIテクノロジーがとても簡単にしてくれているからです。
AIモデルを並行活用する実践プロセス
やってみましょう。Geminiに開始させます。これらのモデルを行ったり来たりする方法として、Geminiにメインの構造化を開始させて、それからCodexモデルに入って堅牢であることを確認させ、本当に良いものであることを確認させます。そして、Geminiが解決できない特定のことがあれば、Codexはおそらく解決できます。Codexが解決できない特定のことがあれば、Geminiがおそらく解決できます。
ご覧のとおり、すでにここのファイルに物を追加し始めています。まだ何も入っていないappディレクトリにすでに取り組んでいます。turbo JSONなど、そういったものをすでに追加しています。私のためにコマンドを実行しています。
そして私はただここに座っているだけです。これが私がAnti-gravityを使い始めるのが好きな理由です。文字通りすべてをやってくれます。文字通りすべてです。そしてあなたはただここに座っているだけです。それからCodexは、エッジ部分に入って、すべてが正しく書かれていることを確認するのが非常に得意なモデルです。優れたセキュリティがあります。
問題が適切な方法で解決されています。そして、Geminiがやっていることを精査する役割に入ることができます。これら二つを並行して使用することは非常に強力です。なぜなら、彼らは非常に相乗的に一緒に機能するからです。見てください。ほんの数秒前にappsをクリックしたときは完全に空でしたが、今は最初のものが入っています。最初のものが現れ始めているのが見えます。
Anti-gravityを使用することの素晴らしい点は、Nano Bananaがエージェンティックなツールチェーンに組み込まれていることです。だから、実際にNano Banana Proモデルを使用して、アプリ内で必要な場所ならどこでもインフォグラフィックスやデザインなどを作成できます。それはクールです。
Geminiが仕事をしているのが見えます。このnode_modulesは見る必要もありません。たくさんのゴミが入っています。でも、実際に物事が起こっていて、かなりスムーズに進んでいるのが見えます。このAnti-gravity CLIが最初に出たときは、かなりひどかったんですが、今はアップデートされて、ずっと良くなりました。より一貫性があって使いやすくなりました。それはクールです。
この時点で、コーディングモデルに仕事をさせて、戻ってきます。この時点では本当にあまりやることはありません。基本的に、うん、やってくれ、頑張れと伝えるだけです。もし一つが行き詰まったら、オーケー、大きく一歩下がって、これについて考えて、起こり得るすべての可能性を見てみようと言います。そして、そこから一つにコミットします。そして、本当にあまりやることはありません。
これはかなり受動的なプロセスです。コーディングエージェントに自分のことをやらせるだけです。もし行き詰まったら、繰り返しますが、重要なことは一方から他方への情報転送です。なぜなら、彼らは異なる視点で物事を見て、異なる方法で問題を解決し、索引付けするスキルのインデックスが異なるからです。
それを覚えておいてください。そうすれば、その時点で解決しようとしているあらゆることを突破できます。そして、私がよくやることは、時々Codexと Geminiで新しい会話を開いて、モデルにプラットフォームの包括的な概要を行わせ、不必要な冗長性をどのように削除できるか、抱えている技術的負債をどのようにクリーンアップできるか、アーキテクチャが強固であることを確認し、堅実なデータベース設計があることを確認する、そういったすべてのことをリストアップさせます。
そして、可能な限りシンプルにするようにします。アプリの動作を台無しにすることなく削除できるものはすべて削除するようモデルに試みさせます。それがここでのゴールです。超超超超超シンプルにして、非常に美しくすることです。そして、それがほぼすべてです。それ以外は、かなり受動的なプロセスです。
初心者が直面する課題と解決策
ここまで来たなら、必要なのはこのくらいです。クール。データベースのことをする前に、見られるUIを構築してもらえますか。それをするために。完全な初心者なら実際に問題に遭遇するかもしれないいくつかの領域は、データベースの統合です。SuperbaseかFirebaseを使うだけで、非常にシンプルになります。その時点で、やるべきことはモデルに、Superbaseをどうやって統合するのか、Firebaseをどうやって統合するのかと尋ねるだけです。英語が読めて質問ができる限り、解決できます。
それが今の文明でAIの力があればできることです。YouTubeとAIの力で。やるべきことはYouTubeの使い方を知って、質問をして、読んで聞くことだけです。そうすればなんでもできます。文字通りすべてのスキルが無料です。すべてのスキルが無料です。あなたと地球上のあらゆるスキルの間にあるのは、立ち上がってやるだけの意欲と主体性だけです。それだけです。だから、立ち上がってやるだけなら、大丈夫です。
クール。これでUIを見る能力があるはずです。これらの変更をすべて受け入れます。新しいターミナルを開いてテストします。npm run dev。おっと。おそらくウェブフォルダーか何かに行く必要があったようです。どこにいますか?間違って入力したのか?いや、これをコピーして、ここに貼り付けます。脳を使う気がしないので。
そして、そうです。主体性です。機知に富むこと、非常に主体的であること。もう脳を持つ必要はありません。いや、脳を持つ必要はあります。
資本配分者への転換:AI時代の新しい役割
今起こっていることで多くの人が見逃していることがあります。私たちは皆、資本配分者になっているんです。インテリジェンスは今や新しい形態の資本です。インテリジェンスと労働は新しい形態の資本です。もちろん、人間のインテリジェンスと労働は配分できるので、常にそうでしたが、今はインテリジェンスと労働を資本として実行するテクノロジーがあります。
まだインストールしていませんでした。わかりました。オーケー。これをコピーします。ここに貼り付けます。インテリジェンスと労働は資本であり、私たちは資本配分者になっています。
だから、この作業をする限り、この仕事をするために脳を使っているなら、脳を間違って使っています。もう専門スキル労働者になることは想定されていません。ソフトウェアがサービスを食べています。ソフトウェアはファイリングキャビネットを食べ、シンプルな決定論的な自動化を食べました。今、ソフトウェアはほぼすべてのサービスを食べようとしています。
では、サービスとは何でしょうか?スキルまたはサービスとはスキルを売ることです。これが新しいスキルです。これらのものがすべてのスキルを置き換えようとしています。だから、Software as a Serviceを持つことがスキルを置き換えています。したがって、特定のタスクに熟練していることは良いアイデアではありません。
熟練すべきはタスクを実行することではありません。世界と複雑な動的システムを見る能力と、それに基づいて意思決定を行うことに熟練すべきです。それだけです。あなたは今や資本配分者です。チャーリー・マンガーを見てください。ウォーレン・バフェットを見てください。
より良いソフトウェアエンジニアになろうとしているなら、何をすべきか理解したいなら、ソフトウェアを理解し、コンピューターサイエンスを理解し、統計を理解し、これらのことを理解するのは良いことだと思います。しかし、より良いソフトウェアエンジニアになるためにそれをすべきではありません。システムを理解して、より高いレベルでより良い意思決定ができるようにするためにすべきです。
より良いソフトウェアエンジニアになるためではありません。なぜなら、それがあなたが索引付けているものなら、これらのものがあなたの仕事全体を食べるからです。より高い抽象化レベルに行くべきです。それは長期的な意思決定、長期的な注意、資本配分です。それが私たちが向かっている方向です。だから、チャーリー・マンガーとウォーレン・バフェットを研究してください。それ以外は、負けゲームをプレイしています。AIと競争しようとしていますが、勝てません。
アプリケーションの初期バージョン完成
そして、見てください、アプリケーションの始まりができました。あなたのニッチは何ですか?これがオンボーディングプロセスです。テックと言いましょう。続ける。あなたの主な目標は?セールスとリード。続ける。あなたのブランドを定義してください。セットアップを完了。
そしてここです。Mr. Beastなんとかかんとか。サムネイルを生成。基本的にサムネイルに何が欲しいかを言って、サムネイルを生成できます。明らかに、実際にこれを行うにはNano Bananaモデルを接続する必要がありますが、これはかなりクールです。スタイルを選択、ミニマリスティックなテック、ショックフェイス、ドキュメンタリー。これらは現在のトレンドのようなものです。
クリーンな製品フォーカス、色の販売、モダンなタイポグラフィ。これらのシステムプロンプトが何なのか気になります。それを見られたらかなりクールでしょう。インターネットのエーテルから最新のビデオサムネイルタイトルのものも引き出せたらいいのにと思います。それで履歴、履歴が機能していないとかありますが、それ以外はこれはかなりクールです。悪い製品ではありません。
明らかに、これらが正しく取得されることを確認するためには、システムプロンプトエンジニアリングが必要です。それから、Nano Bananaモデルを統合する必要があります。それがほぼすべてです。ほぼそれだけです。それは簡単なことです。いくつかのAPIを接続するだけです。それのやり方がわからなければ、何を言えばいいかわかりません。それのやり方がわからなければ、これをやってください。
進捗状況の更新と書いてあります。これが私たちがやったことです。次は何ですか?これがバイブコーディングをしているときにやることです。次は何かと尋ね続けて、次にすべきことをやります。それだけでシンプルです。すでに指示があります。他のモデルで基本的にここに示したのは、やらなければならないすべてのことの指示です。
今、これらの指示をこの右ここで英語に変換します。そして、これを聞いてやるだけです。それと同じくらいシンプルです。それに従っていくだけで、それだけです。ホームストレッチまでそれをやり続けられます。聞いてやるだけです。それだけです。もうそれだけで済むんです。
ソフトウェアエンジニアである必要はありません。天才である必要はありません。やるべきことは読み書きができることだけです。読み書きができて、インターネットにアクセスできて、月額20ドルがあること。それだけで必要なすべてです。もうそれだけで、今後永遠に必要なすべてです。
それが言えたところで、おそらくここでビデオを終了します。もう話すことがあまり残っていないからです。コーディングエージェントがコーディングをするのを見ているだけで退屈になります。
今後の展望:ビジネスモデルの選択について
ごく近い将来に注目してください。実際にどのビジネスモデルにフォーカスすべきかについて話すつもりです。誰もがいつも、バイブコーディングのやり方、バイブコーディングでアプリを構築する方法、これらの異なることをどうやってできるかについて話していますが、誰も、そもそも私は何をバイブコーディングすべきなのかと言っていません。私たちが生きているこの超動的で常に変化する世界で、今実際に良い機会の乗り物は何でしょうか?
一度にとても多くの異なることが変化しています。ビジネスを適切に構築していなければ、始めるとすぐに基本的に死んでいます。それが次のビデオで扱う内容です。お楽しみに。作るのを楽しみにしています。それでは、次のビデオでお会いしましょう。


コメント