バイブグラフィング:バイブコーディングより10倍安価なマルチエージェントシステムファクトリー

AIコーディング・Vibe-Coding
この記事は約14分で読めます。

バイブグラフィングは、自然言語による意図を編集可能なワークフロー仕様と実行可能な計算グラフへと自動コンパイルする新しいアプローチである。マルチエージェントシステムファクトリーと呼ばれるこのフレームワークは、従来のバイブコーディングと比較してAPIコストを約10分の1に削減し、複雑なマルチエージェントシステムの構築をパターンマッチングの問題として扱う。人間がループに参加しながらエージェントの役割割り当て、トポロジー設計、セマンティック補完の3段階を経て、最終的に1,511行のPythonコードをわずか45行にまで削減可能である。実行エンジンが自動的にJSONブループリントを読み取り、実行可能なグラフへとコンパイルすることで、ソフトウェアエンジニアリングの負担を大幅に軽減する革新的な手法である。

Vibe Graphing: 10x More Affordable than Vibe Coding (MAS-Factory)
From "vibe coding" to Vibe Graphing: 10x Cheaper MAS - Multi-Agent-System. Experiments on seven public benchmarks show t...

バイブグラフィングの登場

こんにちは、コミュニティの皆さん。お帰りなさい。そうです、バイブコーディングは昨日の話です。今日はバイブグラフィングを体験していきます。もう少し具体的に言うと、これはコード生成を超えたものなんです。ここでは意図駆動型の計算グラフを介してマルチエージェントシステムをオーケストレーションしていきます。もっと短く言うなら、バイブコーディングの地獄から抜け出したいということです。

ちなみに、これはバイブコーディングより10倍安いんですよ。バイブグラフィングです。そしてここにマルチエージェントシステムファクトリーがあります。このファクトリーはマルチエージェントシステムのスケーリングにも完璧に対応しています。そして別の利点もあるんです。マルチエージェントシステム構成のための自動化されたトポロジー設計を生成してくれるんです。

バイブコーディングは単なる実験以上のものでしたよね。そしてOpenClawは日々さらに発展し、成長していて素晴らしいと思います。前回の動画で見たのは、Anthropicの金融サービスについてでした。これらはAnthropicの公式エージェントだったんです。スキルMDファイルを見て、スキルMDに何を入れなければならないかを発見しました。

例えば、プロンプトが7つの競合他社をリストアップするよう指示したら、5つでも6つでもなく、7つすべてを含めること。そしてプロンプトが2015年から2025年のデータを選択するよう指示したら、サブセットではなくすべての年を含めること。このような指示がすべて、Anthropicの公式エージェントのための金融エージェント、そして競合財務分析のためのスキルMDファイルに必要だったわけです。

マルチエージェントシステムへの進化

そして今、私たちは言います。なぜ単一エージェントで止まるのか、と。マルチエージェントシステムがあれば、スキルMDで定義する美しいワークフローがあります。すべてはパターンですし、AIはパターンマッチングマシンですから、なぜそこで止まるのでしょうか。なぜ計算グラフに進まないのでしょうか。

グラフを構築していくわけですが、今度は少し抽象的な側面からです。ノードは私たちのエージェントやサブワークフローを実行し、エッジはすべての依存関係とメッセージパッシングをエンコードします。

では、バイブグラフィングとは正確には何でしょうか。これは人間がループに参加するアプローチで、自然言語による意図を編集可能なワークフロー仕様へと自動的にコンパイルし、そしてそれを実行可能なグラフへと変換します。これがどうして可能なのかと思うかもしれませんが、答えは簡単です。すべてがパターンになり得るからです。

複雑なマルチエージェントシステムの実装はかなり複雑で、デバッグなども含めて何時間もかかります。エンジニアリング集約的なんです。開発者はエージェントノードのロールプロンプトを手動で作成し、ノード間のルーティングロジック、エージェント間通信プロトコルの確立、そしてスウォームインテリジェンスなど、あらゆることをしなければなりません。

マルチエージェントシステムファクトリーの論文

そこで今日のプレプリントの著者たちは言ったわけです。これはパターンだから、AIにやらせよう、と。今、マルチエージェントシステムファクトリーがあります。これはバイブグラフィングを介した組み合わせ可能なオーケストレーションフレームワークです。では見ていきましょう。

マルチエージェントシステムファクトリー。これは北京郵電大学と上海交通大学によるもので、2026年3月6日に公開されました。彼らはマルチエージェントワークフローのモデルを実行可能な有向グラフとして設計し、バイブグラフィングを統合して自然言語の意図を人間がループに参加して修正しながらマルチエージェントワークフローへとコンパイルします。

例を示しますね。私はモデルに話しかけて、別のエージェントを追加できますか、グループに別の科学者を入れられますか、コンピュータシミュレーションや天体物理シミュレーションへの接続を持てますか、と言えるわけです。今ではすべてが可能なんです。

これまでバイブコーディングで生成してきたワークフローには、構築されたグラフに論理的な欠陥があり、正しい実行結果を返せないことがありました。多くのデバッグが行われていました。バイブグラフィングでは、著者たちが今日示すように、バイブコーディングと比較してAPIコストを約1桁削減します。

興味がありますか。では、マスファクトリーの簡単な例を見てみましょう。

3段階のプロセス

ステージ1はロール割り当てです。ユーザーとしての私が、理論物理学のための文献レビューワークフローを構築したいと言います。ロール割り当て機能は、リクエストに基づいて3つのエージェントからなるチームを提案します。リトリーバー、リーダー、そしてシンセサイザーがいます。

私は、それらは残すけど批評エージェントを追加してくださいと言います。ロール割り当て機能は了解しましたと言い、今度は4つのエージェントになります。そしてそれで良いと思ったら、承認しますと言います。

ステージ2はトポロジー設計です。彼らはどのように相互作用するか、コミュニケーションチャネルは何か、相互作用のパターン、コミュニケーション、推論、議論、コーディング、確認、批評など、何でもです。この例では、ご覧のように非常にシンプルなグラフ構造になっています。

でも、これで仕事は完了するかもしれません。だからトポロジーは良さそうだ、次のステップに進もうと言います。次のステップはセマンティック補完です。ここで美しいセマンティックエキスパートが登場し、明示的なプロファイルを示してくれます。

各エージェントは何をしているのか、各エージェントが持っているツールは何か、天体物理学の計算を行うスーパーコンピュータへのAPIコールは何か、実際にコードを実行して結果を取得するC++やPythonファイルは何か。そして私は、これらが必要なツールとすべてだと言います。良さそうです。先に進みましょう。

そして、システムと話をしただけで、2番目の美しいことが起こります。今度はワークフロー実行のランタイムがあります。これについては5分後に詳しくお見せします。これが美しさですから。

評価と可視化

そして彼らは、マルチエージェントシステムのオーケストレーションのパフォーマンスをどのように効果的に評価するかと言います。実行してみましょうと言います。マルチエージェントシステムに関する学術論文を20本取得し、それらを読み、統合し、批評して、最終レポートにします。何が機能していて何が機能していないかがすぐにわかります。

そしてもう1つボーナスがあります。新しいビジュアライザーがあり、どのエージェントにエラーがあるかを正確に見ることができます。このようなグラフが得られます。

このバイブには複数のコンポーネントがあり、それぞれを見ていきます。エージェントカスタムノード、グラフループ、スイッチングエージェントスイッチ、すべてです。AIによって構築されたキャンバスがあり、これらが指示で、指示を変更できます。これは美しいですし、MCPプロトコルやMCPサーバー、その他の通信プロトコルについて気にする必要はまったくありません。単なるパターンであり、AIはパターンが得意なんです。

だから、なぜマルチエージェントシステムのソフトウェアエンジニアリングをするのか。AIにやらせればいいじゃないですか。もちろん、GitHubリポジトリがあります。すべてがここにあります。例えば、マスファクトリーに行けば、適応コンポーネント、コア統合、ビジュアルなど、すべてがあなたのためにあります。すぐに遊び始められます。

バイブグラフィングの仕組み

では、バイブグラフィングについて話しましょう。何が欲しいかをここで定義します。そして人間がマスファクトリーによって開発されたプランを承認します。承認されると、このエンジンは私が見せたビジュアルマップを即座に実行可能なソフトウェアに変換します。これで完了です。

これは研究者の焦点をソフトウェアエンジニアリングの観点からAI行動設計へと本当にシフトさせるものです。コードについて気にする必要はありません。本当に欲しいものを正確に指定できるだけです。

例えば、超新星爆発の別のコンピュータシミュレーションが欲しいかもしれないと言えます。超新星シミュレーションの特定の専門家である別のエージェントが欲しいとします。そして結果を他のエージェントと統合したいと。ただ伝えるだけで、システムがあなたのために構築できることを期待します。

迅速なプロトタイピングは簡単です。欲しいものを定義するだけで、AIモデル、例えばGPT-5.2を使えば、私の指示を編集可能な中間表現グラフに結合してくれます。このグラフは設計図です。これは極めて重要です。

2番目は、コンテキストとメモリ統合です。今度はプラグ可能なコンテキストアダプターがあります。研究者はMCPのような最新ツールや、MZのようなメモリフレームワークをエージェントのコアロジックを一切書き直すことなくシームレスに取り付けることができます。

そして視覚的トレーシングによるデバッグがあります。これはとても素晴らしいです。これは単なるVS Code拡張機能です。本当にうまく機能し、グラフのどのノートがエラーをトリガーしたかを視覚的に見ることができます。デバッグの演習がこれ以上簡単になることはないでしょう。

ビジュアライザーの機能

ビジュアライザーには、エディターとプレビューがあります。これはAI、例えばGPT-5.2が最適な構成として選択したグラフトポロジーのライブビジュアライゼーションです。

それからモニタリングとトレーシングがあります。これはデバッグを助けるために、ランタイム中のノード状態の進化とすべてのメッセージパッシングのリアルタイムトラッキングです。

そして人間がループに参加できます。これが気に入らないかもしれない、変更できないか、修正できないか、エージェントを追加できないか、複数のツールを追加できないか、何でも、と言えます。手動でグラフの接続を編集できます。

完全なシステムがここにあります。ビジュアライザーについて話しました。インターフェース、再利用可能なコンポーネント、キーコンポーネント、基本コンポーネントについて話します。2つのアダプターがあります。通信プロトコル用のメッセージアダプターと、MCPツール、RAK、メモリなどすべてのためのコンテキストアダプターです。これで完了です。

すべてを見ていきましょう。コアコンピュートユニットはノードで、このノードにはサブクラスがあります。エージェント、グラフ、ループ、スイッチ、制御フローロータ��、そして人間がループに参加するためのインタラクションがあります。

3つの伝播フロー

そしてエッジを横切る3つの伝播フローがあります。因果関係を決定する制御フロー、出力データと通信プロトコルを運ぶメッセージフロー、そして親グラフとサブグラフ間でグローバル変数を同期する状態フローです。

さらに本当に興味深いのは、自動化されたインテントからグラフへのコンパイラです。3つのステージがあります。私が見せたステージ1のロール割り当て、同じく見せたステージ2のトポロジー設計、そしてステージ3のセマンティック補完です。シンプルな例です。

美しさは、LLMの幻覚を厳格なグラフトポロジーに制約することで、予測可能な複雑なシステムアーキテクチャが得られ、幻覚が少なくなることが期待できるという点です。

古いものと新しいものは何でしょうか。古いのはしばしば失敗するバイブコーディングです。新しいのは今お見せしたバイブグラフィングです。GPTシステムによる構造化された中間表現があります。これを非常に詳細で標準化されたJSONブループリントと考えてください。すぐにお見せします。

このブループリントには、ノード、エッジ、契約があります。システムはかなりシンプルだとわかります。

フレームワークエンジンの働き

では、フレームワークは今どのようにコードを実行するのでしょうか。ブループリントが生成され、人間として承認されたら、それを機能させるための基礎となるPythonコードや基礎ロジックを書く必要はありません。

マスファクトリーの2番目の美しい部分がこれで、フレームワークエンジンです。そして自動的にこのブループリントを読み取り、エンジンがそれをオンザフライで実行可能なグラフにコンパイルします。

マスファクトリーの第2部は、フレームワークエンジン、つまりすべてを行ってくれるコンパイラだということを覚えておいてください。なぜなら、これは単なるパターンだからです。

論文では、研究者たちが非常に有名な複雑なマルチエージェントシステムであるJetDefを作成し、人間が行う場合は1,511行のPythonコードだったとカウントしました。それからマスファクトリーのバイブグラフィングと比較しました。人間の開発者が実際に書かなければならなかったコードはわずか45行でした。この45行のコードをお見せします。

1,511行のPythonコード対45行です。なぜバイブコーディングよりもはるかに安価なのかがわかりますね。

ここにあります。モデルの呼び出しがあります。ビルドモデルがあり、週次レポートがあるとしましょう。そしてノートテンプレートがあります。詳しく見てみましょう。

モデルの呼び出しがあり、GPT-4 OmniとMiniを使います。これは後でエージェントの実際の作業を行う高速GPTです。しかし、もちろん、ブループリントを構築する中心的なインテリジェンスが必要です。著者たちはGPT-5.2を使うことにしました。

これはマルチエージェントグラフ構造を設計するトポロジーのアーキテクトとして機能するインテリジェントで高価なAIです。そして最も重要な行はもちろんroot.buildです。スクリプトがこの行に到達すると、一時停止します。

GPTモデルが引き継ぎ、ビジュアライザーを開き、人間と対話してエージェントを設計し、ブループリントを生成します。すぐにお見せします。そして人間がこのブループリントを承認すると、root.invokeを実行でき、これで今度はより安価なGPT-4 Omni Miniモデルを使って最終的なマルチエージェントチームを実行し、最終的な週次レポートを印刷します。

これで完了です。バイブグラフィングのプログラミングコード全体はこれです。

ブループリントの構造

ブループリントとは何でしょうか。GPTによって生成されるものは何でしょうか。これです。これがJSONファイルとしての構造化中間表現です。これがこの非常にシンプルな例のワークフロー仕様で、もちろんバイブグラフィングによって生成されたものです。

これがバイブグラフィングの出力です。そしてこれがフレームワークエンジンへの入力です。これがファクトリーソフトウェアエンジンに渡されるものです。エンジンはこのJSONファイルを読み取り、実際のマルチスレッディングやルーティングコードを人間が書く必要なく、並列ワークフローを完璧に実行します。

美しいと思いませんか。

結果はどうだったでしょうか。美しい人間がコーディングしたネットワークと比較してどれくらい悪かったのでしょうか。ここにすべてがあり、青色で、青色でカバーしたのはマスファクトリーバージョン、つまり自動生成されたバージョンです。時には大幅に優れたパフォーマンスが得られることがわかります。

ヒューマンエボリューションを見てみましょう。オリジナルは67%ですが、マスファクトリーでは約90%を達成します。しかし、ほぼ同一の85対85のままの他のテストもあります。特にDuskのバイブグラフィングでは、ごくわずかな改善しかありませんが、これは最先端の人間がコーディングしたフレームワークと絶対に互換性があることを意味します。時には大幅に上回るパフォーマンスを発揮します。

このマスファクトリーの方法論は実行するのに大幅に安価だということを覚えておいてください。ここに金銭的コストがあります。VGはバイブグラフィングです。VCはバイブコーディングです。ここには中程度と低い推論長があります。しかしすでにわかると思います。

バイブグラフィングでJetDefを使う場合、26セント支払います。バイブコーディングでは3ドル以上支払います。他のベンチマークでは本当に大きな違いになることがあります。バイブグラフィングでは59セント支払いますが、最大68ドルになることもあります。これは本当に美しい方法論です。

実行エンジンの重要性

実際の宝石を強調したいと思います。この論文の技術的な主力は実行エンジンです。これを、私たちのためにすべての作業を行う目に見えないソフトウェアエンジニアと考えてください。

なぜなら、通常、エージェントAがエージェントBにデータを送信するというJSONファイルがある場合、人間のプログラマーは接着コード、APIコール、スレッドマネージャー、メモリコンテキストローダーなどを書かなければならないからです。

しかし今、ファクトリーエンジンでは、ユニバーサルコンパイラとランタイム環境として機能します。GPTシステムやGeminiなど、好きなものからのJSONブループリントを渡すと、エンジンは自動的に適切なLLM APIエンドポイントを起動し、コンテキストアダプターを使ってRAGデータベースやリポジトリなどのリクエストツールをプラグインし、メッセージアダプターを使って内部メッセージをフォーマットします。すべてのエージェントが互いに理解し合えるようにです。

これらが右側からの可視化の2つのアダプターです。しかし、動的なマルチエージェントシステムも可能にします。エージェントエンジンは単なる豊かなパイプラインではありません。オンザフライで本当に同期できます。これがスイッチで示したものです。

品質保証エージェントとして機能するスイッチノードを持つこのブループリントを想像してください。QAエージェントがあります。QAがレポートが悪いと判断した場合、スイッチはブループリント内のリトライループパスを動的にアクティブ化します。しかしレポートが良ければ、スイッチは公開パスをアクティブ化します。

このマスファクトリーの要素、あるいは一言で言えば、この方法で絶対に魅力的なグラフトポロジーを構築できます。バイブグラフィングがあります。これがフロントエンドです。これがブループリントのアーキテクトです。そしてメイン実行エンジンがあり、これがすべての美しい作業を行うバックエンドです。

私たち人間がもうコーディングする必要がなく、マルチエージェントシステムのソフトウェアエンジニアリングを、なぜマルチエージェントシステムファクトリーに頼らないのか、と言えるようにです。

楽しんでいただけたことを願います。新しい情報を見つけていただけたことを願います。次回お会いできたら素晴らしいです。

コメント

タイトルとURLをコピーしました