AIコーディングエージェントがCLIを好む理由

本動画では、AI業界においてモデル開発者がCLIやターミナルベースのエージェントコーディングシステムを構築する理由を探る。従来のIDEベースのツールであるCursorやWindsurfに加え、AnthropicのClaude CodeやオープンウェイトモデルのQwen CLI、Kimi CLIなどが登場している背景には、各モデルの訓練方法やツール呼び出しの仕組みが異なることがある。特にClaude Sonnet 4.5のようなコンテキスト認識能力を持つモデルでは、専用システムの構築が不可欠である。また、オープンウェイトモデルにおいてはサードパーティプロバイダー経由での利用時に性能が低下する問題があり、ファーストパーティAPIや専用CLIツールの使用が推奨される。CLIベースシステムはIDEの肥大化を避けつつ、bashなどのシンプルで効果的なツールへのアクセスを可能にする点で優れており、開発者向けバイブコーディングツールとして今後さらに重要性を増すと考えられる。

Why AI Coding Agents Prefer the CLI

Interested in securing the AI generated code? checkout Snyk: why model makers are shipping terminal-first coding agents—...

AIコーディングエージェントがCLIへシフトする理由
オープンウェイトモデルの新たな動き
モデルごとの最適化の必要性
Minimax M2の事例
プロバイダーによる性能差
CLIベースシステムの利点
IDEとCLIの今後

AIコーディングエージェントがCLIへシフトする理由

なぜ突然、すべてのモデル開発者が独自のエージェントコーディングシステムをCLIやターミナル内で構築しようとしているのでしょうか。これはIDEの終わりを意味するのでしょうか。そして、なぜオープンウェイトモデルにとって非常に重要になるのでしょうか。この動画ではこれらすべてを探っていきます。

皆さんの多くと同じように、私もプログラミングのキャリアをIDE内で始めました。しかし、ここ数年、AI支援コーディングIDEのトレンドを目にしてきました。これはVS CodeのクローンであるCursorから始まり、その後WindsurfやTaiiなど多数のツールが登場しました。

しかし今年の初め、Anthropicは非常に興味深いことをしました。彼らはターミナル内でのコーディングエージェントであるClaude Codeを作成したのです。誤解しないでいただきたいのですが、ターミナル内でのコーディング自体は新しいものではありません。特に経験豊富な人々は長年ターミナルを使用してきました。

これはAnthropicが顧客のいる場所でサービスを提供する方法の一つでした。OpenAIのような企業がターミナルベースのコンポーネントとWebベースのコンポーネントの両方を持つCodexのようなツールを作成するのを見てきました。Claudeも独自のWebベースのClaudeインスタンスを導入しました。つまり、開発者やこれらのシステムを使用する人々がいる場所で彼らと出会うということです。

オープンウェイトモデルの新たな動き

しかし、もう一つ非常に興味深いトレンドも見られます。それがオープンウェイトモデルです。多くのオープンソースコーディングエージェントがあります。Clientが思い浮かびますし、Kilo Codeも別の例です。これらは本当に素晴らしいコーディングツールです。

しかし、MoonshotのKimi K2やQwenのようなモデル開発者を見てみると、彼らは今、ターミナルやCLI内で独自のコーディングシステムを構築しようとしています。例えば、Qwen CLIやMoonshotが独自のKimi CLIをリリースしています。

では、なぜ突然オープンウェイトモデルの開発者たちまでもが、IDEベースのシステムや汎用的なオープンウェイトターミナルまたはCLIベースのシステムをサポートするのではなく、独自のターミナルを構築しようとしているのでしょうか。私は、これらのモデルがどのように訓練されているか、そしてなぜ既存のシステムが完全な機能を本当に示せないのかに起因していると考えています。

モデルごとの最適化の必要性

簡単な例を挙げましょう。Claude Codeのようなものを見ると、実際にはKimi K2、Minimax M2、さらにはQwenモデルを含む最新のオープンウェイトモデルのいくつかを使用できます。それを行う方法はあります。

しかし、おそらく最高のエージェントコーディングシステムの実装の一つであるClaude Codeは、Claudeモデル、具体的には最新バージョンのSonnet 4.5向けに特別にファインチューニングまたは設計されています。これらの機能の一部は、どのオープンウェイトモデルでも使用できません。

例えば、Claude Sonnet 4.5が最初にリリースされたとき、CognitionはこのブログポストをDropしました。「Claude Sonnet 4.5のためにDevinを再構築:教訓と課題」というものです。この記事の基本的な要約は、彼らがSonnet 4.5をサポートするためにDevinを完全に再構築しなければならなかったということです。

主な理由は、このモデルがこれまで見てきたどのモデルとも非常に異なり、特に自身のコンテキストウィンドウをコンテキスト認識しているからです。このようなシステムを構築することは、オープンウェイトモデルのようなものとは非常に異なるものになります。

現在、これらのオープンウェイトモデルの多くがエージェント的な性質を持つようになっています。本当に良い例はM2モデルやKimi K2、さらには最新のDeepSeek R1モデルです。しかし、これらのモデルが訓練される方法は互いに非常に異なります。エージェント的なツール呼び出しを行う方法も異なります。そのため、汎用的なシステムは最適ではありません。これが、オープンモデル、オープンウェイトモデルの開発者が自分たちの本当の能力を実際に示すために独自のCLIツールを構築しようとしているトレンドを目にする理由です。

Minimax M2の事例

例を示すために、これはMinimax M2からの出力です。これは最新の、おそらく最高のオープンウェイトコーディングエージェントです。推論プロセスや思考プロセス中に非常に興味深いことを行います。関数呼び出しやツール呼び出しが挿入されているのです。

その仕組みは、数秒間考え、思考バジェットや思考トレース内でいくつかのツールを使用でき、その後も考え続けることができるというものです。しかし、すべてのコーディングエージェントがこれをサポートしているわけではありません。

例えば、Open Routerは多くの異なるサードパーティプロバイダーがあるため、オープンウェイトモデルを試すために広く使用されているシステムです。彼らはClaude APIの仕様を使用して、Open Router内でこの保存読み取りブロックを実装しました。しかし、M2に関しては特にこれが機能していないことが判明しました。

ここにいるのはSkylerで、Minimax Maxチームのエンジニアリング責任者です。彼は「詳細を再検討してリーディングを手動で渡すことを強くお勧めします」とOpen Routerプロバイダーについて述べています。Open Routerがこれをサポートできなかったことがわかります。

そのため、後続のオープンウェイトまたはオープンソースシステムを使用しているが、Open Router経由でMinimax M2を呼び出している場合、システムは機能しません。これらのオープンソースエージェントコーディングシステムが、出現するすべてのモデルに対して最適化されていないこととは別に、別の問題もあります。

プロバイダーによる性能差

Open Routerに行くと、すべてのオープンウェイトモデルについて、このモデルをホストしている多数の異なるプロバイダーが表示されます。M2 Maxに行くと、異なる構成でホストしている多数の異なるプロバイダーが表示されます。しかし、すべてが同等に作られているわけではありません。

Moonshot Kimi K2チームは実際に分析を行い、Open Router上の異なるプロバイダーのツール呼び出し機能を自社のAPI と比較しました。そして、場合によっては違いが劇的であることがわかりました。どのモデルプロバイダーを選択するかには非常に注意する必要があります。すべてが同等に作られているわけではありません。

CLIベースシステムの利点

さて、CLIベースのエージェントシステムの議論に戻りましょう。個人的には、CLIベースのエージェントシステムは開発者にとってバイブコーディングに本当に最適だと感じています。非開発者向けには、LovableやReplitのようなバイブコーディングツールがあります。しかし開発者にとっては、CLIベースのコーディングエージェントは非常に有用です。

バイブコーディングには、生成されたコードの品質に関する懸念も伴います。その中で最大のものの一つが、生成されたコードのセキュリティです。そこで、AIエージェントによって生成されたコードベースのセキュリティを評価できるツールを使用したいと思うでしょう。ここで今日のビデオのスポンサーが登場します。

このビデオはSneakがスポンサーです。彼らはAI生成コードのセキュリティを評価できる多数の異なるツールを構築しています。彼らは11月20日に「バイブコーディングのセキュリティ確保:AI生成コードのセキュリティ課題への対処」というウェビナーを開催します。一般公開されており、AI生成コードのセキュリティ確保方法について詳しく学ぶことに興味がある方には、このウェビナーへの参加を強くお勧めします。

また、国際情報システムセキュリティ認証コンソーシアムのメンバーである場合、メンバーIDを使ってこのセッションに登録・参加すると、継続的専門教育クレジットを1つ取得できます。詳細はビデオの説明欄にあります。

IDEとCLIの今後

では、ビデオに戻りましょう。最後に、IDEとCLIを再検討したいと思います。両方について論じることができると思いますが、特にCLIベースのシステムがますます使用されるようになると思います。

その完璧な例がClaude Codeで、これは最も強力なエージェントコーディングシステムの一つです。しかし、それを強力にしているのは、bashのような非常にシンプルでありながら非常に効果的なツールへのアクセスです。そして、IDEによって導入される肥大化に邪魔されることなく、これらのツールを使用するシステムがますます増えていくでしょう。

これらがWeb上でも利用可能になっているので、同じセットアップを再利用できると思います。オープンウェイトモデルに関する私の推奨事項は、可能な限り常にファーストパーティAPIを使用することです。ここで最高の構成が得られます。それが不可能な場合は、リソースが許せば自分でホストしてみてください。それも不可能な場合は、複数の異なるAPIプロバイダーをテストするようにしてください。最も安価なものや最も高速なものだけを選ばないでください。

第二に、オープンウェイトモデルプロバイダーがCLIやターミナルベースのツールなど独自のエージェントツールを持っている場合は、それを選んでください。これにより、サードパーティの実装に依存するよりも、これらのシステムから可能な限り最高のパフォーマンスが得られます。

特にオープンウェイトモデルについては、ファーストパーティの統合やツールが、サードパーティで使用する場合よりも通常はるかに強力であることを確認してきました。例えば、それを実際に見るには、Minimax M2モデルに関する私のビデオをご覧ください。

とにかく、このビデオが役に立ったことを願っています。