Googleが提供する無料のオープンソース・ターミナルベースAIエージェント「Gemini CLI」の紹介と実演を行う動画である。Claude Codeの競合製品として位置づけられ、100万トークンのコンテキストウィンドウを持つ最高性能のGeminiモデルによって動作する。無料ユーザーでも毎分60リクエスト、1日1000リクエストの利用が可能で、多様なツールアクセスやMCPS機能を備えている。動画では実際にウェブアプリの作成を通して、その機能と使い勝手を検証している。
Gemini CLIの登場
Gemini CLIが登場しました。これはGoogleが提供するClaude Codeのバージョンですが、最も優れた点は、このターミナルベースのAIエージェントがオープンソースであり、完全に無料で実験を開始できることです。これは100万トークンのコンテキストウィンドウを持つ最高のGeminiモデルによって動作しています。
実際に、より多くの企業がターミナルベースのAIエージェントのリリースを開始するという新しいトレンドが見られています。Gemini CLIには、多数の異なるツールへのアクセスやMCPSを含む多くの機能があり、これが非常に強力です。
無料ユーザーとしては、毎分60リクエストまたは1日1000リクエストを利用でき、これは非常に寛大です。しかし、より多く必要な場合は、独自のAPIキーを持参することができます。これがオープンソースであるため、他のモデルでもこれを使用できる可能性がありますが、他のモデルでの基盤エージェントの性能については確認する必要があります。
私は数週間前からGemini CLIに早期アクセスしていましたが、かなり印象的です。この動画では、セットアップ方法、利用可能な異なる機能を紹介し、その後ウェブアプリの作成を試して、どこまで押し進められるかを確認していきます。
セットアップとアクセス方法
アクセスするためには、このコマンドを実行します。安定版では早期アクセス部分を削除する必要があるかもしれません。安定版は単にGemini CLIになると思います。
これを読み込むと、セットアップするためのかなり多くのオプションがあります。Googleアカウントを使用できるので、Googleでログインするか、Gemini APIキーを使用できます。また、Google WorkやVortex AI APIキーでのログインもサポートしています。
私は独自のGemini APIキーを使用するか、または単純にenvファイルを作成してGemini APIキーを入力すれば、そこから読み込むことができます。Gemini APIキーをセットアップして戻ってきましょう。そのためには終了する必要があると思います。
Gemini APIキーを設定します。早期アクセス中は無料版でレート制限に引っかかることがあったので、無料APIキーで動作するかどうかは分かりませんが、リリース時にそれを確認します。
すでにAPIキーを設定したので、これを再度実行して何が起こるか見てみましょう。今回はAPIキーを求められないので、見つけたということです。
Gemini CLIの機能とコマンド
gemini.mdファイルを作成して、Geminiへの指示を保持することができます。これはcursorルールと非常に似ており、Gemini CLIに必要な異なることを手助けしてもらうよう依頼できます。
たくさんのコマンドがあります – do/help/clear/exitなどですが、私が興味を持っているのは/toolsです。Gemini CLIは多数の異なるツールにアクセスできるので、これらがデフォルトのツールです。フォルダコンテンツの読み取り、ファイルへの書き込み、テキスト検索ができ、またウェブフェッチとGoogle検索もあるので、URLを提供すればそれらにアクセスできます。これは非常に優れており、独自のカスタムツールも追加できます。
本当に興味深い機能の一つは、MCPサーバーのサポートがあることです。これは新しいセッションなので、現在MCPサーバーは設定されていませんが、MCPサーバーを設定してGemini CLIにそれと相互作用するよう依頼できます。
もう一つの非常に役立つコマンドは/statsです。これについては動画の後半で見ますが、これまでに使用したトークン数の情報を提供してくれるので、高額になる可能性があるため本当に役立ちます。
デフォルトではGemini 2.5 Proを使用し、Claude Codeと同様に残りのコンテキストを表示します。Claude Codeと非常に似ており、compressコマンドもあるので、これまでのコンテキストを圧縮または要約し、これは本当に役立ちます。
再度/helpと入力します。メモリに物事を追加したり、メモリから削除したりもできます。本当に素晴らしい機能がここにあり、動画を通してこれらの機能のいくつかを紹介します。
非常に効果的だと思われるもう一つのコマンドはスラッシュエディターです。コードエディターを選択でき、これは異なるファイルに追加されるdiffを直接見ることができるため役立ちます。ファイルを変更している場合、実際にコードエディターでそれらを見ることができます。
実際、私はVent Surf内でこれを実行しているので、それを選択します。現在、ファイルを作成すればそれらのファイルを開いて見ることができると思います。
ウェブアプリ作成の実演
これから使用するプロンプトは次のとおりです。テキスト-画像ウェブアプリを作成したいと思います。テキスト説明を提供し、外部APIを使用して画像を生成します。この場合、Gemini Flash ネイティブ画像生成機能を使用したいと思います。
ここにドキュメントへのリンクがあります。この知識がないと思うからです。具体的に、提供されたリンクからドキュメントにアクセスするためにフェッチツールを使用するよう求めました。それができるかどうか確認しましょう。Gemini APIキーは.envファイルにあります。
これを実行して何が起こるか見てみましょう。この問題に遭遇しました。現在無料APIキーを使用しているようです。エージェントがAPIエンドポイントに多くの呼び出しを行っているため、AI Studioの無料APIキーを使用している場合、この問題に遭遇する可能性があります。
今動作すると思います。これは基本的にウェブフェッチツールを使用しています。リンクを提供してウェブツールを使用するよう具体的に求めない場合、時々それを選択しないので、常に許可するようにします。これはエージェンティックモードのようなもので、次回ウェブアクセスが必要な場合にこのコマンドまたはツールを実行することを意味します。
問題に遭遇したと思います。今度はGoogle検索を試しています。これはおそらくGemini Flashの代わりにImagen 4またはImagen 3を使用することになりますが、見てみましょう。
バックエンドにNodeJSサーバー、フロントエンドにシンプルHTMLを使用します。好きなようにしてくださいと言います。ここで私たちのためにプロジェクトをセットアップしています。特定のタイプのコマンドの実行を許可できるので、それをすべて許可します。
ここで実際にそれらのファイルをすべて作成しているのが見えます。最初はGemini provisionを使用していたと思いますが、問題に遭遇し、その後自動的にこれをGemini 2 Flash 生成画像生成モデルに更新しました。これはまさに私たちが望むモデルです。
エージェントがターミナルを見て、遭遇している問題を見ることができ、興味深いことにそれらを修正できることが分かります。プロセスIDが見つからなかったと言っているので、特定のポートでプロセスを確実に終了する必要があると思います。再度許可しましょう。
より多くのことを行い、Gemini APIキーをチェックし、いいえ、ファイル接続をチェックする必要があります。初期バグでより多くのレビューを行っており、それは良くありません。ループに陥り始めました。これは実際にGeminiモデルで気づいたことです。
サーバーが実行中だと言い、基本的に同じことを何度も繰り返し表示します。サーバーが実行中かどうか確認しましょう。アクセスできますか。確かに実行中ですが、動作しますか。画像の生成に失敗しました。何が起こったか見てみましょう。
問題の解決とマルチモーダル機能
これはマルチモーダルな性質なので、できることはこのスクリーンショットを撮ることです。ファイルをここに持ってきて、ファイルにアクセスする方法はファイルパスを提供することだと思います。この問題に遭遇していると伝えます。
ログを追加しています。再度サーバーを実行しようとしています。いくつかの問題を見たと思います。これを再度実行しましょう。再びそのループに遭遇していると思います。問題は送信しているペイロードにあると思いますが、これを修正できるかどうか見てみましょう。
実際に、ドキュメントに従って画像モダリティも使用するはずだと理解したと思いますが、テキストと画像の両方を有効にできると思います。これを実行して、テキストも使用するよう伝える必要があるかもしれません。
今度は実行中だと言っています。もう一度試してみます。同じ問題です。実際に、ドキュメントから例としてペイロード情報を再度提供する必要があり、今度はすべてを修正できました。今回実行すると実際に動作します。
ここに例を示しましょう。ここがプロンプトで、サングラスをかけたラマの画像を作成しました。トラの画像を作成してみましょう。できると思います。しかし、主な問題はウェブフェッチツールがドキュメントからの一部のペイロードを無視していたことで、これは非常に興味深いです。
トークン使用量の確認
実際に使用したトークン数を見てみましょう。やり取りで約70万トークンを使用し、それはキャッシュトークンを含みます。入力トークンは約20万トークン、出力トークンの合計は約8,000トークンでした。それほど悪くありませんが、良い点は約75%のトークンをキャッシュしたことです。これは非常に良いです。
長時間実行される会話の場合、通常/compressコマンドを使用します。そうすることで、これまでに行ったすべてを要約し、トークンの一部を保持するのに役立ちます。チャット履歴を35,000トークンから550トークンに圧縮したと言っています。
statsコマンドを再度実行すると、同じトークンが表示されますが、次回にはおそらくこれが減ると思います。ダウンロードボタンを追加できますかと言いましょう。その機能を追加しています。
ここに再びウェブアプリがあります。画像の一つを選択します。少し時間がかかっています。今度はダウンロードボタンがあり、動作しているようです。ここにダウンロードされた画像があります。
まとめ
これがGemini CLIの簡単な紹介でした。非常に素晴らしいツールですが、まだ粗削りな部分があると言えます。Googleが改善していると思われるかなり多くのことがありますが、Geminiモデルが好きであれば、Claude CLIの良い代替品だと思います。
Claude CLIとGemini CLIの直接比較や、他のCLIベースのコードツールやコーディングエディターと比較してどうかについて興味があるかどうか教えてください。あなた自身の経験で、下のコメント欄でそれを共有してください。
この動画が役に立ったことを願っています。視聴いただきありがとうございました。いつものように、次回の動画でお会いしましょう。


コメント