Googleが永遠にChatGPTを打ち負かした…(Gemini 2.5 Pro)

AGIに仕事を奪われたい
この記事は約12分で読めます。

6,771 文字

Google just destroyed ChatGPT forever… (Gemini 2.5 Pro)
Try Gemini 2.5 Pro in Vectal: start a business with AI Agents? Go here: DEVs, I'M HIRING...

世界最高のAIモデル、Gemini 2.5 Proが大幅なアップグレードを受けました。このビデオでは、新機能や自分でこのモデルを使う方法、そしてAIエージェントの構築方法をお見せします。手短に言うと、もしあなたがバックエンド開発者で私と一緒に働きたいなら、応募してください。この応募フォームへのリンクはビデオの下にあります。
さて、この新しいバージョンのGemini 2.5 Proで何が変わったのか見てみましょう。前のバージョンも非常に強力でしたが、このバージョンはさらに上のレベルへと引き上げています。これはGoogleの公式記事で、彼らが言うように、今日Gemini 2.5 Proの早期アクセスをリリースしています。
コーディング能力が大幅に向上しており、特に魅力的なインタラクティブなウェブアプリの構築が得意になりました。これについては後ほどビデオでやり方をお見せします。こちらが彼らが示した例です。この画像を、その自然な動きをコードベースで表現したものに変換してください。そして結果がこちらです。
ご覧のように、葉が成長したり風に揺れたりする繊細なアニメーションです。悪くないですね。これらの強化された機能により、2.5 Proはwebdev arenaリーダーボードでトップに立っています。このwebdev arenaリーダーボードをご覧ください。新しいGemini 2.5 Proがスコア1419で一番上にあり、これは2位のClaude 3.7 Sonnetを大きく引き離しています。そして前バージョンのGemini 2.5 Proは3位です。つまりGoogleは現在、ウェブ開発とコーディングに関しては圧倒的な強さを見せています。
このリーダーボードの仕組みは、美しく機能的なウェブアプリを構築するAIモデルの能力に対する人間の好みを測定するものです。つまり、誰も使わないようなMVPではなく、実際に見栄えが良くて動作するUIなのです。また、マルチモーダル機能や長文コンテキストの処理も向上しており、これはGeminiの特徴です。さらに、最先端のビデオ理解性能も持っています。Curserのジェネリックに対するこの新モデルについて、CEOは次のように述べています。
最新のGemini 2.5 Proに興奮しています。社内で観察したところ、新しいモデルではツールの呼び出し失敗が大幅に減少しており、これは以前のGemini 2.5 Proの問題でした。Cursor内で使っていたなら、私が何を言っているかわかるでしょう。そして、この全てについてビデオの最後に詳しく説明します。
では実際に、Geminiアプリでこのモデルを使う方法をお見せします。ちなみに、Google AI Studioを使うこともできます。それも問題ありません。しかし、Geminiの方がはるかに使いやすいです。UIもシンプルで、生成したコードをここで直接実行することもできます。コピーペーストしてCursorなどに貼り付ける必要がありません。
とにかく、左上で2.5 Proを選択するのが主な操作です。さて、このモデルがいかに強力かを示すために、プレイ可能でWASDで操作できるMinecraftの2Dクローンを一発で作るよう指示してみましょう。まずこれは推論モデルなので推論を始め、HTMLとJavaScriptでコードを書き始めます。言うように、HTML、CSS、JavaScriptを使うのでウェブアプリになります。
Googleは着実に進歩していますね。最近、Geminiのアクティブユーザー数が3億5000万人を超えたと思います。これはChatGPTにとって真剣なライバルです。ちなみに、このモデルは大規模AIモデルですが、非常に高速です。数百行のコードを数秒で書いているのがわかります。
価格設定も非常に魅力的です。この価格は素晴らしい。入力トークンについては、Gemini 2.5 Pro Previewは100万入力トークンあたり1.25ドル25セントで、出力トークンは100万あたり10ドルです。これをClaude 3.7と比較すると、入力では3ドルかかり、約2.5倍高価で、出力では50%高価です。
Gemini 2.5 ProがClaude 3.7より優れていることを考えると、これはかなり驚くべきことです。なので、Googleは本当にすごいものを作っています。さて、Geminiがすべてのコードを書き終えたようです。700行のコードがあり、私が頼んだ通りにMinecraftの2Dクローンを構築してくれたかどうか見てみましょう。
Geminiアプリの右上でプレビューに切り替えると、そこにあります。2Dマインドブロックというものができています。とても素敵なUI、素敵なフォントですね。何ができるか見てみましょう。インベントリには土が選択されています。スクロールでブロックを変更できます。右クリックでブロックを設置できます。
動き回れます。木を壊すこともできます。素晴らしい。下に掘ることもできますか?掘れます。ジャンプはできますか?いいえ、ジャンプはできません。これは単一のプロンプトで一発で生成され、他のフィードバックなしでできたことを考えると、悪くないですね。しかし、これが印象的だと思うなら、ビデオの最後でPython内でGemini 2.5 Proを使った実用的なAIエージェントの構築方法をお見せするまで待ってください。
ちなみに、新しいGemini 2.5 ProをVectalで使用できるようになりました。右下のモデルをクリックして、Gemini 2.5 Proを選択すれば、世界最高のAIモデルがあなたのタスクに取り組むことができます。ToDoist、ClickUpのような時代遅れのタスク管理ツールを使う代わりに、タスクをVectalに移動させ、好きなモデルを選択して、AIエージェントに「今日の最も重要なタスクに取り組み始めて」と指示するだけです。
Vectalエージェントはすべてのタスクをチェックして、最も重要なものを特定します。「はい、完了するのを手伝ってください」と言えば、Vectalが完了を手伝ってくれます。O3、O4 mini、Claude 3.7 Thinking、Gemini 2.5 Pro、GPT-4-1.5、Grok 3などの世界最高のAIモデルをすべてVectalに組み込んでいるので、複数のサブスクリプションに支払う必要がありません。
さらに、Perplexity ProもAIエージェントに組み込まれているので、ウェブ検索を実行するためにいつでもPerplexity Proを呼び出すことができます。生産性を最大化したいなら、vectal.aiにアクセスして試してみてください。元には戻れなくなると約束します。さて、Cursorに移動して、Gemini 2.5 ProでAIエージェントを構築する方法をお見せしましょう。
まずはプロジェクトを開く必要があります。Cursorをまだ持っていない場合は、何をしているんですか?cursor.comにアクセスしてダウンロードしてください。文字通り20秒しかかかりません。ビデオゲームやDiscordをダウンロードできるなら、Cursorもダウンロードできます。これらのAIツールをインストールするためにプログラマーである必要はありません。
ちなみに、どこかで行き詰まった場合は、ChatGPTやGeminiに尋ねれば、解決の手助けをしてくれます。今日では、AIで解決できない問題、あるいは少なくともAIの助けを借りて解決に近づけない問題はないと思います。とにかく、Cursorがインストールされたら、空のフォルダを開く必要があります。
「プロジェクトを開く」をクリックしましょう。ここに「code」という名前の空のフォルダがあります。それを開きましょう。他に何かする前に、Gemini 2.5 Proが利用可能かどうか確認しましょう。左上のCursorをクリックし、設定、Cursor設定、モデルをクリックします。ここで最新のGemini 2.5 Proを見つける必要があります。
ここにあります。Gemini 2.5 Pro Max。これはCursorバージョンのモデルです。コーディングにより強力にするために、シークレットなプロンプトや他のものを使っています。これが有効になっていることを確認してください。そして、左側または右側のチャット内で(デフォルトでは右側にあると思います)、Cursorエージェント内で、モデルとしてGemini 2.5 Proを選択していることを確認してください。
AIエージェントを構築する際、二つの異なるオプションがあります。まずファイルを作成しましょう。agents.pyと名付けて、Google AI StudioでGemini 2.5 Proを使用するか、私が推奨するopen routerを使用するかのどちらかを選べます。open routerを使えばどんなモデルでも使用できます。
open routerでAIエージェントを構築すると、新しいAIモデルが登場したときにモデルを簡単に入れ替えることができます。現在AIの世界では毎週のように新モデルが登場し、それはさらに加速していくでしょう。open routerのような統一された方法でAIモデルを呼び出せば、新しいLLMが登場するたびにバックエンド全体を再構築する必要はありません。モデル名を入れ替えるだけで済みます。
open routerにアクセスして、「Gemini 2.5 Pro」と入力し、5月のものであることを確認してください。これが新しいものです。APIをクリックし、下にスクロールすると、open routerが操作方法を教えてくれます。PythonかOpenAI互換エンドポイントを使用できます。このコードをコピーして、Cursorに戻って貼り付けます。
このコードを動作させるには、あと二つのことをする必要があります。OpenAIパッケージをインストールし、open routerのキーを追加します。ちなみに、これらの追加ヘッダーは削除できます。簡略化のためにこれらは必要ありません。まずこの問題を解決しましょう。このコードが動作するにはOpenAIライブラリが必要です。実際にCursor内でGemini 2.5 Proを使ってこれを解決してみましょう。
マウスカーソルを合わせて、「チャットで修正」と言い、「condaでやろう」と言います。これは私がPython環境を管理するのにcondaを使っているからです。使っていなくても問題ありません。どちらにしても機能します。まず、私が持っているconda環境を一覧表示します。
そこで止めて、「test環境を使用して」と言うことができます。これは専用のテスト環境があるからです。もしこのことを知らなければ、おそらく新しい環境を作成するでしょう。その場合、私はあまり気にしません。いつでも削除できますが、私のconda環境をこれ以上増やしたくはありません。
すでに十分持っています。それはそうと、conda activate testをして、OpenAIパッケージをインストールしました。また、Cursorの右下で、この環境をアクティブにする必要があります。そうすれば、使用しているファイルがこの環境で動作します。OpenAIパッケージがインストールされました。
これがもう下線付きでないことは良いことです。最初の問題は解決しました。次にopen routerに戻り、「API keyを作成」ボタンを確認します。open routerアカウントをまだ持っていなければ、再び20秒しかかからないので、ぜひ作成してください。非常に簡単です。「API keyを作成」をクリックするか、右上の「keys」をクリックします。
これでAPI keyセクションに移動し、すべてのAPI keyとそれらにいくら使ったかが表示されます。ここに何もなくても心配いりません。パニックにならないで、ただ「API keyを作成」をクリックしてください。「Gemini 2.5 Pro testing」と名付けて、作成してコピーします。繰り返しますが、API keyは誰とも共有しないでください。パスワードと同様に扱ってください。
Cursorに切り替えて、引用符の間にこれを置き換えます。引用符の間のすべてを削除し、引用符自体は残して、そこにAPI keyを貼り付けて保存します。これで、このテストを実行するためのすべてがそろいました。
このテストでは、最新のGemini 2.5 Pro previewモデルを使用し、「この画像には何がありますか?」と尋ねます。このモデルのマルチモーダル機能をテストしています。実際にこの画像が何であるか見てみましょう。これはウィスコンシン・マディソンの壁のWikipedia画像です。アメリカの自然の風景ですね。モデルがそれを理解できるかどうか尋ねてみましょう。
マルチモーダル機能をテストし、open routerを通じてレスポンスが得られるかテストしています。実行してみましょう。今のところエラーはありません。良さそうです。そして、これがレスポンスです。約6秒かかりました。実際にopen router内でチェックできます。戻ると、「アクティビティ」をクリックできます。ここでスクロールダウンすると、このモデルの様々な使用例が表示されます。
ここではVectal内で使っている人々を見ることができます。しかし、これは私たちのアプリからのものです。ヘッダーを与えていないので、「unknown」になっています。ここの右側のボタンをクリックすると、特定のリクエストについてより詳しい情報を見ることができます。モデルはGM25プレビュー。これはIDです。
このプロバイダーはGoogle AI Studioからでした。利用可能なプロバイダーがあれば、それが最初に呼び出されます。最初のトークンは3.5秒かかりました。スループットはかなり速く、1秒あたり162トークンでした。合計で523トークンで、そのほとんどは推論に使われました。なぜなら、完了は118トークンだけだったからです。そして画像は、プロンプトに1つありました。
最終的なコストは面白いことに0.001ドルです。つまり、1ペニーの10%か18%ほどです。文字通りほとんど無料に近いです。なぜならGeminiモデルは非常にコスト効率が良いからです。Cursorに戻って、それがうまく説明できたかどうか見てみましょう。「画像は、背の高い緑の草の野原を通って遠くまで伸びる木製の遊歩道を示しています…」などと書かれています。
かなりよくテストに合格したと思います。これでPython内でGemini 2.5 Proを使ってAIエージェントやAIアプリを構築する方法がわかりました。次のレベルに進んで、実際にお金を稼げるものを作りたいなら…
次のレベルに進んで、新しい社会で実際のビジネスを構築したいなら、私は自分のAIスタートアップであるVectalをゼロから構築した方法をステップバイステップで記録しています。文字通り、私は経験ゼロ、フロントエンド、バックエンド、フルスタックの経験もゼロでした。以前にフルスタックアプリを構築したことはありませんでした。
プロのプログラマーでもありませんでした。完全な初心者でした。ここでは、AIの使い方、CursorやこれらのAIツールを使って、AIスタートアップを構築した方法、ピーク時には月額12,000ドル以上の月間経常収益を達成したAIスタートアップを構築した方法をすべて記録しています。そうです。このビジネスをゼロから12K/月まで構築するすべてのステップが、ここ「新しい社会」に記録されています。
これらすべての独占コンテンツへのアクセスと、あなたが抱える問題を解決するための週2回のサポートコールを受けたいなら、新しい社会に参加してください。リンクはビデオの下にあります。以上です。視聴いただきありがとうございます。このビデオが役立つと嬉しいです。
Gemini 2.5 Proについてもっとコンテンツを作って欲しい場合は、チャンネル登録して下にコメントしてください。素晴らしく生産的な一週間をお過ごしください。また会いましょう。

コメント

タイトルとURLをコピーしました