
4,295 文字

Googleが新しいモデルをリリースし、またしてもAI界の様相を一変させたかもしれません。そして今からお話しする内容は、みなさんが最初に思うよりも大きな意味を持つことなのです。
昨日、Google DeepMindのCEOであるDennis Sarabisからツイートがありました。彼は「これまでで最高のコーディングモデルを発表できることにとても興奮している」と述べ、「今日、私たちはコーディング能力を大幅に向上させたGemini 2.5 Pro IOエディションを発表します。このモデルはLMAコーディングとWebDev Arenaリーダーボードの両方で第1位にランクされています」と発表しました。
これは驚きです。なぜなら、Googleが業界を変えるような大型アップデートをリリースするのはこれが2回目だけでなく、コーディングのような非常に特定の用途に焦点を当てたモデルをこれほど明確に発表した企業を見たのは初めてだからです。Googleがこれを行うことで、後ほど説明しますが、人々がどのサービスを使用するかという点で間違いなく状況が変わります。
このツイートで言及されていたことの一つは、このモデルはインタラクティブなウェブアプリの構築に特に優れているということです。そして、このデモはプロトタイプ作成のアイデアにどれほど役立つかを示しています。
このシナリオでは、アプリのプロトタイプやアイデアの素早いスケッチを描き、それをGeminiのマルチモーダル機能に入力し、キャンバスを開いて、そのアプリを素早くコーディングするよう依頼する方法が示されています。プレビュー機能のおかげで、作業中のプロトタイプがすぐに表示され、システムの能力を実証し、アイデアを探索して素早くプロトタイプを作成するのに非常に効果的です。これは間違いなく、アイデアのプロトタイプ作成や市場での実現可能性を判断する上で私たちが向かっている方向性です。
このモデルについて最も驚くべきことは、ウェブ開発とコーディングの両方で総合的に1位になったことです。リーダーボードを見ると、最新のGemini 2.5 Proは、Claude 3.7 Sonnetを上回っていることがわかります。多くの人はこの重要性を理解していません。大したことではないように思えるかもしれませんが、ここ数週間、数日の間、Gemini 2.5 Proは間違いなく最高のコーディングモデルだと人々が口を揃えて言っているのを何度も目にしてきました。
それが大したことではないように思えるかもしれません。ただGemini 2.5 Proが最高のコーディングモデルになっただけでしょう?と。しかし、Anthropicにとって、それが彼らの主な売りだったことを理解する必要があります。Claude 3.7はコストが高いにもかかわらず、人々がそれを使用していた唯一の理由の一つは、本質的にコーディングにおいて最高だったからです。
それは「Vibe Code」という革命さえ起こしました。Claudeの主な特長を見ると、コーディングが最も多くの人々が挙げる用途のナンバーワンです。あるユーザーは「Claudeはコーディングと推論がとても優れている。私だけの感想か、それともGPT-4よりも頭一つ抜けているのか?」と述べています。別のユーザーは「私の意見では、Claudeはコーディングやその他のタスクでGPT-4よりも格段に上だ」と言っています。このユーザーは去年LLMに1000時間以上費やしたと主張しています。
これがゲームチェンジャーになる理由は、今やGoogleが第1位だからです。「もちろんゲームが変わるでしょう。Googleが1位になったから、ほとんどの人がこれに切り替えるでしょう」と思うかもしれません。しかし私がこう言う理由は、単に1位になっただけではなく、Claude 3.7よりもかなり大きな差をつけて1位になったからです。そしてGoogle Geminiは非常に大きなコンテキスト長を持っているため、多くのユーザーが一度のプロンプトで小さなコードベース全体を書き直すことができると話しているのを見かけました。
誰もClaudeの使用を完全にやめるとは思いませんが、これは確かにAI業界を変える可能性があります。もしかしたら、Anthropicの次のモデルがGemini 2.5 Proが達成したことに追いつけなければ、彼らは他の分野に焦点を当て始めるかもしれません。
この状況の驚くべき点は、これがChat GPT-4の主な強みも奪っているということです。Google Gemini 2.5 Proはあらゆるカテゴリーで1位にランクされています。人々がChat GPT-4を使っていた主な理由の一つは、常に最先端の知能を提供していたことです。GPT-3、GPT-4、またはGPT-O1のいずれであっても、一般的にはChat GPT/OpenAIが最先端のモデルへのアクセスを持っていることが分かっていました。しかし今のところ、Gemini 2.5 Proがあらゆる面で1位を獲得していることから、彼らがさらに進歩していることがわかります。
これが非常に大きな出来事だと思う理由、そして本当にクレイジーだと思う理由は、Googleがこれを2回目にやったということです。以前、彼らは2.5モデルや、Soraをはるかに超えるV2のようなビデオモデルでこれを実現しました。しかし今、2.5 Pro Previewでも同じことが起きています。これは再び1位になった2つ目のモデルです。現在AI業界でトップの2つのモデルはGemini 2.5 Proモデルです。Pro Previewモデルと、Pro Experienceモデルです。これはわずか6〜8ヶ月前には多くの人がGoogleの製品に触れようともしなかったことを考えると、驚異的な偉業です。
だからこそ、これは本当にゲームチェンジャーだと言えるのです。OpenAIとAnthropicがもはやAIの最先端知能を提供しなくなったらどうなるでしょうか?そして驚くべきことに、Googleはまだ減速していないと思います。このモデルが「IO」モデルと呼ばれていることを覚えておいてください。つまり、Googleの年次開発者会議であるGoogle IOの前にリリースされたモデルであり、同社は最新の技術進歩を発表する予定です。
製品ニュースや将来のイノベーションが発表される予定で、それらは主に開発者やテクノロジーコミュニティを対象としています。このイベントは、開発者がGoogleのエコシステムに関する最新情報を入手し、アプリやサービスを強化する方法を学ぶためのプラットフォームを提供するため重要です。もちろん、AIに関する多くの更新があるでしょう。
このAIモデルがGoogle IOの直前にリリースされたことは、Googleが最先端レベルの知能を提供することに本気で取り組んでいることを示しています。そしてこの傾向が今後12ヶ月間変わらないとしたらどうでしょうか。Googleが全体的な最先端知能において1位と2位の座を維持し、多くのB製品提供を構築することに決めていることを私たちは知っているので、他の企業の戦略を実際に変える可能性が高いです。
OpenAIはすでに最先端の知能に焦点を当てなくなり、優れた製品体験の提供に力を入れるようになっています。本質的にはベンチマークでより良い結果を出すモデルを提供するよりも、顧客体験に重点を置いています。そして私は、これが多くの企業が始めることになるだろうと確かに思います。なぜなら、知能のレベルを上げるための競争は、モデルが非常に賢くなり、飽和点に近づいているからです。GPT-3やGPT-4のような高度なモデルから得られる追加の利益は、一般ユーザーには使われていません。なぜなら人々は日常的に博士レベルの質問をする頻度で使っていないからです。
大規模なAI導入について話すなら、一般ユーザーが増えるのは、ジブリ画像のような新しいクールなAIトレンドがあるときです。それによって何百万人ものユーザーがOpenAIに獲得されました。そして私は、企業が最先端の知能で競争できない場合、それが他の企業が焦点を当てることになると思います。
ベンチマークについて言えば、興味深いことに、このモデルについては、一部の人々はGoogleが失敗したと主張しています。モデルが下がった他の領域があったからです。しかし私は同意しません。ここで簡単な概要を示します。今日私たちが持っている2.5 Pro Previewモデルは、コード生成のような重要な分野で5〜6%の改善を示しています。これはGoogleが特定の分野に焦点を当て、リードを維持することを確実にするための重要な指標だと思います。
もちろん、Claude 4は開発中であり、すぐにリリースされると言われていますが、Googleの反復速度は加速しており、Anthropicがさらに多くのことができるモデルで復活できるかどうか疑問に思っています。これらのベンチマークを見ると、このモデル全体がコードを中心に設計されていることは明らかです。これは、GoogleがAnthropicのような企業の市場シェアを侵食し始めた場合、彼らが何をするのか本当に気になります。
いつものように、AI業界は決して減速していません。常に先を行くための複数の変化があります。そして今、Googleがこの素晴らしいコーディングモデルをリリースしたことで、今後どこに向かうのかとても気になります。後ほど、インタラクティブなアプリやデモをコーディングする方法をチュートリアルでお見せします。しかし今のところ、この大きなジャンプは、私たちが将来見なければならないものを示唆していると思います。
AIをめぐる競争はさらに激しくなる可能性が高いです。しかし全体的に、あなたはどう思いますか?Google製品を積極的に使用していますか?それともこれは単なるベンチマークハッキングだと思いますか?私個人は日々Google Geminiを使用しており、長いコンテキストを扱う際に本当に優れていると感じています。それは本当にそこで優れています。コーディングに関しては、Gemini 2.5 Proが今までに見た中で最高だと報告している多くのユーザーも目にしています。あなたはどう思いますか?


コメント