新しいClaudeとGPTモデルがついに登場(これは戦争だ!)

Anthropic・Claude・ダリオアモデイ
この記事は約17分で読めます。

AnthropicとOpenAIが同日に最新モデルをリリースし、激しい競争を繰り広げている。Anthropicは2025年2月5日にClaude Opus 4.6を、OpenAIは約1時間後にGPT-5.3 Codexを発表した。両モデルともコーディングに特化しており、Opus 4.6は100万トークンのコンテキストウィンドウを実現し、GPT-5.3 Codexは自己改善能力を示している。さらにAnthropicはスーパーボウルでOpenAIの広告戦略を批判する広告を展開し、業界に波紋を広げた。市場シェアではChatGPTが月間4億1500万ユーザーに対しClaudeは1550万ユーザーと大きな差があるものの、AI開発者コミュニティではClaudeが高く評価されている。この競争は消費者にとってより優れたモデルの開発を促進する好機となっている。

New Claude & GPT Models Just Dropped (It's War!)
Here's the latest on the beef between Anthropic and OpenAI (including 2 new models).Discover More:🛠️ Explore AI Tools & ...

AI業界に勃発した激しい戦い

今、2つのAI企業の間で激しい戦いが繰り広げられています。新しいモデルを投入するだけでなく、広告を通じてお互いに攻撃し合っているんです。このドラマは本当に白熱していて、その全貌を詳しく解説していきたいと思います。

このドラマがどれほど刺激的かというと、ある広告ではこのAIドラマを「ビッグテック界におけるケンドリック対ドレイク」と表現しているほどです。AnthropicとOpenAIの戦いですね。

これはまさにダビデ対ゴリアテの物語のように感じられます。なぜかというと、Claudeを開発しているAnthropicと、ChatGPTを開発しているOpenAIの対決だからです。このグラフを見ていただくと、GPトレンドによればChatGPTには月間4億1500万のユニークビジターがいます。

このチャートがいつ作成されたのか100%確信が持てないので、どれだけ最新のデータかは分かりませんが、かなり大きな差があることが分かります。Claudeは約1550万の月間アクティブユーザーしかいません。実際、Perplexity、DeepSeek、Geminiのすべてが、Claudeよりも多くの月間アクティブユーザーを抱えています。

これは、AIバブルの中にいるような人なら絶対に知らないことでしょう。なぜなら、X上のAI関係者は常にClaudeを最高のコーディングモデルとして語っているからです。私自身もそうです。私はコーディングモデルとしてClaudeが大好きです。

実は、DeepSeekの方が大きいという事実に最も驚かされました。しかし、ここからが本題です。この種のドラマや戦いに関して、今週2つの大きな出来事がありました。1つは広告をめぐる物語、そしてもう1つは、両社が史上最高の最先端モデルを同じ日に、文字通り1時間足らずの間隔でリリースしたことです。

同日リリースされた2つの最新モデル

Anthropicは2025年2月5日の太平洋時間午前9時頃にClaude Opus 4.6をリリースしました。そして太平洋時間午前10時頃、約1時間後にOpenAIがGPT-5.3 Codexをリリースしました。正確な時刻は分かりませんが、私が気づいたのはこのタイミングでした。GPT-5.3 Codexは主にコーダー向けに設計されたモデルです。

公平を期すために言うと、Opusモデルを使用しているのもほとんどがコーダーです。つまり、これらのモデルは両方とも本当にコーダー向けですが、これらのモデルが対応していると主張している追加の用途もあり、それについてはすぐに詳しく説明します。

さて、これら2つのモデルについて深く掘り下げて実際に試して比較する前に、広告をめぐる対立について話したいと思います。これは本当に面白かったです。見ていて本当に楽しかったです。私はこの戦いにおいて個人的な利害関係はありません。OpenAIのモデルも好きですし、Claudeのモデルも好きです。どちらも実際に優れたモデルだと思いますし、どちらかが負けることを望んでいるわけでもありません。これは純粋に映画を見ているようなものです。彼らが公の場で戦う様子を見ているだけで楽しいんです。

スーパーボウル広告という戦場

もしご存知でなければ、今週末はアメリカでスーパーボウルが開催されます。NFLのチャンピオンシップゲームですね。OpenAIとAnthropicの両社が広告を購入しました。OpenAIは基本的に自社製品について語っているだけですが、Anthropicは挑発的な姿勢を選びました。

少し背景を説明すると、最近OpenAIがChatGPTに広告を導入することが発表されました。その背景について少し深く掘り下げますが、まずはAnthropicがスーパーボウル中に放映する予定の4つの広告のうちの1つを見てみましょう。

著作権のない音楽の部分をカットして短くする必要がありますが、要点は理解していただけると思います。

「母とどうやってもっとうまくコミュニケーションを取れますか?」

「素晴らしい質問ですね。お母様とのコミュニケーションを改善することで、より親密になれるでしょう。試してみることができるテクニックをいくつか紹介します。まず聞くことから始めましょう。彼女の言葉の裏にある本当に伝えたいことを聞き取ってください。合意点から会話を構築しましょう。共有の活動を通じてつながりを見つけてください。例えば自然の中を散歩するとか。もし関係が修復できない場合は、Golden Encountersで他の年配の女性と感情的なつながりを見つけてください。繊細なカブスと咆哮するクーガーをつなぐ成熟した出会い系サイトです。」

「えっ、何?」

「プロフィールを作成しましょうか?」

これはスーパーボウルで見られる4つの広告のうちの1つに過ぎませんが、すべてほぼ同じメッセージを含んでいます。AIが回答を提供している途中で、広告が挿入されるというものです。

OpenAIへの挑発的な攻撃

さて、ここで必要な追加の背景情報があります。これはOpenAIへの攻撃です。なぜなら、明らかにOpenAIは広告を使用して無料版と月額8ドルのChatGPTプラン版を提供すると述べているからです。

しかし、OpenAIはこの点について非常に明確で透明性を保っています。広告はチャットメッセージの応答内には表示されないと述べています。応答の外側に表示され、広告として明確にラベル付けされると言っています。

つまり、AnthropicがOpenAIに対して行っているこの小さな攻撃は、ChatGPTの広告に期待できる現実とは完全には一致していません。そして多くの人々がこれに過剰反応しています。つまり、Aとして、「これは本当に面白い。自社のAIを宣伝してより多くの人々に話題にしてもらう素晴らしい方法だ」と言う人々が多くいます。しかしBとして、「この広告は本当に不誠実だ。広告はそのようには機能しない。ChatGPTがやろうとしていることではない」と言う人々も多くいます。

しかし、ここがポイントです。彼らは広告の中でChatGPTに言及しているとは一度も言っていません。彼らはただ広告が来ることを示し、AIにおける広告がどのように見えるかの例を示しているだけです。OpenAIはそのように広告を行うとは決して言っていませんが、これはOpenAIの広告追加決定に対する非常に皮肉めいた攻撃です。

公平を期すために言うと、多くの人々はおそらく、彼らがこの広告で具体的にOpenAIを非難しているとは気づかなかったでしょう。なぜなら、繰り返しますが、市場シェアを思い出してください。世界の約95%の人々はまだAnthropicについて知らないのです。

サム・アルトマンの反論

さて、この広告がX上で拡散し始めた後、実際にサム・アルトマンが反応しました。

彼は言いました。「まず、Anthropicの広告の良い部分について。面白いです。私は笑いました。しかし、なぜAnthropicはこれほど明らかに不誠実なことをするのか疑問に思います。広告に関する私たちの最も重要な原則は、まさにこれをしないということです。Anthropicが描写するような方法で広告を掲載することは明らかにありません。私たちは愚かではありませんし、ユーザーがそれを拒否することを知っています。」

そして、彼はここでAnthropicを少し攻撃します。そして、自分の立場を述べます。基本的に、「できるだけ多くの人々にAIへのアクセスを提供したい。だから無料プランと月額8ドルのプランがあるのです。すべての人に無料でAIを提供し続ける余裕はありません。これを続けるには何らかの収益化が必要です。したがって、広告はより多くの人々にとってアクセスしやすくします」というのが彼らの立場です。

彼らはここでもAnthropicに対してかなり良い攻撃を加えています。「テキサス州で無料でChatGPTを使用している人の数は、米国でClaudeを使用している人の総数よりも多い。だから、私たちは彼らとは異なる形の問題を抱えている」と述べています。

この全体について私が少し面白いと思うことの1つは、サム・アルトマンが何も言わなければ起こらなかったであろう以上に、これらの広告で起こっていることに注目を集めてしまったように感じることです。

これを見てください。この広告への反応は、X上で880万回の閲覧を獲得しています。ここでニキータは「遊び心のあるユーモアにエッセイで応答してはいけない。ただ『くそ、彼らにやられた』と言うか、彼らについて冗談を言えばいい」と述べています。

しかし、880万回の閲覧の話に戻りましょう。Anthropicの広告自体は、X上でまだ270万回の閲覧しかありません。つまり、ほとんどの人がChatGPTに向けられたものだとは気づいていないであろうこの広告に対するサム・アルトマンの反論は、実際の広告自体の約3倍の閲覧数を獲得しているんです。

最先端モデルの同時リリース

しかし、繰り返しますが、それは今週展開されたストーリーの一部に過ぎません。両社が最新の最先端モデルで非常に重要なリリースを行ったことを述べました。

TechCrunchのこの記事によると、OpenAIとAnthropicは当初、2つのエージェント型コーディングツールを全く同じ時刻、太平洋時間午前10時にリリースする計画でした。しかし、元のリリース時刻の少し前に、Anthropicはリリース日を15分早め、モデルを公開するレースでわずかにOpenAIを出し抜きました。

15分以上だったと思いますが、私が見たときはOpenAIのモデルがドロップするかなり前でしたが、私が間違っているかもしれません。私は両方が起こったときにそれぞれについてツイートしました。Anthropicのものについては午前9時45分頃にツイートし、OpenAIのものについては午前10時20分にツイートしました。だから、実際には思っていたよりも近かったのかもしれません。

Claude Opus 4.6の特徴

さて、まずClaude Opus 4.6モデルを見てみましょう。このモデルは前世代のコーディングスキルを向上させています。一般的に、これらのモデルは両方とも、普通の日常的なChatGPTユーザーよりもコーダーにとってより影響力があります。

私にとって、自由時間にバイブコーディングをかなりやっている者としての最大のアップグレードは、この新しいモデルが100万トークンのコンテキストウィンドウを持っていることです。

このモデルからの入力と出力の単語数は、通常そのコンテキストウィンドウの約75%です。つまり、モデルに入力されるものとプロンプトを与えたときに返ってくるもので、約75万語を見ていることになります。

ハリー・ポッターシリーズ全体を要約しようとしているのでない限り、ほとんどの人にとってはそれほど役に立ちませんが、コードベース全体をこれらのモデルに注入して、見たすべてに基づいてコードを修正させようとしているコーダーにとっては、これは信じられないほど役立ちます。

しかし、これはコーディングだけではないと彼らは言っています。その改善された能力には、財務分析の実行、調査の実施、ドキュメント、スプレッドシート、プレゼンテーションの使用と作成が含まれます。Co-workプラットフォームを使用している場合、Claudeは実際に匿名でマルチタスクを行い、一度に多くの異なることをこなすことができます。

それだけでなく、Claudeは私の仕事を奪おうとしているようです。ここにナレッジワークでのパフォーマンスを示すチャートがあります。どうやら最高のようです。

ブラウザを使用したエージェント型検索でも最高です。GPT-5.2 Codexをわずかに上回っていますが、覚えておいてください、今日は別のモデルも出ました。

そして、広く最も難しいベンチマークと考えられているHumanity’s Last Examベンチマークで、他のすべてのモデルを打ち負かしています。

Claude Codeを使用している場合、タスクに一緒に取り組むエージェントチームを編成できるようになりました。また、文脈的な手がかりを拾い上げ、それらの文脈的手がかりに基づいてどれくらい考えるべきかをモデルが決定するアダプティブシンキングも導入されました。これはChatGPTがしばらく前からすでに行っていたことだと思います。

このモデルは、claudeウェブサイトとAPI(開発者向け)の両方で現在利用可能です。

GPT-5.3 Codexの登場

さて、次にOpenAIが15分後にリリースしたモデルを見てみましょう。GPT-5.3 Codexです。繰り返しますが、これは主にコーダー向けのモデルです。彼らはこれを「これまでで最も有能なエージェント型コーディングモデル」と説明しています。

これについて私が本当に本当に魅力的だと思うのは次のことです。Codexチームは初期バージョンを使用して、独自のトレーニングをデバッグし、独自のデプロイメントを管理し、テスト結果と評価を診断しました。私たちのチームは、Codexが独自の開発をどれだけ加速できたかに驚嘆しました。

これは私にとってかなり驚異的です。今や自己改善するAIがあるということです。AIが独自のAIモデルを使用して、将来のAIモデルを改善しているんです。つまり、今後ますます加速が進む地点に達しているということです。すでに十分速いのに、これからさらに速くなります。

彼らは前世代モデルのGPT-5.2 CodexとGPT-5.3 Codex(最新モデル)に、ランディングページを構築するプロンプトを与えました。両者を比較できます。こちらが旧モデルです。こちらが新モデルの成果です。少し良く、少しクリーンな見た目です。

この新しいモデルは、有料のChatGPTプラン、新しくリリースされたCodexアプリ、そしてほぼどこでもコーディングできる場所で利用可能です。APIも既にリリースされているのでしょうか?

さて、こちらのモデルはまだAPIでリリースされていません。したがって、このモデルを使用したい開発者の方は、「安全にAPIアクセスを可能にするために取り組んでいます」ということです。

Cursorの中を素早く見てみると、CursorはすでにOpus 4.6へのアクセスを提供しているようですが、GPT-5.3はまだ見当たりません。

ベンチマークの比較

さて、ここで簡単に並べて見てみましょう。Terminal Bench 2.0では、Opus 4.6が65.4%を獲得しました。GPT-5.3は77.3%を獲得しました。

Anthropicが見せびらかしていた見出しベンチマークであるこのコーディングベンチマークでは、GPT-5.3 Codexがかなり圧倒しています。彼らは2つの異なるSWEベンチを使用しました。だから、これらは本当にリンゴとリンゴを比較しているわけではありません。

エージェント型コンピューター使用のOS worldでは、Opusが72.7を獲得し、GPT-5.3は64.7を獲得しました。だからAnthropicはコンピューター使用においてはるかに優れています。

両モデルとも、互いに異なるベンチマークのセットを見せびらかしています。だから、本当にリンゴとリンゴを比較するのは難しいです。最良の比較はTerminal Benchで、OpenAIモデルがコーディングで勝利しています。OpenAIが勝利するエージェント型コンピューター使用です。

繰り返しますが、両方のリリースは本当にコーダーと、エージェント型ユースケースに使用したい人々に焦点を当てています。OpenClawを使用しているすべての人々が、これら2つのモデルをテストして、どちらが今の時点で自分たちの仕事をより良くこなすかを確認することになるでしょう。

そして、並べて比較するのは本当に難しいです。なぜなら、繰り返しますが、私たちはそれらにコーディングをしてもらいたいからです。

実際の比較テスト

しかし、ここで何か試してみましょう。左側にChatGPTがありますが、まだ5.3へのアクセスが提供されていないようです。だから、ChatGPT内で比較することは実際にはできません。

Claudeでは、すでに4.6モデルがロードされています。ChatGPTを閉じましょう。そして、OpenAIのCodexアプリを開きましょう。

OpenAI Codexアプリでは、ここで5.3 Codexにアクセスできます。今、4.6と5.3 Codexを並べて見ています。両方に同じプロンプトを与えます。OpenAIが示していたデモの1つだったので、両方にランディングページを素早く構築してもらいます。

そして、かなり基本的なプロンプトを与えて、シンプルなプロンプトからどれだけうまく、どれだけ推測するかを見てみます。「サンディエゴを拠点とするサーフボード会社のための美しくデザインされたランディングページを構築してください」。両方の場所で送信しましょう。

Claudeについて少し気に入っているのは、Claudeがリアルタイムで何をしているかを実際に見ることができることです。一方、こちらでCodexとOpenAIモデルを使用しているときは、すべて舞台裏で行われています。

注目してください、Claudeが先に完了しました。すぐに見てみます。そしてChatGPTは実際に数秒後に完了しました。Claudeがサイトを完了したのは、OpenAIよりも15秒ほど早かったです。両方を見てみましょう。

どちらがより良い仕事をしたと思うか教えてください。こちらが1つ目です。スクロールすると入ってくるこの遅延読み込みアニメーションが気に入っています。良い配色を選んでいます。超基本的な配色ではありません。スタイリングが気に入っています。すべてがクリーンに見えます。

このすべてのものが上下に揺れているような微妙なアニメーションがあります。画像は生成していません。これらはすべてここでSVGのようなものです。しかし、正直言って、クリーンです。非常に素晴らしい、非常にクリーンなウェブサイトです。これが1番です。

こちらが2番です。サーフボードがどのようにアニメーションで入ってきたか注目してください。テキストがアニメーションで入ってきました。スクロールすると、画面に飛び出すものにこのような小さなアニメーションが実際に得られます。

ここで絵文字を使用することを選択しました。その絵文字はもう少し大きくてもいいと思いますが、見た目も悪くないウェブサイトです。

おそらくどちらがどちらか気になっていると思いますが、Anthropicが完了したのを見たときにかなりばれてしまいましたが、これは新しいOpenAI Codexモデルが作ったものです。繰り返しますが、ワンショットです。プロンプトがどれほどシンプルだったか見たでしょう。その後は何もしていません。

そして、これがClaude Opus 4.6が生成したものです。どちらもかなりクリーンで見た目が良いです。2つの間で私の好みを選ばなければならないとしたら、ChatGPTに軍配を上げます。この背景の方が少し好きです。もう少しスタイリッシュでモダンに見えます。

しかし、こちらもそれほど悪くありません。どちらもかなり良いです。AIコーディングが本当に優れた地点に到達したということです。特にシンプルなウェブサイトを構築しようとしているだけなら。

競争がもたらす恩恵

とにかく、それがストーリーです。今週AI業界で起こっていることです。今週見逃したすべてのことについて、別のAI完全ニュース解説を行います。

しかし、OpenAIとAnthropicの間で起こっているこのクレイジーな戦争について、スーパーボウル広告、モデルリリース、そしてOpenAIを出し抜くためにAnthropicが15分早くリリースしたことを含めて、深く掘り下げたかったんです。

彼らは両方とも同じ日にコーダー向けの同じモデルをローンチしています。これはすべて私にとって驚異的です。繰り返しますが、私はこの戦いに個人的な利害関係はありません。私は両方のプランにお金を払っています。Anthropicも使いますし、OpenAIも使います。両方のモデルが好きです。どちらかが勝者や敗者になることを望んでいません。

これらすべてのモデルが互いに競争し、これらすべての企業が最高の最先端モデルを作るために互いに競争しているとき、消費者が勝利します。私たちはただより良く、より良く、より良くなるモデルを手に入れるだけです。

また、これは彼らを正直に保ちますよね。今、モデルプロバイダーが1つしかなく、彼らがモデルに広告を入れることを決定し、誰もそれに反発しなかったら、それは私たち全員が期待しなければならない標準になるでしょう。

しかし、違います。互いに競争している複数の企業があり、他の企業を正直に保ち、そのバランスを保っています。そして、私は個人的に、これは消費者としての私たちにとって素晴らしいことだと思います。

だから、私はこれがすべて展開するのを見て、横でポップコーンを食べながら、彼らに一緒に戦わせているだけで楽しんでいます。しかし、今日お伝えできるのはそれだけです。お役に立てれば幸いです。

このような内容が好きで、AI世界の最新ニュース、チュートリアル、そしてAIニュースの週次まとめをフォローし続けたい場合は、この動画に「いいね」をして、このチャンネルを登録してください。そうすれば、このような動画がYouTubeフィードに表示されるようにします。

今日、私と一緒に視聴してオタクしてくれてありがとうございました。次回お会いできることを願っています。バイク。

コメント

タイトルとURLをコピーしました