本動画では、AnthropicのClaude Haiku 4.5とGoogleのVeo 3.1という2つの重要なAIモデルのリリースについて詳細に解説している。Claude Haiku 4.5は、Claude Sonnet 4と同等の性能を持ちながら、コストは約3分の1、速度は2倍以上という驚異的なコストパフォーマンスを実現している。特にコーディング分野のベンチマークであるSWE-benchにおいて、従来のSonnet 4を上回る性能を示し、Gemini 2.5 Proをも凌駕する結果を出している。実際のデモンストレーションでは、IRS(米国内国歳入庁)のウェブサイトからW-9フォームをダウンロードするタスクを、Claude for ChromeのComputer Use機能を使って実行し、Haiku 4.5とSonnet 4.5の速度比較を行っている。一方、Veo 3.1は複数の参照画像を使用した動画生成、最大1分間の長尺動画作成、動画の拡張機能、そして最初と最後のフレームを指定したトランジション生成などの新機能を搭載している。両モデルの価格設定についても詳細に比較分析され、現在のAI業界における価格競争とモデル性能のバランスについて考察している。

2つの重要なリリース
さて、今日はこれまでに2つの非常に興味深いリリースがありました。1つ目はGemini APIでの新機能を搭載したVeo 3.1です。2つ目はClaude Haiku 4.5で、これはAnthropicからの非常に興味深いリリースとなっています。
まず、Veo 3.1を搭載したGemini APIの機能を簡単に見てみましょう。複数の異なる画像を使用して動画を生成する機能が追加されました。最大1分間の長い動画を作成できるようになっています。そして、最初と最後のフレームを使用できるようになりました。これについては後ほど詳しく見ていきます。
Claude Haiku 4.5の驚異的な性能
でも、まずはHaiku 4.5についてお話ししたいと思います。これはAnthropicの最新モデルで、はるかに小型でありながら、はるかに手頃な価格でSonnet 4と同等の性能を持っています。コストはほぼ3分の1で、速度は2倍以上です。
しかし、おそらくAnthropicが最も重視している唯一のベンチマークであるSWE-benchにおいて、以前のSonnet 4モデルを上回っています。そして、他のいくつかの主要なベンチマークでも、以前の最先端モデルを上回っています。Gemini 2.5 Proのようなモデルを見てみると、実際に多くの主要なベンチマークでそれを打ち負かしており、これは見ていて非常に素晴らしいことです。
現在、私たちはGemini 3がかなり早くリリースされることを期待しています。うまくいけば、それが新たな最先端となるでしょうが、時間が経てば分かります。すでにClaude Codeで利用可能になっています。追加されているのが確認できます。プランモードでHaiku 4.5を使用している場合、計画にはSonnet 4.5が自動的に使用され、その後、実行にはHaiku 4.5が使用されます。これは特に、シンプルなタスクを実行しようとしていて、複雑なタスクをシンプルなサブタスクに分割できる場合、それらをHaiku 4.5に割り当てることができるため、非常に良いバランスだと思います。
ワークホースモデルとしての位置づけ
Anthropicはこれをワークホースモデルとして位置づけようとしています。つまり、はるかに高速で、トークン効率が大幅に向上し、はるかに安価なこのようなモデルを使用して、Sonnet 4.5レベルのインテリジェンスを必要としないタスクを実行できるようになります。
速度、効率性、価格設定の間の本当に良いバランスになり得ると思います。Claudeを使って開発している場合は、ぜひチェックしてみることを強くお勧めします。
彼らがここで議論しているもう1つのユースケースは、Claude for ChromeのようなComputer Useツールを、以前のバージョンよりもはるかに高速で、はるかに便利にできるということです。
Computer Use機能のデモンストレーション
では、必要なすべてのアクションを実行できるように許可します。つまり、許可を求めることはありませんが、ストップウォッチを見てみましょう。
さて、シンプルなタスクを割り当てます。IRSのウェブサイトに行って、W-9フォームをダウンロードしてください。
文字起こしには、私が個人的に作成したアプリを使用しています。では、これを開始しましょう。実際に、エージェントが実行するすべてのアクションを見ることができます。たとえば、IRSのウェブサイトに移動しましたが、これは非常にきれいでした。そして、すべてのアクションの後にスクリーンショットを撮ります。時々2秒間待機します。これは、アクションが実行されたことを確認するためだと思います。
今、フォームと説明書のリンクを探すようです。そうですよね。再びスクリーンショットを撮ります。今度は検索ボックスを見つけることを考えています。そうですよね。Gemini Computer Useエージェントのようなものと比較すると、比較的遅いようです。しかし、Haiku 4.5を使用すれば、Sonnet 4.5と比較してはるかに高速だと思います。実際、この場合でもはるかに高速になることを期待していたのですが、時間がかかっています。
では、どうするか見てみましょう。URLを直接使用しようとしたようですが、失敗しました。それで、戻っています。今、そのフォームを探していて、フォームをダウンロードできるはずだと思います。同じテストを以前に実行したようです。実際に、私かエージェントがこれらのリンクをクリックしたのが確認できますよね。でも、待ちましょう。
今、ほぼ1分40秒が経過していますが、まだタスクを完了していません。実際に私に尋ねています。ファイルをダウンロードしてもよろしいですか。はい。今、私たちのためにファイルをダウンロードしに行くと思います。少なくともファイルを開きましたよね。ほぼ2分かかりました。
ほぼ2分30秒です。では、Sonnet 4.5で同じタスクを繰り返してみましょう。IRSのウェブサイトに行って、W-9フォームをダウンロードしてもらえますか。これを再起動しましょう。計画ははるかに優れていると思いますが、おそらくはるかに長い時間がかかるでしょう。
Sonnet 4.5との比較
Sonnet 4.5もタスクを完了しましたが、約3分30秒かかりました。興味深いことに、これはHaikuと比較してはるかに時間がかからないものの、はるかに長くかかっています。
おそらく、Haikuのコード実行能力を他のコーディングエージェントと比較する別の動画を作成すると思いますが、いくつか興味深い観察結果があります。
これはEvyという会社からのものです。ここでは、Haiku 4.5でワイプチェックとトピッククックを実行しています。彼らのテストによると、性能は4.5 Sonnetと非常に似ているが、はるかに高速で、はるかに安価だと言っています。そして、安価という部分は相対的なものです。価格は入力100万トークンあたり1ドル、出力100万トークンあたり5ドルに設定されています。
GPT-4o miniのようなものと比較すると、入力100万トークンあたり25セント、出力100万トークンあたり2.5セントですよね。つまり、入力に関してはGPT-4o miniと比較して4倍高価です。同じことがGemini 2.5 Flashの価格設定についても言えると思います。GPT-4o miniやGemini 2.5 Flashと比較してはるかに高価ですが、私たちが見ているベンチマークのいくつかに基づくと、機能は間違いなくはるかに優れています。これを念頭に置いてください。
Anthropicの価格戦略
Anthropicについて気づくことの1つは、彼らが価格設定について全く妥協していないということです。他のすべての企業は価格を引き下げていますが、Anthropicはあるモデルバージョンから別のモデルバージョンへのアップグレードで同じ価格を維持している唯一の企業のようです。
一般的に、人々は最高のモデルを探す傾向があります。しかし、これについてのあなたの考えをお聞かせください。
Veo 3.1のアップデート
さて、Veo 3.1のアップデートに戻りますが、API構造と、Veo 3.1での構築がいかに簡単になったかをお見せしたいと思います。この新しいモデルでは、参照画像を提供する機能が追加されました。たとえば、この場合、これらの2つの参照画像が表示されており、この動画を再生できるか見てみましょう。
音声やオーディオがありますよね。でも、そのようなものを生成したい場合は、2つの参照画像を提供し、正確に何が欲しいかを説明することで、それを組み合わせることができます。
次に追加された機能は、画面を拡張する機能で、前の動画の最後の1秒を使用してそれに基づいて拡張すると思います。この場合、拡張する動画を提供します。それは動画全体になりますが、モデルは最後の数秒を使用してさらに拡張します。こちらは1つの簡単な例です。ご覧のとおり、この動画は通常の8秒よりも長く、実際にはるかに長い動画を作成できる人々も見てきました。
最初と最後の画像またはフレームを提供することもできるようになりました。これは基本的に最初のフレームから最後のフレームへのトランジションを作成するもので、非常に素晴らしいです。そして、これらすべてをAPIを通じて実行することもできます。
価格設定の比較
価格設定についても見ていきましょう。価格はVeo 3と同じです。つまり、オーディオ付きのデフォルトバージョンを見ている場合、1秒あたり40セントです。オーディオ付きのVeo 3.1 Fastを見ている場合は、1秒あたり15セントです。
これはSora 2と比較すると比較的高価です。低価格版は1秒あたり10セントです。高解像度を見ている場合は、1秒あたり50セントまで上がります。しかし、個人的には、現時点ではほぼすべてのフロンティアラボのモデル機能がほぼ同じポイントにあると思います。
今では、構築しているアプリケーションに帰着しており、最終的には、それらがどれだけコスト効率的で、利益率がどのくらいかということになります。とにかく、あなたの考えをお聞かせください。この動画をご覧いただきありがとうございました。次の動画でお会いしましょう。


コメント