3分半で理解するClaude 4.5 Haiku

Anthropicが新たにリリースしたClaude 4.5 Haikuは、Claude Sonnet 4.5と同等の性能を持ちながら、大幅に低コストで利用できるモデルである。特にソフトウェアエンジニアリング分野において優れた性能を発揮し、SWE-bench Verifiedでは73.3%という高いスコアを記録している。エージェンティックコーディングに特化して設計されており、Terminal BenchやAgentツール使用などの各種ベンチマークでも高い評価を得ている。入力トークン100万あたり1ドル、出力トークン100万あたり5ドルという価格設定は、OpenAIのGPT-4o miniよりも安価であり、マルチエージェントシステムにおいてClaude Sonnet 4.5と組み合わせることで、コスト削減と効率化を実現できる。最高の回答を必要としない開発案件において、予算重視の推論タスクに最適なモデルとして位置づけられている。

Claude 4.5 Haiku in 3.5 mins

Claude Haiku 4.5, our latest small model, is available today to all users.What was recently at the frontier is now cheap...

Claude 4.5 Haikuの登場
エージェンティックコーディングにおける性能
コンピュータ自動化での実力
実用的な活用方法
まとめと推奨

Claude 4.5 Haikuの登場

Haiku 4.5がリリースされました。このモデルはSonnet 4.5と同じくらい賢く、しかもずっとずっと安価なんです。使い方は簡単で、claude.aiにアクセスしてドロップダウンメニューを選択するだけで、Haiku 4.5にアクセスできるようになります。

Haiku 4.5において、現時点でソフトウェアエンジニアリング分野における最も重要なベンチマークの一つがSWE-bench Verifiedです。これは、大規模言語モデルに対して数多くのGitHubイシューを解決することが期待されるベンチマークなんですが、Sonnet 4.5は77.2%を達成しており、Haiku 4.5は73.3%を解決しています。これは他の研究機関が提供する主要な大規模言語モデル、例えばGPT-4o Codex、GPT-4o、さらにはGemini 2.5 Proよりもはるかに高い数値なんです。

つまり、このモデルはプログラミング専用に設計されているということです。しかもただのプログラミングではありません。このモデルは特にエージェンティックコーディング向けに設計されているんです。

エージェンティックコーディングにおける性能

エージェンティックコーディングに関連するいくつかのベンチマークを見てみると、Haiku 4.5は開発者にとってまさに贈り物のように思えます。Claude Sonnet 4.5とHaiku 4.5を比較してみると、これら2つのモデルの差はそれほど大きくないのに、価格ははるかに安いんです。

エージェンティックコーディングについて先ほど議論したベンチマーク、SWE-bench Verifiedでは73%のスコアを記録しています。Terminal Benchというエージェンティックコーディングのための別のベンチマークでは、Claude Haiku 4.5は41%のスコアを獲得しました。

最も重要なのは、エージェンティックツール使用です。これは現時点でツール使用を測定する業界標準のようなもので、このモデルは小売業で83%、航空業で63%のスコアを記録しています。つまり、これらの大規模言語モデルにコンピュータを使わせて、特定のドメインに関連するコンピュータの問題を解決させているわけです。小売業ドメイン、航空業ドメイン、通信業ドメインといった具合にですね。

コンピュータ自動化での実力

もう一つ、このモデルが本当に優れた性能を発揮している非常に興味深いベンチマークがコンピュータ自動化です。これはロボティックプロセスオートメーションのようなもので、コンピュータにカーソルを使わせ、ピクセルを理解させ、そして特定の問題を解決させることを期待するものです。このモデルは50.7%のスコアを獲得しています。

そして多くの他の標準的なベンチマークにおいても、このモデルは例えばGPT-4oやGemini 2.5 Proといった他の多くのモデルよりもはるかに優れています。

実用的な活用方法

ここで最も素晴らしいのは、このモデルをSonnet 4.5のようなものと組み合わせて使えるということです。CursorやエージェントベースのIDEなどで使用する場合、計画立案にはSonnet 4.5を使うことができますし、クライアント側でもそれができます。そしてアクションの実行、つまり望むことを実際に遂行する部分にはHaiku 4.5を使うことができるんです。

マルチエージェントシステムにおいて、このモデルはコストを大幅に削減することができ、しかもモデル自体が非常に効率的なんです。このモデルはSonnet 4.5よりもずっとずっと高速で、GPT-4o miniよりも安価です。入力トークン100万あたり1ドル、出力トークン100万あたり5ドルで利用可能で、Anthropicのエコシステム内で比較すると非常に安価なんです。

まとめと推奨

もしあなたがSonnet 4やSonnet 4.5のファンだったなら、Claude Haiku 4.5はあなたの注目に値すると思います。予算重視の推論に最適なモデルになるかもしれません。つまり、大規模言語モデルが必要だけれども、必ずしも最高の解決策や最高の回答が必要というわけではないソフトウェアソリューションを開発するときはいつでも、Claude 4.5 Haikuを間違いなく使うことができます。高速で効率的、そしてAnthropicエコシステムの中でずっと安価だからです。

実際のところ、もしあなたがOpenAIのエコシステムにいるとしても、このモデルはもう一度考え直させるかもしれません。なぜなら、これはGPT-4o miniよりも安価だからです。Claude 4.5 Haikuについてどう思うか、ぜひ教えてください。また別の動画でお会いしましょう。ハッピープロンプティング!