エンジニアリングベンチマーク

Anthropic・Claude・ダリオアモデイ

新型Claude Opus 4.5がAI業界全体に衝撃を与える(全ての人間を上回る性能)

AnthropicがリリースしたClaude Opus 4.5は、同社の最難関エンジニアリング試験において全ての人間候補者を上回る成績を記録し、AI業界に衝撃を与えた。このモデルはSWE-Benchで80%のスコアを達成し、複雑なバグ処理や...