METR

Anthropic・Claude・ダリオアモデイ

Anthropicのベンチマークがすべてを変える—ほとんどの人が見逃す理由

本動画では、AI研究評価機関METRが発表した最新ベンチマーク結果を通じて、AIエージェントが超指数関数的な成長曲線を描いていることを解説する。Claude Opus 4.5は約5時間の人間相当の作業を50%の成功率で実行できるようになり、...