SWE-bench

GPT-5

GPT-5.4は本当に、本当に優秀だ

GPT-5.4は、OpenAIが投入した最新の思考型モデルであり、コーディング、推論、エージェント型ワークフローにおいて従来モデルを大きく上回る性能を発揮する。従来のCodexシリーズは終焉を迎え、5.4では推論トークン効率が劇的に改善され...
AIエージェント

オープンソースAIエージェントが強力すぎる件:孔子AIエージェント

MetaとハーバードによるConfucius Code Agentの登場は、AIエージェントにおいてモデルそのものよりもスキャフォールディング設計が重要であることを実証した。一方、アブダビのTIIが発表したFalcon H1R7Bは、わずか...
Anthropic・Claude・ダリオアモデイ

Claude Coded: Sonnet 4.5、Claude Code 2.0、そしてさらなる進化

本動画は、AnthropicがリリースしたClaude Sonnet 4.5と、大幅にアップデートされたClaude Code 2.0の新機能を包括的に解説したものである。Claude Sonnet 4.5は世界最高のコーディングモデルとし...
Anthropic・Claude・ダリオアモデイ

Anthropic、Claude Sonnet 4.5をリリース(驚異的)

AnthropicがClaude Sonnet 4.5をリリースした。このモデルは世界最高のコーディングモデルとして位置づけられ、複雑なエージェント構築に最適化されている。主な特徴として、SWE-benchでの最先端性能、数時間にわたる自律...