SWE-bench

GPT-5.4は本当に、本当に優秀だ

GPT-5.4は、OpenAIが投入した最新の思考型モデルであり、コーディング、推論、エージェント型ワークフローにおいて従来モデルを大きく上回る性能を発揮する。従来のCodexシリーズは終焉を迎え、5.4では推論トークン効率が劇的に改善され...

2026.03.06

GPT-5

MetaとハーバードによるConfucius Code Agentの登場は、AIエージェントにおいてモデルそのものよりもスキャフォールディング設計が重要であることを実証した。一方、アブダビのTIIが発表したFalcon H1R7Bは、わずか...

2026.01.12

AIエージェント

本動画は、AnthropicがリリースしたClaude Sonnet 4.5と、大幅にアップデートされたClaude Code 2.0の新機能を包括的に解説したものである。Claude Sonnet 4.5は世界最高のコーディングモデルとし...

2025.10.07

Anthropic・Claude・ダリオアモデイ

AnthropicがClaude Sonnet 4.5をリリースした。このモデルは世界最高のコーディングモデルとして位置づけられ、複雑なエージェント構築に最適化されている。主な特徴として、SWE-benchでの最先端性能、数時間にわたる自律...

2025.09.30

Anthropic・Claude・ダリオアモデイ