長時間タスク

GPT-5

GPT-5.4がヤバすぎる!OpenAI史上最高のモデル!100万トークンコンテキストとコーディング性能を完全テスト

OpenAIが今週中にも発表する可能性がある新しいフラッグシップモデルGPT-5.4は、GoogleのGeminiやAnthropicのClaudeが実装した100万トークンのコンテキストウィンドウに対抗する形で登場する。本モデルは既に一部...
GPT-5

OpenAIの新GPT-5.2 Codexがリリース、そしてClaudeが長時間コンテキストの王者に

OpenAIが新たにリリースしたGPT-5.2 Codexは、プログラミングに特化したモデルであり、特にセキュリティ脆弱性の検出において顕著な進化を遂げている。このモデルは88%の確率でセキュリティの欠陥を発見できる能力を持ち、Reactの...
Anthropic・Claude・ダリオアモデイ

Claudeが止まらない

AnthropicがClaude Sonnet 4.5をリリースした。このモデルは30時間連続で自律的に動作し、約11,000行のコードを生成してSlackやTeamsのようなチャットアプリを完成させた。SWE-bench Verified...