ベンチマーク性能

AnthropicとOpenAIが同日発表 Claude Opus 4.6とGPT-5.3 Codexの衝撃的アップデート

AnthropicとOpenAIが同日に主力モデルの大幅アップデートを発表した。Anthropicはコーディング能力を大幅に強化したClaude Opus 4.6を、OpenAIはより高速で効率的なGPT-5.3 Codexをリリース。両社...

2026.02.06

AI競争

GoogleがDeepMindを通じて開発したGemini 3 Proがついにリリースされた。本モデルは数年にわたる研究開発の集大成であり、特に推論能力、コーディングスキル、エージェンティックなタスク実行において大幅な性能向上を実現している...

2025.11.19

Google・DeepMind・Alphabet

中国発のKimi K2 thinkingは、従来の大規模言語モデルとは一線を画す思考型エージェントモデルとして登場し、AI業界に衝撃を与えている。このモデルは200~300回の連続的なツール呼び出しを人間の介入なしに実行可能で、複雑な問題解...

2025.11.09

LLM・言語モデル