ベンチマーク性能

AI競争

AnthropicとOpenAIが同日発表 Claude Opus 4.6とGPT-5.3 Codexの衝撃的アップデート

AnthropicとOpenAIが同日に主力モデルの大幅アップデートを発表した。Anthropicはコーディング能力を大幅に強化したClaude Opus 4.6を、OpenAIはより高速で効率的なGPT-5.3 Codexをリリース。両社...
Google・DeepMind・Alphabet

Gemini 3 Pro – あなたが待ち望んでいたモデル

GoogleがDeepMindを通じて開発したGemini 3 Proがついにリリースされた。本モデルは数年にわたる研究開発の集大成であり、特に推論能力、コーディングスキル、エージェンティックなタスク実行において大幅な性能向上を実現している...
LLM・言語モデル

中国の新型K2エージェントがGPT-5を全ベンチマークで上回る(Kimi K2 Thinking)

中国発のKimi K2 thinkingは、従来の大規模言語モデルとは一線を画す思考型エージェントモデルとして登場し、AI業界に衝撃を与えている。このモデルは200~300回の連続的なツール呼び出しを人間の介入なしに実行可能で、複雑な問題解...