モデル性能比較

LLM・言語モデル

論理の限界を打ち破る:AIの新たな解法パス(GPT-5.2 high+)

本動画では、ローカルで動作する小型LLMの性能を劇的に向上させる手法を解説している。多くのLLMが失敗する原因は、タスクの実行能力ではなく、最適な解法パスを見つける計画段階にあることを明らかにし、解法パスを明示的に提供することで性能を引き上...
GPT-5、5.1、5.2

GPT-5.2は史上最高のモデルである

OpenAIが新たにリリースしたGPT-5.2は、コード生成やARC AGIベンチマークにおいて驚異的な性能を示す一方で、3次元空間理解などの特定領域では前世代モデルから大幅に後退している。Matt Schumerをはじめとする早期アクセス...