BFS探索

GPT-5

GPT-5.4 Highはカンニングしているのか?推論能力かコード生成能力か

OpenAIが2026年3月5日にリリースしたGPT-5.4 Highバージョンの性能を、独自に設計した科学的因果推論テストで検証した結果を報告する動画である。既存のベンチマークが事前学習データに含まれている可能性を懸念し、エレベーターパズ...