GPT-5 GPT-5.4 Highはカンニングしているのか?推論能力かコード生成能力か
OpenAIが2026年3月5日にリリースしたGPT-5.4 Highバージョンの性能を、独自に設計した科学的因果推論テストで検証した結果を報告する動画である。既存のベンチマークが事前学習データに含まれている可能性を懸念し、エレベーターパズ...
GPT-5
AI活用・導入
オープンソース・オープンウェイト
GPT-5
Anthropic・Claude・ダリオアモデイ
GPT-5
AIベンチマーク
GPT-5
GPT-5
GPT-5
LLM・言語モデル
Google・DeepMind・Alphabet
Google・DeepMind・Alphabet
AIベンチマーク
Anthropic・Claude・ダリオアモデイ
Anthropic・Claude・ダリオアモデイ
GPT-5
中国
LLM・言語モデル
中国
GPT-5
GPT-5
GPT-5
GPT-5
GPT-5
オープンソース・オープンウェイト
イーロンマスク・テスラ・xAI