AI benchmark

GPT-5

OpenAIの新型GPT-5.4 Proが世界最高のAIに

OpenAIの最新モデルGPT-5.4は、数学的推論やサイバーセキュリティ能力において従来の最先端モデルを上回る性能を示している。特にFrontier Mathベンチマークでは20年間未解決だった問題を解決するなど、質的な飛躍を遂げた。また...
Google・DeepMind・Alphabet

Gemini 3.1 Proとベンチマークの崩壊:AIのバイブ時代へようこそ

Gemini 3.1 Proのリリースを機に、AIモデル評価の本質的な難しさを掘り下げた考察動画である。ベンチマークスコアの高さが必ずしも実用性能を反映しない理由、ポスト学習によるドメイン特化の影響、ハルシネーションの現状、そしてDario...
AIニュース

AIニュース:OpenAIエージェント、Google Geminiのコンピュータ操作、そしてAMD

本動画では、2025年10月時点でのAI業界の最新動向が網羅的に紹介されている。OpenAIの開発者向けイベントで発表されたChatGPTのアプリストア機能やエージェントキット、Google Geminiの新しいコンピュータ操作モデル「Ge...