AI benchmark

Google・DeepMind・Alphabet

Gemini 3.1 Proとベンチマークの崩壊:AIのバイブ時代へようこそ

Gemini 3.1 Proのリリースを機に、AIモデル評価の本質的な難しさを掘り下げた考察動画である。ベンチマークスコアの高さが必ずしも実用性能を反映しない理由、ポスト学習によるドメイン特化の影響、ハルシネーションの現状、そしてDario...
AIニュース

AIニュース:OpenAIエージェント、Google Geminiのコンピュータ操作、そしてAMD

本動画では、2025年10月時点でのAI業界の最新動向が網羅的に紹介されている。OpenAIの開発者向けイベントで発表されたChatGPTのアプリストア機能やエージェントキット、Google Geminiの新しいコンピュータ操作モデル「Ge...