エージェント評価

Google・DeepMind・Alphabet

Gemini 3でパフォーマンスを自動的に改善する進化的AIエージェントの作成

本動画では、AIエージェントを自動的に進化させ、パフォーマンスを向上させる「進化的エージェント」の概念と実装方法について解説している。この手法は、複数のエージェントに同じタスクを実行させ、それぞれの成果を評価し、最も優れたエージェントを選出...
OpenAI・サムアルトマン

インタラクティブ評価によるエージェントの測定

この動画は、ARC Prize Foundationの代表であるGreg Camradが、フロンティアAIの測定方法について解説するものである。従来の静的ベンチマークでは測定できないインタラクティブな知能を評価するために、ARC AGI 3...