自動化評価

OpenAI・サムアルトマン

実践的な評価手法:フロンティア研究から本番アプリケーションまで

本動画では、OpenAIにおけるフロンティアモデルの評価手法と、実用的なAIアプリケーション開発のための評価ツールについて解説している。従来の学術的ベンチマークから、実世界の経済的価値を持つタスクを測定するGDP valへの移行が紹介され、...