評価指標

OpenAI・サムアルトマン

ビルドアワー:強化ファインチューニング

この動画は、OpenAIのBuild Hoursシリーズの一環として、強化ファインチューニング(RFT)の実践的な応用について詳しく解説した技術セッションである。法的文書の分類タスクを例に、RFTの設定方法から実際のトレーニング、評価までの...
AIベンチマーク

AIベンチマークに隠された暗い真実(Apple研究)

Apple、ワシントン大学、スタンフォード大学による最新研究が、AIベンチマークの信頼性に疑問を投げかける。この研究では、事前学習データをベンチマークタスクに合わせて最適化することで、計算コストを半分に削減しながら同等の性能を達成できること...