評価指標 | ASIに仕事を奪われたい

ビルドアワー：強化ファインチューニング

この動画は、OpenAIのBuild Hoursシリーズの一環として、強化ファインチューニング（RFT）の実践的な応用について詳しく解説した技術セッションである。法的文書の分類タスクを例に、RFTの設定方法から実際のトレーニング、評価までの...

2025.09.03

OpenAI・サムアルトマン

AIベンチマークに隠された暗い真実（Apple研究）

Apple、ワシントン大学、スタンフォード大学による最新研究が、AIベンチマークの信頼性に疑問を投げかける。この研究では、事前学習データをベンチマークタスクに合わせて最適化することで、計算コストを半分に削減しながら同等の性能を達成できること...

2025.07.21

AIベンチマーク