AI研究 兆パラメータAIモデルを破壊する数学 Princeton大学が提案する知識グラフを暗黙的報酬モデルとして活用する新しいAI強化学習手法の解説である。従来の数学やコーディング領域に限定されていた検証可能な報酬構造を、医学や法律などオープンエンド領域にも拡張するため、知識グラフの因... 2026.03.20 AI研究