AI研究 AIは低曲率部分空間で学習する(RLVR)
本動画は、強化学習が大規模言語モデルにおいてどのように機能するかについての最新の幾何学的理解を解説している。テキサス大学オースティン校とMetaの研究チームによる2025年11月の研究論文を基に、強化学習がモデルの全パラメータのわずか5~3...
AI研究
AGI・ASI
AI研究
AI研究