確率分布

AI研究

AI思考の幾何学

本動画は、スタンフォード大学とハーバード大学の共同研究により明らかになったAIトランスフォーマーモデルの内部推論プロセスの幾何学的構造について解説する。研究チームは、LLMが各トークン生成時に選択しなかった代替パスを探索する「フォーキングパ...
AI研究

次トークン予測を超えて:CALM AI

本動画は、テンセント傘下のWeediと中国科学院大学が2025年10月に発表した革新的な言語モデル「CALM(Continuous Auto-Regressive Language Model)」について解説するものである。従来の次トークン...
AI研究

新しい強化学習手法:FlowRL(GFlowNets)

この動画では、従来の強化学習手法であるPPOやGRPOが抱えるモード崩壊の問題を解決する新しいアプローチ「Flow強化学習」について詳しく解説している。FlowRLは生成フローネットワーク(GFlowNets)の数学的枠組みを借用し、単一の...