レイテンシ削減

AI推論・CoT

リーンAI推論:新たなエネルギーベースChain-of-Thought

本動画では、ジョージア工科大学、MIT、Nvidiaによる最新のLLM推論効率化研究を解説する。従来の推論モデルは正確な結果を得るために膨大なトークン数と計算時間を要していたが、本研究ではエネルギーベースモデル(EBM)とランジュバン動力学...
AIエージェント

OpenAI Build Hour:Agent RFTによるエージェント最適化の完全ガイド

本動画は、OpenAIが提供する新しいエージェント強化学習ファインチューニング(Agent RFT)機能に関する技術解説である。エージェントがツールを効果的に使用し、タスクを完遂する能力を向上させるための訓練手法を詳細に説明している。実際の...