マルチトークン予測

Anthropic・Claude・ダリオアモデイ

15億の活性パラメータを持つMoEモデルがOPUS 4.6の推論性能を上回る理由

オープンソースのMoE(Mixture of Experts)モデル「Mio Version 2 Flash」が、わずか15億の活性パラメータでClaude Opus 4.6を因果推論タスクで上回った背景には、革新的なアーキテクチャ設計が存...
AI研究

あなたのLLMは既に未来を知っている(Apple研究)

Appleが開発した革新的なAI技術について解説する動画である。従来の単一トークン予測から脱却し、既存のLLMが持つ潜在的な未来予測能力を引き出す手法を紹介している。特別な再学習を必要とせず、最小限のファインチューニングで最大500%の推論...