残差ストリーム

AI研究

Googleの次世代AI研究 次トークン多様体を超えて

Googleが次世代AIモデルに向けて重要な発見を発表した。従来のトランスフォーマーアーキテクチャにおける線形表現仮説は、自然言語の流れには有効だが、推論タスクでは崩壊することが判明した。Google DeepMindとプリンストン大学の共...
*重要記事

AIの中にAI:時間的抽象化を伴う内部強化学習

本動画は、Googleが開発した革新的なトランスフォーマーアーキテクチャについて解説するものである。従来のLLMが抱える「トークントラップ」と呼ばれる問題、すなわち長期推論タスクにおいて1トークンずつの予測に縛られることで探索空間が膨大にな...
NVIDIA・ジェンスンフアン

NVIDIA:新しいエラスティックAIモデル(5080以上対応)

NVIDIAが発表したNeatron Elasticは、1回の学習で複数サイズのAIモデルを同時生成する革新的なエラスティックAIアーキテクチャである。12億、9億、6億パラメータの推論モデルを単一の学習実行から抽出可能にし、ユーザーのGP...