トークン生成

AI研究

Mercury 2の全貌:誰も語らないエレガントな新言語モデル

Mercury 2は、Inception Labsが開発した拡散型言語モデルであり、従来のトランスフォーマーベースのモデルとは根本的に異なるアプローチを採用している。最大の特徴は、テキストを1トークンずつ順次生成するのではなく、画像生成の拡...
AI研究

新しい種類のAIが登場しつつある、そしてそれはLLMよりも優れているのか?

MetaのAI主任科学者であるヤン・ルカンが発表した新しい論文が、従来の大規模言語モデル(LLM)とは根本的に異なるAIアーキテクチャを提示している。VLJと呼ばれるこのモデルは、Joint Embedding Predictive Arc...
Anthropic・Claude・ダリオアモデイ

Claude Codeの品質低下?実際に何が起こったのか

この動画は、Anthropicが公開したClaude Codeの品質低下に関する詳細な事後報告書について解説している。8月から9月にかけて発生した3つの主要な技術的問題とその解決策を時系列で分析し、大規模言語モデルの推論システムがいかに複雑...