Mixture of Experts

中国

中国が投下した1兆パラメータAIモデルがOpenAIに衝撃を与える

中国のYuan Lab AIが開発した1兆パラメータのAIモデル「Yuan 3.0 Ultra」は、従来の常識を覆す斬新なアプローチで注目を集めている。このモデルは訓練中に全体の約3分の1にあたるパラメータを削減しながらも、処理速度と精度を...
Anthropic・Claude・ダリオアモデイ

15億の活性パラメータを持つMoEモデルがOPUS 4.6の推論性能を上回る理由

オープンソースのMoE(Mixture of Experts)モデル「Mio Version 2 Flash」が、わずか15億の活性パラメータでClaude Opus 4.6を因果推論タスクで上回った背景には、革新的なアーキテクチャ設計が存...
世界モデル・マルチモーダル

Kimi K2.5 – 単なるLLMを超えた存在

中国のKimiチームが初のマルチモーダルモデルK2.5をリリースした。同社は「最強のオープンソースモデル」と謳っており、ベンチマークではGPT-4o、Gemini 3、Claude Opusといった主要モデルを複数の指標で上回る性能を示して...
AI研究

DeepSeekがLLMを劇的に強化:Engramの登場

DeepSeekが発表した「Engram」は、大規模言語モデルの根本的な非効率性を解決する革新的なアーキテクチャである。従来のLLMは繰り返し出現する固有名詞やフレーズを毎回再計算していたが、Engramは人間の脳のような高速メモリモジュー...
Google・DeepMind・Alphabet

「我々は予想以上に進んでいる」— Gemini 3とAIの未来

本動画は、Google DeepMindでGemini 3の事前学習リードを務めるSebastian Bourjouへの初のポッドキャスト出演インタビューである。Gemini 3が前世代から大幅な性能向上を実現した背景として、アーキテクチャ...
LLM・言語モデル

Mistral 3の新モデル4つがリリース!

Mistral AIが5ヶ月ぶりに大規模なモデルリリースを発表した。今回のMistral 3シリーズには、675Bパラメータを持つフラッグシップモデル「Mistral Large 3」と、3B、8B、14Bの3つの小規模な密モデル「Mini...
LLM・言語モデル

中国発の新たな1兆パラメータ推論AI – Kimi K2 Thinking

中国発のKimi K2 Thinkingは、米国のトップクラスモデルに挑戦する新たな推論モデルである。最大の特徴は200から300の連続したツール呼び出しが可能な点で、これはエージェントシステムの基盤となる機能だ。1兆パラメータを持ちながら...
LLM・言語モデル

Qwen3 NEXT A3B:推論とMCPツールの可能性は?

この動画では、新しいオープンソース推論モデルQwen3 Nextの性能を、複雑な因果推論テストで徹底評価している。80億パラメータのMixture of Expertsアーキテクチャながら、実際に訓練可能なのは30億パラメータのみという効率...