Mixture of Experts

中国が投下した1兆パラメータAIモデルがOpenAIに衝撃を与える

中国のYuan Lab AIが開発した1兆パラメータのAIモデル「Yuan 3.0 Ultra」は、従来の常識を覆す斬新なアプローチで注目を集めている。このモデルは訓練中に全体の約3分の1にあたるパラメータを削減しながらも、処理速度と精度を...

2026.03.06

中国

オープンソースのMoE(Mixture of Experts)モデル「Mio Version 2 Flash」が、わずか15億の活性パラメータでClaude Opus 4.6を因果推論タスクで上回った背景には、革新的なアーキテクチャ設計が存...

2026.02.13

Anthropic・Claude・ダリオアモデイ

中国のKimiチームが初のマルチモーダルモデルK2.5をリリースした。同社は「最強のオープンソースモデル」と謳っており、ベンチマークではGPT-4o、Gemini 3、Claude Opusといった主要モデルを複数の指標で上回る性能を示して...

2026.01.28

世界モデル・マルチモーダル

DeepSeekが発表した「Engram」は、大規模言語モデルの根本的な非効率性を解決する革新的なアーキテクチャである。従来のLLMは繰り返し出現する固有名詞やフレーズを毎回再計算していたが、Engramは人間の脳のような高速メモリモジュー...

2026.01.19

AI研究

本動画は、Google DeepMindでGemini 3の事前学習リードを務めるSebastian Bourjouへの初のポッドキャスト出演インタビューである。Gemini 3が前世代から大幅な性能向上を実現した背景として、アーキテクチャ...

2025.12.22

Google・DeepMind・Alphabet

Mistral AIが5ヶ月ぶりに大規模なモデルリリースを発表した。今回のMistral 3シリーズには、675Bパラメータを持つフラッグシップモデル「Mistral Large 3」と、3B、8B、14Bの3つの小規模な密モデル「Mini...

2025.12.04

LLM・言語モデル

中国発のKimi K2 Thinkingは、米国のトップクラスモデルに挑戦する新たな推論モデルである。最大の特徴は200から300の連続したツール呼び出しが可能な点で、これはエージェントシステムの基盤となる機能だ。1兆パラメータを持ちながら...

2025.11.07

LLM・言語モデル

この動画では、新しいオープンソース推論モデルQwen3 Nextの性能を、複雑な因果推論テストで徹底評価している。80億パラメータのMixture of Expertsアーキテクチャながら、実際に訓練可能なのは30億パラメータのみという効率...

2025.09.16

LLM・言語モデル