コンテキストウィンドウ

LLMを忘れろ:MITの新しいRLM(AIにおける相転移)

MITが発表した再帰的言語モデル(RLM)は、従来のLLMが抱えるコンテキスト長の限界と推論能力の劣化という根本的問題に対する革新的な解決策である。本研究は、GPT-5のような最先端モデルでさえ、公称の27万トークンのコンテキストウィンドウ...

2026.01.05

AI研究

GPT-5.2 Codexが凄すぎる件(私のワークフローを公開)

OpenAIのGPT-5.2 Codexを実際に使用した開発者が、その圧倒的な性能と具体的な活用方法を解説する動画である。ARC AGI 2ベンチマークで人間のベースラインを15%上回るという驚異的な結果を示したGPT-5.2は、LLMが苦...

2025.12.30

GPT-5、5.1、5.2

ChatGPT 5.2 vs. Claude Opus 4.5 vs. Gemini 3: ベンチマークが教えてくれないこと

本動画は、ChatGPT 5.2、Claude Opus 4.5、Gemini 3という3つの主要AIモデルの比較を、従来のベンチマーク評価ではなく実務的な観点から行っている。重要なのは「シンプルウィン」という概念で、これは毎日使える小さく...

2025.12.16

AIベンチマーク

GoogleのTitansがAI最大の弱点を解決、しかし…

Googleが矢継ぎ早に複数の重要なAI技術革新を発表した。長期記憶システムTitansは200万トークン超のコンテキストウィンドウを実現し、従来のトランスフォーマーの限界を突破。Myrazは次世代シーケンスモデルの統一理論として登場し、M...

2025.12.09

Google・DeepMind・Alphabet

GPT-5.1におけるモデルの振る舞いの形成 — OpenAIポッドキャスト第11回

本動画では、OpenAIの研究リーダーであるChristina KimとプロダクトマネージャーのLentia Ramenが、GPT-5.1の開発における重要な進化について語っている。今回のリリースで初めて、ChatGPTの全モデルが推論モデ...

2025.12.03

GPT-5、5.1、5.2

AnthropicがMCPを必死に修正しようとしている件について

Anthropicが提供するモデルコンテキストプロトコル(MCP)は、当初から深刻な設計上の欠陥を抱えている。MCPはツール定義を常にコンテキストに含める必要があり、数万トークンもの無駄なデータがすべてのリクエストで送信される。これによりモ...

2025.12.02

Anthropic・Claude・ダリオアモデイ

実世界テスト:Opus 4.5対Gemini 3対ChatGPT 5.1

本動画は、最新のAIモデルであるClaude Opus 4.5、Gemini 3、ChatGPT 5.1 Proの実世界における性能を比較検証したものである。ベンチマーク上の数値ではなく、実際のビジネス課題――クリスマスツリー販売業者の手書...

2025.11.26

Anthropic・Claude・ダリオアモデイ

Gemini 3がプロダクト、エンジニアリング、マーケティングの仕事を再配線した

Gemini 3が世界ナンバーワンのモデルとして登場し、AI活用における戦略の単位がモデル単位からタスク単位へと根本的に変化した。本動画では、Gemini 3の強みである視覚認識と大規模コンテキスト処理能力が、これまでAIが介入できなかった...

2025.11.20

Google・DeepMind・Alphabet

GoogleとVercelのAIエージェント戦略を8分で解説:50ページの白書と実践ドキュメントの要点

本動画では、GoogleとVercelが示すAIエージェントに関する相反する2つのビジョンを比較分析している。Googleの50ページに及ぶホワイトペーパーは、オーケストレーションプラットフォームを中心とした理想的な未来像を提示し、エージェ...

2025.11.18

AIエージェント

GPT-5.1とGemini 3が同時リークしてインターネットを席巻

OpenAIとGoogleが再び激突し、今回は本格的な対決となっている。OpenAIのリークされたGPT-5.1思考モデルは、Googleの次期Gemini 3 Proに対抗する準備が整っているように見える一方、GoogleはGemini技...

2025.11.10

AI競争

中国発の新たな1兆パラメータ推論AI – Kimi K2 Thinking

中国発のKimi K2 Thinkingは、米国のトップクラスモデルに挑戦する新たな推論モデルである。最大の特徴は200から300の連続したツール呼び出しが可能な点で、これはエージェントシステムの基盤となる機能だ。1兆パラメータを持ちながら...

2025.11.07

LLM・言語モデル

DeepSeekがLLMを終わらせた

DeepSeekが発表した新しいOCR技術は、視覚的コンテキストを最大20倍圧縮しながら97%の精度を維持できるという革新的なものである。この技術は、大規模言語モデルが抱える主要なボトルネック、すなわちメモリ制限、訓練速度、コンテキストウィ...

2025.10.23

LLM・言語モデル

新しいDeepSeekが驚くべきことをやってのけた…

DeepSeekが新たに発表したDeepSeek OCRは、画像認識技術に革新的なアプローチをもたらした。従来の画像認識技術とは異なり、このモデルはテキストを画像として表現することで、10倍のテキスト圧縮を実現しながら97%の精度を維持する...

2025.10.23

AI画像

AIのメモリウォール:コンピュートが6万倍成長したのにメモリがわずか100倍の理由(そして私の8つの解決原則)

AIシステムにおけるメモリ問題は、コンピュート性能が6万倍に向上する一方でメモリ性能は100倍にとどまるという「メモリウォール」によって深刻化している。AIシステムは本質的にステートレスな設計であるが、実用的な知能には状態の保持が不可欠であ...

2025.10.17

AIハード・GPU・RAM

Claude Code 2.0: 必要なすべてを網羅した完全ガイド

AnthropicがClaude Sonnet 4.5のリリースに伴い、Claude Code 2.0へと完全書き直しを行った。新バージョンではチェックポイント機能による会話履歴の復元、使用量とコンテキストウィンドウのリアルタイム追跡、プロ...

2025.10.02

Anthropic・Claude・ダリオアモデイ

AI業界ニュース：サム対イーロン、Claude 100万コンテキスト、シチュエーショナル・アウェアネス15億ドル

この動画では、イーロン・マスクとサム・アルトマンの最新の論争から始まり、AppleのApp Storeにおける競争問題について議論している。また、AnthropicがClaude Sonnet 4のコンテキストウィンドウを100万トークンま...

2025.08.14

AIニュース