思考型AI

AI画像

Googleの画像生成AI Nanabano 2を12分で徹底解説

GoogleがフラッグシップモデルであるNanabana Proの後継として、より高速かつコストパフォーマンスに優れたNanabano 2を発表した。このモデルは思考型AIとして機能し、Google検索とGoogle画像検索を統合することで...
Anthropic・Claude・ダリオアモデイ

Claude Opus 4.6思考型vs非思考型 リアルタイム比較テスト

AnthropicがリリースしたClaude Opus 4.6について、思考型(Thinking)と非思考型(Non-Thinking)の2つのバージョンを独自の論理推論テストで比較検証した動画である。テスト内容は制約条件付きエレベーター問...
Anthropic・Claude・ダリオアモデイ

Claude Opus 4.5 Thinking検証:史上最高のモデルか?

この動画では、Anthropicの最新モデルであるClaude Opus 4.5の推論能力を、独自の複雑な論理パズルを用いて徹底的に検証している。非推論モデルと推論モデル(Thinking 32K)の両方をテストし、マーケティング資料ではな...
AI競争

GPT-5.1とGemini 3が同時リークしてインターネットを席巻

OpenAIとGoogleが再び激突し、今回は本格的な対決となっている。OpenAIのリークされたGPT-5.1思考モデルは、Googleの次期Gemini 3 Proに対抗する準備が整っているように見える一方、GoogleはGemini技...
LLM・言語モデル

中国の新型K2エージェントがGPT-5を全ベンチマークで上回る(Kimi K2 Thinking)

中国発のKimi K2 thinkingは、従来の大規模言語モデルとは一線を画す思考型エージェントモデルとして登場し、AI業界に衝撃を与えている。このモデルは200~300回の連続的なツール呼び出しを人間の介入なしに実行可能で、複雑な問題解...
LLM・言語モデル

新登場 Kimi K2 Thinking – 最高のオープンモデルか?

中国のMoonshot AIが開発したKimi K2 Thinkingモデルは、オープンソースの推論モデルとして、OpenAI、Anthropic、Googleといったプロプライエタリモデルに匹敵、あるいはそれを凌駕する性能を示している。1...
Anthropic・Claude・ダリオアモデイ

Claude Opus 4.1 Thinking:信じられない結果

この動画は、Claude Opus 4.1の思考型モデル(16K)と非思考型モデルを独自の因果推論テストで比較検証した実験結果を報告している。テキストアリーナで上位に位置する両モデルに対し、エレベーターの階移動問題という複雑な論理パズルを課...