モデル性能

GPT-5、5.1、5.2、5.3

GPT-5.2への反発は研究に値する

OpenAIが発表したGPT-5.2は、ベンチマーク上では過去最高の性能を記録し、コーディング、長文推論、ビジョン、エージェント的ツール呼び出しなど、あらゆる測定可能な指標で大幅な向上を示した。しかし、オンラインでの反応は祝福や興奮ではなく...
OpenAI・サムアルトマン

OpenAIが「コードレッド」状態に(Geminiはそこまで勝ったのか??)

OpenAIが内部で「コードレッド」を宣言したことが明らかになった。歴史的に競合他社をあまり気にしてこなかったOpenAIだが、Gemini 3 Proのローンチや中国DeepSeekなどのオープンウェイトモデルの急速な発展により、初めて本...
Google・DeepMind・Alphabet

Gemini 3 Proはこれまで作られた最高のモデルだ

Googleが2023年3月のGPT-4リリース以来最大級の能力飛躍を遂げたGemini 3 Proを発表した。このモデルはコーディング、UI設計、マルチモーダル理解において圧倒的な性能を示し、各種ベンチマークでGPT-4.5やClaude...
Anthropic・Claude・ダリオアモデイ

Claudeがアホになった本当の理由

この動画は、AnthropicのClaude AIモデルが一時期性能低下を起こした技術的な問題について詳細に解説している。2024年8月から9月にかけて発生した3つの重大なインフラバグが重なり合い、ユーザーからの「Claudeがバカになった...
イーロンマスク・テスラ・xAI

Grok 4 Fastが全く意味をなさない理由

この動画では、xAIが発表したGrok 4 Fastモデルが従来の業界常識を覆す驚異的な性能を示していることを解説している。このモデルは他社の最高級モデルを上回る性能を発揮しながら、コストは大幅に安価である点が注目される。特に強化学習の大規...
Anthropic・Claude・ダリオアモデイ

君だけじゃない(Claudeは実際にバカになった)

この動画では、AnthropicのClaudeモデルの品質が実際に劣化していたという問題について詳しく分析している。作者は長期間にわたってClaudeの性能低下を感じていたが、それが単なる主観ではなく実際にAnthropicが認めた技術的な...