Claude比較

GPT-5、5.1、5.2、5.3

GPT-5.3 Codexが圧倒的性能を発揮 OpenAI最強モデルはOpus 4.6に勝てるのか 完全検証

OpenAIが静かにリリースしたGPT-5.3 Codexは、同社史上最も優れたエージェンティック・コーディングモデルである。AnthropicのOpus 4.6と同日にリリースされたこのモデルは、従来比25%高速化し、Swaybench ...
OpenAI・サムアルトマン

Sam Altmanがついに認めた「我々は失敗した」GPT-5.2の性能問題

OpenAIのCEOであるSam Altmanが、GPT-5.2の性能問題について公式に認めた。タウンホールイベントにおいて、同社が新バージョンのChatGPTを意図せず劣化させてしまったことを率直に告白した。GPT-5.2はコーディング能...
Google・DeepMind・Alphabet

Gemini 3が恐ろしいほど優秀になった

Googleが発表したGemini 3は、従来モデルから大幅な性能向上を遂げた次世代大規模言語モデルである。Vending Bench 2やARC AGI 2などの複数のベンチマークにおいて、Claude Sonnet 4.5やGPT-5....
GPT-5、5.1、5.2、5.3

GPT-5.1は一般ユーザー向けに作られた

本動画は、OpenAIが新たにリリースしたGPT-5.1について、開発者視点から詳細な分析を行ったものである。GPT-5.1は従来モデルと比較して、より会話的で温かみのあるトーンを持ち、カスタマイズ機能が大幅に強化された。特筆すべきは、メン...
LLM・言語モデル

Kimi k2思考エージェントがChatGPTとClaudeを合わせたよりも優れていると約束、そして他のニュース

Moonshot AIが発表したKimi k2 F thinkingは、ChatGPTやClaudeを上回ると主張する思考型AIエージェントである。本動画では実際にコーディング、SVG生成、旅行プランニングなどの実践的なタスクでKimi k...
中国

とんでもない!中国がこのリリースでトップモデルを破壊する!

中国Alibaba Cloudが開発したQwen 3VLは、2350億パラメータを誇る大規模視覚言語モデルであり、オープンソースとして公開された最大級のマルチモーダルAIである。本モデルはGemini 2.5 ProやClaude 4.1 ...
LLM・言語モデル

中国がガチでやってきた…

中国のAlibaba Cloud傘下のチームが開発したオープンソースのコーディングモデル「Qwen 3 Coder」について解説する動画である。このモデルはAnthropic社のClaudeファミリーのモデルに匹敵する性能を持ち、SWEBe...