Claude比較

GPT-5.3 Codexが圧倒的性能を発揮 OpenAI最強モデルはOpus 4.6に勝てるのか完全検証

OpenAIが静かにリリースしたGPT-5.3 Codexは、同社史上最も優れたエージェンティック・コーディングモデルである。AnthropicのOpus 4.6と同日にリリースされたこのモデルは、従来比25%高速化し、Swaybench ...

2026.02.08

GPT-5、5.1、5.2、5.3

OpenAIのCEOであるSam Altmanが、GPT-5.2の性能問題について公式に認めた。タウンホールイベントにおいて、同社が新バージョンのChatGPTを意図せず劣化させてしまったことを率直に告白した。GPT-5.2はコーディング能...

2026.02.04

OpenAI・サムアルトマン

Googleが発表したGemini 3は、従来モデルから大幅な性能向上を遂げた次世代大規模言語モデルである。Vending Bench 2やARC AGI 2などの複数のベンチマークにおいて、Claude Sonnet 4.5やGPT-5....

2025.11.19

Google・DeepMind・Alphabet

本動画は、OpenAIが新たにリリースしたGPT-5.1について、開発者視点から詳細な分析を行ったものである。GPT-5.1は従来モデルと比較して、より会話的で温かみのあるトーンを持ち、カスタマイズ機能が大幅に強化された。特筆すべきは、メン...

2025.11.13

GPT-5、5.1、5.2、5.3

Moonshot AIが発表したKimi k2 F thinkingは、ChatGPTやClaudeを上回ると主張する思考型AIエージェントである。本動画では実際にコーディング、SVG生成、旅行プランニングなどの実践的なタスクでKimi k...

2025.11.11

LLM・言語モデル

中国Alibaba Cloudが開発したQwen 3VLは、2350億パラメータを誇る大規模視覚言語モデルであり、オープンソースとして公開された最大級のマルチモーダルAIである。本モデルはGemini 2.5 ProやClaude 4.1 ...

2025.09.24

中国

中国のAlibaba Cloud傘下のチームが開発したオープンソースのコーディングモデル「Qwen 3 Coder」について解説する動画である。このモデルはAnthropic社のClaudeファミリーのモデルに匹敵する性能を持ち、SWEBe...

2025.07.24

LLM・言語モデル