モデル比較

GPT-5

新しいGPT-5.4推論テスト

OpenAIの新モデルGPT-5.4が登場し、その推論能力を科学的なテストで検証した結果が報告されている。テスト内容は独自の因果推論テストであるエレベーターパズルで、0階から50階まで20回未満のボタン操作で到達する最短経路を見つけるという...
Anthropic・Claude・ダリオアモデイ

Claude 4.6 Sonnet登場 ― コーディングにおいて驚異的な性能を誇る新モデル

Anthropic社から新たに発表された「Claude 4.6 Sonnet」についての解説である。本モデルは、上位モデルであるClaude 4.6 Opusに匹敵する性能を持ちながら、Sonnetクラスのコストパフォーマンスを実現している...
Anthropic・Claude・ダリオアモデイ

Claude Opus 4.6思考型vs非思考型 リアルタイム比較テスト

AnthropicがリリースしたClaude Opus 4.6について、思考型(Thinking)と非思考型(Non-Thinking)の2つのバージョンを独自の論理推論テストで比較検証した動画である。テスト内容は制約条件付きエレベーター問...
GPT-5

推論テストGPT-5.1:驚きの結果

本動画では、新たにリリースされたGPT-5.1の推論能力を、過去1年間にわたって使用してきた複雑な制約充足問題を用いてテストしている。この問題は、GPT-5やGrok-4、Gemini 2.5 Proといった他のモデルが8~10ステップで解...
OpenAI・サムアルトマン

OpenAIが新モデルを発表(これは私たち開発者のためのモデル)

この動画では、OpenAIが新たにリリースしたGPT-5 Codexモデルについて詳細にレビューしている。開発者向けに特化したこのモデルは、小規模なタスクでは従来の約20分の1のトークン数で動作する一方、大規模なタスクでは2倍のトークンを使...
Google・DeepMind・Alphabet

Google、Gemini 2.5 Flash Image モデル(Nano Banana)ライブストリーム配信

GoogleがGemini 2.5 Flash Image(通称Nano Banana)モデルのライブストリームを実施し、AI Studioでの画像生成・編集機能をリアルタイムでデモンストレーションした。開発者たちがバイブコーディングを駆使...
イーロンマスク・テスラ・xAI

無料モデルがCursorに突然現れた(そしてコードがめちゃくちゃ得意)

新しい匿名の無料AIモデル「Sonic」がCursorなどの開発ツールに突然登場した。このモデルはコーディングに特化しており、従来のステルスドロップとは異なり、Open RouterではなくCursorやKleinなどのagentic co...
GPT-5

なぜみんながGPT-5を嫌うのか(そして修正方法)

この動画は、OpenAIが発表したGPT-5に対する激しい批判とその検証を扱った詳細な分析である。発表当初から多くのユーザーが性格の変化、精度の低下、コーディング能力の劣化などを指摘し、「史上最悪のモデル」とまで酷評された。投稿者は実際にG...
Anthropic・Claude・ダリオアモデイ

Anthropicには変な雰囲気がある

本動画は、AI企業Anthropicに対する厳しい批判を展開したものである。開発者からは人気が高いClaude AIを提供するAnthropicだが、その企業姿勢や運営方針には多くの問題があることを詳細に解説している。特にオープンソースへの...