LLM比較

Anthropic・Claude・ダリオアモデイ

Claude Opus 4.5に完全にハマってしまった理由

本動画は、Claude Opus 4.5が実際の開発現場でいかに革新的な生産性向上をもたらしているかを実証する開発者の率直な体験談である。従来は数ヶ月単位で構想していた機能を数分で実装可能にするOpusの能力により、コーディングスタイルその...
OpenAI・サムアルトマン

OpenAI、危機的状況へ──GoogleのGemini 3に大敗、そしてMistral Large 3のリリース

OpenAIが深刻な危機に直面している。GoogleのGemini 3の登場により、かつて圧倒的な市場シェアを誇っていたChatGPTは急速にユーザーを失い、2025年11月の調査ではGeminiが36%でトップ、ChatGPTは31%で2...
イーロンマスク・テスラ・xAI

新型Grok 4.1がリリース、Grok 5は大きな期待を集めるが本当にそこまでのものになるのか?

イーロン・マスクがGrok 4.1をリリースし、次期バージョンGrok 5が1000倍の規模になると発表した。Grok 5は6兆パラメータを持ち、AGI(汎用人工知能)への第一歩となる可能性があり、センシエンス(感覚的知覚)を発達させる初の...
Anthropic・Claude・ダリオアモデイ

小型モデル、大きなインパクト:Haiku 4.5はエージェントのチートコード

Anthropicが新たにリリースしたClaude Haiku 4.5は、価格が上昇したものの、その性能は数ヶ月前に最先端とされていたSonnet 4を特定のタスクで上回る驚異的なモデルである。入力100万トークンあたり1ドル、出力100万...
GPT-5、5.1、5.2

GPT-5:使うべきか?(ライブテスト)

この動画は、リリース直後のGPT-5を用いた因果推論テストの実証実験である。制作者が独自に開発した複雑な論理パズルを使用し、GPT-5の推論能力をGemini 2.5 Pro、Claude Opus 4、o3などの他の最先端AIモデルと比較...
イーロンマスク・テスラ・xAI

Grok 4の論理推論テスト:実際の検証 – パート2

この動画では、xAIの新しいモデルであるGrok 4の論理推論能力を詳細にテストしている。エレベーターのボタン押下回数を最小化する因果推論テストにおいて、Grok 4が最初の19ステップ解答から、数時間の最適化作業を経て最終的に8ステップま...