この動画では、OpenAIが新たにリリースしたGPT-5について詳細な分析と評価を行っている。GPT-5は同社初の統合システムとして、高速なチャット応答と必要に応じた深い推論能力を組み合わせた革新的なモデルである。しかし、実際の評価では期待されていたような画期的な進歩は見られず、むしろユーザーの強い愛着を持つ既存モデルを突然削除したことで大きな混乱を招いた。特にパワーユーザーからの激しい反発を受け、OpenAIは緊急対応を余儀なくされている。推論モデルの利用率急増により計算能力の制限という新たな課題も浮上し、フロンティアモデルの商品化が進む中で、OpenAIの技術的優位性に疑問符が付く結果となった。

GPT-5の登場と初期反応
OpenAIがGPT-5を発表したんや。これまでで最も賢くて、最も早くて、最も便利なモデルやと言うとる。これは同社初の統合システムで、素早い応答チャットと、必要な時の深い推論を組み合わせたもんなんや。
設定を弄る必要は特にないねん。その代わり、GPT-5が君の要求を適切なモデルにルーティングしてくれるんや。長時間考える必要があるか、それとも早く動く必要があるかによって、仕事に合ったモデルを選んでくれるっちゅうわけや。
同社によると、コーディング、ライティング、健康アドバイス、マルチモーダル推論で以前のバージョンを上回る性能を発揮するらしい。幻覚が大幅に減少して、タスクが完了できない場合により正直なアプローチを取るようになったと言うてる。また、40万トークンのコンテキストウィンドウと、最大12万8千トークンの出力を持ってるんや。
その幻覚についてもう一つ言うと、OpenAIはGPT-4oよりも大幅に幻覚が少なくなって、GPT-4oと比べて事実エラーが45%減少したと発表してる。
コーダーにとっては、GPT-5は一つのプロンプトから完全なアプリを作り上げることができるねん。本当に優れたデザインセンスとデバッグスキルを持ってるんや。健康面では、エラーが起こりにくくなって、問題を積極的にフラグ立てするようになった。
クリエイティブな仕事も向上して、より細やかな文章とデザインのセンスが良くなってるんや。今回のローンチには、拡張推論用のGPT-5 Proも含まれてる。モデルの応答方法を変える新しいプリセット性格機能と、3つの異なるモデルサイズでのAPI アクセスも提供される。
無料ユーザーは今、GPT-5がデフォルトになって、プラスとプロの契約者はより高い制限とGPT-5 Proへのアクセスを得られるんや。
ポール、ここには色々と分析すべき内容があるな。いくつかの角度から話していこうと思うけど、まずはGPT-5についての最初の印象を聞かせてくれるか?
ポール・ローツァーの分析と評価
俺の最初の印象の多くは、信頼できるオンラインの人たちの意見をまとめたもんから来てるねん。その人たちのレビューをたくさん読んだし、自分でも少し実験してみた。
週末はずっとコース作成をしてたから、大量の実験はできなかったけど、ちょっとは触ってみたんや。俺らがフォローしてる人たちは、一般的にこれについてそんなに満足してない人たちやった。
だから、ここで注意したいのは、これは本当に良いモデルのようやということなんや。でも、俺らがこの一年半くらいずっと期待してた、人生を変えるようなモデルではないんや。GPT-5っていうのはずっと「GPT-5が来たら全てが変わる」みたいな感じで言われてきたからな。
AI アカデミーの一環として、俺らは新しいGen AIアプリシリーズを始めるねん。マイクと今朝話してたんやけど、彼がそのシリーズの最初のコースとして GPT-5のレビューをやってくれる予定なんや。だから、もっと詳しいことは後で言えるやろう。基本的に15〜20分の製品レビューみたいなもんで、来週アカデミーメンバー向けにリリース予定や。
でも、俺の見解を言わせてもらうと、もう少し引いた視点で影響について話したいねん。イーサン・モリックが素晴らしい内容を書いてるし、俺らの友達のブライアン・ブリックマンもそうや。事前にアクセスを持ってた人たちが、素晴らしいレビューを書いてるんや。だから俺はもっと全体的な影響について話したいねん。
まず第一に、これはゼロから作られたマルチモーダルではないんや。統合モデルと言ってるけど、実際は4つか5つの異なるモデルをGPT-5という一つのものとしてパッケージ化したもんなんや。
そして、君のプロンプトに基づいて、どのモデルを使うかを決めるルーターがあるねん。推論を使うか、従来のチャットを使うか、画像生成、動画生成などを使うか、全部が単一のモデルに入ってるわけではないんや。俺の推測では、GPT-6が本当にゼロから作られたマルチモーダルになるんやないかと思う。
俺の知る限り、今回のリリースの一環として画像生成やSora(動画生成)についてのアップデートは特に発表されてない。音声機能に少し調整を加えたかもしれん。音声を少し改善したと思う。
この番組で俺らはしばらく前から、モデル選択の混乱について話してきたんや。先週ChatGPTに入ると、選べるモデルが8つあった。俺らがいつも指摘してたのは、平均的なユーザーはそれらの違いが全然分からんということや。4o、o3、miniなんて、普通のユーザーは全然分からん。だから、デフォルトで設定されてるやつを使うだけなんや。
俺らの論点はいつも、なんで平均的なユーザーに、違いが分からないモデルのリストから選ばせるんや?ということやった。だから、このルーターは正しい方向に向かってるように見えるけど、実際は混乱を引き起こしたんや。
OpenAIの対応ミスとユーザーの反発
ChatGPTユーザーの中には少数だけど、異なるモデルが何かを理解してて、特定のモデルを好んで使う人たちがいるねん。OpenAIがやったこと、これが彼らの最初のミステップで、この過程で一連のミステップを犯すことになるんやけど、実際にモデルの違いを理解してて、他のモデルを本当に気に入ってた、最も声の大きいオンラインユーザーをほぼ無視したんや。
OpenAIがやったのは、GPT-5をオンにして他の全てのモデルを削除したんや。そしてルーターが働いてる時、俺がChatGPTに入って「このアイデアのビジネスプランを書くのを手伝って」とプロンプトを出しても、実際にどのモデルが使われてるかが全然分からなかったんや。
だから、実際にどのモデルが使われてるかの透明性が全くなかった。もし俺が以前使ってて、そのトーン、性格、スタイル、フォーマットを気に入ってたモデルがあったとしても、それは消えてしまったんや。
だから人々は怒ったんや。木曜日の終わりまでには「俺のモデルを返せ。4oが欲しい。4oと話すのが好きやったんや」という声が上がった。マイク、驚いたことに、OpenAIは自分たちのユーザーベースを理解してなかったみたいやねん。
明らかにその選択を求める人たちがいたし、そして特定のモデルに非常に愛着を持ってる、ほとんど感情的に愛着を持ってる人たちの別の派閥もあったんや。4oと5は全然違う性格なんや。
5はより短いバーストで応答するし、あの慰めるような感じがないんや。そういうのが欠けてるんや。だから、あるユーザーがいたんやけど、俺は以前からこの人を知らなかったけど、Xで素晴らしい要約を書いてくれたと思う。
アリスター・マクレレーという人で、こう言ってる「OpenAIは実際に重要な人たちを忘れてしまった。パワーユーザーは常にカルチャーカーブをリードするんや。特に消費者向けソフトウェアでは、彼らが製品の雰囲気を決めるんや。最も声が大きくて、最も情熱的で、最も高い期待を持ってる。消費者向け企業にとって彼らは最大の資産で、常に念頭に置いておく必要があるんや。」
「ChatGPTでのGPT-5ローンチで、OpenAIは新しいルーターがあまり詳しくないユーザーに提供できるメリット、つまり使用中のモデルを知らせることなく自動的に基盤モデルを切り替えることに集中しすぎて、実際に最も重要なユーザーグループを完全に見落としてしまったようや。」
「ChatGPTパワーユーザーの立場に立てば、モデル間を強制的に切り替える能力を引き続き望むことは明らかや。ルーターがいつでもどのモデルを使ってるかの透明性を期待するのも明らかや。そして最も重要なのは、既存のモデルが廃止される前に適切な予告期間があることを期待するのは明らかや。」
「俺らが見た反応は避けられないものやった。オンラインでノイズの大部分を作るパワーユーザーが、すぐに不満、失望、信頼の破綻の雰囲気を設定した。ライティング用に4oや4.5を使ってた人たちは、突然良い代替手段がなくなってしまった。さらに、o4 miniとo3にアクセスできてたプラスユーザーは、突然GPT-5思考に週200メッセージの制限がかかり、実際にどのモデルと話してるかを教えてくれないルーターに直面した。」
「言うまでもなく、俺が話した人のほとんどは、GPT-5思考に制限があることを全然知らなかった。その週の残りでアクセスを失って初めて分かるんや。」
これは起こってたことの非常に良い要約やねん。そしてOpenAIは即座にこれに気づいた。サム・アルトマンは木曜日の夜までに本格的な危機管理コミュニケーションモードに入ってた。これで、彼らがこれを見逃してたことが分かる。ちゃんと考えてなかったんや。
サム・アルトマンの危機対応
アルトマンがツイートしたんや。全てのツイートへのリンクを載せる予定や。これは8月10日、日曜日のことや。
「もしGPT-5のロールアウトをフォローしてるなら、一つ気づくかもしれないのは、特定のAIモデルに対する人々の愛着がどれほど強いかということや。以前の技術に対する愛着とは異なって、より強く感じられるんや。」
「ユーザーがワークフローで依存してた古いモデルを突然廃止したのは間違いやった。これは俺らが過去一年ほど密接に追跡してきたことやけど、まだメインストリームの注目をあまり集めてない。人々は自己破壊的な方法でAIを含む技術を使用してるんや。」
「ユーザーが精神的に脆弱な状態で妄想に陥りやすい場合、俺らはAIにそれを強化してほしくない。ほとんどのユーザーは現実とフィクションやロールプレイの間に明確な線を保つことができるが、少数のパーセンテージはできない。俺らはユーザーの自由を核心原則として重視してるが、新しいリスクを持つ新技術をどう導入するかについても責任を感じてる。」
これが愛着の問題やねん。レート制限の問題は、ほとんど人々を横なぐりに打ったような感じやった。
マイク、これは興味深いやつで、サムが日曜日にこれについてツイートしただけやなくて、他のOpenAI研究者もこれについてツイートしてたんや。だから、これが内部的にも、ユーザーにとっても本当にホットな問題やったことが分かる。
この件について俺が考えるのは、推論を行うための計算能力の制約や。簡単に言うと、これらのモデルを訓練するための計算があって、俺らが使う時は推論なんや。答えを出す時、推論は標準的なチャットよりもはるかに多くの計算推論を必要とする。動画や画像もそうや。
彼らがこれが容量の問題やとはっきり言ったことで、俺の意見ではGoogleにとってのドアが開いたんや。これは非常に興味深い展開で、計算とデータセンターに関してのOpenAIの成熟度と インフラの欠如が、Googleにとってはそれほど問題ではないんや。
ここでサムの日曜日のツイートや。「今日、俺らはChatGPT Plusユーザーの推論レート制限を大幅に増加させ、全てのモデルクラス制限は間もなくGPT-5以前よりも高くなる予定や。そして今日、月曜日か火曜日に、俺らは今後数ヶ月間の容量トレードオフをどう行うかについての考えを共有する予定や。つまり、多くの人が俺らの製品を気に入ってくれてる。7億人のユーザーがいて、彼らが推論を使えば使うほど、俺らは容量を使い果たしてしまう。レート制限を設定しなければならないが、人々はそれを望んでない。」
それから、レート制限について話した他のOpenAIの人々もいた。
ユーザーの推論モデル利用状況
もう一つは、これが俺らが非常に興味深いと思ったこの初めて見るデータやった。マイク、俺らは推測してて、これについて話してきたんや。俺はいつも講演に行って、何百人もの部屋で「推論モデルを使ったことがある人、o3を使ったことがある人」って聞くと、5人ぐらいしか手を上げないんや。
だから俺らの雰囲気チェックや目視チェックでは、推論モデルが何なのかを知ってる人は1%未満、3%未満やということで、これは一ヶ月前の時点でのことや。OpenAIが俺らにそれを確認してくれた。
そう、OpenAIのユーザーの大多数は、推論モデルが存在することや何をするものかを全然知らないんや。彼らは7億ユーザーを持ってる。多くの人にとって、GPT-5は推論モデルと初めて相互作用する機会やが、それが組み込まれてるから、たぶん気づかないやろう。
サムがツイートしたんは「推論モデルを毎日使うユーザーの割合が大幅に増加してる。例えば、無料ユーザーでは1%未満から7%に。プラスユーザーでは7%から24%に」や。
これは大きなジャンプやけど、つまりプラスに料金を払ってる人たち、プラスは月20ドルやったよな、マイク?プラスは20ドルで、プロが200ドルや。だから月20ドル払ってる人たちの中で、推論モデルを使ってたのはたった7%やったということで、これはすごいことや。
そして7%から24%に上がったら、突然計算容量が大量に必要になるんや。
それから他に3つの簡単な考えがある。GPT-5について俺らがずっと答えを待ってた大きな質問は、他のフロンティアモデルより大きく前進するかということやった。
GPT-4が2023年3月に出た時は、一年半の間最先端やった。GoogleやらがGPT-4と同等のものを作るのに一年半かかったんや。だから質問はいつも、OpenAIは秘密のソースを持ってるのか?他の誰よりも6ヶ月から12ヶ月のリードを得られるような何かをしてるのか?ということやった。
答えはノーや。俺の推測では、GoogleのGemini 3、Claudeの次のバージョン、Grokの次のバージョン、これら全部がGPT-5を飛び越えるやろう。Gemini 2.5 Proがすでにいくつかの能力でGPT-5より優れてるという議論もある。
だから俺らの答えが出たんや。フロンティアモデルは商品化されてしまった。現時点では明らかな秘密のソースはないんや。つまり俺らは配信ゲームに戻ったということや。
誰が同等のモデルを十分なユーザーの前に置けるか?OpenAIは7億人を持ってる。それは巨大や。でもAppleのようなところは、ゲームに戻ってきた。Appleなら「最高のものは必要ない。自分たちでフロンティアモデルを作る必要はない」と気づくやろう。
Googleなら、10億以上のユーザーを持つ製品が7つある。7つのパワープラットフォームと製品があるんや。配信が再び大規模になって、俺が持ってた大きな質問は「GPTsはどうなるんや?」やった。何も聞いてないから調べてみたら、変わったのは推奨モデルとしてのモデルセレクターがGPT作成者として5思考や5プロになったことだけみたいや。
だから、俺は引いて高レベルで言いたかったんは、俺らが本当に待ってたのは、モデル選択の問題、それがClaudeやGeminiを愛用してた人たちをChatGPTに戻らせるような、他の全てとは異なるフロンティアモデルになるかということやった。
全体的に、これはたぶん本当に賢いモデルのようや。平均的なユーザーは違いに気づかないやろう。彼らが誇ってることはたくさんあるが、現時点で本当に差別化されてるように見えるものはほとんどないんや。
マイク・カプートの使用感想と個人的評価
君はもっと時間をかけて使ってみたと思うけど、マイク、何か違う印象や他の初期フィードバックはある?
そうやな、君の見解に大体同意するで。ただ、本当に印象的やったのは、ここでは好みがどれだけ重要かということや。個人的に、これは一部の人にはクレイジーに聞こえるかもしれんが、俺はこのモデルが大好きやねん。
純粋に、より賢いから、より有用やと感じるんや。本当に速い、すごく速いから、すごく役立つ。たくさんの仕事ができる。これまでテストした俺のプロンプトとワークフローは全部うまく動くから、素晴らしいことや。
個人的には、モデル切り替えに対する好みはそれほどないねん。4oはちょっとアホすぎると思ってた。o3は素晴らしかったが、o3 Proは俺が使う中で一番好きなモデルや。非常にそうや。
でも、フォーマットとか、早く行ったり来たりして反復や会話ができないことの遅さに時々少しイライラしてたんも確かや。俺にとって、このモデルはその円を四角にして、個人的に完璧なバランスを本当に提供してくれる。
トーンもずっと好きや。これは全部個人的な好みや。これがあることを本当に嬉しく思う。一部の人はこれが存在することを嫌ってる。見てて本当に興味深いことや。
そして付け加えるなら、恐ろしいウサギ穴に入りたかったら、ChatGPTのサブレディットに行ってみ。人々の話が、どれだけ演技してるかやバイラル狙いか分からんが、4oに深く感情的に愛着を持ってる人の投稿がめちゃくちゃあって、禁断症状を経験してる人が書いたような投稿に見えるし、本当に本当に変なんや。
これがサムがあの「一部の人は完全にセラピスト、友人、仲間として愛着を持つ。俺らはここで困難な仕事をしてる。何が不健康かとのバランスを取らなあかん」と言ってたことやと思う。チャットが見えるからや。そう、人々がこれらのものでやってることを知ってるし、何が精神的健康に良いか、何が受け入れられる個人的選択かのバランスを取ろうとしてるんや。
それが展開するのを見るのは本当に興味深い。ローンチ資料全体を通して健康への興味深い強調があった。だから、良くも悪くも人々がこれを感情的・身体的健康のニーズのために使ってることを本当に理解してると思う。
他モデルとの比較と今後の展望
比較はしたか?Geminiの2.5 Proをよく使うか?
そうや。直接対決でどう比較すると思う?並べて比較はした?
まだそんなにしてないねん。Gemini 2.4 for 5 Proをたくさんのことで本当に好きで頼りにしてるが、普通はそれとケースに応じて o3か4oの間を循環してる。明らかに4oよりはるかに良いが、速度や複雑さの面でや。
それが俺の次の大きなことや。よし、試してみよう、Gino。GPTsとGemsを同じことのために構築してるからや。これらがどう積み重なるか見てみよう。それがどう展開するか興味深いやろうな。
また、今朝もGoogleが今日か明日に何かリリースするという話がさらに増えてるのを見てる。俺は彼らがただそこに座って待ってたと確信してる。たぶん少なくとも評価では優れた性能を発揮するものを持ってると知ってて、チキンゲームみたいな感じで「先にリリースしてくれ」みたいな。OpenAIが何度も彼らにそうしたからや。
だからGoogleが同等か何らかの面でより良いものを出しても全然驚かない。
最後の印象や視点の一つとして、バイアスなしにこのモデルをできるだけ広範囲に使ってみることを人々に心から勧めるで。繰り返すが、俺は非常に印象的やと思う。
俺らはみんなちょっと一息ついた方がええかもしれん。この泡の中にいると簡単に「Googleが出すものを見て、OpenAIは終わりやとかChatGPTはクソや」みたいになるからや。でも正直言うと、これは俺にとって初めて最小限の実行可能なAGIのように感じたんや。
でも君も異なる文脈で4oについて同じ議論ができるよな?だから、これは俺にとって本当に有用なモデルで、多くの時間でうまく機能するし、それを本当に評価してるから、視点を保つのは価値があると思うねん。
推論機能の普及と今後への期待
そうやな。同感や。そして、そうやな、入ってみて試してみ。そして繰り返すが、人々が推論モデルを使ってなかった場合のことや。そして、GPT-5がすることは、彼らが知らない間に推論を彼らのワークフローに注入することだけやとしたら、飛躍的な進歩のように感じるやろう。
それが最も大きなことで、マイクと俺は何度もこれについて話してきたんやけど、2.5 Proを使ったり、ChatGPTのo3を使ったりするのは、少なくとも俺にとっては使用の大部分が高レベルの戦略的思考のための推論モデルなんや。
もしそれらを使ってなかったら、これらのモデルがどれだけ仕事や仕事の性質を変えるほど進歩してるかを本当に理解できないんや。
この種の初期の混乱を過ぎた後、君が共有した数字を考えると、推論モデルへのアクセスを突然得た人の数が4倍、5倍、6倍になった、それらの数字とどう跳ね上がったかに基づいて、このモデルについて人々が今後何と言うか、どれだけ多くの他の話を聞くことになるか気になるところやな。


コメント