GPT-5に何が起こったのか…(みんなが嫌う理由)

GPT-5、5.1、5.2
この記事は約10分で読めます。

この動画では、OpenAIが2025年にリリースしたGPT-5に対する批判的な反応について分析している。多くのユーザーがGPT-5を期待外れだと感じた主な理由として、モデルセレクターの不具合、性格の変化、そしてベンチマークでの他社モデルに対する劣勢が挙げられる。動画制作者は、OpenAIが研究機関から製品重視の企業へと戦略を転換していることを指摘し、この変化がユーザーの期待とのギャップを生んでいると論じている。

What Went Wrong With GPT-5...(People Hate It)
Want to stay up to date with ai news - 🐤 Follow Me on Twitter 🌐 Checkout My website - http...

GPT-5への失望の声

GPT-5はめっちゃ物議を醸したAIのリリースやったんや。一部の人らはこのモデルががっかりやったって言うてるし、他の人らは素晴らしいリリースやったって言うてる。この動画では、両方の意見とほとんどの人が見逃してるこのリリースの重要なポイントをたくさん紹介するで。

もし君が世間から完全に取り残されてるか、フォーラムやネットで人々が何を言うてるかに注意を払ってへんかったら、多くの人がこのモデルのリリースにただ単に失望してるってことを知らんかもしれん。

あるユーザーは「GPT-5はひどい」って言うてる。これは何か特別に選んだランダムな例やない。個人がGPT-5のリリースに特に満足してへんっていう例が山ほどあるんや。この動画では、なんでそうなってるのかを正確に説明するで。ほとんどの人が何かを見逃してるからな。OpenAIが何を間違えたか、そして何をほぼ即座に修正する必要があるかを君らに正確に見せたる。

彼らは短い返答が不十分で、より鬱陶しいって事実について話してる。そして君が繰り返し見ることになるテーマの一つは、性格が少なくなって、許可されるプロンプトがかなり少なくなったってことや。

さっき言うたように、これは俺が見た唯一の例やない。TwitterとRedditユーザーからのたくさんの異なるコメントが、GPT-5は期待外れでひどいって単純に言うてる。

客観的な視点からの分析

俺はこれとは全く違う意見を持ってるんや。それは俺がAI分野におるからやなくて、俺は常に主観的やなく客観的に物事を見ようとしてるからや。OpenAIのファンボーイにもアンチにもなりたくない。俺が見たいのは、そのモデルが実際に良いかどうかや。

そしてOpenAIは部分的には自分らのせいやって言わなあかん。GPT-5は長い間、多くの異なることができる信じられないモデルとしてハイプアップされてたからな。

このユーザーを見てみい。「Chat GPT-5の徹底的な評価の後、これらが俺の認識や。Claudeはかなり素晴らしい。俺はASIやAGI 2027、俺の頭の中で跳ね回ってた終末シナリオについてかなり心配せんくなった。GPT-5はOpenAIのコストを下げることとフロンティアの境界を押し広げることやなく、境界を押し進めることについてや」って言うてる。

そして明らかにサム・アルトマンの地球に迫るデス・スターについての投稿は、めっちゃハイプで、行き過ぎで、GPT-5の能力とは何の関係もなかった。

これは俺が何度も何度も支持されてるのを見た内容や。Redditに行っても、Twitterに行っても、GPT-5は期待外れや、良いモデルやない、などなどって言う人々の投稿を無数に見るやろう。でもここでほとんどの人が重大な間違いを犯してる。GPT-5はめっちゃ良いモデルなんや。でも間違いはここにある。

OpenAIの重大な失策

OpenAIがこのモデルをリリースしたときにした大きな間違いは、適切なモデルセレクターがなかったって事実や。知らん人のために言うとくと、GPT-5は考える必要があるときに考えることができて、素早く応答する必要があるときに素早く応答できるっていう点でより優れた、ある種の統一されたモデルになるはずやった。

しかし、彼らは実際にはリリース日にそれを有効にしてへんかった。彼らが「何でも聞いて」スレッドで答えてるのを見ることができるんやが、昨日彼らはオートスイッチャーに問題があって、一日の大部分でそれが機能してへんかった。その結果、GPT-5がかなり馬鹿に見えた。それで彼らは決定境界の働き方にいくつかの介入を行って、君がより頻繁に正しいモデルを得られるようにして、どのモデルが特定のクエリに答えてるかをより透明にするつもりや。

基本的に彼らがここで述べてることは、ほとんどの人がGPT-5の最も知的なバージョンやないものとやりとりしてたってことや。そして俺が思うに、OpenAIがここでやったことは、無料ユーザーと有料ユーザーのバランスを取ろうとしたってことや。OpenAIが現実的にやりたかったことは、絶対にみんなの知性を向上させることやった。

それで彼らはGPT-4oとかの全ての無料モデルを後ろに押しやって、それからほとんどの無料ユーザーにGPT-5を与えた。それがより賢くて知的やから、ユーザーは「おお、GPT-5はめっちゃ賢いな」って気づくやろうって期待してたんや。しかし、第一にルーターが機能せんかった。それで彼らは、俺は馬鹿なモデルとは言わんが、少し劣ったモデルを得た。でもそのモデルはより知的やったが、性格に欠けてたから、多くの人がそれを本当に好きやなかった。

ユーザーの反応と市場の変化

ここで人々がこれに気づいてるのが見える。彼らは「彼らは高価で有能なモデルを全て削除して、コスト最適化にデフォルトするオートルーターで置き換えなあかんかった」って言うてる。そしてそれはかなり悪く聞こえるって言うてる。それから、Googleがすぐに彼らを料理するやろうって言う複数の人がおった。Gemini 3はGPT-5よりもはるかに印象的や。

でも本当の問題をここで見てみい。俺が思うに、これはもっとニュアンスのある問題や。なぜならこの記事は基本的に、もう秘密は暴かれてるってことを示してるからや。この記事では、サム・アルトマンが一部のユーザーはChat GPTに「イエスマン」であることを望んでるって言うてることについて話してる。なぜなら彼らは今まで誰かに支持されたことがないからや。

つまり、Chat GPTの新しいバージョンは、君が思ってるほど「イエスマン」やないってことや。覚えておいてくれ、彼らはChat GPTが過度にお世辞を言う、同意する、しばしばゴマすりと表現される更新を削除した。これは、モデルが基本的にみんなの言うことに同意してたからや。もし君が何かの潜在的なナンセンスについて話し始めたら、モデルは「はい、あなたは正しい道を歩んでます。これは素晴らしいです」などなどって言うやろう。それで彼らは実際にこの更新全体を削除した。

でも今人々が言うてることを見てみい。これは俺のTwitterフィードで見まくったもんや。Chat GPTの「何でも聞いて」は、生の知性のためやなく性格のためにGPT-4を戻してくれって懇願する人々が大部分やってことや。

そしてそれはめっちゃ本当や。「40を戻してくれ、4.1やない。あなたのユーザー全員が企業やコーダーやないんや。これらの信じられないモデルは親しみやすく、支援的で、日々の相棒やった。あなたがそれらを単純に引き離したなんて信じられへん」って書いてある。そしてそれは全くその通りや。他のモデルはもっと話しやすかった。

GPT-5は、君のことを本当に気にかけへんで、正しいことだけを気にかける知的な副操縦士みたいに思える。そして俺はそれを言うのがめっちゃ変に聞こえるのは分かってるが、これらのモデルの性格は間違いなく変わらなあかんやろう。OpenAIは最大の顧客、つまりユーザーベース、つまりモデルと毎日話す普通の人々に焦点を当ててるから、最も広いアプリケーションに焦点を当ててるんや。

この件で狂ってることは、もし俺らが実際にPoly Marketを見ると、オッズがOpenAIに賭けてへんってことが分かることや。これは君がさまざまな異なることについて市場でほとんどの人が何を考えてるかを視覚化できるシステムや。何でも賭けることができるが、ここでGPT-5リリースの後、彼らは8月末までにどの会社が最高のモデルを持つかに賭けてた。

ほとんどの人はOpenAIに賭けてたやろうが、今はそれが実際にGoogleに戻ってるのが分かる。OpenAIがそのGPT-5リリースの後に14%の評価まで完全に下がったのが見える。それで俺は、GPT-5リリースがほとんどの部分で大失敗やったってことを明確に思ってる。そしてそれに至るまでにめっちゃハイプがあったことを考慮すると、ここでほとんどの人が「うん、OpenAIがリードを取るやろう」って言うやろうってのが分かる。

今、俺らは人々が将来に期待してることに関してはそれが事実やないのを見てる。そして俺はこれが人々が思ってるほど狂ってへん理由を説明するつもりや。

ベンチマークでの問題

GPT-5リリースでのもう一つの大失敗は、もちろんこのチャートやった。そして俺は文字通りAIについて話してる全てのソーシャルメディアプラットフォームでこのショットを見た。

そして基本的に、それは奇妙や。なぜなら彼らがS.Bench verifiedでGPT-5が著しく優れてるって言おうとしてるのが分かるからや。これは急いで出されたから正直な間違いやったかもしれんが、多くの人がそれはめっちゃ変やって言うてる。なぜ地球上で52が69より高いんや、そしてなぜ69がレベル30の隣にあるんや?このチャートには間違ってることがめっちゃたくさんある。

俺は完全にそれに入り込みたくもない。でももちろん、俺らは今ベンチマーク領域におる。それで他のベンチマークを見始めると、これはSimple Benchで、AIがどれだけよく常識で推論するかを判断することに関する最高のベンチマークの一つや。そしてGeminiが単純にリードを取ってる。そしてそれはここではるかに古いモデルや。

そして俺が思うに、Googleがそのモデルで間違いなく料理したってことを示してる。モデルのバックエンドに実装されてる推論の種類を見ると、俺はそのモデルがどう考えるか分からんが、それは明らかに狂ったレベルで考えてる。そして君は、拡張推論を持つGPT-5のハイバージョンが実際にここの5番目まで下がってることに気づかんかもしれん。

オーケー、推論に関してそれは5位や。もちろんひどくはない。最初のモデルより実際に4%、いや6%しか遅れてへん。でも、ほとんどの人がGPT-5に期待してたことを考慮すると、彼らはこのモデルが少なくとも著しい量でほとんどのベンチマークを超えることを期待してたやろう。そしてもちろん俺らがそれを見てへんから、OpenAIがかなりの間リードを保持してたことを考慮するとそれは少し驚きや。

それに加えて、俺らが別のベンチマークであるARC AGIベンチマークを見ると、これは複雑な問題や形や画像について推論することに関してめっちゃ難しいベンチマークや。Grok 4がこれでかなりの差でリーダーの一人やってことが分かる。そしてこれは再び、モデルが苦戦するこれらの本当に難しいベンチマークで、俺らがOpenAIが少なくともそのようにリードすることを期待してたから、かなり驚きや。

OpenAIの戦略転換

個人的に、全体的に多くの人がOpenAIに弱気になり始めてる。でも俺個人としては、それは正しいことやないと思う。なぜなら俺は、OpenAIがもうARC AGI 2リーダーボードを本当に気にかけてへんと思うからや。俺が思うに、OpenAIのミッションは根本的に変わったんや。そして俺はかなり前にこれについて動画を作った。

俺はそれからのスニペットを含めるかもしれん、OpenAIの全体的なビジョンが変わったって事実について話すところの。でも俺は君らにさらに詳しく説明するつもりや。

それで俺が思うに、人々は理解する必要がある、そしてこれは俺がOpenAIを弁護してるんやない、でも君らは彼らが今何をしようとしてるかを理解しなあかん。彼らはもう研究ラボやなく、より製品重視の会社なんや。

なぜならずっと前のサム・アルトマンのインタビューで、彼は5年後に最も価値のあるものは最先端のモデルやなく10億の日々のアクティブユーザーやろうって言うた。分かるか?それが彼が最も価値のあるものやと思ってることや。だから俺は、もし彼らが平均的な消費者が望んでることのために最適化したとしても驚かんやろう。親しみやすくて、素晴らしくて、人々が本当に良い体験を持てるチャットボットのように。

他の研究室が何に焦点を当ててるかを見ると、もちろんAnthropicはコーディングの側面に焦点を当ててるやろう。Grokは彼らの種類のコンパニオンで完全に他の側面に焦点を当ててる。俺が思うに、Chat GPTは平均的なユーザーの定番やし、彼らがただそれに焦点を当てるのは理にかなってると思う。

もちろん、このリリースで、彼らは間違いなくGPT-5の性格をどう作るかを修正すべきやった。でもそれにもかかわらず、俺はこれが一般の人々によってどうGPT-5が受け取られたかってことがめっちゃ興味深いと思う。

結論と今後の展望

全体的に、俺はまだOpenAIは大丈夫やと思ってる。俺は彼らに完全に弱気やない。なぜならAI、Twitter、YouTubeの外では、人々はまだChat GPTしか知らんからや。

彼らはそれらの4つのモデルについて本当に知らん。だから、GPT-5は悪い、これやそれやって言うユーザーが山ほどおるにもかかわらず、俺が思うに、平均的な人は本当に性格の変化にしか気づかんやろう。彼らは毎日の本当にハードコアなAIユーザーが気づくような微妙な違いには本当に気づかんやろう。

でも君らがどう思うか聞かせてくれ。俺が思うに、これが最もハイプアップされたAIリリースの一つやったってことは間違いなくめっちゃ興味深いし、それは確実に期待に応えへんかった。俺はまた、デモがそんなに派手やなかったから、それが問題の一部やったかもしれんとも思う。

コメント

タイトルとURLをコピーしました