人々は今、新しいGPT-5を嫌っている…

OpenAIが満を持してリリースしたGPT-5であるが、発売直後からユーザーの間で激しい批判が巻き起こった。ベンチマークでは高スコアを記録したものの、実際の使用感は冷たく機械的で、従来のGPT-4oが持っていた人間らしさや感情的知性が失われたと多くのユーザーが感じた。さらにハルシネーションの増加、使用制限の導入、安全性フィルターの脆弱性など、技術的な問題も相次いで発覚し、OpenAIは急遽対応に追われることとなった。

People Now Hate the New GPT-5...

Why are so many people turning against GPT-5? OpenAI’s newest AI model was supposed to be the most advanced system ever ...

GPT-5の期待と現実のギャップ
静かなロールアウトとユーザーの困惑
ルーター障害とその影響
OpenAIの緊急対応
失われた「魔法」
ハルシネーションの増加と信頼性の問題
失われた人間らしさ
安全性の懸念
信頼の問題
開発者への影響
OpenAIの対応と今後の方針
学んだ教訓と今後への示唆

GPT-5の期待と現実のギャップ

さあ、何が起こっとるかっちゅうとな。チャットGPTがこれまでで最大のアップデート、GPT-5をドロップしたんやけど、これはAIの大きな飛躍になるはずやったんや。ほとんどの人がこれはもっと賢くて、もっと速くて、もしかしたらAGIの始まりやないかって期待しとったんや。そんで一時期、ハイプが半端なかったんや。OpenAIのCEOのサム・アルトマンまで、Xでデス・スターの写真を投稿してローンチをほのめかしとったからな。

そうや、それぐらいの期待レベルの話やったんや。でもリリースから数日で、インターネットがひっくり返ったんや。Redditのスレッドが炎上し始めてな。ユーザーたちが新しいモデルはアホになった、ロボットみたいになった、それに前より明らかに役に立たへんって言い始めたんや。その時のr/GPTのトップ投稿は「GPT-5はめちゃくちゃや」っていうタイトルで何千もの「いいね」がついとった。

それにRedditだけやなかったんや。Hacker NewsやX、それにOpenAI自身のフォーラムでも同じことが起こっとった。イライラやで。

静かなロールアウトとユーザーの困惑

何が起こったかっちゅうと、OpenAIがGPT-5を静かにロールアウトしたんや。切り替えボタンもなし、並べて比較するオプションもなし。ただチャットGPTプラスの中で新しいデフォルトモデルにしただけやったんや。そんでほとんどのユーザーにとって、それは人々が実際に愛用しとったGPT-4oが突然消えたっちゅうことやったんや。

警告なし、ただ置き換えられただけや。すぐに人々が違いに気づき始めたんや。返答が短くなった。トーンが冷たい、自然さがない。明確化の質問をしなくなった。会話の途中でコンテキストを忘れるようになった。あるRedditユーザーは「美化されたFAQボットと話しとるみたいや」って言うた。別のユーザーは「ロボトミー手術されたみたい」って呼んだ。

雰囲気が、なんかおかしかったんや。変なのは、紙の上ではGPT-5の方が進歩しとるっちゅうことやった。MMLUやコーディングタスクを含むほとんどのベンチマークでGPT-4やGPT-4oより高いスコアを記録しとった。OpenAIは推論、要約、複雑なワークフローの処理がより優れとるって言うとった。でも問題は数字やなくて、体験にあったんや。

ルーター障害とその影響

実はそれには理由があったんや。ローンチ直後に、OpenAIのスマートモデルルーター、基本的に裏でスピードと知性のバランスを取るはずのもんが故障したんや。サム・アルトマンは後でXでルーターが故障してGPT-5がファストモードでしか動かなくなったって確認したんや。それは速いけどずっと浅いバージョンやった。つまりユーザーは理由も分からんまま薄められた体験をしとったんや、想像やなくて本当にそうやったんや。

でもそれだけが問題やなかった。OpenAIはGPT-5の思考モードに週200メッセージの使用制限も導入したんや。つまり、たとえモデルのより深くて賢いバージョンにアクセスしたくても、キャップに当たってしまうんや。しかもこれは無料ユーザーだけやなかった。チャットGPTプラスの有料ユーザーにも影響したんや。さっきまで仕事でチャットGPT使っとったのに、ドカンと週間制限に引っかかるんや。

人々は警告のスクリーンショットを撮って「で、俺は一体何に金払っとるんや？」みたいなキャプションで投稿しとった。

OpenAIの緊急対応

これが全部雪だるま式に膨らんでいったんや。一週間以内に、OpenAIが後退し始めた。プラスユーザーにGPT-4oを復活させて、メッセージキャップを増やすって約束して、将来はモデルを削除する前に事前通知するって言うたけど、もう手遅れやった。

GPT-5のロールアウトはウォール・ストリート・ジャーナル、Wired、ビジネス・インサイダーで見出しになった。WSJは「OpenAIの方向性に疑問を投げかけるロッキーなリリース」って呼んだ。Wiredはユーザーが離れるのを防ぐためにOpenAIが批判の最中にリアルタイムで決定を覆さざるを得なかった様子を報じた。そんでビジネス・インサイダーはGPT-5のパーソナリティがもう人間らしく感じられへんっていう感情の高まりを報告した。

失われた「魔法」

そこが一番痛いところやったんや。人々はバグについて文句言うとっただけやなかった。魔法が消えたって言うとったんや。何かもっと大きなもの、トーンや微妙なニュアンス、感情を理解できる何かと話しとるっていう感覚。そのつながりが一夜にして消えたように感じられたんや。テストスコアが高くてスピードが速くても、ユーザーは統計だけのために留まっとったわけやないんや。

体験を取り戻したかったんや。そんでな、これが全部ローンチから数日で起こったんや。そんで混乱がピークに達した時、別の問題が表面化した。ハルシネーションや。

ハルシネーションの増加と信頼性の問題

ベンチマークでより高いスコアを記録したにも関わらず、GPT-5はGPT-4oよりもハルシネーションが多いって報告されたんや。ユーザーがそれを記録し始めて、事実を間違える、引用を捏造する、URLを作り上げる。時にはスレッドの途中で自分の答えと矛盾することもあった。あるユーザーは「より自信満々やけど正確性は低い」って表現した。別のユーザーは「より賢く聞こえるけど、もっと間違いを犯す」って言うた。

これは孤立したバグやなかった。複数のコミュニティレポートによると、コーディング、法的要約、基本的な調査プロンプトまで、使用例全体でこれが起こっとったんや。

Hacker Newsに投稿された並べて比較するテストでは、GPT-4oの方が実際にGPT-5よりも地に足の着いた事実確認された返答をしとって、これでまた人々は疑問に思ったんや。なんでOpenAIは明らかにプライムタイムの準備ができてへんかったGPT-5を前面に押し出したんやって。

でも出力だけやなかった。人々が無視できへん別のことがあったんや。トーンや。

失われた人間らしさ

GPT-4oでは、やり取りが流暢で親しみやすくて、時々親しみやすすぎることもあったけど、それでも人間らしかった。GPT-5は、そういうのを全部捨ててしもうたんや。トーンが無機質になって、企業マニュアルと話しとるみたいやった。思慮深いフォローアップも、優しい後押しも、以前のバージョンを会話らしく感じさせとった小さな個性も消えてしもうた。

ビジネス・インサイダーの投稿が一番よくまとめとった。「GPT-5は冷たく感じる、共感を取り除かれたみたいに」。この変化は偶然やなかった。OpenAIは後でGPT-5がより中立なトーンになるよう意図的に訓練されたって認めた。恐らくGPT-4oが過度に熱狂的やったりべたべたしすぎやったりするっていう苦情への対応やったんやろう。でもそうすることで、多くのユーザーが実際に価値を感じとった感情的知性を失ってしもうたんや。

モデルが会話で一緒におるように感じる能力、ただ入力を処理して答えを吐き出すだけやなくて。

安全性の懸念

そんでそれだけでも十分やなかったら、安全性の懸念もあったんや。リリースから24時間以内に、ジェイルブレイカーたちがもうGPT-5の安全フィルターを回避する方法を見つけとった。あるプロンプトは爆発物の作り方の指示を出すよう騙したって報告された。

その他は誤情報、ヘイトスピーチ、なりすましに関わるもんやった。The VergeとWiredの両方がGPT-5のフィルターがいかに素早く悪用されたか、そしてGPT-4oよりも回避するのが簡単に思えたかを報告した。そんでここにひねりがある。このバージョンのモデルはより安全になっとるはずやったんや。OpenAIはGPT-5には強化された安全アライメントとより良いコンテンツモデレーションツールが付いとるって主張しとった。

でも一日で、その物語は崩壊した。Xのプロンプトエンジニアや研究者たちがGPT-5がより脆弱やった証拠を投稿し始めたんや、より安全やなくて。つまり今度は冷たく感じて、ハルシネーションが多くて、使用制限を課して、その上置き換えたバージョンよりも安全ガードレールが弱いモデルを手に入れたっちゅうことや。負け負けの状況みたいに感じ始めた。

信頼の問題

でも本当に批判を主流メディアの見出しに押し上げたのは、OpenAIが警告なしにこれらの変更を全部行ったっちゅう事実やった。ロードマップなし、オプトアウトなし、ロールバックボタンなし、ただ何百万人ものユーザーに一夜にして押し付けられた大きな変化や。そんでそれが開発者から一般ユーザーまで全員を完全に不意打ちにしたんや。

そんでその突然の変化がもっと深いものを引き起こした。もうAIのパフォーマンスだけの問題やなくなった。信頼の問題やった。仕事、研究、セラピー、シミュレーション、教育でGPT-4oに頼っとった人々が突然重要な何かを失ったように感じたんや。GPT-5がひどかったからやなくて、決定が彼らのために作られたからや。モデルが変わった、雰囲気が変わった、そして誰も聞かれへんかった。

ウォール・ストリート・ジャーナルはそれをOpenAIとユーザーベースの間の緊張の高まりを浮き彫りにしたロッキーなロールアウトとして取り上げた。Wiredは最も先進的なAIモデルでさえユーザーが無視されたと感じた時にいかに裏目に出るかの教訓として説明した。そんでTechcrunchはOpenAIのフォーラムがパフォーマンスの低下と不明確なコミュニケーションを理由に返金を要求する有料購読者からの苦情で溢れかえったって報告した。

開発者への影響

そんで開発者への影響もあった。アプリ、サービス、ビジネスでOpenAI APIを使っとる誰もが変化に気づいた。出力が遅くて一貫性がないって言う人もおった。新しいモデルが指示を違った風に処理するから、プロンプトを再考せなあかんくなった人もおった。個人開発者や小さなチームにとって、行動のこれらの微妙な変化は高くついて、イライラするもんやった。

OpenAIの対応と今後の方針

そんでOpenAIが対応した。まず、チャットGPTプラス内でGPT-4oを選択可能なオプションとして戻した。次に、GPT-5の思考モードのメッセージキャップを上げるって約束した。サム・アルトマンはロールアウトの欠陥を公に認めて、ルーターの停止を不運やったって呼んで、今後はより良い透明性を約束した。

新しい設定のテストも始めて、ユーザーがファスト、オート、思考モードの間で選択できるようにした。目標は裏でケーパビリティを削除することなく、モデルがどう振る舞うかについて人々にもっとコントロールを与えることやった。サイレントロールアウトはもう選択肢やなかった。

OpenAIはより人間らしいパーソナリティが戻ってくるかもしれへんって認めた。一部のユーザーを悩ませた過度に親しみやすい種類やなくて、GPT-5の現在のトーンよりも暖かい何かや。ビジネス・インサイダーとのインタビューで、同社はプロフェッショナリズムと親しみやすさのバランスを取ろうと、異なる会話スタイルを実験しとるって確認した。

同時に、研究者たちは将来のAI評価で感情的知性ベンチマークを求めるようになった。MMLUやhuman evalのような技術的スコアはモデルを使うときの感覚を考慮してへんからや。そしてその感覚が重要やっちゅうことは明らかやった。

学んだ教訓と今後への示唆

でもその時にはもう手遅れやった。GPT-5のロールアウトはハイプが配信を上回り、技術的進歩がユーザー体験を無視した時に何が起こるかのケーススタディになっとった。今でもフォーラムは分かれとる。一部のユーザーはGPT-4oに戻してGPT-5には触ろうとせえへん。時間をかけてOpenAIがトーン、一貫性、深さを改善できることを望んで様子を見とる人もおる。

でもほぼ全員がこのローンチは違ったやり方で処理できたはずやって同意しとる。そんでここにもっと大きな教訓がある。AIはもうただのコードやない。何百万人にとって、それは日々の生産性ツール、研究パートナー、創造的な協力者でもある。だから大きなアップデートが来て何かを奪われとるように感じた時、それは個人的なもんや。

人々はただより賢いAIを求めとるわけやない。安定した、信頼できる、馴染みのあるAIを求めとる。信頼できて、使えて、その周りに構築できる何かを。GPT-5はまだ進化するかもしれへん。OpenAIにはインフラがあって、フィードバックがあって、明らかにたくさんのプレッシャーもある。でもこのロールアウトは皆に一つのことを思い出させた。毎日何百万人が頼っとる技術を構築しとる時、進歩だけでは十分やない。

聞くことも必要や。そして人工知能の競争をリードしとる会社にとって、それが最も重要なアップグレードかもしれへんのや。

もしここまで見てくれたなら、下のコメント欄で何を思うか教えてくれや。もっと興味深いトピックについては、今画面に表示されとる推奨動画を必ず見てくれや。見てくれてありがとうな。