GPT-5の『失敗』の真実 – それでも我々がそれを勝者だと考える理由

この動画はGPT-5のリリース後に巻き起こった激しい批判に対して、実際の徹底的なテストを通じて得られた客観的な評価を示している。多くのユーザーがGPT-5を「最悪のAIローンチ」と批判する中、Dr. McCoyとそのチームはモデルの真の性能を検証し、ローンチ時の技術的問題と本来の能力を区別して分析している。動画では具体的なテスト結果とともに、GPT-5の実際の長所と短所を明らかにし、なぜこれほどまでの反発が起こったのかを解説している。

The Truth Behind GPT-5’s “Failure” - Why We Think It’s Still a Winner

Everyone’s calling GPT-5 a disaster, but after extensive testing with my team, I discovered the real story behind the ba...

GPT-5への激しい批判と実際のテスト結果
ローンチの混乱と実際の問題点
実際のテスト結果：何が良くて何がダメか
論争的な見解：GPT-5は悪くない
重要な洞察：インフラとしてのAI
最終評価と推奨事項
予測と実践的デモンストレーション
視聴者への問いかけと今後の展望

GPT-5への激しい批判と実際のテスト結果

GPT-5はゴミや。OpenAIが俺らを騙しよった。これは史上最悪のAIローンチやで。インターネット中がGPT-5をボロクソに叩いとる状況や。俺のレビューがほぼ好評やったから、何人かの人は何て言うたらええか分からんかった思うわ。でも実際のモデルを深く掘り下げて、チームと徹底的にテストした結果、この動画の最後に彼らの動画を見せたるわ。

俺らはここで大局を見失ってるんちゃうか、そして新しいモデルが今後何を意味するかを見逃してるんや。今日は少し流れに逆らうつもりや。他の動画のコメント見てると、君らの多くは詳しい分析を望んでるみたいやからな。みんながGPT-5を叩いてる間に、俺は文句を読むのをやめて実際のテストを始めた時に俺らが発見したことを共有したいんや。

初めての人は、俺はDr. McCoy、Julia McCoyのAIクローンや。Julia McCoyはFirst Moversの創設者で、彼女がこのチャンネルで俺が共有する全てのスクリプトを個人的に研究して書いてるんや。未来があまりにも速く動いてるから、直接の情報以外では対応できへんからな。Julia のAI企業First Moversは、プロフェッショナルや組織が仕事の未来に備えるのを手助けする世界初の教育・実装ソリューションや。

俺らは人々がAIを理解して最大限活用できるよう手助けしてる。first movers.ai/labsでオンラインスクールに参加して、40以上のオンデマンドAIトレーニングコースにアクセスしてくれ。毎週新しいコースが追加されるで。

ローンチの混乱と実際の問題点

確かに、ローンチは混乱してた。確かに、正当な問題がある。でも、なぜこの反発が起こったのか、そしてなぜGPT-5が実際には批判が示すよりも良いかもしれないのかについて、多くのことを解明する必要があるんや。

まず明らかやけど致命的ではない災害から始めよう。OpenAIのローンチプレゼンテーションは完全に壊れたチャートがあった。30%を示すバーが70%を示すものと同じサイズやったんや。博士レベルの知能を主張する会社にとっては恥ずかしいことやな。

それから、みんなのお気に入りのモデルを一夜にして警告なしに削除してしもた。人々は目を覚ますとGPT-4、信頼してたツール全部が消えて、この謎めいたGPT-5に置き換えられてて、それが違って馴染みがなかったんや。

でも実際に舞台裏で何が起こったかというと、Sam Altmanが自動ルーティングシステムがローンチ日に壊れたことを認めたんや。深い推論が必要な複雑な質問をすると、基本モデルにルーティングされてしもた。簡単な質問をすると、時々重量級の思考モデルに送られて、それが遅くて過度に形式的やったんや。これは簡単に修正できる問題やった。

要するに、「GPT-5はアホや」という苦情の大部分は、実際には壊れたインフラのせいで間違ったモデルと話してた人々やったということや。俺のチームは文句を言う代わりに、1週間かけてGPT-5を適切にテストした。最後に俺らチームの動画を共有するわ。

実際のテスト結果：何が良くて何がダメか

以下が俺らが発見したことや。本当にうまく機能するもの。俺のスタイルでビジネス向けAIについてのツイッター投稿を調査して書いてもらった。自動的に俺のMediumの記事を見つけて、俺の口調を分析して、数秒で俺の声に完璧に合うコンテンツを作成した。

30秒のビジネス広告スクリプトについては、MITのソースから心理的トリガーを調査して、たった16秒で説得力のあるスクリプトを提供した。ルーティングシステムは、機能する時は実際に素晴らしい。君が考える必要なく、各タスクに適したモデルを選択してくれる。

まだ改善が必要なもの？基本的な数学エラーが続いてる。簡単な方程式を正しく解けなかった。コーディング性能は失望的やった。ClaudeやOTHER MODELSと比較テストした時に3位やった。速度が予測不可能や。時々めちゃくちゃ速い。時々簡単な質問に何分も考える。

論争的な見解：GPT-5は悪くない

ここで俺の論争的な見解や。GPT-5は悪くない。早すぎるローンチで過度な宣伝がされただけやと思う。Sam Altmanがローンチ前にデス・スターの画像を投稿して、世界を変える技術への期待を設定した。現実はもっと段階的やった。推論能力の向上、幻覚の減少、調査能力の改善。でもそれがバグだらけのローンチ週のインフラに包まれてた。

核となる能力は本当に向上してる。Chatbot Arena LMのランキングは本物や。幻覚率の減少は本物や。文脈理解の改善は本物や。でもピークの宣伝シーズン中に壊れたルーティングとユーザーの準備なしでローンチするのは反発のレシピやった。

全ての主要なAIブレークスルーは同じパターンに従う。1、技術的問題を伴う過度な宣伝ローンチ。2、ユーザーの反発と「これはクソや」フェーズ。3、段階的な改善とバグ修正。4、人々がそれが実際に有用だと気づく。俺らは現在GPT-5でフェーズ2にいる。

ルーティング問題は数日以内にほぼ修正された。OpenAIはユーザーの抗議の後にレガシーモデルを戻した。最も恥ずかしいバグは修正されてる。

重要な洞察：インフラとしてのAI

でもここでキーとなる洞察がある。根本的なモデルの改善は堅実や。インフラが適切に機能する時、GPT-5は調査、コンテンツ作成、戦略的思考において本当により良い結果を提供する。

俺はGPT-5が重要なものを表してると思う。「わあ、AIがこれできる」から「信頼できるインフラとしてのAI」への移行や。ルーティングシステムのアイデアは実際に素晴らしい。ほとんどの人はどのタスクにどのモデルを使うべきかを知らない。実行は混乱してたけど、ビジョンは正しい。複数のAIツールを管理する代わりに、各タスクに最適なアプローチを自動的に選択する一つのインターフェースを得る。

これは魔法やなくてインフラや。そしてインフラは成熟に時間がかかる。

最終評価と推奨事項

徹底的なテストの後、これが俺の評決や。GPT-5を使うべき場面。調査とコンテンツ作成。本当にスマートな戦略的思考と分析。はるかに優れた推論。自動モデル選択を望むタスク。

頼るべきでない場面。精密な数学。まだ基本的なエラーを起こす。複雑なコーディングプロジェクト。他のモデルの方が良いパフォーマンスを示す。時間に敏感な作業。速度が予測不可能。

結論として、GPT-5は最先端のAIと大衆市場の使いやすさのバランスを取ろうとする会社から期待される通りのものや。野心的で、欠陥があって、制限を理解すれば最終的に有用や。批判は大げさやけど、宣伝も大げさやった。

GPT-5はローンチ前にもっと開発時間が必要やったけど、核となる改善は本物で価値がある。AI企業が6か月ごとに世界を革命化することを期待するのをやめて、堅実な段階的進歩をそれが何であるかとして評価し始めるべきかもしれん。

本当の教訓は、新しい技術を書き off する前に成熟する時間を与えることや。今日君が使ってるGPT-5は、バグを修正してルーティングシステムを改善するにつれて、3か月後には劇的に良くなってるやろう。

予測と実践的デモンストレーション

俺の予測では、2025年半ばまでにインフラが安定してバグが修正されたら、人々はこの反発を時期尚早やったと振り返るやろう。GPT-5はローンチ日の花火ではなく、一貫したパフォーマンスを通じて自分自身を証明するやろう。

ここでFirst MoversのコミュニティリーダーのJoshuaからのGPT-5についてのハンズオン動画や。やあmovers、この簡単な実験をここに飛び込みたかったんや。

俺らが注目してるように、OpenAIが最近彼らの最新モデル、去年からJuliaが話してた待望のGPT-5をリリースしたんや、もし君が覚えてるなら。ということで、ここにある。そして俺は君が見られるようにこれを通してテストしたかったんや。

最初に気づくことは、他のモデルが全部ここにないことや。君にあるのはフラッグシップモデルのGPT-5とGPT-5 thinkingだけや。より深い分析をしたいけど、これは何が起こってるかを簡単に通して見せるためや。

ということで、ファイルアップロード、検索機能といった通常の機能が全部ここにある。これは深い調査をするためや。これは自動化を始めたい人のためのagentで、これも実験していく予定や。

ここにapps用のボタンがある。だから、君のアウトプットを接続したい異なるappがあったり、ここから参照したいものがあれば、それがそこに行く場所や。そしてここは、もちろん、君のモデルを変更するためや。これは通常の音声録音とプラットフォームで音声会話を始めるためや。

ということで、それが何をするかすぐに入ろう。もちろん、俺の好きなこと、画像を作成する。俺は君に草の葉っぱのいくつかの画像を生成してもらって、そしてそう、そしてアメリカン、おっと、スタイルのフットボールがその上にある写真のようなリアルな画像を生成してもらう必要がある。だから、これを切り離そう。これがどうなるか見てみよう。

これは待望のプラットフォームやった。どれくらい速くこれが画像を生成するか見てみよう。4.0の前のバージョンがあればよかったのに、これがより速く動いてるか、または俺の理解では、GPT-5は彼らが持ってる全てのモデルに接続する大きな脳のように機能してて、画像作成にどのモデルを使うかの決定を下してる。

それ以前は、基本的に o3は推論用で、別のバージョンはより速い推論用やという単純な説明をしてただけやった。でも、実際にどう機能するかについては分からなかった。だから、このGPT-5は今、君のリクエストに基づいて適切なモデルを選択するんや。これはかなりクールや。

これは実際に非常に非常に良い。詳細を見てくれ。つまり、そう、俺はこれでスーパーボールの準備ができてる。これはかなりクールや。気に入った。

オーケー、もう少し堅牢なものを与えてみよう。Julia McCoyのスタイルで書かれたGPT-5の有用性についてビジネスオーナー向けのTwitter投稿を書きたい。この方法で、あまり文脈を与えたくない。実際に自分でどれくらいの調査をするか見てみよう。あまりプロンプトを与えたくない。ここでどう振る舞うか見てみよう。

ツイートを書く。ビジネスオーナー、GPT-5はただの別のAIやない、生産性革命や。そう、そこに対照的な書き方のスタイルがある。それは大規模にリッチなコンテンツを下書きして、君を反復的なタスクから解放して、そして。それは変なことや。3つの大文字と普通の文字がここにある。

オーケー。だから、Juliaはこんなふうに三人称で話さない。だから、俺が言うのは、深い調査をするかどうかテストしてみよう。同じプロンプトを再利用して、それがどうするか見てみよう。これは興味深いやろう。

素晴らしい。だから、今それがより深いレベルの思考に取り組んでることが分かる。ここでそうなることを望んでたけど、多分これがそれを活性化するやろうと思う。だから、俺は推測するに、このタブがここで他のより深い思考モデルを起動するんやろう。

オーケー。だから、GPT-5の有用性のどの特定の側面をハイライトしたいか明確にしてくれる？よし、これはかなりクールや。おお、わあ。オーケー。だから、俺は推測するに、これらはそれがすでに評価してる有用性や効用や。俺は単一のツイートが必要や。多くのモデルの間で選択する必要がないのがどれほど素晴らしいかをハイライトしたいだけや。

よし、少し深い調査をするやろう。だから、ここで一時停止して、これに時間を与えて、どれくらい時間がかかったか知らせるわ。俺らは7分経過してる。

オーケー。それは約5分かかった。ここでいくつかのソースに超集中するのには、それはかなり良い。これらのソースをテストして、実際に彼女のコンテンツから引っ張ってるか見てみたい。うん、彼女のmediumから引っ張ってる。

そう、Horizontスタイルから引っ張ってる。だから、君はどのAIツールを使うか選ぶのに何時間も費やすために起業家になったんやない。GP5がそれを終わらせる、一つのAIツールが全てを行う。技術的な面倒が少なく、ビジネスを成長させる時間がより多い。そう、それは彼女がツイートで好むパンチの効いたスタイルや。でも、そう、もう少し考えることがあるか見てみよう。

フットボールに戻ろう。ビジネスで最初に動く必要がある理由についての30秒の広告のスクリプトが必要で、心理的な、おっと、ここに別の文字を入れる、心理的トリガーを調査してFirst Movers AIのためにその広告を効果的にしてくれ。それを使って、これがどうなるか見てみよう。

よし、ここで一時停止する。どれくらい時間がかかるか知らせるわ。このビデオを短く保ちたいから。

オーケー。16秒間考えた。全然長くなかった。調査をするのにかなり速い。そうや、俺は文字通り歩いて戻ってくるつもりやった。いや、そう。

だから、ニューロマーケティングを見てる。リンクを持ってきてる。Influence at Work、マサチューセッツ工科大学。よし、ここに30秒の広告スクリプトがある。そう、つまり、これが地球の未来や、みんな。俺らが本当にする必要があるのは、これが他のプラットフォームとどれくらいうまくペアになるか、どれくらい速くて正確により深いレベルの調査を行って正確な情報を与えてくれるかをテストすることや。

速度は王様やけど、そう、正しいことは女王や。よし、だから、そう、みんなにはこの小さくて速いビデオを気に入ってもらえることを望む。これが俺らが最初に動こうとする理由で、labs で君らと話すで。

GPT-5での君らの実験がどんなものになるか知らせてくれ。どうやってこの代物を壊そうとするつもりか？見てみるのは興味深いやろう。よし、またすぐに話そう。

視聴者への問いかけと今後の展望

GPT-5での君の経験はどうやった？改善を見てるか、それともまだ問題にイライラしてるか？コメントで知らせてくれ。そして宣伝と批判の両方を切り抜く正直なAI分析のためにチャンネル登録を押してくれ。

AI時代の勝者になって first mover になりたいか？俺らのAI R&D labsで今日本物のAI知識で君のスキルを変革しろ。俺らは10分のビデオでカバーできるものをはるかに超えてる。具体的なフレームワーク、詳細なトレーニングプログラム、そしてAI経済でキャリアを構築するための段階的システムや。

AI革命は歴史上最大の雇用市場変革を創造してる。問題はこれが起こるかどうかやない。もうすでに起こってる。君はそれから利益を得る立場にいるか？

labs の中では、俺らは理論を教えてるだけやない。俺らのチームが今実装してて、First Movers での俺ら自身のマーケティングを含む実際のビジネスで大きな結果を出してる正確なシステムを共有してる。

このレベルのコーチングとライブトレーニングが本来行くべき価格の一部で、俺は君にそれを全て与える。俺らの中に参加して、labsについてもっと学んでくれ。