
5,399 文字

GPT-5はどこにあるのでしょうか?これはOpenAIによる大きな能力の飛躍と多くの人が考える、待望のモデルです。具体的な事実に焦点を当て、憶測を避けながら、すべての重要な詳細を見ていきましょう。
私たちが知っている重要な事実の一つは、GPT-5が存在するということです。これは憶測上の名前ではなく、実現するかどうか不明なモデルでもありません。疑いの余地なく存在しています。
実際、最近OpenAIを退職した人物が、GPT-5の訓練に参加したことを公に認めており、将来のモデルの開発にも関わったと述べています。これはGPT-5とその後に続くモデルがすでに訓練されている、あるいは少なくとも開発の非常に進んだ段階にあることを示しており、その発表が近いことを示唆しています。
この情報をお伝えするのは、このビデオを根拠のない噂ではなく実際の事実に基づいたものにしたいからです。この情報は実際に、最近履歴書をこのデータで更新した人物から直接得られたものです。もちろん、Sam Altmanが投稿したツイートも忘れてはなりません。そこではGPT-4とGPT-5の予定されたロードマップが共有されていました。
このプランは2025年2月10日に公開され、彼らが考えていることがかなり詳細に記されていました。「私たちはロードマップの共有をより良くし、また製品提供をシンプルにしたいと考えています。人工知能があなたのために機能することを望んでおり、私たちが提供するモデルの多様性によって全てがどれほど複雑になっているかを認識しています」というような内容でした。
現在のAIモデルの使用がかなり混乱していることを指していました。GPT-4 Mini、GPT-4O、GPT-4.5 O1、O3、O3 Mini、O3 Hike、O4 Miniなどのバージョンが存在し、異なる用途のための7つの異なるモデルがあり、これがユーザーの間で一種の決断疲れを引き起こしています。そしてまさにここでGPT-5が重要になってきます。
その考え方は、この混乱をすべて単純化する統一モデルということです。実際、Altmanはこう明言しています。「私たちはあなたと同じくらいモデルセレクターを嫌っており、統一された魔法のような知性に戻りたいと考えています。」また、GPT-4.5が連鎖的推論を使用しない最後のモデルになるとも付け加えました。つまり、これからは以前のような独立したモデルはもう存在しないということです。
彼らが基本的に行おうとしているのは、OシリーズのモデルとGPTシリーズを統合し、利用可能なすべてのツールを使用でき、いつより多くの時間を考えることに費やすべきか、そうでないかを判断する能力を持つシステムを作ることです。これにより、Chat GPTを通じても、APIを通じても、幅広いタスクに役立つでしょう。
GPT-5はOpenAIによって開発された技術の多くを統合したシステムとして発表される予定で、O3モデルも含まれます。実際、O3は独立したモデルとしては配布されなくなると彼らは述べていましたが、これは年初に言及されたことであり、O3モデルはすでに発表されているため、計画を進めながら調整していることは明らかです。
また、Chat GPTの無料版ではGPT-5の標準知性設定での無制限アクセスが可能になるとも述べられていましたが、乱用の場合は一定の制限があるものの、現実的に考えれば、発表時にそうなる可能性は非常に低いでしょう。以前にも、OpenAIが需要を過小評価し、発表後の最初の数日間で大量のトラフィックを処理するための計算能力が不足していることがありました。
Samの話によると、Plus契約者はより高いレベルの知性でGPT-5を使用でき、Pro契約者はさらに高いレベルにアクセスできるとのことです。GPT-5は単なるチャットボットではなく、複数のツールにアクセスできる人工知能になります。画像生成、ビデオ作成、検索、音声の使用、深い調査など、多くのことができるようになります。
本質的に、GPT-5は本当に強力で多用途な仮想アシスタントとして提示されています。そして使い方はあなたのサブスクリプションの種類によって変わります。サブスクリプションが高いほど、モデルはあなたの質問をより長く考え、回答の精度も高くなります。興味深いのは、Sam AltmanがGPT-5についてさらに情報を提供したことです。
あるツイートで彼は「計画変更、最終的にO3とO4 Miniモデルを発表することになりました。これは私たちが知っているように実際に行ったことです。」そして「数ヶ月以内にGPT-5を発表する予定です」と付け加えました。そのツイートは4月に投稿されたので、数ヶ月というのは年末頃に発表される可能性があることを意味するかもしれません。
この計画変更には複数の理由があると説明しましたが、最も興味深いのは、当初の予想よりもGPT-5をはるかに優れたものにする方法を見つけたということです。OpenAIではモデルを大幅に改善できるような何らかのブレークスルーがあったようです。そのブレークスルーが具体的に何かは完全には明らかではありませんが、彼らがそれらの新しい能力をGPT-5に組み込もうとしていることが理由であることは分かっています。
また、これらすべてのモデルを一つのシステムに統合することが、彼らが考えていたよりもはるかに複雑であることも言及されました。すべてをスムーズに統合するには時間がかかり、また予想される需要(それは膨大なものになるでしょう)を支えるために必要な計算能力を確保したいと考えています。前述のように、新しいモデルが発表されるたびに、ユーザー数が非常に多くなり、最初の数日間は適切に試すことさえできないことがよくあります。
OpenAIはまだサービスを安定して提供できるようにインフラを拡大しようとしています。競合他社の精度が発表を加速させたり、事前デモを示したりする可能性がありますが、これらすべてが不可避的にスケジュールに影響します。また、OpenAIのプロダクトディレクターであるKevinがインタビューでGPT-5について話し、その開発にどのように取り組んでいるかについて多くの詳細を提供したことも覚えておく必要があります。
「現在、チームがGPT-5の開発に取り組んでおり、実現したときには素晴らしい新しいモデルになると思います。しかし一般的に、今年はChat GPTが質問に答えるだけでなく、現実世界であなたのために行動する年になります。つまり、今年初めに発表した「オペレーター」と呼ばれる製品があり、これは人間のようにウェブを閲覧し、あなたのために物事を行うことができます。
ウェブでの時間の使い方を考えると、私がウェブを閲覧している時間の30〜40%は、やりたいことをしているわけではなく、何かを完了させるために一連のページやフォームに記入するなどの作業が必要だからです。
AIにそれをやってもらえたら素晴らしいと思います。私がより多くの仕事をしたり、家族と過ごす時間を増やしたりすることに集中できるように、AIがそれらのフォームを私のために記入してくれることを絶対に望んでいます。今年はAIがそのようなことをより多くあなたのためにし始める年です。それはより賢く、より安全になっている推論モデルの進歩と、サイトへの統合によって可能になります。」
プロダクトディレクターのKevinは、GPT-5においてGPTモデルとOモデルが内部で別々のモデルのままなのか、それとも各クエリを最適なモデルにリダイレクトするルーターのようなものを作成しているのかと質問されました。基本的に、GPT-5が内部的にどのモデルを使用するかを決定するインターフェースなのか、それともすべてをより深いレベルで統合するのかということを聞かれていました。
回答は明確でした。モデルは完全に統一されます。これは単に複数のモデルから選択するシステムではなく、実際の統合です。つまり、異なる方法で構築された単一の人工知能システムであり、異なる問題について推論し、複数の孤立したモデルに依存せずに内部的にそれらにどのように取り組むかを決定する能力があります。
これはモデルルーターとして知られているものとは非常に異なり、最も注目すべき点です。なぜなら、問題を解決するためにどの部分のアーキテクチャを使用するかを直感的に選択できるシステムを開発しているとすれば、それはすでにAGI(汎用人工知能)として理解されているものにかなり近づいているからです。
野心的に聞こえるかもしれませんが、言語、視覚、音声に特化したモジュールを持つ人間の脳の働き方と、GPT-5ができるようになること(自然な会話、視覚理解、音声生成、ビデオ理解、テキスト作成など)を比較すると、このモデルがAGIの特性のいくつかを満たし始めるというのはそれほど非現実的ではありません。
OpenAIが統一されたシステムになると確認したという事実は、GPT-5が別のレベルにあるという非常に重要な手がかりです。ここで誰かがOpenAIのプロダクトディレクターであるKevin Willに直接質問しています。「もう少し明確にしていただけますか?GPT-5は全能的なモデルであり、汎用モデルと推論専用モデル間の単なるルーターではないと理解していますが、矛盾する信号があり、さらなる明確さをありがたく思います。」
Kevinの回答は非常に直接的でした。「あなたが書いたことがまさに計画です。最初は残っている特定の複雑さを単純化するために内部ルーティングを使用するかもしれませんが、それは非常に特定の側面だけです。目標は、主要モデルが迅速な回答を提供し、ツールを使用し、単独で長い推論を行うことができるようにすることです。」
要するに、GPT-5の体験は統合された形ですべてを行うことができる単一の統一モデルのものになります。発表日に関しては、GoogleのI/Oイベントが目前に迫っていることから、Googleが人工知能の基準を再び引き上げる可能性があると推測する人々がいます。
彼らはすでにGemini 2.5 ProでOpenAIを驚かせました。そのため、多くの人々は、OpenAIがGoogleのイベントの直前または直後に発表を行い、以前に行ったように、すべての注目を集め、Googleが発表するものを陰に追いやるツールを発表するかもしれないと考えています。したがって、5月はOpenAIからの重要な新しい発表を見るための重要な月かもしれません。
モデルのパラメータに関しては、台湾で開催されたセミコンドイベントでのSamsung幹部からこの情報を得ました。2024年のことだったので、これが確認されているかどうかは確かではありませんが、ここではGPT-5が3250億パラメータを持ち、B100シリーズで訓練されたことが言及されています。述べたように、これが真実かどうかは確認できませんが、情報源はかなり信頼できます。
これはSamsung Electronicsのコーポレート社長兼メモリ事業の責任者です。見つけることができる最も正当な情報源の一つだと言えるでしょう。しかし、この情報は変更されている可能性があるか、公開されることを意図していなかった可能性があります。実際、この情報を他の場所で見たことはありません。実際、この情報を見たのは、有名なリーカーであるJimmy Appleのツイッターでした。
GPT-4からGPT-5へのジャンプについて話すと、Sam Altmanは実際にそのジャンプが印象的なものになると述べました。「GPT-4からGPT-5へ、あるいはそれで十分かもしれません。それはすでに私よりも賢いです。この時点で、どのように統合し、どのように使いやすくするのか?音声モードやキャンバスビデオ、私たちのすべての機能を一緒に持ってくることができるか?そして、いつウェブを検索し、いつ研究プロジェクトに行き、いつコードを書き、いつ音声モードに切り替えるかを知っている、ただ一つのモデルを持つことができるか?
私は、知能の基金を獲得した後、その統合が次の大きなマイルストーンになると思います。私たちはGPTとOを統合したいと考えています。すべてをこなすAGIを統合します。」
Sam Altmanが言及したもう一つのことは、高度な音声モードがGPT-5向けに更新されるということです。GPT-4の音声モードは世界を非常に感動させましたので、GPT-5の音声モデルも私たちを驚かせるだろうと確信しています。非常にリアルなものを想像してください。最近のMajorのデモンストレーションを考えると、同様のものが見られる可能性が高いです。さらに、SamはGPT-5が地球上のどの人よりも賢くなる可能性があるとも述べました。
「私はGPT-5より賢くないと思いますが、それについて悲しいとは思いません。なぜなら、それは私たちがそれを使って信じられないようなことができるということを意味すると思うからです。」


コメント