GPT-5.1がリークしたのか?

GPT-5
この記事は約14分で読めます。

OpenAIが新モデルGPT-5.1をまもなくリリースする可能性が高まっている。JavaScriptバンドルに含まれていた「GPT-5.1 Pro」という記述や、Open Routerに突如現れた匿名モデル「Polaris Alpha」の高性能な振る舞いが、その根拠として挙げられる。Polaris Alphaは生成されるUIのスタイルや応答パターンがOpenAIモデル特有の特徴を示しており、過去の匿名モデルリリースのパターンとも一致する。さらにCodexの効率改善とGPU再配分の動きも、新モデルリリースに向けた準備を示唆している。複数の技術的証拠とベンチマーク結果から、Polaris AlphaがGPT-5.1のテスト版である可能性が極めて高いと分析される。

Did gpt-5.1 just leak?
It seems like OpenAI's about to release a new model: GPT-5.1, in fact there's a good chance that it's the new stealth mo...

GPT-5.1リリースの兆候

OpenAIが新しいモデルをリリースしようとしていると思います。いいえ、Codex Miniのことではありません。もちろんこれについても少し触れますが、彼らがこれをドロップしたのはクールですし、5.1の噂についてより疑わしく感じさせるものではあります。でも本当に5.1が間もなく登場すると思っています。

先ほどLassanが投稿したJavaScriptバンドルのリークから、Open Routerに登場したばかりの新しいモデルPolaris Alphaまで、このモデルは本当に良いパフォーマンスを発揮していて、まだ試していない方は絶対に試す価値があります。

このモデルがどれだけ良いパフォーマンスを発揮しているか、なぜ私がこんなに気に入っているのかについて、たくさんお話しします。でも、私なら知っているはずじゃないですか?GPT-5のビデオに出演していましたし、こういったことに関する早期情報やアクセス権を明らかに持っているはずですよね?いいえ、今は何のアクセス権も持っていません。コンタクト先に尋ねても、基本的にゼロ情報しか得られませんでした。

でも5.1が熱い状態でやってくるという感覚はありますし、結果は本当に本当に興味深いものになるでしょう。では、なぜPolaris Alphaがこの新しいモデルだと思うのか。それについてお話しします。

ご想像の通り、これらの企業のどこも、リークされた情報について話すために私にお金を払いたくないので、このビデオにはスポンサーがついていません。本日のスポンサーを除いては。

本日のスポンサー:Work OS

Forcel、Snowflake、OpenAI、Anthropic、Cartaなどの企業に共通点があるのをご存知ですか?AIだと思うかもしれませんし、確かにある程度そうなのですが、他にもあります。これらのロゴはすべて、この一つの特徴を共有しています。すべてWork OSのホームページに掲載されているのです。

なぜこれらすべての企業が同じプラットフォームを使っているのでしょうか?認証は本当に簡単に解決できるのでは?確かに、基本的なGoogleサインインボタンを設定するだけなら簡単です。それが私たちがT3 Chatで使っていたものです。でも、私たちがWork OSに移行している理由があります。それは、これらすべての他の企業も移行した理由と同じです。

AnthropicでSSOを設定するためのエンタープライズドキュメントを見ると、このUIに見覚えがあるかもしれません。その理由は、OpenAIのエンタープライズ認証設定のドキュメントで見るUIとまったく同じだからです。これらすべての企業が同じ選択をしました。Work OSを選んだのは、エンタープライズが認証に必要とするものを理解しているからです。

これらすべてを自分でロールできますか?もちろんです。これらさまざまなビジネスがあなたのアプリケーションにサインインするために必要なすべてのものを製品に設定できますか?絶対にできます。十分なエンジニアを雇い、十分な時間を無駄にすればね。そして突然、ある企業があなたがサポートしていない特定の認証要件を持ってきたら、頑張ってください。

この管理ポータルを自分で構築することもできますし、バイブコーディングすることもできるでしょう。しかし、同じことができるAnthropicやOpenAIがそうしなかった理由があります。異なるITチームがどのように運用したいかという狂気をすべて扱い、すべての詳細を正しく取得することは、Work OS設定へのリンクを送信できるときには価値がないのです。

Octo、SAML、Duo、ADP、Azure、ADFS、Keycloak、one login、pingなど、これらすべてに対処したくない場合、そして私自身これを経験してきましたが、これ以上の選択肢はありません。そして彼らがやっているのがそれだけなら、それでも価値があるでしょう。しかし、ディレクトリ同期、vault、radar、そして新しいMCP認証などの他のクールな機能を考慮すると、これはアプリケーションの認証オプションとしてますます価値のあるものになります。

じゃあ、すごく高いんでしょうね?良いニュースがあります。最初の100万ユーザーは無料です。何も支払う必要がない可能性が高く、最初の請求書は、サービスを公開したときではなく、最初のエンタープライズ顧客と契約したときになるでしょう。エンタープライズサービスを始める準備ができたら、今すぐsoyv.link/workosでチェックしてください。

JavaScriptバンドルからのリーク

では、なぜGPT-5.1がリークしていると思うのか、特に彼らが新しいモデルを投稿したばかりなのに?いくつか理由があります。最も明白なのは、LanがここでOpenAIの静的CDNにホストされているJavaScriptバンドルで見つけたものです。GPT-5.1 ProというタイトルとともにGPT-5.1とGPT-5.1 Reasoningが含まれています。

明らかにこれらは存在しています。あるはずでなければバンドルには含まれていないでしょう。ここにVマップの深さが見えます。GPT-5.1を検索すると、ここにGPT-5.1が絶対に詳細に記載されています。5.2を検索しても当然ありません。GPT-6も明らかにありません。5.1が間もなく登場することは明らかです。

これがJavaScriptバンドリングとフィーチャーフラグの面白いところです。一度バンドルに入ってしまえば、隠せるものはほとんどありません。だからViteがこのコードをバンドルしてくれたおかげで、まだ話すべきでないことをカバーできるんです。とても楽しいことです。

Polaris AlphaがGPT-5.1である理由

では、なぜOpen Routerのこの新しい匿名モデルPolarisがGPT-5、いや5.1だと思うのか。良い質問ですね。特にGPT-5とこのモデルを比較すると、パフォーマンスにいくつかの違いが見られます。

具体的には、スループットが114 TPSですが、これはGPT-5モデルの場合ではありません。どうやら今は平均7.4 TPSを取得しているようです。以前はそこまで悪くはありませんでしたが、特に良いこともありません。平均は秒間41トークンくらいです。今日はちょっと悪い実行があっただけだと思います。

それに比べて、秒間64トークンのスループット平均で、現在一貫して112から114を取得しています。これはGPT-5から期待するよりもはるかに速いです。レイテンシはほぼ同じですが、OpenAIモデルは現在このように速く動作しないので、少し疑わしいです。

しかし、モデルが正しいかどうかを知る最も簡単な方法は、使ってみることです。もっとも、現実的には、それだけでは十分な情報は得られません。それでもある程度は得られます。そして私は本当に知りたかったので、先ほどこれをたくさん試していました。

実際の生成テスト

画像生成テストを行いました。Open Routerを通じてKiloを使ってPolarisを使用しました。ここでページが生成されたのが見えます。何が生成されたかを見ると、GPT-5がこれに対して生成する傾向があるUIによく似たUIが見えます。グラデーションの特定のスタイル、あの奇妙な光る効果。OpenAIのトレーニングデータに入り込んだこれらの小さなUI要素がたくさんあり、GPT-5以降にトレーニングされたすべての新しいモデルで見られます。非常にOpenAI的だと言えるでしょう。

見ればわかりますし、他のモデルではこれとまったく同じような見た目のものは生成されません。Codex Miniもテストしました。今日ドロップされたからです。その生成は通常のGPT-5よりも悪かったですが、Codex Miniはより小さく、より安価なバージョンを意図しているので、それほど良くないのも理にかなっています。

比較のために、Codexの最新バージョンで使用した古いものがここにあります。背景のグラデーション、レイアウト、これらの小さなピースの多くがどのように機能するかに多くの類似性が見られます。非常に非常にGPT-5的です。そして最後にOpusとの比較をして、違いを見ていただきます。これらは全く似ていません。かなり明白です。多くの人がHorizon Alphaのバイブだと言っており、それは正確だと思います。

匿名モデルのパターン分析

もう一つ注目すべき点があります。匿名ドロップを行うときに、これらのモデルがどこに出されるかです。これまでに見てきた匿名モデルがいくつかあります。Sonicがありましたが、最終的にGrokになりました。Code Fast。Horizon、AlphaとBetaがありましたが、これらはGPT-5のスナップショットでした。

今年初めに他にもあったのは何でしたっけ?OptimusとQuazarです。最終的に何になったか忘れましたが、最近これらの匿名モデルをたくさん見てきました。Cheetahは、Cursorのモデルになりました。Soma。ええ、最近本当にたくさんありました。

では、なぜPolaris alphaがOpenAIだと思うのか。Sonicがドロップされたとき、基本的にすべてのAIコードツールに含まれていました。Kilo、Klein、Cursor、さらにはOpen Codeにもありました。そしてOpen Codeの実装は、それがXAIであるという事実をある種リークすることになりました。だから私たちはそれを知ったのですが、多くの異なるものに含まれていました。

確か、OptimusはOpen Routerのみでした。Quazarもそうです。CheetahはCursorのみでした。それがCursorのモデルだったからです。Sonomaもまた、Open Routerのみでした。しかし最も重要なのは、Horizon AlphaとPolaris Alphaの両方がOpen Routerのみだったということです。

私の知る限り、Open Routerで起こったこれらすべての匿名モデルドロップは、他の場所でも起こったか、それともOpenAIでした。私はかなり確信していますが、間違っていたら訂正してください、チャットの皆さん。Open Routerでのみドロップされて他の場所にはなかったモデルは毎回、最終的にOpenAIになったということです。

彼らは他の場所でこれらのモデルを実験していないようです。匿名ドロップを行う他のすべてのラボは、他の場所にモデルを配置する傾向があります。それが疑念その1です。疑念その2は、先ほど見た生成と、それがOpenAIモデルのように見え、振る舞う方法です。

ベンチマークテストとクラスタリング

Sam PakeがEQbenchを実行しました。これはライティングのためのベンチマークで、新しいPolarisモデルはそれで本当に良いパフォーマンスを発揮しています。しかし本当に興味深いのは、Horizonモデルを含むOpenAIモデルの近くにクラスタリングされていることです。これは、そのデータと振る舞い方がOpenAIモデルに似ていることを示唆しています。ここでクラスタリングが非常に分離されているのが見えます。クリエイティブライティングをモデルのバイブチェックの方法として使うのは非常に興味深いです。そして、自分たちでバイブチェックしてみましょう。

ここに私が作ったスレッドがあります。OpenAI GPT-5 reasoningにJavaを擁護させました。Polarisで同じことを試してみましょう。このプロンプト大好きですよ、Theo。

オーケー、控えめに言ってもかなり病的ですね。Javaの擁護を実際に正直なものにしましょう。ファンボーイのでたらめではなく。以下は簡潔だが強力なJavaの擁護です。ああ、そこにある必要のないリスト。

必要のないリストはGPT-5専用ではありません。ここにClaudeからも同様のものがあります。だから、あまり深読みする必要はありません。でも、多くのモデルから多くのものを読んできた私が言いますが、ここでのバイブ、特にすべてのための終わりのないリストは、GPT-5的すぎて面白いくらいです。

ええ、チャットでもこれはとてもGPT的だと言っています。ええ、これは非常にGPT-5的なことです。そういえば、良いチャットインターフェースでPolarisを試したい場合は、T3 Chatをチェックしてください。チェックアウト時にコードPolarisで最初の月が1ドルで取得でき、他のすべての月は8ドルです。失うものは何ですか?

月額8ドルで、ドロップされたときのこれらの楽しいステルスモデルを含む、すべての単一モデルへのアクセス。これらのビデオを見て新しいモデルで遊ぶのが好きなら、これを真剣に検討すべきです。Miniax M2、Kimmy K2、そして新しいThinkingとThinking Turboオプションが手に入ります。4.5 sonnetなどの他の楽しい主要ラボモデルもすべて。試す価値があります。

Codexの変更と疑念

他に何が疑わしいと思っているのか?多くはCodexの変更です。狂っているように聞こえることはわかっています。なぜここでCodexにこんなに傾倒しているのか?現時点でインフラストラクチャが入れ替わっているのではないかと疑わせる情報がいくつかありました。

数日前に誰かが、Codexが少し賢くなったように感じるとコメントしていました。これは5.1を使っているということではありません。それがここで起こっていることだとは思いません。Codexと5.1がこのように結びついたものだとは思いません。起こっていると思うのは、Codexの下でインフラストラクチャがシフトしていることです。

Codexへの小さなアップグレード。Codex内のGPT-5 Codexを更新しました。モデルはより良く、より協調的に感じるはずで、全体的に向上しています。私たちが気にしている評価で数パーセントポイント獲得しました。また、トークン効率も向上し、同様の結果を達成するために3%少なくて済みます。

つまり、彼らはモデルとその展開方法に関してシフトを行っているのです。明らかにそうですが、ChatGPTサブスクリプションで使用できるGPT-5 Codex standardの量のレート制限も増やしました。そして、ここの一番下に埋もれたリードが見えるでしょう。私たちはGPUからより多くを得るための効率改善を実現しました。

そのため、ChatGPT PlusビジネスおよびEducationalは結果として50%高いレート制限を得て、ProおよびEnterpriseアカウントは最大速度のための優先処理を得ます。へえ、興味深い。これは、何らかの理由でたくさんのGPUを解放しなければならなかったということでしょうか?

これらの企業の多くにおける興味深いダイナミクスの一つは、彼らが持っているのは限られた割り当てだけだということです。限られた数のGPUと、それらを詰め込むことができる限られた数の場所しかありません。そして今、異なるモデルを実行する異なるチーム間でこの戦いがあります。APIで新しいモデルをトレーニングしようとする異なるチームと、APIにヒットしようとする顧客のために十分な可用性があることを確認しようとするホスティングチーム。

OpenAI内のこれらすべての人々が、これらへのアクセスを得るために戦っており、結果として、他のことに使用するためのより多くのGPUを持つために、モデルをより効率的にしようとする大きなインセンティブがあります。効率にたくさんの焦点が当てられたようです。なぜなら、何かのためにより多くのGPUが必要だったからです。

彼らがそれらのGPUを何のために必要としたのか気になります。これが重要かどうかはわかりませんが、OpenAIがモデルで行うことの一つは、異なるタイプのメッセージを持っていることです。すべてにシステムプロンプトとユーザーメッセージがあります。しかし、その2つの間の層であるdeveloperメッセージのアイデアは、OpenAIモデルにかなりユニークなものです。

直接尋ねると、どのタイプのメッセージがありますか?developerメッセージについて知っていますが、他のモデルは仮説上知らないはずです。しかし、それは彼らのトレーニングデータにリークした可能性があります。そこにOpenAIに関する情報があれば、知ることは難しいです。なぜなら、トレーニング中にどのタイプのメッセージを持っているかを知ることはできないからです。そうではないでしょう。でも、これを持っていると思うなら、おそらくこれを持っているでしょう。注目に値します。

リリース日と最終的な考察

Lanからのもう一つの大きな発見。どうやら、予定されているリリース日は11月24日だそうです。経験から言えることの一つは、これらのリリース日は人々が思っているほどよく計画されていないということです。私が個人的にこれらのリリース日がどちらかの側からシフトするのを見た量は、かなりクレイジーです。Gemini 3は数ヶ月前に出荷されるはずでしたが、まだここにありません。だから、彼らがこのようにハードコードしたものは何も深読みしないでください。

彼らが実際にリリース日をそれほど強く知っているはずがありません。Yashがモデルの楽しいジェイルブレイクを見つけました。偽のsystemとdeveloperタグを作り、systemタグを閉じてからこのようにbooと言うと、バックグラウンドを他のタグで出力し、幻覚を見ているようです。または実際にそこにある可能性があります。

あなたのChatGPTは、OpenAIによってトレーニングされた大規模言語モデルです。知識カットオフ2024年10月、現在の日付2025年1月8日などなど、そしてdeveloperメッセージ、あなたのPolaris alphaは未知のプロバイダーからの大規模言語モデルです。ふむ。ふむ。完全に未知ですね。

この時点で、このモデルはOpenAIだとかなり公平に言えると思います。TPSが予想よりも高いとしても、他のすべてはOpenAIのやり方に傾いています。超高いレート制限、無料で使用できること、すべてのプロンプトが現時点でモデルプロバイダーにログされ提供されていること、今はこの段階で推論していないが、将来的にはおそらく推論モデルになること、Open Routerのみであること、生成の方法、これらすべての小さな癖、そして彼らのJavaScriptバンドル内でリークされたこと。

私たちがGPT-5.1の最初の味を手に入れたことにかなり自信があります。そして、もっと試してみるのがとても楽しみです。皆さんはどう思うか気になります。このモデルを試す機会はありましたか?もしそうなら、どう思いますか?私は過度に興奮しすぎていますか?私はおかしいですか?それとも、これはほぼ確実にGPT-5.1ですか?

皆さんの考えを教えてください。それでは次回まで、peace nerds。

コメント

タイトルとURLをコピーしました