OpenAIが秘密裏に開発していたとされるオープンウェイト・モデル「Horizon」について、Open Routerで利用可能になった同モデルの性能テストと、リークされた技術仕様に関する詳細な分析を行った動画である。コーディング能力に優れた同モデルの実演デモを通じて、120億パラメータと200億パラメータの2つのバージョンが存在する可能性や、中国製モデルが圧倒的優位に立つオープンウェイト・モデル市場におけるOpenAIの戦略的位置づけについて考察している。

OpenAIの謎のモデル「Horizon」が登場
Open Routerに「Horizon」っちゅう新しい謎のモデルが登場してるんや。これがなんとOpenAIのオープンウェイト・モデルやって噂されとるねん。この動画では、俺が実際に作れた出力結果をいくつか見せて、さらにオープンウェイト・モデルについて分かってる新しい情報と、モデルのサイズや性能についてのリーク情報についても話していくで。
今日、Horizon betaがリリースされたんや。これは同じモデルの2番目のバージョンやねん。この数日間、みんながテストしてたHorizon Alphaがあったんやけど、その次のバージョンや。OpenAIは以前にもリリース前にOpen Routerでモデルをテストしたことがあるねん。例えば、覚えてるかもしれんけど、Quazar alphaっちゅうのがあって、これは100万トークン対応のGPT-4.1のバージョンやったんや。
技術仕様とデモンストレーション
いくつかのデモや出力を見せる前に、技術的な詳細を簡単に説明するで。コンテキストウィンドウが256,000トークンで、最大出力が128,000トークンなんや。これでコーディングにはめちゃくちゃ良い候補になるし、実際に本当に優秀なコーディングモデルやねん。Open Routerで得られるスループットもかなりすごいで。
1秒間に37から140トークンっちゅうのは、GPT-4シリーズみたいなモデルと比べて、かなり小さいモデルやっちゅうことを示してるねん。
まず、このモデルの本当にすごいところを見せたろか。Googleチームが Gemini 2.5 deep thinkで使ったプロンプトを使ってみたんや。Horizon Betaから得られた出力がこれや。
これは確実にすごいで、特にGemini 2.5 Flashみたいなモデルと比べたらな。実際にズームインやズームアウトもできるし、時刻も追加されてて、これはかなりええ感じや。元に戻してみると、ブルームとビンも増やせると思うねん。実際に見える出力に影響があるかは分からんけど、違うスタイルで再生成できるっちゅうのは、かなりいいタッチやな。
別のプロンプトも見てみよか。この場合、ルービックキューブソルバーが欲しいって詳細な指示を出したら、要求に基づいて良い解決策を生成してくれたんや。例えば、小さいサイズやったら完璧に動くねん。実際に3×3から始めてみよか。
スクランブルしてから、ソルバーを使って解く過程のアニメーションを実行できるねん。バックエンドではコーチのアルゴリズムを使ってるんや。これは普通みんながルービックキューブを解くのに使うアルゴリズムやねん。大きいサイズの場合、スクランブリングはあんまりうまく動かへんねん。外側の層しかスクランブルできひんから、解けるかどうか見てみよか。
うん、解けるみたいやな。SASウェブサイト作成の詳細なプロンプトを出したら、ランディングページでかなりいい仕事してくれたと思うで。俺が欲しかった機能のほとんどを実装してくれて、これらのかっこいいアニメーションも含まれてるねん。例えば、このカードをクリックしたら、ちゃんと動いてるみたいや。ボタンも動いてるし、スクリプトも実行しようとしてるっぽいけど、エラーが出てるな。まあ、ただのモックウェブサイトやから問題ないで。ダークテーマとライトテーマの切り替えもできるしな。今のところは順調や。
プログラミング課題での検証
ハノイの塔の実装や解決策がこれや。再帰を実装できるモデルやったら、これを解けるはずやねん。この場合、ちょっと変なことしてて、ブロックが逆さまになってるねん。解こうとする時も、逆さまに解いてるみたいやな。
まあ、これは向きの問題かもしれんな。でもこれについては、15ステップで最適解が得られるはずで、実際にそれができてるねん。これは今多くの人がこれらのモデルで試してる別のプロンプトで、かなりまともな仕事をしてくれるで。違う惑星を生成できるねん。バイオーム、海洋がある。
青は海、森、砂漠を表してて、これらは山を表してるはずやねん。品質も変えられるし、ウルトラに設定しておくと実際に品質が向上するねん。今のところは順調やけど、面白い失敗例もあるねん。例えば、これは俺の普通のプロンプトで、七角形を実装して、それから側面に衝突する20個の跳ねるボールを実装するように頼んだんや。
これはできひんかったねん。何回か試してみたけど、うまくいかんかった。俺がよく使う別のプロンプトがこれや。これは重力の影響で文字が落ちるシミュレーションのはずやねん。俺のテストでは、これを解くことはできひんかった。これらはただの簡単な例やけど、実際の使用例はこんな感じかもしれんな。
実用的な応用例
非構造化テストとスキーマを提供して、何らかの構造化された出力が欲しい場合や。この場合、俺が正確に何を欲しいかのスキーマの指示と、ここに非構造化テキストを提供したんや。これは特にエージェントシステムを構築する場合に重要やねん。ほとんどの場合、構造化された出力が欲しいからな。これについてはかなりいい仕事をしてくれるで。
個人的には、これは本当に良いコーディングモデルやと思うで。特にもしこれが実際にオープンソースモデルで、120億パラメータか200億パラメータやったら、これができるっちゅうのはかなりすごいことやと思うねん。
モデルサイズに関するリーク情報
俺が何回かこの2つの異なるサイズについて言及してるのを聞いたと思うけど、これらは一体どこから来てるんやろか?Jimmy applesがこれを投稿したんや。「人に手柄を取られる前に言っとくけど、俺はOpenAIのオープンソースをアップロード1分後に見つけて、削除される前に設定ファイルとかその他の資料を保存したんや」って。
どうやらOpenAIは、モデルをHugging Faceにアップロードするのに、これらのテストアカウントを使ってたみたいやねん。Jimmy Appleによると、2つの異なるモデルがあるらしい。1つは1200億パラメータで、もう1つは200億パラメータや。アーキテクチャについての情報もあるねん。128個のエキスパートを持つエキスパート混合(MoE)のようやねん。アーキテクチャ自体が正しいかどうかは分からんけど、実際にこの2つのサイズがあるみたいやな。
これはハイパーボリックのCTOのYanjenや。前に彼がウェイトにアクセスできるって言ってたと思うねん。覚えてるかもしれんけど、OpenAIはそれをリリースする予定やったけど、安全性の懸念でリリースしないことにしたんや。でも今日彼は「OpenAIはGPT-5やオープンソースモデルをリリースしない」って言って、その後「120Bと20B今日」って言及してるねん。
「さらに、OSモデルはFP4で事前訓練されてない。リークされたウェイトは量子化されただけや」って。ウェイトがリークされてて、それが実際のウェイトやけど、これらは量子化されたウェイトで、実際のウェイトじゃないってことに真実味があるみたいやな。来週、OpenAIからオープンウェイト・モデルがリリースされる可能性があるみたいやねん。
オープンウェイト・モデル市場の現状
これは非常に興味深い時期やねん。今アクセスできるオープンウェイト・モデルを見ると、主に中国から出てきてるからな。これは人工分析インテリジェンス指数に基づいてるねん。それによると、Grok-4が最高のモデルや。でもこのリストのオープンウェイト・モデルを全部見ると、全部中国産やねん。
実際にもう少しズームアウトして、オープンウェイト・モデル自体だけを見ると、非常に興味深い絵が見えてくるねん。今、最初の22個のオープンウェイト・モデルのうち、中国製じゃないモデルはたった2つしかないねん。実際には多分3つやと思うけど、これらのNeotronモデルの1つもQuinnベースやと思うから。下の方にMistral Smallがあって、Meta Maverickが一番下にあるねん。
OpenAIからオープンウェイト・モデルが出るのは良いことやと思うで。でも、ライセンスについては確信がないねん。どんなライセンスを出すかが非常に興味深いところや。研究用かもしれんし、商用かもしれん。見てみんと分からんな。
とにかく、みんなの意見を聞かせてくれ。これらのモデルがどんなもんになると思う?ベンチマークも見て、モデルがどれだけ良いか確認せんとあかんな。でも、この動画が役に立ったと思うで。見てくれてありがとう、いつものように、また次の動画で会おうな。


コメント