OpenAIの新しい内部モデル「o3 Alpha」が匿名チャットボットとして密かにテストされている。このモデルは3DのFlappy Birdクローンやマインクラフト風ゲームなどを一発で作成し、日本のプログラミング競技では9時間にわたって人間の競技者を圧倒する性能を見せた。従来のモデルと比較して、UIの洗練度や機能の充実度が格段に向上しており、プログラミング初心者でも簡単にアプリケーションを作成できる時代の到来を予感させる内容である。

OpenAIの内部モデル「o3 Alpha」の密かなテスト
舞台裏で、OpenAIは新しいモデルである「o3 Alpha」をテストしており、これは「Anonymous Chatbot」という名前で表示されています。ジミー・アップルは「これは野獣だ。感動した」と言っています。これが3DのFlappy Birdクローンを作成していて、かなり良い出来に見えます。一発でFlappy Birdを作っているように見えます。
例えば、こちらはGTAクローンです。これは、つまり、ほとんどのものよりもはるかに良く見えています。繰り返しになりますが、実際にリリースされて私たちが実際に試してみるまで、どれほどうまく機能するかは分からないでしょう。しかし、多くの人が言っているように、すべてのタスクを一発で成功させ、非常に、非常にうまくやっています。どうやらこのマインクラフトクローンも含めてです。
なぜか動画を再生できませんが、以前の動画で取り上げたように、OpenAIには明らかにコーディングが非常に得意な内部モデルがあります。数日前の7月16日、日本でat codersワールドファイナルと呼ばれるプログラミング競技が終了しました。そしてこのAIモデルがプログラミング競技に参加することを許可されました。
日本のプログラミング競技での圧倒的な性能
OpenAI AHCという名前で呼ばれています。これは単にハンドル名です。AHCはat codersの略です。これが競技の名前です。ヒューリスティック競技です。これがそのモデルが参加した特定の競技です。競技は10時間続きます。そしてそのうち9時間、最初の9時間の間、このAIモデルは人間である他の競技者たちを圧倒していました。
最後の最後になって、SaiHoが1位の座を獲得しました。こちらはサム・アルトマンがSaiHoを祝福して「よくやった」と言っているところです。ここでのポイントは、コーディングが非常に得意な内部モデルがあることを私たちが知っているということです。サムはしばらくの間それをほのめかしていました。2025年2月、彼は世界で50番目に優秀なコーダーとしてランクされた内部モデルがあり、2025年の終わりまでに人間を超えるコーダーが登場する可能性があると言っていました。
そしてこのモデルは確実にそれに非常に近いように見えます。さて、多くの注意点があります。たとえ1位を取ったとしても、それは人間のソフトウェアエンジニアよりも優秀なソフトウェアエンジニアになるということを意味するわけではありません。しかしここでのポイントは、私たちはまだ野生で最高のコーディングモデルを見ていないということですが、おそらくこのモデルがLMアリーナでテストされ、他のすべてのモデルと対戦させられているのを見ているのかもしれません。
モデルの実力とゲーム制作能力
Chess Lewisは、これは世界で最も困難なプログラミング競技でSaiHoに次いで2位だと言っています。つまり、これがそのモデルかどうかは分かりません。公式な確認は見ていないと思います。こちらは射撃機能付きのGTAクローンです。かなり良い回転のメカニクス、多様な建物、何らかのコインと歩行者、そして明らかに俯瞰視点があります。
さて、こういうことです。繰り返しになりますが、これを少し割り引いて考えてください。まだ何が起こっているか分からないのです。しかし、これが確実に一発作成だったとすれば、つまりこれが一連の反復ではなかったとすれば、たとえそうだったとしても、これはかなり印象的でしょう。見ただけで、これはかなり、かなり良く見えます。正直に言って、どうやら昼夜サイクルがあるようです。
衝突検出やその他さまざまな機能があります。これは私自身のテストに基づく一見しただけの印象です。繰り返しになりますが、これはかなり印象的に見えます。スコア、スピードメーター、何発撃ったか、FPSカウンターまであるように見えます。1秒間のフレーム数カウンターが表示されているような感じです。
各テスターの特徴的な検証方法
みんなそれぞれ自分なりのもの、自分の得意分野を開発するのは面白いことです。YouTubeのMatt Vidproは、レモンのことをやっています。なぜ私がそれを見逃したのか分からないし、今さら聞くのも怖いのですが、レモンです。最近、Testing Catalog Newsの彼の特色はこれらのSVGロボットであることが明らかになってきました。
彼はこれらのモデルでさまざまなSVGロボットを作るのが大好きです。そしてここで、明らかに、このモデルはそれを一歩超えました。ロボットを開発できるSVGアプリを作成したのです。あらゆる種類のパレットやエフェクト、グロー、回路、アニメーション、パルス、プライマリー、セカンダリー、アクセント付きの色を作成できました。つまり、このモデルが作成したこのアプリから、おそらく一つのプロンプトだけで、あなた自身のロボットSVGをカスタマイズして作成することができるのです。
こちらは別の切り口です。これは自転車に乗っているペリカンのSVGです。こちらは物理学と回転するボールシミュレーションを使ったもので、これはとても人気があります。素晴らしく見えます。光る軌跡のようなものがあります。リアルタイムでサイズを変更できます。小さな衝突の火花のようなものでさえ、はるかに良く見えます。
UIの洗練度とカスタマイゼーション機能
スペースインベーダーの仕組みです。私にとって本当に目立つ一つのことは、多くのUI要素がいかに洗練されているかということです。非常に頻繁にこれらのモデルが最初の生成を吐き出すとき、なんだかちょっとお粗末に見えることがあります。例をお見せしましょう。
誰かがこれはそれほど大したことではなく、Claudeで似たようなものを作成することができ、独自のSVGを作成できると言いました。これはかなりクールです。私はこれを気に入っていますが、正直に言うと、第一に、これはずっと洗練されて見えます。ずっと良く見えています。そしてここでのポイントは、非常に、非常にカスタムなものを作成したということです。
私と多くの他の人々は、将来のある時点で、これらのモデルがあなたのためにその場でカスタムソフトウェアのようなものを作成できるようになると信じています。例えば、ロボットのSVG画像を作成したいとすれば、Photoshopを開くのではなく、AIに特定のもの、そのロボットを作るアプリをコード化するよう頼むでしょう。
実際、この新しい「o3 Alpha」でここに注目してください。Grok-2と対戦するように見えます。基本的に、2つのモデルを並べて表示されます。プロンプトを入力して勝者を選択するまで、どちらがどちらか分かりません。こちらがGrok-2で、プロンプトは「SVGサイバーパンクロボットを描いてください。可能な限り最高のものにしてください」です。
一発作成の高度な機能実装
両方とも同じプロンプトを受け取り、この匿名チャットボット、o3 Alphaは、それをスキップしてまっすぐに「あらゆる種類のものを作成できるアプリがここにあります」に進みます。ここで履歴を見ることができることに注目してください。だから私はこれが反復的なやり取りではないことが分かります。プロンプトを見ることができます。
そしてこれを作成し、ロボットにとって意味のある特定のものを含めることを知っています。回路、アニメート、自動パルス、ナイトモードなどです。回路がロボットに本当に関連するものだと思いますが、他のものも最高のものを作成するための多くのカスタマイゼーションを提供してくれます。
今、皆さんの中には感動している人もいれば、目を回している人もいるでしょう。「何が大したことなの?」という感じです。大したことは、これらのモデルがカスタマイゼーションを含む特定のことを一発で成功させることが上手くなっているということです。そして、「ああ、ロボットが欲しいですね、では回路をオンにするかオフにするか選べます」のような文脈上重要なことで、すべての機能を提供してくれます。そして最終的なアプリも、HTMLですので、このモデルの輪郭は、HTMLだと仮定しますが、かなり洗練されて見えます。
プログラミングの民主化への影響
それほど昔でないころ、ウェブサイトを求めた場合、ウェブサイトはこれらすべてのLLMコーディングアプリでとても良く見えることはなく、有用で、あなたが思いもしなかったかもしれない機能を追加することを積極的にはしませんでした。ロボットのSVGを求めた場合、お粗末なロボットのSVGをくれるだけでした。
今は、それを可能にするソフトウェアをリアルタイムで作成しています。そしてそれをCursorやWindsurfのようなものに接続すると、おそらく多くの力と作成能力を得ることになるでしょう。
これがなぜそんなに重要だと私が考えるかをお話しします。すでにフルタイムの専門開発者であれば、おそらくこれらのツールをテストしているでしょう。現在のワークフローにどこで統合されるか、どこでうまく機能するか、どこで悪く機能するかを見ており、それぞれの例を提供できると思います。
しかし、これらの小さなばかげたワンショットアプリが本当に大きな影響を与えるのは、すべての非コーダーたちです。地球上には何十億もの人々がいて、コーディングをしません。もし彼らが小さなクイックスクリプトや自動化、やりたいことを可能にする小さなソフトウェアを作成でき、AIアシスタントと話すだけでコードなしでそれらのものを作成できるとしたら、ご想像の通り、それはソフトウェア市場、SaaSサービス市場に大きな影響を与えます。
プログラミング学習の敷居の変化
ソフトウェアの価格設定方法が根本的に変わりますし、コーディングを学ぶ人数も変わります。なぜなら、以前、何年も前にはコーディングを始めて実験するためには、かなり長い学習期間が必要だったからです。多くの異なる部分を理解してから、飛び込んで実験を始めることができました。言語を選択し、開発に使用するIDEを選択する必要がありました。言語の動作方法を学ぶ必要がありました。
そして、それらすべてを知った頃に、ようやく「Hello World」と言う小さなプログラムを書くことができました。ゼロから始めて画面にテキストを表示させるまでに時間がかかりました。ゼロから始める場合でも、今はその場で物を作成しています。コードを見ることができます。コードはまだそこにあります。隠されていません。まだそれと対話することができ、「このコードがこれを作成する」ということを見ることができ、素早く反復し、学習し、遊ぶことができます。
人々にそのような機能を与えたときに何が起こるかは、ある程度分かっています。昔のカメラでそれが起こりました。写真を撮り、フィルムを現像するのは非常に時間がかかることでした。非常に困難で、やり方を学ぶ必要がありました。フィルムを現像していて誰かが暗室のドアを開けたら、フィルム全体が台無しになり、すべてが無駄になってしまいました。
デジタルカメラでは、最終的に指差してクリックするだけで、それにより誰もが写真を撮り始めることができました。デジタルカメラがより利用しやすくなり、携帯電話の一部になったりするにつれて、世界で撮られる写真の数は数億枚から1兆枚以上に増えました。
ソフトウェアエンジニアリングへの影響
これらのコーディングモデルでも全く同じことが起こると思います。これがソフトウェアエンジニアにどのような影響を与えるかについて、誰かを失業させることはないと思います。悪いキャリアになるとは思いません。おそらくAIツールの使い方など、いくつかの新しいスキルを学ぶ必要があるでしょうが、物を作る方法を知っている賢いエンジニアたちが、近い将来失業することはないでしょう。
しかし、これらの小さなチャットボットが動作するビデオゲームを一発で作成し、さまざまなコーディング競技で人間を打ち負かしています。ちなみに、ここで、人類は一人によって勝利しましたが、SaiHo自身が言ったように、次回は勝つことを期待していません。つまり、2026年版のこの競技で、人間が勝利して1位の座を獲得すると賭けますか?個人的には、そこに賭けることはしないでしょう。
とにかく、o3 Alphaまたはそれがなんと呼ばれるにしても、匿名チャットボットはウェブ開発アリーナから削除されました。私が見る限り、そこにいたのはおそらく5時間から6時間程度だったと思います。前回これらの一つがテストされたとき、Quasar Alphaがありましたが、その後すぐにリリースされたようでした。だから、おそらく今後数週間以内にこの新しいコーディングモデルを見ることになるかもしれません。
他モデルとの比較結果
こちらはジミー・アップルのアカウントからのスクリーンショットです。彼がテストしているところです。左側がGemini 2.0 Pro、右側がこの新しい匿名チャットボットo3 Alphaです。確実にかなり複雑に見えます。そして、スクリーンショットから判断する限り、私たちには分かりませんが、私はまだテストしていないので、これを割り引いて考えてください。しかし、少なくともこのコマンドに関しては、Gemini 2.0 Proよりもはるかに良いように見えます。これは非常に印象的です。
これは釣りRPGゲームです。正直に言って、良く見えます。左側がo3 Alphaです。右側はOpenAIのGPT-4oですが、左側でo3 Alphaがやったことが気に入っています。小さなキャラクターがいます。経験値が一定量レベルアップします。さまざまなものを買う店があります。これは素晴らしく見えます。これは優秀に見えます。
こちらはXboxスタイルのコントローラーSVGを作っているところです。そして再び、SVGを提供するだけでなく、アプリを作成していることに注目してください。どのように見せたいかをカスタマイズできる完全なアプリを作成しています。これが待ちきれません。
コメントで皆さんの意見をお聞かせください。そして、うまくいけば今後数週間以内に私たちがそれを手にすることができるでしょう。期待しています。ご視聴いただき、本当にありがとうございました。私の名前はWes Rothです。次回またお会いしましょう。


コメント