この動画は、OpenAIの新しいAIモデルがプログラミング競技で人間と直接対戦し、2位という驚異的な結果を残したことについて解説している。元OpenAI社員のプログラマーが10時間のマラソン競技で疲弊しながらもAIを僅差で破った歴史的な出来事と、間もなく登場する可能性のあるo3 Alphaモデルの能力について詳しく分析した内容である。

- プログラミング競技でAIが2位の衝撃
- チャンネル紹介と感謝
- 疲弊した男がAIモデルを世界コーディング選手権で破る
- ポーランド人プログラマーの勝利
- 競技結果と詳細
- 史上初の直接対決
- 人間 vs 機械の未来
- イベントの詳細
- 個人的な体験談
- 競技の詳細と歴史的比較
- 技術進歩のペース
- 歴史的な勝利と代償
- AIの本質について
- 競技の結果と意義
- 競技のレベルの高さ
- 競技条件の公平性
- 否定論者への反論
- OpenAIの驚き
- 長期的推論の重要性
- 競技中の状況
- 創造性についての考察
- AlphaGoとの比較
- 新モデルの証拠
- フロントエンド開発の実力
- o3の驚異的な能力
- ゲーム開発の実演
- SVGアニメーションと詳細な機能
- 技術発展への感慨
- モデル名の推測
- 現行モデルの限界と期待
- チャンネル支援のお願い
プログラミング競技でAIが2位の衝撃
そうや、みんな、君らが気づいた通りや。OpenAIが人工知能モデルをプログラミング競技に参加させたんや。そして人工知能が2位になったんや。それも簡単やなかった。なんでかって言うと、競技中ずっと1位やったのに、最後の最後、ラストスパートで人間に抜かれてしもうて、その人間の言葉やと、もうへとへとになってしもうたらしいわ。
せやから、何が起こってるか理解していこうやないか。一緒に見ていこう。
チャンネル紹介と感謝
毎度毎度、いいねを押してくれたみんな、チャンネル登録してくれたみんなに感謝しとるで。特にこの人工知能チャンネルをスポンサーしてくれてる全てのメンバーに特別な感謝を送るわ。メンバーは、インテリジェントエージェントの限定動画にアクセスできて、そこではWhatsApp連携、MCP、PDF読み取り、文書処理の方法を教えてるし、先行配信動画も見られるようになってるんや。
疲弊した男がAIモデルを世界コーディング選手権で破る
今日のニュースはこれや。「疲弊した男が世界コーディング選手権でAIモデルを破る」。これがどこから来たもんで、なんで重要なんかって話やな。
サム・アルトマンが最近土曜日にこんな投稿をしとった:「土曜日の朝早く起きて、新しいモデルを小さなコーディングプロジェクトで試すのに数時間取った」。
つまり彼は、コードを作るAIモデルについて話しとって、こんなコメントしとんねん:「5分で完成した。すごく、すごく優秀」。ということは、もう使ってる、もうテストしてるってことや。そして彼はちょっと不気味なことを言うとんねん。これについてどう感じるかよくわからん。すごく奇妙や、なんでかって言うと、これから君らが見ることで、鳥肌が立つはずやから。
ポーランド人プログラマーの勝利
この写真見て、1位の人が賞を受け取ってるところや。ポーランド人プログラマーが疲弊しきった状態で、近い将来不可能になるかもしれないことを最近成し遂げたんや。OpenAIの先進モデルを激しいプログラミング競技で破ったんや。10時間のマラソンで完全に疲弊してしもうた。
彼が疲弊してるっていう発言はどこから来たんかって?サム・アルトマン自身がこう言うとる:「よくやったPsyirro」(その勝った子のことやな)。
彼自身が投稿でこう言うとんねん:「人類がとりあえず勝利した。完全に疲弊してる。この3日間で10時間しか眠ってなくて、生き延びるのがやっとや。少し休んだら大会についてもっと投稿する」。
もう何が起こってるかわかってるやろ?
競技結果と詳細
はっきりさせとくけど、これは暫定結果で、でも俺のリードは十分大きいはずや。
1位にPsyirroがいて、スコアをつけて(どうやって計算するんかは知らんけど)、2位にOpenAI AHCっていうのが来てる。これが新しいモデルやと思われる。その後に他の人たちが続いてる。
この得点は暫定的なもんで、変わる可能性がある。水曜日に、Psyirroとして知られるプログラマー(元OpenAI社員)が、東京で開催された2025 AtCoder World Tour Finalsでカスタムされたモデルを僅差で破ったんや。このAtCoderっていう会社は競技プログラミングの大会を開催してるんや。
史上初の直接対決
彼らはこんなコメントを出してる:「大規模な世界選手権の現地大会で、AIモデルが最高の人間プログラマーと直接競い合う初の競技を実現した可能性がある」。
めちゃくちゃ不思議やろ?重要なことがいくつかある。この人は元OpenAI社員やから、素人や新人と話してるわけやない。
人間 vs 機械の未来
この人が必死になってAIモデルに勝とうとしてる様子を見てみ。ニュースもはっきり言うとる、いつかこれは不可能になるかもしれんって。いつか人間がプログラミングで人工知能に勝つことを考えることさえできない時が来るかもしれん。
映画みたいな感じになるんや。人間がコードを書かなあかんけど、機械の方がはるかに上手で、でも何らかの理由で人間がやらなあかんのや。やらんかったら大変なことになるから。それで主人公が超天才でないといけなくて、映画の最後でなんとかコードを書いて勝利して、人類が喜ぶっていう。
「どうやって勝つんや?長い間忘れられてたことをやるんや。プログラミングをな」。
イベントの詳細
イベント中、ChatGPTの創設者がスポンサーとして参加して、「人間 vs AI」という特別な展示マッチにAIモデルを登録したんや。AIに特化した特別な時間があって、人々がAIと競い合えるようになってた。
シリコンの疲れ知らずの性質にも関わらず、その会社は2位を獲得した。
個人的な体験談
彼が完全に疲弊してるって話は、俺も経験したことがある。前にコメントしたこともあるけど、あるプロジェクトでデータベースとの連携をやってた時があってん。あまり得意じゃない分野で、ちょっと迷ってた。
それでChatGPTとやり取りを始めて、そのやり取りが始まるんや。スクリーンショット送って、質問して、向こうが答えて、そのやり取りが続く。だんだん前に進んで、学んで、理解していく。
4時間後、あのやり取りの全て、山のようなバグを解決して、クエリを作って、検証を作って、全部が動くまで、俺は完全に疲れ切ってしもうた、へとへとや。4時間で学んだことが多すぎて、もう我慢できんかった。
一方でAIは、口にボールをくわえたゴールデンレトリーバーみたいやった。俺がボールを取って投げて、また持ってきて、また投げて、この無限ループをさらに4時間でも疲れずに続ける準備ができてた。
結局、人間には機械にはない限界がある。疲労もその一つや。
競技の詳細と歴史的比較
競技では参加者が600分(10時間)かけて、複雑な最適化問題を一つ解くことが求められた。この競技は、1870年代に蒸気ドリルと競争したジョン・ヘンリーのアメリカの人気の話を思い起こさせる。
過去に人間が1870年の蒸気ドリルより優秀な人間のリーダーシップを争ってた場所があるんや。ヘンリーの産業オートメーションとの伝説的な戦いと同様に、Psyirroの勝利は、AIの進歩の時代において人間のスキルがまだ重要であることを証明しようと最大限努力する人間の専門家を表してる。
技術進歩のペース
みんな、理解してるかどうかわからんけど、進歩が小さな歩幅を取り始めてるんや。これははっきりしてる。GPT-3.5、4、4o、o3とか、これらは全部大きな歩幅やった。今は小さな歩幅になってる。これは明らかやけど、長期的には、これらの小さな歩幅、小さな革命が、将来的にはこんな感じになるんや。
今日、手作業でドリルが人間より優れてるかどうかなんて疑問に思わん。ただドリルを取って使うだけや。人類の歴史で一度はどっちが優秀か競争があったなんて考えもせん。全く想像もつかんことや。
歴史的な勝利と代償
両方の物語とも消耗的な持久戦を特徴としてる。ヘンリーは心臓が止まるまで何時間も鋼鉄の杭を打ち続けたし、Psyirroは最低限の睡眠で10時間プログラミングした。
類似点は両方の勝利の代償の大きさにまで及ぶ。ヘンリーはレースに勝ったが、努力のために死んでしもうた。なんてこっちゃ、この部分知らんかった。これはオートメーションの避けられない行進を象徴し、一方でPsyirroが「人類がとりあえず勝利した」と認識したことは、ますます能力を増す機械に対するこれが一時的な勝利かもしれないと彼が認識してることを示してる。
AIの本質について
もしAIはただの統計で、ターボチャージされた計算機やって一部の人が言うことを真実として考えるなら、そしたらターボチャージされた計算機が物事の意味を理解して、俺らが想像もできないタスクをこなせるようになるってことになるんや。
競技の結果と意義
Psyirroは50万円の賞金を獲得し、伝説的な鋼鉄のドライバーよりも上手く生き残った。AtCoder World Tour Finalsは、完璧な解決策のない複雑な最適化チャレンジを通じて、人間とAIモデルを限界まで押し上げる。解決策はどんどん良くなっていくだけや。
この最適化の部分は、オリンピックの100メートル走と同じや。毎年誰かが数千分の1秒縮める。長年にわたって、ちょっとした数千分の1秒をここで、ちょっとした数千分の1秒をあそこで、ちょっとした進歩をここで、別の進歩をあそこで、記録がどんどん破るのが不可能になっていく。
競技のレベルの高さ
この競技の興味深い点は、前年の成績に基づいて世界最高の12人のプログラマーだけを招待してることや。
前回投稿した動画で、ある人がこんなコメントしてた:「その国際数学オリンピックで80%の問題しか正解できんかった。だからこのAIは実際はすごく馬鹿や」。その人はこの結論に達したんやけど、その人は国際数学オリンピックが超人的レベルの知能やってことを理解してなかった。
数学の化け物だけ、すごく頭のいい奴らだけがその問題を解けるんや。結論は実は別のもんでなくちゃあかん。一部の人が統計だけ、確率的オウムって呼ぶこの機械、このオウムが人間でもできないことをどうやってやってのけてるんや。だから事情はもうちょっと複雑や。穴はもうちょっと深いところにある。
「さあ、今度は誰が俺たちを守ってくれるんや?俺、確率的オウムが」。
競技条件の公平性
全ての競技者(OpenAIを含む)は、AtCoderが提供した同一のハードウェアに制限されて、人間とAIの競技者間の公平な条件を保証してた。どんな言語でも使えて、再提出にペナルティーはなかった。守らなあかんのは、コード提出と提出の間に5分の間隔を置くことだけやった。
また先ほど見せたランキングが出てくる。Psyirroが1位でOpenAI AHCが2位。彼らの距離の差は約9.5%や。
想像できるように、2位は競技プログラミングのAIモデルにとって画期的なことや。真実はこれや。これらのAIには限界があり、問題もあるが、もう超人的なことをやり遂げてる。
否定論者への反論
前回の動画でも「このようなものは人間がやることを決してやらない。できないだろう」っていうコメントがあった。
当然できるに決まってるやんか。もう「できるかどうか」の話やない。人間よりも何かを上手くできるかどうかの議論は、もう終わってる。ここでの議論は日付や。いつなのか。来年なのか、今年末なのか、これから数年なのか、これから100年なのか。
いつか起こるかどうかを議論してる部分は、申し訳ないけど否定論者の頭の中だけや。否定論者はもう十分いる。
OpenAIの驚き
o3のようなモデルは、コーディングや数学の競技で上位100位に入ってるが、俺らが知る限り、トップレベルのコーディング・数学競技で上位3位に入ったのは今回が初めてや。
みんな、わかってる?OpenAI自身が見てる結果に驚いてるんや。
AtCoderのようなイベントは、俺らのモデルが戦略的に推論し、長期的な視野で計画を立て、人間がするように試行錯誤で解決策を改善する能力をテストする方法を提供してくれる。
長期的推論の重要性
重要な詳細、すごく重要な注釈や。この長期的な部分を見てる?これが今の流行や。俺は何回もいろんな動画でこれを繰り返してるけど、強調するためや。
LLMのAI発見の時期があった。その後推論モデルの発見の時期があった。そしてエージェントを作り始めて、ツールを使い始めて、AIが問題を解決できないと気づいた時、彼らは理解した:「これらのAIは長期的に推論する方法を知らない」。
文脈エンジニアリングの動画もある。この話をした動画を作った。そこで長期戦略の問題を抱えてる人について議論してる。エージェントで問題を解こうとする時の話や。
競技中の状況
AIモデルが競技のほぼ全期間を通じて1位にいたというのはすごく興味深い。Psyirroはこう言うてる:「疲れてた、休憩が必要やった、少し止まる必要があった」でも同時に「でもモデルと同等のスコアにすごく近づいた」。
これが彼を最大限の努力に駆り立て、AIを倒すために残っているすべてのエネルギーを使った。つまり最後の最後で追い抜いたってことや。「持ってるものの100%を出そうとして、生き延びようとしてる」と彼は言うた。
創造性についての考察
競技管理者のYoshi Wataもこう言うてる:「OpenAIのモデルは似たようなアプローチを使った人たちを上回った」。
何が起こったかって?12人の競技者がいて、1位、OpenAI、そしてその下に10人。みんなOpenAIと似たようなアプローチを取った。この場合OpenAIが力を発揮したんやけど、彼は続ける:「でもPsyirroは全く違う解決策に到達した」。
これはすごく面白いことや。AIが持ってないとされる創造性のアイデアに疑問を投げかける。でも俺が何度も言うてるように、いろんな場面でこの創造性の部分はAIに現れて、確かに創造できるんや。
AlphaGoとの比較
最も象徴的な瞬間の一つは、AlphaGoっていうAIが人間に勝ったことやった。その後彼らは人間の知能をはるかに上回るシステムを作った。
これが最も象徴的なケースの一つや。でもここの第37手、人間とAIの対局の一つで打たれた手は、同じシナリオやった。人間が完全に疲弊して、AIに勝つために100%の力を出してる。
囲碁の達人たちは、この第37手は機械によって天才的なことが行われるのを初めて見た手やと言うた。人間には全く理解できない手で、シンプルで効率的で破壊的で完璧で一貫性があって、想像できるすべての良いものが詰まってた。その手は決して人間がするであろうことにインスパイアされたものではなかった。まさにAIが人間が探求しなかったことを探求したからや。
俺らが今まさにこの瞬間を通り過ぎてるのを理解するのはすごく興味深いことや。
新モデルの証拠
でもAIがあって、新しいプログラミングモデルが来ようとしてて、サム・アルトマンが土曜日にテストしてたって言うてるってことは、新しいモデルが来るってことやな?
新しいモデルが来るっていう証拠は何なんか?これや。Peter Gostevの投稿で、OpenAIがWeb Dev Arenaで新しいモデルをテストしてるって。これはAIがどっちが一番良いコードを作るかを競うAIベンチマークや。
テストしてるモデルの名前は「Anonymous Chatbot 0717」。OpenAIは前にもOpenRouterでこれをやったことがある。そこにモデルを潜入させて、みんなにテストさせて、最終的にGPT-4oになった。
フロントエンド開発の実力
この人はこうコメントしてる:「これを言うとは信じられんけど、フロントエンドコーディングで本当に全く違うレベルにいる。Claude 3.5 Sonnet、o3、Gemini 2.0 Flash、Grok-4よりもはるかに良い」。
テストのために、procedurally generated planet(手続き的に生成された惑星)をThree.jsで作るプロンプトを使った。「自分で見てくれ」って言うて、動画を作った。一緒に見てみよう。
見てのとおり、OpenAIのo3モデル(まだリリースされてない)がある。惑星があって、いくつかのコントロールがあって、シミュレーションにすると、惑星が回ってる。Google Mapsみたいに地球を見てる感じや。
Grok-4のバージョンはもっとシンプルやけど機能的。Anthropic、Claude 3.5 Sonetのバージョンもシンプルやけど機能的。何か興味深いものはあるけど動く。
Anthropic、Claude 3.5 Opusのバージョンも同じ球体、同じ惑星、すべて回転してる。Gemini 2.0 Flashは面白いことに、もっときれいなものを作ってる。Gemini 2.0 Proはちょっと大きめのバージョンを作ったけど、まだ良い。DeepSeekは変な物を作った。DeepSeekはいつもランダムやな。GPT-4oも変な球みたいなものを作った。
o3の驚異的な能力
リリースされてないo3モデルが作ったものを見てみ。小さなメニューがあって、雲を追加したり、大気を追加したり、wireframeを作ったりできる。o3と比べて、o3が作ったもの。o3 Proも。o3 Proはちょっと変やったな。
Mistralが作ったもの、Alibabaが作ったものは基本的に色のついた球や。Night Forgeも興味深い。LM Arenaにもある。
みんな、理解したやろ?レベルがすごいことになってる。
ゲーム開発の実演
Shitasluもこの「Anonymous Chatbot 0717」(みんながo3 Alphaって呼んでる)を使って、3D Flappy Birdを作った。スタートしてゲームが始まって、3D Flappy Birdが始まる。すごくきれいに始まる。すごいやろ?鳥が跳んで、パイプが来て、3次元でそのパイプを通り抜けなあかん。
同様に、3Dバージョンで作ったGTAも。明らかにこれはGTAには見えんけど、街の小さな車のゲームみたいや。でも詳細を見て、現れてるもの、起こってること、複雑さが増してる。小さな街がもっと詳細になってる。
このゲームは一度に生成された。改良を求めたりせんかった。ゼロショット、プロンプトを送って何が起こるか見ただけや。リアルタイムで起こってることの進化を理解するのはすごいことや。
SVGアニメーションと詳細な機能
自転車に乗るペリカンの動画バージョン。これはいつもやってるテストで、SVGで作られた自転車に乗るペリカン。ベクター描画で、基本的にはAIが作ったアートで、この場合はアートだけでなく動画、アニメーション形式やから。しかも色を変えたり、SVGを修正したりできる。
結局ベクター描画やから、描画を全部作った後でも好きなものをいじれるっていう利点がある。
最後に、o3 Alphaを使ったMinecraftのバージョンも。ゲームが現れて、すでにプレイできて、マップを生成していろんな設定をして、いろんなことをいじって、このゲームを機能させることができる。
技術発展への感慨
すごいことやろ?10年後にどんなレベルにいるか想像してみ。すごいことや。遊びでMinecraftを作るのが、ほんの少しのプロンプトで。Vibe Codingが誰も想像してなかった風に進化してる。
モデル名の推測
いくつかの信頼できない情報源によると、Web LM Arenaでo3 Alphaっていう名前が出てきた。スクリプトのどこかでモデル名がリークして、この「Anonymous Chatbot 0717」に対応してるらしい。
見てのとおり、0717は日付や。この日にモデルが現れた。今は現れてないらしい。これが都市伝説なのか現実なのかはわからんけど、このニュースが正しければ、今週中に(今週中の可能性は高いと思う)、または来週にはOpenAIのコードモデルがリリースされるはずや。
現行モデルの限界と期待
現在のコードモデルであるGPT-4oはすごく弱いし、o3モデルは研究向けやから、フロントエンド、Web開発、日常的な開発により焦点を当てたモデル4oのアップデートをする時期かもしれん。
見てみようや。今週何か出ると思うか、来週出ると思うか、それとも何も出ないと思うか、コメントしてくれ。
チャンネル支援のお願い
こんな動画を見続けるためにチャンネルを支援したいなら、メンバーになってくれ。メンバーはインテリジェントエージェントの限定動画と先行配信動画にアクセスできる。
それじゃあ、いいねを押してくれ。ありがとう。


コメント