AI ニュース｜Google の自己改善 AI、OpenAI のCodex エージェント + IPO の噂

6,478 文字

Google Reveals a Self-Improving AI System | OpenAI’s Codex Agent + IPO Rumours

Google just revealed a self-improving AI called AlphaEvolve, OpenAI launched Codex, a powerful remote coding agent, and ...

今週のAI界は最初はかなり静かでしたが、突然完全に盛り上がりました。GoogleはAlpha Evolveと呼ばれる文字通り自己改善AIシステムを発表しました。OpenAIは複数のタスクを同時に処理するリモートエンジニアのように動作するよう設計された新しいコーディングエージェントCodexを発表しました。そして加えて、OpenAIがIPOに向けて準備を進めており、Microsoftがすでにそれを実現させる手助けについて協議しているという噂が出ています。
これらは今週の最大の出来事のほんの一部でした。詳しく見ていきましょう。さて、Alpha Evolveですが、これはしばらくの間で最も驚くべき発表の一つでした。私はすでにこれを詳しく解説した完全版の動画を作成しました。今画面に表示します。しかし、まだ見ていない方のために、簡単にまとめてみます。
基本的にここにあるのは、汎用アルゴリズムの発見と最適化のために設計されたGemini 2.5 ProとGemini 2.5 Flashの両方によって動作するコーディングエージェントです。これは何を意味するでしょうか。これは、システムが基本的なコーディングタスクから複雑な数学問題まで、ほぼあらゆる種類のアルゴリズムを進化させることができることを意味します。
シンプルに言うと仕組みはこうです。人間の科学者やエンジニアがAlpha Evolveに目標と改善したいプログラムを与えます。そのプログラムはプログラムデータベースに入ります。その後、プロンプトサンプラーがLLM、Gemini ProとFlashに対する質問を生成します。これらの質問は、そのプログラムのより良いバージョンを生成するのを助けることを目的としています。
新しいバージョンは自動的に評価されます。最良のものが生き残り、プログラムデータベースに戻され、ループが再開されます。しかし、これを非常に驚異的にしたのは、GoogleがAlpha Evolveを秘密裏にハードウェアからソフトウェア、さらには彼ら自身のモデルまで、AIスタック全体を最適化するために使っていたことを明かしたことです。
彼らの言葉によると、この展開は、Alpha Evolveの能力を通じてGemini が自身の訓練プロセスを最適化する新しい事例を示しています。つまり、文字通り自己改善AIです。そしてそれだけでは十分でないかのように、Alpha Evolveは人間が発見したことのない技術を使って50年前の数学アルゴリズムも改善しました。つまり、自己改善するだけでなく、新しいことも発見しているのです。
間違いなく今年最も驚異的なAI発表の一つです。繰り返しますが、私は完全版の動画でもっと深くカバーしているので、まだ見ていない方はぜひチェックしてください。もちろん、OpenAIはGoogleにAlpha Evolveでこの週を制覇させるわけにはいきませんでした。そして金曜日に、彼らは多くのタスクを並行して処理できるクラウドベースのソフトウェアエンジニアリングエージェントCodexを発表しました。
これについても完全版の動画を作成しました。画面に表示しますが、簡単に言うと、これはコーディングタスクを委任できるAIエージェントです。Bench Verifiedのようなベンチマークで最先端の性能を示します。これはソフトウェアエンジニアリング専用に構築されたOpenAIのo3モデルのファインチューニング版であるCodex 1で動作します。
完全にクラウドベースなので、強力なローカルハードウェアがなくても多数のタスクを同時に実行できます。Codexで実際に作業することがどのようなものかを理解していただくために、彼らのライブストリームから短いクリップをご紹介します。
私はその環境を使用します。そして、どのリポジトリでも始めるのに良いと私たちが信じている3つのタスクが表示されます。最初のものはaskタスクで、コードエージェントCodexに新参者にコードベースを説明するよう求めます。一般的な構造を説明するのです。2番目はコードタスクで、リポジトリのどこかでバグを見つけて修正するよう求めます。皆さんご存知の通り、ほとんどのリポジトリにはバグがあります。Codexエージェントが見つけられるか見てみましょう。それでは開始しましょう。
今、3つのCodexエージェントがバックグラウンドでこれらのタスクに同時に取り組んでいます。そして私がやろうとしているのは、私のお気に入りの一つである、できるだけ多くのタイポや文法ミスを見つけて修正することです。これは重要ではないと思います。私の指示にタイポがあることも理解するかどうか見てみましょう。
そして、ここでライブ配信をする前にタスクをスケジュールしました。Codexエージェントにとても興味深いことを尋ねました。私の目標の一つについて尋ねました。私のコードベースを保守可能でバグのないものにしたいと言いました。コードを読み通して、この目標に役立つタスクを提案してください。そしてto-doを過度に強調しないでください。
to-doはコードベースのどこにでもあります。それらについては私も知っています。私は新しいことが欲しいのです。そしてCodexエージェントはコードベースを調べて、その小さな環境でお見せするように複数のことを発見しました。見てみましょう。ここの一つは、可変デフォルトを引数として持っているように見えます。
Codexにそれを修正してもらいましょう。間違いなく修正しましょう。それをスケジュールしましょう。こんな感じでお分かりいただけると思います。OpenAIが近い将来これをもっとインタラクティブにする計画があることも付け加えておきます。彼らはCursorのようなライブコーディング環境により近いものに移行しており、単にエージェントがすべてを独自に行うのを見るのではなく、実際にエージェントと一緒にコードを書くようになります。
そして最近のマルチエージェント開発者ワークフローを構築する会社Windsurfの30億ドルでの買収により、これがどこに向かっているかは非常に明確です。つまり、私たちが知っているコーディングは完全に変わろうとしています。私たちはすでにStack Overflowの使用量が史上最低になっているのを見ており、より多くのAI企業が独自版のCodexを展開するにつれて、それは加速するだけでしょう。
実際、GoogleがGoogleI/Oイベントで独自のコーディングエージェントを発表する予定だという噂がすでにあります。このロイター記事によると、Googleは年次開発者会議に先立って、ソフトウェア開発用のAIエージェントを含むさまざまな製品を従業員や外部開発者にデモンストレーションしています。
このエージェントは、タスクへの対応からコードの文書化まで、ソフトウェアプロセスのあらゆる段階でソフトウェアエンジニアを支援することを意図しています。間違いなくこのイベントに興奮しています。あと数日しかありません。5月20日か21日に開催されると思います。それにご注目ください。
そしてもちろん、ハイライトをすべてカバーした動画を投稿します。しかし、私たちが文字通り今生きているこのAIコーディング革命についてもっと語ると、大規模な労働力の破綻の初期兆候が見え始めています。Microsoftは全従業員の3%を解雇したばかりで、影響を受けた仕事の大部分はソフトウェア開発に関連しています。
そして人事管理協会の新しい報告書では、ほぼ2000万の仕事がAIに置き換えられるために削減対象になっていることが分かりました。より具体的には、ブルーカラーサービス及び管理職が最も高いリスクにあると述べています。つまり、AIをしばらく追っている方にとって、これはおそらく驚くことではないでしょう。
私たちはすでに何が来るかを知っており、AI企業もそれを知っているからこそ、これらの解雇がシリコンバレーで始まっているのです。しかし数年後には、これはあらゆる業界の至る所で起こるでしょう。最近では新しい教皇でさえ、AIは人類が直面する最大の挑戦の一つを表すと述べ、人間の尊厳、正義、労働への影響について警告しています。
そしてこれらすべてが展開している間、雇用削減、自動化、実存的警告、トップのAIプレイヤーたちはより一層力を入れています。今週だけでも、OpenAI、Nvidia、その他の主要テクノロジー企業がアラブ首長国連邦での注目のサミットに参加しました。結果は、この地域を世界的なAIパワーハウスに変革することを目的とした、総額6000億ドルを超える画期的な取引の数々でした。
NvidiaのCEOジェンセン・ファンは、年間最大50万個のトップティアAIチップをUAEに出荷することを確認しました。これは地球上で最大のデータセンターのいくつかに電力を供給するのに十分です。一方、サム・アルトマンはProject Stargate、世界が見たことのない最も強力なAI訓練施設の一つを建設する5000億ドルのイニシアチブを拡大するためにUAEと提携しています。
つまり、誰もがこれに参加したがっています。そして今週明らかになったことがあるとすれば、それは減速がないということです。今ではありません、近い将来もありません。さて、話題を変えて、ヒューマノイドロボティクスの世界では、イーロン・マスクがTeslaのOptimusロボットがダンスをしているこの新しいクリップを投稿しました。これは非常に印象的です。
はい、非常に短いクリップですが、ここでの動きは信じられないほど流動的で、これは全く早送りされていません。マスクは実際にこれがリアルタイムだと述べています。今週、中国の深圳の工場でヒューマノイドロボットが働いているこのクリップも浮上しました。ここで彼らがクレートを何らかのコンベアベルトに運搬しているのを見ることができます。
これは単なるデモンストレーションで完全に稼働している工場ではないと思いますが、それでも、来るべきもののちらっとした見え方のような感じです。彼らがいかに遅いかについてのコメントもいくつか見ました。そして確かに、彼らは非常に遅いです。しかし考えてみると、実際には人間より速い必要はありません。理論的には彼らは休憩も病気休暇もなく24時間年中無休で働けるので、残業することで速度の不足を簡単に補うことができます。
そしてこれらのクリップがまだ少し早過ぎると感じたり、一部の人にはぎこちなく感じられたりするかもしれませんが、GoogleのCEOスンダー・ピチャイは最近、すべてを展望に入れる何かを言いました。彼はロボティクスにとってのChatGPTの瞬間から2〜3年離れているだけだと信じており、Googleがこの分野でより多くの発表を非常に間もなく行うと述べています。これをチェックしてください。
ロボティクスについては、私たちは今、パートナーとなるか、実際に製品を発売するかを考えています。あなたの言うとおり、私たちは応用層を早過ぎに試しました。ロボティクスがAIによってそれほど影響を受けていなかった時代ですが、今ではAIとロボティクスの組み合わせが本当に次のスイートスポットを与えています。そして私たちはそこで計画を立てています。今日共有することはありませんが、この分野でより多くの発表を行うのをご覧いただけるでしょうが、私たちは間違いなく基礎的に
基盤となるモデルを推進しており、そこで最先端のモデルを構築しています。私たちはパートナーと協力してテストしています。ヒューマノイドロボットなどの進歩を見ると、過去には、これらは明らかにぎこちないのが分かるだろうと言っていましたが、今は5秒間時間を取って、じっくりと見て、これは偽物か実際のロボットがやっているのかと言わなければなりません。もう私はその瞬間にいるのです。そして現場で進歩が進行中なのを見ることができます
おそらく私たちはロボティクスでもその魔法の瞬間から2〜3年離れているだけだと思います。それが次のエキサイティングな段階です。私は実際にスンダーのこの見解に同意します。ロボティクスにとってのChatGPTの瞬間がどのようなものかは正確には分かりませんが、物事が進んでいるペースでは、それは避けられないと感じます。
最近のヒューマノイドロボティクスの進歩のペースは単に狂気的です。スンダーの見解に同意するかお聞かせください。そしてこのようなクリップに興味がある方は、私のXページをチェックしてください。AIハイライトをほぼ毎日投稿し始めており、皆さんにそこでお会いできることを楽しみにしています。一方、他のAIニュースでは、OpenAIは現在、新しい資金調達と将来のIPOの可能性についてMicrosoftと交渉中です。
まだ詳細は多くありませんが、OpenAIの最近の公益法人への再編が、そもそもIPOを可能にするものです。つまり、私たちは間もなくOpenAIの株を購入できるようになるかもしれず、それは驚異的なはずです。OpenAIについて言えば、彼らは患者の質問への回答や臨床決定の作成など、実世界の医療タスクでAIモデルがどの程度の性能を発揮するかを評価するよう設計されたHealthbenchと呼ばれる全く新しいベンチマークも発表しました。
これは基本的に、AIが実際にヘルスケアで有用かどうかをテストするための新しい金字塔です。単に試験に合格するだけでなく、実際の診療で医師を助けることです。現在、o3が最高性能のモデルのようで、Claude 3.7 SonnetとGemini 2.5 Proの両方を上回っています。OpenAIはまた、彼らのトップモデルがHealthbenchで過去数ヶ月間で28%改善したと述べており、これはかなり狂気的です。
さて、今週OpenAIからいくつかの他の小さな発表がありました。人気の要求により、開発者専用に設計されたモデルであるGPT-4oが、ChatGPTで利用可能になりました。深い研究レポートを、表、画像、リンクされた引用文、ソースを含む完全なPDFとしてエクスポートできるようになりました。そしてサム・アルトマンは、私たちが間もなく見ることができる控えめな研究プレビューを予告しました。
正直なところ、これが何なのか全く分かりませんが、皆さんに何か推測があれば、ぜひ下にコメントしてください。最後に、今週の要約を締めくくるために、私たちが話さねばならないもう一つのことがありました。Enigma Labsと呼ばれる会社が、世界初のマルチプレイヤーAI生成ビデオゲームを紹介しました。それはMultiverseと呼ばれ、基本的にはリアルタイムで対話し、形作ることができる2プレイヤーレーシングゲームです。
これはかなり驚異的です。そして中国の工場で働いているロボットのように、これは未来への一瞥のように感じます。つまり、これがすべてどこに向かっているかを考えてみてください。特にAIコーディングの台頭により、最終的にはコーディング方法を知らなくても数分で完全なビデオゲームを生み出すことができるようになり、ゲームは実際にマルチプレイヤーにもなり、リアルタイムで他の人間とプレイできるようになるかもしれません。
これはビデオゲーム業界を完全に破綻させるでしょう。そして正直なところ、そろそろ時期です。最大のゲームを運営するこれらの大企業は非常に略奪的になっており、かなり狂気的です。とにかく、今日はここまでです。ご視聴いただき本当にありがとうございました。動画を楽しんでいただけたら、ぜひいいねを押してください。