Google、進化し続ける新しい形の知能を発表

AGIに仕事を奪われたい
この記事は約10分で読めます。

5,729 文字

Google Just Introduced NEW FORM of Intelligence (Evolving Nonstop)
Google’s new AI system, AlphaEvolve, is evolving its own algorithms, outperforming human-written code, and optimizing ev...

全く新しいものがGoogle DeepMindから登場しました。彼らはAlpha Evolveという新しいAIシステムを発表したのです。誇張ではなく、このシステムは自ら独自にアルゴリズムを進化させています。一般的なLLMのようにコードを生成するだけでなく、人間が書いたものよりも優れた全く新しいアルゴリズムを発明するエージェントなのです。
そしてすでにGoogleのコンピューティングリソースで何百万ドルもの節約を実現しています。これは非常に重要な進歩です。では何が起きているのでしょうか。Alpha EvolveはGeminiの言語モデルと進化システムを組み合わせています。基本的に、LLMの創造的な強みを活用して新しい解決策を提案し、それらの解決策を自動評価システムで実行します。
弱いものは捨てられ、有望なものは改良され、このループは最良のアルゴリズムが生まれるまで続きます。コードのための「適者生存」と考えてください。Googleはこれを単に研究室でテストしているわけではありません。1年以上にわたり、Alpha Evolveを自社のインフラ全体でライブ運用しています。
すでにBorgなどのシステムに組み込まれており、これはGoogleの巨大なデータセンタースケジューリングプラットフォームです。Alpha Evolveのアルゴリズムの1つだけで、常時グローバルコンピューティングリソースの平均0.7%を回復することに成功しています。小さな数字に聞こえるかもしれませんが、Googleの規模では膨大なものです。
これは効率化による何百万ドルもの利益です。さらに驚くべきことは、Alpha Evolveが問題にアプローチする方法です。従来のAIコーディングツールの多くは、短いコードスニペットの作成や小さな関数の修正に焦点を当てています。しかしAlpha Evolveは、何百行ものコードを持つ、深く複雑な論理構造を持つ完全なプログラムを進化させています。
これはオートコンプリートの領域をはるかに超えています。このシステムは実際のコンピューティングインフラを設計しているのです。これまでの最大の成果の一つは、Gemini自体に対して行ったことでしょう。Alpha EvolveはGeminiモデルのトレーニングに使用される重要なカーネル、特に行列乗算操作を最適化しました。その変更だけで、その操作の速度が23%向上しました。
そしてそれがコアトレーニングパイプラインの一部であるため、全体のトレーニング時間が1%短縮されました。1%は革命的に聞こえないかもしれませんが、これらのモデルを大規模クラスタで数日間または数週間トレーニングするとき、それは大きな違いです。時間、お金、そしてエネルギーの節約です。そしてそのすべてが、AIを訓練するシステムをAIが最適化したことから生まれました。それだけではありません。
また、GoogleのカスタムTensor Processing Units(TPUs)で使用される演算回路のより良い構成も見つけました。基本的に、すでに高度に最適化されていたハードウェア設計から不要なビットを削除したのです。提案された変更は検証をパスし、エンジニアに承認され、現在は次期TPU設計の一部となっています。考えてみてください。
AIはハードウェアレベルのコードの変更を提案しただけでなく、実際にチップ設計者が使用する言語であるVerilogでそれを行いました。つまり、私たちは今、AIと人間のエンジニアが同じ技術レベルでコラボレーションする新時代に入っています。また、結果が人間にとって非常に親しみやすいということも素晴らしいことです。Alpha Evolveは、難解で読みにくいスパゲッティコードを吐き出すわけではありません。
それが発見するアルゴリズムは、クリーンで解釈しやすく、デバッグや展開が容易です。これにより、エンジニアはAIが意図したものを解読するのに何週間も費やすのではなく、結果を実際に扱いやすくなります。さて、ここからさらに驚くべきことになります。Alpha Evolveは、50年以上も破られなかった数学的記録を破りました。
1969年、数学者のフォルカー・シュトラッセンは、4×4行列を49のスカラー乗算で掛け合わせるアルゴリズムを考案しました。Alpha Evolveが登場するまで、誰もそれを破ることができませんでした。これは、わずか48のスカラー乗算でそれを行う新しい方法を見つけました。これは、複素数値の4×4行列に関するシュトラッセンの記録が初めて破られたケースであり、半世紀以上も立ちはだかっていた数学の壁がGemini搭載のAIコーディングエージェントによって破られたのです。
これは単に楽しみのために記録を破ることではありません。行列乗算は、コンピュータグラフィックスから機械学習まで、あらゆるものにおける基本的な操作です。文字通り毎日何兆回も行われています。したがって、どんなに小さな改善でも、無数のシステムに波及効果をもたらします。
公平に言うと、Alpha Evolveはこれを一度で達成したわけではありません。その4×4行列問題に対して、16,000の異なるアルゴリズム候補を生成し評価しました。しかし、これがその美しさです。ランダムに推測しているわけではなく、進化論理を適用しているのです。何かを試し、それが機能するかどうかを確認し、調整し、最良の解決策が生まれるまで何度も繰り返します。
これがAlpha TensorやAlpha Devを思い出させるなら、それは偶然ではありません。それらはDeepMindによる初期のプロジェクトで、基本的な計算を改善しようとするものでした。Alpha Tensorも行列乗算に焦点を当てていましたが、バイナリ入力のみでした。Alpha Devは、ソートやハッシュなどのコンピュータ操作を最適化しました。
Alpha Evolveが行うことは、さらに一歩進んでいます。プロセス全体を一般化しているのです。一種類の問題のためだけに構築されていません。問題がコードで記述され、自動的に評価できるならば、Alpha Evolveはそれを解決しようとすることができます。実際、DeepMindは数論から幾何学、フーリエ解析まで、50以上の異なる数学問題でテストしました。
そして驚くべきことに、約75%の時間で既知の最良の人間作成の解決策と一致し、約20%の問題では、それらの既存の解決策を実際に改善しました。これにはキッシングナンバー問題も含まれており、これはニュートンにまでさかのぼる古代の幾何学的課題です。目標は、他の中央の球体に重なることなく、同時に触れることができる球体の数を把握することです。
11次元では、以前の記録は592でした。Alpha Evolveは593に達する新しい構成を発見しました。1つ余分な球体は画期的に聞こえないかもしれませんが、数学的には大きな飛躍です。では、Alpha Evolveが実際にどのように動作するのか、もう少し詳しく見てみましょう。
システム全体は、GoogleのGemini言語モデルの主要な2つのバージョン、Gemini FlashとGemini Proを中心に構築されています。Flashは高速なもので、軽量で超高速、大規模なアイデア生成に優れています。わずか数分で何千ものコードスニペットを生成できます。新しい問題に取り組む際の最初の攻撃ラインです。
そして、Gemini Proがあります。これはより重く、遅いですが、深さ、ニュアンス、より複雑な論理を理解する点でははるかに優れています。通常、次のようなことが起こります。Alpha Evolveはプロンプトから始まります。そのプロンプトには、問題の完全な説明、うまくいかなかった以前のアルゴリズム、あるいは私たちが目指している解決策の種類についてのヒントが含まれるかもしれません。
次に、そのプロンプトをGemini Flashに送信します。Flashは大胆に、何百、あるいは何千もの小さなプログラムやアルゴリズムのバリエーションを生成します。行列乗算タスクで行ったように、1つの問題に対して最大16,000の候補を生成することもあります。これらの候補それぞれが自動的に評価されます。これが重要なポイントです。
Alpha Evolveは何が機能しているかを確認するために人間のレビューに依存していません。実行時間、メモリ使用量、正確さ、実際に問題を解決するかどうかなどを調べるカスタム評価ツールのセットを使用します。すべてのプログラムはこれらの指標に基づいてスコア付けされます。
例えば、2つの行列を掛け合わせるプログラムがあるとします。評価ツールは、それが正しい出力を生成するか、現在の最良の方法よりも高速に実行するか、より少ないスカラー乗算を使用するかをチェックします。すべてのボックスにチェックが入れば、高いスコアを獲得します。失敗やクラッシュすれば、それは捨てられます。ここで進化の部分が始まります。
Alpha Evolveは最もパフォーマンスの高い候補、たとえば上位1%を選び、それらを次世代の親として使用します。それらをシステムに戻し、Gemini Flashはそれらに基づいて新しいバリエーションを構築します。ループが再び実行されます。新しいコードが生成され、テストされ、スコア付けされ、進化します。これはアルゴリズムのための自然選択のようなものです。
そして、新しい世代がもう改善されないという停滞が始まると、Alpha Evolveにはバックアッププランがあります。行き詰まりを避けるために、以前のラウンドから古い候補を投入して状況を一新することができます。これにより、モデルが悪い解決策パスに過適合するのを防ぎます。
すべてがうまくいかない場合、そこでGemini Proが登場します。より強力で、より難しい論理を通じて推論できるため、Flashがアイデアを出し尽くしたときに専門家として慎重に使用されます。ProはFlashが見逃す可能性のある全く新しい戦略を追加でき、それが有望なものを生成すると、サイクルは再び続きます。
この全プロセスは、1回の実行で数十回、さらには数百回の世代を経ることができます。そして、これらの自動評価ツールのおかげで、Alpha Evolveはパフォーマンスベンチマーク、エネルギー使用量、計算速度、数学的精度など、フィードバックが即座に測定可能な問題を処理できます。システム全体は高速動作するように設計されています。
かつては専門エンジニアが試行錯誤に何週間もかかっていたことが、今や自動反復のわずか数日で行えるようになりました。そして人間のチームとは異なり、Alpha Evolveは決して疲れることなく、集中力を失うことなく、ほとんどの開発者が試そうとも思わないような何千もの変種を探索することができます。だからこれは単にコードを生成しているのではありません。
これは何十年も前の人間の解決策を上回る全く新しいアルゴリズムを発見しているのです。すべて、この大規模な進化サイクルを通じて、改善の余地が文字通りなくなるまで、ラウンドごとに勝者をスコアリングして選択することで行われています。実際にコードを進化させているのです。そしてこれらすべてが自動評価による閉ループフィードバックで行われています。これが重要です。
システムは各結果をすぐに検証できる必要があります。だからこそ、データセンターの効率や数学的精度など、明確な客観的指標を持つ問題でうまく機能するのです。そして、すでにデータセンター、チップ設計、LLMトレーニングで波紋を広げていますが、これはほんの始まりに過ぎません。
Googleは、材料科学、持続可能性、さらには創薬などの分野にAlpha Evolveを拡大する計画だと言っています。アルゴリズムの複雑さと測定可能な結果を含むあらゆる分野が対象となっています。DeepMindは現在、人間+AI研究チームとユーザーインターフェースを開発中で、学術研究者向けの早期アクセスプログラムがすぐに始まります。
また、将来的にAlpha Evolveをより広く利用できるよう検討しています。ただし、すべてが完璧というわけではありません。1つの制限は、Alpha Evolveが研究室の実験結果の解釈やクリエイティブライティングのタスクなど、結果を主観的に判断する必要がある問題には使用できないことです。解決策を自動的にスコアリングできる問題が必要です。
また、画期的な結果を生み出すものの、そこに至った方法について理論的な洞察を常に提供するわけではありません。そのため、解決策の背後にある「なぜ」を深く理解しようとしている場合、まだ暗闇の中にいるかもしれません。しかし、実際の影響は否定できません。アルゴリズム発見の方法を再形成しています。
手作業で解決策を作成する代わりに、研究者は今や異なる種類の創造性、人間が単純に匹敵できない徹底的に反復的で疲れを知らない探索形式をもたらすAIコラボレーターと協力することができます。つまり、言語モデルが進化するにつれて、Alpha Evolveはそれとともに強くなっていきます。そして、すでに見ている内容に基づくと、これはほんの始まりに過ぎません。
2025年半ばのAIコーディングエージェントがこの段階であるなら、今後数年はとても興味深いものになるでしょう。さて、大きな疑問は、地球上で最も賢いアルゴリズムが人間ではなく、静かに進化する機械によって書かれるようになったとき、何が起こるのでしょうか?ビデオにいいね!を押して、まだサブスクライブしていない方はぜひサブスクライブしてください。コメント欄で皆さんの考えを教えてください。
ご視聴ありがとうございました。また次回お会いしましょう。

コメント

タイトルとURLをコピーしました