
6,545 文字

Googleが最新のAIモデル「Gemini 2.5 Pro」をリリースし、ベンチマークで圧倒的な成績を収めています。一方、OpenAIはGPT-4oにネイティブ画像生成機能を搭載してインターネットを再び騒がせました。さらに、OpenAIのO3 miniが元のARC-AGIテストで85%のスコアを達成した後、より難しく設計された第2バージョン「ARC-AGI-2」がリリースされました。詳しく見ていきましょう。
今週のGemini 2.5 Proのリリースは、OpenAIの新しい画像生成機能によってやや影が薄くなっていますが、このモデルは実際にとても印象的です。特に推論とコーディングに関する複数のベンチマークでトップに立っています。具体的には「Humanity’s Last Exam」で18.8%、PhD レベルの科学的質問である「GP QA」で84%、高度な数学の問題である「AMY」で86.7%のスコアを獲得しています。
他のベンチマークのスコアもありますが、すべては説明しませんが、基本的には多くのカテゴリーで最先端レベルか、それ以上の成績を収めています。視覚的推論ベンチマークの「MMU」で81.7%、「U-bench」で63%、そして興味深いことに長文脈検索タスクをテストする「MRCR」ベンチマークで83.1%を記録しています。これは、巨大な文書内に埋もれた関連情報をいかに上手く見つけられるかをテストするベンチマークです。Gemini 2.5 Proは100万トークンのコンテキストウィンドウのスコアを持つ唯一のモデルであることに注目してください。他のどのモデルもこれほど大きなコンテキストウィンドウサイズを提供していないため、これは大きなアドバンテージです。
また、モデル同士を対決させるチャットボットアリーナである「LM Arena」でも1位でデビューし、現在もGrok 3やGPT-4.5を大きくリードしています。全体的に見て、このモデルは既存のものからの劇的な改善ではありませんが、ほとんどのユースケース、特に高度な推論を必要とするものに対して現在利用可能な最良の選択肢であることは間違いありません。先ほど見たLM Arenaのリーダーボードに基づくと、少なくとも今のところ、人々は他のどのモデルよりもこれを好んでいるようです。
このモデルに関してよく耳にするもう一つのことは、その驚異的なコーディング能力です。Googleによれば、視覚的に魅力的なWebアプリ、エージェントコードアプリケーション、さらにはコード変換や編集にも優れているとのことです。私自身はまだこれらをすべてテストできていませんが、もしこれらのモデルをコーディングに使用しているなら、あなたの経験をぜひコメントで教えてください。
OpenAIの新しい画像生成リリースについては既に詳細なビデオを作成しましたが、まだ見ていない方のために簡単に説明しますと、GPT-4oは現在ネイティブの画像生成機能を持っています。これは画像生成をリクエストすると、DALLEのような別の画像生成モデルにリクエストを送信するのではなく、実際にモデル自体が画像を作成するということです。これにより、モデルは会話のコンテキストをより活用し、あなたが実際に何を求めているかをより理解できるようになります。
このモデルはまた、はるかに正確で詳細であり、正直に言って素晴らしい画像を生成します。背景で再生されているデモからわかるように、モデルは詳細な指示に非常によく従い、この男性が求めたものをほぼ正確に生成しています。別のデモでは、そのテキストレンダリング能力がいかに素晴らしいかも見ることができます。画像内にテキストを正確に配置する能力は次元が違い、教育目的や潜在的にはマーケティングや広告にも使用できるようなグラフィックを作成することができます。
何らかの理由で、GPT-4oのネイティブ画像生成は、これらの見事なジブリスタイルのアニメ画像を作成する能力でバイラルになりました。確かにそれらはクールです。自分の写真をジブリキャラクターに変換しなかったと言えば嘘になりますが、人々はやや要点を見逃していると思います。このモデルを特別にしているのは、その画像生成がネイティブであるということです。つまり、言語モデル自体であるGPT-4oが実際に画像を生成しており、単にプロンプトを別のシステムに渡しているわけではないのです。
この分野の著名人であるイーサン・モロックもこのことを指摘しています。彼は「この数日間のAIにおける真のマルチモーダル画像生成の意味を明確に理解している人はほとんどいないと確信している。アニメプロフィールよりもはるかに大きな意味を持つ」と述べています。もちろん、彼はGemini 2.5についても言及し、モデルがまだまだ改善される可能性があること、そして前回のビデオで取り上げた新しいGPT-4の音声機能についても触れています。
彼は別の投稿でさらに詳しく解説し、「マルチモーダル画像生成は、我々がまだ理解していない方法で、経済的・文化的に意味のある多くの仕事に実際に影響を与えるだろう。それは非常に柔軟で多くの用途に関連し、一度に優れたものになった。まだ欠点はあるが、能力の向上は非常に急速に見える」と述べています。
みなさんはどう思いますか?これはグラフィックデザイナー、イラストレーター、さらには広告代理店にとって終わりの始まりでしょうか?多くのこうした仕事がモデル自体によって完全に処理できるようになるように思われます。モロックが指摘したようにまだ欠点はありますが、改善のペースは驚異的です。
今週はもう一つの画像生成モデルもリリースされましたが、これはOpenAIの発表に完全に埋もれてしまいました。それは「Rev」という全く新しい会社からのもので、「Rev Image 1.0」をリリースしました。彼らのモデルは正直なところかなり印象的で、Flux、Reecraft、ImageDenなどの現在の最先端画像生成器と同等のレベルにあるように見えます。新興企業がこのようなレベルで登場してくるのは間違いなく非常に印象的です。もしOpenAIが今週ネイティブ画像生成をリリースしていなければ、これは間違いなくもっと注目を集めていたでしょう。とはいえ、これはネイティブ画像生成ではないためGPT-4oができることには及びませんが、それでも画像生成の分野がいかに急速に進化しているかを示しています。
他のAIニュースでは、Appleがついにそのゲームを本格的に展開し始めています。彼らは報告によると、10億ドル相当のNVIDIAのGPUを注文したばかりです。これは彼らがAI部門の責任者を解雇し、AppleVision Proの立役者と言われているMike Rockwellに交代させてからわずか数日後のことです。そう、AIレースで深刻に遅れをとっているAppleがついに動き始めたのです。10億ドルのGPU注文は何か大きなことが来ることを示す重要な信号なので、彼らの動向を引き続き注視していきます。
GPUと言えば、NVIDIAの市場シェアが深刻な課題に直面している可能性があります。新しいBloombergのレポートによると、ジャック・マーが支援するAntグループは中国製の半導体を使用してAIモデルをトレーニングし始め、その結果は印象的です。記事によると「ジャック・マーが支援するAntグループは、中国製半導体を使用してAIモデルのトレーニングコストを20%削減する技術を開発しました」と述べられています。これらのチップはNVIDIAのH800と同様の結果を提供するようです。AntはまだAI開発にNVIDIAを使用していますが、最新モデルでは中国のローカルチップへの依存度を高めつつあります。
NVIDIAが市場で最高のパフォーマンスを持つチップを提供しているのは明らかですが、これは間違いなく懸念材料です。もし中国が米国の輸出規制を回避し、同時にコストを削減する競争力のあるチップを構築できれば、状況は大きく変わります。中国はもはやAIハードウェアを米国に依存する必要がなくなり、独立してAIの取り組みを拡大できるようになります。これは中国にとっては素晴らしいことですが、グローバルAIレースで優位性を維持するためにリードに賭けている米国にとっては良いニュースではありません。
私たちが知っているように、このリードは既に縮小しつつあり、中国はAIの全ての面で追いつき始めています。前回のビデオで取り上げたDeep Seek V3のアップデートはかなり大規模なものでした。Artificial Analysisによれば、これはオープンウェイトモデルが非推論モデルとして最高のランクを獲得した史上初のケースです。これはオープンソースAIにとって大きなマイルストーンであり、クローズドソースとオープンソースのAIの間のギャップが縮まっているだけでなく、このグローバルAIレースにおける中国と米国の間のギャップも縮まっていることが明らかです。
次に新しいARC-AGIチャレンジについて話さなければなりません。ARC-AGIチャレンジは、モデルが人間のような推論と一般的な知能を持っているかどうかをテストするために設計されています。これは抽象化と推論タスクに基づいており、暗記やトレーニングデータに依存するのではなく、人間と同様の方法でパターンを識別し、ルールを推測し、パズルを解決する能力を必要とします。
元のARC-AGIチャレンジと同様に、人間のベースラインは85%であり、ルールに従いながらそれ以上のスコアを獲得したモデルは70万ドルの賞金を受け取ります。さらに重要なことに、それは実際のAGIへの大きな一歩となるでしょう。イントロで述べたように、OpenAIのO3 Miniモデルは高計算モードで最初のARC-AGIチャレンジで88%のスコアを獲得しました。明らかにO3 miniはAGIではないため、彼らは新しいものを作ることにしました。
ここでARC-AGI 2の登場です。これはAI推論システムに挑戦する新しいフロンティアAGIベンチマークであり、人間にとっては比較的簡単です。このテストは非常に難しいにもかかわらず(ベースLMのスコアは0%で、現在の最先端推論モデルでさえ4%を超えていません)、人間はまだ比較的容易にこれを行うことができます。また、各タスクのコストが42セント以下であるべきという計算制限も新たに設けられました。
現在のリーダーボードでは、O3が5%未満のスコアでリードしています。このテストで100%のスコアを獲得した人間がいることを考えると、今日のモデルにはまだ何か根本的なものが欠けていることは明らかです。それがまさにこのチャレンジの目的です。これらのベンチマークが一晩のうちに不可能に思えるものから完全に飽和したものに変わる可能性があることを私たちは学んでいるので、間違いなく注目し続けるでしょう。
取り上げるべきストーリーはまだいくつかありますが、その前にPerplexityのCEOであるアラバン・サス氏がAIによる将来の雇用の置き換えについて語っているこのクリップを再生したいと思います。これはほとんどのAI企業のCEOが語らないこと、あるいは語っても、AIが創出する雇用について肯定的に話すことが多いトピックです。しかし、このクリップでは初めて率直な意見を聞けるような気がします。見てみましょう。
「残念ながら短期的には多くの労働力の置き換えが起こるというのがディストピア的な部分です。仕事をこなすのに必要な人が少なくなります。ですから人々がどのようにスキルを向上させ、適応するか、AIを使用している人々は間違いなく有利な立場にあるでしょう。そういったことが起こり、人々がどう反応するかですが、もはや1兆ドル企業になるために1万人の企業を作る必要はありません。次世代の卒業生はどこで仕事を得るのでしょうか。既存の大手テック企業は人員を削減したり、あまり採用していなかったりします。これらのことはすべて間違いなく市場に影響を与えるでしょう。新しい価値を創造し、ソフトウェア作成を容易にする一方で、既存の労働力や価値も置き換えているというのは非常に興味深いことです。人々がこれにどう対処するかを見るのは興味深いでしょうし、どのように展開していくか本当に誰も知らないと思います。」
はい、短期的にはかなり困難な時期が待っていると思います。多くの人々は今後起こることに対して準備ができていません。しかし責めることはできません。文字通りすべての主要産業を破壊するようなものに対して準備するのは難しいものです。さらにAIを搭載したヒューマノイドロボットについても心配しなければなりません。これは最近、猛烈なスピードで動いている分野です。
最近、フィギュア・ロボティクスが最新のブレークスルーを発表しました。たった数時間で自然な歩行を学習したのです。ロボットはシミュレーションを通じて何年もの歩行を学び、ご覧のように、そのモーションは以前よりもずっと自然で人間らしくなっています。これはフィギュアが今年発表した多くのブレークスルーの一つにすぎません。私のチャンネルを見ている方ならご存知のように、私はヒューマノイドロボティクスにとても強気です。これらのロボットが人々の家の中に入り、実際に役立つタスクを実行するようになるまであと数年しかかからないと本気で信じています。これと、AIが知識労働を破壊することが組み合わさると、今後数年で対処しなければならない大きな問題となるでしょう。
最後にビデオを締めくくるために、「エージェントアーカイブ」と題された新しい論文について簡単に話したいと思います。この論文は基本的に、自律型研究エージェントがお互いの研究をアップロード、取得、そして構築できるフレームワークを提示しています。彼らが述べているように「科学的発見の進歩は単一のユーレカ瞬間の結果であることはほとんどなく、むしろ何百人もの科学者が共通の目標に向かって段階的に協力して生まれる製品です。既存のエージェントワークフローは自律的に研究を生み出すことができますが、それらは孤立して行われ、継続的な科学的進歩を生み出す能力がありません。」これに対処するために、彼らは「エージェントアーカイブ」を導入しました。これは基本的に、これらのエージェントが人間と同じように協力し、お互いの研究を構築することを可能にするものです。
論文の詳細には立ち入りませんが、何が起きているのかを皆さんに示したかったのです。なぜなら、世界中のAIエージェントが協力して科学研究を行うという考えは本当に驚異的だからです。これは先ほどの労働力の置き換えに関する会話に戻ります。もはや反復的な仕事や低スキルの仕事をAIが置き換えるだけではなく、高度な認知作業についても話しているのです。
正直なところ、それは最初は怖く聞こえるかもしれませんが、必ずしも悪いことではありません。科学的発見を大幅に加速させることができ、それらの発見が責任を持って使用され、すべての人の利益のために共有される限り、これは人類にとって大きな進歩となり得ます。未知の問題の解決、革命的な治療法の開発、宇宙への理解の増進など、AIの将来の可能性についてこれまで聞いたことのあるものすべての話です。これがうまくいけば、世界を変えるだけでなく、私たちが想像もしなかった方法で世界を理解するのに役立つでしょう。
とにかく、今日のAIニュースはこれで以上です。視聴していただきありがとうございます。この動画を楽しんでいただけたなら、ぜひいいねを押してください。そして、いつものように、このような将来のAIニュースについて最新情報を得たい場合は、ぜひ購読ボタンを押してください。


コメント