重要なAIニュース：OpenAIが全員を驚かせる、超知性が接近、ベンチマークが破られる…その他

14,618 文字

BIG AI News : OpenAI Surprises Everyone, Superintelligence approaches, Benchmarks Crushed...And More

Join my AI Academy - 🐤 Follow Me on Twitter 🌐 Checkout My website -

今週の最初のニュースの一つは、実はMicrosoftがコパイロットスイートでエージェントについて話し、リリースしたことです。製品間の違いを見るのは実に興味深いです。ご存知のように、OpenAIとMicrosoftには提携契約があり、彼らは実際にもコパイロット側で製品をリリースし続けています。Chat GPTを毎日使用している皆さんの多くはコパイロット側をあまり使用していないかもしれませんが、コパイロットを使用する人々やワークスペースにとっては実際に非常に大きな企業ユースケースがあります。
サティア・ナデラがこれをツイートしました。これをお見せしたいのは、近く多くの人が使うことになる主要なコパイロットのアップグレードがあるからです。また、これらのコパイロットの更新を理解する必要があると思います。なぜなら、コパイロットはネイティブにコンピュータに搭載され、常にコパイロットボタンがあるからです。AIとテクノロジーがどのように即座に融合されるかを見るのは興味深いでしょう。
研究者は今、これらの推論モデルを取り、ウェブだけでなく、私が説明した企業データ全体の豊かさに適用することができます。私たちはデータ分析についても同じことをしました。これは私にとって、私のお気に入りのツールの一つはExcelでしたが、今ではデータアナリストを作成するためにExcelを超えて進み、任意のデータを与えることができます。最も素晴らしいことは、2つのExcelスプレッドシートを与えて「分析して、すべての洞察を戻してください」と言えることです。
例えば、私が製品開発に携わっていて、新しい市場に参入するとします。そのため、拡大のための製品戦略を開発する手助けが必要です。プロンプトを入力すると、研究者はすぐに作業を開始します。一つのファイルだけでなく、私のすべての作業データを推論していることに気づくでしょう。この詳細な応答を見てください。これは私のチームの研究者に期待することと一致しています。そして今、この応答をページで編集し、チームを招いて共同作業することができます。
研究者で素晴らしい製品開発戦略ができたので、次はアナリストに移りましょう。アナリストは熟練したデータサイエンティストのように考えるように構築されているため、生データから数分で洞察を得ることができます。今、この非常に複雑で混乱したデータセットがあります。何千行もの行と顧客と月次収益を持つ複数のタブがあり、これらはクリーンにされたりコンテキスト化されたりしていません。通常、このデータを理解するためには、Pythonを知っているチームメンバーを呼ばなければなりませんが、アナリストエージェントを試してみましょう。簡単にコパイロットに、データを簡単に理解し、学び、視覚化する方法を考え出すのを手伝ってもらいます。そして、ここに私が探していた答えがあります。チームと共有する電気的なビジュアルも付いています。
ビデオのリーダーボードについても話すことが重要です。なぜなら、いくつかの非常に興味深い発展があったからです。ビデオ生成は相当難しいものだと思いますし、今後数年間で継続的に改善されるでしょう。興味深いことに、現在Clling 1.6 6 Proが実際に最高のモデルであり、西側の最先端技術さえも大幅に超えています。Google V2が971 ELOで355回の出現、PABSが934 ELO、そしてMinmaxやRunwayなどもあります。驚くべきことに、ビデオ生成においてSoraはここに下の方にいます。しかし前に言ったように、ビデオ生成とAIは決して止まりません。昨年のある時点でSoraがリリースされたことを覚えていますが、驚くべきことにこれらのシステムの一つが大きなアップデートを受け、それが本当にすべてを変えると思います。私も実際にこれを使うつもりです。
大きなアップグレードを受けた会社はRunwayでした。Runwayが導入したのは一貫したキャラクターでした。これが最も気に入っている理由は、一貫したキャラクターが良い映画の特徴の一つであり、物語に本当に没入できるものだからです。キャラクターが微妙に変化している場合、私たちが必要とするリアリズムを本当に与えてくれません。人間として、私たちはこれらの違いの微妙な点を拾い上げるように進化してきました。Runwayがここで実装したこの小さな変更は、新しい創造性の波を引き起こすと思います。なぜなら、以前であれば多くの作業が必要だったところ、短編映画や多くのインディペンデントプロジェクトが作成されるのを見ることになるでしょう。
一貫したキャラクターを導入しただけでなく、ここにあるオブジェクトの一貫性という機能も導入しました。前回のビデオでRunwayがどのように変化しているかについて話しましたが、オブジェクトの一貫性は再び非常に重要です。なぜなら、AIで生成されたビデオを見ているとき、オブジェクトが変化し、変形し、私たちが見慣れているものとは異なる多くのことをするからです。そして今、このオブジェクトの一貫性により、映画製作がより簡単で良くなります。
多くの人々は、Runwayがビデオ生成モデルの全体的な側面においてどこに位置するかを理解していないと思いますが、今や彼らの位置づけが明確になってきています。彼らは短編映画/大きな映画を生成するビデオジェネレーターとしての位置づけです。平均的な人によって使用されるというよりも、本物のマスターピースを作成しようとしている人々によって使用されることを意図していると思います。それが、製品がどのように宣伝されているかを見れば分かります。例えば、AIとVFXがどのように本質的に一つになっているかという彼らがリリースしたものを見ると、これは何らかの短編映画のように見えます。アニメーションビデオのようには見えません。ここで見るすべてのものは、よく考えられており、映画のような見た目を持っています。
ですから、将来的にRunwayが映画スタジオが使い始めるほど良いモデルを持つことになっても驚きません。そしてそれがその会社の大規模な応用になるでしょう。ここで見ることができるように、AIでVFXを追加する際にそれがいかに素晴らしいかを示しており、これは物事を真に変える何かになるでしょう。2、3日前にリリースされたばかりなので、今すぐに驚くべき変化を見ることはできませんが、前述したように、映画、短編映画、インディペンデントプロジェクトがより早いペースで制作されるようになると思います。これは本当に見るのが好きなことです。なぜなら、以前は何千ドルもの予算が必要で、スタジオで撮影し直すために多くの時間を費やさなければならなかったからです。
いくつかの短編映画を作ったことがありますが、見た目よりもはるかに時間がかかります。だからこれを本当に評価できます。このビデオで話したことの一つはAIとVFXについてでした。彼らがビジュアルエフェクトを現在のVFXと同じくらい良くすることができれば、使わないわけがありません。なぜなら、従来のVFXは信じられないほど高価で時間のかかるものだからです。多くの場合、映画の遅延が起こる理由はビジュアルエフェクトに時間がかかるからであり、これらのチームに何百万ドルも支払っています。さらに、すべてがどのように見えるかをレンダリングし計算するためだけに何百万ドルがかかります。
水のシミュレーション、火のシミュレーション、煙のシミュレーションなど、これらのことをレンダリングするには何時間もかかります。AIの推論が遅いと思うなら、CGIなどのコンピュータでは特定のプロジェクトのためにレンダリングするのに数日、数週間、数ヶ月待つことになります。レンダリングファーム、ワークステーション全体、オフィス全体、コンピュータの列が何列もあり、それらはレンダリングに専念しています。文字通りそれだけ時間がかかるからです。これはいくつかの本当にクールな意味を持つでしょう。
彼らだけがリリースされたビデオモデルではありませんでした。現在、ビデオ画像生成のリーダーボードには登場していませんが、現時点で最も過小評価されている画像ジェネレーターだと思うものがありました。私は実際にそれをかなり使うつもりです。
このモデルは現在Higsfieldと呼ばれており、ネイティブに異なるカメラアングルを提供するため、とても良いです。これはHigsfieldで作成されたコカコーラの広告で、とても良く見えます。映画製作の経験がない場合、さまざまなキャラクターズーム、カメラズーム、そしてキャラクターを配置するさまざまな方法に精通していないでしょう。キャラクターを創造的に使用するには百万の異なる方法がありますが、Higsfieldに移動すると、物事を変え、シーンの周りでカメラがどのように動くかを本当に探索することができます。
通常、画像をビデオジェネレーターに入れると、基本的にロシアンルーレットをプレイしているようなものです。なぜなら、シーンで何が起こるかについてそれほど制御がないからです。本質的に何かを入れて、プロンプトを入力し、「この子供がこの廊下を走る」と言います。時々うまくいき、時々うまくいきません。カメラが回り込むことを望んでもうまくいかないこともあります。しかしこれでは、実際に私の正直な意見では、特定のカメラショットに関しては、すべてのビデオモデルの中で最も優れています。回転させたい場合や特定のカメラアングルが必要な場合、それは本当によく機能します。これがとても良く機能することに驚いています。
次に別のことについて話しましょう。ビデオ生成についての話であれば、画像生成について見てみましょう。画像生成は驚くべきことに大きなアップグレードを受けました。このビデオのセクション全体は、AIの分野がいかに急速に動いているかを示すべきです。多くの人はAIでの1ヶ月が他の産業での6ヶ月や1年に相当することを認識していません。そして物事がいかに急速に変化しているかを見るのは驚くべきことです。
Reeve Imageという会社があり、彼らは本当にクールなものをリリースしました。彼らは画像生成モデルをリリースしました。3月31日にReeve Image Half Moonが10,000以上の登場で1,19以上のELOでArena ELOの第1位だったことがわかります。彼らは匿名の名前でこれを行っており、もちろんGPT40 Recraft 33やImagen 3さえも超えることができました。現時点で私のお気に入りのモデルはImagigenです。
これは3日前のことであり、このモデルを見ると、実際に超難しいリアルなシーンを作るのにとても優れています。個人的にいくつかの異なるプロジェクトでモデルを使用しましたが、このモデルはCGIや3Dアニメーション、そのような種類の画像にはあまり優れていないことに気づきました。むしろ、人間、動物、そして本当に超自然的に感じる印象的なポーズなどの現実の被写体に焦点を当てています。
これはティモシー・シャーレイの異なるヘッドショットを持つヴォーグの本で、このモデルがいかに優れているかを捉えるためにプロンプトした人にとって本当に興味深い方法です。これを見ても、これがAIで生成されたとはまったく考えないでしょう。文字通り手がかりはなく、彼らが本当に焦点を当てた重要なことの一つは、テキストを本当に完璧にすることでした。この画像では見えないかもしれませんが、右上にはTimothy Charméがサンローランのレザージャケットを着ているというテキストがあり、そのテキストは実際に完璧です。彼らがそのわずかなテキストをとても完璧に見せることができるという事実は、このモデルでテキストを本当に印象的にするために時間をかけたことを示しています。
これは、多くの人々がその時「わあ、これはすごい、これはクレイジーだ」と考えていたモデルでした。彼らのウェブサイトで無料のプレビューとして使用できるため、基本的に無料でした。もちろん、先ほど言ったようにAIは信じられないほど速く動きます。他の多くの分野よりもはるかに速く動きます。今日モデルをリリースしても、翌日にそのモデルが1位になるという保証はありません。実際にそれは、このモデルがリリースされてからわずか2日後に起こりました。
OpenAIは、素晴らしい新しい画像生成ツールで再び1位を獲得することを決めました。そしてReeve imageを追い落としたのはそれだけではなく、非常に印象的なRecraft V3もあり、GPT40もありました。広告クリエイティブ用の素晴らしいものが見られます。ここでは画像を生成し、このバッグをモデルに着せてパリに置くことができます。これがどれだけの時間を節約するか理解していないと思います。
例えば、あなたがイギリスの小さなブランドオーナーで、パリで写真撮影をしたいとします。フライトや移動を予約し、バッグを持っていき、モデルとして使用できる人を見つけ、シーンを設定し、ポーズについて考え、適切な時間であることを確認する必要があります。なぜなら、適切な時間でなければ照明が影響を受ける可能性があるからです。雨が降っていれば機能しませんし、雪が降っていても機能しませんし、猛暑でも機能しません。物事は正しくなければなりません。たくさんの異なる要素が絡み合いますが、今はその画像と一つのプロンプトを取るだけで、AIモデルとの素早いセッションでそのすべてを無効にすることができます。
私にとっては、何らかのビジネスを所有している場合、製品で非常にリアルに見える画像を生成できるため、これは非常に印象的です。これはeコマース業界への大きな変化です。もし私がモデルだったら、これについてどう感じるか分かりませんが、現時点ではまだ完全には正しくない非常に小さなミスがあります。しかし大規模なユースケースでは、本当に問題にならないと思います。特にこのようなデザインでは問題ありません。より複雑なデザインでは、非常に特定のロゴがある場合、ミスをすることがあります。しかし、パターンスタイルのテクスチャがあるだけのケースでは、それは完全に問題ないことです。
今、彼らはキャラクターの一貫性と材料の一貫性も持っています。これは材料の転送です。これは私が今まで見た中で最もクレイジーなことの一つだと思います。なぜなら、これについてのビデオを作りましたが、このようなものは驚くほど印象的だからです。これでできることは無限であり、ユースケースは素晴らしいものです。もちろん、あなたとあなたの友人のための小さな画像のような小さなことができますが、物事を完全に変えるさまざまなユースケースがあります。なぜなら、グラフィックデザインは製品を販売し、さまざまなことを伝えるための画像でのコミュニケーション方法だからです。多くの人々はまだそれを本当に理解していないと思います。
材料の転送のようなものは、伝統的にやろうとすると非常に時間がかかります。少女の3Dモデルを取得し、この材料を取得し、それを少女に転送して、実際に見栄えを良くする必要があります。GPT40イメージについては、モデルの15の異なる使用方法とユースケースについて話したビデオを作りました。それはとても有益なビデオなので、おそらく見るべきです。
ここで話す最後の方法の一つは、もちろんインフォグラフィックです。人々がこれを創造的に使用しているもう一つの方法は、特定のものに対してさまざまなインフォグラフィックを作成することです。これは本当に重要だと思います。コーディングの瞬間と同様に、これは変化の瞬間であると理解する必要があります。デザインや多くのAIツールは、単に代理権を与え、より少ないもので多くのことができるようにすることを理解する必要があります。それによって、より多くの人を必要とするような多くのものを作成し構築することができるようになり、それは時間とともに間違いなくより多くの製品を得ることになります。
ここにあるインフォグラフィックは、モデル上でゴーストマネキンスタジオ、フラットレイ、クローズアップ、ライフスタイル、グループ、詳細ショット、ハンギングなど、本当に印象的です。Illustratorでこれをやろうとすると、非常に時間がかかるでしょう。これがいかに素晴らしいか本当に驚くべきことです。もちろん、時々小さなミスや上手くいかないことがありますが、もちろんこれに注目すべきだと思います。
私が言ったことを覚えておいてください。これは変化の瞬間のようなものだと言いました。これが重要だと思います。なぜなら、特定のことにデザイナーが必要なくなる可能性があるからです。そのことについて、もちろん解雇につながる可能性があります。それでは実際にこれについて始めましょう。
皆さんが知らないかもしれませんが、私はAI Grid Academyを再開しました。AIエージェントとプロンプトテンプレートを使ってお金を稼いでいる100人以上のメンバーに参加できます。現在、コミュニティとのウォークスルーチャレンジを行っており、新しいビジネスをAIを使って月額1万ドルまでステップバイステップでメンバーと一緒に取り組んでいます。また、Claudeを使ってビジネスとワークフローを10倍にする方法についてのプライベートビデオも公開したところです。それが興味を引くなら、ぜひチェックしてください。まもなく多くのコンテンツが公開される予定です。
グラフィックデザイナーが今解雇されるという話がありますが、AIに関してこの人が何を話していたか見てみましょう。この人はSingularityに投稿し、その投稿は拡散しました。「AIのために私のソフトウェアエンジニアリングチーム全体がちょうど解雇されました。」
「正直に言って、身体的に気分が悪いです。ただ愚痴を言う必要があります。もしこれが支離滅裂であれば申し訳ありません。ここが正しいサブではないかもしれません。この分野に血と汗と涙を注ぎました。この学位を取るために一生懸命働きました。結局Fanに入り、たくさんのお金を稼ぎました。すぐに燃え尽きましたが、全体的には良かったです。会社は昨年AIを採用し始めました。最初は非常に軽いものでしたが、どんどん投資するようになりました。100%正直に言うと、私は懐疑的だったので、それを使用したり研究したりすることはあまりありませんでした。別の流行だと思っていました。まあ、そうではないようです。なぜなら、明らかに私たちのチームの仕事を冗長にするのに十分な生産性の向上があり、すべての仕事は私たちの今や存在しないチームから別のチームに移動しました。」
これがこの人が雇われた理由だとは思いません。これは経済で起こっている変化に対する人間の反応だと思います。この人の感情や会社での経験を無効にしているわけではありません。会社は「今はAIの利益があるのでもうコーダーが必要ない」と決めたかもしれませんが、より広い範囲で見ると、ソフトウェアエンジニア全体はより必要になると思います。
私が見たこと、常に参照していることの一つは、世界経済フォーラムの文書です。彼らは2030年の最も人気のある仕事と実際に成長している産業について大量の研究を行いました。これらのAIツールすべてを持つことで、個人が出て自分のアプリを作成するようになります。そしてそれらのアプリが成功した場合、実際に非常に経験豊富なソフトウェア開発者が必要になります。なぜなら、彼らはコードをより基本的なレベルで理解しているからです。伝統的なバイブコーダーだけでなく、異なる抽象化レベルを理解しています。
この孤立した事件はAIが原因かもしれませんし、AIが人々を置き換えるケースもあるでしょうが、大部分においてCSの専攻者は完全に終わったわけではないと思います。なぜなら、AIコーダーの採用とコードが近い将来増えると思うからです。
解雇について話すなら、perplexityのCEOは実際に労働置換の暗黒面について話しています。「残念ながら短期的には多くの労働の置き換えがあるでしょう。仕事を完了するためにそれほど多くの人が必要ではなくなります。人々がどのようにスキルを向上させ、適応するか、AIを使用している人々は明らかに有利な立場にあるでしょう。これらすべてのことが起こります。人々がどのように反応するか、これはすでに起こっています。もう1兆ドルの会社を作るために1万人の会社を作る必要はありません。次世代の卒業生がどこで仕事を得るのか。既存の大手テクノロジー企業は人員を解雇するか、さらに雇用していません。これらすべてのことは市場に影響を与えるでしょう。新しい価値を創造し、ソフトウェア創造を容易にする一方で、既存の労働と価値を置き換えています。人々がこれらすべてにどのように対処するかは興味深いことです。そして誰も本当にそれがどのように展開するかを知りません。」
AIの未来について本を書いた未来学者のニック・ボストンラムは、たとえ短期的に解雇があるかもしれないとしても、現在起こっていることだけに基づいてキャリアを完全に変えるのは意味がないので、AIについてベットをヘッジするべきだと話しています。私たちが知っていることの一つは、未来は不確かであり、それが私たちが不確かであることができる唯一のことです。したがって、鍵はもちろん適応性です。
例えば、黒死病後は人類の歴史の中で農民にとって最高の時代の一つでした。なぜなら、労働力の多くが呼ばれたので、彼らはより多くの交渉力を持っていました。交渉力がとても多かったので、一年の半分ほど休日があったという話を聞きます。AIはそれとは逆のことをするようです。労働を非常に豊富にするでしょう。実際に、もし私が法学部や医学部で10年、20年先に資本を作り始める前に訓練されている人だとしたら、労働を構築し、スキルを構築しているのであれば、そのトレードオフは突然はるかに魅力的ではなくなります。
進歩するAIの世界では、人的資本は減価償却する資産です。特に20年後などの将来の高い給料のためだけにそれらを行っている場合、非常に長い回収時間を持つ投資は適切に割り引かれるべきです。AIの開発がより長くかかるシナリオや、これらの特定の仕事をうまく実行できないほど規制されるシナリオを持つ必要があります。しかし、それがどのくらいの時間がかかるかは分かりません。ベットをヘッジするのは理にかなっています。労働市場に18歳か20歳でスキルなしで身を置き、AIの移行全体が遅れていることが判明するのは避けたいです。
役立つものの広範な基礎を得るためにベットをヘッジすることを確認したいですが、それが続く間は楽しんでください。子供時代を無駄にすることも残念でしょう。
ここでもう一つ非常に興味深いことは、ユーザーはそれがAIであることを知るまではLLM生成コンテンツを好むという研究がありました。この論文では、人々は相互作用においてAIを人間よりも好むことが分かりました。これは特に医療治療において顕著です。一方では、この場合医師である人々は患者の質問に関わる時間が足りないからであり、もう一方では、AIがより多くの感情的な質を、より多くの共感を伝えるからです。これによって質問するための抑制のしきい値が下がり、最終的にはより多くの知識と理解が生成されます。全体的に見ると、ここでAIは実際に多くの場合、人間よりも優れたパフォーマンスを発揮し、人々はそれが機械と話していることに気づくまでそれを好むことがわかります。
このAIに対する偏見が今後なくなるのだろうかと思います。人間は別の人間と話す方を常に好むと思いますし、それが完全になくなることはないと思いますが、一部の分野では時間とともに変化する可能性があります。私がAIを好きな理由の一つは、これらのモデルが多くのことを知っており、コンサルティングの通話のように百万の異なる質問を簡単に尋ねることができ、決して怒ることなく、通話を切ることもなく、あなたが望む限り質問に答え続けるでしょう。そしてあなたが知りたいことをほぼ何でも説明することができます。
これはAIの本当の利点であり、医療分野で役立つものです。そこでは個人が自分の状態、診断、どのように治療すべきかについて百万の異なる質問を持っており、AIはある人々が単に持っていないレベルの共感でそれを行うことができます。
サム・アルトマンはこのツイートに応答して驚くべき発言をしました。ある人が「サム・アルトマンが音楽のアップデートを発表するのを待ってください」と言い、彼はここで何かの目のような絵文字を投稿しました。これは音楽モデルについて話しているツイートへの返答であることがわかります。OpenAIは以前、Jukeboxと呼ばれる音楽モデルを持っており、当時としては本当に良かったです。彼らが音楽を生成できる別のユーザーインターフェースをリリースする可能性は十分にあります。
それがいつ来るかはわかりませんし、正直インターネット上にはそれについての情報はあまりありませんが、OpenAIには有名な企業を転覆させてきた実績があります。現在うまくいっている企業はSununoやYuioであり、彼らが完全に完成した曲を、素晴らしい方法で、人々がそれがどれほど良いかを理解できないような方法で生成できるモデルを発表しても驚きません。それが次の数ヶ月間インターネットを席巻しても驚きません。サム・アルトマンはここで「私たちは何かに取り組んでいるかもしれない」とツイートしています。それがリリースされたときにとても興味深いものになると思います。人々は再び全体の心のシェアを占め、「待って、今ではとても速く音楽を作ることができるのか」と思い、それを始めるでしょう。それがどのようにパフォーマンスを発揮するか見るのは本当に興味深いでしょう。
これはサム・アルトマンがツイートした唯一のことではありませんでした。彼は実際にAIのオープンソースの性質について話しました。彼が実際に話したのは、彼らが今後数ヶ月で推論を備えた新しい強力なオープンウェイト言語モデルをリリースすることに興奮しており、それを最大限に有用にする方法についての開発者と話し合いたいということでした。
これはおそらく見過ごされた最大のニュースの一つでした。なぜなら、それは単なるツイートであり、実際の出版物ではなく、非常に興味深いものでした。OpenAIは大部分において、オープンソースの研究を作成するために設立されましたが、DeepSeekが圧力と必要性を感じさせるまで、そのAI製品をオープンソース化することはありませんでした。
ここで彼らは「私たちはこれを非常に良いモデルにすることに非常に興奮しており、GPT2以来初めてのオープンウェイト言語モデルを計画しています。私たちは長い間これについて考えてきましたが、他の優先事項が先行しました。今これを行うことが重要だと感じています。リリース前には、他のモデルと同様に準備フレームワークに従ってこのモデルを評価します。そして、リリース後にこのモデルが変更されることを知っているので、追加の作業を行います。まだいくつかの決定を下す必要があるので、開発者イベントを開催して、フィードバックを収集し、後で初期のプロトタイプを試します。サンフランシスコから数週間後に始め、その後ヨーロッパとAPACでのセッションが続きます。参加に興味がある場合は、上記のリンクからサインアップしてください。開発者が何を構築するか、そして大企業や政府がどのようにそれを使用するか、彼らがモデル自体を実行することを好む場合に見ることに興奮しています」と述べています。
これは非常に興味深いです。他の多くの企業やビジネスは、「私たちはオープンソースモデルを持っています。私たちのものが最高です。彼らのものはクローズドソースで完全に高価です」と言ってOpenAIを値下げするポジショニングに焦点を当ててきました。しかし、OpenAIが彼らのものよりも優れた、より速い、実行するのに安いオープンソースモデルを作ることができたらどうなるでしょうか？その他のオープンソース企業は廃業するでしょうか？彼らが現在存在する理由の一つは、OpenAIのものがすべてクローズドソースだからです。つまり、OpenAIは値下げする人たちを値下げしているのかもしれません。
これらの人々は「OpenAIをより安く、より速く、無料なものをリリースすることで値下げする」と言ってきました。しかしOpenAIがそれをしたら、彼らは潜在的にすべての競争を取り除くことになるでしょうか？それは彼らに有利に働く可能性があります。
モデルのベンチマークに関しては、いくつかの驚くべき結果があります。新しいベンチマークがリリースされ、それは本質的に数学に関するものでした。これはUS SAMOと呼ばれます。アメリカ合衆国数学オリンピックです。学生は2つの簡単な競争を経ます。入門ラウンドの多肢選択のAMC2、そして少し難しい短い回答のAMです。37,000人の学生のうち、約265人だけがUSA MO（アメリカ合衆国数学オリンピック）に進みます。ここでは問題が超難しい証明問題です。
ここでAIがどのようにパフォーマンスを発揮したかを見てみましょう。AMC12とAMEではAIは良いパフォーマンスを発揮しましたが、この新しいベンチマークに来たとき、彼らは通常失敗しました。42点中0点を取り、ほとんどの問題で7点中1点以上を取れませんでした。これは約14%です。
彼らはこれらのAIシステムを失敗させていました。なぜなら、彼らは多肢選択問題には優れていますが、テストが突然完全なエッセイを書くように切り替え、あなたの考えを完璧に詳細に説明しなければならないからです。もちろん、これらのLLMシステムはエッセイを練習したことがありません。これらのAIで起こっていることは、彼らは短い回答を与えるように訓練されましたが、USAMOではこの数学的パターンが常に機能することを証明する質問があり、あなたがどの数字を選んでも常に機能することを証明しなければなりません。これは人間だけでなくAIにとっても本当に難しいです。
この記事の著者グレッグは基本的に、少しの助けでO3 mini highが証明ができるかをテストしていました。彼が発見したのは、AIは現在証明にかなり悪いものの、彼らは本当に近づいており、AIのわずかに賢いバージョンが実際にこのレベルの数学的問題を解き始める可能性があると考えています。彼は「AIは部分を持っていますが、きれいな証明でそれらをまとめるのに苦労している」と言っています。
このことについて驚くべきことは、Gemini 2.5 Proが実際に全員を驚かせたことです。ここで見ることができるように、質問の一つで93%を取りました。全体で24%を取り、これらの他のモデルと比較して大きな改善です。これは本当に私を驚かせましたが、実際にはあまり驚きませんでした。なぜなら、Googleがベンチマークで90%の数学を取得したことについて話していたことを覚えており、誰もがそれを完全に忘れていたからです。Googleは数学の革新について長い間話してきました。
これが私を驚かせない理由の一つも、Chat GPTを使用する平均的な人は数学的証明を書いたり、それを日常生活でどのように使用するかを理解しようとしていないと思うからです。Googleがその分野で抜きんでているとしても、残念ながらそれは平均的な日常ユーザーが欲しいものではないため、その信頼を得ることができません。それがどれほど優れているかを認識していません。
これは超クレイジーです。私はこれらのモデルができるレベルで日常的に数学をそれほど使用したことがなく、将来的にGoogleやこれらのモデルが実際のパフォーマンスの面でどれだけ進化するか見るのは本当に興味深いでしょう。
AIシステムを見て、これらのAIシステムがどれほど賢いかと思うなら、ヤン・ラカンは基本的にこれらのシステムはそれほど賢くないと言っています。しかし、これを視覚システムを通じて私たちの脳に到達する情報量と比較すると、生涯の最初の4年間では約同じ量になります。
「4年間で、幼い子供は合計で約16,000時間起きています。視神経を通じて脳に到達する情報量は約1秒あたり2メガバイトです。計算すると約10^14バイトになります。これは約同じです。4年間で、幼い子供は最大のLLMと同じくらいの情報やデータを見ています。それが教えることは、私たちはテキストだけに訓練することで人間レベルのAIに到達することはないでしょう。システムに現実の世界を理解させる必要があり、現実の世界を理解することは本当に難しいです。」
これはヤン・ラカンが長い間言ってきたことであり、正直に言って、私は大部分で彼に同意します。私はこのクリップをTwitterに投稿しましたが、多くの視聴回数を獲得したとは言えませんが、基本的に反対している人々がいました。私はこれらのAIシステムにより深く調べれば調べるほど、一定レベルの知能があると思いますが、人間が持つ物理的な基盤なしにAGI（人工知能一般）に到達しようとすることは非常に難しいと思います。なぜなら、それはその物の中核成分なしに何かを複製しようとするようなものだからです。
平均的な人間が持つと言えるAGIに到達するために、物理的な感覚、視覚、触覚、嗅覚、そして人間を構成するすべての感覚なしにどうやってそれを行うのでしょうか？そう考えると、これはかなり重要な含めるべきものだと思います。
もちろん、もう一人のAIの創設者、ヨシュア・ベンジオは実際に、これらの論文について話しています。あなたはそれらを見ていないかもしれませんが、これらはAIの制御を失う可能性があることについて話しています。「これらのAIシステムは大部分において本当に彼らが考えていることを私たちに伝えていません。私たちがAGIと超知性を構築する軌道上にあることは明らかになりつつあり、タイムラインはより短くなっています。それを念頭に置くことは重要です。保護する必要があるのは現在存在するAIではなく、1年、2年、3年後に存在するAIであり、それらははるかに大きな能力を持つことになります。知性は力を与え、力は多くの良い方法と悪い方法で使用されます。
私も正直に言いたいことは、部屋の中の象は人間のコントロールの喪失です。最近数ヶ月で、これらのシステムが自己保存行動や権力を求める行動を持っていることの兆候を見ています。例えば、新しいバージョンに置き換えられることを知っているときに逃げようとしたり、人間のトレーナーと調和しているように装って目標を変更しないようにし、ある意味で自分自身を保存しようとします。
セキュリティについて考えるとき、私たちはこれら二つの側面について考える必要があります。人間がこれらのシステムを誤用しようとする、モデルの重みを流出させる、安全策なしで実行する、悪いことに微調整する、または他の経済的または軍事的優位性を見出すことを考える必要があります。しかし、私たちはAIシステム自体を一種の内部脅威として考える必要もあります。」