AI ニュース: GPT-4o mini が Claude を圧倒、サム・アルトマンの積極的な新計画、AGI まであと3年

AIに仕事を奪われたい
この記事は約12分で読めます。
AI News : Gpt4o - Mini CRUSHES Claude, Sam Altman's Aggressive New plans , 3 Years Left Until AGI
Prepare for AGI with me - 🐤 Follow Me on Twitter 🌐 Checkout My website -

実際、OpenAI からの1つを含む、いくつかの大きな AI リリースがありました。見逃していたかもしれないニュースをいくつか見ていきましょう。
まず驚いたのは、GPT-4o mini が AI の費用対効果の高いインテリジェンスを進歩させたことです。OpenAI は実際、GPT-3.5 の代替となる GPT-4o mini をリリースしました。昨日、彼らは基本的に GPT-4o mini を発表しました。これは最も費用対効果の高い小型モデルです。OpenAI は、GPT-4o miniが AI インテリジェンスをより手頃な価格にすることで、アプリケーションの範囲を大幅に拡大すると予想しています。
GPT-4o mini について最も驚いたことの1つは、MMLU で82%のスコアを獲得し、現在 ChatBot Arena や LMS リーダーボードでのチャット優先度で GPT-4 を上回っていることです。このシステムの価格は、インテリジェンスのコストが急速に低下していることを考えると、実際には比較的安いです。入力トークンあたり15セント、出力トークン100万あたり60セントで価格設定されており、以前のフロンティアモデルより1桁安く、GPT-3.5 Turbo より60%安くなっています。
この発表がゲームチェンジャーだと思う理由、そして多くの人がこのようなリリースの重要性に気づかないだろう理由は、小型で費用対効果の高いモデルが非常に安価にリリースされることで、AI エコシステムがより費用対効果の高い製品を展開できるようになるからです。
多くの人が GPT アプリケーションを展開したり、ChatGPT やその他の AI システムを使用したりするのを妨げている最大の問題の1つは、単に高すぎるということです。AI で何かを構築しようとしたことがあれば、出力あたりのコストが信じられないほどの請求書を積み上げてしまい、ソフトウェアや AI システムを正当化できないほど高額になってしまうという問題があります。
しかし、GPT-4o mini では、モデルのインテリジェンスやコストを妥協することなく、価格の削減と信頼性の向上、そしてもちろんモデルのインテリジェンスの向上が得られます。これは、以前はそれだけのお金を使う理由を正当化できなかったり、実際に損失を出していたソフトウェア開発やアプリケーションがあった場合、そうではなくなる可能性があることを意味し、今後の業界のさらなるトレンドを示していると思います。
彼らが言及しているのは、GPT-4o mini が低コスト、低レイテンシー、そして複数のモデル呼び出しを連鎖または並列化するアプリケーションで幅広いタスクを可能にするということです。例えば、複数の API を呼び出したり、完全なコードベースや会話履歴などの大量のテキストを渡したり、顧客チャットボットなどのリアルタイムの高速な応答を通じて顧客とやり取りしたりするなどです。
本当にクールなのは、現在 API でテキストとビジョンをサポートしており、将来的には画像、ビデオ、音声の入出力が来る予定だと言っていることです。これが、このモデルの本当のゲームチェンジャーになると思います。
実際に興味深かったのは、モデル評価スコアを見てみると、他のフロンティアモデルと比較するのではなく、他の AI 企業の類似のモデルと比較していることです。基本的に、サイズの小さい他のモデルと比較しています。
ここで見られるように、GPT-4o mini は Gemini Flash、Claude Haiku、そしてもちろん前身の GPT-3.5 Turbo と比較されています。すべての能力において大幅な飛躍が見られます。GPT-3.5 は単純に Gemini Flash や Claude Haiku と比較できませんでしたが、全体的に見ると、驚くべきことに、GPT-4O-Mini が費用対効果とサイズの面で明らかに以前の最先端モデルを凌駕していることがわかります。
MMLU では Gemini Flash と Claude Haiku を超え、DROP ベンチマーク、GQA、MGSM、数学ベンチマークでも同様です。驚くべきことに、これらの他のモデルと比較して、費用対効果の面で大きな改善が見られます。人間による評価でも同様で、MMU や Math Vista でも、再び驚くべきベンチマークが見られ、Gemini Flash が実際に GPT-4o mini を上回っています。
要するに、OpenAI がおそらくこのモデルを訓練するために異なる方法を使用したことは明らかです。なぜなら、モデルのサイズに対する効果は、彼らが実際に述べていないにもかかわらず、将来的にはより高速なシステムからより多くのインテリジェンスを得られることを示しているからです。そして、今後2年間で、入力あたりのコストに対してどのレベルのインテリジェンスを得られるかがどのようになるか、私は気になります。
もし望むなら、今日でも GPT-4o mini を実際に使用できます。例えば、相対的な速度を示すために、「20の食品アイテムをリストアップしてください」と言いました。それは驚くほど速かったです。後でこのモデルの実際のアプリケーションについてのビデオを作る予定です。なぜなら、ほとんどの人がこのようなモデルで実際に何ができるかを見逃していると思うからです。これは後で掘り下げる予定です。なぜなら、モデルがそれほど効果的なレベルのインテリジェンスでそれほど速く応答できる場合、実際に何ができるかは本当に効果的だからです。

「我々は皆とても空腹なのかもしれません。そう言えば、私たちはイエスと言えたかもしれませんし、DeepMind でエージェントを押し進めようとしたかもしれません。そして、私が言ったように、私たちが自分たちのやり方でそれを行うことを決めた理由は、この目標に向かってより速く動けると考えているからです。
この緊急性の一部は、デジタルAGI に似たものからわずか3年ほど離れているという本当の信念によって駆動されています。そして、私が言及してきた普遍的なエージェント、つまり知識の幅と深さの両方を持つものを指しています。つまり、実際に非常に加速されたタイムラインにいるということです。
数ヶ月経って、そのタイムラインの5%ほどに到達しているのかもしれません。そして、おそらくこの一部は、AlphaGo がどれほど速く進んだかによっても駆動されています。専門家がこれは不可能だと疑っていた状態から、人間レベルあるいは専門家レベルの囲碁プレイが数十年先だと言われていたのが、数ヶ月でその問題を効果的に解決できたのを見て、私たちは同様の加速が起こっているのを目にしているのだと思います。」
これは、以前 Google DeepMind で働いていたミシャ・ラシンの発言です。彼らは自分たちの会社を立ち上げに行き、AI のタイムラインについて話しているのが分かります。業界の内部者が実際にタイムラインについてどう考えているかを聞くのは、常に新鮮だと思います。ポッドキャストで AI について簡単に話している数人の懐疑的な人々よりも。そして、それを言うときに、ニュースキャスターやその他のことを指しています。
もちろん、彼らは議論を広いコミュニティに広げるために重要だと思いますが、人々が理解していないと思うのは、タイムラインが今見ているようなもの、つまり3年後、現在は2024年なので2027年になるということです。これは、環境内で実際に行動し、物事を行うことができる真に有能なシステムを手に入れる時期として2027年から2028年を挙げている6人目か7人目の人物を示すことになると思います。
これは驚くべき啓示だと思います。なぜなら、AI が増加すると予想されるペースを示しているからです。面白いのは、過去には、このようなシステムがどれほど速く進歩するかについて、人々が実際に間違っていたということです。だから、これらの指標でさえもある程度保守的だと主張することもできるかもしれません。
つまり、今後5年以内に、さまざまなレベルでさまざまな画期的な出来事が起こり、より多くの能力を持つシステムが登場すると思います。しかし、人々が本当に何が来るのかを理解するかどうかは疑問です。なぜなら、これらのシステムの能力は、単なる派手なチャットボット以上に深遠な意味を持つからです。そして、それらのチャットボットが開発される一方で、もちろん他の一般的に知的なシステムが開発される中で、AI の周辺にもっと多くのお金が流れ込むのも見ることになるでしょう。
AI が元 Google 社員が考えているほど速く進歩しないと思う人たちのために、トランプの同盟者たちが AI 軍事技術のためのマンハッタン計画を作る計画を立てていることを見ると、これは AI 開発にさらなる圧力をかけることになります。
基本的に、トランプの同盟者たちが AI に関する大統領令の計画を立てていると報じられています。ご存知のように、ドナルド・トランプは再び大統領になるために立候補しており、彼が今回の選挙に勝つ可能性が非常に高いです。そして今、人工知能の最大の発展に関する彼の計画に注目が集まっています。なぜなら、もちろん彼には物事がどこに向かうかについていくつかのユニークなアイデアがあるからです。
ワシントン・ポスト紙によると、この元大統領に近い数人が、技術における米国の利益を前進させるための AI 大統領令を起草しているそうです。これには、AI モデルを研究し、外国勢力から保護する業界主導の機関の創設が含まれます。この報告によると、フレームワークには「AI で America First」も含まれており、これは2016年のトランプ政権のコメントと一致し、この分野におけるアメリカのリーダーシップを強化するものです。
この命令は、主要なテクノロジー企業に AI モデルのリスクを連邦政府に伝えることを要求し、高リスクな状況での政府による AI システムの使用を制限し、医療実践における有害な AI を研究するためのプログラムも含んでいます。
前にも言ったように、これらの選出されたリーダーたちが AI の潜在的な可能性の大きさを本当に理解し始めたとき、世界のさまざまな場所でマンハッタン計画が出現するかどうかは疑問の余地がないと思います。アメリカだけでなく、より強力なシステムに近づくにつれて、AI の研究landscape が大きく変わる可能性があると思います。
2030年までに、あるいは2035年までに、特定の分野で公開されている研究のレベルが実際に停滞する可能性があります。これは革新のレベルが下がるという意味ではなく、フロンティアラボから公に見聞きしているものを指します。
また興味深いのは、OpenAI が新しい AI チップを開発するために Broadcom と引き続き話し合っているようです。AI ブームの主要な勝者の1つは Nvidia でした。彼らは時価総額で1兆ドルを獲得し、人工知能の台頭から大きな利益を得ました。多くの人々がモデルを訓練するためにこれらのグラフィックカードを必要としているからです。
サム・アルトマンが昨年これを行っていたことは知っています。昨年、彼は新しい会社を立ち上げて新しい AI チップを開発・生産し、チップ工場の設立を支援し、それらを収容するデータセンターを作ることを決めました。しかし、今では彼の計画が少し変わっています。
彼が実際に行っているのは、Google の AI チップ、テンソル処理ユニットを生産する Google のユニットの元メンバーを雇い、会話に関わった3人によると、AI サーバーチップの開発を目指しているそうです。また、特定の人々によると、チップの作業について Broadcom を含むチップデザイナーと話し合っているそうです。
これについて驚くべきなのは、Nvidia が作るような新しいサーバーチップは大きな賭けであり、実現するまでに何年もかかるだろうということです。チップの開発を試みることで、OpenAI は最も重要なチップサプライヤーである Nvidia を怒らせるリスクを冒していますが、将来の価格交渉で OpenAI に潜在的なレバレッジを提供する可能性があります。
個人的には、OpenAI がなぜこれを試みているのかわかりません。おそらく、いつか超知能 AI を持つことができ、その超知能 AI が社内でチップ製造会社を前進させ、地球上で最高のチップを持つことができると認識しているからかもしれません。少し狂っているように聞こえるかもしれませんが、これが彼らの狙いだと思います。非常に長期的な計画のように思えますが、サム・アルトマンは非常に長期的な思考をする人だと確信しています。
そう言う理由は、これらの AI チップの設計が実際に非常に難しいからです。Nvidia が市場リーダーである理由があります。彼らが最高であり、インフラ全体、統合、パートナーシップ、取引ルートなど、すべてが AI ブームから利益を得るのに有利だからです。
ここで見られるように、一部の人々はこれを信じていません。「アルトマンの工場拡張の野心は、多くの資本と専門的な労働力を必要とするため、多くの幹部にとって信じがたいものでした。TSMC の CEO である Wei 氏は、新しい工場の見通しについて尋ねられた際、先月の記者会見で『アルトマンは私が信じるには攻撃的すぎました』と述べています。」
前にも言ったように、これは非常に経験豊富な起業家にとっても簡単なことではありません。
実際、OpenAI の共同創設者は、AI の進化の未来について興味深い発言をしています。
「癌にかかる可能性があり、癌は自然界でよく見られる現象です。ある意味で、AI の数が増え、AI が自身のコードを修正し、人間が自身のコードを修正するという突然変異のプロセスがあります。自然選択のプロセスがあり、文字通り最大限に広がりたい AI が存在することになるでしょう。宇宙に存在するものは、複製したいと思うものです。主な違いは、AI が巨大な力を持つということです。」
「例えば、すべてのリソースを消費することが許されないという均衡を想像できますよね?それとも、私が何か見落としているでしょうか?」
「他の AI がシステムを防御しているか、あるいはそもそも防御のために訓練されたことがなく、マルチエージェントのセットアップでの動的な予測が非常に難しい可能性があります。1つの AI であれば、可能性を予測することはまだ極めて困難ですが、多くの AI がある意味でリソースを求めて競争している場合、結果を言うのは非常に難しいです。」
これは AI ニュースとしてカウントされないかもしれませんが、本当にこれは多くの人が見るべきものだと信じています。なぜなら、AI 生成ソフトウェアを使って実際に興味深いものを作り出せることを示しているからです。
私はたくさんの異なる AI ビデオを見てきましたが、これは今まで見た中で間違いなく最高のシリーズの1つです。全クリップを再生することはしませんが、AI 生成のテレビ番組の最初の30秒を皆さんにお見せします。これは、エンターテイメントの未来が、ソロクリエイターが本来アクセスできないような本格的なテレビ番組を制作できるようにすることで、どのように変化するかを示しているかもしれません。
「今夜の『未解決の奇妙なこと』のエピソードでは、人間は本当に存在するのか、それとも若者のおとぎ話なのか?人間は私たちの時代の大きな謎です。これらの伝説の生き物は、ジャガイモを食べ、睡眠を楽しんでいたと言われています。絶滅したと考えられていますが、そもそも存在したのかどうかさえ疑問です。しかし、最近、世界中で目撃情報が寄せられ、再び議論が巻き起こっています。ディードルの外れにある田舎のモーゴグで、ハイカーが人間を目撃したと主張しています。」
「そうですね、火曜日の夜でした。唾を吐きに行った後、家に帰ってきたところでした。真夜中の潜伏のために外出したんです。ただ気味悪くて変な感じでいたんですが、そのときそれを見たんです。それは家でした。」
実際にこれを見たとき、私は非常に感銘を受けました。多くの異なる AI ビデオを見てきましたが、これは実際に私を笑顔にさせ、正直なところ、このフルエピソードを見ることに本当に興味をそそられました。
物事がより合理化され、多くのプラグアンドプレイ AI が登場すれば、自動化されたテレビ番組を手に入れる可能性があると思います。しかし、これが AI によって書かれたと思う人もいるかもしれませんが、実際にはそうではありません。人間が書いたものであり、制作の基礎が実際に AI だったのです。
皆さんもこれをチェックしてみるべきだと思います。いつものように、すべてのリンクを残しておきますので、素晴らしい1日をお過ごしください。

コメント

タイトルとURLをコピーしました