この動画では、GPT-5のベンチマークスコアとされるリーク情報、xAIのGrok 4の正式リリース、GoogleがAIで社内コードの50%を生成している実態、激化するAI人材獲得競争、中国発の高性能オープンソースコーディングモデルKimi V2、PerplexityのAIブラウザComet、そして外科手術を完全自律で行う医療ロボットの画期的成果など、AI業界の最新動向を包括的に解説している。

最新のAIニュース:GPT-5リークからGrok 4まで
新しいベンチマークスコアがリークされ、人々はそれが実際にGPT-5のものかもしれないと考えています。もしそれが本物なら、パフォーマンスの大幅な向上を見ることになります。一方、xAIのGrok 4が今週リリースされました。リークとは異なり、これらのベンチマークは確実に本物であり、真剣に印象的です。Googleも、AIが現在内部コードの50%を書いていることを認めました。
そして、これらすべてが起こっている間、AI人材戦争が激化しています。より多くの企業が関与し、これまで以上に高い賭けが行われています。詳しく見ていきましょう。
GPT-5リークの真相について
GPT-5リークの詳細はどうなっているのでしょうか。X上の主要なAIアカウントをフォローしているなら、おそらく既にGPT-5のベンチマークスコアとされるリークのスクリーンショットを見たことがあるでしょう。
最初にこれを見たとき、私は非常に懐疑的でした。皆さんの多くもそうだったと思います。文字通り誰でもこれを作成できるからです。しかし、その後、多くの主要なAIニュースアカウントに取り上げられ始めました。そこで、もう少し深く調べることにしました。そして分かったのは、これらは実際には単なる予測だったということです。
元の投稿は文字通り、ランダムなXアカウントによって作成されました。しかし、起こったことは、OpenAIの内部関係者とされるX上のAIコミュニティでよく知られた人物、SatoshiまたはSatoshi guyが返信したことです。彼は「もう少しスパイスが効いているが、ほぼ正確」と書きました。これは、X上のAIニュースアカウントがそれを取り上げるのに十分で、わずか数時間で至る所に広まりました。
ただし、この騒動を最初に引き起こしたとされる同じOpenAI内部関係者のSatoshiが、後に別の投稿でベンチマークは偽物だと主張したことも言及すべきです。ということです。さらに、AI分野のより信頼できる他の人々も今や出てきて、ベンチマークは偽物だと言っています。
そして、実際に多くの人が遅延を予見しています。GPT-5がこの夏、おそらく今月でさえ来ると聞いたことがあるでしょう。それは、サム・アルトマン自身がこの夏に来ると言ったからです。しかし、つい最近、彼はまた、最高のオープンソースモデルになり得ると主張する彼らの史上初のオープンソースモデルが数週間以内にリリースされると言いました。
ですから、その発表と遅延についての話の間で、今月GPT-5を得ることはおそらくないと思います。とはいえ、OpenAIから今月最先端のオープンソースモデルを得ることは、それでもかなりクールでしょう。
OpenAIの新たな取り組み
OpenAIについて話している間に、今週、彼らがGoogle Chromeと直接競合することを目的とした独自のブラウザの立ち上げに取り組んでいることが報告されました。これは完全にAIネイティブなブラウザで、おそらく複数のエージェントが組み込まれているでしょう。そして、彼らがそれを正しく行えば、正直に言って、ゲームを完全に変える可能性があると思います。
冒頭で述べたように、AI人材戦争が激化しています。私たちは既にOpenAIが多くのトップ研究者をMetaに失うのを見ました。そして今、彼らは反撃しています。彼らはxAI、Tesla、そしてもちろんMetaから複数の重要な人材を引き抜きました。
Appleも今週、トップAI責任者のRoing PangがMetaに向かうことで、この交錯に巻き込まれました。少なくとも、彼らはおそらく向こうで彼を活用するでしょう。しかし、このすべての引き抜きが進行中で、1億ドルの契約ボーナスの噂が飛び交う中、この全てにおける真の勝者はNvidiaです。彼らは現在、4兆ドルの時価総額に到達した史上初の企業になりました。
ことわざにあるように、ゴールドラッシュの時は掘るな、シャベルを売れ、ということでしょう。
Grok 4の登場
もちろん、今週Grok 4も登場しました。私は既に前回のビデオでこのリリースを詳しく取り上げたので、詳細が欲しい方はぜひそちらをチェックしてください。しかし、このリリースの簡単な要約をお伝えします。
人々の注目を集めた主なものは、狂気のベンチマークスコアだったと思います。Grok 4 HeavyがAMYと呼ばれる数学ベンチマークで100%を獲得するという、文字通り驚異的な結果があります。ベンチマークを完全にこなしています。ご覧のように、Grok 4は他の多くのベンチマークでも最先端です。
なぜGrok 4とGrok 4 Heavyがあるのか疑問に思っているなら、Grok 4 Heavyは基本的により大きく優れたバージョンです。OpenAIのo3モデルがあるのと同じように、o3 Proもあるような感じです。
重要な違いは、Grok 4 HeavyがOpenAI o3 Proプランよりも実際にはなぜかより高価で、月額なんと300ドルもすることです。この理由は、Grok 4 Heavyがマルチエージェントシステムだからでしょう。単一のモデルではありません。Grok 4 Heavyにプロンプトを送ると、実際に複数のインスタンスを並行して生成し、それぞれがあなたの質問に個別に取り組み、その後協議してメモを共有し、最終的な応答または最終的な出力を決定します。それがあなたが見るものです。
つまり、実際にGrok 4 Heavyを使用する場合、余裕があるなら、基本的にあなたの代わりに連携して作業する専門家レベルのエージェントのグループと話していることになります。
前回のビデオでより詳しく取り上げた、他にもいくつかの非常に印象的なベンチマークスコアがありました。彼らはGrokの更新された音声モードのリアルタイムデモも行いましたが、次に来るものを垣間見せてライブストリームを締めくくりました。
ここで、xAIの今後数ヶ月のロードマップを見ることができます。8月にリリース予定のコーディングモデル、9月にリリース予定の完全なマルチモーダルエージェント、そして10月にリリース予定の新しい動画生成モデルがあります。これはGoogleのVeo 3に匹敵する可能性があると彼らは信じています。全体的に、大規模なリリースであり、明らかにGrok 4は現在トップの競合者です。
中国発の驚異的なコーディングモデル
今週見逃したであろうモデルリリースがここにあります。Kimi V2です。Kimi V2は中国から出てきたオープンソースのコーディングモデルで、業界を絶対的に驚かせました。このモデルは1兆個のパラメータを持ち、多くのコーディングベンチマークで最先端であり、場合によってはGrok 4にのみ及ばず、非常に安価で、再びオープンソースです。
つまり、ここでベンチマークを見ているだけで、これは実際に狂気的なパフォーマンスです。これは推論バージョンでさえないことを覚えておいてください。推論バージョンは後で来ると言われています。しかし、ご覧のように、SWE-benchで65.8%、LiveCodeBenchで53.7%を獲得しています。つまり、これは本当に良いもので、再びオープンソースです。もちろん、ベンチマークが常に全体像を物語るわけではありませんが、人々が既にこのモデルで行っていることに基づくと、本物のようです。
つまり、DeepSeekだけが注目すべき中国企業ではないということでしょう。
Googleのコード生成におけるAI活用
コーディングモデルといえば、彼らの内部でのAI使用についてかなりオープンなGoogleは、この時点でAIにほぼ全面的に取り組んでいるため、コード生成のためにAIをますます使用しています。最新の数字によると、Googleでのコードの約50%が現在AI生成されており、わずか数年前からほぼ倍増しています。
ですから、AI進歩が加速し続けていることは非常に明らかだと思います。つまり、今週だけで、Nvidiaが4兆の時価総額を突破し、中国から突如として最先端のオープンソースコーディングモデルが登場し、そしてもちろんGrok 4も見ました。GoogleのプロダクトリードのLogan Kilpatrickが言うように、AIの今後6ヶ月は、おそらくこれまでで最もワイルドなものになるでしょう。
PerplexityのAIブラウザComet
他のニュースでは、Perplexityがついに今週、Cometと呼ばれるAIブラウザを立ち上げました。これはしばらく前に発表されたため、おそらくしばらく聞いていたものですが、正式にここにあります。CometはAI専用に構築されたウェブブラウザ、AIネイティブなウェブブラウザで、まさにOpenAIが今後数週間でリリースを計画しているものです。
ウェブを閲覧する際に常にあなたの肩越しに見ているAIモデルと考えることができます。ですから、理解できないことがあれば、チャットボットに説明したり、スクリーンショットを送ったりする必要はありません。単純にCometに尋ねるだけです。また、サードパーティのデータを統合してパーソナライズし、実際にあなたのために行動を取らせることもできます。
ですから、これは文字通りインターネットの使い方を変える可能性があると本当に思います。つまり、Google検索は既にGoogle AI overviewsでチャットボットに過ぎませんが、これは検索全般の次のステップのように思えます。Googleも確実にこれの独自バージョンを作るか、十分早くChromeを改革するでしょう。
医療ロボットの画期的成果
最後に、今週のAI要約を締めくくるために、なぜかあまり多くの人が話していないこの狂気的な成果に注意を向けたいと思います。今週、史上初めて、ロボットが完全に自律的に胆嚢摘出手術を行ったと報告されました。記事で述べられているように、100%の精度でこれを成し遂げました。
ジョンズホプキンス大学の研究者チームによって行われた手術は、ロボットが独立した決定を下し、予期しない合併症にその場で適応することを可能にするAIの力を実証しました。明らかに、これは実際の生きている人間に対して行われたわけではありません。生命のような医療レプリカで行われました。しかし、これは始まりに過ぎません。
興味深いことに、彼らはここで、SRTと名付けられたロボットが、死んだ豚に対して同様の胆嚢摘出手術を行う外科医のビデオで訓練されたとも言及しています。つまり、このロボットは文字通り見ることから学んだのです。つまり、人々はこれがどれほど狂気的で、医療業界がどのように完全に揺さぶられようとしているかを本当に理解していないと思います。
私は以前にも何度も言いましたが、これらのロボットが客観的かつ確実に人間の外科医よりも優れるようになったら、つまり、人間の外科医に手術を行わせることは非倫理的ではないでしょうか。正直に言って、皆さんは、キャリアで手術の成功率が80%程度で、手術を数十回しか見たことがないか、数十回しか行ったことがない人間の医師から手術を受けるのと、手術を数千回見て、シミュレーションで数百万回行い、99.9%の成功率を持つロボット外科医から手術を受けるのと、どちらを好みますか。選択は非常に明らかだと思いますが、それについてコメントでどう思うか教えてください。
最終的に、これは好みの問題というよりも倫理的な問題になると思いますか。それが私が言いたいことです。とにかく、コメントで皆さんの考えを聞かせてください。
いつものように、今週の要約を楽しんでいただけたなら、ぜひいいねボタンを押し、新しい方は登録して、次回でまたお会いしましょう。


コメント