イーロン・マスクが完全燃焼！Grok 4、Neuralinkがコール・オブ・デューティをプレイ、そして自動配送Tesla…

この動画では、Elon MuskによるGrok 4の発表とその専門的なコーディングモデルへの注力、Neuralinkを使用してCall of Dutyをプレイする患者の驚異的な進歩、Tesla Model Yの完全自動配送の実現について解説している。さらに、Google、OpenAI、Anthropicなどの主要AI企業がコーディングエージェント分野に集中投資している現状と、人間とAIの協働によるソフトウェア開発の未来について詳細に分析している。

Elon Musk Goes SCORCHED EARTH! Grok 4, Neuralink plays Call of Duty and Self Delivered Teslas...

The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

イーロン・マスクの最新発表とGrok 4
Teslaの完全自動配送システム
Neuralinkの画期的な進歩
フロンティアAI研究所のコーディング分野への注力
Grokの競争力と特徴
イーロン・マスクの現実的な評価
モデルバージョニングの意味と期待
SalesforceのAI活用と課題
AIエージェントの現状と限界
コーディングエージェントの急成長
コーディングアプリの構造と価値
完全自律コーディングエージェントの影響
XAIの新しいコードエディター
コンピューターサイエンス教育の未来
Geminiを使った実践的なコーディング体験
新しい学習アプローチの価値

イーロン・マスクの最新発表とGrok 4

皆さん、悪いニュースがあります。Grok 3.5はキャンセルされました。しかし良いニュースもあります。Grok 4がまもなく登場します。イーロン・マスクは、7月4日直後にリリースされるGrok 4を発表したばかりです。彼がここで述べているように、専門的なコーディングモデルにはもう一回大きな実行が必要だということです。これについては後ほど詳しく説明します。

イーロン・マスクの企業群は最近、様々な分野で多くの取り組みを行っています。私は最近、Teslaを集中的に取材しているノッタル博士とのインタビューを投稿しました。彼は実際にワイルドなオースティン、テキサスの街中でTeslaのロボタクシーに乗車した地球上で最初の人々の一人でした。

もう一つの大きなマイルストーンは、もちろん工場から顧客の自宅まで、高速道路を含む街全体を横断する車、Tesla Model Yの初の完全自動配送が完了したという事実です。これは考えてみると本当に驚異的なことです。

Teslaの完全自動配送システム

オンラインで車を注文できます。Teslaではウェブサイトから車を注文する機能を提供しています。車は工場の床からロールオフし、もちろん品質保証などで行う必要があることがいくつかあると思いますが、その後は離陸してあなたの家まで運転し、あなたの家の前に駐車して準備完了となります。携帯電話のTeslaアプリがその車をあなたの車両群に追加し、乗り込んで運転を開始できるようになります。

Neuralinkの画期的な進歩

また、Neuralinkには非常に壮観なアップデートがあります。ご覧の通り、Neuralinkの患者の一人がCall of Dutyをプレイしています。すぐに仮想ジョイスティックの制御のシミュレーションを見せます。つまり、彼は自分の心でバーチャルジョイスティックを制御できるのです。

これが患者の実際の脳に接続されているNeuralinkで、私の理解では、脳が送信する信号を解釈し、特定の出力に変換するよう時間をかけて訓練される実際のAIモデルがあります。この場合、彼はXboxコントローラーを動かし、リアルタイムでCall of Dutyをプレイしています。これについては別の動画を作成する予定です。本当に深く掘り下げる必要があると感じるからです。これは見ることができる本当に信じられない、信じられないことです。

フロンティアAI研究所のコーディング分野への注力

しかし、誰もが注目すべきだと思うことの一つは、これらすべてのフロンティアAI研究所が現在、注意の多くをどこに集中させているかということです。本当に大きな焦点はコーディングアプリにあるようです。

GoogleはGemini 2.5 Proを搭載したGemini CLIエージェントを最近ローンチしました。1日あたり大量の無料Gemini 2.5 Proコールを受けることができるので、彼らが提供する非常に寛大な制限があります。OpenAIの提供物と比較する場合、Anthropicと比較する場合、Googleは非常に競争力のある提供物を出して、まさにその戦いの中にいます。

もちろん、Claude Codeは例外的で、優秀なエージェントです。OpenAIは最近、数十億、最終価格は30億ドルだったと思いますが、Windsorを買収しました。

イーロンがGrok 4について、専門的なコーディングモデルにはもう一回大きな実行が必要だと言っていることに注目してください。イーロンはもちろん、構築している最大のデータセンターの一つであるColossusを持っています。

Grokの競争力と特徴

彼が発表してきたモデルの一部が最上位の地位にないのは公平に言えることですが、先頭集団を率いていないものの、かなり速くキャッチアップしており、データセンターや、さらには競合他社が利用できないTeslaが利用可能なデータで、かなり大きな優位性を持っています。

実際、私のGrokの取材を見た方なら、3だったか、その直前のものだったかは分かりませんが、Teslaがこれらのモデルをテストするために提案したベンチマークで、最高の物理的視覚認識の一つを持っていました。道路や道路標識などの現実世界の視覚的手がかりの理解に特化して、Grokは圧倒的に最高でした。

なぜそうなのかは秘密ではありません。彼らはブログ投稿でそれを説明しました。Teslaがアクセスできるデータ、つまり車が走行してデータを収集するデータを大量に使用し、そのデータを使ってGrokの特定の視覚的手がかりを認識する能力を改善しました。

イーロン・マスクの現実的な評価

聞いてください、イーロンは非常に論争の多い人物だということは理解しています。あなた方の中には彼を愛する人もいれば、嫌う人もいることは知っていますし、もちろんほとんどの人はその中間のどこかにいます。ですから、これを「イーロン万歳」や「イーロンブー」として受け取らないでください。状況を現実的に理解しようとしているのです。

私の最良の見解は、第一に彼が首位を取るのは簡単ではないということです。それが努力なしに起こることは期待していませんし、彼が首位にいることに必ずしも賭けるわけでもありません。しかし、彼らが脱落して、Grokの次の将来のイテレーションが無視されることも期待していません。イーロンは激しく追い上げてくるでしょう。

Grokのコーディング能力はかなり印象的でした。もちろんGoogleが信じられないコーディングモデルを発表して、それがショーを取りましたが、Grokは酷くはありませんでしたし、この新しいバージョンはかなり、かなり良いことを期待しています。

モデルバージョニングの意味と期待

もちろん、現実的である必要もあります。例えば3.5は約束されましたが、それは決して実現しませんでした。それは静かに廃棄され、今我々はGrok 4を発表しています。

多くの人々は、これらの企業がモデルの後に好きな数字を付けることができると思っています。5、6、7、または何でも言えるということです。現実は、それはそのモデルの訓練で使用された計算量を示すことになっているということです。つまり、名前の最後の各0.5の追加、例えば3から3.5へ、またはGPTで見たように、GPT-4からGPT-4.5への0.5の追加は何かを意味します。事前訓練計算の10倍の増加、つまり事前訓練中にモデルに投入するハードウェアリソースの量、ハードウェア時間の量を表すことになっています。

この記法はそれを表すことになっています。もちろん、それがそうでなければならないという法律はありませんが、技術的にはそれがそうあるべきものです。Grok 4がここ数週間以内にリリースされる時に、そのウサギの穴に入ることになりますが、Grok 3からGrok 4への飛躍は大規模であるべきだということを覚えておいてください。

「べき」というのは、もしそうでなければ、ここで尋ねるべき難しい質問があるということです。我々は何らかの事前訓練スケーリングの平坦化に達しているのでしょうか、それとも何らかのアルゴリズム的な問題に遭遇しているのでしょうか。Grok 4がローンチされる時にそれらすべてを把握することになりますが、当面は大きなものを期待しているということを理解することが重要です。Grok 4がGrok 3より10～20％良いだけなら、それは確実に非常に期待外れということになるでしょう。

SalesforceのAI活用と課題

その他のニュースでは、Salesforce CEOが会社の仕事の半分は現在AIによって行われていると主張しています。これは疑問を提起します。Salesforceは何をするのでしょうか。実のところ、Salesforceが何をするのか誰も知りません。知っている方がいれば、コメントで教えてください。Salesforceは何をするのですか。企業のジャーゴンの分かりにくい話はやめて、シナジーやパラダイムと言わないで、実際に何をするのですか。

もちろん少し冗談です。Salesforceは基本的に多くの異なる可動部分を持つ巨大なCRMです。顧客との関係や会社との関係を追跡するのに役立ちます。彼らが支払いをしているか、購入しているかなどです。

要点は、そこに実際にいてコードを作成し、異なるものが何を意味するかを正確に知らない限り、理解するのが少し複雑だということです。もちろん、Salesforce CEOはこのAIエージェントの波に大きく賭けています。

私のポイントは、これは注目すべき興味深いことですが、すべてを眉唾物として受け取ることです。AIエージェントの長期一貫性問題を解決した論文や企業や研究所はまだ見ていません。非常に有望な研究はたくさん見ていますし、例えば明日、この問題が解決されたことを示す論文が出てくれば、おそらく6～12か月後に、この仕事の多くを行うかなり強力なAIエージェントが現れることになるでしょう。

AIエージェントの現状と限界

とはいえ、まだそれを見ていません。Alpha Evolveのようなかなり強力なAIの種類のワークフローがあり、ほぼ自己改善する再帰的なもののようなものを見ることができますが、それでも人間のループです。それでも多くのコードと足場であり、システム全体を駆動するLLMですが、それはLLM＋足場＋ループ内の人間です。我々が自律的AIエージェントと呼ぶものではありません。

ところで、AIエージェントのこの長期一貫性問題が解決されたことを示す論文が出た場合、ここで最初に見ることになりますので、必ず購読してください。

コーディングエージェントの急成長

SwixのPostがあります。彼は言っています。「私は通常、コーディングエージェントに非常に前向きです」しかし、一体何なんだ、私は返信チャートを言うつもりです。文字通りY画像による重みのものと同じように見えます。進歩が垂直になり、我々はその断崖絶壁に立って、ちょうど離陸しようとしているように見上げているような感じです。これは超知能の端にいるような感じなのでしょうか、それとも次に何が起こるのでしょうか。

もちろん、多くのAIコーディングソフトウェアが本当に離陸し、非常に高く評価されているのを見てきました。GoogleがCLIの種類、彼ら自身のバージョンのようなものをローンチしています。誰もがそれについて非常に競争的です。GoogleはFirebaseでGemini CLIで彼らの種類の内部的なものをローンチしています。彼らは自分たちのインフラを構築しています。おそらく彼らも誰か他の人をGoogleの傘下やAlphabetの傘下に引き込むために大きな買収も行うでしょう。

しかし、なぜこれが起こっているのかが非常に示唆的だと思います。

コーディングアプリの構造と価値

再び覚えておいてください、これらのコーディングアプリの多くにとって、それを実現するために使用する構造の種類は何でしょうか。それはLLM＋足場＋人間です。優れたコーダーであるGemini 2.5 Proのようなモデルを取り、VS Codeのようなものと相互作用できるようにする何らかの足場をその周りに持ち、正しいコードを正しい場所に出力し、ワークフロー全体を台無しにすることなくそれを行うのに役立つ他のプロンプトなどもあります。そして、それを駆動し、すべてが正しいことを確認し、どこに行くべきか、何を構築すべきかなどを伝える人間があります。

これ全体が始まったとき、我々がすることはChatGPTに入力し、コードを取得し、そのコードをコピーして使用する場所に貼り付けることでした。それの問題は、AIモデルを所有する企業が実際にそこからデータを取得しないことです。そのコードがどこに行き、どのように動作し、どのように作業されるかなどを見ていません。

RepletやCursorやWindsurfやGoogleのFirebaseのようなアプリ内にすべてがある場合、それを所有する企業はそのワークフロー全体をエンドツーエンドで見ることができ、もちろんそれは彼らがそれを改善できることを意味します。これらの企業の評価がこれほど高いのは、人間を特定のプラットフォーム上でこのコードを作業させておくことが非常に価値があるからです。

完全自律コーディングエージェントの影響

明日、ある研究所がすべてのソフトウェア開発者よりも優れた完全自律のコーディングエージェントを開発したらどうなるでしょうか。RepletやCursorやWindsurfのようなこれらすべてのアプリが、価値がなくなるか、少なくとも彼らが評価されている何十億もの価値がなくなるように思われるでしょう。

これが私にとって意味すること、そして私が間違っているかどうか、同意するか反対するかを教えてください。しかし、これらのフロンティアAI研究所の多くは、このAIアシスタントコーディングが巨大で非常に効果的になり、誰もがそれを使用すると考えているが、すぐそこに完全自律コーディングエージェントは期待していないということは確実に思えます。

あなたがOpenAIで、他の会社を1年か2年で陳腐化させる技術にアクセスできる場合、その会社を30億ドルで購入しません。つまり、これが意味するように思えるのは、未来は人間とAIが一緒にコーディングすることであり、AIコーダーがすべてを処理することではないということです。

XAIの新しいコードエディター

この動画を録画している間に、これは速報ニュースです。昨日何人かの人々がそれに気づいたようですが、Nema OGに感謝します。しかし、私がフォローし、x.comで購読しているCadillac Newsのテストでは、XAIがGrokウェブ内で強化されたコードエディターに取り組んでいると言っています。これはまた、イーロン・マスクからの「専門的なコーディングモデルにはもう一回大きな実行が必要」という以前の言及とも一致しています。

コンピューターサイエンス教育の未来

このチャネルで、多くの人々がコンピューターサイエンスの学位のために大学に行っていて、それが陳腐化するのではないかと疑問に思っていることについて、私に何かを尋ねてきました。その質問に答えるのは非常に困難でした。

コンピューターサイエンスに興味がある場合、学習をやめるか、専攻を変えるように誰かに言うことは決してありません。それは悪いアイデアだと思います。しかし、ここ数ヶ月で、物事がどこに向かっているのかがより明確になったと感じています。それは次の10年、数十年の未来は基本的に人間＋AIハイブリッドコーディングだということです。

過去に慣れ親しんでいたものとは少し異なるかもしれません。もはやギターソロをやっているスラッシュのようにはならないでしょう。もう少しオーケストレーターのような存在になるかもしれません。様々なAIエージェントを必要なことを行うように導き、それを監視し、何も脱線しないようにしますが、これらのフロンティア研究所を所有する人々の誰も、完全自律コーディングAIエージェントがすぐに出現することに全財産を賭けているわけではないと思います。

Geminiを使った実践的なコーディング体験

もしこれまでに人生でコーディングをしたことがない場合は、お願いがあります。gemini.google.com/appに行って、現在最高のモデルを選択してください。今は2.5 Proですが、当面は最も大きなもの、最高のものを選択してください。Canvasを有効にしてください。これにより、アプリを作成し、ここのウェブサイトに直接表示させることができます。

そして、小さな視覚的シミュレーションやゲーム、または思いつくものを何でも作成するように伝えてください。3D都市交通グリッドのシミュレーションを作成すると言います。それは少し考えて、コードを出力し、そこにあります。3D都市交通シミュレーター。

ここでは様々なライトと車が動いて、ライトで停止しているなどが見えます。そこにバスのようなものがあり、赤信号で停止し、これが緑になると進み始めます。そこです。ここでコードを見ることができ、ここでプレビューを見ることができます。様々な変更を行うことができ、コードを説明してもらうことができます。

新しい学習アプローチの価値

これが非常に興味深い理由は、始める前に長時間物事を学ばなければならなかったからです。一部の人々の学習アプローチでは、これは非常にうまく機能します。我々の一部にとってはそうではありません。

過去にコーディングを試したことがあるが、始めるには少し複雑すぎ、複雑すぎ、威圧的すぎた場合、このアプローチの方がずっとうまく機能するかもしれません。このアプローチはまた、数年後のソフトウェア開発の未来がどのようなものになるかという我々の期待にずっと近いかもしれません。

パックがどこに向かっているかにスケートしたい場合、これは飛び込むのに素晴らしい方法かもしれません。もちろん、ソフトウェアエンジニアになりたい場合は、古典的なルートがおそらく最高ですが、パートタイムで新しいスキルを身に着けたいだけなら、これは素晴らしく機能すると思います。

ここまで見てくださった方、本当にありがとうございます。私はWes Rothです。次の動画でお会いしましょう。