イーロン・マスクがGrok 5について驚くべき発言を行い、AGI実現の可能性について言及している動画である。Grok 4が既にGPT-4oを上回る性能を示している中、Grok 5では視覚機能の大幅改善、新しい物理学の発見、企業ツールとの統合などが予定されている。しかし、真のAGI実現については懐疑的な見方も示されており、特にコーディング分野でのAnthropic社との競争や、一般ユーザーにとっての実用性について議論されている。

イーロン・マスクのGrok 5に関する発言
イーロン・マスクはここ数日間Grok 5について話しており、これは多くの人が思っているよりも大きなインパクトをもたらすと思う。だから、なぜGrok 5がAIにおける特別な瞬間になるかもしれないかについて動画を作りたいと思う。
先ほど言ったように、イーロン・マスクはここ数日間Grok 5について話している。この動画全体を通して前置きしておきたいのは、イーロン・マスクを批判するためではなく、彼は間違いなく自分の能力を本当に信じているということ、そして時にはそれがより楽観的すぎるタイムラインにつながるかもしれないということだ。
しかし、これまでのところGrok 4は様々な異なるベンチマークで全ての期待を上回っていることは言わなければならない。
Grok 4の驚異的な性能
先日、誰かがツイートで「批判者たちよ、今こそ出てこい。Grok 4 thinkingはArc AGI 2でGPT-4o Highよりもはるかに優れている」と言った。これがとても驚くべき理由は、Arc AGI2がまず第一に、人間が問題をどのように推論するかを多かれ少なかれテストする最も困難なベンチマークの一つだからだ。
そして、開発サイクルの観点から言えば間違いなくはるかに短いと言えるシステムであるGrok 4が、どうやって最先端システムに追いつき、さらには上回ったのか、ほとんどの人が疑問に思っている。
このツイートに対して、イーロン・マスクは「Grok 5は今年末までにリリースされ、圧倒的に優秀になるだろう」と回答した。
Grok 5への期待と懐疑
これが多くの人がGrok 5が実際に何を持つのかを疑問に思い始めた理由だ。Grok 5が持つであろう多くの異なる機能があり、ほとんどの人がそれに気づいていないと思う。それについてもっと詳しく説明していこう。
彼がここで言っていることの一つで、私はこの発言が少し楽観的すぎるかもしれないと正直思っている。個人的にはこの発言を信じていないが、イーロン・マスクの言葉を信じることもできる。彼は「Grok 5を見るまで待て。真のAGIになる可能性があると思う。これまでそのような感覚を持ったことはない」と言っている。
この発言が少し誇張されているかもしれないと信じる理由は、我々が知っているAGIは確実に複数のコンポーネントで構成されたシステムになるからだ。人間のような汎用知能システムを考えると、現在のスペクトラムでは、最先端のLLMでさえ現在持っていない幅広い能力の範囲があるということだ。
Grokに不足している全ての機能と、彼らが将来のアップデートで追加する予定のものを詳しく見ていくと、Grok 5が実際にAGIになることが少し現実離れしているかもしれない理由が理解できるだろう。ただし、おそらく最先端になるだろう。
イーロン・マスクの追加発言
私がイーロン・マスクの複数のツイートから一つのツイートを取り上げているだけだと思うなら、彼が文字通り「AGIを達成する可能性は無視できない。xAIは全ての要素を整える非常に近いところにいる」と言っている別のツイートを見ることができる。
つまり、イーロン・マスクが基本的に「みんな見て、我々は非常に非常に近いところにいる」と自分の角笛を吹いているか、または彼らがいくつかの重要なことに取り組んでいる可能性が高い。彼らはおそらくいくつかの重要なブレークスルーを達成し、「我々は既に最も困難なベンチマークのいくつかでGPT-4oを上回っている。Grok 5とゲームチェンジャーになるであろう全てを組み合わせたものを見るまで待て」と前向きに見ているのだろう。
ブレークスルーは常に起こっているので、50/50だと思う。xAIが前進したスピードには確実に驚かされた。
ライブストリームからの洞察
現実的に将来のアップデートが実際にどこに向かうのかを見ることができる重要な動画の一つはライブストリームからのものだった。このライブストリームで、彼らはいくつかのことを言っている。
私が気づいたことの一つは、Grok 4が本質的に目が見えないということだった。現在、Grok 4のマルチモーダル機能は他の主要なモデルと比較して非常にひどい。彼らは動画でこのことについて話しており、将来的には動画モデルとビジョンモデルを持つ予定だと述べている。
AGIを目指している場合に優秀なビジョンモデルが必要な理由はかなり明白だと思う。見ることができない、または動画を処理できないシステムは、人間のように問題について推論することができず、その世界モデルは十分ではないだろう。
現在のGrokの最大の弱点
現在のGrokの最大の弱点は、部分的に目が見えないことだ。画像理解と画像生成が明らかにもっと良くなる必要がある。それは実際に現在訓練中だ。Grok 4は我々の基盤モデルのバージョン6に基づいており、数週間で完成する予定のバージョン7を訓練している。これがビジョン側の弱点に対処するだろう。
訓練計算量の増加
次に彼らが話していることは、おそらく訓練計算量を増やすということだ。Grok 3はGrok 2の10倍、Grok 4は前のモデルの10倍だったと言っている。しかし、これらのモデルがS字カーブの上部に達し始めているという事実を考慮すると、それが当てはまるかどうか疑問に思う。多くの利得を絞り出すためには、より革新的な方法が必要になるかもしれないからだ。
スケーリングスケーリングスケーリングアーキテクチャはそれほどうまく機能しないかもしれないと思う。物事が遅くなっているというわけではない。HRMやその他のような異なるレベルのイノベーションが、純粋に計算量に焦点を当てるよりも、おそらくより追求される分野になるだろうと言っている。
計算量は確かに非常にうまく機能するが、彼らがそれを管理できるかどうかは興味深いところだ。
訓練の進歩について
訓練の観点から、最初の部分は、Grok 2からGrok 3、Grok 4に移行する際に、各ケースで本質的に訓練を1桁増やしているということだ。つまり、Grok 2の100倍の訓練量だ。そしてそれは増加し続けるだけだ。
率直に言って、ある意味では少し恐ろしいが、ここでの知能の成長は驚くべきものだ。
新しい物理学の発見
彼らが言っているもう一つのことは、Grok 5が主に新しい物理学を発見することができるようになるということだ。これはかなりクレイジーだと思う。もちろんGrokは馬鹿げたほど賢くなるだろうし、ほとんどの人が気づかないことの一つは、AIが平均的な人が実際にそれを使う必要がないほど賢くなるということだ。
これは現在GPT-4oが抱えている問題の種類だ。モデルが非常に賢いので、それが解決している問題や実際に進歩を遂げている分野について、平均的な人は知らないだろう。
例えば、Grok 5が物理学ベンチマークの境界を本当に押し広げることができるなら、普通の人として自分に疑問を抱くだろう。モデルはGrok 4からGrok 5にアップデートされたが、日常生活で改善を見ることはないだろう。
専門レベルでの能力
Grokは例外なく全ての分野でPhDレベルよりも優れている。これは時には常識に欠けることがあり、まだ新しい技術を発明したり新しい物理学を発見したりしていないことを意味するわけではないが、それは時間の問題だ。
今年後半にも新しい技術を発見するかもしれないし、来年までにそれをしていなかったら驚くだろう。Grok が遅くとも来年、そしておそらく今年末までに実際に有用な新しい技術を文字通り発見することを期待している。来年には新しい物理学を発見するかもしれないし、2年以内にはほぼ確実だと言えるだろう。
それをじっくり考えてみてほしい。
ツールの統合
Grokについて彼らが述べているもう一つのことは、より多くのツールを使用するようになるということだ。エージェント的な未来に向かって進む中で、Grokに企業ツールを使用させる予定だと推測している。具体的な詳細にはあまり触れなかったが、シミュレーションがどれほど優秀かということかもしれない。
Grokは現在、企業が使用するような本当に強力なツールを使用していないが、それは今年後半に提供する予定のものだ。企業が持つツールと非常に正確な物理シミュレーターを持つことになるだろう。
コーディングモデルについて
もちろん、ここでGrokが前進している明確な分野を得た。彼らが前進する主要分野の一つは、もちろんコーディングモデルだ。これはGrok 5の一部ではないと思うが、本質的に独自のモデルの一部になるだろう。
これまでTwitterで見てきたものだが、実際にどのようにこれを実現できるのか疑問に思う。現在でもGPT-4oはAnthropicからのマーケットシェアを奪うのに苦労している。Anthropicはコーディングモデルの制作に関して非常に優秀だからだ。
将来的には、本当にそこで優位性を持つモデルになるかもしれない。しかし、個人的にはGrok Codeがanthropicモデルと比較して良いモデルになるとは信じていない。おそらく比較的良いものになるだろうが、その市場は本当に勝者独占の市場だということを理解しなければならない。
直面するバグが非常にひどいので、わずかに劣るコーディングモデルを誰も使わないだろう。「絶対にこれは使わない」と思うだろう。より悪いモデルを使うと文字通り時間を失うので、Claude Codeにもっとお金を払った方がましだ。
Teslaエコシステムとの統合
コーディングを改善するかもしれないが、Grok 5がおそらく向かう全体的な方向を見ると、明確な分野の一つは、Tesla Optimusエコシステムの全てを繋ぐコネクターのようになることだ。
イーロン・マスクが言ったように、これらのLLMをOptimusと接続し、おそらく彼の会社間でいくつかの統合を提供する予定だろう。


コメント