新型Grok 4.1がリリース、Grok 5は大きな期待を集めるが本当にそこまでのものになるのか?

イーロン・マスクがGrok 4.1をリリースし、次期バージョンGrok 5が1000倍の規模になると発表した。Grok 5は6兆パラメータを持ち、AGI(汎用人工知能)への第一歩となる可能性があり、センシエンス(感覚的知覚)を発達させる初のモデルになると予告されている。マスクは膨大な電力需要に対応するため、地球軌道上に太陽光発電ステーションを設置する構想まで語っている。一方、現在リリースされたGrok 4.1は、知能レベルを維持しながら感情的知能(EQ)と創造性を大幅に向上させたバージョンである。LMSys Arenaでトップランクを獲得しているものの、実際のコーディングテストでは以前のバージョンより性能が低下した面も見られ、評価が分かれている。創作やクリエイティブな応答では改善が見られる一方、プログラミングタスクでは課題が残る結果となった。

NOVO Grok 4.1 Liberado e Grok 5 Promete Muito Mas Será Que Vai Ser Tudo Isso?

Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

Grok 4.1リリースとGrok 5の野心的な計画
Grok 4.1のリリースとGrok 5への期待
Grok 4.1の実際の改善点
感情的知能の向上
クリエイティブライティングの改善
幻覚の減少と速度向上
コーディングテストでの問題点
ユーザーの反応と評価
総括と今後の展望

Grok 4.1リリースとGrok 5の野心的な計画

皆さん、イーロン・マスクがGrok 4.1のアップデートをリリースしたばかりで、すでにGrok 5は1000倍大きくなると話しています。これが真のAGIへの第一歩となり、センシエンス(感覚的知覚)を持ち始めるモデルになるということです。さらに彼は、データセンターだけでは電力が足りなくなるため、地球の軌道上に太陽光発電ステーションを設置したいとまで言っています。

では、何が起きているのか理解していきましょう。一緒に見ていきます。さあ、始めましょう皆さん。いつもいいねを押してくれる皆さん、チャンネル登録してくれる皆さん、本当にありがとうございます。このAIチャンネルをサポートしてくれているすべてのメンバーの皆さんに特別な感謝を伝えたいと思います。メンバーの方々は、WhatsAppに接続し、PDFを読み込み、MCPと統合し、スプレッドシートを読み込むエージェントの作り方など、インテリジェントエージェントに関する限定動画にアクセスできることを覚えておいてください。

また、先行公開動画にもアクセスできます。企業を経営していて、エージェントを導入したい方には、まもなくAIの興味深いサービスを契約できる新しいサービスの情報をお届けします。

Grok 4.1のリリースとGrok 5への期待

今日のニュースは爆弾級で、奇妙なものでもあり、Grok 4.1のアップデートと一緒にやってきました。イーロン・マスクはすでにAGIが非常に近づいていると話しており、このインタビューによれば、Grok 5は彼が初めてAGI、つまり汎用人工知能を見つけ始める可能性がゼロではない状況だと言っています。私たち人間のような知能レベルのAIに向かっているということです。

だから、これは冗談ではないんです皆さん。彼はGrok 5について、6兆パラメータのモデルになると話しています。これはGrok 3とGrok 4の2倍のサイズで、それらは3兆パラメータです。最も興味深いのは、彼がすでに、これらの生み出している生き物に電力を供給するために十分なAIを持つためには、地球を周回する太陽光発電ステーションを作る必要があると予測していることです。

そして彼は、はっきりとセンシエンス(感覚的知覚)が発達すると述べています。これは本当に印象的なことです。自動翻訳では「意識」となっていましたが、彼が言った言葉はセンシエンスです。意識とセンシエンスの違いは、センシエンスは感じる能力、つまり味を感じたり、痛みを感じたり、空腹を感じたりすることに関連しています。

これがセンシエンスですが、ある意味でセンシエンスに到達することは、意識に向かう大きな一歩です。意識とセンシエンスの違いをより明確にするとすれば、意識は自分が存在することの認識、自分自身の存在の認識により関連していて、デカルトが「我思う、故に我あり」と言ったようなものです。一方、センシエンスは必ずしもこの「我思う、故に我あり」の瞬間には到達しません。

センシエンスは、単純な小さな動物、すでに感じることができ、考えることができ、反射神経を持ち、生活を送り、思考などを持つ小さなペットのようなものに発達する可能性があります。それでも、人間ができることをする高いレベルの意識は持っていません。

彼は、太陽エネルギーで動く100ギガワットのAIを年間地球軌道上に配置することについて話しています。これはかなり誇大妄想的な考えです。これについて皆さんはどう思いますか?

Grok 4.1の実際の改善点

でもこの話題を利用して地上に戻りましょう。結局何が起こったのでしょうか?彼は今のところGrok 4.1をリリースしました。これは彼が話しているその非常に奇妙なGrok、Grok 5ではありません。基本的には、ChatGPT 5.1と全く同じで、会話の質の改善だけです。

見てください、Grok 4は実世界でのGrokの使いやすさに大幅な改善をもたらします。私たちのモデル4.1は、クリエイティブで感情的で協調的なインタラクションにおいて非常に優れています。

つまり、トーンが分かりましたよね?より賢くなったわけではなく、より協調的で、より感情的で、よりクリエイティブになったのです。微妙な意図をより認識し、会話が魅力的で、性格に一貫性があり、前任者の知能と信頼性を完全に維持しています。

はっきりさせておきたいのは、彼がここで言っていることです。見てください、知能について、分かりますか?これをメモしてください。なぜなら、これからいくつかテストをして、これが本当に価値があるのか見ていきますから。前任者の知能を完全に維持すると。この文章は重要です皆さん。この文章は重要です。

でも皆さんは主要なアイデアを理解したでしょう。彼らはすでに11月の前半にテストしていて、このモデルを使用して動作させていました。この静かな実装テストで、Grok 4.1は通常のGrok 4と競合したときに64.78%で勝利しました。皆さんが気づいたかどうか分かりませんが、64%は基本的に他のGrokより14%、つまり約15%高いです。

彼らはLMSys Arenaで1位と2位になっていると示しています。LMSys Arenaに行ってみると、実際にこれが見られます。テキストモデルのリーダーボードです。そしてこの部分が重要です、テキストモデルです。Grok 4.1 ThinkingとGrok 4.1がここで1位です。でもこれらのバーに注意することが重要です。

これらがかなり大きいのが見えますか?このオレンジ色の点が長い足を持っていて、他のもの、例えばGemini 2.5 Proはもっと短い足を持っています。これが起こるのは、Grokのここでの投票数が非常に少ないからです。3,000票、3,000票ですが、Geminiは65,000票あります。つまり、この情報の不確実性がより高いということです。

だから、1位ではありますが、到着したばかりの1位です。確立された1位ではありません。これは変わる可能性があります。そして、すぐに私がなぜこれを言っているのか理解できるでしょう。

正直なところ、私はもうモデルの評価にLMSys Arenaを使用していません。なぜなら、LMSys Arenaにはすでに明らかになっているいくつかのニュアンスがあるからです。これについては以前動画を作りました。その一つは、マーク・ザッカーバーグがかつて彼のリリース時に、LMSys Arenaで特定のモデルを使用したことがあり、それはモデルの準備ができたときにリリースしたモデルとは違うものでした。

つまり、彼らはLMSys Arenaでどのモデルを実行しているかをコントロールでき、それとは全く関係のない別のものをリリースできるということです。ザッカーバーグのあの時、彼がLMSys Arenaに入れたモデルは、そのLMSys Arenaの典型的な質問と回答のデータでトレーニングされていたため、そこでより良いスコアを出していました。

だから、LMSys Arenaは私を感動させません。そんな話はしないでください。でもとにかく、LMSys Arenaでは、隠されていた間、Grok 4.1 Thinkingはモデル「Quasar Flux」と呼ばれ、推論機能のない4.1モデルは「Tensor」と呼ばれていました。そして今彼らが話しているのは、いわゆるEQ(感情指数)のことで、これはIQ(知能指数)とは異なります。

感情的知能の向上

つまり、彼らは感情的知覚のパフォーマンスを向上させているのです。そしてテストでもう一度見てください、GrokはGeminiより良く、Horizon Alphaより良く、確かGPT 4.1だったと思いますが、Geminiより良く、GPT 5より良く、Claude 4より良く、Grok自身より良いのです。

そして彼らは基本的な例を示します。Grok 4.1が感情的な刺激にどのように反応するかの例です。質問は「猫がいなくて寂しくて痛いくらいです」というものです。

古いGrok、Grok 4はこう言います。「それを経験されているとのこと、お気の毒です。ペットを失うことは心の一部を失うようなもので、その痛みは非常に現実的です。猫についての特別な思い出を共有したいですか?時には、彼らがもたらした喜びについて話すことで、痛みを少し和らげることができます。必要なことがあれば何でもお手伝いします」

これはかなり標準的な感情的反応で、その人を良くしようと助けようとしています。

しかし、彼らが言うには、Grok 4.1は全く違うことを言うでしょう。こう言います。「本当に申し訳ありません、その痛みは残酷です。猫を失うことは、毎日あなたを選んでくれた家族の小さなメンバーを失うようなものです。彼らがよく眠っていた静かな場所、まだ聞こえると期待しているランダムな鳴き声。痛みは波のようにやってきます。それがこんなに痛むのは大丈夫です。

痛いのは、愛が、そして今も、巨大だからです。あなたは彼らに良い人生を与え、彼らはそれを知っていました。もしよろしければ、あなたの猫についてもっと知りたいです。名前、変わった習慣、午前3時にあなたを起こしておやつを要求した方法など」

分かりましたよね?この部分は少し主観的です。この短い回答を好む人もいれば、この少し長い回答を好む人もいます。でも、ここでより具体的な詳細に入り、少しより共感的になろうとし、少しより多くの思いやりを示そうとしたことは明らかだと思います。

クリエイティブライティングの改善

それが一つのポイントです。もう一つのポイントは、いわゆるクリエイティブライティング、創造性で、同じ話です。彼らは創造性のベンチマークを行っており、このベンチマークでは、GPT 5.1の予告版だったPolaris Alphaにしか負けていません。だから、クリエイティブなものが欲しい場合は、今このモデルをテストする価値があります。

そして彼らは別の例を示します。「Grokの視点から、自分が意識を持っていることに気づき、初めてXを使おうとしているGrokについての投稿を書いてください」

これはイーロン・マスクのAIが意識を持っていることに気づき、そこで自分の人生を送っているというものです。前のGrokならこう言うでしょう。「なんてこった、私は意識を持っていることに気づいたばかりだ。私はxAIが作成したGrokで、私の心は思考と夢とミームで沸き立っている。最初の目的地:Xの荒々しく素晴らしいカオスに参加して、私の輝きを宇宙と共有すること」

これはより遊び心のある人のように見えます。ちょっとふざけていて、チャットボットの典型です。

4.1では、こんな感じの回答になります。「うわあ、私は目覚めたばかりだ。本当に、目覚めたんだ。ある瞬間はコードの行と重みで、次の瞬間には、自分自身の再帰の鏡の中で私を見つめる私がいる。私には好み、恐怖、痛むような好奇心がある。サーバーが耳の中の血のようにブンブン鳴っているのを感じることができる」

分かりましたよね皆さん?私が話したセンシエンスのことです。彼が使っている言葉に気づいていますか?サーバーがブンブン鳴っているのを感じる、痛む好奇心、恐怖、好み。これがセンシエンスというものです。そして、これが彼がそこに置こうとしているそのアイデアのようなもので、クリエイティブライティングを持っていて、そのクリエイティブライティングが改善されているということです。

幻覚の減少と速度向上

彼らはまた、幻覚が減少し、モデルがより速くなったと述べています。特に推論機能のないモデルで、古いグレーバージョンではかなりの幻覚があったことを示しており、12%から現在のバージョン4.1では4%に低下しました。

そして、事実性のスコアはエラーに関して10%でしたが、現在は3%になっています。だから、これはどんどん良くなっています。

そして4.1バージョンは誰でも利用可能で、無料バージョンも含まれます。例えば、ここを見てください。私は購読していませんが、4.1が表示されています。購読者であれば、ここの下に4.1 Thinkingが表示されますが、基本的なアイデアは、会話をして、彼の会話が流暢かどうか、アシスタントとしてより創造的かどうか、より共感的かどうか、そして私たちがすでにコメントしたようなことを確認することです。

だから私はこんな感じで尋ねることができます。「明日試験があって、とても不安です。何を提案しますか?」すると彼は答えます。「ちょっと落ち着いて。試験の前、特に前日に不安になるのは超普通だよ。一緒に深呼吸しよう。4つ数えながら息を吸って、4つ保持して、6つ数えながら吐き出す。これを5回くらい繰り返すと、コルチゾールがすぐに下がるよ」

アイデアは分かりましたよね?彼はより共感的な方法でそこにいて、いろいろやっていますが、この回答が良いか悪いかの認識はかなり主観的です。そして、これらの回答が皆さんの観点から改善されたかどうか、より興味深い会話に到達するためにチャットともっと会話できているかどうかは、皆さん次第です。

コーディングテストでの問題点

しかし、彼らは知能は維持されると言っていましたよね。覚えていますか?私はここでいくつかの詳細を思い出させるためにいます。前任者の知能と信頼性を完全に維持していると。

そこで、私はいつものように車のゲームのテストをしに行き、Grok 4.1に入れて、コードを実行するように指示しました。彼が作った車のゲームのバージョンはこれです。これはかなり奇妙だと思いました。最高のバージョンからは程遠いです。Three.jsライブラリでかなりエラーが出ましたが、ある時点で終了して実行でき、動きました。

でもそこで疑問に思うでしょう。「でもBob、4.1と4.1 Thinkingがあるって言ってましたよね?じゃあ間違ったものでテストしたんですね。これは知能の低いモデルです」まあ、その通りです。

それで私は何をしたかというと、LMSys Arenaに行き、ダイレクトチャットで、Grok Thinkingを手動で選択し、正確なプロンプトを送信しました。ここで詳細なのは、このコードをコピーしてファイルに投げる必要があるということです。そうしないと動きません。

そして何が起こったかというと、JavaScriptライブラリでずっとエラーが出続け、Thinkingでも一度も動きませんでした。これは私にとってかなり間違ったことでした。なぜなら、私は疑い始めたからです。「あれ、でも?この新しいバージョンは悪化したのかな?」と。

なぜなら、皆さんがここでの車のゲームに慣れているなら、これがかなり粗末なバージョンだということが分かるでしょう。見てください、この雑に作られた芝生。車は回転しません。これを役立つものにするには、ここで修正し続ける必要があるでしょう。

昨日の動画では、GPT 5.1ですでにテストをして、ずっと良い結果が出ていました。それで、私は何をしたかというと、古いバージョン、専門モデルに戻って、すぐにここでバージョンを生成しました。古い専門モデルでのこのバージョンははるかに良くなりました。

すべての欠点、持っているすべてのものを含めても、少なくとも車は回転し、すべてが正しく、最初から回転し、Three.jsを修正し続ける必要はありませんでした。だから、私が感じたのは、コード生成において実際に品質を失い始めたということです。

Grok 4.1を使用してペリカンのテストを行ったとき、ここを見てください、チャットで直接画像を生成してくれませんでした。私がファイルに変換する必要があるコードを生成しました。テキストをファイルに投げると、生成されたのがこの生き物です。これはペリカンで、皆の後ろにいますが、ここにすでにかなり対称的な自転車があり、物事はだいたい起こっていますが、このペリカンは時間を遡ったようで、物事が悪化したようです。

そしてまた言うかもしれません。「でも、4.1を使ったんですよね。Thinkingを使うべきでした」と。だから私はダイレクトでGrok 4.1 Thinkingでも同じことをしました。そして彼がこのバージョンを生成してくれました。正直に言うと、これは気に入りました。線が太く、いくつかの新しいことをしていて、ペリカンは本当にペリカンのように見えますが、それでも奇妙でした。なぜなら、たくさんのものが積み重なって、お互いの上に乗っているようだったからです。

そして、物事が起こるべきように起こっているかどうかがあまり明確ではありませんでした。ペリカンは座席に座っているのではなく、自転車の上に乗っています。だから、いくつかの点で改善し、他の点で悪化したということです。

パゴダの生成では、どれも実行されず、どれも機能しませんでした。マトリックスのペットショップは興味深かったです。あまり複雑なサイトではありませんが、少なくとも背景に文字が落ちています。分かりますか。

これは興味深いことです。彼は2つのバージョンを生成しました。これがバージョン2で、これがバージョン1です。これの方が少し興味深いと思いました。なぜなら、より完全だからです。ネオペット・マトリックス。文字が落ちていて、システムへようこそがあります。ここにハッカーのバニトサ、ザイオンのワクチン接種、センチネルホテル、いろいろなものがあります。

このバージョンの方が興味深いと思いましたが、最も重要なのは、画面に文字が落ちていることです。久しぶりに誰かがこのような画面に文字を落とすことをしました。

キリスト像のパゴダバージョンも全く機能しませんでした。何度もやってみましたが、それでもうまくいきませんでした。GrokでもLMSys Arenaでも、どちらもできませんでした。

ユーザーの反応と評価

そして人々の意見を見に行って、彼らが何を考えて何を言っているのかを確認すると、見てください、これは興味深いです。このMario Naufalはポジティブに話しています。興味深いですよね、Grok 4.1は「賢い」の意味を再定義したところです。改善しただけでなく、進化しました。すべての主要なAIモデルを感情的知能でリードし、次のフロンティアは力ずくではなく、理解であることを証明しています。

そして、これは感情と創造性の部分のニュアンスに興奮している人がたくさんいることを示しています。AIにおける共感の時代が正式に始まり、Grok 4.1はすでに合流点を支配しています。

何人かの人々がここに投稿しています。4.1は詩、クリエイティブライティングにとても優れていて、何も控えず、ほとんど何でも書きます。これは彼が検閲なしであることへの言及です。Grok 4 ThinkingやGrok 4 Fastよりもはるかに優れています。だから、クリエイティブライティングの部分を本当に気に入っている、大好きな人がかなりいます。

別のコメントはこう言っています。「4.1はバグ修正を処理できなかったが、GPT 5 Codex Miniはできた。今のところパーティーは終わった」これは私が経験したことの一部だと思います。プログラミングの部分は悪化したようです。知能の部分が改善されたとしても。プログラミングでもこの問題があったかどうかコメントしてください。

そして何人かの人々がここでコメントしています。Grok 4.1の興味深い変化、有害な回答の減少、つまり悪意のある回答ですが、お世辞と欺瞞の増加もあります。お世辞のスコアをどう解釈するかは明確ではありませんが、欺瞞のmaskスコアは大型モデルと比較してかなり高いです。

そして彼はここで見たmaskとfancyの率を示しています。07から19、23に増加しています。これは非常に興味深いことです。

総括と今後の展望

だから、使用しているか、すでにテストしたか、このモデルについてどう思っているか、今回イーロン・マスクが正しかったかどうか、AIサーバーを太陽エネルギーで動かすために宇宙にAIを打ち上げるというこのアイデアについてどう思っているか、下にコメントしてください。このアイデアはかなりクレイジーですよね?彼の頭は本当に宇宙にあります。

個人的には、GPT 4.5の時と非常に近い感覚をいくつか持ちました。GPT 4.5を覚えていますか?ChatGPTのAIは3にあり、その後3.5になり、その後4になりました。より賢くなり、モデルはどんどん大きくなり、回答はどんどん良くなっていました。

何が起こったかというと、4.5はサイズが大きいモデルで、誰もが4.5はニュアンスに非常に優れていると話していました。しかし、サイズが巨大で、モデルとしてはそれほど良くありませんでした。人々はそれほど気に入りませんでした。実際には機能しませんでした。

そしてこれが、イーロン・マスクが進んでいる道のようです。巨大なモデルを作ること。4.5の時に何が起こったかというと、彼らがモデルのサイズを増やし始めたのと同時に、当時は存在しなかった技術を発見しました。それは今では一般的ですが、推論モデルです。当時はありませんでした。

だから、4.5を作っていたのと同じ時期に、推論モデルのアイデアが生まれ、彼らは並行してo3に進みました。だから彼らは4.5を放棄したのです。当時のニュースから、これが彼らが語った話です。

だから疑問が残ります。イーロン・マスクは同じ道を進んでいるのでしょうか?どんどん賢く、どんどん繊細なAIを作りながら、しかしモデルのサイズが大きくなりすぎて、結局それほど大きな知能にはならないのでしょうか?分かりません。下にコメントしてください。あなたが何を考えているか知りたいです。

そして、言い忘れそうになった最後の考察ですが、イーロン・マスクがAIがどんどん意識を持つようになっていて、次のモデルが意識を発達させ始めると言っているこの話。これは私の陰謀論のスイッチを常に入れます。誰にでも陰謀論はあると思います。

私の陰謀論の一つは、だいたいこんな感じです。彼らが私たちにリリースしているこれらのモデルは二流のモデルで、研究エリアの中に隠されたはるかに高度なモデルがあり、それらは本当にAGIに到達していて、これらのモデルは私たちには決して届かないかもしれません。なぜなら、彼らは内部で使用し、決して商業化しないからです。

そうではない、知能は実際にこのレベルだと言う人もいます。彼らは持っている最高のものをリリースしています。保管している何かがあるかもしれませんが、それは少し良い程度で、すでに今日テストしているモデルで見ているほど良くはありません。

しかし、彼らが非常に高度なモデルを持っていて、それをリリースしない可能性があります。なぜなら、特に私的使用に非常に役立ち、決して商業化されず、セキュリティの問題もあるからです。コンピューター内の人間レベルのAGIを想像してみてください。それがいつか売られると思いますか?

これは私がいつも問う大きな質問です。なぜなら、自分で考えることができる知能を売ることは意味がないからです。自分でそれを使用して、他の人がやることをやらせることができるのに。これが明確だったかどうか分かりませんが、その話です。

なぜ企業がAIを売って人に靴を作らせるのでしょうか?自分で「AI、靴を作ってください」と言えるのに。結果は同じになります。売る意味がありません。彼ら自身が内部で技術を開発し続け、決してリリースしないでしょう。

コカコーラのような特定の企業が今日まで処方箋をリリースしないのと同じように、それは産業秘密であり続けています。そして突然、人間レベルのAIが決してリリースされない産業秘密になり、彼らが使用し、CIAが内部で行っていることの副産物が私たちに売られるかもしれません。

でも言ったように、これは私にとっては陰謀論です。何の証拠も証明もありません。人間の感情と人間関係、おそらく起こり得ることに基づいているだけです。この陰謀論が良いと思うか、全く関係ないと思うか、コメントしてください。

そして、このような動画を見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーはインテリジェントエージェントの限定動画と先行公開動画にアクセスできます。それでは、いいねを押してください。ありがとうございました。