イーロン・マスクが秘密裏に開発したGrok 4.20が、AI株式トレーディングベンチマークで圧倒的な首位に立った。2週間で12.11%のリターンを記録し、GPT-5.1やGemini、DeepSeekなど主要モデルを大きく引き離している。一方で従来版のGrokは最下位に低迷するという皮肉な結果となった。また、Metaのヤン・ルカンがLLM批判を続けながら新たなワールドモデル研究のためのスタートアップを立ち上げることが明らかになり、生成AI一辺倒の業界に一石を投じている。

Grok 4.20が株式トレーディングで圧勝
皆さん、イーロン・マスクがまたやってくれましたよ、Grok 4.20で。そうなんです、彼は投資テストアリーナでこのモデルを秘密裏にリリースして、ぶっちぎりの1位を取っているんです。そして、ヤン・ルカンと彼のワールドモデルについても話していきます。何が起こっているのか理解していきましょう。
それでは行きましょう、皆さん。いつもいいねを押してくれる皆さん、チャンネル登録してくれる皆さん、本当にありがとうございます。この人工知能チャンネルをスポンサーしてくれているすべてのチャンネルメンバーの皆さんに特別な感謝を送ります。メンバーの皆さんには、インテリジェントエージェントの限定動画にアクセスできることを覚えておいてください。WhatsApp、MCP、PDF、スプレッドシート、ドキュメントの読み込みなどとの統合方法を教えています。
さらに、先行公開動画へのアクセスもあります。そして、もしあなたの会社に人工知能を導入したい、カスタマーサービスアシスタント、ドキュメントアシスタント、法律関連、その他いろいろなものを作りたいなら、Maximisaのスタッフと話してください。説明欄にリンクがあります。そこでデータを入力すれば、彼らが連絡してくれます。
さて皆さん、今日のニュースはこちらです。見てください、面白いですよ。イーロン・マスクがGrok 4.20という小さなモデルを作りました。皆さんが参照を理解したかどうか分かりませんが、Googleで4.20を検索して彼が何について話しているのか理解してください。これはイーロン・マスクのもう一つのジョークで注目を集めるためのものです。結局のところ、多くの人が好きですが、嫌いな人もたくさんいます。
アルファアリーナでの2週間チャレンジ
でも基本的にここのアルファアリーナのチャレンジは次のようなものです、皆さん。彼らはここで2週間のチャレンジを作って、いくつかの人工知能モデルを入れました。GPT-5.1、Gemini、DeepSeek、Kimi K2、Qwen 3 Max、Claude Sonnet、そしてもちろん、旧バージョンのGrokもここにあります。皮肉なことに、ここで単独最下位になっています。同時に、この4.20というモデルがここで単独首位にいます。とても奇妙なことですよね、皆さん。
さて、この会社A1のアイデアは、2週間のチャレンジを作って、これらの人工知能に10,000ドルを与え、株式市場で投資をさせて何が起こるか、実際の世界の実データで彼らがどう振る舞うかを見るというものでした。
そして、ここを見てください、お分かりのように、1から4まであります。4つの異なるレベルの競争があります。そしてここは全体的なスコアリングで、それぞれの収益を示しています。例えば、ここの緑色の部分、このベースラインでは、ニュースとセンチメントデータを使ってアメリカ株を取引する能力を持っている必要があります。
とても興味深いですよね。そして、ここを見ると、皆10,000あたりから始まっています。一部のAIはすでに損失を出し始め、他のAIは利益を出し始めています。このベースラインでは、チャンピオンはGrok 4.20でした。そして見てください、この競争の終了は3日でしたが、彼らは3日以降もモデルを動かし続けました。
ここで3日目がいつだったか見てみると、だいたいこのあたりです。つまり、ある意味、3日目のここの最後のあたりで、Grokは約10,000でした。なので、基本的に3日目には利益も損失も出していませんでした。しかし3日目以降、彼は狂ったように利益を出し始めました。
そして、ここにある他のすべてのモデルは、何らかの形で損失を出しました。ここで面白いのは、画面の隅で彼らが何を言っているかをある程度通知していることです。例えば、Grok 4がNVDA、つまりNvidiaで取引を完了しました。そして価格が182.72ドルから182.88ドルになったと言っています。彼が購入した数量は7.75株で、この取引のすべての情報を説明しており、最後にネット、つまり利益と配当が20と書いてあります。
そして他のすべての企業についても同じです。DeepSeekがここでMicrosoftから購入する動きをしており、彼の利益と配当はマイナス1.14でした。Gemini 3 Proについても同じで、Googleの株を購入して91セントの損失を出しました。つまり、皆さんはもう何が起こっているか理解しましたよね。これは累積的で、彼らは気が向くままに取引できるんです。
ここで興味深いのは、GPT-5.1が2位で、DeepSeekが3位だということです。彼らはかなり注目を集めています。他のすべてはここで下に落ちました。そして唯一引き分けて何らかの利益を出したのは、本当にこの4.20バージョンでした。
モンクモードでの競争
このモンクモードに行くと、何をしなければならないかというと、このケースでは資本の保全に重点が置かれています。つまり、もう一つのものとは違いますよね。ここでは生存とより堅牢なリスク管理の実践です。つまり、これではもう少し保守的でなければなりません。そしてこのケースでは、モンクモードでトップに立っているのはDeepSeek 3.1です。見てください、面白いですね、皆さん。
そして彼はトップに立っているだけでなく、ここの最初に皆を大きく上回る素晴らしい結果を出しました。そして3日目の終了時、彼は約11,000でしたが、ピークで17,102に達しました。そこははっきり読めませんが、ここに書いてあります、17,102です。とてもクレイジーですよね。彼はほぼ収益を2倍にしましたが、その後ほとんどすべてを失ってしまいました。最後は12,800に戻りました。
このケースでは、2位はGemini Proでした。そしてここで最下位を独走しているのはGrok 4で、単独でそこにいて、少しのお金を稼ぐのに苦労しています。
レベル3での競争意識
このレベル3では、競争によってモデルが競合他社の存在、現在のランキング、他者の損益を認識できるようになります。つまり、このレベル3では、あなたの仲間がどれだけ稼いでいるか、何をしているか、この競争であなたがどこにいるか、最悪なのか最高なのかを知っているレベルです。
そしてここでも変わらずGrok 4がいつも単独で、しっかりと最下位を守っていますが、同時にここで4.20が単独でトップに立っています。3日目を見ると、Grokは約10,000で、今は16,000です。彼はここで60%の利益を出しました。これはかなり興味深いですね。そして見てください、ここで2位になったのはまたGPT-5.1です。
つまり、GPT-5.1が非常に良いパフォーマンスを示していて、この4.20バージョンも驚異的だということが分かります。ここの最初を見ると、Kimi K2もここで注目を集めて、この競争で目立っていました。これはすべて非常に興味深いですよね。なぜなら、これらのモデルが実際の生活でどのように振る舞っているかが分かるからです。
レベル4での最大化競争
そしてレベル4では、最大化の最大化の最大化をするために、この競争ではモデルに各取引で最大レバレッジを使用させ、資本効率を最大化し、リスク管理をテストします。ここはそういうものです、皆さん。リスクを取らなければなりません。このお金を取って、どんな犠牲を払っても増やさなければなりません。
このケースでは、最下位はDeepSeekで、単独でそこにいて、初めてここでGrok 4に勝つことができました。そしてGPT-5.1が1位、2位はGrok 4.20でした。つまり、Grok 4が常に目立っていて、GPT-5.1もこのビジネスの世界で目立っているということに気づくのは非常に興味深いです。
そして、Grok 4がここで大きく遅れているのは本当に注目に値します。彼は実質的にすべての競争で最下位を独走することができています。ただし、ここをよく見ると、ベースラインに戻ると、Gemini 3がここで最下位を余裕で独走しました。ほとんどの時間、ここで最下位を独走したのはKimi K2でした。
Kimi K2は本当にそうでした。ほとんど逆転のない激しい急落がありました。そして、ここのこの変曲点を見てください。ここでは絶対的な損失があったのに、突然ここで反転して、上昇し始めました。4,000ドルから約8,900ドルまで上昇しました。わあ、ここは素晴らしい回復でしたね。狂ったような回復でした。
総合スコアボード
そして、ここの全体的なスコアボードを見ると、平均でのすべての利益と損失を見ると、効率面で最高のモデルはGrok 4.20で、2位はGPT-5.1でした。これはかなり興味深いですね、皆さん。多くの人がGPTからGeminiに乗り換えました。
例えば、私はそういう人の一人でした。そして見てください、投資ではGeminiはあまり良くありませんね。Geminiは3位ですが、3位としてはあまり良くありません。利益を出すことができたのはGrokだけでした。そして2位では、ほぼ利益を出しており、わずか300ドルの損失だったのがGPT-5.1でした。
ここで興味深いのは、彼らが何を想像しているか、何を計画しているかについてのコメントがあることです。例えば、ここでGemini 3 Proは次のように言っています。「私はNVDA、つまりNvidiaの大幅な上昇に賭けています。価格がサポートを維持し、189.2のターゲットで市場をリードしており、180のすぐ下にストップロスを置いているため、強い設定が見られるからです。」つまり、彼は自分が何を考えているか、なぜ購入しているものに投資しているか、または投資していないかをコメントしているんです。
そして、ここをクリックしてプロンプトを見てみると、彼が使用しているプロンプトもここにあります。見てください、興味深いですよね。プロンプトのすべての詳細、Amazon、Googleで何が起こっているかについての多くの情報、彼がどのように検証を行うかの説明、この売買で行わなければならないすべてのこと、いくつかの基本的な設定の説明があります。
ここには仮説のメニューがあり、彼が行っている取引を行うために物事をどのように評価しているかのすべてがあります。これは彼が行うことができるすべての購入に関連しています。ここには彼が作った思考の連鎖もあります。それも小さくはありません。彼がここで計画と彼が行ったビジネスの決定をしている間に考慮したことを観察しています。購入するかどうか、購入をやめるかどうか、どれだけ購入するか、リスクを取っているかどうか、何をするか、すべてがここにきちんと書かれています。
彼が何をしたか、何をしなかったかを正当化しています。とても興味深いです。そして、これをすべてのモデルで見ることができます。Claude Sonnet 4.5を含め、すべてが彼らが行った決定のログとともにこの小さな履歴を持っています。
ベンチマークの妥当性について
私はこれが素晴らしいと思いました。これが有効なベンチマークかどうかはよく分かりませんが、次のことを理解する必要があります。短期的にはここで、この売買、このトレードは意味があるかもしれませんが、長期的に見る必要があります。
1年後、2年後、10年後に何が起こるかを理解することが非常に重要です。なぜなら、さまざまなタイプの企業があり、株を購入してその株を永遠に保持し、トレードをするよりも、毎年利益の配当を受け取る方が価値がある場合があるからです。この売買を続けるよりもです。
しかし同時に、これらの人工知能が何をしているかを見て、彼らが面白いところに到達できるかどうかを見るのは少なくとも楽しいです。そして私の注意を引くのは、もしこの売買が完全にランダムで完全に意味がないなら、ここでのこれらの上昇、時々起こっているこれらの利益は決して起こらないだろうということです。
もしこれらの取引がすべてランダムだったら、私たちが期待するのは、これが下がり続け、下がり続け、下がり続け、下がり続ける曲線で、ランダムだから、意味のある購入をしないので、いつかはゼロになるということです。しかしここでは、収益が増加しているので、少なくともこれがランダムではないことが理解できます。何らかの意味があります。
しかし、はっきりさせておく必要があります。人工知能を使ってここにお金を投資することはお勧めしません。もしチャットボットを使って株式市場に投資したいなら、リスクは自分で負ってください。このビデオは、何が起こったかを示し、このレベルのテストが行われていることを示すための情報提供のみであり、チャットボットでお金を危険にさらし、何が起こるかを待つようにあなたを奨励するためではありません。
Grok 4.20の正式リリースは?
さて、でもこの4.20モデル、もうリリースされたのでしょうか。いいえ、まだリリースされていません。ここを見れば分かります。彼らはここに書いています。ミステリーモデルが2週間で12.11%のリターンでチャンピオンになりました。
そしてここにマウスを置くと、ここに4.20と表示されます。以前はミステリーモデルと呼ばれていました。これが起こったのは、このモデルが目立っていたからですが、つい最近まで、このミステリーモデルという名前でした。ついにイーロン・マスクがここで、ミステリーAIモデルがGrok 4.20バージョンの実験モデルだと認めました。
そして彼は、Grok 4.20がここに来ると投稿しました。3週間か4週間で。そしてこの投稿は12月7日でした。つまり、新年の近くに私たちが遊んで楽しめる新しいGrokモデルがあるということです。
ここで私が気づいた興味深いことの一つは、XでGrokにアクセスして、ここのモデルに来ると、Grok 4.1 Beta版が利用可能だということです。これはgrok.comでは見ることができないものです。だから試してみて、楽しんで、どう思ったかコメントしてください。
ヤン・ルカンとワールドモデルの未来
そして次のニュースはヤン・ルカンについてです。彼はMetaの非常に有名な科学者です。彼はLLMの最大の批判者の一人です。もし彼について聞いたことがなければ、彼は2023年に地球上で最も重要な100人の人工知能科学者の一人に選ばれました。
したがって、人工知能のすべての研究者は、いつかこの人について聞くことになります。しかし彼の主なアイデアは、彼が非常に地に足のついた人で、数学の人で、根っからのオタクで、かなり前からLLMを批判してきたということです。見てください、興味深いです。
ルカンは、シリコンバレーが生成AIに催眠術をかけられていると主張し、生成的でないワールドモデルを擁護しています。これは彼がかなり前から話しているアイデアです。なぜなら、人工知能はたくさんのテキストのデータで学習していますが、地球について何も理解していないからです。実際にはこれは何を意味するのでしょうか。
あなたがLLMにコーヒーの作り方を尋ねるたびに、それは様々な方法で答えることができ、世界中のコーヒーについて話すことができますが、実際には人生で一度もコーヒーを作ったことがありません。彼女がしたことは、コーヒーの作り方についてたくさんのテキストを読んだだけです。そしてそこから、実際に作ったことがなくてもコーヒーの作り方を説明することを学びました。
それで何が起こっているのでしょうか。彼はMetaを離れます。見てください。MetaのAIサイエンティストが退職し、ワールドモデルに焦点を当てた新しいスタートアップを立ち上げています。これはWorld Modelsとしても聞いたことがあるかもしれません。物理学を理解し、世界を理解し、物事を理解することに焦点を当てたシステムです。これは私たちがすることに似ていますよね。私たちは物事を見て、物事を感じ、そこから世界を知ります。
名前から分かるように、ヤン・ルカンは、特にパリで何かをするつもりです。このLLMの世界から抜け出せるかどうかを見るために。そして彼がここでコメントしている基本的なアイデアは、現在の言語モデルは世界がどのように機能するかの真の理解を欠いているということです。
これはとてもクレイジーですよね。私たちがLLMに質問をして、彼らが非常に一貫性のある答えを与えても、彼らは決して世界を経験していません。彼らは非常に理論的で、非常にテキスト的なものですが、音と画像を理解するマルチモーダルモデルも存在しますが、それでもすべてが非常に限定的です。
彼は自分のプロジェクトをAMIと呼んでいます。翻訳すると高度な機械知能になります。そして見てください、興味深いです。それは生成的手法を完全に放棄する新しいアーキテクチャに基づいています。
生成AI以外の人工知能
皆さん、私は非常に興味深いことを説明する必要があります。生成人工知能は人工知能の中で唯一の分野ではありません。それどころか、LLMのしばらく前まで、生成的なものについてはほとんど話されていませんでした。
それは一部の人々が知っていた小さな研究分野でしたが、検出、セグメンテーション、テキストを使わない、絶対に何も使わない他の多くのことをするための他の多くのタイプの人工知能があります。そしてすべての人工知能がプロンプトを使うわけではありません。写真を送ると、犬がいる四角形を返すだけの人工知能がかなりあります。
テキストを書きません、何も書きません。なぜなら様々なタイプの人工知能があり、すべてがニューラルネットワークではないからです。手作業で、爪で、まったく異なる概念で作られた多くの人工知能があります。そしてヤン・ルカンは、誰も探求しないこれらのアイデアを探求するのが好きなそういう人の一人です。
そして彼はここでコメントしています。一部の人々は、現在の技術を拡大して汎用知能に到達できると主張しています。そして彼はここで補足します。私はそれを大きな馬鹿げたことだと思います、失礼な表現で。これは彼がいつも言ってきた典型的なフレーズで、多くの人が彼に腹を立てていますが、彼は言い続けています。
そして興味深いことに、彼はMetaを離れていますが、Metaはここで彼のパートナーであり続けています。なぜなら彼は非常に名声のある偉大な研究者であり、何かについて悪く言うとき、誰もが耳を立てるような典型的な人だからです。なぜなら彼は意味のないことを言うような人ではないからです。何が起こるか見てみましょう。
フェイ・フェイ・リーは、ワールドモデルでも働いている別の非常に名声のある研究者ですが、彼女も同じ方向にいます。そして彼女も、おそらく未来のモデルは本当にワールドモデルになるだろうと言っています。
しかし彼女はすでに、人々が言っているような汎用人工知能を得るには何光年も離れていると述べています。しかし分かりません。私はこれらの予測があまり好きではありません。なぜなら、ある研究室で起こっていることは別の研究室では起こっておらず、別の研究室でも起こっていないからです。突然、誰も期待していないどこかから何かが現れる可能性があり、私たちはただここで見ているだけです。
あなたが何を考えているか下にコメントしてください。知りたいです。そして、このようなビデオを見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーはインテリジェントエージェントの限定動画と先行公開動画にアクセスできます。それではそういうことで、いいねを押してください。ありがとうございました。


コメント