本動画は、xAIが提供するGrok 4.20ベータ版の基本的な使い方と実践的なプロンプトのコツを解説するガイドである。Grok 4.20は単一のモデルではなく、Captain Grok、Harper、Lucas、Benjaminという役割の異なる4つのAIエージェントが協調してタスクを処理する点に特徴がある。動画内では、ビットコインの購入時期やベーシックインカムの経済効果といった正解のない複雑な問いに対し、各エージェントにリサーチ、反論、ファクトチェック、要約を分担させる具体的なプロンプト構成を紹介している。エージェント同士を連携させることでハルシネーションを減らし、より論理的で精度の高い回答を引き出す手法を学ぶことができる。

Grok 4.20ベータ版の概要と注意点
さて、Grok 4.20ベータ版がついに登場しましたので、これについては絶対に話しておかなければなりません。
Grokが使えるようになったわけですが、まずこのモデルへのアクセス方法を知りたい方は、プレミアムサブスクリプションに加入していることを確認してください。Grokの無料プランでは利用できないからです。
月額30ドルのプランで利用可能です。これが最初のプランになりますね。
さて、Grok 4.20ですが、夢中になって使い始める前に理解しておいてほしいのは、このモデルはこれまでで最も計算資源を消費するということです。
それがどういうことかと言うと、日々の作業でこのモデルの推論能力をいつ使うか慎重に選ばないと、あっという間に利用制限に達してしまう可能性が高いのです。
こちらのユーザーを見てください。彼はGrok 4.20に10回もメッセージを送っていないのに、すでに制限に達してしまっています。
ですから、制限が存在することを理解しておく必要があります。初期の段階でモデルを完全に使いすぎてしまわないように気をつけてくださいね。
私は実際にこのモデルにかなりの時間を費やしましたので、どのようにプロンプトを出せば最大限の力を引き出せるか分かっています。Grok 4.20は本当に一風変わったモデルでして、実は単一のモデルではないのです。
実際には、あなたの代わりに作業をしてくれる複数の異なるエージェントの集合体なんですよ。
ドロップダウンメニューを開くと、Grok 4.20が実際には4つの異なるエージェントであることが分かります。でも、ほとんどの人はそれらのエージェントが何なのか、あるいは本来何をすべきものなのか気づいていません。
Grok 4.20を構成する4つのAIエージェント
ここで実際にエージェントを見てみると、それぞれのエージェントが異なる役割と目的を持っていることがわかります。
ここにある1番目のエージェントはCaptain Grokです。
これは基本的に、他のエージェントに何をすべきかを指示するコーディネーターの役割を果たします。もちろんこれは最も重要なことの一つであり、後ほどプロンプト作成においてこれがどう影響してくるかをお見せしますね。
Harperは通常、リサーチと事実確認の専門家です。
Lucasは創造性とバランスを担当します。
Benjaminは数学、コード、論理を担当するエージェントです。これで4つのAIエージェントすべてが揃いました。
さて、これらのエージェントが協力し合う際に、それぞれの能力を最大限に引き出せるよう、どのようにプロンプトを構築するかを知ることが重要です。
何時間もテストを重ねた結果、実際にどのようにすればよいのか、分かりやすい例をいくつかご紹介します。
Grok 4.20ベータ版がどのように機能するのか知りたい方のために説明すると、これが基本的なフレームワークになります。
少しややこしく感じるかもしれませんね。これを動画に入れている唯一の理由は、技術に詳しいユーザーならスクリーンショットを撮って、自分のプロンプトで推論を深めることができるからです。
でももちろん、全くの初心者の方でも心配しないでください。これから全てが完全に理解できるように説明していきますから。それでは、本題に入りましょう。
効果的なプロンプトの構造と具体例
たとえば、モデルに聞きたい質問があるとします。
対立する意見が存在し、異なる視点からの意見が役立つような、明確な答えがない場合こそ、Grok 4.20の真価を最も発揮できます。
つまり私がここで言いたいのは、多くの場合、Grok 4.20はオープンエンドな質問に最適だということです。
たとえば、いつビットコインを買うべきかという質問にしてみましょう。これは非常に議論が分かれるテーマですし、誰でも知っているとてもシンプルな内容ですからね。
それでは、いつビットコインを買うべきかと尋ねる場合を考えてみましょう。ただ単にいつビットコインを買うべきかとプロンプトに入力するのは避けたいところです。
実際には、エージェントに何をしてほしいかを構造化して指示したいのです。
そこで、Harper、最適な時期に関する情報をリサーチしてください、と言うことができます。
それから、Lucas、あなたもリサーチを通じて反対意見を検討してください、と言えますね。
そして、Benjamin、彼らの結果をファクトチェックしてください、と指示します。
そして最後、4つ目の指示として、Captain Grok、要約して最終的なアウトプットを出してください、と伝えるわけです。
これが私が開発したプロンプト構造です。このモデルから最高の答えを引き出すには、まず自分の主張を支持する意見を見つけ、次に反対意見を見つけ、3番目に誰かにファクトチェックをさせ、4番目に誰かにすべてを要約した最終的な答えを出させるのが最善だと気づいたのです。
これを入力すると、エージェントたちが思考を始めるのがわかります。
ここではCaptain Grokが基本的に他のエージェントに指示を出しているのが確認できます。
彼は、Harper、これをリサーチして。Lucas、これをリサーチして。Benjamin、それから君はこれをして、と指示しています。
そして覚えておいてほしいのは、これがすべて並行して行われているということです。だからこそ、非常に効果的なのです。
そしてほとんどの人が気づいていないのですが、複数のエージェントに何かを処理させると、ハルシネーションの発生率が10%から11%ほど減少すると思います。
ですから、ある程度の正確さが求められる作業をしている場合、LLMがハルシネーションを起こしやすいことを理解していれば、これは間違いなく助けになるはずです。
そしてここでついに最終的なプロンプトの結果が得られます。ここで最終的な解決策が提示されるわけですね。
それから、少しコンテキストを提供してくれます。最適なエントリーポイントに関するHarperのリサーチシグナルを教えてくれます。
次に、もちろんLucasの反対意見も見ることができます。
そして最後には、実践的な結論を提示してくれます。
もちろん、ここにはBenjaminのファクトチェックも含まれていますよ。
プロンプトにこのステップを含めた理由は、LLMに何かをさせると、しばしば脱線してしまい、自分でファクトチェックを行わないことが多いからです。
他のエージェントと推論を戦わせることもありません。
ですから、Harperにリサーチさせ、Lucasに反対意見を出させ、Benjaminにファクトチェックさせるというこの形は、2つの対立する意見を扱えるため、おそらく最強のプロンプトだと言えるでしょう。
ここで対立する意見が欲しい理由は、LLMが過剰に同調しすぎる傾向があるからです。
LLMが同調しすぎると、ニュアンスに富んだ視点を提供してくれなくなります。
つまり、今日ってビットコインの買い時じゃないですか?と聞けば、おそらくそれに同意して、あなたのアイデアは素晴らしいと言ってくるでしょう。
異なるアイデアがあり、さらに誰かがそのアイデアをファクトチェックできれば、返ってくる結果ははるかに良いものになります。
ここを見ると、長期的に信じるなら今からドルコスト平均法で始めるか、一括投資するか、あるいはリスク管理を行いなさい、と書かれているのが分かりますね。
もちろんこれは単なる基本的な例ですが、Grok 4.20を実際にどうやって最大限に活用できるかをお見せしたかったのです。
より複雑なテーマでの実践と文脈の重要性
では、もう少し情報量が多く、彼らの発言を実際にファクトチェックでき、一般の人にとって本当に役立つ別の例を見てみましょう。
ここに2つ目のプロンプトを書きました。ユニバーサルベーシックインカムはGDPの20%減少をもたらすと私は信じています。Benjamin、私の主張を支持する最も強力なデータを見つけてください、というものです。
Harper、特定の経済レポートを使ってそれを反駁する最も強力なデータを見つけてください。
そしてLucas、妥協点となる理論を説明する統合案を作成してください。
実はこのプロンプトは変更して、すべてが正しいか確認するためにファクトチェックを頼むことにします。
そしてCaptain Grokには、基本的に裁判官としての役割を果たしてもらい、提供された証拠に基づいてどのエージェントがより論理的に妥当な議論を提示したかを教え、論理的な結論に達するように依頼します。
これを実行したい理由はすでに述べた通り、異なる視点の議論を検討し、誰かにファクトチェックさせ、最終的な解決策を提示させるためです。
さて、もちろんこのようなケースであっても、そのまま従えるような決まった直接的な答えは存在しません。決断には微妙なニュアンスが伴うからです。
90歳の人にとっては、ビットコインを買うのに最適な時期ではないかもしれません。
一方で12歳の子にとっては、おそらく買った方が良いかもしれませんね。
ですから当然のことですが、通常のプロンプトと同じように、できる限り多くのコンテキストを追加することを忘れないでください。それが信じられないほど役に立ちますから。
多くの人がコンテキストなしでプロンプトを入力しがちであることは知っています。
現時点でGrokには記憶機能がないことを考慮すると、何かをプロンプトで指示する際には、その状況に追加できるコンテキストを必ず含める価値があるでしょう。
そうすれば、コンテキストを認識し、あなたの代わりに推論を行う際にそれを利用してくれます。
さて、もう一度見てみましょう。Benjaminに支持する証拠を見つけてもらいましたね。彼は特定のマクロ経済モデルを強調したとあります。
そして当然、Harperの反駁する証拠もあります。
さらに、Lucasのファクトチェックもありますよ。
そこでの判断を見ることができます。そして意見を提示してくれます。Harperの反駁する議論の方が論理的に妥当だと述べていますね。
そしてその理由をステップバイステップで説明しています。ベーシックインカムがGDPの20%減少をもたらすという論理的な結論は、単純に証拠によって支持されていないとあります。
利用可能な最も強力なデータは壊滅的な減少を明確に否定しており、その影響は制度設計や資金調達の方法に大きく依存する、かくかくしかじか、と続きます。
これが、ほとんどの人が見落としている驚くほど強力なツールだと私が言っている理由です。
Twitterではコーディングなど素晴らしいことをしている人たちを見かけますが、Grok 4.20は本来そういったことのために設計されたモデルではありません。むしろ推論のために設計されています。
イーロン・マスクでさえ、これらの未来のモデルを設計していると語った際、基本的には日常生活で実際に役立つように設計したのです。
そして、この構造でプロンプトを入力すればモデルを最大限に活かせることを考えれば、その理由は疑う余地がありません。
エージェントの推論プロセスの確認と結論
それでは実際に、これをシンプルな基本プロンプトと比較してみましょう。そうすれば、これがいかに強力であるかが分かるはずです。
ここにある最初の文をコピーして、貼り付け、これは正しいですか?と聞いてみます。
すると、どのようなプロンプト結果が得られるかが分かります。これもエージェントを使用していることを忘れないでくださいね。
あと、一つちょっと変わった小技を忘れていました。これは私がよくやっていることです。
AIに特定の方法で推論してほしい場合、まずこのウェブサイトを検索して、次はこのソースに進んで、このソースを優先して、と指示することがあります。
これは、非常に興味深いソースについてよく知っている場合に使えるテクニックです。
具体的なことはわかりませんが、特定のソースが他のソースよりも信頼性が高い場合があるでしょうから。
もちろん、そういったドメイン知識を持っているなら、遠慮なく使ってください。
さて、もう一度情報を見てみると、興味深いことに非常に面白い思考プロセスを提示してくれています。
証拠は非常に混在していると教えてくれ、いいえ、それはあまり起こりそうにないと言い、結論としてはGDPを減少させる可能性はあるものの、その数値はある特定のシミュレーションからのものだと説明しています。
しかし、先ほどのプロンプトに戻ってみると、Captain Grokが登場し、基本的にすべてのプロセスを順を追って説明してくれているのが分かります。
賛成派の意見、反対派の意見を順に示してくれます。もちろんファクトチェックも行い、きちんとした論理的な結論を提示してくれます。
これらのモデルを使用する際は、自分が何を使っているのかを理解することが重要です。というのも、これは標準的なチャットエージェントとは少し違うと思うからです。
さらに、非常に便利な機能がもう一つあります。必要であれば、推論のプロセスを実際に見ることができるのです。
私がモデルにこれをして、あれをしてと指示したのを覚えていますよね。
基本的にBenjaminにデータを見つけるよう指示しました。主張を裏付ける最も強力なデータを見つけるタスクが、実際にBenjaminに送られたことが確認できます。
そしてもちろん、データを探してレポートを反駁するようHarperに指示が送られたのも分かります。
それから、Lucasがファクトチェックをする番ですね。
つまりLucasはこれらすべてをファクトチェックし、すべての方法論を調べ、影響を与える研究を確認するよう指示されました。そして当然、最終的なプロンプトにたどり着くころには、全体としてはるかに堅牢な回答が得られているのが分かります。
私としては、これがGrok 4.20の活用計画になります。
月額300ドルもするので専門家チームのような大規模なGrokは持っていませんが、Grok 4.20が間違いなく強力なツールであることは確かだと思います。
これはモデルによる評議会のようなものだと言えますし、それが完全に強力なものであることは間違いありません。
もし皆さん独自のユースケースがある場合や、この動画が役立ったという場合は、動画に「いいね」を押すのをお忘れなく。
そしてもちろん、今回使ったプロンプトなどが欲しい場合は、ぜひコミュニティをチェックしてみてください。AIの最新情報を追うためなら、月額たった10ドルですからね。


コメント