Llama 4に無料でアクセスする方法（GPUに恵まれない人向け）

3,007 文字

How to Access Llama 4 for Free (for GPU Poors) !

Llama 4 is out there but it's almost impossible to run it on personal hardware unless you got a huge GPU powered machine...

もし私のようにGPUに恵まれておらず、最新のLlama 4モデルにアクセスしたいなら、この動画ではLlama 4に無料でアクセスできる4つの異なる場所をご紹介します。Llama 4には3つの異なるバリエーションがあります。Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemothです。Llama 4 Behemothはまだリリースされていません。Llama 4 Maverickはこれらの場所のいくつかで利用可能ですが、ほとんどの場所ではLlama 4 Scoutが見られるでしょう。これは最小のモデルであり、1台のH100に収まるからです。
もしあなたの寝室のどこかにH100が1台あるなら、この動画を見る必要はありません。一時停止してH100を持っていることを教えてください。私はただ座って泣くだけです。でもそうでなければ、Llama 4にアクセスできる最初のウェブサイトから始めましょう。これは非常に人気のあるサイトで、多くの人が知っているでしょう。LM Arenaです。これはLMSのチャットボットアリーナで、ここではモデルを評価できますが、同じプロセスでモデルとチャットすることもできます。特に「arena side by side」というモードがあり、ここに行ってドロップダウンをクリックし、このモデルを選択できます。この場合、Llama 4 Maverick 0326 experimentalです。
選択したら質問することができます。Llama 4 Maverickはこの質問に正しく答えますが、Llama 4 Scoutは不正確に答えます。それがLlama 4 ScoutかLlama 4 Maverickにアクセスしているかを判断するもう一つの簡単な方法です。このモデルを選択して「イチゴには何時間ありますか」と聞いてみました。わざとイチゴ（strawberry）のスペルを間違えています。そして回答ではLaTeX形式で「4」と表示されています。これはLlama 4 Maverickです。アクセスする最も簡単な方法の一つで、レート制限があるかどうかは分かりませんが、ログインする必要もありません。これはおそらく完璧なアクセス場所です。
「もし既にここでモデルにアクセスできるなら、なぜ他の場所が必要なの？」と思うかもしれません。最大の理由は、ここではパラメータを変更できないからです。単純なインターフェースで、別のモデルも同時に見なければならないので少し煩わしいです。もう少し良いものが必要で、それが次のオプションがMeta自身から提供されている理由です。
meta.aiに行き、このモデルにアクセスできます。「イチゴには何時間ありますか」と質問できます。ログインしていない場合はレート制限がありますが、InstagramアカウントやFacebookアカウントを持っていればログインして、好きなだけ会話できます。これはただmeta.aiであり、ここでLlama 4 Scoutにアクセスできます。使用しているモデルは明かされていませんが、モデルにアクセスできます。ここでもハイパーパラメータなどを変更することはできません。純粋に消費者向けのフロントエンドだからです。
また、携帯電話のWhatsAppを使うこともできます。少なくとも私が住んでいるインドでは、今日携帯電話でWhatsAppにアクセスすると、すでにLlama 4にアクセスできます。
プログラマーで様々なことをしたい場合の次の最適な場所は、openouter.aiに行ってサインアップし、モデルにアクセスすることです。現在、Open RouterはLlama 4 MaverickとLlama 4 Scoutを無料で提供しています。Llama 4 Scoutは512,000のコンテキストウィンドウを持ち、Llama 4 Maverickは256,000のコンテキストウィンドウを持っています。現在は無料なので、基本的にLlama 4 ScoutかLlama 4 Maverickに行って、チャットを開始できます。「チャット」をクリックして、会話を始めることができます。確認したい場合は同じ質問をすることもできます。
Open Routerで「イチゴには何時間ありますか」と聞いてみました。数えて、3時間と答えましたが、わざとスペルを間違えたので「R」が4つあります。最終的に3と答えていますが、何を考慮すべきか少し混乱しているようです。Open Routerに行き、Llama 4 Scoutをクリックし、チャットをクリックして同じ質問を送ると、おそらく「strawberry」という単語には「R」が2つあると答えるでしょう。速度の違いが分かります。これら2つは異なるアーキテクチャで、Llama 4 Scoutは非常に高速です。これがLlama 4 ScoutかLlama 4 Maverickにアクセスしているかを判断するもう一つの簡単な方法です。これがOpen Routerで、プログラムによって、またはチャットウィンドウを通じてこのモデルにアクセスする最も簡単な方法の一つです。
最後はインターネットのお気に入りの場所であるGrokです。GrokはLlama 4 Scoutに対して最も高速な推論の一つを提供しています。まだLlama 4 Maverickは提供していません。彼らのGPUを燃やしたくないと思います。彼らはLlama 4 Scout 17億パラメータモデルを持っており、間違っていなければ16のエキスパートが付いています。これはインストラクトモデルなので、チャットができます。また、最大完了トークン数や温度などのパラメータも調整できます。これらの設定があり、出力をストリーミングすることもできます。チャットするとき、各トークンを送信するようにレスポンスを得ることができます。
ここに行って、「イチゴには何時間ありますか」よりも少し複雑な質問をしてみます。「イチゴについての小さなエッセイと、人間がそれを好む理由について書いてください」と言ってみましょう。送信します…技術的には非常に速いはずです。最大完了トークンは8,192未満である必要があります。これはかなり悪いですね、事前に教えてくれるべきでした。同じ質問をもう一度送信します。とても速いことがわかります。他の場所で同じ質問をすると、はるかに遅い応答が得られるでしょう。
質問をコピーして、こちらに行き、履歴をクリアして質問を送信できます。この場合、これはLlama 4 Maverickですが、まだこの質問を送信しています。質問を送信すると、回答を得るのにかなり時間がかかることがわかります。しかしGrok上のLlama 4 Scoutは非常に高速です。この時点でのトークン毎秒は493であり、かなり速いです。H100を購入するか、おそらくH100を購入するのに十分な裕福になるまで、これらの異なるプラットフォームで無料でLlama 4のScoutとMaverickの両方にアクセスできます。Mark Zuckerbergはオープンソースを信じているからです。
また別の動画でお会いしましょう。プロンプトを楽しんでください。