NOVO DeepSeek v3 0324が再び世界のAIを驚愕させる | OpenAI、ChatGPTで気をつけろ

8,617 文字

NOVO DeepSeek v3 0324 Surpreende e Enlouquece o Mundo da iA de Novo | OpenAI Se Cuide Com ChatGPT

Aprenda Inteligência Artificial! ▸ Seja MEMBRO: ▸ ▸ Instagram:

みなさん、DeepSeekが何もせずにただ立ち止まっていると思っていた人がいたら、もちろんそんなことはありません。今や新たな更新があり、中国がまた驚異的な発表をしたことで、おそらく何千人ものアメリカ人が絶望しているでしょう。これは私たちが目にしているAI全体を揺るがす可能性のあるものです。それでは、この新情報について理解するために一緒に見ていきましょう。
では行きましょう。いつものように、いいねをくれた皆さん、チャンネル登録してくれた皆さん、そして特に、このAIチャンネルをスポンサーしてくれているメンバーの皆さんに感謝します。メンバーはインテリジェントエージェントの独占動画にアクセスできることを忘れないでください。
今日のニュースはこれです。DeepSeek V3が今やMac Studioで1秒あたり20トークン処理できるようになりました。これはOpenAIだけでなく、すべての企業にとって悪夢です。彼らは必死に中国をあらゆる方法でボイコットしようとしています。NVIDIAがもう中国に販売できないとか、中国人がハードウェアを密輸しているとか、それを阻止しようとしているとかいう記事ばかり目にしています。
そして彼らの対応は実に率直で迅速です。何が起きているのでしょうか？中国のスタートアップDeepSeekが密かに新しい言語モデルをリリースし、その能力だけでなく、実装方法でもAI業界に衝撃を与えています。641GBの大きさ（ここで注意すべきは、パラメータ数ではなくサイズの話をしていることです）を持ち、DeepSeek V30324と呼ばれるこのモデルは、今日Hugging Faceのリポジトリに、ほとんど発表もなく登場しました。これは同社の控えめながらも影響力のある発表スタイルを継続するものです。
彼らが言及しているのはこれです。DeepSeek AI、そして先ほどのDeepSeek V3324ですが、コミットの時間を見ると、初期コミットは18時間前、つまり1日も経っていない状態で私はこの動画を録画しているので、おそらく皆さんが明日の朝これを見る頃には24時間経っているでしょう。基本的には、ここに大きなモデルがあり、無料でオープンソースとして公開されています。いつものようにDeepSeekのスタイルを守っていて、「Open」という名前を持ちながら、誰にも何もオープンにしないOpenAIとは大きく異なります。
そして、前述したように、パラメータ数は685億です。あの641GBというのはモデルサイズであり、パラメータのサイズではありません。このリリースを特に注目すべきものにしているのは、商業利用も無料で可能なライセンスと、消費者レベルのハードウェア、特にAppleのM3 Ultra搭載Mac Studioで直接実行できるという初期の報告です。
ここで、ある人がM3 Ultraを使ったテストを示し、1秒あたり20トークンを処理できると述べています。これは当然、おそらく以前と同じミクスチャー・オブ・エキスパーツのアーキテクチャを使用しているからです。約700億パラメータを持っていても、アクティブなパラメータは約30〜40億ほどです。今彼らが何らかの改善を行えば、おそらくさらに高速になるでしょう。
そして彼は次のようにコメントしています：「新しいDeepSeek V3 0324は4ビット（つまり量子化されて）でM3 Ultra 512GBマシンにMLX LMを使用して1秒あたり20トークン以上を処理します。」彼らはさらに言及しています：「約10,000ドルのMac Studioが消費者向けハードウェアの定義を拡大するかもしれませんが、こんな大きなモデルをローカルで実行できる能力は、通常の最先端AIに必要とされるデータセンターの要件から大きく離れています。これは素晴らしいことです。」
すでに推論モデルがNVIDIA 4090などのカードで非常にうまく動作し始めているという話も出始めています。なぜなら、モデルが非常に優れたものになり、20数億、30数億パラメータ規模になってきており、ここで示されているように量子化された形であっても、これらのハードウェアに収まり始めているからです。
DeepSeekの隠密なリリース戦略はAI市場の期待を覆しています。685億パラメータを持つモデルが、論文やブログ投稿、マーケティングの宣伝なしに、空のREADMEファイルとモデルの重みだけで登場しました。このアプローチは、実際のリリースの前に数ヶ月のハイプが先行する西洋のAI企業の慎重に演出された製品発表とは大きく対照的です。これは興味深い違いですね。一方が人々に衝動買いさせるために不安をあおる一方で、こちらは「ちょっと新しいファイルをアップロードしておくよ」という感じで、公開後に皆が熱狂するのです。
最初のテスターたちは前バージョンからの大幅な改善を報告しています。AI研究者のShelfon氏はXの投稿で次のように宣言しました：「新しいDeepSeek V3を私の内部ベンチマークでテストしたところ、すべての指標、すべてのテストで大幅な飛躍を遂げました。今や推論モデルでない中では最高で、Sonnet 3.5を打ち負かしました。」
彼はこの写真を投稿し、Sonnet 3.5（すでに3.7が出ているのに、なぜ3.5を使ったのか理解できませんが、コメントで3.5は3.7よりも優れているという人もいたので、皆さんの間で議論してください）とV30324のテスト結果を示しています。後者がより良いスコアを出しています。これは彼自身が彼の基準でテストしたベンチマークであることを覚えておいてください。
ご覧のように、これを上回っているのは推論モデルのみです。ここで重要なのは、基本モデルがあり、その上に推論モデルを構築するということです。基本モデルが改善されれば、推論モデルも改善することを意味します。このR1も良くなることが期待できます。これは一般的なテストでの結果で、下のコードテストでも、この新しいDeepSeekはClaude 3.5よりも優れた結果を示しています。
これは状況が完全に変わったことを意味します。この関連性が広範なテストで検証されれば、新しいDeepSeekモデルはAnthropicのClaude 3.5 Sonnet（なぜ3.7ではなく3.5にこだわるのかわかりませんが）を上回る位置につけることになります。Claude 3.5 Sonnetは最も評価の高い商用AIシステムの一つですが、サブスクリプションが必要なSonnetと異なり、DeepSeek V30324の重みは誰でも無料でダウンロードして使用できます。
そして私たちが最も知りたいのは、これをどこで使用できるかです。もうこれ以上の話は不要です。「DeepSeek V30324を試す方法：開発者とユーザーのための完全ガイド」を見てみましょう。
DeepSeek V3を試したいと熱望している人たちのために、技術的なニーズに応じていくつかの方法があります。完全な重みはHugging Faceで利用可能です。ダウンロードしてインストールするだけで、実行するにはMac Studioが必要です。
ほとんどのユーザーにとって、クラウドベースのオプションがより手軽なアクセス方法を提供します。Open Heuterはモデルへの無料APIアクセスとユーザーフレンドリーなチャットインターフェースを提供しています。DeepSeekを選択するだけです。Open Heuterに行くと、DeepSeek V324がすでに表示されています。クリックすると「DeepSeek V324 Free」が表示され、チャットをクリックするとチャットウィンドウが開き、検索やその他の多くのオプションが利用できます。私はこのOpen Heuterを使ったことがありませんが、素晴らしそうです。
すぐに試したいテストがあります。最近、vibe codingについての動画を作り、このコードをGrokとClaude Sonnetで試しました。良いことに、彼はここにプロンプトを公開しているので、家でも試したい方は可能です。このプロンプトをコピーしてこのゲームを生成してみましょう。うまくいくか見てみましょう。
コードを生成中です。これはシンプルなコードで、HTML、JavaScript、CSSがすべて1つのファイルに含まれています。そのゲームを作るために必要なすべての説明が含まれています。少しバグがありましたが、続きました。興味深いことに、そのゲームにはすでにキャラクターとほとんどすべてが準備されているので、基本的にAIは多くの既製部品を統合するだけです。
彼は大量のテキストを生成しています。少し遅れや不具合がありますが、おそらく多くの人がアクセスしているからでしょう。しかし、彼が生成しているコードは素晴らしいです。デバッグ、WSDによる移動、相対カメラ移動、回転、壁との衝突（16×16）など、すべて完璧です。
このコードを実行してみましょう。メモ帳に貼り付けて、何が起こるか見てみましょう。兵士が読み込まれています。以前作ったものと比較すると、いくつかの違いがあります。プレイヤーが動いて止まると、左右でちゃんと止まりますね。これは正確です。プレイヤーのサイズはあまり大きくなく、少し大きい方が良かったですが、カメラの動きは正確です。回転時のこのバグはすべてのバージョンで同じです。
ゲームは正確に作られましたが、彼は4×4のマップを作ったように見えますが、実際には16×16のはずでした。しかし、四角を数えると、13×16くらいなので、もしかしたら私が間違って数えたのかもしれません。キャラクターのサイズは正しいですが、小さくなったように見えます。理論的には、すべて正しいです。マウスで近づくと、ほぼ一人称視点でマップを見ることができます。素晴らしいです。彼は少しマイケル・ジャクソンのように歩いていますが、すべて正しいです。とても良いと思います。
Open Heuterの他に、chatdeepsic.comでDeepSeekの独自のチャットインターフェースも恐らく新バージョンに更新されているはずですが、注意が必要です。なぜなら、そのチャットサイトに行っても、どのバージョンを使用しているかは書かれておらず、単にバージョンがあるとだけ記載されているからです。
会社は明示的に確認していませんが、最初のユーザーはこのプラットフォームで利用できるモデルが以前のバージョンよりも性能が向上していると報告しています。また、Hugging Faceで設定できるHyperbolics AIを通じても利用可能で、Open HeuterもAPIアクセスを提供しています。
新しいDeepSeekモデルは会話の暖かさよりも技術的正確さを優先しています。最初のユーザーはモデルのコミュニケーションスタイルに顕著な変化を報告しました。以前のDeepSeekモデルはそのカジュアルで人間らしい口調で称賛されていましたが、V30324はより形式的で技術指向の人格を示しています。
「私だけ、それともこのバージョンはあまり人間らしくないですか？」とRedditのあるユーザーが尋ねました。「私にとって、DeepSeek V3を他と区別していたのは、その調子、言葉遣いなど、人間らしく見えたことでした。他のLLMのようにロボット的ではなかったのですが、今回のバージョンでは他のLLMのようにとてもロボット的に聞こえます。」
これは興味深い点です。Metaもllamaで同じことをしました。最初のllamaを使ったとき、サイトを通じてアクセスすると、超カジュアルな会話でした。Grokも同様で、始まった頃は非常にカジュアルな会話でした。
これらのチャットが非公式になっている理由を説明するためのあなたの意見は何ですか？それは、大衆に、すべての人々に利用させるときの圧力のためでしょうか？一般的に、平均的な大衆は中立的なものを好み、非公式なものを好まないということは十分にあり得ます。
別のユーザーは「確かに、その魅力を失いました。自分自身のためにあまりにも知的に見えます」と付け加えました。この性格の変化は、おそらくDeepSeekのエンジニアによる意図的な設計上の選択を反映しています。より正確で分析的なコミュニケーションスタイルへのシフトは、カジュアルな会話ではなく、プロフェッショナルで技術的なアプリケーション向けにモデルを戦略的に位置づけていることを示唆しています。
これは、異なるユースケースには異なるインタラクションスタイルが有益であることをAI開発者がますます認識するようになるにつれて、業界全体のより広範な傾向と合致しています。皆さん、もう少し中立的にするのです。
専門アプリケーションを作成する開発者にとって、このより正確なコミュニケーションスタイルは実際に利点となり、プロフェッショナルなワークフローに統合するためのより明確で一貫した結果を提供する可能性があります。しかし、親しみやすさとアクセシビリティが重視される顧客向けアプリケーションでは、モデルの魅力を制限する可能性があります。
皆さん、コメントしてください。より非公式なチャットボットを好みますか、それともチャットボットをより中立的にして、各自が望むようにカスタマイズする方が良いと思いますか？
そしてこの重要な部分を見てください：「DeepSeekのオープンソース戦略が、グローバルAIの風景を再設計しています。」本当に再設計していますね。アメリカのすべての企業に、そして人間にも絶大な圧力をかけています。皆さんは確実にManosからのニュースを期待してレーダーを働かせていると思います。なぜなら、中国がManosに注目して非常に強力にしようとしているというニュースをすでに報告しましたし、中国はDeepSeekにも資金を投入するなど注目しています。
DeepSeekのAI開発と配布へのアプローチは、技術的な達成以上のものを表しています。それは、先進技術が社会に浸透する方法についての根本的に異なるビジョンを具現化しています。最先端のAIを許容的なライセンスの下で無料で利用可能にすることで、DeepSeekはクローズドモデルが本質的に制限している指数関数的なイノベーションを可能にします。
これは非常に奇妙です。DeepSeekは共産党のフィルターを持っていることで多くの批判を受けていますが、同時に共産党はAIがあらゆる人に使われることを望んでいます。一方ではフィルターがありますが、もう一方では大きな自由があります。そのため、支持するか反対するかの立場を取るのが難しくなります。
そして非常に興味深いことに、最近のAIモデルのオープンな比較を見ると、このDeepSeekのバージョンもまもなくここに登場するでしょうが、すべてのモデルの中で、DeepSeek R1はまだトップ10に入っています。皆さん、これが何を意味するか理解していますか？突然現れた小さな企業がここでGoogleのGemini 2.0 Flashを上回っているのです。もちろん、Thinkingなど他のバージョンもありますが、FlashはDeepSeekに負けています。そしてOne、GMA 3、Ken 2.5（これも中国のものです）も同様です。
彼らが実際に到着し、非常にうまく位置づけられていて、誰にも頭を下げていないのを見るのは興味深いです。スタイル制御では彼らは4位です。スタイル制御のランキングを見てみましょう。彼らは4位です。基本的に彼らは動いていませんね。3位には多くのタイがあります。Claude 3.7がここにありますね。Claude 3.7について話さなければなりませんでした。
この哲学は、中国と米国の間で認識されているAIのギャップを急速に縮めています。わずか数ヶ月前、ほとんどの分析者は中国が米国のAI能力から1〜2年遅れていると推定していました。今日、そのギャップは数ヶ月にまで急激に縮まり、一部の分野ではパリティ、あるいは中国のリーダーシップに近づいています。
これは考えるのが非常に不思議ですね。西洋が行うことをすべて中国がコピーし、より良く、より安く、より速く作るなら、AIも例外ではないことが想像できます。
モバイルエコシステムにおけるAndroidの影響との類似点は印象的です。GoogleがAndroidを無料で提供するという決定は、最終的に世界市場の支配的なシェアを獲得したプラットフォームを作り出しました。同様に、オープンソースモデルは、何千人もの協力者による集合的なイノベーションによって、ユビキタス性においてクローズドシステムを上回る可能性があります。
これが真実であることは確かです。実際、今日公開予定だったオープンモデルについての動画は明日公開される予定なので、家で無料で使えるものがまだまだあるので準備しておいてください。
その意味は市場競争を超えて、技術へのアクセスに関する根本的な問題にまで及びます。西洋のAIリーダーたちは、高度な能力を資源豊かな企業や個人に集中させていることでますます批判を浴びています。すべてがPeniとAnthropicとGoogleとMicrosoftの手にあり、巨人たちだけがコントロールしています。DeepSeekのアプローチはこれらの能力をより広く分散し、潜在的にAIの世界的な採用を加速させます。
例えば、Perplexityという大きなAI企業は、オンラインで作業する人々が検索や仕事をするのに最も好まれている場所ですが、彼らは公然とDeepSeekを使用しています。彼らがOpenAIを使用していると言う人々がいますが、Perplexityが投稿したすべてを検索したところ、彼らのSonarモデル、推論モデル、Sonar Proはすべてディープシークです。すべてDeepSeekのファインチューニングです。
DeepSeek V3が世界中の研究所や開発者のワークステーションに浸透するにつれて、競争はもはや単に強力なAIを構築することではなく、より多くの人がAIで構築できるようにすることにあります。このレースでは、DeepSeekの静かな発表が、AIの未来について多くを語っています。技術をより自由に共有する企業が、最終的にAIが私たちの世界をどのように再形成するかについてより大きな影響力を発揮する可能性があります。
彼がここで語っていることは、初めにMetaが持っていた考え方です。ZuckerbergのMetaは実際に彼の無料モデルを傾向にし、誰もが彼のモデルに基づいて構築することを望んでいました。それは実際に初めに起こったことで、先ほど言及したPerplexityはLlamaを使用して製品を開発していました。Maritaca AIというブラジルのモデルでさえLlamaのファインチューニングを行っていましたが、彼らとのインタビューで、Maritacaのメンバーは「Llamaは使用できません、多くのことが許可されていないため」と述べ、他のモデルに移行しなければならなかったと言いました。おそらく彼らも今はDeepSeekを使用しているでしょう。
あなたの考えをコメントしてください。すでにテストできましたか？このDeepSeekが改善されていると思いますか？正直に言うと、このプラットフォームをもう使っていないので、うまく機能しているかわかりません。
皆さんが大好きなグラスのテストをやってみましょう。「グラスのテストをするな」という人が多いですが、ここでオリジナルのグラスのテストをやってみましょう。Deep Thinkもsearchも何も使わずに、ただこれがナンセンスを話すのを見てみましょう。
ステップバイステップで分析していきましょう。あら、これはすでに推論モデルになっていますね。見てみましょう。
最終回答：「サイコロはグラスが最初にひっくり返されたテーブルの上にあります。」気づいたのは、Deep Thinkをオンにしていないのに、モデルがデフォルトで推論モデルになっていることです。私はただ質問をして、モデルは自動的にステップバイステップの推論が必要なものだと検出し、推論モデルのように段階的に回答し、問題を複数の部分に分解しました。LLMが自動的に問題を分解し始めると、正解することがわかります。ここでは正確に答えています。サイコロはテーブルの上にあります。
あなたの考えをコメントしてください。このニュースが気に入りましたか？また新しいニュースを待ち望んでいますか？このようなビデオを見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーはインテリジェントエージェントについての独占ビデオにアクセスできます。いいねをお願いします、ありがとう！