ディープシークR2が間もなくAI業界に変革をもたらす(ディープシークR2のリーク情報!)

AGIに仕事を奪われたい
この記事は約10分で読めます。

5,851 文字

Deepseek R2 Is About To Change That AI Industry (Deepseek R2 Leaks!)
Join my AI Academy - 🐤 Follow Me on Twitter 🌐 Checkout My website -

実際のところ、AI業界はまだ熱を帯び続けており、ディープシークは新しいAIモデルの発表を急いでいて、AIに全力で取り組もうとしています。もしディープシークのモデルについて馴染みがないなら、おそらくAI分野に携わっていないのでしょうが、この企業は完全にAI業界を一時停止させました。なぜなら彼らは誰も予想していなかったことをやってのけたからです。彼らはわずかなコストで本当に優れたフロンティアモデルを作り上げることに成功しました。そして今、彼らは第二世代のR2を発表しようとしているようです。
これはAI業界の現状を考えると、さらに懸念すべきことだと思います。ここで見ることができるように、ディープシークは実際に5月初旬にこれをリリースする計画を立てていましたが、今ではできるだけ早く発表したいと考えているようです。具体的な日時は明かさずに二人が述べています。これは非常に興味深いことです。なぜなら、ディープシークが価格対出力比、つまり品質の面で他の企業を追い越したのはつい最近のことだからです。
ここで私たちが目にしているのは、AI業界を根底から覆す可能性のある驚くべき状況です。もし彼らが実際にR2、つまり思考モデルの第二世代を、最近anthropicやOpenAIなどのフロンティアラボから見られた品質に近いレベルまでわずかなコストで実現できるならば、これは西洋のAI国家、あるいは西洋のAI企業を非常に興味深い窮地に追い込む可能性があります。
現在、開発者やユーザーはこれらのブランドに特に忠誠心を持っているとは思いません。もちろん、これらのブランドの多くは、例えばChat GPTやGrockとイーロン・マスクのようなブランド名を持っていますが、多くの開発者は常により安い価格を求めており、アプリやソフトウェアアプリケーションのコストをどう削減できるかを考えています。
彼らが実際に重点を置くことになる主要な分野の一つはコーディングになるでしょう。この記事では、同社が新モデルによってより優れたコーディングを実現し、英語以外の言語での推論能力を持つことを期待していると述べています。スケジュールの前倒しに関する詳細は、これまで報告されていません。
ここでコーディングについて話している理由は、AIにおいてコーディングは最も難しいタスクの一つだと信じているからです。これは確かに非常に興味深いことであり、多くの人々がClaude 3.5 Sonnetを使用していることを考えると、もしディープシークがClaude 3.5や3.6 Sonnetよりも優れたコーディングを行う段階に到達すれば、それは非常に興味深いことになるでしょう。なぜなら、それはClaudeの市場シェア全体を奪うことになるからです。
この企業がAI業界を一時停止させたのは初めてではありません。例えば、これらの最近のコーディングベンチマークを見てみると、Devonを使用したエージェンティックコーディング評価があります。Devonはソフトウェア開発者向けのAIエージェントフレームワークであり、大企業と連携してソフトウェア開発者の作業を減らし、そのスタックの多くを自動化しています。
ここで最もパフォーマンスが良いモデルは、もちろん最近リリースされたSonnet 3.7です。Deep Seek R1と比較すると、それは51%であり、他のフロンティアモデルがこれを大幅に上回っていることが分かります。しかし、Deep Seek R2がSonnet 3.7を追い越すか、あるいはここに割り込むことができれば、どうなるでしょうか?これはAI業界における非常に重要な転換点となるでしょう。コーディングは多くの個人が注目しており、現在アプリや様々なソフトウェアを構築するために使用しているものだからです。
こちらも非常に興味深い別のベンチマークがあります。これはAda Polyglot Codingベンチマークで、AIの言語モデルが自然なコーディング要求を、ユニットテストに合格する実行可能なコードにどれだけ効果的に翻訳できるかを評価するために設計されたツールです。基本的に、このベンチマークは様々なコードを分析し、モデルのコーディング能力だけでなく、既存のコードを編集し、それらの編集をソースファイルに統合するために適切にフォーマットする能力も評価します。
ここでも非常に興味深いことに、Deep Seek R1とClaude Sonnet 3.5を組み合わせたエージェンティックフレームワークが、この分野で最も安価なものの一つであることが分かります。ここでの総コスト対パフォーマンスメトリクスを見ると、このモデルはわずか13ドルで、スコア的にもかなり高い位置にありますが、他のものは18ドル、100ドル、36ドルとなっています。
しかし、多くの人はコストよりも精度を重視する可能性が高いと思います。つまり、コストは重要ですが、多くの異なるアプリケーションにとって精度が重要になるでしょう。Deep Seekがそれを達成するためには、精度が重要になります。しかし、Deep Seekをとても独特にしているのは、彼らの精度はそれほど重要ではないという事実です。もちろん、かなり正確ですが、価格が非常に低いため、多くの人々がほぼ無料で使用できるため使いたがるのです。
LMSy Arenaを見ると、これはもちろん、あなたのような個人がこれをどのようにランク付けできるかを見る定性的なベンチマークですが、Deep Seek R1はリーダーボードの中で3位、あるいは5位程度であることが分かります。これは非思考モデルとしては依然として比較的高い位置であり、Claude 3.7 Sonnetもこのベンチマークでは下位にランクされています。
ただ、このベンチマークは「雰囲気」が重要になる可能性が高いと言わなければなりません。例えば、GPT-4.5のようなモデルがここで良い成績を収めると思いますし、思考モデルがここで良い成績を収めるとは思いません。しかし、Deep Seek R2がどうなるかは興味深いでしょう。もしそれが再びこれらの企業を追い越すことができれば…もちろん、これらのベンチマークはそれほど重要ではないと思いますが、彼らが達成できる品質を示すことになると思います。
また、もし彼らが第二世代を非常に早く、つまり5月初めに発表できるとしたら、それは今からわずか60~90日後のことです。これはモデルをターンアラウンドさせる点で注目すべきことになるでしょう。彼らがこれをどのように実現しているのかも興味深いです。
想像してみてください。あなたが非常に短時間で、わずかなコストでモデルを生み出せる企業だとしたら、各モデルサイクルを改善するためのフィードバックループは毎回より速くなるでしょう。これは非常に非常に興味深いことです。
R2について人々を本当に心配させているのは、最近ディープシークがTwitterで情報を公開したことです。彼らはオープンソースウィークの6日目に、もう一つ話したいことがあると述べ、オンラインサービスの統計と、利益率が545%であるという事実について話しました。つまり、彼らは実際に収益を上げている企業だということです。
なぜこれが驚くべきことなのでしょうか?AIに関わっていれば、裏側では、これらの企業は実際にはそれほどお金を稼いでおらず、継続的に巨額の資金調達を行わなければならないことを知っているでしょう。例えば、OpenAIは今年37億ドルの収益に対し、50億ドルの損失を計上しなければなりませんでした。これは非常に非常に興味深いことです。もちろん、彼らの収益は年々増加しており、それは良いことですが、多くの人々は、これらの西洋のテクノロジー企業が単に必要のないものにお金を費やしているのではないかと推測しています。
この特定のシナリオではそうではないと思います。AIは、前もって多くのお金を費やす必要があり、これらの利益が実現されれば、後に利益がもたらされるという特定のシナリオだと思います。しかし、株式市場が大幅に下落した理由のように、次のような疑問が浮かび始めています。もしこれらの企業が実際に収益を上げ、実際に継続的なユーザーを持つことができるなら、どうしてOpenAIは数十億ドルの収益を失っているのでしょうか?
知っておく必要があるのは、GPT-4.5などのモデルは、計算リソースとインフラに大きな投資を必要とするということです。GPT-4では、訓練に1億ドル以上かかったと言われており、これらの費用が実際に、ここで見られる50億ドルの損失のような会社の予想損失に寄与しています。もちろん、OpenAIはStargateイニシアチブに投資し、将来の推論のための巨大なデータセンターを持ちたいと考えています。
興味深いのは、これらの損失にもかかわらず、OpenAIは長期的な収益性と市場でのAIのリーダーシップにより、依然として大きな投資を獲得し続けていることです。最近の資金調達ラウンドについての議論を覚えていますが、OpenAIの資金調達ラウンドはすべて「オーバーサブスクライブ」されているようです。つまり、投資家がOpenAIに投資する機会が与えられるたびに、投資家たちは非常に熱心であるため、機会を得られない投資家もいるということです。これはもちろん、OpenAIにとっては素晴らしい問題です。
Sam Altmanが実際に次のように話しているのを見ることができます:「狂ったことに、私たちは現在OpenAI Proの購読で損をしています。人々が私たちの予想をはるかに超えて使用しているのです。」
興味深いと思うことで、多くの人が見落としていることは、はい、他の企業はお金を稼いでいますが、Deep Seekもそうですが、ここでのポイントは、毎年トークンの価格が劇的に下落するということです。
まず最初にGPT-4は100万トークンあたり36ドルでした。次にGPT-4 Turboは100万トークンあたり1ドルでした。その後7ドル、4ドル、そしてGPT-4 Miniは100万トークンあたり25セントになりました。これはAI業界が成熟するにつれて、年々、モデルのトークンあたりの知能の価格が下がり続けるという事実がより明確になります。
これは良くないことだと思います。他の企業が値下げを続けるならば、どうやって利益を出すのかと言う人もいますが、これは実際にOpenAIにとって良いことだと思います。基本的に、彼らが提供するサービスはほぼ無料になり、良いブランドを持っていれば、人々が使い続けたいと思う最高の製品の一つを持つことになるからです。
ディープシークがR2をリリースすることができたとしても、そのロールアウトは少し不安定になる可能性があると思います。R2はもちろんモデルの第二世代ですが、以前はR2が米国政府を心配させる状況がありました。なぜなら彼らはAIのリーダーシップを国家の優先事項として特定しており、このリリースが中国当局と企業をさらに奮い立たせる可能性があるとここに書かれています。数十の企業がディープシークモデルを彼らの製品に統合し始めたと述べています。
彼らが心配しているのは、ディープシークを禁止する可能性があるということです。数週間前、韓国やオーストラリアを含む多くの政府機関が、中国のAIスタートアップであるディープシークへのアクセスをブロックしました。主に政府職員に対してです。つまり、特定の国々はこれをよく思っておらず、彼らの携帯電話にディープシークを入れたくないのです。もちろん、彼らはこれがスパイウェアである可能性があると考えており、政府の安全のためにこれを禁止することになるでしょう。
これが国家安全保障上のリスクとみなされてアプリが禁止される、もう一つのTikTok状況になるかどうか疑問です。しかし全体的に見れば、彼らはAGIへの競争で中国に追い越される可能性について本当に心配すべきだと思います。彼らは明らかに非常に急速に動いており、ディープシークが非常に非常に急速に動いている理由は、彼らが非常に異なる管理スタイルを持っているという事実だと思います。
これは彼らがこれほど短い時間でこれほど多くのことを達成できた理由かもしれません。ここで見ることができるのは、「リャンは私たちにコントロールを与え、私たちを専門家として扱った。彼は常に質問をし、私たちと一緒に学んだ」と言っています。これは会社を去った人の言葉です。「ディープシークは、パイプラインの重要な部分のコントロールと所有権を取ることを許可してくれました。それは非常にエキサイティングでした。」
そして基本的に、ここにあるのは「フラットな管理スタイル」と表現されるものでした。これは非常に革新的なものだと思います。なぜなら、これは全員が同じレベルで働いているということだからです。つまり、コンパートメント化されておらず、全員が基本的に一緒に働いており、これにより組織はより円滑に動くことができます。個人がどのようになっているかを知っており、基本的により効果的に一緒に働くからです。
一方、他の企業ははるかに階層的であり、マネージャーに話し、次にこの人、あの人に話してから、すべてがチェーンの上へ行き、そして下へ行くということを意味します。そのため、この種の管理スタイルは、フラットな管理スタイルを持つことで企業がはるかに速く動くことができると認識し始めるにつれて、将来的にはより一般的になるかもしれないと思います。
R2についてどう思いますか?競争に実際にワクワクしていますか?なぜなら、それは私たちにとって実際に良いことだと思うからです。それはOpenAIに特定のモデルをリリースし、特定のリリースを加速させることを強制したからです。
R2が次の月、つまり4月中に発表されることになれば、それは非常に非常に興味深いことになると思います。企業は通常、新しいフロンティアモデルをリリースするのに何ヶ月も何ヶ月もかかることを考えると。しかし、次に何が起こるか楽しみにしています。
それでは、動画をお楽しみいただければ、次回にお会いしましょう。

コメント

タイトルとURLをコピーしました