Deepseek が AI 業界全体を破壊した… (何かが起こっている)

LLM・言語モデル
この記事は約11分で読めます。

この動画は、DeepSeekの新しいR1モデル「R1-0528」がAI業界に与える衝撃について論じた内容である。このモデルは従来のOpenAIベースの学習からGeminiベースの学習に切り替えたとされ、性能面でGemini 2.5 Proに匹敵する結果を示している。価格面では既存の大手モデルを大幅に下回る競争力を持ち、オープンソースとして提供されることで、クローズドソースモデルの収益構造に大きな脅威となる可能性が指摘されている。また、米中のAI競争という地政学的な文脈の中で、中国企業によるオープンソースモデルの戦略的展開と、それがアメリカのテック企業に与える影響について分析している。
5,985 文字

Deepseek just BROKE the Entire AI Industry... (something is up)
The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

さて、DeepSeekが再び大きな動きを見せました。DeepSeek R1-0528が登場です。最初は皆、これが元のDeepSeek R1モデルのマイナーアップデートだと思っていましたが、どうやらそうではないようです。DeepSeek R1は2025年1月の古いモデルから、2025年5月28日にリリースされた今日のモデルへと大きく飛躍しました。古いモデルから新しいモデルへの飛躍はかなり大きなものです。

基本的に業界のトップ集団の最前線に躍り出ました。Live CodeBenchにおいて、DeepSeekのこの新バージョンはo3 highと同レベルの性能をAIME 2024と2025で示しており、o3には若干劣るものの、Gemini 2.5 Proを上回っています。そして彼らが公開した他のベンチマークでも、同様にトップクラスの位置にあり、多くの場合でGemini 2.5 Proを上回っています。これはかなり大きな出来事です

私たちは皆、次の大きなモデルであるR2のリリースを期待していました。そして恐らく私たちの多くは、結果がこのようなものになることをある程度予想していました。業界のトップ集団の最前線に躍り出る、おそらく1位ではないかもしれませんが、間違いなく最高のOpenAI、Gemini、Anthropicのモデルと真っ向から競合する非常にトップクラスのどこかに位置するだろうと。

私たちはまた、新しいバージョンのGrokの登場も待っているので、それがどこに位置するかも見ものです。しかしここで理解すべき重要なポイントは、これはR2ではないということです。私たちは依然としてR2が来ると信じています。しかし、これらのベンチマークで見られる結果が実際の使用でも維持されるなら、このオープンソースモデルが現在Gemini 2.5 Proに匹敵する性能を持つということを意味し、将来的にはさらに大きくてオープンソースのものが登場する可能性もあります。

さて、問題は、彼らはどうやってこれを成し遂げたのかということです。こちらはサム・Pという方です。発音が間違っていたら申し訳ありませんが、彼はEQBenchを運営しています。EQBenchは大規模言語モデル向けの感情知能ベンチマークです。そして彼は非常に興味深いことを発見しました

これは私がこのプロジェクトについて知った初めての機会なので、それを念頭に置いてください。しかし、彼は各モデルに対してスロッププロファイルを持っているようです。つまり、これらのモデルがどのようなAIスロップを出力しているかということです。そして彼は生物情報学ツールを使ってそれらの系統樹を推定しているのですが、これは正直言って、彼の発想は素晴らしいと思います

繰り返しますが、私がこれを見るのは初めてなので、話半分に聞いてください。しかし、もしこれが機能するなら、これは素晴らしいことです。なぜなら、こちらが昨日リリースされたばかりの新しいモデル、DeepSeek R1のスロッププロファイルだからです。ご覧のとおり、創作文における様々な出力を分析して、上位の創造的単語、上位のバイグラム、上位のトライグラムなどを見つけています。

基本的に、これらのモデルはすべて、特定の表現や特定の単語を使う傾向がありますよね。おそらくGPTモデルがDelveをよく使うのを聞いたことがあるでしょう。それから、tapestries(タペストリー)という言葉ですね。彼らはtapestriesと言うのが大好きです。企業の役員がparadigm(パラダイム)という言葉を使いたがるのと同様に、ChatGPTはDelveとtapestriesを使うのが大好きなのです。

ここで見ることができるように、黄色でハイライトされ下線が引かれているのが、元のモデルであるDeepSeek R1です。ご覧のとおり、o3から分岐しているようです。つまり、GPTsに似ているということです。OpenAIのモデルということですね。Qwen2.5 Alphaが載っているのも興味深いです。なぜなら、このようなツールは、LLM Arenaで何かコードネームでテストされているモデルがあり、実際の名前や制作者がわからない場合に、誰がその背後にいるかを予測するために使用できるからです。

これは、モデルの背後にいるのが誰かを把握するための、かなり簡単な方法のようです。しかし、基本的に注目してください。元のDeepSeekは、OpenAIテクノロジーのクラスターの中にあるということです。それでは、先日リリースされたばかりの新しいDeepSeek R1-0528はどうでしょうか。こちらはGeminiテクノロジーから分岐しているところにあります。

Google Gemma、Gemini 2.5 Flash、そしてGemini 2.5 Pro experimentalと非常に、非常に似ているようです。サムさんの情報へのリンクを貼っておきます。皆さんがチェックしたい場合は、GitHubにあります。彼はウェブサイトも持っています。これはかなりクールなAIフォレンジックスだと言わざるを得ません。素晴らしいアイデアです。

しかし、これらすべての要点は何でしょうか。サムさんがここで言っているように、新しいDeepSeek R1がなぜ少し違って聞こえるのか疑問に思っているなら、彼らはおそらく合成OpenAIデータでの訓練から合成Gemini出力での訓練に切り替えたのだと思います。AI業界にはある種の公然の秘密があり、それはこれらの企業すべてが、他の既存モデルの出力を取って、その出力を使って自分たちのモデルを訓練しているということです。

だからこそ、たとえば非OpenAIモデルに、どのアーキテクチャで動いているかを聞くと、「ああ、私は非OpenAIのGPTアーキテクチャです」と言ったり、何かを拒否して「ああ、これはOpenAIのポリシーに反します」と言ったりするのです。誰もこれについて実際には話しませんが、これはかなり一般的な慣行のようです。彼らはこれを知識蒸留と呼んでいます。他のモデルからの合成データで蒸留したり訓練したりすることなどです。

もしそれが事実なら、これはかなり大きな問題です。ご存知のとおり、中国と米国の両方がAIの取り組みを進めるために競争しています。これは単なる私の意見ではありません。こちらは米国エネルギー省が「AIは次のマンハッタン計画であり、米国が勝利する」と述べているものです。つまり、彼らは基本的にAIの開発を核爆弾の開発と比較しているのです。

そして、サウジアラビアの指導者たちとの会議を追っていたなら、イーロン・マスク、サム・アルトマン、ジェンスン・フアンがそこにいて、他にも多くの人々がいました。彼らはAIの開発分野で同盟国と提携して、これらのAIモデルの訓練と実行に必要な十分なエネルギーを得ようとしています。これは数ヶ月前にバラジさんが行った声明です。

私が思うに、コンピュータビジョンからロボティクス、画像生成、そしてDeepSeekの大規模言語モデルまで、中国のオープンソースAIモデルの完全な電撃攻勢を目にすることになるでしょう。なぜそうなるのでしょうか。潜在的に彼らの目標は、AIソフトウェアから利益を取り除くことかもしれません。なぜなら彼らはAI対応ハードウェアでお金を稼いでいるからです。つまり、彼らは私たちアメリカよりも物理的なものをよく作ることができるのです。

アメリカはソフトウェアが非常に得意で、ソフトウェアをリードし、AIをリードしてきましたが、もちろんアメリカのテック企業は、NVIDIAチップなどを購入し続け、AIを成長・発展させ続けるために、お金、資金、リソースが必要です。今、DeepSeekや他の誰かがオープンソースモデルで、アメリカのテック企業が最前線に到達し、最高のクローズドソースモデルを作るたびに、誰かがそのモデルを再訓練してトップに躍り出て、オープンソースAIを無料または非常に安価で提供し、人々が独自の特定の用途に使用できるよう重みを公開することで、人々が独自のアプリケーションに微調整できるようにするなら、それは多くの企業から勢いを奪ってしまいます。資金調達や収益能力を奪ってしまうのです。

そしてオープンソースモデルが最高のクローズドソースモデルと歩調を合わせ続けるなら、それは基本的にこれらの大企業の利益率を消し去ってしまいます。同じ性能に対して3倍の価格を請求することはできません。そしてコスト差はそれ以上に大きい可能性があります。

たとえば、これらの新しいモデルのAPI価格はこちらです。DeepSeek R1-0528、これがDeepSeek Reasonerです。こちらでは、使用時期に応じて複数の価格設定があります。割引価格、標準価格、また現金を使用するかどうか、ヒットかミスかによっても異なります。つまり、入力に13セントから55セント、出力に50セントから2.20ドル(100万トークンあたり)と呼べるでしょう。

OpenAIのo3については、入力が15ドルから25ドル、出力が60ドル(100万トークンあたり)です。Gemini 2.5 Pro previewについては、入力を1.25ドルから2.50ドル、出力価格を10ドルから15ドルとしましょう。つまり、DeepSeek R1の価格設定は打ち負かすのが非常に困難であり、特にトップ集団に追いつき、迅速に追いつき続けているならなおさらです。

こちらのYouTubeチャンネル「AI Explained」では、DeepSeek、特にDeepSeekの創設者について素晴らしいミニドキュメンタリーがあります。そして創設者のLiangさんからの引用がこちらです。「破壊的技術に直面して、クローズドソースによって作られた堀は一時的なものです。OpenAIのクローズドソースアプローチでさえ、他者が追いつくことを防ぐことはできません。だから私たちは、チーム、組織、そして革新能力のある文化に価値を置いています。それが私たちの堀です。私たちはクローズドソースに変更することはありません」

ご想像のとおり、ここでは多くのことが起こっています。中国と米国の間の競争があります。そして繰り返しますが、これは単なる物語ではありません。

米国当局者、エネルギー省からのツイートを見ました。UAEでのその会議で行われたスピーチもありました。これは実際に起こっていることです。通過する可能性が高い法案があり、まだ変更が起こっているかもしれませんが、特に国内ソフトウェア開発のための様々な研究開発費の償却方法に関するルールを変更することになるでしょう。

うまくいけば、これが通過した時に、この分野について多くを知っている誰かが深く掘り下げて、実際に何が起こっているかを説明してくれることを願っています。私には、これは米国のテック企業がAIやソフトウェアなどを開発するエンジニアの雇用により多く投資するためのかなり大きなインセンティブのようです。これはAIという言葉を一度も使わずにAI開発を補助金で支援する方法です。

X.comのNathan Landsさんが、同時に中国で何が起こっているかについて素晴らしいカバレッジをしています。こちらで、米国のエネルギー生産がある種の横ばい状態にある一方で、中国は急速に前進しています。もちろん、皆がその種の米国対中国の競争マインドセットにあることを念頭に置いてください。確実に多くの協力があります。

中国からの多くの学生、研究者、人々がここに来て教育を受け、その中の一部はここに留まって米国の研究所で働き、一部は戻っていきます。そして確かにここNVIDIAのジム・ファン博士が言うように、DeepSeekをOpenAIの元々の使命を生かし続けているものとほぼ考えることができます。つまり、真にオープンな最先端研究です。

だからここで重要なのは、研究者やAI研究所で働く人々を、両国の政府から区別することです。彼らは同一ではありません。そしてもちろん研究者間には多くの協力があります。論文を発表している人々は、彼らの秘密を他の皆と共有します。研究者コミュニティはそれを使用でき、そのおかげで皆がより良くなります。しかし、政府とこれらのAI研究所の間の重複も両側でますます見られるようになっています

ですから、それを念頭に置いてください。私は必ずしも一つの物語や別の物語を推進しているわけではありません。何かが良いか悪いかを言っているわけではありません。確実にこれはオープンソースコミュニティ全体にとって本当に良いことです。私はただ、ここには多くの動いている部分があると言っているだけです。多くの非常に強力なプレイヤーがいます。皆それぞれ独自のインセンティブを持っています。

また、シリコンバレーの多くの人々、技術リーダーたち、通常はかなり平和を愛する人々が、中国の危険性について少し声を上げています。それはAIの安全性を心配しているからでしょうか。それとも中国やオープンソースとの競争を心配しているからでしょうか。もしかすると、政府を少し脅かして行動を起こさせることができれば、政府が例えば特定のチップの中国への輸出を許可しないなどして、競争を容易にしてくれるかもしれないと感じているのかもしれません。

要点は、必ずしも何らかの単純な物語を買い込む必要のない多くの動いている部分があるということです。しかし、ここでの大きなポイントは、車輪がますます速く回転しており、ますます多くの競争とますます多くの関心が宇宙にあり、賭けている stakes が急速に上昇しているということだと思います。

もしあなたが最初からこのチャンネルを見ているなら、私は常に、ベイエリアのいくつかの研究所が、世界の他の部分が気づかずに超知能を開発することを許されるのは非常にありそうもないと言ってきました。「ああ、どうぞ。私たちはそれについてあまり心配していません」なんて言って。

多くの企業、さらには国家にとって、それらの企業や国家をコントロールしている多くの人々は、おそらくAIを存亡をかけた勝ち負けの条件として見ているでしょう。それが真実かどうかにかかわらず、人々はこれに多くを賭けています。ですから、乞うご期待です。私たちはまだ始まったばかりです

ここまで見てくださった方、本当にありがとうございました。私の名前はウェス・ロスです。また次回お会いしましょう。

コメント

タイトルとURLをコピーしました