DeepSeek R1 – 業界全体を震撼させた中国のAI「副業プロジェクト」!

AGIに仕事を奪われたい
この記事は約13分で読めます。

7,376 文字

DeepSeek R1 - The Chinese AI "Side Project" That Shocked the Entire Industry!
Join My Newsletter for Regular AI Updates 👇🏼 Links 🔗👉🏻 Subscribe: 👉🏻 Twitter: https:/...

DeepSeek R1は数日前にリリースされ、AI業界に衝撃波を送りました。R1はOpenAIの最先端モデルであるo1やo3と同様の思考能力を持つAIモデルですが、ここで重要なのは、完全にオープンソースでオープンウェイトだということです。中国の小さな企業DeepSeekは、全てを無料で公開し、さらにその再現方法まで詳細に説明しました。
しかし、さらに驚くべきことに、このモデルの訓練費用はわずか500万ドルでした。これは、このレベルのモデルを訓練するには数千万から数億ドルが必要だと考えられていた業界の常識を覆すものでした。この事実は、AI業界全体にその影響を理解しようとする動きを引き起こしました。DeepSeekは、OpenAIやMetaといった米国の大手テック企業の没落の象徴から、人類への最大の贈り物、さらには米国を揺るがすための中国のスコープまで、様々に評価されています。
約1週間前、トランプ大統領、OpenAIの創業者兼CEOのサム・アルトマン、Oracleの創業者らが集まり、プロジェクト・スターゲートについて発表を行いました。これは米国におけるAIインフラに5000億ドルを投資するというもので、主にNVIDIAから供給されるGPUに既に投資されている数千億、あるいは数兆ドルに加えての投資です。
その直後、マーク・ザッカーバーグも、自社MetaがエネルギーインフラとAIインフラの構築に数十億ドルの投資を継続すると表明し、AIインフラへの投資を倍増することを発表しました。
世界最大のテック企業の間では、AIで勝つためにできる限りの投資をするという流れがありました。そんな中、2025年1月20日、中国の小さな研究企業であるDeepSeekが、DeepSeek R1という完全にオープンソースでオープンウェイトのAIモデルをリリースしました。このモデルは、テストタイムコンピュートとして知られる思考能力を持ち、数億ドルの訓練費用がかかったOpenAIのo1モデルと同等かそれ以上の性能を持っています。
このリリースにより、AI業界は一転しました。突如として、近い将来には手に入らないと思われていた最先端モデルが、完全にオープンソースで、実質的に無料で手に入ることになったのです。初期の反応は非常に強烈でした。私もこれについて複数の動画を制作しました。AI業界の大物たちは、完全にオープンソースの最先端モデルを手に入れたことに驚愕しました。
皆がこの状況を受け入れ、モデルを試して再現できることに興奮していた矢先、その雰囲気は一変しました。DeepSeekと共に公開された技術論文には、このモデルの訓練費用がわずか500万ドルだったと記されていたのです。これは他の最先端モデルの訓練費用のほんの一部に過ぎません。
これが意味することを考えてみてください。Meta、Microsoft、OpenAI、そして素晴らしい7社(Magnificent Seven)、つまり世界最大の7つのテック企業は、AIインフラの構築に数兆ドルを投資してきました。そんな中、この小さな中国企業が登場し、最高レベルのモデルと同等のモデルをオープンソースで公開し、しかもその費用はわずか500万ドルだったと発表したのです。
すると突然、多くのアナリストが、年間数十億ドルを投資しているこれらの大企業を見て、本当にそれが必要なのかと考え始めました。多くの人々がこれらの大企業を指さして、「あなたたちは負けようとしている。これほどの投資は必要なかったのだ」と言い始めました。私は全くそうは思いませんが、これが現在のAI業界で起きている議論の一つです。
そしてTwitterで誰かが、DeepSeekはどうやって収益を上げるのかと質問しました。なぜなら、彼らは全てを無料で提供し、モデルを実行するためのAPIエンドポイントも非常に安価で、さらに自前のハードウェアで実行することもできるからです。
すると、このツイートがバイラルになりました:DeepSeek holdingは(これは中国企業の名前ですが)クオント企業です。つまり、単にお金を稼ぐために取引アルゴリズムを構築することを任務とする数学者たちの会社なのです。彼らは何年も前から、優秀な数学のバックグラウンドを持つスマートな人々で、取引やマイニングの目的で多くのGPUを所有していました。そしてDeepSeekは、それらのGPUを活用するための副業プロジェクトだったのです。
つまり、これは会社の主要な機能ではなく副業プロジェクトだったのです。賢い人々が集まり、最先端のモデルを信じられないほど安価に作る方法を見つけ出し、AI業界全体に衝撃を与えました。そしてそれは彼らの副業プロジェクトだったのです。考えられないことです。
これはバイラルとなり、ミーム(インターネット上で広まる画像)も強い反響を呼びました。業界の人々からのいくつかの反応をお見せしましょう。
こちらはSimp for Satoshiからのものです:「サムはこの車(私が知る限り数百万ドルする高級車)にDeepSeekがOpenAIを殺したモデルの訓練費用より多くを費やした」と書かれています。これはサム・アルトマンが運転している写真についてのコメントです。繰り返しますが、私はこれを本当だとは思っていません。後ほど私の考えを説明します。
次にヴィノド・コースラの息子であるニール・コースラは次のように述べています:「DeepSeekは中国共産党の国家的スコープであり、米国のAIを収益性のないものにするための経済戦争だ。彼らは低価格を正当化するために費用が低かったと偽装し、皆がそれに切り替えることで米国のAI競争力を損なうことを期待している。この餌に乗ってはいけない」。これには、この主張を裏付ける証拠は全くないというコミュニティノートが付けられました。
しかし、これは最も極端な見方ではありませんでした。ダボスでは、Scale AIのCEOであるアレクサンダー・ワンがDeepSeekを批判し、「彼らは実際には彼らが言っているよりもずっと多くのGPUを持っている」と述べました。なぜなら、米国から中国への最先端チップの輸出が禁止されているからです。
研究論文で多くのGPUを持っていることを認めれば、明らかに米国は怒るでしょう。このクリップでは、アレクサンダー・ワンがDeepSeekはおそらく50,000台のH100(NVIDIAの最高級GPU)を持っており、米国の輸出規制に違反するため、それについて話せないのだと語っています。
それは事実かもしれません。しかし、すべてがオープンソースで、DeepSeekは実際にこのモデルをどのように安価に製作したかについて詳細に説明しており、Hugging Faceという会社が現在それを再現しているということを覚えておいてください。
Stability AIの創設者であるEmadの投稿をお見せしましょう。彼は基本的に数字を計算し、「そうだ、彼らの言っていることは実際に正当だ」と判断しました:「DeepSeekは実行コストを偽装していない。データ構造、アクティブパラメータ、他の要素を考慮すると、他の人々が訓練した他のモデルと比較して予想される範囲内だ。同じコストで独立して実行できる。彼らは一生懸命働いている優れた研究室だ」。
彼は数字を示していませんでしたが、もちろん後でフォローアップして示しました。「数字が知りたい人のために、ここにあります。最適化されたH100なら250万ドル以下でできる」と彼は述べ、実際にChatGPT o1を使って計算しました。この動画では少し技術的すぎるのでその詳細には触れませんが。
そして今や、焦点は再び主要テック企業に戻っています。Anthropic、Meta、OpenAI、Microsoftは、AIインフラを構築するために数十億ドルを調達し支出してきましたが、この小さな中国企業によって足元をすくわれた形です。
これを聞いてください:「DeepSeekは大バイラルとなり、推論に使用する2台のChromebookで需要に対応できている。一方、Anthropicは数十億ドルの資金を持ちながら、有料顧客の負荷に対応できない。これは正しい理解でしょうか?」これが業界全体の感情のようです。
こちらは別の例です:「過去数時間で、DeepSeek APIに20万件以上のリクエストを送信しました。レート制限なし、全体の費用は50セントほど。中国共産党に感謝、OpenAIではあり得ません」。
ここで重要なのは、私たちはこのチャンネルでテストタイムコンピュートについて多く話してきたということです。現在のAIでのスケーリングの多くは、事前訓練(モデルを構築するために必要な500万ドル)ではなく、モデルが考えることができ、より多く考えるほど良い結果が得られるため、その思考は実際には計算能力を使用しているのです。
興味深いのは、テスト時でも、APIに20万回のヒットがあり、レート制限がなく、非常に安価だということです。大量のGPUを持っていて私たちが知らないだけで大損しているのでない限り、彼らは米国企業が見つけていない効率性について何かを発見したということになります。
アレクサンダー・ワンは次のような投稿でフォローアップしています:「DeepSeekはアメリカにとって警鐘だが、戦略は変わらない。米国はAIの歴史全体でそうしてきたように、さらなるイノベーションと高速な競争を行い、将来のリードを維持するためにチップの輸出規制を強化しなければならない。AIの主要なブレークスルーは全て米国によるものだった」。
「中国のDeepSeekは、米国株式市場にとって最大の脅威となる可能性がある。この企業は、最先端チップへのアクセスなしに、極めて低コストで画期的なAIモデルを構築したように見える。これは、業界に投入されている数千億ドル規模の設備投資の有用性に疑問を投げかけている」。これは非常に大きな主張です。
モデルを最初に非常に安価で効率的に訓練できることは一つのことですが、推論を非常に安価で効率的に実行できることは別の話です。私が先ほど信じないと言った理由を説明させてください。
2つの可能性があります。まず、彼らがこのモデルを非常に安価に作る方法を見つけ出したと仮定しましょう。素晴らしいことですね。誰もが勝者です。これがオープンソースの力です。
推論時、つまり思考時において、2つのパスを考えてみましょう。このモデルが非常に安価に推論を実行できる場合、私たちはジェボンズのパラドックスに直面します。つまり、任意の技術の単位あたりのコストが下がると、使用量、総使用量、支出は実際には増加します。このチャンネルでも話してきたように、これは技術の単位コストが下がるにつれて、正のROIで適用できるユースケースの数が劇的に増加するためです。これは歴史を通じて、あらゆる技術で見られてきました。
もう一つのパスを考えてみましょう。彼らは実際に多くのGPUを持っていて、単にその効率性を偽装しているのかもしれません。まず、世界中のAI企業がDeepSeek R1を現在複製しているため、私たちはそれを発見することになるでしょう。しかし、彼らがそうしているとしても問題ありません。
これらのAI企業によるAIインフラへの莫大な投資は依然として有効です。そして、たとえそれが本当に効率的だとしても、これらのAI企業によるAIインフラへの莫大な投資は依然として有効です。なぜなら、最終的には最も多くの計算能力を持つ者が最も賢いモデルを持つことになるからです。トークンあたり100ドルかかろうと、1セントの何分の1かかろうと関係ありません。より多くの計算能力があればあるほど良く、最も賢いAIを持つ者が勝者となります。
Y Combinatorの社長であるゲイリー・タンも基本的に同じことを言っています。これは先ほど話した、米国株式市場にとって大きな脅威だというグラフに関連してのことです:「人々は本当にこれを信じているのか?モデルの訓練がより安価に、より速く、より簡単になれば、推論、つまりAIの実際の実世界での使用への需要が成長し、さらに加速する。これは計算能力の供給が使用されることを保証する」。これが考えるべき方法だと私も全面的に同意します。
しかし、全員が同意しているわけではありません。億万長者の投資家で、元Facebookの初期従業員、All-inポッドキャストの仲間であるChamath Palihapatiyaは、全く反対の意見を持っており、実際にかなり詳しく説明しています。
彼の最初のポイントでは、中国共産党が持つべきではないこれらのチップを持っている1%の可能性があるなら、それを調査する必要があると述べています。
次に、彼は訓練と推論について話します。私たちは今、推論の時代にいます。この日が来ることは常に分かっていましたが、このような安価なモデルで今週末に来るとは多くの人々を驚かせたかもしれません。多くの新しい製品や体験が、今や世界の人々の心を掴もうと現れる可能性があります。チームUSAはここで勝つ必要があります。
その点について、私たちはまだAI訓練チップの輸出を規制したいかもしれませんが、推論チップは異なる見方をすべきでしょう。世界中の誰もが他のものではなく、私たちのソリューションを使用することを望むべきです。
そして、ポイント4に飛びますが、これは興味深く、私が本当に同意できない部分です:資本市場がこれらの情報を吸収し、Magnificent 7(TeslaやMeta、Microsoftなどの素晴らしい7社)の価値を再評価する中で、株式市場には変動があるでしょう。
それを念頭に置いてください。Teslaは最も影響を受けにくく、残りは彼らが公に発表した設備投資額に直接比例して影響を受けます。つまり、もし今すべてが安価になったなら、なぜ彼らはそれほど多くを投資したのか、という理由で企業の株価が下がる可能性があるということです。
私は全くそれに同意しません。再びジェボンズのパラドックスを見てみましょう。技術が安価になればなるほど、より多く使用され、より多くの推論が必要となり、そのためGPUのすべての供給が使用されることになります。
NVIDIAは明らかな理由で最もリスクが高いです。とはいえ、MetaやMicrosoft、Googleなどが年間500億から800億ドルを支出せずに勝てるなら、市場はそれを好むでしょう。市場はそれを好むかもしれませんが、そうはならないでしょう。
繰り返しますが、最終的に最も賢いAIを持つ者が勝者となります。人工超知能に達した時、それは文字通り誰が最も賢いAIを持っているかの戦いです。そしてそれには何が必要でしょうか?最も多くの推論、あるいは一般的に最も多くの計算能力です。そして、それには何が必要でしょうか?最も多くのチップ、チップへの最も多くの投資です。
これらのチップを使用する本当に効率的な方法を見つけることができれば、素晴らしい、誰もが勝者です。しかし、最終的には累積チップ数、あるいは計算能力が本当に重要になるのです。
彼は米国を批判し続け、興味深い見解を述べています:「中国からのイノベーションは、私たちが過去15年間いかに眠っていたかを物語っています。私たちは大金という輝かしい対象に向かって走り、問題をより賢く考え、リソースの制約をイネーブラーとして使用する代わりに、数千億ドルを問題に投げ込んできました」。
知っておくべき重要な概念は、人々がより大きな制限とより大きな制約に直面すると、より創造的になる傾向があり、より少ないものからより多くの効率性を引き出すことができる傾向があるということです。これが彼が本当に言及していることだと思います。「制約がイノベーションの母である」という言葉があると思います。
しかし、全員が陰謀論や米国テック企業の終わりだと考えているわけではありません。MetaのAI部門の責任者であり、オープンソースの大きな支持者であるヤン・ルクンは、次のように述べています:
「DeepSeekのパフォーマンスを見て、中国が米国のAIを追い越していると考える人々へ。あなたたちは誤って解釈しています。正しい解釈は、オープンソースモデルが独自モデルを追い越しているということです。DeepSeekはオープンな研究とオープンソース(例:MetaのPyTorchとLlama)から恩恵を受けました。彼らは新しいアイデアを思いつき、他の人々の仕事の上に構築しました。彼らの仕事がオープンソースで公開されているため、誰もがそれから恩恵を受けることができます。それがオープンな研究とオープンソースの力です」。
私も全面的に同意できません。これはオープンソースにとって大きな勝利です。これにより、多くの企業がオープンソースの最先端モデルを持つことで、クローズドなフロンティアモデルと競争し始めることができるようになります。
この物語はまだ展開中です。基本的に彼らが考えていたすべてのことが今まさに変わろうとしているというニュースに、AI業界が反応するのを見るのは非常に興味深いことでした。
あなたはどう考えますか?彼らは示唆しているよりも多くのGPUを持っていると思いますか?それとも、ほんの一握りの人々が副業プロジェクトとして、この驚くべき効率性を基本的に生み出すことができたと思いますか?中国がAIでリードを奪ったのでしょうか?それともこれは、オープンソースであるため、世界への素晴らしい贈り物なのでしょうか?
私はこの物語のフォローを続けます。私は今世界で起きていることに完全に魅了されています。私はあなたたちにうまく説明できたと思います。このビデオを楽しんでいただけたなら、いいねとチャンネル登録を検討してください。次回の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました