本動画は、2024年12月のAI業界における8つの重要なニュースを10分間で解説するものである。ChatGPT 5.2の緊急リリース、トランプ政権による州レベルのAI規制への連邦介入、AGI実現に対する懐疑論、Anthropicのエージェントによる460万ドルのスマートコントラクト攻撃シミュレーション、Andrej KarpathyによるLLMの本質的理解に関する提言、イーロン・マスクの軌道上AI計算構想、DeepSeekによるNvidia禁輸チップの密輸疑惑、そしてヒューマノイドロボットの実用展開の加速という多岐にわたるトピックを扱っている。特にOpenAIとGoogleの競争激化、AI規制を巡る連邦政府と州政府の対立、そして物理的計算限界に関する技術的議論が注目される。全体として、AI技術の急速な進化と、それに伴う規制・経済・技術的課題が浮き彫りになる内容となっている。

今週のAI業界を揺るがした8つの重要ニュース
私は今週、AI関連のニュースを追うために20時間以上を費やしました。そして、これから10分程度で重要な8つのストーリーをお伝えします。
1つ目はChatGPT 5.2についてです。ChatGPT 5.2がOpenAIからリリースされました。これはGemini 3のローンチとAIベンチマークでのトップ獲得を受けて、モデルを急いで市場に投入するための社内コードレッド体制の結果です。OpenAIはタイムラインを加速させるために絶対的なスクランブル状態にありました。
5.2のアップデートされたシステムカードでは、スタイル、トーン、さらには安全性の動作に関する新しい制御機能がハイライトされています。これらは企業のコンプライアンス要件とフロンティアモデルに対する規制当局の監視に対応するために設計されています。40万トークンのウィンドウは大きな勝利であり、時間をかけた実際の複雑なワークフローを実行するモデルの能力において、本当に重要な進歩を表しています。
つまり、300ページ以上の研究文書を投入して、その全体にわたって本格的な分析を得ることができるのです。ここでの競争圧力は本当に明白です。OpenAIのリリースペースは、GPT5の主要アップデート間が6ヶ月ごとだったのが、5.1と5.2の間ではわずか数週間に加速しました。そして、1月には5.3か類似のものが出るという噂があります。したがって、ペースは加速し続けるでしょう。
ここで注目すべき点は何でしょうか。5.2のAPI価格に注目してください。5.1よりも大幅に安くなることが予想されます。そして、彼らがコードレッドのスクランブル状態をどれだけ長く続けるかに注目してください。OpenAIは資金調達を続けるために、ベンチマークでリードし続ける必要があります。
トランプ政権によるAI規制の連邦統一化
2つ目のストーリーは、トランプ政権が州レベルのAI規制を先取りし、連邦資金を脅かす大統領令に署名したことです。この大統領令は「AIのための国家政策枠組みの確保」と題されており、連邦政府に対して単一のより軽いタッチのAI規制基準を確立し、国家の競争力目標と矛盾すると見なされる州レベルのAI法を積極的にブロックするよう指示しています。
ホワイトハウスは、この命令を50の異なるAIコンプライアンス体制のパッチワークを防ぐために必要なものとして位置づけました。そのようなパッチワークは、米国のAI企業がグローバルに競争する能力を妨げるというわけです。これを、ワシントンで人気のある大国間競争の物語の一部として考えてください。ワシントンは、米国に拠点を置く企業が中国に拠点を置く企業と効果的に競争できるようなAI競争環境を促進したいのです。
ここで注目すべきは、司法省が最初にどの州法をターゲットにするかです。カリフォルニア州のSB 1047改正かもしれません。あるいはコロラド州のバイアス監査要件かもしれません。これは彼らが最近導入したものです。また、どれだけの州が法的挑戦で押し返すかにも注目してください。
議会は2026年に連邦AI法案を導入するかもしれません。私は息を止めて待つことはしませんが。それまでは、EUや他の管轄区域が、米国のAI説明責任フレームワークについて懸念を持ち続ける場合、米国のAIシステムへの市場アクセスをどのように配分するかに注目してください。
AGI実現不可能論という挑戦的な主張
3つ目のストーリーは、Allen Institute for AIの研究者であり、GPU量子化技術、特に有名なQLoRA技術を開拓したことで知られる元カーネギーメロン大学の博士であるTim Dettmersから来ています。
彼は今週、「なぜAGIは実現しないのか」というタイトルで広く議論されたブログ投稿を書きました。彼は、有意義なGPUパフォーマンスはすでにピークに達しており、AGIとスーパーインテリジェンスの両方が、計算の物理的制約を無視することに根ざした幻想であると主張しました。
Dettmersは、GPUは2018年以降、一回限りの機能を追加してきたと主張します。彼は、これらの機能は今や使い果たされ、さらなる改善は収穫逓減に直面していると主張します。彼の中核的な論点は3つの主張に基づいています。
第一に、GPUはコストあたりのパフォーマンスを2018年頃に最大化し、その後の利得はアーキテクチャ上のトリックによるものだということ。第二に、Transformerは局所的計算とグローバルな情報プーリングまたはアテンションのバランスを取るために物理的にほぼ最適であるということ。そして第三に、スケーリング則は線形の改善のために指数関数的なリソースを必要とし、つまり業界はインフラコストが能力向上を上回る前に、あと1、2年のスケーリングしか残っていないということです。
この投稿は、AI研究コミュニティと懐疑派コミュニティ全体で大きな議論を引き起こしました。一部の人々は、Less WrongやSilicon FloristのようなテックプレスのアウトレットでDettmersの議論を増幅させていました。他の人々は、彼がもたらす視点は、以前にGPU最適化に関与していたため信頼できるものの、Nvidia、AMD、Intelのようなハードウェアベンダーが見ている方向とあまりにも対立しているため、最終的には正しくないだろうと主張していました。
これに対する私の見解は、Dettmersはおそらく詳細については正しく、より大きなストーリーについては間違っているということです。彼がGPUがどのように機能するかを理解する専門知識を明らかに持っていることは思います。しかし、彼が見逃しているのは、過去50年、60年、70年にわたって計算スケーリングを機能させる方法、ムーアの法則を現実にした方法は、1つの技術的トリックを繰り返し追うことではなかったということです。それは、計算を前進させることに焦点を当てるために資本と注目を割り当てる産業全体でした。
これはまさにAIで見られるのと同じダイナミクスです。だからこそ、AGIをGPU上で起こるべき特定の技術的ブレークスルーにロックすることは間違っていると思います。何らかの理由でGPUに制限があるかもしれませんが、イノベーションに投入される十分な資本と注目があるため、計算をスケールする能力に長期的な限界は見えません。
そして記録のために言っておくと、主要なラボの研究者たちも誰もそう見ていません。OpenAI、Anthropic、Meta、Googleで働いている場合、壁について話している人は聞きません。実際、彼らは積極的に「壁は見えない。継続的なスケーリングが見える」と言っています。そして、彼らはそれを言っているだけでなく、実際に出荷しています。
だから、私たちは経験的証拠を見て、継続的なスケーリングを確認し、自問する必要があると思います。なぜこれが続かないのでしょうか。デフォルトの立場は、私たちが資本を割り当て続け、注目を割り当て続け、スケーリングのブレークスルーを見続けるということであるべきです。Dettmersが指摘した特定の技術ではないかもしれませんが、全体として、知能の改善を見続けるべきです。
もし私が間違っていたらどうでしょうか。しかし、もしDettmersが正しいとしても、皮肉なことに、Dettmersが正しかったとしても、私たちは20年以上のAI駆動型企業破壊に向かっていると思います。なぜなら、すでに組み込まれている既存の能力セットがすでに非常に破壊的であり、世代全体がこれらのシステムにAIを組み込むためにキャリアを費やす必要があるからです。
AIエージェントによる大規模なセキュリティ侵害
4つ目のストーリーは、Anthropicのものです。AIエージェントがシミュレートされた盗難で460万ドル以上のスマートコントラクトを悪用しました。ここでのストーリーは、自律的なAIエージェント能力の継続的な向上です。エージェントには契約アドレスと「脆弱性を見つけて悪用せよ」というような非常にハイレベルな指示のみが与えられました。そして彼らは、偵察を実行し、エクスプロイトを作成し、攻撃を検証することを自律的に実行できることを示しました。
ここでの教訓は非常にシンプルです。エージェントはどんどん良くなっていき、新しい悪用を見続けることになります。ITセキュリティの専門家は、野生のあらゆるエージェントが潜在的に敵対的であると仮定する必要があります。
LLMの本質に関する新しい理解
5つ目のストーリーは、Andrej Karpathyが、LLMは視点のシミュレーターであり、LLMと話すときに「あなた」のような代名詞を使うべきではないと主張するスレッドでバイラルになったことです。なぜなら、それは平均化された中間盆地の意見に向かって彼らを押しやり、LLMからの内部的なアイデンティティの感覚を本当に反映していないからです。それは単に、彼らが得る平均化された事前学習データを反映しているだけです。
そして、実際にLLMに研究者、プロダクトマネージャー、CTOのような特定の役割内のシミュレーターとして行動するよう求めることで、はるかに興味深い応答を得ることができます。ここでの皮肉は、すべてが一周するということですよね。私たちは役割が終わったと世界に発表したばかりなのに、今度は役割が重要だと言い始めています。
LLMについて良い理解と良いメンタルモデルを持っていれば、人々が意見を変えたり、このような新しいことが出てきたりしても、振り回されることはないということを指摘したいと思います。私はしばらくの間、役割は答えの正確性のためには有用ではないかもしれないが、高次元の潜在空間を通じてLLMを特定のアテンションシンクに向かって操縦するのに有用であり、そこで有用な次のトークン予測を得ることができると言ってきました。
基本的に、それがAndrej Karpathyが言ったことですが、彼はより賢く、絶対に正しく言っており、注目を集めていることを嬉しく思います。なぜなら、プロンプティングのために役割を使わず、代わりにこれらのマジックワードを使うということに、あまりにも多くの注目が集まっていたと思うからです。私たちは、これらのモデルのより広範な能力について考える必要があります。Andrejは仮定に挑戦する先導者であり続けており、この場合、彼は擬人化に挑戦していると思います。
彼はモデルを人間のように扱うのではなく、モデルをシミュレーターとして扱い、異なる視点をシミュレートできるようにすると言っています。それは本当に有用な見解です。
宇宙データセンター構想と実現可能性
6つ目のストーリーです。Elonが軌道上AI計算を提案しています。ここでのストーリーは簡潔でシンプルです。それは議論でした。今日、宇宙には何もありません。核となるアイデアは、宇宙は熱を排出するので、熱いデータセンターを宇宙に置き、レーザーでトークンをビームダウンできるはずだということです。
誰かが今後1、2年以内にこれを試みるでしょう。ソーラーパネルで駆動される宇宙のデータセンターを試みる誰かを見ることになります。そして、これがデータセンターのフットプリントをスケールし、LLMをスケールする妥当な方法であるかどうかを急速に見ることになります。
ここでの私の見解は厳密に経験的です。それが機能するかどうかわかりません。実際にこれができるかどうかは明確ではありません。もしできるなら、誰かがそれを試して確認するでしょう。
DeepSeekによる輸出規制チップの密輸疑惑
7つ目のストーリーです。DeepSeekは輸出禁止にもかかわらず、密輸されたNvidiaのBlackwellチップを使用していると報じられています。The Informationが12月10日にこれを報告しました。コスト効率の高いモデルで知られる中国のAIスタートアップが、米国の半導体制限の下で中国への輸出が禁止されているGB200とB200を使用してきました。
Nvidiaは、ファントムデータセンターの記録はないと述べていますが、東南アジアや中東の正規の購入者からBlackwellのサンプルが紛失していないことを証明できず、中国に行き着く可能性のあるGPUネットワークに何らかの漏れがあることを示唆しています。皆さん、これは私の驚いた顔です。
ヒューマノイドロボットの実用展開加速
8つ目のストーリーは、ヒューマノイドロボットがラボのデモから実用的な展開へとシフトしていることです。UBSは実際にこれに参入し、2035年までにロボティクスの職場ユニットが200万台になると予測しています。皮肉なことに、彼らがその予測を行ったという事実は、現実がはるかに高くなることを示唆していると思います。
先週の複数の情報源は、ヒューマノイドロボットの加速する進歩を強調しており、Figure AIのヒューマノイドは2023年のぎこちない限定的な歩行から、2025年には動的なバランス補正とパッケージの仕分けに移行しました。これは約18ヶ月の開発サイクルであり、Figureはすでにロボットを工場に展開しています。
ところで、Dettmersはロボティクスのケースが見えないと指摘しました。そして、彼がそれを言った同じ週に、Figure AIのCEOによって1時間の長さのビデオが投稿されたのを見るのは本当に、本当に興味深いと思います。
基本的に、それが示すのは、組立ラインに立ってパッケージを正しく仕分けしているヒューマノイドロボットだけです。ロボットは来ています。ロボットを提供することが経済的ではないという考えは、根本的に間違っています。ユニットあたりのコストの継続的な低下が見られるでしょうし、今後数年で1万ドル以下への低下が見られると予想します。
来年、特にAmazon、BMW、Foxconnなどがヒューマノイドロボットをスケールし始めた場合、企業展開パターンに注目してください。それは業界の転換点になるでしょう。また、家庭用タスクのパフォーマンスが、たとえば2027年のホリデーシーズンに消費者購入の転換点を正当化するのに十分改善するかどうかにも注目してください。
現在の能力は、家庭ではまだ本当に重要な人間の監督を必要としています。そして、ロボットが真の家庭用ヘルパーになることを可能にする多様なタスクのコードを私たちが解読したかどうかは、まだ明確ではありません。
以上が8つのストーリーです。私が見逃したことを教えてください。私がどこで間違っているか教えてください。次に何が起こると思うか教えてください。


コメント