DeepSeekが復活!業界を揺るがすかもしれない新AIモデル

AIニュース
この記事は約11分で読めます。

DeepSeekが新モデルV3.2Xを発表し、長時間の複雑なタスクの実行コストを最大50%削減できると主張している。スパースアテンションという技術を採用し、重要な情報のみに焦点を当てることでコストを大幅に削減した。一方、OpenAIのSoraは米国App Storeで1位を獲得し、サム・アルトマンは収益化モデルとして権利者への収益分配システムを計画している。元OpenAI CTOのミーラ・ムラティは新会社Thinking MachinesからファインチューニングツールTinkerを発表し、研究者から高い評価を得ている。IBMはGranite 4.0という新しいAIモデルファミリーを公開し、MAMBA 2アーキテクチャを採用することでメモリ使用量を70%以上削減した。さらにハリウッドでは、AI監督による初の長編映画が発表され、業界に波紋を広げている。

DeepSeek is BACK! New AI Model That Might Shake the Industry
DeepSeek is back with a new experimental model that slashes AI costs by half. OpenAI’s Sora just hit #1 on Apple’s App S...

DeepSeekの復活と革新的な新モデル

DeepSeekが復活しました。今回彼らは、新モデルが長時間の複雑なタスクの実行コストを半分に削減できると主張しています。OpenAIのSoraはわずか2日間でAppleストアの1位に躍り出て、サム・アルトマンはすでに収益化の計画を進めています。

元OpenAI CTOのミーラ・ムラティは、彼女のスタートアップThinking Machinesからの最初の製品であるTinkerを発表しました。研究者たちはこれをAIモデルのファインチューニングにおける画期的な製品だと呼んでいます。

IBMはGranite 4.0をリリースしました。これは画期的なハイブリッド設計に基づいて構築されたモデルファミリーで、メモリ使用量を70%以上削減しながら、ベンチマークでは依然として高いパフォーマンスを発揮しています。そしてハリウッドは、人間ではなくAIエンティティによって監督される映画を発表しました。AI業界にいくつかの大きな動きがありましたので、それについて話していきましょう。

DeepSeekの新モデルV3.2Xとスパースアテンション技術

DeepSeekはしばらくの間、かなり静かにしていました。今年の初め、彼らはR1モデルで多くの注目を集めました。このモデルは主に強化学習で訓練され、アメリカの研究所が費やしていたコストよりもはるかに少ない費用で済みました。一部の人々は、この動きがAIモデルの訓練方法を完全に変えると考えていましたが、期待していたような革命を起こすことはできず、DeepSeekは少しスポットライトから消えていきました。

しかし今、彼らは戻ってきました。そして今回は全く異なるものを持ってきました。彼らはV3.2Xという実験的なモデルを発表したばかりです。そして大きなセールスポイントはこれです。長時間の複雑なタスクの実行コストを最大半分に削減できるというのです。これは大きなことです。

では、彼らはどうやってこれを実現しているのでしょうか。彼らはスパースアテンションと呼ぶシステムを考案しました。技術的に聞こえますが、アイデアは実際には非常にシンプルです。通常、AIモデルが大きなテキストの塊を処理しようとすると、つまらない部分や無関係な部分も含めて、すべての部分を見るためにエネルギーを無駄にします。

DeepSeekのモデルがやっていることは、はるかに賢いのです。ライトニングインデクサーと呼ばれるコンポーネントを使用して、大量のテキストの壁を素早くスキャンし、最も重要なセクションのみを抽出します。次に、ファイングレイントークンセレクションシステムと名付けられた別のレイヤーが、さらにズームインして、それらのセクション内の重要な詳細を選び出します。

つまり、すべてを処理するために時間とお金を無駄にする代わりに、モデルは本当に重要なことだけに焦点を当てるのです。このダブルフィルターシステムが魔法を起こすのです。そしてDeepSeekの初期テストでは、通常長いコンテキストウィンドウを扱うと非常に高額になる単純なAPI呼び出しが、最大50%のコスト削減になることが示されました。

そして最良の部分は、これがオープンソースで、完全な論文がGitHubに掲載され、Hugging Faceで利用可能だということです。コミュニティはすぐにテストして、これらのコスト削減が本当に維持されるかどうかを確認できます。

なぜなら、ここがポイントなのですが、これらの大規模なAIモデルの訓練はすべての見出しを飾ります。しかし、本当にお金を食うのは、毎日それらを実行することです。特に今、コンテキストウィンドウがばかげたほど巨大になっているので。企業が最も速く現金を燃やすのはそこなのです。

DeepSeekは基本的に、すでに最大限まで活用されていると思われていた古き良きTransformerアーキテクチャにも、まだ未開拓のトリックがあり、それをはるかに効率的に実行できることを皆に示しています。そして、このアプローチが定着すれば、予算を枯渇させることなくAIをスケールしようとしている人にとって、ゲームチェンジャーになる可能性があります。

OpenAIのSoraとマネタイゼーション戦略

さて、AI業界の反対側では、OpenAIは全く異なる方向性を進んでいます。アプリとユーザー採用です。そして今、ショーのスターはSora、彼らのAI動画作成アプリです。このアプリは米国のApp Storeで1位になったばかりですが、これは招待制のみで、しかも米国とカナダでしか利用できないことを考えると驚異的です。

それでも、初日に56,000のダウンロードを達成し、最初の2日間で164,000のインストールを記録しました。これを視野に入れると、このデビューはAnthropicのClaude、MicrosoftのCopilot、さらにはOpenAI自身のChatGPTアプリのローンチを上回りました。

サム・アルトマンはSoraアップデート第1弾と呼ぶアップデートで参加し、同社の次のステップをいくつか示しました。まず最初に、マネタイゼーションです。彼らは料金を請求し始めるつもりですが、あなたが予想するような方法ではありません。アルトマンは、権利者との収益分配システムを設定したいと言っています。

基本的に、誰かが著作権で保護されたキャラクターや肖像を使用した場合、それらの権利者に支払いが行われます。それに加えて、彼らはより細かい制御ツールを構築しているので、権利者は自分のキャラクターがどのように生成されるか、されないかを決定できます。これはOpenAIがすでに肖像権のために実行している現在のオプトインモデルを超えています。

アルトマンはこれをインタラクティブなファンフィクションとして位置づけ、多くの権利者が実際に興奮しており、これを観客とエンゲージし、さらにはお金を稼ぐ新しい方法と見ていると述べています。

もちろん、より大きな課題は、人々がOpenAIが予想していたよりもはるかに多くの動画コンテンツを生成していることです。その多くは小さな観客向けです。つまり、提供コストが膨らんでいるということです。

収益分配のアイデアは、これらのコストをカバーすることもありますが、使用に厳しい上限を設けるのではなく、コンテンツ作成にインセンティブを与えることでもあります。オルトマンは、最終的なモデルは試行錯誤が必要だと述べましたが、方向性は明確です。彼らはSoraを、有料モデルの下でも、採用が急速に広がるほど魅力的なものにしたいのです。

Thinking MachinesとTinkerの登場

スタートアップの世界では、OpenAIの元CTOとしてご存知のミーラ・ムラティが、自身の会社Thinking Machinesで公式にステップアウトしました。そして彼らの最初の製品がここにあります。Tinkerと呼ばれ、大規模言語モデルのファインチューニングをはるかに簡単にしながら、研究者に真剣な制御を与えるように設計されています。

これを考える最良の方法はこうです。Tinkerは、データを投げ入れて指をくわえて待つようなドラッグアンドドロップツールではありません。開発者グレードで、Pythonベースであり、すべてに対して細かい制御を提供します。トレーニングループ、損失関数、データパイプライン。すべての実際の計算はThinking Machinesのインフラストラクチャで行われます。

したがって、GPUやマルチノードオーケストレーションと格闘する必要はありません。アンドレイ・カルパシーが言ったように、アルゴリズムの制御の90%を維持しながら、インフラストラクチャの苦痛の90%を捨てることができます。

そして人々はすでにそれを仕事に使っています。プリンストンのGodelチームは、TinkerとLoRAを使用して定理証明モデルをファインチューニングし、miniF2Fで88.1%のpass@32を達成し、自己修正で90.4%に跳ね上がりました。これは、はるかに少ないデータで完全なパラメータファインチューニングと同じくらい優れています。

スタンフォードでは、Rosskoff研究室がLlama 70Bの上で化学推論モデルを訓練し、IUPACから化学式への変換の精度を15%から50%に向上させました。バークレーのSky RLグループにとって、Tinkerは複雑なマルチエージェント強化学習ループを実際に実行可能にしました。

そしてRedwood ResearchはそれをQwen 32Bの長いコンテキストAI制御タスクのトレーニングに使用しました。エリック・アンはTinkerなしではこれを試みることさえなかったと述べたものです。

推薦が積み重なっています。ジョン・シュルマンはこれを「私がずっと欲しかったインフラストラクチャ」と呼びました。カルパシーはデザインを称賛しました。Rayの共同創設者でさえ、分散フレームワークと組み合わせることで巨大なスケールを解放できると述べました。

Tinkerは現在プライベートベータ版です。無料で使用できますが、使用量ベースの価格設定が来ます。A16Z、Nvidia、Excelから20億ドルの資金調達を受けて、Thinking Machinesは明らかに本格的なプレーヤーになりたいと考えています。そしてムラティはこれを、彼女が去った閉鎖的なエコシステムに対するオープンで安全で適応可能な代替として位置づけています。

IBMのGranite 4.0とハイブリッドアーキテクチャ

では、IBMについて話しましょう。彼らはGranite 4.0を発表したばかりです。これはかなり大きなひねりを加えた新しいオープンAIモデルファミリーです。今日のほとんどのAIを動かす標準的なTransformerセットアップのみを使用する代わりに、彼らはMAMBA 2と呼ばれる新しい設計を混ぜました。バランスはMAMBA 9対Transformer 1です。そしてこの変更だけで、メモリ使用量が70%以上削減されます。

平易な英語で言えば、企業は同じ重いタスクをはるかに少ない高価なGPUで実行できます。これは直接的に多くのお金を節約することを意味します。

Granite 4.0には4つのバージョンがあります。最大のものは全体で320億のパラメータを持っていますが、一度にアクティブなのは約90億だけで、実行を軽くしています。次に70億バージョンがあり、約10億をアクティブにします。さらに2つの小さな30億モデルがあります。1つはハイブリッド、もう1つは完全にTransformerです。システムがハイブリッドセットアップの準備ができていない場合のためです。

それぞれには一般用途バージョンと指示に従うバージョンもあります。彼らはこれらのモデルを大規模なテキストウィンドウ、50万トークンで訓練し、128,000までテストしました。したがって、これらは崩壊することなく本当に大きなワークロードを処理するように構築されています。

パフォーマンスチェックも堅実に見えます。中型のGraniteは、推論テストでほとんどの他のオープンモデルを打ち負かしており、Llama 4 Maverickのようなはるかに大きなシステムにのみ後れを取っています。そしてそれは、はるかに安く実行できる間、関数呼び出しベンチマークでも優位を保っています。

その上、IBMは信頼性を強調しています。Granite 4.0は、AI管理のための公式ISO認証を持つ最初のオープンモデルファミリーです。そしてすべてのリリースは暗号的に署名されています。

アクセスも広範です。HuggingFace、Kaggle、DockerHub、Replicate、Watsonx.ai、その他多くのプラットフォームで入手できます。全体として、IBMはメモリコストを大幅に削減しながら、依然として高いパフォーマンスを維持する、無駄のない強力なモデルセットを提供しました。まさに企業が望むものです。

AI監督による初の映画プロジェクト

そして最後に、ハリウッドについて話しましょう。イタリアのプロデューサー、アンドレア・イエルヴォリーノが、完全にAIによって監督される初の映画と彼が主張するものを発表しました。映画は「The Sweet Idleness」と呼ばれ、監督はFelon AIと名付けられたAIエンティティです。イエルヴォリーノはループ内の人間として行動し、プロジェクトを監督します。

映画のストーリーはテーマに合っています。仕事が儀式に過ぎない豊かさの未来を舞台にしています。トレーラーはすでに公開されており、人間の俳優は一切登場せず、完全にAI生成に見えます。イエルヴォリーノが最近、嵐を巻き起こしたTilly NorwoodというAI俳優を紹介したので、これは理にかなっています。

エミリー・ブラントはこのアイデアを恐ろしいと呼び、人間のつながりを殺すと述べました。一方、ウーピー・ゴールドバーグは、何千人もの専門家の仕事で訓練されたものに対して俳優を対抗させるのは不公平だと主張しました。映画俳優組合は、ノーウッドは俳優ではなく、単なるコンピュータの創造物だと宣言しました。

しかし、ここがポイントです。俳優たちが本当にAIのパフォーマンスがゴミで、観客が彼らとつながらないと信じているなら、なぜ彼らはそんなに恐れているのでしょうか?彼らがAIが自分たちを上回ることができないと確信していれば、単に無視するでしょう。反発自体が、彼らがそれを脅威と見ていることを示しており、これをさらに興味深いものにしています。

ソーシャルメディアはこのプロジェクトをゴミだと非難しました。スターたちはそれを非難しています。代理店は不安を感じており、観客は懐疑的です。イエルヴォリーノは、映画を置き換えようとしているのではなく、新しい章を開こうとしていると主張しています。そして、アダム・ドライバー主演の「Ferrari」や、リリー・コリンズとキアヌ・リーブスの「To the Bone」などのクレジットを持つ彼は、決して軽量級ではありません。

それでも、ハリウッドや一般大衆が完全にAIによって監督された映画を受け入れる準備ができているかどうかは、別の話です。

そうですね、これが現状です。この分野はスピードを落としません。最後まで見てくれてありがとうございました。次回お会いしましょう。

コメント

タイトルとURLをコピーしました