NVIDIAが4つの驚くべき最新AIアップデートを発表

NVIDIA・ジェンスンフアン
この記事は約10分で読めます。

NVIDIAがGTC Taipeiで発表した4つの主要AIアップデートを解説する。1つ目は、ハイブリッドアーキテクチャを採用した5500億パラメータのオープンソースモデル、Nemotron 3 Ultraの公開。2つ目は、AIエージェントが協働する時代に向けて設計されたデータセンター向けCPU、Veraの発表。3つ目は、ロボティクスや物理AI向けに開発された世界モデル、Cosmos 3の提供開始。最後は、Microsoftとの提携で誕生した、AIエージェントをローカル実行するための次世代PC向けチップ、RTX Sparkの登場である。

Nvidia Just Introduced 4 New Stunning AI Updates
🎓 Learn AI With Me For Free - 🌐Subscribe To My Newsletter - your Fre...

オープンソースモデル Nemotron 3 Ultra の登場

ジェンスンがNVIDIA GTC Taipeiで大量のアップデートを発表しました。今日の動画では、そのすべてを詳しく解説していきます。

まず最初に、NVIDIAは次なるオープンAIモデルであるNemotron 3 Ultraをリリースしました。これはとんでもない怪物モデルです。ハイブリッドなMamba TransformerのMixture of Expertsセットアップに基づいて構築されており、総パラメータ数は5500億、アクティブトークンあたり最大550億パラメータに達します。しかし、私たちにとって本当に重要なのは、これが完全にオープンソースであるという点です。モデル、トレーニングスクリプト、データのすべてが公開されています。では、ジェンスンがこれをどのように説明したのか見てみましょう。

私たちはこのモデルをNemotronと呼んでいます。NVIDIAは、皆さんが独自のAIエージェントを作成できるように、世界に向けてオープンなモデルを構築することに専念しています。本日、私たちはNemotron 3 Ultraを発表します。

はい、これが私たちの次なるオープンモデルであり、非常に賢いモデルです。Nemotronモデルでは、モデルそのものを提供するだけでなく、モデルのトレーニングに使用したすべてのデータも提供します。私たちには素晴らしいパートナーの連合があるため、協力し合い、互いにデータを提供し合っています。数多くの素晴らしいパートナーシップのおかげで、Nemotronは世界最大級のツール活用データセットを用いた、長時間の推論やツールタスク解決モデルのスイートでトレーニングされています。

モデル、トレーニングスクリプト、データに至るまで、このすべてが皆さんに完全に公開されます。これはオープンモデルの最高峰であり、世界で最高のオープンモデルシステムポリシーです。私たちのシンプルな目標は、皆さんがこれらすべてを受け取り、追加し、さらに改善して、自分自身のものにできるようにすることです。

Nemotron 3 Ultraは5倍高速です。これは、SSM状態空間モデルとMixture of Expertsのハイブリッドアーキテクチャに基づいた世界初のモデルです。このアーキテクチャは信じられないほど高速です。皆さんが素早く思考できるように、私たちも高速化を図りました。思考が速くなれば、同じコストでより長く考えることができます。だからこそ5倍速いのです。

さらに30%安価です。総FLOPsや総推論時間において、世界で最も費用対効果の高いモデルと比較しても、実行コストが30%低くなっています。私たちは世界最高のオープンモデルと比較しています。フロンティアモデル並みに賢く、5倍高速で、30%安価であり、完全にオープンです。私たちはこの取り組みに全力を注いでいます。これがNemotron 3であり、現在はすでにNemotron 4の開発に取り組んでいます。

エージェント時代の新しいCPU Vera

次に、NVIDIAは全く新しいCPUを発表しました。彼らはもはやそれが私たち人間のためのものだとは微塵も思っていません。このCPUはVeraと呼ばれています。ジェンスンは、従来のCPUは人間のために設計されていたが、Veraは何十億ものAIエージェントが私たちと一緒に働く未来のために構築されていると明言しました。彼はこれをエージェント時代のCPUと呼びました。スペックもすさまじく、内部帯域幅は最大で毎秒3.6テラバイトに達します。彼がどのように紹介したのか見てみましょう。

エージェントAIはCPUの役割を変えます。今やCPUが指揮者であり、GPUがオーケストラなのです。従来のCPUは異なる時代のために作られました。ソケットあたりのコア数を最大化し、それらを分割して仮想化し、時間単位で貸し出すためのものでした。エージェントの時代において、CPUは今やGPUの稼働率に対するボトルネックとなっており、トークンのスループット、レイテンシ、そしてユーザー体験に直接影響を与えています。

NVIDIA Veraはエージェントループのために構築されたCPUであり、NVIDIAのカスタムデータセンターCPUコアとスケーラブルなコヒーレンシファブリックを組み合わせることで、パフォーマンスコアと帯域幅の適切なバランスを実現し、AIファクトリーの出力を最大化します。

Veraの中心にあるのは、モダンなデータセンターのワークロード、分岐の多いPythonランタイム、ツール呼び出し、サンドボックスでのコード実行のために構築されたNVIDIA Olympusコアです。各コアはスループットに最適化されています。サイクルごとに2つの分岐を評価するニューラル分岐予測器。毎サイクルより多くの処理を取り込む10ワイドのデコードエンジン。命令を止めずに動かし続ける大規模なアウトオブオーダーエンジン。次のデータパスを予測する斬新なグラフエンジンを備えた高度なプリフェッチャ。

しかし、高速なコアは、データが正確かつ時間通りに到着して初めて意味を持ちます。Veraは、帯域幅を損なうことなく複数のエラーを同時に修正しながらLPDDR5Xメモリを使用する最初のCPUです。Veraはx86アーキテクチャと比較してピークメモリレイテンシを40%削減し、検索、分析、サンドボックスの実行を通じて時間通りにコアへデータを供給し続けます。

NVIDIAの第2世代スケーラブルコヒーレンシファブリックは、メモリとI/Oを個別のダイに分離し、モノリシックなメッシュ上で全88個のOlympusコアを統合します。コアはチップレット間で分割されないため、従来のCPUよりもコア間の通信が50%高速化されます。そして、メモリコヒーレントなNVLinkチップ間接続により、GPUがファブリックに直接接続されます。

GPUにとどまらず、NVLinkチップ間接続はVeraをマルチソケット構成に拡張し、CPU間で膨大な帯域幅を実現します。Veraはx86 CPUの1.8倍のエージェントサンドボックスパフォーマンスを提供します。スタンドアロンのVeraラックは、エージェントのサンドボックス、ツール、コード、データパイプラインを実行します。Rubin GPUと密接に結合されたVeraは、アクセラレーテッドワークロードを動かし続けます。

NVIDIA Vera Bluefield 4 STXは、コンテキストメモリとAIストレージ、コンピュート、ネットワーキング、ストレージを強化します。Veraはまさにエージェント時代のCPUです。

物理AIのための世界モデル Cosmos 3

さて、次はロボティクスや物理AIの分野に関心がある人向けです。NVIDIAは、ロボット、自動運転車、そして物理システムが実際に現実世界を理解し予測するのを助けるオープンワールド基盤であるCosmos 3を立ち上げました。彼らは、20兆トークンのマルチモーダルデータ、約40億枚の画像、4億本の現実および合成動画、さらに音声、テキスト、アクションのデータを使ってトレーニングを行いました。これは単に世界を観察するだけでなく、アクションデータを出力します。

本日、私たちはCosmos 3をリリースできることを非常に嬉しく思います。これは私たちがこれまで構築してきた中で最も強力で最も汎用性の高いモデルです。昨年、私たちは未来予測のためのCosmos predict、ドメイン転移のためのCosmos transfer、物理的理解のためのCosmos reason、そしてアクション生成のためのCosmos policyをリリースしました。

Cosmos 3では、これらすべてを単一のモデルに統合しました。最新のCosmos 3モデルはオムニモデルです。入力と出力の両方において、言語、動画、音声、アクションのオムニ仕様となっています。これはMixture of Transformersと呼ばれる斬新なアーキテクチャに基づいており、2つのタワーが存在します。左のタワーは自己回帰を実行し、右のタワーは拡散を実行します。

この新しいアーキテクチャは、ビジョン言語モデル、世界モデル、世界アクションモデル、さらにはビジョン言語アクションモデルなど、いくつかの重要なアーキテクチャを包含しています。物理AIの開発者は、このアーキテクチャを良い出発点として活用し、最終的に自らの下流アプリケーションにとって重要なものを構築するためにカスタマイズすることができます。

そして、今回のCosmos 3のリリースでは2つのモデルを用意しています。1つはナノモデル、もう1つはスーパーモデルです。スーパーモデルは物理AIタスクにおいて並外れた精度を提供し、ナノモデルは小型でエッジデバイスへの展開が容易になっています。

Cosmos 3は信じられないほどのパフォーマンスを発揮します。VintageやTARなどの推論ベンチマーク、PI benchやAPP benchなどの生成ベンチマークを含む複数の物理ベンチマークで勝利を収め、ロボットラボのポリシー評価でも1位を獲得しました。

私たちの画像から動画への生成結果は現在、オープンソースモデルの人工知能分析において1位にランクされています。物理AIは困難な課題です。自分の物理的なセットアップの視点に合わせてモデルをカスタマイズできるようにするためには、オープンなモデルが必要です。

Cosmos 3は、開発者がウェイトにオープンにアクセスできるオープンモデルです。また、物理AI開発者の導入を支援するためのトレーニングスクリプトやデータセットも提供しています。NVIDIAとして、私たちは物理AI革命を加速させる手助けをしたいと考えています。私たちは、すべての開発者の可能性を解き放つために、高品質でオープンな物理基盤モデルを構築するという自分たちの役割を果たしています。

Cosmos 3は本日よりご利用いただけます。モデルのウェイトはHugging Faceからダウンロードでき、簡単なコードはGitHubからダウンロードできます。

PCを再定義する次世代チップ RTX Spark

そして最後は、大本命の発表です。NVIDIAとMicrosoftがタッグを組み、ジェンスンの言葉を借りればPCを再発明しようとしています。それがRTX Sparkです。これは、6144個のCUDAコアを搭載したBlackwell RTX GPUと、カスタム設計された20コアのGrace CPUを融合させた単一のスーパーチップです。1ペタフロップスのAIパフォーマンスと、128ギガバイトのユニファイドメモリを誇ります。ジェンスンはこれを、40年間で初めて完全に再設計されたPCのラインナップだと呼びました。単にアプリを実行するだけでなく、AIエージェントをローカルで実行するPCです。では、その発表の様子をご覧ください。

それは一つの火花、Sparkから始まりました。AIの時代に向けて、40年間で初めてPCを再構想するというアイデアです。エージェントの世界において、私たちのパーソナルコンピュータはどうなるのでしょうか。

エージェントがネイティブに動作し、ローカルやクラウドのモデルに接続される世界。セキュリティのためにサンドボックス化され、継続的に稼働し、タスクをこなしていく私たち専用のパーソナルAI。

チップとOSも進化しなければなりません。RTX Sparkをご紹介します。私たちが33年間にわたって学んできたすべてのことを、この1つのチップに凝縮しました。

6144個のCUDAコアを搭載したBlackwell RTX GPU。1ペタフロップスのAIパフォーマンス。MediaTekとのパートナーシップにより構築され、NVLinkで接続されたカスタム20コアのGrace CPU。

128ギガバイトのユニファイドメモリ。TSMCの3ナノメートルプロセス、700億個のトランジスタ。そしてMicrosoftとの緊密な連携による、エージェントのためのWindowsプラットフォーム。

私たちはパーソナルコンピュータを再発明しています。クリエイティングのため、ゲーミングのため、そしてエージェントのために。

これは新たなパーソナルコンピューティング革命の夜明けであり、そのすべてはNVIDIA RTX Sparkから始まります。

コメント

タイトルとURLをコピーしました