AI最新ニュース:LTX-2オープンソース化、NVIDIA Rubin、ChatGPT Health、GPU価格動向など

AIニュース
この記事は約13分で読めます。

オープンソースのテキスト動画変換モデルLTX-2が完全公開され、ローカル環境での実行やカスタマイズが可能になった。NVIDIAは次世代スーパーコンピュータRubinを発表し、推論コストを最大10分の1に削減する革新的な冷却システムを実現した。OpenAIはChatGPT Healthを発表し、個人の健康データと連携した積極的な健康アドバイス機能を提供する。メモリ不足によりGPU価格が高騰する可能性があり、RTX 5090が5,000ドルに達する可能性も報じられている。NVIDIAは合成データで訓練された自動運転システムAlpha Mayoをオープンソース化し、わずか1,700時間の運転データで高性能を実現した。Anthropicは3,500億ドルの評価額で100億ドルの資金調達を実施し、AI業界での競争力を強化している。

AI News: NVIDIA Rubin, LTX-2 Open Source, ChatGPT Health, GPU Prices and More!
Try Greptile for free for 14 days! The Subtle Art of Not Being Replaced 👇🏼 Humanities L...

オープンソース動画生成モデルLTX-2の完全公開

完全にオープンソースでオープンウェイトのテキスト動画変換モデルが登場しました。これがLTX-2で、現在は完全にオープン化されています。ローカルマシンにダウンロードして実行することができます。

発表内容によると、このリリースでは完全なLTX-2開発スタックが一般公開されます。モデルウェイトは、メインモデルと蒸留バージョンの両方が含まれており、さまざまなハードウェアでのローカル推論、ファインチューニング、本番環境での使用が可能です。つまり、ダウンロードして自分のニーズに合わせてカスタマイズできるということです。

LoRAアダプターも提供されているため、特定のスタイルやタスクに対してモデルがどのようにカスタマイズされているかを確認でき、自分でカスタマイズする際のインスピレーションになるでしょう。また、Trainerと呼ばれるモジュール式のトレーニングフレームワークも提供されており、マルチモーダルデータパイプライン、リファレンス設定、マルチGPUサポート、評価ツールが含まれています。

基本的に、このテキスト動画変換モデルで何でもできる完全なスタックを提供してくれています。企業からここまで充実したサポートを受けられるのは本当に初めてのことです。LTX-2はNVIDIAマシン向けに最適化されており、特にRTX 5090で快適に動作しますが、このチップはすぐに非常に高価になるかもしれません。詳しくは後ほど説明します。

このモデルについてもう少し詳しく見ていきましょう。最大20秒の動画を生成できますが、最初と最後のフレームをコントロールできます。つまり、これらの20秒のクリップを好きなだけつなぎ合わせることができるのです。LTXの特別な点は、まるで映画スタジオの中にいるかのような、ストーリーボードのようなコントロールができることです。

これらの20秒の動画は4Kで、最大50フレーム毎秒です。つまり非常に高品質です。また、非常に正確なリップシンクも備えています。もちろん音声も付いており、マルチキーフレームコンディショニング、LoRAベースのカスタマイズ、3Dカメラロジック、テキスト、動画、音声などを含むマルチモーダル入力など、あらゆるものを非常に細かくコントロールできます。

モデル、コード、パイプラインのすべてをGitHubやHugging Faceからダウンロードして、ローカルで実行できます。もちろん、ローカルで実行したくない場合は、クラウドプロバイダーを使用することもできます。これらすべてはこの発表に記載されています。リンクは下に貼っておきます。そして、LTX-2はすでにArtificial Analysisのオープンウェイトリーダーボードで1位を獲得しています。

これはオープンソースでオープンウェイトの動画モデルとしてナンバーワンです。ぜひチェックしてみてください。とても素晴らしいです。もっと動画を作ることを考えています。ComfyUIへの組み込み方のチュートリアルなども作るかもしれません。見たいと思ったらコメント欄で教えてください。さらに、このモデルを作成するために使用したすべての技術を詳述した研究論文も公開されています。

LTXで実際に得られるものをいくつかデモでご紹介します。品質を見てください。ディテールを見てください。物理演算のリアリズム、使用できるさまざまなスタイルを見てください。これらすべてが無料で利用できるようになりました。

NVIDIA Rubinスーパーコンピュータの発表

次に、私はCESから戻ってきたばかりです。ジェンスン・フアンの基調講演に参加し、彼がRubinと呼ばれる絶対的な怪物スーパーコンピュータを含む複数の新製品を発表しました。

これは彼らの次世代アーキテクチャです。これは一般消費者向けのハードウェアではありません。これはハイパースケーラーやOpenAI、Anthropic、AWSなどのモデルプロバイダーが購入するものです。Rubinは推論コストを最大10分の1に削減し、Mixture of Expertsモデルのトレーニングに必要なGPU数を4分の1に削減します。

これらはすべて、現在の最先端スーパーコンピュータであるBlackwellプラットフォームと比較してのものです。また、はるかに電力効率が高く、私の心を打ったのは、水冷すら必要としないことです。基本的に熱湯でシステムを冷却しているのです。奇妙に聞こえるかもしれませんが、これは文字通りジェンスンが言ったことです。これを見てください。

「非常に重要なのは、システムに入る水の温度が同じ45度であることです。45度であれば、データセンターには水冷チラーが必要ありません。基本的に熱湯でこのスーパーコンピュータを冷却しているのです。」

信じられないほど効率的です。それぞれが1,152個のGPUを搭載しており、まったく狂気の沙汰です。そして、それらすべてを駆動する16個のラックがあります。各ラックには72台のRubinが搭載されています。イーロン・マスクがこの投稿にコメントしました。

ハードウェアが大規模に稼働し、ソフトウェアがうまく機能するまでには、さらに9ヶ月ほどかかるだろうと。それは事実かもしれませんが、すでに生産段階に入っています。そして、彼らはこのマシンを大幅に簡素化しました。ケーブルなし、ホースなし、ファンなし。環境冷却に可能な限り近い状態です。そして前述したように、すでに本格的な生産段階に入っており、今年後半にはNVIDIAのパートナーに提供される予定です。

そしてもちろん、このAIパワーの最大の使用例の1つがコーディングです。だからこそ、今日のスポンサーであるGraiptileについてお話しできることを嬉しく思います。AIはコードを書くのがかなり得意になってきましたが、皆さんが気づいていないかもしれないのは、適切なツールを使えば、コードのレビューにも本当に優れているということです。

そこで登場するのがGraiptileです。Graiptileはすべてのコードを自動的にレビューするAIです。Graiptileチームはこのコードレビュー問題に多くの時間を費やしており、人間が見落とした信じられないようなバグやエラー、問題をGraiptileが見つけることができたことを見せてくれました。実際、彼らはそのような驚くべき発見の一部を紹介する専用ページを持っています。

Graiptileはオープンソースプロジェクトには完全に無料で、NVIDIA、Posthog、Storybookなど、今日では大規模なリポジトリで使用されています。ぜひGraiptileをチェックしてください。現在14日間の無料トライアルを提供しています。リンクは下に貼っておきます。すべてのコードを自動的にレビューし、デプロイメントサイクルにもう1つの信頼の層を追加してくれます。

では、動画に戻りましょう。

ChatGPT Healthの発表

次に、OpenAIがChatGPT Healthを開始します。これは、少なくとも私にとっては非常に歓迎すべき主要機能です。ChatGPT Healthは、あなたの健康情報をChatGPTに統合する専用エクスペリエンスで、積極的に健康に関する推奨事項を提供できます。Whoopデバイスを持っている場合はそれ、Oura Ring、Apple Healthなど、これらすべてを接続できます。

これらをChatGPTに接続すると、健康関連の質問をするたびにすべての情報が利用できるようになります。また、積極的に健康に関する推奨事項を提供してほしい場合にも使えます。医療記録やウェルネスアプリなど、何でも接続できます。私はすでにChatGPTを使って、医師からの検査結果やスキャン、自分の健康に関するさまざまなことを理解する手助けをしてもらっています。まずChatGPTに質問しています。

もちろん、人間の医師のところにも行きますが、より情報を得た状態で医師のオフィスに到着したいのです。そのため、健康データへのアクセスを提供することは自然な次のステップのように思えます。さて、多くの方がおそらくすべての健康データをOpenAIと共有することに前向きではなかったり、興奮していなかったりするでしょう。それは理解できます。

実際、これこそがAppleが自分たちの邪魔をしていると私が考える部分です。Appleエコシステムを使用している人々にとって、彼らはすでにApple Healthアプリにすべての健康データを組み込んでおり、人々はAppleとそれを共有することに非常に快適に感じているようです。そして、Appleはローカル人工知能に非常に力を入れています。つまり、スマートフォンやラップトップ上で動作するAIです。

そのため、実際にはChatGPTのようなサードパーティと健康データを共有する必要がない世界を想像できます。Appleは自社のAIを使用して、データがスマートフォンから離れることなく、積極的な推奨事項を提供したり、健康データに関する質問に答えたりできます。しかし、もちろん彼らは少なくとも今のところそれをしていません。そこでChatGPTの出番です。

この機能にはウェイトリストがあります。基本的にすべてのプラン、無料、Plus、Proプラン、すべてで公開されると利用可能になりますが、1つ大きな例外があります。それはヨーロッパです。もちろん、ヨーロッパははるかに高い規制があるため、少なくとも初日には利用できません。

これはChatGPT内で完全に独立したエリアとして動作します。プライバシーとセキュリティを強化するという考え方で、チャットを共有したり、私がいつもやっているように画面を見せたりする場合に、誤って健康情報を共有することがないようにします。もちろん、健康情報はChatGPTモデルのトレーニングには使用されません。

ウェイトリストに登録して、すぐに利用できることを願っています。実際にはまだ試していません。OpenAIの担当者に連絡したところです。アクセスできたら、皆さんにお見せします。

GPU価格高騰の可能性

さて、GPU価格が上昇するかもしれないと述べましたが、実際にその可能性があります。それはすべて、GPUのコアコンポーネントの1つであるメモリの在庫不足が原因です。最新のRTX 5090に最大5,000ドルを支払うことになるかもしれません。

Newswireによると、NVIDIAとAMDは来月からGPU価格を大幅に引き上げるとのことです。RTX 5090は2,000ドルから5,000ドルに上昇します。ただし、この投稿にはコミュニティノートがあります。

報道によると、メモリ不足により2026年初頭にGPU価格が上昇する可能性があり、一部ではハイエンドカードが5,000ドルに達する可能性があると推測していますが、NVIDIAもAMDもこれらの価格上昇を公式に確認していません。しかし、噂は起きており、CESでのライブQ&A中に誰かがジェンスンにこのことについて尋ねました。

Tom’s Hardwareは、これらの最新世代GPUの潜在的な価格上昇に対応して、ジェンスンに具体的に尋ねました。「もっと利用可能な生産能力があるかもしれない古いプロセスノードで、旧世代のGPUの生産を立ち上げることがそれに役立つと思いますか?あるいは、少量のDRAMを搭載したGPUの供給を増やすことも?取れる措置や具体的な意見はありますか?」

ジェンスンは答えました。「そうですね、可能性はあります。そして、世代によっては、最新世代のAI技術を旧世代のGPUに持ち込むこともできるでしょう。それにはかなりのエンジニアリングが必要ですが、可能性の範囲内です。戻って検討してみます。良いアイデアですね。」

つまり、価格上昇は起こりそうです。NVIDIAが検討しているさまざまな解決策がありますが、業界全体がメモリ不足の影響を受けています。まだRTX 5090を持っていなくて欲しい場合は、今が手に入れるのに良い時期かもしれません。

NVIDIA Alpha Mayoの発表

次に、NVIDIAが行ったすべての発表の中で最もクールだと思ったのは、Alpha Mayo、自動運転車向けのモデルと実際には完全なスタックアーキテクチャです。では、これの何が特別なのでしょうか?まず第一に、本当にクールです。自動運転車は非常に未来的で、とてもクールです。

TeslaとWaymoは信じられないほどうまく機能しています。実際、友人がTeslaで私を家から空港まで送ってくれましたが、ボタン1つで全行程を運転してくれました。介入はありませんでした。本当に印象的でした。さて、Alpha Mayoに戻りましょう。では、TeslaとWaymoはどうやってそんなに優れたものになったのでしょうか?彼らはモデルをトレーニングするための何百万マイルものトレーニングデータを持っていました。

しかし、ここでAlpha Mayoが本当に輝きます。NVIDIAは自動車会社ではありません。モデルをトレーニングするための何百万マイルものデータを持っていません。では、彼らは何をしたのでしょうか?合成データを使用しました。さまざまな都市を車が走行する合成ビデオクリップを生成し、その合成データを使用してモデルをトレーニングしました。

つまり、何百万マイルもの実際の走行は必要ありませんでした。単に合成データを使用したのです。では、これの何が特別なのでしょうか?完全にオープンソースです。モデルをダウンロードできます。いじることができます。スタック全体をダウンロードできます。基本的に、自動車会社を所有していれば、自分で実装できます。

そして、これは推論モデルでもあります。つまり、ビジョンモデルだけでなく、ビジョン推論モデルなのです。これはWaymoやTeslaとは異なるように思えますが、それらは完全に閉鎖されたシステムなので確認はされていません。発表によると、NVIDIAはロングテール自動運転の課題に対処するように設計された、初のオープン推論VLA(おそらくVision-Language-Actionモデル)をリリースします。

このNVIDIA Alpha Mayoファミリーには、AV開発用のシミュレーションツールとデータセットも含まれています。Alpha Mayo 1、AlphaSim、Physical AIオープンデータセットが含まれており、人間のような判断で知覚し、推論し、行動する車両の開発を可能にします。彼らは実際にメルセデスとのパートナーシップを披露しました。

カメラのみを搭載したメルセデス車がサンフランシスコ周辺を非常に成功裏に走行しています。ジェンスンが言ったのは、Alpha Mayoはエンドツーエンドのアイアーキテクチャだということです。ビデオを入力し、動作を出力します。つまり、世界を見て、ステアリングホイールを制御し、アクセルとブレーキを制御します。非常に印象的で、わずか1,700時間の運転データのみを使用してトレーニングされましたが、これは実際にはそれほど多くありませんが、どうやら本当に優れているようです。

したがって、どの自動車会社もTeslaの圧倒的なリードに追いつくことができるようになりましたが、実際には追いつかないと思います。これらのレガシー自動車メーカーの一部は、自分たちの邪魔をしているだけです。そのため、これらのツールがすべて本質的に無料であっても、明らかにNVIDIAは車両内のすべてを駆動するために自社のGPUを購入してほしいと考えていますが、彼らはそれをうまく実装できないと思います。

TeslaとWaymoを比較するのも興味深いです。Waymoはlidar、レーダー、さまざまなセンサーを使用しており、かなり高価です。Teslaは完全に削ぎ落としたアプローチを取りました。ビジョンのみです。道路上のカメラが判断を下しています。Alpha Mayoシステムはそのアプローチに近いようですが、lidarも使用できると聞いています。

Anthropicの大型資金調達

次に、速報です。この動画を録画している時点で、Anthropicが新たな大規模資金調達ラウンドを実施しました。Wall Street Journalによると、Anthropicは3,500億ドルの評価額で100億ドルを調達しています。参考までに、OpenAIは約7,500億ドルの評価額だと思います。つまり、Anthropicはその約半分ですが、Anthropicはほぼ収益性を達成しています。

彼らは多額の収益を生み出しています。これはAnthropicの成功の継続です。これは、NVIDIAとMicrosoftがAnthropicに投資している150億ドルに加えてのものです。MicrosoftはOpenAIにも投資しているので奇妙に聞こえるかもしれませんが、NVIDIAもそうです。彼らは単にすべてに賭ける戦略を取っているのです。

今日はここまでです。この動画を楽しんでいただけたら、いいねとチャンネル登録をお願いします。

コメント

タイトルとURLをコピーしました