
16,762 文字
ロボット工学の世界が大きく前進しましたわ。1X、ノルウェーとアメリカの合弁AI・ロボット企業が最新作のネオアを発表しました。これは家庭用ヒューマノイドロボットで、業界に革命を起こすんです。
ネオアは1Xの最新AIロボットで、家庭での使用を目的に設計されてます。1Xがネオアの能力を紹介する動画シリーズを公開したんですが、その結果には目を見張るものがありましたわ。
このロボットは、ぎこちない機械のようにゆっくり動くんとちゃいます。デモ動画では、ネオアがバッグを持ち運んだり、ワイングラスを扱ったり、卵をつかんだりしてるんです。その動きの巧みさは驚くべきものでした。
動きがとても人間らしくて、静かで滑らかやから、見てる人の中には動画が本物かどうか疑う人もおるんちゃうかってくらい印象的でしたわ。
実際のタスクでは、ネオアがバッグを持ち運んだり、ワイングラスを扱ったり、卵をつかんだりする様子が見られます。全体的に、非常に人間らしい器用さを示してます。
実際、ロボットの動きがとても静かで滑らかやったんで、動画の信ぴょう性を疑う声もあったくらいです。
ロボットが繊細なワイングラスや卵を扱える能力は、ロボット工学ではめったに見られへん精密さを示してます。単に力があるだけやなく、制御能力も優れてるんです。ネオアは、壊れやすいものを扱う時に握力や力加減を調整できるんです。
でも、ネオアはただ見た目がええだけやありません。このロボットには本格的なスペックが詰まってるんです。身長167cm、体重30kgで、人間らしいデザインが目を引きます。
これを分かりやすく言うと、身長約170cm、体重約66ポンドで、小柄な大人くらいの大きさですわ。
でも、本当にすごいのはネオアの生物学にインスパイアされた構造なんです。1Xは従来の硬い油圧システムを捨てて、人間の筋肉や腱を模倣したシステムを採用しました。
この革新的なアプローチのおかげで、ロボットによくある不自然でぎくしゃくした動きが、人間の動きに近い滑らかで流動的な動きに置き換わったんです。結果として、驚くべき精密さと滑らかさが実現しました。
力の面でも、ネオアは侮れませんで。上半身は約20kgまで持ち上げられ、下半身も同じくらい強力です。これにより、ネオアは家具の移動から買い物の荷物運びまで、幅広い家事をこなせるんです。
ネオアは速さも兼ね備えてます。移動に関しては、通常の歩行速度は時速4kmで、これは人間の平均歩行速度とほぼ同じです。でも、急ぐ必要がある時は時速12kmまで速度を上げられるんです。
コミュニケーションの面でネオアが本当に輝いてるんは、OpenAI搭載のチャットシステムを備えてて、音声でのやりとりができるところです。
でも、ここからが本当に面白いんです。ネオアは単に話すだけやなく、身振り手振りでコミュニケーションを取れるんです。これにより、言葉を使わへんやりとりも可能になりました。
家庭での使用を考えると、このロボットはうなずきや視線といった微妙な合図も理解できるんで、よりナチュラルで直感的なやりとりができるんです。
ネオアには5本指の手があって、それぞれに20の自由度があります。ロボット工学では、自由度はロボットが独立して動かせる動きの数を指します。
各手に20の自由度があるってのは非常に複雑で、幅広い動きや操作を可能にします。この器用さのおかげで、ネオアは繊細なワイングラスから重いリュックサックまで、さまざまな大きさや壊れやすさのものを扱えるんです。必要に応じて握力や力加減を調整できるんです。
この多様性こそが、ネオアを他のロボットと一線を画すものにしてるんです。
でも、ネオアの本当の天才的なところは、その頭の中で起こってることなんです。これは具現化されたAIなんです。ネオアは単にプログラムされた機械やありません。常に学習し、適応してるんです。
周囲の情報や過去の経験を使って、パフォーマンスを向上させていくんです。AIシステムは、強化学習やコンピュータビジョン、その他の先進的なAI技術を使って、人間の運動や操作を再現してます。
これは、ネオアが相互作用から学び、時間とともにパフォーマンスを向上させられるってことです。イヴというロボットの経験を基に進化してるんです。これらのロボットは一種の集合意識を共有してて、一つが学んだことを全てが学ぶんです。
この共有知識ベースのおかげで、ロボット群全体が急速に改善されるんです。
現在、ネオアは実際の家庭環境でテストされてます。1Xは大量生産の前に、技術を最適化し改良するためのフィードバックを集めてるんです。
価格に関しては、1Xは新車や中古車くらいの価格になるやろうって言うてます。1Xは、これらのロボットを単に販売するんやなく、使用データに基づく月額課金のリースモデルも検討してます。
これにより、より多くの消費者がネオアを手に入れやすくなるかもしれません。
1Xはすでに、OpenAIを含む様々な企業から1億ドルを調達してます。彼らの目標は、市場への投入を加速し、先行者の優位性を確保することです。
来年の初めには大量生産と一般向けのリリースを計画してます。
1Xはネオアを、ChatGPTがAI業界に与えたのと同じようなインパクトをロボット業界に与える可能性があると考えてます。ヒューマノイドロボットの一般利用を促進するきっかけになるかもしれません。
強くて速く動くロボットを家庭で使うとなると、安全性が大きな懸念になりますよね。でも、1Xはそこんとこもちゃんと考えてます。
ネオアは柔らかい外装を持ってて、優しい触り心地になってます。支配するんやなく、人間と調和して共存するように設計されてるんです。
1XのCEOであるバーント・ボリックさんは、このポイントを強調してます。「私たちの最優先事項は安全性です。安全性は、ネオアβ版を自信を持って家庭に導入し、重要なフィードバックを集め、実際の環境でその能力を実証するための礎石なんです」
別のデモでは、ネオアがキッチンで食器洗い機から食器を出す様子が見られます。精密に繊細な物体を扱ってます。
こういうタスクには力加減の絶妙なバランスが必要なんです。力が強すぎると卵を潰してしまうし、弱すぎるとお皿を落としてしまう。でも、ネオアはこれら全てを難なくこなしてます。
でも、ネオアが繊細な作業だけをこなすと思うたらあかんで。あるデモでは、レーシングバイクを持ち上げてるんです。これはかなりの力が必要ですわ。
歩行に関しても、ネオアはよたよたしてるんやありません。その歩行能力は完全に学習されてて、関節のトルク制御にまで及んでます。
ヒューマノイドロボットに必要とされる精密さのレベルだけやなく、力のレベルも示すような特定のタスクがあるんです。
目標は、年末までにネオアが人間と同じくらい効率的で自然に歩いたり走ったりできるようにすることです。
この完全に学習によって得られた歩行へのアプローチは、ロボット工学における重要な進歩です。
ほとんどのロボットは事前にプログラムされた動きに頼ってますが、ネオアは人間の子供がするのと同じように、練習と適応を通じて歩くことを学んでるんです。
その握力は70kgのデッドリフトに十分なほどです。ロボットは力制御を伴う腱駆動システムを使用しており、より自然で適応性のある動きを可能にしてます。
ネオアは1000回の転倒に耐えられるように設計されてます。この耐久性のレベルは、予測不可能な家庭環境で動作するように設計されたロボットにとって極めて重要です。
1Xはネオアに大きな計画を持ってます。彼らの生産タイムラインはかなり野心的です。2025年に数千台、2026年に数万台、2027年に数十万台、2028年には数百万台を目指してます。
もし彼らがこれを実現できたら、次の10年以内に全ての家庭にロボットが1台ずつある世界が見られるかもしれません。
1Xの製造運営・エンジニアリング担当副社長のシャバ・ハートマンさんは、彼らのビジョンをこう説明してます。「私たちは、安全で有能、そして手頃な価格のロボットを作ってます。これにより、私たちの間で生活し、学ぶことができるロボットを作り出すことができるんです」
将来のAIシステムに対するネオアの潜在的な影響は計り知れません。GPT-5やGPT-6がヒューマノイドロボットに具現化される可能性について話してるんです。
具現化されたAIとヒューマノイドロボットに対する影響は驚くべきものです。人間と機械の相互作用における新時代の入り口に立ってるかもしれません。
1XのAI部門副社長のエリック・ジャンさんは、彼らが取り組んでる課題を強調してます。「ロボットに電気のスイッチを入れるよう頼んだとしても、スイッチに触れたかどうか、スイッチが入ったかどうか、転倒しなかったかどうかさえ分からないんです」
これは、ネオアが対処するように設計されてるタスクの複雑さを示してます。
1Xのネオアに対するAI開発アプローチには、実世界での相互作用から多様なデータを収集することが含まれてます。
ジャンさんはこう説明してます。「私たちのヒューマノイドロボット、イヴとネオアの両方を使って、多様なロボットデータを大量に収集してます。世界に関するあらゆる種類の知識を捉えるロボティック基盤モデルを訓練し、それを役立つアシスタントに変えるんです」
ネオアの開発は、以前のロボット工学の進歩からインスピレーションを得てます。ハートマンさんは、2000年に初めて紹介されたホンダのヒューマノイドロボット、ASIMOからインスピレーションを得たと言ってます。
ASIMOは歩いたり、走ったり、階段を上ったり、顔や声を認識したり、物を運ぶなどの簡単なタスクを実行したりできました。ロボット工学の一大マイルストーンと考えられてましたが、ホンダがより実用的なロボット応用に焦点を当てることを決めた2018年に開発が中止されました。
ネオアはASIMOから大きく進歩してます。ASIMOが主に研究プラットフォームやったのに対し、ネオアは家庭での日常的な使用を目的に設計されてます。
ASIMOの移動能力と高度なAI、改良された器用さ、実世界での応用に焦点を当てたものを組み合わせてます。
自動車業界との比較は適切です。ハートマンさんは「この種の価格設定と広範囲な採用の可能性を持つ消費者トレンドが最後に起こったのは、おそらく自動車の導入時やったんちゃうかな」と述べてます。
これは、世界中のロボットデモの増加を説明してます。企業は、私たちの生活や仕事の仕方を大きく変える可能性のある主要な変革の最前線に立とうと競い合ってるんです。
ネオアを動かすソフトウェアも同様に印象的です。OpenAI搭載のチャットシステムにより自然言語でのやり取りが可能になり、さらにロボットが非言語的な合図を理解し使用できる能力は、ロボット工学ではめったに見られへん細やかなコミュニケーションを可能にしてます。
ネオアの開発がもたらす経済的な影響も考慮に値します。もし1Xの野心的な生産タイムラインが実現すれば、労働市場に大きな変化が起こる可能性があります。
現在、人間の労働者が行ってるタスクの多くが、ネオアのようなロボットに取って代わられる可能性があります。これにより効率性と生産性が向上する可能性がありますが、同時に職の置き換えや労働者の再教育の必要性といった問題も提起されます。
一方で、ネオアのようなロボットの開発と生産は、ロボット工学、AI開発、ロボットのメンテナンスと修理といった分野で新たな雇用機会を生み出す可能性もあります。
ロボット経済の出現は、様々な分野を再形成し、全く新しい産業を生み出す可能性があります。
これらの課題にもかかわらず、ネオアのようなロボットがもたらす潜在的な利益は計り知れません。
この技術的ブレークスルーについて、あなたはどう思いますか?コメント欄で教えてください。そして、より多くの有益な動画を見るために、Blow Me AIのチャンネル登録とライクをお忘れなく。
OpenAIの新しい極秘モデル、ストロベリーとオライオンが明らかになりました。そして、すでに連邦政府官僚たちは動揺してます。
これらのAIブレークスルーは、問題解決を革新し、現在のチャットボットを時代遅れにする可能性があります。
ここがポイントです。以前にQARとして知られていたストロベリーは、他のAIが立ち往生するような複雑な数学や難問を解くことができます。
そのあまりの高度さに、OpenAIはアメリカの国家安全保障の大物たちにデモを見せたほどです。
でも、それだけやありません。ストロベリーは、さらに強力なモデルであるオライオンのトレーニングデータを作成するのにも使われてるんです。
なぜこれが重要なんでしょうか?これは、何年も先のことやと思われてたAIの限界を打ち破る可能性があるんです。
現在のAIでは手に負えない航空宇宙工学やコーディングの分野で、潜在的なブレークスルーが起こる可能性があるんです。
さらに、OpenAIは今年の秋にもストロベリーのバージョンをChatGPTに統合する可能性があります。
これらのモデルがどのように機能し、なぜ人々を驚かせてるのか、詳しく見ていきましょう。
ストロベリーは単なる言語モデルやありません。複雑なタスクをじっくり考える人間の問題解決能力を模倣するように設計されてるんです。
このアプローチにより、特に複数のステップを要する推論において、より正確で信頼性の高い出力が可能になります。
具体例を挙げましょう。ストロベリーはニューヨーク・タイムズのコネクションズパズルを難なくクリアします。私はこれをClaude 3.5 SonnetやGPT-4のようなトップモデルでテストしましたが、全く歯が立ちませんでした。
ストロベリーの成功は単に単語ゲームに優れてるってことやありません。言語理解と抽象的推論の飛躍的な進歩を示してるんです。
でも、ストロベリーには注意点があります。考える時間が必要なため、通常のAI応答よりも遅くなります。
そのため、OpenAIはChatGPTへの潜在的な統合に向けて、蒸留バージョンの開発に取り組んでます。改善された推論能力と日常使用に適した実用的な速度のバランスを取ることを目指してるんです。
次はオライオンです。これはOpenAIの次のフラッグシップモデルになる見込みで、GPT-4を上回るパフォーマンスを目指してます。
面白いのは、オライオンのために高品質なトレーニングデータを生成するのに、ストロベリーの大規模バージョンを使用してるってことです。
このアプローチは、AIの進歩を遅らせるやろうと多くの人が考えてたデータの制限を克服する可能性のあるゲームチェンジャーになる可能性があります。
なぜOpenAIがこれらの新しいモデルをそんなに急いで押し進めてるんでしょうか?簡単です。競争が激しいんです。
Llama 2のようなオープンソースモデルがGPT-4の後ろに迫ってきてます。AnthropicやGoogleもAI推論の分野で大きな進歩を遂げてます。
OpenAIは先頭を走り続ける必要があり、ストロベリーとオライオンが彼らの秘密兵器になる可能性があるんです。
この話には技術仕様以上のものがあります。OpenAIが国家安全保障当局にストロベリーをデモしたってのは大きな意味を持ちます。
AI開発と国家安全保障の懸念の交差点が拡大してることを示してるんです。これらの技術がより強力で潜在的に破壊的になるにつれて、AI企業と政府の間の新たな協力の時代を迎える可能性があります。
これはまた、AIの安全性とアライメントという重要な問題にも関連してます。推論能力の向上は、私たち全員が嫌がるAIのハルシネーションやエラーを減らすかもしれません。
これは、AIが機密性の高い分野で採用されるために不可欠です。でも同時に、これらのシステムがより高度になるにつれて、AIの能力とリスクに関する新たな疑問も提起されます。
タイムラインとしては、早ければこの秋にストロベリーの蒸留バージョンがChatGPTに統合される可能性があります。
オライオンのリリース日はあまり明確やありませんが、明らかにOpenAIの最優先事項です。
ストロベリーの仕組みについて詳しく見てみましょう。問題解決能力を高めるために「テストタイム計算」という技術を使用してます。
即座に答えを出すんやなく、問題を解くよう求められた後で問題のあらゆる部分を考慮するんです。これは、私たちが難しい数学の問題に取り組む時のように、AIが「考え方を示してる」ようなもんです。
これは、OpenAIの元チーフサイエンティストであるイリヤ・サツキーバーが始めた研究を基にしてます。サツキーバーが退社した後、研究者のヤコブ・フォースターとサイモン・シュミットがこの研究をさらに発展させ、QAR(現在のストロベリー)につながりました。
このブレークスルーは、サム・アルトマンがCEOを解任され、その後再雇用されるという激動の取締役会劇のちょうど前に起こりました。
ストロベリーの可能性はパズルをはるかに超えてます。複雑な推論、高度な数学、モデリング、最先端の科学研究、さらには高度な戦略的計画が必要なタスクにおける革命的な可能性について話してるんです。
単に数字を処理するだけでなく、文脈や意味を本当に理解するAIを想像してみてください。
オライオンの詳細はもっと秘密めいてますが、その開発はストロベリーと密接に関連してるようです。
ストロベリーを使ってオライオンのトレーニングデータを作成するってのは、頭が混乱するような概念です。
これは、オライオンを訓練するための大量の高品質で推論に焦点を当てたデータを生成するためのOpenAIの方法かもしれません。潜在的に既存のデータセットの限界を飛び越える可能性があります。
このデータ生成アプローチは革命的かもしれません。多くの専門家がAI開発におけるデータの壁、つまりますます複雑になるモデルを訓練するための良質なデータが不足することについて警告してきました。
もしストロベリーが本当にオライオンを訓練するのに十分な良質の合成データを作り出せるなら、AI発展の全く新しい道を開く可能性があります。
国家安全保障当局がストロベリーのデモを見たってのは大きいです。これらのモデルが商業利用を超えた影響を持つことを示唆してます。
複雑な問題を推論する能力は、サイバーセキュリティ、戦略的計画、さらには軍事応用においてゲームチェンジャーになる可能性があります。
でも、これはまた、誰がこれらの強力なAIシステムを制御するのかについて大きな疑問を投げかけます。
OpenAIが政府当局者にブリーフィングを行うのは、責任ある開発と見なされる可能性もありますが、AI進歩に対する政府の潜在的な影響について眉をひそめる人もいるかもしれません。
正確なリリース日はありませんが、OpenAIがChatGPTへの潜在的な統合のためにストロベリーの蒸留版に取り組んでるって事実は、彼らが急いでるってことを示してます。
予想よりも早く、ストロベリーの能力の一部が一般向けアプリで見られる可能性があります。
オライオンのタイムラインはもっと不明確ですが、OpenAIの戦略にとって明らかに重要性が高いことを考えると、最優先事項であることは間違いありません。
AI世界は光速で進化してて、OpenAIはトップの座を維持するためのプレッシャーを明らかに感じてます。
これらの開発はまた、AIの安全性とアライメントに関するより大きな議論にも影響を与えます。
一方では、より優れた推論能力により、AIシステムがより信頼性が高く、エラーやハルシネーションが少なくなる可能性があります。これにより、重要なアプリケーションでのAIの安全性と信頼性が向上する可能性があります。
一方で、AIが複雑な推論をより上手く行えるようになるにつれて、人間の価値観や目標に沿ってるかを確認することがますます重要になります。
推論能力があるからといって、自動的に倫理的な決定ができるわけやありません。これは、継続的な研究と警戒が必要な分野です。
まとめると、ストロベリーとオライオンに関する明らかになった情報は、AI能力における潜在的に大きな飛躍を表してます。
これらのモデルは、人間の思考を不気味なほど模倣する方法で、真に推論し問題を解決できるAIシステムに一歩近づいてる可能性があります。
その影響は計り知れません。科学研究から創造的な問題解決、ビジネスの洞察まで、幅広い分野に及びます。
医薬品開発の加速、パーソナライズされた教育の革新、より細やかなビジネスの洞察の提供、さらには複雑な環境モデリングへの取り組みができるAIを目の当たりにしてる可能性があります。
いつものように、私はこれらの進展を鋭く見守り続けます。AI業界はかつてないほど急速に変化してて、OpenAIのこれらの新しいモデルは本当のゲームチェンジャーになる可能性があります。
AIチップ、ご存知の通り、真っ先に思い浮かぶ名前はNVIDIAです。あなたのチップはNVIDIAとどう違うんですか?
そうですね、NVIDIAはGPU(Graphics Processing Unit)と呼ばれるものを作ってます。一方、私たちはLPU(Language Processing Unit)と呼んでるものを作ってます。
GPUは並列処理が非常に得意です。例えば、確定申告のようなタスクを完了したいとします。各ページを他の人に記入してもらうことができると想像してください。それがGPUのやることです。
Gro、AIチップのスタートアップ企業が最近、6億4000万ドルのシリーズDの資金調達ラウンドを完了しました。これにより、同社の評価額は28億ドルに押し上げられました。
2016年に設立されたGroは、AIチップ市場でNVIDIAの優位性に挑戦することを目指してます。
Groの創業者兼CEOであるジョナサン・ロスさんは、AI推論チップに焦点を当てて会社を設立しました。
AIにおける推論とは、訓練されたモデルが新しい状況に知識を適用するプロセスのことです。これにより、スマートフォンが写真の物体を識別したり、チャットボットが応答を生成したりすることが可能になります。
Groの主要技術は、彼らの言語処理ユニット(LPU)です。
でも、物語を書こうと思えば、一貫したストーリー展開が必要です。始まりと終わりを知る必要があり、他のすべてのことがそれに依存します。
そのためには、おそらくLPUが必要です。なぜなら、それは連続的やからです。99番目や100番目の単語を予測するまで、99番目の単語を予測することはできません。
これらのチップは、NVIDIAのグラフィックス処理ユニット(GPU)とは対照的に、特に推論タスク向けに設計されてます。
Groは、推論タスクにおいて、彼らのLPUがNVIDIAのGPUよりも4倍速く、5倍安く、3倍エネルギー効率が良いと主張してます。
私たちはLPUを作ってます。GPUのことは聞いたことがあると思いますが、LPUは言語処理ユニットです。
違いは、GPUは高度に並列化されたプログラム、つまり同時に多くのタスクを実行できるものに適してますが、それらは連続的でなく、お互いに依存しません。
一方、LPUは例えば言語に適してます。なぜなら、99番目の単語を予測するまで100番目の単語を予測することはできないからです。
だから、完全にユニークですが、超高速です。通常、人々に初めてデモを見せると、「わぉ」という反応が返ってきます。
実際、私たちのウェブサイトのURLはwww.gro.aiではなく、www.gro.comです。
AIチップ市場は2027年までに1.1兆ドルに達すると予測されてます。推論市場だけでも、今後4年間で607億ドルの価値があると予想されてます。
Groはこの成長する市場の一部を獲得することを目指してます。
Gro Cloudの成長は急速でした。NVIDIAやAMD、Intel、多くのレガシー企業があります。また、SambanovaやCerebrasのような他のチップスタートアップもあります。
そのエコシステムの中で、どのように位置付けられ、他のプレイヤーとどのように競争してるんですか?
私たちが主にやってることの一つは、実際にチップをサービスとして利用可能にすることです。Gro Cloudがそれです。
そこに行けば、実際に試すことができます。超高速です。そして、人々が自分のアプリケーションを構築できるAPIがあります。
サーバーを購入してデータセンターに設置する必要はありません。私たちがそのすべてを処理します。非常に簡単です。
実際、過去約14週間で、7人未満の開発者から26万人以上の開発者に成長しました。
ロスさんは、「過去5ヶ月間で、ほんの一握りの開発者から30万人以上に成長しました。Llamaの品質とオープンさ、そしてGro LPUの信じられないほどの速さに魅了されたんです」と述べました。
現在、NVIDIAがAIチップ市場シェアの約80%を占めてます。他の競合にはAMD、Intel、CerebrasやSambanovaなどのスタートアップがあります。
Groはこの競争の激しい環境で大きな課題に直面してます。
イーロン・マスクがグロックというチャットボットを持ってますね。何か混乱は生じてませんか?
ちょっとはありますね。こう言っておきましょう。私たちが先に商標を取得しました。私たちが先に宣言したんです。
Groは最近、元Intelの幹部であるスチュアート・パンさんを新しい最高執行責任者(COO)として雇いました。
また、MetaのチーフAIサイエンティストであるヤン・ルカンさんを技術顧問として迎えました。
これらの著名な人材の追加は、会社に貴重な経験をもたらします。
Groは2025年第1四半期末までに10万8000以上のLPUを展開する計画です。
彼らはグローバルに拡大し、Aamco Digitalのような企業と提携してAIコンピューティングセンターを世界中に構築しています。
業界のリーダーたちはGroに注目してます。
BlackRock Private Equity Partnersのサミール・メナンさんは、「AIコンピューティングの市場は意味があり、Groの垂直統合ソリューションはこの機会に適していると考えてます。Groが需要に応えてスケールアップし、イノベーションを加速させるのを支援できることを楽しみにしてます」と述べました。
Samsung Semiconductor Innovation Centerの責任者であるマルコ・チサリさんは、「Groの破壊的なコンピューティングアーキテクチャと、ソフトウェアファーストのアプローチに非常に感銘を受けました。Groの記録的な速さと、ほぼ瞬時の生成AIの推論パフォーマンスは市場をリードしてます」と述べました。
Groのビジョンは、単に高速なチップを作ることを超えてます。
彼らは、AIコンピューティングを民主化することを目指してます。
ロスさんは、「最大手のテクノロジー企業だけでなく、誰もが最先端のAI製品を作れるようにリソースを提供することを目指してます」と述べました。
Groは、Global Foundriesとのパートナーシップを通じてチップを製造しています。
彼らは、Gro Cloudにさらに10万以上のLPUを追加で展開し、コンピューティング能力を大幅に増強する計画です。
会社の名前は、SF小説「異星の客」に由来します。この本の中で、「グロック」は「共感を持って理解する」というマーシャン語です。
これは、イーロン・マスクのグロックチャットボットと似てますが、ロスさんは「私たちが先に宣言したんです」と主張してます。
実際、私たちはお金が尽きると思ってました。死ぬと思ってました。問題は、私たちが作ったものを少し早すぎるタイミングで作ってしまったってことです。
Groは、全米AI研究リソースパイロット(NAIRR)に参加するよう選ばれました。これは、研究者をAIリソースと結びつける米国政府のイニシアチブです。
これにより、Groはより大規模で確立された企業と同じリーグに位置付けられました。
Groの公共部門社長であるイアン・ブラックさんは、「Groは部分的に、AIにおける持てる者と持たざる者の格差を解消するために設立されました。必要なリソースへのアクセスの欠如が、研究者の次のオペレーション・ワープ・スピードでの成功を妨げることがあってはなりません」と述べました。
Groは最近、Gro Cloud上でLlama 3.1モデルをリリースしました。これには4050億パラメータのモデルが含まれ、公開されてる中で最大級の言語モデルの一つです。
マーク・ザッカーバーグはこれについてコメントし、「Gro CloudでのLlama 3.1モデルのクラウド展開における超低遅延推論に本当にわくわくしています。これは、オープンソースへの私たちのコミットメントがAIのイノベーションと進歩を推進してる素晴らしい例です」と述べました。
Groの財務実績は、進歩と課題の両方を示してます。
2023年には、売上高は340万ドルと低く、純損失は8830万ドルでした。しかし、今年度は1億ドルの売上を予想してます。
同社は初期の年に大きな課題に直面しました。ロスさんは、「Groは何度も死にかけました」と認めています。
「Groを少し早すぎるタイミングで始めたかもしれません」と彼は2019年、スタートアップが資金切れまで1ヶ月を切った時のことを振り返りました。
2022年後半にChatGPTがリリースされたことで始まったAIブームは、Groにとって有益でした。
ロスさんは現在の状況を「コンピューティングは新しい石油です」と表現し、AIコンピューティングパワーに対する高い需要を指しています。
考え方としては、すべての技術時代は何らかの希少資源に基づいてます。産業時代は石油、石炭、天然ガス、そして今では太陽光や風力などのエネルギーに基づいてました。
情報時代は印刷機から始まり、最終的にはインターネットとモバイルに至りました。
資金調達の際によく聞かれた質問は、「AIは次のインターネットになるのか、次のモバイルになるのか」でした。
私の答えは、絶対にそうではありません。なぜなら、それらは情報時代の技術だからです。これは生成時代の技術です。
違いは、情報時代の技術がデータを高忠実度でコピーし、複製し、配布することに関するものであるのに対し、生成時代の技術は、問われた質問の文脈に応じてその場で何か新しいものを生成することに関するものだからです。
Groの技術は、高性能コンピューティングにも応用されています。
マンハッタン計画に起源を持つ連邦研究施設であるアルゴンヌ国立研究所は、核融合の研究にGroのチップを使用しています。
エネルギー効率は、Groの重要な焦点です。
彼らのチップは、推論タスクにおいてNVIDIAのGPUよりも3倍エネルギー効率が良いと主張されています。
AIのエネルギー消費に対する懸念が高まる中、これは大きな利点となる可能性があります。
Groは、自動車やロボット産業も対象にしており、これらを潜在的に3000億ドル規模の市場と見積もってます。
イーロン・マスクでさえ、テスラのAIプロジェクト用にNVIDIAのチップを注文してます。
同社はAI教育にも投資しており、カリフォルニア州の住民に高度なAIのトレーニングを提供する計画です。
この戦略は、彼らの製品に対する需要を生み出すと同時に、AIスキルのギャップに対処する可能性があります。
Groはいくつかの課題に直面しています。
ハードウェアの展開をスケールアップすることは複雑で、今後のチップの設計上の欠陥や潜在的な遅延に関する噂もあります。
新技術の展開における何らかの後退は、成長期待に影響を与える可能性があります。
AIチップ市場の競争は激しいです。NVIDIAは市場シェアを積極的に守ると思われ、他のスタートアップも市場シェアを狙っています。CEOであるアンドリュー・フェルドマンさんは、Groのアプローチを認めています。「白紙の状態から始めた人で、このような作業用にGPUを作ることを選んだ人はいません」
これは、GroのLPUのような目的特化型AIチップの潜在的な優位性を強調しています。
地政学的要因も、Groを含む半導体セクター全体に影響を与える可能性があります。
バイデン政権とドナルド・トランプの両方から最近出た発言は、半導体株が世界的な緊張にいかに敏感であるかを示しています。
最近の6億4000万ドルの資金調達ラウンドは、BlackRock Private Equity Partnersが主導し、既存および新規の投資家(Neuberger Berman、Type One Ventures、Cisco Investments、Samsung Catalyst Fundなど)が参加しました。
ロスさんは、AIの展開における推論の重要性を強調しています。「AIモデルのトレーニングは解決済みです。今は、世界が使えるようにこれらのモデルを展開する時です」
より高速で効率的なAI推論の潜在的な応用範囲は広いです。
医療やや気候科学などの分野での進歩を加速させ、医療画像のリアルタイム処理や、より正確な気候予測を可能にする可能性があります。
Groは積極的に採用を行っており、競争の激しい市場でトップ人材を惹きつけようとしています。
ロスさんは、「私たちは、何十万人もの開発者がオープンモデル上で構築することを可能にしたチームです。そして、私たちは採用中です」と述べています。
NAIRRパイロットへのGroの参加は、重要な意味を持つ可能性があります。
コンピューティング・データ・ソフトウェア・プラットフォームのケイティー・アンティパスは、「研究者が責任を持って国のイノベーションと科学的発見を進めるために必要とするリソースです」と述べています。
NAIRRパイロットへのGroの貢献により、研究者は最先端のモデルにアクセスでき、彼らの大胆な研究ビジョンの実現を助けることになります。
ジョナサン・ロスさんは、Llama 3.1のローンチについてコメントしました。「Metaは、AIのオープンなオペレーティングシステム、つまりLinuxの等価物を作成しています。これはGro LPU(高速AIインファレンスを提供)だけでなく、エコシステム全体のためのものです。技術の世界では、オープンが常に勝ちます。このLlama 3.1のリリースで、Metaは最高のプロプライエタリモデルに追いついたんです。このペースでいけば、閉鎖的なモデルを追い越すのは時間の問題です」
GroのLPU技術は、従来のGPUとは大きく異なります。
GPUが並列処理に優れているのに対し、LPUは言語処理に重要な連続的なタスク向けに設計されています。
この設計選択により、特定のAIアプリケーションにおいてGroが優位に立つ可能性があります。
トレーニングではなく推論に焦点を当てる同社の戦略は戦略的です。
AIモデルのトレーニングは計算量が多いですが、推論は展開されたAIシステムの継続的な計算コストの大部分を占めます。
推論を最適化することで、Groは多くのAIアプリケーションにとって重要な痛点を狙っています。
Groのチップは、AIシステムが目標を達成するために複数の連続的なタスクを実行する必要がある「エージェント的ワークロード」に特に適しています。
これは、自動運転や複雑なロボット制御システムなどのアプリケーションで特に価値がある可能性があります。
AIが進化し続けるにつれて、より高速な推論によって可能になることはどんなことがありますか?
そうですね、大きなものの一つはエージェント的なユースケースです。
今では、チャットボットに行って質問を入力して答えを得るのに慣れてますが、それは単一のステップです。
代わりに、例えば、ハワイへの旅行を予約したいと仮定してください。ハワイはいい休暇先ですね。
「ハワイへの旅行を予約して」と入力したとします。すると、ハワイのどこに行きたいのか、ビーチで過ごしたいのか、何をしたいのかなど、一連の質問をする必要があります。
すべての答えを得た後、どの航空会社を予約し、どのホテルを取るかを見つけ出す必要があります。一部は満室かもしれません。
何かを成し遂げるために行わなければならないすべてのタスクを考えてみてください。これらがエージェント的なワークロードです。
すべてのイテレーションを完了するまで、実際に解決することはできません。
そのため、答えを得るのに時間がかかるほど、より大きな影響が出ます。
実際、あるお客様がエージェント的なワークロードを構築しました。これは10億人以上のユーザーを持つお客様でした。
結果を得るのに4〜5分かかっていたのですが、Groに切り替えたところ、10秒に短縮されました。
Groのチップ設計へのアプローチは業界でユニークです。
彼らは最初の6ヶ月間、チップを設計する前にコンパイラに取り組みました。これは従来のアプローチとは逆です。
このソフトウェアファーストの戦略により、AIワークロードの最適化において優位に立つ可能性があります。
Llama 3.1のようなオープンソースモデルに焦点を当てる同社の戦略は戦略的です。
これらのモデルをサポートすることで、Groは成長するオープンソースAI運動の重要なインフラストラクチャプロバイダーとしての立場を確立しています。
同社の低遅延への注力は、自動運転や金融取引などの分野でのリアルタイムAIアプリケーションにとって特に価値がある可能性があります。
ミリ秒単位の遅延でさえ重要になる可能性があります。
Groのチップは、大規模言語モデルを効率的に処理するように設計されています。
これらのモデルがサイズと複雑さを増すにつれて、GroのLPUのような特殊なハードウェアがますます重要になる可能性があります。
推論に焦点を当てる同社のアプローチは、エッジAIアプリケーションの予想される成長に適しているかもしれません。
より多くのAI処理がエッジデバイスに移行するにつれて、効率的な推論がますます重要になります。
Groの技術は、AIモデルを大規模に実行するコストを潜在的に削減する可能性があります。
彼らの効率性に関する主張が真実であれば、より幅広い企業にとって高度なAIアプリケーションがより経済的に実行可能になる可能性があります。
AIチップ競争は熱を帯びており、Groは革新的な技術と野心的な計画を持つ真剣な競争相手です。
彼らはNVIDIAの優位性に挑戦する準備ができています。
AIコンピューティングの未来は興奮に満ちています。
私たちは、ディープラーニングを100万倍加速させました。これが、大規模言語モデルを作成することが可能になった理由です。
100万倍のスピードアップ、100万倍のコストとエネルギーの削減が、生成AIを可能にしたんです。
NVIDIAのディープラーニングにおける飛躍は、単に生の力だけの問題ではありません。
AIがハードウェアの制限に縛られない未来を可能にすることに関するものです。
このような進歩により、NVIDIAはAI軍拡競争における重要な役割を担っています。
そこで、私たちの旅のカートゥーンを作りました。
あなたが作ったんですか、それともAIが生成したんですか?
作らせました。CEOはそうするんです。私たちは何もしません。ただ作らせるだけです。
ここでのユーモアは、深刻な真実を隠しています。NVIDIAは産業を再定義するツールを作り出しています。
カートゥーンの作成から最先端のAIチップの開発に至る彼らの旅は、イノベーションへの容赦ない追求を示しています。
このカートゥーンは本当に素晴らしいです。これらはコンピュータ業界における最も重要な瞬間のいくつかです。
もちろん、IBM System 360は現代のコンピューティングの発明です。
1975年のティーポット、1979年のユタのティーポット、1986年のレイトレーシング、プログラマブルシェーディングなどです。
これらの瞬間が技術の風景を形作りました。
しかし、NVIDIAの最近の動き、特にAIチップに関するものは、産業全体を再定義する可能性があります。
彼らの進歩は、コンピューティング史の次の大きな章になるかもしれません。
もちろん、プログラマブルシェーディングは、今日私たちが見るほとんどのアニメーション映画を可能にしました。
元々はCray スーパーコンピュータで行われ、その後1993年にNVIDIAが設立されました。


コメント