究極のロボットはついに登場したのか? Helixを発見せよ

AGIに仕事を奪われたい
この記事は約11分で読めます。

6,393 文字

https://www.youtube.com/watch?v=glj6ifGW9RM

これから見る映像は絶対に魅力的です。まずはご覧いただき、その後で議論しましょう。
「イー・フィティゴス、こちらに来てもらえますか?」
「わかりました」
「新しいことを試してみたいと思います。これらの物体を初めて見るとしても、あなたの新しいAI、ELXを使って、どこに配置すべきか推論し、一緒に片付けてみませんか?」
あなたも見ましたね。瞬時にあなたを理解し、あなたの見ているものを見て、これまで触ったことのない物体を操作するロボット。訓練も、プログラミングもなし、ただ知性だけで。これがFigure社の新しいロボットです。
以前、彼らが最初のFigureロボットを発表した時に大きな話題になったことを覚えているでしょうか。当時もそのイベントについて取り上げましたが、かなり驚くべきものでした。そして今回はその続編、彼らのロボットの進化形です。家庭用ロボット工学の分野での明確な進歩がようやく見られます。
ここで何が起きたのか分析してみましょう。ご存知かもしれませんが、この会社はOpenAIとかなり緊密な提携関係を持っていました。彼らは契約を結んでいましたが、数週間前、Figureは見てのとおり、OpenAIとの提携を終了しました。FigureのファウンダーであるBrett Adcockは2月4日にTwitterで、自社内でロボット向けのend-to-endのAIで大きなブレークスルーを達成したため、提携が終了したと発表しました。そしてこの内部的なブレークスルーが「Helix」だったのです。
この発表の直後、Figureが新たな大規模な資金調達について既に協議していることも分かりました。いくつかの報告によると、評価額約400億ドルで15億ドルの資金調達という話も出ています。もはや小さなスタートアップではなく、巨大な企業になっていることが明らかです。おそらく投資家はこのテクノロジーを間近で見て熱狂しているのでしょう。実際、このようなロボットを見て感動しない人がいるでしょうか。
このロボットはあなたの買い物を片付けることができますが、それだけではありません。Helixとその真の重要性について説明しましょう。なぜこれが単なるデモではないのか、その理由をお話しします。
まず名前から始めましょう。彼らは「Vision Language Action(視覚・言語・行動)」と呼ぶモデルを開発しました。この名前自体が3つの主要な構成要素を示しています。環境を見る(視覚)、指示を理解する(言語)、それに応じて行動する(行動)。Figureはこのモデルを「汎用モデル」と呼んでいます。なぜなら、一つの特定のタスクに限定されず、特別なプログラミングや膨大なデモデータなしに、数千の異なる家庭用品を扱うことができるからです。
このデモ映像では、人が「買い物を片付けてください」と言うと、ロボットは台所をスキャンし、冷蔵庫を開け、品物を中に入れ、りんごを果物かごに入れています。さらに驚くのは、これらのタスクには複数のロボットが協力し、互いに物を渡し合っていることです。これは前例のないことです。後で説明します。
Figure社の創設者Brett Adcockは、ELXの開発は1年以上続いており、人間のように一般的なロボット工学を解決することを目指していると述べています。「人間のように」とは、Helixが問題に対して推論できるだけでなく、音声コマンドに応答し、見たことのない新しい物体を操作できることを意味します。これは人型ロボットが今日機能するために必要な最低限の条件です。
本当の意味での物体の一般化について話しているのであり、これは大きなことです。一般家庭は整然と並んだ組立ラインとはまったく異なります。今日、工場では人型ロボットが働いていますが、これらのロボットは特定の機械や物体に対して訓練されています。工場の生産ラインにいるロボットをそのままあなたの家に持ってきても機能しません。物体を認識できないでしょう。そしてこれこそがHelixが解決している問題なのです。
家は散らかっていて、物は変わり、照明条件は変化し、基本的にどの家も独特です。ロボットがこの環境で本当に快適に動くには、これまでのロボットにはない適応性のレベルが必要です。彼らがこのブレークスルーを達成し、このロボットがどのように機能するかを説明させてください。
「システム2(S2)」と「システム1(S1)」と呼ばれる二つの人工知能が一つのシステムとして機能します。システム2はより遅い部分で、インターネット上で事前訓練された視覚言語モデルです。これは自然言語での命令を解釈し、シーンを観察して、どう行動するかの全体的な計画を立てる部分です。一方、システム1はロボットの視覚運動システムで、システム2が立てた行動計画を200Hzのシステムでリアルタイムの物理的行動に変換します。
システム2を何をすべきか考える脳として、システム1を素早い動きをコントロールする神経系として想像してください。これらの二つのシステムが連携して動くのを見るのは本当に魅力的です。
少し補足すると、これら二つのシステムはロボットに直接組み込まれたローパワーGPU上で動作します。つまり、計算は外部の巨大なコンピュータではなく、すべてローカルで行われます。これは理にかなっています。もし彼らがこれを一般消費者向けに商品化するつもりなら。
Figureによれば、この手法がロボット工学の問題を解決するのだといいます。大規模AIモデルは会話や意思決定には優れていますが、瞬時の制御には遅すぎます。一方、小さなAIモデルは非常に高速ですが、知性が限られています。Helixを「遅い思考」のシステム2と「素早い行動」のシステム1に分けることで、両方の利点を得ています。
彼らは約500時間のテレオペレーション行動データベースも構築したと言っています。つまり、チーム全体がVRヘッドセットを装着し、ロボットに操作方法を教えている間、ロボットはそれをすべて記憶しているのです。まるで誰かがあなたの体をコントロールし、あなたの代わりに動かしているようなものですが、あなたは意識があり、すべてを観察している状態です。ロボットはこのようにして学習しました。
彼らはロボット工学におけるいくつかの革新も紹介しました。まず、上半身の完全制御です。35の自由度があり、これは膨大な数です。手首、胴体、頭、指などすべてが200Hzで機能します。これはたくさんの関節を調整することであり、特にロボットが異なる形や重さの物体を拾う場合は複雑です。例えば、冷蔵庫のドアを開けるには、中を見るために胴体をひねる必要があります。これらはすべて、ロボットを構築しタスクを実行させる際に考慮すべき細かな詳細です。
次の革新はマルチロボット協力です。映像では、二つの異なる人型ロボットが単純な音声コマンドで食料品を受け渡しているのを見ました。例えば「右側のロボットの隣にあるビスケットを渡して」と言うと、両方のロボットが環境を解釈し、物の受け渡しを調整しなければなりません。同時に行動することはできないので、二つのロボットを連携させて全体的な状況を理解させる必要があります。
最近、ロボット工学の分野では多くの発表がありましたが、これは本当に完全なデモです。自律型ロボット二台が実用的なことをしています。通常、ロボットの技術的な成果、つまり非常に素早く走るような敏捷なロボットや、特定のタスクに非常に優れたロボットは見慣れていますが、今回は少し一般的なタスクで協力して働く二台のロボットのデモを見ました。これこそがロボット工学に欠けていたもの、環境に適応する能力です。
彼らによると、このロボットをあなたの家に持ち込んでも、何でも言えば彼らは環境を認識します。子供がいて床にしゃがんでいるおもちゃの恐竜を拾って欲しいと言えば、そのシステムは以前に見たことがなくても理解できるのです。これが重要な点です。工場では特定の機械と連携するロボットを既に作っていますが、それらのロボットを家に持ってきてもこのようなことはできません。
システムを制御するGPUについて、S2部分は70億パラメータのモデルだと言われています。AIの世界では非常に小さなモデルです。しかし最近、小さなモデルをはるかに効率的にする方法を発見したため、これで十分なのです。小型モデルを過小評価すべきではありません。非常に優れ始めています。ロボット内部に計算チップがあるため、小型モデルを使用するのは理にかなっています。
システム1については、制御用に8000万パラメータのさらに小さなモデルを使用しています。瞬時に反応する必要があるため、神経系との比較は理にかなっています。このシステム全体が、物を拾ったり置いたり、引き出しを開けたり、物を渡したりするタスクのために上半身や全身をコントロールできるのです。
残念ながら、すべての企業がこのアプローチを取っているわけではなく、特定のタスクごとにロボットを訓練することは実質的に不可能であることに気づき、現在大きな困難に直面しています。
驚くべきことに、Figureはこのロボットが商品化の準備ができていると言っていますが、私は少し慎重になるべきでしょう。まだ初期段階にあり、技術的なテストを見せてくれましたが、具体的な使用例や、このロボットを実際に使った最初のユーザーからのフィードバックを待ちたいです。Figureの短いデモ映像ではすべてが滑らかに見えますが、おそらくこれは舞台裏での膨大なテストの結果でしょう。実際の状況での真の結果を見たいと思います。
完全な食事を作ったり、洗濯物をたたんだり、家中を掃除機で掃除したりするロボットが家庭に来るまでには、まだ数年かかるでしょう。しかし確かなのは、この企業がHelixをロボット工学の世界における真の変化と位置づけているということです。産業用ロボットから家庭用ロボットへの移行が始まっています。
BMWのような自動車メーカーは既に工場でFigureロボットを使用しており、他の企業、特に中国企業も工場でロボットを使用し、一部の人々を既に置き換えています。しかし今、私たちはついに家庭用ロボットに移行しつつあります。
また、MetaもAI駆動の人型ロボットを作るための新しい部門を構築中であることも非常に興味深いです。日本のスタートアップAptonicも最近、GoogleのDeepMindなどの支援を受けて3億5000万ドルの資金調達で注目を集めました。Meta、Google、そしておそらくMicrosoftやTesla、さらにはAppleも参入するという噂もあります。
Appleがロボット工学への参入を通じて復活するかどうかは興味深いところです。AppleはAIの波、VRの波を逃し、最近はあらゆる技術的転換点を逃しています。多くの投資家やウォールストリートの人々が企業に対して懸念を示し始めています。車両プロジェクトにも膨大な投資をしましたが、それも失敗しました。彼らは難しい立場にありますが、おそらくロボット工学の分野が彼らを再び注目の的にするかもしれません。
私がこれらすべてをお伝えするのは、ロボット工学のこの技術がテクノロジー大手すべてにとって真の軍拡競争に変わっていることを示すためです。そうなると、常に非常に興味深いものになります。
もちろん、安全性、信頼性、さらにはハッキングに関する疑問があります。「誰かが私の家庭用ロボットをハッキングして、奇妙なことを言わせたり、させたりすることができるの?」と思うかもしれません。はい、それは起こり得ます。技術が進むにつれて、これについて多くの議論が増えるでしょう。私も、そして誰もが、自宅のロボットがハッキングされることを望みません。
現在、Figureは中央AI(S1とS2の組み合わせ)に集中し、Helixがさらに多くの異なるシナリオで機能し、即席のタスクを実行できるようにしていると言っています。また、自然言語での音声コマンド、ChatGPTのような応答方法、AIに現実的な声を与えることなど、他の機能への大きな進展も見られます。ロボットをより親しみやすくするためには、まだ改善の余地があります。また、ロボット間のリアルタイム協力も彼らが深く掘り下げたい分野です。2台のロボットを協力させることに成功しましたが、まだ完璧ではありません。10台のロボットを一緒に協力させる場合はどうなるでしょうか。
いずれにせよ、会社によれば、Helixは人間のようなロボットで、言葉を理解し、問題に対して推論し、要求に応じて物体を掴みます。
誰もが自宅に人型ロボットを招き入れる準備ができているわけではありませんが、このような道具の大量生産が加速し、コストが下がるにつれて、公共および民間のより多くの場所、おそらくサービス部門や高齢者介護でこれらのロボットを見ることができるでしょう。最近、中国が高齢者介護のために人型ロボットにすべてを賭けるという記事を取り上げました。彼らは全員の世話をするのに十分な人手がなく、行き詰まりに直面しているため、このような状況のためにこのタイプのロボットを開発することにしました。
アクセシビリティが重要なポイントであることは理解していただけるでしょう。新しい技術とアクセシビリティについて話すと、止まらないこのような革新やブレークスルーが、AIのトレーニングを作成する動機となっています。AIの使い方だけでなく、それが実際に何であるかを教えています。家庭用ロボットとは異なり、AIをマスターするために何年も待つ必要はありません。日々成長している私たちのコミュニティがその生きた証拠です。サポートに感謝します。AIがただのエリートのためのものではなく、誰もが使えるものだということに気づいた時の人々の目の輝きを見るのが好きです。
この動画を見ているあなたは既に最初の一歩を踏み出しています。この機会を逃さないでください。AIが複雑になりすぎる前に今トレーニングを始めるべきです。年齢やレベルに関係なく、誰にでもアクセス可能です。すべてを教えますので、ぜひ動画の説明欄やピン留めされたコメントにあるリンクをクリックして参加してください。
また、コメント欄でこれらのロボット、特にHelixについてどう思うか教えてください。あなたの台所を探るために、これらの人型ロボットの一つを信頼しますか?あるいは逆に、技術がさらに頑強になるまで、おそらくより安価になるまで待つべきだと思いますか?面白い質問です。明日10ユーロで人型ロボットを提供されたら、家に置きますか?考えるべき価値のある質問です。
以上です。この動画をご覧いただきありがとうございます。まだであれば、お気に入りいただけたらぜひチャンネル登録をお願いします。Vision AIでは、このような技術的進歩についての動画を毎日公開していますので、登録すれば何も見逃すことはありません。説明欄やコメント欄にリンクがあることも忘れないでください。ここまで見ていただきありがとうございます。次の最新情報でまたお会いしましょう。
この分析に興味を持ち、現在の地政学的課題の理解をさらに深めたい場合は、新しいチャンネルVision Actuをチェックしてみてください。そこでは、この話題や私たちの現在と未来を形作る他のトピックについての詳細な分析を見つけることができます。両方のチャンネルを登録して、何も見逃さないようにしましょう。新しい分析でまたお会いしましょう。

コメント

タイトルとURLをコピーしました