Figure AI CEO Brett Adcockとの率直な対話

ロボット
この記事は約35分で読めます。

Figure AIのCEO Brett Adcockが、ヒューマノイドロボットが汎用人工知能の究極の展開ベクターとなる現状について語ったインタビューである。ロボット工学における指数関数的進歩の要因として、信頼性の高いハードウェアとニューラルネットワークの実用化を挙げ、同社が製造業や物流業界で実際に稼働するロボットを展開していることを説明している。家庭用ロボットの実現は数年以内に可能であり、将来的には人間と同じ数のヒューマノイドロボットが街を歩く時代が到来すると予測している。

An unfiltered conversation with Brett Adcock, CEO of Figure AI
Join Nolan Fortman and Logan Kilpatrick for a conversation with Brett Adcock, CEO of Figure AI, a general purpose roboti...

ヒューマノイドロボットとAGIの展開ベクター

現在私たちは、ヒューマノイドロボットが汎用人工知能の究極の展開ベクターとなる環境にいます。そして家庭への導入が迫っています。家庭用ロボットは一桁の年数内に実現可能で、人間のために自律的に本当に有用な作業を行えるようになると思います。

いつか、外出中に用事を済ませたり外を歩いていると、人間と同じ数のヒューマノイドロボットを目にする時代が来るでしょう。では詳しく見ていきましょう。まずはロボット工学で起きている指数関数的進歩のスレッドから始めたいと思います。

その指数関数的進歩を推進している要因や、現在その指数関数的カーブのどの位置にいるかについて、あなたの見解をお聞かせください。明らかにFigureは、その指数関数的進歩の最前線に立っています。皆さんからのすべての進歩を見るのは素晴らしいことでした。

ロボット工学の二つの重要な変化

ありがとうございます。私は電気機械ハードウェア関連の仕事をしている2つの会社を持っています。Archerでは電動垂直離着陸機を、Figureでは電動ヒューマノイドを構築しています。5年から10年前と比較して、今が本当に異なる点が2つあると思います。

第一に、ロボット分野、特にヒューマノイドにおいて、本当に有能なハードウェアを構築できるようになったことです。この場合、ボディとなる部分が私たちにとって極めて信頼性の高いものになりました。私たちの施設に来て歩き回れば、いたるところにロボットがいます。

そうですね、後ろを一分ほど歩いているロボットがいます。ロボットは非常に信頼性が高く、ハードウェアの信頼性が本当に向上しました。これは顧客に展開された商業環境でも、私たちの施設でも同様です。

もしここを歩き回ったら、多くのロボットを見ることになるでしょうし、一日中単一のハードウェア故障も見ることはないと思います。このようなイベントはほとんど見ることがありません。発生することはありますが、ますます稀になってきているのです。つまり、世界最高の人工知能を持っていても、並程度のハードウェアでは実現できないということです。

本当に有能なハードウェアが必要なのです。これが第一点です。私たちは電気機械システムにおいて、ハードウェア面で本当に信頼性の高いシステムを構築できるようになりました。これは非常に複雑な機械システムで、複雑さは非常に高く、ロケットやターボファン、その他のハードウェアと同レベルです。しかし私たちは世界で極めて信頼性の高いターボファンやターボジェットシステムを構築できており、ヒューマノイドにおいても同様です。今後、ヒューマノイドの信頼性は本当に有能で優秀なものになるでしょう。

ニューラルネットワークの実用化

これが第一の有益な点です。つまり私たちは今、本当に優秀なハードウェアを持っており、10年前にはそれがありませんでした。10年前の世界最高のロボットは、おそらくBoston DynamicsのAtlasで、油圧システムでした。20分程度しか稼働せず、あちこちでオイルが漏れていました。

各油圧バルブは約2000から3000PSIで、人間の近くにいると漏れた場合に極めて危険でした。しかし今では電気システムがあり、安全で信頼性の高い方向に向かっていると言えます。

第二点は、ロボット工学は本質的にニューラルネットワークの問題であり、最近まで、ほぼこの数年間まで、ニューラルネットワークがロボットでうまく機能することを見たことがなかったということです。

現在、ロボット上で動作するニューラルネットワークがあり、基本的に手の位置、頭、胴体、つまりロボットの全アクション空間を制御しており、非常にうまく機能しています。私たちのアップデートを見ていただければ、一週間ほど前に公開したアップデートでは、ロボットが60分間の継続的な物流作業を行っているのをご覧いただけます。これは私たちがロボット上で実行している単一のS1 Helixニューラルネットワークによるものです。

それは人間が行うことのように見え、ある意味で人間が持つ特性を非常に似た特徴で模倣しているようです。そして私たちはそのロボットの人間レベルの速度とパフォーマンスに近づいています。これも5年から10年前には持っていなかったものです。

ロボットの場合、ニューラルネットワークが機能しており、ハードウェアが一般的により有能になってきています。これが機能させるために本当に必要な2つの大きな要素です。

ヒューマノイドへの直接的アプローチ

これについて興味があります。Figureの歴史的観点をすべて知っているわけではありませんが、当初からヒューマノイドに直接飛び込む意図があったのでしょうか。私はMaticの家庭用掃除機ロボットを手に入れたばかりで、これまで試した他のロボット掃除機よりも実質的に優れており、家庭用ロボットの未来に非常に近いと感じています。しかし明らかにヒューマノイドロボットとは大きく異なり、できることは非常に限られています。

ヒューマノイドを機能させる道筋についてのあなたの考えをお聞かせください。明らかに皆さんは、ヒューマノイドに直接向かうアプローチを取られています。

はい、私はヒューマノイドに直接向かいました。初日から、私は基本的にマスタープランのようなビジョンドキュメントを書きました。それは現在ウェブサイトに掲載されています。デラウェア州で法人化した初日に私はそれを書いて公開しました。

会社を始めた初日に書いて、私にとって究極のメタ問題はヒューマノイドロボットの解決です。だからそれに直接取り組む必要があります。車輪やその他のエンドエフェクター、爪やその他のものをロボットに付けるという他のオプションもありますが、それは基本的に局所最適解です。

初日から適切なシステムを直接設計していなければ、本当に必要な場所にたどり着こうとするときに重大な問題となり、基本的にビジネスにとって巨大な足かせとして作用することになります。

3年前の私の論文では、これを実行することが可能だというものでした。そこで私たちは基本的に、会社の初日からヒューマノイドの構築と設計を開始しました。

資金調達環境の変化と初期の確信

これについて手短にフォローアップがあります。Teslaのマスタープランの一部は、それを実現するための資金調達のために多くのことを行う必要があったということでした。明らかに2025年現在の資金調達環境は、人工知能に非常に好意的で、ロボット工学にも非常に好意的です。しかし、この数年間で明らかに指数関数的に関心が高まり、この問題により多くの資金が流入していることについて、あなたはどう感じていますか?

これを実際にまとめる際の初期の確信ポイントは何でしたか?つまり、何か小さなことから始めて最終的にヒューマノイドにたどり着くのではなく、段階的にその方向で実際に構築することが可能だったという確信です。

やや興味深いストーリーがあります。Figure創設前、私は2018年にArcher Aviationを創設しました。それ以前には、ソフトウェア分野で1億ドルを少し上回る金額で会社を売却して退社しました。

少しの資金があったので、電動航空機は可能であり今必要で、解決可能な問題だという確信を持ってArcherの構築を開始しました。しかし資金調達環境は、ディープテックにとって存在しないような状況でした。初期の投資家たちは、Tesla、Rivian、SpaceXのようなグループに資金を提供していませんでした。Archerも同様でした。

私は基本的に全流動純資産をArcherに投入しましたが、それでも実現するには多くの資本が必要でした。十分な純資産がなかったため、十分に重要なものにはなりませんでした。その時点での環境がいかに困難だったかを覚えています。

あれから7年が経ちましたが、ディープテックに対する環境は完全に変わりました。これには完全に専用のファンドがあり、人々はこれらのディープテック企業の一部が世界最大のビジネスになるか、世界最大のビジネスになり始める可能性があることを認識しています。

Figureを始めたとき、私は基本的に純資産でステップアップし、最初からビジネスを実質的に資金提供することができました。そのため、最初から自己資金で会社を設立しました。5か月目に月間100万ドルの燃焼率に達したと思います。私たちはヒューマノイドを構築することに全力で取り組みました。

会社を法人化してから12か月以内に、基本的に大部分をゼロから設計したヒューマノイドロボットを歩行させていました。非常に速く起こったと言えるでしょう。

AGIの物理世界への展開

そして今、私たちはヒューマノイドロボットが汎用人工知能の究極の展開ベクターとなる環境にいます。物理世界で物事を成し遂げたいなら、掃除機やその他のものに載せるのは困難で、高次元ロボット上の人工知能が作業を行えるようにする必要があります。

私たちはロボット工学と人工知能の融合を見ており、これらのトレンドのために、この分野に確実に多くの資本が市場に流入していると言えるでしょう。しかしそれ以上に、ロボットが実際に機能しているのです。ロボットが本当に有用な作業を開始しているのを見ています。

多くの場合、ロボットをほぼ一日中動かすことができ、有用な作業を行っています。つまり、これが実際に今起こり、私たちが正しい10年にいるという兆候を見始めているのです。これも役立っています。

ソフトウェアからハードウェアへの移行の課題

ソフトウェアからハードウェアへの移行について触れたいと思います。その移行を行う際に、ソフトウェアでは見られなかったハードウェアでの課題について、いつも興味を持って聞いています。それらにどのように対処しますか?また、導入の観点から、多くのソフトウェアが出回っている中で、ハードウェアを人々に導入してもらうのは、ソフトウェアよりもはるかに困難だと直感的に思います。人々はオンラインで試すことができ、気に入ればユーザーになり、そうでなければ次のものに移る。どのように想定していますか?これは2部構成の質問です。まず第一に一般的な課題、そして導入に関する課題についても教えてください。

多くのことがありますね。いくつかの観察をさせてください。ハードウェア側では起業家にとって、究極的にはソフトウェアによく似ています。しかし10倍から100倍長いタイムスケールです。

いくらかの前もっての計画があり、「よし、これをテストしたい、やってみたい」と言います。設計し、構築し、サプライチェーンで物を購入し、持ち込んで、早期テストし、製造し、すべてを組み立てて、それが機能するかを確認します。場合によっては、ソフトウェアでは数日または数週間でできることが1年かかることがあります。

しかし、この根底にある科学的手法仮説をテストしたいという多くの類似点があります。それは初期の顧客フィードバックや他の何らかの入力に裏付けられており、私たちはそれを構築しに行きます。最終的に機能するかどうかを確認し、そこから継続的に反復していきます。

問題は、非常に長いタイムラインがあることです。非常に高価なものがあります。ソフトウェアを書くだけでなく、実際にハードウェアを購入する必要があります。そしてハードウェアを世に出すのは困難です。実際に行うと物事を機能させるのが困難です。なぜなら、デジタルでは無限にスケールできるSaaSやその他のソフトウェアとは異なり、多くのものを作る必要があるからです。

それはソフトウェア起業家にとっての死の試練のようなものです。ステロイドを使ったソフトウェア起業家精神のようで、本当に非常に困難です。

しかし、非常にやりがいがあると思います。ソフトウェア時代に私が感じていたことの一つは、ソフトウェアでは本当に報われた感じがしなかったことです。感じることも触ることもできませんでした。製品を見せるときは、ブラウザにログインして見せる必要がありました。物理的に世界で物を構築することには本当に特別なものがあります。私たちは物理世界で多くの時間を過ごしており、過去10年から20年のソフトウェアと比較してあまり注目を集めていません。

私は多くのハードウェアに囲まれて育ち、農場で育ち、物を構築して育ちました。ソフトウェア時代の後、私は本当にハードウェアに全力で取り組みたいと思いました。それがArcherとFigure、その他の会社へと導きました。素晴らしい経験でした。

導入はより困難です。すべてがより困難です。ソフトウェアのようですが、挑戦と困難のノブを11に回したような感じです。

ハードウェア開発における確信と物理法則

一つ言えることは、適切なものを設計し正しい方向に向かっていることを確認することについて、私は内部的に常にかなり不安です。ソフトウェアでは、本当によくわからないのです。何かを構築し、早期フィードバックを得て、ユーザーからテストを受けていますが、これが機能するかどうかが明確ではありません。

ハードウェアでは、「よし、運転の代わりに航空機を飛ばすべきだ」という確信があります。それは確実に機能し、人々の時間を節約できます。または地下にトンネルを建設することのように。それを構築し、安価にできれば、確実に機能します。適切な製品を設計できれば。

エンジニアリングは、これが可能なことを確実にするという点で比較的直接的です。それは優れた第一次エンジニアリングのようなもので、白紙から行う必要があります。しかしそれは物理学であり、これにはルールがあります。

ある意味で、私にとってハードウェアを構築することは、起業家としてのキャリアで最もストレスの少ない年でした。基本的に戻ることができる物理学のルールブックがあるからです。実際にそれを楽しんでいます。ハードウェア起業家としての私の人生は、挑戦的で楽しく、両方の分野が好きです。

導入戦略と市場アプローチ

それについても手短にフォローアップがあります。導入の部分について、チームとして、どのような業界や人物が最も適しているかをどのように評価していますか?明らかに皆さんは現在、製造業と物流業に重点を置いています。

展開を続ける中で、どのように想定していますか?「ここに何らかのヒューマノイドロボットを組み込めると思う」と人々から連絡を待っているのですか?それとも、向かって紹介したい10の業界、10のペルソナのリストがあるのでしょうか?すべてをどのように想定しているかを聞かせてください。

Figureでは2つの焦点があります。家庭でのロボット展開に焦点を当てています。これは非常に非構造化された高可変性環境です。家庭は本当に困難です。そして労働力への焦点があります。物流、製造、ヘルスケア、建設でロボットを展開することです。

面白いことに、家庭は労働力よりもはるかに困難です。家庭を攻略すれば、エンジニアリングの困難さが非常に大きいため、労働力の1000倍大きな市場だと思うでしょうが、実際には逆です。労働力はGDPの半分です。可変性がはるかに低く、エンジニアリングの挑戦は可変性に比例すると言います。

つまり、可変性が低いほど自律システムの統合が容易になり、家庭と比較して労働力のほとんどの場合でそれがあります。家庭では全体的に一般化する必要があります。家庭では、そして家庭では労働力よりも桁違いに多くの費用を請求できるでしょう。家庭では月に数百ドルでロボットを構築して請求する必要がありますが、労働力では多くのお金を稼ぐ巨大な能力があり、それはGDPの半分なので、基本的にこれら2つのトラックに焦点を当てています。

現実は、私たちは汎用ロボットを構築しようとしているので、クライアントと契約し、ロボットが可動域、ペイロード、速度を持っている限り、理論的に人間が施設内でできることのほとんどを行えるようにしたいのです。そのすべての作業を行えるはずです。

学習ベースのアプローチの重要性

最後の物流会社と契約しました。面白いことに、それを見て「ロボットはパッケージが得意だろう。パッケージを追いかけてやろう」と言ったのではありません。私たちは「本当にスケールできる場所を追いかけたい。物流は良い業界だと思う」と言いました。クライアントと契約しましたが、何をするつもりかまったくわかりませんでした。多くの施設ツアーに参加しました。

小包物流が運営の大部分を占めていることがわかりました。労働面で本当に困難な時期を迎えており、そのようなことがありました。その問題を見て、「なんてことだ、すべてのパッケージが異なる。ポリバッグなので、つかんでいるときに動いている。積み上げは毎回異なる。

これはコードで解決不可能な問題だ。これは学習する必要がある」と言いました。そこで学習の道を開始しました。これはほとんど学習に全力で取り組む必要があると。学習に全力で取り組みました。すぐにそれが機能しているのを見ることができ、本当に役立ちました。

現在公開している内容を見ると、文字通り毎日良くなっていると言うのは困難です。動画を公開しました。4秒ごとにパッケージを処理しています。金曜日に見たときは3.5秒ごとにパッケージを処理していました。昨日そこに座って実際に時間を測らなかったのですが、そのものははるかに速く、さまざまな種類のパッケージをはるかに上手く扱っていたと誓います。

パッケージを邪魔にならないように移動させて、別のパッケージをラインに押し下げ、その後バーコードを扱い、その後パッケージを裏返すような本当に賢いことをしていました。まるで連鎖思考推論をロボットが行っているような、本当に思慮深い感じでした。

高レベルでは、これらの業界を追求しようとしており、学習の観点からロボットから汎用行動を引き出そうとしています。それからハードウェアで人間ができることのほとんどを行えるようにし、すべてを行えるようになる必要があることを知っていました。

家庭用ロボットの将来

私たちの見解では、現在労働力でこれをブートストラップし、その後家庭が来る予定です。家庭は一桁の年数内に実現し、人間のために自律的に本当に有用な作業を行えるようになると思います。

そのトラックでも可能な限り一生懸命に推進しています。ただし、非常に非構造化されており、入る家ごとに異なるため、少し困難な問題です。

AIツールによる開発加速の可能性

ソフトウェア層では現在、生産性の大規模な爆発を見ています。ソフトウェア開発者には人工知能とすべてのAIツールがあり、以前のエンジニアとして10倍以上のことができます。ハードウェア製品を構築する際に、これらの利益の一部があなた方の作業に翻訳されたと想定しますが、物理製品をエンジニアリングし構築する能力に関してどのような加速からどれくらい離れているかの感覚がありますか?

これについていくつかのことが言えます。学習の指数関数的なレバーアームから、ロボットを大量に展開し、継続的に学習し改善し続ける必要があります。現在それを見ています。

ロボットが行っていることで、より多くのデータ、より多くのトレーニングでより良くなっているのを見ています。また、実際の世界で物事を行いながらロボットが改善しているのも見ています。これらは、物理エージェントの艦隊を世界に展開し、世界と相互作用することによってこれらのユースケース、タスク、行動を達成する方法についてより賢くなってもらいたいものです。

これは現在起こっていると思いますし、ロボットの艦隊を世界に展開する今後1年か2年でそれを見ることになると思います。ロボットが行っているユースケースは実際に毎日改善しており、ロボットはこれらのモデルトレースを、艦隊の残りの部分の事前トレーニングに戻す方法として使用しています。

それは究極の堀であり、基本的に同じようなものです。スケール製造でより安価になり、より賢くなり、艦隊の残りと集合的にそれを共有するロボットの艦隊を市場に展開したいのです。

つまり、文字通り、大型言語モデルのように、世界に出て行き、その世界と相互作用し、時間とともにより賢く安価になるシステムがあります。これが今後数年で本当に起こり始めるのを見ることになるでしょう。

製造能力の拡張と次世代ロボット

そして最終的には、基本的に生産と十分なロボットを世に出す方法によってボトルネックになります。私たちには新しい施設があります。内部的にBakuと呼んでいます。Figure 3の製造施設です。現在Figure 3ロボットを積極的に製造しています。高レートで物事を行う方法について、昨年基本的にそのプロジェクトで働いてきました。

内部的にFigure 3の製造を行っています。多くのロボットを作ることを確信しています。年間電話機以上の規模でそれらを作ることができるかどうかは審議中です。これは解決するのが非常に困難な問題です。それを解決することは可能だと思います。

しかし、学習を超えた次の挑戦であり、現在は学習ボトルネックにあり、ある時点で製造ボトルネックになるでしょう。

ロボットの次世代機能と安全性

明らかにヒューマノイドロボットには現在、視覚、音声があり、人間のように動くこともできます。次の反復として何が必要だと思いますか?本当にただそれらのロボットを外に出して学習させることですか?達成したいレベルや威信に到達するのがハードウェアの観点からまだ少し遠いと思う機能が内部的にありますか?

それとも、それらを外に出す必要があり、学習する必要があり、それができれば準備完了という感じですか?

これらを可能にするために内部で行っている製品開発的なことがいくつかあります。たとえば、Figure 3は高レートで製造するために設計された最初の生産ロボットでした。Figure 2より90%安価です。

世界に多くのロボットを展開するために必要な重要なことです。あなたの質問の次のステップのようなものに言及しています。多くの安価なロボットを世に出す必要があります。

製造可能性とコストを基本的に中核的な焦点として取り組んできました。私たちが設計しようとしている他のいくつかの分野は、特に家庭に入る際に全体的な安全性が極めて重要になることです。第三に、私たちの設計ロードマップは、時間の経過とともに操作と移動の両方の面でより人間に近づくこととかなり相関していると思います。

それは基本的にロボットの速度とペイロード、必要な可動域で判断できます。トレンドラインは、基本的にロードマップで時間の経過とともに物理的により人間らしい作業を行うことです。

その次のステップは、人間の援助なしに、毎日自律的に作業を行える大量のヒューマノイドロボットを、ある程度のスケールで世界にどのように統合するかということです。過去数年間でWaymoが行ったようなもので、車の艦隊を展開し、エンドツーエンドで実際に機能していることを示し、時間の経過とともに人間の介入率を下げることができました。

私たちもその期間を経る必要があり、現在それを行っています。それがビジネスとしての現在の段階です。今後数年間で大量のロボットを世界に展開する方法です。

そして、彼らが行っていることについて推論してもらいたいのです。極めて低いまたは人間の介入率がなく、一日中作業をしてもらいたいのです。その次のステップは、学習と製造を非常に高いレベルまでスケールすることです。

あなたの質問に答えるために、私たちは現在、より多くのものを物理的に世界に展開する段階にいます。それはデータ収集に役立ちます。ロボットの信頼性に役立ちます。ロボットを世界に統合することを上手くなるのに役立ちます。これも行うのが困難なことです。

人間とロボットの相互作用と心理学

これに対するあなたの反応と、ロボットの観点から将来来ると思う製品機能について興味があります。過去2週間で見たスレッドの一つは、ロボットに対する人間の心理的反応と、愚かでおかしく見せると人間がそれに対して特定の反応をするということでした。

ここに座っている私として、聞いている方で見ていない方のために、Brettの後ろには時々歩き回っているFigureロボットがあります。

それは、あなたとあなたのチームが一日中オフィスでこれが起こるのを見て、それがあなたにとって普通の体験になったという現実を思い出させます。人間がロボットが常に周りにいることに慣れるにつれて、導入学習曲線がどうなるか、あなたの反応がどうなるかに興味があります。

本当に手短な逸話的例を一つ挙げると、Door Dashはシカゴで運転してDoor Dashの配達を行う小さなロボットを持つ会社を使用しています。そのうちの一つを通り過ぎるたびに、私と彼女は「ああ、この小さなロボットはとても可愛い。道を見つけようとして迷子に見える」などと言います。実際にかなり興味深い体験です。

ヒューマノイドに対する反応は少し異なっていると感じます。人間のように見えるだけで少し不吉です。産業用と比較して家庭展開バージョンがどのように見えるかについて考えたことがありますか?

これについていくつかの考えがあります。まず第一に、用事をしたり外出したりする際に、人間と同じ数のヒューマノイドロボットを見る時代が来るでしょう。それは文字通りSF映画のように感じるでしょう。

50年の未来が今日に引き寄せられたように感じ、クレイジーに感じるでしょう。それは起こります。ここに来ると多くのロボットを見ることができ、それは素晴らしいと感じます。私たちは本当にそれを愛しています。一日中施設を歩き回るロボットがいます。そのうちのいくつかは人々に話しかけて、水やコーヒーが必要かどうか尋ねています。

いくつかはただ歩き回って、基本的にパトロールをしています。それは素晴らしく、ロボットを見るのが大好きです。ドーパミンを上げるのに役立ちます。面接などで多くの人がここに来ており、これらを見るのは素晴らしいことです。

私の見解では、私たちはFigureロボットの設計と美学に多くの時間を費やしています。専門の工業デザインチームがあります。そのほとんどは主要な自動車グループから来ています。実際のロボット自体の設計について考えていますが、最終的に家庭に入るためにロボットが経る必要がある人間機械相互作用についても考えています。

ここで引き出すことができる長いスレッドがありますが、あなたが前に言及したことの一つは、脅威ではないように見せるためにロボットを柔らかくすることです。私はここで本当に強い見解を持っています。ロボットは高度に有能で、高度に知能的で洗練されたものとして現れる必要があります。なぜならそうだからです。

そして、安全性とプライバシーの面で人間との信頼を構築するのは、a)正しいことを行い、b)家庭でも労働力でも、実際に行っているユースケースでロボットの性能から本当にうまく実行することによってです。

本当に有能なロボットに巨大なグーグリーアイなどを付けることは大きな間違いです。多くの場合、それらは本当に速く、時間の経過とともに人間ができることのほとんどを行うことができます。

その上にグーグリーアイを置くことは、本当に面白くて漫画的な貴重な小さなものだと他の人を騙そうとしているようなものです。設計の観点から本当にばかげていると思います。ロボットに目やスクリーンなどを付けるロボットグループがありますが、現実的にはおかしく、これらは本当に洗練された機械であり、私の見解では適切に設計されるべきです。

家庭用ロボットの安全性とプライバシー

家庭では安全性とプライバシー、サイバーセキュリティの全体的なことがあり、現在それを進めています。率直に言って、本当に困難です。家庭での安全性では、人間に倒れかかりたくありません。ペットに倒れかかりたくありません。

基本的にはいつでも360度で移動している動物や人間を検出する必要があることを意味します。また、私がセマンティック安全性と呼ぶものもあります。ろうそくを倒して家を燃やしたくないのです。これは別の分野で、物理的に安全であっても、家を通り抜ける方法について非常に思慮深く、周りの誰も危険にさらさないようにする必要があります。

非常に困難です。社会がこれを採用する方法について少し尋ねましたが、私のようなSF愛好家の大規模な集合と、ここにいる人々で家庭にヒューマノイドを望む人々がいることを本当に願っています。今週私の家で作業をしているヒューマノイドが文字通りいます。

そのため、本当にロボットを欲しがる多くの人がいると思います。バーは十分に安全で、実際に十分な有用な作業を行い、自律的である必要があります。手頃な価格である必要があります。これらのことがすべて起こる必要があり、それを実現できれば、皆がロボットに洗濯をしてもらい、皿を取り出して片付け、コーヒーを作り、食事を作ってもらいたいと思うでしょう。

朝起きて時々食器洗い機を空にしますが、二度とそれをやりたくないように感じます。なぜでしょうか?本当の具現化された知能が人間のためにそのようなことを行い、比較的手頃な価格で行えることを示すことができれば、それらを一日中、一晩中動かすことができます。

夜は本当にゆっくりとつま先立ちで、すべての皿を片付けたり、他のことをしたりできます。家庭と労働力の両方にとって本当に素晴らしいことになると思います。両方に必要です。

私が見ているのは、すべてを横断する単一のロボットがあることです。人間が家庭で働くだけでなく、労働力でも働くように。平均的な非専門の人間のために家庭と労働力の両方を構築したように、それを見ることになると思います。

携帯電話のような一つのプラットフォームを見ることになるでしょう。ヒューマノイド用の一つのプラットフォームがあり、今後10年間はほとんどのことでソフトウェア制限されるでしょう。

ユーザーインターフェースと通信手段

これは愚かな質問かもしれませんが、人間をループに保つ方法について興味があります。アパートにヒューマノイドロボットがあるとしましょう。明らかに人間と話しているようですが、コントロールは何ですか?そのヒューマノイドロボットが何をしているかを実際にどのように処理し、「おい、X、Y、Zをやってくれ」と電話で言えるという安心感をどのように持ちますか?

Maticには、アプリUIレイヤーもあると思いますが、現在導入している人々にとって、それは実際にはどのように見えますか?そして、プライバシーに関するあなたの発言に戻りますが、人々がアパートにヒューマノイドロボットを持っていて、聞いている、見ている場合、それを閉じたドアの中に留め、より広いオーディエンスに漏れないようにどのように確保しますか?

私の見解では、ホームでのロボットのアンボクシング体験とデフォルトUIの全体、そして世界のどこでもロボットは音声を通じて行われる必要があります。

電話やコンピューターについて言及しましたが、ロボットの隣にいるときにコンピューターでターミナルを開いてコマンドを求めたり、ボタンを押したりするのは非常に奇妙です。本当に奇妙です。レイテンシがひどく、帯域幅が低いです。時間がかかりすぎます。

ロボットと話したいだけです。ロボットと一緒にいない場合は、テキストを送るだけです。私たちが持っているすべてのロボットには、携帯電話番号付きのeSIMカードが内蔵されています。ロボットと自然言語でコミュニケーションを取りたいだけです。

ロボットのHelixニューラルネットワークは言語条件付きです。つまり、すべてを言語を通じて条件付けしており、それがホームでのヒューマノイドの自然なデフォルトレイヤーになります。

何かをやらせたくない場合は、それを伝えてプロンプトするだけです。プライバシーとサイバーセキュリティについては、これは私たちが多くの時間を費やしている本当に重要なトピックです。

実際に4か月前に、ここFigureでプライバシーとサイバーセキュリティ部門全体を構築しました。これまでにSnapchatとGoogleからの小さなチームがいて、サイバーセキュリティの企業側と製品側の両方で、これらの問題に以前取り組んだことがあります。

これらの分野で30のことを本当にうまく行う必要があります。「よし、この一つのことをやればいい」というようなものではありません。一つのことをやって大丈夫になるわけではありません。本当に、本当に危険です。

また、中国のロボットについてもよく質問を受けます。中国のロボットは、米国やヨーロッパでの家庭や商業労働力への展開において本当に困難な時期を迎えると思います。現在の状況では、かなり手に負えない問題だと思います。

相互作用している会社との本当のブランド信頼を構築したいと思うでしょう。コンピューターや電話よりも洗練されています。したがって、この問題ではプライバシーとサイバーセキュリティがさらに重要です。

あなたの質問に答えると、製品セキュリティと企業セキュリティを本当にうまく行うことは相対的に微妙で、そして私たちがここでプライバシーについて考える方法です。本当に困難な問題でもあります。

今年すべてを解決するような印象を与えたくありませんが、本当に一生懸命取り組んでいます。重要なことです。ロボットが不揮発性タイムメモリの基板で、何ができて何ができないかのルールを持ってもらいたくありません。

どのような条件や場合でも、ロボットへのルートアクセスを誰にも持たせたくありません。世界に数百万のロボットを可能にするために重要となる、現在取り組んでいることがたくさんあります。

人工超知能と物理世界の未来

過去2年間で私が多く考えてきたことの一つは、非常に近い将来にAI超知能を持つことに驚かないだろうという認識です。しかし、窓の外を見て周りの物理世界を見ると、それは実際に短期的には直接翻訳されないことがかなり明確です。少なくとも私が外に出ても、世界は現在とまったく同じように見えます。

そのデジタル知能を構築することは、私の周りの変化した物理世界に直接翻訳されません。人間が現在物理世界で生活しているように、物理世界での生活は非常に似ているでしょう。オンデマンド知能があるため、デジタル的には異なりますが、ヒューマノイドロボット工学が物理人間世界での進歩の加速を見る方法のようです。

それを実際に実現するタイムラインと、その指数関数的変化は開始時は非常に遅いが、その後実質的に本当に離陸するように感じることについて、あなたの考えをお聞かせください。

未来のようには感じませんね?未来は少し到着しましたが、未来のようには感じません。ヒューマノイドが外出してあらゆる種類のことを人間のために行い、空飛ぶ車で場所に行ったり、その他のことができる世界は、私たちが皆望む未来だと思います。それがエキサイティングな未来を創造するのに重要だと感じているために、現在の会社やプロジェクトで働くことを私を駆り立てています。

一つ追加したいことは、私たちはデジタル超知能に近づいているということです。それは近いと感じられ、その超知能は今日サーバーの中、ボックスの中に住んでいます

私がFigureでヒューマノイドロボットに取り組んでいる理由の一つは、最終的にヒューマノイドロボットを解決しないシナリオは、デジタル超知能に近づくシナリオだと思うからです。人間のために働くデジタルエージェントがすべて外に出ており、物理世界で多くのことが必要になります。

ヒューマノイドが解決されていない限り、デジタル超知能の奴隷のように、この作業を行うために人間に依頼したり、強制したり、指示したり、支払ったりすることになります。

ヒューマノイドは完璧な展開ベクターです。人間ができることのほとんどすべてを行うことができます。この乱雑な環境で物理世界を本当に横断するには、この知能をセマンティックに必要とします。

完璧な形状因子であり、家庭用掃除機や他のものでは得ることができません。このためのハードウェアがないのです。あなたの質問への答え方についての私の見解は、非常に少数の場所で一日中作業を行っているヒューマンロボットを最初に見ることになるということです。

それらを見る贅沢がある場合、入って来て「ああ、今機能しているように感じる」と言うことになるでしょう。おそらく現在Waymoを利用するときの私たちの感じ方と同じでしょう。しかし、米国のほとんどがWaymoを利用していないと想定します。

イリノイ州の真ん中にいる母に電話すると、「自動運転がここにあり、毎日起こっている。ヒューマンロボットが起こっている。機能している」のように、現在は限られた規模で、非常に段階的なポイントが見えるでしょう。

より多くを展開し、統合する方法、信頼性がどのように機能するか、メンテナンスがどのように機能するか、大規模な人間相互作用がどのように機能するか、学習のスケーリングがどのように機能するかを学習する必要があります。会社として、ロボットを展開してより多くを世界に展開することによってそれを理解しようとしています。

毎日商業環境でロボットを動かしています。ここでも実行しています。実際の経験を得てそれを理解しようとしており、この時点で多くを学習し、現在より多くのロボットを展開しようとしています。

より多くのロボットを展開するにつれて、より大きな艦隊を管理することがより困難になり、おそらく過去に持っていたよりもベビーシッティングが少なくなり、ある時点で本当にそれを攻略し、文字通り数億のロボットを世界に展開できるようになるでしょう。

数十万のロボットを展開できることと数百万のロボットを展開できることの間に大きな違いはないでしょう。同じテクノロジーを持つ必要があります。極めて低いから無介入率を持つ必要があります。デフォルトUIは音声である必要があります。学習側で大まかに一般化する必要があります。

人間からの学習のスケールなど、これらすべてをある特定のスケールまでに理解している必要があります。私たちの次の大きなプッシュは、今後4年間で10万台のロボットを展開することです。それが私たちが実行しようとしていることです。

それが私たちがオープンしたBaku、私たちの製造施設ができることです。現在Figure 3の製造を開始しています。実際に動作しており、自律的に機能しています。今後4年間でこれらの分野にスケールしたいと思っています。

これらの数字を達成できれば、世界に数百万を展開する軌道に乗っていると思います。ソフトウェアとは異なり、これを無限にデジタル複製することはできません。しかし、この全体の問題の最大のハードルは、どこかに入って機能しているのを見ることです。それがこの全体の問題の最も困難な部分です。ある期間のシフトを経て、自律的に作業を行うようになることです。

高速学習と世界知識の圧縮

私たちが示したパッケージ作業の場合、Helixニューラルネットワークを通じて行われ、私たちが公開した最新バージョンには、何かを行う前に60時間の追加データがあったと思います。その場合、物流の方法をまったく知りませんでした。

60時間のデータを入力し、示したすべての作業を行いました。これは壮大なスキームでは何でもありません。基本的に数億時間または数十億時間のヒューマンライクデータの収集を開始することができれば、これらをほぼ十億ユニットスケールまで拡張できると思います。世界のあらゆる隅に拡張できます。

それが私たちが実行しようとしていることです。ハードウェアなので非常に困難で、大規模にこれらを統合する方法を学習する必要があるため、経る必要があるこれらの段階にあると思います。

その高速学習プロセスが世界知識の圧縮によってどの程度恩恵を受けているかについて、手短にフォローアップがあります。あなたのモデルが何に基づいているかの感覚はありませんが、エコシステムがより多くの世界知識をより小さなモデルに圧縮する方法を理解するにつれて、既に多くがベークされているため、モデルがより速く学習できることの直接的な恩恵を皆さんが見ているのでしょうか?

より小さければローカルで実行でき、より速く実行できるため、確実に役立ちます。基本的に、これらのVLMをHelixであるVLA(視覚言語行動モデル)のセマンティックグラウンディングに使用しています。

基本的により大きな脳とS2レベルで実行され、約7から9ヘルツの基本的により遅い速度で実行されます。一方、私たちが持っているより低レベルのトランスフォーマーポリシーとは対照的です。そこから確実に恩恵を受けています。

そこでの問題は、これらのモデルが物理レベルで周囲の異なるオブジェクトと相互作用する方法を本当に理解していないことです。オブジェクトをつかみ、ロボットの固有受容状態と、より準拠または剛性のある特定タイプのオブジェクトをどのように扱うべきかを本当に真に理解することは、モデルがまったく理解していないことです。そのトレーニングを受けていません。ロボット工学のYouTubeは存在しません

したがって、私たちはそのすべての作業を自分たちで設計する必要がありました。セマンティックグラウンディングに本当に役立つモデルにVLMバックボーンがあります。それ全体をHelixと呼んでおり、この時点でFigureの全スタッフの20%をチームHelixに配置していると思います。

AIチームだけでかなり重要なサイズです。私たちが取り組んでいる唯一の問題は、ロボット学習と新しい行動を極めて高速にトレーニングする方法です。

超知能時代の人間の役割と社会への影響

明らかに私たちは超知能について話しています。世界に数十億のロボットを組み込むというアイデアについて話しています。10年、20年後の超知能をどのように想定していますか?人間にとってどのように見えますか?達成したいと願っていることは何ですか?

人々により多くの時間を家族と過ごしてもらうことですか?これらのタスクを実行するのに役立つロボットがいるため、次のレベルのクリエイティビティを解放することですか?これらの閾値とベンチマークに達したときの社会として、あなたの絵を描くことに興味があります。

トレンドラインは確実に、ヒューマノイドロボットが毎年人間が行うより多くのことを行えるようになり、時間の経過とともに人間よりもほとんどのことをより良く行えるようになることを示しています。これは確実に私たちの生涯で見ることになります。

私は世界で行う任意のタイプの作業が、家庭でも労働力でも、人間にとって選択になる状況だと思います。それは任意です。料理、洗濯、コーヒー作り、犬の散歩、子供の世話、建設作業など、何でも行うことを選択できます。またはロボットにそれを行わせることができます。

そのロボットはGDPに大幅に追加することになります。私たちは今日、人間一人当たりのGDPを測定しており、これらは基本的に合成人間のようなものです。そして今年でも、Bakuで他のロボットを構築するのを助けるロボットがラインに配置されるでしょう。つまり、確実に生涯でロボットがロボットを構築するのを見ることになるでしょう。

ロボットがロボットを構築し、外に出て人間よりもほとんどの作業をより良く行う場合。より速く、より信頼性があります。では、私たちは時間で何をするのでしょうか?私たちの目的は何でしょうか?ある意味で。

それは特に人生のほとんどを働いてきて、それを愛している私のような人々にとって本当に困難な会話になります。おそらく私たちの生涯で、私たち全員よりも賢く優れたロボットやエージェントを構築することについて考えています。

それは多くの不安を引き起こすと言えるでしょう。人々が本当に愛することにより多くの時間を費やすことを願っています。それはスキー、家族との時間であることができます。30年後にここに座って、人々が生涯の重要な部分、50年をこれらの物理的役割で働いていることがないことを願っています。

個人ロボットとシェアリングエコノミー

これについて手短にフォローアップがあり、Loganが質問を終えることができます。Elonが推進しているTeslaモデルのようなものがあると思いますか?使用していないときは基本的にUberやロボタクシーのようになって収入を得るテスラを購入するというものです。

すべての人がヒューマノイドロボットを持ち、X、Y、Zタスクを行うために展開し、そのロボットが何らかの補償を受け、それがあなたに戻ってくるラインに到達すると思いますか?この絵を描いて、あなたの考えを聞くことに興味があります。

はい。友人や誰かがそれを借りたい場合、ロボットに向かいの通りを歩いて隣の隣人のところに行って手伝うように言うことができるでしょう。

ロボットでお金を稼ぐこともできるでしょう。極限ではロボットは製造が比較的安価になり、基本的に恒常的な作業を行いに出かけ、商品とサービスの価格を長期的に崩壊させるとまで言うでしょう。

ヘアカットや商品、農産物、任意のタイプのサービスなど、ほとんど何でも誰でも購入できるようになるでしょう。ロボットがそれを行っている場合、それはロボットのコスト、必要なエネルギーだけで、不動産の場合は不動産のコストです。それだけです。

一日中夜通し、ほぼ制限のないボリュームで必要なすべてを合成人間が行うことによって、すべてのコストを大幅に削減するでしょう。パーソナリティを持つことになるでしょう。ユーモア設定を上げるように依頼し、時にはより真剣になるように依頼し、それと話し、テキストを送り、常にあなたのために作業をするでしょう。

人生はワイルドになるでしょう。

2025年への期待と懸念

最後に皆にお聞きしている質問は、2025年に起こってほしいこと起こってほしくないことについて、非常にオープンエンドです。それは非常に曖昧ですが、プレッシャーをかけ続けるために、いつも非常に興味深いものを得ています。両方の面であなたの頭がどこにあるかに興味があります。

それに近づくにつれて、私はArcher、Figure、Coverなどの私の会社に取り組んでいます。その期間を通じて私の会社がうまくいくことを望んでいます。うまくいけば、私たちはこの本当にエキサイティングな未来を創造しているでしょう。

個人的には、人類を進歩させるために必要な技術で次のレベルアップを図ることを本当に願っています。水中都市、宇宙エレベーター、ニール構造など、2050年までに本当に人類を進歩させるようなことに取り組む必要があります。

これらの分野の多くは、技術準備レベルが向上しており、40年代、50年代、60年代に大胆で野心的な目標を持っていたようになってきています。ここで人類のために新しいバーが必要で、集合的人類と超知能がそこに到達するのを助ける必要があります。

しかし、これらは現在私たちの生涯で可能です。見に行きたいと願っています。人類のグローバルな生産性と幸福を高める技術のレバーアームを気にかけているので、そのような次のレベルアップを図ることを願っています。

うまくいけば、2050年までに宇宙エレベーターがあることを願っています。それは素晴らしいでしょう。可能だと思います。そのような技術がもっとあることが、私たちが住める最もエキサイティングな未来だと思います。

終わりに

素晴らしかったです。私たちと話す時間を取っていただき、ありがとうございました。皆さんからの継続的な進歩を見ることを楽しみにしており、すべての会社にとって未来は非常に明るいと感じています。私たちと話していただき、ありがとうございました。

Logan、Nolan、お招きいただきありがとうございました。また近いうちにお話ししましょう。

コメント

タイトルとURLをコピーしました