Tesla の数十億台のヒューマノイドロボット製造という驚異的な計画 – James Douma と共に

イーロンマスク・テスラ・xAI
この記事は約38分で読めます。

この動画は、Tesla の Optimus ヒューマノイドロボット開発について、AI 専門家の James Douma が詳細に分析した内容である。Tesla の自動運転技術開発で見せた戦略的判断と同様に、Optimus でもハードウェア製造に焦点を当てた正しいアプローチを取っていると評価している。特に、ソフトウェアよりもハードウェアが現在のボトルネックであり、Tesla の製造能力と規模拡大への注力が競合他社に対する優位性を生み出すと論じている。ロボットの手の設計の複雑さ、大量生産への道筋、市場投入のタイミングなど、技術的・戦略的観点から包括的に議論されている。

Tesla's INSANE Plan to Make Billions of Humanoid Robots - with James Douma
If you're interested in Tesla Robotaxi, Tesla AI or Tesla FSD, then you ought to know about James Douma.He's probably th...

Tesla のロボタクシーとヒューマノイドロボット開発の比較

トラックに挟まれそうになって、あ、あそこにもう一台ありますね。ここでロボタクシーを待っているんですが、ここは難しい状況ですね。でも実際、みんな苦労していますし、人間も苦労していますよね。

James さん、Optimus について聞きたいことがあります。過去 4、5年間話してきたことの一つに自動運転がありますよね。Tesla が正しい判断、正しい決定をして、正しい道筋を歩んでいるということを話してきました。

ロボタクシーに乗ってみると、「なんてこった、もうここにあるじゃないか」という感じで、展開されているように見えます。Optimus についてはどう思われますか。Tesla が正しい判断をして、正しい焦点を当て、正しい戦略的決定をしているように見えます。手への重点、正しい AI ソフトウェアの決定など、体系的に正しい方向に押し進めているように見えます。

Optimus の開発についてどう見ていますか。初期の Tesla での自動運転と同じくらい興奮していますか。

これが私たちですね。今日最後の乗車になります。

ソフトウェアとハードウェアの根本的な違い

Optimus と FSD は、戦略的観点から見ると表面的な類似点しかないと感じています。共通の技術基盤があるように見える理由は分かりますが。

Tesla が現在この分野で圧倒的な優位性を持つに至った出発点での決定が二つあると思います。一つ目はニューラルネットワークとカメラに賭けたことです。当時これは明らかに賭けでした。私はそれが正しい賭けだと思いましたし、他の人もそう思いましたが、業界のほとんどの人は間違った賭けだと考えていました。センサーを大量に使い、HD マッピングなどを行うのが勝利の戦略だと考えられていました。

もう一つの驚くべきことは、会社がすべてのハードウェアを車に搭載することに投資したことです。はるか前からフリートを構築し、フリートを構築することでデータを収集できるようになりました。ニューラルネットワークへの初期のコミットメント時点では、データがそれほど重要になるとは明確ではありませんでした。推測はできましたが、多くの証拠はありませんでした。

しかし、彼らには膨大な資本投資をしてフリートを構築するレベルの確信がありました。技術への正しい賭けとフリートの早期構築の組み合わせが、現在の立場に彼らを置いているのです。

ロボットは全く違う状況にあると感じています。Tesla がロボタクシーとなる技術の構築を始めた時、それが成功するかは明確ではありませんでした。ほとんどの人は成功しないと思っていました。

ヒューマノイドロボットについては、初期段階にあり、25 社がヒューマノイドロボットを作っています。ビジネス戦略の観点から環境は完全に異なります。

ハードウェアが鍵となる理由

ヒューマノイドロボットで最も興味深く、Tesla の優位性だと思うことは、FSD とは異なり、実際には FSD の正反対で、ハードウェアが最も重要だということです。

FSD では、基本的に車の上に構築していました。車は非常に成熟した産業です。多くの人が車を作ることができ、必要なセンサー群やコンピューターも成熟しています。新しいチップを設計する必要があるかもしれませんが、チップは設計できます。新しいカメラが必要かもしれませんが、非常に洗練されたカメラ技術が低コストで利用可能です。すべての必須ハードウェア要素は既に利用可能で、サプライチェーンがあり、大量生産で低コストで製造できました。

しかしソフトウェアは全く準備ができていませんでした。ソフトウェアに多くの作業が必要で、多くの人がソフトウェアは全く機能しないと考えていました。ソフトウェアが最後のパズルピースとなって市場を機能させるものでした。

ロボットは正反対になると思います。2021 年頃、Tesla が他に何をすべきかと聞かれた時に私がロボティクスと答えた理由は、ソフトウェアが実現されつつあるのを見たからです。しかし、誰もハードウェアをやっていませんでした。ソフトウェアが来て、ハードウェアの準備ができる前に利用可能になると感じました。

ハードウェアの準備ができるというのは、大量生産可能な 1 万ドルのロボットで、機能性において人間と同等のものを指しています。手は非常に困難です。多くの困難なソフトウェア問題がありますが、人間の体ができることを行える、耐久性があり効率的で、実際に器用さとセンサーフィードバック、バッテリー寿命などを持つ大量生産可能なロボット本体を持つ前に、それらを非常に有用にするソフトウェアを持つことになるでしょう。

規模拡大の重要性

FSD では、既にインフラがあり、サプライチェーンがあり、コア技術が十分に開発されていたため、ソフトウェアが鍵でした。ロボティクスでは逆だと感じています。ロボティクス技術ソフトウェアが利用可能だというわけではありませんが、ハードウェアの開発ランプとソフトウェアの開発ランプを見ると、ソフトウェアがハードウェアよりもはるかに早く到達することは明らかです。

その分野で実際に成功する鍵は、シャツを畳むことができる最初のロボットを作ることではありません。鍵は規模に到達できることです。なぜなら規模こそがハードウェアコストを下げるからです。製造規模、センサーの調達、アクチュエーターの調達、設計のバリエーションとオプションの整理、そして規模への到達です。

そこには多くのヒューマノイドロボットスタートアップがあり、ソフトウェアが正しいので面白いトリックができるロボットを作り出しています。詳しく調べたわけではありませんが、おそらくそれらは、そのトリックを 1 年間毎日やらせようとすると、そこに到達する前にロボット本体が故障するような種類のトリックだと推測しています。トリックの信頼性も現在おそらくそれほど高くありません。

ハードウェアにはかなりの道のりがあり、現在ヒューマノイドロボット分野で支配的なプレイヤーになる鍵は、即座に投資を行い、信頼性が高く高機能で低コストでロボットを大量生産できる地点に到達することです。

続けましょう。ヒューマノイドロボットではハードウェアがより困難な問題だと考えているということですね。ソフトウェアは到達するだろうし、Tesla はハードウェア能力を持っているので有利な立場にある、ハードウェアに焦点を当てているということですね。

製造とコストの課題

本体、つまり非常に低コストで高性能な質の高い本体を作る能力が、すべてを機能させる最後の要素になります。現在、比較的高性能で、あまり信頼性が高くなく、安価でもない本体を作ることはできます。これらの様々な組み合わせを見ることができますが、市場で成功するためにはこれら三つすべてを持つ必要があります。

三つすべてを持つためには、ハードウェア設計を開発し、改良し、多くのものを構築し、実世界に置いて何が機能して何が機能しないかを見て、センサーを改良し、フィードバックを改良し、そして規模でそれを行える製造ラインを構築してコストを下げるという困難な作業を行う必要があります。

年間 1 万台のロボットではこの価格帯にヒットすることはできません。年間 100 万台、10 万台の規模が必要です。これは私がこの分野のすべての異なるプレイヤーを詳しく調べていない領域です。他のプレイヤーが規模に行くためのインフラを構築する時間はあります。

Tesla は、本当に製造可能で高性能な本当に良い設計を得ることの問題に最も明確に焦点を当てているように見えます。それをまとめたら規模に行けるようになります。Elon は彼らのテストフリートが 5,000 台のロボットだと話しています。私にとって、テストフリートは 5,000 台、1 万台、2 万台のロボットです。それは、行う設計決定を具体化するために必要な最小限の数です。それらは別のリビジョンを行うので捨てることになるロボットで、それらでもテストを行う必要があります。

開発タイムラインと世代交代

Elon は今年末までに数千台と言っていましたね。今年は 1 軍団で 5,000 台でしょう。仮に来年がより多いとしましょう。来年後半までに 5,000 台のロボットがあるとして、工場内部に配備し、もしかすると他の会社や他の工場にも配備するでしょうか。

設計を知っているからロボットを構築するという問題ではありません。多くのロボットを構築し、世界で使用し、行った設計選択の何が良くて何が良くないかを学び、そして次世代のロボットを構築して再びそれを行う必要があります。

現在 Gen 3 の Optimus だと思うので、進歩はしていますが、最終目標に対してかなり低いレベルから始めたので、数百万台のことを行う前に Gen 6 の Optimus になると感じています。しかし、6 か月か 1 年ごとに世代交代をしているので、数年先のことですが、設計を確定するまで数年かかります。

ヒューマノイドロボットがどうなり得るかからは非常に遠いところにいます。ヒューマノイドロボットについて考える時、ポケットの iPhone 16 を考え、iPhone 1 や iPhone 2、3G、4 などとの比較、その間のすべてのステップの大幅な改善を考えます。

Optimus 3 はおそらく iPhone 1 でしょう。いつか Optimus 12 があり、Optimus 10 よりも大幅に良くなるでしょう。私はこれを一つの弧として見ています。今ロボットがあって大量生産して 10 億台作るという時点ではありません。10 億台目のロボットは 100 万台目のロボットとは大きく異なるでしょう。

今年 Optimus Gen 3、来年後半までに 5,000 台生産、2026 年末に Gen 4、2027 年に Gen 5、Gen 6 は 2028 年か 2029 年として、Tesla はその頃までに 100 万台のロボットに到達できると思いますか。

多くのことが指数関数的傾向になる傾向があるので、指数関数的傾向を見ることになっても驚きません。1,000 台のロボットを配備したら、次の 3 か月、6 か月、12 か月を見て、指数を把握し始め、それを 100 万台のロボットまで合理的に外挿できるかもしれません。

2030 年までに 100 万台のロボットを行えない良い理由は見当たりません。2030 年までに 100 万台のロボットを行うことは、100 万台作る価値のある設計を持つことのようなものです。

市場での優位性と競争

他のどの会社よりも早く年間 100 万台のロボットに到達することの利点は何ですか。

先行者利益があり、場所によってはネットワーク効果があります。ロボットは携帯電話のようなものかもしれません。iPhone が非常に多くの電話を作るので Android 電話の市場がないということではありません。電話ネットワークのような従来のネットワーク効果ほどの効果ではないと感じています。タクシーネットワークに匹敵するかもしれませんが、少し少ないでしょう。

起動する可能性のある一つのことは、多くのロボットを配備してデータを収集し、より多くのデータを収集することでより良いロボットを作れるとすれば、規模への到達が先になることで、さらに大きな規模への到達で大きな利点を得られる正のフィードバックループがあり得ます。まだその証拠は見ていませんが、彼らが end-to-end ネットワークを行っているとのことで、Tesla のソフトウェア観点から制御の多くがニューラルネットワーク中心なので、それがネットワーク効果になるかもしれません。明確ではありませんが。

しかし、前述のように、ソフトウェアが現在重要なものとは見ていません。高性能なソフトウェアスタックを持っていても、競合の 3 倍のコストで半分の寿命のロボットでは、実世界では大きな不利です。

ロボットの所有コストではなく、ロボット時間あたりのコスト、完全に投資された年間あたりのロボットコストと、そこから得られる能力のセットを考える必要があります。その意味で、より多くの機能性とより長い寿命を持つことが、それらを掛け合わせることでロボットの真の価値を得ることになります。

XAI と言語モデルの統合

Tesla は Optimus のロボットの会話と LLM 機能で XAI に依存すると思いますか。

現在そのように見えます。Elon は既に Grok をそれに入れると言いました。OpenAI のような緊張関係はありますか。OpenAI がロボティクスに参入して「我々の方が良いロボットスタックを作れる」と言うかもしれません。

再び、スタックがロボット側の重要な制限要因だとは思いません。ハードウェアが重要な制限要因だと思います。間違っている可能性もありますが、現在のところそのように見ています。

最終的なロボットスタックがまとまる方法はいくつかあります。現在のロボットスタックと言語モデルには大きな共通点はありません。相乗効果はありますが、言語スタックは言語インターフェースを提供していて、ロボットアプリケーションに特有というわけではありません。それは変わるかもしれませんし、統合されるかもしれません。

ロボットにはロボット特有のスタック開発の構成要素が大量にあります。OpenAI は以前ロボティクスに取り組んでいましたが、Altman が提案したのとは非常に異なる方法でした。それを基に構築できるかもしれませんし、できないかもしれません。

Tesla はロボティクススタック部分に取り組んできました。指示や計画などのための共有概念空間を提供する言語モジュールが必要なら、XAI から得て、そのようなことに Grok を使うのも悪くありません。特に XAI がロボティクスアプリケーションに特化したモデルを調整したりカスタム訓練したりしてくれるなら、それは非常に有用かもしれません。

基本レベルでの大規模言語ネットワークの訓練はそれほど困難ではありません。現在多くの組織がそれを行っています。最前線にいるなら困難ですし、本当に大きなモデルを訓練するなら困難です。多くのアプリケーションは大きなモデルを必要としません。

例えば、Tesla が Grok の高度版を Optimus で使用するロボティクスモデルと統合されたモデルに蒸留する権利を得るということが機能するかもしれません。それはすべて理にかなっています。

未来の問題解決能力

5 年から 7 年後を考えてみましょう。Optimus が優秀な配管工だが、異なる配管の割り当てを見て、何が割り当てなのか、何が壊れているのかを把握して修理する必要があるとします。その時点で、最高のフロンティア、LLM とは呼ばれないかもしれませんが、最高の思考モデルが配管問題の問題解決や特定などの手助けに使えるのではないでしょうか。

その船は既に出航しており、5 年後はシンギュラリティの向こう側なので、5 年先の予測はできません。

でも、Optimus は物理的な AI の脳だけでなく、思考する脳も必要ではないでしょうか。

少し前に Grok を使って配管問題を解決しました。何かの写真を撮って、修理方法を聞いたら、それを理解し、パイプのネジ山が何か、どんな部品を買う必要があるかを教えてくれました。話している配管問題のような問題は基本的に解決されています。

上手くパッケージ化されていないかもしれませんが、話している能力のセット、基本的に家庭のもので配管工や電気工などに来てもらいたいようなものを診断・デバッグできる能力は既に存在します。その能力は既に存在し、オープンソース対応で、Optimus ハードウェアで簡単に実行できる広く利用可能なモデルにあります。

とはいえ、Optimus はインターネット接続を持つでしょうから、クラウドの兄貴分に何かをアップロードしてアドバイスを得る必要があるなら、それはロボットの配備に挑戦にはならないでしょう。

コンピューターは問題ではなく、バッテリーも問題ではなく、構造も問題ではありません。構造要素を理解し、アクチュエーターを改良し、全体的なボディ設計を改良する必要がありますが、コンピューター、バッテリーなどは解決されています。複雑なソフトウェア部分と考えるもののほとんど、高レベルの推論などは実際にそれなりにうまくいっています。

AI が現在本当に良い高レベル推論を行うとは論じませんが、「ここにパイプのセットがあって、ここに問題がある。問題を解決するためにこれらのパイプをどう再構成するか」というレベルの推論では、それは異なる種類のソースから収集できる知識を統合し、事前にモデルに訓練でき、いくつかの代替パスを探索する適度な推論を行うことの組み合わせです。配管問題には 2 の 4 乗の可能な解決策や検索する必要のあるツリーはありません。配管問題には 10 の問題があり、それをブルートフォースでき、言語モデルは現在そのようなことができます。

Tesla の独自の優位性

Tesla は何らかの独自の優位性を持っていて、ヒューマノイドロボットで特別な利点を与えると思いますか。例えば、アクチュエーター設計が他のどこよりもそれほど良くなるのでしょうか。それとも、実世界 AI とニューラルネット、FSD コンピューター、機械的アクチュエーター設計などの経験の組み合わせなど、様々なものの組み合わせでしょうか。全体的に広がった専門知識がユニークなのか、それとも特に重要で決定的な 1、2 のことがあるのでしょうか。

両方です。この分野の他のプレイヤーと比べて非常に優れているいくつかのカテゴリがあり、実際に重要です。しかし、全体のスタックも持ってきます。両方が彼らの強みです。

高度な製造の専門性と迅速な規模拡大、非常に解決策重視で迅速に到達する文化、ファーストプリンシプルのことが、現在彼らがいる開発レベルで本当に役立つと思います。その上で、訓練用の大きなクラスター、多くの内部 AI 能力を持っています。これらはすべて重要なことです。

前に言ったように、AI が構造的な差別化要因になるとは思いません。重要ではないということではなく、重要ですが、ロボットの超優秀な製造業者になることと、絶対最先端のロボティクスソフトウェアスタックプロバイダーになることのどちらがより重要かという重みを考えると、現時点ではロボット側の方が大きな利点だと思います。ソフトウェア側よりも機械的ロボット側の方が大きな利点です。

両方とも進歩する必要があり、両方とも進歩するでしょうが、現在ロボットを構築している会社のうち、どれだけが10 億台のロボットの構築にレーザー集中しているでしょうか。10 億台のロボットに到達する弧を見ているでしょうか。

彼らは 10 万台を売るまでロボットを市場に投入することを気にしません。最初の 1,000 台、1 万台などは内部でテスト用に使います。そのようなファーストツール的な集中です。VC 資金をより多く得るためにトリックをやろう、早期顧客にロボットが使う価値があると納得させて、10 万台のロボットに到達するための踏み台にしようというものではありません。私は 100 台のロボットにいます。

Tesla については、最初の 1,000 台、1 万台は気にしていないと感じています。内部で使い、いくつかの産業会社に取ってもらって開発と審査の手助けをしてもらいますが、確実に最初に消費者に売るバージョンは数百万台を売るように設計されます。その時点で価格が設定され、耐久性があり、そのことに対処する柔軟性があります。

最初に産業、商業アプリケーションに入るものは 10 万台ロボット規模のもので、10 万台作ってそれがスイートスポットにヒットするような設計かもしれません。

開発プロセスの一部として最初の 10 万台のロボットを食べることを喜ぶ他の競合他社もいるかもしれません。

ハードウェアとソフトウェアの差別化

ハードウェアが現在最大の差別化要因かもしれないとおっしゃっているのは、ソフトウェアの差別化が少ない、つまりトップのロボティクス会社や他の AI モデルからの借用などで、ソフトウェア側では似たような能力があるということでしょうか。

数字を入れてみましょう。正しい数字だと言いたいわけではありませんが、2 年後にロボットスタックが完成して、必要なすべてのコアロボティクスソフトウェアを持っているとします。2 年後には、100 万台、1,000 万台、1 億台作る価値のあるボディはありませんし、100 万台のロボットを構築する準備ができている人もいません。

これを設計問題として考えるのは簡単です。ロボットの設計を正しく行い、今度は多くを構築して大丈夫というように。しかし、より多く作るほどより多く作れるようになるというフィードバックループがあります。なぜなら、コストを下げるために設計をさらに改良する必要があるからです。

10 万ドルの単価で 1 万台のロボットは、1 万ドルの価格で 10 万台のロボットの良い代替品ではありません。しかし、その弧を通る必要があります。すべての中間ステップを行う必要があります。より少ないボットでより高いコストから始めて、道を下っていく必要があります。その弧全体が連続的である必要があります。弧のすべての点で次のステップに進むことが理にかなっている必要があります。

しかし、長期的に成功するためには、その終点に到達する道筋をたどる必要があります。現在理にかなうことに集中しすぎて、10 倍、100 倍大きくなった時に理にかなわない道筋を選ぶなら、近期的成功のために長期的成功を妨害しています。

これは Boston Dynamics のことですね。高性能な 100 万ドルのロボットには未来がありません。ヒューマノイドロボットに 100 万ドルを費やす価値のあるタスクが非常に少ないからです。1 万ドルで高性能なロボットが必要で、1 万ドルのロボットになる点まで段階的に改善できない技術を開発するなら、それは自然な開発パスではなく、近期的に機能させるために長期的成功を妨害しています。

これは一般的な問題です。スタートアップは機能する必要があり、新技術もすべての中間点で機能する必要があるからです。長期目標が明確に探しているもので、Tesla の AI の人々がいるので中間的なことをあまり気にしない戦略があるなら。彼らは Optimus 専用の AI の人々がいますが、他のことにも使う AI があります。AI グループを持つコストは Optimus だけのために AI グループを構築することではなく、既に必要な AI グループの付随的なものです。多くの相乗効果があります。

彼らの法廷で既に持っているこれらの他のことが、中間点を得ることを容易にし、長期的な点に集中することを可能にします。なぜなら、VC が 5 年で資金を回収する必要がないような制約がないからです。

詳細に入りすぎているかもしれません。ロボティクスで Tesla が良い選択だという私の論文を見ると、異なることを見ており、詳細な批判にあまり耐えられないかもしれない方法でこの点を擁護しています。

全体的な論文は、ソフトウェアは順調に進んでおり、ハードウェアは多大な集中を必要とし、ハードウェアで多大な集中を必要とする特定のことは、可能な限り迅速に高性能で耐久性がありコスト効果的なボディに到達することです。Tesla は正しい戦略、正しいリソース、それを行う動機を持っていると思います。やりたいだけでなく、それを行うことに十分なインセンティブがあります。

Tesla はロボットで年間 1 億ドルを稼ぐことは興味深くない十分大きな会社です。Optimus は 100 億ドル、1,000 億ドル、1 兆ドル規模で彼らにとって興味深い市場です。それが彼らにとって針を動かすものです。

小さなスタートアップなら、年間 10 億ドル、100 億ドルの収益ランウェイに到達することで満足するかもしれませんが、それは Tesla を満足させません。Tesla の内部インセンティブは長期的に最も成功する可能性の高いことを行うことで、より少ないリソースを持つ小さな会社とは異なります。

この分野で彼らは優位性を持っていると思う傾向がありますが、シンギュラリティのようなもので、3 年先、5 年先の未来を予測するのは非常に困難です。5 年先は不可能で、地平線の向こうで、遠い側で見るスパークから向こうで何が起こっているかを推測しているだけです。

経済価値と市場投入の閾値

興味深いですね。私はそれを経済価値として見ています。ヒューマノイドロボットは異なる機能性で特定の経済価値を与えるでしょう。超高性能なヒューマノイドロボットは明らかにより高い経済価値を与えるでしょう。顧客にとってのそのロボットのコストは、そのロボットが顧客に提供する経済価値よりも低い必要があります。それにその経済価値をそのロボットから得られる顧客の数を掛ける必要があります。

ヒューマノイドロボットは、ロボタクシーのように閾値があることを覚えておく価値があります。人間が車を運転するコストよりも安くロボタクシーサービスを提供できなければ、市場優位性はありません。人間がその仕事をするコストよりも安くヒューマノイド労働を提供できなければ、優位性はありません。

すべての努力は、より低いコストポイントで既存のニーズを供給するか、より高い品質などで供給するという閾値を越えることを期待して行っています。ロボタクシーは本当にケースを持つために、まず人間のライドシェアドライバーを上回る必要があります。それを越えると、あらゆる種類のことが可能になりますが、それまでは何も可能ではありません。

同様にヒューマノイドでは、年間 10 万ドルかかる手作業を行うヒューマノイドを誰かに供給できるなら、人間の労働と競争できません。年間 5,000 ドルかかる人間の労働を行うヒューマノイドを誰かに供給できるなら、今度は製品があります。既存のものがあり、市場が現れる前に打ち負かす必要があるニーズを満たすものがあるからです。

手の重要性と技術的挑戦

が取引の大部分だと思います。それが問題への入り口のようなものだと感じています。すべてのツールへの、有用性への道筋のようなものだからです。

人間の手は驚くほど高いバーを設定しています。人間の手は素晴らしいからです。ポケットに手を入れて、25 セント硬貨とニッケルを数えて、感触だけでいくらのお釣りがあるかを言うことができます。暗闇でできることにいつも驚いています。暗闇で靴紐を結ぶのは非常に簡単です。難しくもありません。靴紐を結ぶ時に靴を見ることもありません。

それは触覚フィードバック、運動記憶、靴紐がどのように動くか、靴での張力がどのように働くかなどの動力学の良い理解です。その一部はソフトウェアですが、非常に多くの部分は本当に高解像度のフィードバックを持つこと、そしてすべての運動の自由度を持つことです。

ハサミを持って使うことは実際に驚くほど複雑です。世界にはすべてのハサミがあり、人間の手のために本当によく作られています。ロボットが人間がするようにハサミを使うのを見たことがありません。ロボットハンドでは可能だと思いますし、起こるでしょう。

しかし、これまで見たロボットハンド設計で、人間の手ができる強度と運動範囲で競争できる性能のものは、3、4 年間工場でロボットに入れて使用できるような、摩耗して外れることなく使えるものではないでしょう。

ロボットハンド、肘から指先までのすべてがロボットのコストの半分になっても驚きません。高性能である必要があり、耐久性がある必要があるからです。3 か月しか持たない高性能ロボットハンドを構築することは十分ではありません。

しかし、手は本当に高価になります。短期的には、ロボット本体の複雑さの半分、コストの半分になるかもしれません。この状況にいる理由の一つは、本当に良い手を作るために必要なセンサーとアクチュエーター、つまりコア技術について、これまで誰も作業したことがないからです。

アクチュエーター技術の課題

カメラとは異なり、FSD が必要としたカメラは、セキュリティカメラ、携帯電話のカメラなど、無数の他の製品で使います。そのため、技術は非常に進歩し、自動運転車が必要になった時までに、本当に素晴らしく安いカメラがありました。

手に必要なセンサーとアクチュエーターについては、超高量で超高性能なアクチュエーターがありません。人間の手では、筋肉がここにあり、小さなことをする筋肉がここにあります。ほとんどの筋肉はここにあり、基本的にのようなケーブルのセットがあり、ここを通してこの種のモーションすべてを可能にします。

これを直接模倣しようとするのが、Tesla が現在やっていることだと思います。彼らは最初の世代の手では手にアクチュエーターがありましたが、手のひらを大きくし、運動範囲を制限しました。また、指で有用な自由度の数ほど多くのアクチュエーターがありませんでした。

そこで今、多くのアクチュエーターを前腕に移し、ケーブルが来ています。いくつかの問題は解決しましたが、ケーブルは悪いものです。ケーブルは伸び、張力の維持があり、ケーブルは押したり引いたりしません。人間の手では、これは一つのアクチュエーターで、この動きには反対の動きが別のアクチュエーターです。指を曲げる筋肉と指を伸ばす筋肉があります。

筋肉アクチュエーターは本当に小さいです。私の手の後ろの、この指を上げる筋肉は、糸のようなものではなく、私の腕の後ろを走る靴紐のようなものです。現在、指の伸展を行える靴紐サイズのアクチュエーターを作る技術がありません。そこで他の機械的ショートカットを行います。

最終的には、手のひら、前腕を与え、ケーブルを使ってその作動を行えるアクチュエーターを得るでしょう。ケーブル材料などを機能させるための機械的相互接続も思いつくでしょう。

もう一つは、人間は 150 ポンドの握力を持っています。150 ポンドの握力が有用である必要はありませんが、50 ポンド範囲の握力がなければ、シャベルで土を掘ることはできません。ロボットがそれを行う必要はないかもしれませんが、犬の散歩をして芝刈り機を押すロボットなら、50 ポンドの握力が必要です。セントバーナードを押さえ、前庭の傾斜で、草が高すぎても芝刈り機を押し上げることができる必要があります。

これらすべては、人間の代替になるなら、手が持つ強度と器用さと感度の範囲に入る必要があります。その目標に届かなくても有用性はありますが、本当に人間の世界に入って人間のことすべてを行える時に大当たりが来ます。

市場評価の困難さ

普通の人がヒューマノイドロボット分野のプレイヤーを評価するのはどうですか。例えば、Tesla が他のプレイヤーと比べてどこにいるかを正確に評価することは現実的でしょうか。特に手について話している時、異なるロボティクスプレイヤーの手のコストがいくらか分からず、1 週間持つか 1 年持つかの耐久性も分からず、会社がそのようなことを開示していない時など。

すべての数字を出て行って把握できると思うことはできません。ヘッジファンドが内部情報を得て、市場で誰がどこにいるかベンチマークしようとしているかもしれませんが、個人投資家としてはそれは全て絶望的です。

Tesla がロボティクス分野に入るのが良いと思った理由は、この分野でうまく機能するために異常に良いコア能力のセットを持っていると思ったからです。まだそのように見ています。

実際にロボティクス市場を徹底的に理解することに多くの時間を費やしていません。多くのプレイヤーがいて、頻繁に変化し、多くの不明点があります。重要だと思う大きな絵のアイテムに減らし、これらの大きな絵のアイテムでプレイヤーがどうかを重み付けします。世界は複雑で物事は変化することを完全に認識しています。

大きな絵のアイテムとは何ですか。

10 億台のロボットを構築するパスを持っているかということです。5 年、7 年の時間枠で 10 億台のロボットに到達するパスを持っているかです。そのような量への規模拡大は、既に非常に大量で大きく複雑なものを構築する実体にのみ本当に実行可能だと感じています。

ロボティクス分野の人々のうち、非常に高い品質基準で非常にタイトなコストポイントで非常に大量で複雑な機械的なものを構築する分野での実績や重要な専門知識を持っているのは誰でしょうか。自動車メーカーは多くの点で並行しているので、明らかな選択肢です。

7 年で 10 億台やると言うスタートアップを割引したり信用しませんか。

可能ではないと言う意味で割引しません。割引には二つの方法があります。一つは「ああ、それは」で、もう一つはその目標を達成する可能性にある割合の割引係数を適用することです。その後者の意味で割引します。その声明をそれに応じて重み付けします。

既にできる人はそれを割引しないか、あまり割引しません。現在 3D プリンターを使って射出成形でコンポーネントを作っている人で、明らかに鋼やダイキャストアルミニウムなどである必要があるものは、あなたのアルミニウムダイキャスターはどこですか、10 億の高品質ダイキャストに至る道筋で経験をどこで得るのですか。

不可能ではありませんが、現在持っていない非常に挑戦的な異なることを要求リストに追加するほど、確実な成功を通り抜ける可能性が低くなります。

Tesla の総合的優位性

Elon がそれを理解しているように感じます。起こる必要があることを理解しているように感じます。アクチュエーター、設計、手の性能の重要性を理解しています。ランプに起こる必要があることを理解しているようです。あなたが話している多くのボックスをチェックしているように見えます。

彼だけではありません。彼のために働く多くの賢い人々がいます。Elon がそれを理解するかより、Elon と最も上級な 100 人がそれを集合的に理解するかが重要なことです。Elon がこの作業の 99.9% を行っているわけではありません。他の人々によって行われています。彼らが理解する必要があります。

人々が調整されることができるようにリーダーシップは多くをしますが、リーダーシップが作業を行うわけではありません。Tesla が既にやっていることとの多くの相乗効果があり、この分野で他のロボティクススタートアップに対して有利だと感じさせます。

Apple が分野に入ると言ったら懐疑的でしょう。機械的なものを構築しないからです。Google が分野に入ると言ったら懐疑的でしょう。複雑なものを規模で構築したことがないからです。どのスタートアップもそれを行うなら、規模で何もしたことがありません。それは挑戦です。

GM がそれを行うと言ったらどうですか。GM にはいくつかの有利なことがありますが、文化がなく、技術がなく、ソフトウェアがありません。それは本当に大きな問題です。他の候補者は誰でしょう。Airbus、Boeing。いいえ、文化が間違っています。

ソフトウェアとハードウェアの製造コンボを見つけるのは困難で、米国では確実に、中国についてはあまり分かりませんが、封筒を押し、伝統と決別し、急進的な代替手段を探求し、物事を行う急進的な新しいアプローチに農場を賭けることを喜ぶ多くの製造業者はありません。それは GM や Boeing で見る文化的なことではありません。

他に誰が作り、エレクトロニクスは非常に異なるもので、Apple はプリント回路基板を作りません。プリント回路基板の製造は超困難、アイシングの製造は超困難、カメラの製造は超困難ですが、Apple はそれらのものを作りません。他の人々からそれらすべてを買います。

Foxconn がロボット本体を規模で作ることができるでしょうか。それは興味深い質問です。Foxconn は面白い状況でしょう。車のようなものは作りません。車は、ロボットに必要なスキルセットに対してはるかに良いマッチだと感じています。

特に電気自動車では、ロボティクスの大きな挑戦の一つが電磁アクチュエーターだからです。多くの能力が必要です。Tesla の電磁、モーター設計チームが世界で最高の電磁アクチュエーターチームの一つだという議論があると思います。

LinkedIn で人々を雇ってそれを得るという場所ではありません。正しい人々がいても、それを良く行える内部文化と背景を構築するのに年がかかります。電磁アクチュエーターは、設計創造性、機械的直観、電磁モデリングの非常に興味深い組み合わせです。それは他の分野には本当に存在しません。

Tesla はそれを持っています。それはロボットにとって重要な欠けている要因です。Tesla は、今日世界に存在しないヒューマノイドロボット用に設計された新しいアクチュエーターを、全くのゼロから信頼して作ることができます。そしてそれらを超高量製造に持っていき、それらを構築し、信頼性を持たせ、低コストにすることができます。Tesla はそこで超信頼できます。

Boeing がそこで信頼できるかと聞かれたら、おそらくそうではないと言うでしょう。Mercedes がそこで信頼できるかと言えば、絶対にそうではありません。彼らはこのようなことをしないからです。

他に誰がいるでしょう。低量で同様のことができる機械メーカーはおそらくいるでしょうが、高量で同様のことができるのは誰でしょうか。HP プリンターメーカーのように、超低コストで量のアクチュエーターを作るかもしれませんが、本当に競争するには間違った性能エンベロープにいます。しかし、見るかもしれない場所です。

Foxconn については、Apple 携帯電話以外で何をするか分かりません。大きな産業ビジネスがあることは知っています。電磁アクチュエーター分野で、その分野で信頼できるような能力セットを持っているかもしれません。分かりません。

中国の EV メーカーもう一つかもしれません。

Optimus の進歩への評価

これまでの Tesla の Optimus での進歩に満足していますか。

見るものが少なすぎて意見を持つのが困難です。Optimus について話してきたことで見たもので不満になることは何もありません。最終的に end-to-end のことを採用するのを見るのはクールでした。以前のバージョンのロボットで起こっていた古い Biden シャッフルのようなものがなくなったからです。

それは必要のないもので、長い間解決可能だったものでした。彼らがそれを単純に取り除き、最新の最先端ではなく、5年前の最先端を採用してそれを起こさせるのを見るのは良かったです。

しかし、再び私の焦点は、機械でどれだけうまくやっているかで、モーターのトルクピークについての少しのデータと、Optimize day の一つでモーターのスルーレートについて少し情報を得たと思います。それらはすべて良く見えました。

ヒューマノイドロボットのニーズに特化したアクチュエーターを設計しているという事実は巨大な勝利です。それは簡単な設計空間ではありません。エアコンからモーターを取ってロボット用に再利用したり、オートバイや電動スクーターのようなものではありません。それらのモーターはどれも実際にはアプリケーションに良いフィットではありません。本当に目的設計されたアクチュエーターが必要です。

彼らはそれをやっていて、私には本当に良いアクチュエーターに見えます。前に言ったように、手は現在弱点だと思います。手は Tesla だけでなく、みんなのためにはるかに良くなる必要があります。しかし、コア技術がそこにないので彼らがそこにいない理由です。人々はそれを前進させる必要があります。Tesla がそれを前進させるために働いていると思いますが、まだその成果を見ていません。

ダンスビデオについてはどう思いましたか。

ついにが最初の思いでした。それは非常に長い間実行可能でした。Tesla がそれを気にしなかった理由が分かります。他の人々がダンスロボットや不均一な地形を歩けるロボットなどを見せびらかしているからといって、ダンスロボットを作ることは重要ではありません。

ソフトウェア観点から、それらは解決されたとは言いませんが、解決方法を知っている問題です。Tesla のエンジニアリングチームが座ってそれをやりたいと決め、解決策を出してそれを行える種類のことです。しかし、高い優先度ではなかったのでそれをやっていませんでした。私の解釈では、高い優先度ではなかったのでそれをやっていませんでした。

しかし、より良い方法が知られている時になぜそれほど不器用なものを使っているのかを見ていたような種類のことの一つでした。そのソフトウェアができることを見せるデモを見るのはかなりクールでした。

それは単にそれを行えるソフトウェアを持つ問題ではありません。十分に早く、低遅延で、高いラグがなく、それを引き抜けるトルク比を持つアクチュエーターを持つ必要があります。Tesla がそれを引き抜ける正しい仕様セットでアクチュエーターを設計していることに疑いはありませんでしたが、証拠を見ていませんでした。

ダンスはロボットにとって挑戦的です。超挑戦的ではありませんが、歩くよりも挑戦的です。完全な自由度があります。彼らが明らかにその空間にいることの直接的証拠を見るのは良く、楽しいです。ダンスロボットを見るのは単純に楽しいです。喜ばしい種類のことです。良いダンスロボットの仕事でした。

必ずしも長期目標への直接パスにあるとは思いませんが、見るのはクールです。

彼らの全体的な sim to real のようなことの実証は重要な道筋の一部だと言えますか。

ロボットにとって sim to real はかなり重要です。多くのことをやりたいです。手のことに戻ります。ロボットがつまずいて倒れ、手で自分を受け止めたら、手は床との遭遇を生き残るでしょうか。現在多くのロボットハンドは床との遭遇を生き残らないと思います。

倒れるたびに手のセットを失うので、ロボットが倒れることを許可できません。肩を失うかもしれません。ロボットが倒れることは良くありません。最初に開発している時、まだ壊れやすく高価で交換困難な時は、倒れる可能性を本当に低くするソフトウェアでプログラムするか、倒れないようにハーネスに入れるか何かをします。それは他にできることを制約します。

Optimus をハーネスから外して踊らせることは、ここに使い捨ての Optimus があって、倒れて手を壊しても気にしないことを示すかもしれませんが、それをやって快適な点に到達したことも示唆します。

Sim to real はかなり重要です。ヒューマノイドロボットは、はるかに多くの自由度を持ち、バランスを取らなければならない逆さのプレナム問題があります。人間には慣れているので、実際には人間には思えるより機械的に非常に挑戦的なことです。

それらすべてがまとまってくるのを見て、明らかに Sim to Real を使っているのは良かったです。それは重要な技術で、しばらくの間あり、許容可能に行う多くの方法があります。彼らがそれを行えることに全く驚きませんでしたが、すべてを引っ張ってきて小さなデモを与えてくれるのはクールです。

今後の実証展開

次の 6 か月で Optimus の実証で何が可能になると思いますか。

見るものが少なすぎます。Tesla が Optimus でより多くのデモを与える範囲で、個人投資家やウォール街を満足させたり、競合他社に何をしているか、どこにいるかを明かしたりするために多大な努力を行う強いインセンティブはありません。

多くの情報を得られないのは驚くことではありません。投資家を納得させる必要がなく、顧客はまだ遠いし、投資に敏感ではないからです。時々小さな簡単な、個人投資家に Optimus の物語を信頼できるものにしておくための骨を投げることは悪くありません。おそらくそのようなことを続けるでしょう。

しかし、その観点で彼らが行うことは、ロボティクス専門家ではない個人投資家にアピールすることになると予想します。ダンスロボットはその観点にあると感じます。私はそれから少し得ますが、彼らがいる点でそれを行えることに全く驚きません。彼らがそれを行うのを見るのは少し良いですが、一方で、他のダンスロボットの多くのビデオを見てきた個人投資家にとって、Optimus もそれを行えることを見るのは、おそらくはるかに満足のいくものです。

将来得るかもしれないデモの種類は同じ観点にあるかもしれません。最も見たいのは本当に良い指の敏捷性の実証でしょう。手で。それが起こる多くの異なる方法を見ることができます。私にとって、Optimus が人間用に設計された複雑な手工具を使うことは説得力があるでしょう。

特に、Optimus が 16 分の 1 インチのステンレス鋼シートを切るためにブリキ鋏を使うようなことです。それは多くの器用さと手の力を同時に必要とし、人間の手でも使うのが非常に厄介な工具を使うことです。それは例ですが、指で鉛筆を回すトリックのような他のことを思いつくことができます。それは困難です。

人間がそれを行うのは困難で、作業を入れればロボットをプログラムしてそれを行わせることができる種類のトリックですが、それがその物の中核能力に基づいて構築されたことが明確なコンテキストで行ったなら、見るのはクールでしょう。

人間がそれを行うためのトリックの一つは、背中での圧力、鉛筆が動くのを感じる、または人々がニッケルでこれを行うのを見る、指を横切ってニッケルが転がる感触がフィードバックメカニズムです。それは本当に敏感な圧力センサーを指の後ろに持っていることを示唆します。

カメラを使ってトリックを複製することはできますが、それはあまり面白くありません。良くもないし説得力もありませんが、その方法で偽装することはできます。しかし、Optimus が指の後ろに圧力センサーを持っていてそのトリックを引き抜けるなら、私は超感銘を受けるでしょう。それは驚くべきことでしょう。

現在、その種のことを行うためのコア技術は存在しないと思います。十分に安い、その種のセンサーアレイを作るための。多くのロボットハンドが今、指先にテクスチャーと圧力センサーを追加することに焦点を当てているのを見ます。それは物を扱うなどのための高価値のことだからです。手の後ろには置いていません。人間は技術があるのでそれを持っていますが、多くの価値を追加していない場所に本当に良いセンサーを置く前に、かなり安くなる必要があります。

猫との相互作用とオレンジの皮むき

何年頃に Optimus が猫を両手で拾い上げ、膝の上に置いて、猫を撫でることができると思いますか。

猫が鎮静剤を打たれていないと仮定して。

協力的な猫、びくびくしない猫としましょう。

超協力的な猫もいますが、彼らがその平凡な猫でそのトリックを引き抜ける、数年以内にそれを行えるなら、私は本当に感銘を受けるでしょう。それが必要とする猫への感度の量は非常に並外れており、猫があなたに抵抗するように怒らせることを避けるための非常に繊細な扱いが必要です。

手でオレンジの皮をむくのはどうですか。それは本当に困難なことですか。

それは本当にオレンジによります。マンダリンは皮が落ちるだけです。それは本当です。例えば、熟した平均的な sun-kissed ネーブルオレンジのような具体的なものにしましょう。

それはかなり困難ですが、簡単にする多くのトリックがあります。皮を破ったら、はるかに簡単になります。それは本当に良いトリックです。そのような良い提案です。

オレンジの皮をむくのはブドウの皮をむくのとは違います。ブドウの皮をむくなら、それは印象的でしょう。

一方で、鉛筆を扱うのは本当に困難で、一方で、鉛筆を扱うだけのためにロボットを訓練するために多大な努力を入れるなら、それは行えることです。人間は手でできる他のすべてのことの副作用として鉛筆の扱いを得ます。鉛筆で訓練時間を費やすからではなく。

は良いものでしょう。箸で食べ物を食べる。

箸でピーナッツを拾う。興味深いです。

人間スタイルの箸で、何らかの特殊な箸ではなく。

それはかなり困難で、特にピーナッツを拾い、箸を刺す必要がある食べ物も考えています。ラーメンをボウルから持ち上げるなど。

食べるのに適した方法で、それはかなりトリッキーです。

人間の手は非常に驚くべきで、完全に当然と思っている信じられないほど細かい器用さのスキルが不足していません。靴紐を結ぶのは超困難です。卵を割るのはもう一つです。片手に卵を持って、これを行うことはできません。片手で割って、殻を入れずにフライパンに卵を注げるように半分を分離する。困難で、それをうまく行うことはできません。

またはゆで卵の皮をむくこと、めちゃくちゃにしないで。それは私がうまくできないもう一つのことです。

しかし、人間の労働の代替である私のヒューマノイドロボットのビジョンでは、これらのすべてのことを話すことができます。猫を拾うことができ、赤ちゃんの世話ができ、祖母をベッドから起こすのを手伝い、シャワーに入るのを手伝うことができます。干し草の俵を積むのを手伝い、箸で食べたり箸であなたに食べさせたりできます。自分で使えない時にアジア人の祖父に箸で食べさせることができます。

これらすべてを行うことができ、それが可能性の範囲内であることに疑いはありません。障害は、IC や太陽電池パネルやレーザープリンターやタイヤを構築するのとは異なり、本当に基礎レベルですべてのコア問題を解決し、前進するための多くの歴史を持つこの巨大な産業を構築していないことです。

ヒューマノイドロボットに持っていない技術のために同等のことを行うのに時間がかかると信じています。

Apple との類推

興味深いです。直接的ではありませんが、Apple を少し思い出させます。彼らは Mac OS、iTunes 音楽でソフトウェア経験がありました。iPod で小型デバイスの経験があり、設計がありました。時が来た時、彼らは能力、専門知識を引っ張って、モバイル体験のためのほぼデスクトップ品質の OS と、超高品質の電話やタッチスクリーン基本的にインターフェースとハードウェアを設計することができました。彼らが持っていたもの、良かったものを活用しました。

同様の方法で、Tesla は彼らが本当に良いもの、機械的なもの、設計を活用することができ、そうしているように見えます。

彼らには良いフィットです。その一部は偶然です。Elon が Optimus を構築する良い立場に置くために EV を作ったとは思いません。EV を作って、その後「ヘイ、ヒューマノイドロボットができる、それは素晴らしい市場だ、材料がある」と言ったのです。

それが、この物すべてが始まる前に「Tesla がそれを行うべき会社だ。彼らがそれを行うことを願う。現在持っているすべての問題を考えて時間がないと思う。現在持っているすべての問題を考えて、どんな狂人がヒューマノイドロボットに取り組むのか」と言った理由です。

今、答えを知っています。

まさに、まさに。

技術革新の最高の時代

魅力的なことです。それに続いて話すことができるのは非常に興味深いです。どうなるかを見てください。

これは生きている最高の時代です。これは、これらすべてのことを見る最高の場所です。他の場所で他のことを見ている他の人々が同じことを考えていると確信していますが、これは私がここからこれを見て「わあ、これは史上最高のこと、これは素晴らしい」と思っています。

ロボタクシーの打ち上げの最初の週のようなもので話しているのはクールです。自動運転が起こっているようなものです。このようなことは本当に起こります。物事が成熟の特定のポイントに到達する正確なタイミングを特定するのは困難ですが、向かっている場所、方向を見ることができるなら。

これは真に大衆市場の Kitty Hawk の瞬間です。再び、Waymo の人々に影を投げかけているわけではありません。彼らに非常に感謝しています。良い仕事で、彼らのサービスを愛しています。サンフランシスコにいるので、いつも使っています。本当に満足しています。

しかし、ロボタクシーの約束は 1 マイル 40 セントの無制限のもので、欲しい車両だけで 30 秒で現れることです。それは私たちが向かっている場所で、10 年早く、20 年早くそこに到達するなら、世界に巨大な違いをもたらします。

特に今、私たちは 5 年前に EV の優位性だけで軽輸送にモーター燃料を使用することから移行を手助けすることを本当に望んでいた点のようなものにいます。それは、世界をより良い場所にすることの低ぶら下がりの果実のように思えました。

Tesla がそれで素晴らしい仕事をし、しばらくの間世界がその方向に動いているように見えました。今、Tesla 以外では、世界がこの種のことの約束から後退したように見えます。数年前に感じたよりも、AV での成功、AV は自然に EV だからです、そして AV はその 5 倍のレバレッジを持っているからです。1 台の AV が 5 台の ICE 車両分のマイルを置き換えます。

それは持続可能な輸送への世界の移行のもう一つの約束です。私にとっては、LA を歩き回る時に息が詰まらない輸送です。その移行がペースで進むのを見たいし、AV は私たちの唯一の希望です。

さあ、James さん、おたがいさまでした。これを 2 つまたは 5 つのビデオに分割するつもりです。多くのビデオです。Optimus セクションはおそらく最後の部分になり、おそらくそれを分割します。一緒にいるのは楽しかったです。これで終わりにして、後でまた会いましょう。お疲れ様でした。

コメント

タイトルとURLをコピーしました