家庭用真のAIがここに到来—そして掃除もします!マティック創業者へのインタビュー。

AGIに仕事を奪われたい
この記事は約39分で読めます。

22,927 文字

TRUE AI For The Home is HERE—And It Cleans! Interview with Matic Founder.
Join me in a deep dive into the world of a SMART home robot you can own today--the Matic vacuum/mop--with one of the com...

今、最高の部分は、完全な地図があるので、地図上のどこでも長押しして「ここに行け」「あそこに行け」と指示できることです。すると、文字通り経路を作成し、「おっと、ワイヤーがあります」と言います。これは実際には良いことで、昨日はなかったワイヤーがありますね。それで「行けますか?」いいえ、いいえ。うまくいけば別の方向に行く必要があることを理解するでしょう。遠回りしなければならないので…今やり直しました。
すごいですね。こんにちは皆さん、Dr. Knowit Allです。マフル・ナラヴァラさんと一緒にいます。正確に発音できたかな?
完璧でした。
素晴らしい。マティックのCEO兼創業者です。彼らは素晴らしい小型ロボット掃除機を作っていて、すべてをきれいにして素晴らしい仕事をしています。彼らは親切にも私に一台貸してくれて、次の数本の動画で完全なレビューをする予定ですが、まずあなたとチャットしたいと思いました。まず、アセンズまで来てくれてありがとう。誰も私のためにそんなことをしてくれないので、来てくれて本当にありがとう。
ジョージア大学のキャンパスを見て、アセンズを訪れる素晴らしい口実になりました。私の喜びです。
私たちは二人とも少し汗をかいています。アセンズのダウンタウンを歩き回っていたばかりなので。
最初の質問から始めましょう。いわゆる「ロボット掃除機」はたくさんあります。スコット・ウォルター博士はそれらはロボットではないと主張するでしょうが…自動ロボット掃除機はたくさんあります。私は2010年か2011年くらいから所有しています。それは我々がハスキー犬を飼い始めた頃だと思います。とにかく、私はたくさん持っていました。それらはすべて異なる点で機能しません。なぜあなたは大胆にも「掃除機を作ろう」と考えたのですか?
私たちが始めた理由は、それが私たち自身の問題だったからだと思います。明確にするために、私のパートナーであるナミ・ダラルは、その背後にある頭脳であり、実際にコンピュータビジョンでPhDを持っています。彼が共同創業者兼CEOで、私は製品側に焦点を当てた社長です。
彼と私の両方が父親であり、私には3人の子供とゴールデンレトリバーがいます。先ほど言及したように、すべてのロボット掃除機は、言葉遊びを意図して、残念ながら実際には上手に吸引せず、ワイヤーやおもちゃ、レゴなどを吸い込んでしまいました。
それらは本当によく考えられていないと感じました。あるいは一歩下がって、2002年にルンバが登場したとき、2002年の視点から見れば素晴らしかったです。しかし20年後、AIの出現により、彼らは本当に遅れをとっており、この円形デザインに閉じ込められていました。誰も第一原理から考えていませんでした。
私たちはただ、今日からゼロから作るならどうするか、ロボット掃除機が存在しないと仮定して、何を作るか、どう作るかと考えました。それは本当に私たち自身のユースケースであり、コンピュータビジョンのバックグラウンドがこれを行う鍵でした。室内の世界、特に家は人間のために人間によって作られ、視覚に基づく私たちの知覚システムに合わせて設計されていると感じました。
だから、私たちのように振る舞い、私たちのように掃除するロボットを作るなら—それがレベル5の室内ロボットになるでしょう、レベル5の自動運転車が人間のように運転するという意味なので—同様の知覚システムが必要です。そしてそれができると思いました。室内視点からのロボティクス2.0時代を本当に始める機会がありました。
2018年にこの問題を検討したとき、テスラやウェイモのアプローチを知っていました。テスラが屋外の世界のためにやっていることを、誰かが室内の世界のためにもやる必要があると感じていました。そこに機会がありました。当時、200以上の自動運転車のスタートアップがありましたが、家庭用のロボティクススタートアップは一つもありませんでした。これは私たちにとって不思議なことでした。なぜなら、家はこれらの単調で繰り返しの雑用を何度も行う場所だからです。
これは私たちにとって明らかでした。以前Nestにいて家について考えていたからです。機会があると感じ、日常の問題を解決できれば素晴らしい製品を作れると思いました。それは実際のニーズです。
理解のために皮肉なことを言うと、この特定のカテゴリー、つまりGoogleやAmazonのような大企業が無視しているカテゴリーは、過去8年間で毎年17%成長しています。累積成長率ですよ。自動室内掃除機、具体的にはロボット掃除機です。2017年に560万台だったものが、昨年は世界で2000万台以上のロボット掃除機が販売されました。これはiPhoneやスマートフォンの導入後の成長率と同じレベルです。
しかし、カテゴリー全体のNPSスコア(ネットプロモータースコア)は文字通りマイナス1です。ロボット掃除機が人生を変えたと言う人には会ったことがありません。しかし、皆が買い続けています。問題の強度が非常に高く、人々は床掃除が非常に嫌いで、劣った製品を許容する意志があるということです。本当により良い製品を作ることができれば、大きなチャンスがありました。
床掃除から時間を取り戻し、常にきれいな床と常にきれいな家で生活できるようにすることは本当に良い機会だと感じました。
チームについて聞きたいと思いますが、しばらく話をしましょう。これはイノベーターのジレンマを表しているように思えます。あなたではなく、例えばルンバや他の企業が、機能する技術を発明し、それを繰り返してきたけれど、自分自身を破壊することを望まない、基本的に20年前のものの進化に過ぎないものだからです。
実際には二つの部分があります。一つは彼らがこの平らな円盤形に自分たちを閉じ込め、今それを解決しなければならなくなったという要素があります。分散型ロボットにカメラを置くとアリの視点のようになりますが、私たちの背の高いロボットは、上からの人間のような視点を提供します。それが一つ。あなたはその制限に自分自身を閉じ込めてしまいました。
しかし、より大きな課題は、通常ロボティクスがセンサーやハードウェアを最初のアプローチとしていることです。私たちが試みているのは、アルゴリズムを出発点として、そこから逆算するアプローチです。コンピュータビジョンを出発点として使用したいと思っています。これが典型的なロボット工学者と非常に異なる点です。彼らは通常センサーから始め、逆算します。
では、チームについて話しましょう。それは大きな違いになると思います。最初は誰が始めたのですか?今はもっと多くの人がチームにいると思いますが、どのグループの人々が始め、あなたたちのスキルは何でしたか?
私と私のパートナーのナミド、私たちはコンピュータで働いていました。彼のコンピュータビジョンでの博士論文は2005年のもので、古典的なコンピュータビジョンの基礎的な研究でした。彼の単一の論文は5万回引用されています。それは「勾配のヒストグラム」と呼ばれ、コンピュータビジョン101を取れば学ぶことになります。
私たちは2005年頃からコンピュータビジョンに携わっており、最終的に2010年にGoogleに買収されたlike.comという記事に加わりました。その後、Webカメラのジェスチャー検出の別の会社を始め、それもGoogleに買収されました。私たちにとってはうまくいきました。私たちは約20年間コンピュータビジョンで一緒に働いてきました。
私の背景は具体的には製品側の方が多いです。冗談で言うと、彼は作ることができ、私は売ることができると言っています。私はlike.comでほとんどの時間を製品マーケティングやビジネス側に費やしていました。その会社が買収されたとき、私たち二人の間には会社を始めるのに十分な補完的なスキルセットがありました。
それでFlutterを始め、Flutterが買収されてGoogleに移った後、Nestに移り、GoogleによるNest買収後、製品の観点からNestカメラポートフォリオ全体を率いました。Nest Cam Outdoors、Nest Cam IQs、Nest Hello Dobellなど、私たちが発売したすべての製品です。そして彼が発表したすべてのコンピュータビジョン機能です。
私たちは埋め込みデバイス上でコンピュータビジョンを使用したハードウェア製品を構築した経験がありました。それが私たちの背景であり、顧客のニーズだけでなく、オンデバイス、エッジデバイスのロボティックスタックを構築するという私たちの試みにもユニークな視点を与えてくれました。
ロボットを持ってきて、ここで紹介したいですか?
はい、これがロボットです。ここに置きましょう。まず最初に形状が明らかに非常に…それは掃除をしていたので汚れていますが、掃除していることを考えると、そして私たちの家ではハスキー犬がいるので、持ち上げるとすぐにハスキーの毛が至る所にありました。この平らな円盤や、U字型のものとは非常に異なる形状をしています。それでもかなり平らですけどね。
それは設計によるものです。このように裏返してみましょう。最初に私たちが行った思考実験は、ルンバを想像し、テレポーテーション装置があると想像して、60年代に送り返し、人々に「これは何か」と尋ねるというものでした。彼らはそれがロボットや掃除機だと推測できない可能性が高いです。
まず私たちがしたかったのは、ロボットのように見え、目的が明確なロボットを作ることでした。そして、より丸みを帯びた角の形状を与えました。家にはペットや子供がいるので、とても怖く見えないようにしたかったからです。そして壁なども、壁にぶつかって傷つけたくないですよね。
そして、直立型掃除機に似た長方形のクリーニングヘッドを与えました。アイデアは、直立型掃除機は縁や角によく適しているため、円形のクリーニングヘッドではなく、長方形にしたのです。このようなクリーニングヘッドを持たせることで、ユーザーにそれが掃除ロボットであり、上手に掃除するという自信を与えます。
研究を行うにつれ、ルンバは20年前、25年前には全面カーペットの世界向けに作られていたことに気づきました。当時の家は全面カーペットだったので、小さな車輪でよかったのです。今は厚いパイルのラグと硬い表面、そしてそれらの間の移動が多いです。
そこで大きな車輪がパズルの大きな部分になりました。大きな車輪を作れば、SUVのようにさまざまな地形を越えることができます。それはまたクリーニングヘッドの下に隙間が必要だということも意味しました。そのためクリーニングヘッドが上下に動くのです。
そしてサイドが実際に上に曲がっていることがわかります。これは前部がここで掃除機で、これがブラシロールだからです。これは初めての種類のもつれ防止ブラシロールです。注目したいのは、これは家を4回ほど掃除していますが、髪の毛が全くついていません。他のものは常に髪の毛がついていました。
また、簡単に注意したいのですが、これはレビューではありませんが、これはとても素晴らしいです。モップヘッドがここにぽんと出てきます。それがつまったのですが…アプリを開いたら、すぐに「これが問題です、チュートリアルがあります」と表示されました。とても簡単でした。
ありがとうございます。それがアイデアでした。シンプルにしたかったのです。人々にロボットをひっくり返して切断しようとさせたくありませんでした。そのため、インテリジェンスだけでなく、ハードウェアも重要だと考えました。この素晴らしい脳を持っていても、手や指がなければ意味をなさないでしょう。同様に、ロボットが自分がどこにいるかを見ることができるだけでなく、実際にきれいに掃除できるハードウェアも持たせたいと思いました。
前部は掃除機で、後部はモップです。掃除機がけをしているときはモップのローラーは上に上がっているので接触しません。そしてモッピングするときは、気づいたように、クリーニングヘッドをこのように回転させて良い接触を得ることができます。
掃除と同時にモップもするという掃除機をお持ちの方がいるかもしれませんが、彼らがやっているのは単に湿ったモップブラシを掃除機の後ろに引きずるだけで、汚れをあちこちに広げるだけです。
私たちがしたのは、このブラシロールだけでなく、内部にリングがあり、そのリングが実際に汚れと汚れた水を絞り出し、両方がこれらのHEPAバッグに入るようにしています。そしてこれが水タンクで、少量の水と液体を入れます。
これを行った理由は、いくつかのことに気づいたからです。一つは、それがよく掃除すべきだという原則です。しかし、掃除ロボットもまた、騒音で私たちの家を汚染すべきではありません。それを非常に静かにしたいと思いました。
二つ目は、巨大なドックを持つべきではないということです。スペースはいくつかの家では十分にありますが、特にニューヨークなどに住んでいる場合、非常に限られています。多くの顧客から、実際に騒音を立てるドックを望んでいないという声を聞きました。あなたはそのような掃除機を使ったことがありますか?子供がいる私の家では、ロケット発射のような感じがします。
キャニスターを空にするものですね。はい、朝2時の掃除機のようです。それは起きてしまうよね。それは掃除機を掃除する掃除機のようで、とても不格好な解決策に感じました。私たちはそれを非常にフレンドリーにしたかったのです。家を飾り、子供たちとフレンドリーであるべきだと。
そして、この黒い部分がクラウンで、センサースタック全体です。前面に2つのカメラ、背面に2つのカメラ、ディスプレイがあり、何が起きているかを正確に伝えます。上部に1つのカメラ、そして4つのマイクアレイがあります。そしてこの部分が赤外線ライトなので、夜間でも真っ暗な中で見ることができ、問題なく機能します。
基本的に非常にシンプルな人間のようなカメラとアルゴリズム、それだけです。そしてすべてがデバイス上、エッジデバイス上で行われるので、データが家から出ることはありません。
記録開始前に話していましたが、妻の誤解は「このものは私の家の地図を作っている」というものでした。それは最初にすることですが、高さはどれくらいですか?約8インチですね。だからちょうどよちよち歩きの幼児がハイハイするレベルです。そして、地図自体は約1フィートですね。
基本的には家の底部1フィートがカラーでマッピングされます。とても素晴らしいです。妻は「でも待って、これは悪意を持って送られていくのでは?」と言っていましたが、そうではなく、あなたの家に留まります。
それについて話すことが重要だと思います。設計の一部として考えるべきは、私たち人間はハイドマインド(集合知能)を持っていないということです。私たちは実際にロボットの脳を持っていて、家の地図を学ぶにつれて各家に適応します。全く同じように、私たちは家ごとに非常に正確に学習するロボットを構築したいと考えました。ハイドマインドを持つのではなく、二つ目の部分は、すべてをデバイス上に保持していれば、非常に速く適応できるということです。
プライバシーは大きな問題ですが、遅延も重要です。インターネットが遅いから階段から落ちた、とか、電源が落ちたから子供にぶつかった、というロボットを作りたくはありません。遅延は大きなパズルの一部であり、屋内の世界ははるかに動的です。私たちの家は子供がいれば常に変化しています。
だから、すべてをこのデバイス上に置き、さまよっている間も常にマッピングしています。クラウドに依存する必要はありません。すべてが家の一員という視点から構築されました。プライバシーを保護し、よく掃除し、うまくいけば家に属しています、とても親しみやすい方法で。
とても可愛いですし、それは重要だと思います。すぐにそれらのことについて話しますが、センサースタックについて話したいです。しかし、箱には素敵な小物がついています。とても愛らしいです。
これには明らかにここに小さなディスプレイがありますが、本当に使う必要はありませんでした。一回だけ水がなくなって一時停止と表示され、水を足してくださいと言われましたが、それは簡単でした。通常は電話を見たりします。アプリは素晴らしく、それと一緒に素晴らしく動作します。
センサースタックについて再び話しましょう。これはVSLAMを使用していますね。「ああ、それは2002年のオリジナルルンバだ」と言いたくなるでしょう。いいえ、オリジナルのものではありませんでしたが、2010年頃のものはそうでした。VSLAMは古いですね。つまり視覚的同時位置マッピングですが、これは何が違うのでしょうか?標準的なロボットとは非常に異なる動作をします。
パズルには二つの部分があります。一つは、私たちは主に画像を取り、ニューラルネットワークを使用してVSLAMでボクセル(3D空間の単位)に変換しています。非常に3D表現のように見えると気づきました。そうです、各ピクセルの代わりに1×1×1cmの立方体、ボクセルがあります。スキャン時には空白のスペースのようなものです。
空のスペースを理解しているのですね。そうです。意味論的には、私たちはボクセルベースのものを構築しましたが、あなたの質問に答えるために、VSLAMについて私たちが気づいたこと、そしておそらく後付けで私たちの過小評価した間違いの一つは、VSLAMが数学的に解決され、理論的に80年代半ばから解決されていると仮定したことです。オープンソース版を使用できると思っていましたが、私たちが行う前のVSLAMの実装はすべて初歩的だったか、せいぜい80%の精度でした。
私がこれを説明するために常に使用する類推は、iPhoneの前に生きていたとしたら、iPhoneは長い間存在していますが、タッチインターフェースは1995年から2008年までスタイラスを使って存在していました。そのタッチインターフェースは、スタイラスを叩くか、指で全力で突く必要がありました。プラスチックが変形するのを感じるほどでした。それらは存在していましたが、とても素晴らしいわけではありませんでした。
そしてiPhoneが登場し、絹のように滑らかで、現在のすべてのタッチインターフェースは美しいです。全く同じように、VSLAMは存在していましたが、すべての実装はそれほど素晴らしくありませんでした。最終的に、私たちはVSLAMで四桁の精度を持っていると主張できると思います。世界で誰も持っていないと思います。
ニューラルネットワークですか?高ダイナミックレンジカメラを使用していますよね?暗闇でも見えるから。その通りです。しかし、多くのニューラルネットワークと一部のニューラルネットワーク技術は確かに重要です。古典的なVSLAM技術とニューラルネットワーク技術の組み合わせがありますが、その多くは単なる根気強さです。
私が言いたいのは、文字通りそこに座って、バグ後のバグを解決し続け、ある地点に達するということです。0から1の製品を構築しようとすると、0から80までは1倍の努力、80から90までは2倍、90から95までは3倍、95以降はそれ以上です。本当に3年間継続的に反復し、何が機能し何が機能しないかを理解し、それを常に最適化することでした。
チームは今数字的にどれくらいの規模ですか?
数字的には約60人です。
おお、すごい。それはクレイジーですね。外部資金を持っていますか、それとも全て自己資金でしたか?
いいえ、外部資金があります。外部から約3000万ドルを調達しました。そして私たち自身のお金もかなり投資しています。それは良いことだと思います。このように、あなたはゲームに関わっていて、それが成功することを本当に望んでいます。
これは常に人生の仕事でした。別の製品、別のスタートアップをする必要はありませんでした。私たちはGoogleにいましたが、私たちが言うところの象徴的な製品を構築したいという欲求がありました。象徴的な製品には二つの特徴があります。一つは市場に出て可能なことの認識を変える、あるいは物事を再考するということであり、このロボットはそうすることを意図していました。しかし二つ目は、単に格好良いだけでなく、有用であるということです。
それは本当に重要でした。なぜなら、最初のスタートアップであるFlutterはWebカメラを介したジェスチャー検出でした。マイクロソフトのKinectのようなものでしたが、単純なカメラを使用していました。そして私たちはハードウェアから学びました。誰も朝起きて「今日はジェスチャーを買うぞ」とは言いません。対して、人々は「床をきれいに保ちたい」と言い、ロボット掃除機または掃除機が必要だと言います。
それが、実際の問題を解決しようというアイデアが生まれた場所です。そして非常に異なる方法でそれを行う大きな機会があると感じました。自動運転車を例に、VSLAMのポイントを理解していない人々に明確にするために、自動運転車を構築しようとしている場合、GoogleマップとGPSがあります。GPSは車に位置を教え、Googleマップは車に行く場所を教えます。
室内環境では、ロボットがソファの右側にいるのか左側にいるのかをどうやって知るのでしょうか?GPSはなく、地図もありません。そこでVSLAMが本当に重要になります。ロボットが私たちのように家を探索し、地図を構築し、同時にその地図上で自分自身を特定する能力を与えます。
走行の比喩に戻るのは重要な比喩だと思います。テスラは数年前、AI Day 2022だったと思いますが、長い間前ですね、初めて「占有ネットワーク」について話しました。あるいは実際には前の会議だったかもしれません。いずれにせよ、彼らはこれに取り組んできましたが、その多くはボクセルベースのもので、周囲の空間と運転のダイナミクスについて異なる考え方をしていました。
車があなたの前に出てくることがあります。同様に、犬や子供などがロボットの前に走ることがあり、それは非常に迅速に反応できなければなりません。正直な答えは、テスラは私たちにとってインスピレーションであり、FSDチームはインスピレーションです。実際、アショックとDはマティックのユーザーです。それは私たちにとってとても嬉しいことです。珍しい仲間入りですね。
彼らに一つ送っただけですが、彼らが共有した占有ネットワークは私たちにとって大きな突破口でした。正直に言って、それは同様のものです。私たちには4つの主要なものがあります。一つ目は画像からボクセルへのネットワーク、二つ目は夜間と昼間のどのような照明条件でも機能する長期的なスラム、三つ目は鳥瞰図ネットワークです。このロボットは私たちと同じように上から45度の角度で世界を見て、ナビゲーションし障害物を作成することができます。そして明らかに制御の部分もあります。
アプリを見ると、それを見ることができ、周りを走り回っているのが見えます。自分自身が運転している様子が小さな鳥瞰図で表示されます。上部のカメラはなぜあるのですか?
良い質問です。多くの人は上部カメラはVSLAMを行うためにシーンを使用していると思いますが、その要素はありますが、実際にはそれが理由ではありません。私たちがそれを行った理由は、ロボットが完全に自律的で、本当に人間のように振る舞うなら、人間のように声とジェスチャーを理解するべきだからです。
時々、私はハスキーがいました。以前ゴールデンレトリバーを飼っていましたが、時々毛のボールが見えて「なぜロボットにここを掃除するように言えないのか」と思いました。私が別の人間に手伝ってもらっているなら、私はそうするでしょう。
私はまだそれを試していません。それは来る機能です。それが4つのマイクがある場所です。4つのマイクがあることで、声がどこから来ているかを知ることができます。「ここを掃除して」と言えば、ここに位置を特定します。
「ヘイ、マティック」と言うと、あなたの方を向き、あなたを見ているかのようになります。そしてこのカメラはそれがどこから来ているかを見て、ジェスチャーと人間を見て、「わかりました、そちら側に行きます」と言います。それが上部カメラの目的です。
それはとても素晴らしいですね。地上にあるものは、小さなライダーが立ち上がって周りを回転し、SLAMのようなことをするのを見たことがありますが、これははるかにエレガントです。人のように単にカメラを使用しているだけだからです。
素晴らしい点は、前面と背面に目があるので、後ろ向きにモップができることです。つまり、行動するときに自分の汚れの上を走ることなどはありません。それはすごいと思います。そして後ろのカメラは、狭いスペースに入った場合に出てくる必要があるので、車のように目があるとかなり役立ちます。
私たちが興奮していることの部分であり、私たちが考えた方法は、自動運転車のアナロジーを使用しても同様です。レベル5の車は人間のように運転する車を意味します。テスラのFSD V13はそこに近づいています。それは私たちのように運転し、私たちは皆魅了されています。
同じように、家庭用のレベル5ロボットとは何を意味するのでしょうか?レベル5の床掃除ロボットとは何を意味するのでしょうか?アイデアは、それが人間のように掃除し、振る舞うということでした。人間のように掃除するなら、なぜそれは一日23時間ドックにいるのでしょうか?一日中、時々出かけて汚れや汚れた場所を探し、見つけたら掃除すべきです。
ビジョンベースのシステムを持つことで、上から見て汚れを見ることができます。多くの場合、私たちが汚れを見る方法は、単に「これは昨日と違って見える」と言うことです。それが私たちのやり方です。私はハスキーを飼っていて、通常は毛の塊があります。見た目が違いますが、かなり明らかです。
それが最初のパズルの部分でした。人間のように掃除するなら、私たちはクローゼットから掃除機を取り出してクローゼットの横を掃除することはありません。ドックから離れて横を掃除するのは愚かなことです。どの部分の家が汚れるかを知り、そこから逆算する必要があります。
時間とともにそれを学ぶ必要があります。犬用のドアがあれば、そこを一日10回掃除するかもしれません。または玄関の近くを一日10回掃除するかもしれません。しかしベッドの下は週に一回か月に一回で十分かもしれません。優先順位をつける必要があります。
正直言って、他の掃除機の最も不満な点の一つは、彼らが間違いを犯し、その後文字通り毎日同じ間違いを繰り返すことです。カーペットの端が毎日同じ場所で引っかかるなど。この機械が学習して、もうその間違いを繰り返さないことを知れば、「ありがとう」と言いたくなります。
それがインテリジェンスの一部です。私たちを知的にするのは、間違いから学ぶ能力であり、決して間違いを犯さないということではありません。同じように、私たちにはここに二つの概念があります。一つは、それが学ぶことができるかどうか、そしてまた間違いを犯したとき、優雅に失敗できるかどうかです。
私はいつもその言葉「優雅に失敗する」を使います。このロボットにはかなり良いワイヤー検出がありますが、時にはワイヤーに絡まることもあります。時々間違いを犯すことは避けられません。
そのため、ジャムを認識し、自分自身を反転させ、ゆっくりと後退するアルゴリズムを構築しました。ほとんどの場合、それは自分自身を修正するので、ユーザーが介入する必要はありません。それがアイデアです。
実際それに気づきました。私はここにラップトップを差し込んだままにしているので、ワイヤーがちょうどここに掛かっています。それにぶつかり、それを取り込みましたが、その後それを元に巻き戻し、後退しました。実際にはそれを抜き取りましたが、それは何でもよかったのですが、実際にはうまく解決しました。それはあなたのコーナーケースですね、地面にあるのではなく、少し高い位置にあるのですね。
そのような小さなことがあり、それに取り組み続け、成長し続ける必要がありますが、ニューラルネットベースのアプローチの素晴らしい点は、それが向上し続けるということです。理解するために、11月に生産ロボットの出荷を開始して以来、25のアプリのアップデートと約22の異なるリリースを出荷しています。
次の6ヶ月で、テスラや他の無線更新と同様に、センサーではなく本当にソフトウェアアップデートなので、大幅に改善されます。それも重要なことの一つでした。iOSではTest Flightという名前のものを使用する必要があるからです。
基本的に、ソフトウェアアップデートをプッシュできますが、そうでないとAppleを通過するのに約1週間かかり、面倒です。私はAppleにプログラムしたことがあり、その痛みを知っています。ひどいです。
ユーザーのために、私たちのアプリは今App Storeにあるので、直接App Storeからダウンロードできます。もはやTest Flightを経由する必要はありませんが、Test Flightは常にApp Storeよりも速いバージョンを提供します。最初にTest Flightにプッシュされ、その後App Storeにプッシュされます。
Androidバージョンを準備中ですか?
開発中です。ちょうど作業を始めたところです。私たちのウェブサイトではQ3と言っていますが、4〜5週間でバージョンができる可能性が高いです。素晴らしいですね、それが次の目標です。
本当に大きな質問は、このマイクに加えてスピーカーがあるかどうかです。
あります。唯一欠けているのは、何か可愛い小さなことです。そうです。気づいたかもしれませんが、私たちがしたことの一つは、箱から出てくるときに「こんにちは」と言うことです。それがレビューの一部になるでしょう。押すだけで箱から転がり出て、最高にクールなことです。
設定してご案内しますので、またやってみてください。最終的に私たちがしたいのは、クリーニングヘッドが上下に動作して手を振るようなこと、そして小さな声を追加することです。まだそこまで至っていません。順番に小さなことをやっていかなければならないだけです。
将来のロードマップについてどれくらい話したいですか?以前議論したことを知っていますが、どれくらい話したいですか?それは高さに関係していると思いますが。
私たちが話した一つのことは、ロージー・ザ・ロボット(私たち全員が欲しい未来のロボット)を構築するためのアプローチです。私の意見では、人型ロボットに直接ジャンプするのではなく、それが広く普及するまで少なくともあと5年はかかるでしょう。それらは非常に複雑です。
そしてユーザーの側にも仮定があります。それは高価な製品であり、私のためにXYZをしなければならないので、より安価なものから始めることができます。人間の形をしていると、はるかに知的で、料理などもできることを期待するでしょう。
私たちはその未来に到達するでしょう。それはテスラのFSDのような努力であり、少し時間がかかるでしょう。あるいは自動運転車のような努力が少し時間がかかるでしょう。私たちのアプローチは、人間が行うこと、つまり子供を育てることを行うことでした。
これは5歳のハイハイする子供のようなものです。人間の子供の最初の5年間で、彼らはナビゲーションと3Dで世界を見る方法を学び、理解できるようになりますが、まだすべての意味論を知りません。植物が何であるか、チェリーが何であるかなどを知りません。ゆっくりと語彙を増やし、5歳から10歳の間に成長するにつれて、より高い視点で世界を見始め、基本的な操作ができるようになります。
おもちゃを片付けたり、靴を動かしたり、バックパックを取ったりできますが、料理や野菜を切るなどは信頼しません。そして15歳になると、すべてを信頼します。同じように、三段階のアプローチをとるのが良いと考えています。
最初は床掃除ロボットだけです。次の進化として、このロボットを多くの家庭に導入するにつれて、多くの親が「おもちゃ掃除ロボットをください」と言っています。レゴやおもちゃを掃除するロボットがあれば、幸せになれるでしょう。
あるいは、私たちが考えていなかった別のユースケースとして、多くの顧客が「このロボットにはカメラがあり、リモートで制御できます。フロリダの両親の家に置いて、彼らは年を取っているので、セキュリティではなくモニタリングデバイスとして使用できますか」と言っています。
私は彼らに実際にロボットを制御させて掃除させたくないかもしれませんが、それは有用なロボットなので、彼らはそれを兄のように考えるのではなく、役立つロボットとして考えるでしょう。そしてカメラがあるので、毎晩彼らが大丈夫かどうかを示す10秒のタイムラプスを提供するだけでいいかもしれません。それは興味深いユースケースでした。
このようなユースケースがあり、それが私たちがすることです。実際にはユースケースから始めて、そこから逆算していきます。これは本当に別の難しい学びの教訓です。Flutter時代にY Combinatorの一部だったとき、Paul Grahamはまだ周りにいて、いつも私たちを見て「あなたたちは技術で問題を探している。まだ見つかりましたか?」と言っていました。非常に重要な点です。
私たちはロボティクスの「ファイトクラブ」があるとしたら、消費者向けロボティクス会社を構築するための第一のルールは「消費者向けロボティクス会社を構築するな、製品会社を構築しろ」と冗談を言っていました。なぜなら、誰もロボットを望んでおらず、彼らは彼らの問題への解決策を望んでいます。ロボティクスは単に手段に過ぎません。
AIと人型ロボットはまだ問題を解決する方法に過ぎません。重要な部分は、あなたがどの問題に焦点を当てているか、そしてそれがあなたにとって十分に価値があるかどうかです。
これは最初に戻るような気がします。つまり、他の自動掃除機が抱えていた、あるいはまだ抱えている問題は、彼らが本当に私たちの問題を解決していないということです。特に子供や犬がいる場合など、家を掃除してほしいという切実なニーズがありますが、彼らはただ良い仕事をしません。
私が最初に気づいたことは、これについて考えないということです。それが周りを走り回るのは愛らしいですが、非常に静かでほとんど音を立てず、問題もありません。ただうまく解決します。袋が一杯になるか水がなくなる場合を除いて、それだけです。それ以外はただ仕事をするだけで、本当に注意を払う必要がありません。
自動運転車では、人々は運転したマイル当たりの「解除」を測定するのと同じように、私たちは「解除」または「強制介入」、あるいは掃除する平方フィート当たりの「立ち往生」を測定します。実際に、これを確実にするように努めています。
今、約700台以上のロボットを顧客に出荷し、約1000万平方フィートの掃除を行っています。使用状況は素晴らしく、人々はそれを愛しています。それは本当に良いことです。
多くの人々が理解するのが非常に難しい部分は、700台でも、私たちはすでにルンバとiRootに次ぐ二番目に大きなアメリカの消費者向けロボティクス企業だということです。シャークニンジャはまだ中国企業の一部であり、他のすべてはアジアまたは中国のブランドです。アメリカのロボットを考えると、それだけです。他の消費者向けロボットはありません。
マイティ・ボストン・ダイナミクスでさえ、最後に聞いた時点で物事が変わっているかもしれませんが、彼らは素晴らしく、素晴らしい技術を持っていますが、彼らの全歴史の中でわずか1500台のロボットしか出荷していません。
これについて少し前に話すつもりでしたが、あまり話題から外れたくないのですが、一つ目は、これにはJetson Orinが搭載されていますね?そうです、Jetsonです。非常に非常に洗練された脳を持っており、メモリのサイズは8GBですか、4GBですか?実際には4GBです。それはかなり小さいですね。ニューラルネットワークをハイパー量子化し、非常に効率的に実行し、それをプッシュします。
理由は私たちの生活を困難にしたかったからではなく、本当に手頃な価格のロボットを作ろうとしているからです。NVIDIAとコンピュート(計算)は消費者向けではまだ高価です。実際、より実質的なボードはより多くの電力も必要とします。常にエネルギー予算があります。
幸い、掃除機自体は多くの電力を必要とするので、NVIDIAに比べてもまだ良いです。それは良いことですが、どれくらい大きな地図を構築できるかという要素があります。4GBのメモリで5,000平方フィートは簡単にできます。24,000平方フィートのオフィス全体も地図化しました。しかし、それは少し遅くなります。
前述のように、1cmのウォーク(移動)ができます。より高いコンピュートがあれば、約5mmまで下げることができます。このクラウンは、ちょうど人間の子供のように成長し、成長するにつれて完全な情報をキャプチャします。技術的には、このクラウンを手に持ち、周りを歩いて部屋全体の360度ビューを構築するデモがあります。
6自由度で、非常に早い段階で考えたのは、ロボットに目を与えることができれば、それが見ることができるなら、ナビゲートできる、それが見ることができるなら、掃除できる、それが見ることができるなら、操作できる、避けることができる、すべてが可能だということでした。それは本当にビジョンについてだけです。
ほとんどの人は気づいていませんが、私たちの脳の60%は視覚皮質に使われています。私たちは主に視覚に基づく動物であり、必ずしも他のセンサーに基づくわけではありません。それは非常に重要です。
他のロボット会社は「夜間に実行できる」と言っていますが、できません。彼らは物にぶつかり、泣き、多くの騒音を立てます。これは実際に夜間に実行できます。朝6時に開始するように設定しているので、私たちが起きる前に既にいくつかの部屋が掃除されています。私のは午前2時に設定されています。
もっと大胆になります。少し怖かったのですが、全く問題ありません。私たちは部分的に午前2時にしました。なぜなら、熟睡中で聞きたくないと思ったからです。また、家によっても異なります。私たちはランチスタイルの家なので、寝室は少し離れているので、実行しやすいです。
メインエリアを朝に掃除し、寝室はベッドの周りを走り回ってほしくないので後にするかもしれません。それも本当に素晴らしいです。現在、ドックを実際に自己離れて周りをドライブするようなことをしますか?
それは来る機能です。基盤が構築されたので、現在取り組んでいることがいくつかあります。最後のリリースで、やっと台所の下に入る機能を提供しました。それをしないことに気づきましたが、その後それをすることに気づきました。
エッジの掃除とキッチンキャビネットの下のスペースを別々に行っています。なぜなら、ロボットに制御を与えることができれば、多くの人が単にロボットが勝手に掃除するのではなく、どこを掃除するか、何を掃除するか、いつ掃除するかを正確に伝えたいと気づいたからです。
時には、キッチン全体を掃除してほしくない、キッチンキャビネットの下のスペースだけを掃除してほしい、またはエッジだけを掃除してほしいという場合があります。それらの別々のアルゴリズムを作成しているので、ユーザーが実際に制御できるようになり、それが何をしているかを示すことができます。それが私たちが今可能にしたことです。
次に構築しようとしているのは、床とそうでないものを区別するネットワークです。それにより、紙やクレヨンなど、平らなものを避けることができます。私は袋小路に住んでいて、山の中の小さな未開発地があるので、ネズミの問題がたくさんあります。多くの従来のロボットはそれらの粘着トラップに乗り、同様に引っかかってしまいます。
床には多くのランダムなアイテムがあり、それらを避けたいと思っています。そこで、何が床で何がそうでないかを理解することで、何が掃除可能で何がそうでないかを理解します。紙やノートブックなら掃除しないでください。そしてそれは非常にダイナミックになる可能性があります。なぜなら、子供やペットがおもちゃを持ち出して散らかすことがあるかもしれません。昨日はなかったものが今日はあるかもしれません。
時には人々は床に巨大なパズルを組み立て、それらのパズルが吸い取られたり、押しやられたりしないようにしたいことがあります。または時にはあなたの犬が、あなたの掃除機が犬の糞を通って運転するようなTikTokビデオを本当に望んでいません。
そこでネットワークが必要です。次に、何が汚れで何がそうでないかを教えます。そうすれば汚れを検出できます。ワインのシミとケチャップのシミでは、ケチャップのシミの方が厚いので、12回のパスが必要です。もしあなたがそれを掃除しているなら、行ったり来たりします。しかしワインのシミやコーヒーのシミなら、実際に6回のパスで済むかもしれません。それでそのシミがなくなったことを知る必要があります。
シミの検出、シミの掃除、なくなるまでのモッピング、そのような機能がすべて来ています。そして最終的には、もし簡単に動かせるものがあれば、そのうち道をどけることができるかもしれません。部屋の真ん中に靴があれば、それを脇に押すことができます。それも素晴らしいでしょう。それはすでに少し整理しながら掃除し始めています。
そのような機能がすべて来ています。私が最も興奮しているのは、声とジェスチャーです。「マティック、キッチンを掃除して」「リビングルームを掃除して」と言えるかどうかです。そして最後の一つは、これに関連しているのは、今私たちがしていることです。
各ウォークからビジョン言語モデル(VLM)からの埋め込みと視覚情報を抽出し、ウォークレベルで追加しています。各ウォークは椅子の脚やロボットのおもちゃに属していることを知るでしょう。だから意味的な情報を持っています。
それについて考える方法は、現在のロボットは私たちの猫や犬と同じ知能を持っています。彼らはぶつからずに周りをナビゲートできますが、私たちは猫に「リビングルームのソファに行け」と言うことはできません。彼らはその理解を持っていません。しかし、私たちはロボットにその理解を与えたいと思っています。
そうすれば、「リビングルームに行ってコーヒーテーブルの周りを掃除して」または「オフィスに行って本棚の周りを掃除して」のような非常に具体的な指示を与えることができます。それにより、私たちの最終的な目標に近づきます。アプリの代わりに、視覚的で地図があるかもしれませんが、チャットGPTのようなチャットウィンドウがあり、単に何をすべきかを伝えると、それが機能します。
学校やオフィスにいても、「あ、キッチンを掃除してほしかった」と思ったら、「ヘイ、キッチンを掃除して」と言えます。基本的にアプリを開いてキッチンの部屋をクリックして指示することは既にできますが、それを非常に自然にします。最高のインターフェースは音声インターフェースであり、アプリさえ必要ありません。「ヘイ、家を掃除して」または「キッチンを掃除して」と言うだけです。
一つ質問させてください。私たちは2階建ての家で、1階に置いています。それはマッピングします。それを1階に持っていってマップするように指示すれば、それをしますか?
そうです。それを1階に持っていき、マップ設定に行くと、「新しいマップを追加」と表示され、新しいマップを追加します。その機能は必要ないかもしれませんが、それをシンプルにします。別の場所にいることを自動的に認識し、構築を開始することができますが、それはユーザーにとって少し混乱するので、シグナルとして「新しいマップを追加」を追加しました。
一度それを行うと、複数のマップを保存できます。10個のマップまで保存できます。フロア間を移動すると、各フロアに基づいて自動的に再ロードします。「1階のマップに行く」または「1階のマップをロード」または「2階のマップ」と言う必要はありません。そこに置くだけで自動的に認識します。そのため、マルチマップのサポートは既にあり、それは機能します。
このものでいくつかのトリックを見せてもらえますか?その前に、これを皆に見せなければなりません。これは愛らしいと思います。あなたは少しイーロンのようなところがあります。あなたのマティックと一緒に、まだ組み立ててはいませんが、小さなレゴバージョンと3Dプリントされたキーホルダーがあります。
ちなみに、マティックを飾ることができます。私たちのものは「WALL-E」と呼んでいますが、おそらくあまりユニークではありませんが、WALL-Eは面白いと思いました。「こんにちは、私の名前は」のように、WALL-Eと書いて側面や上部に置くことができます。
これは二つの理由で行われました。一つは、人々はそれに名前を付けるのが好きであり、アプリ自体でも近々名前を付けられるようにする予定です。それは近々来る予定です。二つ目の理由は、多くの子供たちが最初は少し不安を感じるということに気づいたからです。このステッカーを貼り、彼らがステッカーを貼ることで非常にフレンドリーになります。彼らがステッカーを貼り、それを認識すると、非常に心地よく感じます。
持ってきませんでしたが、小さな目玉シールもあり、人々はそれを貼って目を付け、小さな可愛らしい目を付けます。そうすると小さな子供たちもとても親しみを感じます。実際、私たちは逆の問題を抱えています。多くの人々がこの電源ボタンにロックを作るよう要求しています。子供たちが来て押し続けるからです。
ペットも実際にそうしますか?
はい、ペットも。顧客の一人の猫が常にそれをノックしていました。おそらく30秒ほどの時間遅延を追加する必要があるでしょう。長押しするようにする必要があります。それは非常に面白いですね。
予想していなかったことがありますが、なぜこれなのか?
最初の部分は楽しみのためだと思いますが、二つ目の部分は、少なくとも初期の顧客は通常物事に非常に熱心であるというアイデアでした。これは私たちの感謝の気持ちを伝え、歓迎する方法でした。
そしてこれは、もしそれをパーソナライズすれば、それがあなたの家に属し、あなたのものであるという感覚になるというラインに沿ったものでした。その所有感のパズルは本当に重要です。多くの人々はいずれにせよそれをします。
このアイデアは、初期の顧客の一部が実際にステッカーを印刷して自分で貼り始めたことから来ました。一人の顧客は小さな帽子も付けました。それは素晴らしいですね。小さなカウボーイハット。そのようにして私たちはアイデアを得ました。人々はいずれにせよそれをしているので、ステッカーを提供することでそれを簡単にすることができるのではないかと。素晴らしいです、それが好きです。
いくつかの素早い部分ですが、飛行機の機能を試したことがありますか?これはあなたの家の完全な理解を与えます。このアプリをこれほど深く調べたことがないのですが、それはクールですね。3D家の鳥瞰図を与えます。
ズームイン、パン、チルトなどができるので、ロボットがどこにあるか正確に表示します。それが飛行機が意味することです。私はそれが飛行機モードだと思い、触りたくありませんでした。単に飛行物です。そして、ここで動的に表示されるのが見えます。あなたが動くと、それはそこにあります。
そしてこれは意味的なビューですが、それも見たことがありますか?
見たことがありません。これは硬い床とカーペットとしてそれを認識し、それが完全な理解を与えます。どれが何ですか?それはレイヤーです。
そしてこれはロボットに追従したい場合に異なる視点を与えます。これはロボットを追跡しています。最高の部分は、完全な地図があるので、地図上のどこでも長押しして「ここに行け」「あそこに行け」と言うことができ、それは文字通り経路を作成します。
「おっと、ワイヤーがあります」。これは実際に良いことです。昨日はなかったワイヤーがあります。「行けますか?」いいえ、いいえ。うまくいけば別の方向に行く必要があることを認識するでしょう。長い道のりを行かなければならないので…今やり直しました。そしてそれは自分自身を再マッピングしました。これはすごいです。
それはとても素晴らしいです。それは良いテストでした。予期せぬことでしたが、はい、それで良いテストになりました。それは素晴らしい部分の一つです。今は止めておきます。他の素晴らしい部分を見せました。
視覚的なマップに戻しましょう。このカーペットのどこかに汚れがあるとします。ここで私ができることは、「エリアを掃除」と言い、このペンシルをタップして円を描き、「これを掃除」と言うことです。単に「掃除機」と言うと、それは戻って「わかりました、そのエリアを掃除します」と言います。
両方と言えば掃除機と拭き掃除をするのですか?
両方と言えば、それを始めますが、自動的にカーペットでは拭き掃除ができないことを認識します。それは理解していますね。最初のマッピングを行うとき、カーペットのエリアを区切ってくれます。
両方と言えば、カーペットではモップできないことを自動的に知ります。そして見ることができますが、ここにも昨日はなかった障害物があります。これらの小さなバスケットのようなものがそこにあります。それは素晴らしいです。それらはこの地図上でリアルタイムで見やすく表示されます。
このバスケットを少し動かしたらどうなるでしょう。こんにちは、コナ(犬の名前)。そしてそこにいます。今、それらは実際に消えて、それが周りを移動すると、それらはそこから消えています。そして実際にその領域も掃除します。
最初はブロックされていたとしても、それを理解するのですね。その通りです。特にペットや子供がいる場合、これは本当に重要でした。時にはペットや子供がいるので、「このエリアを掃除していなかったので、行って試してみよう」と覚えています。それは素晴らしい部分でした。
そしてコナはとても快適です。静かで、簡単にチャットできます。ETAがすぐに表示され、何を掃除したか正確に示します。それは本当に素晴らしい部分です。ETAも本当に素素敵です。それは素晴らしいと思いました。掃除を始めると、「2時間かかります」のように表示されるので。
自動運転車と同様に、充電が必要な場合は、中断したところから再開できることも知っています。それらのことも本当にうまくやっています。
一つの素早いトリックを見せましょう。3Dマップに戻ります。今、それはこのカーペットの上にありますね。これを持っていてもらいます。ロボットはどこにいるかわかりません。すべてのカメラが覆われています。これを持ち上げて、どこか別の場所に移動させましょう。あなたのキッチンに移動しましょう。
どこに住んでいるかを把握するのにどれくらい時間がかかりますか?
それでも、リビングルームにいると思っていますね。これをどけてみましょう。2、3、4、5…そこです。実際に認識しました。今はあそこにいます。それはすごいです。それは本当に印象的です。すぐに。
それは本当にクールです。コンピュータビジョンとロボティクスにおける最も難しい問題の一つで、文字通り「誘拐問題」と呼ばれています。ロボットを誘拐した場合、それがどこにいるか把握できるかどうかということです。
それは下の階に行く場合にも重要です。下の階に置くと、それが下の階にいることを知る必要があります。正確にその通りです。人間と同様に、それがどこにいるかを知る必要があり、そうすればドックや周りの場所に自分で戻ることができます。
それは重要です。なぜなら、特に異なる照明条件や環境の変化の中で、それが何であるかを知る必要があります。晴れた日や低照度の日にマッピングしたかどうかは関係ありません。
実際、タイミングを考えると、夜でした。かなり暗く、ただいくつかのライトがあるだけでした。今日は明らかに照明が異なります。外は非常に素晴らしいです。それがアイデアでした。それは重要なパズルの一部でした。なぜなら、今あなたはそれにどこに行くべきかを正確に伝えることができるからです。
視覚的なマップ、それが正確にどこにいるかを知ることができるということはすべて、それが実際に行っていることを行うことができる理由の一部です。
最後に何か言いたいことはありますか?一部のことを削って、トリックをしていますが、あなたの母親になぜこのロボットを手に入れるべきかを伝えるとしたら、何と言いますか?
それは静かで、より良く掃除するからです。ほとんどのロボット掃除機よりも良いと思います。夜間に掃除できるので、きれいな家に目覚めることができます。大きな車輪とインテリジェンスを持っているので、あなたが常に救助する必要なく、家のどの部分もナビゲートできます。
それが美しい部分です。見た目がきれいで、裸足で歩くと触れるとき、モップができるので、クリーンな感触です。ノイズ的にもきれいで、そして近々液体に小さな香りを加えるので、本当に良い香りがします。
私はそれを持っています。ファニーズかなにかのおすすめでした。ただ少しだけ。まだそこに至っているところです。私の考えでは、最高の部分は、ほとんどの人が気づいていないことですが、実際に内蔵のHEPAバッグフィルターがあることです。
ユーザーからわかったのは、ほとんどの顧客は実際にフィルターを交換せず、忘れてしまうということです。それを取り出して洗うのは面倒な作業です。各バッグには新しいフィルターが付いています。このポストコロイド(コロナ後)の世界では、アレルゲンやすべての細菌が常に捕らえられるようになっています。
ちょうど花粉のシーズンが終わったところですね。数週間前なら、これは非常に役立ったでしょう。花粉を吸い取るので。正確にその通りです。空気をきれいに保つ。ロボットはあらゆる種類のものをきれいにするべきだというアイデアがありました。空気、ノイズ、床。素晴らしいです。
ありがとうございました。本当に感謝しています。訪問していただきありがとうございます。これは素晴らしいです。
美しい場所です。招いてくれてありがとう。もちろんです。
皆さん、説明欄にこのリンクを探してください。あなたのXリンクなどの他の良いものも残しておきます。はい、これらは今注文できます。2〜4週間で出荷されます。関税のために価格を上げなければならなくなる前に手に入れてください。
しかし、これは米国で組み立てていますよね?
そうです。それが私たちがより良い立場にいる理由の一つです。それは私たちが実際に行いたかった最大のことの一つでした。米国で組み立てられており、可能な限りここで製造したいと思っています。仕事を戻すなど。それは一つの基準でした。
そこにあります。アメリカの製造業も助けているのですね。素晴らしい。皆さん、本当にありがとうございました。マティック・ロボティクスをぜひチェックしてください。次の動画でお会いしましょう。さようなら。ありがとう。さようなら。

コメント

タイトルとURLをコピーしました