これは2030年に向けた技術開発を行う10のAI企業について紹介した動画の書き起こしである。OpenAIのような有名企業とは異なり、多くの人々が知らない革新的なAI企業群を取り上げている。脳コンピューターインターフェースのNeuralink、屋根工事自動化のRenovate Robotics、軍事用自律システムのShield AI、倉庫ロボティクスのCovariant、防衛技術のAnduril、AI専用チップのCerebras Systems、軍事用マイクロドローンのBlack Hornet、AIショッピングカートのCaper、そして汎用ロボティクスのPhysical Intelligenceまで、幅広い分野で世界を変える可能性を秘めた企業たちの技術と展望を詳しく解説している。
皆さんはOpenAIのことはご存知でしょうが、世界を静かに変えようとしている多くのAI企業があることを知らない方がほとんどだと思います。今日の動画では、皆さんがおそらく存在すら知らなかった10のAI企業をご紹介します。
まず最初の破壊的企業として、実際にご存知かもしれないNeuralinkがあります。この企業は本当に素晴らしく、麻痺のある人々、動くことができない人々が、思考だけでコンピューターや携帯電話を使えるようにしているのです。SFのように聞こえるかもしれませんが、これは現実なのです。
手術では特別なロボットを使用して極細のワイヤーを正確な位置に配置します。これは人間ができることより10倍、いえ100万倍も正確です。そして将来的には、これらの能力を失った人々が再び見たり、聞いたり、動いたりできるよう支援する可能性があります。この種の脳チップを小型化し、ワイヤレス化し、実験ではなく実際の人々に使える状態にした最初の企業の一つなのです。
簡単に言えば、Neuralinkは人々が思考でデバイスをコントロールできる脳チップを作っており、これは障害のある方々を含めて私たちの生活を変える可能性があります。皆さんはどう思われるか分かりませんが、私はこれは非常に素晴らしく破壊的だと思います。
次にお話ししたい企業はRenovate Roboticsという会社です。これは屋根工事の自動化に焦点を当てたアメリカを拠点とするスタートアップです。Renovate Roboticsは2021年に設立され、ニューヨークのブルックリンで運営されています。
ではRufusは具体的に何をするのでしょうか。Rufusは住宅屋根へのアスファルトシングルの設置を自動化するよう設計されており、将来的には追加の屋根作業も扱う予定です。
主な目標は生産性の向上です。屋根職人は人間の屋根職人より最大3倍速くアスファルトシングルを設置でき、屋根工事チームの生産性を効果的に2倍から3倍にします。また、労働者が危険な傾斜屋根表面で過ごす時間を減らすことで安全性も向上させます。屋根工事業界で高い怪我や死亡のリスクを軽減します。
これは労働力不足にも対処します。熟練した屋根工事労働者の不足により、Rufusは請負業者がより少ない人数でより多くの作業を完了できるようにします。また品質も向上させます。RufusはマシンビジョンとAIを使用してシングルが正確かつ一貫して設置されることを保証し、設置品質を向上させ、保証のためのデータを提供します。
Rufusはマシンビジョンを使用します。カメラとAI搭載のコンピュータービジョンを使って屋根セグメントのシングル位置を見て、各シングルの正確な配置を保証します。また自律ナビゲーションもあります。ロボットはウィンチベースのガントリーシステムを使用して屋根面をナビゲートし、XおよびY軸を移動し、屋根のレイアウトと障害物のリアルタイムAI分析に基づいてパスを調整します。
屋根はまた、保険および保証提供者と共有して屋根の品質と完全性を検証できる設置データを記録します。これがどのように展開されるかというと、Renovate Roboticsは当初、パートナー請負業者と屋根工事を完了する下請け業者として屋根職人を使用する計画です。
また、サービスとしてのロボティクスもあります。長期的には、Renovateは屋根請負業者にRufusロボットをリースし、大きな初期投資なしに生産性と安全性を向上させることを計画しています。
今日、私たちはRufus V1を発表します。このシステムは今年初めにお見せしたシステムより半分の重量で、より信頼性が高く、より速く、より正確です。このロボットは大きな建物で優秀な性能を発揮します。複数世帯のアパート建物、大きな家、その他の商業建物などです。12対12の傾斜まで作業でき、これらの大きなプロジェクトで請負業者の生産性を最大化するのに本当に役立ちます。
この新システムのもう一つの利点は、はるかにモジュラーだということです。エンドエフェクターを素早く交換できるので、異なるプロセスをテストできます。現在はシングル設置に焦点を当てていますが、シングル除去、ソーラー設置、屋根上のその他のプロセスも実行できるようになります。屋根工事の未来に興奮している請負業者の方は、当社のウェブサイトやLinkedInでお気軽にお問い合わせください。
次にお話ししたい企業はShield AIです。Shield AIは具体的に何をするのでしょうか。Shield AIは軍事および政府用途向けの人工知能と自律システムを専門とするアメリカを拠点とする防衛技術企業です。2015年に設立され、カリフォルニア州サンディエゴに本社を置くShield AIの使命は、最も困難で争いのある環境で動作できるインテリジェント自律システムを開発することで、軍人と民間人を保護することです。
Shieldの主力AI製品はHivemindという先進的な自律性とAIソフトウェアスタックです。Hivemindは航空機、ドローン、その他の車両を完全に自律的に動作させることができます。つまり、GPS、通信、直接的な人間の制御なしに、ナビゲート、意思決定、ミッション実行をすべて行えるということです。この技術はクアドコプターから戦闘機まで幅広いプラットフォームで動作するよう設計されています。
同社は自律航空機一式も開発しています。Shield AIのHivemindソフトウェアは自社および第三者の航空機の両方に統合でき、群れ操作、無人チーミングを可能にします。ソフトウェアは異なる機体にわたって迅速にスケールするよう設計されており、迅速な展開と統合をサポートします。
Shield AIの技術はアメリカ軍と世界中の同盟軍によって積極的に使用されています。Shield AIは経路計画、マッピング、コンピュータービジョン、強化学習を備えたAIを使用して、無人システムが最小限の人間の監視で複雑なミッションを実行できるようにします。
彼らの言葉を聞いてみましょう。私たちの自律能力とシステムに提供するAIの主要な差別化要因は、システムが回復力のあるインテリジェントな方法で動作する能力です。つまり、本当に自分で考え、変化する条件に適応し、人間の入力があってもなくても動作し、通信が劣化または拒否される条件、外部情報が利用できなくなる可能性がある条件をナビゲートできることです。これらのシステムは互いに通信できなくても動作できます。そして互いに通信できるときは、チームとして進歩し調整できます。
VBATチーミングは、GPSに依存せず、代わりに共有センサー観測を使用してその共通作戦図を構築する状態推定フレームワークを使用し、その上に構築された協調計画フレームワークが通信損失を予期することで、通信およびGPS環境での動作を可能にします。
VBATチーミングについて興奮することの一つは、能力の展開方法でもあります。私たちは生産ラインから出てくるあらゆるVBATに搭載できるペイロードに私たちのAIパイロットを組み込んでいます。この変革的能力は小さなモジュラーペイロードで実現できます。チーム内のすべてのVBATが独自のAIパイロットを取得します。
このモジュラーペイロードは当社の最新VBATプラットフォームのいずれにも内部に取り付けられます。CPUとGPUを備えたXavier NXコンピュートモジュールが含まれており、自律アルゴリズムを加速し、周辺機器とのインターフェースを可能にするキャリアボードが含まれています。基本的に、私たちは数百または数千のVBATのVBATチーム向けにスケールするようHivemindアーキテクチャをゼロから構築しました。
元リトルバードパイロット司令官、特殊作戦航空連隊として言えることは、VBATチームは他のすべての自律チームが測定される基準になるだろうということです。
さて、次に見るべき企業があります。この企業は経済のバックボーンになる可能性があると思います。なぜなら、この企業ができることは驚異的だからです。この企業はCovariantと呼ばれ、カリフォルニア州エメリービルに設立されたアメリカのAIおよびロボティクス技術企業で、2017年に設立されました。特に倉庫やフルフィルメントセンターにおいて、動的な実世界環境でロボットが複雑なタスクを実行できるAIシステムの開発におけるリーダーです。
Covariantは何をするのでしょうか。CovariantはRFM1という大規模汎用AIモデルを構築し、ロボットに人間のような推論能力を与えます。これらのモデルは、実際の倉庫運営から収集されたテキスト、画像、動画、ロボットアクション、センサーデータを含む大規模で多様なデータセットで訓練されています。
同社の主力プラットフォームはCovariant Brainと呼ばれています。これはロボットが物理世界で見て、推論し、行動できるようにする汎用AIシステムです。ピッキング、ソート、デパレタイジング、キッティング、オーダーインダクションなどの幅広いタスクをロボットが処理できるようにし、しばしば速度と信頼性で人間を上回る性能を発揮します。
Covariantの技術は倉庫に広く展開されており、ビンからアイテムをピック・ソートするロボットアームやシステム、在庫管理、変化するSKUやワークフローへの適応を動力として提供しています。AIによりロボットはタスクを迅速に学習し、フリート全体で学習を共有でき、物流、eコマース、小売業務において自動化をより柔軟でスケーラブルにします。
CovariantはABBやNAPなどの主要な自動化および物流企業とパートナーシップを結び、グローバル小売業者やフルフィルメント提供者が使用するロボットシステムにそのAIを統合しています。彼らの技術は労働力不足と変動する需要に対処するため、トップフルフィルメント企業から信頼されています。
ロボティクス基盤モデルは世界中の数十億のロボットを動力する可能性があります。CovariantのRFM1は、ロボットに人間のような推論能力を提供するロボティクス基盤モデルです。このモデルは柔軟で信頼性の高いロボットシステムの次世代をアンロックすることで、可能性の新しいフロンティアを設定しています。生成AIが商用ロボットに言語と物理世界のより深い理解を与えることに初めて成功したことを表しています。
ロボットが物理世界について推論するためには、環境内の物体とそれらの物体がロボットの行動にどのように反応するかについての細かく訓練された理解が必要です。従来のコンピューターベースのシミュレーションは、ハードコードおよびプログラムできるものに限定されています。一方、今日の生成AIモデルはテキスト、画像、特定のパラメータ内で動画を生成できます。しかし、ロボティクスに焦点を当てた必要なデータセットが不足しているため、現実的なロボットアクションの動画を生成することはできません。
ロボティクス基盤モデルが物体力学の細かいシミュレーションを生成するために必要なデータは、ロボットシステムの実世界展開を通してのみ見つけることができます。2017年以来、Covariantは世界中の実世界倉庫環境にAI搭載ロボットを展開することで、世界最大のマルチモーダルロボティクスデータセットを開発してきました。
RFM1はCovariantの実世界データセットで訓練されたロボティクス基盤モデルであり、ロボットが意思決定を行うために必要な幅広い情報を含んでいます。RFM1の物理学の理解は動画の生成を学習することから生まれます。モデルはAI生成動画を通じて、物体がロボットアクションにどのように反応するかを予測できます。この動画はRFM1によって生成されました。
これは、ロボットがビンからポリバッグ包装のアパレルアイテムをピックアップし、スキャンテーブルに置いてからコンベアに押し出される様子を示しています。これは複数の物体が複数のコンポーネントと相互作用する複雑なシーンで、動画として予測的に生成されています。その隣に、実際にキャプチャされた動画を見ることができます。
このロボットのピック・アンド・プレースアクションには、RFM1によって生成されるいくつかの部分があります。ピッキングアクションから始まり、この動画はビンからアイテムがピックアップされる様子を予測的に示しています。RFM1はこのピックをシミュレートするために、意図されたロボットアクションの解釈やアイテムのピック方法の決定など、いくつかの重要な要素を予測します。RFM1は物体が操作された後にシーンがどのように変化するかも予測できます。
例えば、RFM1はこのアイテムが取り除かれた後にビンがどのように見えるかを予測します。そのマルチモーダルなエニータイムセットアップのおかげで、RFM1は世界が毎秒毎に変化する様子をシミュレートする動画予測モデルだけではありません。ロボットのアクションの結果として、ロボットの前のビンが3秒後にどのように変化するかも直接予測できます。
ハイレベルな世界モデルとして機能し、モデルは規定されたロボットアクションを理解し、将来の結果について推論できます。ここでは、規定されたロボットアクションが実行された場合にビンがどのように見えるかをモデルが予測している画像を示しています。これはRFM1が物体の恒久性の概念を持っている新興能力を示しており、触れられていない物体は変化しないことを理解していることを意味します。
RFM1は操作時に物体がどのように動作するかを予測できます。システムとアイテムの物理学の複雑さのため、これらのシナリオを従来のシミュレーション方法を使用して大規模に予測することはほぼ不可能でしょう。RFM1は今後数十年にわたって生産性と経済成長を向上させ、高度に反復的で危険なタスクに従事することを望む労働者の増大する不足に対処する、柔軟で信頼性の高いロボットシステムの新世代を表しています。
実際に聞いたことがあるかもしれない別の企業はAndurilと呼ばれます。Anduril Industriesは、Oculus Riftの作成者であるパルマー・ラッキーによって2017年に設立されたアメリカの防衛技術企業です。Andurilは軍事および国家安全保障用途向けの先進的自律システム、人工知能、ロボティクスの開発を専門としています。
使命は、従来の動きの遅い防衛セクターにシリコンバレースタイルのイノベーションとスピードを導入することで、アメリカと同盟国の軍事能力を近代化し変革することです。同社は自社の資本を研究開発に投資し、政府契約を求める前に完成品を構築し、展開による迅速な結果に焦点を当てることで注目されています。
Andurilは何をするのでしょうか。Andurilは自律無人航空システムと対UAVシステム、自律監視塔、持続的監視と戦力保護のためのセンサーを構築しています。またLattice OSと呼ばれるものもあります。これは彼らのコアソフトウェアプラットフォームです。Latticeは、Anduril自身のものと第三者のデバイスを含む数千のセンサーからのデータを融合するAI搭載コマンド・アンド・コントロールシステムで、オペレーターにリアルタイムの状況認識、ターゲット検出、自動化された意思決定支援を提供します。
Andurilのシステムは国境、軍事基地、重要インフラの監視に使用され、先進的コンピュータービジョンとセンサー融合を使用した自動検出、追跡、物体分類を提供しています。これは20億ドル以上のベンチャーキャピタルの支援を受け、2024年8月時点で140億ドルの評価を受けている素晴らしい企業です。
Andurilは基本的に軍事的焦点について公然としており、ロシアや中国などの敵対者に対してアメリカとその同盟国を技術的に優位に保つことを目指しています。最近では、戦争の未来を絶対に変える可能性のある自律戦闘機を発表し、これは間もなく飛行予定です。
確かに革新的な企業です。彼らの取り組みに注目すべきです。次に、チップの分野を本当に変える可能性のある企業を見てみましょう。これは実際にNvidiaに挑戦しようとしている企業です。
これはCerebras Systemsと呼ばれる企業です。彼らは世界で最も強力なAIハードウェアとシステムの構築を専門とする先駆的技術企業で、従来のコンピューティングハードウェアでは達成できないレベルまで人工知能と深層学習ワークロードの加速に焦点を当てています。2015年にAndrew Feldmanなど多くの人々によって設立され、カリフォルニア州サニーベールに拠点を置いています。
Cerebrasが行うのはウェーハースケールエンジンです。これまでに構築された最大のコンピューターチップで最もよく知られています。小さな別々のチップから作られる従来のプロセッサとは異なり、WSEは全体のシリコンウェーハーから構築され、単一の巨大なAIプロセッサとなります。
最新バージョンのWSE-3がCS-3システムを動力し、AI推論と訓練のベンチマークを粉砕します。CerebrasはそのWSEチップを専用AIシステムCS-1、CS-2、CS-3にパッケージ化しています。これらは高性能AI訓練と推論用に設計されています。これらのシステムは、医学研究、暗号学、エネルギー、科学計算などの分野の組織によって、オンプレミススーパーコンピューターの構築やクラウド提供を通じたAI電力へのアクセスに使用されています。
同社のハードウェアは、自然言語処理やコンピュータービジョンで使用されるような大規模AIモデルの訓練プロセスと展開を劇的に高速化するよう設計されています。例えば、WSE-2チップを搭載したCS-2システムは85万のAI最適化コアを特徴とし、従来のGPUクラスターよりもはるかに高速に数十億のパラメータを持つモデルを訓練できます。
Cerebras systemsはスペースと電力効率の良いパッケージでスーパーコンピューターレベルの性能を提供し、顧客が従来のデータセンターと比較して、より少ないマシンとより低いエネルギー消費で同じ計算出力を達成できるようにします。ハードウェアに加えて、CerebrasはSeoftと呼ばれるソフトウェアプラットフォームとクラウドベースのソリューションを提供し、研究者や企業が物理インフラを管理する必要なく彼らの技術を活用できるようにしています。
共有ビジョンから、Cerebrasの創設者たちは想像を絶するものを構築するために団結しました。彼らはより良いものを構築し、世界で最大、最速のチップを作成できると信じていました。ウェーハースケール統合はかつて不可能と考えられていました。しかしCerebrasは不可能を現実に変えました。その種では最大のチップです。それは人間の創意工夫と野心の証です。
スーパーコンピューターを動力し、AI能力の最前線を推進するチップです。ウェーハースケールエンジンは、最も困難なAIワークフロー向けの最大のAIスーパーコンピューターを動力する最大のAIチップです。産業、科学、グローバルイノベーション全体の進歩を推進しています。CerebrasはAIの未来を形作っているだけでなく、想像し、革新し、インスピレーションを与え続ける次世代にインスピレーションを与えています。
Cerebrasは私たちの革命的なコンピューティングでAIの未来を動力しています。シリコンバレーで設計され、アメリカで組み立てられ、世界のために構築されました。共に、私たちは可能性の限界を押し広げることができます。
Black Hornetは、戦場での秘密偵察と状況認識のために設計された超軽量手のひらサイズの軍事マイクロドローン、ナノ無人航空機またはUAVのシリーズです。もともとノルウェーのProx Dynamics ASによって開発されたBlack Hornetラインは、現在Teledyne TechnologiesのTeleflir Defenseによって生産され、さらに改良されています。最新モデル、特にBlack Hornet 4は、自律性、ナビゲーション、ミッション効果を向上させるためにAIを活用しています。
実際にこれがAIをどのように使用するかというと、最新モデル、特にBlack Hornet 4は、自律性、ナビゲーション、ミッション効果を向上させるために人工知能を活用します。ドローンは事前プログラムされたミッション用のAI搭載システムを使用し、特定のルートに従い、障害物を回避し、一定のオペレーター入力なしに変化する環境に適応できます。
また衝突回避もあります。AIはオンボードの視覚および赤外線カメラを使用して、複雑な都市または屋内環境でもリアルタイムの障害物検出と回避を可能にします。
またGPS拒否動作もあります。Black HornetはGPSが利用できないまたは妨害された環境でナビゲートしミッションを完了でき、AIとオンボードマッピングに依存します。また認知負荷の軽減もあります。AI統合により、ドローンは複雑なタスクを自律的に処理でき、手動制御の必要性を最小限に抑え、兵士がミッションに集中できるようにします。
またリアルタイムデータ分析もありました。ドローンはライブビデオ、サーマル画像、スナップショットを処理および送信でき、多くの場合AIを使用して画質とターゲット識別を向上させます。
さて、世界を変えないかもしれませんが、興味深いと思ったので含めたい別の企業は、Caperと呼ばれる企業です。基本的に、彼らはより効率的に買い物できるAI対応技術を持っています。
これはCaper Cart、Instacartの顧客が愛用するAI搭載スマートカートです。彼らがする必要があることは、アイテムを取って落とすだけで、Caperが画面上の合計に即座に追加します。Caper Cartはスマートセンサーとコンピュータービジョンカメラを装備しており、顧客が商品を追加したときに自動的に認識します。
内蔵の重量・測定認定スケールは重量まで分かります。そう、青果物でもです。顧客がアイテムを追加、削除、そして再び追加することも簡単です。eコマース統合により、顧客がアプリで買い物リストを作成し、カートから簡単に買い物できます。位置ベースの取引やセール中のアイテムなどの個人化機能は、小売業者が各買い物体験を顧客に合わせてカスタマイズするために利用できます。
Caper Cartの広告でさえ、顧客の体験に関連するように個人化できます。スピン・トゥ・ウィンなどのゲーミフィケーションで顧客を驚かせ、喜ばせます。顧客がカートで直接支払いをして行列を短縮します。チェックアウトの時間になると、みんなが勝者です。顧客は店舗のロイヤルティプログラムで節約することもできます。
CaperはPOSシステムを含む店舗のインフラに統合します。縮小防止に役立つカート監視ツールに便利にアクセスできます。ネスト充電により、Caperカートは一日中稼働するのに十分な電力を得られます。すべての旅行が冒険のように感じられるとき、顧客はバスケットサイズを増やし、より多くのために戻ってきます。
Caperカートでより多くの収益、より多くのロイヤルティ、より大きなバスケットを促進します。
次の企業はPhysical Intelligenceと呼ばれます。これは2024年に設立されたばかりのロボティクスとAIスタートアップ企業で、再びサンフランシスコ、カリフォルニアに拠点を置いています。この企業はエンジニア、科学者、ロボティクス研究者、企業建設者で構成され、その野心的なミッションとベゾス、OpenAI、Sequoia Capitalなどのリーダーからの重要な財政的支援により迅速に注目を集めています。
この企業は実際に、幅広いロボットと物理的に作動するデバイスを制御するために特別に設計された汎用モデルの開発に焦点を当てています。彼らの核心的イノベーションは、複数のロボットとタスクからの多様なデータで訓練された大規模で多用途なAIモデルである、ロボティクス用基盤モデルの作成です。
基本的に、彼らは物理的アクション用のLLMを構築しています。彼らの最初の汎用ポリシーであるπ0は、簡単なテキスト指示に基づいて複雑な実世界タスクを実行するためにさまざまなロボットを制御できる基盤モデルです。特定のタスクやハードウェア向けに通常カスタマイズされる従来のロボットソフトウェアとは異なり、π0は異なるロボットと環境にわたって汎化するよう設計されています。
洗濯物を畳む、ゴミを分別する、部屋を片付ける、箱を組み立てるなど、微妙なリアルタイム意思決定と器用さを必要とするタスクを処理できます。今、彼らの最新のイノベーションの一つはπ0.5です。現在、ほとんどのロボットは工場で働いています。そこでの作業は同じままだからです。
しかし、私たちの家やオフィスに置きたい場合は、汎化できる必要があります。つまり、混沌を処理できる必要があります。そこで新しいモデル0.5の出番です。π0と呼ばれる古いモデルを基盤としていますが、こちらはランダムな家を清掃するなど、これまで見たことのない新しい環境でタスクを実行することにより優れています。
π0.5は新しいトリックをしようとするだけではありません。異なるロボット、動画、さらには人間からの段階的指示から学んだことに適応しようとします。画像、アクション、言葉、ロボットデモンストレーションなど、あらゆる種類のデータを混合して学習します。車輪付きロボット、腕のないロボット、インターネットからのデータなど、多くの多様性があります。多くの多様性がより良い汎化に等しいというのがポイントです。
彼らはこれまで見たことのない家でこのロボットをテストしました。タスクには皿の片付け、こぼれた物の清掃、ベッドメイキングなどが含まれていました。最初の試行で常に正しくできるわけではありませんでしたが、最終的に人間が何をしたいかを理解しました。
全体的に、これは任意の環境で任意のタスクを実行できるロボット用の汎用ブレインを作成することを目指す企業です。このアプローチにより、各ロボットアプリケーション用のオーダーメイドソフトウェアの必要性を排除し、製造、物流、医療、ホームオートメーションなどの産業でロボティクスをより柔軟で、スケーラブルで、アクセスしやすくすることができます。


コメント