本動画は、NVIDIAのレベル2++自動運転プラットフォームを搭載したメルセデス・ベンツによる、ロサンゼルス市街地での1時間にわたる無編集の走行テストの記録である。NVIDIAの自動運転車両ユーザーエクスペリエンス担当シニアプロダクトマネージャーであるアーメン・コニー氏が同乗し、センサーフュージョンや意思決定ロジックなど、システムの内部構造について詳細に解説している。競合他社との技術的な比較や、将来のレベル4自動運転(ロボタクシー)に向けたロードマップにも触れられており、NVIDIAの自動運転技術の現在地と今後の展望を深く理解できる内容となっている。

- はじめに:ロサンゼルス市街地での自動運転テスト
- LiDARを搭載しない理由とセンサーの役割
- センサーフュージョンと360度の状況把握
- カメラ特化型ソリューションとの違いと次世代チップTHOR
- インターフェースと地図情報への依存度
- レベル4のロボタクシー構想と操作のシームレスな移行
- 悪天候や視界不良時のセンサーの優先順位
- 予測不能な障害物や極端なエッジケースへの対応
- 今後のロードマップと日々の進化
- 勾配や障害物がセンサーに与える影響
- センサー間の矛盾と車線変更の進化
- AIによるデータマイニングと意思決定速度
- 自動運転における「究極の難問」とは
- 駐車ルールの認識と緊急車両への対応
- ドライバーの運転観を変える自動運転の進化
- おわりに:NVIDIAの自動運転プラットフォームの可能性
はじめに:ロサンゼルス市街地での自動運転テスト
今日はとても特別な企画をお届けします。NVIDIAのレベル2++自動運転プラットフォームを搭載したメルセデスで、ロサンゼルスのダウンタウンを1時間走行する、無編集のリアルなテストドライブです。これはハイライト映像でもシミュレーションでもありません。ロサンゼルスの日常的な交通の混乱、車線の合流、突然の割り込み、工事現場、そして予測不可能な歩行者をシステムがどう切り抜けるかを捉えた連続映像です。
助手席には、NVIDIAの自律走行車ユーザーエクスペリエンス担当シニアプロダクトマネージャー、アーメン・コニーさんを迎えています。私は思いつく限りの技術的な質問をすべて彼にぶつけてみました。センサーフュージョンや意思決定ロジックから、ドライバーに情報を伝えるためのユーザーエクスペリエンスの設計に至るまで、システムの内側で実際に何が起きているのかを彼が解説してくれます。
投資家の皆さんにとって、この映像がNVIDIAの自動車プラットフォームが実際にどこまで進化しているのか、そして自律型モビリティ市場における他社と比べてどうなのかを評価する助けになれば幸いです。数分おきに予期せぬ出来事が起こります。システムがそれにどう対処するかを見れば、完全自動運転の分野で誰がリードしているのか、少なくともどれくらいの差をつけているのかという皆さんの前提が覆るかもしれません。
皆さんの時間は貴重ですので、早速本題に入りましょう。
システムはすでに作動していますね。この車が通り過ぎたら、赤信号での右折を試してみます。
ええ。
今体験していただいているのは、私たちがレベル2プラス・エクスペリエンスと呼んでいるものです。これは当社のHyperionアーキテクチャの上に構築されています。この車は10台のカメラ、5つのレーダー、そして駐車用の12個の超音波センサーを使用しています。
LiDARを搭載しない理由とセンサーの役割
LiDARは搭載していないんですね。
はい、この車にはLiDARはありません。
なるほど。
レベル2のプロダクトなので、まだ運転席にはジョージがいます。そして、ドライバーが車と協力できるように設計されています。車はすべての制限速度を守りますが、もし彼が速度を上げたいと思えば、ステアリングホイールのボタンを押して速度調整ができます。
ウインカーレバーを使って車線変更をリクエストすることもできますし、例えば道路に大きなポットホール(くぼみ)などがあった場合、ドライバーが介入してステアリングを調整し、手を離せば車が再び運転を再開するといった協力も可能です。
ただ、今のところはすべて車に任せておきましょう。一時停止の標識に近づいていますが、車はあの標識を認識しています。止まらなければならないことも、優先順位に従って進むべきことも理解しています。ここから少し走って、レストランやお店があるショッピングエリアに向かいます。通りを渡る人や配達のバンなどに出くわすことを期待しています。そうすれば、私たちが様々なシナリオに対応できることをお見せできますからね。
もちろん。最初の質問としてお聞きしたいのですが、LiDARを搭載しないという設計上の決定にはどうやって至ったのでしょうか。
私たちはパートナー企業と協力して、どのようなセンサーを使用するかを決定しています。レベル2プラスの製品であれば、10台のカメラと5つのレーダー、そして超音波センサーだけで目標を達成できると考えました。しかし、レベル3やレベル4の取り組みになれば、LiDARを追加することになります。さらに、使用する実際の運転モデルもより大規模なものに変更します。つまり、製品の設計意図に合わせてすべてをスケーリングできるということです。
なるほど。それは同じスタックの拡張版のようなものだと考えていいのでしょうか。つまり、レベル2++を求める人もいれば、レベル3、4、あるいは最終的にレベル5を求める人もいるわけですが、まったく異なるスタックになるのではなく、同じスタックが進化していくというイメージですか。
基本原則は同じですね。今日体験していただいているのは、すべて1つのOrinチップ上で動作しているものです。そして、この運転体験の約95%はエンドツーエンドモデルが担当します。その上で、例えるなら昔の自動車教習所の車のように、ブレーキペダルやアクセルペダル、ステアリングホイールが2つずつあるような古典的なクラシックスタックも同時に搭載されているのです。
つまり、エンドツーエンドモデルが運転席に座って実際に運転をしているようなイメージですね。
その通りです。
そして、古典的なクラシックスタックが助手席に座っていて、いざという時には補助のブレーキやアクセル、ステアリングで介入し、特定のルールを強制する役割を果たしています。このようにして、クラシックスタックによる安全性と、エンドツーエンドモデルによるスムーズで快適な人間らしい運転行動の両立を実現しているのです。
センサーフュージョンと360度の状況把握
なるほど。ぜひ理解しておきたいのですが、カメラやレーダー、超音波センサーがたくさん搭載されているとおっしゃっていましたよね。それぞれのセンサーは具体的に何をしていて、それらがどのように組み合わさって車の周囲360度の状況把握につながっているのでしょうか。
システムはこれらすべてのセンサーからの入力を受け取り、私たちがワールドモデルと呼ぶものを構築します。例えば、カメラで状況を把握することで、駐車されている車がすべて停止していることや、動いている対象物の速度を検知することができます。また、車線や路面の標示も確認できるので、自分たちが走行可能な車線にいて、右側が自転車レーンであることなども識別できます。車はそれらすべてをラベル付けして理解しているのです。
このようにして世界の再構築を行い、それを使って様々な行動を理解します。例えば四方向の一時停止交差点では、他の車がいつ到着したかを把握し、優先順位に従っていつ自分が動くべきかを判断します。それに加えて、歩いている人たちの存在も考慮しなければなりません。彼らの動きも私たちの発進に影響を与えますからね。
あそこに止まっている人が見えますね。横断歩道にも人がいます。今は進んでも安全だと判断できます。また、自転車レーンにスクーターに乗っている人がいるのも見えますが、パニックになる必要はありません。自分の車線をそのまま走り続ければいいだけです。この人の隣をただ走っていけば大丈夫です。
そうですね。
エンドツーエンドモデルは主にフロントカメラで前方の状況を見ており、さらにワールドモデルから入力を受け取ることで後方の状況も把握しています。そしてクラシックスタックは、すべてのセンサーを使って車が進むべき方向を決定しています。
すみません、ここまで説明していただいたことは、すべてカメラからの情報に基づいているという理解で合っていますか。
カメラだけでなく、レーダーも使っていますよ。
レーダーもですね。
はい。基本的に両方を使うことで、物体や歩行者の速度を理解していますし、目の前にいるのが車であることも認識できます。実際に両方の入力を組み合わせて、見ている対象物やレーダーで検知したものを把握しているのです。
そして、3つ目のセンサーは超音波センサーだとおっしゃっていましたね。
それは駐車用に使われます。縁石などに非常に近づいた際などに超音波センサーが活躍します。しかし通常の運転においては、そのほとんどがカメラとレーダーによって行われています。
なるほど。そしてレーダーは主に距離と速度を測定するためにあるのですね。
その通りです。
それはすごいですね。ステレオビジョンのように、複数のカメラからの情報を使って距離や速度を測定することはできないのでしょうか。なぜレーダーを使うのですか。
実は両方やっているんです。それが一種の企業秘密のようなところもあるのですが、私たちは両方のシステムを使って周囲の世界を確認し、理解しています。この冗長性があることで、どこが走行可能か、他の物体が何をしているかを正確に把握できるのです。例えば、レーダーは人が通りを横断していることを検知できますが、それが人の形をしていることを教えてくれるカメラがなければ、単なる物体としか認識できません。両者を組み合わせることで、それが車や小さなスクーターではなく、歩いている人だと理解できるわけです。
カメラ特化型ソリューションとの違いと次世代チップTHOR
道路上を走っている他社のソリューションの中には、カメラだけを使ったアプローチをとっているものもありますよね。カメラだけでは特にレベル3やレベル4のソリューションとして不十分であり、他のセンサーも必要だという結論に至った背景には、どのような考えがあったのでしょうか。安全性や規制の観点からですか、それとも一般的な性能の観点からでしょうか。なぜ最初からカメラ単独以上の構成を選んだのでしょうか。
私たちのHyperionアーキテクチャでは、冗長性を持たせたかったからです。レベル3やレベル4に向けては、チップをTHORにアップグレードし、LiDARも追加する予定です。これにより、さらに多くの情報を得ることができます。
すみません、THORやOrinとは何か、簡単に説明していただけますか。
これらは私たちがパートナーに提供している、車載用のコンピューティングチップのことです。THORはOrinよりもはるかに高い計算能力を持っています。計算能力が上がれば、より大規模なエンドツーエンドモデルを動かすことができますし、より多くの信号からの入力を処理できるようになります。つまり、より多くのカメラを使ってモデルを駆動し、情報を増やすことができるのです。
ちょうどいい例ですね。今、交差点にかなり近づいたタイミングで信号が黄色に変わりました。車は、停止線の手前でブレーキを踏んで止まるべきか、人間のようにそのまま通り抜けるべきかを判断しなければなりません。停止線までの距離や車の速度などを計算して、そうした判断を下しているのです。
とても興味深いシナリオでしたね。
そうですね。この先はおそらく保護されていない左折があるので、それを見るのも面白いと思います。対向車を考慮しなければなりませんし、横断歩道に人がいないかも確認する必要がありますからね。ここから先は少し面白くなりますよ。
このあたりは先ほどお話ししたショッピングエリアで、二重駐車している車や通りを横断する歩行者がいるかもしれません。今日のこれまでのテストでは運が良く、興味深いシナリオにいくつか遭遇できました。皆さんにもいくつかお見せできるといいのですが。
ええ、楽しみにしています。気付いたんですが、これはおそらく今までで一番退屈な運転の仕事ですよね。ステアリングホイールには触れていませんし、ペダルにも全く触れていません。あまりにもスムーズなので、メインのドライバーというよりは安全バックアップとしてここに座っているような不思議な感覚です。本当に自分で運転しているというより、車に運転してもらっているんだということに初めて気が付きました。
そうですね。例えば先日、サンフランシスコからサンディエゴまで1日で運転するというテストを行いました。約14時間、1000マイルほどの距離です。もう一人のドライバーと一緒に南下したのですが、普通ならそれだけ長く運転席に座っていれば、疲労困憊でイライラして到着すると思いますよね。一日中渋滞に巻き込まれたりしますから。
しかし、正直なところ、このシステムを使ってロサンゼルスの大渋滞のような単調な作業の多くを車に任せたおかげで、長い一日だったにもかかわらず、かなりスッキリした状態で到着できました。運転中の情報処理から解放されるので、想像以上に疲れないんですよ。
なるほど。決断疲れのようなものを大幅に減らせるわけですね。
インターフェースと地図情報への依存度
このディスプレイはどうなっているのでしょうか。かなり静的な画面に見えますが、ドライバーが自分で運転する場合と車に運転を任せている場合とで、どのような情報が提示されるのか教えていただけますか。
中央のディスプレイにはナビゲーションだけが表示されています。様々なシナリオをお見せするためにルートを設定していますが、純粋に道案内として使っているだけです。HDマップは使っていないので、右側の車線が駐車レーンだとか、その隣が自転車レーンだといった事前情報は一切得ていません。すべて車が実際に見て判断しています。
ジョージ、時間がある時に画面をカンファレンスビューに切り替えてもらえますか。
パートナー企業には様々な情報を提供しており、彼らがどのように視覚化するかを選べるようになっています。
すみません、今画面を見ています。
ドライバーの目の前にあるインストルメントクラスターですね。ここには先行車を認識していることが表示されています。車はドライバーに対して、自分が見ているものや行っていることを少しでも伝えようとしているのです。信号機、他の車両、車線の検出など、共有できるデータはすべて揃っており、パートナー企業はそこから表示したいものを選ぶことができます。
確認させていただきたいのですが、今画面で見ているものはすべて純粋に人間向けのものですよね。車自身が意思決定に使う情報は、私が見ているこの画面の情報とは完全に分離されているのでしょうか。
おっしゃる通りです。車がここで受け取っているのは基本的にはルート情報だけです。目に見える形で受け取っているのはそれだけです。この後でルートを変更して、元のルートにない新しい目的地を設定することも問題なくできます。その場合も、車はただナビゲーション情報を受け取るだけです。
なぜでしょうか。例えば、すべての制限速度情報などを事前に与えないのはなぜですか。カメラで標識を読み取るだけで十分だと判断しているからでしょうか。
マップ情報については常にデータの品質という課題があります。マップから不正確な情報を得てしまったり、そもそも情報がなかったりすることもあるのです。ですから、マップ情報があれば使いますが、なければ車の知覚システムで見たものに従います。
制限速度の標識が変われば、車はそれを認識して速度を適切に調整します。マップが更新されていなくても、車が常に最も関連性の高い現状に基づいて運転できるようにしたいのです。例えば、この先で工事が行われていますよね。こうした情報はどんな地図にも反映されていないかもしれません。
それでも車は「この先で車線規制がある」という状況に対処できなければなりません。今、車が止まりましたね。あの人が割り込んでくるかな?問題ありません。ちゃんと止まることができました。そして前方を見ると、大きなLED掲示板で車線規制が案内されています。
車はあの標識を認識しており、左折したいので左車線に入ろうとしますが、状況を見て判断を変え、こちらに進みます。問題ありません。道路に人が立っているのも見えています。中央の車線が閉鎖されているので、このまま進みます。中央車線だけが閉鎖されているなんて、滅多に見ない状況ですよね。
ええ、そうですね。質問してよければお聞きしたいのですが、ドライバーとしてはどんな気分ですか。誰かが目の前に割り込んできても、足元にはペダルがあり、手元にはステアリングがあるのに、何もしないでただシステムが機能するのを見ているというのは。
私はこのソフトウェアのテストを何度も行っているので、車がほとんどの状況に対処できることを知っています。
最初に乗った時はクレイジーだと思いませんでしたか。
いえ、もっとクレイジーな状況を見てきましたから。
なるほど。つまり、このシステムは本当に極端な例外的な状況にも対処できるということですね。
ええ、モデルは十分にトレーニングされているので、一般的な運転の多くをこなすことができます。私たちが今ワクワクしているのは、今年の第2四半期にこのベータ版をリリースする予定だということです。
この2人の人の間を抜けようとしていますね。問題ありません。今年の年末までには全国展開を目指しています。
すみません、全国展開というのはどういう意味ですか。メルセデスで全国展開するということでしょうか。
この車を購入するお客様が対象です。このソフトウェアを購入すれば、例えばここからマイアミまで、あるいはその間のあらゆる場所まで、このシステムを使って運転できるようになります。これは本当にエキサイティングなことです。
そして、より多くのお客様の車にこのシステムが搭載されるようになれば、それらの車から興味深いデータが得られるようになります。データは匿名化されて私たちに送られてくるので、私たちのテストフリートが捉えきれなかった新しいイベントを常に評価できます。私たちがテスト車両を走らせていない州に住んでいる人からもデータを収集し、将来のリリースに向けてモデルを強化するために活用できるのです。
レベル4のロボタクシー構想と操作のシームレスな移行
いくつかのことが同時に進行しているんですね。自動車メーカー各社でソフトウェアの採用が広がり、さらにそれぞれのレベルでの機能も向上していると。今はレベル2プラスの車に乗っていますが、将来的にはレベル3、そしてそれ以上へと進んでいくわけですよね。先ほど全国展開についてお話しいただきましたが、レベル3やレベル4に到達するのはいつ頃になりそうですか。
今年のGTCのニュースでご覧になったかもしれませんが、Uberと提携して来年からロサンゼルスとサンフランシスコでレベル4のロボタクシーを導入すると発表しました。
この狭い道をうまく進んでいますね。すみません、今彼がステアリングに触れましたが、なぜ車に任せずに手動で曲がったのでしょうか。純粋に理由を知りたいのですが。
私はあくまでセーフティドライバーです。車が物体に接触しそうだと感じた場合、私が介入してコラボレーティブ・ステアリングという操作を行うことができます。それでも車は私にステアリングの操作を委ねてくれます。
とてもシームレスな移行に見えました。軽く操作して手を離しても、モードが完全に切り替わるようなハードな介入ではなかったですよね。
はい、レベル2ではジョージが介入することも、手を離すすることもできるように設計されています。どちらでも可能です。私は今日だけでこのカーブを6回曲がりましたが、何の問題もありませんでした。このケースでは、ジョージが対象物に近づきたいかどうかに応じてステアリングを補助し、安心感を高めることができます。
過去に他のレベル2の運転支援車に乗ったことがありますが、手動で介入すると、もう一度機能をオンにし直すまでマニュアル運転になってしまうのが普通でした。でもこの車はとてもスムーズで、ステアリングに触れて少し調整し、手を離せばまたシステムに任せられるんですね。
その通りです。ジョージがアクセルを踏んだりステアリングに触れたりしても、システムは作動したままです。ブレーキを踏んだ時だけ完全に解除される仕組みになっています。
なるほど、非常に興味深いです。先ほどのレベル3とレベル4の話に戻りますが、Uberとの取り組みがそれにあたるのですね。
はい、レベル4はまずロサンゼルスとサンフランシスコで展開を開始し、2028年末までには28都市に拡大する予定です。これも非常に楽しみにしています。
あそこに乗用車が止まっていますね。問題ありません。うまく対応しています。このアーキテクチャがレベル2プラスからレベル4までスケーリングできることをお見せできるのは本当に素晴らしいことです。レベル4になれば、ジョージのようなドライバーは必要なくなり、車がすべてのシナリオを単独で処理できるようになります。
それが実現した時、ステアリングホイールを持たない新しいタイプの車が登場すると思いますか。これは将来の自動車の形にどのような影響を与えるのでしょうか。
いくつかの異なる方向性が考えられます。ドライバーが決して乗らないロボタクシーのようなものであれば、ステアリングホイールがなかったり、座席が内側を向いていたりするデザインの世界が想像できます。これが一つのコンセプトです。
もう一つは消費者向けの車です。少なくともカリフォルニアに住んでいれば、ハイウェイ1号線やパシフィック・コースト・ハイウェイを走り、海沿いの美しい田舎道を自分で運転したいと思うことがあります。しかし、サンフランシスコで渋滞にはまった時は、すべてを車に任せたいですよね。このように、自分で運転したい時とそうでない時に応じて異なるアプローチが可能です。
必要なセンサーセットさえ搭載されていれば、スタックは非常に柔軟です。ステアリングホイールを残してドライバーを体験の一部にする設計もできますし、完全にドライバーを排除する設計も可能なのです。
なるほど、それは非常に理にかなっていますね。
悪天候や視界不良時のセンサーの優先順位
スタックの話が出ましたが、その大部分がカメラベースであるなら、濃霧や夜間、激しい雨といった悪天候でのパフォーマンスはどうなるのでしょうか。
素晴らしい質問です。システムには許容できる一種の機能低下のレベルが設定されています。また、どこが遮られているかも理解できます。例えば、前方のカメラに汚れが付着していて建物の上が見えなくなったとします。しかし、私たちが走行する空間、つまり目の前の状況さえ確実に見えていれば、上部の情報にはそれほど重要性がないため気にしません。
カメラごとに何が最も重要であるかに応じて異なる領域を優先付けしているのです。そして、機能低下が一定のレベルに達した場合には「ここはドライバーに代わってほしい」とシステムが要求することもあります。レベル3やレベル4において冗長性のあるセンサーセットが必要なのはこのためです。車の視覚を補助し、道路上のすべての物体や車を確実に認識できるようにするための選択肢を用意しておきたいのです。
予測不能な障害物や極端なエッジケースへの対応
先ほどから興味深いユースケースやエッジケースをたくさん見てきましたね。例えば、道路の真ん中で工事が行われていて左右どちらかに避ける判断を迫られる場面などがありました。これまでに見た中で、実際にトレーニングデータとして役立った最もクレイジーなエッジケースは何でしたか。
やはり工事現場での出来事が興味深いですね。サンフランシスコでのことですが、コーンが一列に並んでいて、その真ん中で人が作業していました。ここまでは何百万回も見る光景で何の問題もありません。しかし、そのうちの一人の作業員が、荷下ろしをするから止まれという合図のために、突然車の前にコーンを投げ捨てたんです。
文字通りコーンを投げ捨てたわけですが、車はその物体を認識して停止しました。「えっ、何が起きた?こんなこと今まで見たことない」と驚きましたよ。その作業員は単に待ちたくなかったようで、車の前にコーンを投げ捨て、箱をいくつか持って通りを横断し、その後コーンを拾って退いていきました。
全く問題なく対処できたんですね。
ええ、完全に問題ありませんでした。しかし、人間のドライバーでさえ見たことがないような出来事でした。
今、交差点を塞ぎたくない状況ですが、歩行者もいますね。できるだけ交差点を空けようとしていますが、信号が赤に変わって歩行者が歩き出しました。サンフランシスコのダウンタウンのような交通量の多いエリアでの渋滞ですね。
低速で移動していて信号が黄色になり、交差点内にいる間に赤に変わったという状況で判断を下したようですが、これはよくあることですか。今起きたことと、普通の人が期待するであろう対応との違いを教えてください。
車のすぐ近くに人がいるので、後方の死角センサーが反応していますね。人間のドライバーにとっても黄色の信号への対応は興味深いものです。車や交差点に向かって自分がどれくらいのスピードで近づいているかを把握し、「遠くにいて速度も遅いから止まるべきだ」とか「交差点に近いから急ブレーキを踏むよりそのまま進んだ方が安全だ」と判断しますよね。
これと非常に似たアプローチです。黄色の信号に関する十分なトレーニングデータがあるので、この速度でこれくらい離れているなら進むべきだ、あるいは進まないべきだと学習しています。また、今回のように交差点に進入して待機ラインを越えた状態で立ち往生してしまった場合は、交差点を空けるよう努めるべきだということも知っています。だからこそ右側の車線に寄せて、交差する交通を妨げないようにスペースを空けたのです。
なるほど。私がもっと身勝手なドライバーだったら、そのまま交差点の真ん中に留まって、この車線には入らなかったと思います。駐車車両がいる車線に入ってでも交差点を空けるという利便性を犠牲にした判断を車が優先したのは非常に興味深いです。人間なら「どうせもうすぐ信号が変わるから」とそのまま交差点に居座ることも多いですからね。
そうですね。しかし同時に歩行者がいることも認識していたので、停止して歩行者を先に渡らせました。
私ならクラクションを鳴らしていたかもしれません。
今後のロードマップと日々の進化
近い将来のロードマップで最も楽しみにしていることは何ですか。特定の機能の追加でしょうか、それとも世界的な展開でしょうか。日々この技術に触れている立場として、次に何が来るのを楽しみにしていますか。
そうですね。16歳の子どもが運転を学ぶのを見守っているようなもので、毎日少しずつ良くなっていくのを見るのはワクワクします。皆さんとこうして体験を共有していない時は、私自身が毎日車を運転して最新のビルドを体験しています。
作業員がコーンを投げるシナリオや中央車線の工事など、車がより複雑な状況に対処できるようになっていくのを見るのは本当に素晴らしいです。サンディエゴへのテスト走行のように、異なる都市や環境で車がどう対応するかを見るのもエキサイティングですね。
これは難しい状況ですね。理解できます。録音を始める前にお聞きしたかもしれませんが、NVIDIAでのあなたの実際の役割や業務内容を教えていただけますか。
私はADAS機能に携わるプロダクトマネージャーの一人です。具体的にはユーザーエクスペリエンスのチームに所属しており、全体的な運転行動に気を配っています。車は快適か、安全か、運転中のフィーリングはどうか。これらがスタックを開発する上での私の優先事項です。
快適か、安全かというのは、今回の体験のような個別の状況での話ですか、それともデータに基づいてマクロな視点で見た停車や曲がる時のスムーズさなどの統計的な話でしょうか。
両方です。例えば、1万回の左折イベントをシミュレーションで実行し、毎回安全にクリアして交通や歩行者と衝突しないことを確認するようなリグレッションテストを行っています。すべてのオフラインテストを行った上で、実際の道路上でのテストも行います。最終的には実際の車での挙動も検証したいからです。
私はその両方を行っており、実際に車に乗って様々なビルドを体験するのはとても楽しいです。リラックスしたモデルもあれば、アグレッシブなモデルもあります。私たちは技術に詳しくなく、コントロールを手放したくないと思っている私の母のような人でも快適で安全だと感じられるような、80%の人が満足する設計を目指しています。
シミュレーションの話題が出たのでぜひお聞きしたいのですが、例えばシミュレーションで1万回の右折を行い、同じモデルを使って現実世界で1万回の右折を行った場合、両者のデータにどれくらいの差異やばらつきがあるものなのでしょうか。
Cosmosや当社の物理ベースのAIシミュレーションを使用すると、現実世界の物理法則を再現できます。雪や雨が降っているエリアのシミュレーションを実行すれば、現実と同じように制動距離が長くなります。
驚くほど正確ですよ。例えば「このモデルはアンダーステア気味で、曲がる時に車線をきっちりキープできず隣の車線に膨らんでしまうかもしれない」とシミュレーションで確認できたとします。そのモデルを実際の車にデプロイしてみると、やはり「この車は私たちが望むほどタイトにカーブの軌道を描けない」という結果になるのです。このように、実際のパフォーマンスをかなり正確に把握することができます。
人間のドライバーがどれくらい優秀なのかもよく分かるでしょうね。例えば、車がどう処理するかに対して、人間がどれくらいの頻度でカーブのコントロールを自分で奪おうとするかといったデータも取れるわけですよね。
ええ、そのようなデータも得られます。モデルは人間の運転データで大量にトレーニングされているので、一時停止標識で完全に止まらずにジリジリと進むカリフォルニア・ロールのような動きを学習してしまうこともあります。モデルは止まったつもりでも、実際には止まっていなかったりするわけです。
そこで、完全に停止するというルールを強制するためにクラシックスタックが非常に役立ちます。また、赤信号での右折が禁止されている州に行った場合には、場所に応じてそのルールを強制することもできます。このようにして行動を制御しているのです。
そのルール強制についてもう少し詳しく教えてください。例えば、州境の境界ボックスに入ったら「赤信号での右折禁止」というルールベースの強制が働くのですか、それとも別のモデルをトレーニングしているのでしょうか。
両方のアプローチを取っています。地域ごとのデータセットを持つこともできます。今、この車が割り込んできましたが、全く問題ありません。ただ、歩行者もいるので少し慎重に進んでいます。カリフォルニア用のデータセットやフロリダ用のデータセットを用意して、実際のモデル内で異なる場所の情報を扱うこともできますし、ルールの強制も行います。
赤信号での右折を許可していない州に入った時にはルールとして強制できますし、車自身が「赤信号右折禁止」の標識を読み取ることもできます。
そうですね。だからここで一時停止して少し待ちます。このルートには赤信号でも右折できる場所がいくつかあり、そこでは車がゆっくり前進して誰も来ないことを確認してから曲がります。
初歩的な質問かもしれませんが、車は今カリフォルニアにいることをどうやって知るのですか。緯度経度の情報から判断しているのか、それともシステムに教え込まれているのでしょうか。
車にはGPSが搭載されているので、自分自身の現在地を把握しています。
なるほど、GPSデータを使っているんですね。
今こちらは青信号でしたが、あの人が渡り始めたので譲りました。人間がルールを破っても、車は対処できます。さて、誰も来ないのでこれで曲がれますね。
自分が自動運転車の運転席に座るのと、将来自動運転車ばかりになった道路を歩く歩行者になるのと、どちらが怖いか分かりませんね。どちらにせよ私がルールを破りそうです。
それが人間ですからね。
勾配や障害物がセンサーに与える影響
車が誤作動を起こしそうになるような、よくある混乱要因にはどんなものがありますか。例えば、今は上り坂で低い位置に電線が垂れ下がっていますが、車が上を向いているせいでセンサーには異常な光景に映るのではないでしょうか。
先ほどのカメラの機能低下の話と同じで、私たちは地面に近い部分、つまり車が実際に走行する場所を優先することを学習させています。もし頭上の電線のような奇妙なものが見えたとしても、「それは私たちが走る場所とは関係ない」と判断して無視することができます。電線は車線でも線路でもありませんからね。
十分なデータがあれば、車が見ているものの中で特定の領域の優先順位を下げるように学習させることができるのです。
車は自分が上り坂にいることを理解して、より地面に近い部分を見るべきだと判断しているのですか。
このルートにはサンフランシスコ特有の急な坂道もあります。車はそこで視界が遮られていることを認識できるので、四方向の一時停止交差点などでは、死角から誰かが来るかもしれないと考えて少し慎重になる必要があります。車は「先が見えない、勾配があるから少し慎重にゆっくり走ろう」と理解しているのです。
また、制限速度が時速25マイルの区間でも、サンフランシスコの急な坂道では時速25マイルは非常に速く感じるため、車は自発的に速度を落とします。エンドツーエンドモデルに多様な運転データを学習させることで、人間が狭い道や急な坂道で自然に速度を落とすように、車もその行動を学習するのです。
なるほど。そしていくつかのカメラは私たちより高い位置に設置されているので、私には見えないものでもカメラには見えていることがあるわけですよね。
その通りです。複数のカメラとレーダーがあり、それぞれが見ている位置を比較して「そこに何かあるのか、慎重になるべきか」を判断しています。
センサー間の矛盾と車線変更の進化
センサー間で情報が食い違った場合はどうするのでしょうか。例えば、レーダーには強く反射するのにカメラには何も映らないような状況です。
比較検討を行います。様々なものに信頼度のパーセンテージを割り当てることができます。「これが何なのかよく分からない」という場合には、マルチセンサーフュージョンを使って、何を重視し、何を優先すべきかを信頼度に基づいて決定します。
なるほど。マルチセンサーフュージョンはカメラとレーダーの解像度の違いなども考慮するのでしょうか。
はい、もちろんカメラのスペックや見えているものは把握しています。ですから、「ここに何かがある確率」を判断できるのです。今、車が一時停止しているあの車のために車線変更を検討しているようですね。通り過ぎるのを待ちましょう。少しずつ前進していますね。よし、停止している車を避けて車線変更できました。
私たちがモデルについて非常に興味深いと感じているのは、車線変更がはるかに自然に感じられるようになったことです。クラシックスタックでは、交通のギャップを特定するために先行車と後方車の速度を計算し、自車の位置を決定しなければなりませんでした。車が加速したり減速したりするスピード適応フェーズでは、横方向と縦方向の両方の加速度を考慮する必要があります。
クラシックスタックでは、それが少しロボット的だったり、ギクシャクしたりすることがありました。しかし、車線変更のデータをモデルに学習させ始めたところ、非常にスムーズになったのです。交通のギャップに静かに滑り込むように入り、横方向と縦方向の動きをより自然に制御できるため、はるかに直感的で人間らしく感じられます。
それは驚きですね。データ層を増やすことで運転体験が目に見えて劇的に良くなった良い例ですね。他にも、トレーニングを追加したことで行動に明確な変化が生じた例はありますか。
私たちにとって大きな課題だったのが、二重駐車している車への対応でした。目の前に車が止まっている場合、対向車線にはみ出してから元の車線に戻らなければなりません。駐車車両との距離を測り、対向車が来ていないかを確認する必要があります。自転車やオートバイなど狭くて速いものが来ている場合、いつ進むべきかの判断は非常に難しいものです。
しかし、人間の運転データを大量に与えた結果、モデルのタイミングの取り方がはるかに自然になったことが分かりました。進むべきか待つべきかの判断が自然になり、操作自体の質も向上しました。衝突を恐れて大きく揺れたり急ブレーキをかけたりすることなく、自然で人間らしい方法で困難なシナリオに対処できるようになったのを見るのは非常にエキサイティングでした。
車の縦列駐車の性能はどうですか。
縦列駐車も、直角駐車も、斜め駐車もできます。駐車場内での駐車機能なども追加しようとしています。エンドツーエンドモデルの進化のスピードには目を見張るものがあります。クラシックスタックの上に乗っているため、安全性を担保しながら、車線変更や二重駐車への対応など、人間らしい運転行動の利点を素早く反復して取り入れることができるのです。
それは本当に興味深いですね。あ、なるほど。
コーンを置いている人たちがいるのを認識しています。
そして、あのコーンは自分の車線にはないからこのまま進もうと理解したようですね。とても素晴らしいです。
ええ、人がいるのを見て減速しました。私たちの前に飛び出してくるか予測しています。大丈夫そうなのでこのまま進みます。
AIによるデータマイニングと意思決定速度
システムは1秒間に何回くらい意思決定を行っているのでしょうか。常に継続しているのは分かりますが、例えばカメラから1秒間に60フレームの映像が送られてくるとして、どれくらいの頻度で処理と決定を行っているのですか。
正確な数字はすぐには出てきませんが、基本的には毎秒軌道を生成し、それをクラシックスタックと比較して合理的かつ安全かどうかを判断しています。後で正確な数字を確認してお伝えします。
ええ、ただ気になっただけなので。
ジェンスン・フアン氏のQ&Aセッションに参加した際、OpenClawやNemoclawのような新技術でどのようなアプリケーション分野に取り組むのが一番楽しみかと質問しました。驚いたことに、彼は自動運転について多くを語り、将来のエージェントAIがいかに自動車に統合され、意思決定スタックを支援するかについて話してくれました。現場に近い立場として、現在AIをどのように活用しているか、あるいは将来的にどう組み込んでいくのか教えていただけますか。
私の役割ではまだ直接使っていませんが、他のチームメンバーは必要なデータセットを探すためにAIを活用しています。すべてのフリートや顧客から集めた膨大なデータの中から、「コーンを投げる作業員」の映像を探し出すような場合ですね。AIを使ってモデルのトレーニングに必要なデータを見つけ出しているのです。
なるほど。大量の非構造化データから必要な情報を探し出すためにAIを使っているわけですね。
その通りです。データのラベル付けにも使います。これは車、これは人、これは犬、これはコーン、といった具合です。そして、特定のシナリオでモデルをトレーニングするために必要なデータを収集するのにも役立ちます。
それは理にかなっていますね。
自動運転における「究極の難問」とは
シミュレーションで新しいシナリオを作る必要があるとどうやって判断するのですか。データを見て「このケースが足りないからもっとシミュレーションしよう」となるのか、新しいシナリオを作成するプロセスはどのようなものですか。
私たちは「機能的シナリオツリー」と呼ぶコンセプトを持っています。例えば「四方向の一時停止」を例にとると、直進、左折、右折の3つの選択肢があります。これら3つすべてのデータを十分に持っているか確認し、足りなければ特定の一時停止のデータをさらにマイニングします。
さらに「二方向の一時停止」も考慮する必要があると気づけば、ツリーに新しいノードを追加します。このように個々のシナリオやユースケースを拡張し、その上にデータを重ねていくことで、ロングテールと呼ばれる稀なケースを構築していくのです。
今ご覧いただいている運転体験も、かなり優秀ですよね。車は工事現場や歩行者にもうまく対応しています。しかし、まだ遭遇したことのない新しい地域やシナリオに行けば、さらに機能を追加していく必要があります。世界中のフリートで見つかった新しい問題を確認し、「こんな状況は見たことがない。シミュレーションもしたことがないから、これをサポートするデータを探そう」という具合に拡張していきます。
例えば、今道路の真ん中にコーンが置かれています。人がいるかもしれないし、バックしてくるかもしれないから、少しブレーキをかけて確認しよう、といったデータを将来コーンの横を通り過ぎるシナリオのトレーニングに使えるわけです。
自分が意識して見ていると、運転というのは本当に難しいものだと気付かされます。自分で運転している時は目の前のことに集中しているので当たり前にこなしていますが、一歩引いて見てみると「うわ、すでに何度かクレイジーな状況を切り抜けているぞ」と驚かされます。車は見事に対処していますね。
次の質問ですが、自動運転にとって究極に難しいシナリオは何だと思いますか。私が想像するのは、インドの巨大なラウンドアバウトで人々が織りなすように走っている映像です。上から見ると純粋なカオスのようですが。実際にトレーニングするのが一番難しいシナリオは何ですか。
考え方としては人間と同じです。人間にとって難しいことは何だろうか、と考えます。運転行動の多くは人間のデータに基づいてトレーニングされているからです。
車線も道路標示もない中でスクーターや歩行者が入り乱れるような大渋滞は、解決すべきロングテールの課題だと思います。しかし、十分なデータさえあれば、異なる国や地形、気象条件での運転をサポートできない理由はないと考えています。良い運転行動とは何かを十分に理解していれば、それを強化して優秀な人間のドライバーよりもさらにうまく対処できるようにすることは可能です。
なるほど。それに付随して気付いたのですが、車線標示は非常に重要ですよね。未舗装の道路ではどうなるのでしょうか。
他の車からのコンテキストを利用して、他の人がどこを走っているかを理解します。もちろん車線標示があるに越したことはありませんが、サンフランシスコでも工事中で車線がない場所があります。そうした場所でも、車は「ここは2車線分の幅があり、他の車はここを走っている。状況から判断して自分はここを走るべきだ」と判断できるのです。
このシステム自体がHDマップに依存しないソリューションなので、コンテキストを理解して「車線はここにあるはずだ」と推測して運転できるのです。
完全にコンテキストベースということは、携帯の電波がなく、インターネットやクラウドに接続されていなくても、すべて自己完結で機能するということですか。
はい、すべて車の中で完結しています。この市販車に最新のソフトウェアをフラッシュして機能を有効にしていますが、ハードウェア自体は同じです。データをアップロードするためのネット接続はありますが、「サンフランシスコの最新のマップ情報」をリアルタイムでストリーミングしているわけではありません。
駐車ルールの認識と緊急車両への対応
例えば、車椅子マークをそこに置いたら、文脈的に「ここは身障者用スペースだから駐車できる」と理解するのでしょうか。
まだそこまでは対応していません。縁石の色などもまだ認識していませんが、同僚たちがそうしたコンセプトに取り組んでいます。将来的にそうした機能を展開できればと期待しています。
ロボタクシーの場合で考えてみましょう。15分限定の駐車スペースで、乗客を降ろすための1分半だけ駐車したい場合、車は「ここは15分停められるから乗客を降ろすのに十分だ」と判断できるのでしょうか。
そのレベルには到達できるはずです。私はロボタクシーのプロジェクトに直接携わっていませんが、道路標識を読むことはできます。「赤信号での右折禁止」の標識を読んで理解できるのと同じです。
あ、すみません。話を遮るつもりはなかったのですが。
いえいえ、大丈夫ですよ。この狭い隙間を通れるか確認していますね。近づきすぎないように一度止まりました。そして、こんな風にするりと通り抜けていきます。
すごいですね。
先ほどお話しした二重駐車のケースですが、エンドツーエンドモデルが導入される前はこのような状況は非常に困難でした。しかし今では、前の車が止まっているのを見て、十分なスペースがあるから通り抜けられると判断して進むことができます。
自分について気付いたのですが、私はこのコンピューターよりもずっと保守的なドライバーだということです。あの状況なら、対向車が来ているのが見えた時点で私はずっと待っていたはずです。車が「隙間を通れる」と正確に見積もって挑戦できる能力に驚くと同時に、私はもっとアグレッシブなドライバーになるべきだと思い知らされました。
面白いのは、私たちが様々なモデルをデプロイしている点です。非常に保守的なモデルもあれば、「このモデルは頻繁に立ち往生してしまう」とテストフリートからフィードバックを受けることもあります。立ち往生することと積極的に進むことのバランスを取り、時には立ち往生し、時には追い越すような、状況に応じた中間の妥協点を見つけようとしているのです。
そのモデルは全体的にアグレッシブ、あるいは保守的という評価なのでしょうか。それとも「追い越しにはアグレッシブだけど他のケースでは保守的」というように個別なのでしょうか。
モデルによって異なります。私たちは1日に平均して約7つの新しいモデルを生成しており、様々なものを試していますが、すべてが実車テストに回るわけではありません。
1日に7つの新しいモデルを生成するんですか。
GPUの使用量などを考慮して生成できるのがそれくらいなのですが、膨大なデータセットになります。私たちは常に運転行動の改善に努めています。人に対して過剰に反応してすぐにブレーキを踏みたがるモデルもありますが、それは安全性は同じでも快適性が低いと判断します。様々なデータセットの重み付けを変えることで、安全性と快適性の最適なバランスを探っているのです。
先方の車が遠くにいて車を停めようとしているので、問題なく迂回できますね。
このように異なるモデルを展開し、毎日フリート全体でテストしています。あるモデルはカリフォルニアでは優秀でもテキサスでは苦戦するかもしれません。だからこそシミュレーションに加えて様々な地域で実際の道路テストを行い、確認したいのです。あ、この車は一時停止を無視しましたね。でも私たちの車は静かに待ってから進みました。
なるほど。同じモデルのバリアントを生成して出力を比較しているわけですね。
ええ、非常に似たベースから始まりますが、時間の経過とともにより高性能に進化していきます。16歳の子どもの例えに戻りますが、最初は少しギクシャクしたり不安定だったりしても、今では非常にスムーズで高性能な運転を見せています。工事や二重駐車にも対応できますし、トランクを開けて立っている人を検知して減速し、迂回してから車線の中央に戻ることもできます。
その16歳の例えについてもう少しお聞きします。2年前は11歳のような運転だったモデルが、2年後には25歳のように運転できるようになると期待していいのでしょうか。モデルの進化のスピードについて教えてください。
こうしたモデルを使ったプロジェクトが始まってから1年少しが経過しましたが、ここに至るまでに約2300のモデルを生成してきました。これだけのデータを処理して新しいモデルを作成できる計算リソースがあるのは幸運です。今日の運転は非常にスムーズで有能ですよね。工事や二重駐車を理解しており、かなり優秀なドライバーだと言えるでしょう。
確かにそうですね。
黄色の信号が短く点滅しましたが、問題なく通り抜けられました。スケートボードに乗った人が向かってきても急ブレーキをかけたり大きく避けたりすることなく、非常にスムーズで予測可能な動きを学習しています。
素晴らしいですね。
信号のない左折を終えて、下り坂に入りました。制限速度は25マイルか30マイルですが、すぐにその速度まで上げようとはしません。赤信号が見えているので、あの信号に向かって静かに進んでいきます。
かなり急な坂なので、車は目の高さにあるものが実は地平線であり、運転のコンテキストとしては役立たない情報だと理解して、目の前のことだけに集中しているのですね。
ただ、コンテキストとして利用することはできます。車の屋根が消えていくのを見て「急な勾配があるから少し寄せておこう。坂を越えるためにアクセルを踏み込むのはやめよう。あそこに誰かが止まっているかもしれないから」と判断できるのです。
ドライバーの運転観を変える自動運転の進化
標高や天候など、ドライバーの行動を変化させるような興味深い要因は何でしょうか。予想外に難しかったシナリオなどはありますか。
その2つは確かに最初は驚いた要因でしたね。さらに、サンフランシスコのラッシュアワーのように、自転車や配達員が縫うように走る大渋滞の中で、いつ強気に出るべきか、いつ保守的になるべきかを理解するのは非常に興味深いです。
先ほどのあなたの言葉の通り、自分自身の運転について深く考えさせられます。「自分ならこうしていた」「あ、あの男に気づいていなかった」という具合です。一時停止で「早く行けよ」と思っていると、茂みの後ろから急に人が飛び出してくることもあります。車はその動きを検知して「人がいるから行かない」と判断していたわけです。
自分が運転へのアプローチを考え直すべきだと気づかされるのは、とても楽しい体験ですよ。
確かにそうですね。フロリダでは救急車のサイレンが聞こえたりライトが見えたりすると、道を譲るために端に寄せる文化がありますが、自動運転の場合はどうなるのでしょうか。サイレンを聞き分けたりライトを探したりするのですか。
まだそこまでは対応していません。レベル2プラスの製品では、ドライバーが介入して道を譲ることになります。しかし、レベル4に向けては、緊急車両のために道を譲らなければならないことを車が理解するという機能の追加を目指しています。
では、道路の真ん中で警察官が手信号で交通整理をしているような場合はどうですか。非常に見えにくく、背景に溶け込んでいるような状況で「進め」と合図されたら、車はそれを理解できますか。
できる時とできない時があります。これはモデルの動作をさらに洗練させる必要がある部分ですね。このような場合、システムを作動させたままドライバーがアクセルを軽く踏むことで「進んでも大丈夫だ」という入力を与えることができます。車は「人がいるからそちらには向かわないが、ドライバーが自信を持って進めと指示しているから進もう」と判断してコントロールを再開します。
それは面白いですね。ドライバーが完全に状況を切り抜けるために介入するのではなく、「前に進んでいいよ」と伝えるだけで、実際の行動の決定は車に委ねているわけですね。
その通りです。車と協力して運転しているようなものです。二重駐車の車に近づきすぎて立ち往生しそうな時でも、ステアリングを少し操作して「周りは見えているから大丈夫だ」と伝えれば、車がアクセルをコントロールして抜け出してくれます。
そんなに協力的だとは思いませんでした。目の前にスクールバスがいますね。スクールバスは突然どこからともなく「止まれ」の標識を出す魔法の力を持っていますが、車がすでに軌道を計画していたところに突然標識が現れたらどう反応するのでしょうか。
私たちは様々な種類の車両を識別できます。スクールバスという分類もありますし、普通の車やトラックも識別できます。
あ、つまり単なるバスではなく「スクールバス」だと認識できているんですね。
そしてスクールバスの一部として「止まれ」の標識があることも理解しています。標識が出されればそれを検知し、点滅するライトも見えます。「標識と点滅するライトがあるからここで止まって待とう」と判断するのです。
なるほど。ただのバスが魔法の力で標識を出したと認識するのではなく、そのレベルで理解しているのですね。非常に明確です。
今、Waymoの車を見ていますが、GoProなどのセンサーがついていて特殊な形をしていますよね。車の上で回転しているものなどを気にしますか。それともより大きなコンテキストを理解しているのでしょうか。
これは単に車だと認識します。上で何かが動いていても、「これは車だ。通り過ぎるのを待つか、このまま進むか」と判断するだけです。それ以上の奇妙な特徴は、ただの奇妙な特徴として処理し、形が違うからといって別の行動をとることはありません。
手動運転に切り替えます。
ジョージ、時間通りに進めるために戻してくれてありがとう。
見ての通り、ジョージのブレーキは私たちの車(自動運転)よりも少し強めですね。
おわりに:NVIDIAの自動運転プラットフォームの可能性
車の機能について他に知っておくべきことはありますか。できるだけ多くの質問をしましたが、視聴者に伝えておきたい見落としがあれば教えてください。
非常にエキサイティングなのは、このアーキテクチャをスケールアップもスケールダウンもできるということです。今体験しているのはレベル2プラスですが、これをロボタクシーや消費者向けのレベル4の体験へとスケールアップしています。パートナーが求めるものに合わせて適応できる柔軟性があります。
個人的に楽しみにしているのは、自分で美しい曲がりくねった道を運転することもできれば、仕事からの帰り道には車にすべてを任せてレベル4の体験を享受できるような未来です。
記録に残らない前提での質問ですが、それは3年後、あるいは10年後に実現すると思いますか。
Uberとの取り組みでは、来年までにカリフォルニアでロボタクシーの導入を開始します。それを確実に機能させる方法を見つけなければなりませんし、それを楽しみにしています。私たちが思っているよりもずっと早く実現すると思いますよ。
それは本当に楽しみですね。他に何か付け加えることはありますか。
いえ、私からは特に。皆さんはNVIDIAの社員以外でこれを体験した最初のグループの一つですが、どう思われましたか。
本当にスムーズで感動しました。自分が下す決定とシステムが下す決定の違いも印象的でした。私は自分のことをかなり優秀なドライバーだと思っていますが…
みんなそう思っていますよ。
ええ。でも、もっとアグレッシブに早めに車線をクリアした方が安全な状況もあるのだと気づかされましたし、逆に自分なら誤った判断をしていたかもしれない状況もありました。車の中央に固定された2つの目しかない人間に対し、この車は死角や高い位置からの視界を含む複数のカメラを持っています。その違いによる行動の差には本当に驚かされました。
初めてジョージの席に座って「車がどう動くか見てみよう」と構え、数分後には「これは自分と同じか、それ以上に優秀だ」と気づくのは楽しいですよ。そして「自分ならこうしたが、車はこう動いた。なるほど、理にかなっている」と気づく。運転を全く違う視点で見直すきっかけになりますからね。
自動運転が普及してデータが集まり続ける中で、コンピューターのより良い判断を見ることで人間自身もより良いドライバーになっていくのかどうか、今後数年間がとても楽しみです。
私からも一つ質問していいですか。自動運転の目標において、安全性と効率性に優先順位や重みの違いはあるのでしょうか。
安全性は常に最大の重みを持ちます。人や他の車に突っ込まないようにすることが常に最優先です。だからこそ、モデルが予期せぬ動きをしないようにクラシックスタックが常に監視しているのです。
その次に快適性と効率性が来ます。誰も渋滞にはまったり立ち往生したりしたくありませんからね。そこで大規模なモデルの出番です。人間の意思決定を取り入れることで、「この車線に入って渋滞を避けよう」「ここは車線が閉鎖されているからこっちへ行こう」と判断できるのです。これがこのシステムの本当に強力なところです。
素晴らしいですね。貴重なお時間をいただき、本当にありがとうございました。
ありがとうございました。お会いできて光栄です。
ジョージさんのサポートも素晴らしかったです。
NVIDIAのレベル2++を搭載したメルセデスで1時間過ごしてみて、いくつかの点が際立っていました。車はロサンゼルスの交通、車線の合流、突然の割り込み、工事現場、予測不可能な歩行者に対し、人間のドライバーでは得られないようなスムーズな精度でダイナミックに対応していました。
投資家にとってより重要なポイントは、アーメンの解説にあったかもしれません。NVIDIAのDrive OSと認識スタックがどのように連携し、どのような車内機能を実現するのか。そしてこのアーキテクチャが、HyundaiのようなOEMメーカーやUberのようなプラットフォームが、今後数年間でレベル2、レベル3、レベル4の自動運転体験をカスタマイズする上でどのように機能するのかということです。
カリフォルニアまで私たちを招待し、GTCのプレスパスを手配し、このテストドライブを実現してくれたNVIDIAチーム全体に心から感謝します。そして、私の絶え間ない質問に答えてくれたアーメンにも感謝します。
もちろん、このチャンネルを見てサポートしてくれている皆さんにも感謝します。皆さんなしにはこのような機会は得られませんでした。私がNVIDIAのGTCで他に何を学び、何に投資しているかを知りたい方は、次の動画をチェックしてください。あるいは、株価の背景にある科学的根拠についてもっと知りたい方は、こちらの動画がおすすめです。
いずれにせよ、ご視聴ありがとうございました。それでは次回まで。こちらはTicker Symbol UのAlexでした。あなたができる最高の投資は、あなた自身への投資であることをお忘れなく。


コメント