
23,310 文字

私たちは文字通り1998年にマウンテンビューにあるキャスター・ストリートのインド料理ビュッフェレストランの上の小さなオフィスで、Alexaに相当するデモを動かしていました。
EE TechとAll About Circuitsから、これはモリス・ロビーです。ホストのダニエル・ボグダノフです。
今日は、Siriの起源ストーリーの直接的な証言、インディカーレースチームがAIエージェントを使ってイエローフラッグを予測し、リアルタイムでレース戦略の決定を行う方法、そして量子コンピューティング統計学の専門知識がゲストのクリストファー・シーボイ氏をZapata AIの創設に導いた経緯について伺います。彼は同社のCEOです。彼は医学博士号を持ち、弁護士でもあり、後にSiriとなった技術の共同発明者でもあります。ですから、このエピソードをとても楽しみにしています。
クリストファーさん、お越しいただきありがとうございます。
お招きいただき、ありがとうございます、ダニエル。
Siriを開発して実現させた人について私の頭の中で考えると、大学院に入った時から機械学習をやっていた研究者のような人を思い浮かべますが、あなたの場合はそうではないということですね。あなたがテクノロジーの世界にどのように入り、AIおよび機械学習の分野にどのように参入したかについて、背景を教えていただけますか?
はい。テクノロジーへの参入は、おそらく私が8歳の頃に始まりました。その時はTimex Sinclair 1000という小さなコンピューターがあり、最終的にはVic 20 Commodoreに進歩しました。私はかなり経済的に厳しい状況だったので、Commodore 64を手に入れることができず、より少ないメモリで作業しなければなりませんでした。しかし、それは本当にクールでした。
Commodoreには「スプライト」と呼ばれるものがあり、ベクターを使ってコンピューターグラフィックスに取り組むことができました。これはかなりクールでした。ベクタープログラミングの方法を学びました。当時はマシンモニターを使って、非常に限られたリソースのマシンから何かを引き出すために、すべてのメモリビットがどこで利用可能かを常に把握する必要がありました。制約のある環境でしたが、それが楽しかったのです。
私はエンジニアやコンピューター科学者になりたいと思っていましたが、それは私の父とはうまくいきませんでした。父は「お前は医者か弁護士になるんだ。医者か弁護士だ。他に選択肢はない。私のような良いカトリック系ユダヤ人の子供は、そのどちらかにならなければならない」と言いました。
しかし、さまざまな選択肢について考えてみてください。私は「弁護士になることもできる。検察官、自動車事故を扱う原告側弁護士になることもできる。さまざまなキャリアの可能性がある。小児科医、腫瘍学者にもなれる。他に何を望むのか?」と言われました。
結局、私は両方になりました。そして、キャリアの中では上記のどれでもなくなりました。話を早送りしますが、私は日本に行き、免疫学を研究する医学の大学院生になりました。より技術的に言うと、構造生物物理学をやっていました。これらの免疫分子の構造、それらがどのように結合するか、その分子動力学などについて研究していました。
これは1990年代前半から中期の話で、古いIndigoマシンを覚えているでしょうか。当時としては非常に強力なワークステーションでした。今日では、iPhoneに入っているようなものに見えるでしょう。しかし、それでかなりクールなことができました。私は多くのウェットラボのマススペック作業をやりました。
医学部に通いながら、副業として日本で最初のウェブデザインとネットワークコンサルティング会社の一つを始めました。昔のRazerfishを覚えているなら、そのような感じでした。ウェブサイトをデザインし、ネットワークコンサルティングとプログラミング作業を、インターネットの非常に初期の頃に副業として行いました。
これは、私が自分のバイオインフォマティクスの仕事をするために、Perlスクリプトやその当時のCGIスクリプトのプログラミング方法を学ばなければならなかったからです。私が取り組んでいたシーケンス作業のためでした。そして人々が「おお、HTMLプログラミングの方法を知っているのですね。私のためにウェブサイトを作ってもらえませんか?こんなビジネスをやっている私の叔父のためにウェブサイトを作ってもらえませんか?」と言いました。私は「みなさん、これにはお金を請求し始めなければなりません」と言いました。そして実際にそうしました。
グラフィックデザイナーと、ファイナンスの知識を持つ別の人と一緒に会社を立ち上げました。Webulaという会社で、最終的にAppmarkになりました。これをパートタイムの副業として続けていました。しかし、会社が成長していたため、日本最大級のVCの一つであるJAFCOから投資を受けることになりました。これは1990年代中期で、ドットコムが本格的に始まる前のことでした。収益性のあるビジネスを持っていました。これが私の最初のテクノロジーへの参入でした。
その時の同級生の一人で、コンピューター工学科の大学院生だったイギリス系イラン人の二重国籍学生、ババク・ホジェットがいました。彼は現在CognizantでのコグニザントでのコグニザントでのボスでのコグニザントでのCognizantでAIを統括していますです。私は最初、その会社での案件で彼を雇いました。
私たちが話をしているとき、福岡の地元企業との大きな契約の機会がありました。私たちは居酒屋という小さな日本の居酒屋でお祝いをしていました。そのパブを経営しているママさん、オーナーに、野球の試合をつけてもらいたいと頼みました。ご存知のように、野球は日本でとても人気です。しかし、彼女は機器を動作させることができず、ケーブルを変更したりすることができませんでした。
彼が「ねえ、息子よ、野球の試合をつけて」と言いました。彼は立ち上がり、2秒後にはそれを解決していました。私は「あのようなものが欲しい。あのようなエージェントが欲しい。画面に現れて『ねえ、息子よ、これこれを取ってくれ』と言ってくれるエージェントが欲しい」と思いました。私たちは「それは素晴らしくないか?」と考えていました。
これはVCRの時代でした。昔VCRで何かを録画しようとしたことがあるなら、それは恐ろしいものでした。インターフェースがありませんでした。3回これを押して、といった感じでした。アナログ目覚まし時計をセットするようなものでしたね。「しまった」という感じで、野球の試合を録画しようとして、帰宅すると「愛の病院24時」のようなものが録画されていました。インターフェースが恐ろしかったからです。
そこで私たちは「ただ『今夜の野球の試合を録画して』と言えたら、素晴らしくないか?」と考えました。それがきっかけでした。
私は自分の機械学習の仕事で、現在では小規模言語モデルと呼ばれるもの、タンパク質のアミノ酸に関するものに取り組んでいました。そして、ボブが遺伝的アルゴリズムの世界で、これらの共生エージェントによる人工生命のようなことに取り組んでいることを知っていました。私は彼に「あなたのために何かをしてくれる大規模なエージェントは一つのことだが、小さなデバイスとしてのエージェントは別のことだ。ねえ、ババク、この人工生命のものを使って自然言語問題に取り組み、人々が本当に欲しがるクールなものを作れると思う?」と言いました。
最初、彼は「あなたはこれを理解していないと思う。自然言語は本当に困難な問題だ」と言いました。私は「いや、私はこれをある程度理解していると思う」と答えました。しかし、後で彼が戻ってきて「そうですね、あなたの言う通りです。よし、これをやってみましょう」と言いました。
そこで私たちは基本的に、小規模言語モデル、極小言語モデルをこれらのエージェントの中に埋め込み、それらが共生的にアンサンブルで動作して、より大きな問題を解決するようにしました。それが私たちがそのアイデアを始めた経緯です。
最終的にそれは会社となり、Caiaseに売却されました。そして、その会社にいたアダム・チアーを含むチームの半分が、その会社が関わっていたDARPAプログラムの一部であるCLIOプロジェクトに参加しました。そして、それはさらに少し発展しました。音声認識がはるかに良くなりました。私たちのモバイルデバイスも数年間でかなり良くなりました。そして7年後、それは製品として登場し、Siriとして発売される前に、Apple社がその会社とアプリケーションを買収し、iPhoneに組み込みました。それがその物語です。
バイオフィジクスと野球の試合を見たいという願望から、一般的に人々が最初で主要な音声認識AIチャットボットシステムと考えるものまでのかなりの旅ですね。
それは最初のものでした。私たちは文字通り1998年にマウンテンビューのキャスター・ストリートにあるインド料理ビュッフェレストランの上の小さなオフィスで、Alexaに相当するデモを動かしていました。1998年に、私たちは「ドイツを含むすべてのワールドカップサッカーの試合を録画して」と言って、それを実現させることができました。
それは1998年のことで、興味深いことに、人々はChatGPTが全知全能の神のような存在であるべきだと考えるように、そのような期待を持っていました。「なぜこれができないのか?なぜあれができないのか?」と思っていました。なぜなら、私たちはまだそれをプログラムしていなかったからです。とても小さなドメインを非常にうまく扱っていました。本当に良く。
今日でも、Siriはそれが設計された目的、つまりデバイス制御、アラームの設定、時計の設定などにおいて、間違いなく最高だと言えます。それは本当に、本当にうまくやります。曖昧な質問に答えるのは、それほどでもないかもしれませんが。しかし、これらのシステムに対する期待は非常に高かったのです。
人々がやってきて、「それは私の靴を磨いたり、他のすべてのクールなことをしたり、地球上のあらゆる質問に答えたりできるはずだ」と考えていました。私たちは他の人間に対してもそれを期待しませんし、チャットボットやエージェントに対してもそうです。
ですから、私たちがそのシステムにその能力をはるかに超えることを求める、この種の人間の行動は興味深いのです。そして、それが私たちの望むことをすべてしてくれない時、私たちは本当にがっかりし、非常に早く失望します。そして、私たちは今、AIで少しそれを見ていると思います。
「ああ、これはすべてをして、幻覚なしに完璧にすべての質問に答えるべきだ」という感じです。しかし、これはエンジニアリングです。コンピューター科学です。実際に生命や人間や知能を創造しているわけではありません。私が今考えるところでは、実際には良い知能の人工的な代替品です。
それはより良くなったり、より良くなったりするかもしれませんが、多くの場合、それは無知な知能です。
今日のAIについて考えるのは非常に興味深い課題ですね。ChatGPTは一般の人々の心の中では万能薬のようなものと考えられていますが、それは主に人間として知能を認識する方法が、多くの場合、言語で他の人とやりとりすることを通じてであるためです。
AIの特殊化について、そして大規模言語モデルが、タンパク質を折りたたんで新しい薬を作るといった異なることを把握しようとするものとどのように異なるかについて話していただけますか?
すべてを支配する一つのモデルを作るという期待があったと思います。そして、現在のCognizantでのババクの仕事と私の仕事を見ると、私たちはこの「一つの全知の大きなもの」である必要があるという考えに、ある意味で回帰してきていると思います。
実際には、人間がそうであるように、モデルは特殊化された時により良く機能するのです。オーケストラとその中の異なる役割について考えてみてください。指揮者にフルートを演奏してもらいたくはありませんし、ドラマーに立ち上がってトロンボーンやフレンチホルンを演奏してもらいたくはありませんよね、大きなバンドでは。しかし、これらの特殊化が一緒になることで、本当に美しいオーケストレーションを作ることができるのです。
オーケストレーションシステムについては、エンジニアリングやソフトウェアエンジニアリングで多く聞きます。私たちはもはや巨大なモノリシックなコードを設計しません。長い間オブジェクト指向プログラミングがありました。物事を分割し、特殊化することを望みます。なぜなら、それは保守しやすく、モジュラーな方法でアップグレードしやすいからです。
人工知能システムもそのように設計されるべきです。これに対して本当に優れた視覚イメージングシステム、この特定のタスクに本当に優れたシステム、またはタンパク質折りたたみに本当に優れたシステムを設計すべきです。Googleのタンパク質折りたたみAIを使って、ChatGPTのようなクイズ質問に答える人は誰もいません。
それをアルバムの新しい歌詞を書くために使いません。音楽をデザインするために使いません。タンパク質折りたたみをするために使うのです。DALL-Eを使って橋を建設しません。橋をデザインはしますが、おそらく本当にうまく機能するものではないでしょう。
ですから、この種の細かい特殊化、そしてこれらの異なるモデルをモデルのアンサンブルとして一緒に動作させること、人間の組織がまとまって「私はこれができる、私はあれができる、私はこれが本当に得意だ」と言い、それらがやりとりし、モデルが他のモデルと協力することが、本当に未来だと思います。
ボブと私がこれらのエージェントがどのように一緒に動作するかを構想した時、私たちは、これらのエージェントが自然言語理解を超えて、ソフトウェアエンジニアリングの観点からも、オペレーティングシステムの領域でもやりとりできる基本的なオブジェクトになれると考えていました。半自律的な小さな知能片としてのソフトウェアオブジェクトとして、それらが一緒になって、人間が組織で行うように、より大きな知能を創造できるのです。
それが本当に私たちが持っているビジョンであり、これが一周回ってくるのを見始めています。彼らは、Andretti Globalでインディカーレースでスリップ角を予測するために私たちが行っていることに、ChatGPTを使うつもりはありません。
エリック・ブレッツマンが約1年前のレースの一つで私のところに来て、とても面白いことを言いました。「ああ、私たちはもうZapataを解雇できる」と。「本当に?」「そうです。もう君たちは必要ない。ChatGPTの月20ドル版を手に入れたので、生成モデリングを持っています。Zapataの専門知識はここでは必要ありません」。「本当に?」。
「ChatGPTにインディ500で勝つ方法を聞いたんです」と私は言いました。「おお、そうですね、何と言いましたか?」「速く走れ」と言いました。「いや、いや、もっと具体的でした。車をクラッシュさせるなが1番目でした。そして2番目は、トップ10で予選通過することでした」。
素晴らしい一般化された答えですよね。どのダンパー設定を使う必要があるか、どのくらいのフロントウィングをそこに入れる必要があるかなどは教えてくれませんでした。それを実際に行う方法についてのエンジニアリングの答えは得られません。しかし、要約するのは素晴らしいです。
ChatGPTよ。これらの言語インターフェースは、自然言語を使って物事を要約するUIツールとして素晴らしいのですが、エンジニアリングの答えを与えることは決してありません。橋を建設したり、トラックを回るために使う必要があるスリップ角をデザインしたり、衛星を軌道に打ち上げるためにロケットが必要とする軌道をデザインしたりすることは決してありません。
それを行うモデルをデザインし、この自然言語インターフェースに、それが最も得意とすること、つまり言語を使って結果を伝えることをさせることができます。ですから、これらのモデルが得意とすることに使われることが、本当に未来だと思います。
それは、ライブラリを読み込んで関数を呼び出すような世界ですが、関数を呼び出す代わりに、特別に訓練されたAIエージェントを呼び出すのです。少し賢いオブジェクトと言えるでしょう。そのように考えるなら、それが本当にこれらのものを考える方法です。
それらをエンジニアリングシステムとして使っているなら、基本的にオブジェクトを持つことになりますが、そのオブジェクトは特定のタスクを半自律的に本当にうまく行うために、独自のコードと独自のモデルをその中に持っています。
あなたは多くの異なるAIアプリケーションを見てきました。日産でバッテリー予測のようなことをしていた時期があることを知っています。あなたのキャリアのその部分と、そこで学んだこと、そしてそれが今日あなたが行っていることにどのように発展したかについて、少し教えていただけますか?
自動車業界では、私は企業アーキテクチャにいて、実際に自動車業界で最初のHadoopスタックを導入しました。そこで多くの異なる情報を照合しました。車両自体に関する情報、自律運転情報の束、バッテリー情報、バッテリー予測がありました。
私たちは、電気自動車での航続距離不安が大きな問題である、バッテリー予測分析のような本番環境に移行したものを作成しました。私たちには日産リーフ電気自動車がありました。エアコンをどのくらい使っているか、これやあれをどのくらい使っているか、またはシリコンバレーの高速道路101号線で渋滞にどのくらい巻き込まれているかに応じて、「いや、あなたはこのくらいは大丈夫です」と予測できるようになりました。これは人々が気にかけていることでした。
ですから、AIをアシスタントとして使い、データ駆動型機械学習ベースのアルゴリズムを使って、工場での予測保守、車の予測保守のようなことを行い、何かが壊れることを知らずに実際に壊れてしまい、それを防ぐことができたということを人々が知った時に、本当に怒ることを教えてくれました。
問題が起きてからではなく、問題が起きる前に「ちょっと、問題が起きる前にこれをショップに持っていった方がいいかもしれません」と伝えることで、人々の車のブランド変更を積極的に防ぐことができます。
このようなことを、自動車業界でデータとデータ駆動型のものを使うことは、本当に重要だと思います。私たちが行ったことの一部に影響を与えたと思います。私たちがAndretti Globalのレース関連の仕事を始めた時、それは私に実績を与えました。私は8歳の頃から叔父たちと車に夢中でした。車会社で働くのは本当にクールでした。
私は生涯を通じて車を愛していました。特に電気自動車とこれらの本当に高性能なシステムで働き、そして今それを適用し、私たちがAIで行っているものを、主要な顧客の一つであるAndretti Globalとのやりとりで適用し、BMWとも発表した最適化での仕事の一部で適用しています。
ですから、これは多くの製造業や産業会社が、これらのエンジニアリングモデルから得られる洞察から多くを得ることができる、本当に重要な分野だと思います。
車の予測保守についても興味深い考えですね。私たちは2台の車を持っていて、一台ではACコンプレッサーが予期せず故障し、もう一台では20万マイルでステアリングラックが故障しました。ステアリングラックの交換には喜んで小切手を書きましたが、ACコンプレッサーについては不満でした。それらは同じくらいの金額だったにもかかわらず、主に一つは来ることがわかっていて、もう一つはサプライズだったからです。
そうですね、これについては心理的な側面があります。問題が起こることがわかっていて、それを予測し、故障する前に防ぐことができれば、そのことについてより良く感じます。これは実際に消費者行動で見つけたことで、そのようなことが起こるということです。結局のところ、人々はサプライズを好みません。
彼らは予想していなかった結果を好みません。人々は「ああ、私のタイヤを交換する必要がある」ということに問題を感じませんが、予期していなかった釘を踏んでしまった場合は別です。その時は、摩耗して交換する必要がある4本のタイヤよりも、交換している1本のタイヤについて本当に腹を立てます。後者の方が高価であるにもかかわらずです。
そうですね、これは多くの人間の行動の場合だと思います。会社のHRでの混乱を予測できるなら、誰かが去ろうとしているかもしれないことを知っていれば、私たちは定着率で、または例えば後継者計画でより良くできるかもしれません。
ですから、これらのAIシステムは、私たちが会社で行うことをより予測的な方法で行い、私思うに、より少ないサプライズを持つことで、本当により良くなっていくと思います。
私の頭はすぐに「離職しそうで昇給が必要だという信号を会社のAIに送る方法」について考えました。
あなたの行動からおそらくそうでしょう。いや、本当にそうなんです。これらのビッグデータシステム、そのHadoopシステムにすべてのデータがあった場合を考えてみてください。時間をかけて物事を集約すると、行動について、物事がどのように反応しているかについて学べることは、ちょっと不気味です。
彼らは物事を非常に予測的にします。つまり、人の運転習慣だけから、その人の生活で実際に何が起こっているかについて予測できることがありました。加速習慣とブレーキ習慣だけからです。
これらの変化を見ると、「よし、何かが起こっている。ヒューストン、ここで問題がある」と言えます。そして、消費者向けの会社として、私たちが彼らについて知っていることを人々に知ってもらいたいかというと、そうではありません。
では、どうすればよいのでしょうか?法的な背景を持っていることは興味深かったです。なぜなら、「よし、ここにはプライバシーの問題があり、考慮しなければならないPRの問題もある」という感じだったからです。
しかし、人々についてそれだけのデータを集約すると、実際に何が起こっているかを予測できるのは事実です。実際に、私たちはトラックでのイエローフラッグ、事故を80%以上の精度で予測しています。
今、誰かの行動が仕事を辞めそうな感じか、少なくとも他の場所での面接を楽しんでいるように見える時を予測できます。そのようなことを実際に予測できるのです。
良くも悪くも、これは私たちが考えなければならないことです。そして、科学者やエンジニアだけでなく、倫理学者、法律関係者も、これらの知的情報源を含む世界、過去に人間が持てたよりも何が起こっているかについてより良い洞察を持つかもしれないものについて考え始めることが重要だと思います。
それは何を意味するのでしょうか?その含意は何でしょうか?そのデータを持っている時に組織をどのように運営するのでしょうか?それをどのように使うか、使わないか?それを使うことを防いだり、間違った方法で使われることを防いだりするにはどうすればよいでしょうか?
私は「ああ、神よ、AIが引き継ぎ、地球を破壊するだろう」というような終末論者の一人ではありません。私たちが本当にそこにいるとか、汎用人工知能が今人類にとって実存的脅威だとは本当に思いません。
しかし、あらゆる技術革命で行ってきたように、何が起こりうるか、もしもの場合について積極的に考え始める人々を持つことは私たちの義務だと思います。なぜなら、私たちは人類として、技術で良いことを持つことの意図しない結果を理解することに、時として本当に貧弱な仕事をしてきたからです。
それは人間の組織や行動に何をするのでしょうか?ですから、それを見始める必要があると思います。
歴史は、技術が常に前進しており、それが搾取的にならないよう非常に注意深くなければならないことを教えています。規制と思慮深い使用を技術と並行して進歩させることは、認識する必要がある人間という種族としての私たちにとって大きな機会です。
また、私の車が「今日はちょっとブレーキを強く踏んでいますね。そのセラピーセッションを早めた方がいいかもしれません」と言うアイデアも好きです。
今日はカフェインを控えた方がいいかもしれません。ハーブティーに切り替えてください。
あなたはAndretti GlobalとF1レースについて少し話してきました。少し詳しく話しましょう。AIがF1レースをより良くしている興味深いまたは驚くべき方法は何ですか?
私たちはインディカーシリーズにいます。これはF1のアメリカ版です。私たちはオープンホイールレースを行っています。モータースポーツでは、それは本当にすべて戦略についてです。
私の息子をレースに連れて行った時、面白いことがありました。彼はレースに興味がありませんでした。彼の好みではありませんでした。しかし、コルトン・ヘルタとのパンクコンサートに行けるという理由で彼をそこに引きずり込みました。コルトン・ヘルタは副業でドラムを演奏しています。それが私が彼をそこに連れて行った方法でした。
しかし、彼がピットで私たちが行っていることを見て、ドライバーがやりとりし、すべてのデータとこの種のものすべてを見て、人々が話していることを見た時、彼は「うわあ、これは私が好きな戦略ゲーム、リスクのようなもののようですね。これは本当にチェスと戦略についてなのですね。タイヤ戦略で何をするか?ピット戦略で何をするか?ここで何をするか?」と言いました。
多くの人にとって本当に驚きなのは、このスポーツがどれだけデータ駆動であったかということです。なぜなら、それを実行する必要があるからです。結局のところ、それはエンジニアリングコンテストなのです。それが彼が最後に言ったことでした。そして、それがそれです。それは運転コンテストというよりも、エンジニアリング戦略コンテストなのです。
ドライバーたちはあなたと議論して、「ああ、私たちがアスリートとして行っていることは現象的で、実際にそうです」と言うでしょう。しかし、戦略を間違えると、トラック全体で最速のドライバーになることができ、間違った時にイエローフラッグが一つ、ちょうどこの過去の週末にスコット・ディクソンに起こったように、戦略を逃し、列の後ろに行きました。彼はレースに勝つ競争から、チャンスすらない状況になりました。
ですから、実際に多くのデータ、多くのエンジニアリング分析が行われています。それは大きなデータタイプのゲームであり、AI部分は戦略と運転により良い意思決定を与えています。
結局のところ、これはより良い決定科学を行うためにAIを使うことについてです。この車をいつピットに入れるべきか、いつ入れるべきでないか、結果は何か。これは統計的ゲームであり、AI機械学習はすべて統計と過去から学ぶことについてです。
私たちは、さまざまなドライバーとさまざまな状況でそのトラックを回る20年間の履歴データを取り、物事がどのように起こるかについて非常に予測的になることができます。私たちはその状況で、本当に良い物理モデルから始めることもできます。物理モデルとは、シミュレータ、デジタルツインのことです。
レースでは、デジタルツインは本当に、本当に良いです。Gran Turismoを見たことがあるように、ゲームが上手になると、それは実際の車でそれを行うことに時々本当によく変換されます。デジタルツイン、ゲームは、そのトラックをどれだけよく知っているか、トラック温度が何であるかについて、時にはミリメートルレベルの許容範囲まで下がります。車のモデルは車の完璧な物理モデルのようです。
ですから、油圧付きのこれらのシミュレータの一つに入ると、それは本当にそのものです。基本的に、マックス・フェルスタッペンを連れてきて、スパトラックでの彼の車の彼のセットアップに入れると、彼のラップタイムを10分の1秒以内で予測でき、彼はレース日にそのセットアップでその車で運転するのと同じように、そのラップタイムを運転するでしょう。
レース開始時の満タン燃料で、あなたのラップタイムは?予選セットアップで、あなたのラップタイムは?そして、それは10分の1秒以内でしょう。それらがどれだけ良いかということです。
しかし、これが意味することは、私たちが今、このデジタルツイン能力とすべての履歴データを実際に持っているということで、以前にはできなかったことを行うことができるということです。なぜなら、マックスに「そのシミュレータに座って、食べることなく、眠ることなく連続で1000時間やってほしい」と言うことはできないからです。
私たちはそれをすることはできません。彼はちょっと高価でもあります。しかし、二流のドライバーでさえ、私のためにそれをすることはできないでしょう。そして、これらの設定で別の1000時間、このトラックでその設定で別の1000時間をやってほしいのです。人間にそれをさせることはできません。
しかし、マックスが車で何をするかのモデル、ハイパーパラメータ化があり、それを10分の1秒の許容範囲内の完璧に近いデジタルツインに適用できるので、異なる設定、異なることで、マックスがそのシミュレータに1000時間座っている合成データを作成できます。GPUにお金があれば、100万回でもできます。
そのデータで今、さらに良いモデルを構築できます。ですから、これは本当に反復的になります。私は合成データという言葉を使うのが嫌いです。なぜなら、それは実際にマックスが車に座って1000ラップを行うのと同じだからです。彼は物理的にそれをすることはできませんが。
そのデータで今、私たちは何が実際に起こるかをより良く予測でき、これをした時、あれをした時のスリップ角のような物理的特性を予測できます。そして、それゆえに、以前にできたよりもより良いレベルの忠実度でタイヤの劣化がどうなるかを予測できます。
ですから、私たちが持っている物理モデルと組み合わせた生成モデリングは、物事がどのように起こるかについてより良く、より良く、より良く予測的になり、したがって何をすべきかのこの戦略ゲームでより良くなる、この本当に素晴らしい反復的な良循環を作り出すことができます。
レースについて興味深いことは、多くのエンジニアリングが投入されているが、結局のところ、それを成功させたり失敗させたりできるのは人的要因だということです。
そうです。しかし、エンジニアリング自体は本当にクールです。私たちが遊ぶことができるものは、これらはトラック上の航空宇宙工学です。本当にそうです。
インディカーについてのクールなことは、ハイブリッドを入れた今、それらの重量は約1700ポンドだということです。しかし、その車を裏返したなら、ウィングが非常に多くのダウンフォースを持っているので、上下逆さまにして天井に置き、通常走る200マイルではなく約120マイルの半分の速度で走らせると、実際に天井に張り付いてアリのように這い回るでしょう。
それらのウィングがどれだけのダウンフォースを持っているかということです。
うわあ。
ですから、私たちが実際にそこでアクセスしているエンジニアリングは現象的です。物理学とエンジニアリングについて本当にオタクな人々にとって、それは多くの楽しみです。私たちはこれで遊ぶことができ、OEMの車の状況では得られないエッジを得ることができます。
そして、クールなことは、これらのマシンで物理的に可能なことの端でそのようなことを行う時、それはすべて最終的にOEMの車へ、そして私たちが日常的に運転する車へと前進し、より安全な車、消費者にとってもより良い性能の車両を作ることです。
私の日常の車は2006年式ですが、適応油圧サスペンションがあります。大きなSUVで、それを回すと、右側のショックが少し固くなります。そして、それはこれらのすべてのものでなければなりません。つまり、アンチロックブレーキに入る多くの技術とモデリングがあります。そして、このすべてのものは最初にトラックで起こりました。
インディに入って学んだ興味深いことは、バックミラーがインディ500で発明されたということです。彼らは以前、車に2人乗っていて、一人をスポッターとして「はい、右に行っても大丈夫です」と言ってもらっていました。
そして、ある日、誰かのスポッターが現れませんでした。彼はそこにミラーを付けて、一人だけでレースができました。体重が半分になり、彼はレースに勝ちました。そして、それからみんながバックミラーを使うようになりました。
ですから、アンチロックブレーキからバックミラーまで、これらの発明の多くがオートレースから出てきています。これはエンジニアリング開発の観点から、ちょっとクールです。
それはワイルドですね。
ちょっと休憩の時間です。すぐに戻ります。
このエピソードはMouser Electronicsによってスポンサーされています。あなたの設計実現配送業者として、Mouserは何千もの主要ブランドからの数百万のコンポーネントの認定ソースです。発見、設計、開発しに来てください。
さて、Zapata AIの創設者兼CEOであるクリストファー・シーボイに戻りましょう。
これが本当に興味深い他のアプリケーションについて話しましょう。あなたはグリッド管理で働いています。それはレースほど派手ではないかもしれませんが、私たちは皆それを必要とし、使っています。そのアプリケーションがどのようなものか、そしてグリッド能力の改善が見られる驚くべき分野について話していただけますか?
この種のネットワーク化された状況では、レースでイエローフラッグ予測で行っていることを考えてみてください。私たちは実際に問題が起こる前に、事故が起こることを事前に予測できます。
ですから、20年間のデータを取り、車が本当に接近したり、ピットサイクルがあったり、この種のことやより微妙なものがあった時のデータのパターンを見始めます。ここで悪いことが起こる可能性が高いのです。
これを電気通信ネットワークスペースや他の種類のグリッド管理タイプの状況で考えてみると、電力管理システムのすべてのネットワークホップまたはすべてのノードでそれらのイエローフラッグ予測器の一つを持っていて、需要が高すぎるために物事がちょっと変になっているのを見て、物事がダウンする前にその信号を送ることができるとします。
そのネットワークを管理している人として、物事が悪くなり、すべてが崩壊し始めた時に、「これらの100台のデバイスがダウンしています。これらのデバイスの階層があります。100台のトラックを出して、それを把握してください」と言われる代わりに、今私たちができることは、最終的な災難の前に、ここで何かが起こっているのを見たということです。ここで最初に何が起こっていたのでしょうか?
よし、テイラー・スウィフトがXで新しいビデオを出したばかりです。よし、それがこの問題を作り出しました。よし、しかし、それは最初にこのルーターで起こり始め、次にここで、次にここで起こりました。
ですから、トラックを出す時、実際に今、「ここを最初に試してください、そこを試してください、あそこを試してください」と言えます。100台のトラックを出す代わりに、3台を出すことができます。
停電でも同じことです。天候イベント、熱、何であれ、ここで大きな需要信号を追加し、雷がこのトランスフォーマーに当たります。緩和するために最初にどこに行くべきでしょうか?
現在、以前にVerizonでネットワーク運用オペレーションガイとして働いていた時、私の他の仕事の一つでは、本当に「これらの100台のデバイスがダウンしています。それを把握してください」と言われ、どれがどれに関連しているかは知っていますが、事前にその予測情報は持っていませんでした。
その予測情報があれば、ネットワークを稼働させるのにはるかに的を絞った、はるかに効果的、はるかにコスト効果的で時間効果的になることができます。
そして、それは電気通信、電力グリッド管理、エッジで想像するかもしれないあらゆる種類のIoTアプリケーションで機能する概念です。それがこの技術の本当にクールなアプリケーションです。
もし私がこれを私が抱えている特定の問題や、私の業界全体、ウィジェットの製造に適用したいなら、どこから始めるべきでしょうか?どのような質問をし、実際に有用な最終状態に到達するために、どのような考慮事項やデータを収集し始めるべきでしょうか?
あなたは本当に興味深いことを言いました。これは私たちがモデル開発で見つけたもので、人々は最初のステップだと仮定しています。データを入手し、どのようなデータが必要かということです。それは古いビッグデータの時代から人々が始めた場所です。それは私たちが日産で行っていたことです。よし、すべてをHadoopに入れて、後で何を意味するかを把握しようと。
Zapataでの私たちの関与で見つけたことは、このパラダイムを逆さまにしなければならないということです。私たちは本当に決定科学から始めなければなりません。世界について何を知りたいのか?どのようにしてあなたのビジネスをより効率的にしたり、あなたの問題を解決したりできるのか?
もし私がそれらを解決すれば、本当にあなたにとって針を動かす問題は何でしょうか?そこから始めて、それから「よし、そうです、私はより良い戦略決定を行うためにイエローフラッグを予測したいのです」と言います。
レースの例に戻ると。よし、それを行うためにどのようなモデルを使うのでしょうか?よし、私たちはこれを行うことができるGANモデルを使い、それについて予測的になるでしょう。ここで強化学習を使うでしょう。よし、そのために何が必要でしょうか?まあ、これ、これ、これ、これ、これについてのデータが必要です。
今、私はどのようなデータソースを持っているかを調べに行くことができます。それらを持っていないなら、どのような合成データをテーブルに持ってくることができるでしょうか?構築するために、アクセスできる、またはライセンスできる他のデータソースは何でしょうか?
ですから、それは実際にパラダイムを逆さまにします。私は考えることなしにデータを保存しているわけではありません。そして、「ああ、私は大量の干し草を持っています。針はどこにありますか?」と試みることではありません。あなたはどの針が欲しいかから始めます。よし。そして、その多くの針を見つけるのに十分な干し草をどのように手に入れるか?
そして、針に到達するために使用する干し草を篩い分けるモデルは何でしょうか?そこから始めると、結局のところ、はるかに少ない干し草とはるかに多くの針を得ることになります。
それが私たちが本当にしようとしていることです。非常に特定のビジネス質問により良く答える小さなモデルを持ち、効率的な方法でそれを行うことです。クエリあたり8ドルは多くの場合に機能しません。そのようにしてROIを得ることは決してありません。
ですから、それは思考の階層のようなものです。解決しようとしている問題は何か?それらの問題に答えるためにどのようなモデルを使うか?そして、それらのモデルに何のデータを供給するか?
まさにその通りです。そして、それは本当に反復を通じて行われます。ソフトウェア開発ライフサイクルのようなモデル開発ライフサイクルがあります。私たちはそれをMDLCと呼んでいます。
しかし、ここでの違いは、ソフトウェア開発ライフサイクルでは、会社ソフトウェアの製品計画セッションとロードマッピングセッションとQ3に到達でき、「はい、来年は予算が下がるので、これらの機能のみを追加します。それ以上の開発は行いません」と言えることです。
モデルの問題は、それらが生きているものだということです。データが変わると、それらはもはやそれほど有効ではなくなります。ハイブリッドエンジンを持たなかったインディカーから、ハイブリッドエンジンを持つものに切り替えた時を知っています。うわあ、今私たちはバッテリー管理を行っています。
それは非常に異なります。ガソリンのみのエンジンデータを使い続けると、同じ答えが得られません。ですから、今私たちは反復しなければならず、予算サイクル、設計サイクル、すべてが、そこにあるこの種の生きているものを持つ新しいパラダイムに合うように変わらなければなりません。それは仕事を正しく行うために、供給され、維持される必要があります。
ですから、ソフトウェアをエンジニアリングする方法、そこにあるモデルをエンジニアリングする方法についてのこの全体的な思考において、それは一種のクールな発展だと思います。私たちはモデルを開発し、展開し、野生に置き、今それがどのように機能するかを見て、そのモデルを常に再ベンチマークし、再検証して、今入ってくるデータに基づいてそれが有効であることを確認しなければなりません。
これをすべてどのように始めたのですか?あなたはZapataを持っていて、この会社のアイデアはどこから来て、それを独自のものにする中核的な触媒は何ですか?
私たちは2017年にハーバードの量子アルゴリズム研究室からスピンアウトしました。6人でそこのハーバード量子研究室から技術を取り出しました。私たちは本当に良い線形代数、本当に良い高レベルの数学を持っていました。それをそう呼びましょう。
量子化学問題と量子物理学問題を解く方法を知っていました。これらは数学を行う最も困難な多次元空間の一部です。この電子はただここにいるだけでなく、アンドロメダの向こう側にもあり、あなたのGPSが正しく動作するように計算時にそれを考慮に入れなければなりません。
統計は重要です。それはここにあり、ここにあり、ここにあり、ここにありますが、そこよりもここにより多くあります。そして、私たちが住んでいたその種の統計的フレームワークと世界は本当に困難です。
ですから、今私たちはそれをネイティブに本当にうまく行うことができる量子コンピューターを開発しています。しかし、その背後にある数学は、結局のところ、線形代数です。それが何であるかです。それは、その種の空間で動作できる本当に強力な統計アルゴリズムです。
そして、それらのアルゴリズムとそれらの方法を取り、産業分野に適用することが、最初からの本当のビジョンでした。今、私たちはそれを材料開発のための量子化学に使うことができ、他の多くのことに使うことができます。
しかし、私たちが最初から実現した重要なことの一つは、うわあ、2017年の生成モデリング、サム・アルトマンがOpenAIで営利事業体を持つ前でさえ、私たちは「生成モデリングは分子によく似ている」と考えていました。奇妙に聞こえるかもしれませんが、量子分子は、ある種のファジネスを持つこの電子の隣に、ある種のファジネスを持つこの電子です。
不確定性原理のために、それはここでもそこでもどこでもありません。今、この分子がその分子にどのように結合するかを把握するために、それらすべてのことを考慮に入れる必要があります。そして、それがどのように見えるか、それについて予測的になろうとします。
まあ、分子は言語モデルや他の生成モデリング、DALL-Eのようなプログラムで行っているもののようなモデルによく似ています。
DALL-Eに行って「尻尾のない紫の水玉の猫を描いて」と言うことができ、それはそれを行うでしょう。そして、あなたは「まあ、どのようにしてそれを行うことができるのか?それは紫の水玉の猫の写真について訓練していない。少なくともそうではないことを望む」と言います。
しかし、それが行ったことは、多くの猫を見て、猫とは何か、猫が犬とどのように異なるかを一般化できたということです。その一般化が最初のことです。それは統計的モデルを見つけることができました。「よし、猫は体に比べて頭がこのくらいの大きさの4本足のもののようなものですが、それほど大きくはない。この大きさになると、もう猫ではありません。尻尾がそれほど長いと、猫ではなくアライグマです」
ですから、それはすべて統計的であるこれらのパラメータの一般化を見つけることができます。足はこの大きさでもよいが、あの大きさではいけない。それはそのくらいの大きさでしょうが、奇妙ではない。あまりに奇妙だと、もう猫ではありません。
しかし、それはこれらの量子システムのように表現力もあり、「そう、それはアンドロメダの向こう側にある可能性がある」と言えます。ありがたいことに、この原子は私の爪にあり、アンドロメダの向こう側にはありませんが、それはそこよりもここにより多くありますが、現実にはそれは実際に同時に他の場所にもあります。
ただ、ここよりもそこにはより少ないのです。そして、それが本当にこのモデリングが行うことです。ですから、私たちは分子と原子で行うことを、それがどのように見えるかに直接関連付けることができました。
そして、私たちはその数学を、より良い一般化を行い、それらの一般化からより良い予測や表現を行うために適用できました。現在DALL-Eや他の拡散や他のタイプのモデルで使っているものよりも、尻尾のない紫の水玉の猫のようなことをより良く行うことができるのです。
そこから出てきた量子統計を使うことが、私たちが非常に早期から使うことができた本当の洞察でした。生成AIに量子を適用する最初の特許は2018年でした。最初の特許出願です。ですから、私たちは初期の頃からこれを行っていました。
2018年に生成AIを行う量子会社だと言うのは、ちょっと困難でした。1998年にSiriについて話すようなものでした。「そう、あなたは電話に話しかけて、明日の天気がどうなるかを尋ねるつもりです」。「まあ、なぜ天気予報を見ないのですか?」それが当時に私が得た返事でした。
そして、これはそのようなものでした。「まあ、なぜ偽の写真を生成したいのですか?そのビジネスモデルは何ですか?」いや、猫の偽の写真だけではありません。実際に機能し、エンジニアリングするものの偽の写真を生成でき、レースの例で話しているように、車のスリップ角を生成できます。よし、どうやって、理解できません。
ですから、ある意味で私たちは時代を少し先取りしていました。ありがたいことに、OpenAIプロジェクトとこの種のもの、それがここに出てきたことで、人々はこの生成能力に多くの力があることを実現しました。
それが言語側に過ぎず、悪いマーケティングコピーを生成することに過ぎると思います。これらの創造的エンジニアリングタイプのアプリケーションでより良く使うことができると思います。それが私の個人的な意見です。
それがより良いマーケティングコピーを書くことができるなら、私の仕事ははるかに簡単になるか、私は仕事を失うでしょう。ですから、それがまだそこまで到達していないのを見て嬉しいです。
先ほど、一つの大きなカバーオールモデルに対する多くの小さなエージェントモデルについて話していました。あなたはエージェントを行っていますか?スタックのより高いレベル、より上位で行っていますか?それはすべてどのように一緒に機能し、どのように見えますか?
私たちの会社では、これらのエージェントのアンサンブルで完全なスタック開発サイクルを行うことを可能にするプラットフォームを持っています。ですから、エージェントとエージェントのアンサンブルを開発し、それらを一緒に動作させることができます。
Andrettiでは、65のエージェント、これらの小さなモデルが2台のA100でトラックでリアルタイムでリアルタイムストリーミングデータで推論をライブで実行しています。それはかなりクールです。
そして、私たちはこの種のアンサンブルのオーケストレーションを行うためのオーケストレーションツール「Orchestra」と名付けられたものを持ち、これらのアンサンブルエージェントを構築し、これらのモデルを調整し、それらをアンサンブルとしてオーケストラとして動作させ、結果を創造し、予測的で、ライブなものになることができます。
チェックリストのすべての異なるエージェントを持って「ああ、サスペンションエージェントとタイヤ摩擦係数エージェントとそれらすべてを呼び出そう」と言う必要がないというのは理にかなっています。単一の入力出力、フィードバックのようなものが欲しいのです。それが最も有用です。
その通りです。それを行うことを可能にするプラットフォーム、そして結局のところUIを使うことを望みます。どのような種類のUIツールでも開発できます。Tableauは他のものに統合されて、グラフィカルな答えを与えることができます。
OpenAIエージェントを使ってそれらのものにクエリを行い、自然言語の答えを与えることさえできます。「次のラップの予測ラップタイムを教えて」と言って、そのものがタイヤ劣化やタイミングエージェントのような他のすべてのエージェントに尋ねて、その答えを与えてもらうことができます。
まあ、私はあなたと一日中話すことができると思いますが、私たちには数分しか残っていません。最後にいくつかの稲妻質問をしたいと思います。
よし。
私のお気に入りの一つは、あなたは数十年間この分野にいて、ゲームの先を行ってきました。実生活でも、ポップカルチャーの小説や映画でも、このAIのことを本当に正しく理解したと見た例はありますか?そして、それを本当に間違って理解したと見たものはありますか?
本当に良い質問ですね。HALのものやスター・ウォーズのコンピューター、特にスター・トレックの偽のコンピューターは、私が言及したように、すべてのデータとすべての答えを持つこのモノリシックなもの、それが私たちが持っていた理想主義かもしれないという意味で、それを間違って理解したと思います。
テクノロジーはスター・トレックのコンピューターを私たちに与えるのに不足していると思います。そして、特定のタスクのために使うことができるツールではなく、HALのような超知能的な人間のようなものを得るという間違った期待を設定したと思います。
エンジニアリング側では、異なる問題に対する異なるタイプのテスト機器について考えますが、消費者として、人間として、私はただ「サーモスタットを上げて、EVバッテリーを予熱し、20分後にオーブンを始めることを思い出させて」と言うような一つのインターフェースが欲しいのです。心理的な何かがあるに違いありません。
そうですね。そして、人々の行動を予測し、この種のディストピア的なもので見る他のサイエンスフィクションドラマ的なもののいくつかは、その危険性があると思います。私たちが話したように、ビッグデータで消費者について本当に多くを知ることができるようになりました。
それらの一部は真実からそれほど遠くありません。私たちは犯罪をかなり迅速に解決することができます。そして、それがあまりにもビッグブラザー国家になると、正当な理由で中国でこれを見たことがあります。
彼らは10億人の国で、すべてのカメラと何らかのもののために、テロ行為を犯した誰かを8分のように見つけることができました。それはかなりクールですが、それはすべての情報を持つ権威主義国家でもあります。私は本当にそれを望みますか?
ですから、そのディストピア的なもののいくつかは現実にいくらかの根拠を持っています。
AIが向かっている方向について恐れることはありますか?そして、人口への一般的な行動喚起として、私たちがそれについて行うべきことはありますか?
それは人々がそれをどのように使うかについてだと思います。私たちのプライバシーとこれを政府の透明性と呼ばれるものを保つことだと思います。彼らが人々がお金で何をするか、購入で何をするか、結局のところ日々何をするかを見ることができる時、それはコントロールになります。
そして、私たちは、便利だからという理由で、大手テクノロジー企業と政府にコントロールを譲り渡すことで、ゆっくりと沸騰する水の中のカエルのようになったと思います。偏執的な方法ではありませんが、私たちはただそれをしました。
私はすべてのパスワードを一か所に置きたいです。私は関連な検索結果を本当に与えてくれるように、ここに検索履歴を持ちたいです。私のExpediaホテル推奨がこのようになることを好みますが、今それは私がどのようなホテルを望むか、それがどこにあるかを正確に知っており、私についてのデータを持っています。
政府がそれを行ったなら、どのように悪くなる可能性がありますか?そして、人々の家系図のリストのような、それほど洗練されていないものでさえ、ドイツで人々を殺すために使われたのを見たことがあります。政府が情報を持ち、コントロールしたい時に、物事がどのように機能するかの極端ではない例です。
ですから、この技術で何を望むかについて注意することの一種があります。私は陰謀論者ではありません、どちらの政治的スペクトラムの側でも。しかし、時間をかけて誰であるかのために人々が殺されてきた伝統から出てきているので、将来どのように誤用される可能性があるかについて少し敏感になります。
人間社会として犯す可能性がある最大の間違いは、「ああ、それはここでは決して起こらないだろう。それはここでは決して起こりえない」と言うことだと思います。そして、それに先手を打って、間違った人々が権力を持っている場合に誤用される可能性があるすべての方法について考えることが私たちの義務だと思います。
絶対的権力は絶対に腐敗しますが、少しの権力でも本当に腐敗的なものになり、誤用される可能性があります。
ですから、AI自体は、それほどでもないかもしれませんが、AIとデータの透明性と、よし、国のデジタル通貨、それは物を買うために使うことができるすべてで、私たちは今、あなたが行うすべての購買行動を知っており、すべてを知っています。
今、私たちはあなたに対する完全なコントロールを持っています。なぜなら、私はあなたの食べ物を買う能力を切ることができるからです。
確かに。ツールは恐ろしく、誰も自分がテーブルソーが滑って手を切る人になるとは思いません。
その通りです。
より明るい話題で、約30秒で、もしあなたが魔法の杖を振って、AIにAIMLの世界で何かをさせたり、問題を解決させたりできるなら、何を魔法的に解決したり修正したり変更したりしますか?
私にとってはマルチモーダルだと思います。私はちょっと忙しいので、私のカレンダーと時間管理のマルチモーダル提案が本当に有用でしょう。
今はカレンダーの予定リマインダーをさせることができますが、本当に複雑なクエリは、私は本当にそれを愛するでしょう。「ねえ、私は来週ヨーロッパに行きます。この都市、次にその都市にいる予定です。私の好みに基づいて、ホテルでどこにいるべきですか?」のようなもの。
それは本当にクールでしょう。そして、私のワークアウトのためのプールがあるホテルが欲しく、云々で、しかしこの金額以下で、これが私の予算で、云々。行ってください。それは本当にクールでしょう。
今日はお時間をいただき、ありがとうございました。これは本当に啓発的で興味深いものでした。
お役に立てて、ありがとうございます。これは本当に興味深い会話でした。
それはZapata AIの創設者兼CEOであるクリストファー・シーボイでした。今日はロビーでお聞きいただき、ありがとうございました。
このエピソードは絶対的な楽しみでした。このエピソードについてのあなたの考えを聞きたいです。All About CircuitsとMoors Lobbyのソーシャルページで私たちに知らせに来てください。そして、これを気に入ったなら、それを気に入ると思う友人たちとシェアしてください。シェアすることは、このポッドキャストが成長する一番の方法です。
そして、このエピソードをスポンサーしてくれたMouserに感謝します。
私はあなたの間違いなくAIではないホスト、ダニエル・ボグダノフです。次回お会いしましょう。


コメント