「人工知能」ライアン・リース

AI研究
この記事は約31分で読めます。

本動画は、素粒子物理学者から技術業界へ転身したライアン・リースが、人工知能の発展と創造性への影響について語るインタビューである。物理学から始まった彼のキャリアの軌跡、ディープラーニングの基本原理、創造的分野におけるAIの役割、そしてAIが人間の思考能力に与える潜在的影響まで幅広く議論している。特に、AIを脅威ではなく人間の能力を拡張するツールとして捉える楽観的な視点が印象的である。

Artificial Intelligence, Ryan Reece
Roger sits down with Ryan Reece, a particle physicist and data scientist specializing in deep learning, to discuss artif...

素粒子物理学から技術への転身

よう、ライアン、ショーへようこそや。参加してくれてありがとうな。

こちらこそ、ロジャー。ありがとうや。

君と僕は中学1年の時から知り合いやな。それで、こういう会話を何回も何回も重ねてきたわ。哲学的なもんもあれば、科学的なもんもあったな。君自身、めちゃくちゃ面白い軌跡をたどってきとるわ。それで、素粒子物理学での君の歴史を振り返って、今日までどうやってきたか教えてくれへんか。

うわぁ、キャリアの要約か。そうやな。僕はいつも物理と数学にめっちゃ興味があったんや。親父がソフトウェアエンジニアやったから、プログラミングが早い段階で興味の対象になったと思うわ。高校の時にはもう学者になりたいって分かってたと思う。

テキサス大学で物理学の学士号を取って、それからペンシルベニア大学で博士課程を勉強したんや。

君が勉強してたのって、特定の種類の物理学なん?いろんな種類があるんか?

違うやつがな。専門化せなあかんのや。それで、素粒子物理学の中でも、僕は実験家なんや。実験と理論を勉強する間に分岐点があるんやな。

最初は理論の勉強だけでもめっちゃ楽しかったと思うわ。トピック自体がほんまに面白いからな。でも理論家になるには相当な自信がいると思うねん。ほんまにその分野の最前線を押し広げられるって思わなあかんからな。一方で実験家やったら、理論を勉強して面白い質問を選んで、それで成功するかどうかを決めるのは他の人とどれだけうまく協力できるか、技術をどれだけうまく使えるかなんや。特に素粒子物理学はな。

CERNの歴史とそれが何をしてきたかまとめることもできるけど、30年前にWorld Wide Webを始めるのを助けたみたいにな。インターネット技術の多くは、世界中で協力しようとする素粒子物理学者によって推進されたんや。今では大企業、FacebookやGoogleが世界中に巨大なデータセンターを持つのは当たり前やけど、素粒子物理学者が90年代や2000年代前半に、僕らがデータセンターって呼んでるもんを本当に押し進めたと思うわ。

そのコミュニティから学ぶのはめっちゃいい訓練やったな。

物理学から創造性へ

君にとってなんで素粒子物理学やったん?他の研究分野じゃなくて。

子供みたいな質問やからやな。空がなんで青いんか、宇宙はどこから来たんかみたいな。何でもいいから「なんで」って聞き続けたら、説明のいろんなレベルで止まることができるやろ。でも「なんで」って聞き続けたら、ほんまに面白い質問にたどり着くんや。それが素粒子物理学の分野を動かしてるもんなんや。

君の場合は、基本的に次の質問をし続けたってことやな。

そうや。それで、物理学がその答えにどれだけ情報を提供できるかがほんまに面白いと思うねん。「なんで」って答えられるもんがいっぱいあるわけじゃないけどな。空がなんで青いかには答えがあるんや。レイリー散乱って現象のせいなんやな。

糸を引っ張って「なんで」って聞いて、どれだけ多くの人が前にそれを考えて本を書いてるかに気づく時、満足できるもんがいっぱいあるんやな。

子供みたいな質問から始まるってのが面白いと思うわ。なんで物事がそうなってるんか、どうやって物事がこの位置に落ち着いたんかみたいな。なんで僕らは地球に存在してるんか。地球はどうやってこの位置に落ち着いたんか。物理学は明らかにそういう質問の多くに答えてきたし、まだ答えを出そうとしてる新しい質問もいっぱい展開してるわ。

このポッドキャストは基本的に創造性と創造的思考についてのもんなんや。科学コミュニティにおいて創造的思考はどんな位置や役割を果たしてるんやろか?

創造性を、何かを言う独特な方法を思いつくことや、前にはなかった違うもんを貢献することって意味で受け取るわ。でも君がもっといい定義を持ってるかもしれへんけど、とりあえずそれで進めよか。

それが進歩の仕方やと思うねん。誰かが違うアイデアを持たなあかんわけやからな。創造性は芸術的なことだけやなくて、型にはまらない思考なんや。出発点として存在する文献の体系を理解しておくことやな。

みんなが前に考えたことや、どこに穴があるかを理解せんと、僕がいいアイデアを持ってるなんて言われへんからな。科学者にとって創造性はめっちゃ有用やと思うし、どうやって物事をもっと一般的にできるか、どうやって物事をもっと効率的にできるか、何が欠けてるか、このコミュニティは何をしてるか、次のステップは何かって聞くことが含まれるんや。それはどんなキャリアでも当てはまると思う。今は僕は学術界におらんでテック業界にいるけど、それでも当てはまると思うわ。

同僚の中で何が物事をほんまに効率的にして前に進めるのに役立つかをよく見ようとしてるし、それを創造性の一部として見てるんや。

君が言ったことが大好きやわ。創造性は芸術家だけのもんやないってことな。僕らが伝統的に創造的な人って呼ぶ人だけのもんやない。僕みたいに商業映画製作者として働いてたら、君は僕を創造的な人って呼ぶやろうな。でもそれは僕が創造的な職業人やからで、創造業界で働いてるからなんや。でも創造性と創造的思考は確実に僕らみんなの中にあるもんなんやわ。

分野や何をしてるかに関係なく、僕らみんなが使えるツールなんや。家の周りで変えるかもしれへん何かについての創造的なアイデアさえあるかもしれへんしな。

それを指摘してくれてほんまに嬉しいわ。クッキーのレシピやないけど、何でも本当に何でも当てはまると思うねん。

テクノロジー業界への転身

強調したいのは、君が言ったように進歩の方法やからその重要性なんや。科学でも、規則正しく見えて極端に科学的に見える素粒子物理学みたいなもんでも、時には型にはまらない思考が科学を次のレベルに押し上げるのに必要やったり、単純に正しい質問をするのに必要やったりするのがほんまに面白いと思うわ。

素粒子物理学からテックへはどうやって移ったん?

これは何世代にもわたってあることで、素粒子物理学者が学術界に入られへん時に何をするかってことやな。しばらくの間、みんな医療物理学に行ったんや。今でもめっちゃいい方向やわ。MRIや X線、PETスキャン、そういうのは全部応用核・素粒子物理学技術やからな。特に90年代はそれが熱い分野やったんや。

それからしばらくはみんな金融に行ったわ。計算能力と数値解析能力のせいでな。

この10年くらい、20年くらいは、みんな何らかのバージョンのデータサイエンティストになってるんや。基本的にはいろんなことを意味するけどな。でも民間部門では、どの会社も自分らが何をしたらいいか分からんくらいデータを持ってるわけや。

顧客を理解すること、製品がどう使われてるかを理解することさえ、リスクを計算すること、あらゆることがデータベースを見て何が面白いかを把握できる能力を持つことが関わってくるんや。それがデータサイエンスっていう名前でいろんな用語で呼ばれてるわけや。

僕はある程度データサイエンティストやと思うわ。それで、この10年くらい、時計をどこから始めるかは分からんけど、ディープラーニングがこの巨大な分野になったんや。これはAIの一種なんやな。僕は最後の数年間、それをちょっとやり始めてたんや。2015年頃にCERNにいた時、Kerasっていうディープラーニングフレームワークの使い方を学ぶワークショップを主導したんや。

ディープラーニングの解説

ディープラーニングって何なん?

ディープラーニングは基本的に、人工ニューラルネットワークを使うことなんや。これは何十年も前からあるけど、人々が前に持ってたよりもずっと大規模でやってるわけや。ニューラルネットワークは、脳のニューロンがどう働くかを大まかにモデル化したアルゴリズムの一種や。でも単純にグラフやって言ってもええわ。

あるものがどう関連してるかを学んで、多くのものから要約された出力を与えてくれることがよくあるアルゴリズムのやり方なんや。長い間、コンピュータサイエンティストや研究者は、その分野をどれだけ押し進められるかを過小評価してたと思うねん。

顔認識や、君がいるバーで流れてる曲を認識できるアプリ、そういう僕らの周りの技術応用がめっちゃ良くなったのを見るやろ。

これらのカメラの1つにあるフォーカストラッカーでも、顔が何かを識別してそれについていけるようになってるやろ。それが面白いわ。

でも僕らが子供の時、食料品店で母親が小切手を書いて、その小切手がスキャンされて手書き文字を読めるのを覚えてるわ。それは90年代に動いてたし、それでもその頃の一種のニューラルネットワークやったんや。それはYann LeCunが有名になったところやな。

Metaの主要研究科学者の1人やけど、90年代に手書きの数字を認識するためにニューラルネットワークを使う方法を理解したんや。それからめっちゃ爆発的に発展したわけやな。

僕はこの10年くらい、それについて学べることは何でも学ぼうとしてきたんや。この大きなニューラルネットを実行するための新しい種類のコンピュータチップ、新しい種類のハードウェアを作る何社かのスタートアップにいたことがあるわ。使用と訓練の両方でな。

それが今僕がいる分野なんや。

つまり君は基本的に人工知能が動作するハードウェアを構築してるってことやな。

そうや。

AIの歴史と目標

ちょっと巻き戻してAIがめっちゃ熱いトピックやから、歴史をちょっとカバーしたいんや。なんで僕らは人工知能を目指してるんか?AIの一般的な目標は何なん?それは実際どこから始まったんか?

僕の読みからすると、間違ってたら訂正してくれよ。でもそれはアラン・チューリングから始まってるような感じやな。彼が「機械に論理や推論をさせることはできるんか?もしそれができたら将来僕らの能力はどうなるんか?」っていう大きな質問をした人やからな。それから50年代後半にジョン・マッカーシーがバトンを受け取って走り続けて、実際に「人工知能」って用語を作ったんやな。

めっちゃいい名前の引用やな。そこから始めるのはいいところや。1つだけ言いたいのは、チューリングが実際に形式化したのはコンピュータサイエンス全体の分野やってことや。だから人工知能より大きいんやな。

チューリングが数学的な意味で形式化したのは、コンピュータプログラムが何かってこと、抽象的にコンピュータが何かってことや。どうやって実装するかに関係なくな。チューリングマシンって呼ぶもんが、数学者がコンピュータの定義として受け取るもんなんや。どうやって作ったかは関係ない。基本的には読み書きできる何らかのメモリがあって、1と0を書いて、それに基づいて判断する方法があるってことや。

テープを動かして別の1を書くことができるし、それを消去して別のを書くこともできるし、何でもな。1と0を書いて何らかの非常に基本的な処理ができる限り、それはチューリング完全って呼ばれるんや。つまり理論的には、コンピュータプログラムって呼ばれるもんなら何でも、本当に何でも実装できるってことやな。

それがチューリングが早い段階で先見の明を持って見てたことなんや。論理のような何らかの一般性があって、本当に何でも実装する扉を開けるかもしれへんっていう。

だからそれがチューリングの革命やと僕は言いたいわ。もちろん彼はAIが将来来るもんやって見てたけどな。彼はチューリングテストって用語を作ったことで有名や。

これは、機械が説得力のある方法で会話できるようになったら、人々が知的かどうか、人工的かどうかさえ認識できるものの境界線をぼかすってことを指摘する、砂に引いた一種の線やな。だから彼はそれで有名や。でも僕が言ってるのは、彼のキャリアは実際に形式化したのはもっと一般的やってことや。

アルゴリズムって何なん?コンピュータって何なん?ってことをな。それで君がマッカーシーを人工知能って用語を作ったって引用するのは正しいわ。有名な会議があるんや。ダートマス・ワークショップって呼ばれてるやつが50年代にな。それで人々がAIについて話すことを本気で始めた場所なんや。

今この段階を生きてるのがめっちゃエキサイティングなことの1つは、僕らが話してるこういう他の古い時代を生きてへんかったからやけど、遅くなってるのが見えへんだけやなくて、前にあったよりもずっと多くの人が働いてるんやな。

何十万人の研究者、たぶん何百万人かもしれへん。研究者って何を呼ぶかによるけどな。みんながAIを実験してる今やからな。製品エンジニア、一般消費者も、それをどう適用するかについてもっと精通してきてるわ。

だから今はほんまにエキサイティングな時やと思うねん。あんまり遅くなってるのが見えへんからな。もっともっと多くの人が創造的になって物事を押し進めると思うわ。

チューリングテストと創造性への影響

君がチューリングテストに触れたから、面白い言及やと思うねん。大規模言語モデルがこのテストに合格してるって議論できるやろ。実際、この6か月くらいでまさにそれを主張する論文がいくつか出てきたんや。

そやから僕がそれを砂に引いた線って表現したんや。かなりぼやけた線やって呼びたいわ。僕らが今それを踏み越えてるって言いたいな。

それが面白いわ。創造的産業について考える時、創造的な労働力の将来について考える時、これは僕が人々が時々終末論的になってるのを見るトピックやと思うねん。他の人は単なるツールキットへの追加で、仕事を奪うもんやないって言ってるけどな。

テック業界にいる君の視点から、会話を聞いたり、ハードウェアを構築したりする時、人工知能やAIが創造性に影響を与える能力をどこで見てるんか?人間の創造性とAIの観点からの創造性みたいなもんを区別することもできるかもしれへんけど。

将来はこれらのツールによって強化されるんや。それらなしで働こうとするんやなくて、それらを使わずに働こうとするんやない。もっと楽観的な見方をすると、他の技術的飛躍と同じように、物事を今はもっと簡単にできるんやってことや。

だからプロトタイプをもっと早く作れるし、もっと早く反復できるんや。頑固になって「車はいらん、馬に乗る」って言うのは行く道やないやろ。車が行く道やって受け入れるんや。今は反復できるし、それは製品、人類、科学、エンジニアリングに利益をもたらすんや。アイデアからかなりうまく動くもんまでの時間がめっちゃ短くなったからな。

多くの分野でな。

僕らの分野、特に商業広告の創造的産業でそれを見てるわ。コンセプト作りやアイデア出し、フォーマットやテンプレート作り、特定のものなんかで、製品のアイデアにもっと早くたどり着けるんや。生成AIについて話すなら、もっと簡単にコミュニケーションできるんやな。

撮影しようとしてるテレビコマーシャルのアイデアがあったら、生成AIを使って基本的にスケッチアップできるんや。どう見せたいか、撮影するかもしれへん角度、そういうものの参考フレームをくれるんやな。

だから今はプロセスを強化するのにほんまによくて、インターネットをスクラブできるものを模倣するのにほんまにいいと思うわ。

創造的産業での安全性は、本当に新しいものについてはまだあんまりよくないってことやと思うねん。主に人間の創造性は、君がディープラーニングネットワークについて話してるように、人間の脳を模倣しようとしてるからやな。基本的にはそれが元々のAIの目標やろ、知性を理解することなんや。

知性って言う時に何を意味してるんか?それを計算的に再現できたら、僕ら自身についてもっと何かを理解できるかもしれへんし、僕らは基本的に僕らについての質問なんや。どうやって僕らは知的なんか?それはどうやって現れるんか?僕らの中でそれは何なんか?

でも創造的な観点から見ると、僕らにとって今の安全性はそこにあると思うねん。僕の考えでは、本当に新しいことは何もしてへんのと同じやからな。既に存在するもんの束を合成してるだけで、データをスクラブして何らかの一見ユニークな方法でいくつかの物事をまとめることができるからやな。

人間と機械の創造性の比較

それはもっとぼやけてると思うわ。押し返したいのは、人間が何をしてるかを僕は知らんってことや。僕は神経科学者やないから、人間が何をしてるかは知らん。でも君がしてることがもっと新しいって、そんなに確信してるんか?君は経験によって学ぶんやないか?君が見たり読んだりしたもののリミックスにすぎひんのやないか?

僕はそこに明確な線は見えへんわ。それに、僕らが最先端のAIを訓練して評価する方法は、人間の経験の豊かさと比べるとまだかなり狭くて脆いと思うねん。

それは、よりアドバンストになって特に仮想世界で動いたら変わるかもしれへんし、それでもっと豊かなもんを体験して、その経験を引き出すことができるようになるかもしれへんな。

今見てみ、Googleやこれらの大規模言語モデルの一部は何をするように訓練されてるんか?訓練には多くのステップがあるけど、それの大部分は人々が事前訓練って呼ぶもんで、めっちゃ計算量が必要なんや。それは文字通りすべてを読み通すことなんや。

インターネットで集められる全てのテキスト、全てを読み通すんや。読んでる本に目隠しをつけることを想像してみ。読みながら次の単語を予測しようとするんや。だから文を読んでるけど、次の単語が何かを覆い隠してるんや。それでこの文脈を与えられて、次の単語は何か。それから見るんや。

それで正しかったら自分に報酬を与える。そうやなかったら自分を修正する。それからテキストからテキストへと読み続けながらそれをするんや。それについてすごいのは、それだけで読んでることについての階層的な知識をめっちゃ学ぶことを強制されることなんや。

卵はバスケットに入れられるけど、バスケットは卵に入れられへんとか、世界についての文脈的知識がめっちゃあるんやな。その次の単語を予測できるのに役立つからな。

ある意味では、これは僕らが若い時に読み書きを学ぶことがなんで重要やったかと同じやな。僕らも同じことをしてるからや。

だから確実に人間の学び方とは違った訓練を受けてるわ。人間はもっと少ない経験に基づいて学ぶからな。世界中の本、すべての本を読むわけやないけど、僕らが持ってるすべての知識を持てるようになるんやからな。

だから今のフロンティアは、もっと与えて、もっと大きくすることやったんや。それは遅くなってへんし、そのやり方でもっといいモデルを得られてるんやな。

でも今、基本的にインターネットで簡単に見つけられるすべての可能なテキストを使うことに近づいてるんや。だから今あるものより10倍多い書かれたデータを言語モデルの訓練に得ることはないやろ。

強化学習と人間らしい学習

だからこそ僕が言及したし、このアイデアを発明してるわけやないけど、この数か月で出てきた重要な論文がいくつかあって、この点を指摘してるんや。AIはもっと強化学習って呼ばれるもので訓練されるやろうってことや。これはもっと体験的な学習の種類なんや。

実際、言語モデルは後の段階で既にその種の訓練を受けてるんや。僕が話した事前訓練をすべて終えた後にな。RLは人間のフィードバックからの強化学習を指してるんや。これには、ボットとチャットして、この答えが好きやったかどうかを言うことが含まれるんや。

人間のチームがその種のフィードバックを与えることもな。だからそれは小さなバージョンの体験みたいなもんやな。

でももっと豊かなそういうフィードバックがあると思うねん。僕らがいつもフィードバックループで学んでるのと同じようにな。君の訓練が終わったからもう終わりってわけやない。

まさにそうや。今日この会話をしてることを考えてたら、なんでかダグラス・ホフスタッターが頭に浮かんだんや。

そうやな。彼の本『私は不思議な輪』を読んだのを覚えてるわ。僕を同じ場所に連れて行ったんや。人間、人間の体験。僕らはこの不思議な輪やって。常に学んでる、常に進歩してるんやな。

それがおそらく差別化要因の1つやろうな。僕らには進歩的なもんがプログラムされてるんや。人工知能が持たへん生存本能がな。資源やカロリー摂取を競争してへんからな。ある程度のレベルで僕らを配線したすべてのもんがな。

人間は非常に少ない例から学ぶことがずっと効率的で、世界がどう動いてるかについて非常に豊かなアイデアを持ってるんや。

それがどの程度まで、AI訓練がその方法でよくなれるかは未解決の問題やと思うねん。そういうことをしてAI訓練をもっと効率的にしようとする人がいっぱいいるわ。人がするように、より少ないデータでもっと学べるようにしようとしてるんや。でもフロンティアはその方向に押し進められてこなかったんや。

創造性のことに戻ると、この時点での差別化要因は、人工知能が新しいもの、本当にユニークなもののような、生成できるもんについてどれだけ高度になれるかは議論せえへんってことやと思うねん。

人間は今のところそれがもっとうまいと思うわ。君が言ったように、僕らがもっと効率的やからってのが1つや。でも2つ目は、僕らのニューラルネットワークがまだずっと深いからやろ?君の脳の何十億もの何十億ものニューロンが情報を合成して、お互いに情報をやり取りできるってことやな。

それに僕らが常に配線し直せるか、継続的にやろ。神経可塑性、それを進歩させて変化させる能力や。僕らの経験がより深いから、僕らはめっちゃ効率的で、僕の考えではもっと創造的やと思うねん。

言い換えると、今でも僕らは狭いAIをいじってるんや。まだ完全に一般的やないんやな。その区別をつけてくれ。

狭いAIと統合された脳の違い

今僕らが持ってるモデルについて僕が考える方法は、人間が持ってるような完全に統合された脳やないってことやな。それは脳の一部で、器官のようなもんか、視覚皮質のようなもんやな。

非常に具体的にするために、この画像に猫や犬がいるって言える有名な画像認識モデルの多くや、君の顔も認識するモデルは、フィードフォワードネットワークって呼ばれるもんなんや。

だからモデルの前面があって、予測や答えを持つ後面がある。そしてデータは一方向にそこを流れるんや。カメラや君の眼球があって、信号が一方向に処理されて答えに到達するようなもんやな。それがフィードフォワードって意味やな。

それは反芻したりループに入ったりするもんとは対照的で重要やな。君の不思議なループみたいにな。また僕は脳神経外科医やないけど、脳にはループになってて非常に複雑な方法で相互作用してる部分があるのは確実やと思うわ。単なるフィードフォワードやないんやな。

でも君の視覚皮質については、神経科学について知ってる限りでは、フィードフォワードネットワークやと思うねん。光が君の目に入った時、脳の一部、視覚皮質を通ってフィードフォワード方式で処理されるんやな。

エッジを見つけたり、物体を選び出したり、重要やないもんを無視して重要なもんに注意を向けたりすることを含む多くの処理が、そのレベルで起こってると思うんや。

そして君がそれについて反芻することなく、すぐにそのすべての処理が起こるんやな。だから僕らが持ってる人工ニューラルネットについて考える時、それはそういうもんやな。君が運転してる時に障害物に気づいて、それを知らせてくれる脳の部分みたいなもんや。信号が一方向に入ってきただけで、そのすべてが素早く起こって、君の脳はブレーキを踏むかどうかの決定をするために熟考する必要がないんやからな。

でもそれをするために君の脳のいくつかの部分が集まるんや。でも視覚部分は、一方向の処理だけやと思うねん。だからそれらを非常に衝動的やと思ってくれ。これらの大規模言語モデルは、反応的やな。文脈を与えられて最も可能性が高いと思うもんを選んでるんや。それは全体の人間が大規模言語モデルができるほど素早く理解するのは難しいことやけどな。

でもそれは計画してへんし、決定をするために熟考するようなことはしてへんねん。君がするかもしれへんようにな。

人工知能による人間能力への影響

それは完全に異なる存在やから理にかなってるわ。その用語を使いたければやけど、1つは人間で、もう1つはそうやない。1つは機械、コンピュータ、非常に強力なもんか、ネットワークで繋がったコンピュータの束やからな。

でもそれが明確な違いのようやな。これは重要な質問やと思うし、他のどの質問よりも僕を心配させる質問やと思うねん。労働、特に精神的労働をオフセットする時に何が起こるんかってことや。

そのいい例があると思うねん。運転する時にいつも地図のようなもんを使うことの影響について研究をした研究者がいるんや。

君の脳はめっちゃ効率的で、君がしてることやしてへんことに適応するんやな。そして自分で地理的な場所を通る道を見つけてへんかったら、その筋肉を失うんやな。だから地図を使えば使うほど、その部分を効率的にする必要がないから、脳の一つの領域がちょっと小さくなるんやな。

だから言語モデル、特に読み書きのようなもんをオフセットし始める時、その労働を別のもんに任せる時、批判的思考に何が起こるんか?僕らが機械にもっと多くの労働をさせるようになったら、僕ら自身の推論に何が起こるんか?

それが他の何よりも僕を心配させることやな。

それはめっちゃいい質問やし、僕も同感やわ。僕も怖いと思ってる。特に若い世代にとってな。

それを見る1つの方法は、僕らはもう言葉を書かん時代に入ってるってことやと思うねん。良くも悪くもな。でも誰かがそれを読まなあかんやろ。機械がそれをして要約をくれるだけかもしれへんけど。でも君はその情報で何をするつもりなんか?その情報に基づいて行動して賢明な決定をしなあかんのやからな。

情報を得るためにな。君も僕も、本棚に本があって、それを読むことが君が誰かを知ることを助けて、決定をするのを助けることに同意するやろ。メール、レポート、本、何でもいいけど、いい文書を書く技術は、君の考えを書き留める練習なんや。そして言語モデルがもっともっと僕らが書くのを助けるようになったら、それが重要なスキルやと同感するわ。

彼らがまだ読まなあかんのに、あんまり書かんかもしれへん時、若い人たちがどれだけ違った考え方をするか分からんわ。それがいいことやとは思わへんな。

相互に補完する読み書きの関係

特に相互に補完するツールやからな。読むことは書くことを教える。書くことは君の読書を教える。ある意味、これらのループの1つのようなもんやな。

そうや。昔は歩いて本を持ち歩かなあかんかった年寄りみたいに聞こえがちやと思うけど、若い人には自分でやってみることを少なくとも練習として勧めたいわ。

ウェイトリフティングのようなもんやろ?携帯もインターネットもない、クローゼットに一人で残されても、ペンと紙があったら、心配してることを箇条書きにできるか確かめるんやな。興味あることについての君の考えは何で、生産的になれるかってことや。

実際、昨日テキサスで大きな雷雨があって電気が止まったんや。それでもやりたい仕事があったから、ペンと紙のノートを開いて、そのやり方で仕事をしたんや。そのスキルはなくならんと思うわ。

だから人々にはいつもGPSを使わないことを勧めたいし、言語モデルをいつも使ってメモを計画しないことも勧めたいわ。確かに何かの助けにはなるけど、運動として考えてくれ。

同じ理由でな。君が言った通りの同じ理由や。ウェイトリフティングのようなもんやな。別の筋肉を鍛えてるんや。その筋肉がたまたま君の脳やってだけや。

特に何かに夢中になってる場合はそうやな。特に若い人にとって、どんな分野に入ろうとする時でも最も重要なのは、何かに夢中になることやと思うねん。

夢中にならん限り、何かの専門家になるのに必要な10,000時間や100,000時間、何でもいいけど、それを自分に強制するのは難しいからやな。だから興味を育てて、何に興味があるかを見つけて、できるだけ自分でその理解を築こうとするんや。

AIと相互作用することも確実やけど、ペンと紙で考えをまとめることができるかは、まだ非常に有用やと思うねん。

確実にAIが常に多くの仕事を引き継いだら、人々の能力が衰えることは心配することがいっぱいあると思うわ。

製造業と創造産業の変化

最も重要なのは、僕の考えでは精神的労働やな。明らかにあらゆる種類のもんを引き継ぐつもりやし、既に引き継いでるわ。フォークリフトが完全に自動化された工場に行ったことがあるし、君が言ったように、障害物が何かについて訓練されてるんや。僕の前を歩いてる人と、僕が取りに行く製品をまだ保管してる大きな金属ラックとの違いは何かってことをな。

そういうことはすべて今訓練されてるんや。それの一部はいいことやろ?肉体労働は僕らの体にきついからな。でも確実に仕事を奪うことにもなるわ。ここで面白いのは、少なくとも創造的分野で僕が見てることは、こういう仕事が自動化されるにつれて、もっともっと多くの人が創造的な情熱を追求するようになってるから、多くの創造的分野で流入が見られるってことやと思うねん。

それはいいことやと思うし、そうであることを望んでるわ。だからこそ君が前に創造性は芸術家だけのもんやないって言ったことが好きなんや。本当に誰でも同じことをするためのもんやし、君の中に既にあるツールキットをもっと使う練習をして、それをするにつれてもっともっと上手になるんやからな。

だから人々が創造的分野に入っても、人工知能のようなもんと相互作用してプロセスを拡張するだけやったとしても、僕はそれは面白い一歩やと思うねん。ある程度、僕らは既に似たような革命を生き抜いてきたんや。インターネットが登場した時とな。

バーで何かについて議論してて、今はそれを調べてすぐに解決できるっていう昼と夜の違いやろ。それは僕らの世代が理解してる世代の分かれ目で、もちろん調べるつもりやって。この情報を指先で得られることを期待すべきやってな。

今、僕らはその革命の別の段階にいて、情報がアクセスできるだけやなくて、自動的に僕のために整理してくれることも期待すべきやっていう感じやな。

創造性の拡張とGoogleスキル

ある意味では、そのツールを使いこなすことができたら、あらゆる種類のキャリアで人々を助けるもう一つのステップのようなもんやな。Googleを使うのがスキルになったのと同じようにな。文字通りキャリアや学術研究に移ったんやな。僕はGoogle Scholarをいつも使ってるわ。

論文を見つけるためにな。それがなくなって、僕が読むべき種類のもんを知ってるAIアシスタントができると想像するわ。

だからある意味では、そういう風に増分的やけど、正しい方法でそれを使うことに飢えてて、まだ新しい何かを押し進めてる場合だけやな。

僕の観点からそれについて刺激的なのは、それが強化する時で、物事を前に押し進めることができる時やと思うねん。ChatGPTのようなプラットフォームで創造性を発揮することや、OpenAIの新しいSoraがいつか出てくる予定やったり、これらのもんのどれかを考えてみ。Midjourneyはしばらくの間ほんまに大きくて、多くの人がまだそこで多くの時間を過ごしてるわ。

これらのもんを生成することで、君の想像力が数秒で実現できる方法で創造性を高めて、したがって君の想像力がより速く拡大するやろうって感じやな。それが今の時点で僕がそれを見る方法やな。

ハードウェアとNvidiaの成功

実際に分解した時、どんな種類のハードウェアについて話してるんや?君の普通のデスクトップパーソナルコンピュータ、確かにそれとインターフェースできるけど、実際にこのプログラムを動かしてるハードウェアは何なん?

別の言い方をすると、なんでNvidiaは今ほど価値があるん?

彼らがたまたまこの種の技術を持ってて、それを認識して可能な限り押し進めてきた先駆者やったからやな。技術はGPU、グラフィックス処理ユニットで、元々のアプリケーションはコンピュータグラフィックスに関係があったんや。僕らのスタジオのコンピュータにはすべて強化されたGPUセットが入ってる。モーショングラフィックスをするし、8K動画編集もするからな。

パワーがいっぱい必要やからな。

だから抽象的には、AIや、これに適したりこれ専用に作られたりしたハードウェアの種類は、アクセラレータって呼ばれるんや。メインのCPUやないけど、GPUのようなカードやな。ゲーミングマシンを持ってたら、ディープラーニング専用やこれらのニューラルネット処理専用のアクセラレータカードを買うやろ。あるいはこれらのカードでいっぱいのサーバーを買うかもしれへん。

これらのサーバーでいっぱいのデータセンターやな。そういう規模やねん。

アクセラレータとGPUは同じもん?それとも別のもん?

GPUはアクセラレータの一種やと思うわ。アクセラレータは特定のタスクのための一種のコンピュータって意味やな。

チューリングに戻ると、チューリングが指摘したのは、テープと1と0を書けるもんがあれば、何でも処理できるってことやった。だからそれはコンピュータや。でも明らかに効率的やないやろ。

同様に、君のコンピュータのメインプロセッサである汎用CPUは何でもできるんや。これらのニューラルネットをすべて実行できるけど、効率的やないかもしれへんな。

だからアクセラレータは、この種の計算に遭遇したら、メインのCPUでするんやなくて、これでしろって感じのコンピュータの種類やな。GPUでしろってな。それがアクセラレータやねん。

消費者向けハードウェアの未来

つまり君が言ってるのは、君が取り組んでるハードウェアは基本的に多くのGPUを結合して、大規模言語モデルのようなもんを徹底的に加速してるってことやな。

そうや。そういうことや。

そういう製品は将来、デスクトップになるようなもんなんか?明らかに大企業や政府だけが、これらのアクセラレータがいっぱい積まれた非常に高価なサーバーを今は買ってるやろうけど、将来いつかそういうもんを購入できるようになると想像するわ。

これはめっちゃいい質問やけど、実際に予測してるところを記録されたくないねん。PCについて人々が言った非常にアホなことを言えたかもしれへんからやな。家にPC、コンピュータが必要な人なんているんかって、60年代、70年代の時期にな。

建物全体を占有して、変なオタクだけが働いてる、僕らの観点からはそれほど強力でもないメインフレームコンピュータがあったんやな。なんで家にコンピュータが欲しいことなんてあるんや?

それと非常に似た状況かもしれへんと思うねん。なんで個人がリビングルームにそんなに多くの計算能力が必要なんやって。

それから別の見方をすると、僕らはもうそこにいるようなもんやろ?君が言ったように、ここにGPUを持ってるし、10年後の最新のもんを使うためにアップグレードするつもりで、それにはおそらくAIが入ってるやろ。

それを説明する1つの方法は、ヘテロジニアス・コンピュートって呼ばれるもんか、異なる領域での計算のようなもんやな。消費者規模の計算があって、企業規模の計算がある。そしてAIは両方にあると思うわ。

僕らが運営してる会社のような会社にとって、特に僕らがポストプロダクションをめっちゃするから、企業規模の計算のようなもんが有用やと思えるわ。

訓練と推論の区別

だからAIソフトウェアが入ってるから、訓練したい何でもを通して爆破できる、一緒にリンクされたアクセラレータがいっぱいあるとしたら、僕らのようなビジネスには確実に有用やと思えるけど、特に明らかに大企業やろな。

銀行や、何かを継続的に監視したいかもしれへんあらゆる種類のセクターやな。君のリングカメラは、セキュリティをしてて、AIが入ってるし、その中でニューラルネットワークを実行してる何らかのレベルのプロセッサーがあるんやな。それは既にここにあるわ。

AIの使用例を大雑把に分ける1つの方法は、訓練なんか、推論って呼ばれるもんをしてるんかってことやと思うねん。推論はモデルをそのまま使うだけってことで、僕らが訓練のワークロードについてもいっぱい話してきたこととは対照的やな。

多くの人がデータセンターについて考える時に思い浮かべるのは、多くの大きな作業をしてるってことやからな。でもデータセンターは今、規模で推論も実行してるんや。

みんなとその母親がこれらのボットといつもチャットし始めた時やからな。それは規模で何度も何度も使われる推論やろ。

エッジコンピューティングとデバイス上のAI

別の考え方は、データセンターについて話してるんか、テック系の人がエッジって呼ぶもんについて話してるんかってことやと思うわ。エッジは君が持ってるリングカメラや、携帯電話に入ってるAIのようなもんを意味するんや。

人によって使われてて、データセンターやないところのエッジにあるわけやな。僕の携帯のChatGPTアプリは、エッジでそれを使ってるわけや。

でも僕の携帯でAIが動いてるんか、データセンターで動いてるんか分からんから、ぼやけてくるわ。データセンターで動いてると想像するわ。だから携帯はデータセンターと話してるだけやろ。それはエッジやない。データセンターとコミュニケーションしてるだけの場合もあるけど、デバイスにAIが入ってる場合もあるんや。

特にカメラ技術の多くには理にかなってると思うわ。推論を素早くしたいし、プロセッサーが実際にカメラにあるか近くにあるんやな。

これらのカメラの1つにあるフォーカストラッカーのようにな。

AIと知性の定義

要約と質問を提供したいんやけど、僕の観点から、少なくとも人工知能についての僕の読みから、基本的に最初は僕ら自身の中にあるものとしての知性が何かを理解することやったと言えると思うねん。僕らが知性を持ってることは分かってるわ。そして最初は、機械がそれを持てるかってのが一般的な質問やったように思えるねん。

そうは思わへん。僕はそういう風には表現せえへんな。

どう表現する?

コンピュータが何をできるかを理解しようとしてるオタクやったと思うねん。これらの能力を拡張し続けたら、人々が知的って呼び始める種類の自動化に近づくって認識するのは、それほどSFやないねん。

そして知性から神秘性を取り除くんやな。知性は君の目標を解決することやと思うねん。知性は何かをする能力があることを意味するんや。それがより広い範囲を持ってたり、より柔軟やったりするほど、僕らはより感銘を受けるんやな。

だからそこに明確な線は見えへんな。より一般的な種類のもんの能力の拡張、拡張として見てるわ。これらの言語モデルがそんなに面白いと思うのは、言語の領域がめっちゃ一般的やからやな。

メールを分類したり、この曲線の下の面積を計算したりするような数学的なもんやなくて、この問題を解決するためのアルゴリズムのようなもんやなくてな。

この質問に答えろとか、この文を完成させろって感じで、それは何についてでもありえるんやな。言語の領域がめっちゃ大きいから、その種のもんを知的って呼ぶのは非常に自然やと思うねん。

楽観的な未来への希望

君が言った神秘性を取り除くって表現と、知性の定義を単純化した方法が好きやわ。特にAIの文脈でな。それから創造的分野や創造性って呼ぶもんに関して、君の強化や拡張の観点も面白いと思うねん。

その観点は、時々終末論的なもんに溺れてしまうことがあると思うねん。なんでライターを雇う必要があるん?今後はチャットに全部書いてもらえるんやからって感じでな。

でもまだ解決せなあかん多くのことがあるし、味覚を持つことや新しい経験をすること、物事とのほんまに深いつながりを持つことに関してはめっちゃいっぱいあるから、もちろんライターはまだ必要やし、もちろん物語を語る面白い方法もまだ必要やし、そういうもんが必要やと思うねん。

だからそれは君にとってより強化で拡張やと思うわ。業界で働いて、ハードウェアを構築してる君個人として、人工知能の未来への希望は何なん?

健康への応用について話すのは非常に簡単やな。僕は医学にはいてへんけど、これらの技術によって医学が革命を起こせるのは僕にとって明らかやわ。既にな。

GoogleのDeepMindと彼らのプロダクト、AlphaFoldがあるやろ?僕は生物学者やないから、彼らが達成したことがどれだけ記念すべきかを理解するのは難しいねん。

彼らはタンパク質フォールディング問題をハックしたんやな。だから僕らは今DNAとタンパク質の間のマッピングを理解してると思うし、専門家を見つけてそれを説明してもらわなあかんけど僕やない。でもそれはおそらく100万の治療法と薬を生み出すやろ。

生命を延ばし、痛みを減らし、病気を治すんやな。AIのためにこの生涯で多くのもんが控えてるって言うのは、SFやないと思うわ。

自動運転はどうや?僕らが日常的にする最もリスクの高いことの1つは車に乗ることやな。個人的には人々がもう運転せえへんようになったら嬉しいわ。

でも全体的に、将来への希望は基本的にこれらのツールを使って生活をより良くするってことやと感じてるんか?物事がより効率的になるんやな。

でも長期的には、まだ読み書きをする限り、それによってより良い人になってるってのが考えやな。

終わりに

本当にショーに来てくれてありがとうやった。素晴らしかったわ。ほんまに感謝してるで。このシリーズが楽しみやわ。もっと見たいと思うねん。

僕も楽しみやわ。君みたいな面白い人とたくさん話すつもりやから。多くの人がめっちゃいいことを言うと思うわ。だから感謝してるわ。

エグゼクティブプロデューサーは僕とジェシカ・クレイマーや。プロデューサーはジゼル・サウセドや。編集者はマックス・スミスとギャレット・アローウェイや。クリエイターによる音楽や。ホストの僕はロジャー・ピータースや。聞いてくれてありがとうやった。また次回会おうな。

コメント

タイトルとURLをコピーしました