サム・アルトマンが描く未来のビジョン!

OpenAI・サムアルトマン
この記事は約31分で読めます。

OpenAIのCEOサム・アルトマンが、ChatGPTのパーソナリティ設計、新モデルGPT-5.5の進化、AGIへの道筋、そして2050年の未来像までを率直に語ったロングインタビューである。スーパーインテリジェンス開発の最前線に立つ人物が、科学的ブレイクスルー、雇用への影響、ロボティクス、パーソナルAGI構想、起業家精神の復活など、現代AIをめぐる根源的な問いに踏み込んで答える内容となっている。

Sam Altman's Vision For the Future!
Sam Altman on what comes next and how AI could unlock a future we’ve never seen before!Sam, thank you so much for coming...

世界に最も影響を与えているのはChatGPTのパーソナリティ設計

私たちがやっていることの中で世界に最も大きなインパクトを与えているのは、ChatGPTのパーソナリティをどう設定するかという部分なんです。

新しいモデルは何が違うのか。よりスマートに、より速く、より多くのコンテキストを扱えるようになりました。あなたの頭の中で一番よく浮かぶ考えは何ですか。私たちは何を目指しているのか、ビジョンはどういうものですか。

ほとんど想像もつかないほどの繁栄です。

これがサム・アルトマンです。3年前、彼は私たちを超知能を発明する競争へと一気に押し出しました。しかし実際には20年前、誰もがAIを作ることなど不可能だと思っていた頃から、彼はこの仕事に取り組んでいたのです。あらゆる困難をはねのけて、彼と少数精鋭のエンジニアチームはそれをやってのけ、世界を変えました。今や毎週9億人以上の人がChatGPTを使っています。

今日のエピソードでは、これまで誰も聞いたことのない質問をサムにぶつけていきます。私、たぶんこれ全然うまくできないと思うんですけど、やってみますね。そして彼の未来へのビジョンを、貴重な形で見せてもらいます。だからロボットを持たないといけない、先回りして次の大きなものを作るために。

すごく楽しかったです。番組に来てくれてありがとうございます。呼んでくれてありがとう。本当にうれしいです。今回のためにあなたの過去20年分のインタビューをほとんど全部見たんですよ。すごくクールだなと思ったのは、ずっとぶれずに一貫している部分がたくさんあることです。

ビルダーへの一貫した情熱とAIへの愛着

そのうちのひとつが、ビルダーへの強いフォーカスですよね。多くの人はあなたを今のOpenAIのCEOとしてしか見ていなくて、20年前からAIに夢中になっていたことを知らないと思います。大学時代、AIに最初にハマったきっかけと、人工知能を好きになった理由を教えてもらえますか。

ひとつには、テクノロジーの中で純粋に一番クールなものだと思っているからです。コンピュータに自分の代わりに考えさせて、いろんなことをやらせて、人を助けてくれるなんて、本当に魅力的なアイデアですよね。私はずっとこの考え方が好きで、人類の技術進歩の歴史というのは、道具の上にまた道具を作って、その上にまた道具を作って、と足場を組み上げていくことで、私たちはどんどん多くのことができるようになってきた、という理解をしています。

だから純粋にものすごく美しいアイデアで、すごくクールなテクノロジーだと感じる。そしてそこから二つ目の話につながるんですが、テクノロジーと科学的発見という観点から見て、AIは世界をより良くできる可能性がある。この道具を人々の手に渡せて、彼らがAIを使って何かを作ったり、探索したり、新しい会社を立ち上げたり、新しい種類のアートや、お互いのための新しい体験を作ったり、ほかにも何でも好きなことをやれるようになる。それこそが、世界が良くなる方法だと信じているし、人が充実感を得る方法だとも思っています。

これ以前の私のキャリアはスタートアップ業界にいて、人々がスタートアップを作るのを見ていて、これは世界にとっても、本人にとってもすごくいいことだなと思っていました。これからは、一人スタートアップとか三人スタートアップが当たり前の世界になると思います。そこで解き放たれる人間の潜在能力の量、そして私たち全員のために生まれるであろう良いものの量は、このテクノロジーなしでは絶対に不可能だったレベルのもので、見ていてかなり素晴らしいことになるはずです。

ダ・ヴィンチと予測としての知能

歴史上の人物で、AIがあったら一番恩恵を受けただろうと思うのは誰ですか。

ダ・ヴィンチが最初に思い浮かびました。とても幅広い思考をする人で、いろんなことに興味を持っていて、巨大な創造的エネルギーを持って、できる限り多くを成し遂げようとしていた。

面白いですよね、Transformerが最初に出てきたとき、あれって予測テキストモデルだったわけじゃないですか。あの一つのブレイクスルーが、これだけ遠くまで私たちを連れてきてしまったのはすごいことです。あなたもそういうこと考えますか。

しょっちゅう考えてますよ。イリヤ・サツケヴァーがかつて、シンプルな一文を口にしたんですが、シンプルな言葉ほど頭に残るもので、それがずっと頭から離れない。それは、予測は知能にとても近い、というものなんです。考え方としては、世界に関するすべての情報、物事の状態を、可能な限り小さな表現に圧縮できて、そのうえで次に起こることを予測できるなら、その対象を深い意味で理解していることになる、というものです。

当時、AI分野の多くの人がなぜか生成モデルにすごく興奮していたんですが、その理由をうまく言葉にはできませんでした。でも、その理由はたぶんこの考え方に関係していたんだと思います。予測は知能に非常に近い、と。学習した全データを本当に理解するシステムを作ろうとするなら、次に来るものを予測できるようにすることは、大きな一歩のように思えた。子どもが世界を理解し始めるところを見ていても、似たような現象を観察できると思います。

私もよく考えます。AIがどんどん賢くなっていくのを見ていると希望を感じるんですよね。じゃあ自分の脳に同じ情報を全部入れたら、同じ結論にたどり着けるはずだ、という気がして。

特定の人が物理や科学、数学に天才的に向いている運命なんでしょうか。それとも、全員に同じ情報を与えたら同じアウトプットが出ると考える派ですか。

いや、そうは思いません。むしろそうじゃなくて良かったと思っています。人間の経験が豊かなタペストリーになっていて、人それぞれ興味も才能も違う、訓練データも違う、というのが嬉しい。もし私たちが全員にまったく同じ訓練データを見せて、全員がまったく同じアイデアと興味を持つようになったら、すごく寂しい世界だと思います。だから、そうならないことに感謝しています。

ChatGPTのパーソナリティ設計の責任

それで思い出したんですが、以前のインタビューで、これだけ多くの人が一つの心と話している時代は歴史上なかった、とおっしゃっていましたね。毎週9億人がChatGPTを使っている。これは異常なことです。それはChatGPTのパーソナリティをどう形作るかにどう影響していますか。

これに関しては、これまで本当にいろんなアプローチを試してきました。正解にたどり着くのが本当に難しいんです。人によって望むパーソナリティは違うし、同じ人でも日によって望むパーソナリティが変わる。時間軸の取り方によっても、好まれるパーソナリティは大きく変わってきます。

たとえば、今日の自分の気分のことだけ考えるなら、自分はすごい人間だ、と褒めてくれるモデルがほしいかもしれない。でも、長い時間軸で自分の充実感や達成感を最大化することを考えるなら、もっと厳しく押し返してくれるモデルのほうがいい、ということになる。

いいポイントですね。ほぼ誰も、ChatGPTにどう振る舞ってほしいか、これくらいおもしろくて、これくらい優しくて、これくらい押し返してきて、みたいなスライダーをいちいち調整したいとは思わないでしょう。実生活の友達に対しても、私たちはそんなことしません。ただ、その日や状況によって違う人に惹かれたり、同じ人でも違う面を求めたりはする。そして、相手にはそれを察してほしいと期待しているわけです。今のChatGPTはそんなふうには動いていないし、ほとんどの人もそんな動き方を期待してはいない。でも、目指すべきはそこだと私は思っています。

ある程度はモデル化されているとは感じますよ。私のChatGPTは、ログアウトしたアカウントで使うときと比べて、すごくエネルギッシュで楽観的に感じます。

確かに少しはやっています。ある程度は使う人のことを知っていく仕組みがあって、これは私たちが目指してきた方向です。記憶や理解をどんどん深めていく方向ですね。昔はそうじゃなくて、こういうスライダーがあって、自分の好きなパーソナリティを指示してください、という感じだったんです。

そして例の4oの一件がありましたね。あれはあなたにとって興味深い瞬間だったと思います。背景を知らない人のために言うと、4oはとても同調的で、ある面ではいい意味で同調的だった。インタビューで、メールをくれた人がいて、これは私の人生で唯一の支えになるチャットだと言っていた、という話をされていたのを覚えています。あのメールのことを今もよく考える、と。

ええ、本当によく考えます。

それをどうやって乗り越えていくんですか。だって、うまくやれば誰かの脳をポジティブな方向や勤労意欲のある方向に書き換えられるチャンスでもある。でも責任もすごく大きい。

ええ、この点に関する責任は本当に巨大です。AIのリスクと利点についてはよく話題に上がっていて、バイオリスクとかサイバーセキュリティリスクとか、大きなものを測定したりしている。でも、少なくとも歴史的に見て、私たちが世界に最も大きな影響を与えてきたのは、ChatGPTのパーソナリティをどう設定するかという部分なんです。

どれくらい励ますべきか、どれくらいタフラブで接するべきか、どれだけあなた向けにカスタマイズして、私向けにはまた違うふうにするか、それともしないのか。今やっていることがどれくらい人に分かりやすくあるべきか。結局スライダーは見せたほうがいいのか。

私たちは歴史的に、というか業界全体として、これを、新しい病原体を作らないようにしましょう、というレベルの厳密さや科学的フォーカス、リスク理解で扱ってこなかった。でも、これが世界に与えた影響は本当に大きい。多大なポジティブな影響もあったと思っているし、4oでは明らかにネガティブな影響もあった。

これについて、これが答えだ、世界はデフォルトのパーソナリティの力やモデルのパーソナリティの限界をこう考えるべきだ、というふうに語っている人を、いまだに聞いたことがありません。でも、これは明らかに巨大な問題で、これからもっと大きくなっていきます。

今、それについてどう考えていますか。

私は、いろんな意味で本当に賢いと思える少数の人たちに相談しています。偉大な精神的伝統に立つ人々、優れた臨床心理士、そして人がどう関わり合い、何によって動機付けられ、何によって満たされるかを本当に深く理解している人たち、そういう人たちにChatGPTのための指示書のようなものを書いてもらおうとしています。人々の充実感、個人の成長、達成感、人生の楽しみを最大化するためにはこう振る舞うべきだ、というガイドです。それを集めて組み合わせ、ChatGPTをそれに合わせて整えてみて、何が起こるか見てみたい。

文化によっても変えないといけないですよね。

おそらく、かなりの部分はそうなるでしょう。でも、文化というよりは生物学に根ざした、人間に普遍的なものもあるんですよ。

たとえば、どんな。

面白い本があってね、タイトルがちょっと違うかもしれないけど、たしか「ヒューマン・ユニバーサルズ」という本です。人類学者たちが見つけられる限りのあらゆる人類文化を調べて、特性のリストを作って、もし一つの文化にすら存在しなかった特性があれば、それは普遍的じゃない、何らかの文化的なものだ、として外していった、という研究です。

私にとって意外だったのは、たとえば旅を価値あるものとする文化、というのがあらゆる文化に存在していたこと。逆に、どの文化でもそうだろうな、と納得できるものもたくさんありました。

繁栄と苦闘、そして人間の本能

さっきAIについて、世界に何ができるかにすごくワクワクしている、という話をしましたが、最近よく聞くようになった懸念があります。仮にあなたの言う通りになるとしましょう、と。AIが地球上のあらゆる人にものすごい裁量を与えて、AIを使う人々が集合的に世界に巨大な繁栄をもたらすとしましょう。それでも人々は楽しみのために働きたい人は働く、けれど誰も働かなくてもよくなる、誰もが素晴らしい暮らしができる、という世界。でも、そこで「繁栄を受け取る権利」と言うけれど、苦闘はどうなるんですか、逆境を求める気持ちはどうなるんですか、課題を乗り越えて学ぶこと、何でもお膳立てされていない状態の重要性はどうなるんですか、という声が増えてきている。私たちが進化してきた過程で、そういうものは確かに大事だったように思える。

同感です。ただ、これはちょっとした論理のすり替えでもあるとも思います。どの大きな技術革命を見ても、雇用が全体として減ったことはありません。仕事がシフトしただけで。

ええ、私たちは週4時間労働を約束されたじゃないですか。ストレスが減って、幸福が増えて、豊かさが増す、と。実際、もし100年前や500年前の生活レベルで満足するなら、そんなに働かなくてもいいはずなんですよ。それは可能でしょう。でも私たちはもっともっと、もっと求める。バーがどんどん上がっていく。そしてそれ以上に、達成したい、競争したい、互いに役に立ちたい、新しい世界がどんな姿であろうと、新しいことを推し進めて、新しいフロンティアを発見して、新しい商品やサービスを発明して、新しいものを作りたい、という欲求がある。

完全に同意です。ある音楽プロデューサーが何十年も前に、音楽はもう十分良くなったから、これ以上音楽を作る必要があるとはとても思えない、と言ったらしいんですが、そういう発想ですよね。

そう、私たちはそうは動かない。だから幸か不幸か、捉え方次第ですけど、人々はこれからも一生懸命働き続けるし、ストレスも抱えるし、不幸を感じるし、創ろうと努力し続けるし、自分にとって意味のある形で逆境を乗り越えようとし続ける。そしてそれを通じて充実感と成長を見つけていく。それが今日の苦労や仕事とはまったく違う形になるかもしれないけれど、その精神は驚くほど似たままだと思います。

面白いポイントですね。AIに対する世論を見ると、特にアメリカではポジティブな方向に動いていない。それなのに、私はChatGPTを使うとお菓子屋さんに来た子どもみたいな気分になるし、新しい扉が次々に開く感覚があって、起業家の友達もみんな同じように感じている。でもメディアでよく取り上げられるのは、雇用の50%が消える、みたいな話ばかりです。なぜそういうナラティブが広がったと思いますか、そして実際には何が起こると思いますか。

ドゥームセル、雇用、そして新モデルの体感

いろいろ思うことはあります。人はいつだって、ドゥームを売るのが好きですよね。ニュースは悪いこと、災厄を取り上げる。多くの人は、未来がどれだけひどくなるかを読んだり語ったりするのが好きみたいですし、悪いニュースのほうが良いニュースよりも遠くまで広まっていく。

新しいテクノロジーで、これだけの変化があるなら、慎重さに理由はあるとは思います。さっきの深い人間進化的な特性の話で言うと、私たちは悪いことを考えたい、悪いことを話したい、という何かを進化の過程で身につけてきたようです。それは恐らく自分たちを守るのに役立った。社会全体として共有される警戒心、というのも非常に重要なものなんでしょう。

一部のAI企業のCEOが、雇用の50%は消えると発言しているのを知っていますが、これは音感がずれているとしか言いようがない。うちの会社が雇用の50%をなくして、人類史上最も価値のある会社になります、なんて素晴らしい未来でしょう、でもあなた方の半分は仕事を失います、と言うことの不味さは、賢明さ以前にトーンの問題として変です。それが正しい考え方だとも思いません。

雇用は失われるでしょう。あらゆる技術革命で雇用は失われてきたし、雇用は変化していく。昨日ある人に言われて頭に残っているのは、新しいモデル、GPT-5.5をCodexで使えば、2年前なら数週間かかった仕事を1時間でこなせる、という話です。そして、自分はそういう世界ならもっと暇になっていると思っていた、と。今は逆で、これまでの人生で一番忙しい、夜中に起きて仕事をしている、もうやめてくれ、というぐらいに。

新しい道具があれば、私たちは新しい形でものを生み出していく。経済が大きく変わり、雇用が大きく変わるのは間違いないし、慎重さも必要だし、新しい社会契約や新しい経済システムについての厳密な議論も必要です。でも、私たち全員が意味も仕事もない人生にぼーっと座っているような世界になるとは思いません。違う形になるだけだと思います。

科学的なブレイクスルーも本当にやってきていて、すごくワクワクします。

それについて深掘りしたいです。たくさん質問があります。最初に思いついたのは、さっきの予測モデルの話に戻るんですが、シナリオが二つあるように思います。一つは、人間に十分な時間とすべての情報を与えれば、同じブレイクスルーにたどり着けたのか。もう一つは、囲碁での「37手目」のように、AIが人間ならまずやらない手を編み出した、というケース。私たちはどちらの道にいるんでしょうか。

そんなに違わないかもしれません。最初のGPTモデルが出たころ、すごく頭の良さそうな科学者やAIの専門家たちが、次のトークンを予測するだけのモデルが新しい知識を生み出すことなんて絶対にない、それは無理だ、見せられたデータから模倣しているだけで、新しいことなんて何も見つけられない、と言っていたのを思い出して、笑ってしまったんです。すごくスマートに聞こえる、もっともらしい説明がたくさんあった。

それが、5.4で初めて、5.3でも少しだけそうだったんですが、モデルが小さな形で人類の集合知に新しい知識を貢献し始めた。未証明だった数学定理の証明とか、物理学の小さな新発見みたいなものとか。これは続いていくと思っています。

ある意味では、37手目はすでにその一例でした。次のトークンを予測するように訓練したモデルが、すでに見たことしかないはずなのに、その能力を使って、どこにも存在しなかった根本的に新しいものを発見しに行く、というのは、表面だけ見ると当たり前ではない。むしろ、そんなことができるはずがない、というほうが直感的だった。

しかし実際にはこれらのモデルが次のトークン予測を通じて学んでいるのは、推論することなんです。見てきたデータすべてに筋を通し、たとえ見たことのないものであっても、次に何が来るかを補完する。この推論プロセスは、見たことのない問題にも適用できる。これは本当に驚くべきことです。

人間も同じことをしますよね。既知の物理学を全部学んで、自分の予測モデルを動かし続けて、物理学の訓練の中で身につけた事実だけでなく、その下にある思考プロセスを使って、新しい物理学を発見する。これらのモデルがやっていることも、それと同じだと思います。

人間はそれを、より時間と脳の処理能力をかければできるか。たぶんできる。実際、できると思います。ただ、人間に大きな脳を与える方法を見つけるよりも、より速く大きなモデルを作るほうがずっと簡単なんです。

だから私としては、本当に難しい問題について必死に考えてくれと頼める、こういう新しい外部ツールが手に入ったことに大喜びしています。これらのモデルが何十万ページもの文書を数秒で読むのを見ると、もし人間にもっと大きな脳があればできるかもしれないけれど、今のサイズの脳では絶対に無理だと感じます。

自然からのインスピレーションと医療の最前線

それでも、生物の脳と似ているのは興味深いですよね。気になったんですが、技術的ブレイクスルーのために自然から模倣できるものは他にあると思いますか。飛行機が鳥を参考にしたみたいに。

ある偉大な科学者がかつて、「他に選択肢はない、それが私たちが見つけた唯一の方法だ」と言っていました。もちろん文字通りそうではないですが、ニューラルネットワーク、人工ニューラルネットワークは、脳のニューロンのつながり方に明らかに着想を得ていますよね。自然が新しい科学のための唯一のインスピレーション源だとは文字通りには思いませんが、まずそこを探し始めるのは本当にいい場所です。

今、実装したいと考えているものはありますか。今週は新しい科学モデルにとっての大事な週でもありますし、科学的なブレイクスルーについてどう考えていますか。次に何が来るのか。あるオーストラリア人の男性がAIで愛犬の癌を治した、というのを見ました。

それはすごく具体的な例ですね。ちょうどある会社のファウンダーと話していて、昨日YCを訪問したんですが、似たようなことを考えている人がいて、それをスケーラブルにするにはどうしたらいいか、というテーマでした。多くの人が、人向けの癌に対するカスタムmRNAワクチン、カスタムRNAワクチンを考えているはずで、これは本当にエキサイティングです。

完全に同意です。なぜまだ実現していないんでしょう。

私の理解では、理由は多々ありますが、大きなものの一つはFDAがそれをどう扱うかについて整っていないこと。ただし、改善のスピードは速い。

面白いのは、パーソナライズド医療を次のフロンティアと考えると、それしかないように思える。私たち全員、DNAもリスクも違うわけですから。

癌になったときに、企業や研究室があなただけの個別ワクチンを作って、それが効く可能性が高い、というのは、本来私たち全員が当然のように要求すべきことです。

健康のためにChatGPTを使っていますか。

使っています。

何に使っていますか。

たぶん使いすぎだと思います。昔はサイバーコンドリアックって呼ばれた人たちがいましたよね。ChatGPT版を何と呼ぶのか分かりませんが。少しでも症状があると、ChatGPTのうさぎ穴に落ちていきます。みんなと同じように、自分の血液検査の結果を入れたりもします。これがいいのか悪いのか、入れて満足はしているんですが、たまに、ここがちょっとずれているね、と言われて、これって何かしたほうがいいのかな、と思うこともあります。

最近、私を助けてくれました。

どう助けてくれたんですか。

ランニングで疲労骨折してしまって、私の医師が町にいない時期で、MRIを撮りました。それをChatGPTに入れたら、MRIを読んでくれたんです。もちろんあとで医師にチェックしてもらいましたが、内容は正確でした。

すごい話ですね、衝撃を受けました。

ChatGPTを最初に出したころ、ちょっとそういう機能はあったんですが、全然良くなかった。みんなが、ChatGPTを医療アドバイスに使う人なんていない、まったく十分な精度じゃないし、これからも十分にはならない、と言っていた。それに、もし十分な精度があっても、誰だってお医者さんに直接話したいに決まっている、と。

実際、人々はもちろん医師と話したい。でも、医療的な質問をChatGPTに投げて、少なくとも本人たちが報告してくれる範囲では、本当に役に立つ情報を得ているケースの量は驚くほどです。

技術がインパクトを持たない、と疑われ続けるのは、しんどいですか。

しんどいです。もう気にしなくていいはずなんですけど、それでもまだイライラしますね。

私もイライラすると思います。どんな大きな技術ブレイクスルーでも、飛行機が空を飛ぶ前は、新聞は人類が空を飛ぶことなんて百年経ってもないだろう、と書いていた。それで翌週には人が空を飛んでいた、みたいな。

その例、特にライト兄弟のニューヨーク・タイムズの記事の話は、OpenAIの初期に私たちもしょっちゅうしていたんです。AIもこうなる、と話していて、結果的に正しかった。

正直、初期は本当にイライラしましたが、当時は確かに先が見えづらい状況でもあった。だから、これは大きなインパクトを持たないかもしれない、と批評する人たちは、少なくとも知的に誠実だと思っていました。

今になって、AIには本当に価値がない、世界に影響を与えない、と言う人を見ると、気にすべきじゃないと頭ではわかっていても、明らかにバカげていて、本当にイラッとします。知的に不誠実すぎる。

そして、毎日アリーナに立ってボールを前に進めようと必死にやっていると、人に信じてほしいと思うものですよね。私自身、自分の動画では、すごい技術や、人々が手にする可能性のある未来を見せようとしています。見せないと、人はロックインしてビルドしないから。最終的に、人は自分が大事だと思うことに必死で取り組んでいるときに、最も充実していると思うんです。

22歳と若い起業家の波

今日、22歳の人たちと話すなら、彼らがどう世界を感じているかについて、何を聞いてみたいですか、そしてそれは作るものにどう影響しますか。

最近の数週間、私が試してきたのは、最新のモデルとCodexを使っている人たちと一緒に座って、その仕事への影響、ワクワクしていること、そうでないこと、私たちにまだ作ってほしいと思っていることを理解しようとすることです。今のところ、相手はだいたい会社を経営している人や、企業のシニアエンジニアです。本当は若い人たちと一緒に座って、これ使ってみてよ、と言って、やっていることを観察し、彼らの懸念に耳を傾けるべきです。

あなたはユニークな視点を持ってますよね、たくさんの若いファウンダーをアドバイスしてきたわけですから。数年前のジョー・ローガンのポッドキャストで、25歳のファウンダーが少なくなっている、と話していました。それは変わりましたか。

完全に変わりました。

何が変えたんでしょう。

いくつかのことが同時に起こったと思います。今は本当に忙しすぎてファウンダーのアドバイスをほとんどできなくなっているんですが、また何か方法を見つけてやらないとな、と最近思っています。なぜなら、このテクノロジーが可能にしている起業家精神は、最も重要なことの一つですから。

その点について、自分が時代に取り残されつつあると感じていて、それは本当に好きじゃない。頭では理解しているんですが、現場に行きたい。二人のファウンダーと1万GPUで会社を建てているような人たちと一緒に塹壕にいたい。最近そういう人に何人か会いました。これを話していて、またスタートアップに近づく方法を見つけないといけないな、と思い出しました。

なぜ当時は若いファウンダーの集団がいなかったのか、そしてなぜ今はいるのか、その理由はいろいろあると思います。アメリカの教育システムがすごく暗い時期を過ごしていて、それとコロナが同時に起きた。私たちはこの世代全体のモチベーションを下げて、未来は悪くなる、資本主義は悪、企業は悪、野心は悪、と教えていた。それが補正されてきました。

戻ってきましたよね。

ええ、戻ってきました。ティモシー・シャラメが、賞を取りたい、と言って話題になった瞬間がありましたよね。みんなが、また気にかけることがクールに戻ってきた、と興奮していた。

素晴らしいことです。本来そうじゃなくちゃおかしかったんです。本来そうじゃなくちゃおかしかったのに、野心を持つことが許されない、みたいな空気があった。本当に変な、変な時代でした。

もう一つ、スタートアップはダイナミズムと新しさがあるところで栄える。テクノロジーの風景に変化があるとき、ですね。それは2008年にiPhoneのアップストアがローンチしたときに起きた。その数年前にはAWSのローンチで起きた。それからAIが来るまで、長いあいだそれが起きなかった。だから、ある種の荒野の時期だった。成功するスタートアップはあったけど、本当の技術シフトがあるときほどの数ではなかった。

7年前、あなた自身がブログで、もうそろそろ次の技術シフトが来るころだ、と書いていましたよね。それを実現したのがあなただ、というのはクールです。

ありがとうございます。

OpenAIの3つの優先事項と新モデルの本質

今、フォーカスについてはどう考えていますか。AGIに関して次に注力する領域は何で、最近Sora関連の動きもあった。一番注力しているのはどこで、それはなぜですか。

私たちにとって今、最も重要な3つは、まず研究の加速。AI研究から物理学、生物学、何でも含めてですが、研究と科学的理解を加速させる。なぜなら、それは人類のためにとても多くを成し遂げてくれるからです。

二つ目は経済の加速。さっき話した自動化されたスタートアップや、AIで生産性を上げる大企業、そして最終的には宇宙コロニーの建設なども含む話です。

三つ目はパーソナルAGIです。ChatGPTはその小さなプレビューでした。医療的な質問を入力してアドバイスをもらえる、というような。でも、自分の文脈、人生まるごと、すべての時間を共にして、ひたすら計算リソースを使って自分の生活をより良くしてくれるAGIが本当にあったらいいな、と私自身思います。

この3つが最重要のフォーカスです。可能にする技術とプラットフォームは驚くほど似ているんですが、社会が本当に価値を実感する場所はこの3領域だと思います。

科学的ブレイクスルーに関して、財団でアルツハイマー研究にもフォーカスされていますね。それ以外で、たとえば1年以内にブレイクスルーが期待できる領域はありますか。

数学の進歩は驚くべきものになると期待しています。

具体的にどういう意味ですか。

非常に重要な新しい数学を発見し、手の届かなそうに見えていた数学の問題を解いていく、という意味です。歴史上の他の多くの場合と同じく、新しい数学を発見すれば、それが新しい物理学や、新しい暗号理論や、何になるか分からない実世界応用への道を示してくれると期待しています。

ただ、私たちはより高い基準を自分に課して、もっと泥臭くて難しい、実世界へのインパクトが大きい科学的理解にも取り組んでほしい。アルツハイマーが来年中に治るとは思っていないし、本格的に治療できるようになるとも思っていない。でも、押し進めるべき新しい有望な方向性が見え始めることは期待しています。

マーク・ザッカーバーグがインタビューで、AI業界の人と話すと「あらゆる病気を解決する」と言うのに、医師に話すと「そんなことは絶対にない」と言われる、と話していました。明らかに分野間に乖離がありますよね。それについてはどう思いますか。

AIの人たちが思うよりは時間がかかる。医師たちが思うよりは早く実現する。

いいですね、その表現。完全に同意です。数年前を振り返るだけでも、今AIで可能になったブレイクスルーの種類を見ると、明らかに指数関数の上にいる、と感じます。

長いコンテキストウィンドウもめちゃくちゃ重要になりそうですね。それを実現するにはどうしたらいいんでしょう。計算資源を増やすしかない。何が必要ですか。

文字通りの10億トークン、1兆トークンのコンテキストウィンドウが必要だ、とは思っていません。もちろん、それも実現可能になっていくと思います。重要なのは、モデルがあなたの人生まるごと、会社まるごと、関心のあるすべてを実質的に理解できるかどうかです。

新しい手法はどれも残念ながら膨大な計算資源、少なくとも膨大なメモリを必要としますが、現在のコンテキストウィンドウを使いつつ、本当に重要な部分を見抜いたり、必要に応じてツールを使って重要度の低い部分を取りに行ったりして、同じ量のコンテキストをはるかにうまく使う、という素晴らしい新しい方法がいくつも出てきています。

これは続いていくと思います。新しいモデルと、これから数か月で追加していくものを合わせると、無限のコンテキスト感、と言うつもりはないですが、このモデルは本当によく分かっているな、私が頭の中に持っている以上のことを頭に持っているな、という感覚になります。

新しいモデル、何が違うんですか。何を変えたんですか。

よりスマートに。より速く。より多くのコンテキスト。それから、うまい言葉が見つからないんですが、信頼性が高くなった、と言いたいけれど、もっと正確には、直感が増した、と言いたい。

私が本当に何を求めているのかを理解するのが上手くなっている、何度か試してみて、これは正解への道を進んでいる、これは違う、というのを見極めて、最終的に正しいものを返してくれる。だから主観的な体験としては、モデルに何かをお願いすると、正しいことをしてくれる確率が圧倒的に上がっています。

訓練データに基づいて理解する、ということですよね。アルゴリズムを更新したんですか。

たくさんのアルゴリズム的変更をしました。新しい、よりよい、より大きなベースモデルで、別のアーキテクチャ、というよりアーキテクチャ上の改善を含んでいて、ポストトレーニングについて学んできたすべて、人々がモデルをどう使いたいか、世界やシステム、文脈にどう接続して役立てるか、というノウハウも入っています。

AI進化の3つの軸とロボティクスの未来

考えていると、AIが良くなる道は3つあるように見えます。よりよいアルゴリズム、より多くのデータ、そしてより多くのエネルギーや計算資源。この3つを押すと考えていいんですか。

実質的にはそうです。データという言葉はかなり広いカテゴリで、文字通りより多くの訓練データを意味するのか、それとも、何かをやっていて失敗する過程をループに入れて連続学習させる、というような意味なのか。でもおおざっぱに言って、その3つで合っています。

その中で一番ブレイクスルーを起こしやすいのはどれですか。

計算資源を増やすことが一番確実です。そこには科学的不確定要素が一番少ない。お金と複雑なサプライチェーンは必要ですが、やればできる。アルゴリズム的ブレイクスルーは見返りが最も大きいですが、見つけるのが最も難しく不確定。データはその中間です。

データのところは、モデル自身が学んでいく、いわゆる再帰的学習に関係しますか。

関係しうる、ですね。それも一つのやり方です。ある意味、モデルが本当に賢ければ、未証明の定理を証明しに行ける。すると次の訓練ではそれが新しい証明として加わって、モデルが学べるものが一つ増える。それが一例です。

今、モデルが自分自身を大きく改善している段階に来ていますか。

その質問は枠組みを作るのが難しいんです。ある意味では明らかにイエスです。私たちのエンジニアがCodexのおかげで以前の3倍生産的になっていて、前のモデルを使って次のモデルのコードをより速く書ける。それも当然カウントすべきです。

そして、人々が「自分でボタンを押して次のモデルを作って、新しいアルゴリズムを編み出してくれ」と言うようなスピリチュアルな意味では、まだそうなっていません。

サプライチェーンの話も気になります。データセンターをどう全部建てるか、ロボティクスもすごくワクワクします。ロボティクスが大きな優先事項だ、と言われていましたよね。何にワクワクしていて、ロードマップはどう考えていますか。

私たちは物理世界に住んでいて、バーチャルな世界にいるときでさえ、それを支えるには物理世界の巨大な複雑さが必要なんです。チップを作って、データセンターを建てて、発電所を運転して、その他もろもろやらないといけない。だから、コンピュータはこんなにすごいことができるのに、ロボットを解決できなかったせいで、AGIのアクチュエータとして人間が物理世界で走り回って、テーブルを動かしてください、これをしてください、あれをしてください、と頼まれる、というのはとても悲しい未来です。

悪夢のシナリオですね。

ものすごく悪い。だからロボットを持たないといけない。

どんな種類のロボットがベストだと思いますか。

特定のモルフォロジー(形態)にこだわっていません。私が欲しいのは、自動化された製造と、こういうものがもっと必要だ、と言ったときに、ChatGPTの汎用性と同じ汎用性で、自分自身を再構成してそれをもっと作れるロボットの工場、というイメージです。

ロボットを物理的に自社で製造することはあると思いますか、それともパートナーシップですか。

分かりません。

それ以外のAIハードウェア、たとえばジョニー・アイブが関わっていることは優先度が高いんですか。

ああ、チップの話かと思いました。コンシューマー向けAIハードウェア、ですね。

そうです。

さっき、AIにあなたの人生のすべての文脈を持たせたい、という話をしましたよね。今のハードウェアは素晴らしくて、iPhoneは現時点で人類が作った史上最高のコンシューマーハードウェアだと思います、ぶっちぎりで。これがしてきたことは信じがたいレベルです。

同感です。

でもiPhoneは、人生のすべての文脈を吸収できるハードウェアが必要な世界のために作られたものではない。電話を使ったり使わなかったりできるし、ポケットに入れることもできるけれど、あくまでオン/オフです。使っていないときは、たとえばこのすごく面白い会話を、後で自分のパーソナルAGIから参照できるようにしたいと思っても、私の電話はポケットの中にいて、私たちの会話を理解しない。本当はね、こちらが許可すれば、その会話に参加して、理解して、知っておいてくれる端末がほしい。

外側からのインサイトを得るのも面白いと思うんです。最近、ポッドキャストAcquiredの全エピソードのトランスクリプトをダウンロードしてみたんですよ。

Acquiredご存じですか。

ええ。

あの番組大好きで。彼らの番組がなぜ成功しているのかをリバースエンジニアしようと思って、400回分のトランスクリプトをダウンロードしてChatGPTに入れて、ストーリー構造を分析してもらったら、本当にすごかった。同じように、自分自身の会話や、リーダーとしてのアプローチについても、似たようなインサイトが得られるんじゃないかと想像しています。

ただ、常時録音している機械があると、人は引いてしまう、というのも分かります。

完全にそうですね。

ジョニー・アイブと最初に話したかった理由の一つは、AI時代のハードウェアがどうあるべきかを考えたかったからなんです。生活の中であまりにも存在感が大きすぎる技術には、自分でも不快感がある。スマートスピーカーですらそう感じます。ジョニーなら、これらの相反する要素を全部抱え込んだまま設計する方法について、すばらしいインサイトを持っているだろうと思いました。彼ならうまくやってくれると信じています。

あなたのアプローチについて、最も誤解されることになるのは何だと思いますか。

まだ分かりません。きっとたくさんありますよ。あとで戻ってきて話せると思います。

AIエージェントの時代と2050年のビジョン

エージェントとして、AIをバックグラウンドで動かす使い方にもすごく興味があります。それはどういう意味で、どう考えていますか。

チームが最初にCodexアプリを作ったとき、自分のコンピュータに入れたんです。当時はYOLOモードと呼んでいた機能があって、結局もっと洗練された名前を付けたと思いますが、要するにコンピュータのバックグラウンドで好きに動いていろいろやっていいよ、という設定です。毎回許可を取らなくていい。最初は、絶対にあれはオンにしないぞ、と思っていました。

それが数時間で限界が来て、いちいち許可を求められるのにイライラして、結局オンにしてしまった。エージェントが私のコンピュータの中をうろうろして、バックグラウンドでいろんなことをやっている、という状態になって、その後すぐに、コンピュータを閉じたくない、仕事を止めたくない、と思うようになっていた。そこへの移行があまりにも滑らかで、何の事件もなく、我ながら少し無責任なことをしているなと思いつつ、現にやっていた。その後、もっと責任ある形で実現できるように工夫しました。

絶対に快適に思えないだろう、と思っていた状態から、エージェントが自分のコンピュータで役に立つことをしてくれるアイデアを心から好きになる、まで一気に行ったんです。

何をしてくれてたんですか。

メッセージの処理、メールの処理。最終的には、私のコンピュータの中を見回して、私の役に立てそうなことを見つけてやってみて、と頼んでみました。

おお。何かやりましたか。

最初に試したそのときは、特にやりませんでした。でも、それがきっかけで自動的に項目が埋まっていくような自動補完式のToDoリスト、という小さなプロジェクトを自分で作ることになった。

それすごい。自動補完するToDoリストって本当にクールですよね。ChatGPTのホームに組み込まれているんですか。

いえ、自分で作った小さなプログラムです。

クール。ToDoアプリってダウンロードしても続かなくて、結局自分宛にテキストを送るのが落ち着く、というパターンが多いので。

エージェント同士が連携する時代になると思いますか。たとえば、パーソナルトレーナーのエージェントがいて、それぞれ役割を持っていたり。

ものすごく考えています。これは私が一番答えがほしいプロダクトデザインの問いの一つです。人々はどう働きたがるのか。

たぶん、人々は異なるエージェントの概念モデルを頭の中に持って、そのうえでパーソナルアシスタントとか、首席補佐官とか、何と呼んでもいいですが、それらをコーディネートしてくれる存在を持つようになるんじゃないかと推測しています。

では、未来へタイムトラベルして、2050年に行ってみましょう。長いスパンですが、半年先すら予測できないような時代だとは思いますが、未来がどう見えるか、一緒に夢を見るとしたら、何を目指しているのか、ビジョンは何ですか。

うーん、すごく遠く感じますね。ほぼ想像もつかないほどの繁栄、というのは起こりそうに思える。

私が望むけれど、本気で取り組まないと達成できないのは、人間のエージェンシーが極端なレベルにまで広がること。誰も想像もできないようなものを、人々が自分で生み、創れる状態になり、権力の中央集権化の傾向を回避できていること。

世界が実際にどう見えるかは、分かりません。その頃には宇宙コロニーがあるかもしれない。

空飛ぶ車。

そう、浮く列車もいいですよね。

クールです。

未来らしく見えていてほしい。

私もそう思います。今みたいな感じだといいですね。

このビデオを締めるのに、ブラインドランキングってご存じですか。基本的に、選択肢を渡すんですが、次に何が来るかは分からない状態でティアリストを作ってもらうやつです。技術ブレイクスルーでやりたいです。

オーケー。

1から10で順位を付けていって、次に何が来るか分からない、と。

そうです。1から5まで、頭の中で一番重要な順に並べてもらうんですが、次に何が来るか分からないので、上のほうに余裕を残しておく必要があります。

なるほど。たぶん私はこれ全然うまくできないですけど、やってみます。

絶対うまくできますよ。1から5、1が最重要です。最初に出すのは、火。

困ったな、全部1にしたくなるやつだ。

すごい。3で。

オッケー、いい答えです。次は、印刷機。

4で。

オーケー。次、宇宙の人工衛星。

5で。

賢い答えですね。次、AI。

1で。

オーケー。最後、自動運転車。

残ってる枠は2しかないですね。すべての選択肢を見たうえで、入れ替えますか。

入れ替えます。AI、火、印刷機、衛星、自動運転車。

いい答えです。なぜAIが火より上なんですか。

火は人類史において明らかにものすごく重要だった。食べ物から蒸気機関、寒冷地での暖房、その他もろもろ。ただ、100年後あるいは1000年後から振り返ったら、両方とも史上最大級の汎用イネーブリング技術になっていて、合計でAIのほうがより多くを成し遂げた、という結果になると私は賭けます。とはいえ、判断が難しいので、誰かが逆だと言っても、戦うつもりはありません。

最後の質問です。あなたの頭の中で一番よく浮かぶ考えは何ですか。毎日一番考えていることは。

このところは、「これの社会的展開を成功させるとはどういうことか」です。技術の話だけじゃなく、エージェンシーと起業家精神をどう促していくか、社会契約はどんな形になるべきか、生活の質が大幅に上がるとしてもGDPが下がっていく世界に生きるとはどういうことか、良くて公正な未来のために必要だと思う計算資源を、短期的に経済を壊さずに、サプライチェーンに対してどれだけ強引に投資して構築していくか、そういうことばかりです。

いいですね。あなたは「今」を考えつつ、5年、10年、15年先のことも考えるという、興味深く刺激的な挑戦の中にいますね。

たぶん、もう少し「今」のことを考えるべきなんですけどね。

それいいですね。出てくれて本当にありがとうございました。最高でした。ほんとに楽しかった。

これすごかったです。じゃあ、行きましょう。すごく楽しかったよ、最高でした。

コメント

タイトルとURLをコピーしました