サム・アルトマン+グレッグ・ブロックマン – 偉大なるOpenAIのリセットについて

OpenAI・サムアルトマン
この記事は約66分で読めます。

本動画は、OpenAIの共同創設者であるサム・アルトマンとグレッグ・ブロックマンをゲストに迎えたポッドキャスト「Core Memory」のエピソードである。二人が揃ってポッドキャストに出演するのは非常に珍しく、OpenAI設立の初期の思い出から、今後の製品開発の方向性、そしてパーソナルAGIの展望に至るまで幅広く語られている。さらに、AI技術がもたらす社会的な繁栄と格差の問題、アメリカのハードウェアおよびロボティクス分野での競争力、AIの安全性とセキュリティに関する懸念、そして現在進行中の訴訟や業界内の対立といったデリケートな話題についても、彼ら自身の率直な見解が述べられている。

Sam Altman + Greg Brockman - On The Great OpenAI Reset
Sam Altman and Greg Brockman did their first media podcast together, and they did it on Core Memory. OpenAI's co-founder...

イントロダクションとOpenAIの始まり

マイクテスト、1、2、3。これで大丈夫そうですか。

ええ、これから90分間で、個人的なドラマのすべてを語り尽くしますよ。

おお、それは楽しみです。超知能の構築についても話しましょう。この部分はポッドキャストに使われるんでしょうか。

いや、おそらく使われないでしょうね。

私の少しふざけたイントロにお付き合いください。でも、お二人はきっとうまくやってくれると思います。

金融の要塞、資本の都へようこそ。いえ、これはそういうポッドキャストではありません。こちらはCore Memoryです。私はアシュリー・バンスです。

そして私はカイリー・ロビンソンです。今日は本当に素晴らしいエピソードになりそうですよ。通常はこの部分でゲストの紹介をするのですが、今回はおそらく不要でしょう。

本日は、OpenAIの共同創設者であるサム・アルトマンとグレッグ・ブロックマンにお越しいただいています。皆さんも一度は耳にしたことがある会社だと思います。お二人とも、本日はありがとうございます。

お招きいただき、ありがとうございます。

本当にありがとうございます。

お二人が揃ってポッドキャストに出演するのは、これが初めてではないでしょうか。

それは驚きですね。でも、確かにそうだと思います。少なくとも、かなり久しぶりなのは間違いありません。

かなり久しぶりですね。もしかすると初めてかもしれません。

私たちの番組に出演していただいたことについて文句を言うつもりは全くありませんが、お二人はポッドキャスト番組を買収されましたよね。私たちはただ運が良かっただけなのでしょうか。

ええ、運が良かったのだと思いますよ。

なるほど、それなら素直に受け取っておきます。なぜポッドキャストを買収したのか気になっていたんです。深く掘り下げる必要はありませんが、何か簡単な考えがあったのでしょうか。

あのポッドキャストネットワークをやっている人たちは素晴らしいと思っています。彼らは非常に創造的な思想家です。人々にとって非常に役立つAIシステムを構築し、それが人々の私生活や仕事においてなぜ価値があるのかを理解してもらうという、私たちが向かっているこの世界において、彼らのような人たちこそが、そのメッセージを伝える手助けをしてくれると考えたのです。

あなたがその番組に出ているのを見ましたよ。出演されたんですよね。

はい、出ました。

すべてのエピソードを見ているわけではありませんが、楽しいポッドキャストですよね。

さて、今日はお二人が揃っているので、少なくとも久しぶりということで、最初は少し懐かしい話をしたいと思っていました。カイリーと私は、何年にもわたってお二人を知る機会がありました。今回の準備をしながら振り返っていたのですが、ちょうど10周年の節目を少し過ぎたところですよね。お二人は現在残っている共同創設者のうちの二人で、たしかヴォイチェフが三人目だと思います。つまり、あなた方は会社をずっと貫いてきた不変の存在というわけです。

お二人は最初、挑戦者のような立場で始まりましたが、最終的にはトップに立ちました。その間には多くのドラマや浮き沈みがありました。そこで純粋に気になっていたのですが、このすべての過程を通じて、お二人の関係はどのように変化してきたのでしょうか。お互いにどのように影響を与え合い、時間が経つにつれてどのように変わっていったのでしょうか。

それは非常に素晴らしい質問ですね。もちろん、私たち全員がもっとドラマが少なければいいのにと思っていますし、ただ技術に集中できればと願っています。しかし、これほど多くの混乱やドラマ、緊張、争い、権力闘争がある世界において、全体の文脈を完全に理解している相手と関係を築けることは、信じられないほど素晴らしいことでした。私たちにはすべての歴史があり、素晴らしい時も、非常に困難な時も、お互いを心から頼りにしてきました。それは、OpenAIのすべてにおいて最も素晴らしいことの一つです。

多くの意味で、OpenAIのまさに最初の瞬間は、2015年7月のあの夕食会の直後でした。サムと私は一緒に車で街に戻りながら、顔を見合わせて、私たちはこれをやらなければならない、と言ったのです。AGIを目指し、良い影響を与える研究所を立ち上げるにはもう遅すぎるのではないか、という議論がずっとありました。今となっては、そんなことを心配していたなんて馬鹿げて思えますが、当時は本当に遅すぎるのではないかと感じていたのです。

そうですね。もう乗り遅れたと思っていましたよね。お二人が始めた時、私もそう感じていたのを覚えています。いや、彼らはこれで逃げ切るつもりなんだな、と思っていましたよ。

夕食会での結論は、それが明らかに不可能というわけではない、ということでした。そして、私たち二人はただ、これは非常に重要なことだ。やるしかない、と感じたのです。

その通りですね。

そして、その精神は今も続いています。初期の頃の私たちの仕事の進め方の多くもそうです。私は当時無職だったので、翌日からフルタイムで取り組み始めました。サムは当時、本業を持っていたのですが、私たちは一日に5回くらい、ずっと電話で話していました。

その時点ですでに、お二人は親友のような関係だったのでしょうか。

かなり長い間お互いを知っていました。少なくとも、すごく長いように感じていました。正確にはいつからか思い出せませんが。

そうですね、2010年か2011年くらいだと思います。あなたがStripeで働き始めた頃ですね。

その通りです。コリソン兄弟を通じて知り合いました。

それで、私たちはカジュアルな友人関係にありました。

私が思っていたほど長くはなかったんですね。2010年だとして、この時が2015年ですから、5年間ですね。

時間は圧縮されるものですから。

なるほど。そして当然ながら、このすべてのプレッシャーの中でこの仕事をしてきたことで、お二人の関係は時間とともにより親密になっていったと想像します。

ええ、トラウマの絆という言葉を使う人もいますが、私はその言葉は好きではありません。私はむしろ、同じ塹壕にいる仲間といった表現が好きです。どんなことでも一生懸命働くことの良さの一つは、特にストレスの多い時期に一生懸命働くことで、他の方法では決して形成されないような深い関係を築くことができる点だと思います。

ええ、そして、サムと私の仕事の進め方や関係性は、一般的な共同創設者の関係から想像するものとは少し違うかもしれません。私たちは常に連絡を取り合っています。1回数分の電話を1日に5回するといった精神は今でも残っています。私たちは常に同期していますが、常にすべてにおいて同意しているわけではありません。世界をまったく同じ視点で見ているわけではないのです。しかし、だからこそ私たちは一緒にいると非常に強いのだと思います。私たちは非常に補完的なアプローチを持っています。サムがアイデアを出し、私が、じゃあ別の方法でやれないか、あるいはこの角度からアプローチしたらどうなるか、私たちが考えている他の事柄とどう関連するのか、といったことを考えます。

私がサムについて深く評価していることの一つは、彼が常に異なるアイデア間のつながりを見つけ出し、私たちが到達しなければならない大きな全体像に焦点を合わせ続けていることです。そして、私たちは一緒にそれを実際にどのように実行するかを考え出します。壮大な野心と実行力を結びつけること、それこそが常にOpenAIを際立たせてきたものです。

安全性へのアプローチと社会への影響

この10年間の中で、お二人が意見を対立させることが本当に重要だったと感じたのはどんな場面でしたか。お二人にとって記憶に残っている重要な瞬間はありますか。

グレッグが最も上手くやったことの一つで、私の本能にはないものがあるのですが、それは、彼自身の仕事においても、会社がやろうとしていることにおいても、最も重要なことに焦点を絞るよう強く求めたことです。私がもっといろいろなことをやりたいと思った時でも、グレッグはただ、これが最も重要なことなのか、今はこれだけに集中しよう、会社を集中させよう、と言ってくれました。私たちはそこで意見が分かれることもありましたが、会社全体を通して、それがグレッグの非常に役立つ精神となってきました。

ええ、そして付け加えるとすれば、たとえばコンピューティングについて考え、常に野心を高め続けることにおいてもそうだと思います。私は時々、論理的には、私たちがこのコンピューティング主導の経済に移行していることや、需要が常に供給を上回ることは理解しています。しかし、私たちにはやるべき大変な仕事がたくさんあり、すでにこれらすべての巨大なコンピューターを持っていて、それを運用しています。物理的なインフラを構築するだけでも大変で、すでに圧倒され、溺れそうに感じることがあります。そんな時でもサムは、いや、もっと必要だ、と言うのです。

そして、それは実際には非常に重要なことだったと思います。時には高次の視点を見失いがちになります。これは次の6ヶ月間だけでなく、次の2年間、5年間、10年間にとって重要になるという事実です。詳細に没頭することも必要ですが、詳細に溺れてはいけません。そのバランスを保つことこそが、OpenAIの現状と今後の方向性に大きく貢献しているものだと考えています。

お二人がこれまでで最も激しく意見を対立させた製品や戦略は一つありますか。

今、グレッグがその話をしていた時、製品のことではないのですが、頭に浮かんだことがありました。あなたがそれを聞く前に言おうと思っていたのですが、私たちは安全性についてどう語るべきかについてよく話し合っていました。安全性の極めて高い重要性や、これを正しく行うことと間違えることが何を意味するかについては、一度も意見が分かれたことはありません。しかし、この分野は、安全性をどのように語り、どのように利用し、それが実際に物事を安全に保つことよりも、どれだけ権力の問題になっているかという点において、奇妙な関係を持ってきました。

初期の頃、私は特定の枠組みで安全性を語らなければならないという考えに少し流されがちでした。しかしグレッグは、従来の枠組みには陥らない、そういう風には語らない、という点において非常に規律正しかったのです。今でも、これが非常に重要であるがゆえに、私自身は間違った枠組みで語る罠に陥ってしまうことがあると思います。

しかし、今日までのOpenAIの最大の貢献の一つは、安全性について語る別の方法を見つけたことだと思います。製品をどのように構築するかや、社会がどうすべきかについて語るだけでなく、それらをどのようにデプロイするかについてです。反復的なデプロイメントという考え方全体、リスクが高まるにつれてますます安全になる製品をどのようにデプロイするかを理解する世界へと向かうことです。

グレッグはその点において、そうしないようにという極端な圧力に対して、しっかりと一線を画してくれました。それは私たちが物事をどう語るかだけでなく、製品をどう出荷し構築するかという全戦略において、非常に重要だったと思います。

ええ、たとえばOpenAIを統治し、かなりの割合の株式を保有する非営利団体であるOpenAI Foundationを見てみると、その柱の一つがAIのレジリエンスです。それが本当に意味するのは、AIをいかにして世界にとってポジティブなものにするかを考えることです。そしてその答えは、単一の介入ではありません。思考の連鎖の監視機能があれば使命を達成した、というようなものではないのです。このテクノロジーを中心に社会がどう方向づけられるべきかについての、深く連なる様々な方法全体なのです。

そして、論文の中でAGIが世界に良い影響を与えるという問題を解決することはできない、というこの視点です。それは、社会からの貢献、多くの人々からの貢献、そしてこの技術が何であるか、人々にどのような影響を与えるか、世界にどのような影響を与えるかを真に理解する多くの異なる方法を通じた、世界的な努力でなければなりません。これは、私たちが10年前に始めた頃にはまったく評価されていなかったり、理解されていなかったりしたことでした。なぜなら、私たちは技術者であり、技術を構築しているのだから、解決すべき問題はそれだけだ、という考えに固執するのは非常に簡単だからです。誰もはっきりとそう言ったわけではありませんが、時々そういうメンタルの罠に陥ることがあります。

ですから、私たちが多くの時間を費やしてきたのは、第一原理に基づいて考え、人々の日常生活を実際に助けるような形で、変革をもたらす技術をどのように世界に運用し提供するかを本当に考えることでした。そして気づくのは、もし物事を変えるような非常に強力な技術があるなら、それより強力でない技術の段階で、すでに物事をポジティブな方向に変える手助けをしていた方が、おそらくうまくいくということです。

そのように考えると、レジリエンスについて考え、反復的なデプロイメントについて考えるというこの道を深く進むことになります。繰り返しますが、これはサムと私の間のOpenAIにおけるダイナミクスの多くを占めており、私たちは常に、この使命をどう達成し、より良く進めるかという問題について考えています。

ええ、2022年か2023年のサウスバイサウスウェストであなたをお見かけしたのが、まるで昨日のことのように感じられます。あの時は、今日私たちが耳にするAIに関する議論とはまったく異なるものでした。そして、それがこの10年で変わったことのように感じます。安全性やアライメントについてどう議論するかという点です。今、それをどう振り返っているのか気になります。当時のパネルディスカッションやニュースでの発言を変えたいと思いますか。安全性について語ることに関して、何を学びましたか。

安全性に至る前のことですが、私たちは技術オタクとしての枠組みに陥っていたと思います。私たちは超知能を構築しようとしていて、それはあなたにとって素晴らしいものになるでしょう、と語りながら、その詳細を十分に埋めてきませんでした。私たちはこの素晴らしい技術を構築していて、それがたくさんの素晴らしいことをしてくれると語ります。

そして今、世界には、なるほど、あなた方が正しかったようだ、あなた方はこれを構築するのだな、という空気があります。でも、なぜ私たちはそれを望むのでしょうか。それは私たちに何をもたらすのでしょうか。この分野の多くの人が、がんは治るし、みんな幸せになるよ、などと言ってきましたが、それは明らかに人々の心に響いていません。多くの人は、がんが治るなら素晴らしいことだけど、本当に望んでいるのは繁栄や主体性、そしてこれからも意味のある仕事を持ち続けることだと考えています。

先日、非常に印象に残った素晴らしい投稿を見ました。それは逆境に対する権利のようなものでした。人々は実際、人生に何らかの課題を望んでいるのです。毎日が完璧で、すべてが自分のために行われることを望んでいるわけではありません。そしてAIに対しては、もしあなたが正しくて、それを構築し、それがすべてのお金を稼ぎ、すべての仕事をしてくれたとしたら、私は何をすればいいのか。私の子供は何をすればいいのか。人生はどうなるのか。成長はどこから来るのか。人々は何を目指して努力するのか、という恐れがあります。

私たちは分野として、またOpenAIとして、そしてグレッグと私として、驚くべき技術とそれができること、その技術的驚異についてはたくさん語ってきましたが、未来がどうなるかについての点を十分につなぎ合わせてきませんでした。学齢期の子供を持つ親と話すとき、最もよく聞かれる質問は、子供に何を勉強させるべきか、未来はどうなるのか、何がまだ経済的価値を持つのか、といったことです。

しかし、彼らが本当に聞きたい質問はそれではないのだと気づきました。彼らが聞きたいのは、この新しい世界で私の子供はどうやって充実した人生を送るのか、ということなのです。経済的な観点から答えることはできますが、それでは人々は本当に安心しません。ここにはもっと深い何かがあるからです。

そして、これについては私たちにも多くの見解があると思います。例えばChatGPTの中には、ChatGPTを通じて得た情報によって自分や愛する人の命が救われたと言う人がたくさんいます。激しい頭痛に悩まされていた子供がいて、MRIの撮影を拒否された家族が、ChatGPTを使って症状を調べ、MRIの保険適用を勝ち取るための議論に使ったという話があります。結果的に脳腫瘍であることがわかり、介入して命を救うことができました。その家族は、ChatGPTなしでどうやってこの状況を乗り越えられたかわからないと言っています。

これはほんの一例に過ぎず、そうした話はたくさんあります。人々は、この技術が抽象的に社会を助けるだけでなく、自分自身を助けてくれるのだと本当に理解し始めています。彼らがお金を稼ぐ手助けをしてくれるのです。現在、起業の波が押し寄せてきているのを目の当たりにしていますが、これは今年を通じての大きなテーマになると思います。

そして、人間がコンピューターに合わせて無理をするのではなく、AIが人間のために仕事をしてくれるようになるという点についても、多くの視点を持っています。私たちが現在どのように仕事をしているかを考えてみると、それは自然なことではありません。私たちが本来するように設計されたことではないのです。その代わりに、コンピューターがあなたのために仕事をしてくれるようになります。

AIがもたらす未来とパーソナルAGI

では、その仕事とは何なのか、何が良いことなのか。実際に成し遂げたいことは何なのか。それは非常に人間的なこと、つまり主体性やエンパワーメントになるでしょう。ですから、この技術が今もたらしている変化には、盲目的な楽観主義ではなく、非常に前向きなものがあると思います。しかし、何がなくなるのかに気づくことの方がはるかに簡単です。強固で安定していると思っていたものが変わっていくのは見えやすいですが、その代わりに何が来るのか、どんな新しいものが得られるのか、この変革の一部としてもたらされる恩恵は何かを見るのはずっと難しいのです。それこそが、他の側面を説明するのに加えて、私たちがさらに明確に説明しなければならないことだとますます実感しています。

ここでお知らせです。Core Memoryでは、革新的で動きが速く、先見の明のある企業を取り上げています。だからこそ、Core MemoryはBrexのスポンサーでお届けしています。Brexはこうした企業の多くにとってのインテリジェントな金融プラットフォームです。スタートアップから世界最大規模の企業まで、3万社の企業が財務管理にBrexの技術を頼りにしています。彼らはスマートな法人カード、高利回りのビジネスバンキング、そして素晴らしい経費自動化ツールを提供しています。私は経費精算が大嫌いなのですが、BrexのAIソフトウェアはそうした経費を処理し、どこでお金を使っているかを把握し、多くのことを代わりに行ってくれるので、自分で時間を無駄にする必要がありません。brex.com/corememoryにアクセスして詳細を知り、ぜひプログラムに参加してみてください。この時代遅れの財務ソフトウェアから抜け出し、未来へ向かいましょう。Core MemoryとBrexがお届けしました。

お二人がお話しされたことに基づいて、いくつか質問があります。先日、息子の付き添いでオベリン大学に行きました。そこには600人か700人くらいの人が集まる部屋があって、オハイオ州にあるのですが、全国から人が集まってきていました。学長が前に立って話をした後、Q&Aの時間が設けられたのですが、質問の多くはAIに関するものでした。しかし、それによって、私たちがここでいかにバブルの中に住んでいるかを再認識させられました。

決して誰かを見下そうとしているわけではありませんが、それらの質問は非常に基本的なものでした。部屋全体から受けた圧倒的な印象は、うわあ、みんなこれから何が展開され、自分たちに何が起ころうとしているのか、あまり分かっていないんだな、というものでした。それは警鐘を鳴らすようなものではなく、私にとっては目を見張るような体験でした。

もちろん、彼らは授業でAIをどう使うつもりか、子供たちがAIに頼り切るのをどう防ぐつもりかといったことも聞いていました。しかし、少し話が進むと、このかなり賢い人たちの集まりが、現在起きていることと本当に接点を持っていないように感じたのです。もし人々がこれらの技術で何ができるかという例を知らず、私たち自身もこれが正確にどのような形になるか分からないのであれば、この問題をどう解決し、どうやって人々を準備させることができるのか私には見えません。

これについて、私には一つポジティブな見解があります。AIについて単に読むだけだと、一つの印象しか与えられません。この新しい技術を理解しようとしているような感覚です。しかし、実際に使ってみると、非常に直感的であることがわかります。そして、それが多くの意味でAIの目的なのです。

過去70年間、私たちがどのようにコンピューターを設計してきたかを振り返ってみてください。機械は人間のことを完全には理解していません。頭の中に目標があっても、それを機械の言語に分解しなければなりません。それはアセンブリコードを書くことであったり、高水準言語を使ってコンピューターと対話することであったりします。しかし、ChatGPTの仕組みを考えてみても、言語モデルの概念を本当に理解しなければなりません。なぜ新しい会話、新しいタブを作成しなければならないのか。なぜ、すべてを記憶してくれる単一の相手と話すだけではいけないのか。これらは技術的な限界ですが、私たちはそれを改善しています。

ですから、私たちが構築しているのは最も直感的な技術だと思います。私たちは、機械をあなたに合わせるようなものを構築しているのです。そして、人々がそれを使うと、自分に何ができるかに気づきます。

私が聞くのが大好きな話の一つがあります。中西部に住む友人の話ですが、彼の妹が、誰かが作ってくれたらいいのにと思っているアプリについて彼に話していました。彼女が詳細に説明している間、彼は相槌を打ちながら、彼女が言っていることをそのままCodexに入力していました。エンターキーを押して数時間後、彼はその結果を彼女に見せました。それは彼女が説明した通りのアプリでした。彼女は、これは一体何? 誰が作ったの? これこそ私が欲しかったものよ、と驚きました。すると彼は、あなたが作ったんだよ、と言ったのです。

誰もが経験するであろう、そのようなひらめきの瞬間があると思います。AIが自分に何をしてくれるかを体験し、自分が力を得たことを実感するのです。頭の中に世界で見たいイメージがあれば、間もなく登場する新しい画像モデルを見ればわかるように、これまで不可能だった方法で創造することができます。

もう一つ思い出す話があります。私の祖母は認知症、アルツハイマー病を患っており、それは誰にとっても非常に厳しい経験でした。しかし、特に私の記憶に残っているのは、彼女がAlexaを使って音楽を再生することができ、歌詞を覚えていて一緒に歌うことができたということです。それは、技術を通じて彼女が自分自身とつながる方法でした。それが非常に印象に残っています。

直感的なインターフェースを構築できれば、誰もがそれとつながることができます。現在は、特定の個人を対象とした技術の断片があるか、あるいは自分が本当に望んでいることとは深く関係のない、技術そのものに特化したスキルを身につけなければならないように感じられます。

グレッグが話している間に、私の中で3つのことが浮かびました。一つ目は、私たちが製品を立ち上げる前、人々にAIというものがやってくる、注目すべきだ、すべてを変えることになる、本当に重要なことだ、と伝えようとしていました。しかし、ほとんど注目されませんでした。美しいブログ記事を書き、信じられないほど印象的な偉業を成し遂げました。ビデオゲームの大会で優勝し、ルービックキューブを片手で解くロボットを作り、驚くべきことをたくさん成し遂げました。私たちはかなりイケてる気分になり、ニューヨークタイムズにも取り上げられたから大成功だ、と思っていました。

しかし、本当に、誰も気に留めませんでした。実際の影響は何もありませんでした。そして、ChatGPTを立ち上げました。これは、私たちがこれまでに行った中で最も印象的な技術的成果ではまったくありませんでした。断じて違います。しかし、人々がそれを実感できた途端、なるほど、理解した、となったのです。あの瞬間が、世界がAIというものは本物かもしれない、と一斉に認識した最大の瞬間だったと思います。人々がそれを使用し、そこから価値を引き出すことができたからです。自分自身の感覚を育てることができるのです。それは話を聞くのとはまったく異なります。

コーディングモデルでも同じことが起きています。しかし、これら二つが、世界が情報を更新し、何かが起きていると認識した本当に大きく重要な瞬間でした。今後もさらにそういう瞬間は来るでしょうが、今のところ、コンピューターに何かを質問して答えを得たり、コードを使って何かをさせたりできるという事実、これらは本当に強力であり、それが世界が変わっていく方法だと思います。

私たちが超知能がやってきてすべてを変える、と言っても、このポッドキャストを聞いている人たちは、なるほど、理にかなっている、注目すべきだろう、と言うかもしれませんが、世界にそれほど大きな影響は与えません。ですから、この技術がカンニングを防ぐといったレベルの話だけでなく、世界にとって何を意味するのかを人々に考えてもらうために私たちができる最も重要なことは、人々に多くの価値を生み出し、使いやすい、素晴らしい製品を出荷することです。そして、私たちはそれを継続していきます。

二つ目は、私たちの歴史の中で何度も見てきたことですが、私たちがかなり良いものを世に出すと、人々はこれがこれ以上良くなったらどうなるのか想像もつかない、これ以上良くなるはずがない、と言うのです。グレッグが言及した、まもなくリリースされるこの画像モデルは、私にとってまさにその実例でした。私は画像生成はすでに解決されたと大まかに考えていました。本当に優れているから、これ以上良くなる必要はない、と。しかし、この新しいモデルは、まだまだ先へ行けるし、できることはもっとたくさんあるということを本当に思い出させてくれました。

それは何をするんですか。

とんでもなく素晴らしい画像を作ります。

テキストも入れられますか。Core Memoryのグッズのモックアップを作ろうとしているんですが。

もうすぐできるようになります。チームは今回本当に素晴らしい仕事をしました。でも、ChatGPTでさえ、GPT-4を導入した時、私の洗練された友人たちの多くが、これだ、これがAGIだ。モデルがこれ以上賢くなっても気にしない。ただもっと安くしてくれ。信じられない、と言っていたのを覚えています。

もし今戻って、2023年3月頃のバージョンのGPT-4を使ったら、なんだこれはひどいな、と思うでしょう。しかし当時は、人々は解決した、解決した、チューリングテストに合格した、もう完成だ、これ以上良くなるはずがない、と言っていました。そして、それはどんどん良くなり、できることへの期待と可能性を高め続けることができます。推論モデルやコードの作成については言うまでもありません。あの期間にChatGPTがどれだけ良くなったかについて話しているだけです。

ですから、ここでもまた同じことを見ています。世界は、あなたはこれまでで最高の素晴らしいものを作った。これ以上良くなることはない。私が必要としているのと同じくらい優れている、と言います。しかし、月ごとに、少なくとも四半期ごとに、期待と能力は大きく跳ね上がっていきます。

そして三つ目にグレッグが言っていたのは、これらのモデルは今後どうなるかと比べるとまだかなり愚かですが、それ以上に、あなたの生活についての認識がかなり限られているということです。あなたはまだ、自分が望むものを得るために、モデルを調整し、なだめすかさなければなりません。

しかし、私たちは、あなたの文脈をすべて知っているモデルからそれほど遠く離れてはいません。それはあなたのことを知っており、あなたの生活を知っており、あなたが何をしているか、何を大切にしているかを知っており、あなたの生活にいる人々のことを知っています。もちろん、あなたが望む方法で、あなたのコンピューターやブラウザーにアクセスできます。そして時間とともに、あなたの周りの現実世界で何が起きているかにもアクセスできるようになるかもしれません。

それは、コンピューターを使う感覚、AIを使う感覚を完全に変えることになるでしょう。私はそれについて非常に興奮しています。しかし、私たちでさえ、それが本当にどんな感じになるのか、まだ良い直感を持っていません。

その点についてですが、今、自分が使っているツールに状況を説明するのにどれだけ時間を費やしているか考えてみてください。それがどれほどフラストレーションがたまることか。まるで、同僚に、いや、私が望んでいるのはこういうことで、こういう状況なんだ、と常に説明しようとしているようなものです。もしその文脈をパッとパッケージ化できたら。

まさにその通りです。それは、これらのシステムに期待する振る舞いではありません。そして、サムが言っていたことにもう一つ付け加えると、OpenAIにおける最大の技術的課題の一つは、機会が多すぎることだと思います。AIは果てしない機会の分野です。どの次元に拡張しても、何か新しく、前例のない、素晴らしいものがあります。ですから重要なのは、どこに集中すれば最大の利益と恩恵を得られるのかというビジョンを持つことです。複数の異なる取り組みがあり、それらがすべて組み合わさって何かになります。

モデルの進化と執筆能力の課題

現在コーディングシステムがありますが、それがすべてのコンピューター作業に拡大していくことは明らかだと思います。ちなみに面白いのは、人々が行う仕事の多くが、対面での会話と、コンピューターでタイピングして文脈をうまく取り込もうとすることの間で、非常にシームレスに織り交ぜられているということです。これは非常に重要な問題になるでしょう。

しかし同時に、私生活でもこれを本当に望むはずです。私たちが向かっている先を「パーソナルAGI」と呼び始めています。あなたを本当に知り、文脈を共有し、信頼できるAIです。財務や健康に関する質問をすれば、信頼できる情報を与えてくれます。これらのことはすべて重要であり、そのためには文脈も必要です。

深くコンピューター作業に使われるAIと、私生活で使われるAIとの間の境界線が、技術的なレベルで曖昧になっているのがわかり始めます。たとえ、仕事の文脈だけを知っているシステムと、個人の文脈を知っているシステムという異なるものを求めたとしても、それらを並行して追求し、同じ技術的基盤の上に構築することができます。私たちが構築している技術について最も驚くべきことは、その中核はすべて一つのニューラルネットワークだということです。依然としてディープラーニングです。それをスケールアップさせ、一つのシステムを構築し、それをこれらすべての異なる素晴らしいアプリケーションに適用しているのです。

この流れに沿って一つ質問させてください。こんなことはしないと自分に誓っていたのですが。私はAIを信じていなかったわけではなく、驚くべきことができるとは分かっていましたが、比較的最近まで懐疑的でした。

何があなたの考えをアップデートさせたのですか。

いくつかあります。一つは、エージェントをより頻繁に使い始め、自分の望むように形作り、お二人が話していたようなことを実際に感じるようになったことです。ああ、これは実際に私の時間を大幅に節約してくれている、私の指示に従ってくれている、しかもかなり上手くやっている、と。

もう一つは、私はバイオテクノロジーをよく取材するのですが、そこから出てくるいくつかの結果を見て、コーディングとバイオテクノロジーが現在最も明確にAIが向かっている分野だと感じたことです。先日、夕食の席でお話しし、あなたが書いたものも読みました。LLMを基盤として、あなたが描写した方向へ進む明確な道筋が見えます。

それでも私の中に、私は言葉を扱う仕事をしているせいか、文章の執筆がまだ素晴らしいとは言えないという思いがあります。これは単なる逸話的で直感的なものに過ぎませんが、私に返ってくる感触は、いや、これは超知能ではない、というものです。

私たちはまだ、個性という点には到達していませんね。

でも、LLMはそこまで到達できるのでしょうか。

到達できると思います。非常にギザギザな(分野によって凹凸がある)状態だと考えてください。例えば、ここ数日の間に、私たちのAIが長年の問題を解決しました。長い間大きな関心を集めてきた数学の謎です。この問題について長年考え、多くの時間を費やしてきたある数学者が、今回の貢献に対する自身の見解を投稿しました。テレンス・タオも、このAIが発見した異なる数学分野間のつながりがあるように見えると述べており、これらの機械から真の美しさが生まれ始めているのを目の当たりにしています。

もちろん、それは特定の領域です。数学はクリエイティブな執筆とは大きく異なります。しかし、これらのAIが興味深い洞察を持ち、支援できるという事実は、数学者たちに、私たちにさらに何ができるか考えさせています。ですから、AIが得意とすることに関して、境界線はギザギザなのだと思います。私たちはその境界線を押し広げ続ける方法は分かっています。

しかし、私たちが本当に探求しているのは、AlphaGoの第37手のようなものです。あれは深い洞察だっただけでなく、人々の囲碁というゲームに対する理解を本当に変え、より多くの人が囲碁をプレイするようになりました。人々がしていることの意味を本当に深めたのです。ですから、私たちは不満の少ないものを作ることになると思いますが、同時に、あなたが執筆において望むことを、今日想像できる以上にずっとできるようになると思います。

しつこくて申し訳ないのですが、私はGPT-5が執筆において非常に優れていると聞いていました。私がシニカルでなくなったのは推論モデルが登場した時です。Claudeが本当に優れたリサーチを提供し、その後あなた方がリサーチ機能を発表した時、私にとっては、なんてことだ、これは素晴らしい、私の時間を大いに節約してくれた、と思いました。しかし、それ以前に、今頃には良い文章が書けるようになっていると約束されていたのです。

文章には魂が感じられません。何かが欠けているのです。

技術的な観点からお話ししましょう。私たちの技術は、教師なしの方法でモデルを訓練することができます。公開されているすべてのデータを見て、次に来るものを予測することを学びます。それは新しい状況に置かれ、合理的な対応は何かを把握しようとするものです。

その後、強化学習のステップを行います。実際にアイデアを試し、どれだけうまくできたかに基づいて報酬と罰を与えます。ポジティブなシグナル、ネガティブなシグナルといったものです。

叩いているわけではありませんよ。

その通りです。まったく違います。このシグナルの話です。そして難しい部分は、どうやって判断するか、サムズアップかサムズダウンかをどう決めるかということです。数学や科学では、よりオープンエンドな分野よりもはるかに簡単です。しかし、より賢くなり、そうした報酬シグナルを提供できるようになったAIもあります。

ですから、課題の一部は、採点できるタスクのセットをどう拡大するかということであり、それが多くの焦点となってきました。これには非常に興味深いものがあり、その多くはOpenAIの最初期にまで遡ります。私たちは、こうなるだろうというビジョンを持っていました。しかし、私たちはそこに近づいていると言いたいと思います。もちろん、まだまだ進歩すべき点はたくさんありますが、あなたがフィードバックを与え続けてくれれば、私たちはあなたのためにそれを改善できるでしょう。

そこに組み込まれている課題の一つは、あなたが望む文章が、大多数の人々が望む文章とは大きく異なるということです。現在、私たちは約10億人が使用し、全員が何となく好むようなモデルを作らなければなりません。私たちがやりたいのは、モデルのパーソナライゼーションを非常に優れたものにして、あなたがそれを素晴らしいライターだと思い、同時に、あなたとは全く異なる生活やニーズを持つ別の人が、自分の目的にとって素晴らしいライターだと思えるようにすることです。それらは全く異なるものなのです。

それが私の聞きたかったことかもしれません。パーソナルAGIには、そのきらめき、その魂、その魔法のようなものを持っていてほしいのです。そしてもしそれがなければ……ご存知の通り、ヤン・ルカンは長い間これに反対してきましたし、デミスも最近、あなた方と同じ方向を向いているように見えましたが、彼もまだ何か特別なものがもう少し必要だと言っているように見えました。しかし、お二人は非常に自信を持っているようですね。

もしモデルが解決できるなら、私たちはアシュリー・バンスが素晴らしいライターだと思うようなものを作ろうとはしていません。私たちは、世界で最も賢い数学者でさえ解けないような未解決の数学問題を解決させようとしてきたのです。これらの数学者と比べてあなたの知性がどうこう言うつもりはありませんが。

ライターたちも賢いですよ。

しかし、私が言いたいのは、数学を解くことも難しいということです。もしそれができるのなら、このアプローチが、あなたが何を素晴らしい文章だと考えるかを学び、あなたのためにそれを行う方法を見つけ出すこともできると、私はかなり確信しています。

ちなみに、この次元においてもいくつか新しいモデルが登場する予定です。

このポッドキャストが公開された後、それを判断するのが待ちきれませんね。

文章が良くなっているか教えてください。

個性ですね。私たちは常に、ギザギザな境界線を押し上げるようにすべての能力を改善しています。この分野では常に、現在の位置ではなく、その傾きがどうだったか、そしてそれを指数関数に当てはめて判断することが非常に重要です。1年前の文章と比べてどうなっているかを考えてみてください。GPT-5で期待外れだったなら申し訳ありませんが、心配しないでください。私たちは本当に成果を出すことに強いモチベーションを持っています。しかし、人々が望むすべてのアプリケーションのために改善する見通しは本当に立っていると思います。

Core Memoryポッドキャストは、初日からE1 Venturesの素晴らしい人々によってサポートされています。彼らはシリコンバレーの若く野心的なVCファンドであり、若く野心的な企業や人々に投資しています。E1 Venturesの皆さんのサポートに心から感謝します。

豊かさと格差の未来

お二人が概説した世界では、すべてがうまくいっているとしましょう。これは非常に楽観的なシナリオです。病気は治癒され、資源は豊富になり、問題は解決され、人類全体が底上げされます。しかし私にはまだ理解できないことがあります。世界の最も賢い人々がこの技術を開発しているように思えます。全体が底上げされたとしても、ほぼすべてのシナリオにおいて、不釣り合いに恩恵を受ける人がいるのではないでしょうか。お二人がこれらのツールをどのように操り、どう使うかについて話しているのを聞くたびに、事態はさらに極端になるのではないかと感じます。永遠の下層階級という冗談や、これらの本当に強力なツールを見て「ああ、自分は何のためにここにいるのか」と感じ、権利を奪われたように感じる人たちのことです。

楽しく創造的なことをする時間はたっぷりあるかもしれませんが、他の人々がこれらを非常に極端で素晴らしい方法で操っているのを見ると、どうなるのでしょうか。

これこそが、OpenAIの使命の核心にあります。これが私たちがこの場所を始めた本当の理由です。この強力な技術がやってくるのが見えています。それはこれまでに作られた中で最も重要な技術になるでしょう。それがすべての人、真に全人類に恩恵をもたらすことをどう保証するのか。それは私たちの使命の中にあります。AGIが全人類に恩恵をもたらすことを保証する。そして、私たちは本気でそう思っています。

私たちの企業構造を見れば、この技術が本当に人々に恩恵をもたらすものになることをどう保証するかという私たちの価値観の一部を構造に組み込もうと、何度も異なる反復を試みてきたことがわかるでしょう。私たちが下す製品の選択にもそれが表れています。私たちがChatGPTを立ち上げる決定をしたのは、これが人々の手に渡るべき技術だと心から信じているからです。

ちなみに、それは非常に物議を醸しました。秘密裏に構築しなければならない、人々にアクセス権を与えてはならない、別の方法でやらなければならない、という異なる学派がありました。しかし、私たちがどうやって社会をレジリエンスのあるものにするか、どうやって実際に人々に恩恵をもたらすかを考えるとき、それはすべて私たちが進んできた方向を指し示していると思います。そこには多くのニュアンスがありますが、私たちが向かっている方向は、すべての人の基準がほんの少し上がるだけではないと確信しています。

例えば、ポケットの中に、世界中の誰が受けられる最高の医療チームよりも優れた医師がいることを想像してみてください。スマートフォンを持っている人なら誰でもアクセスできて、しかもそれが無料になる。それがやってくるのです。これは途方もない事実です。少し良くなるというレベルではありません。それは根本的に大規模に基準を引き上げるものです。

もちろん、上限を引き上げることについての疑問も妥当だと思います。富が正確にどのように分配されるのか、私たちはこれについてよく考えます。OpenAI Foundationを見てください。OpenAIの株式の25%から30%程度を保有しています。もしOpenAIが非常に成功すれば、それは1500億ドル以上になります。そのすべての価値が非営利団体に確保されており、それは世界を真に豊かにするために使われることになります。

先日夕食を一緒にしたとき、あなたがエージェントで何をしているかについて話しているのを聞きました。私はあなたのことを知っていますし、あなたは信じられないほど賢い人ですが、私はただ「ああ、神様、グレッグはこの機械でこんなことをしているのか」と思いました。自分でも助けになるような面白いことをしていると感じてはいましたが、あなたが自分の生活や何をしているかを描写するのを聞いたとき、「ああ、これはスーパーヒューマンがあちこちを走り回るようになるんだな」と思いました。なんだか、威圧的ですらありました。クールではありましたが、威圧的でもありました。「私はあなたのようにこれをどう使えばいいのか全く分からない」と感じたのです。

もう少しフィルターを外したバージョンで話してもいいですか。

ぜひお願いします。

怒られないといいんですが。私には世界に関する3つの未来が見えます。

一つは、グレッグが言ったように、基準が大きく上がる世界です。誰もが主観的に10倍豊かになり、物質的な豊かさ、繁栄がとてつもなく大きくなります。人々は「10年前の生活に比べて、今はすごくうまくいっている」と言うでしょう。しかしその世界では、エージェントの使い方を本当に学び、多くのコンピューティング資源を集めた人たちもいて、たとえば兆万長者が10人くらい生まれるかもしれません。ですから、基準は劇的に上がりますが、これが人々が本当に活用できるレバレッジであるため、最も有能で最も野心的な人々、すでに裕福で多くのコンピューティング資源にアクセスできる人々の間で、不平等は悪化します。これが私に見える一つの世界です。

もう一つの世界は、起こり得る様々な異なる事象を通じて、基準がそれほど上がらない世界です。全体的な繁栄はそこまで生み出されませんが、不平等も少なくなります。ですから10年後、人々は2倍豊かになったと感じるかもしれませんが、不平等は縮小しています。

この2つで止めておきましょう。これが問題の核心だと思うからです。

3つ目はもっと怖い世界ですか。

いえ、私が言いたいポイントから逸れてしまうので。世界の多くの人は、グレッグと私が1つ目を選ぶべきだと考えるのは明らかだと思っているでしょうし、あなたもそれに同意すると思います。しかし感情的には、多くの人がそう感じているわけではありません。

何が明らかかは主張したくありませんが、個人的にはこの技術に非常に大きな可能性を見ていますし、社会レベルで、アメリカの競争力という点でも非常に重要だと思います。ロボティクスを見ても、私たちはロボティクスでリードしているとは思いません。

リードしていませんね。

しかしソフトウェアの側面では、私たちには機会があります。これらすべての要因を一緒に考慮する価値があると思います。

明らかに、他の多くのことで意見が合わない人たちも、アメリカがチップ、ロボット、AI、その他すべてにおいて競争力を持つ必要があることには同意するでしょう。しかし、社会と経済をどう組織するか、最大限の繁栄を推し進め、それに伴う不平等を受け入れるのか、それとも、相対的な性質や、世界がより繁栄したとしても、これをうまく使う人たちがすべての権力を握るのではないかという恐れに焦点を当てるためにそれを制限するのか、という巨大な疑問が生じるでしょう。

知的には私には明確に思えますが、感情的にはそれが明確でない理由も、ここで不平等を放置すれば、このツールの複利的な性質は私たちがまだ理解していないものになるという恐れもよくわかります。

これについて最後に言いたいのは、何があっても、誰もがより多くのコンピューティング資源、より多くのインフラ、そしてAIへの最も安価なアクセスを望むべきだということです。そうでなければ、これの量が限られていて、需要と供給によって価格が上がり、富裕層しかアクセスできなくなれば、本当に不平等を悪化させることになるからです。

ええ、それについて少し補足したいと思います。ある程度、これはサムと私がどのように一緒に働き、どのように考えるかに通じているからです。その2つの選択肢を提示することは、実際には「その2つの選択肢しかないのか? 私たちが見落としている領域の何かがあるのではないか?」と考える良い出発点になります。

そして、サムが言った最後のことは、私にとってAIは本当に機会であると考える上での解放(アンロック)でした。アクセス権、つまりコンピューティング資源があれば、AIはすべての人にとっての機会になります。もしコンピューティング資源がなければ、どんなにエージェントを上手く使えても、それを実行するリソースがなければ多くのことはできません。

ですから、もし全員がコンピューティングにアクセスできる世界であれば、私の世代が育った時、親よりもコンピューターを使うのがはるかに上手だったように、今育っている世代は私がエージェントを使うのと同じくらい、いや10倍は上手になると思います。それを見るのは驚くべきことです。

本当に驚きですね。Core Memoryで最初に大きな記事にしたのは、Claudeを使って核融合炉を作った若者の話でした。彼がコンピューターでやっていることを見たとき、融合炉そのものよりも、彼がこのツールを全く違う方法で使っていることの方が印象に残りました。彼は22歳くらいで、AIアプリケーションを8つ立ち上げていました。もしその子に、あるいはすべての子供にコンピューティング資源を提供できれば、それは本当にアメリカン・ドリームの最も極端なバージョンになるでしょう。テクノロジーで遊び、深く入り込み、それで構築し、そこから最大限のものを引き出そうとする意欲と意志を持つ人なら誰でも。

そこで並外れたパフォーマンスが見られるようになり、あらゆる種類の流動性が生まれると思います。ですから、「選択肢1か選択肢2か」という質問に対する正しい答えは、まさに「何か別のもの」を提示することだと思います。そしてそれは可能だと考えています。

アメリカの競争力とロボティクス

かなり広いテーマについて話してきましたが、具体的な質問もいくつかあります。もう一つだけ広い質問をしてもいいですか。

もちろん。

私がハードウェアを深く取材していることはご存知かもしれません。私はおそらく他の誰よりも多くのアメリカの工場やハードウェアスタートアップを訪れ、中国の動向にも目を光らせてきました。

私の頭を常によぎるのは、確かに私たちはソフトウェアやAIでリードしています。ソフトウェアは過去40、50年間のアメリカの強みの物語でした。しかし、この技術が物理的な世界でどのように現れるかを考えると、ロボティクスだけでなく、これらのハードウェアシステムに入るすべてのコンポーネントにおいて、アメリカが競争力を持つ未来がまったく見えません。

エルセグンドに行くと30社のスタートアップがあり、アイデアが花開き人々が挑戦しているのを見るのは素晴らしいことですが、中国で見ているものに比べれば取るに足らないものです。これらすべての物理的な現れが世界に起こることは明らかですが、アメリカがそこで勝つためには、アメリカは極端に不利な立場にあるように思えます。

それを変えようと信じられないほど懸命に働いている人たちがいると思います。サムは……。

ロボティクスにおいてですか。さまざまなハードウェア企業への投資を通じてということですか。

いや、私たちはロボットがこの明らかな一部であることを理解しており、ロボティクスで大成功を収める方法を見つけ出そうとしています。アメリカを製造業や原子の世界全般で競争力のあるものにするために一つだけ選ぶとすれば、より多くのロボットを作れるロボットがたくさん必要だと言うでしょう。

でも私たちはアクチュエータ一つ作れないじゃないですか。

それは私たちが解決します。OpenAIがやります。

ロボティクスを通じてですか。

やらなければなりません。しかし、本当に重要な他の部分もあります。AIのワークロードをサポートするためだけに世界が必要とするギガワット単位の電力、製造しなければならないチップの数。十分なラックを組み立て、ネットワークケーブルを強力に張り巡らせ、そもそも作り出すという退屈な作業について考えてみてください。アメリカはここで極端に遅れています。

これがどれほど早く起こらなければならないか、アメリカが現在何を得意としているか、どれだけのインフラを構築しなければならないか、そしてそれを手作業で行うのにどれだけの時間がかかるかを考えれば、ロボティクスが解決策になると思います。あなたの診断と、その重要性については正しいです。

しかし幸いなことに、私たちにはチェス盤の新しい駒があると思います。

OpenAIを通じて、あるいはアメリカが、ですか。

どういう意味ですか。

私は違った印象を持っています。私たちはハードウェアで遊び半分にやっているだけで、完全にやられることになるのではないかと感じています。

コードの軌道においては、ええ、まったく同意します。もし私たちが真の汎用ロボットを作ることができれば、ロボットのためのCodexに相当する力を持つものがあり、「工場をこういう風に設定して、この種のロボットをもっと作ってくれ」とか「この種のものを採掘して精製する方法を見つけ出してくれ」と言えるようになれば、競技場は変わります。

なるほど。でも、あなたはOpenAIのことではなく、アメリカのことを言っていましたね。あなたが何か知っていることを指しているように感じますが。

ええと、アメリカにはこの種のAIとロボティクスの組み合わせ以外に、十分早く追いつくための信頼できる計画があるとは思いません。

チェスの駒が何のことか分かりませんでした。最近何か見たのですか。

ああ、汎用ロボットのことです。チェスの駒。ええ。ロボティクスには本当に卵が先か鶏が先かという問題が存在していたと感じています。ロボットのハードウェアがなければソフトウェアを開発するのは難しいですし、素晴らしい頭脳がなければハードウェアを開発するモチベーションを保つのは難しいのです。

私たちは2018年にロボティクス・プロジェクトを行っていました。あのロボットハンドを覚えていますか。

ええ、すごくかっこよかったですね。

あの手について知っておくべきことは、私たちがそれを強化学習を通じて訓練したということです。実は、競技ビデオゲームを解決するために使用したのとまったく同じアルゴリズムです。驚くべきことですよね。一つの技術が両方を行っているのです。唯一の違いは、この手が20時間稼働すると、腱の役割をしている糸が切れてダウンタイムが発生したことです。機械エンジニアが来て直さなければならず、彼らを夜中に起こしてオフィスに来させたりもしました。そして、これでは機械学習はできないと気づいたのです。絶対に不可能です。

そのため、最終的にあのプロジェクトはキャンセルしました。そのチームは後にGitHub Copilotの開発に貢献することになりました。ソフトウェアの世界がいかに速く動いているかを実感する瞬間です。しかし今、私たちはこれらの驚くべき汎用アルゴリズムをあらゆる方法で利用できる地点に達しています。そして、もしそれを物理的な世界に適用し始めれば、ハードウェアの開発と、そのコード設計へのハードウェアのチューニングがどのように行われるかについて、まったく異なる物語が生まれると思います。

ですから、変化の本当の可能性があると思いますが、国家としての私たちがこれを実行する意志を持たなければなりません。しかし、そうしたものがなければ、現在の軌道がひどいものに見えるという点には、私たちも本当に同意します。

私たちは完全に終わってますね。

彼が納得させてくれましたね。

かなりひどい状況です。

プロダクトの焦点と開発の優先順位

話を大きく戻しますが、ロボティクスやモデルはあなた方が構築に興味を持ち、本当に気にかけているものです。しかし最近、あなた方がプロジェクトを統合し、焦点を絞ったと報じられました。視聴者もきっと知りたいと思うのですが、今テーブルの上には何が残っていて、何がカットされたのでしょうか。そしてなぜそれを気にかけているのか、なぜそのカットが重要だったのかについて伺いたいです。

グレッグに答えてもらう前に、少し説明します。グレッグは、私たちの一貫した製品の提供と、それをサポートする研究がどうあるべきかを本当の意味で形にする役割を引き受けてくれました。そして、それは社内で驚くほど喜ばしいことでした。すべてのものが出荷されるまでにはもう少し時間がかかるでしょう。彼がその役割に就いてからまだ数週間しか経っていませんから。しかし、ここでグレッグがしていることへのエネルギー、興奮、熱意は信じられないほどです。

では、それが何になるのか話してもらえますか。

ええ。もう少し詳しく教えてもらえますか。あなたは数週間前にその役割に就きましたが、カットの一部はすでに起きていましたよね。それらすべてを評価したということですか。

私は常にOpenAIの多くの部門で舞台裏から深く関わってきました。ですから、この特定の分野で前面に出る役割を担うようになったのは比較的最近のことです。しかし面白い事実として、私はAPIの最初のバージョンを構築しました。製品というものがOpenAIに存在して以来ずっと製品作りに関わってきましたし、常にそれを深く気にかけてきました。

それについて言えることはたくさんあります。製品を作り始める前は、それが私たちの使命にとっていかに中核的なものであるかを認識していませんでしたが、その後、それがどれほど重要であるかを思い知りました。だからこそ、私は常に製品の近くにいたのです。

現在私たちが置かれている状況は、エージェントへの移行の明確な瞬間にいるということです。ソフトウェアエンジニアリングに携わる人なら、過去6ヶ月間これを肌で感じてきたはずです。2025年にかけての移行があったと思います。オートコンプリートのようなものから始まり、エディタのサイドバーにそれが組み込まれ、ほとんどそこで話をするようになりましたが、やっているソフトウェア開発の中身は以前とほとんど同じでした。

しかし今は、Codexのような、真のエージェント管理プラットフォームであるツールが求められています。エージェントがすべての詳細を処理し、厄介な作業のすべてをやってくれます。人間は、物事をどう組み合わせるか、コードの構造はどうするかといった、通常はアーキテクチャ・ドキュメントに書くような、人間が本当に気にかけて管理したい上位レベルのことに20%ほどの時間を費やすようになりますが、コードの正確な詳細についてはエージェントの仕事です。

そこで私たちが抱いた疑問は、まず、この瞬間にどう立ち向かうかということです。これはソフトウェアだけではありません。私たちは、法律や金融といったあらゆる分野において明確な道筋を見ています。スプレッドシートやプレゼンテーションの作成といった機械的なスキルなどです。私たちのモデルをこれらにおいて極めて優れたものにするにはどうすればいいでしょうか。

ドメインの専門家と協力し、評価基準を作成し、トレーニングデータを作成し、AIにその優れたドメイン知識をこれらの分野に適用させ、経験を積ませ、「よし、よくやった」といった評価を得て、何が「良い」ことなのかを把握させます。私たちはこれをどう行うかについて機械的なビジョンを持っていますが、これらすべてを解き放つための適切な製品サーフェスを構築していることを確認する必要があります。

私たちが気づいたことの一つは、モデルが「製品そのもの」から「製品の一部」へと移行したということです。以前はモデルの上に非常に薄いソフトウェアの層があり、それがどのように設計されているかについて深く考える必要はありませんでした。しかし今では、それは非常に厚い層になっています。スキルのコネクタがあり、コンピューターの使用にどう接続するか、文脈や記憶をどう管理するかといったものがあります。

つまり、ほとんどAIと呼べるような深いソフトウェアの層が存在しているのです。モデルという形の頭脳があり、今度は身体を構築しているようなものです。どちらも難しく、両方を一緒に設計しなければなりません。

ですから、私たちが焦点を当てていることの多くは、第一に、素晴らしいエージェント・プラットフォームを組み立てることです。それが私たちが実現しようとしている最優先事項です。これを極めてうまく実行しているチームがありますし、今後数週間の間にリリースされるものについて非常に興奮しています。

第二に、これらのエージェントを実際にどこに適用したいかということです。そこでの私たちの優先事項は、本当にコンピューター作業に向けられています。ちなみに私はこの言葉を非常に意図的に使っています。人々は知識労働(ナレッジワーク)について語るのが好きですが、自分自身を知識労働者だと思っている人はいませんよね。それは実際の仕事から切り離されたような言葉です。

しかし、「コンピューター作業」という言葉の私が好きなところは、「コンピューター作業なんて本当はやりたくない」と思えるところです。それは私がやりたいことのようには聞こえません。しかし、デスクの後ろに鎖で繋がれ、タイピングし、肩を丸め、手根管症候群になりながら、自分の時間のどれだけをそれに費やしているかに気づくはずです。

ですから、私たちはそこに焦点を当てており、現在存在するCodexをソフトウェアエンジニアだけでなく、すべての人のためのものにしようとしています。これは非常に急速に進んでおり、このポッドキャストの撮影日にもいくつかのアップデートがあります。その方向性に向けて、パイプラインにはまだ多くのエキサイティングなものがあります。

そして第三に、パーソナルAGIについて本当に考えています。現在10億人のユーザーに使われているChatGPTについて考えてみてください。地球上のすべての人が、自分を代表し、自分の文脈を持ち、信頼関係を築いたAIを望むようになるでしょう。それはただ構築するものや、1対1で話すだけのものではなく、外に出てあなたのために何かをしてくれるものです。

例えば、あなたが特定のミュージシャンを好きだとAIが知っていて、そのミュージシャンが町に来ることにAIが自発的に気づいたとします。チケットが手に入るようになり、あなたが買える安くて良いチケットがあります。AIはただそれを買いに行きます。もしかすると、あなたとの信頼関係が構築されているので、承認を得なくてもこれをしてもいいと知っているかもしれません。あるいは、確信が持てないので確認したほうがいいと判断するかもしれません。私たちはそのようなものも構築しています。

これらを考えてみると、すべてはまとまりのある全体へと組み合わさるものの表現です。私たちが向かっている先の未来に早送りしてみると、皆が本当に望んでいるのはただのAGIなのです。言語モデルが欲しいわけではありません。スレッドが欲しいわけでも、これらの詳細な機能が欲しいわけでもありません。ただ、自分を助けてくれ、自分のために動いてくれ、問題解決を手伝ってくれ、仕事でも私生活でも自分の目標を知り、それを達成してくれるものが欲しいのです。これが私たちが優先し、構築しているものです。

ええ。

ですから私にとって重要な質問の一つは、私たちが消費者をどう考え、企業をどう考えているかということです。その答えは、これらの言葉の現在の定義に従えば、私たちは消費者を大いに気にかけ、企業も大いに気に掛けているということです。

しかし、これらの言葉の意味は変化し、曖昧になっていくと思います。なぜなら、私たちがやろうとしていることは、再び起業の波を解き放つことだからです。その最前線が見え始めていると思います。小さな会社が、以前は不可能だったような莫大な収益を得られるようになります。これはしばらくトレンドになっていましたが、さらに加速するでしょう。それは企業向けでしょうか、消費者向けでしょうか。どちらでもないようなものです。

ですから、私たちはすべての文脈において目標を解決することに本当に焦点を当てていると思います。それが私たちが物事を見るレンズです。そしてそれは、それ自体は素晴らしいものであっても、他のものを優先度を下げる必要があったことを意味します。

コンピューティング資源と今後の展開

何がカットされたのですか。

ええと……。

Soraが最もわかりやすい例ですね。

なぜですか。

なぜなら、それは技術ツリーの異なる枝だからです。Soraを実際に動かしているモデルを見ると、コアのGPTシリーズとは統合されていません。第二に、ユースケースも完全には統合されていません。この目標の枠組みにはあまり当てはまりません。そこには創造的な表現があり、非常に重要なものがあります。信じられないようなモデルでしたし、チームは素晴らしい仕事をしています。その技術は他のアプリケーションのために生き続けるでしょう。

しかし、私たちが本当に焦点を当てていたのは、私たちが提供したい製品スイートであり、次の3ヶ月、6ヶ月、12ヶ月で何をしたいかということでした。ちなみに私が説明したことは単なる第一歩に過ぎません。なぜなら、はるかに強力なモデルへの道筋も見えているからです。現在私たちが数学でやっていることを見ると、なるほど、あの新しいエルデシュの問題を解決した結果は、実は本当に重要なことなのだと、驚かされます。2年前にGPT-5.4 Proを使っていた人のような気分です。

以前は、コンピューティングオリンピックの問題を解かせるために、20人のチームでモデルを訓練しようとし、銅メダルを獲得しました。20人のチームが2週間かかり、多くのコンピューティング資源を費やしました。しかし今では、私たちが非常にカジュアルに訓練したこのモデルを、誰かが問題に向けるだけで、このような結果を得ることができます。

もしそのモデルを創薬に向けたらどうなるでしょうか。20人のチームとすべてのコンピューティング資源を使って、科学的発見のために本当に推し進めたらどうなるでしょうか。それは現在誰も価格に織り込んでいないことです。

ですから、エージェントの瞬間に立ち向かい、私たちが行っている製品投資がうまく構造化されていること、これらすべてのピースがどう組み合わさるかを考え、うまく機能するコネクタを持ち、それぞれのピースが構成可能であることを確認し、またエコシステムを構築することです。なぜなら、それは私たちが構築したものだけに関する問題ではないからです。

いくつかのエージェントの例を構築したいと考えています。Codexをサンプルエージェントのようなものとして考えることもできますが、開発者であったり、創造的なアイデアを持つ人であれば、自分自身のエージェントを構築できるべきです。自分のアプリケーション、自分の目的のために構築できるべきなのです。特定の数学問題に関心があるなら、そのエージェントをその数学問題に適用できるべきです。私たちはそのすべてを可能にしようとしています。

しかし、一つだけ確認させてください。これに関連するいくつかのことを手短に話します。つまり、この一部は、コンピューティング資源を得るためにSoraをカットしなければならなかったということですよね。

Soraが多くのコンピューティング資源を消費していると報じられていましたね。

この分野で成功するものはすべて、多くのコンピューティング資源を必要とします。

お二人、特にあなたとイリヤや他の何人かは、初期の頃にどこにコンピューティング資源を振り向けるか全力を注いだことで有名です。しかし今では、これらの非常に難しい決定を下さなければなりません。サービスを提供すべき多くの顧客がいて、多額のお金を使っているからには利益も出さなければなりません。お二人は可能な限り最大の賭けをするような性格ですが、今はある程度ビジネスに制約されています。それは非常に難しいことに思えます。お二人の性格には合っていないように感じますが。

懐疑的な顔をされていますね。奇妙な言い回しです。なぜなら、私はビジネスに制約されているとは感じておらず、ビジネスによって可能になっていると感じているからです。なぜなら、このビジネスこそが、コンピューティングをスケールさせることができると私たちに言わしめてくれたものだからです。

ChatGPTを立ち上げた時のことを覚えています。その直後に話をしていて、どれくらいのコンピューティング資源を買うべきか考えていました。私は「全部買わなきゃ。とにかくやるしかない」と言っていました。なぜなら、これほど多くの需要があることは明白だったからです。そしてそれが、私たちが多くのコンピューティング資源を獲得する能力における大きな解放だったと思います。

この信じられないような収益マシンがなければ、これらすべてのコンピューティング資源を得るべきだと誰にも納得させることはできなかったと思います。

なるほど。しかし、Stargateのようなニュースを見ると、明らかにあなた方がインフラストラクチャーを縮小しているかのような印象を受けます。

それがどこから来ているのか分かりません。時折、この特定のサイトは空冷しかないので、他のサイトほど価値がない、といった判断をすることはあります。そういった具体的な事象があるため、人々は「縮小している」というストーリーを書きたいのでしょう。しかし、間もなく再び「OpenAIはこんなに無謀だ。どうしてこんな狂った額を使えるんだ」と言われるようになるでしょう。メディアはどちらにせよ大騒ぎするものです。おそらく何か書くネタが必要だからでしょうね。しかし、私たちは可能な限り多くのコンピューティング資源を構築し続けます。

一つ考えておくべき価値があると思うのは、私たちにとってコンピューティングはコストセンターではなく、プロフィットセンターだということです。製品にデプロイされたときには。ですから多くの意味で、私たちのビジネスは極めてシンプルです。コンピューティング資源を借りるか買うかして、それにマージンを乗せて再販するのです。それにプラスのマージンがある限り、スケール可能なのです。需要は事実上無制限ですから。

なるほど。では、データセンターのハードウェアは引き続きフル稼働で進んでいると。

ええ、私たち独自のチップですか。

ええ、独自のチップ、ネットワーキングなど。

はい。私たちのチップには非常に興奮しています。

素晴らしいチームがいます。

タイタンについては……。

ええ、もちろんスケジュールの話はしませんが、私がそのチームと多くの時間を過ごしていて、彼らは素晴らしい仕事をしているとだけ言っておきます。

では、それはすべて進んでいると。ロボティクスについても進んでいるようですね。

「ああ、これがChatGPTの瞬間だ」というものを手に入れるまでには、まだ少し時間がかかるでしょう。

でも、そのプログラムは進めているんですね。ソーシャルロボットは現在のものではありませんが、将来非常に重要になるのは明らかです。

そしてソーシャルネットワークは……。

やっていません。多くはありません。

それから明らかに、スーパーアプリ、ブラウザ、そういったものはまだ進んでいますね。

はい。スーパーアプリについて一つ理解しておくべきことは……キャッチーな言葉なので一人歩きしがちですが。

あなたたちが考え出した言葉だと思っていました。

社内の略語として使っていたものです。理解しておくべきことは、私たちがチームに伝えていることが、当然ながら世界へのコミュニケーションになってしまうことがありますが、これらは同じ意図のものではないということです。スーパーアプリは多くの意味で氷山のようなものです。ええ、私たちはアプリを持ち、Codexをすべての人のためのものにするために、現在のCodexアプリへのアップデートを目にすることになるでしょう。

そして最終的にそれが何になるにせよ、私たちの望む場所に到達するには多くのステップがあります。しかし、それは私たちが説明したこの統一されたエージェント的インフラストラクチャーを構築しているということであり、それが人々がやりたいあらゆることにとっての巨大な解放になると思います。

オープンモデルとセキュリティへの懸念

私とあなたは以前、あなた方の会社で多くのドラマがあったことについて少し話しましたね。それが時に会社の歩みを遅らせました。悲しいことに、今でもドラマは続いています。訴訟も近づいています。

それは楽しくなりそうですね。

ええ、ええ。その話は後でしましょう。この2年間、OpenAIとAnthropicのどちらが実際にうまく実行してきたと思いますか。

そうですね、今の瞬間だけでそれを言うのは難しいことだと思います。一歩引いて、私たちが皆ここで何をすべきなのかを本当に考えるべきだと思います。OpenAIの観点から言えば、私たちが話してきたことは、ある意味で、エンタープライズへの販売や、これらのコーディングツールをいかに提供するかを理解することについてです。競争は、自分たちの思考を高め、「これに焦点を当てなければ」と気づく助けになります。

コーディングの例で言えば、抽象的にコーディングが得意なモデルを構築するだけでなく、プログラミングコンテストで常に最高の数字を出していたモデルを、厄介なリポジトリや実世界のデータといったものに適用することにおいて、私たちは遅れをとったと思います。それはAnthropicよりも遅れて認識したことだったので、彼らに称賛を送ります。しかし、それは同時に私たちの実行力を高めるのにも役立ち、現在CodexとClaudeを直接比較すると、非常に好ましい結果が得られています。

そして、私たちのチームは会社全体で、単に競争力があるだけでなく、多くの面で実際に先行している製品を構築するという信じられないような仕事をしてくれたと思います。しかし、中核は決してニュースサイクルの浮き沈みについてではありません。AGIへの進歩、そしてそれがすべての人に恩恵をもたらすことについてです。私たちはそれに極めて集中してきたと思います。チームは非常にうまく実行しています。

外部からは常に分かるわけではありませんが、私たちが話した事柄について考えると、多くのタイムスケールでの焦点があり、それらすべてが私たちの行くべき方向へと積み重なっているのです。

時間が許す限り聞きたい質問が山ほどありますが、その一つは、多くのモデルを多くの人の手に渡し、彼らが強力な技術を持てるようにすることについて触れました。しかし今、これらのモデルの一部は強力すぎるという点に達しています。特定の企業のためだけに制限されていると聞いています。ClaudeとMythosは本当に多くの見出しを作り、さらなる恐怖を生み出していると思います。

この新しい瞬間についてどうお考えですか。私たちは、これらの強力なモデルをすべての人の手に渡すのではなく、舞台裏に留めておく必要がある地点に達しているのでしょうか。

世界には長い間、AIを少数の人々の手に留めておきたいと望んできた人たちがいます。それを様々な方法で正当化することはできますし、安全上の正当な懸念があるというのも一部は事実です。しかし、もしあなたが望んでいるのが「自分たちは信頼できる人間だから、自分たちだけでAIをコントロールする必要がある」ということだとしたら、恐怖に基づくマーケティングはそれを正当化する最も効果的な方法でしょう。

それが一部のケースで正当でないと言っているわけではありません。しかし、「我々は爆弾を作った。あなたの頭上に落とそうとしている。1億ドルで防空壕を売ってあげよう。あなたのすべてのデータにそれを走らせる必要がある。でも、我々があなたを顧客として選んだ場合だけだ」と言うのは、明らかに信じられないようなマーケティングです。

世界がこの技術を理解し、新しいアイデアを思いつく必要があるという私たちの信念と、これからやってくるこれらの新しい能力とのバランスをとる方法は、常に簡単ではありません。私たちは長い間、準備の枠組みの中にサイバーセキュリティを含めており、これをどうリリースするか、これらのモデルを信頼できるアクセスプログラムの手配にどう置くか、そしてより能力の高いモデルをすべての人にどう提供するかを把握するための緩和策を構築してきました。

しかし、リリースするには危険すぎるモデルについては、はるかに多くのレトリックが出てくるでしょう。また、異なる方法でリリースしなければならない非常に危険なモデルも出てくるでしょう。しかし、グレッグが言ったように、ここでの目標はすべての人に恩恵をもたらすことでもあり、これをある意味でマーケティングしたくはないのですが、世界をこの旅に同行させることです。

「私たちはあなたにより強力な技術を提供します。それに伴う責任もあります。私たちは世界が成功するように可能な限り準備を手助けします。しかし、恐怖に基づくマーケティングはできる限り避けるように努めます」というように。

では、単刀直入にお聞きします。Mythosはただのマーケティングだと思いますか。

素晴らしいサイバーセキュリティのモデルだと確信しています。繰り返しになりますが、私たちはこれについて長い間話してきました。私たちのモデルの中にもずっとありました。しかし、こう言う方法もあります。「これらのモデルはサイバー攻撃にずっと強くなる。私たちにはこの準備の枠組みのカテゴリがある。これらを世界にどうデプロイするかの計画はこうだ。この信頼できるアクセスプログラムはこんな感じだ。私たちがモデルに適用する緩和策はこれだ」と。

Anthropicは、彼らの準備の枠組みのカテゴリの一つとしてそれを持っていなかったと思います。ですからMythosはサイバーセキュリティにとって素晴らしいモデルだと確信していますが、私たちはこの種の能力を世界にどう送り出すかについて、自分たちが納得できる計画を持っています。

業界内の対立と今後の展望

国防総省を巡るAnthropicの件が起きていた時、私の見解では、デイビッド・サックスやイーロンと長いつながりを持つ人々が圧力をかけ、そうしたことを起こさせ、政府にそれに焦点を当てさせようとしているように見えました。あなた方はその後すぐに介入し、より好意的な独自の発表を行いました。

イーロンは当然、あなた方に対しても攻撃的です。これらの一部は私にとって滑稽に思えます。なぜなら、あなた方とAnthropicが実は反対側にいて、イーロンや、私の理解ではザックまでもがある程度、こちら側の事態に圧力をかけているという世界があるからです。Anthropicはその件で公平に扱われたと感じましたか。

いいえ。そこでは多くの悪い振る舞いがあったと思いますが、Anthropicが公平に扱われたとは思いません。

もう少し詳しく説明してもらえますか。何が特に間違っていたと目立ったのでしょうか。

その後に起きたこと、つまりこれらのモデルが明らかに国家安全保障の利益に関わるサイバーセキュリティの閾値に達したことを見ると、少し違った色合いを帯びてくるとは思います。しかし、国防生産法(DPA)の使用を脅かしたり、実際にサプライチェーンのリスク指定を使ったりすること、これは私たちの政府と私たちのAIの取り組みが持つべき関係ではないと思います。

私たちはアメリカ政府を支援することを本当に大切にしています。モデルが有能になるにつれて、それはますます重要になるでしょう。研究所が「我々はこの超兵器を持っている。ところで、国の防衛を助けるためにあなた方と協力するつもりはない」と言うのは良い姿勢だとは全く思いません。

しかし同時に、政府がこうした問題をメディアで戦わせたり、政府が持つ大きなハンマー(権力)をごく稀にしか使ってはいけない場面で使ったりするのも良いことだとは思いません。OpenAIについて言えることは、私たちは一般的に穏健で中道で、合理的であろうと努めているということです。それが私たちがアメリカ政府に対してここでやろうとしてきたことです。

しかし、主要なAIの取り組みがアメリカ政府を支援しないという良い未来は全く見えません。もし私たちが言っていることすべてが正しく、モデルがどこに向かうかについて私たちが言っていることを信じるなら、それは私が確かに信じていることですが、政府は私たちの助けを必要としており、私たちがそれを提供できることを光栄に思います。

私がテクノロジーの記者になりたての頃、テクノロジーについて初めて書き始めた頃の最大の戦争は、基本的にはマイクロソフト対その他のすべて、というものでした。彼らは巨大で邪悪なプロプライエタリ・ソフトウェア企業であり、オープンソース企業が対抗していました。ネットスケープのマーク・アンドリーセンもいました。

物事はメディアを通じて展開され、あちこちで少し辛辣な言葉が飛び交いましたが、人々はそれぞれ哲学的、宗教的な陣営を持っていました。しかし、現在の私たちがいるAIの世界で起きていることは狂気です。

これの多くが、あなた、イーロン、ザック、ダリオ、デミスといった人々の性格や、様々な敵意、世界観に結びついているように見えます。あなたはこれのシェイクスピア的なドラマについて書きましたね。私たちは一体どうやってこれを乗り越えられるのでしょうか。あなた方は皆とても……抜け出す道が見えません。そして先ほど触れたように、これから訴訟が来て、事態はさらに……。

ステージ上で手をつなぐことはないでしょうね。

残念ながら、そうです。関わっている一部の人たちは、自分たちだけが正しくやり遂げられると信じています。ステークホルダーが無限であると考えているため、そして様々な理由から、他の誰にも正しくできるとは思っていないか、あるいは他の誰かにやらせたくないため、それが非常に有害な行動につながっていると思います。

他人の行動をコントロールすることはできません。しかし、私たちはこれを、人類が共に正しくやり遂げなければならない共同プロジェクトとして行うことを主張し続けます。一人の人間や一つのイデオロギーが勝つか負けるか、単独での勝利を得るかといったことであるべきではありません。

これに触れないわけにはいきませんし、非常にデリケートな問題だと分かっていますが、続けてください。つまり、先週あなた個人に起こったことを見ると、技術の進歩を本当に望まない派閥がより過激になった時に何が起こるかについて書かれたSF小説がたくさんあります。

これがその境界線に達しているという議論もあるかもしれません。

ええ、止めたがっている人たちと一緒に。

ええ。何年も前にリチャード・クラークの本を読みましたが、そこではビル・ジョイのような人物がAIは実現してはならないと決意し、データセンターを破壊して回ります。こうした話は昔からありました。しかし、事態がこれ以上どうやってエスカレートし得るのか分かりません。良くなっているようには見えません。

上がったり下がったりはするでしょうが、方向的にはより高まっていくでしょうね。

あなたが書いたように、これは明らかに恐ろしいことのはずです。

ええ。ここで何か深いことが言えるとは思いません。あれはクレイジーな目覚め方でした。最初の日はそのショックとアドレナリンの中で、ただロジスティクスを把握しようとしていました。そして翌日には、「こういうことはもっと起こるだろうし、それは信じられないほど落胆させられることだ」と感じていました。

本当に鬱屈としたサイクルを経験しました。しかし、それは非常に恐ろしいことですし、特に深いことを言うつもりはありません。破滅主義的な(ドゥーマリズムの)議論は助けにならなかったと思います。特定の他の研究所が私たちについて語る方法も助けになりませんでした。本当はどちらかの側につきたくはないのですが、AnthropicがOpenAIについて語る方法は助けにならないと思います。

そして、いつか冷静な時期が訪れることを願っています。

一つだけ言っておきたいことがあります。「他人の行動はコントロールできないが、自分自身はコントロールできる」という点についてです。私がただただ感銘を受け、サムに驚かされたのは、この時期を通じて、まさにその日も、彼を絶対に必要とするような仕事をしていたことです。彼はただ使命に向かって押し進み続けています。それは私が決して当たり前だとは思っていないことです。サムに体現されている回復力の度合いは極限的であり、非常に過小評価されていると思います。

私も同じものを見てきました。人々は「あなたは気楽にやっている」とか何とか言うかもしれませんが。分かりませんが、私は過去3年間、これほど劇的なビジネスや個人的な……。

メディアの語り口はかなり劇的でしたからね。

人々は同情しないでしょう。「あなたは……」と。

同情しないなら、それで結構です。私の家でこの事件が起こる前夜、夕食に何人か招いていました。職場の同僚たちで、次の段階について話していました。彼らは「メディアであなたにとって過酷な時期でしたね。でもある意味では良かったのかもしれません」と言いました。私は「まあ、少なくとも誰も私を殺そうとはしなかったからね」と答えました。

あなたは前夜にそう言っていたんですね。

ええ。しかし、それは物事を本当に視点を与えてくれました。人々は言いたいだけ意地悪なことを言えます。意地悪なことを言っているだけなら、実際には大したことではありません。ただ進み続けるだけです。

あなたはいつも、ナパに引退するのが夢だと言っていましたね。それなら、なぜそうしないのですか。

まだやるべき仕事がたくさんありますからね。

でも、誰かがAGIに到達するのは明らかです。現在、合理的にそれを成し遂げられそうな会社が5社ほどあります。

どの会社に一番最初に行き着いてほしいか、ということですか。それが結局のところですか。

いいえ。なぜなら、欠けているのは、この技術が人々のために何ができるかを人々が本当に理解するのをどう助けるかという点だからです。それはどの会社も貢献できることだと思います。それは私たちが持っている視点であり、このポッドキャストでもたくさん話してきました。根本的に、この技術を創造しようとしているすべての人々の責任であり、その恩恵と人々がなぜそれを望むべきかを示すことでもあると思います。

なぜ人々はこの技術を創造する能力を保護し、守るべきなのか。なぜアメリカはここでリーダーシップを持つ必要があるのか。なぜこれらすべてが、国のためだけでなく、あなた個人の未来、あなたの子供たちの未来にとって良いことなのか。それは私たちが毎日目覚めたときに考えていることです。大げさな表現ではないと思います。私たちが常に話し合っていることです。

私たちの会社の奇妙で創造的な法構造についてもそうです。私たちがとても重要だと信じているこの使命、この目標のためにそれを解決しようとして、これまで何度もそうしてきました。もし他の人たちがそれに貢献したいなら、大歓迎です。それは私たち全員がやるべきことですが、私たちをユニークに駆り立てているものです。

すべての人に繁栄をもたらす技術を提供できれば、人々により多くの主体性を与えることができれば、浮き沈みはあっても、より良い世界につながると私たちは強く信じています。この分野で働くすべての人がそう信じているとは思いませんが、そう信じる人なら誰とでも一緒に働きたいと心から思っています。そしてそれが、私たちが世界を向かわせたい使命なのです。

少し戻りますが……。

時間はあと数問分くらいでしょうか。

ええ。どうしても聞きたい質問はありますか。

急いで答えますよ。ええ、実は今から聞こうとしている質問で終わりたいと思っています。だからこれを選びますね。

分かりました。準備はいいですか。

つまり、今回の裁判をどれほど実存的なものだと見ていますか。

実際、これは私たちの物語を語る絶好の機会だと思っています。なぜなら、OpenAIの歴史を見ると、分裂があった時、私たちは本当に他方に物語を語らせてきました。私たちは「いや、本当はそういうことじゃないんだ。真実を話そう」と言うことをできるだけ避けてきました。しかし今回は、ついに選択の余地がありません。自分たちを防御し、真実を語り、何が起きたのかを話さなければならないからです。

私は非常に誇りに思っています。歴史を振り返り、さまざまなメッセージを見返すことに多くの時間を費やしてきました。もちろん、都合よく切り取って「ほら、お前はこんなことを言っていたじゃないか」と言おうとすることは常にあります。

あなたの日記は有名ですからね。

ええ、分かっています。しかし、それは非常に個人的な文書であり、これほど個人的なものを奪われ、武器として使われようとすることは極めて苦痛です。しかし、それらの特定の文は、反対派が見つけられる最悪のものという程度です。「本当に?」という感じです。そして重要なのは、それらはすべて文脈から切り離されているということです。

「ねえ、私たちはこの交渉の真っ只中にいるんだ」という質問です。OpenAIが前進する唯一の道は営利目的であることに、私たちは皆同意していました。サム、イリヤ、グレッグ、イーロン、全員がこれに同意していました。「これがやらなければならないことだ。使命のためにまさに必要なことだ」と全員が言いました。

そして今、あなたはこの狂ったような交渉の中にいます。イーロンは「過半数の株式が必要だ。CEOになる必要がある。完全なコントロールが必要だ」と言います。私たちはそこまで歩み寄りました。「分かった。対等なパートナーにはならない。あなたがそれだけ大量の株式を必要とし、関わりたいと言うなら、そこまで譲歩できる。いいだろう。サムがCEOになる。いや、イーロンがCEOになる。彼が責任者だと皆が分かるようにそれが必要なんだ。いいだろう。でも、完全なコントロールだ。OpenAIに対する絶対的なコントロールだ。たとえ『将来は希薄化させる、手放す』と言ったとしても」と。

そしてあなたは考えます。私たちの使命は何なのか。私たちは本当に自分たちの使命を信じているのか。この技術がすべての人に恩恵をもたらすことを望んでいるという絵図を本当に大切にしているのか。全未来をコントロールする一人の人間が存在するべきではありません。その人物が誰であろうと関係ありません。

それが限界点でした。それが私たちに「ノー」と言わせた原因です。私たちは何年もの間、その物語を語ることはありませんでしたが、今こそ語ります。ですから、私たちを真に動かしているものは何か、私たちが真に何を支持しているのかを人々に理解してもらう絶好の機会だと思っています。

彼がこんなことをしているのは正気の沙汰ではないと思いますが、現時点での私の恐れは、彼が裁判の直前に訴訟を取り下げる決断をして、私たちがこれらすべてを語れなくなることです。しかし、私は喜んでこのすべてを世界に説明し、この章を過去のものにしたいと思っています。

なるほど。では私の質問ですが、このポッドキャストの最初に戻るような内容です。この物語について話していましたが、私はAIの記者として、「私たちは皆死ぬ」「仕事を失う」という話を聞いて育ってきたように感じます。何度も何度もそう聞いてきました。そして今、あなたの個人的なノートの一部が公開されています。後知恵になりますが、今ならこれをどのように違った形で語っていたと思いますか。

そうですね、私たちが今日考えている方法は、ある意味で私たちが語っていたらよかったと思う方法ですが、当時の知識でそれができたかどうかは分かりません。

例えば、技術そのものに関連することもあります。2017年、2018年当時、私たちは競争的なマルチエージェント・シミュレーションを通じてAGIを構築するという図を描いていました。1000のエージェントがいる島があり、すべてが生き残り、複製するための戦いの中にいると想像してください。もしそこに大量のコンピューティング資源を投入すれば、もしかすると非常に賢いものが構築されるかもしれない、と考えたのです。

しかし、その賢いものは人間の価値観とは全く結びついていません。そもそもこの存在とどうやって話をするのかを見つけ出す、別のステップが必要になります。現実世界で全く育っておらず、言語の概念を持たず、私たちの現実と何のつながりもありません。ただ賢くて強力なだけです。それは非常に恐ろしいシステムですよね。どうすればそれをアライメント(価値観の調整)できるか、というところから考え始めなければなりません。

しかし代わりに、私たちは人間の価値観に根ざし、人間を理解することに根ざしたこの言語モデルのルートを持っています。実際に監視できる思考の連鎖を持っています。技術的な意味で正しくアプローチすれば、それを忠実なものにする道筋があり、AIの真の動機を純粋に表現させることができます。

私たちが話している結果に到達するために、まったく異なる技術的パスを持っていることに気づくでしょう。そして、それははるかに楽観的なものです。ですから、この技術が本当に何になるのか、どうやって作られるのか、どうやって役立つものにするのかについて、私たちが学ばなければならない技術的な教訓がありました。それは当時の私たちには評価できなかったことですが、今日では理解しています。

これは本当に魅力的な議論でした。お二人が揃って登場し、これを行ってくれたことに心から感謝します。私たちのささやかなポッドキャストですが、お二人がこの時間を割いてくれたことを光栄に思います。

広範囲にわたる話題をカバーしましたが、見出しとしては、「比較的短期間のうちに新しいモデルが」ということですね。

ええ。

「本当に良い新しいモデルが」と。

ええ。それでは、本当にありがとうございました。お越しいただき感謝します。すべての人に役立つ新しいモデルを。

ありがとうございました。

ありがとうございます。

Core Memoryポッドキャストは、私、アシュリー・バンスとカイリー・ロビンソン、または私たちの両方でお届けしています。プロデュースは私とデビッド・ニコルソン。テーマソングはジェームス・マーサーとジョン・ソートランド。番組の編集は常にジョン・ソートランドです。BrexとE1 Venturesの皆様、サポートをありがとうございます。

そして何より、視聴してくださっているすべての皆様に感謝します。愛しています。ぜひ「いいね」、レビュー、チャンネル登録をお願いします。すべて素晴らしいことです。ありがとうございました。またお会いしましょう。

コメント

タイトルとURLをコピーしました