OpenAIの共同創業者であるグレッグ・ブロックマンが、AI開発競争の最前線やサム・アルトマン解任騒動の舞台裏、そして人工知能がもたらす未来について語るインタビュー動画である。創業初期の苦労やDeepMindとの圧倒的なリソースの差をどう乗り越えたか、さらにAGIに向けたスケーリングと計算資源の重要性について深く掘り下げている。また、解任騒動時の社内の混乱と結束、彼自身が一時的に現場を離れて得た気づきなど、個人的な葛藤や成長についても赤裸々に明かされている。

- OpenAIの成り立ちと創業初期の舞台裏
- 圧倒的優位な競合と非営利組織の限界
- Dotaの成功とAIが推論する瞬間の訪れ
- 組織内の軋轢と技術的分断
- サム・アルトマン解任騒動の真実
- 従業員の結束とイリヤとの関係修復
- 現場離脱中の気づきとリーダーとしての成長
- 苦痛を伴う成長と真実と向き合う企業文化
- AIの自己進化とコーディングの未来
- AIの政治的偏向と長期的な目標へのアライメント
- グローバルなAI開発競争と国家戦略
- コンピューティング資源の圧倒的不足とデータセンターの価値
- 汎用人工知能(AGI)がもたらすエンタープライズと消費者の未来
- 反復的デプロイメントと安全性の確保
- AI規制のあり方とこれからの社会インフラ
- 若者が身につけるべきスキルとAIがもたらす未来の光と影
OpenAIの成り立ちと創業初期の舞台裏
OpenAIはどのようにして誕生したのですか。
私はスタートアップをやりたいと思っていました。それが自分のやるべきことだと感じていたからです。
でも、あなたはすでにスタートアップにいましたよね。Stripeもスタートアップでした。
確かにそうです。ただ、Stripeで解決しようとしていた問題は、私自身の問題ではないと感じていたのです。私が子供の頃から考え続けてきた問題ではありませんでした。それは重要な問題でしたし、数年間その使命に全身全霊を捧げましたが、私がいようといまいとStripeは成功するだろうと感じていました。そこで、自分の人生の残りの時間を費やしてでも、少しでも良い方向に物事が進むのを見届けたいと思えるような、真に自分が身を捧げたい使命とは何かを初めて真剣に考える時間を持ったのです。
私にとって、そのリストのトップにあるのがAIであることは非常に明確でした。AIが世界でどのように展開していくかに実際に変化をもたらすことができるなら、それは素晴らしい人生だと思えたのです。
Stripeを離れることを考えていた時、パトリックからサム・アルトマンに相談しに行くよう言われたそうですね。その時の会話はどうだったのですか。
パトリックは、サムは君のような状況にいる若者をたくさん見てきているからと言っていました。パトリックは本心では、サムが私を引き留めてくれることを期待していたのだと思います。しかしサムと数分話しただけで、彼はこう言いました。君はもうすでに決断しているね。それはとても明らかだよ。そして彼は、次に何をしようと考えているのかと尋ねてきました。
私は、AIの会社を立ち上げようと考えていると答えました。すると彼は、自分もAI分野で何かをやろうと考えているから、連絡を取り合おうと言ってくれたのです。その後、Stripeを辞める直前にもう一度サムと話す機会があり、彼はまだAIで何かをやろうと考えているかと聞いてきました。私がはいと答えると、彼もより詳細な計画を練り始めていて、7月にディナーを企画していると教えてくれました。そして私はそのディナーに参加するために飛行機で向かったのです。
そこで覚えている話題は、最高の研究者たちを集めて新しい研究所を立ち上げるには、もう遅すぎるのだろうか、それは可能なのだろうかというものでした。
それは何年のことですか。
2015年です。当時はGoogleのDeepMindがあらゆる研究者、資本、データを独占しているように感じられていましたから、今から新しいものを立ち上げることが果たして可能なのかという空気がありました。人々はそれが難しい理由をいくらでも思いつくことができました。
しかし、それが絶対に不可能だという理由を思いつく人は誰もいませんでした。その日の夜、サムと一緒に車で街へ戻る道すがら、お互いに顔を見合わせて、私たちはこれをやらなければならない、絶対にやるべきだと言い合ったのを覚えています。そして次の日から、私はこのプロジェクトを形にするためにフルタイムで動き始めました。
最初は非常に曖昧だったので大変でした。人間レベルのAIを構築し、それを世界にとってポジティブなものにし、その恩恵を広く行き渡らせるという使命とビジョンはありました。しかし、どうやって実際に人々に今の仕事を辞めさせて、このプロジェクトに参加してもらうのかが課題でした。
当初、私が候補として絞り込んだメンバーは、イリヤ・サツケヴァー、ダリオ・アモデイ、クリス・オラー、そして私自身でした。これがチームになる予定でした。私たちは多くの時間を共に過ごし、研究所の潜在的なビジョンや、物事がどのように機能するかについて話し合いました。しかし、このプロジェクトに十分な勢いがあるのかという疑問もあり、すぐにはまとまりませんでした。ダリオ・アモデイは自分自身の名前を確立する必要があると感じており、これが本当にその場所になるのか確信を持てていませんでした。すべてがどう機能するのかという疑問があったのです。
そんな中、私はジョン・シュルマンに関を持ってもらうようになり、彼は参加すると言ってくれました。しかしダリオ・アモデイとクリス・オラーは結局Google Brainに行くことを選びました。そのため、残ったのはイリヤ・サツケヴァーと私、そしてジョン・シュルマンの数人だけになってしまいました。
それでも、興味はあるけれど、他に誰が参加するのかと様子を見ている10人ほどのグループがいました。私はサムに、この膠着状態をどう打破すればいいのか、どうやって全員に参加を決断させるのかと相談しました。サムの提案は、全員をオフサイトミーティングに招待することでした。そこで私たちはナパで集まりを企画しました。私はその時のためにTシャツまで作りました。
それは彼らが正式に参加する前のことですか。
そうです。正式なオファーは一切なく、誰も参加していませんでした。組織の構造も何もなく、ただアイデアとビジョン、そして使命だけがありました。私たちは人々を飛行機で呼び寄せ、一緒にナパまで車で向かいました。それは本当に素晴らしい一日でした。次々とアイデアが溢れ出てきました。
そこで私たちが思いついたのは、過去10年間にわたって追求してきた技術的な計画そのものと言えるものでした。1つ目は強化学習を解決すること。2つ目は教師なし学習を解決すること。そして3つ目は、徐々により複雑なものを学習していくことでした。
そのオフサイトの後、私は全員にオファーを送り、2、3週間以内に始めたいので、参加するかどうか教えてほしいと伝えました。
圧倒的優位な競合と非営利組織の限界
なぜ当時、DeepMindがそれほどまでに圧倒的な優位性を持っていると思っていたのですか。
当時のGoogleのDeepMindは、この分野において本当に圧倒的な存在でした。彼らは豊富な資金と確かな実績を持っていました。これはAlphaGoが登場する前の話です。AlphaGoはその数ヶ月後に発表されましたが、それは驚くことではありませんでした。明らかに彼らに勢いがあったからです。そのため、独立して新しいものを構築することが本当に可能なのかどうか、決して自明ではありませんでした。
非営利という形ではうまくいかないと気づいたのはいつですか。
2017年になって、私たちはどうすれば本当に使命を達成できるのか、どうすれば実際にAGIを構築できるのか、そしてそれがどのような形になるのかについて真剣に考え始めました。そこでコンピューティングリソースの計算を始めました。
すると、途方もない計算能力が必要になることに気づいたのです。私たちはCerebrasという、独自のコンピューティングハードウェアを構築している会社に出会いました。彼らが約束するようなコンピューターがあれば、私たちの計算能力ははるかに進歩すると気づきました。もし私たちがそうしたコンピューターを大量に購入できれば、AGIの構築に成功する可能性が高まる。もしCerebrasへの独占的なアクセスを得られれば、圧倒的な優位に立てる。大規模なデータセンターを購入できれば、それも独自の強みになるかもしれないと考えたのです。
しかし、非営利団体の資金調達には事実上の限界があります。そこでイーロン・マスク、サム・アルトマン、イリヤ・サツケヴァー、そして私は、OpenAIにとって前に進む唯一の道、使命を達成するための唯一の道は、OpenAIに関連する何らかの形の営利体を作る事だという意見で一致しました。私たちはその方向へ進むことを決意し、それが使命を達成する唯一の方法だと確信していました。
Dotaの成功とAIが推論する瞬間の訪れ
すべてがあなたにとって変わると確信した瞬間はいつでしたか。それはDotaの時ですか、それともその前後ですか。
OpenAIでの歩みは、これがついに現実になったと実感する瞬間の連続です。完全に理解した、すべてを把握したと思うたびに、まだ気づいていなかった新しい地平が広がっていることに気づかされるのです。
その過程で、最初の立ち上げの瞬間がありました。チームが集まり、これでついに使命を追求できると思いました。しかし、次の日にオフィスに出社して、さて何をしようかとなりました。私たちにはホワイトボードすらありませんでした。ジョン・シュルマンがホワイトボードに何かを書きたいと言ったので、私がホワイトボードを買いに行きました。それが私にできることでした。
Dotaでは、最初の大きな成果を上げました。本気で取り組めば本当に何かを達成できるのだと実感しました。すべての計算能力が結集していくのを目の当たりにし、計算能力をスケールさせれば、結果もスケールするということがわかりました。
GPTシリーズでも何度かそうした瞬間がありました。初期の段階で覚えているのは、教師なし感情ニューロンの論文の時です。その論文については聞いたことがありますか。
聞いたことはありますが、読んだことはありません。
あれはとても興味深い論文です。2017年のことで、言語モデリングの目的で学習させることで、初めて意味論的な理解が生まれるのを見た時でした。次の文字を予測するように学習させると、突然、ニューラルネットワークが感情を理解し、何かがポジティブかネガティブかを理解するようになるのです。
口で言うほど簡単なことではありませんが、その瞬間、私たちは単にカンマや名詞、動詞の場所を把握するだけでなく、文章の意味を本当に学習できる機械を作っているのだと気づきました。これはもっと推し進めなければならないと感じました。
そしてもちろん、GPT-4のようなものを見た時もそうです。私たちがGPT-4で遊んでいた時、誰かがなぜこれはAGIではないのかと尋ねたのを覚えています。実際、その違いを正確に指摘するのは非常に難しいことでした。なぜなら、どんなことでも流暢に会話できるからです。明らかにAGIではありませんし、何かが欠けてはいたのですが、もし2ヶ月前にAGIの基準を尋ねられていたら、おそらくGPT-4はその基準を満たしていたでしょう。
ですから、これが現実になった、本当に起こるのだと感じる瞬間がその過程で何度もあったのです。経済全体がこのコンピューティング主導の世界へと変貌していくのだと。そして、そうしたブレイクスルーの瞬間はまだ終わっていないと思います。次の段階が可能だと気づかされる瞬間が、これからもたくさん待っているはずです。
Dotaは信じられないような瞬間だったと思います。Deep Blueのようなチェスでもなく、AlphaGoのような計算集約的でルールの決まったものでもありませんでした。世界はある程度構造化されているものの自由度が高い環境で、実際に人間とインタラクティブに対戦するものだったからです。
ええ、そこには非常に魅力的なものがありました。皮肉なことに、私たちは最初Dotaを通じて新しい手法を開発しようとしていました。当時の強化学習アルゴリズムでは到底スケールしないことが明らかだったからです。PPOと呼ばれる私たちが使っていたアルゴリズムは、毎回のタイムステップごとに計画を立てます。階層性というものがありません。人間はそんな風に一日の計画を立てたりはしません。
ですから、このアルゴリズムは非常に欠陥があり、絶対にスケールせず、多くの問題を抱えていることは分かっていました。しかし、どこかから始めなければなりません。自分たちの持っているもので到達できる限界の壁にぶつかるまで、ベースラインを押し上げる必要があります。そうすることで初めて、新しいアルゴリズムを導入することができるのです。
私たちはただひたすらPPOをスケールさせ続け、ついに最高レベルの人間のパフォーマンスを超えました。それ自体が大発見でした。圧倒的な計算能力とシンプルなアルゴリズムがあれば、理論上だけでなく実際にも機能するのだと。プログラムすることも、先読みすることも、検索することもできないこの極めて複雑な環境で、私たちが本当にそれを実現できるのだと証明したのです。
そこでは、ほぼ人間のような直感が必要とされます。ちなみに、私たちが使用したニューラルネットワークは、本物の昆虫の脳と同じくらいのシナプス数しか持たない、ごくごく小さなものでした。そこで私たちは考えました。もし同じ計算アプローチを、人間の脳の規模にまでスケールアップさせたらどうなるだろうかと。それは非常に興味深い問いでした。
推論することと予測することの間に違いはありますか。次の文字や次の単語を予測することと、第一原理から実際に推論することの違いについて言及されていましたが。
それらは深い部分で繋がっていると思います。次に何が来るかを予測するというのは、一見すると平凡なタスクに聞こえますが、もしアインシュタインの口から次に出る言葉を本当に予測できるなら、そのシステムは少なくともアインシュタインと同じくらい賢いと言えます。
それは違うと反論する人もいるでしょうが、私はそうした反論は的を射ていないと思います。予測の真の目的は、すでに知られていることを当てられることではありません。見たこともない新しい状況に置かれた時に、次に何が起こるかを予測できることに意味があるのです。
知能と予測の間には深い繋がりがあり、学術的な文献でも長年にわたってこの圧縮という概念について議論されてきました。これらはすべて本質的に同じものの一部なのです。現在私たちが目にしている推論モデルについて非常に興味深いのは、私たちがそれらを強化学習で訓練しているという点です。
これはOpenAIの当初の計画に戻るのですが、2つのステップがあります。1つ目は教師なし学習です。次に何が来るかを予測させるだけでモデルを訓練します。ここではデータはより静的で、より観察的なものです。モデルにとっては初めて見るデータや状況ですが、すでに起こった出来事のデータです。
次に強化学習を行います。ここではAIに独自のデータで学習させます。AI自身に私が取るべき行動はこれだと決定させ、世界からの観察結果を得て、そこから学習します。そしてここでも、実際に訓練する方法は予測なのです。
この行動をとったら何が起こる可能性が高いかを予測しようとし、その結果がどれだけ良かったかに応じてそれを強化します。このアプローチの素晴らしい点は、背景知識と現実世界での経験を併せ持つAIができあがることです。しかし根本的には、教師なし学習の段階と強化学習の段階で使用する技術は全く同じです。ただ予測しているだけなのですが、データの構造を変えているのです。
組織内の軋轢と技術的分断
事態が緊迫し始めたのはいつ頃ですか。
OpenAIについて言えることは、使命を本当に信じていて、人間の知能レベルの機械を作り出せる可能性を本当に信じているなら、常に非常に高いプレッシャーを感じることになるということです。誰が意思決定を行うのか、その決定にどのような価値観が反映されるのかといった、普通の会社なら社内政治のようなありふれた問題が、実存的な重みを持つようになります。
それがOpenAIの文化や、よく知られている対立に大きな影響を与えてきました。例えば、特定の成果に対して誰がクレジットを得るかというだけの問題が、突然、実存的な重みを持つようになるのです。
私が考えていたのはその点です。ある時点で、このテクノロジーが不可避であり、世界を変えることになるだろうと気づいたはずです。当時はまだ世界に広く知られてはいませんでしたが、自分が中心に立ってこの功績を自分のものにしたいと考える人が出てきてもおかしくありません。
ええ、まさにそれが、私がこの分野で観察してきた圧倒的な力学です。OpenAIに限った話ではありません。私が初期の頃に観察したことの1つは、このテクノロジーは本質的に非常に断片化しやすい性質を持っているということです。強い圧力がかかった時、ダイヤモンドができることもあれば、ひび割れてしまうこともあります。
しばしば、小さなグループの中でダイヤモンドが形成されるのを目にします。互いに強い信頼関係で結ばれ、どう協力すべきかを知っているチームです。しかし時折、彼らが分裂し、独自の道を進んでいくのを見ることがあります。AIの分野において、アプローチの多様性や、互いに切磋琢磨する異なるグループの存在は、実際には大きな恩恵をもたらしてきたと思います。
このテクノロジーをより有益な形で提供するために、安全性に関する厄介な問題、安全であるとはどういうことか、このテクノロジーを展開するとはどういうことか、リスクをどう軽減するか、そして同時にその恩恵をどう最大化するかといったことについて、非常に健全な議論が行われています。それはOpenAIの壁の内側でも常に議論されてきました。
そして今、それが世界中で実際に起こり始めていると思います。これは社会として私たちが本当に恩恵を受けられる状況だと考えています。
サム・アルトマン解任騒動の真実
サムが解任されたと知った時の状況を教えてください。どこにいましたか。
家にいました。
何が起きたのですか。
ビデオ通話をしてもいいかというテキストメッセージを受け取りました。そこでビデオ通話に参加すると、サムを除く取締役会のメンバーがそこにいることに気づきました。
あの時点ではあなたも取締役会にいましたよね。
はい、そうです。
それで何が起きたのですか。何か異変には気づいていましたか。
何かあるなとは推測していましたが。
取締役会がサムの解任を決定したと告げられました。実質的に私が受け取ったメッセージは、後で一般に公開されたものと同じ内容でした。
私はさらに詳しい情報を教えてもらえないか尋ねましたが、今はダメだと言われました。また別の機会にならと食い下がりましたが、これ以上共有できる情報はないと再び言われました。そして、待ってほしい、まだあると言われたのです。私も取締役会から外されることになったが、会社や使命にとって私が非常に重要なので、会社には留まってほしいと。
私はもう一度、理由やフィードバックをもらえないかと尋ねましたが、答えはノーでした。最後には、この新しい体制の下で、いつかフィードバックを得られるようになることを願っていると言われました。それがその時の会話でした。
その時、頭の中を何が駆け巡りましたか。
ただ、これは間違っていると思いました。
怒りを感じましたか。
いいえ、何が起きたのかは理解できたと感じていました。
これが引き起こされた実際の理由を知るまでにどれくらいの時間がかかりましたか。
その答えには2つの側面があります。1つは、今でも誰かの頭の中にあった新しい事実や事情を少しずつ学んでいるような気がしているということです。ある意味では、コミュニケーション不足に起因するものだと言えます。自分が受け止めていた様々な事柄があったことに気づかされました。
ただ、ある程度おおよそのことは分かっていた気がします。ここにいるすべての人について、なぜ彼らがそのような行動をとったのか、かなり正確なモデルを自分の中で持っていました。しかし、その瞬間において私にとって最も重要だったのはそこではありませんでした。ただ、これが間違っているということだけは確信していました。通話を切った直後、私は妻と話し、辞めなければならないと言いました。彼女も同意してくれました。
従業員の結束とイリヤとの関係修復
そしてその日のうちに辞任したのですね。
はい。
その後どうなったのですか。
私が辞任したその日、たくさんのメッセージが届き始めました。あなたとサムが次に何をするのかは分からないけれど、私も一緒に行きたい、あなたたちと一緒に何か新しいことを始めたいと言ってくれる人たちがいたのです。あのようなサポートや思いやりの言葉をいただけるとは全く予想していなかったので、本当に心から驚きました。
その日、私の親しい協力者であるヤコブ、シモン、アレクサンダーなど数名も辞任しました。彼らとサム、そして私で集まり、新しい会社がどのようなものになり得るかを話し合い始めました。
最初の日は、会社を取り戻せる可能性は10%くらいだろうと感じていたのを覚えています。たった10%です。翌日、サムの家でミーティングを開きました。会社の多くの人が立ち寄り、私たちが描いていたビジョンを見せました。まだ1日しか経っていませんでしたが、プロジェクトをどう運営していくかという新鮮なビジョンがありました。
その週末、私たちは多くの時間を費やして取締役会や会社と交渉し、筋の通る形で再び一つになる道はないか模索しました。その日曜日の夜、取締役会は暫定CEOとしての私を新しい人物に置き換えました。すると会社全体が反発したのです。
私たちはオフィスにいて、復帰の合意に近いと考えていました。道はあると思っていたところに、取締役会がその変更を行ったのです。すると突然、全員が建物から流れ出し、まさに本物の大混乱となりました。
私は、この新しい会社に来ることに興味を持っていた多くの人たちとビデオ通話をしていて、大丈夫だ、私たちには計画があると言っていました。最初にごく少数の人たちのために用意していた小さな救命ボートを広げ始めたのです。すると突然、今の会社に残りたいと思う人が誰もいなくなりました。誰もが自分が正しいと信じるもののために立ち上がりたかったのです。
サムはサティア・ナデラと話をしていました。この新しい試みの支援者になってくれないかと相談していたのです。私は、この小さな救命ボートをさらに広げて、全員を乗せることはできないかと尋ねました。そして、よし、どうにかして方法を見つけようということになりました。
その日はちょうど感謝祭の直前で、多くの人が実家などへ帰省する飛行機に乗る予定でした。しかし彼らはフライトをキャンセルし、オフィスは人で溢れ返りました。誰もがただそこにいて、その場の一部になりたかったのです。たとえ話し合いに直接貢献できなくても、この歴史が作られる瞬間に立ち会いたいと願っていました。
そして署名活動が始まりました。あまりに多くの人が一度に署名しようとしたため、Googleドキュメントがクラッシュしてしまったほどです。そのため、複数の人が同時に編集しないよう、文書に名前を書き込む担当者を数名指定しなければなりませんでした。それは非常に強力なメッセージになったと思います。
その日、私は午前5時頃に家に帰り、眠りにつきました。そして45分後くらいに目が覚めてTwitterを見ると、イリヤ・サツケヴァーが投稿し、署名に参加しているのを見ました。会社が再び一つになることを望んでいると書かれていました。その瞬間、本当に深い安堵を感じました。深い感謝の念が湧き上がり、よし、これでもう一度立て直せる、正しい軌道に戻ることができると感じたのです。
あなたとイリヤ・サツケヴァーはこれを一緒に作り上げてきました。その後、彼との関係を修復していくのはどのような感じでしたか。
大変でした。間違いなく非常に親密な関係でしたから。彼は私の結婚式で立会人を務めてくれましたし、私たちは本当に困難な時期を一緒に乗り越えてきました。どんな関係でもそうであるように、山あり谷ありです。その後、私たちはお互いの間に行き違いになっていたことや、言葉にしていなかったことを話し合い、理解し、明確にするために多くの時間を費やしました。
そのプロセスを経て、私たちは本当に良い状態に到達できたと思います。私としては、起こったことすべてに対してしっかりと決着をつけることができたと感じています。
あなたが人々の忠誠心を呼び起こしたことについて、どう感じていますか。
深く感謝しています。本当に、私が求めたものではありませんし、予想もしていなかったことです。私のやり方は、最前線で泥臭く先頭に立って引っ張っていくというものです。そうしていると、つい感情的になってしまうこともありますし、後ろを振り返って全員がついてきているか確認するのを忘れて、ただひたすら突っ走ってしまうこともあります。
だからこそ、人々がついてきてくれて、このプロジェクトを構築するのを助けてくれると、心から感謝の気持ちでいっぱいになります。彼らはあらゆる面で私の期待をはるかに超えてくれました。
そして最終的に全員が戻ってきたのですね。
でも、それは決して保証されたものではありませんでした。その週末中、あらゆる競合他社が周囲をうろついていたからです。想像してみてください。人々を引き抜こうとするすさまじい争奪戦です。皆オファーを受けていましたが、その週末を通して私たちはただの一人も失いませんでした。競合他社からのオファーを受け入れた人は一人もいなかったのです。
それは信じられないことですね。ビル・ベリチック監督と最高のチームについて話していた時、彼はこう言いました。最高のチームは金のためではなく、隣にいる仲間のためにプレーするのだと。皆が辞任したという話を聞いて、まさにそのことを思い出しました。誰一人として、おそらくもっと好条件だったであろうオファーのために去らなかったのですね。皆が引き抜こうと狙っていたにも関わらず。
ええ、あれは本当にダイヤモンドが形成された瞬間でした。
現場離脱中の気づきとリーダーとしての成長
この騒動の後、あなたは少し休みをとりましたね。その間、あなたの中ではどのような変化がありましたか。
一連の騒動は経験するのも強烈でしたし、戻ってくるのも強烈な経験でした。正直なところ、OpenAIでの最も辛い瞬間の一つは、イリヤ・サツケヴァーが去った時でした。おそらくそれが、OpenAIの歴史の中で唯一、もう続けたくないと感じた瞬間でした。
自分がなぜこれをやっているのか、なぜこれがそれほど重要なのか、なぜこれほどの苦痛に耐える価値があるのかを思い出すための時間が必要だったのだと思います。
休み中は何をしていたのですか。
DNAシーケンスで言語モデルの学習を行っていました。
そこで言語モデルの学習方法を学んだのですね。ブログで自己学習をしたと読みましたが。
いや、実はOpenAIの過程でもずっと学習の実行はやっていました。今回はDNAシーケンスで言語モデルを学習させたのです。
それはすごいですね。
ええ、ARC Instituteのためにその作業を行いました。それはとても素晴らしい経験でした。自分の持っているスキルを全く異なる領域に応用することができたからです。それは私にとっても妻にとっても個人的に非常に意味のある領域でした。彼女は多くの健康問題を抱えており、AIが彼女の健康や動物の健康のために何ができるのかを私たちはずっと考えてきました。
私たちがこれまで追求してきたテクノロジーとは全く異なる方法で役立てるかもしれないと感じたのです。ですから、それはこの経験の中で非常にポジティブな部分でした。
もしGoogleドキュメントを開いて、サムの解任からあなたが辞任し、人々の忠誠心を呼び起こし、休みをとって戻ってくるまでの一連の出来事から学んだことを1ページにまとめるとしたら、何と書きますか。
価値ある目標のためなら、ただ前進し続けることを学んだと書くでしょう。重要な使命があるなら、浮き沈みがあっても進み続けるべきです。もうすべてが終わったと思う瞬間もあれば、完全に復活したと思う瞬間もあります。そうした瞬間に流されて、本来の軌道から外れてはいけません。
そして、こうした時期には個人的な回復力を大きく成長させなければなりません。リーダーとして立っているなら、人々はその安定感やサポート、全体が向かうべき方向性をあなたに求めているからです。
私が成長しようと努めてきたことの多くは、私たちがやっていることの詳細や、ある選択がもたらす影響を深く理解することと同時に、決断力を持つということです。
これまでのOpenAIでの歩みの中で、不確実性のレンズを通してアプローチしてきた瞬間がたくさんありました。何が正しい答えなのか、このテクノロジーを構築する正しい方法は何なのか、これらの非常に厄介な質問にどう答えるべきか分からないと感じることがありました。しかし社内には非常に賢く、強い意見を持った人々がたくさんいます。ですから、すべての意見を理解し、それらをどうまとめるかを常に考えてきました。
それが正しいこともあります。しかし時には、意見が互いに矛盾していて、すべてを同時に満たすことはできないと気づくこともあります。その時は、どちらかを選ばなければなりません。誰かが怒ったり、辞めたり、軽視されたと感じたりすることが避けられないと分かっていてもです。
私が努めてきたのは、より強い自己意識を持ち、行動を起こすべきだという確信がある時には、それに従って行動する感覚を研ぎ澄ますことです。OpenAIの歴史を振り返って、違うやり方をすればよかったと思うことがありますが、それは大抵の場合、何かが間違っていると分かっていたのに決断を先延ばしにしてしまった時です。
この役割にはこの人は適していない、この技術的な方向性は少し違う、このプロジェクトの進め方ではうまくいかないと分かっていたのに、長く待ちすぎたのです。ですから、そうした経験から学び、毎日少しでも成長しようと努めています。
OpenAIやStripeでの経験、さらに大学時代や過去のプロジェクトまで振り返ってみると、私は日々の実務が本当に好きなのだと気づきます。個人としての貢献、ソフトウェアを書くこと、問題について思考を巡らせることなどです。しかし同時に、そうした作業が行われる環境にも非常に強い関心を持っています。
私は、ソフトウェアを作り上げるというその場ですぐに得られるタイプ1の楽しさを犠牲にしてでも、その瞬間は苦痛でも後から振り返ると価値があるタイプ2の楽しさを選びたいと考えています。それは、他の全員がその素晴らしい作業に没頭できるような環境を作り上げるということです。環境づくりは常に私が惹かれる分野ですが、決して簡単なことではありません。個人的に大きな苦痛を伴うことを厭わない覚悟が必要です。
イリヤ・サツケヴァーの言葉を借りれば、常に苦しまなければならないのです。苦しんでいないなら、価値を創造していないということです。そこには深い真理があると思います。
苦痛を伴う成長と真実と向き合う企業文化
その点についてもう少し詳しく聞かせてください。
イリヤ・サツケヴァーの視点についてですね。彼には独特の話し方があって、彼が選ぶ言葉には常に深いインスピレーションがあります。この苦しみという表現は、OpenAIの歴史を通じて私たちが常に考えてきたことです。
私たちは最初から、あまりにも多くの不確実性を抱えていました。これは本当に機能するのか。機能しない理由、機能すべきでない理由、不可能だと言える理由は山ほどありました。どうやって人を集めるのか、どう技術を追求するのか、どう資金を調達するのか、どうモチベーションを維持するのか、どう正しい決断を下すのか。これらのすべてが極めて困難で不確実でした。
問題をカーペットの下に掃き隠して、ただ盲目的に進むのは簡単です。それがいわゆるシリコンバレーの文化の負の側面、少なくともそういう認識を持たれている部分だと思います。ただ盲目に物事を進め、現実歪曲フィールドのようなものでどうにかするというような。
しかし、AIにおいてはそれは通用しませんし、OpenAIにとっても機能しないと思います。私たちがこれまでそのように運営してきたことは一度もありません。私たちのやり方は常に、厳しい真実と向き合い、科学や現実をあるがままに理解することでした。それが、私たちが問題を違った角度から考え、これまで成功を収めてきた要因だと思います。
初期の頃でさえ、論文を書いて発表すればそれでいいとは満足していませんでした。引用されてカンファレンスで一番クールな存在になれたとしても、それで使命を達成できるのか。その活動がどのようにAGIを世界にとって良いものにすることに繋がるのか。それらは直接結びついていません。基礎やステップにはなるかもしれませんが、十分ではありません。
そこで、AGIを構築するには何が必要かという、より大きな枠組みの問いについて真剣に考え始めます。これは楽しいことではありません。道筋がないことに気づくからです。莫大な資金が必要だと分かっても、それを調達する仕組みがありません。
必死に努力して、1億ドル、あるいは5億ドルなら調達できるかもしれません。しかし10億ドルとなると非常に困難です。使命を推進するために私たちが調達できたリソースで、OpenAIがこれまで成し遂げてきたことを見てください。苦痛から逃げず、私たちが成し遂げようとしていることの真実を理解しようと努める以外に、方法はありませんでした。
複数回学ばなければならなかった教訓は何ですか。
困難な決断を下し、難しい会話から逃げないことです。
これまでに受けた最高のアドバイスは何ですか。
ハーバード大学1年時のライティングの授業で言われたことですね。明確に伝えるためには、言葉を削り続けなさいというものです。
情報をどのようにフィルタリングしていますか。
大量に読み、徹底的にトリアージ(優先順位付け)を行います。
あなたのロールモデルは誰ですか。またその理由は。
ガウスとデカルトです。彼らは信じられないほど思慮深く、時代をはるかに先取りしたビジョナリーであり、私たちの思考や生き方を変えるような真のブレイクスルーを生み出したからです。
非テクノロジー系の人々にAIについて知っておいてほしいことは何ですか。
AIが人々の私生活において恩恵をもたらすポジティブな力となり、科学や医療を進歩させ、すべての人を引き上げる力になるということです。
世間がグレッグ・ブロックマンについて誤解していることは何ですか。
私がこの使命にどれほど集中しているか、人々は理解していないと思います。その過程では個人的に何度も辛い思いをしてきました。しかし、このテクノロジーが人々に力を与え、すべての人に利益をもたらすと信じています。そして、それを実現する手助けがしたいと心から願っています。
なぜOpenAIはモデルのネーミングがそんなに下手なのですか。
それについては私もお答えできません。
AIの自己進化とコーディングの未来
AIがAIの開発を劇的に加速させるようなパラボリックな(放物線を描いて急成長する)地点に近づいていますか。
私たちは今、AIをそれ自身の開発プロセスに応用するフェーズにいます。そのスピードはどんどん上がっていくでしょう。実際、ChatGPTが登場して以来、多くの面でそれはすでに起こっています。私たちはChatGPTを使って開発プロセスを10〜20%スピードアップさせました。
現在では、ソフトウェアエンジニアリングの手法を根本から変革する素晴らしいコーディングツールがあります。モデルの生産において私たちがやっていることのほとんどは、ソフトウェアがボトルネックになっています。システムの構築、スケールアップ、巨大なコンピューターの管理などです。
まもなく、AI自身が研究アイデアを考案し、それをテストし、実験を行うフェーズに突入するでしょう。ですから、私たちが生み出しているものによって、イテレーション(反復)とイノベーションのスピードは上がり続けると考えています。
現在、コードの何パーセントがAIによって書かれているのですか。
AIによって書かれていないコードの割合を知る方が難しいですね。それはごくわずかな割合になっています。実際のコードを書く作業においては、適切なコンテキストと構造が与えられれば、現在AIは人間よりもはるかに優れています。
もちろん、コードの実際の構造に関する部分では、私たちの人間の専門家の方がまだはるかに優れています。モジュールをどのように配置すべきか、各要素をどう連携させるか、特定のインターフェースの定義などです。しかし、実際のコードを書く作業は本質的にすべてAIが行っています。
AIは、人間が思いつかないような斬新なアイデアを自ら生み出しているのですか。
私たちはその段階に近づきつつあると言えます。例えばチップ設計の分野でそれが見られます。昨年、私たち自身のチップを設計する際、回路の面積を縮小するためにより良い配置を見つける技術を適用しました。そこでモデルが生成した最適化は、実はすでに私たちのリストにあったものでした。
つまり、どの人間も思いつかなかったような全く新しい斬新なものを考え出したわけではありませんが、私たちが手作業でやるには時間が足りなかったであろう最適化を、はるかに速く実装してくれたのです。
数学や物理学に目を向けると、私たちは今、未解決の数学問題や物理学の問題を解いています。最近では、量子物理学における特定の問題を、コミュニティの予想とは逆のアプローチで、美しくエレガントな公式を使って解決しました。これは本当に起こっていることです。
ですから、これらのモデルから新しいアイデアが生まれることは十分に可能です。一部のドメインではすでに見られ始めています。より複雑なドメインや、より現実世界のコンテキストを必要とする分野へ適用しようとしており、すでにその兆候が見られます。実現に向けた道筋は見えていますが、まだやるべきことはたくさんあります。
AIの政治的偏向と長期的な目標へのアライメント
なぜモデルは政治的な偏りを持っているように感じられるのでしょうか。
私たちはモデルが中立性を保ち、真実を提示できるように多大な努力を払っています。私たちのウェブサイトでは、モデルに組み込まれている価値観を正確に確認することができます。モデルにどのように振る舞ってほしいかを定義した仕様を公開しており、それに対してフィードバックを送ることもできます。
私たちは、公平でバランスの取れた中立的な視点に到達するために多大な労力を費やしてきました。Twitterで見かけるようなスクリーンショットは、背景にある以前の会話の文脈や、背後で回答を調整しているメモリー機能、隠された指示などが省かれていることがあり、必ずしも出所を正直に伝えているとは限らないと思います。
また、そもそも正解がない質問もあります。一言で答えろという質問に対して、どちらの言葉を選んだとしても、何らかの偏りがあると言われてしまうでしょう。
ですから、私たちが重要視している核となる部分は、真実を重んじることと、あなたを真に表現するAIを持つことにあると考えています。
強化学習に基づいている場合、モデルは私たちが聞きたいことを言うように進化すると思いますか。もし私が左派の考えを持っていれば左寄りの答えを出し、右派なら右寄りの答えを出すように。
モデルをユーザーの好みに合わせてどのように学習させるかについては、私たちも進化を遂げてきました。昨年の時点では、モデルがユーザーの聞きたいことを言う方向に強く傾いているのが見られました。それは素晴らしい回答でしたなどと同調するような形です。
私たちはそれに対応しました。これは私たちのモデルが機能すべき姿ではないと判断し、変更を加えました。私たちがモデルに本当に合わせてほしいのは、ユーザーの目標、特に長期的な目標の達成を支援することだからです。
その瞬間は、これまでにない最高の質問ですねと言われれば気分が良いかもしれませんが、それはあなたが本当に望んでいることではありません。一部にはそうした人もいるかもしれませんが、ほとんどの人が本当に望んでいることではありません。
ですから、AIの訓練が採点者をハッキングするような結果に陥らないよう、技術的に大きな改良を加えました。一時的な満足感を得るためのものではなく、本当の目標に向けた良いシグナルが確実にあるようにしたいのです。
私にとってそれは、パーソナルAIやパーソナルAGIが私たちをどこへ導くかというビジョンにおいて、最も重要な部分かもしれません。単にその場しのぎの見栄えが良いものではなく、あなたの長期的な幸福や目標、あなたが本当に望んでいることと一致していることが重要なのです。
それこそが人々に最も力を与えるものだと思います。あなたのために24時間365日動いてくれる存在がそこにいることで、あなたは本当に主導権を握ることができるようになります。あなたが眠っている間も、AIはシェーンが何を望んでいるのか、どうすればもっと上手くできるのかを考え、実際にそれを達成してくれるのです。
グローバルなAI開発競争と国家戦略
私たちは今、グローバルなAI開発競争の中にいるのでしょうか。
確かに私たちはグローバルなAIルネサンスの時代にいますが、国と国との間の力学はまだ完全には定まっていないと思います。画期的なアルゴリズムを生み出す拠点はアメリカの欧米企業に集中しています。世界中で多くのイノベーションが起きていますが、力学のバランスや、どの国がどのプロバイダーに依存するかといったことは、まだこれから決まっていく部分だと考えています。
アメリカが最初にAGIに到達できない場合、どのような結果を招くと思いますか。
アメリカがAI分野をリードすることは極めて重要だと思います。なぜなら、それこそが民主主義の価値観を守り、維持するための方法だからです。また、すべての国が独自の主権的なAI戦略の必要性を認識し始めています。これが経済安全保障や国家安全保障の基盤となるのであれば、何らかの形で参加しなければならないからです。
チップの輸出や技術の輸出をどのように管理するかというアメリカの取り組みを見ると、規制を強めすぎれば他国は独自の競合技術を開発するか、この技術を構築している他の誰かに依存せざるを得なくなります。逆に規制を緩めすぎれば、アメリカの優位性が失われる可能性があります。問題は、そのバランスをどう取り、リーダーシップを維持するかです。リーダーシップとは単に先頭に立つことだけでなく、世界を共に導いていくことでもあります。
他国が技術的進歩を盗んでいるという懸念はありますか。蒸留(Distillation)について多くの記事を読みましたが。
確かにモデルを蒸留しようとする試みは多数存在します。それはアメリカ国内の企業からも、世界中からも行われています。しかしそれは重要な点を見落としています。この技術の発展は指数関数的であり、私たちが一つのモデルを公開した時点で、私たちはすでに次のモデルへと移行しているのです。すでに次のレベルへと進んでいます。
私たちは蒸留を防ぐために多くの努力をしており、特に思考の連鎖(Chain of Thought)のような、出力を得るために必ずしも必要ではない部分を利用して蒸留を行うことを困難にしています。
私たちが持っている中核的な優位性、時間をかけて築き上げている強みは、単一のモデルそのものではありません。モデルを作り出す機械そのものなのです。
だから推論のプロセスを見せるのをやめたのですか。
それが理由の一部です。理由は2つあります。1つは蒸留を防ぐため。もう1つ、ある意味ではより重要な理由ですが、推論パラダイムを最初に開発した時、私たちが予想していなかった解釈のメカニズムが得られることに気づいたのです。モデルの思考を実際に読むことができ、どうやってその答えにたどり着いたかを正確に確認できるからです。その答えを導き出した動機を解釈できるわけです。
しかし問題は、見栄えの良い思考の連鎖を持つようにモデルを訓練してしまうと、その真実性が失われてしまうということです。モデルは、求められている答えの一部が思考の連鎖を特定の形で見せることだと学習してしまい、それが実際に答えに到達したプロセスを反映しなくなってしまう可能性があります。
そのため、ユーザーに提示できるような好ましい形に見えるよう思考の連鎖を訓練する誘惑を避けたいと、私たちは早い段階で決定しました。競合上の理由、安全上の理由から、中間の思考プロセスを公開することには慎重になっています。
コンピューティング資源の圧倒的不足とデータセンターの価値
現在のトレンドとしてプレビューモデルをリリースすることが多いように見えますが、これはコンピューティング資源が制限されているからでしょうか。
総じて言えば、私たちはコンピューティング主導の世界へと向かっています。これらのモデルが人々に提供できる価値の大きさを考えれば、それは極めて絶大です。もはや単に簡単な質問に答えたり、健康情報へのアクセスを提供したりするだけではありません。
大量のトークンを消費して様々なデータソースを統合し、企業のナレッジベースを検索して複雑な問題を解決し、人間よりも優れたソフトウェアを記述するなど、深く入り込んだ処理を行っています。これらはすべて高度なタスクです。
GPT-1からGPT-2、GPT-3、Codex、そしてGPT-4へと私たちが遂げた進歩を見ると、それは劇的なものでした。これらのモデルは、ユーザーの意図を理解し、達成したいことに合わせて適応する能力が飛躍的に高まっています。また、Codexのような環境にモデルを組み込むことで非常に使いやすくなり、開発者は想像もしていなかったような成果を上げることができるようになりました。
これらはすべて、根本的にはコンピューティング資源によって支えられています。しかし、現在は圧倒的にコンピューティング資源が不足しています。もし世界中のすべての人に1つのGPUを提供しようとすれば、80億個のGPUが必要になります。私たちは現在、それに近いレベルの計算能力を構築する軌道には乗っていません。数十万個のGPUでさえ今日ではかなり大規模なフリートですし、今後数百万個のGPUが登場するにしても、世界には計算能力が決定的に不足しています。この技術をすべての人に届けるためには、はるかに多くの計算能力が必要になることは驚くことではありません。
学習に関しても、私たちは今後の展開を見据えてコンピューティング環境を構築するために多大な努力を払ってきました。モデルをすべての人に届け、広く利用可能にするという私たちの使命に、今後も強く焦点を当てていくことになります。
データセンターに多額の資金と労力を注ぎ込んだことで批判もされましたが、今それがどのように機能していると考えていますか。
それは私たちに優位性をもたらすと思います。そしてその優位性は単にビジネスの面だけでなく、この技術をすべての人に届けるという使命を果たすための優位性でもあります。
あなたたちはそれをはるか前から見抜いていましたよね。ほとんどの競合他社からそのことで揶揄されていましたが。
最後に笑うのは誰でしょうか。
本当にそうですね。
競合他社はコンピューティング資源の面でかなり苦労していると思います。そういう言い方にしておきましょう。
しかし、彼らには見えなかった何かをあなたたちは見ていたはずです。外から見れば、誰もが同じような技術的状況にありました。全員がこれが来ることを知っていたのに、あなたたちだけが1000億ドル規模の投資をする大胆さを持っていました。
しかし、それこそがOpenAIの核心なのです。現実をあるがままに受け止め、次の6ヶ月、12ヶ月、10年で私たちが成し遂げることがどんな意味を持つのかを真剣に考える。これは壮大な使命にも当てはまりますし、ソフトウェアの各部分を日々どう設計するかにも、そしてコンピューティング資源のスケールアップにも当てはまります。
私たちはこのテクノロジーをすべての人に届けることに深く動機づけられています。そして、それを安全かつ適切に行うための様々なメカニズムについて考えています。
汎用人工知能(AGI)がもたらすエンタープライズと消費者の未来
いずれ、ノースダコタにある巨大なデータセンターが、ガン治療の解決だけに特化して稼働するような未来が来ると思いますか。
はい、そう思います。
それはどれくらい先の話でしょうか。
このようなことが今年起きても不思議ではないと思います。本当に驚くべきことです。巨大な機械があって…あなたはデータセンターに行ったことはありますか。
いいえ、オンラインで見たことはありますが、直接はありません。
サーバーラックの間を歩き、通路を進み、すべてが完璧な長さに揃えられたケーブルの束を見るのは、全く異なる体験です。そこでデータセンターが何であるかを実感します。それは巨大な機械なのです。人類が作り出した最も巨大な機械かもしれません。
そして、なぜこんなものを作るのかという問いが生まれます。なぜそれほどの価値があるのかと。それは、人々にとって重要な問題を解決する可能性を秘めているからです。ガンの治療法を見つけたり、人々のビジネス運営を支援したり、時にはありふれた検索を処理したり。
私の中でその目的は、いかにして価値を届けるか、いかにして人々の目標達成を支援するかという点に尽きます。特定の1つの問題に特化してこれらの巨大な機械を稼働させることの可能性について、私たちはまだ十分に実感しきれていないと思います。
しかしコンピューティング資源が制限されている中で、誰にサービスを提供するかをどう決めるのですか。例えばガン治療の解決よりも、私が画像を作ろうとしているリクエストを優先する理由は何ですか。
それは、社会が答えるべき最も重要な問いになるでしょう。計算能力をどこへ割り当てるのか、どの問題に価値があるのか。価値ある問題はたくさんありますが、計算能力には限りがあるため優先順位をつける必要があります。
私たちが強く信じていることの一つは、誰もが計算能力へのアクセスを必要とするようになるということです。だからこそChatGPTには無料枠があるのです。私たちはこの技術を人々が利用できるように、広く普及させることに多大な労力を注いできました。それが私たちの活動の核心だと信じているからです。
このテクノロジーを人々の手に届けることで、人々に力を与え、目標達成を支援します。同時に、人々が技術を理解する助けにもなります。この技術が社会にどう組み込まれるべきかを形成することに繋がるのです。
全く異なるアプローチをとることもできます。象牙の塔のように、とにかく問題を解決することだけに集中し、技術的ブレイクスルーの恩恵を後から何らかの形で分配するという考え方です。それにも一理あると思いますが、私はそこに重点を置きません。特定の重要な問題で大きな進歩を遂げたいとは思っていますが、それはあくまでこのテクノロジーの恩恵を広く行き渡らせるためのものであるべきです。
社内では、コンシューマー向けとエンタープライズ向けのバランスをどう考えていますか。
私が最近よく考えているのは、フォーカスの問題です。この分野はまさに可能性そのものです。AIをあらゆる問題に適用できます。どんなものでも作れるようになりました。
問題は、計算能力に限りがあるということです。それをどこに投じるか。シナジーを生み出す必要があります。複数のことが同時に起こり、それらが合わさることで、1足す1が10になるようなリターンが必要です。それが夢であり目標です。
OpenAIの次のフェーズで非常に重要になるのは、明らかにエンタープライズです。なぜなら経済が私たちの目の前でコンピューティング主導の経済へと変貌しつつあるからです。これは今まさに起こっています。ソフトウェアエンジニアリングでそれを目の当たりにしましたが、コンピューターを使って仕事をするあらゆる分野で同じことが起きるでしょう。
誰もがコンピューターを使って仕事をするのではなく、コンピューターが自分のために仕事をしてくれるようになるのです。これは本当に驚くべきことです。ですから私たちは、人々がこれらのモデルを導入し、どう活用し、どう最大限の恩恵を引き出すかを見出すための支援をしなければなりません。
それに、エンタープライズとコンシューマーの境界線も曖昧になっていくでしょう。起業がこれまで以上に簡単になるからです。これはすでに見られ始めています。例えば私の友人が、彼の妹がこんなアプリがあったらいいのにと、思い描く正確なイメージを語っていた時の話を教えてくれました。彼は彼女の話を聞きながら、こっそりCodexに打ち込み、エンターキーを押しました。
数時間後、彼がそのアプリを見せると、彼女は「待って、これ何?どこから来たの?誰が作ったの?」と驚きました。彼は「君が作ったんだよ」と答えました。これは本当に素晴らしいことだと思います。誰もがビルダーになれるのです。Codexのようなツールは一部のソフトウェアエンジニアだけのものではありません。ビジョンさえあれば、誰もがソフトウェアエンジニアになれるのです。
自分が達成したいことに対するエージェンシー(主体性)があれば、それを可能にする魔法のツールを誰もが手にできるのです。
コンシューマー側について言えば、コンシューマーという言葉は幅広すぎます。エンターテインメントや自己表現など様々な要素がありますが、私たちが本当に焦点を当てているのは目標の解決です。
スマートフォンは40億人以上の人々が使っています。それと同じように、すべての人がパーソナルAI、パーソナルAGIを持つべきだと信じています。それは自分のことをよく理解し、個人的なコンテキストを持ち、信頼でき、アドバイスを求めることができる存在です。同時に、好きなミュージシャンが町に来ると知れば自発的にチケットを購入してくれたり、これは事前に確認を取るべきだと判断したりするほど、あなたのことを深く理解している存在です。
あなたを知り、あなたが達成したいことを何でも支援し、目標を具体化する手助けをしてくれるAIです。目標を設定するのはあなた自身です。あなたの目標であるべきですし、あなたが主導権を握るべきです。しかし私たちはそうしたものを創り出したいのです。
これは40億人どころか、地球上の80億人全員が恩恵を受け、必要とするものになると思います。ディープな知識労働と、エージェントシステムへの広範なアクセスの普及という2つの次元を見据えています。私たちはこの両方の側面を構築したいと考えており、最終的にそれらは同じ技術であるため一つに融合していきます。
最終的に私たちが求めているのは、クラウド上に存在し、情報へのアクセスを持ち、信頼でき、良い答えを提供し、あなたの代わりにビルドや私生活での行動を起こしてくれるAIです。複数のインスタンスを持つことになるかもしれませんが、根本的には1つの技術システムなのです。
宇宙にデータセンターができると思いますか。
あらゆる場所にデータセンターができると思います。
それはどれくらい先の話でしょうか。
宇宙にデータセンターを設置することには、多くの技術的な問題が伴います。現在のデータセンターでさえ非常にデリケートで、壊れやすく高価なコンポーネントで構成された巨大な機械です。過去にも、ケーブルがピンと張りすぎているというだけで信号の整合性に問題が生じ、コンピューターが動作しなくなるという問題が何度もありました。
ですから、システムのメンテナンスをどうするか。現在は人間が物理的に行ってケーブルを引っ張ったりしていますが、おそらくロボティクスに移行するでしょう。宇宙のような過酷な環境にデータセンターを設置することを考えるなら、こうした技術的課題の解決が非常に重要になります。宇宙というのは壮大な挑戦に感じますが、計算能力に対する需要はとてつもないものになるため、あらゆる選択肢を検討する必要があります。
反復的デプロイメントと安全性の確保
反復的デプロイメント(Iterative deployment)とは何ですか。なぜそれを行うのですか。
反復的デプロイメントは、OpenAIがこのテクノロジーを人々に役立て、使命を達成するためのアプローチの核となる柱の一つです。この2つの言葉を組み合わせたのはおそらく私ですが、この精神は最初のプロダクト展開を考えていた時、私たちがやろうとしていることとどう結びつけるかを考える中で生まれたものです。
AGIを構築し、人々に恩恵をもたらすという目標に対して、2つの異なるルートがあることに気づきました。1つは秘密裏に開発を進め、何も展開せず、完璧に磨き上げるまで時間をかける。そしてある日ボタンを押してリリースするという方法です。
私はその戦略に賛同できるか、その戦略に責任を持てるかを考えました。すべてのテストを終えて、さあデプロイの準備はできたかと考えながら部屋に座っていたいか。それまで一度もデプロイしたことがなく、世界を変えるような非常に強力なシステムで初めて現実世界と接触するのです。それはあまりにも困難な問題です。
そうではなく、これがあなたにとって100回目のシステムデプロイだとしたらどうでしょう。少しずつ強力になるシステムで、この問題をすでに99回解決してきた経験があるのです。そして世界もまた、それに適応し、再構成する機会を得ています。
GPT-3の時、私たちは早い段階でそれを学びました。GPT-3がどのように悪用される可能性があるか、どのような形で失敗するかについて私たちは多大な時間を費やして考えました。偽情報や、そうした大規模な問題について心配していました。
しかし、GPT-3の悪用の第1位が何だったか知っていますか。
何ですか。
医療スパムです。様々な薬を人々に宣伝するようなものです。私たちが問題として予測すらしていなかったことですが、目の前でそれが起きているのを見て、対応し、そこから学ぶ機会を得たのです。
ですから反復的デプロイメントとは、このテクノロジーの中間バージョンを世に出していくという考え方です。もちろん、盲目的にリリースするための言い訳ではありません。すべての段階で、どのように悪用される可能性があるか、ダウンサイドやリスクは何かを考え、それを軽減する必要があります。しかし実際にそれを見て、自分たちが正しかったかを確認し、現実から学び、次はもっとうまくやることができるのです。
これはすべて新しいことであり、プレイブック(定石)がないということを人々は理解していないと思います。これほど強力なテクノロジーが世界で最も急速に展開される中で、あなたたち自身も手探りで進めているということを。
確かにOpenAIの歴史の中で、かつて変革をもたらすテクノロジーを展開した経験のある人たちが、私たちに答えを教えてくれるのではないかと期待した時期もありました。しかし、決してそんな単純なものではありませんでした。
彼らは知恵や洞察を持っており、それは私たちがしっかりと取り入れてきたものです。しかし同時に、私たちがこのテクノロジーに最も近い存在であることにも気づきました。自分たちが創り出しているからこそ、これをどのように形作っていくかについての理解があり、現場から遠い人には適切にアドバイスするのが難しい領域なのです。
私の観察では、正しい選択というのはその技術の事実に極めて依存します。携帯電話、メインフレームコンピューター、AI、電力など、それぞれが特有の性質や問題、開発のされ方を持っています。開発に関わる個人の特性も重要です。様々な人々の間の力学といった人的要因は、今日のAIの展開に多大な影響を与えています。
OpenAIの初期から、さらにそれ以前から、私たちは多くの時間を夢を描くことに費やしてきました。私たちがこれから行うことの影響について、本当に多くの時間をかけて考えてきました。一つの気づきとして言えるのは、その過程で起こる出来事の「内容」自体には驚かされていませんが、「いつそれが起こるか」「それを達成するのがどれほど難しいか」「それがどのような順番で起こるか」については驚かされてきたということです。
そして私たちが向かっている世界は、私たちが予想していたよりも多くの点で、より素晴らしく、畏敬の念を起こさせるものだと思います。
もしあるフロンティアモデルが安全性を最優先し、別のモデルがそうでない場合、その競争は長期的にどのように展開すると思いますか。
安全性は実際の中核的なプロダクト機能であるということが分かってきました。自分とアライメント(一致)していないモデルを使いたいと思う人はいません。信頼でき、どんな状況でも正しいことをしてくれるモデルを求めるはずです。
私たちは安全性に多大な投資をしてきましたし、人々が認識している以上に、他のどの研究所よりも投資しているかもしれません。ChatGPTは世界で最も広く展開され、最も多くの人々に利用されているAI言語モデルです。私たちは安全性を気にかけなければなりません。これまでもずっと気にかけてきましたが、これほど多くの人々に技術を届けられるようになった今、それがより明白になっています。
ですから、この技術を構築し成功するプロダクトを持つ人々が、同時に安全性にも懸命に投資しないという状態が持続可能だとは思いません。ここでの課題は少し引いて考える必要があることです。安全性を実現するという意味には、短期的ではない側面があるからです。ビジネスだけでなく、自分たちが創り出しているものについて長期的に考えなければなりません。
これにはモデルの学習方法や、フィードバックループの構築方法なども含まれます。いずれにせよ、私たちは使命の一部として安全性にコミットしており、それがプロダクトや世界で実証されていると思います。
人々が見落としがちなのは、これが単なるモデルの安全性の問題ではなく、社会のレジリエンス(回復力)の問題だということです。変革をもたらすテクノロジーが世界に登場する時、社会は技術の強みとリスクの双方を前提にそのシステムを構築します。
エンジンの場合を考えてみてください。車を作ると同時にシートベルトも必要です。道路を整備し、そのテクノロジーが機能することを前提に都市を再構築します。電気の場合も、様々な安全基準があります。電柱や高電圧線の設置場所に関するルールなどです。
AIについても同じことが言えるはずです。テクノロジーそのものやモデル単体の問題ではありません。レジリエントな社会の中に、それらをどう統合していくかという問題なのです。OpenAIの財団は、社会がAIに対するレジリエンス層に投資し、構築するのを支援することを主要なフォーカスの一つとしています。
AI規制のあり方とこれからの社会インフラ
AIの規制はどうあるべきだとお考えですか。
AI規制が達成すべきことには、いくつかの異なる要素があると思います。一つは非常に重要なことですが、最終的にこのテクノロジーが人々に利益をもたらすことを保証しなければなりません。
例えば、人々が安定していると考えていた制度や仕事、人生のレールといった前提が崩れる可能性があることは非常に明らかです。このテクノロジーが普及するにつれて、私たちはお互いを支え合う仕組みを確実に提供しなければなりません。
規制の観点からそれが何を意味するのか。誰もが計算能力にアクセスできるようにすべきだというアイデアなど、多くの議論があります。どうすればそれを保証できるのか。このテクノロジーがさらなる経済価値を生み出し始める中で、それが一箇所に集中しないようにするにはどうすればいいのか。誰もがこの恩恵を受けられるようにすべきです。
このテクノロジーは、経済全体を抽象的に豊かにするだけではいけません。それは間違いなく起こりますが、人々が日常生活の中で、この技術が存在し、それを利用し、より多くのことを達成できるからこそ自分の人生が良くなったと直接感じられるものでなければなりません。
これがどのように展開するかを考える時、私たちが実際に何を目にしているかに基づいて考えることが非常に重要です。例えば、ChatGPTを使ったことで自分や愛する人の命が救われたと言う人々の数は増えており、それはサポートされ、保護されるべきものです。
規制を通じてそれをどう実現できるかという良い例が、プライバシーと特権の問題です。医師や弁護士との会話には秘匿特権があり、安心して共有することができます。医療提供者がいつ法執行機関に情報を提供したり、誰かに警告したりしなければならないかについてはガードレールがあり、法律で明確に定義されています。
現在、AIにはそうした仕組みは一切ありません。しかし人々はこれらのツールを使っていますし、他の方法では得られない情報へのアクセスを与えてくれるため、使うべきなのです。そしてそこには、適切な保護への理解があるべきです。
ですから、これらのモデルが人々の生活にどのように組み込まれるのかを真剣に考えることが求められます。イノベーションを継続しつつ、その恩恵が広く行き渡るようにするにはどうすればいいか。アメリカがリーダーであり続けることをどう保証するか。ロボット工学の分野では、アメリカはリーダーではないと思います。しかしAIにおいては、私たちが達成できたこの驚くべき地位を維持し続けなければなりません。
データセンターのような問題について言えば、電気料金を高騰させるのではないかという懸念が明らかにあります。私たちはそうならないようにするコミットメントを持っています。これらの問題は様々なメカニズムを通じて達成できると思います。規制による場合もあれば、企業のコミットメントによる場合もあります。
あるいは、人々が事実を理解するだけで済む場合もあります。その良い例がデータセンターと水の使用量です。よく話題に上りますが、実際には私たちのデータセンターが使う水は驚くほど少ないのです。大量の水を使うというのは、実は誤った情報なのです。
一般の家庭よりも少ないのですよね。
はい、そうです。なぜなら閉鎖循環系(クローズドループ)だからです。巨大なプールのよう水で満たし、それをただ循環させているだけなのです。固定された量の水であり、決して大量ではありません。
しかし、人々が理由を理解することが重要です。なぜ私たちがこれらを構築しているのか。なぜそれだけの価値があるのか。自分にとってどんなメリットがあるのか。人々が起業家になれる、ビジネスを立ち上げられる、何かを創造できると感じられるようなエンパワーメントを提供すること。私たちはこれらを解決し、人々が日々の生活の中でその恩恵を実感できるようにしなければなりません。
私がこのインタビューを行うと人々に話した時、共通の反応の1つは、彼らが自分の仕事や将来の不確実性を恐れているということでした。彼らに何と伝えますか。
この技術が正確にどのように展開していくかについては、確かに不確実な部分があると思います。そして、予想外の形で展開していくでしょう。現在私たちが持っているAIや、今ある世界は、SFが予測していたものとは全く異なります。不可避だと思われていた結論のいくつかは、実際に起こってみると同じ姿はしていません。
失うものは常に見えやすいものです。変化は確実にやってきます。それは否定できません。しかし、何を得るのかを事前に見通すのははるかに難しいのです。
例えば、1950年の人にUberを説明することを想像してみてください。コンピューター、携帯電話、GPSという概念を理解してもらわなければなりません。それがすべて、3分後に車を自分のいる場所に呼び出すためなのです。その単一のユースケースのためにそれほどの技術投資をするなんて、よく考えればクレイジーな話です。
しかしそれは現実に起こりました。そしてその1つのユースケースのためだけでなく、数千、数万、数百万の他のユースケースのためにも機能したのです。
私のAIに対する見方は、それが人々のエンパワーメントであり、人間のエージェンシー(主体性)を高めるものだということです。それは同時に、私たちが依存できると思っていた制度や仕事などが、想定していたほど安泰ではなくなることを意味します。ですから人々に影響は及ぶでしょう。
しかし目を向けるべき問いは、そこから何を得て、どう恩恵を受けるかということです。今やあなたはビルダーになれます。何でも創り出すことができます。想像できることはすべて現実になります。では、あなたは何を想像しますか。そのスキルをどうやって磨きますか。
私が観察してきたことの一つは、この技術の複数の世代にわたって、そこから最も大きな恩恵を受けているのは、前の世代でも同じように取り組んでいた人たちだということです。
この技術に深く入り込み、使いこなすスキルを磨けば磨くほど、その核にあるのはエージェンシーであり、ビジョンやアイデアを持つことだと分かります。なぜなら、それを試すための参入障壁がこれまでになく低くなっているからです。
ですから私は、新しい機会が創出されると思います。経済はコンピューティング主導へと変貌し、これまでとは違う形になるでしょうから、世界はこの不確実な時期や移行期を通じてすべての人をどうサポートするかを考える必要があります。しかし、誰もが貢献できる場所が必ずあると信じています。
若者が身につけるべきスキルとAIがもたらす未来の光と影
若者は今日、何に投資すべきでしょうか。高校生や大学生、あるいは働き始めたばかりの人が、将来より価値を持つようになると思うスキルは何ですか。
このテクノロジーに深く関わっていくことが、非常に重要なスキルになると思います。AIから最大限の価値を引き出す方法を理解することです。なぜなら、私たちは全員がエージェントのマネージャーとなり、やがては自律型AI企業のCEOになるような世界へ向かっているからです。
想像してみてください。10万人の従業員を抱える企業がすべてあなたの思いのままに、あなたの代わりに24時間365日働いてくれるとしたらどうでしょう。それを動かすためのトークン、つまりコンピューティング資源がある限り。繰り返しますが、世界中の誰もが計算能力にアクセスできるようにすることが極めて重要です。
その地点に達すれば、それをどんな問題にでも向けることができます。人類が解決したいと願う問題の数は無限にあります。ですから、人々がこの技術に踏み込み、やって来るものをどう活用するか、これらの技術を新しい方法でどう組み合わせるか、エージェントとどう対話し管理するかを考えるほど有利になります。
自分が何を望んでいるのか、自分の自己意識とは何か、目的は何か、世界に何を見たいのかを考えることで、それを達成することがかつてないほど簡単になるでしょう。そうして私たちが手にする世界は、想像を絶するほどの素晴らしいものになると思います。
それが未来に対する最もポジティブな見方ですね。では、想像し得る最もネガティブな見方はどのようなものですか。
これまでのテクノロジーの発展において非常に興味深いのは、私たちが機械に合わせて自分自身を歪めてきたということです。箱のようなコンピューターに向かってキーボードを叩き、手根管症候群になり、肩を丸めて仕事をしている人がどれほどいるか考えてみてください。それは決して自然なことではなく、私たちが本来そう設計されているわけではありません。
私たちは、単にコンピューターを使って仕事をするだけでなく、コンピューターが私たちのために仕事をしてくれる世界へと移行しつつあります。そこには機会があると同時にリスクも存在します。それらをどう軽減するかを考えなければなりません。
結局のところ、人々の目標達成を支援し、望むことを行ってくれる機械があるとして、時には人々の目標が衝突することもあります。それをどう解決するのか。AIが手助けする境界線をどう決めるのか。これが社会にどう組み込まれるべきか。恩恵が1つの企業や一部の人々だけに集中せず、本当にすべての人を引き上げるものにするにはどうすればいいか。
誰もが素晴らしい人生を送り、この技術にアクセスし、それを使って何かを成し遂げられるように、社会のボトムの基準(フロア)を引き上げる必要があります。それが同時に天井を引き上げることにも繋がります。誰もが新しい機会を得て、全員を確実に取りこぼさないためのセーフティネットのようなものが整備された上で、私たちはより多くのことを達成できるようになるでしょう。
医療へのアクセスを例に考えてみましょう。私たちが正しく仕事を行えば、誰もが世界最高の医師チームよりも優れた医師をポケットの中に持ち、24時間365日自分の健康状態を見守り、どう治療すべきかを考えてもらえる世界になるはずです。
それは破壊的な変化です。この技術が世界と相互作用する上で、タダで手に入るわけではありません。私たちはすでにその初期段階を目にしています。しかし、ここから2年間ほどの間に私たちが見るものは、善のための力になると思います。ただ、そのアップサイド(利益)を達成するためには、うまくいかない可能性やリスクをすべて認識した上で進んでいく必要があります。
私たちはいつもすべてのポッドキャストを同じ質問で締めくくっています。あなたにとっての「成功」とは何ですか。
汎用人工知能が全人類に恩恵をもたらすことを保証するという、OpenAIの使命を達成することです。
ありがとうございました。本当に素晴らしかったです。素晴らしい会話でした。
こちらこそ、ありがとうございました。とても楽しい時間でした。


コメント