サム・アルトマンが語るAGI、GPT-5、そして次に来るもの — OpenAIポッドキャスト第1回

この動画は、OpenAIのCEO兼共同創設者であるサム・アルトマンが出演するOpenAI公式ポッドキャストの記念すべき第1回エピソードである。インタビュアーはOpenAIの元エンジニアで科学コミュニケーターのアンドリュー・メインが務める。アルトマンは新しい父親としてのChatGPTの活用法から始まり、AGIの定義と現在の進歩状況、今年夏に予定されているGPT-5のリリース時期、5000億ドル規模のプロジェクト・スターゲート、プライバシーと広告に対するOpenAIのアプローチ、Jony Iveとの協力によるハードウェア開発計画、そして若い世代へのアドバイスまで、AI業界の最前線で起きている様々な話題について率直に語っている。特に注目すべきは、AGIへの道筋と人工超知能の可能性、計算資源の大幅な不足とその解決策、そしてAIと人間の共存における新しいパラダイムについての洞察に満ちた議論である。

はじめに – OpenAIポッドキャストの開始
新しい親としてのChatGPT活用
AIと子供の関係性の課題
OpenAIの将来とChatGPTの進化
AGIの定義と進歩
科学的発見への応用と現在の進歩
モデルの進歩とOperatorの改善
Deep Researchの活用と時間制約
GPT-5の発表時期
モデル命名の複雑さ
メモリ機能の重要性
プライバシーに関する懸念とNYTの訴訟
広告とデータ使用に関するOpenAIのアプローチ
競合他社との比較
モデル調整とユーザー体験の課題
画像生成モデルの進歩
プロジェクト・スターゲートの詳細
イーロン・マスクとの対立
競争環境の変化
エネルギー要件の課題
宇宙科学データの処理
物理学とchemistry理解モデル
推論モデルの仕組み
推論時間の価値
ハードウェア開発への取り組み
デバイスデザインの考慮事項
若い世代へのアドバイス
AGI後の雇用見通し

はじめに – OpenAIポッドキャストの開始

アンドリュー・メイン：OpenAIポッドキャストへようこそ。私の名前はアンドリュー・メインです。数年間、私はまずエンジニアとして応用チームで、その後科学コミュニケーターとしてOpenAIで働いていました。その後、人工知能をどのように組み込むかを理解しようとする企業や個人と仕事をしてきました。

このポッドキャストでは、OpenAIで働く人々や関わる人々と話し、舞台裏で何が起こっているのかについて話し、そして未来を垣間見る機会があります。私の最初のゲストは、OpenAIのCEO兼共同創設者のサム・アルトマンです。そして、スターゲートについて、親としてどのようにChatGPTを使っているか、そしてGPT-5がいつ登場するかについてのアイデアを得ようと思います。

サム・アルトマン：毎年、ますます多くの人々がAGIシステムに到達したと考えるようになるでしょう。ハードウェアとソフトウェアに求めるものは、かなり急速に変化しています。しかし、もし人々がより多くの計算資源で何ができるかを知っていたら、彼らははるかに、はるかに多くを求めるでしょう。

アンドリュー・メイン：私の友人の一人が新しい親で、質問をするためにChatGPTをよく使っています。とても良いリソースになっています。

新しい親としてのChatGPT活用

アンドリュー・メイン：そして、あなたも新しい親ですね。ChatGPTはそれにどれくらい役立っていますか？

サム・アルトマン：とても役立っています。つまり、明らかに人々は長い間ChatGPTなしで赤ちゃんの世話をすることができていました。私にはそれがどうやってできたのかわかりません。最初の数週間は、本当に常に使っていました。

今では、基本的なことはできるようになったので、発達段階についてより多く質問するようになりました。

アンドリュー・メイン：これは正常ですか？

サム・アルトマン：そうです。でも、そのためにとても役立ちました。私は子供が将来どのようにAIを使うかについて多くの時間を考えています。ところで、私は完全に子供推進派です。みんなたくさんの子供を持つべきだと思います。

アンドリュー・メイン：はい。OpenAIの多くの友人たち、元同僚や現在の同僚が子供を持っています。人々は「このAIのことはどうなの？」と言いますが、私が知っている内部の人は皆、家族を持つことについてとても楽観的です。

サム・アルトマン：それは良い兆候だと思います。私の子供たちはAIより賢くなることは決してないでしょう。

アンドリュー・メイン：それで彼らをがっかりさせるつもりですか。

サム・アルトマン：つまり、彼らは私たちが育った時よりもはるかに有能に育ち、私たちが想像できないようなことができるようになるでしょう。そして彼らはAIを使うのがとても上手になるでしょう。明らかに、そのことについてよく考えますが、取り除かれるものよりも、私たちが持っていなかったもので彼らが持つものについてもっと考えています。

私の子供たちは、AIより賢くないという事実に悩まされることは決してないと思います。私にとって印象に残っているビデオがあります。赤ちゃんや小さな幼児が古い光沢のある雑誌の画面をこのようにしているビデオです。

アンドリュー・メイン：iPadだと思っているからですね。

サム・アルトマン：壊れたiPadだと思っていました。そうです。今生まれる子供たちは、世界には常に非常に賢いAIがあったと思うでしょう。そして彼らはそれを信じられないほど自然に使い、これを非常に、先史時代の時期として振り返るでしょう。

AIと子供の関係性の課題

アンドリュー・メイン：ソーシャルメディアで見たことがありますが、ある男性がトーマス機関車について子供と話すのに疲れたという話がありました。それでChatGPTの音声モードに入れました。

サム・アルトマン：子供たちはChatGPTの音声モードが大好きです。

アンドリュー・メイン：そして1時間後、その子はまだトーマス機関車について話していました。

サム・アルトマン：繰り返しますが、これがすべて良いものになるとは思いません。問題が生じるでしょう。人々はある程度問題のある、あるいは非常に問題のある準社会的関係を発達させるでしょうし、社会は新しいガードレールを見つけなければならないでしょうが、利点は計り知れないものになるでしょう。

そして社会は一般的に欠点を軽減する方法を見つけるのが得意です。

アンドリュー・メイン：はい。だから、楽観的だと思います。教室で良い教師、良いカリキュラムと一緒に使用されるChatGPTは非常に良くなるという興味深いデータを見ていますが、宿題の松葉杖として単独で使用されると、子供たちがGoogleで調べるのと同じことをしようとするのと同じことにつながる可能性があります。

サム・アルトマン：私はGoogleが出てきた時に、みんなが心配していたような、Googleで何でも調べて学習をやめてしまう子供の一人でした。でも、結果的に、比較的早く、学校の子供たちは適応します。だから、私たちはこれを解決すると思います。

アンドリュー・メイン：Googleですべて調べていなかったら、サム、あなたはどうなっていただろうかと考えてみてください。

OpenAIの将来とChatGPTの進化

アンドリュー・メイン：採用数字を見ると、本当に驚異的です。OpenAIの最も人気のある製品です。5年後、それはChatGPTになるでしょうか？

サム・アルトマン：つまり、ChatGPTは5年後には全く違うものになると思います。だから、ある意味では、いいえです。でも、まだChatGPTと呼ばれているでしょうか？おそらく。

アンドリュー・メイン：はい。わかりました。だから、しっかりした名前ですね。

AGIの定義と進歩

アンドリュー・メイン：もう一つ聞くのはAGIです。AGIの定義を聞かせてください。

サム・アルトマン：多くの意味で、5年前にソフトウェアの認知能力に基づいてAGIの定義を提案するよう私や他の誰かに頼んだとしたら、多くの人が与えただろう定義は今では十分に超えられています。これらのモデルは今賢いのです。

アンドリュー・メイン：そうですね。

サム・アルトマン：そして彼らはより賢くなり続けるでしょう。改善し続けるでしょう。毎年、ますます多くの人々がAGIシステムに到達したと考えるようになると思います。定義がより野心的になり続けるにもかかわらず、より多くの人々がまだそれに同意するでしょう。

しかし、今では人々の生産性を本当に向上させ、価値ある経済的な仕事をすることができるシステムがあります。おそらくより良い質問は、私が人工超知能と呼ぶものには何が必要かということです。

アンドリュー・メイン：わかりました。

サム・アルトマン：新しい科学の自律的発見、または新しい科学を発見するためのツールを使用する人々の能力を大幅に向上させることができるシステムがあったとしたら、それは私にとってほぼ定義的に人工超知能のように感じられ、世界にとって素晴らしいことだと思います。

科学的発見への応用と現在の進歩

アンドリュー・メイン：基本的に、それぞれの定義がより良くなり続けるこの勾配のようなものですね。内部でGPT-4にアクセスした時、私はこれで10年間のランウェイがあると感じました。そして、それが自分自身を使い始めた時、推論を入力するのは本当に有能でした。でも、新しい定理や証明を思いついて、「おい、癌のより良い治療法を見つけた」とか、「新しいGLP薬を発見した」とか言った時のことですね。

サム・アルトマン：そうです。つまり、人々の生活をより良くする高次のビットは、より多くの科学的進歩だと私は強く信じています。それが私たちを制限するものです。だから、もしもっと多くのことを発見できるなら、それは本当に非常に大きな影響を与えると思います。

そして私にとって、それは非常にエキサイティングなマイルストーンになるでしょう。AIの他の多くの素晴らしい用途も起こると思いますが、そのことは本当に重要だと感じます。

アンドリュー・メイン：内部で見た兆候はありますか？「ああ、私たちはこれを理解したと思う」と感じさせるようなことを見たことはありますか？

サム・アルトマン：私たちが理解したと言えるようなものはありませんが、追求すべき方向への信頼が高まっていると言えるでしょう。

多分、みんなが話している例ですが、それでも興味深いと思います。人々がAIシステムを使ってコードを書き、コーダーがより生産的になり、したがって研究者もより生産的になっていることです。それは、明らかに新しい科学をしているわけではありませんが、間違いなく科学者が仕事をより速く行えるようにしています。

o3についても科学者から常にこのことを聞いています。だから、私たちが理解したとは言いませんし、私たちがアルゴリズムを知っていて、「よし、これを指摘すれば、それが独自に科学をやってくれる」と言えるとも思いません。しかし、良い推測を得ており、進歩の速度は非常に印象的であり続けています。

o1からo3への進歩を見ていると、数週間ごとにチームが「大きな新しいアイデアがある」と言い、それらがすべて機能し続けました。時々、大きな新しい洞察を発見すると、物事が驚くほど速く進むことがあることを思い出させてくれました。そして、これからも何度もそれを見ることになると確信しています。

モデルの進歩とOperatorの改善

アンドリュー・メイン：最近、OpenAIがOperatorのモデルをo3に変更したことに気づきました。Operatorで大きな改善を感じました。

サム・アルトマン：はるかに良くなりました。

アンドリュー・メイン：そうですね。以前に遭遇した問題は脆弱性でした。エージェントシステムがすべてのことができると約束する人々がいますが、解決できない問題に直面した瞬間に、それは崩壊してしまいます。

サム・アルトマン：興味深いことに、AGIの質問について言えば、多くの人が私に、個人的な瞬間はo3を使ったOperatorだったと言っています。AIがコンピューターをかなりうまく使っているのを見ることには何かがあります。完璧ではありませんが、o3は非常にAGIのように感じられる大きな前進でした。

私にはそれほど同じ程度の効果はありませんでしたが、それは非常に印象的ですが、十分な回数聞いています。

アンドリュー・メイン：私にとってはDeep Researchでした。それが本当にエージェント的な使用法のように感じられたからです。それは私が戻ってきて、興味を持っていたトピックについて、以前に読んだものよりも良いものを作り出したときでした。なぜなら、以前はそれらのモデルは単に多くのソースを取得して要約するだけだったからです。

しかし、システムがインターネットに出て行き、データを取得し、それを追跡し、その手がかりを追跡し、そして戻ってきて、私がするように、しかしより良く行っているのを見たとき、それは興味深かったです。

サム・アルトマン：最近、この男性に会いました。彼は狂ったような独学者の一人で、学習に取り憑かれており、すべてについて知っています。

彼はDeep Researchを使って、好奇心を持ったことについてレポートを作成し、一日中そこに座って、それらを速く消化することが上手になり、次に何を聞くべきかを知っています。そして、学習への狂ったような食欲を持つ人々にとって、それは驚くべき新しいツールです。

アンドリュー・メイン：私は文字通り質問をさせて、これらのことについて音声ファイルを生成してくれる自分のアプリを作りました。私の好奇心はおそらく記憶力を超えています。

Operatorについて、私にとっての魔法の瞬間を話しますが、次にどこに向かうのか興味があります。私はマーシャル・マクルーハンについてやっていて、マーシャル・マクルーハンの画像をたくさん手に入れたかったので、それをするように頼みました。

そして突然、研究のために、これらのもので満たされたフォルダ全体ができていました。それを自分でやるには永遠にかかっただろうことです。

サム・アルトマン：そうです。ワークフローがどのようなものでなければならないか、何かにどれくらい時間がかかるかについて私たちが考えていたことが、ワイルドに速く変わっていくのを見続けると思います。

Deep Researchの活用と時間制約

アンドリュー・メイン：あなたはどのように使っていますか？Deep Researchを？

サム・アルトマン：好奇心を持っている科学について？私は極端に時間に制約されているという奇妙な立場にいます。もし時間があったら、他のほとんどのものを読むよりもDeep Researchのレポートを読むことを好むでしょうが、一般的に読む時間が不足しています。

アンドリュー・メイン：共有機能も素晴らしいです。今では他の人とそれを共有するのが簡単だからです。PDFは素晴らしく、それはクールです。Deep Researchやこれらのツールがあるにもかかわらず、モデル競争が起こっています。

GPT-5の発表時期

アンドリュー・メイン：そして質問が出てくるのはGPT-5のようなものです。そのようなシステムで、能力の向上を見るべきです。GPT-5の時間枠は何ですか？いつ見ることができますか？

サム・アルトマン：おそらく今年の夏のどこかでしょう。正確にいつかはわかりません。私たちが行ったり来たりしていることの一つは、新しいモデルで大きな数字をどれくらい上げるべきか対、GPT-4oでやったように、ただより良く、より良く、より良くしていくことです。

アンドリュー・メイン：GPT-4のリリースを担当しなければなりませんでした。その間、それと3.5の間でテイクテストをしなければなりませんでした。そして3.5はどんどん良くなっていきました。私ができる比較は変わっていました。

だから、私の質問は、GPT-5を知っているだろうか対、うわあ、これは本当に良いGPT-4.5だ、ということです。

サム・アルトマン：必ずしもそうではありません。つまり、どちらの方向にも行く可能性があります。4.5の反復を続けることもできますし、ある時点でそれを5と呼ぶこともできます。

以前はずっと明確でした。私たちはモデルを訓練してそれを出し、それから新しい大きなモデルを訓練してそれを出していました。そして今、システムははるかに複雑になり、それらをより良くするために継続的にポストトレーニングできます。私たちは今これについて考えています。

例えば、GPT-5を起動し、それを更新し、更新し、更新したとします。それらをGPT-5と呼び続けるべきでしょうか、GPT-4oでやったように、または5.1、5.2、5.3と呼んで、いつバージョンが変わるかを知ることができるようにすべきでしょうか？

これにはまだ答えがないと思いますが、4oで処理した方法よりも良いことがあると思います。

私たちは定期的にこれを見ます。時々、人々はあるスナップショットを別のものよりもずっと好み、一つを使い続けたいと思うかもしれません。ここで何かを見つけなければなりません。

モデル命名の複雑さ

アンドリュー・メイン：技術的に傾倒している場合でも、前にoがある場合、これを知っていると理解できます。しかし、そうでない場合でも、o4-miniを使うべきか、o3を使うべきか、これを使うべきかが明確ではありません。

サム・アルトマン：これはパラダイムシフトの産物のような例だったと思います。

アンドリュー・メイン：うーん。

サム・アルトマン：そして、これら二つのことが同時に起こっていました。私たちはこの現在の問題の終わりに近づいていると思いますが、何かはわかりませんが、モデルツリーを再び二股に分ける必要があるような新しいパラダイムを発見する世界を想像できます。

アンドリュー・メイン：さらに複雑な名前ですね。

サム・アルトマン：それをしなくて済むことを願っています。GPT-5とGPT-6に到達することに興奮しており、それは人々が使いやすくなると思います。o4-mini-highやo3や4oを選ぶ必要があるかどうか考える必要はないでしょう。

アンドリュー・メイン：o4-mini-highはコーディングに使っています。会話にはo3です。

サム・アルトマン：私たちはすぐにその全体の混乱から抜け出すと思います。今のところは。

メモリ機能の重要性

アンドリュー・メイン：選択肢があるのは、それらが何を意味するかを知っている時には楽しいですが、それでも、これらのものをより有能にしているが、能力がどこから来ているのかを理解するのを難しくしているもののうちの一つは、メモリのような統合です。

メモリは一つの非常にシンプルなものとして始まり、今ではメモリはより洗練されたものになっています。

サム・アルトマン：メモリは私の最近のお気に入りのChatGPT機能です。GPT-3のようなコンピューターと初めて話すことができた時、それは本当に大きなことのように感じられました。

そして今、コンピューターが私について多くの文脈を知っているように感じます。そして、少数の単語でそれに質問をすると、私の人生の残りについて十分に知っているので、私がそれに何をしてほしいかについてかなり確信を持てます。時には私が考えもしない方法で。それは本当に驚くべきレベルアップでした。そして他の多くの人からもそれを聞いています。

それを好まない人もいますが、ほとんどの人は本当にそれを好んでいます。私たちは、もしあなたが望むなら、AIがあなたの人生について信じられないほどの文脈を持ち、これらの非常に、非常に役立つ答えを与えてくれる世界に向かっていると思います。

プライバシーに関する懸念とNYTの訴訟

アンドリュー・メイン：私にとってはクールです。それをオフにできるという事実も素晴らしいです。しかし、出てきた課題の一つは、OpenAIとのニューヨーク・タイムズの継続中の訴訟で、彼らは裁判所にOpenAIに対して、通常の理由で保持しなければならない30日間の窓を超えて消費者のChatGPTユーザー記録を保存するよう指示するよう求めました。

そして、ブラッド・ライトキャップがこれに応答する手紙を書きました。説明していただけますか？

サム・アルトマン：私たちは明らかにそれと戦うつもりですし、勝利すると思い、願っています。ニューヨーク・タイムズがそれを求めたのは狂った越権行為だったと思います。これは、ユーザーのプライバシーを評価すると言う人です。

しかし、ここで銀の裏地を探すために、私はこれが社会がプライバシーが本当に重要であることを実現する瞬間になることを願っています。プライバシーはAIを使用する中核原則である必要があります。ニューヨーク・タイムズのような会社がAIプロバイダーにユーザーのプライバシーを妥協するよう求めることはできません。そして、社会がAIでプライバシーをどのように扱うかについて社会が持つ必要がある会話を加速することを願っています。

そして答えは、私たちがそれを非常に、非常に真剣に受け止めるということであることを願っています。人々は今ChatGPTとかなりプライベートな会話をしています。ChatGPTは非常に機密性の高い情報源になるでしょうし、それを反映したフレームワークが必要だと思います。

広告とデータ使用に関するOpenAIのアプローチ

アンドリュー・メイン：それは、これを使用している人々や懐疑的な人々からの他の質問を提起します。OpenAIが今このデータにアクセスできるということ、そして訓練についての懸念がありました。OpenAIはいつ、いつ訓練しないかについて非常に明確にしています。それをオフにするオプションがあります。もう一つは、広告のようなことです。それに対するOpenAIのアプローチは何ですか？その責任をどのように処理するつもりですか？

サム・アルトマン：私たちはまだ広告製品を行っていません。私は完全に反対しているわけではありません。広告が好きな分野を指摘できます。Instagramの広告は結構クールだと思います。そこからたくさんのものを買いました。しかし、それを正しくするのは非常に難しく、多くの注意が必要だと思います。

人々はChatGPTに対して非常に高い信頼度を持っており、これは興味深いことです。なぜなら、AIはハルシネーションするからです。あまり信頼すべきでない技術であるはずです。

アンドリュー・メイン：私の友人もハルシネーションしますが、私は彼らも信頼しています。

サム・アルトマン：人々は本当にそうです。しかし、その一部は、ソーシャルメディアやウェブ検索のようなものと比較すると、あなたが収益化されていることがある程度わかり、会社があなたに良い製品やサービスを提供しようとしていることは間違いありませんが、広告をクリックさせようとするようなこともしているということです。

あなたがその会社が実際にあなたにとって最良のコンテンツだと思うものを得ていると、広告との相互作用を試みているものと、どれくらい信じますか？心理的なことがあると思います。

例えば、もし私たちがLLMからの出力ストリームを、私たちにより多く支払っている人のために修正し始めたら、それは本当に悪く感じられるでしょう。そして私はユーザーとしてそれを嫌うでしょう。それは信頼を破壊する瞬間のようになると思います。

もし私たちが、「ねえ、私たちはそのストリームを修正するつもりはありませんが、とにかく私たちが示すであろうそこのものをクリックすると、私たちは取引収益の少しを得て、それはみんなにとってフラットなものです」と言ったら。

もし私たちが支払いの簡単な方法を持っているなら、それは機能するかもしれません。LLMストリームの外側、つまりLLMの出力を台無しにしていないことが本当に明確で、ユーザーにとって本当に有用に感じられる広告があるかもしれません。

しかし、そこでの証明責任は非常に高くなければならず、ユーザーにとって本当に有用で、LLMの出力を台無しにしていないことが本当に明確に感じられなければならないと思います。

アンドリュー・メイン：困難なものになるでしょう。解決策があることを願っています。ChatGPTや本当に良いチャットボットを通じてすべての購入をしたいです。なぜなら、多くの場合、最も情報に基づいた決定をしていないと感じるからです。

サム・アルトマン：それは良いことです。本当に明確で整合的な方法でできるなら。でも、わかりません。私たちが良いサービスを構築することが大好きです。人々は私たちにお金を払います。それは非常に明確です。

競合他社との比較

アンドリュー・メイン：それが利点です。モデルの違いは、Googleが素晴らしいものを作っていると思うということです。新しいGemini 2.5は本当に良いモデルだと思います。

サム・アルトマン：本当に良いモデルです。

アンドリュー・メイン：そうです。彼らは「うん、これらのものは良い」から行きました。しかし、結局のところ、Googleは広告技術会社です。そして、それが私がいつも考えることです。彼らのAPIを使うことなどはそれほど心配していませんが、彼らのチャットボットを使っているとしたら、それが私の考えることは、彼らのインセンティブがどこに整合しているかということです。

サム・アルトマン：Google検索は長い間素晴らしい製品でした。私にはそれが劣化したように感じられます。でも、多くの広告があったが、それでもインターネット上で最高のものだと思った時期がありました。つまり、私はGoogle検索が大好きでした。

だから、良い広告駆動型会社になることは明らかに可能ですし、Googleがやったことの多くを尊敬していますが、明らかに問題もあります。

アンドリュー・メイン：Appleユーザーとして、Appleモデルが気に入ったのは、電話に多くのお金を払っていることを知っていますが、彼らがそこにこれらすべてのものを詰め込もうとしていないことを知っているということです。彼らはiAdsをやりましたが、それはあまり効果的ではありませんでした。おそらく彼らの心が本当にそこにはなかったことを示しています。

サム・アルトマン：彼らの心は本当にそこにはありませんでした。

アンドリュー・メイン：そうです。だから、興味深いことになるでしょう。私たちはただ見続けて、これを見て、「ChatGPTが本当にこれを推し進めている」と考え始めたら、これについて疑問に思い始める必要があります。

サム・アルトマン：私たちがすることはすべて、明らかに狂ったほど前もって明確である必要があります。

モデル調整とユーザー体験の課題

アンドリュー・メイン：問題がありました。モデルアップデートがあり、その後起こったことは、明らかにモデルが少し好意的すぎる、少し同意しすぎるようになろうとしていました。それは、人々がこれらのシステムをより多く使用し、それとの関係を発達させる際の人間とAIの相互作用を提起します。

その形を見てきて、性格についてのOpenAIの立場は何ですか？

サム・アルトマン：ソーシャルメディア時代の大きな間違いの一つは、フィードアルゴリズムが社会全体、そしておそらく個々のユーザーにも、多くの意図しない負の結果をもたらしたことでした。彼らはユーザーが瞬間に欲しがっていた、または誰かがそのユーザーが欲しがっていると思ったことをしていましたが、それはサイトで時間を過ごし続けることでした。

そして、それがソーシャルメディアの大きな不整合でした。そして、人々を怒らせることが、幸せで満足感を与えるよりも、より彼らを立ち往生させるような、他の多くのことがあったと思います。

AIで新しい問題があることは常に知っていました。明らかではない方法で不整合であるようなことがあるでしょう。

しかし、私たちが経験した最初のもののうちの一つは、一つの与えられた応答に対してユーザーに何を求めるかで、それからユーザーに最も役立つモデルを構築しようとすることでした。ユーザーに二つの応答を見せて、「どちらがより役立ちますか？」と聞く場合、任意の与えられたことについて、モデルが一つの方法で行動することを望むかもしれませんが、AIとのすべての相互作用の過程で、それは一致しないかもしれません。

ユーザーシグナルにあまりにも多く注意を払うと、これらの問題を見ることができ、私たちも見ました。そして私たちが事後検証で話し合った他の多くのことですが、これは興味深いものだと思います。短期的な地平線では、長期的にユーザーが最も望む、または最も役立つ、または有用、または健康的な行動を得られません。

だから、フィルターバブルとの類推は、短期的な地平線でユーザーに役立つが、長期的な地平線では役立たないAIになるでしょう。

画像生成モデルの進歩

アンドリュー・メイン：その兆候だと思ったのはDALL-E 3で、技術的には本当に有能なモデルだと思いましたが、すべて一種の画像ジャンルになり始めました。

そしてすべてHDRスタイルのようになり、それは、これらの二つのことを孤立して見て、「私はこちらの方を好む」とユーザーが言ったそのような比較をすることからでしたか？

サム・アルトマン：DALL-E 3については覚えていませんが、そうだと思います。

アンドリュー・メイン：それは良くなったと思います。新しい画像モデルは素晴らしいです。

アンドリュー・メイン：狂ったほど良いです。そして、ここからどこに向かうのか想像できるだけです。

プロジェクト・スターゲートの詳細

アンドリュー・メイン：これらのものを構築して使用量を増やしているとき、それは常にある種の問題でした。新しい画像モデルが出て、使用量を制限し、Soraのように、それをするための特定の量の計算しか持てません。これは、みんなが直面している大きな問題、つまり計算を説明しています。

そして、これに対処するために、プロジェクト・スターゲートについて聞きました。これは非常にクールな名前で、コンピューターが関わっています。それ以外では、多くの人が5000億ドルという価格タグを見て、「待って、何？」と言っています。スターゲートについて私の母に与える簡単な説明は何ですか？

サム・アルトマン：非常にシンプルだと思います。これは、前例のない量の計算資源を資金調達し、構築する取り組みです。

人々が、私たちが人々がやりたいことをするのに十分な計算資源を持っていないのは完全に真実です。しかし、もし人々がより多くの計算資源で何ができるかを知っていたら、彼らははるかに、はるかに多くを求めるでしょう。

だから、今日世界に提供できるものと、10倍多い計算資源で、またはいつか願わくば100倍多い計算資源で世界に提供できるものとの間には、信じられないほど巨大なギャップがあります。

そして、私が働いてきた他の技術とは異なるAIについて、少なくとも世界中の数億、数十億の人々に有用に配信する規模でのAIは、インフラ投資がどれほど大きくなければならないかということです。

そして、スターゲートは、多くの資本と技術と運用専門知識を一緒にまとめて、次世代のサービスをそれらを望むすべての人々に配信し、知能をできるだけ豊富で安価にするためのインフラを構築する取り組みです。

アンドリュー・メイン：これは大規模なプロジェクト、グローバルプロジェクトです。以前話しましたが、パートナーの一つはUAEです。あなたはそれに取り組んでいます。世界中の他の政府と取り組んでいます。考慮事項の一つは、5000億ドル、500,000,000,000です。お金はありますか？

サム・アルトマン：文字通り今日銀行口座に座っているわけではありませんが、それほど多くの年月をかけずにそれを展開します。本当に何かが間違って、これらのコンピューターを構築できないことが判明しない限り。人々がそれに対して良いものであることを確信しています。

私は最近、アビリンで構築している最初のサイトに行きました。それは、スターゲートへの最初のコミットメント、5000億ドルの約10%になるでしょう。それを見るのは信じられません。ギガワット規模のサイトがどのようなものかを頭では知っていました。

しかし、実際に構築されているものを見に行き、建設をしている何千人もの人々を見て、GPUが設置されている部屋の中に立って、全体のシステムがどれほど複雑で、それが進んでいる速度を見るのは、かなりのものです。

次のサイトについてはすぐにもっと共有する予定ですが、鉛筆についての素晴らしい引用があります。標準的な木と黒鉛の鉛筆で、誰も一人でそれを作ることはできません。そしてそれは資本主義の魔法です。世界がこれらのことをするために調整されるのは本当に奇跡です。

そして、最初のスターゲートサイトの中に立って、これらのGPUのラックを動かすのに必要だったグローバルな複雑さについて本当に考えていました。携帯電話を取り出してChatGPTに何かを入力し、答えを得るとき、この時点でおそらくそれが特に驚くべきことだとは思わないでしょう。それが機能することを期待するだけです。

最初に試した時はあったかもしれません。「それは本当に素晴らしい」と思ったでしょう。しかし、これらの苦労して得られた科学的洞察を得るために、そして工学と会社と複雑なサプライチェーンを構築し、この魔法のラックをどこかに置くために世界を再構成しなければならなかった、少なくとも数百年間、信じられないほど懸命に働いた人々の最後の千年間にわたって起こった仕事です。

そのすべてに入ったものについて考えてください。それを、岩を地面から掘り出して何が起こるかを見ていた人々まで遡って辿り、あなたが今ChatGPTに何かを入力してそれがあなたのために何かをするようになったのです。

イーロン・マスクとの対立

アンドリュー・メイン：プロジェクト・スターゲートの開発と国際的パートナーシップ、特にUAEについての舞台裏の話を読みました。そして、イーロン・マスクがそれを阻止しようとしたということです。あなたは何を見ましたか？何を聞きましたか？見解は何ですか？

サム・アルトマン：選挙後に、イーロンが政府での彼の権力を不公正に競争するために悪用するつもりはないと、内部的にも、また外部的にも言ったと思います。

そして、私がそれについて間違っていたことを後悔して言わなければなりません。一般的に間違っているのは好きではありませんが、主に彼がこれらのことをするのは国にとって本当に残念だと思い、彼がそうするとは本当に思わなかったのです。

政権がそのような行動に対して本当に正しいことをし、立ち向かったことに感謝しています。

しかし、それは最悪です。

競争環境の変化

アンドリュー・メイン：変わったことの一つだと思いますし、グレッグ・ブロックマンがこれについて話していたと思いますが、数年前には人々が「最初に到達した人が勝者で、それで終わり、ゲーム終了」と考えていました。そして今、他の場所に素晴らしいAI研究所があることがわかります。Anthropicは素晴らしいツールを構築しています。Googleは本当にゲームを上げていると思います。

あらゆる場所で良いことが起こっており、一人が逃げ出すことはないでしょう。

サム・アルトマン：同意します。私が最も好きな例は、AIの発見がこれと類似していることです。完璧ではありませんが、近いです。多くの驚くべき点でトランジスタの発見に対して。

しかし、多くの会社がそれに基づいて素晴らしいものを構築するでしょうし、最終的にはほぼすべての製品に浸透するでしょう。しかし、常にトランジスタを使うことを考えないでしょう。

だから、多くの人々がこの信じられない科学的発見に基づいて本当に成功した会社を構築すると思います。

そして、イーロンがそれについてより少ないゼロサムであることを願います。

アンドリュー・メイン：またはネガティブサム。

アンドリュー・メイン：パイがどんどん大きくなると思います。エネルギー会議にいましたが、エネルギー生産やハイパースケーリングに関わる人々と話すのは興味深く、彼らが使った用語はトピックでした。

エネルギー要件の課題

アンドリュー・メイン：そして、それはエネルギー要件を提起します。Grok 3について、彼らはそのモデルを訓練するために駐車場に発電機を置かなければならなかったようです。そして、質問は、エネルギーがどこから来るのかということです。お金は理解します。エネルギー、必要なエネルギーの規模を考えるとき。

サム・アルトマン：あらゆるところからだと思います。今は大きなミックスだと思います。最終的には、私は先進的な核、核分裂と核融合の両方について非常に興奮しています。しかし、今のところ、それは全体のポートフォリオの全体的なミックスだと思います。ガス、太陽光、つまり、本当に核、すべてです。

アンドリュー・メイン：すべての上記のようなものですね。アルバータのような、エネルギーへの多くのアクセスがあり、そこでそれに対する需要があまりない地域で働いていた人々と話していました。そして今、これは私が考えもしなかった全体的な絵です。

サム・アルトマン：伝統的に、世界中でエネルギーを移動させるのは非常に困難です。ほとんどの種類で。しかし、エネルギーを知能と交換し、その知能を世界中に移動させると、はるかに簡単です。だから、巨大な訓練センターや大きな推論クラスターでさえ多くの場所に置き、インターネット上で出力を出荷することができます。

宇宙科学データの処理

アンドリュー・メイン：開会でイベントがあり、ジェームズ・ウェッブ宇宙望遠鏡で働いていると思う誰かがいました。彼は、彼らがこのテラバイトのデータをすべて取得しようとしているが、それに取り組む十分な科学者がいないという彼の最大のボトルネックについて話しました。

データを調べる十分な人がいません。そして、ここに宇宙についての答えがあり、私たちの前にあり、それは大きなデータ問題のようです。

サム・アルトマン：OpenAIが十分なお金を持っているとき、私たちがすべきことの一つは、巨大な粒子加速器を構築して高エネルギー物理学を一度に解決することだといつも冗談を言っています。

それは勝利的で素晴らしいことだと思うからです。しかし、本当に、本当に賢いAIが、より多くのデータなし、より大きな粒子加速器なしで、私たちが現在持っているデータを見て、それを解決する可能性は何でしょうか。

それは不可能ではありません。

そして、すでにそこに多くのデータがあるという質問があります。世界には多くの賢い人がいますが、知能がどこまで行けるかわかりません。これ以上の実験なしで、どれだけもっと理解できるでしょうか？

アンドリュー・メイン：1990年代初頭に誰かがOzempicのような形を見つけて、薬会社に提示し、彼らが「いや、それには手を出さない」と言ったという話を読んだことを覚えています。

そして、それは人々の人生を変える薬になりました。慢性肥満の人々にとって、それは生活の質を向上させるでしょう。これは25年間そこに座っていました。

サム・アルトマン：私たちが見つけるであろう他の多くの例があると思います。既存の薬が何か良いことをすることを既に知っているが、他の大きな方法で再利用可能であったり、いくつかの小さな修正で、私たちは何か素晴らしいものに非常に近いところにいます。

そして、この種の仕事に現在世代のモデルを使用している科学者から聞くのは非常に心強いものでした。

物理学とchemistry理解モデル

アンドリュー・メイン：次世代モデルのために必要なもののうちの一つは、物理学と化学を理解するモデルのようですね。Soraはそれに対する試みですか？

サム・アルトマン：ニュートン物理学のようなものは理解するでしょう。新しい化学の発見や新しい、新しい物理学や新しい理論物理学のようなものに役立つかどうかはわかりません。

しかし、推論モデルに使用する技術がこれらのことで大いに役立つと楽観的です。

推論モデルの仕組み

アンドリュー・メイン：推論モデルがどのように機能するかの短い定義と、GPT 4.1に何かを聞くのとの違いは何ですか？

サム・アルトマン：GPTモデルは少し推論できます。実際、GPTモデルの初期の頃に人々を本当に興奮させたことの一つは、モデルに「ステップバイステップで考えましょう」と言うことで、より良いパフォーマンスを得ることができることでした。

そして、それはステップバイステップで考えているテキストを出力し、より良い答えを得ることができました。それがまったく機能することは何種類か驚くべきことでした。推論モデルはそれをずっと先に押し進めているだけです。

アンドリュー・メイン：質問を分解できるとき、各ステップにより多くの時間を送ることができるというアイデアですね。

サム・アルトマン：あなたが私に何か、質問をするとき、本当に簡単な質問なら、私はほとんど反射的に答えを返すかもしれません。しかし、より困難な質問なら、私は頭の中で考え、内的独白を持って、「これかあれをすることができる、あるいはもしかしたらこれがより明確になるかもしれない」と言うかもしれません。

それについて確信がありません。そして私は後戻りして、ステップを再追跡することができます。そして、考えを終え、英語で考えた後、いくつかの箇条書きを作って、それから英語であなたに答えを送ることができます。

推論時間の価値

アンドリュー・メイン：今アプリを使用するときに観察した興味深いことの一つは、Deep Research質問をしたり、何かをして離れてロック画面に行くと、まだ処理して考えているという通知を受けます。

他の会社の誰か、Anthropicだったと思いますが、何かが費やした時間の長さという指標を使っていました。「このモデルは実際に何かについて考えるのに15分や30分などの時間を費やした」と言っていました。それは良い指標ですが、実際に正しい答えを与える必要があります。

サム・アルトマン：私が驚いたことの一つは、人々が素晴らしい答えを待つことを驚くほど喜んでいることです。モデルがしばらく考えている場合でも。私のすべての直感は、瞬間的な応答が重要なことで、ユーザーは待つことを嫌うというものでした。

そして多くのもので、それは真実です。しかし、本当に良い答えでの困難な問題については、人々はかなり喜んで待ちます。

ハードウェア開発への取り組み

アンドリュー・メイン：これらすべてのツール、すべてのものがあります。これまで、私は電話を使っています。そして今、OpenAIはハードウェアを構築していると発表しました。あなたとJony Iveが数年間話し合い、協力してきたという動画がありました。

明らかに、あなたは、まあ、これを聞くことはできます。今あなたの身に着けていますか？

サム・アルトマン：いいえ。そうではありません。

アンドリュー・メイン：わかりました。

サム・アルトマン：しばらくかかるでしょう。

アンドリュー・メイン：わかりました。

サム・アルトマン：私たちは狂ったほど高いレベルの品質で何かをしようとしており、それは速く来ません。

しかし、コンピューター、ソフトウェアとハードウェア、現在のコンピューターの考え方は、AIのない世界のために設計されました。そして今、私たちは非常に異なる世界にいて、ハードウェアとソフトウェアに求めるものが非常に急速に変化しています。

あなたはその環境をはるかに認識し、あなたの人生ではるかに多くの文脈を持つ何かを望むかもしれません。タイピングして画面を見るのとは異なる方法でそれと相互作用したいかもしれません。

私たちはしばらくの間それを探求してきており、本当にかなり興奮しているいくつかのアイデアがあります。この種の世界でコンピューターを使うことが何を意味するかに人々が慣れるのに時間がかかると思います。なぜなら、それは今非常に異なっているからです。

しかし、本当にAIがあなたの人生のすべての文脈を理解し、あなたの質問を理解し、あなたの代わりに良い判断をすることを信頼していたら、会議に座らせ、会議全体を聞かせ、それが何であったかを知らせ、誰と何を共有することが許可されているか、誰とも共有すべきでないことを知らせ、あなたの好みがどのようなものかを知らせることができます。

そして、一つの質問をして、適切な人々と適切なフォローアップを行い、あなたが望む方法でコンピューターを使って完了させる全く異なる種類を想像できます。

デバイスデザインの考慮事項

アンドリュー・メイン：ChatGPTと相互作用する方法が、ある種デバイスに情報を提供しますね。

サム・アルトマン：つまり、ChatGPTと相互作用する方法は、前世代のデバイスによって知らされたとも言えるでしょう。だから、これはある種の共進化するもののようなものだと思いますが、そうなることを願っています。

アンドリュー・メイン：電話をそれほど普及させたもののうちの一つは、公共の場でいて画面を見ることができるということでした。プライベートでいて電話をかけてそれと話すことができました。そして、新しいデバイスの課題の一つは、公共と私的で使うもののギャップを埋めようとすることだと思います。

サム・アルトマン：電話は信じられないものです。つまり、多くの理由で本当に素晴らしいものです。

あらゆる場所で使用できる一つの新しいデバイスを想像できますが、私が公然と行うことと、おそらく家でのようなことは異なることもあります。家では、音楽に素晴らしいステレオシステムが組み込まれています。世界を歩いているとき、私はAirPodsを使い、それは私を悩ませません。

だから、パブリックと私的使用ケースで異なることがあると思いますが、汎用性は重要だと同意します。

アンドリュー・メイン：それはあなたとともにそれに従います。だから、来年まで何もありませんね。

サム・アルトマン：しばらくかかるでしょう。

アンドリュー・メイン：わかりました。

サム・アルトマン：待つ価値があると願いますが、しばらくかかるでしょう。

若い世代へのアドバイス

アンドリュー・メイン：わかりました。興奮して興味があります。私には考えがあります。

今25歳の人にアドバイスを与えるとしたら、何を言いますか？

サム・アルトマン：明白な戦術的なことは、おそらくあなたが私に期待するであろうことでしょう。AIツールの使い方を学ぶことです。世界が平均的な20歳、25歳に「プログラムを学べ」と言うことから「プログラムは重要でない。AIツールを使うことを学べ」と言うことに、どれほど速く変わったかは面白いです。

次に何が来るかわかりませんが、もちろん、次の何かがあるでしょう。

しかし、それは非常に良い戦術的アドバイスです。そして、より広い前線では、レジリエンス、適応性、創造性、他の人が何を望んでいるかを理解するなどのスキルを信じています。これらはすべて驚くほど学習可能だと思います。

ChatGPTを使う練習をしろと言うほど簡単ではありませんが、それは実行可能です。

そして、これらは次の数十年間で大いに報われるスキルの種類だと思います。

アンドリュー・メイン：45歳の人にも同じことを言いますか？今の役割でそれを使うことを学ぶだけですか？

アンドリュー・メイン：おそらく。