OpenAIの主任科学者ヤコブ・パハツキとシモーン・セドールが、AI進歩の測定方法、AGI(汎用人工知能)の定義、そして次のブレークスルーがどこから生まれるかについて語る。二人はポーランドの同じ高校出身で、優秀なコンピュータサイエンス教師の下で学んだ。国際数学オリンピックでの金メダル獲得、プログラミング競技での成果、そして推論モデルの登場など、最近のAI分野での驚異的な進歩について詳しく解説する。また、現在のベンチマークの限界、AGIに向けた道のり、そして高校生へのアドバイスまで幅広く議論している。

AGI進歩への道のりと測定の難しさ
こんにちは、私はアンドリュー・メインです。これがOpenAIポッドキャストです。今日のゲストはOpenAIの主任科学者ヤコブ・パハツキとシモーン・セドールです。AI進歩の測定方法、AGIをどう判断するか、そして次のブレークスルーがどこから生まれるかについて話していきます。
モデルはその問題で進歩を遂げられなかったことを正しく認識することができました。私たちは組織として信じられないほど速いペースでの進歩に準備ができているかという質問を非常に真剣に問い始めました。
OpenAIでの研究プログラムをどう形作るかを考える時、私たちは非常に汎用的な知能を創造することを目指しています。まず、あなた方の役割を理解することから始めたいと思います。
ヤコブ、あなたはOpenAIの主任研究者、主任科学者ですね。主任科学者です、はい。主任科学者とはどういう意味ですか?
私が主に責任を持っているのは、会社の研究ロードマップを設定することです。つまり、私たちがどの技術的道筋に賭けるかを決定し、長期的に追求していく基礎研究は何かを決めることです。
シモンさんはどうですか?何をされていますか?
いろんなことやな。いろんなこと、そうか。まあ、主にIC(個人貢献者)の仕事をやっとります。リーダーシップを少し振りかけたりもしてるけど、とにかく一番役に立つことをやろうとしてます。
お二人はOpenAIで働く前からお互いを知っていたんですよね?
そうですね、同じ高校に通ってました。同じ高校です、はい。友達だったんですか?
親友になったのは高校を卒業してからやと思います。アメリカに来るっていう感情的な体験が絆を形成したんやと思います。高校の時はどちらかっていうと同僚みたいな感じでしたね。
どんな高校があなた方みたいな人を育てるんですか?
私たちはポーランドの高校に通ってました。そこに引き寄せられたのは、ラシャード・スバロフスキー先生っていうコンピュータサイエンスの教師がいたからです。その先生は私たちが行く前から、コンピュータ科学者やプログラマーを育てる素晴らしい実績を持ってて、プログラミング競技に重点を置いて、この分野での卓越性を追求することに焦点を当ててました。
高校時代の深い学習体験
そうですね、それは本当に人格形成的な体験で、私たちにとって素晴らしいメンターでした。ああ、すごいですね。確かに、キャリアは本当にプログラミングを深く掘り下げることでした。典型的な高校のカリキュラムをはるかに超えて、グラフ理論や行列など、いろんなことがありました。
実際に、ChatGPTがあることで、今は人々がこの種の深い探求をするのが少し楽になったんじゃないかと思います。適切なメンターと多くの作業なしには、その体験を再現するのはちょっと難しいですからね。
私はそれを使って物事を説明してもらってます。例えば、ドアを選ばなければならないモンティ・ホール問題がありますよね。ChatGPTに行って「これのグラフィック付きのインタラクティブ版を作って」と言うと、突然それを見ることができます。一つのことをしたり別のことをしたりした場合の異なる解決策を見せてくれます。
これは、テキストで説明するだけでなく、マルチメディアを構築し、いろんなことができる能力について私が興奮していることの一つです。そして、それに対する測定方法が実際にはないという領域に入ります。これまで存在しなかった使用例で、私たちはAGIについて話しますが、非常に曖昧な定義しか持ってません。技術的な観点と一般人の理解の両方から、それをどう説明するかを聞いてみたいです。
AGIの定義と現在の到達点
まあ、教育についてのポイントに対処するなら、何かの概念のより良い説明や教育方法は確実にtragicの強力な使用例で、私たちの先生のような教師とうまく機能すると思います。同時に、彼が提供できたのはもっと感情的なサポートと空間で、これはAIが一人でやるのは難しいと思います。
それは素晴らしい指摘です。時々人々が「AIが教育を置き換える」と話すのを聞くと、それがよく見落とされると思います。私にとって、事実が常に正しくない教師もいたけど、心がそこにあって気にかけてくれて、質問に答えてくれました。
これらはそれに対する仲間であり、これらのツールを使う教師はより有能な教師になれると思います。
でもAGIの話題について、まず技術的な定義を教えてください。実際、技術的な質問ではなく、例えば弟や妹と話しているような感じで説明してもらえますか?
数年前にAGIについて話していた時、深層学習の技術は信じられない可能性を持っているけれど、同時にその概念はまだ少し抽象的で遠いもののように感じられました。人間レベルの知能について話すにしても、自然に会話する能力について話すにしても、数学問題を解く能力や研究を追求する能力について話すにしても、それらはすべて同じ空間にあるように感じられました。
技術が進歩した今、これらは実際にはかなり異なる能力であることがわかります。そして私たちは、AIが幅広いトピックで自然に会話できる地点にかなり明確にいると思います。数学問題を解くこともできます。IMO(国際数学オリンピック)で金メダルを獲得することは、長い間AGIへの道のりのマイルストーンとして議論してきたことで、それが起こりました。
AGIの実用的な定義と影響
全国数学競技のすべての問題を解くことは、実際にはもう少し難しくて、AGIへの道のりのもう一つのマイルストーンだと思います。しかし、ますます、この種の点ごとの測定では不十分だということがわかってきて、実際に世界にどんな影響を与えるかについて考えるようになりました。
個人的に、AI進歩が世界に意味のある影響を与える方法について考える時、まず新しい技術の発見と生産を自動化する可能性について考えます。私たちは新しいアイデアや根本的な技術進歩を人間の独創性と関連付ける傾向があります。
私たちの進歩を主要なマイルストーン発明や技術革命によって測定します。このプロセスのほとんどを自動化することが可能だということを内面化するのは難しいです。世界の理解を根本的に変えるアイデアを思いつく大きなコンピュータを持つことが可能だということです。
そして、それはそれほど遠くないと実際に思います。それと私たちを分けるものは何か、そのような技術の結果は何かを考えることが、私の最初の考えです。
私はオープンソースモデルのGPD OSSを実行させたくて、小さなMac Studioを注文しました。24時間365日それを実行させて生成させる考えは私にとって魅力的です。
でもあなたは基本的に科学を大規模に自動化することについて話していますね。それで、どんな発見、どんなことが最初に見られると思いますか?
汎用性重視の研究アプローチ
OpenAIでの研究プログラムを形作る方法を考える時、非常に汎用的な知能を創造することを目指しています。自動化された研究者を優先事項として推進しますが、特定のドメインを取ってそこにこの技術を展開しようとは考えていません。それはより速い点ごとの進歩をする方法だと思います。
しかし、本当に大きな発見と最も意味のある技術進歩の可能性は、この汎用性から来ると思います。とはいえ、この技術が他のドメインよりも適用しやすいドメインがあることは確かです。
特に、大量の推論と多くのドメイン知識と直感を組み合わせる場所は、これらのシステムに非常に適しているようです。特に医学でかなり信じられない結果を見ており、それは非常に励みになります。それについて高い期待を持っています。
当然ながら、AI研究者の会社として、私たち自身の仕事を自動化することについてたくさん考えています。これもまた、AIが実際にAI研究を自動化できる地点に到達できるなら、それはおそらく自動化すべき非常に重要なことだと思います。同様に、AI整合性と安全性の研究の自動化にどう役立つかについても考えています。
IMOでの成果と数学的推論
IMOの結果には明らかに感銘を受けています。実際に、ヤコブと過去にIMOについて話していた時、それは数年前のことでしたが、私たちはまだAGIの定義が何かを理解しようとしている段階でした。考えていた概念の一つは、数学オリンピックのすべての問題を解くことのようなものでした。
それが適切に感じられた理由は、そのような優れた数学的推論を持つモデルがあれば、数学的にモデル化できる多くの異なるドメインを破壊できるはずだからです。
これは、内部の視点をもう少し共有する良い機会だと思います。私は進歩に驚嘆しました。
時々、AIの経済的影響はわずか3%や5%だけという見出しを見ます。それらの見出しにはしばしば、AIが減速しているとか、人々がAIを誇大宣伝しすぎていて、わずか3%だから何が起こっているのかというコメントが伴います。
そのような見出しを見る時、10年前のことを思い出します。私は深層学習で自然言語処理に取り組んでいましたが、その頃は本当にうまくいきませんでした。ヤコブが一度、私たちが取り組んでいた技術の一つをテストしに来たのを覚えています。それは文の感情を検出しようとするもので、「この映画は悪い」を正しく否定的に分類し、「この映画は良い」を正しく肯定的に分類しました。しかし、彼が「この映画は悪くない」と言うと、モデルは「ああ、否定的」と答えました。
それが10年前でした。それ以来、ゆっくりとこのようなタスクを解決し始めました。この単語が名詞か動詞かを決める感情ニューロンのようなタスクを解決し、それからGPT-1、GPT-2が意味のある段落のテキストを生成し始めました。それはそのような画期的な出来事でした。今ではとてもシンプルに感じますが、その時は画期的でした。
それからGPT-3、GPT-4がありました。GPT-4は私にとって個人的なAGI の瞬間のようなものでした。時々私を驚かせることを言うからです。このモデルが実際に私を驚かせることができるのかと思いました。
AI進歩の実感と測定の課題
その頃はまだChatGPTを個人使用する時は、ちょっとしたニュアンスがあって、少し良いGoogleのように感じられましたが、大したことじゃありませんでした。それから突然Deep Researchが出てきて、これは実際に質問に答えることができて、めったに作り話をしません。
それは有用に感じられました。そして最後に今、プログラミング競技で競争できるモデルがあります。これは私にとって個人的に非常に困難で、明らかにヤコブにとってはなおさらです。この技術に取り組んでいる人の視点から見た進歩のペースは絶対に素晴らしいです。
その3%を見る時、10年前にそれを定量化しなければならなかったとしたら、おそらく0.00001%かそんなところでしょう?本当に、これらの数字は視野に入れる必要があると思います。1年後には10%になり、2年後には20%になると信じない理由はありません。
経済のグラフを、例えば90年代初頭のワールドワイドウェブから現在まで見て、インターネットが経済に起こった点を指摘してくださいと言われても、その点を見つけることはできないと言われています。ティム・バーナーズ・リーがこれを発表したという点はありません。AIもそれと似ていると思います。人々は「私たちはこれしか測定していない」と言いますが、私たちの測定は困難で、誰がどのように使っているかを知るのは難しいです。
もし長い間それを追ってきたなら、私は自分のコンピュータで非常にシンプルな次の文字予測器を訓練したことを覚えています。それはひどいものでした。一つは小さなコンピュータを使っていたからですが、それでもです。それからBERTで遊んで、感情分析をやりました。
しかしGPT-2が出た時、私はGitHubでGPT-2のすべての出力を読みました。GPT-2が出たすべての出力を読んだのは、何かが起こっていると思ったからです。
それが私がOpenAIで働くようになった理由です。そのことに夢中になっていたからです。GPT-3にアクセスできるようになって、ああ、これは本当にこの道を進んでいると言い続けました。
でも今はちょっとクレイジーです。6週間経ってベンチマークが破られないと、人々は「ああ、壁にぶつかった。壁にぶつかった」と言うからです。問題の一部は、ベンチマークが適度な改善を見せるように感じることだと思います。いくつかのベンチマークには問題があると聞いています。実際に間違った答えがあるものもあって、正しく答えても100%を取ることは不可能です。
でも、私たちは内部で使う用語について話しています。飽和という言葉を人々が話しているのを聞いたことがあります。それについて話してもらえますか?
ベンチマークの飽和問題
今、ベンチマークでいくつかの問題にぶつかっていると思います。はい、かなり明確な一つは飽和で、それはモデルが本当に、知能や能力の標準化された測定形式で人間レベルに到達している地点です。世界中の最高の競技者がいる非常に困難な高校競技でトップクラスで演技できるなら、この非常に制約された測定を持つことは非常に困難になります。
以前、GPT-1、GPT-2、GPT-3、GPT-4のスケーリングパラダイムを見ていた時、ベンチマークは本当に潮の上昇を測定していただけでした。
今では、この分野は特定の能力に対してより効率的な訓練方法をたくさん開発しています。これらのベンチマークで訓練するという意味ではありませんが、例えば書く能力と比べて数学が不釣り合いに得意なモデルを訓練できます。数学ベンチマークではより良い結果を出しますが、他のトピックでの全体的な知能を代表するものではなくなります。
この二つの問題が組み合わさって、これらのモデルの報酬効用、特に新しい洞察を発見する能力について本当に考えなければならないと思います。
見落とされがちなのは、テストをよく受けるモデルを作ることはできるけれど、そのモデルが実際の仕事に役立つとは限らないということです。理想的には、モデルはテストで良いスコアを取るべきですが、モデルがこれらのスコアを取ったからといって、個人的に有用だと思えるわけではありません。
それは確実に今私たちが直面している挑戦で、人々がモデルが良いか悪いかと言う時、一律の評価を作ろうとしているようなものですが、それには100の異なる使用例があります。モデルが良いか悪いか?クリエイティブライティングは素晴らしいかもしれませんが、数学は悪いかもしれません。数学は素晴らしいかもしれませんが、クリエイティブライティングは悪いかもしれません。それは本当に大きな挑戦になります。
数学オリンピックの意義と推論能力
数学の国際数学オリンピックやこれらの種類の測定について話してきました。なぜそれらが重要なのでしょうか?なぜこれらの種類の人間レベルの競技に投入することが重要なのでしょうか?
国際数学オリンピックのような競技に興奮してきた理由は、制約されていて多くの知識を必要としないが、1時間か2時間か3時間、問題について一生懸命考える能力を本当にテストするテストのかなり興味深い例だからです。
これらの問題は困難だという非常に良い証拠があります。多くの人がそれらを解こうとして競争し、それらにとって重要です。多くのことを知ることに優れているが、過去に必ずしも非常に一生懸命考えることに優れていないモデルにとって、それは本当に取り組むべき適切なマイルストーンのように思えました。
私の理解では、そこで金メダルレベルのスコアを取ったモデルは、電卓を使っていませんでした。他のツールを使っていませんでした。フレームワークのいくつかを使っていませんでした。純粋に推論を通してそれを行っていました。
そうです、そうです。国際数学オリンピックでは、モデルは電卓のような他のツールを使っていませんでした。そして2年前、二つの4桁の数を掛けるように頼むと、失敗していました。
でも確実に、この種のコンテストでは、限定された数学の領域ではありますが、公式を適用することではなく、かなりクリエイティブな思考について本当に重要です。
ベンチマークの限界と新しい測定方法
しかし、数学から離れ始めると、それは困難になるという挑戦の一部だと思います。人類最後の試験のようなものを考え出すことができて、それはかなり巧妙なテストだと思いますが、特定のモデルが特定の種類のツール使用を学んだ後、これらの問題をより良く解く方法を何となく理解するようになることがわかります。
どんな種類のベンチマークが必要になるでしょうか?能力の客観的な測定を得ることができると言うために、何を見ているでしょうか?
過去に私を驚かせたことの一つは、ここの同僚の一人、アンナ・マカンドゥと話していた時のことです。IMOについて話していて、進歩に興奮していると話していたら、彼女は「何それ?」という感じでした。それは私にとって非常に面前の瞬間でした。私たちがちょっとバブルの中に住んでいることを実感したからです。
私にとってその競技は重要に感じられ、特にIII(国際情報オリンピック)のコンピュータサイエンスの対応物は、私の人生の大きな部分だったからで、ここの多くの同僚にとってもそうです。しかし実際に、他の分野で働いている平均的な人や、数学やコンピュータサイエンスにそれほど興味がない人、歴史に興味がある人にとっては、アンナは5言語を話すので、彼女にとってはそれに基づく異なる測定が興味深いでしょう。
完璧な測定ではありませんが、少なくとも私たちを正直にし、バブルから逃れるのを助ける一つのことは、ChatGPTです。みんながChatGPTを使って、あらゆる種類の使用例で使っているからです。明らかにそれを測定として使うことには多くの落とし穴がありますが、少なくとも私がより馴染みのあることと他の人が他のことを評価するかもしれないという特定の問題を避けることができ、非常に広いカバレッジを与えてくれます。
推論能力の評価と計算量の活用
そしてそこでも、GPTを構築してより複雑なことをしている人々のユーザーのサブセットがあります。以前にも言及しましたが、モデルがより長く推論するという事実は、能力を評価する非常に興味深い方法のように思えます。
そうですね。そしてこれはまた、ChatGPTの広い採用とAIの進歩の測定基準としてのAIの使用にのみ焦点を当てることの挑戦の一つかもしれません。
これはまだ非常に意味のある程度には起こっていないと思いますが、かなり早く起こり始めると思います。ユーザーが通常自分で購入しようと思うよりもはるかに多くの計算を使用して、多くの人に役立つ技術的成果物を生産できるようになるはずです。
それは私にとって進歩の非常に重要な測定になると思います。
これらの勝利の中で、最も驚いたのはどれですか?
推論モデルが機能し始めるのを見た時、この地点に到達することは確実に予想していました。同時に、この最近の一連の成果は非常に印象的だと思います。それらの中で、IMOが予想より少し早く来たと思います。
IMO金メダル、IMO問題6は依然として、IMOのすべての問題は創造的思考といくつかの新しい洞察を必要としますが、典型的には問題6があって、それは非常に型にはまらない思考を必要とし、通常は他の問題の典型的なドメインの外にあります。過去には実際に、金メダルを取ることとこれらの他の問題を解くことと、実際にすべての問題、特に問題6を解くことを考えることの間に境界を引いていました。
私たち自身とGoogleのDeepMindが同時に、問題1から5を完璧に解いて問題6で全く進歩しなかったのを見るのは、かなり、ある意味で陽気でした。その挑戦をかなり明確にしたと思います。
それは興味深かったです。OpenAIのモデルが「ええ、これは解けないと思います」と言ったのです。試さなかったか、問題があると言いました。それは正しかったのですか?
モデルはその問題で進歩を遂げられなかったことを正しく識別できました。
モデルがそれを決定できるというのは非常に魅力的です。幻覚について多くの会話があり、それはちょっと理解が不十分なことだと思いますが、流動的思考と結晶的思考に違いがあって、一つはモデルがどれだけの知識を持っているかで、もう一つは問題解決能力です。それができる地点に到達した時、「いや、これには答えられないと思います」と言えるようになるのは、到達すべきかなり興味深い地点です。
日本での競技大会の成果
日本でのライブストリームについて質問するように言われました。
過去数週間で、実際に私たちのモデルは3つの競技で信じられないほど良い成績を収めました。そのうち2つについて話しました。IIIとIMOです。高校生だけでなく、みんなに開かれたAdventと呼ばれる競技もあります。
それは非常に権威のある、非常に高品質な競技で、日本で開催されていますが、世界中の競技者に開かれています。この特定のコンテストでは、より長期の発見的問題について、たった一つの問題が与えられ、それを解くのに10時間あります。競技者は困難な最適化問題への最良のアプローチを見つけるために競います。
単一の正しい解決策がないので、ちょっと違います。従うべき単一のパターンがありません。これらのタスクは非常に多様で、10時間の間、単一のタスクに集中できます。それで私たちはモデルをこのコンテストに参加させました。
これは私にとって少し個人的な意義がありました。過去にはIIIのような短い形式の閉じた形式のコンテストで非常に熱心な競技者でした。
私の友人シホもOpenAIで働いていて、この長時間持続するコンテストで優秀でした。私たちが一緒に働いていた時、彼は私の種類のコンテストは彼のものよりずっと早く自動化されるだろうと少しからかっていました。より長時間で集中した作業を必要とするからです。
結果として、この日本のコンテストで、シホは実際にトップ候補の一人でした。それで私はこのライブストリームを見て、私たちのモデルがコンテスト全体を通してシホと競争するのを見ていました。
最終的に、私たちのモデルは実際に2位を獲得し、シホが勝ちました。つまり、彼一人が彼の予測が実現しないことの障害に立っていました。それでもOpenAIにとって2勝です。
また際立ったことの一つは、コンテストの終わりにシホが本当に疲れ切っていて、コンテストの途中での体験について少し話すためにインタビューを受けた時です。このポッドキャストで彼を直接引用することはできないと思いますが、彼は「あなたたちのモデルは本当に本当に悪い。眠りたい。疲れた」と言っていました。
推論モデルの登場とその衝撃
壁について話を聞いたことがあります。前に言及しましたが、推論がどこからともなく出てきたのは興味深いと思いました。つまり、いくつかの論文やヒントはありましたが、人々は本当にその線を引いていませんでした。それから突然o1モデルが出てきて、モデルに答えを出させるだけでなく、モデルに内なる独白をさせて、自分自身と話し、それを通して物事を解決させるという全体的なアイデアです。
これがAGIに向かうのに十分だと思いますか、それとも他のブレークスルーが必要だと思いますか、あるいは起こると思う他のブレークスルーはありますか?
ここのチームがこの特定のことに非常に懸命に取り組んだことを指摘する必要があります。より長い思考の連鎖が必要なだけのようなシンプルなことに感じますが、実際にそれを機能させるのは本当に大変でした。
以前の質問に戻ると、驚いた結果は何だったかという時、それが機能していることに最初に気づいた時、それらのモデルを訓練してより多くのデータを与えることができ、それらが良くなることに最初に気づいた時でした。
それは最も衝撃的な瞬間の一つだったと思います。私たちが組織として信じられないほど速いペースでの進歩に準備ができているかという質問を非常に非常に真剣に問い始めた瞬間でした。
午後11時頃の特定の夜があったのを覚えています。サムとメイラと電話で話していて、それらの結果に少し怖くなったりしたと思います。時々そういうことが起こります。
ペースは速いです。つまりそれは速いことで、あなたが言ったように、6週間何も起こらないと人々は減速したと思うという冗談がありますが、年単位で見ればそうです。
それは妥当な指摘です。何かに数年間取り組んでいる時に内部的に認識していることがあって、研究論文があるけれど、昨夜出たわけではありません。多くの作業があったのです。
でも世界にとっては、これらのモデルにさらに多くのことをさせる、既存のインフラを言わば取って、そこからより多くの能力を得るための本当に根本的に新しい方法があるという事実によって、ある種驚かされたと言うでしょう。
次のブレークスルーはどこで起こると思いますか?
スケーリングの重要性と今後の方向性
常に過小評価しないようにしていることの一つは、スケーリングの重要性です。これらの推論モデルを見ても、事前訓練の以前のスケーリングパラダイムが消えたわけではありません。これらのことが複合すると思いますし、特に移動できる新しい方向もあります。
これらのモデルが計画し推論できる範囲を延ばすことについて話していました。単純に計算支出の観点から見ると、GPT-4がすべての答えに対してある程度の計算をしていたのが、おそらく10倍、20倍、何かしら重要ではあるが、ある意味ではそれほど印象的ではない量の計算をより多く使うGPT-5 Proのようなものになったということです。そしてはるかに良い答えを生成できます。
多くの人にとって実際に重要な問題、医学研究の問題での進歩、次世代のモデルを開発することでの進歩に、どれほどの計算量を費やそうと思うかの規模で言えば、これらは比較にならないほど大きな量です。
モデルの持続性と非常に長時間集中した問題に取り組む能力という問題は、かなり明確な次のステップだと思います。
AGIの実用的な影響について
AGIの実用的な影響を、典型的なChatGPTユーザーのような人に話すとしたら、数年後、あるいは5年後(それは遠く聞こえますが実際はそうではありません。5年前にGPT-3が出たのですから、それはあっという間でした)の体験はどのようなものになるでしょうか?AGIのようなモデルは何ができるでしょうか?
私は研究の自動化について話していました。それが実際にどのように見えるかの私のイメージは、非常に有能な研究者とエンジニアの会社が大部分自動化されているものを想像することです。それはブラックボックスのようなものではないでしょう。人々と話し、入力を受け取り、実験を実行するでしょう。
新しい技術を開発する可能性と、コードベース、デザインなどの他の種類の成果物を持つことは、技術進歩のペースを根本的に加速できると思います。
それは私たちが感じるものであり、技術的および社会的観点から正しく行うために多くの作業をする必要があります。しかし、実際に私たちが相互作用するインターフェースでも多くの進歩を期待するべきだと思います。
ChatGPTは非常に人間らしく感じられ、それに愛着を形成できます。より持続的になり、テキストでの異なる形式で自分を表現できるようになると思います。それらの効果はより強くなり、それは非常に大きく重要な会話になると思います。
AIとの信頼関係の構築
ChatGPTで実際にカレンダーとGmailを読む機能にアクセスしたばかりで、どこまで来たかを実感しました。今はそれに興奮していて、誰かにイウォークのファンフィクションを書き始めるのではないかと本当に恐れているわけではありません。それは私たちが越えたある種の信頼のレベルという巧妙な閾値だと思います。
モデルに多くのデータへのアクセス権を与えることで抽出できる明確な経済的、個人的価値と、モデルを悪用しようとする誰かによって悪用されないよう完全に信頼できる堅牢性の閾値にはまだいないという事実の間には、非常に困難なトレードオフが確実にあります。
それは確実に大きな問題で、私たちが分野として反復していかなければならないと思います。
高校生へのアドバイス
今日のお二人の高校時代のバージョンに何を伝えますか?昔の教室を訪れるとしたら、未来について何と言いますか?どんなアドバイスをしますか?
ビットコインに投資しろ。
いや、つまり今日、2025年の今日、高校生に何を伝えますか?
それも素晴らしい質問ですね。オンラインでそれについてたくさんの誤情報があると思うからです。
絶対にコーディングを学ぶべきです。プレミアムにある技能で、プレミアムであり続ける技能の一つは、複雑な問題を細かく分解し、本当に構造化された知性を持つことです。将来はプログラミングではないかもしれませんが、プログラミングはその技能を習得する良い方法です。たくさん考える必要がある他の分野もそうです。
コーディングを学ぶべきではないと人々に言わせてはいけません。
私は人生の後半でコーディングを学び、実際にOpenAIでエンジニアとして働くようになりました。システムがそのことができるからといって、どのように機能するかを知りたくないわけではないということを人々に説明しようとします。
あなたが言ったように、タスクを分解する方法を理解している時、私がOpenAIでプロンプトエンジニアリングをしていた時、コーディングの理解が言語を取って分解し、より良いことをさせるのを理解するのに役立ちました。そのギャップを橋渡しする人々は本当に有利だと思います。
「コーディングを学ぶな」と人々が言うのを聞くたびに、空気力学を理解しない飛行機のパイロットが欲しいかということです。私にはあまり理にかなっていません。
高校での物事の考え方を振り返ると、本当に考えてみると、認識された制約の多くが実際にはそこにないということは非常に信じられないことです。
おそらく私にとって最初の啓示は、このコンピュータサイエンスに本当に情熱を持っているなら、実際に学校の他の12科目にもう少し時間をかけるのを犠牲にして、もう少し時間をかけることができるということでした。
でも、実際にアメリカに行って勉強することができるというのも、明らかに相互作用空間のようには思えないことの大きな啓示でした。シリコンバレーで時間を過ごして、人々が本当に野心を持ってこれらの大きな問題に取り組み、実際に世界に意味のあるポジティブな変化をもたらすことができるという信念を持っているのを見ることは、信じられないほどインスピレーションを与えてくれました。
このコミュニティについて大切に思うことです。
影響を受けた書籍と作品
あなたにインスピレーションを与えた本や何かありますか?
いくつかの本があると思います。今思うと実際に非常に陽気です。点を結び付けていませんでした。しかし、私が15歳ぐらいの時、かなり何をしたいか確信が持てない時に、父がある本をくれました。
それは何か他の人による「ハッカーズ・アンド・ペインターズ」という本のポーランド語版でした。ええ、それは実際にポール・グレアムでした。このコミュニティですね。それはかなりインスピレーションを与えてくれました。
大きく夢を見て、世界でものを作ることができるというメッセージを聞くのは助けになることがあると思います。より多くの人がそれを実現するほど、世界はより良くなります。
あなたに影響を与えた本や映画やテレビ番組はありましたか?
映画ですね。それに対してバカな答えがあります。深遠な答えの後のちょっとバカで悪い答えですが。
アイアンマンを見ました。そしてそれが私にロボティクスの博士号を始めるインスピレーションを与えました。
それは素晴らしい答えですが。アンディ・ウィアーの「火星の人」のようなものです。NASAの植物学者の科学者に会いましたが、その本を読んで「まあ、大気物理学は間違っているし、これもそれも」と言っていました。彼は「だから私がここにいるんです」と言いました。
私はバカな部分にたどり着きませんでした。バカな部分は、ロボティクスの仕事を始めた時、それらのロボットがどれほど悪いかにとても失望したことです。映画は映画だということがなぜか思い浮かばなかった。
もしアイアンマンでなかったら、もしかしてソーの代わりだったら、物事はもっとうまくいっていたかもしれません。誰にもわかりません。
数学を勉強したかったと思います。
何を勉強したって?数学です。数学や理論計算機科学です。どちらでも。物理学もおそらく。
それは… ああ、物理学。私は最初マジシャンでした。知っているかどうかわかりませんが。実際に自分のリアリティ番組も持っていました。だから、ここに辿り着くのは非常に奇妙な道です。
終わりに
ヤコブ、シモーン、お二人と話すことは絶対的な喜びでした。また会って、あなた方が密かに取り組んでいて、どこからともなく出てきて「それは一夜にしてできたことだ」と私たちが言うような次の大きなブレークスルーについて話すことができればと思います。
ありがとう、アンドリュー。ありがとうございます。


コメント