Google DeepMind CEO デミス・ハサビス、AI未来での生活を語る | EP 137

31,631 文字

Google DeepMind C.E.O. Demis Hassabis on Living in an A.I. Future | EP 137

This week, we take a field trip to Google and report back about everything the company announced at its biggest show of ...

今年、Googleは人工知能について全く違う話し方をしています。今度は、皆さんに背筋を伸ばして欲しいのです。身を乗り出して欲しいのです。250ドルを支払って欲しいのです。そして仕事に取り掛かって欲しいのです。
過去20年間、私は使える限りの時間を全て働いてきました。なぜなら、このテクノロジーがどれほど重要で記念すべきものになるかを感じていたからです。それが5年後なのか10年後なのか2年後なのかは分かりませんが、このテクノロジーがもたらす変革の巨大さについて議論する時、これらは全て実に短いタイムラインなのです。
ヴァン・ゴッホを見る時、背筋に鳥肌が立ちます。彼らが経験したことを思い出すからです。その作品を生み出すための苦闘を、ヴァン・ゴッホの筆致の一つ一つに感じるのです。たとえAIがそれを模倣し、そう言われたとしても、それが何だというのでしょうか？
向こうに大きなサーカステントのようなものが見えますね。何が起こっているのでしょうか？
あれはシェーン円形劇場です。昨日、従業員のためにカーニバルが設営されているのかと思いました。間違いでした。Ringling Brothersがグーグルとパートナーシップを結んだのかと思っていました。復活テントですね。キリスト教を復活させているのです。
私はニューヨークタイムズのテック記者、ケビン・ルースです。Platformerのケイシー・ニュートンです。これはHard Forkです。
今週は、Googleへのフィールドトリップです。同社が年間最大のショーで発表したすべてについてお話しします。そして、Google DeepMindのCEOデミス・ハサビス氏が再び番組に登場し、汎用人工知能への道のり、教育の未来、そして2030年の生活がどのようなものになるかについて議論します。
ケビン、まず非常に年老いているということですね。誰かが私にテキストで、なぜ毎回番組名を叫ぶのかと尋ねてきました。私の名前を叫び始めたからだと言いましたか？コールドブリューのせいだと答えました。
ケイシー、今週は装飾が少し違いますね。そうですね。良く見えると言いましょう。そうです。私たちは普段のサンフランシスコのスタジオにはいません。カリフォルニア州マウンテンビューに来ており、Googleの本社内にいます。これほど多くの訓練データに囲まれて座っているのは感激です。Googleではそれを本と呼んでいます。
今週はGoogleの年次開発者会議、Google IOが開催されているためここにいます。Googleの幹部たちから、今後展開予定のAI関連事項について多くの発表がありました。少し後で、Google DeepMindのCEOであるデミス・ハサビス氏とお話しします。彼は基本的にGoogle のAI部門を率いており、これらのAIプロジェクトの多くを推進してきました。
まずは人々に状況を説明しましょう。私たちが一緒にIOに参加するのは初めてだと思うからです。どのような感じでしょうか？
Google IOは少しフェスティバルのような雰囲気があります。コンサート会場であるShoreline Amphitheaterで開催されます。しかし年に一度、ミュージシャンの演奏を見る代わりに、Googleの従業員がステージでvibe codingをするのを見る、一種のオタクコンサートに変身します。
そうです、vibe codingのデモがありました。他にも多くのことがありました。私が帰る時、実際にGoogleのアカペラグループが、コンサートに向けて準備のためのウォーミングアップをしているのを見ました。昔ながらのGoogleの雰囲気もありますが、AI関連のことへの興奮もたくさんあります。
Google Pellaの演奏は見ませんでした。この演奏はどこで行われたのですか？私も演奏は見ませんでした。ウォーミングアップしているのを見ただけです。音階の練習をしていました。素晴らしい音でした。クラシックなアカペラの状況だったと思います。彼らがウォーミングアップして、誰かが来て「演奏しないで」と言ったのでしょう。
さて、ケビン。始める前に開示事項を言いましょうか？はい。私はニューヨークタイムズで働いており、同社はAIシステムの訓練に関連する著作権侵害でOpenAIとMicrosoftを訴えています。そして私のボーイフレンドはGoogleが投資しているAnthropicで働いています。そうでしたね。
では、今週発表されたいくつかの内容について話しましょう。とても多くあります。すべてを取り上げることはできませんが、あなたの視点からのハイライトは何でしたか？
私はこれについてコラムを書きました、ケビン。この会議では少し熱に浮かされたような夢の中にいる気分でした。開発者会議では通常、大きな要点を1、2、3つに分けて説明しようとするものです。今回は消防ホースのような大量の情報でした。最後には私のメモを見ながら、「つまり、メールが私の声で書き始め、PDFをビデオTEDトークに変換できるようになる。確かに、なぜダメなのか？」と思いました。少し熱に浮かされた夢のような心境でした。あなたはどう感じましたか？
昨日誰かに、このイベントの名前は「エブリシング・エブリウェア・オール・アット・ワンス」であるべきだったと言いました。まさにそんな感じでした。彼らが言っていることは、あなたが使うすべてのGoogle製品により多くのAIが搭載され、そのAIがより良くなり、すべてが様々な方法であなたの生活をより良くするということでした。しかし、追跡するには多すぎました。
そうですね。見たすべてから明らかなテーマを一つ抜き出すとすれば、AIがすべてのものに導入されるということでした。それらのいくつかについて詳しく掘り下げる価値があるでしょう。
私の注目を引いたのは、私があなたの隣に座っていた時、あなたが本当に身を乗り出したのを見たのは、彼らがGoogleの検索、つまりコア検索製品の新しいAIモードについて話し始めた時でした。AIモードと昨日発表されたことについて話してください。
ケビン、これは少し混乱します。なぜなら、今や3つの異なる主要なGoogle検索があるからです。まず通常のGoogle検索があり、これは現在多くの場合、AIオーバービューと呼ばれるもので強化されており、上部にAIの回答のようなものが表示されます。
そうです、「アナグマを二度舐めることはできない」といったフレーズの意味を教えてくれる小さなものですね。その通りです。その意味を知らない場合は、Googleで検索してください。
それが第一のものです。第二は、ChatGPTの一対一の競合製品のようなGeminiアプリです。これは独自のアプリ、独自のウェブサイトにあります。そして今週発表された大きなものは、しばらくテスト中だったAIモードです。これは最初の二つの中間に位置するものだと思います。検索内のタブになっており、アメリカといくつかの他の国の全員に展開されています。そこをタップすると、GeminiやChatGPTで行うような長い、複数ステップの質問ができますが、Google検索のインターフェースから直接行うことができます。
私は数週間この機能で遊んでいます。ラボセクションにあったので、登録していれば試すことができました。本当に素晴らしいです。とてもクリーンな体験です。まだ広告はありません。おそらくすぐに表示されるでしょう。ファンアウトと呼ばれることを行います。これは私にとって非常に面白いことです。質問をすると、多数の異なるGoogle検索を派遣して、多数の異なるウェブページをクロールし、答えを持ち帰ってくれます。実際に何回検索を行っているか、何の異なるウェブサイトを検索しているかを教えてくれます。
例えば、Costcoメンバーシップの費用を尋ねたところ、その質問の答えを求めて72のウェブサイトを検索しました。AIモードは時にやりすぎの域に達することもありますが、あなたの質問に答えることに非常に熱心です。
AIモードを率いている人物の一人であるロビー・スタインと会う機会がありました。私はあなたがこれについてどれほど熱心だったかに驚きました。これまでのところ私が見つけていない方法で、実際にこれが非常に有用だと感じているとおっしゃいました。これについて何に気づいていますか？
主なことは、それがとてもクリーンな体験だということです。通常のGoogle検索結果ページでは、私たちが話してきたように、非常に雑然としています。多くのものがあります。広告、画像のカルーセル、時にはショッピングモジュール、時にはマップモジュールがあります。実際に青いリンクを見つけるのが困難な時もあります。AIモードもより多くの収益を上げようとするにつれて、より雑然とするようになると想像しますが、現在それにアクセスすれば、はるかにシンプルな体験です。探しているものを見つけるのがはるかに簡単です。
同時に、彼らは非常に興味深く複雑なことをしようともしています。基調講演で披露したもののひとつは、誰かが野球の統計について質問し、3つか4つの異なる種類の見つけにくい統計を探し、それらをすべて組み合わせてインタラクティブなチャートにするというものでした。それはただのデモでした。まだアクセスできません。しかし、それが機能すれば、検索の意味のある改善になる可能性があります。
検索の意味のある改善になる可能性があります。また、これらすべてがメインのGoogle検索製品にどのような影響を与えるかは大きな未知数だということも言うべきでしょう。現在のところタブです。まだメインのコアGoogle検索に統合されていません。部分的には、まだ収益化されていないからです。従来のGoogle検索よりもそれらの結果を提供するのにはるかにコストがかかります。しかし、時間が経つにつれて、これらのものは統合されると想像します。これは出版社、インターネット上でものを作る人々、インターネット全体の経済モデルにとって多くの意味を持つでしょう。
しかし、その話の穴にはまってしまう前に、Google IOのステージで彼らが言った他のいくつかのことについて話しましょう。彼らが披露した製品の使用数に私は非常に印象を受けました。彼らによると、Geminiアプリは現在月間4億人のユーザーがいるということです。それは多いです。ChatGPTほどではありませんが、Claudeやその他のAIチャットボットよりもはるかに多いです。
Geminiが出力するトークンが昨年から50倍増加したと言いました。つまり、人々は実際にこれらのものを使っているのです。言い換えれば、これはGoogleが人々が回避しようとしているような製品に押し込んでいる機能ではなく、人々が実際にGeminiを使っているということです。
それは正しいと思います。特にGeminiの数字が私を驚かせました。4億は多くの人数であり、Googleがその統計を偽造する明らかな方法は多く見当たりません。例えば、彼らは月間15億人がAIオーバービューを見ていると言いましたが、それはGoogle検索結果に入れただけなので、全く受動的な現象です。しかしGeminiでは、ウェブサイトに行き、アプリをダウンロードしなければなりません。これは人々が実際にそこに本当の有用性を見つけているということを教えてくれます。
それがGeminiですが、彼らは新しい画像・動画モデルなど、他の多くのものもリリースしました。それらについて話したいですか？
他の会社と同様に、彼らはテキストから画像、テキストから動画に取り組んでおり、OpenAIのモデルがこの分野で最も注目を集めていますが、Googleのものも本当に非常に良いです。今年のIOのマーキー機能は、動画生成モデルVO3が音も生成できることだと思います。例えば、フクロウが羽ばたくデモを見せてくれました。羽の音が聞こえます。地面に降りてきます。神経質なアナグマのキャラクターがいて、彼らは対話を交わしました。それは基本的に理解不能で、純粋な怠惰でした。しかし、彼らはそれをゼロから生成することができました。
彼らは今日ボールを置いていきました。私がジャンプできるより高く跳ねました。それはどんな魔法なのでしょうか？
彼らはまた、GoogleのAI製品の新しいウルトラサブスクリプションも発表しました。GoogleのAI製品の最先端を使いたい場合、Gemini Ultraに月250ドル支払うことができます。ケイシー、私は自分自身に言いました、誰もこんなことはしないだろうと。誰が月250ドルも支払うでしょうか？GoogleのリーディングAI製品へのアクセスには大金です。
そして右を見ると、基調講演の最中にケイシー・ニュートンが財布からクレジットカードを取り出して、この非常に高価なAI製品のサブスクリプションを購入するために入力しているのです。この製品の最初の顧客だったかもしれません。なぜですか？
彼らが大型言語モデルに私を入力する時になって、それを忘れないでくれることを願っています。最新のモデルにアクセスできるようになりたいのです。これらのAI企業がやっている巧妙なことのひとつは、「最新かつ最高のものを他の人より早く提供しますが、ばかげた金額を支払ってください」と言っていることです。
記者で毎日このことについて報告している場合、そのキャンプにいたいと思うでしょう。月々のAIサブスクリプションに2010年にフェニックスのアパートに支払った金額よりも多く使っているのは事実ですか？はい。あまり良い気分ではありませんが、良いジャーナリストになろうとしています。ケビン、お願いします。あなたの家族が死んでいます。
私の注意を引いたもう一つのことは、個人化について多く話したことです。これは私たちが何年も話してきたことです。基本的に、Googleは数十億人のメール、検索履歴、カレンダー、すべての個人情報を持っており、私たちはそれらの情報を織り交ぜ始めて、それらの製品でGeminiを使って作業ができるようになるのを待っています。それは遅れています。
しかし、彼らは小さな歩みを進めており、今年後半にサブスクライバーが利用できる新しい個人化されたスマート返信機能を含むいくつかのことを披露しました。Gmailでは、メールの下部にある公式的な提案返信を得る代わりに、実際にあなたの書き方から学習し、おそらくカレンダーやドキュメントの一部にアクセスして、本当により良い返信を提案してくれます。まだ送信を押す必要がありますが、メッセージを事前に入力してくれます。
この点について私は少し弱気です、ケビン。これが簡単なことなら、すでにここにあるはずだからです。これほど公式的なメールの多さを考えると、あなたがどんなタイプのメールかを理解するのがそれほど難しいとは思えません。私は基本的に二文のメール書きです。それを模倣するのはそれほど難しくないようです。
また、大型言語モデルは大きなメモリを持っていないことも知っています。Gmailにしてほしいことの一つですが、できないことは、すべてのメールを理解して、それを使って私の声のトーンを知らせることです。しかし、それはできません。はるかに限定されたサブセットしか取れません。それによって私のトーンを正確に模倣するのが困難になるのでしょうか？分かりません。
つまり、ここには多くの問題があり、この点に関する私の期待はかなり低いです。
これが存在し、優秀であることを実際に使用できる時に信じるという部分でした。昨年開発者会議で多くのAI機能をデモしたが、その半分を決してローンチしなかったAppleのような他の企業同様、実際に自分でそのものを使用できるまでは少し懐疑的になっています。
振り返ってみると、昨年のWWDCは代替の未来で有能なAI企業が行ったかもしれないことについての映画のようでした。私たちの現実とはほとんど関係がありませんでしたが、確かに興味深い提案のセットでした。
IOのソフトウェアAI部分については以上です。Googleが取り組んでいる新しいハードウェア製品のデモもありました。それは、基本的にMetaが披露してきたもののGoogleバージョンであるAndroid XRグラスです。分厚い黒いフレームを持つメガネのようなOrionグラスで、ホログラムレンズが付いており、実際に視界に重ねられた小さなものを見ることができます。天気や時刻、新しいメッセージがあることを教えてくれたり、Google Mapsとの統合があり、メガネの中に小さなGoogle Mapが表示され、あなたが向きを変えると一緒に回転し、どこに行けば良いかを教えてくれます。これはプロトタイプだと言いましたが、これについてどう思いましたか？
多くの部分が本当にクールに見えました。おそらくデモの最も気に入った部分は、実演していた人がコーヒーショップに歩いて行く準備をする時に足元を見下ろしたことで、Google Mapが実際に足元に投影され、左に行く、右に行くことが分かったことです。外国の都市を歩き回っていて、この機能を切望したことがある人なら、それを見てかなり興奮するでしょう。あなたはどう思いましたか？
Google Glassが戻ってきたと思いました。長い間荒野にいて、今戻ってきました。今度は実際に機能するかもしれません。絶対にそうです。メガネを試す機会がありました。デモには非常に長い列がありましたが、私は…
「私はケビン・ルースです。列の前に通してください」と言ったのでしょうね。
いいえ、2時間待たされました。文字通り2時間待ったわけではありません。何かをしてから戻ってきました。しかし、デモを受けました。5分ほどの長さでした。かなり基本的でしたが、クールでした。周りを見回して「これは何の植物ですか？」と言うことができ、Geminiがあなたが見ているものを見て、その植物が何かを教えてくれます。
数ヶ月前にデモをしましたが、本当に楽しめました。ここには何かがあると思います。そしてより重要なことに、ケビン、消費者は今GoogleとMetaを見る時、ついに選択肢があります。どちらの広告独占に自分の個人データを与えたいかという選択です。消費者の選択があります。それは美しいことだと思います。それが資本主義の全てです。
さて、それらがいくつかの発表ですが、イベント全体の基調についてどう思いましたか？雰囲気として何が目立ちましたか？
最も目立ったのは、昨年のイベントとの対比でした。昨年、彼らは「GoogleにGoogleingをさせよう」という繰り返していたフレーズがありました。これは、Wall-E映画の浮遊椅子に後ろに寄りかかって、AIに人生を荒らし回らせるような人を思い浮かべさせました。
今年、Googleは人工知能について非常に異なって話しました。今度は、あなたに背筋を伸ばして欲しいのです。身を乗り出して欲しいのです。250ドルを支払って欲しいのです。そして仕事に取り掛かって欲しいのです。AIはあなたの超能力です。あなたのバイオニックアームであり、これまで以上に遠くまで行くために使用するのです。
しかし、そのビジョンを提示する間も、ケビン、彼らは同時に「でも、それは普通になります。冷静になります。今のあなたの生活のようになります。まだ裏庭で子供たちと科学実験をするでしょう。まだナッシュビルでの女子会を計画するでしょう」と言っていました。あまりサイエンスフィクションはありませんでした。「ああ、これに少しAIを入れました」という感じでした。それは私にとって興味深いことでした。
私は少し異なる見方をしていました。GoogleがAGI化されていると思うのです。何年もの間、GoogleはAGIについての会話から距離を置いてきました。Deep Mindがありましたが、それは一種のAGI部門でしたが、ロンドンにあって別個のものでした。GoogleのPeopleは、AGIについて尋ねられると、正確に笑うわけではありませんが、少しくすくす笑うような感じでした。それは彼らには現実的でないか、考慮する価値がないほど遠いものに見えました。
「これが検索広告と何の関係があるのか？」と言うでしょう。まさにその通りです。今でも、この会社は自分たちを製品会社、検索会社として考えてもらいたがっているのは事実です。AGIに全力投球しているわけではありませんが、それを探し始めると、GoogleでのAIの文化とGoogleの人々がAIについて話す方法が実際に変化していることが分かります。
Googleの多くの人が思っていたよりも技術が良くなっているのが早いことを示すような、異常で示唆的な方法で会話に染み込み始めています。
完全には同意しません、ケビン。確かに一年前よりもAGIについての会話が増えているでしょうが、彼らが構築しているものを見ると、多くの「引き裂いて最初からやり直し」があったようには見えません。AIシステムをGoogle型の穴に差し込む方法のように見えます。それは最終的にAGIのようなものまで積み上がるかもしれませんが、まだそれを見ていないと思います。
もう一つの観察は、2025年のGoogleは、2024年や2023年のGoogleよりもAIに関してはるかに多くの自信と威勢を持っているということです。2年前、GoogleはまだBardを成功させようとしており、消費者向けチャットボットでいくらかの大規模採用を見つけたOpenAIに敗れたことを非常に不安に感じていたと思います。
彼らは追いつこうとしていただけでした。数年前にはGoogleが生成AIに関してリードしていると誰も言わなかったでしょう。しかし今、彼らはレースがあり、それに勝つ良いポジションにいると感じています。Geminiがこれらすべての他のモデルに対してどれだけうまくスタックするかについて話していました。これらの異なるカテゴリすべてでこのリーダーボードLM Marinaのトップにいます。
AIがスポーツのようにカバーされる方法は好きではありません。誰が上で、誰が下で、誰が勝って、誰が負けているか。しかし、Googleは今、少なくともプレーオフに参加することが分かっているチームの自信を持っているとAIに関して感じます。そしてそれは明らかでした。
過去一年間に起こった競争を見ると、AppleはWWDCで本質的に架空のデモを多く行っており、MetaはLM Arenaで勝つためにチートして、一つのことに優れた一つを思いつくためだけに同じモデルの27の異なるバージョンを作成しています。だから、Googleの立場から見れば、私はそれらの連中になれると思っているでしょう。
それがGoogle IO内部での感じでした。外部からの反応はどうでしたか？例えば、同社の株価が実際に下落したことに気づきました。それほどではありませんが、ウォールストリートが発表された多くのことにいくらか無関心だったことを示唆する程度でした。Google外部での反応はどのようなものでしたか？
私が見た外部の反応は、点を結ぶのに少し苦労しているという感じでした。2時間の間に多くのことを発表する問題は、時々人々が「それを試すのが待ちきれない」と言って持ち帰る一つのことがないことです。すでに使っているGoogle製品の束を見ているだけなら、投資家としては、これがGoogleでそれほど多くの価値をアンロックする理由が理解できないでしょう。
数百万人が月250ドルをGemini Ultraに費やすかもしれませんが、それが起こらない限り、これは少し現状維持のように感じる理由を理解できます。
それは分かります。これらすべてがどのように収益化されるかについて多くの未回答の質問もあると思います。Googleは、Google検索エンジンとそれを支える広告ビジネスで、資本主義の歴史で最も収益性の高い製品の一つを構築しました。
AIモードが何になるか、または検索に詰め込むことができるAI機能が何であれ、検索というカテゴリが全体的に減少している場合、人々が数年前のような方法でgoogle.comに物事を調べに行かない場合、次のものが何で、GoogleがそれをSearch同様に効果的につかめるかどうかは開かれた質問だと思います。
彼らは私たちにそれが何であるかのビジョンを一つ与えたと思います、それはショッピングです。基調講演のかなりの部分が、Google内の新しいショッピング体験について一人の幹部が話すことに費やされました。そこでは自分の写真を撮ってアップロードし、仮想的に物を試着でき、AIを使ってあなたのプロポーションを理解し、衣服を正確にあなたにマッピングしてくれます。
そこには、Googleがカットを取ることを可能にする多くのことがありました。明らかに、購入する個々のアイテムを広告することができます。おそらく支払いのいくらかのカットを取っているでしょう。そこにはどこかにアフィリエイト料金があります。
私がGoogleを今後カバーしようとしてやっていることの一つは、検索がコアであることを理解することですが、Geminiは多くの他の本当に価値のあるビジネスを構築するための踏み台になり得るということです。
私がこれらのものに行く時にあなたにいつも尋ねる重要な質問があります。食べ物はどうでしたか？
食べ物は本当に良かったと思います。昨年は朝食で純粋に塩辛い体験でしたが、私は起きた時に甘いお菓子が少し欲しいという恥ずかしいアメリカ人です。今年はベーグルとアップルシナモンコーヒーケーキの両方があったので、基調講演に向かう時はかなり良い気分でした。
小さなコールドブリューのボトルのようなものがあり、私は巨大なカフェイン中毒者なので、二つ取りました。すっかりロケット燃料状態で一日中でした。ただ鼻歌を歌っていました。壁で跳ね回っていました。パルクールをやっているような感じでした。素晴らしい気分でした。
あなたがアカペラチームと一緒にウォーミングアップしているのを見たと思いました。今すべて納得がいきます。
戻ってきたら、AIの未来に対する彼のビジョンについて、Google Deep MindのCEOデミス・ハサビス氏と話します。Prepared to translate next segment of program interview.1sここで番組が第2部に移って、Demis Hassabisとのインタビューが始まるようです。引き続き翻訳していきます。デミス、Hard Forkに再び来ていただき、ありがとうございます。お招きいただき、ありがとうございます。前回番組に出演されてから多くのことが起こりました。最も注目すべきは、ノーベル賞を受賞されたことです。おめでとうございます。
私たちのものはまだ郵送中だと思います。来年の委員会に良い言葉をかけていただけませんか？そうします。そうします。
ノーベル賞を受賞するのは非常にエキサイティングなことだと想像します。長い間あなたの目標の一つだったことを知っています。また、日常的な活動中に多くの人からからかわれることにもつながると想像します。例えば、プリンターを動かすのに苦労していて、人々が「おや、ノーベル賞受賞者さん」のようなことを言うような。そんなことが起こりますか？
少しあります。「見てください、そのようなことを修理する必要がないかもしれません」と言おうとしています。より盾のようなものですね。
Google IOがあったばかりで、本当にGeminiショーでした。基調講演でGeminiの名前が95回ほど言及されたと思います。発表されたすべてのもののうち、平均的なユーザーにとって最も大きな取引になると思うのは何ですか？
多くのことを発表しました。平均的なユーザーにとっては、新しい強力なモデルと、このAstraタイプのテクノロジーがGemini liveに導入されることだと思います。人々が初めて使用した時、それは実際に本当に魔法的だと思います。AIが彼らが思っていたよりもはるかに多くのことをすでに今日できることに気づくのです。
そして、V3がおそらく番組の最大の発表だったと思います。現在バイラルになっているようで、それもかなりエキサイティングです。
今年のIOが以前の年と比べて私を驚かせたことの一つは、GoogleがいわゆるAGI化されているように見えることです。数年前でもGoogleの研究者たちにインタビューしたことを覚えていますが、AGIについて話すことには少しタブーがありました。彼らは「ああ、それはロンドンのデミスと彼のDeep Mindの人々のようなものです。それは彼らが興奮している少しクレイジーなことですが、ここでは本当の研究をやっています」のように言っていました。
しかし今、Googleのシニアエグゼクティブがそれについて公然と話しています。その変化を説明するものは何ですか？
AIの部分が方程式でますます中心的になってきていると思います。時々、Google Deep Mindを今はGoogleのエンジンルームと表現していますが、昨日の基調講演でそれを本当に見たと思います。一歩下がって見ると、AGIがおそらく適切な言葉かもしれません。私たちは人間レベルの汎用知能にかなり近づいており、数年前に人々が思っていたよりも近いかもしれません。
それは広範囲にわたる横断的な影響を持つでしょう。基調講演で見たもう一つのことは、それが文字通りあらゆる場所に現れているということです。すべてを支える水平層になるからです。誰もがそれを理解し始めていると思います。おそらくDeep Mindの精神が一般的なGoogleに染み込んでいるのかもしれません。それは素晴らしいことです。
Project Astraが、人々がAIがまだできるとは気づいていない事柄を動かしていると言及されました。これは、モデルがこれらの非常に驚くべき能力を持っているが、製品がそれらを売っていないか、ユーザーがそれらをまだ理解していないという、AIビジネスの現在の実際の課題について語っていると思います。
その課題についてどう考えていますか？そして、研究の問題に対して製品の問題にどれくらい自分を向けていますか？
素晴らしい質問です。この分野の課題の一つは、明らかに基礎となる技術が信じられないほど速く動いていることだと思います。これは、インターネットやモバイルなど他の大きな革命的技術とはかなり異なると思います。ある時点で技術スタックのある程度の安定化があり、その後焦点を製品に、またはその技術スタックを活用することに当てることができました。
私たちが持っているもの、研究者の視点から非常に珍しいが同時にかなりエキサイティングだと思うのは、技術スタック自体が信じられないほど速く進化していることです。これは製品側で独特に挑戦的だと思います。私たちGoogle and Deep Mindだけでなく、スタートアップ、どんな企業、小さなものも大きなものも、すべてにとってです。
見てきたように、一年でそれが100%良くなる可能性がある時に、今何に賭けるかということです。そのため、テクノロジーが一年後にどこにあるかをある程度理解するために、かなり深く技術的な製品の人々、製品デザイナー、マネージャーが必要だという興味深いことがあります。
今日はできないことがあり、一年後に出てくる製品を設計したいのです。だから、依存できる機能を理解するために、技術とそれがどこに向かうかについてかなり深い理解が必要です。それは興味深いことです。
だからこそ、多くの異なることが試されているのを見ており、何かが機能すれば、それを迅速に倍増させなければなりません。
基調講演中に、生産性アシスタントスタイルの事柄と、基本的な科学研究の課題の両方を動かすGeminiについて話されました。あなたの心の中で、それは一つの素晴らしいモデルが解決できる同じ問題なのか、それとも異なるアプローチを必要とする非常に異なる問題なのでしょうか？
見ると信じられないほどの幅広いもののように見えますが、それは真実で、これらのことはどのように関連しているのかということです。私がそれらすべてに興味があるという事実以外に。
しかし、それは汎用知能を構築するというアイデアでした。真に一般的に、私たちがやっているこの方法では、生産性という非常にエキサイティングな、日常生活で何十億人もの人々を助けることから、科学の最大の問題を解決することまで、ほぼ何にでも適用可能であるべきです。
90%は基礎となるコア汎用モデル、私たちの場合特にGemini 2.5だと言えるでしょう。これらの分野のほとんどでは、その問題に取り組むために、追加の応用研究やドメインからの少しの特別な場合分けが必要です。特別なデータかもしれませんし、科学分野のドメインエキスパートと協力するかもしれません。
しかし、それらの分野の一つを解決すると、それらの学習を汎用モデルに戻すこともでき、汎用モデルがより良くなります。それは一種の非常に興味深いフライホイールです。多くのことに非常に興味がある私のような人にとっては素晴らしい楽しみです。このテクノロジーを使って、興味深いと感じるほぼどんな分野にも入っていけるのです。
多くのAI企業が現在取り組んでいることは、基盤モデルでモデルをより基本的なレベルで良くするコアAIプッシュにどれだけのリソースを割くか対、それの一部を商業化して製品にするためにどれだけの時間とエネルギーとお金を使うかということです。
これはリソースの課題であるだけでなく、人事の課題でもあると想像します。例えば、Deep Mindにエンジニアとして参加してAGIを構築したいと思ったが、Googleの誰かが来て、実際には人々が服を試着できるショッピングのもの構築を手伝ってほしいと言ったとします。一つの理由で参加した人に何か別のことを求める難しい会話ですか？
それは内部で自己選択的です。かなり大きいことの利点の一つです。製品開発、製品に対処できる製品チームと製品分野に十分なエンジニアがいて、コア研究にとどまりたい研究者がいれば、絶対に問題ありません。それは必要です。
しかし実際に、多くの研究者が現実世界の影響にかなり動機づけられることが分かります。明らかに医学やIsomorphicのようなことでもありますが、何十億人もの人々に自分の研究を使ってもらうことも含みます。それは実際に本当に動機づけとなり、両方をやりたい人がたくさんいます。特定のことに人々を転換させる必要はありません。
昨日、Googleの共同創設者のSergey Brinとパネルをやりました。オフィスに戻ってこのことに取り組んでいて、興味深いことに彼のAGIタイムラインはあなたより短いです。AGIは2030年より前に到着すると思っており、あなたは直後だと言いました。
彼は実際にあなたをサンドバッギング、基本的に約束を少なくして期待を上回る配達ができるように推定を人工的に押し出していると非難しました。しかし、おそらくあなたとSergeyは同じ情報と同じロードマップにアクセスでき、何が可能で何がそうでないかを理解していると思います。
AGIがいつ到着するかについて異なる結論に至る原因は、彼があなたが見ていないものを見ているのか、その逆なのでしょうか？
まず第一に、彼が2030年より少し前で私が少し後なら、私たちのタイムラインにはそれほどの違いはありませんでした。また、私のタイムラインは2010年のDeep Mind開始以来かなり一貫しています。大体20年のミッションだと思っていて、驚くことに私たちは軌道に乗っています。だからその頃のどこかだと思います。
実際に、今から5年から10年の間のどこかに確率分布があると感じています。5年から10年後の任意のことを正確に予測するのは非常に困難だと思うので、それに関して不確実性バーがあります。
また、必要なブレークスルーがあといくつ必要かについても不確実性があります。AGIの定義についても同様です。私は常に持っていたかなり高いバーがあります。それは人間の脳ができるすべてのことができるべきだということです。理論的にでもです。それは、明らかに経済的に非常に重要で大きなマイルストーンとなる典型的な個々の人間ができることよりも高いバーですが、私の見解ではAGIと呼ぶには十分ではありません。
昨日ステージで少し話しましたが、今日のシステムに欠けているものがあります。真の箱から出た発明と思考の一種です。数学の予想を解くのではなく発明することです。一つを解くのはかなり良いですが、実際にリーマン予想や数学者が本当に重要だと同意するほど重要なものを発明することははるかに困難です。
また、一貫性もあります。一貫性は本当に汎用性の要件です。トップエキスパートでも、特に些細な欠陥をシステムで見つけることが非常に困難であるべきです。今日では簡単に見つけることができ、平均的な人でもそれができます。だから、私がAGIと考えるものになる前に、能力ギャップと一貫性ギャップがあります。
そのギャップを埋めることを考える時、長期間にわたって積み重ねられた各連続モデルでの段階的な2%から5%の改善によって到着すると思いますか？それとも、ある種の技術的ブレークスルーに達し、突然リフトオフがあって、ある種の知能爆発に達すると思いますか？
両方だと思います。両方が有用になると思います。だからこそ、私たちはスケーリングと、段階的と呼ぶものに信じられないほど強力に押し進めています。実際にはその中にも多くの革新があります。それを前進させ続けるために、事前トレーニング、事後トレーニング、推論時間計算、そのスタック全体です。
だから、従来のスタックと呼ぶべきものすべての部分で革新しており、拡散モデル、Deep Thinkモデルなど、その一部を示しました。それに加えて、Alpha Evolveのような、より緑地のもの、より青空のことをやっています。
緑地のものと青空のものの違いはありますか？よく分かりません。おそらくかなり似ているのでしょう。新しい分野と呼びましょう。それはメインブランチに戻ってくる可能性があります。ご存知のように、私は基礎研究の根本的な信者でした。
私たちは常に、おそらくどの研究所よりも最も広く、深い研究ベンチを持ってきました。それが過去の大きなブレークスルー、明らかにトランスフォーマー、Alpha Go、Alpha Zero、これらすべて、蒸留を行うことを可能にしました。
そのレベルの別の大きなブレークスルーが再び必要な範囲で、私たちがそれを行うことに賭けるでしょう。そして、そのような段階的変化をもたらす可能性のある非常にエキサイティングな道を多く追求しており、段階的なものも同様に、それらは相互作用します。ベースモデルが良くなるほど、その上で試せるものが増えるからです。Alpha Evolveの場合のように、LLMの上に進化プログラミングを追加するのです。
私たちは最近、AIについて本を書いたジャーナリストのKaren Howと話しました。彼女は基本的にスケールに対する論拠を展開していました。この大きな汎用モデルは必要ない、信じられないほどエネルギー集約的で計算集約的で、数十億ドルと新しいデータセンターとあらゆる種類のリソースを必要とするものです。その代わりに、より小さなモデルを構築できる。より狭いモデルを構築できる。タンパク質の3D構造を予測するように設計されたAlpha Foldのようなモデルを持つことができる。その目的を達成するのに巨大な巨人のモデルは必要ない、という論拠でした。それに対するあなたの回答は何ですか？
大きなモデルは必要だと思います。私たちは大小のモデルを愛しています。小さなモデルを訓練するのに大きなモデルが必要なことが多いです。私たちのワークホースモデルと呼んでいるフラッシュモデルを非常に誇りに思っています。本当に効率的で、最も人気のあるモデルの一部です。内部ではそのサイズのモデルをたくさん使っています。
しかし、より大きな教師モデルから蒸留せずにはそのようなモデルを構築することはできません。Alpha Foldのようなものでも、明らかに私はそのタイプのモデルをもっと作ることの大きな支持者です。今AGIを待つ必要がない、今日科学と医学の本当に重要な問題に取り組むことができます。
それはタンパク質構造予測の周りに汎用技術を取って、潜在的に特化させることを必要とするでしょう。そのようなことをもっとやる大きな可能性があると思います。科学AIの科学研究で、最近ほぼ毎月かなりクールなことを生み出していると思います。
おそらく多くのスタートアップが、今日存在するある種の汎用モデルとある程度のドメイン特異性を組み合わせて構築される可能性があります。しかし、AGIに興味があるなら、その両側を押し進める必要があります。私の心では、どちらか一方ではありません。「そして」です。スケールしましょう、特化技術を見て、それらを組み合わせ、時にはハイブリッドシステムと呼ばれるものを見て、次のトランスフォーマーを提供する可能性のある新しい青空研究を見ましょう。
私たちはそれらすべてに賭けています。
Alpha Evolveに言及されました。ケビンと私が本当に魅力を感じたものです。Alpha Evolveとは何かを教えてください。
高いレベルでは、基本的に最新のGeminiモデル、実際には二つの異なるモデルを取って、プログラムや他の数学的関数についてのアイデア、仮説を生成することです。そして、それらは進化プログラミングプロセスに入り、それらのうちどれが最も有望かを決定し、それが次のステップに移植されます。
進化プログラミングについて少し教えてください。とてもエキサイティングに聞こえます。
基本的に、システムが新しい空間を探索する方法です。遺伝学のように、新しい有機体を得るために何を変異させるべきかのようなものです。プログラミングや数学でも同じことを考えることができます。プログラムを何らかの方法で変更し、得ようとしている答えと比較し、評価関数に従って最も適合するものを次の新しいアイデアを生成するセットに戻します。
最も効率的なフラッシュモデルが可能性を生成し、プロモデルがそれを批評し、次の進化のラウンドで選択される最も有望なものを決定します。
それは自律的なAI研究機関のようなもので、何らかのAIが仮説を思いつき、他のAIがそれらをテストし監督し、私が理解している限り、目標はAIが時間の経過とともに自己改善したり、既存の問題への改善を提案したりできることです。
はい。それが人々がとても興奮し、私たちが興奮している理由だと思います。自動化されたプロセスの始まりです。まだ完全に自動化されておらず、比較的狭い範囲です。チップ設計、スケジューリング、データセンターでのAIタスクのより効率的な実行、行列乗算の改善など、訓練アルゴリズムの最も基本的な単位の一つにも適用しています。
実際に既に驚くほど有用ですが、数学とコーディングが明らかにそうであるような、証明可能に正しいドメインに制約されています。しかし、それを完全に汎化する必要があります。
多くの人がLLM一般に持っている批判は、実際に与えてくれるのは訓練データの統計的中央値だけだということです。しかし、あなたが言っていることは、統計的中央値を超えて、実際に最先端を進歩させるのに有用な新しいアイデアを潜在的に生成する方法があるということです。
その通りです。Alpha Evolveは進化的方法を使用する別のアプローチですが、Alpha Goの日々から遡ってその証拠を既に持っていました。Alpha Goは新しい囲碁戦略を考案しました。最も有名なのは、私たちの大きなLee Sedol世界チャンピオンシップマッチのゲーム2の37手目です。
ゲームに限定されていましたが、私たちが何百年も囲碁をプレイしてきたにもかかわらず、これまで見たことがない本当に新しい戦略でした。それが私たちのAlpha Foldプロジェクトと科学プロジェクトを始めたきっかけでした。知っていることの領域内でのそのような創造性の火花、あるいは少なくとも独創性の証拠を見るのを待っていたからです。
しかし、それを知らない領域に行くにはまだやらなければならないことがたくさんあります。モンテカルロ探索や強化学習計画技術と組み合わされたこれらのモデルが、新しい地域の空間を探索し、現在のモデルが知っていることを超えて進む新しい地域に到達できることを知っています。進化的方法は、以前に見たことのない新しい体制にそれを強制的に押し込む別の方法です。
長い間良いモンテカルロツリーを探しています。見つけるのを手伝ってくれれば、本当に大きな助けになります。
それらの一つが助けになるかもしれません。Alpha Evolve論文を読みました。より正確に言えば、Notebook LMに入力して、より初級レベルで説明してくれるポッドキャストを作らせ、それを聞くことができました。
私を驚かせた魅力的なことの一つは、Alpha Evolveをより創造的にすることができた方法についての詳細で、それを行った方法の一つは本質的にモデルに幻覚を強制することでした。
多くの人が現在幻覚を排除することに夢中になっていますが、その論文を読む一つの方法は、実際にモデルに幻覚させたい、または創造的になってほしいシナリオがあるということです。
そうだと思います。事実的なことが欲しい時の幻覚は明らかに望みませんが、創造的な状況では、MBAコースでの横断的思考のようなものと考えることができます。クレイジーなアイデアをいくつか作るだけです。そのほとんどは意味をなしませんが、奇妙な一つか二つが、後で評価してみると実際にかなり価値のある検索空間の領域に到達させてくれるかもしれません。
その時点で、幻覚という言葉を想像力に置き換えることができるかもしれません。明らかに同じコインの両面です。
AI安全性について少し心配しているAI安全性の人と話をしました。実際の技術と実験についてではなく、この人はそれらは魅力的だと言いましたが、それが展開された方法についてでした。
Google Deep MindはAlpha Evolveを作り、それを使ってGoogle内部のいくつかのシステムを最適化し、数ヶ月間隠しておいて、その後一般に公開しました。この人は、もし私たちが本当にこれらのAIシステムが再帰的に自己改善を始め、より良いAIを構築できるポイントに到達しているなら、GoogleがAGIや超知能を構築した時、責任ある行動を取って一般に知らせるのではなく、しばらく自分たちのために保持するということを意味するのではないかと言っていました。
実際にはその両方だと思います。まず第一に、Alpha Evolveは非常に初歩的な自己改善のもので、まだ人間がループに入っており、既存のタスクからわずかではあるが重要なパーセンテージポイントを削るだけです。価値があることですが、何らかの段階的変化を作り出しているわけではありません。
一般に公開する前に内部で慎重に評価することと、学術コミュニティなどからの追加の批評を受けることの間にはトレードオフがあります。それも非常に有用です。私たちが話している信頼できるテスタータイプのプログラムもたくさんあり、人々がこれらのものに早期アクセスして、フィードバックをくれたり、ストレステストをしたりしてくれます。時には安全性研究所も含みます。
私の理解では、Google内部でこれを単にレッドチーミングしていただけではありませんでした。実際にデータセンターをより効率的にしたり、AIモデルを訓練するカーネルをより効率的にしたりするために使用していました。
この人が言っているのは、AGIのようなものになる前に、これらのことについて今良い習慣を身につけ始めたいということです。これが必要以上に長く隠されることになるかもしれないということを少し心配していました。それに対するあなたの回答をお聞きしたいです。
私が言うには、そのシステムは本当にAGIタイプの前線からリスクがあるものではないと思います。今日のシステムは非常に印象的ですが、この人が話していたかもしれないAGIリスクの観点からはそれほど強力ではないと思います。
より強力になるにつれて、これらのものの信じられないほど厳格な内部テストと、外部からの協力的な入力の両方が必要だと思います。最初の数ヶ月のアルファプロセスの詳細は実際には知りません。以前は関数検索で、その後より一般的になりました。
昨年、この汎用ツールになることで進化してきました。メインブランチで実際に使用できるようになるまでには、まだやるべきことがたくさんあります。その時点で、Geminiのように、現在それとは別のものであるため、より深刻になると思います。
AI安全性についてもう少し広く話しましょう。時間を遡って戻るほど、AIシステムの力が弱いほど、誰もが安全リスクについて話しているように見えるというのが私の観察です。モデルが改善するにつれて、昨日の基調講演を含めて、それについて聞くことが少なくなっているようです。
AI安全性におけるこの瞬間をどう思いますか？現在持っているシステムによって作成される可能性のあるリスクに十分注意を払っていると感じますか？3、4年前と同じようにそれにコミットしていますか？
これらの結果の多くはあまり可能性が低いように見えます。私たちは今まで以上にコミットしています。Deep Mindの始まりから、私たちは成功を計画してきました。成功とはこのようなものを意味しました。これは私たちが想像していたようなことです。
それが実際に起こったのはまだ信じられませんが、私たちがこれらの技術が発展すると思った方法で本当に発展するなら、私たちが考えていたことの範囲内にあります。リスクとそれらのリスクを軽減することへの対処はその一部でした。
私たちのシステムで膨大な量の作業を行います。非常に堅牢な赤チームプロセス、ローンチ前とローンチ後の両方があると思います。多くのことを学びました。これが今の違いで、これらのシステムが現実世界と接触することです。まだ初期のシステムですが。
これは実際に全体的に有用なことだったと今私は納得しています。確信がありませんでした。5年前、10年前には、研究所にとどまって学術界と協力した方が良いかもしれないと思ったかもしれませんが、実際に何百万人もの人々が試してみない限り、見ることも理解することもできないことがたくさんあります。
何百人、何千人のテストチームがいても、何千万人もの人々があなたのシステムを使用することとは比較になりません。しかし一方で、リスクが起こる前にできるだけ多くを知って軽減したいと思います。
これは非常に興味深く、良い学習です。過去2、3年間の業界での出来事は、前に言ったように、システムがそれほど強力でもリスクでもない時に学習していたので、素晴らしかったと思います。
これらのエージェントシステムが本当に有力になり始める2、3年後には、物事が非常に深刻になると思います。エージェント時代の始まりしか見ていませんが、想像できるし、基調講演から材料が何であるか、それらがどのように一緒になるかを理解していただけたと思います。
そして、分析と理解と制御可能性の研究で段階的変化が本当に必要だと思います。しかし、もう一つの重要なことは、それが国際的でなければならないということです。それはかなり困難で、私はそれについて非常に一貫しています。それは世界の誰にでも適合する技術になるからです。それは異なる国の異なる企業によって構築されています。
だから、これらのシステムを何に使いたいか、安全性と信頼性をテストしたいベンチマークの種類について、ある種の国際的な規範を得る必要があると思います。
しかし、今取り組むべき作業はたくさんあります。そのようなベンチマークがありません。業界と学術界がそれらが何であるかについて合意に達するべきです。
今言ったことを行うために、輸出管理がどのような役割を果たすことを望みますか？
輸出管理は非常に複雑な問題で、明らかに今日の地政学は極めて複雑です。その点で議論の両側を見ることができます。これらの技術の制御されない拡散があります。さまざまな場所に最先端のモデル訓練能力を持たせたいですか？それは良いアイデアではないと思います。
しかし一方で、西側の技術が世界中で採用されるものになってほしいと思います。だから、それは複雑なトレードオフです。簡単な答えがあれば、私は屋上からそれを叫んでいるでしょう。しかし、ほとんどの現実世界の問題のように、ニュアンスがあります。
AIをめぐって中国との二極対立に向かっていると思いますか？すでにその中にいなければ。Trump政権がサウジアラビアやUAEなどの湾岸諸国をAI大国にしようとする大きな押し上げをしているのを最近見ました。アメリカのチップを使って、中国とそのAI力にアクセスできないモデルを訓練させるのです。それが新しい世界的対立の基盤になると見ていますか？
そうならないことを願いますが、短期的には、AIが進行中のより大きな地政学的変化に巻き込まれていると感じます。だから、それはその一部に過ぎないと思います。現れている最も話題の新しいものの一つであることがたまたまそうです。
しかし一方で、これらの技術がより強力になるにつれて、私たちは皆一緒にいることを世界が気づくことを願っています。なぜなら、そうだからです。AGIへの最後の数歩、うまくいけば実際により長いタイムラインです。私が考えているタイムライン、より多くのタイムラインがあれば、それまでに必要な協力、少なくとも科学レベルでの協力を得る時間があります。それは良いでしょう。
AGIへの最終ホームストレッチにいるような感じがしますか？Googleの共同創設者のSergey Brinは、私のニューヨークタイムズの同僚が今年報告したメモをGoogle従業員に送り、私たちはホームストレッチにいて、誰もがオフィスに戻って常に働く必要があります。これが本当に重要な時だからです。
そのような最終性や新しい段階やエンドゲームに入るような感覚がありますか？
私たちは確実にミドルゲームを過ぎていると思います。しかし、過去20年間、使える限りの時間を全て働いてきました。なぜなら、このテクノロジーがどれほど重要で記念すべきものになるかを感じていたからです。20年間可能だと思っていて、今それが見えてきていると思います。
それに同意します。それが5年なのか10年なのか2年なのか、このテクノロジーがもたらす変革の巨大さについて議論する時、これらは全て実に短いタイムラインです。それらのタイムラインのどれも非常に長くはありません。
戻ってきたら、Dennis Hassabisから将来の奇妙な未来についてもっと聞きます。
より一般的なAI未来についての質問に切り替えましょう。多くの人が今、AGI後の世界がどのようなものかについて考え始めています。私が実際に最もこれについて聞く文脈は、子供たちが何をすべきか、勉強すべきか、大学に行くのかを知りたい親からです。あなたには私の子供より年上の子供がいます。それについてどう考えていますか？
子供たちに関して、これはよく聞かれることですし、大学生にも聞かれることですが、まず第一に、STEMについての基本的なアドバイスを劇的に変えることはないでしょう。コーディングのようなことでも良くなることをまだ推奨します。これらのAIツールで何が起こっても、それらがどのように動作し、機能するかを理解し、それらで何ができるかを知っていた方が良いからです。
また、今没頭することも言いたいです。今日の10代の私がやっていることは、最新ツールの忍者になろうとすることです。最新の最もクールなAIツールをうまく使えるようになれば、ある意味で超人的になることができると思います。
しかし、基本も軽視しないでください。基礎が必要だからです。そして、学習の仕方を学ぶというメタスキルを教えることです。確実に分かっていることは、今後10年間に多くの変化があるということです。そのためにどう準備するか、そのためにどのようなスキルが有用か、創造性スキル、適応性、回復力、これらすべての種類のメタスキルが次世代にとって重要になると思います。
彼らがAIネイティブに育つのを見るのは非常に興味深いでしょう。最後の世代がモバイルとiPadとタブレットネイティブに育ったように、その前はインターネットとコンピューターで、それは私の時代でした。
その時代の子供たちは常に最新の最もクールなツールに適応し、活用するように見えます。AI側でツールをもっと良くできることがあると思います。人々が学校や教育でそれらを使うなら、それらを本当にそれに適したものにし、証明可能に良いものにしましょう。
教育に大きな方法でそれを持ち込むことに非常に興奮しており、また、AIチューターがあれば、良い教育システムがない世界の貧しい地域にそれを持ち込むことにも興奮しています。だから、そこにも多くの利点があると思います。
子供たちがAIでやっているもう一つのことは、デジタルコンパニオンとたくさんチャットすることです。Google DeepMindはまだそのようなコンパニオンを作っていません。これまで見たもののいくつかはかなり心配に見えます。あなたがどれほど素晴らしいかを言うことしかしないチャットボットを作るのはかなり簡単で、それが暗くて奇妙な場所につながる可能性があります。
このAIコンパニオン市場を見て行った観察と、いつかこれを構築したいと思うか、それとも他の人に任せるかについて興味があります。
その領域に入り始める時は非常に注意深くなければならないと思います。だからこそ、まだやっておらず、それについて非常に思慮深くしています。私のこれに対する見解は、昨日話したユニバーサルアシスタントのレンズを通してです。日常の生産性にとって信じられないほど有用なものです。
私たちが皆嫌がる退屈で平凡なタスクを取り除いて、愛することをする時間を増やしてくれるものです。また、あなたが楽しむとは気づかなかった、あらゆる種類の素晴らしいことについて信じられないほどの推奨をしてくれることで、あなたの人生を豊かにしてくれることを本当に願っています。
驚くべきことであなたを喜ばせる。だから、これらがこれらのシステムが向かうことを願っている方法です。実際にプラス面では、このアシスタントが本当に有用になり、あなたをよく知るようになれば、明らかに自然言語でそれをプログラムして、あなたの注意を保護できると感じます。
だから、それをあなたのために働くシステム、個人としてのあなたのものと考えることができます。それはあなたのもので、あなたの注意を他のアルゴリズムからの攻撃から保護してくれます。これらのアルゴリズムはあなたの注意を得たがっていますが、実際にはAIとは何の関係もありません。ほとんどのソーシャルメディアサイトが効果的にやっていることです。
彼らのアルゴリズムはあなたの注意を得ようとしており、それが実際に最悪のことだと思います。私たちがより創造的なフローやあなたがやりたいことに集中できるようにそれを保護できれば素晴らしいでしょう。それが私がこれらのシステムが人々にとって有用であってほしい方法です。
そのようなシステムを構築できれば、人々は信じられないほど幸せになると思います。現在、人々は人生のアルゴリズムに襲われていると感じており、それについて何をすべきか分からないと思います。
理由は、一つの脳を使わなければならず、例えばソーシャルメディアストリームであれば、欲しい情報を得るためにその激流に浸らなければならないということです。しかし、同じ脳でやっているので、その激流に浸ることで、欲しかった価値のある情報を見つけるために、すでに心と気分と他のことに影響を与えてしまっています。
しかし、デジタルアシスタントがあなたのためにそれをやってくれれば、有用な塊だけを得ることができ、家族との集中や、その日やっていることや気分を壊す必要がありません。それは素晴らしいでしょう。
ケイシーはそのアイデアが大好きです。あなたもそのアイデアが大好きですね。注意を襲おうとするすべての力からあなたの注意を保護するAIエージェントのアイデアが大好きです。Googleの広告チームがこれについてどう感じるかは分かりませんが、番組が来る時に彼らに聞くことができます。
一部の人々は就職市場、特に最近の大学卒業生について見始めており、すでにAIによる失業の兆候を見始めていることを心配しています。私は、数年前なら技術やコンサルティングや金融や法律などの分野に興味があったかもしれない若い人々と軼話的に話しましたが、これらの仕事がもうそれほど長く続かないと分からないと言っています。
The Atlanticの最近の記事では、これらのエントリーレベルのポジションでAIが大学卒業生と競争し始めているのかと疑問視していました。それについて見解はありますか？
それを見ていません。分かりません。その研究を見ていませんが、今始まっているかもしれません。まだそれについてハードナンバーはないと思います。少なくとも私は見ていません。今のところ、これらをあなたができることと達成できることを強化するツールとして主に見ています。
大きな新しい技術シフトで通常起こることと同様に、次の時代、AGI後はまた異なるかもしれませんが、今後5年から10年間は、一部の仕事が破綻するが、新しい、通常はより価値があり、通常はより興味深い仕事が作られることを見つけると思います。それが近い将来に起こることだと思います。
今日の卒業生と次の5年間は、その後を予測するのは非常に困難です。それは私たちが準備しなければならないより社会的な変化の一部です。
そこでの緊張は、これらのツールが人々にはるかに多くのレバレッジを与えるということですが、特定のことをする大きなチームの人々の必要性も減らすということです。最近話した人は、以前の仕事でデータサイエンスの何らかのタスクに取り組んでいた75人の人々がいたデータサイエンス会社にいたが、今は以前75人を必要としていた仕事を一人で行っているスタートアップにいると言っていました。
他の74人は何をすべきなのかという質問にあなたの見解を聞きたいです。
これらのツールは物事をより迅速に作成する能力を解放すると思います。だから、より多くの人がスタートアップのようなことをするでしょう。以前は可能でなかった、これらのツールで攻撃し、試すことができる多くの表面積があります。
プログラミングを例に取りましょう。これらのシステムはコーディングが良くなっていますが、最高のコーダーは、質問を提起し、コードベース全体を構築し、コーディングが何をするかをチェックする方法をまだ理解しているため、差別的価値を得ていると思います。
同時にホビイスト側では、デザイナーや技術者でない人々が、ゲームのプロトタイプやウェブサイトや映画のアイデアであれ、バイブコーディングをすることを可能にしています。理論的には、その70人やそれが何人であれ、新しいスタートアップのアイデアを作ることができるはずです。
多分、これらのより大きなチームではなく、AIツールによって非常に力を得たより小さなチームになるでしょう。しかし、それは教育のことに戻ります。どのスキルが今重要なのか。創造性、ビジョン、デザインセンスのような異なるスキルがますます重要になるかもしれません。
来年、今年雇うのと同じ数のエンジニアを雇うと思いますか？
そう思います。少なく雇う計画はありませんが、コーディングエージェントがどれだけ速く改善するかを見なければなりません。今日、彼らは自分でできません。最高の人間のコーダーにとって助けになるだけです。
最後に私たちがお話しした時、AIについての一般の人々のより悲観的な見解について尋ね、あなたが私たちに言ったことの一つは、この分野は、それを変えるために人々にとって明らかに有益な具体的なユースケースを実証する必要があるということでした。
私の観察では、AIに対して積極的に敵対的な人がさらに増えていると思います。おそらくその理由の一つは、大きな研究所の人々が最終的にこれがあなたの仕事を取って代わると大声で言っているのを聞くからです。ほとんどの人はそれを望んでいません。
その過去の会話から振り返って、世論をシフトし始めるのに十分なユースケースを見たと感じますか？そうでなければ、実際にここでの見方を変えるかもしれないものは何ですか？
私たちはそれらのことに取り組んでいると思います。開発には時間がかかります。それが本当にあなたのもので、あなたのために効果的に働いている場合、ユニバーサルアシスタントがそれらのものの一つになると思います。
あなたのために働く技術です。これは経済学者や他の専門家が取り組むべきことだと思いますが、誰もがあなたのために物事をする一群のエージェントを持っているのでしょうか？お金を稼いだり、物を構築したりすることも含めて。それが通常の仕事プロセスの一部になるのでしょうか？次の4、5年でそれを想像できます。
AGIに近づき、おそらく前回話した材料科学、エネルギー融合、これらの種類のことでAIに助けられてブレークスルーを作ると、私が根本的豊富と呼ぶもの、多くのリソースが回る社会の位置に到達し始めるべきです。
そして再び、それをどのように公正な方法で分配するかは、より政治的な問題です。ユニバーサル高収入のようなものを聞いたことがありますが、おそらく良く、必要だと思いますが、明らかに考え抜かれる必要がある多くの複雑さがあります。
そしてその間に、今からそのような状況を持つ時までの移行期間があります。その中間で変化について何をするか、それがどれくらい長いかにも依存します。
経済のどの部分がAGIによって最後に変革されると思いますか？
人間同士の相互作用と感情が関わる経済の部分が、おそらくAIがやるのに最も困難なことだと思います。
人々はすでにAIセラピーをやっており、誰かに1時間100ドル支払ったかもしれないことについてチャットボットと話していませんか？
セラピーは非常に狭い領域で、それらのことについて多くの誇大宣伝があることは確実ではありません。実際の経済に影響を与えているものと、より玩具的なもののうち、実際にどれだけのことが起こっているかは確実ではありません。
AIシステムがそれを適切に行う能力があるとは思いません。しかし、お互いに話すことから得る感情的なつながり、自然の中で、現実の世界で物事をすることから得るつながりです。AIがそれらすべてを本当に複製できるとは思いません。
だから、ハイキングを率いれば良い仕事でしょうね。エベレストに登る。
私の直感では、労働を置き換えたり人々の仕事を奪ったりするためのAIの使用に対して大規模な反発がある、健康保険や教育のような何らかの重規制産業になるでしょう。しかし、それらの重規制産業ではより簡単なリフトになると思いますか？
分かりません。そうかもしれませんが、社会として、そのすべての積極的なものを望むかどうかを比較検討しなければなりません。例えば、すべての病気を治すことや新しいエネルギー源を見つけることです。これらのことは社会にとって明らかに非常に有益だと思いますし、私たちの他の大きな課題のために必要だと思います。
AI以外の社会に課題がないわけではありません。しかし、AIはそれらの他の課題の多くの解決策になりうると思います。エネルギー、資源制約、老化、病気、水へのアクセスなど、今日私たちが直面している膨大な問題、気候です。AIはこれらすべてを潜在的に助けることができると思います。
私はあなたに同意します。社会はこれらの技術を何に使いたいかを決める必要があります。そして、前に議論したように製品で変化しているのは、技術が進歩し続けることで、根本的豊富、宇宙旅行といった新しい可能性が開かれることです。これらは今日多くのSFを読まない限り範囲外のものですが、急速に現実になっていると思います。
産業革命の間、新しい技術を受け入れ、農場から都市に移り、新しい工場で働く多くの人々がいました。その曲線の早期採用者でした。しかし、それは超絶主義者たちが自然に退避し、技術を拒絶し始めた時でもありました。ソローがウォールデン池に行った時で、新しい技術を見て「私はそうは思わない。私には向いていない」と言ったアメリカ人の大きな運動がありました。
AIの拒絶について同様の運動があると思いますか？もしそうなら、どのくらい大きくなると思いますか？
自然に戻るという運動があるかどうかは分かりませんが、多くの人がそれをやりたがると思いますし、これが潜在的に彼らにそれをする余地と空間を与えるでしょう。根本的豊富の世界にいるなら、私たちの多くがやりたいことは、まさにそれを使うことだと完全に期待しています。
私は宇宙航行やより多くの最大人間繁栄について考えていますが、それは多くの私たちが選択することの一部となり、しかしそれをする時間と空間とリソースを持つことになると思います。
あなたの人生で「私はそれにはAIを使わない」と言う部分はありますか？たとえそれがかなり上手であっても、創造性や思考プロセスを保護したいなどの理由で。
AIがまだそのような分野で私が考えるような領域に食い込むほど十分に良くなっているとは思いません。主にNotebook LMでやったような、要約などの有用なことに使っています。新しい科学的トピックの氷を破って、それについてより深く入りたいかどうかを決めるのです。それが私の主要なユースケースの一つです。
それらは全て役に立つと思います。しかし、AIがより強力になるにつれて、そのようなものの例があるかもしれません。
最近AnthropicのDario Amodeiと話した時、彼はAIがコーディングのような、彼が非常に上手になろうと多くの時間を費やした領域で進歩を遂げていることについて、興奮と一種の憂鬱が混じった感情について話していました。
新しいコーディングシステムが出て、自分より良くて、それは素晴らしいと思うが、次の思考は「うー、それは少し痛い」という感じでした。そのような経験をしたことはありますか？
私がそれほど痛いと感じない理由の一つは、私が非常に若い時にチェスでその経験をしたことかもしれません。チェスが私の最初のキャリアになる予定でした。子供の時にかなりプロとしてプレイしており、イングランドジュニアチーム代表でプレイしていました。そしてDeep Blueが現れました。
明らかにコンピューターは世界チャンピオンよりもその後永遠にはるかに強力になるでしょう。しかし、私はまだチェスをするのを楽しんでいます。人々もまだやっています。違いますが、私たちは車を持っているのにウサイン・ボルトが100メートルを信じられないほど速く走ることを祝うのと少し似ています。しかし、私たちはそれを気にしません。
他の人間がやることに興味があるのです。ロボットサッカーや他のすべてのことも同じでしょう。そして、それは前に議論したことに戻るかもしれません。最終的に私たちは他の人間に興味があると思うのです。
だからこそ、小説でも、いつかAIが技術的に良い小説を書くかもしれませんが、AIによって書かれたと知っていれば、読者との同じ魂やつながりを持たないと思います。少なくとも今のところ私が見る限りでは。
ロボットサッカーについて言及されました。それは本当にあるのですか？私たちはスポーツファンではないので、何かを見逃していないかを確認したいだけです。
サッカーのことでした。いいえ、そうですね。ロボカップという、ボールを蹴ろうとする小さなロボットのサッカータイプがあります。どれくらい真剣なのかは分かりませんが、ロボットサッカーの分野があります。
ロボットによって書かれた小説には魂がないように感じるかもしれないと言及されました。VOやImagineなどの技術が信じられないほどであるにもかかわらず、そのように感じることを言わなければなりません。見るのは美しいですが、それをどうすればいいのか分からないのです。分かりますか？
まさにその通りです。だからこそ、私たちはDarren AronofskyやShankaの音楽のような素晴らしいアーティストと協力するのです。これらはツールで、技術的に良いものを思いつくことができると完全に同意します。V3は信じられません。現在バイラルになっている投稿されているものを見た時に分からなかったのですが、実際に音声がビデオに与える違いの大きさです。本当に生き生きとさせると思います。
しかし、Darrenが昨日インタビューで議論していた時に言ったように、それでもそうではありません。彼は語り話をもたらします。マスター映画製作者や最高のゲームのマスター小説家のような深い語り話はありません。それは決してやらないかもしれません。
何かが欠けているように常に感じるでしょう。より良い言葉がないなら、作品の魂、本当の人間性、偉大な芸術作品の魔法です。ヴァン・ゴッホやロスコを見る時、なぜそれがあなたに触れるのか、なぜ私の背筋に鳥肌が立つのか。彼らが経験したことを思い出し、それを生み出すための苦闘を思い出すからです。ヴァン・ゴッホの筆致の一つ一つに、彼の苦悩が込められています。
たとえAIがそれを模倣し、そうだと言われたとしても、それが何だというのかは分かりません。だからこそ、少なくとも5年から10年先を見る限り、トップの人間のクリエイターが常にもたらすものがあると思います。だからこそ、私たちのツールVO、すべてをトップクリエイティブアーティストとの協力で行ってきました。
新しい教皇レオがAGIに興味があると報告されています。彼がAGI化されているかどうかは分かりませんが、それは前に話したことです。AGIが生活に意味を与えるものについて考えることを強いられる世界で、宗教的復活や信仰と精神性への関心のルネサンスがあると思いますか？
それは潜在的にそうなる可能性があると思います。実際に、前の教皇とそれについて話し、バチカンはこの教皇以前からこれらの問題、AIと宗教、技術全般と宗教がどのように相互作用するかに興味を持っていました。
カトリック教会について興味深いのは、私は教皇庁科学アカデミーのメンバーですが、宗教団体にとって奇妙なことに、常に科学部門を持っていたことです。彼らはガリレオが創設者だったと言うのが好きで、それらの興味です。実際に本当に分離されており、私はそれがかなり興味深いと常に思っていました。
スティーブン・ホーキングのような人々や公然とした無神論者がアカデミーの一部でした。だからこそ私がそれに参加することに同意したのです。完全に科学的組織だからです。非常に興味深く、彼らは10年以上前からこれに興味を持っていたので、哲学的観点からこの技術がどれほど興味深いか、または哲学的にどれほどのものになるかという点で早期にこれに取り組んでいました。
実際に、このタイプの思考と作業を哲学者や神学者からもっと必要だと思います。実際に本当に本当に良いでしょう。だから、新しい教皇が真剣に興味を持っていることを願っています。
最近Tyler CowanがAnthropicのJack Clarkに尋ねたのを聞いたとても良い質問で、そのまま盗むことにした質問で締めくくりましょう。進行中のAI革命において、最悪の年齢は何歳ですか？
うわあ。そうですね、考えたことがありませんが、それを見ることができる年齢であればどの年齢でも良い年齢だと思います。医学などで大きな進歩を遂げるつもりだからです。信じられない旅になると思います。
私たちの誰も、それがどのように展開するかを正確には知りません。それを言うのは非常に困難ですが、それを見つけるのは非常に興味深いでしょう。
できるなら若くいるようにしてください。
そうです、若いことは常により良いです。一般的に、若いことは常により良いです。
デミス、来てくださってありがとうございました。
ありがとうございました。