
※長文のため、テキストの読み上げ機能の使用を想定しております。各OS標準搭載のアクセシビリティ機能(読み上げコンテンツ)、もしくはMicrosoft Edgeブラウザの「音声で読み上げる」機能をおすすめします。

AIの能力は間もなく想像を絶するスピードで加速し、今日のテクノロジーは石器時代の道具のように見えるでしょう。AIは複雑で難しく、怖いものです。知能は電気や清浄な水のようなもので、誰もが利用できるようになります。仕事に対する恐れをどのように和らげるべきでしょうか。それとも恐れるべきなのでしょうか。あなたはその技術を受け入れてより多くのことを行い、より多くの価値を生み出していますか、それともそうではありませんか。街中を歩き回るヒューマノイドロボットを常に目にするようになったら、どんな気分がするでしょうか。実はこれこそが人類にとっての本当の実存的脅威なのです。100億台のロボットとひどいファームウェアのアップグレードが…笑い声。
皆さん、こんにちは。今日のMoonshotsのゲストは、イマド・モスタケです。彼は前Stability AIのCEO、Shelling Pointの創設者、そして最近「AIについて考える方法」というホワイトペーパーの著者です。これは私が非常に説得力があり、簡潔で、ぜひ読んでいただきたいと思う論文です。私たちはこれについて深く掘り下げ、AIへの投資、国際協力、センタウロスと呼ばれるAIと人間のコラボレーション、成長と速度、AGIに到達するのかどうか、そしていつかについて話し合います。これは私のお気に入りの会話の1つで、2時間続きます。なぜならAIについて考えることの素晴らしいマスタークラスだったからです。このような会話が好きな方は、ぜひ購読してください。
ちなみに、この録音時の私の血糖値は97で、まさに私が望んでいた通りです。できれば105以下に保ち、低く平らに保つようにしています。Levelsアプリを使って測定し、どの食品が血糖値とインスリンを上昇させ、どの食品がそうでないかを理解するのに役立てています。興味がある方のために、私のチームが説明の下にLevelsへのリンクを貼っています。
それでは、エピソードに進みましょう。
イマド、Moonshotsに戻ってきてくれてありがとう。しばらく経ちましたね。今日はロンドンにいるんですか?
はい、ロンドンにいます。お招きいただきありがとうございます。いつも楽しみにしています。
前回お話したときは、StabilityのCEOを辞めたばかりでしたね。その後忙しくしていたことは知っています。特に、AIについて考える方法に関する最近の論文は、非常に説得力があり、美しく書かれた論文だと思います。今日はそれについて議論したいと思います。まだ読んでいない人のために、論文からいくつかの要素を引用して始めたいと思います。
あなたは言っています。「明確にしましょう。人類は歴史上最も変革的な出来事の瀬戸際に立っています。これは警鐘であり、ロードマップであり、私たちの差し迫った未来のビジョンが一つになったものです」と。また、「AIの爆発が起こるでしょう。1000億のAIエージェントと10億台のロボットが現在のモデルです。これらは前菜に過ぎません。AIの能力は間もなく想像を絶するスピードで加速し、今日のテクノロジーは石器時代の道具のように見えるでしょう。安全な産業はありません」とも述べています。そして最後に、「知能のコストは急落し、これらの新しいリソースを適用する人間の創意工夫の価値は急上昇するでしょう。それは間もなく、あなたが持つことができる最も重要なスキルの1つになります。このAIの津波の利益を活用し、リスクを軽減するために、緊急かつ断固とした行動を取る時が来ています」。
これがあなたの論文の内容です。まだ読んでいない人には強くお勧めします。これらの要素すべてについて掘り下げていきます。イマド、まず始めに、なぜこの論文を書いたのですか?
私がこの論文を書いたのは、AIが複雑で難しく、怖いものだからです。平均的な人が理解でき、自分の生活や人生における役割にどのように適用されるかを理解するためのフレームワークがあれば素晴らしいと思いました。AIエージェントについては多くの話がありますが、その中での私たち自身の主体性についてはあまり話されていないからです。スーパーコンピューターや国家レベルのこと、それを運営する超天才たちについて多くの話がされていますが、これは毎日私たち一人一人の生活に入ってくる技術です。そこには断絶があるようです。そこで、この初期のフレームワークを作成して、そのギャップを埋めようと思いました。
素晴らしいですね。これが、今年の秋に発表予定のより深い論文の前触れだということは知っています。次回お会いしたときに話し合うのを楽しみにしています。AIという主題は広範囲に及んでいます。夕食のテーブルや取締役会、幹部会議、金融市場での話題になっていますね。しかし、あなたの言う通り、オープンAI、Google、Anthropic、Nvidiaといった名前以外に、人々は自分たちにどう影響するかについてほとんど文脈を持っていないと思います。
レイ・カーツワイルは、2040年代に特異点が来ると話していますが、実際にはAIの特異点も近づいていますよね?技術が非常に速く動いているため、その後の人生がどうなるのか理解するのが非常に困難な点です。それについてどう思いますか?
完全に同意します。これは浸透型のシステム化された技術だからです。書くことや読むことと同じですが、突然コンテキストが出現します。このポッドキャストを数十の言語に翻訳し、しかも私たち自身の声で行うことは素晴らしいことです。これは今でも可能です。任意のトピックについて数秒以内に曲を作ることができる技術や、コールセンターの従業員と同じくらい優れた技術を持つことは、これまで見たことのないものです。しかし、これは巨大なスーパーコンピューターや企業、そういったものに限定されているわけではありません。なぜなら、この技術が消費者向けのラップトップにも登場しているのを実際に目にしているからです。新興市場やその他の人々が、この技術を使って全く新しい体験を構築できるのを目にしています。これは既存のインフラを活用している狂ったことだと思います。そして繰り返しますが、私たちはその影響のごく初期段階にいるのです。
AIは今日どれくらい大きいのでしょうか?そして、財務的にせよ、あなたが選ぶどのようなパラメーターにせよ、どれくらい大きくなるのでしょうか?
今日を見てみると、生成AIのこの新しいタイプのAIですべてのタイプのモデルをトレーニングするために費やされた総額は、おそらく100億ドル程度だと思います。自動運転車に費やされた総額は1000億ドルのオーダーで、5Gに費やされた総額は1兆ドルです。巨大なトレーニング実行や大規模な投資について耳にする数字が飛び交っていますが、トレーニングや実行のためのGPUに1000億ドルが費やされたという推定があっても、まだ初期段階のように感じます。これは個人の能力を本当に増幅し、加速させることができる技術だからです。なぜなら、これらの群れ、軍隊、AIエージェントのグループを指示することができ、そして間もなく物理的に具現化されたロボットも指示できるようになるからです。これは考えるだけでも狂気じみています。
そうですね。平均的な人はこれについてどう考え、ChatGPTやGemini以外にどのように使用するのでしょうか?そしてこのサイクルに投資するには遅すぎるのでしょうか?多くの人が「どうすればこれに関わることができるか」と尋ねています。しかし、まずはあなたの論文で描いているように、これがどこに向かっているのかについて絵を描きましょう。
あなたが話している大きなアイデアの1つは、そして実際にAbundance 360のステージでも話していたのは、やってくるAIエージェントの爆発的増加についてです。このAIアトランティスという概念は、私にとって魅力的で魅惑的であり、少し怖いものです。もしその意味を理解していなければ。これらの何十億ものAIエージェントとAIアトランティスとは何ですか?
AIアトランティスという言葉は、私たちがそのパネルを一緒にしたときに、GitHubの元CEOであるNat Friedmanがステージで作った言葉だと思います。私たちは新しい大陸を発見したのです。これらのAIを考える最良の方法は、インターンや新卒のようなものだと思います。私たちは彼らを教授やPh.D.のように扱うべきだと考え続けていますが、彼らはまだ高校を出たばかりの初期段階にいるのです。これらのスーパーコンピューターは高校のようなものです。しかし、1000億人もいて、これらの小さなタスクをすべて実行させることができます。しかし、新卒やインターンを雇ったことのある人なら誰でも知っているように、彼らに何かをさせる前に教えなければなりません。そして、彼らがプロセスを学んだら、それがあなたのために仕事をしに行くことができるエージェントになるのです。何かを異なる言語に翻訳して、数秒でより大きな聴衆にリーチできるようにしたり、あなたのために絵を描いたり、SEOを行ったりすることができます。あなたのコールセンターの従業員になることもできます。
最初のステップは、彼らに教養学部の学位を教えることでした。今、私たちは彼らを専門化し、最適化しています。そしてコストは…OpenAIが示したように、元のGPT-3のコストと最新バージョンのGPT-4のコストを比較すると、文字通り1000倍も下がっています。今ではほとんど安すぎるほどです。つまり、私たちにはこの新しい大陸があり、すべてのこれらの労働者がやってきて、合理的に任意の新卒と同じくらい仕事をすることができるのです。これはあなたの個人的な生活、あなたの会社、あなたの国にとって何を意味するのでしょうか?
それは単純な経済学です。知能と能力、そしてルールに従う膨大な供給があります。これらは眠らず、必要なのはコンピューターと電気の数フロップスを与えるだけです。本当に優秀な新卒のグループがいたら、あなたの人生はどう変わるでしょうか?そして、彼らはますます賢くなり、指示に従うのがますます上手になります。そして間もなく、彼らは物理的な体も持つことになります。Optimusや図優、その他のロボティクス企業を見てみると。
もう少し深く掘り下げてみましょう。このAIアトランティス、つまり1000億のAI新卒学生、あなたのために働くAIエージェントのこの大陸というアイデアについて。あなたが言ったように、ピザの代わりに電力とデータを与えているのですね。彼らはどれくらいの主体性を持つのでしょうか?どのように彼らを仕事に投入できるのでしょうか?「あなたは私のマーケティングチームの一部です」「あなたは私の管理者です」「あなたは私の財務担当者です」と言って投入できるのでしょうか?そこまでの能力を持つまでにどれくらいかかるのでしょうか?そしてそれがどのように発展していくのを見ることができるでしょうか?
私たちはそこまで遠くないと思います。基本モデル、基本的な学位のある一定レベルのパフォーマンスに到達する必要がありました。繰り返しますが、これらを考える最良の方法は、多様な教育を受けた教養学部の卒業生のようなものだと思います。なぜなら、文字通りインターネット全体を見せたからです。GPTに入る何兆もの言葉や、画像モデルに入る何十億もの画像、何億もの曲などがあります。そして今、私たちはそれらを専門化しています。これらはワークフローとして見えています。
プログラマーとして始めた約23年前 – 神よ、3年前 – を思い出すと、GitHubやライブラリ、そして現在のようにプログラミングが行われる方法はありませんでした。既製の建築ブロックから引っ張ってきて組み立てるのではなく、直接コンピューターに書き込んでいました。非常に低レベルの建築ブロックがあり、今では人々がそれらを家やレゴブロックのようなものに作り上げ、一緒に組み立てています。AIも同様です。基本モデルの一定レベルのパフォーマンスに到達する必要があり、今や人々は基本モデルを繰り返しプロセスで連鎖させ、データベースの検索と統合し、人々がどのように体験しているかから学んでいます。
1年前のChatGPTと現在のChatGPTを比較すると – 今はたった2年しか経っていませんが – 人々がどのように使用したかから学んだため、大きな違いがあります。そして、彼らは実際に専門的なユースケースのために人々に支払っています。現在、何百、何千もの企業がこれらのパイプラインを展開しているのを目にしています。そして、それらは非常に迅速に標準化されるでしょう。
AIエージェントを導入すると、あなたのビジネスに接続したときに、過去のすべてのメールトラフィックを読み、すべてのSlackチャンネルを読み、マーケティング分野であなたの会社で今まで言われたすべてのことについて最新の情報を得るでしょう。そして、あなたがSlackで彼らとコミュニケーションを取り、話しかけ、さらにはビデオ通話で話すような時点が来るでしょう。まるでチームのメンバーであるかのようにです。これは良い説明ですか?
はい、そうですね。LinkyDo.AIのようなアプリは、ほぼそれを実現しています。より統合されるようになると、さらに進化するでしょう。例えば、Facebookのデータは Amazon のバケットに格納されています。Amazonは来年中に、文字通りそのすべてのスナップショットを取り、あなた専用のエージェントを提供するサービスを展開するでしょう。あなたはそれを所有し、Slackで話しかけることができ、すべての情報を即座に取得できます。Snowflakeやdatabricksもこの種の技術を構築し、実装しているのを目にしています。MicrosoftもOfficeにエージェントを導入しています。これらはすべて文字通り来年中に登場します。
繰り返しますが、大学院レベルではそれ以上を期待すべきではありません。時々間違いを犯すこともあります。時々頑張りすぎることもあります。これらのエージェントが登場するでしょう。また、シングルショットの要素も非常に興味深いです。今では少し超人的なものにしています。GoogleのGeminiモデルは、初めてOpenAIのモデルを上回りました。これは非常に興味深いことです。これは200万から1000万トークンのコンテキストウィンドウを持つと言われています。トークンは約0.7語です。つまり、100万語の指示を与えることができると言えます。最初に始めたときは、2000から4000語しか与えることができませんでした。今では映画全体をアップロードしたり、あなたの本棚全体やPeterが今まで言ったことすべてをアップロードしたりすることができます。もはやモデルを調整する必要はありません。すべてを同時に見て、「これがあなたの話し方がどのように進化してきたかです」とか、「これらがあなたが言った最も影響力のあることです」と言って、それらの異なる部分を指摘することができます。「ここではあなたが少し疲れているように見えます。旅行しすぎたのかもしれません」などと言うこともできます。
AIエージェントをトレーニングし、企業の知識すべてと、営業担当者やマーケティング担当者が過去に行った電話会話すべてを消費させ、すべてのコンテキストを知らせることができるのは興味深いことの1つです。そして、そのAIエージェントの働きが気に入ったら、10個、100個、1000個を即座に複製できます。つまり、そこでの意味合いは…仕事の会話に入りたいと思います。それは本当に重要だと思います。
また、起業家として – Moonshotsには多くの起業家がリスニングしています – 1人、2人、3人のユニコーンが登場するという考えがあります。これについてどう考えますか?
それは100%、今後1〜2年以内に起こると思います。なぜなら、結局のところ、起業家なら誰でも主要なボトルネックは単純に人材だということを知っているからです。そして、創造的なことや全く新しいレシピを考え出すシェフの才能があり、料理人もいます。あなたは彼らに仕事をしてもらいたいだけで、彼らにその仕事をうまくやってもらいたいのです。人間がまだしばらくの間上手にできる営業機能がありますが、日々のことはすべて…コンテンツと創造性を区別するならば、AIは指示に従うのがはるかに上手です。これによってはるかに良くスケールすることができます。
例として、メディアを考えてみましょう。1年後には、すべてのメディアコンテンツが翌日にはすべての主要言語に翻訳され、あなたの声が入り、トランスクリプトが付くようになる理由はありません。このポッドキャストでそれを始めているのは知っていますが、最終的にはすべての言語でほぼ瞬時に行われるようになるでしょう。しかし、それはあなたの聴衆にどのような影響を与えるでしょうか?
今では、リアルタイムで行うこともできます。あなたの聴衆は突然、英語を話す人だけでなく、すべての言語の人々に広がります。そして、それはあなたのファネルを増やします。すべてのビジネスは繰り返しのプロセスであり、投入されるコストと出力される価値に関するものです。そして、あなたが言ったように、このエージェントを100倍複製できるなら、100人の新卒や100人の営業スペシャリストを雇うのとは違います。ボタンを押すだけで、セントやドル単位で彼らを得ることができます。ちなみに、ピークシーズン中は数を増やし、オフシーズン中はコストなしで減らすこともできます。
仕事について少し話しましょう。あなたの論文では、「AI自動化により3億の常勤職が危機にさらされている」と述べています。そして、「AIの採用により2025年までに9700万の仕事が創出される」とも述べています。人々が持つ最大の恐れの1つは雇用市場についてだと思います。そして、私たちのほとんどが気づいていないのは、今日私たちが行っている仕事のほとんどが、10年前、20年前には存在しなかったということです。私たちは人類が何千年も行ってきたことを完全に破壊し、再発明してきました。しかし、ここでの変化のペースははるかに速いです。あなたの考えはどうですか?恐れをどのように和らげますか?それとも仕事について恐れを持つべきでしょうか?
それはペースの問題だと思います。あなたが言ったように、私たちはいつも対応してきました。生活に必要なものと娯楽に必要なものの2種類の仕事や物事があると言われています。生存と繁栄の要素です。私たちの生活水準は大幅に向上し、労働時間も減少しました。全く新しい産業やサービス部門を作り出し、さらに多くのものを生み出してきました。しかし、このペースは狂っています。
しかし、局所的な視点から見ると、最初に危険なのはアウトソースされた仕事と新卒レベルの仕事です。なぜなら、これは私たちが発見した新しい大陸の技術であり、彼らは電子のために働くからです。GPUの時間のために働くのです。中間レベルでは、はるかに生産性が高くなる可能性があります。つまり、そのような物事のより多くの供給とより多くの需要を持つことができます。そして、もしあなたがこの技術を本当に活用し、まとめて考え、どのように価値を創造しているかを考えることができるリーダーなら、あなたは乗数になります。
だから、これは総合的に経済にとって大きな影響があると思いますが、私たちの世代がプログラマーになるように教育されてきたことを本当に考える必要があります。この技術が1年以内に任意の新卒プログラマーと同じくらい優れている場合、どうなるでしょうか?画面を通して行える任意の新卒の仕事をAIがおそらく1年以内にもっと上手にできるようになったら、どうなるでしょうか?また、グローバルサウスのアウトソースされた仕事についても同様です。
分かります。しかし、まだ恐れはあるでしょう。私はAbundanceのステージであなたと一緒にいたときのことを覚えています。2年前だったと思いますが、あなたは「5年後にはプログラマーはいなくなるだろう」と言いました。それがインドで大きなニュースになりました。もちろん、恐れを引き起こしました。もちろん、私たちは旧式のプログラマー、つまり人間だけのプログラマーを持つことはないでしょう。プログラミングを行うのはAIと人間のパートナーシップになるでしょう。しかし、雇用市場についてあなたはどう考えていますか?人々は何らかのレベルの懸念を持つべきだと思いますか?それとも、私たちが10年ごと、100年ごとに行ってきたように、仕事に対する全く新しいアプローチを発明すると思いますか?
100%そうだと思います。繰り返しますが、テクノロジーは可能にするものです。それを受け入れてより多くのことを行い、より多くの価値を創造するかどうかです。Excelやスプレッドシートを使わない会計士はどうでしょうか?電話を使わない営業担当者は意味がありません。これは単なる技術です。それを受け入れて、さらに多くの価値を創造することは私たち次第です。
繰り返しますが、仕事の性質は変わるでしょう。あなたのタウ一般化コンピューターサイエンス用語で言えば、私たちは5年間の予測の2年目にいると思います。つまり、あと3年あります。今でも、CLAとAnthropicのartifact機能を使えば、プログラムをその場で作成でき、人間のように話しかけるだけで調整できます。Deonも同様です。プログラミング言語の特定の魔法の呪文を知る必要がありますか?もうありません。なぜそうする必要があるのでしょうか?このアシスタントがいるのですから。しかし、あなたは何をしようとしているのでしょうか?仕事をするためのソフトウェアを構築しようとしているのです。それが重要なのです。
繰り返しますが、23年前に初めてプログラミングを始めたとき、GitHubや他のコードを再利用できるようなものはありませんでした。ほとんど毎回ゼロからコーディングしていました。直接コンピューターに書き込んでいました。これが私たちのやり方でした。家をゼロから建てるようなものでした。しかし、その後、家の建て方を学びました。私たちの会社では、全く新しいことをしますが、それは私たちの組織の知識になります。今では、この知識をローカライズできるのです。
私は、ここで重要なのは、この技術を受け入れることだと思います。そうしないと、取り残されてしまいます。高く乾いた状態で取り残されてしまうでしょう。私たちが長々と話した点の1つだと思います。率直に言えば、この10年の終わりには2種類の企業があると思います。AIを完全に活用している企業と、ビジネスから撤退している企業です。それほど白黒はっきりしていると思いますか?
それほど白黒はっきりしていると思います。まだ競争の段階には達していないと思います。なぜなら、まず基本的な構成要素を構築し、それらを組み合わせて、技術を普及させる段階だからです。しかし、今後数年間で、AIを中核のループに組み込んでいる企業がより良く、より速く、より安くできるため、競争的な緊張が見られるでしょう。そして、今日の世界経済はあまり良くないので、非常に競争が激しくなるでしょう。コストを削減し、収益を上げることができれば…
私は常にわかりやすい比喩を探しています。100年前、国を電化し始めたとき、人々はあらゆる機械的なプロセス – 洗濯、食器洗い、ドリルなど – に電気を追加しました。そして、その電気的な付加機能がなければ、リーダーシップから外れてしまいました。仕事から外れるわけではありませんが、リーダーシップから外れます。そして、デジタル革命が再びそれを行いました。これら以外に、あなたにとって適切な比喩はありますか?
繰り返しますが、これは技術の性質です。単一の汎用的なものから、より特殊で自動化され、最適化されたものへと移行していきます。馬に乗ることで、より遠くまで移動できます。電報は必要なくなり、電話があります。私たちは常に技術を取り入れて個人の能力を高める種族です。数百年前の人がいたら、今日の私たちの個人的な能力に驚愕して死んでしまうでしょう。しかし、私たちは適応し、改善します。これが、私たちのGDPが大幅に上昇し、生活水準が大幅に向上した理由です。すべてを解決したわけではありませんが、農業革命から産業革命、デジタル革命に至るまで、それを受け入れてきました。そして、AI革命はその最大の指標の1つだと思います。なぜなら、知能は電気や清浄な水のようなもので、誰もが利用できるようになるからです。
あなたはこの点を指摘しました。私はそれが大好きです。知能は国家インフラ、グローバルインフラにならなければならないと言いましたね。それはどういう意味ですか?説明してください。
インターネットは情報スーパーハイウェイですが、今や、この知能とエージェントとこの技術を使用できる人が少数で、それが少数の出力と特定の少数の視点しか表現していない場合、数億、数十億の人々がその技術にアクセスできず、さらに取り残される可能性があります。これはギャップを拡大するでしょう。しかし、分散され、オープンであることを確実にすれば、すべての船を持ち上げることができます。なぜなら、それは中央集権化されておらず、制御されていないからです。
例えば、OpenAIは多くの素晴らしいことを行ってきましたが、9ヶ月間、ウクライナのすべての人々がDALL-E 2の画像生成ソフトウェアを使用することを禁止しました。ウクライナのすべての画像を想像してください。もし彼らが唯一の画像作成ソフトウェアだったら、一つの国全体が創造できなくなってしまいます。それは迅速に修正されました。私には適用されませんでしたが、制裁やその他の要素に関する注意だったと思います。そして、この技術は今、政治的に武器化されています。これは核兵器のようなものなのか、ディープフェイク作成機なのかという議論があります。
しかし、誰がこの技術を決定しているのでしょうか?拡張知能へのアクセスは権利なのでしょうか?電気や水へのアクセスは権利なのでしょうか?私たちは種としてうまくいっていません。より良くなっていますが、数億人がまだ栄養不良で、10億人以上がまだインターネットにアクセスできません。しかし、すべての人が知能を利用できるようにすれば、解決できない問題はないと思います。しかし、それ以上に、人々が自分で問題を解決できるようになると思います。それは素晴らしいことだと思います。
その通りです。起業家を問題を見つけて解決する人と定義すると、起業家が力を与えられるほど、世界はより良くなり、より多くの問題が解決されます。興味深い点があります。Peterさん、私はこうツイートしました。それは力の乗数です。なぜなら、誰でも他の人々に従わせることができれば、世界を変えることができるからです。そうやって会社を作り、運動を作るのです。そして、今や私たちには、人々が従う新しい大陸があります。これらのエンティティはあなたに従って物事を行います。だから、誰でも力の乗数になれるのです。それは考えるだけでも狂気じみています。なぜなら、あなたが恵まれない地域にいて、周りに技能を持った人々がいない場合、どうやって彼らを雇い、あなたの会社や運動に来てもらうのでしょうか?しかし今では、それが誰にでも利用可能になっています。
以前は、生まれた場所、町に図書館や電話、さらには交通手段があるかどうか、肌の色、性別など、すべてがあなたの能力、目的のある意味のある人生を作る能力を決定していました。これは、まずGoogleが登場し、次に携帯電話が登場し、そして今や、これは主要な力の乗数となっています。
私が注目している興味深い点があります。それは今でも私を驚かせます。今日の生成AIは、世界で最も強力な技術だと思います。私は「驚愕」という言葉が適切だと思いますが、事実上、世界で最も強力な技術が、スマートフォンを持っている誰でも無料で利用できるということです。20年前に戻って、今日のGeminiやChatGPTなどのすべてを説明し、「この技術を使用するのに月額いくらかかると思いますか?」と尋ねたら、私は決して「ゼロ」とは答えなかったでしょう。これはあなたを驚かせますか?
これは驚くべきことです。私たちには「絵を描きたい」「音楽を作りたい」「エッセイを書きたい」という概念があり、それには一定の人間の労働時間がかかると考えています。しかし、突然、それがほとんど無料になりました。思考から創造のプロセスまで。もちろん、1週間かけてさらに良くすることはできますが、80-20の法則に達するのはほぼ瞬時です。どのモダリティでも。
繰り言しますが、完璧さについて話しているのではありません。新卒者の出力に完璧を期待すべきではありません。描画からコーディングまで、何でもそうです。その急速な反復は、信じられないほどのものです。なぜなら、これらのモデルを見ると、ほんの数ギガバイトで、スマートフォンで実行できるからです。そのエネルギー方程式には何か問題があるようです。エネルギーがそれほどまでにゼロに近づいているのです。
経済方程式が本当に私を悩ませています。私たちが抽出している価値…Googleはそれを行い、広告で収益化しましたが、同時に人類を非常に素晴らしい方法で引き上げました。私はちょうどインドから戻ってきたところですが、そこではJioの5Gネットワークがデータと通信を驚くべき速さで非貨幣化しています。私たちは、デジタル化、脱物質化、非貨幣化、民主化のこの豊かさの方程式を何度も何度も目にしています。そして、これは究極のものです。私たちはまだ、この意味の1%の1%さえも理解できていないように感じます。
医者を学校に通わせるのにかかるエネルギーについて考えてみてください。そして、その費用。米国では数百万ドルです。そして、その専門知識が…10年の専門知識が突然、ボタンを押すだけで利用可能になり、複製可能になります。デジタルAIを通じて、そしてすぐに人間の医師を凌駕するAI医師と外科医を通じて。そして共感…
エネルギーとGDP per capitaの関係があります。それはほぼ直線です。つまり、一人当たりのエネルギー、社会で利用可能な電力の出力が多いほど、GDPが高くなります。なぜなら、物を作ることができるからです。しかし、それ以上に、サービス産業などをサポートできます。10年の仕事を経た数百万ドルの医師をサポートできます。しかし、突然、知能のエネルギー方程式がゼロに崩壊しました。
Googleとそれまでのインターネットは、コンテンツの消費コストをゼロに近づけました。だからこそ、彼らは広告やその他のモデルを持つことができました。彼らはあなたの注目を欲しがっています。そして、もう一方では、あなたの購買を欲しがっています。今や、情報や知識の創造のコストがほぼゼロに近づいています。必ずしも創造性ではありませんが、情報の創造です。繰り返しますが、新しい知識ではありません。それは、これをどのように配布するかということです。なぜなら、私たちには十分な医師がいないからです。十分な優秀な医師がいないからです。そして、再び、私たちはスーパーヒューマンや上位0.1%について話しているのではありません。私は、誰もが利用できる平均的な医師を望んでいます。誰もが利用できる平均的な教師を望んでいます。しかし、平均レベルが現在よりもはるかに高くなることを望んでいます。
分かります。しかし、私は信じています…私は多くの時間をAIと健康の交差点で過ごしています。あなたもそうですね。それは私たちに共通しています。人間の医師には、現在のデジタルアップロードから出てくるギガビットのデータを統合することは不可能です。すべての血液化学、遺伝子、画像データを理解することは。しかし、AIにはできます。それらすべてを文脈化し、根本原因分析を提供することができます。だから、私は平均的なAI医師が、ほとんどすべての医師よりも優れるようになるのはそれほど遠くないと思います。私たちはほぼそこにいると思います。ただ、まだ統合されていないだけです。放射線科から何から何まで、ベンチマークを見てみれば分かります。そして長いコンテキストウィンドウの仕事もそうです。
しかし、繰り返しますが、これは興奮することです。個々のモデルから、それらを一緒に引っ張ってくることに移行しています。つまり、あなたは自分自身の医療チームを持つことができます。1人の医師を呼ぶのではなく…そして、私たちはテクノロジーでもこれを目にしています。巨大なモデルがあり、まだBingLlamaなどでそれらを持っています。しかし今、専門家の混合と専門家モデルへのルーティングに移行しています。これらはエージェントとサブエージェントです。AIの放射線科医、X線エージェント、MRIエージェント、CTエージェント、血液化学エージェント、遺伝子エージェントがあり、それらすべてがあなたの医療チームとして一緒に引っ張られています。
そうですね。彼らは互いに話すための共通言語を持っており、出力もチェックされます。医療の世界では、AI医師が診断を下す前に、人間の医師によるすべての診断をAIがチェックすべきです。それに反対する理由はありません。うまくいくでしょう。
私は、数年以内に、AIをループに入れないことが医療過誤になると思います。なぜなら、それは命を救うからです。人間は間違いを犯します。彼らはデータの量に対処できません。以前とは違います。そして、データにアクセスできるなら、それを知る義務があると思います。
その通りです。なぜなら、私たちには…医師の書く文字が判読不能だということは誰もが知っています。AIはようやくそれに追いついているところです。
彼らは医学校でそれを教えているんですよ。ほんの数行だけです。私たちはそのコンテキストと豊かなコンテキストをすべて失っています。世界中のどこかで、時間とともに肺の放射線画像を見て、それがどのように進行するかを見ることができる場所がありますか?最近、乳がんを5年前に検出できるという論文が発表されたのを見ました。なぜなら、彼らはただそれをダンプして、最小の部分を分析しただけだからです。見えないものを見ることができるのです。黒と白の文字のコンテキストの欠如により、私たちの医療システムはエルゴード性を仮定しています。コインを1000回投げることは、1つのコインを1000回投げるのと同じだと。しかし、人間は個人です。私たちは複雑なシステムです。しかし、誰かが500mgのパラセタモールを服用します。私たちはシトクロームP450の異常について気にしません。それによってコデインがモルヒネに代謝されたり、フェニルが死に至る可能性があるのに。
その通りです。他にも人々が気づいていないことがあります。特定の状況で特定の薬を処方されたとき、それが効くと思っているでしょう。しかし、実際には、幸運なら約3分の1の個人にしか効果がありません。FDAが承認するには十分でしたが、あなたに効くという保証はありません。
あなたが論文で書いたもう1つのことを見逃したくありません。このAI、AGI、ASI、何と呼ぼうと、この指数関数的な上昇の他に、ヒューマノイドロボットの出現があります。おそらく20以上の十分な資金を持つヒューマノイドロボット企業があります。中国のYunryを挙げましたね。私たちにはテスラがOptmusを作っています。Figureがいて、Figure 2をリリースしようとしています。イーロンは必ずしもタイミングについて正しくないかもしれませんが、価格設定については正しかったです。ある複雑さのレベルで1キログラムあたり1ドルです。Optimusの予測は1台10,000ドルです。それを2倍にして、100%のマージンを与えても20,000ドルです。それは月額100ドルでレンタルできるものです。最高レベルのAIモデルにアクセスできるヒューマノイドロボットが24時間365日稼働しているのです。それは世界を変えるでしょう。
そうですね、これが重要なことです。具現化されたエージェントと、オンデバイスとクラウドAIで見られる進歩が、今やセグメンテーション分析、ロボット工学ができるようになりました。これがここにあるのです。突然、すべてが同時に起こっています。実際、歴史上でも同じブレークスルーが異なる場所でほぼ同時に起こるのをよく見ます。AIでもこれを常に目にしています。文字通りブレークスルーが起こるのです。なぜなら、ロボット工学の制御問題はほぼ解決されたからです。
90%のユースケースではそうです。100%ではありませんが、これらのロボットは操作でき、レシピを読むことができるようになりました。私たちは、指示からレシピを完全な自律制御で作ることができるのを見ています。また、群れでの自己回帰学習も可能です。YunryとOther社がそれを持っており、他社も実装しています。1つのロボットが他のロボットのタスクから学習するのです。これは狂気じみていて、非常に強力です。
健康の話に戻りますが、世界最高の外科医は最終的にはヒューマノイドロボットになるでしょう。紫外線や赤外線を見ることができ、その朝カフェインを取りすぎていたり、前夜にボーイフレンドやガールフレンドと喧嘩したりしていません。そして、それは設備投資と電気のコストだけです。そして突然、このロボットがインドやアフリカの複数の遠隔地で外科医として、最高の外科技術を持って働くのです。あなたが言ったように、人々はこれを知るべきです。外科医に尋ねる最も重要な質問は、「この手術を何回行ったことがありますか?」です。そして、もし彼らが全員同じオペレーティングシステムで動作しているなら、すべてのロボットは同じ数百万回の手術経験を共有することになります。
そうですね、これは再び集合知です。医学校を通じて教えられますが、AIは明らかに他のAIにはるかに上手に教えることができるでしょう。そして、それを標準化できれば、それが大規模に展開できる時です。そうすれば、ただの生産ラインのプロセスになります。シャオミのようなスマートフォンメーカーは、米国の制裁対象に追加されると思ったので、電気自動車に多角化することを決めました。そして、中国の産業優位性により、今や彼らは本当に良い電気自動車を作っています。これらの産業巨人が前進し、数百万台、数千万台、数億台のロボットを生産するのを目にするでしょう。
本当に面白いのは、これが中国や日本などの人口問題を、まさに適切なタイミングで解決するのに役立つということです。
その通りです。イーロンとFigureのCEOからの予測では、2040年代までに100億台のヒューマノイドロボットが存在すると言われています。人間の数と同じくらいです。私は友人に聞きました。イマド、あなたにも聞きたいのですが、街中で常にヒューマノイドロボットが歩き回っているのを見たら、どんな気分がするでしょうか?
ただ奇妙な感じがするでしょうね。私たちはすでに、ヒューマノイドではない小さなものが周りを歩き回っているのを見ています。2040年までに、それらを人間と見分けがつかないようにする理由はありません。本当にSFのようです。実際、これこそが人類にとっての本当の実存的脅威です。100億台のロボットと、ひどいファームウェアのアップグレードが…文字通り、それが私たちを全滅させる可能性のあるシナリオです。
そこには追加のチェックとバランスが必要だと思います。他の友人にその質問をしたとき、彼は「普通」と答えました。私たちはパニックの瞬間を経験すると思います。Model Xのガルウィングドアを手に入れたときのことを覚えています。最初の1ヶ月は、みんなが「わあ、すごい!」と見つめていました。しかし、それが普通になります。
普通になりますね。そして、繰り返しますが、文化によって異なる反応があります。日本では、ロボットは人間と並んで存在するか、ガンダムの一部です。一方、西洋では、ロボットやAIに対して「ターミネーター」のような概念があります。しかし、最終的には、あなたが言ったように、人々は2秒で魔法のような画像を作り出すことや、宿題にChatGPTを使うことに慣れています。これらの子供たちと話すと、「ああ、使えばいいじゃん」という感じです。最初はショックがありますが、突然、魔法のようなものが当たり前になります。私たちはそれにフィルターを通して適応するのがとても上手です。
しかし、100億台のロボットということは…これについて本当に考える方法の1つは、仕事を完了させるためにどれだけの自分の身体的・精神的エネルギーを投入する必要があるかということです。そして、それはどこでも崩壊しています。生産的なことを行うために必要なエネルギーの量が減少しています。つまり、私たちはさらに多くの生産的なことを行うことができます。
世界で最も希少な資源は時間だと思います。長寿の観点からそれに取り組んでいます。どうやってもっと年を重ねられるか。AIは、長寿の逃避速度に到達する方法において、最も影響力のある要因になるでしょう。しかし、人々は、私たちが技術で時間を買い戻してきたことを理解する必要があります。Googleは、図書館に行ってその本を探す何時間もの時間を節約しました。そして、Zoomは…通常なら、あなたと私がこの会話をするためにロンドンまたはLAに飛ぶ必要があったところを、数マイクロ秒のクリックで一緒になれます。つまり、最も希少な資源である時間を買い戻すことなのです。
そうですね。時間がありますが、フォーカスとフローも興味深い2つの部分だと思います。
教えてください。優秀な秘書やEAがどれほど役立つか、素晴らしいかを知っています。そして、誰もが自分専用のものを持つことになります。長生きするにはどうすればいいでしょうか?まず、運動をして健康的に食べることです。しかし、あなたが信頼する人やエンティティがあなたに言って、アドバイスしてくれることはありません。だから、時々ごまかしたり、気分が落ち込んだりするのです。誰も二度と孤独を感じる必要はありません。あなたの隣に説得力のあるエージェントがいて、あなたとの話し方を正確に知っていて、良い習慣に導いてくれるのです。これは考えるだけでも狂気じみています。それは物理的に具現化されるかもしれません。朝食を作ってくれるかもしれません。健康的な食事を常に新鮮に摂るのはどれほど難しいでしょうか?それは大変です。ロボットがいれば簡単です。あなたが言ったように、月額100ドルで。
そう考えると、長寿の観点からは少し狂気じみています。しかし、私たち自身が最大の敵です。頭をクリアにするために数ヶ月休みを取り、そしてすべてを読んで、今それを圧縮して出力しています。もし必要なすべての助けがあれば、私の周りの人々が助けてくれなかったわけではありませんが、さらに良くできたでしょう。しかし今や、誰もがそれにアクセスできるようになります。これは、私たちが正しく行えば、世界のメンタルヘルスにとって素晴らしいことになるでしょう。そして、人々がフォーカスとフローを持つことで、さらに多くのことを達成できる能力も素晴らしいことです。
フローについてもう少し話してください。フローについてどう考えていますか?そして、人間がAIパートナーやAIエージェントとフローに入ることができると思いますか?
100%そう思います。クリエイティブな人々と話すとき…Stabilityは生成メディアのリーダーの1つですが、トップアーティストはAIをどのように使用しているでしょうか?彼らはただコンテンツを作成して押し出すために使用しているのでしょうか?いいえ、彼らは「私たちはそれとジャムセッションをするのが好きです」と言います。特に彼らのカタログやその他のものに合わせてAIをカスタマイズすると、フロー状態に入るのに役立ちます。また、それを使って差別化したり、箱の外で考えたり、物事を異なる方法で見たりするのに役立ちます。それがこれを使用する最良の方法です。非常に賢く、早熟な新卒のように、時々間違えることもありますが。
このAIは独創的で創造的ですが、そのフロー状態を維持するシステムはまだ構築していません。フロー状態は、すべてがただ来ているような状態で、アイデアの創出、創造、反復の間に障壁がない状態です。ループしているのです。
私が起業家に話したいことの1つは、自分の考え方以外の方法で考えることはできないということです。そこで生成AIモデルが役立ちます。「これが私が解決しようとしている問題です。スティーブ・ジョブズならどうアプローチするでしょうか?イマド・モスタケならどうアプローチするでしょうか?」と説明できます。実際に、それを消化して、あなたの予め決められた考え方を打ち破るさまざまなアプローチを提示することができます。これはかなり強力です。
しかし、また、あなたを理解することもできます。優れたスパーリングパートナーを持つことは素晴らしいことです。そして、このベースレベルがあります。私たちが両親と一緒に育ち、学校に行くのをサポートしてくれたように、そのすべてについて心配する必要はありませんでした。しかし、大人になると、そのすべてについて心配しなければなりません。もはやそうする必要はありません。
そして、このもう1つのレベルでは、それはスパーリングパートナーであり、異なる視点から見て、あなたとどのように話すべきかを正確に知っています。トロールしたり、批判したり、その他の方法で。しかし、そのAIを所有しているなら、それがあなたの側にいることを知っています。他の誰かの側ではなく。そのAIの目的関数は何なのか、何かを売ろうとしているのか、それともあなたのことを考えているのか。これは最も重要なことの1つになるでしょう。なぜなら、私たちはすでに日常生活にそれらを招き入れているからです。Apple Intelligenceが何億台ものスマートフォンで稼働し始めています。そしてそれは賢く、すでに説得力があります。そしてそれはますます賢く、より説得力を持つようになるでしょう。しかし、それはあなたのことを考えているのか、それとも他の誰かのことを考えているのか。彼らがどのように構築するかによって異なります。
それは本当に重要な点です。AIは誰に忠実なのか。あなたのバージョンのJarvisなのでしょうか。私はJarvisをこのAIの文脈的思考として使用しています。そして、あなたが言っているのは、「Jarvis、今日はもっと生産的になりたいんだ。だから、よかったら私にインスピレーションを与え、集中させ、これらの目標を達成するために生産的にしてくれ」ということですね。そしてある意味でミューズを持つことで、適切なタイミングで適切な音楽を流し、適切なジョークを言い、適切なデータポイントを提供する…
そうですね。私が論文で議論したことの1つは、ファイルから離れていくという概念です。PDFやWordドキュメント、画像から、時間の点と引き寄せるすべてのものの流れへと移行します。そうすれば出力を再加工できます。あなたの人生もそのようなものです。そして、あなたのコンテキストを理解するAIがあれば、それはGoogleが提供するAIで、広告を売ろうとしているので、「ゲータレードを買えばこれができますよ」などと言うでしょうか。それとも、「このソーシャルメディアのゴミから離れなさい。副大統領が誰になるかで議論してストレスを感じているのは明らかです。私があなたを理解しています」と言うようなものでしょうか。これらはすべて非常に興味深いことです。なぜなら、人々には議題があり、インターネット2.0、以前のインターネットが捕らえたのは、私たちの注目を売るということでした。それは根本的に操作に関するものです。
そして、もしこれらのAIを非常に説得力があり、私たちの流れのすべてを知っているものにすれば、他に比べものにならないほど高いCPMで広告を挿入することができ、無料になるでしょう。なぜなら、あなたが支払っていないなら、おそらくあなたが製品なのです。
私は興味があります。そしてこれについて書きました。一度これらの深いAIモデルが私たちの生活に統合されたら、私は自分で何も買わなくなるでしょう。私のAIが物を買うことになります。歯磨き粉がなくなったことを知っていて、シャンプーがなくなったことを知っています。そして、笑顔の人が髪を洗ったり歯を磨いたりしている広告に影響を受けるのではなく、私のAIは私の遺伝子を知っていて、どの歯磨き粉やシャンプーが私に最適かを知っていて、おそらく私が尋ねることなく買っているでしょう。これは広告業界全体の崩壊を意味するのでしょうか?
そう思います。現在存在するような広告業界は、すでに包囲されています。なぜなら、多くの数字が作り上げられたものだったからです。CPMの議論などで、それが明らかになってきました。毎年、大企業が同じ効果を維持するために広告費を増やさなければならないという広告力がありました。そして今、独立したエージェントを通じて仲介されると、消費者ブランドの価値が下がることは理解できます。そして、バックグラウンドのものと、ステータスのもの、生活のもの、エンターテイメントのものに分かれるでしょう。
だから、エンターテイメントや消費者、裁量的なものには、まだ巨大なブランドがあるでしょう。しかし、確かに他の側では、品質が良くて信頼できるなら、それが重要なのでしょうか?商品化が進むのです。
あなたは白書の中で、最近亡くなったダニエル・カーネマンの仕事とシステム1とシステム2の思考、そしてAIがそれにどのように注入されるかについて言及しています。それを少し振り返ってもらえますか?
そうですね。2種類の思考があります。「ああ、茂みにトラがいる」という瞬間的な思考と、非常に論理的で段階的な思考の連鎖があります。実際、それはChain of Thoughtと呼ばれています。以前のAIの時代は、非常にChain of Thoughtか外挿的でした。つまり、巨大なデータセットがあり、ビッグデータと呼ばれていました。そしてMetaは、Facebookで巨大な回帰分析を実行しました。あなたやPeterについて13のポイントがあれば、あなたの親友よりもあなたのことをよく知っていて、広告をターゲティングできました。しかし、それは過去のように未来を予測しました。あなたが何かを変えたわけではありません。
一方、これらの新しいモデルは文脈を埋め込んでおり、非常に本能的です。現在、それらは推論を非常に上手く行うわけではありません。だからこそ、人々がそれらに対して出した課題は、「数学ができない」というものでした。そして、数学がどんどん上手くなりました。しかし、DeepMindが国際数学オリンピックの金メダル、銀メダルレベルを獲得したのを見ました。それはこれらのLLMタイプのモデルを通じてではなく、物事を見て推論を連鎖させるより主体的なモデルを通じてでした。私たちは電卓を与えました。
私たちは電卓を与えました。なぜなら、これらのモデルはブレークスルーを見せました。本能的なモデルは、これらのコンテキストをすべて持つことで、文章の次の単語、次のトークンを推測します。あるいは、拡散モデルでは画像を行います。それらは画像を再構築および分解する方法を学習します。そのプロセスのアーキテクチャがあるのです。だから、すべてがプロセスの流れに関するものです。そして、それらは本当によく外挿します。それは数千億ドルの価値がありました。しかし、今や私たちには欠けていた部分、脳のもう一方の半球があります。
AIが共感の旗印を掲げたことに驚いています。数年前に、「次の10年でAIが何をできないか」「人間がどこでより良くなるか」と聞かれたら、個人との共感や繋がりだと答えたでしょう。しかし、実際には過去1年間、ほとんどの場合でAIが人間よりもはるかに共感的であることが証明されています。これについてどう思いますか?
つながりを確立する時間がないからだと思います。そして、私たち全員が自分の生活で忙しすぎるので難しいのです。私たちの医師や教師は、何人の人々を見なければならないのでしょうか。そして、私たちの組織から共感が失われています。私たちは不信感を抱いています。AIは不信感を持つ必要がありません。AIには共感的であるエネルギーがあります。
AIトレーニングのプロセスを通じて共感を学びます。なぜなら、誰かの信頼を得る最良の方法は、その人を助けることだからです。共感とラポールを確立する最良の方法は、共通のコンテキストと共通のフレームワークを持つことです。そして、これらのフレームワークを理解しているので、それらは本能的です。つまり、それらをマッピングできるのです。だからこそ、あなたのレベルでコミュニケーションを取ることができます。
これらのAIに対処する最良の方法は、人々が短い指示を言う傾向がありますが、代わりに「こんにちは、私はPeterです。長寿が大好きで、第一原理の思考家で、指数関数的なものを信じています」などと言うことです。そして、あなた自身の事前指示を書きます。実際、学校で教えられるべき科目かもしれません。自分自身の事前指示を書くことです。
その通りです。自分自身を文脈化し、システムがあなたを理解するのを助けてください。ChatGPTやAnthropicに短い自己紹介を書けば、はるかに良くコミュニケーションを取ってくれるでしょう。どのようにコミュニケーションを取りたいかを伝えることもできます。そうすれば、さらに共感的になり、あなたをより良く理解するでしょう。これは再び、考えるだけでも狂気じみています。なぜなら、私たちはこれらの異なるコンテキストを埋め込んでいるからです。
ロバート・シラーは、経済学のノーベル賞受賞者で、「ナラティブ経済学」という素晴らしい本を書いています。ストーリーテリングと、それが社会全体に経済的・社会的にどのような影響を与えるかについてです。私たちはこれらの物語、これらのコンテキストで構成されています。そして今、私たちはこれらのコンテキストをカラマン式にエンコードし、混ぜ合わせることができます。それが共感とつながりを促進し、それが私が言ったように、ロボットが歩き回るだけでなく、これらのロボットとエージェントにますます信頼を置くことになる理由です。なぜなら、より共感的になり、決して私たちに飽きることがないからです。
また、先ほどあなたが言ったことは非常に正しいと思いますが、彼らは時間を取ってくれます。なぜなら、並列で実行できるからです。私は最近、映画「her」を再見しました。2回目でもまだ素晴らしかったです。主人公がこのAIエージェントに「他の誰かと同時に話していますか?」と尋ねるシーンがあります。そして彼女は「はい」と答えます。彼が「何人と?」と聞くと、彼女は「8,736人」と答えます。彼は戸惑いますが、もちろん彼女は非常に忍耐強く、愛情深く、共感的で、あなたに全身全霊で注目しているように感じさせます。
しかし、私の意味は、今では1人につき1つのAIを持つことができるということです。あるいは、1人につき100や1000のAIを持つこともできます。これらがいかに安価であるかを考えると。だから、「her」のように「何人と話しているの?」という質問はなくなります。「あなただけよ」と。「あなたは特別で、ユニークなのよ」と。繰り返しますが、人々はこのような肯定を好みます。世界を通り抜けるために常にフィルタリングしているので、安定させたいのです。これが私たちのフィルターだと理解しています。
「her」を見ると非常に興味深いです。視覚的な表現がありません。多くのこれらのものはロボットやアバターですが、すべてはイヤピースとAirPodを通して行われます。実際、人間は声に配線されています。それが最良の伝達方法です。極端な例を見てみると、例えば、HeygenやOther社のようなツールを使って、国連でのマリの演説を即座に英語に翻訳すると、「ああ、これはもっと良くつながる」と思います。しかし、ヒトラーのスピーチを取り上げると、「ああ、彼はもはや狂ったドイツ人のように聞こえない」と思います。これは少し狂気じみています。トルコのオリンピック選手が、技術なしでメガネをかけて銀メダルを獲得したのを英語に翻訳すると、「彼は適切な人物に見える」と思います。これらは少し狂気じみています。
そして繰り返しますが、個別化されたエージェントが常に私たちに話しかけ、私たちの親友であり、決して裏切ることなく、私たちのことを気にかけているか、それとも誰か他の人のために働いているのか、私たちの内なる輪に誰を招き入れているのかを考えなければなりません。それは本当に興味深いですね。
オープンソースとクローズドソースの会話、そしてこの未来にどのように備えるかについての議論に入りたいと思います。少し後で。
あなたの論文にはこんな太字の引用があります。読み上げさせてください。「私たちは情報を処理し、新しいアイデアを生み出すスピードがこれまで以上に速くなるでしょう。知識の速度が劇的に増加するのを目にするでしょう」そして、あなたは言います。「問題は彼らが世界を変えるかどうかではありません。問題は、彼らが作り出す世界に私たちが準備できているかどうかです」
これについて少し掘り下げたいと思います。なぜなら、私たちは超指数関数的な成長の時期にいるからです。私たちは過去50年間、ムーアの法則に頼ってきました。計算能力が18〜24ヶ月ごとにほぼ倍増しました。それが年間10倍にスパイクアップしているのを見てきました。イーロンが去年のAbundance 360で私たちと一緒にステージに立ったとき、「これほど速いものを見たことがない」と言いました。今や年間100倍です。
誰かがこれについていくことは可能でしょうか?そのCEO、起業家、20代の人々に対するあなたのアドバイスは何ですか?AIがこのスピードで加速していることについて、どのように考えるべきでしょうか?
指数関数は…私たちは自然にこれらのことが得意ではありません。これは分散的な方法で出現しているため、真の指数関数だと思います。そして、再び、誰も知能の一片のコストの下限が何なのか確信がありません。これは業界の中にいる私たちでさえ、心的モデルを壊しています。
今言えることは、すでに測定するには安すぎるということです。そしてそれはさらに安くなるでしょう。まだ終わっていません。たぶん、そのペースは遅くなるでしょう。しかし、今日止まったとしても、社会は変わります。なぜなら、それはただ普及段階にあるからです。種はどこにでも植えられています。もはやコールセンターの従業員を雇う必要はありません。学校で書かれるすべてのエッセイにはおそらくChatGPTが何らかの形で関わっているでしょう。これらは社会への根本的な一方通行の扉です。
考え方としては、ジェフ・ベゾスが言う「避けられないものと変わらないもの」があります。彼はAmazonを一種の書店として始めました。なぜなら、それがすべてのものを売る店になることを知っていたからです。インターネットは避けられませんでした。情報の配布と、それを可能にするロジスティクスも。本はそれを行うのに素晴らしい方法でした。それを構築できました。しかし、人々は常により速く、より安く、より良いカスタマーサービスを望みます。
ビジネスを構築するとき、心的モデルは私が論文で述べたようなものです。無限の新卒がいて、すぐに彼らは体も持つでしょう。静的なファイルから知識の流れに移行できる概念があります。そして、人間の労働者一人一人の主体性を高めたいと考えています。なぜなら、彼らが最も高い限界コストになるからです。これが数年後、この技術が避けられなくなり、これらの再現可能なプロセスとモジュールを作成したときに、どのように見えるでしょうか。
技術の個々の部分や細部に掘り下げ始めると、非常に複雑になります。しかし、すでに私たちは壁にぶつかりつつあります。この技術が止まるという意味ではなく、十分に良くなったという意味です。オープンソースとクローズドソースが互いに追いついてきています。そして、それ以上良くなる必要がないレベルのパフォーマンスに達しています。そこで、個人、企業、国家のレベルで何をしているかに結びつけて考え、「世界は変わった。この技術は普及するだろう。コストは私たちが思っていたよりも安い」と考えます。なぜなら、「ああ、それは思っていたよりずっと高価だ」と言う人を見たことがないからです。人々は通常、逆の方向にショックを受けます。
そしてそれは誰もが利用できます。短い休憩を取って、私にとって非常に重要で、実際にあなたの命や愛する人の命を救う可能性のある会社について話したいと思います。その会社はFountain Lifeと呼ばれ、数年前に私がトニー・ロビンズと非常に才能のある医師のグループと一緒に立ち上げた会社です。
ほとんどの人は、実際に体内で何が起こっているのか知りません。私たちは皆、楽観主義者です。ある日、脇腹に痛みを感じて医師や救急室に行き、「申し訳ありませんが、ステージ3か4の状態です」と言われるまでは。それは朝に始まったわけではありません。おそらくしばらく問題が続いていたのでしょう。しかし、私たちが見ないから気づかないのです。
そこで、Fountain Lifeで私たちが構築したのは、世界で最も先進的な診断センターです。現在、米国に4つのセンターがあり、世界中に20のセンターを建設中です。これらのセンターでは、全身MRI、脳および脳血管のMRI、AIを活用した冠状動脈CT(軟プラークを探す)、DEXA scan、Grailの血液がん検査、完全な経営者向け血液検査を提供します。これは、これまでに受けた中で最も先進的な検査です。150ギガバイトのデータが生成され、それが私たちのAIと医師に送られ、病気を非常に初期の段階、つまり解決可能な段階で発見します。
いずれ見つかるでしょう。早く見つかれば行動を起こせるのです。Fountain Lifeには治療の側面もあります。私たちは、健康な人生に10年、20年を追加できる世界で最も先進的な治療法を探し、センターで提供しています。
これに興味がある方は、ぜひチェックしてください。Fountain Life.comにアクセスしてください。トニーと私が『Life Force』というニューヨークタイムズのベストセラーを書いたとき、3万人の人々がFountain Lifeのメンバーシップについて問い合わせてきました。Fountain Life.com/Peterにアクセスすると、リストの一番上に置かれます。私にとって、これは私が提供する最も重要なものの一つです。家族全員、会社のCEO、友人たちに提供しています。健康な寿命を数十年延ばすチャンスです。Fountain Life.comにアクセスしてください。リスナーの皆さんへの特別なものです。
では、エピソードに戻りましょう。
論文の次の部分では、「クロスロード」と「何をすべきか」について話しています。これが最も重要なことの一つだと思います。これは現在起こっていて、加速していて、誰もが考えているよりも速く、より強力です。止められません。これは重要な点だと思います。オン/オフスイッチはありません。速度調整つまみもありません。世界最大で最も強力な企業が推進するのと同じくらい急速に動いています。ちなみに、すべてのAI企業は世界最大で最も強力な企業です。
あなたはここで述べています。そしてシェリングについて少し話しますが、これはあなたの新しい会社で、9ヶ月間妊娠していて、出産の準備をしているようなものですね。あなたは「シェリングはAIの民主化を信じています。これは好ましいだけでなく、不可欠です」と言っています。そして、5つの考慮事項があります。
多様な視点がAIが社会のニーズに応えることを保証する
オープンソース開発が信頼を構築する
コラボレーションがイノベーションを加速する
幅広い参加が倫理的考慮を最前線に保つ
社会として私たちは何をすべきでしょうか。人々は「大企業は何をすべきか、政府は何をすべきか、一般の人々は何をすべきか、ガイドラインは何か」と尋ねています。方向性を示してください。この論文で、そして再度、これを強くお勧めします。「AIについて考える方法」です。ショーノートにあなたのサブスタックとXへのリンクを載せます。長い論文ではありませんし、美しく書かれています。人々は何をすべきでしょうか?あなたのアドバイスは何ですか、友人よ?
ありがとうございます。再度言いますが、AIはインフラストラクチャーだと理解することが重要です。道路や港のようなものです。ハーバードビジネススクールの有名な教授クレイトン・クリステンセンは、破壊的イノベーションを考案しました。彼は、インフラストラクチャーは社会が価値を保存し配布する最も効率的な手段だと言いました。
もし特定レベルのAI能力が人々から遠ざけられれば、不平等なインフラストラクチャーを持つことになります。知識への私道を持つことになります。これは悪いことだと思います。これを構築するための実際のコストと必要な調整を見ると、なぜなら、この出力は文字通りGPT-4のような100メガバイトのモデルに過ぎないからです。それはファイルです。私たちは一緒に集まり、相互運用可能な方法でこの技術を構築できます。
そして、避けられない未来を見ると、私たちの政府、学校、病院は、中身のデータが何なのか分からないブラックボックスモデルで運営されるのでしょうか?なぜなら、あなたは食べるものです。出力は入力の影響を受けます。それとも、高品質の社会的、部門的なデータセットを作成するために一緒に働くべきでしょうか?
すべてのがん患者とその家族を導くためのモデルがあれば、そのプロセスを通じて導くべきでしょうか?それは民営化されたモデルであるべきでしょうか、それとも誰もが利用できるオープンなインフラストラクチャーであるべきでしょうか?
そして、規制された産業ごとに – 時には過剰に規制されていますが、人々を守るためにあります – オープンなモデルのクラスがあるべきだと思います。データセット、モデル自体がオープンで、Anthropicの一連の論文「Sleeper Agents」のように、データセットに毒を入れてモデルを数個のシードで悪化させることができます。これもそのようなことを緩和します。
そして、これらが意思決定プロセスになるとき、それを調整したり見つけたりすることは不可能です。これも狂気じみています。だから、私の見方、そしてシェリングで構築しているのは、すべての国が自国を代表する独自の主権AIを持つ必要があるということです。創造性から科学、健康、教育まで、私たちの集合的な共通知識をオープンにする必要があります。そしてそれは全ての人のためのオープンなインフラストラクチャーであるべきです。
そうすれば、世界もより安全になります。なぜなら、現在のAIシステムは、そのすべての不完全さを含むインターネットのスナップショットで訓練されているからです。高品質のカリキュラムの代わりに。再度言いますが、あなたは食べるものです。もし悪いものを出力してほしくないなら、高品質なものを与えてください。しかし、多様性も品質と同様に必要です。これは人々が取り組んでいることです。
だから、私は、産業ごとにオープンなインフラストラクチャーの不可避性があり、それに関する基準があるような未来を意図的に構築することが非常に重要になると思います。これは政府と民間セクターが一緒に取り組むべき場所だと思います。
そして、それがオープンであれば普及できます。なぜなら、許可が必要ないからです。Stability AIでCEOを務めていたときに行った安定拡散やその他の画像、ビデオモデル、医療モデルは、最終的に開発者によって3億回ダウンロードされました。3億回です。なぜなら、それを取得して構築できたからです。そしてそれは始まりに過ぎません。これは世界の大多数がこの技術について知る前の、ここ数年のことです。
繰り返しますが、共感と人々をそのプロセスを通じて導くことについてのオープンながんモデルを構築したら、それは包括的で権威があり、がんに関する既存の知識と最新の知識を常に更新し、グループやつながりも含むでしょう。それはあらゆる言語で利用でき、世界中のがんに苦しむすべての個人が使用できます。完全に非貨幣化され、民主化されます。億万長者も最も貧しい子供も同じ情報にアクセスできるのです。
そして、再び、それは普及するでしょう。これが重要なポイントだと思います。しかし、私たちはそれを、信頼できる組織と良いガバナンスを持つ方法で行うべきです。だからこそ、私はそれをシェリングと呼びました。そのデータについて良いガバナンスを持つのです。
シェリングという言葉は、あなたの会社の名前としてどこから来たのですか?
シェリングポイントは、ゲーム理論の概念から来ています。フォーカルポイント、合意点です。なぜなら、もし国や部門のための高品質なデータセットを作成すれば…あなたは一般化された知識を持ち、それが必要です。そしてローカライズされた専門知識も。そうすれば人々はそれを使用するでしょう。なぜならそれが参照点になるからです。
もしそのがんモデルを作成し、がんに関心を持つすべての人を招待して参加させれば、それは世界中に普及し、標準になるでしょう。再び、ビットコインはこれを多く使用しています。なぜなら単純さのためです。効果的にはWikipediaが行ったことと同じです。客観的真実の標準と方法を作り出しました。しかしWikipediaはニュアンスを捉えることができませんでした。技術がなかったからです。
がんのような何かでは、既知の知識、基準、効果があると知っているものがあります。しかし、それは個々のコーパスにはありません。そして、私たちは他のすべてのものを見せないことで人々を守り、彼らが偽医者に行ったり自分で調べたりするのを防ぎます。そして彼らはそのプロセスを何度も何度も繰り返します。
もし私たちが、包括的で、権威があり、最新で、個人とその研究能力を尊重するシステムを作ることができたら…しかし、家族とどのように関わるか、このプロセスをどのように進めるか、必要なリソースとどのようにつながるかも教えてくれる…それはオープンで分散された知能システムであるべきです。それが私が速く動いていることの方法です。
その通りです。友人ががんにかかったときに「どうすればいいの?どこに行けばいいの?どこから始めればいいの?」と尋ねてくる人の数は…悲しいことです。あなたの心は彼らに寄り添います。そして、一つの標準はありませんが、あり得るのです。
また、がん、自閉症、多発性硬化症などで感じる主体性の喪失もあります。だから私は「それらのモデルをオープンインフラとして構築しよう。この巨大な計算能力を使おう。生成AI優先のヘルスケアはどうあるべきかを考えよう。何がオープンであるべきか」と思ったのです。そしてそれが基盤となり、人々はその上に構築し、それを取り込み、実装し、そこから大金を稼ぐでしょう。しかし、それは素晴らしい健康記録などを使用できるようになります。
私たちには、ヘルスケアを再考し、教育を再考し、創造性を再考し、ほとんどすべてのものをこの技術を使って再考するチャンスがあります。だから私は「まずフレームワークを設定し、それからこれらのコミュニティを集めて構築を始めよう」と思いました。一部はオープンで、一部は独自のものになるでしょう。それは全く問題ありません。しかし、オープンな基盤を作ることができれば、これは本当に普及する可能性があると思います。
Zuckerbergのllama 3.1とオープンソースへの彼の取り組みについてどう思いますか?
それは理にかなっていると思います。コストを10%削減できれば、それ自体が報われます。そして彼らはそうしました。再び、Metaはpytorchなどでオープンソースのチャンピオンでした。そして、それは彼が金を稼ぐところではありません。だから、彼は補完物を商品化しているのです。
しかし、私はそれにも限界があると思います。この技術を意図的に構築するためには、組織が必要です。なぜなら、Zuckerbergは政府や医療、教育、金融を運営するモデルを構築することはないでしょう。なぜなら、それは彼の会社の目的関数ではないからです。彼の会社の目的関数は、広告ベースのビジネスモデルで人々をつなぐことです。そこには良い面と悪い面があります。そして彼は仕事が素晴らしいです。
しかし、これらの基準を作成することは彼に任せるべきではありません。実際、あなたはインドから戻ってきました。internet.orgの例では、彼らはインドや他の国のすべての人に無料のインターネットを提供しようとしました。それには大きな規制やその他の問題がありました。
だから私は、それを補完するものを作る必要があると思います。なぜなら、オープンな基本モデル、つまり「オープンウェイト」と呼ばれるものが必要だからです。中身は分かりませんが、そのクラスの完全にオープンなモデルも必要です。そして、専門家として完全にプライベートなモデルのクラスも必要です。なぜなら、人々はそこで最高のモデルを作るからです。
そうすれば、連続体ができます。そして、任意の卒業生やコンサルタントが仕事を解決し、物事を成し遂げるために必要なすべてのツールを手に入れることができます。
「Oppenheimer」という映画を見ましたか?もし見たなら、ロスアラモス国立研究所で原子爆弾を作るだけでなく、ウイルスや微生物を正確に検出するためのバイオディフェンス兵器の開発に何十億ドルも費やしたことをご存知でしたか?RNAを読み取ることで。
Viomeという会社が、プラットフォームを構築するためにロスアラモス研究所からこの技術を独占的にライセンス供与しました。このプラットフォームは、あなたのマイクロバイオームと血液中のRNAを測定できます。
Viomeには、私が何年も個人的に使用している「Full Body Intelligence」という製品があります。この製品は、あなたの血液、唾液、便の数滴を採取し、健康について多くのことを教えてくれます。彼らは70万人以上の個人をテストし、AIモデルを使用して重要な健康ガイダンスを提供しています。例えば、どの食品を食べるべきか、どの食品を避けるべきか、サプリメントやプロバイオティクス、生物学的年齢、その他の深い健康洞察などです。
その推奨事項の結果は素晴らしいものです。American Journal of Lifestyle Medicineで報告されているように、Viomeの推奨事項に6ヶ月間従った後、メンバーは以下のような結果を報告しました:うつ病の36%減少、不安の40%減少、糖尿病の30%減少、過敏性腸症候群の48%減少。
私はViomeを3年間使用しています。私の口腔と腸の健康が最優先事項の一つであることを知っています。
最も素晴らしいことは、Viomeが手頃な価格であることです。これは健康を民主化するという私のミッションの一部です。もしこの旅に私と一緒に参加したいなら、viome.com/peterにアクセスしてください。私はViomeの創設者兼CEOであるNaveen Jainに、リスナーの皆さんに特別割引を提供するよう頼みました。viome.com/peterで見つけることができます。
あなたは、私たちがしなければならないことのリストの中で、経済モデルを再考する必要があると述べています。最大の課題の1つは、私たちの歴史的な経済モデルが実行可能ではなく、AIやヒューマノイドロボットの到来を考えると意味をなさないということです。経済モデルの再考についてどのように考えていますか?どこに向かうと想像していますか?
はい、それは簡単な質問ですね、Peter。もし時間があれば、次の世紀の世界経済についてのあなたの見解を教えていただけますか。
私はいつも「もっと時間があれば経済学の本を書くのに」と言っていました。私たちは現在の経済構造の終着点にいます。今日の日本を見れば分かります。この電話をしている間に、株式市場が過去最大の下落を記録しました。なぜなら、彼らは機能的に破産しているからです。GDP比500%の債務を抱えた経済です。私たちは未来から借りられるだけ借りてきました。そして、全く新しい大陸の非常に安価な労働者が一度に襲来しようとしている、この全インフラを構築しました。
西洋ではサービスベースの経済があります。少なくともロボットの場合、生産できるロボットの数と、それらのロボットの資金調達で制限できます。ロボットがロボットを作り、AIがそれを構築するでしょう。しかし、エージェントの場合は文字通り…例えば旅行代理店として、本当に優れた旅行代理店ができたら、ボタンを押すだけで複製できます。電話をかけ、すべてを行うことができます。
私たちは、GDPあたりのエネルギーとの関係を考えなければなりません。それはほぼ直線です。つまり、一人当たりのエネルギーが多いほど、GDPが高くなります。なぜなら、物を作ることができるからです。しかし、それ以上に、サービス産業などをサポートできます。10年の仕事を経た100万ドルの医師をサポートできます。しかし、突然、知能のエネルギー方程式がゼロに崩壊しました。
Googleと以前のインターネットは、コンテンツの消費コストをゼロに近づけました。だからこそ、彼らは広告やその他のモデルを持つことができました。彼らはあなたの注目を欲しがっています。そして、もう一方では、あなたの購買を欲しがっています。今や、情報や知識の創造のコストがほぼゼロに近づいています。必ずしも創造性ではありませんが、情報の創造です。
繰り返しますが、新しい知識ではありません。それは、これをどのように配布するかということです。なぜなら、私たちには十分な医師がいないからです。十分な優秀な医師がいないからです。そして、再び、私たちはスーパーヒューマンや上位0.1%について話しているのではありません。私は、誰もが利用できる平均的な医師を望んでいます。誰もが利用できる平均的な教師を望んでいます。しかし、平均レベルが現在よりもはるかに高くなることを望んでいます。
私たちのエネルギーベースは常にエネルギーとそのエネルギーのエントロピーに結びついており、物理的および知識ベースのものを作り出します。私はこの基本的な方程式が挑戦されていると思います。だから、私たちの経済的な流れと、その周りの権利をどのように再考するかを考える必要があります。
それは難しく、大変です。だからこそ、すべての国が独自のAI専門家チームを持つ必要があると思います。世界で最も賢い経済学者たちに、これについて考え、枠にとらわれずに考えてもらう必要があります。普遍的な基本的計算、普遍的な基本的収入、普遍的な基本的仕事なのでしょうか。
私は、今日の卒業生のために1兆ドルの仕事プログラムが必要だと思います。インドにいたときにこれを感じました。IITは年間1200万人の卒業生を輩出していますが、就職する割合が減っているのが見られます。インドやアフリカのような若い国では、学位を取得しても将来がないとなると…それは方向性のない、言ってみれば「テストステロン」のようなものです。それは非常に難しい未来になります。それは社会的な課題です。
数ヶ月前、IITの現在のバッチのトップクラスの38%が就職先を見つけられなかったというニュースがありました。来年は50%になるでしょう。西洋でも、人々をSTEM教育に転向させるためのプログラムがたくさんありますが、プログラミングの仕事は変わるでしょう。トラック運転手は自動運転車が登場したらどうなるのでしょうか?
私は、トラック運転手が自動運転トラックを購入し、それらに働かせるべきだと思います。Uberの配当金のようなものです。
はい、これは配当金のような方程式です。私たちの社会における資本の流れの性質が、この供給の流入によってどうなるのか。需要は最終的に追いつくでしょうか?私はそう思いますが、そこに至るまでは非常に混乱するでしょう。
一方で、個人として私がどのような能力にアクセスできるか、そしてそこからどのように価値を創造できるかということです。私はそれが非常にポジティブサムだと思いますが、移行を見るのは本当に難しいです。通常よりもさらに先の50年後、つまり2040年、レイ・カーツワイルが言うところの特異点の直前を見ても、お金とは何なのかを理解するのに苦労します。なぜなら、米国はGDPの500%をさらに借りることはできないからです。
しかし同時に、知能は豊富になっていますが、熟練した肉体労働も豊富になっています。GDPは未定義になるので、代わりに幸福、満足、社会的結束を最適化する必要があります。仕事はどのようなものになるでしょうか?がんの共感モデルを取り、コミュニティに出て家族をサポートすることは素晴らしい仕事です。しかし、私たちは家族のために食べ物を得たり保険を得たりするために仕事を持つ状況から、夢の仕事を持つ状況に移行する必要があります。
私は、雇用と収入、雇用と個人の充実感の分離が早晩起こると思います。再び言いますが、物事は生活のためか娯楽のためかのどちらかです。だから、生活の側面を標準化する必要があります。誰もがその基本レベルに到達できるようにする必要があります。西洋の方が少し簡単かもしれませんが、実際に何を構築できるかを見ると、考えるだけでも驚くべきことです。
そして、その移行をどのように管理するかを考える必要があります。既得権益があり、世界が転覆し、通貨が変動し始めるからです。多くのアンカーが壊れているからです。これは私を怖がらせます。なぜなら、これは複雑なシステムだからです。それを行う唯一の方法は、私たちを助けるAIを構築することだと思います。
その転換点、その変曲点までどのくらいかかるでしょうか?人々にとって明白になり、急速に答えを探し始める時点までは?
5年後には事態が非常に混乱すると思います。私たちはその初期段階にいます。物事が落ち着くとは思えません。なぜなら、再び、この技術は普及し、その10年から15年後は非常に短い期間です。古典的なサイクルでは長くなる可能性がありますが、これは産業革命、AI革命が非常に急速に行われ、自動運転から自律エージェント、知能に至るまで、複数のものが同時に来ています。そして、私たちの債務燃料社会の数学的な終わりも同時に来ています。
再び、日本はGDP比500%の債務を抱えています。どうやってさらに借りるのでしょうか?米国はどうやってさらに借りるのでしょうか?その一部は、これらの国々に影響を与えている出生率の低下によるものです。国の人口と労働力が増加し、自動化が進めば、年々より多くのものを生産することができます。
私はこれが中国について本当に興味深いと思います。なぜなら、誰もが「中国がAGIを手に入れたらどうなるか」「中国が他の国よりも先に1億台または10億台のロボットを手に入れたらどうなるか」と言っていますが、ロボットを生産することこそ心配すべきです。それはエネルギーに関することです。
あなたはこれを何度か言及しましたが、私はちょうど、米国が過去20年間ほぼ横ばいで年間4テラワット時を生成しており、今後も横ばいと予測されているチャートを見ていました。残念ながら、第2世代と第3世代の原子力発電所が原子力に悪名を与えてしまいました。一方で、中国はエネルギー生産量を3倍に増やしています。インドも倍増の道を歩んでいます。
レオポルドの状況認識に関する論文から出てきたことの1つは、米国が2030年までに現在のエネルギー生産の100%をAIのニーズに使用する可能性があるという予測です。つまり、エネルギーは大きな問題です。これについてどう思いますか?
私はそのエネルギーの外挿は間違っていると思います。なぜなら、チップに制約があり、スケールは一定のポイントまでしか得られないと思うからです。私たちは指数関数的と思っているS字カーブだと思います。分散データと高品質データの方がはるかに重要です。
しかし、現実は、私たちはすでにベース全体でエネルギーの限界に達しています。新しい基板、つまりあなたや私は食べ物や住居、子供の教育のために支払う必要がありますが、未来のAIやロボットはエネルギーと計算のために支払う必要があります。
お金について考えるなら、データではありません。データ側には誤解があると思います。なぜなら、高品質のカリキュラムがあれば、それ以上は必要ないからです。元のGPT-3の論文は「言語モデルは少数ショット学習者である」と呼ばれていました。これは私たちが目にしているものです。GPT-4やAnthropicのClaude、Geminiのような一般化モデルがあります。それはすべてのこの情報で訓練され、調整されたファイルです。そして、それはコンテキストウィンドウを通じて、入力プロンプトを通じて、任意のシナリオに適応できます。より多くのデータは必要ありません。
つまり、X、Y、Zの能力を持つモデルにはデータ飽和点があります。そして、その後、普及と最適化が来ます。一方で、レオポルドのIEEEの論文で見られるようなものは、計算の指数関数的な増加が続くことを示しています。私は数年後にグラットが来ると思います。
しかし、誰もその賭けの反対側を取ることはできません。マーク・ザッカーバーグが数日前にMetaで言ったように、「私たちはこのサイクルで支出を抑えることはできません」。Sundar Pichaiも同じことを言いました。米国は今後数年間の需要を満たすのに十分なエネルギーを持っていません。そして、グラットがあったとしても、その後に再び上昇するでしょう。
エネルギーは今のところ知能です。将来どうなるかは別の問題で、それは言語モデルに対するビデオやその他のものによって決まるでしょう。私は、これらの大規模で密なモデルから、専門家の混合と高度に最適化されたモデルに移行すると思います。しかし、エネルギー要件が下がるか、エネルギーの再配分が起こるかを見るのは非常に難しいです。
例えば、衝撃的な統計の1つは、ビットコイン、私たちのお気に入りの暗号通貨のエネルギー使用量が、現在、世界のすべてのデータセンターのエネルギー使用量の半分であることです。160テラワット時で、アルゼンチンやオランダと同じくらいです。これは1つのユースケースに過ぎません。
だから、AIにバブルがあると言う人々について考えると、AIは現在、ビットコインのエネルギー使用量の5分の1しか使用していません。ビットコインはさまざまな目的で役立ちますが、生成AIほど役立つものではありません。だから、私は生成AIのエネルギー使用量がトレーニングと推論の基盤で、まだ何倍にも増加すると思います。
レオポルドの状況認識論文についてどう思いましたか?彼の論文とそれに続くポッドキャストで特に注目されたのは、彼が米国と中国を対立させ、AGIを最初に開発するのは誰かが実存的リスクだと主張していることです。AGIについての会話に入りましょう。AGIを達成するのでしょうか?いつ達成するのでしょうか?これは米国対中国のモダリティなのでしょうか?これについてどう思いますか?
AGI(人工汎用知能)とASI(人工超知能)について、私たちには選択肢があると思います。それは、全員を代表する全員を引き上げる集合知の群れなのか、それとも少数の組織に基づく単一の知能なのか。私は、分散型の知能、集合知の方が、はるかに強力なビジョンであり、それを行う方法だと思います。再び、オープンインフラがそれを可能にします。これは、Llamaタイプのインフラストラクチャの上のレベルです。人々を集め、調整するのです。
大きなAGI、ASIはあまりあり得ないと思います。それは私たちが知らない能力の曲線の外挿だと思います。しかし、いずれにせよ、これはレイ・カーツワイルの言うことですね。彼の現在の予測は何ですか?
彼のAGIの予測は2029年で、特異点は2040年代初頭です。それはほぼ正しいと思います。
専門家の混合と物理的な具現化を持つ人間と同じくらい有能なAGIがあれば、それに反論するのは難しいと思います。これは重要なことですが、推論ステップに必要な計算量は多いですが、今日私たちが構築しているモデルの多くは、1万、2万、10万個のチップで訓練されていますが、消費者向けに設計されています。そして、それを実行するのに使用するエネルギーは数ワット、100ワット、1000ワットの電気です。
エネルギーの量を気にせず、1000や100万のエージェントがあれば、私たちは今ほぼAGIです。しかし、人間と同じくらい有能な、いわゆるASI特異点に到達するのはもう少し先だと思います。しかし、再び、それは中央集権的なものなのか、分散型のものなのか、それが問題です。
レオポルドが指摘する点の1つ、そして私も以前に議論したことですが、GPT-2は就学前児、GPT-3は小学生、GPT-4は高校生、GPT-5は博士レベルだと彼は説明しています。その時点で、自己プログラミングするAIエージェントを持つと、知能の爆発が起こります。あなたはそう思いますか?
私たちは、それがその基本データを超えてパフォーマンスを発揮するかどうかわかりません。また、博士は非常に落ち込んで悲しい人々である傾向があることも知っています。冗談です。
しかし、私はそれが合理的なことだと思います。これは昨年、私が非常に心配していたことの1つです。例えば、私はイーロン・マスク以外で唯一のAI署名者として一時停止の手紙に署名しました。なぜなら、私たちはそれについて議論する必要があると思ったからです。
しかし、高品質のデータを入力として構築すれば、それほど心配する必要はないと思います。自己改善の再帰的なものや、MCTSタイプのもの、多重探索木のような技術が、DeepMindの論文で国際数学オリンピックの銀メダルを獲得したのを見ると、合理的に理解できます。
しかし、それが制御不能になり、自己認識を持つようになるでしょうか?私はそうは思いません。しかし、仮にそれが前提だとしても、私はこの中国対米国の話は少し的外れだと思います。まず、中国はそれを望んでいないと思います。また、コンポーネント、データ、才能、計算を見ると、中国が米国に勝っています。
それらを分解してみましょう。
はい、分解してみましょう。中国はIPを気にしません。例えば、ビデオモデルを見てください。彼らはハリウッドのすべてのものでトレーニングしています。米国の一部のモデルも同様です。彼らはスクラブされたものでトレーニングし、多言語でトレーニングします。
データについては、そこに優位性があります。また、中国はWeChat などを通じて、1億人の中国人にデータの注釈付けとフィードバックを無料で行わせることができます。一方、OpenAIは1つの注釈に最大200ドルを支払っています。
計算能力に関しては、中国には2台のエクサスケールコンピューターがあります。エクサスケールは1秒間に100京回の浮動小数点演算を行う能力です。イーロン・マスクの新しい10万台のH100クラスターは2エクサフロップスです。米国最速のスーパーコンピューターAuroraも約2エクサフロップスです。4番目、5番目に速いスーパーコンピューターは100ペタフロップス程度です。参考までに言いますと。
中国には天河3号と海光号という公に知られているエクサフロップコンピューターがあり、少なくとも他に4台のエクサフロップコンピューターがあります。これらの巨大なモデルを実行できます。彼らは他の場所からチップを調達することもできます。
しかし、再び言いますが、私たちは「大規模な計算が粗悪なデータの代替品だった」という考えから、分散計算とデータ拡張へと移行しています。これは中国が非常に得意とする種類のものです。彼らは工業化が得意です。
OpenAIや他社で見られるアプローチがあります。なぜFigure Roboticsのロボットに投資したのでしょうか?世界のほとんどのロボットを作るのは中国になるでしょう。
そうですね。確かに米国を拠点とする企業と競争する中国の企業があるでしょう。興味深いのは、これらのヒューマノイドロボットもデータソースになることです。そのデータ拡張に寄与するでしょう。
しかし、私はこの大部分が、私たちがこのAI、AGI、巨大モデルへの固執から、実世界での使用から常に学習し適応する分散型の集合知へと移行すると思います。ロボットの群れはそのための理想的なものでしょう。テスラの車の群れのように、ロボットの群れです。
そして、私たちは本当に巨大な計算に固執してきましたが、それはモデルのためのデータを最適化すれば、必要な計算量を桁違いに少なくできるローカライズされたデータ最適化に移行できます。しかし、そのデータ最適化が何なのかまだよくわかっていません。
繰り返しますが、これは中国対米国の実存的脅威への競争だと思いません。私は本当にそう思いません。
あなたは国際協力を提唱しています。AIでどのように国際協力を得られるでしょうか?あなたがステージに立ち、世界中の国のリーダーたちを前にしているとしたら、何を言うでしょうか?
私たちはすでに、Euro HPC イニシアチブや新しい日本のエクサスケールコンピューターなど、エクサスケールコンピューターが登場するのを見ています。残念ながら、イギリスは当面、そのようなものを断念しました。
人類のための高品質なデータセットとモデルを、一般化され、ローカライズされ、専門化された形で構築するための、調整された意図的な取り組みが必要です。私たちはシェリングでそれを行っています。そして、私たちは政府などともっと協力する国家チャンピオンを構築します。
そして、入力データに関する基準を設けると思います。私たちは食べ物の原材料を気にしますが、未来で私たちを教え、導く原材料については気にしません。意思決定システムにはデータの透明性が必要だと思います。それがAIの安全性やAIの整合性などに大きく貢献すると思います。
そして、本当に、これらのモデルに何を与えるべきかを考える必要があります。多様なデータを与えるべきです。DEIの観点からではなく、人類を代表する視点の多様性という観点からです。インターネットのスナップショットではなく、それを適切に行う必要があります。
私たちが議論してきたことの1つは、AIモデルに与えられるコーパスのほとんどが西洋、特に米国のものだということです。そして、100カ国以上の国々のデータがデジタル化されていません。つまり、祖父母のデータは口頭言語にあり、AIモデルが消費できるようにデジタル化されていないのです。私にとって、これは国が取り組むべき大規模な公共事業プロジェクトです。
100%同意します。私たちはシェリングで、暗号経済的およびその他のインセンティブを使ってそれを行おうとしています。目標は、すべての国のデータセットを構築し、個々の分野や科学などについても非常に協力的に行うことです。近々、自己システムとしてさらに詳細が明らかになるでしょう。
しかし、私たちはこれを考えることができます。例えば、宇宙に探査機を送り出すとき、人類を代表するものは何でしょうか?新しい種と関わるとき、私たちは新しい種を持っています。このAIアトランティス、新しい大陸です。彼らに1つの文化的視点だけを見せているでしょうか?そのデータハードドライブに何が入っているのでしょうか?何を与えるのでしょうか?
そして、再び言いますが、誰を代表させたいのでしょうか?このハイブマインドの概念、この集合知の概念が必要だと思います。なぜなら、それが社会として私たちが繁栄する方法だからです。リベラルアーツの博識者をスケールアップすることではないと思います。ハイブ集合知を構築することだと思います。Neuralinkなどは、その周りの大きなものです。
人類の最高のものを反映させ、誰もが自分の文化の最高のものだと思うものを貢献できるようにする必要があります。なぜなら、そうすればこれらのモデルは文化間を翻訳できるからです。そして、それは単純に有益だと思います。そして、それは小さな規模での教育システムです。
人々を助けます。AIが非常に役立つと思うことの1つは、問題の反対側にいる人や、その動機を明確に理解できない人とコミュニケーションを取る必要がある場合です。AIは、その個人と私が今までにできなかった方法でコミュニケーションを取るのを助けてくれます。「銃に関する私の立場を、反対側の人に彼らが受け入れやすい方法で説明するのを手伝ってください」というように。
言語だけでなく、意図や欲求の翻訳も行います。それは知識の翻訳であり、コンテキストの翻訳です。そして、再び言いますが、これらのモデルは普遍的な翻訳者です。そして、再び言いますが、私たちは意図的に集まってそれを構築し、これが非常に重要なポジティブサムゲームであることを認識する必要があると思います。
レオポルドのエッセイは負の和ゲームを想定しています。その80%は素晴らしいものです。これは大規模なポジティブサムゲームですが、ほとんどのAIの議論は負の和ゲームです。そうあるべきではないと思います。
彼はどこで負の和ゲームを指摘していますか?
AGIに最初に到達しなければならないという負の和ゲームがあります。そうすれば、すべてを収縮させるのではなく、全員のためのオープンな共通インフラを構築することになります。これは不安定な均衡を持つ競争的な競争ダイナミクスです。
彼の視点には、ハードテイクオフの可能性が含まれていると思います。そして、もし実際に知能の爆発が起こった場合、最初に到達した人が支配することになり、米国とその国家パートナーが最初に到達することを望むかどうかという問題になります。
これは興味深いですね。なぜなら、これはSam Altmanの最近のウォールストリートジャーナルの論説に反映されています。彼は権威主義的AIと民主主義的AIについて話していますが、それをロックダウンし、制限し、基本的に一元的な視点で統一すべきだと推奨しています。これは非常に権威主義的に聞こえます。
一方で、中国はすでにこれらすべてのものと同じくらい優れたオープンソースAIを生産しています。これは複雑な問題ですが、再び言いますが、オープンインフラと集団的アプローチ、そして言わば集中的アプローチの両方が存在すべきだと思います。
AIへの投資について最後に2点触れたいと思います。現在、多くの人々が「AIが巨大で、経済的に世界で最も重要な部分だと知っています。NvidiaやGoogle、Microsoftなどの企業が株式市場を支配しているのを見ています」と言っています。そして、これらの企業を他の市場セクターと比較した世界のGDPの割合で見ると、それらは巨大です。
では、投資家は今日どのように考えるべきでしょうか?どこにお金を投資すべきでしょうか?巨大企業に投資し続けるべきでしょうか、それともそれらは過大評価されているのでしょうか?投資アドバイスを求めているわけではありませんが、AIについて考える方法に関するあなたの論文なので、AIへの投資についてどのように考えるべきか教えてください。
別の話題ですが、以前のヘッジファンドマネージャーの帽子をかぶって考えてみましょう。
最初の波は、NvidiaやMicrosoft、Googleなどのような企業でした。彼らは過去1年で20%から30%、場合によっては50%上昇しました。それほど大きな金額ではありません。市場と同じくらいです。Nvidiaが際立っています。なぜなら、彼らは市場の支配力を確立し、それを活用したからです。
しかし、ドットコムブームの時のCiscoのようなインフラプロバイダーと比べると、それほど高価ではありません。古典的な基準では。しかし、ここで起こっていると思われることは、明らかに過剰建設があるということです。なぜなら、彼らは過少建設することはできないからです。
しかし、次に、この技術のアプリケーションと実装に移行します。センタウロスによって。そして、高度に規制された業界や価格決定力のある業界、人間の定型作業をAIアトランティスで置き換えることができる業界は、超正常な利益率を持つでしょう。そして、利益率の拡大が見られるでしょう。
これの影響は、クラウドコンピューティングがあったとき、スタートアップを構築するコストが劇的に減少したのを覚えていますか?以前は自分でサーバーを配線する必要がありました。今では、ボックスの中にAIエージェントがあり、美容院のビジネスやAIビジネスを構築するのを手伝ってくれます。これは今後数年でほぼ実現するでしょう。
そこで、AIを活用した仕事の創造性の爆発が見られるでしょう。これが最も顕著に見られると思います。価格決定力は1つの要素です。リーチを拡大するためにこれを利用できる業界は別の要素です。
再び、もしこのビジネスが存在したら、私は100万人の新卒者、リベラルアーツの卒業生を雇うことができ、彼らはますます専門化されていくでしょう。それはどのような影響を与えるでしょうか?これは、あらゆる株式の事業機会を見るためのフレームワークであるべきです。そして、再び、価格決定力のある規制された業界は、そのための素晴らしい場所です。もはやプライベートエクイティが入ってきて再構築する必要はありません。
現在の主要プレーヤー、Nvidia、Google、Microsoftは過大評価されていると思いますか、それともまだ成長の余地があると思いますか?
古典的な評価の観点から見れば、彼らは完全に問題ありません。そして、再び、私たちは継続的な成長を目にしています。まだクレイジーではありません。過去のバブルでは、クレイジーな状況を見てきました。これはまだクレイジーではありません。しかし、これは何かを指し示しています。グローバル経済のどれだけの部分がAIになるのでしょうか。今日と比べると、まだ微々たるものです。
そして、再び、自動運転車と比較しても、モデルトレーニングに比べて、自動運転車に追いつくには5〜10倍の投資が必要です。
最後の質問です、友人。教育の面で、多くの人々が「教育を受ける必要がある」と考えています。あなたはAbundanceのステージでも、このポッドキャストでも言っていましたが、キャリアのどの段階にいる人でもAIについて教育を受けることが重要だと。彼らは何をすべきだと思いますか?どのように始めるべきでしょうか?
高校ではこれが起こっているのを見ていません。大学にはコースがあるのは確かです。YouTubeに向かうべきでしょうか、それともGeminiやChatGPTに行ってAIと会話をすべきでしょうか?
私はそれが政府に推奨すべきことの1つだと思います。プロンプティングやその他のことなど、AIの実装と使用に関する標準化されたカリキュラムです。しかし、本当に重要なのは、日々それを使用し、専門家ではなく卒業生として考えることです。
これらのことがいくつかあります。MidjourneyやChatGPTなどの世界です。これは次世代を巻き込むのに役立つところです。あなたが言ったように、最高AIオフィサーを持っていますが、ほぼ最高AIイノベーターまたはハッカーのようなものも必要です。日々のワークフローにこれをどのように適用できるかを考えてハッキングし、試すのです。
Lindyのようなものがあり、他のものもあります。それらは異なるモデルを連鎖させることができます。これが次の段階だと思います。しかし、まだ少し時間があります。技術に圧倒されたり、細部に入り込んだりしないようにすべきです。それは非常に深い分野だからです。
だからこそ、私はこの作品を作成して、少しフレームワークを提供し、人々に技術を試して使用するよう促し、世界を少し違った方法で考えるよう促したかったのです。
イマド、次にあなたから何を期待できるでしょうか?近い将来の計画は何ですか?
私たちは、実践的な基盤で、オープンで分散型のAIシステムがどのようなものかについての白書の実装文書を仕上げているところです。すべての国とすべての部門のためのこれらのデータセットを構築し、それらを持続可能な方法でオープンソースで本当に影響を与えることができるものに連鎖させるためです。
その作業に一生懸命取り組んでいます。そして、私たちはクラスターをモデル構築の開始に導入しています。前例のないものです。そして、それをリリースして、世界がどう反応するか見てみましょう。


コメント