

さて、クレイジーな話題のひとつとして、人工知能の分野で、多くの人があまり話したがらない部分があります。それは、現実世界が非常に危険だということで、皆さんも知っておくべきことだと思います。これは古い話ですが、最近インターネット上の投稿で知ることになりました。基本的に、中国の研究チームが、機関銃を搭載したロボット犬が、適切に設計されていれば、人間の射撃手に匹敵することを発見したのです。
これがそれほどクレイジーではないと言われる理由は、ビデオデモを見ると、ショッキングとまでは言いませんが、かなり驚かされるからです。ここ数年、人工知能を見てきた者として、自律システムが本当に何ができるのかを見ると、非常に怖いものがあります。特に、私のように想像力が豊かな人間にとっては、とてもとても怖いものです。
基本的に、これは戦争に大きな影響を与えるものです。おそらく、ここでの翻訳はあまり良くないと思いますが、これは単なるロボット犬のことです。実際には、ユニタリー・ドッグがあると思います。ここで、その短いビデオをお見せしますが、かなりクレイジーです。ショッキングな内容だとブロックされるかもしれないので、全部は再生しませんが、このビデオはかなりクレイジーで、このロボット犬を見せています。驚くべきことに、数年後には、これらの人型ロボット犬が特定のサイトを徘徊し、特定の行動を実行している世界が見えてきます。それが良いことなのか悪いことなのかは、あなたがどちらの側にいるかによって変わってきます。
このロボット犬は、非常に高い精度を持っています。現時点での精度は、おそらく80〜60%程度だと思いますが、射撃手に匹敵すると言われており、驚くべきことです。これと、人工知能の開発ペースを見比べてみると、人工知能の分野全体で、生成AI、LLM、その他のものだけでなく、全体的に見ても、かつて私が人工知能の奥深くにいたときには、毎日たくさんの研究論文を見ていました。食事をしながら、arXivのウェブサイトを見て、自律ドローン群を調べたりしていました。小さな変化の積み重ねを見ていたのですが、将来的にはこの種のものがもっと良くなっていくことを約束できます。
私が考えているのは、いつ、人間対人間の戦争から、自律型の戦争へと本当に変化するのかということです。将来的には、自律型の戦争がより効果的になるため、ますます増えていくと思います。米国の兵士にどのくらいのコストがかかるのかはわかりませんが、個人的には、人間の命に本当の価値を置くことはできないと思います。1人が1万ドルとか、年収とかで計算すべきではありません。でも、建物を素早く駆け抜けて、ターゲットを見つけて、すぐに殲滅できるようなシステムがあれば、戦争に非常に大きな影響を与えると思います。
これは、かなりクレイジーなことになるでしょう。空中戦でのAIの可能性も最近クレイジーでしたが、これを含めたかったのは、現時点で多くの人が人工知能を見る範囲から外れているからです。今のスポットライトは、もちろんOpenAIと、AGIがやってくること、生成AI、モデルが推論し学習する方法などに当たっています。このようなニュースは良いニュースではありませんが、世界が非常に面白い場所に変化しつつあり、AIが本当に考えもしなかった産業の一部を支配することになるということを知っておくことは重要だと思います。
そして、実際にGoogleからアップデートがありました。これは本当のアップデートではなく、GoogleのDeepMindのCEOとの非常に興味深いインタビューでした。彼は、200万のコンテキストウィンドウで、人々が「戦争と平和」や1時間の長いビデオのような本をアップロードし、正確で知的なやり取りを期待できると話していました。彼らの新しいプロジェクトAstraでの今後の開発についても話していました。ライブストリーミングビデオを取り込み、高齢者の記憶を助け、日常の実用的なタスクに役立つものに取り組んでいるそうです。
このスニペットは、Googleが人工知能をどのように使おうとしているのかを非常に興味深く示していると思います。最近見られるのは、Demis Hassabisのような人やGoogleのような企業は、最高のテクノロジーを持っているわけではないかもしれません。最先端のテクノロジーと次善のテクノロジーの間には小さな差があるからです。もちろん、そのテクノロジーはすばらしいものです。GoogleのAGIレベルのシステムで世界を助けようとする本当の目標と意図が見えると思いますが、OpenAIからのナラティブは、多くの人がその力で何をするのかを疑問に思うものに変わってきています。
彼らのAIアシスタントの未来を見てみましょう。これは非常に重要だと思います。
「この100万トークンの長いコンテキストを実際には200万トークンに拡張しました。もっと先に進むことができるかもしれません。つまり、『戦争と平和』のすべてや、1時間の長いビデオを取り込んで、システムに質問すると、知的に答えてくれるようになったのです。分析ツールや研究アシスタントとしての可能性が広がります。
そして、Astraでは、ライブストリーミングビデオを取り込んで、長い間ビデオストリームの中であいまいに起こったことを覚えておくようなことをしています。高齢者が薬の場所や車の鍵の場所を覚えておくのに、とても役立つと思います。
これらのものがどのように使われるのか、まだほとんど明らかになっていないと思います。」
これには完全に同意です。この技術がいかに世界を変えるのか、本当にまだ表面しか触れていません。これは、これらの最先端の研究所にいる人々の頭の中を時々覗いてみたくなる疑問を投げかけます。このインタビューでも、人々が文字通り、AIの開発ペースについていけない一般の人にとって、このテクノロジーがどれほどクレイジーなものになるのかを概念化するのは非常に難しいと話しています。確かに、ある技術は特定の用途にはまだ準備ができていませんが、人々の日常生活に影響を与えるときに、記念碑的な変化が起こると思います。人々がChatGPTのデモを見たとき、GPT-2やGPT-3のデモはそれよりずっと前に存在していました。GPT-2やGPT-3を見た人は、基本的に驚きませんでしたが、GPT-3.5を一般の人々の目に触れさせたことで、多くの人を本当に驚かせました。
このインタビュー全体のリンクをお渡ししますが、本当にこれはハイレベルなカンファレンスではありませんが、AIの本当の性質が世界中ですぐに感じられるようになることを示していると思います。
さて、AI業界で多くの人がセキュリティを懸念している機能の1つに、Microsoftのリコール機能があります。基本的に、Microsoftにはリコールタブバーがあり、自分が何をしていたかを正確に検索することができます。基本的に、コンピュータ画面全体を記録するデバイス上のものがあり、生成AIを使用して、記録全体を検索して、情報を思い出すために正確に何をしたかを見つけ出す方法があるのです。
残念ながら、Microsoftはこの機能を少し後退させなければなりませんでした。記事によると、Microsoftは、人工知能を搭載した新しいPC向けに発表した物議を醸す機能に変更を加えているそうです。プライバシーの悪夢になる可能性があると指摘されたためです。同社は、Co-pilot Plusのリコール機能を、ユーザーのデスクトップ活動のスクリーンショットをキャプチャして保存することで、ユーザーの生活を楽にする方法として構築しました。しかし、ハッカーがこのツールを悪用し、保存されたスクリーンショットを利用する可能性があると主張する人もいて、この機能をオプトインにすることにしたそうです。
以前は、この機能はデフォルトでオンになっていました。考えてみると、かなりクレイジーですよね。何が起こっているのかを明確にせずに、人々に何かをさせているようなものですから。多くの人がこれをデバイスにインストールしても、実際にはあまり活用しないような、ポイントレスな機能がたくさんあるのが現状です。特に過去にプライバシーの問題が多くあっただけに、これをデバイスに搭載するのはかなり難しいことだと思います。
だから今彼らがしているのは、基本的にCo-pilotPCでリコールを有効にすることを選択しやすくし、プライバシーとセキュリティの保護を改善することだと述べているだけです。正直言って、これはまだ初期段階にあり、ハッキングされて銀行情報や、オンラインでどんなことをしているかを知られてしまうようなことが証明されたら、最悪です。どんなことをコンピューターでしているにせよ、プライバシーを守る権利は誰にでもあるはずです。オプトアウトではなくオプトインにしないと、少し脅かされるかもしれません。
だから、これは良いことだと思います。今のところ、生成AIを何にでも埋め込むというトレンドは本当にあるようですが、セキュリティは大切だということを覚えておく必要があります。ChatGPTからも、基本的なプロンプトを入力するだけで、個人の機密データが漏洩することがありました。名前、住所、メール、電話番号などが文字通り出力されてしまったのです。OpenAIはかなり素早くパッチを当てましたが、これらの機能をゆっくりと展開することが重要です。テストしないと、かなりまずいことになるからです。
リコールの機能の1つは、コンピュータ上で何が起こっているかを正確に把握し、何をすべきかを教えてくれるというものでした。マインクラフトのデモもあり、世界で何が起こっているかを理解し、プレイヤーにリアルタイムでアドバイスを提供する方法は非常に魅力的でした。多くの人に使われるかどうかはわかりませんが、いくつかのシナリオでは非常に適用可能だと思います。
さて、イーロン・マスクのニュースですが、イーロン・マスクは実際にメンフィスで世界最大のスーパーコンピューターを計画しています。これはそれほど大きなニュースではありませんが、スーパーコンピューターを建設していることは知っていましたが、世界最大のスーパーコンピューターを建設していることは知りませんでした。
このニュースがとてもクレイジーなのは、世界はこれらの巨大なスーパーコンピューターが開発され、オンラインになり始める新しい段階に入っていると思うからです。もちろん、来年の早い時期には、次のレベルのファンデーションモデルが実際に構築され、より多くの生成AIとより多様なAIシステムがより速くトレーニングされるようになるでしょう。今考えると、現時点での最大の制約は、限られたコンピュートだと思います。モデルをトレーニングしているときのことを考えてみてください。より大きなモデルをトレーニングしようとしているのに、他の多くのことにコンピュートがないのです。これは最初、OpenAIのGPT-4で見られました。問題は、推論に必要なコンピュートさえ十分になかったことです。強力なAIシステムであるGPT-4に25のメッセージしか送ることができませんでした。GPT-5も同じようになるのでしょうか。OpenAIは、Project Stargateと呼ばれる1,000億ドルのコンピュータを構築しようとしており、イーロン・マスクはメンフィスで世界最大のスーパーコンピューターを構築しています。
クレイジーなことは、彼が2025年までにこれを完成させたいと言っていることです。おそらく、テスラやX社からの最近の投資を使って、必要なAIインフラストラクチャを支えるデータセンターに大量のNvidiaのGPUを購入するのだと思います。もちろん、その一部はAI企業のXのためのものでしょう。私は、彼らがAIに関して追求しているベクトルで、かなり大きな前進を遂げるだろうと思います。テスラで既に巨大なインフラを持っているので、その力を結集して、具現化されたAGIに関して非常に魅力的なものを生み出すことができると思います。
イーロン・マスクが2025年までにオンラインになるべきだと言っているこの種のプロジェクトには、膨大な量の電力が必要になります。問題は、どのようにしてこれを実現するかということです。多くの政治家が原子力を主要なエネルギー源の1つとして語り始めているのを見ています。データセンターがエネルギーグリッドにストレスをかけているのが見えます。
2022年に世界で460テラワット時を消費した後、2026年にはその2倍以上になると、パリに本拠を置く国際エネルギー機関が1月の報告書で述べています。基本的に言っているのは、次のレベルのファンデーションモデルとこれらの最先端のAIシステムを構築するこれらのデータセンターは、本当に膨大な量のエネルギーを必要とするということです。
データセンターには電力だけでなく冷却も必要なので、このような巨大なレベルのシステムを運用するためのインフラ要件という点で、クレイジーなことが起きているのです。
今後数年間は、これらのスーパーコンピュータが構築され、このAIをすべて動かすための巨大なデータセンターが構築されるにつれて、大規模な建設が行われるのを目にすることになるでしょう。生成AIのインフラを最も速く、最も効果的に構築した企業が、生成AIのリーダーになるでしょう。データのボトルネックは、もちろんエネルギーであることはわかっています。
経済がこれにどのように反応するのか、エネルギー需要を満たすことができるのか、そしてこの問題全体がどのようにナビゲートされるのかを見るのは興味深いことです。
ここにYann LeCunのツイートがありますが、これはおそらく、現在AIで最も議論されている事柄への返信だと思います。人工超知能の前に、我々が潜在的に持つことができる最大のパラダイムシフトの1つだと思うからです。
現在、AIで最も大きな議論となっているのは、ロジスティック成長や指数関数的成長につながるこのような変曲点にいるのかどうかということです。
この人は、GoogleのDeepMindのオープンエンド性チームにいるのですが、次のように言っています。
「他の人と同じように、私もAIの進歩に非常に興奮し、楽観的です。しかし、指数関数的なトレンドの未来を予測するのは本当に簡単だという誤解があるようなので、対数スケールで線を引いてみましょう。
指数関数的なトレンド(例えば、コンピュートやニューラルネットワークのパラメータの増加)を観察しているとき、我々が観察しているものが実際には変曲点の前のロジスティックトレンドに従っているのかどうかを完全に確信することはできないということを思い出させてくれます。変曲点の前は、両方のトレンドが同じように見えるのです」
基本的に彼が言っているのは、この変曲点に到達する前に、白紙の状態でこの下だけを見ていたら、両方とも同じパターンをたどっているように見えるということです。肉眼で見ると、「ああ、成長はおそらく指数関数的だろう」と思うでしょう。
しかし、通常、S字型のグラフがあり、ここで物事が成熟し、テーパーオフし始めるのがこのロジスティック型の成長です。もちろん、指数関数的な成長が続き、まっすぐ上昇するケースもあります。
問題は、現在、私を含め多くの人が、この変曲点がどこにあるのか、そしてその成長がどこでテーパーオフし始めるのかを予測するのは非常に難しいと感じていることです。
私個人としては、この変曲点は1つまたは2つの要因によって引き起こされると考えています。1つは、先ほど議論した要因です。1つ目は、もちろんコンピューティング能力です。
ご存じのように、これらのデータセンターに電力を供給することは容易なことではありません。データセンターに電力を供給するには多くのコンピュートが必要です。つまり、エネルギーとコンピュートの問題が最大の問題の1つなのです。
そして、もちろん、より大きなモデルを作るにつれて、規制の問題が出てくるでしょう。
もし、より大きなモデルをトレーニングするためのエネルギーやコンピュートがなくなったら、文字通り物理的な含意と変曲点があると思います。
しかし、もちろん、自動化されたAI研究のポイントに到達したら、指数関数的な成長が得られるという、隠れた理論もあります。AIが問題解決により効率的かつ効果的になるような研究を行うことができれば、成長は指数関数的になる可能性が高いからです。
AIの研究を行い、それをテストし、繰り返し、改善するループで24時間体制で動かすことができれば、10年分のAI研究を12ヶ月に圧縮することができるかもしれません。
だから、私が思うに、これらの工場、つまり巨大なデータセンターがオンラインになる前は、GPT-5かGPT-6あたりで成長が鈍化するかもしれません。しかし、そのコンピュートが構築されたら、小さな変曲点があり、物事がテーパーオフし、再び別の変曲点に向かうようなものになると思います。
だから全体的に、おそらくこのようになるでしょう。つまり、GPT-3.5があり、そしてもちろんGPT-4が他の多くのファンデーションモデルと共にあり、そしてGPT-5は結局同じようなジャンプになるということです。
そうすると、ゆっくりとした成長とテーパーオフが起こり、これらのモデルがオンラインになるまで続きます。これらの巨大なスーパーコンピュータがオンラインになったら、自動化されたAI研究が解決され、グラフは上昇するでしょう。世界の物理的制約により、無期限ではないかもしれませんが、その領域ではより指数関数的に見えるようになります。
問題は、これはOpenAIの意見なしでは判断が難しいということです。現在、AIの研究はすべて非公開だからです。Yann LeCunが基本的に言っているのはこのことです。
「私はこのポイントを何度も何度も言ってきました。シグモイドの始まりは指数関数のように見えます。変曲点の前に我々が観察しているものが、実際にはロジスティックトレンドに従っているのかどうかを完全に確信することはできないだけでなく、すべての指数関数的トレンドは最終的に変曲点を通過し、シグモイドに飽和することを常に確信できるのです。
その変曲点を超えて指数関数的トレンドを継続するには、パラダイムシフトが必要です」
基本的に、あなたがやっている曲線が次のシグモイド曲線に上がるためには、ある種のブレークスルーが必要だということです。
物理的プロセスは無期限に成長することはできません。常に、最終的に支配的になる動力学方程式の摩擦があります。エネルギー消費、熱散逸、量子効果、熱ゆらぎ、通信帯域幅、質量エネルギー密度など、地球の物理的限界に到達するでしょう。
長い時間スケールで指数関数的に見えるプロセスでさえ、実際にはシグモイドの連続なのです。
「ムーアの法則は今飽和しつつありますが、過去70年間の指数関数的な進歩は、あらかじめ定められたものではない技術的パラダイムシフトの連続によるものです」
基本的に、1つのパラダイムが存在し、次に別のパラダイムが続き、また別のパラダイムが続くというシグモイドについて私が話したことです。
各パラダイムはシグモイドのように振る舞い、各シグモイドは前のものを追い越し、それが指数関数的に見えるのです。
さて、多くの人がAnthropicをディスったり、Humaneを「ひどい」と言ったりしていますが、Sanders SawがBrilliant AR社のBrilliant AI Glassesについて作ったこのデモを紹介したいと思います。これは基本的にオープンソースのAIテクノロジーで、本当に信じられないほどすばらしいものです。私はこれをTwitterで見ましたが、正直なところ、以前にこれをリツイートしなかったことに驚いています。使うのに最適なハードウェアと組み合わせた生成AIの有用性を実際に示す注目すべきデモだからです。
将来的にはMetaのスマートグラスがこの方向に向かうと思いますが、皆さんにこれを見ていただきたいと思います。携帯電話の接続性とオーディオ、そして今日我々が使っているような生成AIアプリを活用しているからです。信じられないほどすばらしいものです。皆さんにお見せしたいと思います。
「こんにちは、ノア。あなたを紹介する動画を撮っているところです。自己紹介をしてもらえますか?」
「みなさん、こんにちは。私はノアです。あなたのARスマートグラスウィザードです。GPTなどの最先端のAIモデルを使って、あなたの生活を楽にするためのあらゆることを知っています。何かを翻訳したり、人生を楽しくするお手伝いをしたりします」
「この服に合う帽子が近くにあるといいんだけど。」
「あなたはベニスにいるので、アボット・ケニー通りのゴーア・アンド・ブロスに立ち寄ってみてください。信じてください。映画に出てきそうな帽子が必ず見つかりますよ。」
「昼食に何を作ればいいかな?」
「トマト、玉ねぎ、リンゴがあるみたいですね。」
見てください。24時間365日、頭にグラスをかけているだけで想像してみてください。 ただのガラスで、目を痛めたりすることもありません。
「私が画面で見ているものは何ですか?」
「冷蔵庫の中には何がありますか?ここで何が作れますか?」
「これは期限切れですか?このタイヤは交換する必要がありますか?」
本当に、このような用途で実際に効果的になる未来が見えてきます。特にここのテキストは、それほど目障りではなく、シームレスに統合されているように見えます。
これらのメガネは、ハードウェアとソフトウェアのイノベーションとともに、時間とともに進化していくと思います。 デバイス上で効果的に実行でき、推論をより速くできるAIシステムと組み合わせれば、これらの製品は本当に未来のAIになると確信しています。
このデモは、Project Astraなどと組み合わせたときに、私たちが何ができるかを正確に示していると思います。AIと組み合わせたときに、今後5年間でどのようなテクノロジーを手にするのか、想像してみてください。本当に、豊かさの時代と、この素晴らしい期間が訪れると信じています。
さて、これからお見せするクリップは、おそらくこのビデオの中で最も重要なクリップで、MicrosoftのCTOがAIの次のレベルについて語っているところです。注意して聞いてください。何を言っているのか、なぜそれが重要なのかを詳しく説明しますから。AIの自動化研究に近づいていることを示唆しているからです。ではご覧ください。
「デュアルなメモリを持つシステムが成り立つようなすべてのものが整ってきました。 推論は大幅に改善されると思います。現在のモデルの脆弱性の一部は、非常に複雑な数学の問題を解くことができず、非常に複雑なことをするために他のシステムに頼らなければならないことです。 私が言いたいのは、GPT-4やその世代のモデルは、APテストのようなもので高校生並みのパフォーマンスを発揮するものだということです。 今見ている新しいモデルの初期のものは、PhD学生の資格試験に合格できるかもしれないということです」
これは信じられないことです。AIシステムが文字通りあなたのPhDを行うことができるとしたら。マイクロソフトのCTOが、おそらくGPT-5の初期プレビューに参加していて、これらのモデルが以前のシステムよりもはるかに高度なレベルで推論できることを見ていると述べているのは、そのためです。
自動化されたAI研究に近づいている可能性が高いということです。彼がAI「PhD学生の試験をするようなものだ」と言っているということは、AIが自動化された研究をするレベルまで、さらなる反復サイクルがそれほど遠くないということです。
私がAIの自動化研究についてこれほど多くを語るのは、AIが指数関数的に成長するために自動化する必要があるのは、それだけだからです。 一度AIがAIの研究をすることができれば、私たちはそれを指数関数的に拡張することができ、それらのブレークスルーを互いの上に積み重ねることができます。
これは非常にクレイジーだと思います。GPT-4は、多くの人が日常的に使用している「賢い高校生」と言われています。 ポケットの中に PhD レベルの研究者がいて、日常的にさまざまなことを推論するのに使えるようになったら、一般の人々のコンセンサスがどのように変化するでしょうか。
GPT-5の推論能力が優れていて、できることが多岐にわたるのなら、驚かないでください。 ここではっきりと、PhD学生が試験に合格できるレベルになると述べられているのですから。
さあ、テンションを上げていきましょう。ニューヨーク・テック・ウィークで最高のパフォーマンスを披露するんです。観客があなたのエネルギーに感化されてざわめいている様子を想像してください。あなたならできる。情熱を込めて、観客にあなたのバイブスを感じさせ、あなたが持っているものを見せつけるんです。
そして、今見ていただいたのは、OpenAIがニューヨーク・テック・ウィークで新しいフラッグシップモデルのGPT-4のデモを行った様子です。かなりクールでしたね。GPT-4がまだかなりクレイジーだということを示しています。
さて、登録者数20万人を記念して、コミュニティを再始動することにしました。これは、ポストAIの準備期間で、私のポストAGIフレームワークの1つに排他的にアクセスできます。このフレームワークは、AGI以降の世界をナビゲートするために使用しているものです。
これまでのところ、非常にうまくいっています。AIを使ってお金を稼ぐための私の個人的な戦略と、AIを実際に使用する方法を学ぶためのチュートリアル、そしてもちろん、AIに投資して途方もないリターンを生み出す方法などがあります。
これらすべてのこと、つまりAI革命を活用することは現在、無料メンバーのためのスロットがそれほど多くありません。今参加しようとすると、無料で参加できますが、月額19ドルくらいの価格になります。
しばらくチャンネルをサポートしてくれている人は、これがAIを一緒に学ぶチャンスです。ここではAIに関して有益なことをほぼ毎日投稿していきますから。
ここでこの発表をしたかったのは、見逃した人がいるかもしれないからです。
以上で動画は終了です。ご清聴ありがとうございました。


コメント