グーグルのAlphaEvolve AIは自己改善できる。でもAIベイビーを止められるのか？

22,256 文字

Google's New AI Agent Improves Itself. But Can It Stop AI Babies?

Are we on AGI watch? Google’s new AlphaEvolve agent model can improve AI algorithms on its own as OpenAI's Sam Altman la...

今週はAIの複数の分野で大きな進歩がありました。自律型エージェント、ロボティクス、科学的ブレークスルー、そしてベイビーです。ケビン、これはベイビー向けのAIです。そうですね、ギャビン。間違いなくベイビーです。インターネット全体を席巻している赤ちゃんポッドキャストの作り方をお見せしますが、その前に、AnthropicとGoogleのAlpha Evolveから新モデルが登場し、AIが実際に新しいアルゴリズムを生成・作成できることを示しています。
また、OpenAIはHealthbenchを導入してAI科学の進歩を追跡し始めました。さらにTeslaのOptimusロボットから非常にクールな新アップデートもあります。なぜまだ赤ちゃんなんですか？より良い質問は、ケビン、なぜあなたは赤ちゃんじゃないのか？というところですね。それは実に公平な指摘です。
また、新しい法王はAIに焦点を当てています。AI著作権争いでは大きな騒動になっています。これは私が妻と口論するときに妻が私をどう見ているかというところですね。これはベイビーと人間のためのAIです。みなさん、ようこそ。AIの大きな1週間でした。来週はGoogleのIOで大きな発表があります。
でもその前に、今週は多くのことが発表されました。ケビン、再び盛り上がり始めているようですね。これを私はAIシーズンと呼んでいます。そう呼びますか？はい。アレグラを飲まなきゃいけないくらいです。くしゃみが出て炎症が起きますが、これが新しい基盤モデルが登場する合図なんです。ケビン、何か空気が変わっていますね。
サム・アルトマンがシークオイア・キャピタルのオフィスで行った素晴らしいインタビューからのクリップから始めましょう。これから話すことの多くが高いレベルで紹介されています。より詳細なレベルで言うと、2025年はエージェントが作業する年になると思います。特にコーディングが支配的なカテゴリーになると予想します。他にもいくつかあると思います。
来年はAIが新しいものを発見する年になると予想しています。AIが非常に大きな科学的発見をするか、人間がそれをするのを支援するかもしれません。私は人間の歴史における本当の持続可能な経済成長のほとんどは、地球に広がって植民地化した後は、より良い科学的知識からもたらされ、それを世界に実装することから来ると考えています。
すみません、2026年と言いましたか、サム・アルトマン？私はスラック・アルトマンのような気がしますが、ギャビン？そうですね。クリップを続けましょう。そして27年は、それが知的領域から物理的世界へ移行し、ロボット、ただのセクシーなものだけではないロボットの年になると思います。
これについては聞いたことがあります。これは非常に興味深いです。それぞれのことについて見ていきましょう。でもケビン、本題に入る前に、サム・アルトマンの美しい声を皆さんに思い出させたいと思います。何時間でも聞いていられる声で、耳に水が注がれるような最も素晴らしい感覚です。
それはちょっと違いますね。水拷問のようなゆっくりした滴のことかと思いました。サム・アルトマンのホワイトノイズマシンをバイブコードで作りました。彼が子供の物語などを暗唱するだけですが、その声でスリープマスクをつけて寝るとすぐに眠りに落ちます。
サムが2025年、26年、27年と言及した3つのことすべてについて今週ニュースがあります。2025年のエージェントの考え方から始めましょう。GoogleからAlpha Evolveという新しいアルゴリズム発見AIエージェントに関する重大なニュースが出たばかりです。
来週はGoogleのIOがあり、OpenAIに先んじていくつかのことを発表すると思われます。面白いのは、Googleはしばらくの間、社内で一部のコードを書いていると言っていたことです。これは新しいアルゴリズム発見AIモデルで、以前見たものを単に再現するだけではなく、75%のケースで最善の解決策を発見し、20%のケースでは以前に知られていた最善の解決策を改善し、新しい発見をもたらしたという統計があります。
彼らは解析、幾何学、組合せ論など50の問題を投げかけました。私は組合せ論の優れた学者ですよ。母がやっていた組合せ論のVHSがありました。それはレゴを組み立てることですよね？ダークナイトセットの組合せ論なら上手くできます。それはなんだかノックオフのパワーレンジャーみたいで「私たちは組合せ論よ」という感じです。
でも実際20%のケースで以前に知られていた最善の解決策より良い解決策を見つけました。これはアルゴリズムを作成し、評価し、改善するエンジンです。大きなブログ記事のダイアグラムでは、上部に科学者・エンジニアがあり、今のところまだ人間の頭があります。
それは見て良かったですね。そうですね。それには4つのフェーズがあります。プロンプトサンプラー、LLMアンサンブル、評価者プール、プログラムデータベースです。基本的には今のところ人間が問題を提起し、方向性を示すために既知の例やケースがあればそれを与えることができます。
このシステムは問題を解決するためのさまざまなプロンプトのバージョンを考え出し、どのLLMを使用するか、既存のものか、カスタムのものが必要かを判断します。それらのプロンプトから結果の評価を生成し、反復できるデータベースにすべてを保存します。そして基本的には総力戦とは言いませんが、最適なプログラムは何か、どうやって反復し、解決策を最適化するかを見つけ出します。
これは当然、数学や科学の分野に応用がありますが、薬物発見も大きく破壊されるでしょう。これはあなたに大きな配当をもたらすでしょう、特にあなたの脳を働かせるために必要な薬が多いあなたにとっては。それが重要なことです。
ケビン、私たちの聴衆の普通の人々に伝えたいのは、この再帰的自己学習が最も魅力的だということです。再帰的自己学習の定義をTLDRや小学生向けのバージョンで説明してくれますか？そしてなぜこれが重要なのかについて簡単に説明しましょう。
これは先ほど言った自己改善ループです。出力を生み出し、その出力を評価し、基準をパスするか失敗するかを確認します。パスしなければ戻って改善を続けます。解決策が機能していても、他の解決策が機能するかを確認します。2つの解決策を評価し、どちらが良いかを判断します。ケージマッチ、デスマッチ、ブラッドです。
それは完璧です。データのデスマッチです。2つのデータが戦い、1つのデータが残ります。より良いデータが良いデータです。推論モデルとその成長曲線について見たことがあれば、これはAIの懐疑論者や熱狂者の多くが長い間話してきたことです。本当の再帰的自己学習を構築できれば、AIが自分自身を改善し始め、AI開発プロセスが加速します。
この文書で興味深かったのは、彼らがすでにAIトレーニングと推論を強化するためにアルファ・エボルブを使用していることです。つまり、このツール、このエージェントはすでにAI自体の問題に取り組んでいるということです。
これとInformationのストーリーを組み合わせると、GoogleはGoogleの次のIOで常時オンのソフトウェアエージェントを導入するかもしれないということです。これはAIに質問して答えを得るというものから、AIに任せて重要なことをやってもらうという移行を意味します。
今週はO3、OpenAIの最新モデルが多くの幻覚を起こしていることについて多くの人が話していて、それが妨げになる可能性がありますが、Googleがこのレベルのデータを出していることは大きなことです。
この再帰的自己改善、自己改善の問題はモデルをより良くトレーニングする方法や少しパフォーマンスを向上させる方法だけではありません。データセンターの設計や配置、そのデータセンターに組み込まれたチップ、チップの最適化方法など、そのスタック全体の問題かもしれません。そしてそれはAIだけでなく、すべてのビジネスとすべての産業に関わります。
来週登場するとうわさされている常時オンのエージェントがあれば、コードを扱うビジネスにとってどのようなものになるでしょうか。追加される新しいラインを常に監視し、最適化しようとし、バグを自動的に取り出して修正しようとする24時間体制のエージェント。顧客が「何かが壊れている」と言えば、それを取り上げてキューに入れて修正します。あなたは笑っていますが、何を考えていますか？
私はただ、私のコーディングのために常時オンのエージェントがクレイジーなAPIの請求書を作るだろうと思っています。それがもう一つの側面で、常時オンのAIは単に運用に費用がかかるだろうということです。はい、そしていいえ。
コストは相対的だと思います。費用がかかるかもしれませんが、これは一部の人が雇用の大規模な置き換えについて非常に懸念し始めるところです。たぶん福利厚生や休暇よりも安いでしょう。たぶん父親の育児休暇よりも安いでしょう。
n月前は、コーディングツールに0ドルも使っていませんでした。今は何百ドルも使っています。私はコーダーではありませんが、概念実証を作るための時間とエネルギーは従来の方法では負担できませんでした。高価ではありますが、それでも価値があります。
それが本当に新しい科学を解決したり、アルゴリズムの変更を生み出したりするなら、特にGoogleのような大企業にとっては大きな問題です。
同じ流れでもう一つの大きなストーリーがあります。Anthropicは数週間以内にopusとcloud opus、cla sonnetの両方を更新する予定です。opusはしばらく更新されていません。それは彼らの最高級の最先端モデル、最大のモデルです。重要なのは、これらが推論ハイブリッドモデルとしてリリースされることで、エージェント能力を持ちますが、推論自体をいつオンにするかも判断します。これはAIが推論が必要かどうかを決定する次のステップです。
chatbtで、O3コレクトを使ったままシーホークスの今週末の試合時間について聞いたら、1分間考え込む経験をしたことがあると思います。「いや、答えが欲しいだけなのに」と思いますよね。そして実際のシーホークスをさまざまなスポーツでトレーニングする方法を見つけ出し、「はい、動物をケージファイトさせる方法についての48ページのPDFレポートです」と言います。
スターバックスのベンチマークとは何ですか？Anthropicモデルはマンハッタンのイーストビレッジで開く新しいコーヒーショップの潜在的テーマについて市場調査を行うとのことです。これはAnthropicの誰かまたは情報源がInformationに伝えた例で、基本的にはイーストビレッジでコーヒーショップを開くかどうかを決めるために最先端のモデルを使用するというものでした。
今すぐ言えるのは、それをやらないでください。そのビジネスは悪いビジネスです。利益率はひどいでしょう。私はイーストビレッジが大好きです。ニューヨーク市も大好きです。そこに長い間住んでいました。でもイーストビレッジにコーヒーショップを開く必要はありません。世界中のスーパーコンピューティングパワーを使用しても、「レインフォレストカフェにしなさい」と返ってくるだけです。
そうですね。イーストビレッジはそれを引き裂くでしょう。イーストビレッジは熱帯雨林を引き裂くでしょう。さて、2026年のバケットでサムが話した次の大きなことは、新しい科学などについてでした。明らかにGoogleはすでに2025年にそれに取り組んでいます。
しかし、OpenAIがHealthbenchと呼ばれるクールなものを今週導入しました。HealthbenchとはAIモデルが診断の改善や科学の向上にどれだけ効果的かを実際に確認するための新しいベンチマークです。以前このショーで、AIプラス医師が医師だけよりも優れていると話したことがあります。AIの方が賢かったからです。
しかし今度は、O3とGPT4.1ではAIの回答はもはや人間の医師と一緒にいる方が良いわけではなく、人間が関与していない方がはるかに優れているというリリースがありました。つまり、真のデータの答えが得られるところに入ろうとしています。多くの幻覚の話を聞いてきました。
Gary Marcusを含む多くの人々がこれらの新しいモデルがどれだけ幻覚を起こしているかについて話しています。このデータでは、AIは人間プラスAIよりも医師としてより良い仕事をしていることがわかります。これは再帰的自己学習の考え方に戻ります。時間とともに改善するにつれて、彼らは私たちよりも賢くなり、物事を決定するのが上手になります。
私たちはいつもこれを多くの方法で話しています。クリエイティブな選択は常に興味深く変わっていて、それは個人的な人間的なことですが、あなたが病気になったとき、何に病気であるか、または問題が何であるか、または病気を解決する方法に関するデータはデータです。そしてそれを分析できることは本当に大きなことです。
私たちはよくベンチマークが一つのことであるが、バイブチェックは非常に現実的だということについて話します。モデルはどのように感じるか、応答はどのように感じるか、どのような出力が得られるか。逸話的に言えば、そして以前このキャストで言ったように、私は医師だけを信頼しないでしょう。申し訳ありませんが医療専門家の皆さん、あなたはマシンから出てくるこのすべてのデータと競争できません。
私はAIを使って文字通り手術を受け、服用すべきではないスタチンを服用していた隣人を救いました。それを使って母を助けました。最近、私たちは医療提供者と戦っていて、すべてのデータへのアクセスを得て、すべてのテストを承認してもらうようにしています。そのデータをAIに入れて分析できるようにしたいからです。これを好まない医療専門家の方々には申し訳ありませんが、これは過去のように皆がWebMDを手に入れた時とは違います。
コーヒーテーブルで足の指をぶつけて「あと3〜4ヶ月です。申し訳ありませんが、準備を始めたほうがいいでしょう」と言われるような。「すみません、虫刺されですが、それはがんです」と言われるような。すべてがそうでした。これは同じことではありません。これは非常に非常に異なる獣です。
私は過去6ヶ月ほどで医師に会いましたが、彼らがマシンでチャットGPTを使っているのを見ました。彼らは積極的にそれを使用しており、それは良いことです。なぜ自分が知っている最も賢い医師に質問したくないのか、あなたが普通の医師なら。誰も医師が素晴らしくないと言っているわけではありません。彼らは素晴らしいです。そして医師が上手にやることの一部は、何かが間違っている人々と話すことです。
しかし診断は異なります。可能な限り広いデータセットを持つことは役立ちます。医師に「結果を教えてください、でもカフェインを摂りすぎた海賊の形で」と言うと、彼らは協力しません。でもAIは協力します。ギャビン、あなたはあまり時間が残っていないようです。私と一緒にカリブ海に行きませんか？壊血病とはどういう意味ですか？ジムで肩を痛めただけだと言いました。私たちが知っているのは壊血病だけです。私たちは6ヶ月間船に乗っていました。
とにかく、これは非常にクールなことです。これに加わるもう一つのことは、OpenAIの研究責任者がNatureとのインタビューを行ったことです。ログインすれば読むことができます。支払いは必要ありません。彼はAIモデルが新たな研究能力を持っていると言っています。これは、イリア・サスケヴィッチがイリアが去った後に引き継いだOpenAIの主任科学者であるジェイコブ・パチです。これが現在すべて起こっているという考えに対するもう一つのチェックマークに過ぎません。
そしてケビン、2027年の世界、サムはロボット工学の進歩と言いました。私たちはビデオを公開し、実際に起こる前に物事が起こっていると言うのが大好きな人を知っています。私はまだ2027年が良い数字だと思います。これらは大きくなるでしょう。しかしテスラのオプティマスが新しいビデオをリリースしました。
これらが最初に登場したとき、彼らは奇妙な布製のもので、明らかに誰かに操作されていました。彼らは本当にうまく機能しませんでした。テスラのオプティマスがビデオを出しました。それを皆に見せましょう。それは非常に機敏で見るのが信じられないほど素晴らしいです。
実際、ギャビン、これが最初に出たとき、それは布製でした。それはユニアードに詰められた人間で、このスタイリングを持つことになっていて、当時ロボット工学の分野では笑うほど不可能だったダンスムーブをいくつか行いました。興味深いのは、非常に有能で器用で振り付けられたダンスムーブを中国の製品から見てきましたが、ここでオプティマスは完全にワイヤレスで操作されているように見えることです。言わなければならないのは、「見える」ということです。なぜなら私たちは決して知らないからですが、コーナーに1倍速で実行されていると書かれているように見えます。もし正当で1倍速で実行されているなら、非常に非常に印象的な結果です。
彼らは最適化し、非常に速く動いています。ここで興味深いのは、テスラのエンジニアがシム・トゥ・リアル型のトレーニングを使用していると言及していることです。これは以前のショーで話したことで、Nvidiaがたくさん話していることです。この場合、明らかに人々が踊っている実世界のデータに基づいてこれらのモデルをトレーニングし、それをロボット自体に入れるという考えです。これはこの物事がより良く、より速くなる方法のもう一つの非常に速い速度アップです。シミュレートされた宇宙（私たちがシミュレートされた宇宙にいるかもしれませんが）やシミュレートされた世界では、このロボットは多くのトレーニングをせずに、戻ってきてこの空間を理解することができます。
ケビン、いつか私たちがこれらを直接脳にダウンロードできるようになることを願っています。そうすれば私もこのように踊ることができます。私はこのテスラロボットのように素早く動けるようになりたいです。間違ったソフトウェアアップデートで、新しいファームウェアアップデートをプッシュして、それがロボットのように操り人形のようにあなたを操作しようとして、あなたは四肢を失うかもしれませんが、それはTik Tokにとっては良いものになるでしょう。
私は先週、あなたが自宅で頸動脈を空手チョップするかもしれないロボットを受け入れる準備ができていたときのことを思い出します。はい。洗濯物をたたむことができれば。それがポイントです。
あなたはまだそのように感じていますか？これらのロボットが動く方法を見て、彼らが何ができるかを知って、彼らが子供の足を踏みつけていることを知って？はい。それは本当に面白いビデオが出てきました。ユニットロボットのもので、これらが本当のロボットの姿だとギャビンは言います。
子供が傷つかないという意味で面白いですが、ユニット・ツリー・ロボットが見えます。それはモールにいて、おそらく中国で、ロボットが前進するために動くときに、子供の足を気楽に踏みつけるようなものです。これは2025年版の現在のロボット工学の場所です。Unitryを見ると、それらは世界のいくつかの場所に存在し、明らかに中国に存在し、これは数週間前に話したI Show Speedを持っていた同じ会社です。彼らはまだそこにいません。2025年ですが、2027年は見えます。オプティマスやこれらの他のすべてのものが非常に役立つ世界が見えます。
このユニトリーのビデオを見ると、それは「あっ、うっかりあなたのスケッチャーを傷つけた」というようなものではありません。このものは若い子供の足を4回か5回踏みつけ、スニーカーが脱げ、その後向きを変えて歩き去ります。ところで、それはどこに行くと思いますか？それは私の質問です。それは明らかにどこかに行きます。それは怒って行きます。それはキンダーケアに向かっています。はい。「もうたくさんだ。この仕事から離れる必要がある」と言っています。ウォールデンブックスに向かっています。私はいくつかの自己啓発本を読んでこのキャリアから抜け出す必要があります。
これに対する準備をしてください。来年末までにベータテストが可能かもしれません。今年末までかもしれません。これらの企業がどれだけ押し進めるか分かりません。安全だとは思いません。しかし内部ベータテスト2026年2027年、確実に家の中にこれらのうちの1つを持つことができるでしょう。おそらく高い月額でリースすることになり、それはおそらくティー操作されるでしょう。多くの人にとって狂気のように思えるでしょうが、非常に迅速に人々は快適になるでしょう。他の場所の誰か、出荷コンテナ、バンカー、またはコンピュータ上で拡張現実ヘッドセットを使って家の中でロビットを操縦して洗濯をしたり、ティックトックダンサーのように操り人形にしたりします。待ちきれません。私の世界に18個持つつもりです。それが私の仕事になります。ただ18個持って一度に全部動かします。私はそれらすべてを私の拡張脳を通して実行します。
でもケビン、これらすべてはどのように支払われるのでしょうか？これは多くの高価な開発のように聞こえます。私たちは将来のコンピュートが非常に高価なものになると多く話してきました。
尋ねてくれてうれしいです。どうやって支払うのでしょうか？Patreonを通じてです。私はそこに行くとは思っていませんでした。ギャビン、すぐにそこに行きましょう。「いいね」、購読、エンゲージしてください。そして気にするなら、Patreonのチップジャーに5ドル入れてください。何も得られませんが、私たちは非常に温かくてぴりぴりします。そして誰がそれを好まないでしょうか？それは正しいです。私はいつも温かくてぴりぴりします。実際、それは私の標準設定なので必要ありません。私たちのポッドキャストに行き、レビューしてください。5つ星のレビューをください。私たちはポッドキャストプラットフォームでレビューされるのが大好きです。ありがとうございます。そして、「いいね」、フォロー、そしてすべてのことをしてください。私たちはあなたたちが成長するからこそ成長します。ところで、先週は素晴らしいショーでした。YouTube上の多くの視聴者が入ってきて私たちを見ました。だから、誰かが私たちを見て「あの人たちはバカだ」と思ったなら、ようこそ。それが私たちです。
彼らがもう1週間戻ってくると思うのは推測し過ぎますね。男、私はこれが嫌いです。「いいね」、購読、ベルを押してください。しかし真剣に、皆さんありがとうございます。はい。
それで、実世界でこれらすべてのものはどのように支払われるのでしょうか、ケビン？サウジアラビア人によってです。はい。本当に奇妙なことです。見逃したかもしれませんが、イーロン、サム・アルトマン、ジェンセン・ウォン、そして多くのクレイジーなビッグテック企業の人々が今週サウジアラビアで大きな会議を行いました。これは未来のためのGoFundMeとしか言いようがありません。これは世界で最も裕福な国の1つであるサウジアラビア人の手を振るGoFundMeのようなものです。
サウジアラビアやその他の国際的な場所に、AIコミュニティ全体が良くも悪くも解放しようとしている多くのお金があります。このポッドキャストでは深入りしたくない多くの政治的な話がありますが、これがお金のある場所です。彼らはインフラストラクチャをより多く構築してコンピューティングを持つ必要があります。
サム・アルトマンは、GPT40の画像生成が起こったとき、彼には十分なコンピューティングパワーがなかったことを非常に有名に言いました。そして、それはこのスペースで最大の会社の1つ、Google とMetaと比較して最大の会社の1つかもしれませんが、それでも、これは大きな問題です。これはただ、より多くのコンピューティングサイクルを得る方法の継続でしかありません。サウジアラビアとその他のアラブ湾岸地域の人々は実際にこれにお金を投入しています。
このようなことを見ると、ブラックストーングループ、ブラックロック、IBM、シティグループ、ボーイング、アルファベットとグーグル、アマゾン、エヌビディア、パランティア、ハリバートンなど、もし私がコルクボードに糸を持っていたら…はい、あなたは陰謀論者です。これはすべての要素が一度にあります。これは正しいです。これはすべての主要なプレーヤーです。私は確かに新しい視聴者の中の誰かをスリーパーセルとして起動したと思いますが、それが誰が行って握手をしているかです。
これらは何百億ドルもの資金を必要とする人々です。そして今、彼らが誰を求愛しているか知っています。また、私たちの結婚式招待状のようにも読めます。本当に？それがあなたの結婚式に招待した人々ですか、ケビン？それらの人々。フッターにリタ・ホフマンが出席する予定だったが出席しなかったと書いてあるのを見ました。「そうだね、それは私の結婚式だ」と思いました。いいえ、それは一致します。私は彼ら全員を招待しました。誰も現れませんでした。
これに加えて、OpenAIがもう一つのスターゲートプロジェクトをアラブ首長国連邦で追求しているというInformationからの最新ニュースがあります。これは、AIに注ぎ込まれるであろう国際的に存在する大きなお金のもう一つの例です。
私は経済学者ではありませんが、これは世界全体のことです。一般的にアラブ諸国は、石油ベースの経済からどのように移行するかを考えてきました。なぜなら、いつか私たちが石油を解決すると仮定しなければならないからです。明らかにテスラやその他の企業がバッテリー駆動の車に私たちをもたらしました。私たちはまだそこにはおらず、まだ成長する余地がたくさんあります。しかしAIは新しい石油です。それは人々が話しているように新しいデジタル石油です。したがって、当然、これらの余分な現金をたくさん持っているこれらの国々がこれに折り込まれると思うでしょう。そして、私たちは多くのこれらの巨大なお金の状況がAIに注ぎ込まれるのをもっともっと見ることになるようです。
見てください、大規模な支出があるでしょう。そして、賞品に目を向け続ける必要があります。私たちは家の中に老人ケアを手伝うロボットを持つでしょう。医学のブレークスルーを持つでしょう。新しい並べ替えアルゴリズムを持つでしょう。そして、本当に無限の、本当に終わりのない赤ちゃんポッドキャスターの供給を持つでしょう。それは正しいです。世界中のすべてのお金が今赤ちゃんポッドキャストに向かっています。赤ちゃんポッドキャストを作るのにどれだけの純粋なお金が使われているか想像できますか？
チャットGPTに基本的なクエリをするたびにどれだけの水が蒸発するかについての、必ずしも真実ではない記事をよく読みますが、それらのことの多くはセンセーショナルです。しかし、赤ちゃんのテオ・ボンの別のクリップを手に入れるために何本の木が伐採されなければならないかを考えると震えます。
これについて話しましょう。ソーシャルメディアにいなかったら、恐らくこれらを見たことがあるでしょう。赤ちゃんポッドキャストはティックトック、インスタグラムリール、YouTubeショート、あらゆる場所のソーシャルメディアを席巻しています。これらの最初の大きなものの一つは、1ヶ月ほど前に爆発的に広まったイエス・ポッドキャストを作った同じ人、ジョン・レオイでした。彼は昔からのYouTubeスターです。彼は赤ちゃんが彼の犬にインタビューするという作品を作りました。それはティックトックや他の多くの場所で何百万もの再生回数を獲得しています。
「トーキングベビーポッドキャストへようこそ。今日のエピソードでは、私の家に住む奇妙な見た目の人物について話します。ここに来てくれてありがとう、奇妙な見た目の人物。ありがとう。ご存知のように、あなたは私の世界で3番目に好きな人です。私たちと一緒に住んでいる2人の大きな人々の次です。」
そしてテオ、アメリカで最も文化的に影響力のある声の一つであるように思える有名なポッドキャスターは、誰かに作ってもらい、自分のハンドルに赤ちゃんバージョンの自分のポッドキャストを投稿しました。「犬を撫でてそれが立ち去らなければ、神よ、それが好きです。神よ、それが好きです。」そして今や彼らはどこにでもいます。しかし私たちが最初にやりました。ケビン、赤ちゃんジョー・ブロエンのポッドキャストの非常に短いショットを再生しましょう。それは何日付ですか？それは約6ヶ月前のものだと思います。
これは2024年8月頃のものです、ギャビン。私たち自身が赤ちゃんだったときのものです。これは赤ちゃんジョー・ブロエンが赤ちゃんテレン・ハワードにインタビューしているものです。「テレンス、ここベビー・ジョー・ブロエン・エクスペリエンスであなたをお迎えできて光栄です。1番プラス1番は2番になると言うとき、どういう意味ですか？」「これは振動的なものです。1番をすると、おむつが濡れます。そうですね。」「そうです。それがどのように機能するか。」「さて、もう一つの1番をすると、振動があり、見よ、2番です。」「でもテレンス、それはそのようには機能しません。」「ここで心を開いておく必要があります。」「そして、そして、そして、ううう。」「ジョー、私は振動を感じました。」「良い振動。」
ギャビンの指摘通り、私たちは早かったです。そして、視聴回数から見ると、はるかに成功していませんでした。はるかに成功していません。私たちは多くの新しい視聴者を得ました。そして、新しい視聴者やリスナーの方々が、私たちが以前やっていたことに嫌気がさせられなかったことを願っています。その場合、アーカイブを探検しないほうがいいかもしれません。
しかしケビン、これがいかに簡単にできるようになったか、そして自分でできることを皆に伝えたいと思います。とても簡単です。私は今朝、約30分でこれをやりました。あなたは人々にいくつかのアルファをここで与えようとしています。他の人がさまざまなサービスで100ドルほど請求しようとしている情報です。これは、ハスラーたちのハッスルに対して失礼という意味ではありません。しかし、友達、鉛筆とパッドを持ってください。
そして、これに多くのお金を使う理由は、これらのビデオが非常に大きくなり、一部は何千万もの視聴回数があり、実際に一部の人々のお金儲けになっているからです。だから、これは全体的なハッスルブロのことになります。しかし、ここに非常にシンプルなバージョンがあります。そしてこれは無料でできます。これらのツールを以前に使用していない場合にのみ本当に無料でできますが、かなりシンプルな種類のサブスクリプションがあります。使用した2つのものがあります。Runwayのリファレンスとヘドラです。その後、私は自分でそれらを編集しました。
基本的に、Runwayのリファレンスでは、人々の写真をアップロードして、それを他のものに変換することができます。GPT40イメージジェネレーションでも直接これを行うこともできます。これも無料です。自分や誰かの写真をアップロードして赤ちゃんを作ることができます。しかしケビン、私は先週のサムネイルから私たち二人の写真をアップロードしました。背景を取り除いただけで、同じ写真でした。「画像1の二人の男性をリファレンス接続として、ポッドキャストスタジオで互いに向かい合った18ヶ月の幼児に変えて、前にポッドキャストマイクがある状態にしてください」と言いました。そうすることで、私たちに十分近い二人の赤ちゃんのツイート（二者会話）を得ました。
そして、多分あなたはこれを試すために複数のバージョンを作りたいかもしれません。その後、私は文字通りそれらを垂直方向としてスクリーンショットしました。基本的に、私はその物の二つの部分を取り、本質的に垂直形式のビデオとしてスクリーンショットしました。先週のエピソードの音声をヘドラにアップロードしました。私たちがケンタウロスについて話していた部分です。ヘドラのプロンプトで「話しながらジェスチャーをする赤ちゃん」と言っただけです。
この結果を再生してください。これは非常に簡単なことで、超面白くするように設計されていませんが、どのように機能するかの例として示します。「でも、ビデオを一時停止してズームインすると、なぜそうしないのですか？技術的なことを探しているからです。」
面白いですね。そこに何かがあるということです。もう一度言いますが、これがどれだけ早く出せるかを知りたかったので、このバージョンにはジョークを入れませんでした。約30分でできました。それはかなりクレイジーです。そして、それはそのものの10秒のクリップに過ぎませんが、本当に簡単にできます。そして、自分で試すことができます。
ヘドラとRunwayの両方に無料トライアルがあり、これを利用できます。これはクールなAIビデオプロジェクトを自分に開くための良い方法です。そして、Runwayリファレンスは非常に強力です。最大3つの画像を供給し、任意の方法でタグ付けし、それらを任意の方法で組み合わせるようにプロンプトを与えることができます。
ポッドキャスターを持っているが、異なる環境に置きたい場合は、環境の写真をアップロードし、「背景」または「世界」としてタグ付けします。そして、特定のアイテムを持たせたり、特定のシャツや帽子を着せたい場合は、それを別のリファレンスとしてアップロードできます。そして、@記号とタグ付けした名前を使用するだけで、これらすべてを1つのプロンプトに非常に簡単に組み合わせることができます。
私はリファレンスに本当に感銘を受けています。それは本当に素早く反復し、アップロードしたものに基づいて動画を生成し始めることができます。ショーの最後に、私がRunwayリファレンスを使用して、赤ちゃんとして、また20歳として私自身にインタビューした方法について少し話します。
しかしケビン、本当に奇妙なビデオから移る前に、ニール・デグラス・タイソンのディープフェイクを見せたいと思います。多くの人がこれがディープフェイクであることを知らなかったのを見ました。これは完全に信じられるデジタル人工メディアにどれだけ近づいているかの良い例です。
「ジグルフィジックスが現在GTA 6にあります。これはグーナーと失業者にとって画期的なニュースです。しかし、なぜでしょうか？水の物理学ではなく、気泡の跡がある
ビール瓶でもなく、これは安いものの動きを完全にシミュレーションした高度なシミュレーションです。」
もしあなたがここでビデオを見ていない場合、それは本当にニール・デグラス・タイソンがこれを言っているように見えます。また、ニール・デグラス・タイソンがこれを言っているように聞こえます。最初の手がかりは「グーナー」という言及と「勃起」です。しかし、これらのことは本当に実行可能で信じられるパスがあります。
この赤ちゃんポッドキャストのすべては、私たちが永遠に話してきた同じポイントに行き着きます。何かが本物だと信じないでください。明らかに、赤ちゃんが話す赤ちゃんは一つのことですが、そのディープフェイクは私を座らせて「ああ、多くの人々が実際にこれを確信していなかった」と思わせました。そして、初めて見たとき、私も確信が持てませんでした。
ギャビン、私たちは不正行為について話しました。エッジロードマックス物理学について話しました。政治について話しました。残りは宗教だけですね。宗教の世界に入りましょう、ケビン。宗教の世界で何が起こりましたか？新しい教皇が登場しました。バージョン14です。彼は新しいモデルです。パッチノートをチェックしてください。彼はAIに基づいています。
何が起こっているのでしょうか？通常、このような種類のことについては全く話しません。明らかに、これは大きな話でした。「コンクラーベ」という映画を見ていなければ、それは去年の素晴らしい映画です。見るとは思いませんでしたが、それは教皇がどのように決まるかの物語です。この教皇は2日という短期間で決まりました。
まず、彼はアメリカ人であり、これはかなり大きな出来事です。最初のアメリカ人の教皇ですが、彼は名前をレオ14世に選びました。なぜなら、その名前の最後の教皇は産業革命を経験し、AIの変革力を私たち全員が非常に真剣に受け止めなければならないものとして見ているからです。先週、AIの会話が最高レベルで行われていると言いましたが、今、ケビン、AIの会話は神との間で行われています。
今や私たちは教皇と神自身との間でAIの会話が行われています。AIのほとんどはクラウドで行われます。それは理にかなっています。神様、それについて考えたことがありませんでした。あなたは正しいです。クラウドがある場所は、私たちの新しい世界では実際に天国です。そして宗教を愛するすべての人はこの会話やコメントに今すぐ飛び込んでいます。
しかし、ギャビン、AIの世界では空が本当に落ちているかもしれません。それは非常に速く崩壊しています。私たちがかなり話してきた原罪、これらのトレーニングモデルに入ったすべてのデータ、それらがテキストを出力できるようにする医学的診断、驚くべき音と動画、赤ちゃんポッドキャスト、そのすべてのこと、しかしそのほとんどは私たちが信じている限り、ハリウッド映画、あらゆるポッドキャスト、小説や新聞記事などの著作権のあるデータでトレーニングされました。長い間、これらのものは人間のようにトレーニングされただけだと言われていました。あなたと私が新しい言語や楽器を学ぶのと同じ方法です。それは単に模倣しているだけですよね？はい。そうですね。たぶん違います。
ああ、何が起こったのですか？ギャビン、著作権ドラマが起こっています。米国著作権局は明らかにコンテンツ作成者の味方をし、最新の報告書で公正使用の例外はおそらく商業的目的には適用されないと結論づけました。
いいえ、大丈夫です、ケビン。あなたが聞いたかもしれないし聞いていないかもしれない別のことが起こりました。現政権はそのメッセージが出るとすぐに著作権局の長を解雇しました。それが今起こっているクレイジーなことです。政権は著作権局の長を解雇しました。
しかしケビン、この話にはもう一つのひねりがあります。どうしてこれがもっと報道されないのか理解できません。明確にするために、これはケビンが言及したAIの原罪です。そしてもしAIモデルがこれで存在できないなら、もしこれらのモデルが自分自身をトレーニングする方法に何らかの停止があるか、これらのモデルの使用に法的に何らかの停止を設けるなら、それはすべてを遅らせます。
どちらかの側に強い意見を持っている人がいることは知っていますが、これは大きな問題です。しかし、このすべてのひねりは、ケビン、The Vergeがこれについて非常に長く、非常に詳細な記事を持っていることです。著作権局の長の解雇は、超AIプロの人々からではなくて、むしろ逆効果から来ているかもしれません。
そうですね、ギャビン？はい。逆効果です。良い仕事です。良い仕事です。もっと言葉を入れたいですか？ウォンカ。ウォンカ。ウォンカ。ウォンカ。やあ、ウォーリー。ウォーリーザセイウチです。ウォンキーウォール物語です。
超詳細に入る必要はありませんが、Vergeの記事を読んでください。これについての最大のことは、これはモデルトレーニングの将来だけでなく、アーティストがどのように支払われるか、またはそもそも支払われるかを決定する可能性があるということです。しかし今のところ、現政権の人々は実際にハードコアだということです。彼らをVergeの記事では「保護的著作権主義者」と表現しています。基本的には著作権を本当に支持したい人々対それを排除したい他の人々です。Twitterからイーロンとジャックの両方が大規模に著作権を排除することに興味を持っていることを知っていました。
記事はまた、権力を持つ新政権がビッグテックに特に反撃したいということも示唆しています。著作権を保護したいのと同じくらい、それは本当にテクノロジー企業に反撃することについてです。だから私たちがここで逆効果があるかもしれないと言う理由です。「彼らを排除しよう。私たちはすべてのAIモデルをトレーニングするためにフリーハンドが必要だ。」そして今権力を持っている人々はビッグテックを抑制したいようです。政治についてさらに議論するリスクを冒さずに、人々をVergeの記事に向けましょう。
特に画像生成の分野でリリースのために安定性の波。彼らはスタビルディフュージョンの背後にある企業で、大量のAIの創造性を開始しました。彼らは今日新しい投稿をしました、ギャビン。彼らはステーブル・オーディオ・オープン・スモールをオープンソース化しています。それは3億4100万パラメータのテキストから音声へのモデルです。少しサンプルを再生して、なぜ私がこれを取り上げているのかを説明します。
わかりました。ああ、あなたは頭を振っていましたが、今は大丈夫です。あなたはくつろいでいます。なぜこれが興奮するのですか？私は聞きました。あなたはAnthropicのコーヒーショップでモカチーノを飲みながらMacBookでそれに合わせてバイブしたくないですか？これがなぜ興奮するのか、でも教えてください。
理由はこうです。オープンソースは素晴らしいです。誰もがそれをいじくり回して改造することができます。オープンソース化のおかげでそれはより良くなるでしょう。それはARMのCPUで実行するように設計されています。何？大多数の携帯電話にARMのCPUがあります。はい、ARMのCPUはあなたのスマートデバイスの多くにあります。彼らの投稿によると、99％のスマートフォンが数秒で音楽制作サンプルをデバイス上で直接生成できるようになります。そして、それはローカルで行います。クラウドに接続したりしません。だから、良い音の音楽を生成できる非常に小さなモデルです。
あなたはそのクリップを聞いて「ああ、それは大丈夫だけど、最先端ではない」と思ったかもしれません。それは確かに1年前よりも音楽生成ははるかに良くなっています。そして今、「ああ、そう。それは私たちの手のひらにあります。」あなたの携帯電話でこのモデルを実行するであろう音楽とオーディオのおもちゃベースのものの大量の流入に準備してください。それによってあなたは周りの環境を素早くサンプリングしてビートに変えたり、友達とローカルで遊んだり、マルチプレイヤーで曲を生成したりすることができます。
おもちゃのための素晴らしいアイデアがあります、ケビン。DJテディ・ラックスピン。それは完全にマシュマロスタイルのDJがブースの前に立っているようなものですが、子供のためにこれを手に入れると、彼らはそれを仕事として学びます。だから彼らはサンプリングしたり、あらゆる種類のことをすることができます。私は自分の子供のためにそれをすぐに買うでしょう。
私の孫がそれを手に入れるでしょう。彼は私の子供たちを狂わせるでしょう。それが私の計画です。これは、10年、15年、20年後に私の子供たちが子供を持つときの計画です。そしてこのシナリオでは、あなたの子供たちはまだあなたと話しています。はい、ほとんど。今のところそうではないですが、その時までには修正されていることを願っています。子供たち、パパがまた曲を作りました。パパはあなたと絆を結びたいです。私の音楽を聞いてください。
子供たち、今週あなたがAIでやった楽しいことを見る時間です。AIです。私はあなたがしたことを見ました。時々あなたは気にせずスクロールしています。そして突然あなたは立ち止まって叫びます。
ケビン、ここに非常に興味深いAIビデオがあります。それは長いものですが、多くのピックアップを得ています。それは「The Colorless Man」と呼ばれています。これはレディットのSourceCode 12という人によって作成されました。彼はインスタグラムやX、さまざまなハンドルでも活動していると思います。基本的に、これは白黒のテレビ番組のようなものが、それから色付けされるという非常にクールなビデオです。それは60年代のテレビでカラーテレビを作ったあの大きな瞬間のようなものですが、一人の男は色付けされません。そしてストーリーは時間が経つにつれてどんどん良くなっていきます。
このビデオのAIモデルは完璧なトップオブザラインではありませんが、これらのツールで何ができるかを示す非常にクールなストーリーです。そして更に印象的なのは、彼がこれを600ドルで作ったということで、これは大きな出来事です。このビデオは13分の長さで、本質的にはTVパイロットまたはTV特番と言えるでしょう。これはまた、非常に広範な創造性とこれらのツールを組み合わせると何ができるかを示しています。
はい、これは本当に本当に美しい短編です。皆さんはぜひチェックしてください。それは「プレザントビル」という映画を思い出させます。それはプレザントビルと呼ばれていましたか？リース・ウィザースプーンとトビー・マグワイアが出ていた映画です。はい、おそらくプレザントビルと呼ばれていました。100％の確信を持ってプレザントビルと言いましょう。コメントが入ってきます。プレザントビル。
また、Xでのアレックス・フレド87にも敬意を表します。投稿には「ポイントアンドクリックのビデオゲームシステムを改良しました。今やアニメーションはより良く見えるなど、他の改良もしています」と書かれています。彼らがやろうとしているのは、90年代のCD-ROMスタイルのゲーム、「触手の日」のようなティム・シェアーの古いゲーム、彼のOGゲームなどを再現することです。
基本的に彼らはさまざまな画像生成システムでモデルを生成し、歩行サイクルをアニメーション化し、それをゲームシステムに組み込もうとしています。これはまた、専任チームが40〜60人ほどと多くのお金と時間がかかるシステムを作るものです。そして今や人々は単なる趣味でハッキングして物事を起こしています。アレックスのプロフィールはアーティストとプログラマーであり、それは一致します。
これが少し思い出させたのは「ディスコエリジウム」をプレイしたことがありますか？そのゲームを知っていますか？ああ、はい。ああ、それは私の最も好きなビデオゲームの1つでした。試していない場合は、プレイしてください。それは更新された、本当に深くて面白いポイントアンドクリックの冒険のようなものでした。もっと深いカットです。「ファンタスマゴリア」を覚えていますか？もちろん。私はファンタスマゴリアが大好きです。これらは私のお気に入りのゲームの一部です。あなたは物事をすることができ、これについて本当に奇妙な、半分フォトリアリスティック、半分ファンキーな雰囲気があるのが素晴らしいです。
最後に強調したいのは、番組の友人です。長い間番組を聴いていれば、私たちの友人のPufを覚えているかもしれません。彼は匿名ですが、永遠に前、おそらく最初の10回のショーの中で登場し、D&D（ダンジョンズ＆ドラゴンズ）のためにセットアップしたAIエージェンティックシステムについて話しました。彼は今、全く新しいAIエージェンティックの実験を作成しました。
これには少しだけ暗号通貨の部分があります。それがあなたを悩ませるなら申し訳ありませんが、ただこれに言及したいと思います。それは重要です。彼は基本的にブロックチェーン上のエージェントを使用した金融シミュレーションを行っていますが、これらはすべて互いに交流し取引するコメディキャラクターでもあります。
これは金儲けの機会として設定されていません。基本的にあなたはこれらのキャラクターをあなたのものの一部として取得し、彼らが取引するのを見て、チームとして彼らに何をするように指示するかを少しコントロールできます。この種の実験は明日から始まると思います。それはあなたがそれがどのように展開するかを見ることができる日です。しかしPufに敬意を表します。
彼は私たちのこの分野で最も好きなクリエイターの一人であり、素晴らしいものを作り出し、AIという考え方全体を前進させています。そのスペース自体だけでなく。明らかに、あなたが暗号通貨に興味がないなら、それは大丈夫ですが、これはオンラインで見るのにとても面白い実験です。
それは次の数日間に興味深いものになる可能性があります。さて、ケビン、今週は予想以上にこれらの赤ちゃんポッドキャストのことに時間を費やしましたが、先ほどあなたが言及したRunwayのリファレンスについて、非常に小さな実験も行いました。それがどこまで行けるかを見たかったのです。
やりたかったのは、赤ちゃんバージョンの自分自身、20歳の自分自身、そして今の自分自身の間でポッドキャストを作れるかどうかを見ることでした。先ほどRunwayリファレンスの使い方について言及したように、基本的に3つの画像を使いました。上部では3つの画像しか使えないからです。かわいい赤ちゃんだった頃の赤ちゃん写真、22歳の大学卒業時の写真（その写真でも赤ちゃんのように見えます）、そして基本的にレイアウトを作成し、左に「男性2」というボックス、右に「赤ちゃん1」と言い、真ん中に現代の自分の写真を置きました。下部には「マイク付きポッドキャストテーブル」と書きました。
これら3つの画像を一度にアップロードし、それぞれを参照すると、完璧ではありませんが、マイクの設置方法に小さな問題があるため、赤ちゃんにはマイクがありませんが、真ん中に自分がいて、左に赤ちゃんの自分、右に20歳バージョンの自分という3人のポッドキャストが生成されました。これは、このようなものがどのように機能するかを見る本当にクールな使用例でした。そして、Runwayの皆さん、素晴らしい仕事をしています。彼らはこれを既に数回更新しており、どんどん良くなっているようです。人々はこれよりもはるかに興味深い使用例を見つけています。それを追跡し、他に何があるかを見てください。
あなたがポッドキャストシーンにしたいものの大まかなレイアウトを作ったのと同じ方法で、素晴らしい例があります。Runwayの社長であるクリスタル・バル・バレンエラは、このツールができることのいくつかの素晴らしい例をツイートしています。その中で私を驚かせたのは、マトリックススタイルのチェスボードでした。
行と列がアルファベットと数字でラベル付けされているものです。もう一つは美術館のような空間の写真、三つ目は彫刻のような写真です。彼は基本的に「ヘイ、Runway画像モデル、この彫刻をこのグリッドのD1という正確な位置に配置してください」と言います。
エンジンはグリッドを見て空間を見て、そのグリッドでその空間がどこにあるかを解釈し、彫刻を配置します。それは環境内の現実的な照明と影を持ち、カメラの動き、「これをここに、このキャラクターがそこを見るように」などを描くことができます。人々はこのツールで非常に興味深いことをしており、彼ら自身もまだそれができることを発見しているのだと思います。
全くその通りです。繰り返しますが、これはAIの本当にクールな使用例であり、明らかに以前にもこのようなものを見たことがあり、CllingやMiniaxなどの他のモデルもありましたが、Runwayはかなり興味深い何かを解決したと思います。
人々は将来これで本当に創造的な使用例を考え出すでしょう。最後に、私の心を吹き飛ばしたのは、砂の写真と木の棒のような写真をアップロードし、「ツールを使って砂の画像にエッフェル塔を描いてください」と言ったものでした。見ると、木の一部と出力結果が見え、エッフェル塔が砂の中に削られているように見えます。
これは本当に興味深く、エレガントです。私も週末中これをいじって、光を見ることのない未来のプロジェクトを作っていました、ギャビン。そうですね？あなたはそれらを見なければなりません。それらは日の目を見ないでしょう。わかりません。わかりません。そうですか？
とりあえず、道徳的な基準から見て曖昧な空間に存在するプロジェクトがあると言っておきましょう。皆さんにそれが何であるかを想像してもらいましょう。もし予想があれば、コメントに残してください。週末に作成されたもので、まだリリースするかどうか決めていないものです。
私はそれを2時間でジャムアウトしたことを非常に誇りに思っています。それが何であるかを考えると、印象的でした。印象的でした。しかし、それをリリースすることが問題になる可能性があることは理解できます。もし十分な人が予想し、それを見たいと思えば、たぶん私たちは…予想しないでください。予想しないでください。
もう一度言います。予想しないでください。十分な人が予想すれば、もしあなたが「クラーケンを解放せよ」と言うだけなら、そうすれば私たちは来週それを解放するか、あるいはそれについて話すことを検討します。もしそれを見たいなら、YouTubeのコメントに「クラーケンを解放せよ」とコメントしてください。
皆さん、それではこれで終わります。愛しています。愛しています。皆さん、さようなら。ご視聴ありがとうございました。