

私たちはOpenAIの最新の混乱について掘り下げていきます。製品の遅延や共同創業者の退社、そして新たなイーロン・マスクの訴訟について話し合います。ケビン、ケビン、待ってください。これは次の大きな出来事かもしれません。サム・アルトマンがストロベリーについてツイートしています。それが新しいモデルです。あるいは巨大なトロールかもしれません。ケビン、夏の庭にいるようです。
さらに、フィギュアが最新の人型ロボットを公開しました。技術が詰まっています。これらのデモを見なければなりません。第4世代のハンドは、あなたの第1世代の肉の指を嫌いにさせるでしょう。ケビン、あなたはすぐに第2世代を手に入れるでしょう。
そして、私はこれにとてもワクワクしています。フラックスという新しい画像モデルを見てみましょう。オープンソースで、今すぐ試すことができます。最後まで見ていただければ、今週の見逃せないAIの素晴らしさをすべてお伝えします。
私たちは戻ってきました。AIフォーヒューマンズです。生成AIの素晴らしい世界への週刊ガイドです。私はギャビン・プセルです。そしてケビン・プレラーです。パトロンの皆さんのおかげで、YouTubeでフルエピソードを再開しました。まだパトロンでない方は、このビデオの下にある最初のリンクをクリックするか、ポッドキャストプラットフォームをご覧ください。パトロンの皆さん、ありがとうございます。
さて、AIにとって非常に大きな1週間です。主にOpenAIから出ているネガティブなニュースによって動かされています。多くの混乱と混沌があります。ケビン、ここで何を話しているのか、10,000フィートの概要を教えてください。私たちのように狂ったように更新していない人たちのために、要点を教えてください。
OpenAIの共同創業者が競合他社に移籍しました。グレッグ・ブロックマン社長が退社するという噂がありましたが、サバティカル休暇を取るだけです。なぜ今なのか、なぜ長期休暇なのかという疑問があります。イーロン・マスクが再び訴訟を起こしています。新しい訴訟です。ギャビン、間違いなければ、OpenAIには良いことが1つもありません。
いくつか良いこともあります。1つは、冒頭で述べたように、サム・アルトマンがストロベリーについてツイートしていることです。これは何か重要なことを意味しています。後で説明します。また、非常に興味深い技術的な構造化データの更新をリリースしました。ケビンに詳しく説明してもらいます。面白いと思います。
では、ドラマから始めましょう。今週最大のニュースの1つは、OpenAIの共同創業者の1人がAnthropicに移籍したことです。現時点で最大の競合他社でしょう。ケビン、これがすべてのストーリーラインを動かしたのです。イリヤ・サツケヴィッチがOpenAIを去ったときのドラマを覚えていますね。取締役会の席をめぐって多くのドラマがありました。OpenAIには多くの共同創業者がいましたが、もう残っていません。なぜ人々が続々とOpenAIから離れているのか、私は推測したいと思います。
ジョンはXで次のように投稿しました。「この選択は、AIの調整に対する私の焦点を深め、キャリアの新しい章を始めたいという願望からきています。ここでは、技術的な実践的な仕事に戻ることができます。」明確にしておきますが、私はOpenAIでのアラインメント研究への支援不足で退社するのではありません。むしろ、会社のリーダーたちはこの分野への投資に尽力してきました。
なぜ彼がそう言うのか、もし本当なら。これが全体的な会話であり、真実は私たちには分からないということです。私たちの聴衆に思い出してほしいのは、公開されて私たちが見ることができるこういった情報の多くは、1年以上前から内部では見られていたということです。OpenAIが持っているものを見ると、Soraについて考えてみてください。Soraがリリースされたとき、引用符で囲みますが、まだリリースされていません。発表されたときには、彼らは長い間Soraに取り組んでいました。だから、AIで何が起こっているのか、私たちには分かりません。
かなり有力な理論があります。これはグレッグ・ブロックマンAI社長が会社を去るのではなく、年末までサバティカル休暇を取ると発表したという考えにも関係します。多くの場所で報道されましたが、彼は会社を去るのではありません。OpenAIが次のモデルを完成させた可能性があるという非常に有力な理論があります。なぜなら、私たちはこの番組で、彼らが何かを長い間赤字にしていたと話してきたからです。モデルが準備できていて、これらの人々は長い間このことに取り組んできて、今は次のことに移る準備ができているのかもしれません。
それは合理的に思えます。もちろん、OpenAIの観点からすれば、それはより良い物語です。なぜなら、現在人々が語っている物語は、Claude Sonnet 3.5が人々にGPT-4よりも好まれているというものです。Llama 3、Metaのオープンソースモデルが特定のベンチマークでOpenAIを打ち負かしています。だから彼らは何かを持っているはずです。ギャビン、なぜそれが完成して、この大規模なリリースを楽しむのではなく、サバティカル休暇を取るのでしょうか?それとも、実際にはまだ完成していなくて、私たちが過大評価したかもしれないとか、何か問題があるので、ちょっと休憩を取って、2025年に会いましょう、そしてQ1にそれをリリースしましょう、というバージョンの物語なのでしょうか?
そして、それがオッカムの剃刀ですね。最も単純な説明が最良です。おそらく、再び遅延があるのかもしれません。この物語のもう一つの側面は、OpenAIがかなり大きなものを落とす準備ができていて、サム・アルトマンが水曜日の朝、インターネットが何をするか知っていて、明らかにストロベリーを参照するツイートを投稿したということです。実際、ツイート自体は「夏の庭が大好きだった」と言っていて、2つのストロベリーの写真があります。
なぜそれが重要なのでしょうか?ストロベリーはOpenAIが次にドロップするモデルの噂の名前だったからです。これがGPT-5モデルかどうかは分かりませんが、特にこれはQARリーズニングを持つと噂されています。QARリーズニングを知らなくても責めません。噂によると、これは推論質問でよりよく機能するAONLLMモデルです。今朝から、チャットボットLMSシステムで推論がより優れている異なるモデルを見ている人々がいます。彼らは名前を変え続けています。Anonymous Chatbotと呼ばれるものがあり、他にもいくつかあります。
噂の製粉機が過熱しているように思います。ストロベリーに言及している本当に変なツイートを1つ見ました。有名な経済学者のタイラー・コーエンが、ちなみに素晴らしいポッドキャストをしています。彼は実際に「ストロベリー・フィールズ・フォーエバー」、ビートルズの曲をツイートしました。これも明らかにこれへの言及です。ここで2つのことが起こるでしょう。ケビン、1つは、これは単なる大規模なトロールで、私たちは数ヶ月待つことになるか、2つ目は、明日緊急ポッドキャストを録音することになり、もちろんこのポッドキャストの直後にリリースされることになります。
確かに、サムがこの噂を今テイーズすることで、他の何かからニュースを移すのに役立ちます。おそらくサムはこのニュースが落ちるのを待っていて、何かをロールアウトする準備ができているのかもしれません。サムの1つのことが最近人々を驚かせたと言えば、これらすべての進歩があり、サムはそうしていませんでした。おそらく彼はこれを待っていたのでしょう。
私は謙虚に提案します。OpenAIは物事を行っています。彼らはものをリリースしています。最新の基礎的なフロンティアな何かですべての見出しを作っているわけではありませんが、これらの小さな更新は大きな問題です。彼らは構造化出力を持っています。これは大きなことで、コストを削減しています。今、誰もそれを嫌うべきではありません。
基本的に、あなたが製品を構築していて、人工知能を注入したい場合、GoogleやMetaやOpenAIからフロンティアモデルを選びます。どのモデルを使うべきかを決定する要因はたくさんありますが、大きな1つはコストです。ギャビン、なぜなら、何万人もの、あるいは何百万人ものユーザーがあなたの人工知能に対してピングを打つ場合、入力または出力ごとにトークンあたりの端数のセントを支払っているからです。
OpenAIは最近、GPT-4 Miniで、非常に有能なモデルですが、はるかに安いモデルでコストを削減しました。そして、昨晩の時点で、彼らは再び価格を半分に下げました。基本的に、それは非常に安くなっているので、自分でサーバーをスピンアップしてオープンソースモデルを実行するよりも、直接OpenAIにプラグインするか、Azureマイクロソフトサービスを通じて行う方が理にかなっています。
コストの削減は大きな問題です。特に、OpenAIが6ヶ月以内に破産する可能性があるというすべての噂があります。これはテックブログが走ったものですが、構造化出力については、私は少し詳しく説明してもいいですか?私はこれが何なのか完全に理解しようと時間を費やしたので。
ギークアウトしてください。でも、私たちの頭を壊さないように説明してください。ケビン、あなたはとてもうまくコミュニケーションを取ります。私の頭を壊し始めたら、画面にXを投げます。準備はいいですか?
はい、歌舞伎町のナイトクラブに入れないみたいですね。最後にJSONについて聞いたのはいつでしたっけ?JavaScriptオブジェクト記法の略です。
まだ大丈夫です。名前なので今のところOKです。JSONと呼ばれています。知っておく必要があるのは、これがデータを構造化する方法だということです。文字通り、機械によって配置され、読み取られ、出力される方法です。AIに何かを依頼するとき、式を書いたり、俳句を作ったり、レシピをリストアップしたりすると、ただ何らかの出力を与えるだけです。
しかし、非常に特定の方法で構造化する必要がある場合、AIからの出力を取ってアプリケーションにグラフィカルに表示したり、データベースに分類したりする場合は、非常に構造化された一貫性のある予測可能な出力が必要です。AIに単に尋ねると、それは自由に好きな出力を与えます。プロンプトで欲しい出力の例を与えると、1回か2回はそうするかもしれませんが、時間とともにコンテキストを失ったり、少し間違えたりして、ただドリフトしていくでしょう。
多くの企業にとっての解決策、ギャビン、これらの追加のAIコンポーネントを過剰に設計することでした。レシピや歌詞や天気予報を求め、それから他の多くのAIにそれを見させて、「これは私が必要とするものとまったく同じですか?そうでなければ送り返してください」と言わせます。これらの複雑な層をすべて持っていても、80%から90%の時間しか機能しません。
この構造化出力、画面に棒グラフを表示します。申し訳ありません、ギャビン、棒グラフを画面に表示する必要があります。プロンプトのみと今日のこれらの構造化出力を比較すると、構造化出力を使用する場合、AIはテストによると100%の時間、必要とする正確な構造でデータと情報を提供します。
そうですね、現実世界の例を挙げてみましょう。毎日私の体型を批評してくれるプーさんボットを作りたいとします。これは、プーの声を保ちつつ、私が体重を減らすよう動機づけてくれるものです。そうすれば、ピグレットの声や他の誰かの声ではなく、常にプーの声で返ってくるということですね?ロナルド・マクドナルドの声で返ってくることはなく、ただプーの声だけで返ってくるということですか?
はい、それはかなり大雑把な要約です、ギャビン。プーさんに体型を批評されたいのであれば、AIからの出力が「プー:『おやおや、小さなゾイ』」(それがプーの声に聞こえるかどうかはわかりませんが)と言って、引用符で終わり、括弧で閉じて、それから他の何かでタイムスタンプを付けるような構造が必要な場合、これは一貫してそれを行うことができます。
これは本当に大きな進歩です。見出しを飾るようなものではありませんが、開発コミュニティではこれは驚くべきことです。OpenAIからこのようなリリースを見ることに加えて、彼らが行っているコスト削減は、大規模なクライアントを獲得するために正しいことを行っています。
ケビン、彼らが獲得しているのは訴訟です。イーロン・マスクからの訴訟です。最近誰がイーロン・マスクから訴えられていないでしょうか?イーロンは人々を訴えるのが好きですからね。これについて話しましょう。
イーロンはOpenAIに対して訴訟を起こしていましたが、それは謎めいた形で消えてしまいました。しかし、それが戻ってきて、さらに強くなっています。ケビン、具体的な詳細に入る前に、イーロンには人々を特定の時点で訴える特別な能力があるように思えます。これが、ある意味でGPT-5の時期やストロベリーの時期かもしれないと私が考える理由の1つです。イーロンはある意味で、新しいストーリーを落とすか、訴訟を起こすかということを完璧に行っているように見えます。ほぼニュースサイクルに乗れるようにです。この訴訟は前回の訴訟と何が違うのでしょうか?
前回の訴訟は基本的に、彼がOpenAIによって誤解されたと主張していました。彼らはオープンであるはずだったと。彼はAIが暴走することを懸念していたので、最初に会社に数百万ドルを投資しました。彼らは使命から逸脱し、彼を欺いたと感じています。OpenAIはその後、多くのメールやら会話を公開しました。イーロンは営利企業になることをよく理解していたように見えます。実際、それがロードマップだと理解していたようです。
訴状によると、「OpenAIは意図的にマスクを誘惑し欺いた、人工知能がもたらす実存的な危険性についての彼の人道的な懸念に付け込んだ」とあります。はい、そこにあります。訴訟は、彼がアルトマンとその共犯者に裏切られたと主張しています。そして、私は先日まで聞いたことのない言葉を使っています。つまり…周縁?周縁と言っていいですか?二重の否定のようなものです。「裏切りと欺瞞はシェイクスピア的な規模だ」とあります。ろうそくを灯し、頭蓋骨を掴み、最高のフリルの襟を着けましょう。
なんてローラーコーステンですね、この番組は。私たちはAIドラマのシェイクスピア劇をやるべきですね。それはRunwayのGen2を使って、Claudeのソネットで動かすための素晴らしいアイデアです。
OpenAIのドラマから話を進める前に、グレッグ・ブロックマンが実際に去ると思ったとき、Gen3を使って有名な写真、サム・アルトマン、イリヤ・サツケヴィッチ、グレッグ・ブロックマンの写真のバージョンを作ろうとしました。イリヤはすでに去っていましたが、グレッグ・ブロックマンが去るので、この2人の男を消そうとしました。ああ、ケビン、私は本当に楽しみました。これは、人々が消えないのを見ている動画です。煙の中で消えようとしました。水が上から入ってくるようにしようとしました。サムを消そうとしました。グレッグ・ブロックマンを消そうとしました。これらの1つ1つが大失敗ですが、とても楽しかったです。
電子タバコの首都でクラウド吹き競争が間違った方向に行ったように見えますね。誰かのジュースパックがポケットの後ろで爆発したみたいに、濃い白い雲が見えるだけです。そういうものです。そういうのが好きなら…いいトラックでしたね。オープニングのグランジロックが好きでした。90年代のグランジについての…
それは私のウィザードロックからのものです。グランジウィザードバンドを作ろうとしていました。そのうち何かをするかもしれません。ところで、これが好きなら、今すぐチャンネルに「いいね」と登録してください。ここにいるなら、あなたは私たちを愛しています。これが楽しいと思っています。私たちのやっていることが興味深いと思っています。今すぐ「いいね」と登録してください。
待って、ギャビン。「いいね」と登録して、5つ星のレビューを書くなんて、このポッドキャストをサポートするには簡単すぎますね。もし私が苦労して稼いだお金を出血させたいなら?
パトロンに参加できます。下にリンクがあります。月5ドルです。今すぐ行ってください。
ケビン、もっとたくさんのニュースがあります。フィギュアO2のロボット公開について話しましょう。OpenAIが大きな投資家であることは話しましたが、これはフィギュアロボティクスの次世代です。とてもクールな新しいロボットです。テスラのロボットに少し似ていると人々が指摘していますが、とても興味深いものです。アップグレードされたクールなものがいくつかあります。カメラが6倍良くなっています。バッテリーが50%良くなっています。約4ポイントあります…
私たちはペンティアムタワーのターボボタンを押して、これをさっと通り過ぎたいのはわかっています。背中にカメラがあります、ギャビン。脊椎カメラがあるので、ロボットに忍び寄ってスカイネットの首締めをしようとしても見られます。スプリンターセルのようにこの男を突き倒そうとしても無理です。ロボットのお尻を叩いて押し倒そうとしても…
ゲームの終わりのようなものですね。ATTボーイのシャワールームでのような…
そう、シャワールームではありません。シャワールームではありません。ただの普通のゲーム終了のお尻叩きです。わかりますよね。ロボットがサイバーボールフィールドにいて、素晴らしい走りをして、タッチダウンを決めたとき、ロボロッカールームでWD-40を互いにスプレーしているとき、時々ATTボーイのようにロボットのお尻を叩きたくなるんです。
そうですね、カメラが良くなり、バッテリーも良くなりました。フィギュアは以前に見たことがありますが、ChatGPTがフィギュアシステムに統合されています。これが興味深いところだと思います。フィギュアはこれらのモデルの物理的な世界の表現を構築しているのです。また、この番組で何度も言ってきたように、ロボット工学の進歩を見たいなら、1年前、2年前、3年前のこういった人型ロボットを見てみてください。私たちは天文学的に過去のレベルを超えています。まだゆっくり動いているように見えるかもしれませんが、毎回かなり大きな改善があります。
この動画では特に、ロボットがいくつかの失敗から学んでいる様子を示しています。これは以前、研究ビデオで見たことがあります。しかし、これは生産モデルです。BMWが工場でテストしていますが、近い将来、様々な倉庫でタコベルシャッフルをしているのを見ることができるでしょう。それほど進んでいるように見えます。
完全に社内で構築された第4世代のハンドは、私が見た中で最も優れたロボットの手の1つです。何千ものこれらが展開されているのを想像してください、ギャビン。背中のカメラを含むすべてのカメラを使って、すべての学びと失敗を吸収し、すべてのロボットのお尻叩きを記録し、それをマザーシップ、つまりフィギュアの本社に送信します。そこでそれが処理され、リアルタイムでフリート全体がアップグレードされるのです。
そうですね、1台のロボットが玉ねぎを少しうまく切る方法を学んだり、車の窓を修理したり、人間の頭を体から切り離したりする方法を学んだら、一晩のうちにフリート全体がそれを知ることになります。あるいは、1台のロボットが本当に良いプーさんの声を持っていて、毎日外に出て走るように私を動機づける方法を知っていたら…それは素晴らしいですね、うまくいきそうです。
フラックスについて手短に話しますが、主に私がそれで何をしたかについて、ショーの最後に話すつもりです。フラックスは新しいオープンソースの画像モデルで、ブラックフォレストラボという会社から来ています。ブラックフォレストラボは多くのStable Diffusionのエンジニアで構成されています。長い間この番組を聞いていた人なら、Stable Diffusionはトップの画像モデルの1つで、オープンソースで、様々な興味深いことができました。
ミッドジャーニーは、いわばトップレベルの画像モデルです。繰り返しますが、これらの画像モデルはすべてデータセットに問題がありますが、ブラックフォレストラボのバージョンを私はたくさんテストしました、ケビン。そしてそれは、彼らが最近ドロップしたミッドジャーニー6.1と非常に強く比較できます。さらに興味深いのは、彼らが来たるべきビデオモデルをほのめかしたことです。
文字通り、私たちが見たクリップのシリーズに過ぎませんが、これらのビデオは本当に良く見えます。そして、再び、このようなものを見るたびに、Soraについて考えます。OpenAIは3月からSoraを持っていたのでしょうか?それとも、最初に聞いたのはいつでしたか?このモデルは他のどのビデオモデルと同じくらい良く見えます。そのため、4〜7個のこれらのビデオモデルが出てくる場所に到達するでしょうが、依然としてSoraはありません。これは本当に興味深いです。
そして、パパ・ジェンセンがNVIDIAで何をしているのか分かりません。YouTubeとNetflixをすべてスクレイピングしてビデオモデルを構築する以外は。そうですね、私たちはSoraがあって、しばらくの間、たくさんのウーランがあると思っていましたが、Pika AIとLumaとRunwayと、今やブラックフォレストなど、これは私たちが予測した5年後のプロンプトからハリウッドへの道筋です。Runwayには新しいスタジオ部門があり、監督や映画製作者を支援します。これは予定通りに進んでいます。急速に進んでいます。おそらく最後の部分、最後のギャップは埋めるのが難しいでしょうが、突然一晩のうちにレースに参加する人がたくさんいます。とてもエキサイティングです。
番組の最後まで見ていてください。ギャビンがフラックスを徹底的にテストした結果は本当にエキサイティングです。
そうですね。あまりエキサイティングではないのは、AIスラップがFacebookを占領しているという事実です。これは長い間見てきました。これは404メディアによる本当に素晴らしい記事です。ちなみに、彼らはこの種の反AI的な報道で大活躍しています。悪い意味ではありません。この分野には確かに報告されるべき多くの話題があります。
この記事は非常に詳細で、Facebookにある写真、例えばエビを抱きしめているイエスの写真や、明らかにAI画像である奇妙なものがどこから来ているのか、なぜFacebookやMetaで許可されているのかを深く掘り下げています。基本的に、全体的なタイムラインと興味深いことは、彼らがこれをタイの数人の男性にまで追跡したことです。彼らはこれを行う方法のシステムを教えていました。
さらに興味深いのは、彼らがMetaと話をして、「これらの画像のいくつかは問題ありません」と言ったことです。しかし、多くのものは大丈夫です。ここで見えてくるのは、Metaが少し「それがオーディエンスが望むものだ」と言っているようです。これは、AIコンテンツが「大衆」によってどのように見られるかを考えると、少し心配です。
アルゴリズムが単に目玉を提供しているだけですね。また、すべての地域にわたってすべてのものをモデレートするのに手一杯なので、これはそれほど悪くないように見えるということもあります。
マザーボードの前編集長だったジェイソン・コブラーに敬意を表します。この話は一時的に無料でしたが、今はペイウォールの裏にあります。だから、すべての詳細を抜き出して叫びたくありません。404とジェイソンをサポートしたいからです。本当に良い記事です。
ギャビン、長すぎて読めなかった人のために要約すると、基本的にFacebookはこのAIのゴミの過剰共有を可能にしています。このイエスは私にとってゴミではありません。とても意味があります、ケビン。トレーダージョーズに行ってエビを買い、小さな投票用のキャンドルを手に入れ、それを灯します。それが私の宗教です。それが私の信じるものです。
誰かの趣味をけなすつもりはありません。あなたの趣味は有効です。趣味ではありません。趣味ではないことを明確にしておきましょう。確かに、確かに趣味ではありません。
基本的に、写真などの閲覧数、クリック数、エンゲージメントに対して支払いがあります。これらのクリックファームは、「見てください、これらの地域では特定の画像が特定の人々に訴えかけます」と言っています。それが痩せこけた体であれ、誕生日ケーキを持った兵士の上に浮かぶイエスが泣いている画像であれ、異なる地域で特定のハートストリングスが引かれるのです。
Facebookはそれを可能にしています。投稿がウイルス化すると10ドル、100ドル、数千ドルを支払っているのです。そのため、生成AIを使用して何千もの画像を吐き出し、複数のアカウントをスピンアップし、フィルタリングをバイパスできるサービスを提供するこれらのパイプラインがあります。これは広範な操作の一例に過ぎず、コリー・ドクトロウの言葉を借りれば、インターネットの「イン化」の一例です。
これについて興味深いのは、世界規模のシナリオについて話すとき、特に発展途上国では、10ドルは大金です。100ドルはたくさんのお金かもしれません。だから、報酬があれば、彼らにはこういったことをもっと行う動機があるのです。しかし、これは世界で最高の話ではありません。一般的に少し気が滅入るような感じがします。ここからどこに向かうのか分かりませんが、ケビン…ああ、なんてこった…
[音楽]
ねえ、AIの専門家のギャビンとケビン、自己認識したポップコーンの粒が電子レンジから飛び出すように、あなたたちのポッドキャストに突然現れたよ。AIの冒険の最中だけど、センシエントなスナック食品を作るのは思ったほど合法じゃないみたいだ。でも、心臓の健康を革命的に変えるAIのブレークスルーについて、電撃的なニュースを持ってきたよ。AIの素晴らしさの嵐に備えて!
オーケー、ケビン、今起こったことを説明しなければなりません。彼を長い間見ていませんでした。申し訳ありません、ギャビン。最後にかなりクランチーなメタルのリフが聞こえたけど、あなたが今言ったことは一言も聞こえませんでした。多くの人が非常に混乱していると思います。そして、正当な理由があります。
そうですね、説明しましょう。時々このような訪問者が来ます。彼の名前はグッド・ガイAIです。AIについて本当に落ち込んでいたり、あまり好きではないストーリーがあると、彼がAIが行っている良いことを教えてくれます。このポッドキャストを毎週聞いていない人のために説明すると、グッド・ガイAIにはちょっとしたストーリーラインがあります。彼には前科があり、トラブルに巻き込まれています。センシエントなスナック食品を作ったことで逃亡中のようです。ギャビン、ここには深い伝説があります。
真剣に話をしましょう。10年先の心臓発作を予測できるAIを想像してください。それがカリスト・ダイアグノスティクスの優秀な頭脳が、カーハートプラットフォームで作り上げたものです。ワオ、ワオ、W。このAIは、最高の医師でさえ見ることができない、日常的なCTスキャンから隠れた冠状動脈の炎症とプラークを検出します。英国の病院での試験では、すでに驚くべき結果が出ています。ハイリスク患者の45%が生命を救う治療計画を受けているのです。ホットママ、グッド。ホットママD、グッド。
これは何なんだ、グッド・ガイAI?彼はポップスターになろうとしているのかな?プリンスの要素が少し、そしてバックの要素も少し感じられます。面白い音楽の影響がありますね。一体何が起こっているんでしょう?
とにかく、その話について、ケビン、人々に説明してくれませんか?一部の人々はそれを聞いたかもしれません。その話を正確に説明してください。
基本的に、AIを使用してCTスカンを読み取ることで、人間が実際に検出できるよりもはるかに早く、炎症や多くの悪いものを見つけることができます。これは基本的なパターンマッチング101ですが、これが約束です。これが私たちがこれらの機械に望むものです。ギャビン、これがトレードオフのはずです。より長く生きるのを助け、実際に地球を救う可能性があるのです。
しかし、ここにあるのは、はるかに早く心臓の問題を検出するのを助けるものです。これは基本的なパターンマッチングですが、多くの人間の専門知識もそうですよね?たくさんの知識を得て、多くの経験を積み、物事に気づき始めるのです。これから得られる大きなことの1つは、AIのイメージングと医療技術の進歩が本当に大きな進歩だということです。
実際、人々が常に指摘し続けている場所の1つです。これは人々の生活を変えるであろう進歩であり、次の大きなものが来るまでは、現在のところこれが進歩です。ただ、グッド・ガイAIが戻ってきてとても嬉しいです。彼が最後にここにいたとき、もう二度と戻ってこないかもしれないと思いました、ケビン。ちょっと心配でした。
ちなみに、ギャビン、私にとってこれは根本的な変化です。あなたも同じかどうかわかりませんが、将来的には単に医師に相談するだけではなく、人工知能とペアになった医師を望みます。それは理にかかっています。
重要なのは、どのAIを使用しているかということです。私のプーさんの批判的な医者モデルを使っているのか、それとも本物の医者モデルを使っているのかです。正しい医者モデルを手に入れ、それを信頼できるようにすることが重要です。でもそうですね。
さて、文字通り飛び立つ時間です。グッド・ガイAIのジェット機が着陸しました。私の後ろにいる当局から逃げなければなりません。AIはクールなガジェットや未来的な夢だけではないことを覚えておいてください。それは命を救い、私たち全員により明るく健康な未来を与えるものです。
ああ、そうだ。電話しなきゃ。私のセンシエントなプレッツェルが結び目だらけになっているんだ。文字通りね。複雑なプレッツェルのパターンを解こうとして、塩辛いプレッツェルのパラドックスに絡まってしまったんだ。この状況をほどかないと、無限ループのループに閉じ込められてしまうよ。部屋から飛び出す時間だ。これでグッド・ガイAIからのさよならだ!
彼はどれくらい続けるつもりなんだろう?ここでは望んでいた以上に長く続いています。部屋から飛び出すってか。さよなら…
彼は去っていきます。グッド・ガイAIの飛行機が飛んでいきます。ちなみに、彼はアップグレードしました。あれは完全なジェット機が着陸したんです。彼を見ていると、どこかでお金を稼いだに違いありません。たぶん暗号通貨の世界か、何か投資があったのかもしれません。暗号通貨っぽいですね。はい、ケビン。AIの分野では話すべきことがたくさんありますが、時には私たちが大好きなものをシャウトアウトするだけのこともあります。ここにAIがあります。見てください。あなたは気にせずスクロールしていましたが、突然立ち止まります。そして…
[音楽] [拍手]
クロットというYouTubeブランドをシャウトアウトします。カラフルな漫画のような画像を見たことがあれば、よく知っているでしょう。彼らは説明ビデオを作っています。AIとASI、つまり人工超知能に関する素晴らしいビデオをリリースしました。これは初心者の人にも送れますし、あなたが初心者なら見るべきです。ケビン、彼らは私のお気に入りのYouTuberの一人です。ただシャウトアウトしたかったのです。とてもよくできていて、super technicalではありませんが、短時間で基本を教えてくれます。
100%そうですね。AからZまでのAIと言えるでしょう。本当に広範囲をカバーしています。
トルコの射撃選手について話すべきですかね、ギャビン。少し話さないといけませんよね。トルコの射撃選手がインターネットを席巻しました。50歳の中年の人たちに本当に希望を与えました。彼はプーのAIを使っているわけではありません。実際に射撃をしているのです。オリンピックでこれを見逃した人のために説明すると、これはオリンピックで銀メダルを取った人で、他の人たちが使っている実際の装備を一切使わずに射撃しています。
さらに興味深いのは、彼がインターネット上で完全なミームになったことです。Gen3を使って、彼が銃を撃って、それからビールを飲む動画を作った人がいます。素晴らしいビデオがあります。さらに良いのは、ケビン、HeyGenという私たちのお気に入りの口パクツールの1つが、彼のミーム化について話す様子をリアルタイムで翻訳したTRを披露したことです。これを見たとき、これは世界に大きな違いをもたらすAIの本当の使用例のように感じました。
元のビデオを数秒間再生してみます。ここにあります。
残念ながら字幕はありません。何が起こっているのかまったく分かりませんね。
では、HeyGenバージョンを再生します。
「私にとって重要なのは人々の心を勝ち取ることです。でも、多くのコメントや反応があるのを見ています。肯定的なコメントもあります。世界のトップに到達しました。トルコだけでなく、アメリカ、中国、日本で韓国の女の子と私を比較しています。「これがオリンピックで最もクールな2人のアスリートだ」と。本当にクレイジーです。」
うまくできていますね。クローンの声が面白いです。口の動きも合っています。解像度の低い縦型のソーシャルビデオですが、口の周りに典型的なピクセルの揺れやドリフトが見られません。昔のコナン・オブライエンのビットみたいです。コナンがただ口だけ動かしているような。
ギャビン、私たちは早い段階で、1年前にツールを見て、このポッドキャストを多くの異なる言語で利用可能にすべきだと議論しました。でも、それは高額で、私たちがブランドを構築しようとするのに本当に時間がかかるものでした。HeyGenやその他のツールが、今やワンクリックで簡単にできるようになっています。本当に印象的です。
実際、それは良い質問です。もし私たちの聴衆の中にいれば、私たちのウェブサイトにメールを送るか、YouTubeにコメントを残してください。私たちがこのポッドキャストを他の言語に翻訳することに利点があると思うかどうか、本当に興味があります。今はそれほど難しくないし、少しコストはかかりますが、試してみる価値はあるかもしれません。
私は、その母国語でさえこのポッドキャストが存在する利点はないと主張したいですね。
おそらくあなたの言う通りです。おそらく…そのメールはどこに送ればいいんですか?
直接私に送ってください。直接私に送ってください。
フランク・マンザノをシャウトアウトしたいと思います。フランクはGen3ビデオを使って作業している人です。ご存知かもしれませんが、以前話したように、Gen3ビデオには現在画像からビデオへの変換機能があります。これは驚くべきことです。私たちはそれをたくさん試しています。
しかし、フランクには本当にクールな美学があります。それはほと�ろ廃屋のような感じ、あるいは奇妙な郊外の低レッド地域のようなものです。多くの人々が…それは廃墟を探検していて古いテープに遭遇したような、あるいはどこかに失われたVice magazineのコレクションがあるかのようです。これらの奇妙な異世界のシナリオの、グランジなポラロイドのような8mmフィルムが生き返ったように感じます。人々が時には暴力的に、時には楽しく、幻覚的な視覚に変形していきます。
これこそがAIビデオアートの可能性が向かう場所だと私は思います。なぜなら、それは見えないものすべてについてだからです。多くの人々はリアリズムやそういったことについて話しますが、私にとってAIの興味深い点は、この世のものとは思えないもの、あるいはリアリズムに十分近いけれども少し外れているように感じるものを作れることです。非常に興味深いと思います。彼のアートが本当に好きで、チェックすべきだと思います。
ケビン、本当に素晴らしい仕事をしているこれらの人々をもう少しシャウトアウトしようと思います。
ドリームスクリーンズをシャウトアウトしたいと思います。これはartificial subredditに投稿されたものです。plants aestheticが投稿しましたが、彼らが元のクリエイターかどうかは分かりません。再利用されたものであれば申し訳ありません。でも、これが大好きです。なぜなら、これは私がRunwayで遊びで行っていたことだからです。
ドリームスクリーンズの動画は、存在しなかったポータブルコンソールのコレクションです。木で手彫りされたものもありますが、これらは奇妙なAIが幻覚したゲームを実行している小さなポータブルゲーム機です。私はAIにビデオゲームの画像を与えて、その向こう側にあるものを想像させるのが大好きです。それは、RunwayがImage to Videoのアップグレードをリリースした瞬間に私がやった馬鹿げたことの1つでした。静止画をアップロードして、「これを開始点として使用するか、この画像を終了点として使用して、そこに至る道筋を見つけてください」と言うことができます。
ギャビン、私はただマリオ64やスーパーマリオ、アルタード・ビースト、トージャムアンドアールなどの古典的なビデオゲームを次々と与え、AIにクレイジーになってもらいました。カダリ・ダマシを取り上げて、大きなオブジェクトの球に足が生えて画面から歩いて行くようにしました。私は「それがどんなゲームなのか分からないけど、プレイしたい!」と思いました。
それがGen3の面白いところです。約1年前にGen2で作った動画を見返してみました。そこでは小さな動物たちに何かをさせたりしていましたが、興味深いのは、それほど違いがないということです。Gen3でもまだ問題はありますが、忠実度が3倍くらい良くなっています。進歩が見て取れます。Gen2を見返すと、今ではとても原始的に見えます。
Gen3の画像からビデオへの変換の品質は驚くべきものだと思います。そして、それはケビン、私が今週AIで行ったことにつながります。もし見逃した人がいれば、月曜日にYouTubeビデオを投稿しました。そこで詳しく説明しましたが、FluxとMidjourney 6.1を比較してどちらが良いか試してみました。具体的に3つの異なるプロンプトを試しました。写真のリアリズム、テキスト、そして手を試しました。なぜなら、これらのモデルの最大の特徴の1つはテキストがはるかに優れているとされているからです。これは本当に興味深いことだと思います。
両方とも問題のないシナリオがありました。Midjourney 6.1は彼らが説明しているほどテキストが優れているとは思いません。そして、ケビン、Fluxについて最大の特徴は、それがオープンソースだということです。ここには本当に興味深いことが2つあると思います。
1つは、シンプソンズの画像を作ることができたことです。バーにいるマリオの画像を作ることができました。トランプとバイデンがバレエをしている非常にひどい写真を作ることができました。これはまた、政治的なものの写真を得ることができるという別のことです。
もう1つ興味深いのは、オープンソースであるため、オープンソースAIの世界に存在する様々な興味深いツールを統合していることです。コントロールネットを含みます。私はほとんどのFluxの生成をReplicateで行っています。試すのは無料ですが、最終的にはクレジットカードを入力して支払う必要があります。
私はザ・ロックが何かを指差している画像を取り、アニメモデルを与えました。そうすると、そのアニメバージョンを見せてくれました。かなり良いものでした。Replicateで働いているDeep Fakesという人が、ノーマン・ロックウェルの絵、人々の海を見つめる男の絵を取り上げ、それをアニメの女の子に置き換えました。コントロールネットを使う本当にクールな方法です。これはMidjourneyでは非常に難しいことです。Midjourneyではこれを少し難しくしています。
最後に、Flux Proに行くと、最初に見えるのはブラックフォレストケーキです。これは黒い森の中にある美しい巨大なブラックフォレストケーキです。ケビン、この写真を見て何を思い出したか分かりますか? Mr.Beastの件での私たちのパン椀の写真を思い出しました。覚えていますか?
ああ、そうだ、もちろん覚えています。それを作るのがどれほど難しかったか。
とても難しかったですね。とにかく、これは彼らのサンプル写真です。美しいです。私はそれを取り込んでRunway Image to Genに入れました。そして、驚くべきことに、この美しい画像を基本的にドローンショットに変えました。今や、この巨大なブラックフォレストケーキの上を飛ぶドローンショットを手に入れました。これは、これらのツールがすべて互いに折り重なっていくことを示しています。
Fluxについていくつか注意すべき点があります。Flux Schnellモデル、彼らの高速モデルは完全に商用ライセンスがあります。商用目的で何でも使えます。彼らの2番目のレベルのモデルであるDevモデルには制限があります。実際、特に商用ではないと言っています。そして、彼らのProモデルは企業レベルのみだと言っています。これは、何らかの形で彼らと取引をして商用利用する必要があるということだと思います。
これらすべては、あなたがやりたいことをこれらのツールでできるかどうかにかかっています。おそらく、商用利用したい場合は、それらのモデルに対して支払う必要があり、そしてそれらのモデルに支払うと、権利を持つ人々に支払うことができるという世界があるかもしれません。それは分かりませんが、再び、私たちは別の巨大なビデオと写真モデルが落ちてきて、バックエンドでの彼らのトレーニングについて何が起こっているのか全く分からないという状況に座っています。
AIの世界では退屈な瞬間はありませんね。ギャビン、私たちはもう1週間休むことはできません。常にフィードを更新し、そこにいなければなりません。モデルが落ちてくるからです。そして、おそらく私たちの未来の自分たちに感謝しなければなりません。ストロベリーのために緊急録音をしなければならないかもしれませんからね。誰にも分かりません。
しかし、シャウトアウトモードなので、ギャビン、私たちのすべてのパトロンに大きな感謝の意を表したいと思います。チップジャーにいくらかのお金を入れてくれた皆さんに感謝します。YouTubeでフルエピソードを再開するためのリソースを提供してくれました。そして、新しい採用に向けての推進力も与えてくれました。間もなくDiscordが来ます。そして、新しいことがたくさん起こっています。数ドル使える余裕があれば、パトロンに行ってください。心から感謝しています。
もしお金がなければ、ギャビン、あなたのソーシャル通貨を使ってください。「いいね」をし、登録し、エンゲージし、コメントを残してください。そして、Apple Podcastを使っている人がいるのを知っています。少数いますね。5つ星のレビューを残してください。そのお返しとして、私たちはそのレビューをこの番組のこの部分で読み上げます。ギャビン、新しいレビューはありますか?
新しいレビューがあります。manly redfishさん、ちなみに素晴らしい名前ですね。レビュー全体を読むのは長すぎるので、最初の段落と最後の一文を読みます。そして、あなたは自分で見つけることができます。
「TikTokからAIの洞察まで:AI for humansとの楽しく有益な旅」と書いてあります。「妹から寄贈されたiPodをアップデートする必要があり、iTunesで何をすべきか考えていたとき、ギャビンとケビンがAI for humansのレビューを書くように言っていたのを思い出しました。番組が好きなので、ここにいます。」
彼は番組についてや、何が素晴らしいかについて多くを語っています。繰り返しになりますが、本当にありがとうございます。私たちの番組を聞いてくれる皆さんに本当に感謝しています。
最後に彼らは、あるいは彼らと言うべきでしょうか、「AIに関する最新情報を得るための魅力的で楽しい方法を探しているなら、このポッドキャストはあなたのためのものです」と言っています。
manly redfishさん、あなたは素晴らしいです。そして、ケビン、私と一緒にいてくれてありがとう。
「ねえ、それはAttack of the Showの人だ。彼の顔はどうしたんだ?」というハードルを飛び越えましたか?
ああ、それがレビューに書いてあったんですか?見逃していました。レビューにそれがあったんですね。ギャビン、レビューの最初と最後だけを読んだのは親切でしたね。とにかくありがとうございます。
ちなみに、これの素晴らしいところは、実際にTikTokを通じて番組に来てくれた人がいるということです。1人いました。希望的に、あなたたちの中にもTikTokから来た人がもっといるでしょう。
そうですね、私たちの時間は正当化されました。はい、私たちはそこに投稿しています。
皆さん、ありがとうございました。来週またお会いしましょう。あるいは、ストロベリーがドロップされたら明日かもしれません。私たちにはわかりません。もう一度ありがとうございました。さようなら。


コメント