OpenAIのSora 2:メディアの未来かAIスロップの黙示録か?

OpenAI・サムアルトマン
この記事は約54分で読めます。

本動画は、OpenAIが発表した動画生成AI「Sora 2」の衝撃的な進化と、それがもたらすメディア業界への影響について詳細に解説している。Sora 2は高品質な動画生成に加え、音声も同時生成し、特に革新的なCameo機能によってユーザーが自分のアバターを作成し、他者と共有できるソーシャルネットワーク的側面を持つ。この機能により、ユーザーは自分の顔を使った動画を簡単に生成でき、友人同士で互いのアバターを使った創作が可能になる。一方で、SpongeBobやSouth Park、ポケモンなどの著作権キャラクターが容易に生成できてしまう問題や、AIスロップ(AI生成による低品質コンテンツの氾濫)への懸念も浮上している。ホストたちは自身のスタートアップ「And Then」のローンチも発表し、AI生成ツールを活用した制作プロセスの効率化と、人間の創造性が依然として不可欠である点を強調している。

OpenAI’s Sora 2: Future of Media or AI SLOPOCALYPSE??
Sora 2 is a remarkable piece of AI technology! Sora 2 is filling the world with AI slop! Both of these might be true as ...

Sora 2がインターネットを席巻

Sora 2がインターネットを席巻し、サム・アルトマンが私たちのスタジオを爆破しました。ようこそ、ギャビン。すみません。ネタバレですが、実際には起こっていません。私が巨大な魚とロマンチックなイブニングスケートをしたわけでもなければ、ダークチャウダーを吸ったわけでもなく、無料テレビセットを販売して逮捕されたわけでもありません。

これは全部ケビン、あなたがSoraでCameoを公開したせいですよ。そしてごめんなさいギャブ、私は今、中国のスニーカートークでトレンド入りしています。ニーハオ、ケビン。新しいCameo機能がどのように友達やAIとのやり取りを変えているのかお見せします。また、カートマン、ポケモン、そしてOpenAIが所有していない知的財産に関する厄介なIP問題についても取り上げます。人々がこの夏にあらゆる奇妙なことをしています。

やばい、光ってる。普通じゃないぞ。クラビーパティを焼きすぎたかもしれない。三人の親友が走って逃げる。俺のクラリネットは有酸素運動用じゃないんだ。そして彼らは揚げられそうになっています。それにギャビン、私たちの小さなスタートアップが世に出ましたよ。

そうです。And Thenの誕生、それで何ができるのか、そしてAIを使って私たちがこれまで作ったどんなものよりも遥かに速くこの非常に奇妙なローンチトレーラーをどうやって作ったのかをお話しします。私たちはインタラクティブエンターテイメントの未来、And Thenを構築しています。すみません。私たちはClueyのローンチビデオに出ているんですか?違います、ケビン。これはAnd Thenのローンチビデオです。

面白い事実ですが、Sora 2は使っていません。でもどうやって作ったかお見せします。そして将来的にはおそらくSora 2を使うでしょう。それ以外にもたくさんあります。AI for Humansで。

子猫たち?なぜ子猫がいるの?天井が落ちてくる。これは狂ってる。番組は終わったと思う。でも史上最高のイントロだったね。彼らは私たちの仕事を奪うつもりなのかな?

皆さん、AI for Humansへようこそ。AIの世界への毎週のガイドです。今週、ケビン、一つのストーリーがすべてを支配していて、私たちはそれについてたくさん話すつもりです。Sora 2がリリースされました。これはOpenAIです。本当にクレイジーです。とてもクレイジーで、私たちはこれについて深く掘り下げなければなりません。言葉にするのも難しいくらいです。でもこれは変革的な瞬間で、初めてV3が登場したときのようなものです。他の瞬間のようなものです。私が言うなら、何よりも40 image genのようなものです。それくらいのインパクトがあります。

Sora 2とは何か

まず最初に、これが何であり、何をしているのかを説明しましょう。そしてこれができることとその行き先、そしてどう配信されるかについて、私が信じる深刻な文化的影響について掘り下げていきます。でもまずケビン、基本的なことを理解しましょう。基本中の基本は何ですか?

分かりません、ギャビン。私は頭に猫を乗せたフィギュアスケーターが氷上でスピンしているのを見ています。注意を払えません。分かります。Soraについて、OpenAIは動画生成モデルを持っていました。永遠に前のように感じます。彼らは最初にシーンに登場し、人々を「ちょっと待って。これは非常に違う。これは素晴らしい」と言わせました。

そしてその後、彼らは最長の間オスラムのような存在になりました。会社の後に会社がこれらのモデルをリリースしている間、みんなが「ねえ、Sora、どうしたの?音声がない。キャラクターの一貫性がない。物理学、つまり世界の物理的理解が完全にずれている」と言っていました。そして彼らが完全に切り捨てられたとは言いたくありません。なぜならSoraには活発なコミュニティがあったからです。でも他のすべての会社が得ていた、いわばバイブスやハイプと比べると色あせていたと思います。Runway、Google、特にV3。

そしてV3が登場したとき、「ああ、SoraはOpenAIのバックバーナーに置かれた。彼らは気にしていない」という議論がありました。そうです、これがSora 2です。そして明確にしておくと、日付を調べました。誰も使えるようになる前の最初のSoraのドロップは2024年2月14日でした。つまり18ヶ月前のことです。

世に出たとき、Sora 1はそれらのクリップで見たものと比べてかなり期待外れでした。そしてそれがあなたが話していることの一部だと思います。でもここにSora 2があります。あなたの指摘通り、これはV3のようなものです。クリップを取得すると、それに音声が付いてきます。そして音声はかなり良いものになり得ます。人々が歌っているクリップがあります。本当に興味深いアーカイブ映像のクリップがあり、これから掘り下げますが、アーカイブ映像のように聞こえます。

ギャビン、マシンから完全にライセンスされた音楽が出てきます。たとえあなたが求めていなくてもです。Stranger Thingsのテーマはどうですか?それにもすぐに入ります。もう一つあなたが指摘したのは物理学です。物理学は遥かに良くなっています。そしてこれはOpenAIのライブストリームを見ると分かりますが、Bill Peeblesや他のSora 2に取り組んだ人々と一緒に行ったもので、彼らはこれがまた別のワールドシムの一つであり、V3が設定したものと同じ種類のものだと長い間話してきました。

実際、本当に興味深いことですが、ちょっとした余談として、V3が先週ドロップしたのは、これらのワールドシムやビデオモデルが、彼らがプログラムしなかった創発的な物理学を実際に持っているかもしれないという考えについての論文でした。そしてこれはその別の例です。とにかく、長い話を短くすると、非常に良いビデオ生成です。10秒が得られます。

通常出てくるクリップの解像度はかなり低解像度ですが、今のところそれほど重要ではないと思います。より高解像度にするオプションが得られると確信していますが、ケブ、ここで最大のことは、そしてこれが秘密のソースだと思いますが、このCameo機能です。これについて、これが何を意味するのか、そしてAI動画のアイデアをどう変えるのかを話さなければなりません。

革新的なCameo機能

はい。これはもう一度言いますが、このポッドキャストの音声版のみを聴いている方は、今週のYouTubeをチェックすることを強くお勧めします。非常にビジュアルが重要だからです。進行しながら物事を説明するために最善を尽くしますが、全体を聴いてください。また、音声リスナーの方も今すぐあきらめないでください。音声コンテンツもたくさんあります。聴き続けてからYouTubeを見に行ってください。あきらめないでください。これを完走するよう努力してください。

スロッグかもしれませんが、これはあなたの耳のためのAudibleウルトラマラソンです。最後まで到達してください。耳のためのラッキングのようなものです。これは二重の意味があります。まず、Soraですが、ビデオモデルがどれほど優れているかは過大評価できません。多様性、スタイル、最先端です。エミュレートできます。

このものが、Twitchの長時間ゲームプレイからYouTubeチュートリアル、80年代のインフォマーシャル、警察のGoPro、ボディカメラ映像まで、あらゆるものでトレーニングされていることは明らかです。これはあなたが投げかけることができるほぼすべてのスタイルをエミュレートできます。音声付きで。音声付きで。ギャビンが言ったように音楽付きでやってくれます。

しかし2番目のことは、あなたが言ったように、このCameo機能ですが、それはソーシャルネットワークです。そして私たちはこの番組で、2週間前だったと思いますが、ギャビン、話しました。「誰もこれを望んでいない。誰も別のソーシャルネットワークを必要としていない。誰もAIソーシャルネットワークだけを望んでいない」と言いました。しかし違いを生むのは、実際にはこのCameo機能です。

Sora 2、今アクセスできる場合、この録音の時点では、まだ招待制です。必ずAI for humansをフォローしてください。私たちのXハンドルです。なぜなら招待を配布するからです。一つあげます、ギャビン。あなたが?今は配る分を持っていませんが、配布します。そのためにフォローする必要があります。まあいいでしょう。招待制です。

入って、Sora 2をアクティベートすると、生成されたすべてのビデオのTik TokやInstagramのリールスタイルのフィードが表示されます。ワンタップでリミックスして、そのビデオの独自バージョンを作成できます。これは非常に強力です。ミームまでの時間を増やしています。リミックスがあって、それから非常に素早くCameoがあります。これについては後で大きな議論をしますが、基本的に自分のアバターを苦労なく作成できます。

本当に楽々とです。そしてそれをソーシャルネットワーク全体と共有でき、今や火遊びをしているようなものです、彼らが言うように。Soraをロードすると、ビデオを作成しようとするときに、いくつかのCameoが自動提案されることに気づくかもしれません。これらは他の個性、他の本物の人間であり、彼らの肖像を譲渡したか、基本的にあなたに彼らをいじる許可を与えた人たちです。

アバターを作成するとき、カメラから自撮りをします。基本的に、これはiOSアプリ内です。そして通常、3つの数字の一連の数字を唱えるように求められ、その後上、下、左、または右を見ます。私はここで数字を唱えません。念のため。そしてあなたが知っているかもしれないので、ここで頭の動きはしません、ギャビン。

分かりません。しかしほぼ瞬時に。つまり、おそらく2分の処理時間です。とても速いです。映像をクラウドにアップロードします。あなたがあなたであることを確認します。また、服を着ているかどうかも確認します。ギャビン、どうやって知っているかは聞かないでください、でもそれは確認します。そして完了すると、Cameo、つまり個人アバターを自分だけのものにするか、友達用にするか、全世界に公開するかを完全にコントロールできます。そしてあなたと私は両方とも病人なので、私の最初の選択は全員だったと思います。あなたも同じだと思います。

これについては後で説明します。もう一つ言いたいのは、アプリでこの機能について本当に天才的なのは、誰かをメンション(@)するとき、文字通り私たちが今すべてのソーシャルネットワークで慣れているようなものです。ビデオの生成で誰かをメンションすると、その人のものが引っ張られます。

さて、ケブ、この機能を他の場所でも以前見たことがあると言いたいですが、それは常に写真をアップロードしてから他のすべてのことをしなければならない状況でした。そしてまた、これについて魅力的なのは、Cameoを作成することで、あなたが許可すると言った人々にあなたの暗黙の許可を与えているということです。したがって、彼らはこの人の権利について心配する必要がありません。

そのため、これまでよりも遥かに多くの本物の人々の映像の母集団を見ています。そしてそれは、まず第一に、このようなネットワークに組み込むアイデアとして、驚くほど賢いことです。なぜなら、それは人々を引き込むからです。友達を引き込みます。友達グループを引き込みます。

しかし、また、それは個性についての、そして私の映像を使用する権利があるかどうかについてのいくつかの厄介な問題を本当に回避します。なぜなら、あなたがそれをやったなら、そして再び、私たち両方がやりました、そして私はあなたと私は、明らかに多くの人々が決してこれをやりたくないであろうプライバシーのことがあると思いますが、一度やったら、この奇妙なマルチバースの一部になることを許可する扉が開きます。

おそらく1年半、おそらく2年前にこのポッドキャストで奇妙な未来について話しました。子供たちがRoblox、Discord、Disney、Comcastコアサーバーに集まります。それがすべて一つの会社になるからです。そして彼らは「今夜何をすべきか?」と言います。そして彼らは一緒に旅を幻覚し、これが私がプレイしたいキャラクターで、これが私がプレイしたいものです。

そして彼らはサンドボックスのおもちゃのように物事をまとめて魔法を作ります。そしてこれは、私が今スクロールしてフィードを見て、他の人が彼らのドールハウスで人形のように私と遊んでいるのを見ているとき、私が持っているその未来の最初の感覚のようなものです。そしてそれについて言えば、実際に私が持っている腹話術師の人形としてあなたのビデオを作った人がいます。これを見せます。これについて言いたいことの一つは、実際にはケブ、これを再生してください。私はこれをかなり早く作りました。

これは私の最初のCameoの例の一つでした。完璧ではありませんが、私が歌っているものを再生してください。これは私が自分の顔をアップロードし、かなりシンプルなプロンプトでプロンプトしたものです。ここに来たときに得られるものです。彼らは私を見つけました。まず第一に、口を動かさずにマイクから目をそらしながら歌うあなたの能力は前例がありません。

そのビデオを見ると、私たちが以前話していたことがたくさんあります。LoRAや、Clingのような画像生成アップロードについて話しましたが、その部分は非常に良いですよね?私の顔を見ているその実際の部分、一貫性、それをするのにそれほど多くはありませんでした。しかし、彼らは私の顔のこれらすべての異なる角度を持っているので、それがどこに行くのかを理解できます。

しかしケブ、あなたに起こったことについて話したいです。なぜなら、私たちはイントロでこれを少し予告しましたが、あなたは私よりも有名で、あなたをいじるのが好きな人々が旅するかなり重要なDiscordがいくつかあるからです。あなたはSora世界で人物のようになりました。サムと同じレベルではありませんが、それについては触れます。

サム・アルトマンはこれの顔のようになりましたが、あなたはSora世界で人物になりました。これがどう感じたか、そしてそれがどのようなものだったか少し教えてください。まだこれがどう感じるかを処理しています。とても新しいからです。私は10代の頃から、そしてG4で18歳のときに始めて、そこでミーム化され始めました。

Photoshopがリリースされたり、ファンフィクションがあったりすることに慣れていません。インターネットの最も暗い面の人々が私にしたり、私と一緒にしたり、または彼らが私に不満を持っているからしたりすることに慣れていません。私はその面を経験しました。これは今のところ99%最良の面の超加速です、よね?でもまだ初期段階です。

だから私は判断を保留しています。この2晩、私はベッドにいて、エイプリルが隣にいて、私は私で作られたテレビネットワークのように感じるものをスクロールしています、よね?他の人によって作られ、愛情を込めて作られたと言えます。私のVape中毒が今起こっている奇妙なあなたと私のフィクション、そこで進行中です。しかしそれは奇妙です。夜に他の人が私と遊んでいる間、私はこの奇妙なフィードをスクロールしています。そして私は「ああ、その人は今プラットフォームにいる」と見ています。なぜなら突然私は別のTwitchストリーマーとラーメンを食べているからです。ああ、今私はこちらでこの別の人とピクルボールをプレイしています。

そして人々が入ってCameoを作り始めると、私は彼らとマッシュアップされ始めます。中国のことについて知りたいです。あなたのネットワークに中国語を話す人がいますか、それともそれは完全にランダムなことで、中国の人々が今参加していて、彼らがあなたに中国語で物事をさせ始めたのですか?

そうです。私はまだその部分を理解しようとしています。ポーランドの車のレビューがたくさんあります、たくさんです。私がポーランド語で話していて、新しいBMWについて話しています。SUGのxドライブです。中国の観光ビデオがたくさんあります。そこで私は学校の子供たちと一緒にぶらぶらしたり、スニーカーを売ったり、中国のエリアを歩いて旅行ブログをしたりしています。

それらはフォロワーがゼロで公開されているものがゼロのアカウントによるものですが、それらは完全な中国語のプロンプトがそこに入っています。そして私が思うに起こったことは、インターネットのほとんどが長年にわたってさまざまな理由で私に反対しているにもかかわらず、まだクリームチームDiscordがあるということです、ギャビン。私たちはあまり話しませんが、これらの小さなクリームシーたちが私のCameoを手に入れて、たくさんのもので私を使い始めました。そして私は自動提案された場所に飛び出したかもしれないと思います。

ああ、面白い。それは理にかなっています。アプリを使用すると、デフォルトで、最初に起動したときは私にとってサム・アルトマンでした。I Justineはそこにいました、少なくとも私にとっては。そしてガブリエルという男、どこにでもいるガブリエル。ガブリエルは金髪のOpenAIの研究者です。髪の毛を持っている男を見たことがあるなら、それは別の男です。

だから私は何かに飛び出したかもしれないと思います。なぜなら私は狂ったようなフォロワー数を持っていないからです。でもまた、奇妙なことです。あなたが入っているすべてのCameoを見ることができますよね?そしてクリックすることで私が入っているCameoを見ることができます。私だけが見ることができる私のすべての下書きCameoも見ることができます。

そして言っておきますが、たくさんの奇妙なコンテンツが作られています。誰かが私を使って、デイリーアファメーションTik Tokのようなものをしていると思います。そこで私はただポジティブさを与えています。他の誰かは私を使ってレシピブログをしていて、たくさんあります。だから私はこれらすべての方法で使用され、利用されています。ゼロペニーを得ています。これは興味深いです。

知りたいです。それはすぐに話すべきです。彼らがこれがビジネスモデルの場所だと信じているというアイデアについて話しましょう、よね?明らかにTik Tokは巨大なビジネスであり、スクロールは広告を置くための簡単な場所です。だからそれは考えるべきことです。もう一つ、このCameoがどのように使用されているかについて続ける前に話したいことは、サム・アルトマンがOpenAIの顔であることから変わったということです。それは一つのことでした。彼は今や誰かが彼をほとんどMySpaceのトムのように言及したようなものになっています。そしてそれはそんな感じです。

しかし彼は文字通りこのものの顔です。そして私にとって興味深いのは、これに入ってくる多くの人がいて、あなたがそれを開くと、スクロールすると、今ではあなたが何を望んでいるかを理解しようとするアルゴリズムがあります。

しかし、サムはこれらの多くに現れます、よね?そして彼自身が言いました。「自分自身のミームでいっぱいのフィードを見るのは、思っていたよりもずっと奇妙ではない。これをどう受け止めればいいのか分からないけど」と。これを再生してください。このSkibidi Toiletのものを。これはTheoによるもので、バズりました。そしてSkibidi Toiletを知っているなら、それは、あなたが知っている、トイレの中に頭がある男です。

しかし今これを再生してリスンしましょう。Skibidi Altmanを聴きましょう。私は磁器のスパにいるCEOです。それは私です。水面より上で走っています。部屋の中のみんな。それはhead、サム、トイレから突き出た彼の頭で、アダムのリンゴまで水線があり、トイレにいるCEOであることについてのボッパーを歌っています。

そしてこれら2つのプロンプトを見ると、ギャビン、話さなければなりません。いくつかのプロンプト、最高のビデオのいくつかは、このシーンのこの人だけです。ダイアログなし、カットなし、他に何もありません。ただの空のプロンプトです。

そして裏で起こっているプロンプトエンジニアリングにはたくさんの秘密のソースがあると思います。なぜならそれはこれが韓国ドラマですか?これは1990年代のインフォマーシャルですか?これは法廷手続きドラマですか?を検出しています。そしておそらく台本やショットやカメラアングルを洗練してノックアウトして、あなたのためにバックグラウンドでそれらすべてをやっているだけです。なぜならこの歌は書かれていなかったからです。それはただSkibidi Toiletとしてのサム・アルトマンで、このミームが出てきました。

著作権とIP問題の複雑さ

まあ、これについては後で話しますが、IP問題ですが、実際にはたくさんの時間面白いんです。そしてそれはここでの別の秘密のソースです。実際のAIが、これらのビデオが過去にどのように作られたか、そしてそれらを特定の方法で面白くしたものについて何かを理解しているようなものです。

私はまた、本当に素早く言及したいです。サムと一緒に作ったものがあって、それが私を笑わせました。Jurassic Parkの恐竜のシーンを作るようにプロンプトしました。だから今それをすぐに再生して、なぜいつも完璧ではないのか、でもそれは興味深いものであることについて話しましょう。何?なんてことだ。これを見ていますか?巨大です。サム・アルトンです。

彼らはどこにでもいます。信じられない。サムパークへようこそ。もしあなたがただ聴いているだけなら、ここで見ているのは、そのシーンのように見えるものです。私はそれを、そのシーンのストレートビデオバージョンのようなものだと考えています。ジープがあり、帽子をかぶった男がいて、金髪の女性がいますが、彼らはサム・ニールとローラ・ダーンにはあまり似ていません。

また、木から何かをつかんで取っている巨大なサム・アルトマンもいるので、彼は巨大な男のように見えます。しかし興味深いのは、注意深く聴くと、Jurassic Parkのテーマソングによく似ているということです。そこで流れている音声はJurassic ParkのJohn Williamsのスコアのように聞こえます。

そしてそれは本物なのか、それともそれに近いだけなのか?分かりません。それは大きな質問です。まあ、ライセンスされた音楽がこの中にあることは分かっています。Jurassic Parkのそのシーンが何であるかを理解していることは非常に明らかです。ショットごとのショットですか?おそらくどこかにあるでしょう。出力時にわずかに変更するように指示されていますか?はい、そうでしょう。しかし他の生成では止まりません。

Cyberpunkのシーンの誰かが共有したビデオを見ましたか?ああ、ヘッドホンを失いました。あれは本物じゃなかった。あれはAIでした。ギャビン、誰かがCyberpunk、ゲームCyberpunkのシーンを共有しました。そこでサイドミッションを直接再現することができました。これはほとんどの人が見ないものです。

そして多くの人々が「もちろんできる。ただコピーしているだけだ」と言いました。でも実際にはただコピーしているわけではありません。そしてそれは本当に魅力的なことです。なぜなら明らかにこの奇妙なサイドミッションを理解するのに十分なCyberpunkでトレーニングされていて、それをほぼ正確に再現したからです。彼らはそこにどんな奇妙なエミュレーションファームを持っているのでしょうか。ゲームをプレイし、Netflixを見て、すべてをクリックし、画面上に何があるか、画面上のものがどのように動くか、画面上のものがどのように動いているかを分解するための独自のユニーク分類器を使用しています。

ディレクターとしてシーンを説明し、オーディオプロデューサーとしてサウンドトラックを説明します、よね?彼らがこのマシンに吸い込んでいるすべてのコンテンツから取得しているデータと埋め込みと何でもの量は、正直に言うと、これが私がこのようなものについて投稿するたびにインターネットの半分が私を破壊したいと思う理由の一つです、よね?私がそれを見ているかどうか分かりませんが、ここで私たちはこの気まぐれとこのおもちゃを祝っていますが、このもう一方の側面は最前線で中心的なものです、よね?

彼らはIPで武器自由です。彼らは今すぐ何でものような生成を配っています。ここにビジネスモデルがあることを証明するためです。明らかにそうです。なぜなら彼らがそれを締め付けて月1,000ドルと言ったら、今すぐ、あなたと私はAI for humansのためにそれを手に入れるかどうかについて少し交渉があるでしょう。でも私たちはおそらくそうするだろうと思います。それはかなり素晴らしいことです。

そうです。ただ、今それを特別にしているものの一部は、人々がそこにいる方法です。だから問題は、もしあなたがそれを制限したら、私たちはすぐにそのすべてのものについて話すつもりです。ケビン、私が見た本当に興味深いことの一つは、それがブラウザのようにHTMLをレンダリングするということです。

だからこのものに実際にHTMLコードを入れることができて、ウェブサイトを送り出してくれます。だからバックグラウンドで奇妙なことをやっていて、本当に技術的に興味深い何かをやっているというあなたの指摘について、それがどれだけ深く行くのか、人々がそれを理解するまでしばらく分からないと思います。

誰かがchat GPTに行って俳句を書くようにプロンプトしました。そしてchat GPTに行く画面のビデオをやりました。そしてそれから実際に正確な俳句を出しました。だから信じられません。ここにもう一つのことがあります。V3は非常に素晴らしいモデルです、よね?OpenAIに脱帽です。彼らは非常に魅力的で素晴らしいものを出荷しました。そして再び最先端の基礎的な、素晴らしいV3素晴らしいモデルです。どの価格設定とどのモデルとどの速度とどの品質を使用しているかによりますが、1生成あたり最大3ドルかかる可能性があります。

OpenAIは今これらのものを何でもないかのように配っています。そしてあなたは一日中何百もキューに入れることができます。だから彼らは今マーケットシェアを得るためにこれで出血しているのか、それとも彼らは何かを理解したのか?バックグラウンドで彼らがこれをすることを可能にしている何かを見ましたか?ギャビン、はるかに多くの計算、競合他社のどれよりもはるかに最適化された計算です。噂ツイートを読みました。どこからだったか言いませんが、昨日確かにこれを見ました。知っている人だと思った人がいたと言っています。ただ適当なことを言っているわけではありません。

彼らが知っているということで、OpenAIがV3のようなものよりもはるかに小さなモデルをトレーニングして、このようなものを出力できるようになったかもしれないと彼らが考えているということです。だから彼らはこのビデオモデルを動作させるために最適化する方法を見つけたのです。だから大きな違いを生むと思います。ここで最後に話したいことは、私にとってはある種の秘密兵器だということです。Sora 1にも存在しましたが、40 image genを興味深いものにしたものでもありました。

それはこれらのものの公開出力をリミックスする能力です。そしてこれは、単にAIの側面だけでなく、これのソーシャル側面について話すことになります。なぜならOpenAIが40 image genでよく理解したことの一つは、他の誰かのものを使って飛び立つことができるということだと思うからです、よね?そして私たちはたくさん楽しみました。しばらく前にこれについて話したのを覚えています。90年代のビデオゲームキャラクターが彼らのテレビで遊んでいるようなショットをやりました。それはミームになります、よね?それは物になります。

彼らはSoraで同じことをやっています。そしてケビン、ここに置いたこのリンクを出せるか見たいです。人々はMLKとJFKのアーカイブ映像を取って、彼らのスピーチで異なることを言わせています。そしてこれを知らない場合のために言っておくと、これらの一つを見て、右と左に行く小さなドットがある場合、上にスワイプする代わりに、右と左にスワイプできて、人々が同じビデオを取っているのを見ることができます。そして新しいプロンプトをそれに追加して、異なることをさせることができます。だからこれらのいくつかを再生してください。いくつかの周りをカットしなければならないかもしれませんが、音声を上げていくつか再生してください。

夢を見ました。あなたが、あなたがあなたの、あなたができた、あなたがしたい、あなたができた、あなたがそんなに欲しい、あなたが何でもできる。それはミームです。そうです。それが本当にSoraに火をつけた主なものです。そしてアプリにいる場合は、左から右にスワイプするだけです。

ウェブサイトにいる場合は、右上に小さなリミックスパネルがあり、小さなサムネイルが表示されます。あなたは今までに夢を見たことがありますか、あなたが、あなたがあなたの、あなたができる、あなたがする、あなたがしたい、あなたが同じことをやっている。あなたが欲しかった、あなたがそんなに欲しかった、あなたが何でもできる。さて、兄弟姉妹の皆さん、若い男性が皆さんと言葉を共有するために来てくれて、私の喜びです。彼に注目してください。私はBBWが大好きです。

67。何になるか分かりませんでした。ギャビン、サーバーを実行するつもりなら、どれだけのワムが必要ですか?さて、皆さん、今日ここに来るために長い道のりを来た友人を歓迎したいと思います。この若い男性に温かい歓迎を。ありがとう。ああ、完璧です。

人気ストリーマーXQCがMLKと一緒にステージでおならをしています。これはまさにみんなが望んで必要としていたものです。だから言おうとしていました。MLKやJFKのような人を取ってこれらのことをすることを不快に思うかもしれない私たちの聴衆の人々が間違いなくいますが、他の場所でも役に立つと言いたかっただけです。

MinecraftでのOppenheimerを誰かがやっているのを見ました。本当に興味深いです。そして私はそれをアニメでのOppenheimerとしてリミックスしました。そして私の出力は素晴らしかったです。それはたった10秒ですが、同じショットを取って、同じオーディオを取って、それを再カットして、そのように見えるように作りました。

私はOppenheimerアニメを見たいです。でもそれはSoraだけがこの世界でやる本当にクールなことです。そしてそれはおそらくその成功の大きな部分だと思います。なぜなら何かを思いつくのは難しいからです、よね?Tik Tokについて、あなたと私は両方ともTik Tokを作ってきました。そして私たちのTik Tokは比較的成功しています。カメラの前に立って、このすべてのことをセットアップすることは本当に簡単ではありません。

そして成功するためには、まあ、私が始めるフックは何か?これは何か?を知らなければなりません。もしあなたが他の誰かの創造物から飛び立つことができて、彼らがすでに面白いことをやっていて、あなたがそれに何かを追加できるなら、それはウェブが元々構築されたリミックス文化の素晴らしいことです。

そして人々は、これがAIであるという事実を嫌うでしょう。しかしそれは一種のその世界に住んでいます。みんなが同じようなアイデアに飛び込んでいるようなものです。そしてそれはクールに感じます。私はそれが興味深いと思います。私が知らない誰か、Daniel、ammo、amanma、amoranがXにいます。昨日、私はTellyのコマーシャルをまとめました。これは私が投資しているデュアルスクリーンテレビです。そして私はほぼ独占的にSoraを使用しました。

Final Cutでいくつかクリーンアップをして、サウンドエフェクトといくつかのオーディオに11 Labsを使用しましたが、小さなコマーシャルを作りました。無料のテレビなので私が逮捕されるというものです。そしてそれを説明しようとしています、云々。私のコメントで、Remote Buildという名前の誰かが基本的に「ねえ、Soraでより長いクリップをアンロックするために使用したコードはどうやって手に入れるの?」と言いました。そして私は「ああ、いや、いや。私はそれを編集した」と答えました。時にはまだ何かをするのに人間が必要です。

そして彼らはXで長いスレッドをやって、基本的にそれが彼らにとってインスピレーションのようなものだったと言っていました。彼らは通常このようなコンテンツを作りませんが、「ああ、私に何ができるだろう?」という感じでした。そして彼は基本的に、私がやったコンセプトを取りました。車のボンネットで逮捕されて、それから尋問室にいて、それから刑務所にいて、それから裁判官の前にいる、みたいなものですが、彼はそれを彼のビジネスに適用しました。

そして彼は「いくつかのサイドクエストに道を外れることになった、云々」と言いました。彼は「今朝9時から5時に到着するまでに、これまでのすべての試みの3倍のエンゲージメントを獲得したものをまとめた」と言いました。そして彼のリモートビルディングビジネスか何かのために認知度を高めている彼です。だから、あなたの指摘通り、それはまさにその通りでした。ああ、それを見ました。私が見たのは、これです。

ああ、そのことを見ました。誰かが何かを見た。私はそれを取るつもりです。私はそれを私のものにするつもりです。私は進みます。そして水とAIによる電力使用のようなことに腹を立てている多くの人々がいます。これらのものに入るすべてのトレーニングデータに腹を立てている多くの人々がいます。

誰かが何かを見て、それを取って、自分たちのためにリミックスするという私が今説明したそのパイプラインに腹を立てている多くの人々がいます。私は、あなたもそうですが、この奇妙な場所にいます。はい、これが私たちのアバターです。どうぞ好きなようにしてください。あなたが宣伝したくない何かの奇妙な中国の広告にいるかもしれませんが、それはその領域に付属しています。

誰かがあなたのアイデアを取ってリミックスして、あなたが望まないかもしれない何かをするかもしれません。それもその領域に付属しています。良いものと悪いものを取ります。最終的に、そしてこれは今日エイプリルと話していたことですが、このようなマシンにささやくことができて、それは他の誰かのクリエイティブをリサイクルできます、よね?そしてBreaking Badのスタイルで何かを返してくれます。

誰かがまだスタイルを作らなければなりません。誰かがまだ物を作らなければなりません、よね?人々がそれに飛びついて行きたくなるほど興味深いものを。だから私は疑問に思います。ゴールポストを動かしているだけですか?私はここで妄想していますか、よね?それとも、それを興味深いものにするためのスタイルを定義する、ループ内の人間のための必要性がまだあるのでしょうか、あるいはAIが?そうだと思います。

そして私がこれらのことと言うとき、ミームやトレンドが上昇し下降する速度は、人々が興味深い新しいものを思いつくことを要求するでしょう。それはこのAI能力のためにより速く、より遠く、より速く広がるだけだと思います。しかしそれはまたフラット化です、よね?ショーで何度も話しました。多くの人々がこれをできるようになります。

以前とは非常に異なります。アーティストが何かを作らなければならず、映画製作者が何かを作らなければならず、インフルエンサーがビデオを撮影しなければなりませんでした。今私たちは基本的にみんながそれをできるこの世界に入っています。そしてそれは変わります。話すべきことがまだたくさんありますが、ケブ、最も重要なことについて少し話さなければなりません。それは家にいるあなたがこのYouTubeチャンネルを「いいね」してチャンネル登録することです。なぜならそれが私たち人間を生かし続けるものだからです。

また、オーディオでポッドキャストに5つ星レビューを残してください。そうしてください。前に言ったように、5つ星レビューを残すと、私たちのTwitterハンドルから自動的にツイートされます。もうコントロールしていません。AIがそれを引き継いでいます。しかし最も重要なのは、皆さん、私たちのスタートアップをサポートしてくださって本当にありがとうございます。それについては後でもう少し話します。

今はオープンしています。これから入りますが、And Chatに行くことができます。そして私たちのDiscordに来てくれたすべての人に感謝します。これはこのショーの下にリンクされています。フィードバックを寄せてください。しかし、本当にありがとうございます、みんな、あらゆる方法でサポートしてくれて。まだPatreonがあります。すべてのPatreonサポーターの皆さん、まだ愛しています。本当にありがとうございます。

それは進むにつれてこれらのツールの支払いを可能にしてくれました。ケビンと私は事前に話していました。このショーがエンティティとして収益性があるかどうか?そうではありません。私たちは多くの時間と多くのお金を費やしています。ジェットスキーを3台手に入れました。それは誤算でしたか?それはあなたがすべきことではありませんでした。それは実際にSoraでした。でもそうです。

家で視聴して「いいね」するか、Patreonにお金を送ってくれるあなた方によってサポートされています。だから本当にありがとうございます。そしてその甘いアルゴジュースをありがとう。美味しいです。コメントネクターです。コメントにドロップしてください。とても美味しいです。ギャビン、私たちの権利と他の人々の権利についても話さなければなりません。なぜなら再び、私たちはそれらを譲渡したようなものだからです。

ところで、これに対する後悔までの時間はどれくらいだと思いますか?いつアバターやCameoを削除すると思いますか?まあ、実際に彼らと何が起こるかによると思います。おそらく見なければならないでしょう。今週何が起こるか見なければなりません。今週何が起こるか見ましょう。だから、Sora 2についてさらに話したい大きなことは、これのすべてのIPです、よね?

だから、私たちは以前これについてほのめかしましたが、もしあなたがまだ見ていないなら、40 image genで起こったようなことの一つが起こっています。これはインターネットのジブリ化と呼ばれ、スタジオジブリの画像が明らかにトレーニングに使用され、その後みんながジブリのような画像を作成したという事実について大きな騒動がありました。

まあ、今はトレーニングだけではなく、ケビン。ピカチュウやSpongeBobやSouth Parkのキャラクターのような本格的なIPキャラクターがあり、基本的にそのショーからクリップを作成したり、彼らがすべきでないことをやらせることができます。だから良い例として、このクリップを再生したいと思います。

Signalからのこのクリップを再生できるなら、彼がこのクリップを作ったかどうか分かりませんが、実際に本当に興味深い、誰かが作った基本的にSouth Parkのエピソードの文字列があります。だから15、20秒くらいこれを聴きましょう。これがどう進行するか感覚がつかめます。そしてこれは真剣な質問ですが、AI生成されたSouth Parkを再生することでYouTubeから削除通知を受け取るつもりですか?

実際に分かりません。そうですね、あなたが正しい。絶対に正しいです。だから、フラグが立つかどうかは分かりませんが、表示したり再生したりしません。しかしそれは1分59秒です。少なくとも今存在しているクリップは。10秒のSoraクリップの文字列ですが、完全な、完全なSouth Park体験のように感じます。

だからCartmanは最初にカナダに行きたくないと決めます。それから彼はカナダに行かなければなりません。カナダに行き、Tim Hortonsで仕事を得て、Tim Hortonsのマネージャーになります。そしてその過程のすべてのステップで、それはSouth Parkではありません。奇妙なカットや奇妙なものがあることが分かります。しかし、「ああ、それはCartmanが言いそうなことだ」と思う瞬間があります。

そしていくつかの笑いがそこにあります。そして私が言いたいのは、私はAIの笑いで簡単には笑いません。奇妙な何かでない限り。これは明らかに、物の外観だけでなく、物の声だけでなく、そのキャラクターがどのように演じるか、そのキャラクターがどのように話すかについてのある種の感覚を取り込んでいます。そして再び言いますが、私は声だけを意味していません。

そのキャラクターの口から出ている言葉を意味しています。そしてこれがみんなを今騒がせたものです。おそらく正当な理由で、もちろん。そうです。Matt Bolognaもツイートを持っていました。大したことではないと言って。彼は、ディズニーやAmazon/Netflixが所有する私のお気に入りの著作権キャラクターでSoraで個人化されたビデオを作っているだけです。間違いなく報酬を得ていない識別可能な女優をフィーチャーしています。

そしてこのビデオはWednesdayが食卓で、Family GuyのPeter Griffinの隣に座って完全なシーンをやっています。そして再び、プロンプトはかなり直接的です。Wednesday AdamsがFamily GuyのPeter Griffinと一緒に食卓で夕食を食べています。だからMatt、もしMattを知らないなら、MattはPAで素晴らしいニュースレターを書いています。そして彼はハリウッドシーンに直接結びついているようなものです。これらは彼が知っている、彼が話している人々です。

彼はすべてのハリウッドスタジオの幹部に話しかけています。さらに、New York Timesがこれについて素晴らしい記事を持っていました。私たちのお気に入りの作家の一人、Mike Isaacからです。WME、代理店が基本的にこれが起こるのを見たときに空にフレアを送ったというアイデアについて話しました。そして彼らはみんながこれを使う権利を引き上げるべきだと言いました。

そしてケビン、明確にしておきたいのは、Sora 2がローンチする前にWall Street Journalに記事がありました。そこでOpenAIが1週間の通知を企業に与えたと言っていました。あなたのIPを望まないなら、そしてあなた方の何人かは見つけたかもしれません。Disneyのものを手に入れるのは難しいです。Darth Vaderを手に入れられませんでした。Mickey Mouseを手に入れられませんでした。

自分たちを引き出した特定の企業があるかもしれません。South Parkのことについての私の質問。だから本当に私がIP的に見た主なものは、Spongebob、South Park、Pikachu、Marioです。任天堂をたくさん見ました。だからそれは2つの大きなものです。興味深いのは任天堂とParamountです。だからParamountはSpongebobとSouth Parkの両方を所有しています。

そして私の一部は、もしあなたがハリウッドビジネスをフォローしていないなら、すぐにParamountはEllison家に買収される取引を経たところです。そしてある方法で、それが起こることを許可する選択がなされているのではないかと思っています。

そして私は本当に興味があります。MattやTreyのようにさえ、彼らはしばらくの間それが起こるのを見ることに興味があるかもしれません。彼らが時々奇妙な種類のアナキストだからです。Spongebobのものはより奇妙で、ケブ、ここで本当に知ることが重要なもう一つのことは、これらはどれも承認された使用ではないということです、よね?そしてBaked Halfbakを再現したSpongebobのクリップのような奇妙なものがあります。Dave Chappelleの映画で、ストーナーの集まりです。だからこのようなもののほとんどはブランドに精通していません。

それは奇妙な場所だと思います。しかし、前に話したように、これはおそらくナーフされるでしょう。だからもしあなたがこれらを手に入れようとしているなら、今手に入れようとしてください。おそらく今がその時です。そうです。そうです。彼らが完全なオプトアウトに行ったのは興味深いです。つまり、訴訟が飛び交うだろうという議論が不足していません、ギャビン。ハンマーが降りてくるでしょう。オプトアウトは一つのことですが、彼らはこれから現金を期待しています。ClingやMiniaxのような、非米国モデルで起こっていることを見て、これをやらなければならないと言ったと思いますか、それとも今の政権では規制についてあまり心配していないと感じたと思いますか?

なぜなら、これはすべて、おそらく番組の最初からずっと話してきたことにつながっているからです。このようなことをする権利を誰が持っているのか、そしてそれは何を意味するのか?大きな質問は常に、もしあなたがこのようなもので訓練したなら、それならお金を払う必要があるのか?というものでした。そしてJames Cameronのような人々が言っているように見えました。いや、それはアウトプットについてもっとだ。もしアウトプットが私たちのものを含む何かなら、それならお金を払う必要がある、と。

しかしこれはある意味で武器自由のようなものです。オプトアウトした人々を除いて。だから私の期待は、40 Image Genが出てきたときのようなもので、40 Image Genが出てきたとき、私は自分が入っているG.I. Joeの画像を作成できたことを覚えています。そして2日後のようには、そのプロンプトを通す方法がありません。

だからそのようなことが来ると期待しています。Sora 1やImage Genと異なっていたものの一つは、有名人を生成できないということです。だから人間の顔や顔はしばしばブロックされています。あなたは多くの有名人の写真を見ません。だからここに面白いことがあります、ケビン。Will Smithか、他の興味深いことをする有名人を取りましょう。

これは私が言及した瞬間だと思います。今週のニュースレターでこれを述べました。Tilly Norwoodという名前のAIキャラクターについての大きな記事がありました。彼女はハリウッドで今大騒ぎを起こしているAI女優です。彼女が代理店から代理人を得るかもしれないけれど、有名な俳優だったらどうでしょう。何ですか?彼は彼女が代理人のようなものを得ていると言いました。

しかしそうです。でももし有名な俳優か、セミ有名な俳優のような誰かが、「よし、どうぞ?私はCameoをアップロードするつもりだ」と言ったらどうでしょう?正直に言うと、もし私がエージェントだったら、下り坂にいる誰かなら、やってみてください。今がその時ですか?

WMEとの会話は何だと思いますか?ギャビン、だからあなたは中国にいるのですか?あなたは間違いなく2014年以来関連性がありませんでした。できることは何でもやって、中国のエンジンファクトリーを売りに行ってください。そこに出て、モンゴルでTik Tokダンスをやってください。やってください。なぜならギャビン、もし私がこのSora MySpaceの次のトムになれるなら、それなら私は「ねえ、Sammy Alman、ペニーの一部。誰かが私のCameoを使うたびに、それは大丈夫です。オリジナルが欲しいでしょう。これが欲しいでしょう」と言えます。

もちろん、誰も言いません。あなたを人々は欲しがっています、ケビン。彼らはそうです。彼らは明らかにあなたを中国の人々は欲しがっています。はい、私は一生懸命釣りをしていました。しかし私たちがこの議論をしている間、私はSoraに行きました、ギャビン。私は進行サークルを見つめています。そしてそれが来ています。しかしあなたは私たちの友人、ショーの友人、James Cameronについて言及しました。彼はアウトプットに対して支払われるべきだと言いました。

私は好奇心があります。私の巨大な三つ編みを使ってアバターキャラクターと絆を結ぶことができますか?そして何かのガイドライン違反になるかどうかすぐに分かるでしょう。なぜなら時々何かをレンダリングするとき、それが何かの違反かもしれないことを知らせるためにアウトプットまで待つからです。そうです。それはかなり興味深いです。

またチェックします。なぜならアバターを作成するとき、生成と一緒に行く画像をアップロードできるからです。人々の画像をアップロードすることは許可されません。そのためのチェックがあります。そして再び、アバターを作成するときの服装チェック。驚き、驚き。だから私はこの背後のビジネスについて少し話したいです。

ビジネスモデルと収益化戦略

Dan Broningは、OpenAIが過去数日間で3つの自然な広告ユニットをローンチしたと言いました。Pulse、トピックカードです。これについて簡単に話しました。もしあなたがプロ加入者なら、このような毎日の更新を与えるというアイデアです。chat GPTで購入してください。これについてはすぐに話します。そしてSora 2のフィードでのスポンサー付きビデオです。

そして彼は、それが先週のゼロから増加したと言っています。だからここでのビジネスについて話すとき、chat GPTはお金を稼ぐ必要があります。しばらくの間それについて話してきました。彼らは今、週に7億人以上のユーザーがいると思います、よね?そして今、このSora thingがバズっています。

彼らが見つけようとしているのは、お金を稼ぐためのいくつかの方法です。そしてSamはTwitterでこれについて特に尋ねられました。そして彼は言いました。なぜなら彼は答えていたからです。多くの人々が「ああ、あなたはただこのAIスロップをやって物を出しているだけだ」というようなものです。そしてAGIはどこですか?

そしてSamは特に言いました。「ここでのバイブスは理解しているけど、私たちは主に科学のためにできるAIを構築するための資本が必要で、私たちは確かでAGIにほとんどすべての研究努力を集中している。途中で人々に新しい技術製品を見せるのもいいことです」と。だから基本的に、彼はこの種のことが人類に利益をもたらすものに支払うだろうと言っています。

お金を稼ごうとしているときにほとんどの誰もが言うことでしょう。しかしこの場合、彼らはお金を稼ぐ何らかの方法を見つけなければなりませんでした、よね?彼らは銀行に現金を入れるための何らかの方法を見つけなければなりませんでした。

そうです。私はこれらすべてが起こるのを見ることができると思いますし、かなり素早く一つについて触れるべきだと思います。なぜなら3つのことを見過ごしたからです、よね?「ここで起こっていること、あなたの更新です」というこの毎日のようなパルス製品があります、よね?2つについてはかなり長い間しゃべりました。しかしchat GPTでの購入はかなり興味深いものです。

これは今Shopifyとの統合です。これにより小売業者が製品をチャット体験内に直接置くことができます。だから私がchat GPTに行って「ねえ、最高の云々を見つけて」と言うとき。または私が今売るのが大好きなこれらの中国のスニーカーがありますか、ギャビン?大好きです。サイズ9.5で持っていますか?そうです。

そしてアプリ内にShopifyストアが出てきて、タップして購入できます。だからElonは長い間Xアプリがそれをすべて支配するものになることを約束してきました。OpenAIがその方向に這っていくのを見ています。今、彼らはたくさん楽しめるTik Tokの競合を持っています。彼らはchat GPTを持っています。彼らはアドバンスト音声を持っています。彼らは何が起こっているかを思い出させるための毎日のことを持っています。コードを書いてアプリを作って共有できます。そして今、同じアプリ内で買い物ができます。

それはお金を稼ぐ方法です。そして私たちはしばらくの間これを言ってきました。注目がすべて必要です、それが何であるかという点で。ああ、ここで結果が戻ってきましたか?アバターの結果が出ました。何か出してくれましたか?分かりました。テキストして、一緒に見ましょう。テキストしています。

リアルタイムでこれをやらなければなりません。待ってください。James Cameronがこれに対していくらペニーをもらうか分かりませんが、再生させてください。こんな髪は見たことがない。なんてことだ。そうです。私たちのキューは私たちの一部です。準備はいいですか?準備できています。わあ!すべてを感じることができます。今、私を理解していますか?

そうです、これはナーフされるでしょう。説明しましょう。私たちが見ているのは、正直に言うとケビン、映画のシーンのように見えます。私にとってクレイジーなことです。Soraのもののことの一つは、時々品質が高かったり低かったりすることです。

これは非常に高品質なクリップで、長いヒッピーの三つ編みを持つあなたですが、あなたの人間の形で、主要なナヴィの一人、主要なキャラクターの一人の隣に立っているあなたです。彼女は主要なキャラクターの一人のようですが、あなたが三つ編みを一緒に触れていて、それから三つ編みがあなたの口の中にあるので、三つ編みを食べています。そうです、ギャビン、このブレイディングのやつがどう機能するか分かりません。

つまり、ドッキングなら理解できますが、これは青い人のように感じるまで髪を吸うつもりです。分かりました。十分です。十分は十分でした。ケブ、最後の呼びかけをしましょう。なぜなら私はこれを持ちたいからです。

AIスロップ問題についての考察

最近たくさんの人々がAIスロップについて話していて、実際に私はSora 2の前の約1週間半前にこれについて全体のニュースレターを書きました。これがAIスロップを問題にするつもりだと思いますか?悪化するつもりですか?そもそもAIスロップは問題だと思いますか?いいえ。つまり、問題を定義してください。すべての世代が前の世代のコンテンツに拳を振るのが好きなように感じます、よね?そこには新しいものは何もありません。

AIスロップは問題ですか?どの視点から見るかによります。脳を配線し直して揚げていますか?そう、おそらくそうです。そう思います、よね?しかし人々は昔、MTVについても同じ議論をしました。分かりました。それは、それは、それは必要なスポットライトを、アルゴリズムに頼って発見される人間のクリエイターから奪っていますか?そうです、そうしています。

それはユーザーがそれに興味を表明していて、彼らがそれを見たくて、それを求めて、それにエンゲージしているからそうしているのですか?そうです。だから、そう、私は、つまり、お願いします。これはあなたの専門分野です。私はAIスロップを楽しんでいます。いくつかは非常に面白いと思います。また、私が本当に本当に感謝しサポートするクリエイターによる長編の何かに落ち着くのが大好きです。だから両方のことが真実であり得ると思います。

そうです。つまり、これはまさに私もそこから来ようとしていたところです。それは非常に複雑な会話です。私が戻り続けることの一つは、コンピューターが私たちのためにこれらのものを作っているわけではないということです。そうです、それらはそれらを簡単にしています。しかし人間がそれらを作って見ているのです。

だから、もしこれがメディアについてのあなたの考え方を変えるなら、あなたの仕事についてのあなたの考え方を変えるなら、そのすべてのものは複雑で難しく、それは消えないだろうということを理解することが重要だと思います。だから私はそれはルールがあると思います、よね?私たちが言ったように、彼らは多くのこのようなものをナーフするつもりだと思います。なぜなら正直に言って、他の創造物や人々が所有するもののこのような種類のものを作ることができるべきではないと思わないからです。

そこには区別があることを知っています。世界の多くの人々は、一般的なIP権利がなくなるべきだと信じています。私たちは以前コメントでそれを言った人々がいました。それが人間の創造性にとって最良のことであるかどうかは分かりません。なぜなら私は、もしあなたが何かを創造するなら、そこには価値があると信じているからです。しかしこれは私たちが生きている複雑な世界です。

90年代のリミックス文化で見たものから、たとえば千倍になっていることを除いて、それほど遠くありません。私はそれを経験するのに十分な年齢でした。私の好きなアーティストはBeck、Beastie Boysのような、他の音楽を取ってそれをまとめる人々、Girl Talkは90年代の人々の別の良い例でした。

そしてその音楽の多くは一部殺されました。なぜならサンプルベースのオーディオを作るのが高価になりすぎて、本当に高価なものになったからです。だからそれがどこに着地するかを知るのは難しいです。しかしそれは新しい会話ではありません。MTVについてのあなたの指摘は完璧に正しいです。ビデオゲームについても同じことを考えます。

私が子供だったとき、ビデオゲームが人々の脳を揚げるだろうと言った人々がいました。子供たちを悪魔やモンスターのようなものに変えるだろうと。そしてそれがケースだとは思いません。明らかに起こっていません。だからそれは複雑なシナリオです。しかしこれは私たちが文化としてそれに取り組まなければならない次の段階です。

これは完璧な移行です、ケビン。さあ。そうです。分かりました。入りましょう。ギャビン、ここで移行は、私たちがAI生成されたものを出してきたということです。しかしまた非常に人間の創造性に依存しています。そしてそれはAnd Thenと呼ばれています。あなたは私たちがここで何ヶ月も話しているのを聞いてきました。そしてそれは世に出ています。早期ベータがあります。これらの体験のいくつかをプレイできます。新しいものが常に出てきます。

それが何であるかを非常に明確に言うと、もしあなたが私たちが話すのを聞いていないなら、それはオーディオインタラクティブ製品です。そこであなたは自分の声を使ってキャラクターと話し、彼らに何かをさせようとします。これらのキャラクターはAI生成された音声ですが、実際には人々によって書かれています。つまり、今は私たちのような人々ですが、最終的には他の人々もそうなり得ると思います。シナリオを書いて、キャラクターを考え出して、それらをセットアップしています。そしてAIがそれらを生き生きとさせます。

だからケブ、これが世に出ているのはエキサイティングです。素晴らしいフィードバックを得ています。クールなことがいくつかあります。でも人々がそれをプレイする機会を得ていることが嬉しいだけです。そしてもしあなたが今これを聴いているか見ているなら、それを試してみてください。これを見終わった後に。今すぐそれをやりに行かないでください。しかしAnd Chatに行って試すことができます。

これまで。完全に無料です。言おうとしていました。ブラウザで使えます。スマートフォンで使えます。何もダウンロードする必要はありません。And Chatがサイトです。私たちがもっと習慣にしなければならないことを言うのは、ギャビン。なぜならそれを見つけなければならないからです。しかし今日、Docmaster Zedをローンチしました。これは初期の人々の何人かとベータテストしたものです。

ところで、あなたに称賛と、今日ドロップした素晴らしいストーリーについてThe Hollywood Reporterに大きな感謝を。それは報道ができる限り寛大なものでした。著者は体験を楽しみ、実際に時間を費やしました。そして私がDocmaster Zedを持ち出したのは、彼らがDocmasterに賄賂を贈ることに成功したからです。

どうやってかは言いませんが、それは私たちがその体験に入れた意図された道の一つでした。なぜなら「ああ、それは楽しいだろう」というような感じだったからです。ゲームを打ち負かす方法は一つ以上あります。しかし私たちはAIのパワーを使ってプレイヤーが最終目標に到達するためのどんな道でも探索させたかったのです。そして彼らは私が試してほしいと思っていた何かをやりましたが、彼らがやるとは予想していなかった方法でやりました。

だから私はそれに対する反応に驚いています。人々がそれを受け入れていること、彼らがそれを楽しんでいること、彼らが「ああ、それが大好きです。ここで何かを挿入できたらいいのに」と言っていることです。なぜならそれはまさに私たちがこれで刺激したかったものだからです。これらのツールをリリースして、他の誰でも自分自身の心地よいシミュレーターやイタリアのブレインロットジェネレーターを作れるようにしたいのです。

Docmaster Zedが私たちのサイトの一番下にいることに今気づきました。Zedを上に移動しなければなりません。彼は新しいです。彼は新しいものです。そうです。そして再び、ここで重要なことだと思います、ケビン。私たちのローンチトレーラーについても話すつもりです。私たちが作ったもので、人々も楽しんでくれました。それは本当に私たちについてというよりも、AIツールを使うことについてです。

And Thenローンチトレーラーの制作過程

しかしこれを作る過去2年間で私たちが考えてきたことについて知ることが重要です。そしてなぜこのショーがAI for Humansと呼ばれているのか、それは何かをやろうとするAIと人間が一緒にいることです。そしてSora 2について話すのに費やしたすべての時間と、出てくる人間の創造性のように、私たちはそれのその側面を忘れることはできないと思います。

そしてそれが本当に伝わることが重要です。そして私はこの記事で言いましたが、ここでもう一度すぐに言います。もしあなたが聴いているなら、あなたの経験はAIによって複製されることはできません。あなたになることができる方法は全くありません。そしてこれは私の妻が文章を教えています。

それは彼女が言うことと同じです。本を書いているとき、別の人のスタイルをコピーしようとしたり、成功すると思うから何かをコピーしようとしたりできますが、最終的にはその物のあなたのバージョンが何であるかを理解しなければなりません。だからそれが私がAIに少しもたらしたいと思っていることです。And Thenで可能だと思います。

しかし移行しましょう。そしてケビン、このローンチトレーラー。だからケビンと私はローンチトレーラーをやるという奇妙なアイデアを持っていました。もしスタートアップ世界に慣れていないなら、起こってきたこれらすべての種類のローンチトレーラーがあります。最も有名なのは最近はClueyローンチトレーラーでした。ショーでClueyについて話してきました。彼らはAIであなたの人生でカンニングする種類のようなものです。

彼らはトレーラーを持っていました。2つのキャラクターが向かい合って座っていて、一人の男は他の女性について何も知りませんでした。彼はこれをやるためにClueyのような画面を使っていましたが、彼らはバイラルになります、よね?そしてこのアイデアは、スタートアップトレーラーを持たなければならないというようなものです。

だからケビンと私は、もし私たちがこれらのトレーラーの多くを通して自分たちをForrest Gumpのようにしたら、それはどんな感じだろうかというアイデアを思いつきました。そしてアイデアとして、それは面白いアイデアです。しかしまたケブ、これをどうやってやったかについて話しましょう。なぜなら、これを見る人々は、おそらくあなた方がこれに大金を費やしたに違いないと思うかもしれないからです。3週間、6週間これを作るのに費やしたに違いないと。

確かに、私たちがやったことの詳細と、それがどのように見えたかについて少し教えてください。まず第一に、称賛を。Fiona Novaが参加してくれて、私の良い友人、監督してくれました。私たちの親愛なる友人Kevin Capiello、素晴らしいエディター。素晴らしい。エディターと言うのさえ好きではありません。なぜなら彼はグラフィックデザインだからです。彼は本当に多くの意味でクリエイティブチームの一部です、正直。

彼と一緒にジャムできるプロジェクトは、彼のおかげで常に次のレベルにあります。だから大きなシャウトアウトです。Kodiakも参加してくれて、だからこれはプレイに入ってくる人々が不足していませんでした。これがこのものの人間要素です、よね?物を作るために集まる人々です。しかし過去には、率直に可能な限り言うと、この撮影は私たちが持っていたタイムラインと私たちが持っていたリソース、またはその欠如にとって不可能だったでしょう。完全に終わりです。

そして私はこのようなビデオをやってきました。ポップカルチャーをパロディにしているところです。何でも。Tonight Showでそれらをやったことを知っています。私は毎年任天堂のためにそれらをやりました。他のストリーミングの努力のために。あなたは大規模なヘアとメイクアップを持っているでしょう、ワードローブを持っているでしょう、特別なセットとサウンドステージを持っているでしょう、小道具を持っているでしょう、全VFXチームを持っているでしょう、これらすべてのものを持っているでしょう。

そして私たちがそれらのものを持っていたら、ところで、ビデオをさらに良くすることができたでしょう。しかし現実は、私たちは非常に限られた時間と非常に限られたお金を持っていました。だからワークフローは、ショットリストをまとめることでした、よね?これらは私たちがパロディにするつもりのビデオです。これらは私たちがAIツールを使って自分たちをコンプするつもりのシーンです。そしてすべてはドライビングイメージから始まりました。

だから私たちはseedream、runway、sora、OpenAI画像生成、nano banana、GoogleのGeminiのようなツールのコレクションを使用しました。これらはすべてただ、オフザシェルのAIツールで、私たちはパロディにしていた元のビデオまたは元のイベントのスクリーンキャプを取得して、それから私たちを交換しろと言うでしょう、よね?そしておそらく少し作業をします。時々Face Fusionを使って自分の顔をそこに交換しました。

Kevcapは自分自身のこれらのAIバージョンを作るための独自のルーチンを持っていましたが、基本的にすべてはドライビングフレームから始まりました。そして私たちはこのシーンで、Kevinのクローズアップはこれを言っているでしょう、Gavinのクローズアップはそれを言っているでしょうと言いました。そして私たちはWAN 2.2のようなツールに行きました。これはちょうどこの頃出てきたものか、Runway Act 2です。これはキャラクターの唇や体の動きや腕の動きを操り人形のようにできるプログラムです。

だから私たちはただそれらのドライビングフレームをそこに置き、AIでそれらをドライブし、その最終結果を取って、少しカラー補正、少しポリッシュ、いくつかの特殊効果をかけました。しかしそれがそれでした。つまり、それはあなたと私がA16Zオフィスでポップアップグリーンスクリーンの前に座ってセリフを言っていただけでした。そしてRex、私たちの共同創設者の一人もです。そしてそれをスチルに適用しました。

そしてそれは、それはAIの近似のようなものです。そして時々シーンの壊れ具合がジョークだと思います。しかしそれがほぼそれです。銀色のボールをCybertruckの窓に投げて粉砕するシーンがあります。それはただClingでした。

ステージ上でこの悪い口ひげを持った私のスターティングイメージを与えたので、私のように見えるでしょう。そして彼がボールをそのものに投げると言いました。15回くらい生成しました。最終的に何とか機能するものを得ました。あなたへのシャウトアウトがあります。なぜならKevinがこれでやらなければならなかったことの一つは生成を通り抜けることだからです。そして私たちはこれを百万回言ってきました。

Kevと私は両方ともこのようなプロジェクトを通じて、あなたがやっていることのランダムなスロットマシンバージョンのようなところにいます。適切なものを出すために多くのものを生成しなければなりません。だからそれは多くの試行錯誤です。しかし私は言いたいです、長い間テレビプロデューサーだった人として、もしこのチームを集めてこのものを作らなければならず、それをすべてまとめなければならなかったら、それは保守的に見積もって、私たちが実際にやったことに基づいて、実際にかかった費用の10倍はかかったと思います。おそらくそんなにではないかもしれません。5倍から7倍くらいです。

そうです、実際には10倍だと思います。そうです、そしてそれについてクレイジーなのは、再び、Kevinの指摘通り、短い時間でそれをできたということです。私たちがこれを言っている理由は、それが単にAI制作だけでなく、ものを生成するだけでなく、実際の制作がどのように変わり得るかを示しているからです。

そしてそこにいる誰かがこれを聴いているか見ていて、私たちがこれをどうやったかのより具体的なステップバイステップの詳細を望むなら、私たちは喜んでそれをどうやって行うか理解すると確信しています。実際、時間があるときにこれのステップバイステップのウォークダウンを作れるYouTubeビデオがあるかもしれません。

しかしこの大きな部分、Kev、私が言いたいのは、グリーンスクリーンで撮影することは、私は違いを生むと思います。もし誰かがリップシンクをどうやって上手くやるかを理解しようとしているなら、もしあなたがそこにいるクリエイターで「どうやってこれらをより良くできるか?どうやってそれがそんなに良く見えたのか?」と思っているなら、実際に操れる実際の人形の顔を持つことは、このプロセスにとって非常に価値のある資産だと思います、よね?

そうです。つまり、ただ本当に高解像度のあなたの口のクリーンな映像です。もしそれがあなたが求めているものなら。またはスターティングポジションが操縦しようとしているスチルにマッチすることを確認することです。なぜなら時々これらのアプリで、人の手が見えないスターティングスチルを持っていて、突然手を期待しているとき、それらは不釣り合いか変になるからです。そしてもしそれがあなたが求めているものなら、素晴らしい。

しかしこのプロセスについて私が本当に興味深いと思った一つのことは、それが機能したということです。しかし私は非常に幸運です。あなたもこの点でそうだと思います。私たちはこの制作の反対側、伝統的な側との経験があります。そして私が最も楽しかったのは、つまり、結果を見ることで多くの楽しみがありました、誤解しないでください。そして私たちがまとめたものを本当に誇りに思っています。

再び、制約を考慮すると、しかし私が最も楽しかったのは、Gav、実際にセットでぶらぶらすることでした。他のクリエイティブと一緒に物事を思いつくこと、よね?そしてそれはこのパイプラインが本当に説明しないものです。グリーンスクリーンで私がやった一つの馬鹿げたことがありました。頭を傾けて笑顔で、ぎこちなく微笑みました。

Kevinは、彼の功績として、それを取って「ああ、彼はそれをラフの一つに入れたので、AIに適用した」というような感じでした。このワークフローで進みながらシーンをアドリブしたり、はいと言ったりするのは本当に難しいです。だから伝統的なワークフローでは、おそらくもう少しエンターテイニングか面白いものを得たでしょう。または髪と一緒にばかげた瞬間があったでしょう。Clueyビデオで女性として交換された私の顔に髪がぶら下がっている瞬間があったでしょう。そのあれこれです。それで遊べたでしょう。

このもう一つのワークフローではそれを得られません。だから効率性と出力を、リソース制約を賛美できるだけ、もしこれが唯一の制作スタイルだったら、私が非常に恋しく思うこのものの全く別の世界があります。

だから両方が存在して、うまく付き合って、それらが良い様々な理由で良くなる世界があると思います。そしてあなたの指摘通り、他の人々と創造することは対面で楽しいことがあります。だからもしあなたがAIクリエイターなら、世界さえあるかもしれません。AIクリエイターミートアップがたくさんあることは知っていますが、3人で何かを作ることがどんな感じか見て、一緒にジャムしてください。そしてあなた方それぞれが物事をやるようにしてください。なぜならそれは大きな違いを生むと思うからです。

そしてまた、グリーンスクリーンで撮影するというその点で、あなたと私が互いに面白いことを追加するためにお互いにノートを与えた瞬間がありました。そしてもしあなたがコメディセットのようなセットにいたことがあるなら、ジョークをピッチして、誰かがそれを取るか取らないか、または彼らは別のジョークを考えるでしょう。そしてそれが創造を超楽しいものにする一部です。

だからあなたが正しいと思います。それはここで残す良いノートです。創造は機械である必要はありません。人々だけである必要はありませんが、両方のものが一緒にいるこの奇妙なミックスがあって、本当に良いものになり得ます。だから、それが今日のすべてです、みんな。来週お会いしましょう。

And Thenをチェックしに行ってください。そしてKevin、別れの言葉はありますか?And Then Chat and then. Chat。ワイルドな女性たち。リッピングと、ワイルドな女性たち。何?分かりました。さようなら、みんな。また次回お会いしましょう。ヘドニズムのクリップを知っていますか?分かりました。そうです。分かりました。

コメント

タイトルとURLをコピーしました