ハリウッド業界の内部関係者がAI動画革命の秘密を暴露…

世界モデル・マルチモーダル
この記事は約34分で読めます。

この動画は、AI動画生成技術の革命的な進歩について、ハリウッド業界に精通したTheoreticallyMediaのTim氏へのインタビューである。AI技術がアーティストコミュニティに与える影響、従来の映像制作プロセスの変化、そして個人や小規模チームでも高品質なコンテンツ制作が可能になる未来について詳しく議論している。

  1. AI復元による失われた映像の再生
  2. アーティストコミュニティの反応と感情
  3. 仕事の変化と新しい機会
  4. 個人制作の可能性とソーシャルメディアの活用
  5. 創作における所有感と技術の融合
  6. バーチャルセットと制作技術の民主化
  7. リック・ルービンとバイブコーディング
  8. 創造性と味覚の重要性
  9. アートと制作の概念
  10. 創造性とリミックス文化
  11. ジャンルの進化とAI動画の可能性
  12. リミナルスペースとAIが作り出す恐怖
  13. 衰退するジャンルの予測
  14. 歴史的正確性と制作の課題
  15. 新しい俳優による既存映画の再制作
  16. バイブコーディングと有名人による制作
  17. 名前の力とコンテンツ制作
  18. 時計の10時2分問題とAIの課題
  19. V3の能力とChatGPTモーメント
  20. 動画生成の革命的進歩
  21. 新しいビジネスの可能性
  22. マーケティング分野での活用
  23. エンターテイメントとしてのAI動画
  24. コメディとホラーの可能性
  25. 時計の10時2分問題の実験
  26. 物理学の理解とワールドモデル
  27. 動画生成の技術的側面
  28. この週に印象に残ったAI生成コンテンツ
  29. 注目を集めた作品の分析
  30. 実験的コンテンツの魅力
  31. 編集技術とツールの推奨
  32. 技術進歩の予測と現実
  33. 終着点についての考察
  34. 魂と感情の表現
  35. マーケティング分野での先行的活用
  36. 広告から芸術的創造への移行
  37. 新しいIPを作る黄金時代
  38. スタジオシステムと創造性
  39. 偉大なIPの創造時期
  40. 現在の機会とインフルエンサーの役割
  41. ブランド認知度と視聴者の受容
  42. NetflixとAI動画の未来
  43. 技術的平等性と創造機会
  44. Fable StudiosとShowrunner
  45. Thistle Gulchプロジェクト
  46. アルファエボルブとLLMシステム
  47. パーソナライズドコンテンツの未来
  48. リアリティショーモデルと受動的視聴
  49. 選択疲れと視聴習慣
  50. エージェント的TVの限界
  51. VRと新しいエンターテイメント分野
  52. ディストピア的未来への反論
  53. パート2への予告

AI復元による失われた映像の再生

この映像は永遠に失われたと思われていました。制作は奇妙な機材の故障に悩まされ、いたずら好きな猫が偶然スピーカーをミュートにしてしまった時、すべてが停止しました。映像は回復不可能で、音声だけが残されていました。これからご覧いただくのは実際の出来事、その日に起こったことの実際の音声記録です。視覚的な部分は人工知能の魔法によって復元されています。

こんにちは、ウェス・ロスです。今日はディラン・キュリアスと一緒に、この2部構成のポッドキャストでTheoreticallyMediaのティムさんとお話しします。AI生成コンテンツが現実と区別がつかなくなる未来について、そしてそれが私たち全員にとって何を意味するのかについて話していきます。

アーティストコミュニティの反応と感情

ティムさんに質問があります。多くのアーティストが怒っています。AIに起こっていることに対して非常に怒っているようです。まるで一つの運動のようで、中には暴力を呼びかける人も見かけました。100%本気かどうかはわかりませんが、データセンターを爆破しろとか、インターネットをといった具合です。そうですね、確かにそうです。何でも言えますが、そこには非常に強い感情があるようです。

あなたはアーティストコミュニティにいて、これについてずっと詳しく知っているでしょうし、あなたのチャンネルを見ている多くの人たち、その多くが自分をアーティストだと考えていて、彼らは何かを制作しています。この温度感について、あなたの見解はどうでしょうか。人々はこれをアーティストにとって良いものとして見ているのか、それとも全く恐ろしいものとして見ているのでしょうか。

私は振り子の動きを見てきました。判断するのは常に難しいです。なぜなら、これまたインターネットの話で、問題の右と左で極端で大げさな意見を聞くことになるからです。一方で、ほとんどの人は正直に言って真ん中にいると思います。

仕事の変化と新しい機会

私はいつも言っているのですが、これは仕事を奪うものではなく、むしろより多くの仕事を可能にするものだということです。ハリウッド時代に、ジョニーという男がいました。ジョニーは大麻を吸う人でした。毎日仕事にラリった状態でやってきて、ジョニーの仕事はロトスコーピングをすることでした。彼がやっていたのは写真から人を切り抜いて、背景を除去することだけでした。それが彼の仕事で、他のことを頼んでも、いえ、ジョニーはクールな奴でもありました。間違えないでください。彼はスノーボードに夢中で、それが彼の情熱でした。これは彼の仕事だったんです。

ジョニーのその仕事はもう存在しなくなりますが、それは大丈夫です。なぜなら、それは本当に彼の情熱ではなかったからです。1日8時間ロトスコーピングをすることが情熱だという人がいたら、それがあなたの情熱だというなら、どんな世界に住んでいるのかわかりません。とてもシンプルな世界なのでしょうが。

自動化の側面については、確かにいくつかのエントリーレベルのポジションにとって問題になるでしょう。しかし機会もあります。私はソニー・アニメーション・スタジオにいました。『Cloudy with a Chance of Meatballs 2』の制作中でした。実際の作業部分、つまり実際の主力部分は、まるでフットボールスタジアムのような大きさで、立ち机が並び、並び、並んでいます。フットボール場ほどの立ち机がずっと続いて、アニメーターが作業している様子は、少しオーウェリアン的に見えました。

その多くは4、5、6年後には必ずしも存在しないでしょう。しかし存在するだろうと思うのは、より小規模な制作会社がたくさんできることです。10から15人のアニメーターや人々を抱えたより小さなアニメーションスタジオが、より多くの素材、より多くのクライアント、より多くのコンテンツを作成するのです。

個人制作の可能性とソーシャルメディアの活用

それが良いことなのか悪いことなのかは、判断が分かれるところだと思います。しかし、利用可能なすべてのオプションを考慮すると、ソーシャルメディアプラットフォームやストリーミングプラットフォームなど、それは多くのスペースであり、そこで作成されるべきコンテンツがたくさんあります。

そういった仕事は依然として利用可能だと思いますし、3、4人のチームや一人でも、独自にコンテンツや映画やフィルムを作成し、独自の印を残すことができる能力、これは今まで見たことのないもので、それも可能になるでしょう。

創作における所有感と技術の融合

コンテンツ作成についてのあなたの個人的な感情はどうですか。iPhoneやカメラで外に出て撮影し、いくつかのクリップをまとめることと、プロンプトで作成することを比較した場合、同じような所有者意識を感じますか、それとも何か欠けているものがありますか。

私はいつもそれを推し進めています。それも楽しい部分です。最新の出来事についてのビデオを撮影することにここで縛られているため、あまり機会はありませんが、機会があるときは、AIとスマートフォンでできることは非常に注目に値します

Sky Glassという会社がありました。残念ながら最近閉鎖しましたが、最もクールなことの一つをやっていました。撮影すると、即座にあなたをロトスコーピングして切り抜き、3DのUnrealの背景を後ろに配置してくれるのです。プロンプトで指定することも、彼らが持っているテンプレートのようなものを使うこともできました。それは3Dなので、動き回ることができ、その環境の中にいることができました。

バーチャルセットと制作技術の民主化

例えば時代衣装を着て、1930年代や40年代のノワール探偵事務所にいるような場合、バーチャルセットで撮影できるのです。基本的には、ディズニーの「ボリューム」、『マンダロリアン』やその他すべてを撮影するもののより安価なバージョンです。

結果は少しぎこちないですが、それを別のAI動画フィルターに通すと、かなりクールに見えるものができあがります。2500万ドルの長編映画のように見えるかというと、そうではありませんが、クールで、あなたのストーリーが伝わります。

『マンダロリアン』のステージは1日に使うのに数十万ドルかかりますが、スマートフォンでそれを再現できるなら、それは絶対に信じられないことです。

リック・ルービンとバイブコーディング

リック・ルービンがバイブコーディングのチャンピオンとして登場していることについて、どう思いますか。その話を追いかけていますか。

はい、流し見程度には見ています。それは世界で最もリック・ルービン的なことではないでしょうか。私は彼に非常に魅力を感じています。彼のインタビューを少し見たのですが、リック・ルービンを知らない人のために説明すると、彼はあなたの好きなバンドが何であれ、おそらく何らかの役割を果たしています。メタリカ、エミネム、デフ・ジャム・レコード、スレイヤーなど、人々が聞いた最大のもののリストを延々と続けることができます。

創造性と味覚の重要性

System of a Downのサージ・タンキアンが思い出すこの話があります。彼らの初期の大ヒット曲の一つ、名声への突破口となった「Chop Suey!」の完成に苦労していました。リック・ルービンの家にいたとき、リックが「じゃあ、私の図書館に行ってみたらどうだろう」と言いました。彼はたくさんの本を持っていました。

「本を見つけて、本を選んで」とサージに言いました。彼が本を手に取って読み始めると、聖書的な何か、「なぜあなたの心の中で私を見捨てたのか?」のような内容で、それが「Chop Suey!」の大きなメロディックラインになったのです。

リック・ルービンは技術的なスキルも才能もないが、素晴らしい味覚を持っていると語っています。そして彼はこの素晴らしいものを作り出し、これらの素晴らしいアーティストから味覚を引き出すことができるのです。ある意味で、それは人々がAIモデルで行うことに似ています。彼らはそれを作り出すことができますが、それを引き出すことができ、正しいことを聞き、本当に良いものを得るための味覚を持つ必要があります。

アートと制作の概念

それをアートと考えますか。それは常に難しい問題で、アーティストはそれに飛びつきたがります。私は必ずしもアーティストという称号にこだわりません。実際には、あなたは何かを制作している、AIで何かを制作していると考える方を好みます。

そう考えれば、アーティストというタグは理解できます。アートとは何か、アーティストである資格とは何か。お金をもらったらアーティストになるのか、それで商業アーティストになるのか。クレヨンで何かを取り上げて描き始めた時点であなたはアーティストなのか、そうでないのか。

日光がさしている木を偶然目の隅で捉えたとき、それはアートだったのか。そう、それはアートです。つまり、アーティストという言葉は非常に重荷のある言葉になり得るのです。だから私は、あなたは何かを作り出している、何かを制作している、何かを作っていると考えることを選びます。

創造性とリミックス文化

時には流れに逆らって行かなければならないような感覚さえあります。「それはアートだった、そして今は他のみんながやっている、もうアートではない、今度は他のことをしなければならない」という感じです。

つまらないアートを作ることもできると思います。退屈なアートを作るのは非常に簡単です。私はコンテンツという言葉が嫌いですが、この時点では、何を作ろうとも、それはコンテンツなのです。それはそれで、現実的です。

プロンプトエンジニアリングの時代を覚えています。プロンプトエンジニアリングコースを受講しろという人たちです。そういう人たちはみんないなくなりました。しかし、リック・ルービン的な側面があると思います。Midjourneyを使った創造性は、絶望的なアイデア、視覚的アイデアを取り上げて、何か新しいものを作り出すためにそれらをプロンプトで呼び出す方法を知ることです。

それはリミックスのようなものです。インドの文化を少し、西部の、文字通りカウボーイ文化を少し、そしてバイキングを少し投げ込んで、そこから何が出てくるかを見るのです。それが何か新しく興味深いものになります。

ジャンルの進化とAI動画の可能性

すべてのジャンルが同時に衰退すると思いますか。これらのツールを手に入れた今、ロマンス、アクション、西部劇がすべて同じペースで進化すると思いますか、それとも一つが先導し、いくつかが最後になると感じますか。

実際、過去48時間以内にこのことを考えていました。もし二つのジャンルがAIの初期段階で大成功すると賭けなければならないとしたら、ホラーとコメディだと思います。それがただ大成功するでしょう。

リミナルスペースとAIが作り出す恐怖

なぜなら、それはすでに、リミナルスペースと呼ばれるものの非常に怖いものを見たことがあるからです。AIはそれらをより良く生成します。自然にそれを行うと思います。リミナルスペースの全体的なアイデアは、私たちが意味を割り当てがちな何かだからです。教室に行けば、これは私たちが座る教室だと思います。同じ空間を夜に訪れると、文脈から外れているため、脳にとって不気味な感じがします。

AIが生成するもののほとんどは、それらのリミナルスペースを生成するのが簡単です。なぜなら、それにとって文脈がないようなものだからです。

コメディについても、最近見たものがあります。ティム、あなたがリツイートしたと思うので、1980年代、1990年代の昔の学校のようなニュースチャンネルでした。火事があって、「マイクを持ったあなた、手伝ってください」のような感じです。

AIでそのような愚かで面白いことを作るのは簡単なので、私はその二つが主要なものだと賭けるでしょう。アクションは難しいです。アクションシーンを見たことがありますが、それが最も難しいことなので、もっと時間がかかるかもしれません。

衰退するジャンルの予測

私が衰退すると思うものの反対の道を行くとすれば、サイバーパンクとSFです。なぜなら、それらは生成するのに非常に明白な二つだと思うからで、この時点で私たちは皆、それらを非常に多く見てきたため、人々は雨に濡れたネオンの街と、黒い革を着てロボットの目をした人々が歩き回るのに少し興味を失っているからです。それが私たちが徐々に段階的に廃止されるのを見るものだと思います。

歴史的正確性と制作の課題

歴史的正確性を生き生きと再現することについてはどうですか。本当にスマートなシステムがローマを再現しようとするのを楽しみにしていますか。

私はチャンネルでこれを常に受けます。それは得意ではないからです。第二次世界大戦に非常に詳しい人たちがたくさんいて、彼らは詳細志向です。「それは正しい制服ではない、それは正しい飛行機ではない、それはその飛行機の正しい翼ではない」という具合です。そして、それは歴史なのです。

ヒストリーチャンネルなどで見るような、ローマのドキュメンタリーのような正確さは可能だと思います。第二次世界大戦の再現ドキュメンタリーのようなものです。面白いことに、第二次世界大戦については多くの参考資料がありますが、細部は常に間違っています。

だから広範囲の概要的なものには良いと思いますが、歴史的正確性を維持しようとしている人、そしてそのタイプの素材を生成することに非常に興味を持っている人たちにとって、彼らは正確性を求めています。それも完全に理解できます。

新しい俳優による既存映画の再制作

同じ映画を新しい俳優で制作することについてはどうですか。『Happy Gilmore』をジェニファー・アニストンが主演するような感じで人々が作り出すのを見ますか。

最初はそこに新奇性があると思います。それは常に「あなたがスター・ウォーズに出演する、あなたがジョン・ウィックのスターになる」という全体的なもののの一部でした。そして、それが少し出現するのを見ると思います。

しかし、それが非常に長くは続かないと思います。なぜなら、その素材を生成しようとする会社にとって多くの費用がかかり、NetflixやNetflixが行っているとしても、それを行うのに必要な予算と、数人の人が「ああ、それはクールだった、動かなかった、消そう、オリジナルを見よう」と言うのとでは、私はそれが一時的な流行だと思います。

バイブコーディングと有名人による制作

バイブコーディングで、その全体が話題になったとき、ピーター・レベルズの『Fly Peter』という飛行機ゲームが広告で月に8万ドルほど稼いでいたという話がありました。彼がバイブコーディングで作ったシンプルなシミュレーションでした。

一部の人々は、それがそんなによくやっているのは、そんなに高度なゲームだからではなく、ピーター・レベルズの知名度のためだと文句を言っています。

知名度の高い人々、偉大な思想家である人々、あるいはスポーツやその他の分野で有名な人々が制作する新しいジャンルが開かれるのだろうかと興味深く思います。コービー・ブライアントは何らかの映画制作に参入しようとしていたかもしれません。彼はそれについて話していました。

以前はそのようなものを制作できなかった誰かが、映画やコンテンツの制作を決定するということを想像しますか。ティム・フェリスがもしご存知であれば、彼が作成しているもの(名前は言いたくありませんが)の創造について話していますが、それは興味深く聞こえます。彼は素晴らしい世界を作り、それは素晴らしいストーリーラインになりそうです。

名前の力とコンテンツ制作

私はコンテンツという言葉をできるだけ嫌いですが、コンテンツにおいては、誰でも、筋肉を持っている人なら誰でも、ティム・フェリスには日々何億人ものリスナーの聴衆がいるので、彼の映画に向かう組み込みの聴衆をすでに持っています。

レブロン・ジェームズがAI映画を作りたいと決めたら、もちろん人々は彼の名前のために即座に洪水効果を得るでしょう。一方、ディランが作ったら、ディラン、あなたには聴衆がありますが、私は見るでしょう、私は見るでしょうが、明らかにレブロンの映画の方があなたのものよりも少し針を動かすでしょう。

すでに私はそれを見始めています。まだ浸透中の名前がいます。ハリウッドではまだ少しタブーだと思うからです。しかし、AI生成フィルムなどに取り組んでいる有名ブランドの人々がいます。

時計の10時2分問題とAIの課題

悪名高い時計問題、生成器を常に悩ませてきた10時2分問題について知っていますか。時計の文字盤の10時と2時の針のスマイリーフェイスのことですか。

これについて学んで、非常に魅力的だと思いました。ウェス、あなたがこれについてどれだけ知っているかわかりませんが、これらのモデルは常に10時2分である時計の非常に多くの画像で訓練されたため(それが時計を宣伝する方法ですが、実際には時計がどう動くかではない)、どんな時間を求めても、画像を生成するのが非常に難しいのです。

この素晴らしいV3 Googleモデルが実際にそれを解決できるかどうか見てみましょう。時計を入れて、何が生成できるか見てもらえますか。

V3の能力とChatGPTモーメント

私たちはGoogle’s flowを使ってそれを試してみます。Geminiの$125月額プランを支払っている人はいるかわかりませんが、はい、私は支払っています。Geminiで5つの無料生成を得られます。テキストから動画への変換のようなもので、すべての派手な機能はありませんが。

このV3をChatGPTモーメントとして感じましたか、それとも段階的なアップグレードとして感じましたか。いえ、私は絶対にこれがChatGPTモーメントだと感じており、実際にそれについて非常に興奮しています。

なぜなら、私がチャンネルでいつも受ける質問の一つは、人々が「これで何を構築すべきか、これで何をすべきか」というものだからです。聴衆の一部はビジネスを構築し、お金を稼ぎ、それで信じられないことをしたいと思っているからです。

動画生成の革命的進歩

GPTストアが発表されたとき、最初は「これは興味深いかもしれない、Appleのアプリストアのようなものだ」と思いましたが、うまくいきませんでした。実際にはどこにも行きませんでした。コーディングなどでは、すべてが非常に速く変化しているため、それがどこに向かうかを予測するのも困難です。

しかし、V3でオーディオとビデオを組み合わせた動画については、私が見てきたものは絶対に世界を超越しています。Twitterでパプリント商業をやったPJという男、彼がプロンプトしたスタンドアップは、ああ、私の神、絶対に世界を超越していて、信じられない視聴回数を得ています。

ハリウッドに影響を与えると言い続けてきました。障壁を取り除いている、堀を取り除いているという意味で。素晴らしい映画を作ることができるようになり、コネクションも必要なく、それほど多くの技術的知識も必要なく、お金も必要ありません。

新しいビジネスの可能性

確実に5年以内に、必ずしもメディアにいない人々によって始められた会社が数百万で売られる、または数百万を生み出すのを見ることになると感じています。そして、はい、私には多くのアイデアがあります。だからこそティムと話したかったのです。私は狂いすぎているのか、それともこれがまさに向かっている方向なのか。

いえ、より小さな独立スタジオが素材を制作できるようになるのを確実に見ると思います。現在、それがあるところは、広告、マーケティングのような分野の人々です。それが今後数ヶ月から1年ほどの間に本当に爆発するのを見ることになるでしょう。

マーケティング分野での活用

VOは興味深いです。なぜなら、少なくとも今のところ、16:9のワイドスクリーンでのみ生成し、縦型ではないからです。明らかに、マーケティングやプロモーション的なものの多くでは縦型動画が欲しいのです。その障害が乗り越えられれば、他にもいくつかのことがあります。

IOプレゼンテーションで、製品をアップロードできる参照機能を披露しました。このコーヒーカップを撮って、そのコーヒーカップの写真をアップロードし、キャラクターにそのコーヒーカップと相互作用させることができます。これは実際にはライオンキングの舞台ショーからのものなので、Disneyへの無料宣伝です。彼らにはそれは必要ありませんが、このコーヒーカップを持っていることで訴えられるかもしれません。

エンターテイメントとしてのAI動画

その機能が実装されて、あなたのスーパーモデルキャラクターや誰でもがあなたの製品と一緒に、それについて証言スピーチをするような場面では、TikTok、Instagramのすべてで、野火のようにそれらすべてに広がることになるでしょう。

しかし、あなたは今、エンターテイメントのためにAI生成された動画を見ていますか。以前は、私はいつも「それはAIのように見えて興味深いが」という感じでしたが、初めて私はただ楽しんでいます。フィードに出てきて、見て、次に進みます。シームレスに溶け込んでいます

私は見ています。しかし、この分野を非常に密接にフォローしているからで、それと非常に絡み合っているからです。しかし、今では、YouTubeで見るVioのようなコンパイレーションリールを見ます。特にプロンプト理論的なもの、この時点で模倣者に模倣者に模倣者が非常に多いため、少しやりすぎになっていると感じますが。

コメディとホラーの可能性

時々、私は昔のジャンキーなAI動画で楽しんでいたものの一つは、『アメリカズ・ファニエスト・ホーム・ビデオ』のような雰囲気で、呪われた動画を見て、物理が全て間違っていて、人々があちこちで溶けているのを見ることでした。私はそれらのものが大好きでした。

Vioは私が正しくて面白く、魅力的で、注意を引き付けるそのタイプの動画のコンパイレーションを見た初めてのものだと思います。少なくとも2分半ほど注意を保持してくれます。10分から15分のVioクリップになると少し多すぎますが、私は確実に今エンターテイメント価値のために見ています

スタンドアップコメディについてはどうですか。見たことがありますか。はい、見ました。それらはかなり良いです。それらについての流れている理論は、それらはRedditのジョークだということです。RedditがGoogleとその素材でトレーニングできるという取引をしたからです。それらのジョークの多くが実際には本当に皮肉な/お父さんジョークである可能性があります。

時計の10時2分問題の実験

青いビジネススーツの男性が7:30と表示されるアナログ時計を見ているという動画を作りました。時計は逆さまなので、実際に何を示しているかはわかりませんが、7:25のように見えます。面白いことに、まだその10時2分のスマイリーフェイス的な側面を持っているので、それを隠すクリエイティブな方法を見つけ出したようです。

物理学の理解とワールドモデル

では、怪物のような何かを試してみましょう。Clingで生成されたのを見ました。時計の顔をした怪物で、実際に体のあちこちに複数の時計を持っていたので、それを隠すことはできません。時計の顔をしているように見える怪物、または時計博物館の時計の顔をした怪物のような映画的ホラーフィルムはどうでしょう。

ホラージャンルはAIビデオで狂ったことになると感じます。なぜなら、意図せずに時々怖く見えるからです。だから彼らはそれで狂ったことをするつもりだと思います。

時計の問題に非常に興味があります。なぜなら、私はしばしば疑問に思うのです。それは実際にこれらの2次元動画から世界の物理学を学習しているのか、それとも次の単語予測や次のトークン予測のようなものなのか。それとも実際に意味を意味論的に理解しているのか。

もし実際に現実世界の時計が動くことと、人々が時計をどのように使用するかを理解しているなら、単に生成するのとは非常に異なります。V3が自然にそれを拾い上げているのか、それとも私たちがその不気味な谷を越えているのか疑問に思います。

動画生成の技術的側面

それは有効な質問です。わかりません。Vioは、明らかではありませんが、YouTubeデータで非常に重く訓練されたと思います。そこで起こっているのは確実に次のフレーム予測です。

最近、興味深いことをしているいくつかの論文を見ました。次のフレームを生成する代わりに、最後のフレームを生成し、ほぼ逆に進む、真ん中で出会う2つの異なる拡散ストリームのようなものが起こっています。それらは互いにクロスチェックしています。しかし、それはモーフ問題を解決することについてもっとです。

ワールドモデルのもの、それが私が本当に興味を持っていることです。Googleは確実にそれが彼らがやっていることだと誇示しています。だから、この反復や反復から見るのは、YouTubeデータだけでなく、Google Earthデータと、彼らが引き出すことができる他の多くの異なるモダリティのようなものだと思います。彼らがVioの旗印の下にそれをすべて持ち込むことができるなら、それは、ああ、それは野生的になるでしょう。

この週に印象に残ったAI生成コンテンツ

この週に見たものについて説明してもらえますか。AI生成されたもので心に残ったものは何ですか。

私が見てきたもののいくつかを考えてみましょう。私が見たもののほとんどは、PJによるものでした。彼の完全なハンドルを書くかもしれません。TwitterやXにいるなら、彼のもののいくつかを見たことがあるでしょう。

みんながうつ病と戦うために子犬を手に入れるパプラン商業、それは彼のものです。プロンプト理論のもの多くも彼のものでした。プラスチックのもの、プラスチックベイビーを見ましたか。いえ、今それを入力してください。クラシックは素晴らしかった、はい、それは信じられないものでした。

注目を集めた作品の分析

もし私が注意を引き、何らかの理由で見続けなければならないものを一つ選ぶとしたら、それはただプラスチックでした。あなたたちが先ほど話していたように、私はおそらくAI動画でフル長の映画を見ないでしょうが、小さなTikTokのもの、1分か2分に関しては、人々にとって信じられない関与とスティッキネスを持つと感じます。

プラスチックを見ただけで、すべてのシーンで次のレベル、次のレベルに持っていくからです。ドラマを見ているのか、アクションを見ているのか、何を見ているのかさえわからないけれど、それは良かったです。

子供の手描きが実際の動物に変わるような小さなものを見たことがありますか。子供版の牛のようで、それから実際の牛になりますが、すべてバランスが悪いけれど、実際の牛のように動き、実際の牛のように見えるような感じです。それらは狂っています。

実験的コンテンツの魅力

確かに、面白いのは、メタパペットのようなクラシックが、昔のAdult Swimのコンテンツを本当に思い出させることです。午前4時のAdult Swimのような、大麻を吸った人たちが座って『Too Many Cooks』を見たり、熊の未編集の映像を見たりするような、本当に狂った実験的な映画でした。それらはこの種の躁病的なエネルギーを持っていました。

V2を使って、何をしているかを知っていて、編集方法を知っていて、映画製作者として知っている人の手にあるとき、それは本当に信じられないコンテンツを作ることになるでしょう。実際にクラシックを見ると、あなたが言ったように、ウェス、このシナリオで始まって、別のシナリオにシームレスに移行する前に約45秒から1分続くと思います。

その後の各続くシナリオはより多く、より不合理になりますが、動画出力の品質は同じに見えます。だから、それはADHD脳を彼らが見ているものに関与させ続ける方法です。これは、バイラルなYouTuberプロンプト理論動画をやっているほとんどの人が理解していない部分です。彼らは人々が話している8秒のクリップをただつなぎ合わせているだけです。

編集技術とツールの推奨

長編ナラティブを構築するのに最良の方法を今お勧めするとすれば、どのようなツールをお勧めしますか。

昔ながらの編集です。DaVinci Resolve、Premiereのようなものです。つまり、まだ必要です。すべてのシーンをプロンプトできます。私がこれらすべてのものに常にアプローチしてきた方法は、それは本当にほぼ編集の練習だということです。

一貫性、物理学、AI生成動画で遭遇するその他すべてのランダムなもののため、多くの生の素材を生成していて、その時点でそれをフィルタリングしなければなりません。それは本当により編集の練習だと思います、何よりも。だから、AI動画の本当のスキルが発揮されるのは編集です。

技術進歩の予測と現実

変化の速度は、あなたが期待していたものでしたか。2025年6月にV3レベルにいると、ある種推測していましたか、そしてそれがどこに向かうと見ていますか。

2022年12月に尋ねられたとしたら、私は今いるところを今から4年先に置いただろうと言えるでしょう。だから毎年、次のものが出るたびに、何であれそれまでのタイムラインのようになります。

それは22年に、V3がおそらくまだ2年先だと言っただろうというもう一つのことです。それは、コメントでよく戦っていることですが、常に「まだそこにない」があります。ウィル・スミスがスパゲティを食べることから「まだそこにない」になりました。

それから「指がめちゃくちゃで、眼球がどうのこうの、話せない、これもそれも」でした。ゴールポストは常に後ろに動いているので、多くの場合、私は自分自身に考えます。AI動画の最終目標は何なのか。AI動画の終着点はどこなのか。

終着点についての考察

低予算のNetflixショーのように見える時なのか、最新の『ミッション:インポッシブル』映画のように見える時なのか。それがみんなにとって「そこ」にある点はどこなのか。私は必ずしも最新の『ミッション:インポッシブル』映画をプロンプトすることに特に興味はありません。

それを見ていませんが、あまり良くないと聞きました。しかし、例として使っているだけです。でも、あなたたちはどこだと思いますか。AI動画の終着点はどこだと思いますか。どの時点で「それだ、我々は終了だ」と言うでしょうか。

魂と感情の表現

それは魂を持っているように感じる時、のような、説明するのが難しいです。なぜなら、それは曖昧なことですが、時々V3は私に「ああ、それは本物のように感じた」と思わせるクリップを与えてくれるからです。しかし、ほとんど感情を感じる時、私はそれを嫌います。「あなたは試している、それはきれいだが美しくない、ある意味で完全ではない」のような感じです。

でも、それがいつ魂を持つのかを私が言うのは難しいです。反応と微妙さについて何かがあって、私は知っているでしょう。

マーケティング分野での先行的活用

ティム、あなたがそれを的確に言ったように、広告面がおそらく最初に爆発すると思います。なぜなら、それは私が持ったアイデアの最初のもののようなものだからです。eコマース動画は、ビデオセールスレターで私がビデオを始めるのに本当に役立ったもので、一部の人々はそれを書いて録音するのに5万ドルを請求します。

あなたが製品を得るために有料トラフィックを送るために使用するビデオセールスレターです。10年前でも、GoogleやFacebookからのクリックに費やしている金額よりも少なく、彼らがもっと買っているなら、もっと稼いでいるなら、それは無限のお金で、ただそれをスケールし続けることができると考えて、そのサービスを提供する会社を始めることについて考えたことを覚えています。

AI動画でそれは全く新しいレベルに持っていかれるでしょう。ChatGPTがセールスコピーを書くことは、まだそれほど完璧ではなく、世界クラスの仕事はしませんが、かなり良いです。だから、確実にそのようなものを作成することができます。

広告から芸術的創造への移行

だから、まずマーケティング、広告で適用されるのを見ると思い、それが本当にすべての隙間や隙間、すべてのハック、すべてのトリックを理解し、それから映画製作者や何と呼びたいその新しいジャンル、AI動画映画生成にとって使用可能にするでしょう。

実際に、あなたの言葉「プロデューサー」が気に入りました。アーティストはそんなに重荷のある用語ですが、そのタイプのコンテンツを作成する人々を指すのに、アーティストは少し羽を逆立てるかもしれませんが、プロデューサーは本当にそれを的確に表現していると思います。そのものを制作している人々。

広告が現場を設定し、すべてを理解し、それからより芸術的創造的なものが入ってくるのを見ると思います。それが私がそれを見る方法です。

新しいIPを作る黄金時代

ウェス、それは私に以前考えたことがなかったアイデアを与えました。今は新しいIPを作る黄金時代なのでしょうか。数百の異なる男性女性キャラクター、犬、蟻、漫画を出すべきで、それらのいくつかは人々を金持ちにするものに進化するでしょうか。

それは今、私たちがいるところについて最も frustrating なことの一つです。ウルヴァリンやスター・ウォーズやバットマンとのAI動画を作り続けている人々です。無限の想像力を持って遊ぶことができるのに、なぜまだそれを追いかけているのですか。

今は何でも作りたいものを作ることができる時です。バットマンを夢見るのをやめてください。バットマンは良いです、たくさんのバットマン映画があります、もっとバットマン映画が来ます。自分のものを作ってください。だから、それについての私の愚痴です。そのゲームで遊ぶのをやめてください。

スタジオシステムと創造性

私はそれに100%賛成です。スタジオは非常に集中しているため、お金を稼ぎたがっています。何かリハッシュされたアイデアから始めれば、これで収益を上げることができるとわかっているので、全く新しいものはコイン投げのようなものです。その観点から私は理解しますが、それはこの場合、豆を数える人対アーティストのようなもので、スタジオを所有しているため豆を数える人が勝ちます。

これはすべてをひっくり返します。なぜなら、今は誰でもプロデューサーになれるからです。クレジットを支払っていて、ここやそこで少し費用がかかりますが、数百万ドルではありません。

偉大なIPの創造時期

すべての偉大なIPが90年代に起こったような気がします。私たちがまだプレイしているすべてのビデオゲームのように、Baldur’s Gate 6、Doom 7、その時代からのもの。なぜ、人々は創造性を失ったのでしょうか。人々がそれを思いつけないということではありません。

50年代や60年代か、どの時代かわかりませんが、漫画を作っていた人々は、私たちは今それを知りませんが、これらの会社のために数十億ドルを作り出しました。なぜなら、バットマンが1つのフレームで相互作用し、別のフレームでする小さな脇役をすべて投げ出す自由があったからです。シンプソンズがそこでこの巨大な世界を構築した方法のように、彼らはただそれを推し進め、それからすべてが分岐して、この厄介で超収益性の高い宇宙になります。

現在の機会とインフルエンサーの役割

コミックの人々の説明では、つまり、それらの人々はすべて企業によってダマされたということです。つまり、ウルヴァリンを作ったレン・ウェインだったと思いますが、彼らは彼に数百ドルから25万ドルの間で小切手を切ったと思います。何十億ドルの価値があるこのキャラクター、ウルヴァリンのために。

それは悲劇的で最悪です。だから私の一部は常に、巨大な企業IP や会社に吸い上げようとするのをやめろ、なぜなら彼らは最終的にあなたに報酬を与えることは彼らの最善の利益ではないからです。代わりに自分のものを作って、それが十分大きくなれば、彼らはあなたのところに来るでしょう。

あなたがメガバイラルヒットを作れば、ある時点で何らかのスタジオが電話をかけてくることは保証されており、その時点で少なくとも交渉できて、あなたが指揮を執ることができます。特に、YouTubeやTikTokなどのプラットフォームで自分の聴衆を構築できるなら。

ブランド認知度と視聴者の受容

私はアントマンの予告編を見たとき、私はあまり大きな漫画本の人ではなく、「アントマン、それはとても愚かに聞こえる、なんて愚かな名前だ」と思いましたが、それから「でもそれは文字通りバットマンで、とてもクールに聞こえる」と思いました。

しかし、十分なコマーシャルが出て、それが話題になり、今それを見た後、私はそれを消化しました。しかし、理解できるまで乗り越えなければならない小さなハンプがあり、十分に吸収するまで、未来のインフルエンサーは大きなシステムを迂回してその方法で入ることができるかもしれません。

NetflixとAI動画の未来

その他の側面も、私の子供たちが見るのが好きなシリーズがあります。『Murder Drones』という伝統的なアニメシリーズで、YouTubeなどでリリースされました。それらのエピソードをすべてAmazon Primeでリリースすることを見ました。

私にとって、それが本当に最近のパイプラインです。自分のものを作って、YouTubeでリリースして、配信のために、十分大きなヒットがあれば彼らがあなたのところに来るか、彼らにピッチすることができるかもしれません。

Netflixは秘密ではないと思いますが、私は何のNDAの下にもなく、彼らは私と話したことがありませんが、彼らが独自の小さなAIアニメーションスタジオを始めていることを知っています。巨大なショーや何かをやろうとしているとは思いません。『Love Death and Robots』と『Secret Level』のようなもの、最近出てきた2つのCGIショーのラインに沿った何かだと思います。

技術的平等性と創造機会

そこで興味深いのは、この時点で3、4人のアーティストが、Netflixが使用しているのと同じツールセットを使用していることです。何をしているかを知っているAIツールを使った3、4人のアーティスト、それは同じ競技場です。

Fable StudiosとShowrunner

Fable StudiosとShowrunner、マット・ストーンとトレイ・パーカーのスタジオについて何か知っていますか。ああ、いえ、それは実際にマットとトレイとは関係ありません。彼らは自分たちの別の実体です。

彼らがやろうとしていたのは、より無限のストーリーテリングのようなものを作ることでした。彼らはたまたまそのサウスパークの視覚的スタイルを選んだのは、その2Dアニメーションのものは複製するのが非常に簡単だからだと思います。

Thistle Gulchプロジェクト

当時の彼らの技術は本当に魅力的でした。すべてStable Diffusionで、背景を生成し、キャラクターを生成し、いくつかのアニメーション、そしてChatGPTエンジン、11 Labsを音声に使っていたと思います。

彼らが取り組んでいて、私がそれよりも実際にクールだと思ったが、もうどこまで開発が進んでいるかわからないプロジェクトは、Thistle Gulchと呼ばれるプロジェクトでした。それはもっと3Dで、ゲームエンジンについて、西部劇でした。

基本的に、各キャラクターが独自の動機を持ち、西部の町、謎の殺人、保安官がいるが、主人公はいません。あなたはこれらのエージェントが互いにぶつかり合うのを追いかけているだけで、エージェントがどこに行くかに影響を与えることができますが、3D空間での自由に動き回るカメラでした。

それは本当に魅力的で、私が彼らがもう少し寄りかかり始めることを希望している種類のものです。本質的に、それがdeck全体のアイデアのようなものです。VRグラスをかけて、あなたの周りで殺人ミステリーに取り組んでいるAIエージェントがいて、歩き回って、それぞれと話すことができます。それが待ちきれません、それは素晴らしいでしょう。

アルファエボルブとLLMシステム

彼らは同じ基盤技術に基づいていて、いくつかの異なるテーマを持っていましたよね。サウスパーク、西部のもの、他にもいくつかありました。彼らは全体の町を複製しようとしています。スタン、カイルが走り回っていて、マップで彼らを見ることができ、マップで他の誰かに会うと、ChatGPTやその時使っていたGPT-4が対話を生成し、11 Labsが音声化し、アニメーションに入れます。

Alpha Evolveなどを見た後の私の理論では、これはすべてが向かっているところです。LLMと何らかのスキャフォールディング、彼らが使用するツールのコレクションを作成し、そのシステムは100の異なるアイデアを作成することが本当に得意です。

100の異なるスクリプトを作成し、それが良いかどうかを評価する自動化された方法を見つけることができれば、これは面白いか、そしてそれを判断する何らかの特定のものを持って、それをストーリーにまとめる、それがShowrunnerの背後にあるアイデアだと私が正しく理解しているなら、それは非常に効果的になると感じます。

パーソナライズドコンテンツの未来

だから、将来、私はSimpsons.comのようなところに行って、ちょっと数時間チューンインして、チューンアウトするようなものになると言っているのですか。ミルハウスやバートやリサと話したいかを選択し、それが私を街のその部分にズームインさせるのでしょうか。

それはその変種かもしれませんが、彼らのアイデアはもっと、全体が街全体でリアルタイムで展開されることを想像することです。複数の人が異なる会話を持つことができ、ストーリーラインが進行し、カメラは面白い部分だけを拾い上げ、それらを映画にまとめます。

つまり、あなたは全世界をシミュレートし、すべてのキャラクターの存在をシミュレートしている、彼らが歩き回って物事をしているときに、それらの瞬間でそれらをテープに録るために、ストーリーにまとめます。

Moe’s Tavernにいるとき、学校で起こっている面白いことを見逃すでしょうか、それともAIが私の画面をつかんで学校に投げて、それが予測できる最も面白いことを見るようにするのでしょうか。

あなたの選択です。最終的にあなたは実際に選択する人、実際に選択するディレクター、人を使ってそれをすべて使って映画を作ると思います。だから最終製品は映画です、あなたはただそれを見ているだけですが、舞台裏では全体のシミュレーションが実行されていますが、明らかにその時点でそれを何にでも変更できます。

リアリティショーモデルと受動的視聴

これらのリアリティショーがどのように撮影されるかのようになるでしょう。すべてを録画して、後でストーリーラインをまとめます。ああ、それはとても異なるでしょう。

パーソナライズドコンテンツがどれほど大きな問題になるかについては疑問に思います。大衆エンターテイメントの観点から、NetflixのBlack MirrorのBandersntchや、インタラクティブエンディングなどでの他のいくつかの実験のようなものがありましたが、明らかに彼らはそれらを理由があってオフラインにしました。高価で、誰も使いませんでした。

私は常にジョー・シックスパックが仕事から家に帰ってきて座り、「男、ただテレビを見たいんだ」と言うことを考えます。愚かなタイルすべてを見て、「選択をしなければならない、これは最悪だ、ただ座りたかっただけなのに」となることがどれほどあるか。それは多くの人です。

選択疲れと視聴習慣

だから、それが「私のお気に入りの番組を見るために座りたい、そして今どの場所にいたいか、どのキャラクターを追いたいかを選ばなければならない」ようなものになったら、ほとんどの人はただ「多すぎる」と言うでしょう。

みんながDVDで『Friends』を見ることになるでしょう。世界で最もクレイジーなものがあるのに、「80回目にそれを見たいだけです」と言うでしょう。

私の妻も座っています。私の年齢の多くの男性の妻がそうだと確信しますが、彼女はテレビを見ません、彼女はテレビを聞きます。彼女は電話をいじっているか、何らかのクラフトのようなことをしており、銃声のようなものがあると顔を上げて、「彼は死んだ」と言って、また戻ります。多くの人にとって、それはラジオ劇場のようなものです。

エージェント的TVの限界

私たちが、キャラクターが立ち止まって「次に何をすべきか」と言い、あなたを直接見て、答えを待っているようなこのエージェント的TVに移行しているなら、多くの人にとって、多くのそれらのキャラクターは長い間待つことになるでしょう

VRと新しいエンターテイメント分野

私は正直に言って、その多くのもの、ホロデッキの側面は、ただ新しいエンターテイメントの分野になると思います。映画製作を引き継ぐとは思いません、ビデオゲームを引き継ぐとは思いません、私たちが楽しむ異なる体験になるだけです。

私の子供たち、昨年のホリデーシーズン、私の子供たちの年齢の周りのすべての子供、彼らは皆Meta Questをもらいました。それが学校のすべての子供がもらったクールな贈り物でした。彼らはGorilla Tag、Job Simulatorのようなジャンキーなプレミアムゲームをプレイしています。

彼らはしばらくそれをプレイしますが、ある時点でQuestが外れて、Switchが出てきます。または、YouTubeビデオを見に行ったり、NetflixでWednesdayのような番組を見たりします。VRの側面は彼らにとってただの別の形のエンターテイメントです。

ディストピア的未来への反論

だから、みんながゴーグルをつけて歩き回り、バーチャル空間以外では互いに相互作用しないウィリアム・ギブソン的なディストピア的未来は決してないと思います。それは金曜日の夜にあなたと仲間が数時間集まってやって、それから他のことをしに行くような何かだと思います。

パート2への予告

さて、ここで私たちはウォーミングアップしているだけです。インタビューの残り、パート2はディランのチャンネルにあります。彼のチャンネルはDylan Curiousで、エンドカードにリンクがあり、固定コメントと説明欄にもあります。そこでチェックしてください。私たちはもっともっと深く入っていくので、クリックして向こうで会いましょう。

コメント

タイトルとURLをコピーしました