アドビの新しいテキスト・トゥ・ビデオモデルが素晴らしい…(アドビ・ファイアフライ・ビデオ)

AIに仕事を奪われたい
この記事は約9分で読めます。

4,782 文字

Adobes New Text To Video Model Is Stunning.... (Adobe Firefly Video)
Prepare for AGI with me - 🐤 Follow Me on Twitter 🌐 Checkout My website -

ファイアフライビデオモデルは、商業利用に安全に設計された、初めて一般公開されたビデオモデルやねん。これは、ほかのファイアフライモデルと同様に、使用権のあるコンテンツのみで学習されてるんや。今、皆さんの後ろに見えてるものは全て、ファイアフライビデオモデルで作られたもんやで。
そやから、今見てもらったように、アドビのファイアフライビデオモデルは、商業利用のために設計された初めてのモデルで、実際にかなり安全なんや。これに関しては、アドビに脱帽せなあかんわ。というのも、多くのビデオモデル企業は、完全に怪しいとは言わへんけど、映像の出所についてあんまり透明性がないからな。
今日のこの動画では、業界に衝撃を与えたアドビのファイアフライビデオモデルについて掘り下げていくで。アドビマックスイベントで、彼らは既存の製品をさらに良くするための生成AIの新機能をたくさん披露してたんや。
まず、このビデオモデルについて分析したいんやけど、アドビのビデオモデルは明らかに最高レベルのビデオモデルの一つや言うてええと思う。これは驚くべき発言やけど、AIの分野でのビデオモデルの競争がどれほど激しいか知らん人には、ちょっと驚くかもしれへんな。
多くの人がソラにしか注目してへんのは知ってるけど、実際にこれらのクリップの質を見てみると、クリップの鮮明さが非常に高いことがわかるんや。これが見るに値するものにしてるんやな。
最初のクリップを見てみよか。夜の街中で、年配の男性の詳細な肖像画をクローズアップで映してるシーンや。照明はムーディーでドラマチック、色調は青みがかっててて、影とオレンジのハイライトがあるんや。男性の肌は超リアルで細部まで見えて、毛穴まではっきりしてる。動きはわずかで柔らかく、カメラは動かへん。フィルムグレインがあって、ビンテージのアナモルフィックレンズを使ってるように見えるな。
これもアドビのデモンストレーションの一つやけど、これらのモデルが実際にプロンプトにかなり忠実やってことを示してるんや。ビデオモデルが最も苦労するのはプロンプトへの忠実さやと思うんや。ビデオモデルを作るのは本質的に難しいからな。
でも、品質、忠実度、一貫性に優れたビデオモデルを作れて、さらにそれがプロンプトに非常に一貫して従うようになると、実際にそのモデルは他のどんなものよりも使いやすくなるんや。そして、この例はまさにそういう例の一つやと思うわ。
アドビはこの例も見せてくれた。メキシコの美しく照らされたコテの眺めや。水は透き通った青で、夕方の太陽の輝きがある。色は暖かくて、マジックアワーのスタイルで、高品質でシネマティックな感じや。
特定のクリップについては、いつも特定の特徴に注目するようにしてるんや。それによって、モデルの質と、どんなところで苦労してるか、どんなところで優れてるかを判断できるからな。
現在のアドビのモデルについては、実際にこのモデルが苦労しそうな分野を見つけるのに苦労してるんや。例えば、左側の水面の反射を見ると、非常に正確で一貫性があるように見えるんや。このキャラクターが前に進むにつれて、フレーム内のほとんど全てのものが信じられないほど首尾一貫してて、一貫性があるように見えるんや。
つまり、遠くから見たら、これがAIやとは本当に分からへんやろうな。そして、なんとアドビは責任を持ってこのモデルを訓練するための映像を調達することに成功したんや。つまり、そのあたりで素晴らしいことをしてるだけやなく、非常に効率的な訓練プロセスを見出す方法も見つけ出したってことやな。
これらのビデオモデルは本当に計算コストが高いってことは知られてるけど、なんとかアドビはこれをすぐにリリースする計画を立ててるんや。つまり、非常に効率的な方法でこのモデルを作り上げたってことやな。アドビにはかなり賢い人たちが働いてるってことやな。
キャラクターの一貫性をもっと見たいなら、このクリップを見てみるといいで。これは最も重要なことの一つやと思うんや。AIのビデオモデルがどのように機能するかに詳しくない人は、クリップが開始点からどんどん離れていって、長くなって、もちろん地形が変わっていくにつれて、一つの大きな問題があるってことに気づかへんかもしれへん。
その問題っていうのは、同じ背景の一部に見える一貫したイメージを持ち続けるのに苦労するってことなんや。もし開始時点と同じ背景の一部に見える一貫したイメージを持ち続けられるビデオモデルを見つけられたら、それは良いビデオモデルやってことが分かるんや。
そして、それはまさにこの広大な赤い火星の風景を映したシネマティックなショットで見られるものなんや。実際、このモデルからはこんなものは期待してへんかったんや。だって、これは達成するのがとても難しいことやからな。
これが、アドビのモデルを上位に押し上げてる要因の一つなんや。そして、これについて一番クレイジーなのは、前に話したように、アドビのモデルが彼らの全エコシステムに統合されてるってことなんや。
つまり、クリエイターがこれをプロジェクトで使うことで、創造的な価値がもっと多く得られるってことやな。そして、もちろん、より献身的なAI愛好家が最初に注目するような、より小規模なビデオモデルにあまり注目してこなかった一般の人々にも広く公開されることになるんや。
より広いクリエイティブコミュニティがこれらのツールをどのように使うかを見るのは、本当に興味深いことになるやろうな。
ここにはファンタジーの領域もあるんやけど、正直に言うと、これは本当に好きなやつなんや。このクリップの動きは驚くほどリアルやからな。小さな爬虫類が動き回るのを見たことがある人なら、まさにこんな風に動くってことを知ってるはずや。
これには本当に驚いたんや。というのも、今、動物を合成したようなめっちゃ話題の動画があるんやけど、それ見たことあるやろ?あの動きを見てたんやけど、全然良くないんや。でも、これは溶岩でできた赤ちゃんドラゴンが火山の中を這い回ってるマクロな超接写ショットで、本当に魅力的に見えるんや。
さて、ビデオの話はもう十分やな。これを使ってプロジェクトを改善できる本当にクールなことをいくつか紹介するで。
アドビが話してることの一つは、コミュニティからの要望に応えて、既存のコンテンツに視覚的な深みを加えたいってことなんや。ファイアフライビデオモデルを使って、水、火、ライトリークなどの雰囲気のある要素を生成できるようにしたいんやって。
これは実際にはすごく効果的なんや。なぜかっていうと、これらのモデルを使って短いクリップを生成し、それをプレミアプロの既存の動画に合成できるからや。これによって、以前は考えもしなかったような小さなクリップの創造性を高められるんや。
例えば、ここでライトリークを生成してるのが見えるやろ。これはまさに、黒い背景に有機的なテクスチャーでリアルなフィルム風のライトリークを作ってるんや。そして、ユーザーがこのシーンを完全に合成して、最終的にはすごく魅力的に見えるクリップができあがるんや。
これは、個人が何ができるかを考える上で大きな助けになると思うんや。なぜかっていうと、これらの短いクリップを即座に生成できることは素晴らしいからや。時々、煙やライトリークのパックをダウンロードしても、ちょっと変に見えることがあるやろ。そして、その特定のシーンの動きにぴったり合う小さなクリップを見つけるのに40分から2時間もかかることがあるんや。これは、そういった問題をすごくうまく解決してくれるものになるやろうな。
アドビはまた、アニメーターやモーションデザイナーに対して、自分たちのクリエイティブプロセスの前に考えを伝えることで、適切なスタイルを見つけるための試行錯誤の時間を節約できるようにしたって話してたんや。
ここで見えるのは、かわいい赤ちゃんタコが愛らしい目で、各触手でティーカップを持って幸せそうに周りを見回してる3Dレンダリングのプロンプトや。オクタンのソフトな照明やらなんやらって書いてあるけど、要は、これはかなり一貫性のある3Dレンダリングで、すごく良く見えるんや。
初めてのビデオモデルでこんなに一貫性のあるものが作れるなんて、かなり驚きやな。
このモデルで本当に気に入ってるのは、テキストもうまく扱えるってことなんや。ここに見えるストップモーションビデオは、リアルな感じがして、正直AIとは思えへんくらいや。つまり、このモデルは特定のビデオスタイルもできるってことやな。
前に見たビデオモデルが地平線の上を飛んでるスピードランのようなショット…実際にはスピードランとは呼ばれへんな。正確にはドローンショットって呼ばれるんやけど、そういうショットはこの2Dのストップモーションみたいなショットとはかなり違うんや。
つまり、これは多様なシーンを扱える本当に優秀なモデルってことやな。これはクリエイターにとってすごく役立つはずや。時々、ビデオの表現方法を実験したいことがあるやろ?これは、そういうことをしたい人たちにとって重要なツールになるはずや。
ここでも、テキストがうまく扱えてるのが分かるやな。プレイエリアで見たように、「夏」という言葉がふわふわした虹色の雲から形成されて、渦巻くパステルカラーの空に浮かんでるのが見えるやろ。これもすごくよく見えるんや。人々がこれをどう使うか見るのが楽しみやな。
彼らが話してたもう一つのこと、そしてこれが最大の領域の一つやと思うんやけど、それはもちろん画像から動画への変換や。これは多くの人が使うことになると思うんや。元の映像を持ってそれを拡張するのはいつでも良いことやからな。
基本的に、彼らは画像から動画への変換を発表したんや。ドライビングイメージを使えるんや。これが最初のドライビングイメージで、かなり標準的な画像やな。そして、もちろん彼らは「美しい蝶がこの花の一つに着地する」ってプロンプトを入れたんや。すぐに蝶が着地するのが見えるやろ。
この例の画像の重要性に気づいてる人はあんまりおらんと思うんや。例えば、映画製作者で、何か生き物が映ってる本当に重要なショットを撮りたいとするやろ。例えば、蝶が何かを象徴してる短編映画を作ってて、蝶が着地するショットが欲しいとするやろ。
特定の素材に蝶が着地するのを撮るのにどれだけ時間がかかるか、みんな過小評価してると思うんや。でも、もしまず最初にショットを撮って、それからプロンプトを入力するだけでええんやったら、これはめっちゃ時間と労力を節約できることになるんやな。
映画製作で人々がよく苦労することの一つは、もちろんシーンの修正やねん。ここでは、スイッチをパチッと上げる手を映したシーンが見えるやろ。でも、もしこのシーンを使うの忘れてたり、単に実験したかっただけやったらどうする?「宇宙飛行士の手袋をはめた手がケーブルに入って、黄色いケーブルの1本を抜く」っていうプロンプトを追加できるんや。
アドビのファイアフライモデルがそれを難なく撮影できてるのが分かるやろ。これは人々の時間を大幅に節約することになると思うんや。ワイも少し映画製作をしたことあるけど、正直に言うて、これは本当に時間のかかることやったんや。だから、こういうものは間違いなく人々の時間を大幅に節約することになるやろうな。
さて、アドビはこの機能をプレミアプロのベータ版にネイティブに組み込んだんや。みんなもぜひ試してみるべきやと思うわ。ビデオ編集がどう変わるかを見せるために、アドビの短いクリップを流すで。そしたら、この動画は終わりや。じゃあ、アドビに任せよか。

コメント

タイトルとURLをコピーしました