AI動画が信じられないレベルに…(GEN 4)

AGIに仕事を奪われたい
この記事は約23分で読めます。

13,744 文字

AI Video is getting UNREAL... (GEN 4)
The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

Runwayが最新の製品を発表しました。以前にも素晴らしいリリースを見てきましたが、実際にユーザーが使用してみると少し期待外れだったりします。しかし今回は、ユーザーたちが実際にかなり素晴らしいAI動画を制作しているようです。見てみましょう。
これはRunway MLの創設者による動画で、彼らの最新製品であるGen 4を紹介しています。彼らが私たちのために用意した新機能を紹介しています。このモデルが少し特別で少し新しい点は何か、そして実際にユーザーたちの反応を見る限り、すべての有料プランで利用可能で、反応は非常に非常にポジティブなようです。聞いてみましょう。
「こんにちは、私はクリスです」「そして私はジェイミーです」「今日、私たちは非常に興奮してGen 4を発表・リリースします。これは私たちの今まで最も強力なAIモデルです」
「皆さん、これを見つけましたが、取るべきでしょうか?二重に見えます」
「Gen 4は画像と動画生成の両方において完全に新しい基準を設定し、私たちが世界の一貫性を実現した初めてのモデルです。つまり、一貫した環境、オブジェクト、場所、キャラクターを持つ一貫した世界を作成できるということです。それができれば、実際の連続性を持つより長い形式のナラティブコンテンツを作り始めることができます。同じキャラクター、同じオブジェクト、同じ場所を異なるシナリオで生成できるので、シーンをブロックして意図的に何度も何度も何度も物語を語ることができます」
「過去数ヶ月間、Gen 4を設計・開発し、モデルが実際に何ができるかを見るのはとても楽しかったです。私たちは、Gen 4がクリエイティブツールとしての最高のデモンストレーションは、モデルを使って語ることができる物語だと考えています。また、Gen 4で何ができるかを紹介するために、一連の短編映画と実験を作成しました。それでは、これらの映画がどのように作られたかの舞台裏をお見せし、一貫した環境で物語を作るためにこのモデルがいかに強力かを理解していただきましょう」
「最初に見ていく短編は『孤独な小さな炎』です。実は、私たちの監督が10年以上前から語りたかった物語ですが、その手段がありませんでした。Gen 4を使って、友達を見つけられなかった孤独な小さな炎の物語を語ることができました」
「この映画が大好きです」「はい、美しいですね」「オープニングショットは本当に興味深いです。物語自体の調子や感情、ムードを設定しているような感じです」「そしてこのシーンは本当にスカンクが何かを探している様子です。Gen 4では実際にシーン全体で被写体を指示することができます。スカンクに2つのマークを与えているのがわかると思います。この場合、スカンクにまずこちら側に行き、それから戻ってくるようにして、何かを探しているように見せたかったのです。そして、シーン全体を通して同じキャラクター、同じライト、同じムード、同じ条件で見ることができます」「ここで主人公キャラクターを紹介していますね」「そうです、すべての素晴らしいアニメーションと同様に、モデルによってデザインされたキャラクターの表現力だけでなく、これらのシーン内での動きにも表現力が見られます」
「今見たのはキャラクターの一貫性の素晴らしい例で、異なるシーン、異なる照明条件、異なるモーションやアクションを指示した場合でも、同じキャラクターを出現させることができます。また、実世界のオブジェクトも扱えます。ここに小さなおもちゃがありますが、写真を撮って、そのおもちゃの写真をGen 4に取り込み、好きな環境に配置することができます」
「ここで少しデモをします。このオブジェクトの写真を撮ります。私の電話からです。写真を撮って、いくつかの異なる環境でそれを実行します。写真を取得したら、Gen 4にリファレンスとしてドラッグします。また、数日前に撮ったニューヨークの写真も使います。そして、作りたい構図を入力します。この木のおもちゃが、ニューヨークの通りの歩道に寄りかかっているか、隣にあるようにします。今、J4がそれらのリファレンスを組み合わせています。そこに4つの初期画像があり、閲覧して選択できます。これが気に入ったのでアニメーション化しましょう。おもちゃの前に人々が来るようにしたいです。そうすると、おもちゃとシーンとのリファレンスで必要とした動きとアニメーションが得られます。もちろん、これをどの場所でも行うことができます。おもちゃを山に持っていったり、砂漠に埋めたりすることもできます。基本的に何でもできます」
「今見たばかりですが、次の作品『そこの少年』を紹介しましょう」
「私は牛を殺すのが好きではないが、すべての牛を殺さなければならないなら、それは価値があるだろう」
「多くのドラマと謎がありますね。誰かが追われていて、その理由はわかりません」
「『私は牛を殺すのが好きではない』さあ、ここで止めましょう。これは私が本当に好きなショットです。牛の目に登場人物の反射が見えることに気づいたでしょうか」
「このシーンは本当に素晴らしいです。とても生き生きとしていて、リアルです。火が草に燃え移る物理的な様子、ここはまだ暗く、後ろの方も暗いですが、この素晴らしい減衰が得られます。超リアルです」
「Gen 4の本当に興味深い点は、シーン全体で一貫したキャラクター、オブジェクト、環境を使用できることです。この場合、デザインとキャスティングでキャラクターから始め、別のキャラクターと環境を使用して、基本的にムード、外観、キャラクターがどのように見えるかを作成できます。そこから新しい画像を作成し、その画像からさらに派生することができます。つまり、別のショット、別のアングル、その人、オブジェクト、または環境がどのように反応してほしいかについての変更をモデルに要求できます。これは本当に強力です。なぜなら、実際の画像からジェネレートされたものまであらゆるものを取り込み、周りにあるものを見て、キャラクター、環境、またはショットにあるオブジェクトのプロップとして使用できるからです」
「次は『ニューヨークは動物園』と呼ばれるもので、Gen 4のビジュアルエフェクト能力の素晴らしいショーケースです。これはニューヨークの異なる場所の実際の写真と動物の実際の写真を組み合わせ、それらを一緒にマージして、不可能な場所にいる動物の面白い構図を得ています」
「これはまた、物理学の理解を明確に示しています。これらの動物の重さ、表面をどのように移動するか、表面とどのように相互作用するかです。これを作るのはとても楽しかったです。なぜなら、数時間で作れて、モデルがあなたの頭の中のアイデアを素早く引き出せるようになると、それは非常に中毒性があるように感じるからです。モデルがあなたのクリエイティブパートナーになることができるのです」
「Gen 4の最も強力で楽しい点の一つは、あなたが欲しいものなら何でも組み合わせることができることです。時には一つの画像から始まります。次に紹介する動画は、白いスタジオスペースにいる猿の生成から始まり、そこからスノーボールのように転がって音楽ビデオになりました。それを見てみましょう」
「ここまでで、Gen 4がいかに強力で楽しいものか、以前にはできなかったような方法で一貫した世界からキャラクター、場所まで作ることができるかをより理解していただけたと思います。Gen 4は現在、すべての有料ユーザーとエンタープライズ顧客に利用可能です。一貫性のあるキャラクター、場所、オブジェクトのシーンリファレンスは近日公開予定です」
これはRunwayチームの誰かが作ったものです。彼らが手元にあったプロンプトから作成したもので、とても良く見えます。非常にリアルです。これは明らかに布やコットンのようなものが岩の上を這っていますが、とても良く見えます。マクロ撮影したストップモーションアニメーションのように見えます。
このオオカミはとても良く見えます。素晴らしい影、素晴らしい視野。別のスタイルのヘビ。また、質感が布のような素材であることがわかります。完璧に見えます。
これは間違いなくマクロで拡大されたストップモーションアニメーションビデオを複製していて、良く見えます。優れた反射、鹿の口から滴る水、絶対に素晴らしいです。
これは誰かが彼らのよく使うプロンプトをテストしたもので、とても良く見えます。彼らは「完璧に見える」と言っています。このスペーステーマは非常に良く、非常にハイテクに見えます。すべてのキャラクターがそれらのショットで一貫しているようです。変な変形は起こっていません。少しアニメ風のスタイルで、指は奇妙に見えますが、それ以外に明らかに間違っているものや違和感があるものは見つかりませんでした。
これは誰かがRunway Gen 4で最初に生成したもので、「これはチェリーピックされていません」と言っています。とても良く見えますね。枕、背景の力、動きのショット、列車は本当にリアルです。
これは「ワイルド・スピード」のリメイクのようなもので、何かわかりませんが、青い猫のようなキャラクターですが、素晴らしいです。
この画像のようなものを取り上げるとどうなるでしょうか。ここの下の部分はありますが、上には何もないことに注意してください。これはRunway Gen 3が生成するものです。上に何があるかを把握し、その周りに全体の世界を構築します。反射する建物、看板など、とても良く見えます。
これは親子関係についてのものです。非常にリアルに見えます。この女性は少し変に見えます。少し固いというか何というか。アニメーションで、少し違和感があり、100%滑らかではないことがわかりますが、それ以外はとても良く見えます。
私はGen 4を手に入れました。時間がかかります。有料プランが必要で、アクセスするまでに約5分かかりましたが、試してみましょう。
彼らが推奨するのは、より単純なプロンプトから始めることです。彼らが言うように「シンプルさの力を過小評価しないでください」。最初から複雑すぎるものにならないように、より複雑な特定のプロンプトに取り組む前に、シンプルなプロンプトから始めてみてください。
彼らが作業しているのは、キャラクターの一貫性とカメラの動きをコントロールするようなものなので、出力を洗練するためによく機能する要素がいくつかあります。被写体の動き、カメラの動き、シーンの動き、スタイルの説明などです。
「機械的な雄牛が砂漠を横切って走るとき、手持ちカメラがそれを追跡します。その動きは、機械的な生き物の後ろに続く埃を乱します。映画的な実写」
タトゥーで覆われた筋肉質の男が熱帯雨林の木に登るのを試してみましょう。Midjourneyでこの狂気を見つけました。同じようなものが作れるか見てみましょう。マスクはいい感じですね。5秒のクリップを作りましょう。
怒ったカプチーノの子猫はどうでしょうか?様々な営業マンに「コーヒーはクローザーのためのものだ」というようなやる気を起こさせるスピーチをさせるべきでしょうか?そうですね、それは完璧です。コーヒーを持った猫がやる気を起こさせるスピーチをする。
では、もう少しアクションショットを試してみましょう。このリファレンス画像を取って、スキーヤーが坂を下るのをカメラで追うようにしましょう。「カメラがスキーヤーを山の下まで追う」と書きます。
難しいものを試しましょう。この女性が一方向に回転し、カメラが反対方向に回転するようにします。「女性が時計回りに回転し、カメラは反時計回りに彼女の周りを回る」と書きます。
ここに心臓があります。毎回心臓が鼓動するたびにカメラが少し揺れるようにしましょう。「心臓が鼓動し、毎回の鼓動でカメラを揺らす」
数日前、サム・アルトマンが丁寧に私たちに「画像生成を控えていただけませんか、これは狂気です。私たちのチームは睡眠が必要です」と頼みました。私は彼と彼のチームに対して、GPUを溶かさないようにする彼らの努力において励みになるようなことを返信しました。世界中の人々が手に入れられるものすべてをジブリ化しています。これは私のOpenAI管理チームが従業員にもっとジブリ画像を生産し、休息なしで働くように動機付けるという芸術的表現です。私はその本質を本当に捉えたと思いますが、アニメーション化してみましょう。ハムスターが引っ張る馬車はますます速くなります。
いくつかの動画が戻ってきたので、確認してみましょう。これは、木に登っているはずの男です。熱帯雨林の木だと思います。かなり良いですね。彼は少し空中を歩いているようですが、他のすべては素晴らしいです。最初の数フレームはMidjourney画像を取り、非常に忠実にそれを回転させています。その後、別のシーンに入るのでそこはマイナスポイントになるかもしれませんが、最初の数秒間は本当にMidjourney画像に非常に似たキャラクターを維持しています。
すべてのタトゥーなど、彼が回転しているとき、3D空間でどのように回転するかという点で、非常に正確にすべてを作りました。5段階中4をつけます。2番目の部分は少し…悪くはありませんが、彼は空中を歩いていて、「熱帯雨林の木に登る」と言ったので、それが上向きのショットになっているのかもしれません。試してみる必要がありますが、悪くはありません。
これは「クローザーにコーヒーを」という動機付けスピーチです。信じられますか?私はあなたにはわかりませんが、私はやる気が出ました。それはかなり攻撃的に見える子猫です。
これは、スキーヤーが丘を下るのを追うものです。明らかにキャラクターの一貫性があります…ちょうど言おうとしたときに、誰かの足が引きちぎられました。何が起こったのかわかりません。繰り返しますが、最初の数秒は素晴らしく、最後の数秒は少し変になるかもしれませんが、それでも悪くはありません。
これが元の画像です。マクロ写真で、レゴの人ではなく、何らかのプラスチックの小さなフィギュアです。続くと、本当にその本質をとらえています。非常に非常に良いです。それは続き、まだマクロ写真であることがわかります。まだプラスチックの部品です。この人の足にどうなったのかわかりません。何が起こったのでしょうか。それがなければ5段階評価で5をつけると思いますが、何であれそれが少し台無しにしています。私は何を見ているのかさえわかりません。
これは回転する女性と回転するカメラです。どれだけうまくいくか見てみましょう。彼女は反時計回りに回転していて、カメラは静止しているようです。これは多くの画像生成、動画生成が問題を抱えているものです。Googleの「V2」は素晴らしかったですが、これについても問題がありました。これは5段階中2だと思います。キャラクターの一貫性という点では非常に一貫していますが、360度回転を示していませんし、カメラの回転指示も無視しています。
鼓動する心臓がカメラを揺らします。繰り返しますが、カメラの揺れは見えません。心臓の鼓動は、心臓がどのように鼓動するかとは少し違いますが、動きはあります。
ハムスターを見てみましょう。完璧にできたか教えてください。それは悪くないですね。ハムスターが馬車を動かしているのがはっきりわかります。馬車を操縦している二人は笑顔を浮かべています。悪くないです。5段階中5です。
次に、説明文なしで大量のMidjourney画像を急いで処理してみましょう。指示はなく、「これが画像です、アニメーションしてください」と言っているだけです。なぜなら、これが新機能が本当に得意なことだと思うからです。キャラクターを取り、一貫したキャラクターを動画で作成し、特定の指示、カメラアングルなどに従わせることです。
ちなみに、これより前に見たものはすべてチェリーピックされていません。アップロードしたすべての画像、書いたすべての説明を見ました。7つか8つ見たのは、7つか8つアップロードしたからです。そして今、同じことを18のMidjourney画像で行っています。これらには説明がありません。
最初のものは、元の画像が最初のフレームとして見えます。これがどのようにアニメーション化されたかです。Runwayは、不気味な頭蓋骨がゆっくりとあなたの方を向き始めるようにズームインすることにしました。非常に非常にクールで、間違いなくシーンの不気味さを捉えています。
次は、イタリアのスクーターでピザ配達です。これはどのようになったか見てみましょう。子猫がスクーターについていっています。非常に非常にクールです。それはとても良く見えます。シンプルですが気に入っています。画像は消失点があり、通りはこの方向に向かっているので、これをアニメーション化する唯一の理解できる方法はこのようなものだと判断したのでしょう。前進する以外の方法は少し変になると思います。
次に、この精霊のオオカミやその他のものがあります。ゆっくりと草の中を歩き始めます。それは良く見えます。
ここでは、この素晴らしいものが進行中です。これがどうなるか見てみましょう。ワオ、まず第一に、元の画像よりも明確で鮮明でリアルです。流れ落ちる液体は非常にリアルで、反射があり、とても良いです。
魔法使いの魔法はどうでしょうか。それをどれだけうまくやったか見てみましょう。素晴らしい火です。それはそのようなファンタジー設定で期待される火のようです。写真のようにリアルではないかもしれませんが、間違いなくリアルです。アニメーションでこれを見たら「はい、そのアニメーションはそのように見えるでしょう」と思うでしょう。
次に、何らかの漫画のようなキャラクター、草の葉があります。彼は周りを見回していて、これはピクセルスタイルのアートだと思います。彼らはそれを完璧に再現しました。実際、彼が回転するとき、それは画像の残りの部分よりも高解像度のようですが、全体的に良いです。
ここにいるのは、何らかの宇宙の女神、宇宙の修道女、ロボットの修道女、よくわかりませんが、彼女が回転するとき、それは完璧です。すべての顔の特徴、フードの側面のペイントストライプのようなものをすべて捉えています。彼女が回転するときに、すべてをどれだけうまく捉えているかは素晴らしいです。影、顔の光の反射、肌、ロボットの顔、わかりませんが、良く見えます。
これは猫の生き物の鉛筆スケッチのようなものです。ボブキャットか、スフィンクス猫の一つかもしれません。それが動き始めるのを見てみましょう。それは離れて回転します。それをスフィンクス猫、あの毛のない猫の一つとしてレンダリングしました。素晴らしい仕事をしています。3D回転を再現する能力は本当に驚くべきものです。
ここに日光の中で微笑む女性がいます。彼女はそこで少し狂った目をしていて、少し変な動きをしています。少し犬のように、少し動物のように動きます。これはこれまでで最高のものではありません。5段階中4か3でしょうか。多分彼女は笑っているのかもしれませんが、少し不自然で、少し変です。
次に、このカメラの視点を飛び越えるような馬がいます。それをどれだけうまくやったか見てみましょう。これは彼らが今見ているものです。有刺鉄線に変わり、馬は少し変わって、定義が少し失われ、画像のスタイルが変わりました。これは今までで最もクオリティが低い生成だと感じます。ひどくはありません、悪くはありませんが、これは他のほとんどの画像や動画モデルで見ることが期待されるものに近いです。これは悪いと言いますが、これほど「悪い」ものさえ得ることは珍しいです。馬が空に飛んでいったりはしていません。フェンスはある程度テクスチャを保持していますなど。ひどくはありません。5段階中2.5をつけると思います。それは公平だと思います。
これがどうなるか非常に興味がありました。土星の輪の上でF1やインディカーのようなものがあります。どうなるか見てみましょう。それはとても良く見えます。左に曲がり、その後右に曲がり始めたようですが、それは土星の輪がどのように動くのとは少し違うかもしれません。繰り返しますが、これらはテキスト指示がないものなので、他のすべてについては良く見えます。それがF1カーかインディカーであることは明らかで、その一貫性を保っています。それが宇宙にいることを理解しているので、近くの他の惑星もすべて表示しています。5段階中4だと思います。
これはMidjourneyで評価の高いもので、少し笑ってしまいました。一方では、とても健全な家族の肖像画で、他方では、ゴールドのグリルは…それは興味深い画像です。Runwayがこれでどうするか見てみましょう。家族のようなので、それで多くのことはしません。少しアニメーション化しますが、ほとんど動きません。健全な家族写真のようなものであるべきだと思います。それは家族写真のためにじっとしているものですね。OK、それはそれでいいでしょう。悪くはありません。
あまり写真のようなリアルなものをやっていなかったので、もう少し写真のようなリアルなものも試してみたいと思います。それらをどれだけうまく捉えることができるかを見るためです。
ここに一つあります。ザクロを持っています。それは素晴らしいです。ワオ、それは本当に信じられないほど良いです。最初のショットではザクロに太陽の反射のようなものがあることに注目してください。彼女が回転すると、太陽の光が彼女の肩に落ちます。動きについては少し加速しているように感じる部分がありますが、それ以外はこれは絶対に素晴らしいです。絶対に素晴らしいです。
これでどうなるか見たかったのですが、見てみましょう。それは本当にアニメーション化されませんでした。ただズームインしただけなので、低いスコアをつけますが、OK。
ここに別の写真のようなリアルなものがあります。見てみましょう。それは興味深いですね。彼らを列車に乗せて、列車が前後に揺れています。それは本当に良いです。これが元のショットであることに注意してください。彼らが列車に乗っているとは明らかではありません。彼らが列車に乗っているとは思わなかったでしょう。これがロッジやキャビンのようなものだと思ったでしょう。
これは木のように見えます。これは屋根で、雪を見下ろしています。Runwayは列車のような動くものにすることに決めました。それは全く素晴らしく、彼らは間違いなくそれを完璧にしました。風景が彼らの前を通り過ぎていき、パララックス効果があって、彼らは笑顔で、子供は超ハッピーです。ワオ、これは5段階中5です。
このカメラアングルのために特別に選んだこれをご覧ください。巨大な建物と巨大な…あれは怠け者ですか?フードを着ています。そして下から見上げています。これは人間の手なので、このものはスカイスクレーパーの高さがあります。ここで何か破壊が起きているようです。これがどのようになったか見てみましょう。これはかなり難しいことですが、あまり多くはしていません。そうですね、アニメーション化しましたが、あまり刺激的なことはしていません。その手はただ突き出したままですね。OK。
これが最後のバッチのものです。雨の霧の日と、何台かの車の上を飛ぶ巨大な飛行機があります。バスかもしれません。そこに人がいます。これがどうなったか見てみましょう。
飛行機はゆっくりで、バスは動いています。二台の車が衝突して消えます。興味深いですね。ここで彼らは衝突して消えています。人は道路の真ん中を歩いているだけです。ここでどうスコアをつけるべきかわかりません。確かに非常に興味深いものを捉えていて、視覚的に良く見えるものがたくさんありますが、論理的にはあまり意味がありません。これは指示なしのものなので、論理がないことでポイントを減らすべきかどうかわかりません。
テキスト指示付きでこれを再実行して、どうなるか見てみましょう。ここでは「飛行機が正面からカメラビューに飛んでくるときにカメラが上に浮かぶ」と書きます。次に、飛行機が上空を通過するときにカメラがそれを追跡するようにしてみましょう。つまり、飛行機が私たちの上を通過するときにカメラが上を向くようにします。
「飛行機がスローモーションで動き、車がハイパー・タイムラプス・スピードで動く」と書きます。「カメラは静止したままです」。カメラがどのように動くべきかについて3つの異なるアイデアがあります。上に浮く時、上にパンする時、静止している時です。最後に、「カメラは飛行機を視界に入れたままバックする」と書きます。
これは最初に生成したものです。指示なしで生成したものです。次に、「飛行機がカメラの正面に飛んでくるときにカメラが上に浮かぶ」と指示しました。どうなるか見てみましょう。
これを上に浮くとは呼びません。これは次のものから望んでいたものに近いですが、それでもこれは素晴らしいショットです。求めていたカメラアクションではありませんが、それ自体で素晴らしいショットです。それは素晴らしいです。
次に、「カメラが上空を通過する飛行機を追跡する」と書きました。これが前のプロンプトが生成するはずだったものです。どうなるか見てみましょう。
ここではカメラが飛行機を視界に入れたままバックしているようです。適切なカメラの動きを説明する方法について少し混乱しています。明らかに様々なカメラショットを行うのに非常に優れていますが、私が入れたテキストが実際のカメラショットと一致していないようです。しかしカメラショットについては、それらは素晴らしいです。優れています。
最後に、「飛行機がスローモーションで動き、車がハイパー・タイムラプス・スピードで動く」と書きました。どうなったか見てみましょう。
これは私たちが探していたものではありません。このものについては低いスコアをつけます。すべてを生成していますが、指示に従う観点では5段階中1です。
最後に、「カメラは飛行機を視界に入れたままバックする」と書きました。それは実際に非常に良いです。これは私たちが望んでいたものです。カメラは飛行機と同じ速度でバックしているので、すべてが距離に後退していますが、飛行機の視点はほぼ同じままです。これは5段階中5です。素晴らしいです。
次に、キャラクターが画面上でどれだけうまく動くことができるか見てみましょう。このワイルドな猫がどうなるか見てみましょう。「猫はサングラスを脱いで微笑む」。見てのとおり、これは完全な猫です。「猫はナイフを隠す」と書きます。「猫は自分の爪をナイフでいじる」と書いてみましょう。「猫はカメラをサイドキックする」、おっと、それは予期していませんでした。
次のものはもう準備ができています。「カメラは車が都市を通って高速で走るのを追う」と書いています。どれだけうまくできたか見てみましょう。
それはかなり良いです。カメラの動きは完璧です。これは非常に非常に良いですが、スタイルが変わったと感じます。スタイルがかなり劇的に変わりました。ここで起きている素晴らしいことがたくさんあります。ヤシの木や空からの反射は素晴らしく、テールライトの反射も素晴らしいです。唯一の問題は、これが私たちが目指していたスタイルであることです。もう少しグリッティなパステルカラーというか、わかりませんが、少しGTAスタイルのようなもので、そして得られるのはこれです。とても近いですが、同じスタイルではありません。もっと滑らかで美しいです。もう一方はもう少しグリッティです。
私たちの視点にはいくつかの水分が飛び散り、ここではグリッチのようなものが少しあり、レンズフレアのような感じがあります。それがここでは失われています。それ自体は素晴らしく見え、指示に非常によく従っていますが、スタイルを失いますが、それ以外は素晴らしいです。
猫のようなサングラスを脱いで微笑みます。それはかなり良いです。それはとても良いです。それは本当にすべてをうまくやっています。ナイフをその目の近くに持ってくるのは少し不安になりますが、はい、それは微笑む猫です。はい、それはサングラスを脱ぎました。これには5段階中5をつけます。これは素晴らしいです。
次に、猫がナイフを隠します。それは何か遠くの兆候を聞き、何が起こった?それは何を隠した?OK、それは振り返ります。わかりました、どこに行ったのかわかりません。それは何が起こっているのかわかりません。それはかなり良いです。私が想像していたものではありませんが、確かにプロンプトは成功したと思います。少し恥ずかしそうに、誰かに見られたかどうかを理解しようとしているようです。後頭部からの眺め、サングラスはそれに巻き付いています。それは非常に非常に非常に良いです。それは私が考えていたものとは少し違いますが、それでもプロンプトを完璧にこなしたと思います。5段階中5をつけます。
猫がナイフで自分の爪をいじります。何が起こっている…?OK、これは私が低い評価をしなければならないものの一つです。これと柵を飛び越える馬のように、それは…わかりません、5段階中2か1でしょうか。何が起こったのかさえわかりません。突然、違う猫になっています。これは良くありませんが、今までのところ、あまり多くの悪い生成を見ていません。それらはほとんどが非常に高品質のものです。
猫がカメラをサイドキックします。何が起こるか非常に非常に好奇心があります。私が想像していたものではありません。これには5段階中3か4をつけます。サイドキックを捉えているので5段階中3をつけますが、カメラを蹴らせるのは非常に非常に難しいかもしれません。ナイフで何が起こっているのかわかりませんが、そうですね、5段階中3でしょうか。
興味深いことに、私は誤って「カメラをサイドキック」を二回クリックしてしまい、これは別の解釈です。これははるかに良いです。これには5段階中4または4.5をつけます。それは良く見えて、猫がカメラをサイドキックしているので、多くのクレジットを与えなければなりません。尾が動いていることさえ、他のすべてが止まっているのに、それは興味深い芸術的なデザインです。それはジーンズやパンツのようなものを着ています。素晴らしいサイドキック、素晴らしいフォーム。周りの輪が何だったのかわかりませんが、そこには多くの素晴らしいことが起こっています。一貫したキャラクターデザイン、繰り返しますが、カメラを蹴っていませんが、そのプロンプトはここでテストするのに適切なプロンプトではないかもしれません。これが「サイドキックをする猫」であれば、私からは完璧な5段階中5つ星を獲得するでしょう。
次の一つは、雲の中を飛行機で飛んでいる人物のMidjourneyからの画像で、絶対に素晴らしいです。計器パネルでさえ、そこに何が書いてあるかはっきりとは見えませんが、数字は見えませんが、非常に正当に見え、非常にリアルに見えます。丸いものは丸く見え、そこに何かがまばたきしています。パイロットはボタンをいじり、ボタンを変更しています。あまり詳しく見なければ、すべてが素晴らしく見えます。確かに、コックピット、窓のちょっとした傷のようなものは非常にリアルです。太陽が輝き、それらの傷をどれだけ見せるかを変えるのは素晴らしいです。雲は素晴らしいです。ここにはただ信じられない素晴らしいことがたくさん起こっており、私はそれが大好きです。これは私にとって5段階中5です。
それがほぼすべてです。アップロードしたほぼすべてのものを見ました。何もチェリーピックされていません。著作権のあるキャラクターがあったため、一つのプロジェクト、一つの画像だけは拒否されました。それ以外はすべてを素晴らしくこなしました。おそらく一つか二つの生成が低評価されるものがあり、残りはすべて素晴らしいか、あるいはプロンプトのいくつかの部分を見逃したかもしれませんが、全体的に、これはとても、私はそれがものを生成する方法に非常に満足しています。一貫したキャラクターを維持する能力にとても満足しています。
これを録画していますが、彼らのツールの別の一つである「Lip Sync Video」を使ってこのビデオを取り込むことができるかどうか見てみましょう。弁護士猫になるか、あるいは何か他のものをテストするか、わかりません。
これらすべてについてどう思ったか教えてください。良く見えますか?AI動画はどんどん良くなっているように思えますか?キャラクターの一貫性などが本当によく発展していることに興奮していますか?Runwayは映画制作スタジオのような動きをしているようです。これは誰もが遊ぶためだけのものではなく、彼らは実際のビジネスプランを持っており、アーティストがこのプラットフォームで創作することを望んでいます。
人々が実際の映画を作成し、コンテストに出品できるポイントに近づいていると思いますか?それが本当に普及すると思いますか?すでにいくつかの例を見てきましたが、これを単なる一時的なブームと見ていますか、それとも次の大きなことの始まりと見ていますか?コメントで教えてください。
ここまで見てくれてありがとうございます。私の名前はウェス・ロスです。また次回お会いしましょう。

コメント

タイトルとURLをコピーしました