
13,524 文字
最近リリースされたKling AIバージョン1.6について詳しく見ていきましょう。前バージョン1.5との新モデルの比較をプロンプト対決で行い、Kling 1.6をSora、Runway、Genry、Minimax、HuanYuanと比較テストします。そして今年の終わりに近づくにつれて、2024年の重要なビデオモデルについて私の個人的なランキングを共有したいと思います。
始めましょう。まず、新しいKlingバージョンにアクセスするには、AIビデオをクリックし、上部のモデル選択ドロップダウンからバージョン1.6を選択できます。この新モデルは、より一貫性のある動的な結果を得るためにプロンプトの遵守性が大幅に改善されています。
最初の例では、プロンプトの理解に焦点を当て、バージョン1.5と1.6をテストして改善点や違いを理解しようとしています。念のため、Klingのプロンプトガイドで推奨されている公式のプロンプト構造を使用しており、彼らの例でも使用している構造です。また、これらのプロンプトは再生成せず、最初の試行結果をそのまま使用しています。
最初の例として「カメラが後退する中、女性が地下鉄にいる」というプロンプトを書きました。バージョン1.6は良い仕事をし、最初のトラックでカメラの動きを理解しましたが、バージョン1.5は少し苦戦しました。カメラの後退をうまく表現できず、カメラの動きは当たり外れがありました。1.5では大抵失敗でしたが、1.6が最初の試行でカメラの動きを実現できたことには好印象を受けました。
次の例は、古城でバレリーナが踊るというものです。ここでは、動作やアクションに関して新モデルが前のモデルと比べてどれだけ優れているかを観察したいと思いました。再び両モデルで同じプロンプトを使用していますが、バージョン1.6のバレリーナの方がはるかにダイナミックで活動的であることに気付くでしょう。動きはより滑らかで自然に見え、1.5の出力は比較的静的に見えます。これらは最初の試行結果であり、バージョン1.6には既にポジティブな印象を受けています。
次の例では、再びプロンプトの理解をテストしており、一貫性とカメラが被写体をどれだけ密接かつ一貫して追跡できるかを理解しようとしています。ここでもバージョン1.6で再び良い改善が見られ、ロボット消防士が犬を運んでいるという非常に一貫性のある結果が得られました。一方、1.5では少し奇妙な切り取り方になり、燃えている家に入って消えてしまうような感じでした。ここでは新モデルで明確な改善が見られると言えます。
最後の例では、再びアクションと動きに焦点を当てています。Klingでプロンプトを行う際は、常にガイドラインで推奨されているように、まずシーンの説明から始めます。プロンプトの2番目の部分では、そのシーンで起こるイベントやカメラの動き、または撮影で見たいシネマティックな動きを説明します。この例では、両モデルとも刀の最後の振りで少し苦戦したことに気付くでしょう。バージョン1.5の方がはるかに苦戦したと言えますが、バージョン1.6は最後まで良好な仕事をし、最後に深刻な苦戦を見せました。しかし、これら4つの簡単なプロンプトを試しただけでも、1.6には大きな改善があることがわかります。Klingチームに拍手を送りたいと思います。良い仕事をしたと思います。
さて、プロンプト対決に移りましょう。テキストからビデオの生成から始めます。テキストからビデオでは、Kling 1.6、Sora、Runway、Genry、Minimax、HuanYuanの5つのモデルを比較します。
最初のプロンプトは「有名なスタイリッシュな女性が東京の通りを歩く」です。画面に完全なプロンプトが表示されています。これらすべてのモデルで同じプロンプトを実行しています。私の観点から最悪のものから始めましょう。Soraが最も悪く見えます。Runwayの出力では、特にバッグを持つ右手に一貫性の問題が少し見られます。Minimaxの出力は驚くほどカラフルで彩度が高く、この特定の出力ではリアリズムが少し損なわれていますが、歩行に焦点を当てると、動作の流動性は非常に良く見えます。
ここで最高の仕事をしたのは、Kling 1.6とHuanYuanだと思います。特にKlingの世界は、このような短いクリップでも非常に生き生きとしており、人々が周りを歩き回っているのが見えます。残念ながら後ろからの撮影でしたが、歩行だけに焦点を当てると、非常に自然で正確に見えます。一貫性は非常に高く、HuanYuanの結果は、まるで本物のプロのカメラで撮影したかのようにリアルに見えます。Klingの出力ほど生き生きとしてはいませんが、リアリズムは全く新しいレベルにあります。HuanYuanの結果とKlingの結果に非常に満足しています。この最初のテストでは、KlingとHuanYuanの間で引き分けだと主張したいと思います。
次のプロンプトは、モデルに少し挑戦したい難しいもので、オスマン帝国のイスタンブール包囲です。これは歴史的なプロンプトで、多くのことが起こっている場面を見ています。長いプロンプトで、フォトリアリズム、プロンプトの遵守、世界の理解をすべて総合的に見ています。
この特定の例では、Soraの出力に感銘を受けました。シネマティックでリアリスティックに見えます。Soraにはグッドジョブです。もちろん、クローズアップは取引の一部ではありませんでした。プロンプトでクローズアップについては言及していないので、全体的に見ると、求めたものは提供されていませんが、本当に印象的に見える小さなフレームや部分があります。
Runwayの出力は私の観点から最悪に見えます。これは現代のイスタンブールのように見え、私が求めたものとは全く関係がありません。非常に貧弱な結果です。HuanYuanの出力はリアリズムの表現に成功し、もちろん壁や兵士がいます。しかし、旗やイエニチェリは表現されていないので、世界理解の面で私たちが求めたものはここにはありません。しかし、少なくともリアリスティックに見えるビデオだとは言えます。
ここではMinimaxの出力とKlingの出力が、私たちがプロンプトで求めたものに最も近いと主張したいと思います。これは歴史的なシーンで、壁の前に兵士がいて、少なくともイエニチェリの伝統的な赤い制服を着ています。Minimaxの出力は再びやや漫画的に見え、HuanYuanの出力ほどリアリスティックではありませんが、少なくともある種の世界理解はあります。奇妙な物理現象のあるHuanYuanの出力を見ると、兵士や馬が突然左右に動くので、このチャレンジではKlingとMinimaxが勝者だと主張したいと思います。しかし、どちらかのモデルが他方を劇的に上回ったとは言い難いです。
次のプロンプトは、AIビデオモデルのチューリングテストとなるカードをシャッフルする手です。単純に言って、すべてのモデルがこのプロンプトで苦戦しました。Google V2を除いて、このテストを簡単にパスするAIビデオモデルを見たことがありません。Klingの出力は非常に奇妙です。手の解剖学は良く見えますが、カードが奇妙に見えます。パンフレットのように見えるか、よくわかりませんが、トランプカードには見えません。Soraの出力は純粋なカオスです。Runwayの出力は形が変形してしまい、ただ奇妙です。HuanYuanの出力も非常に奇妙です。完璧ではないものの、Minimaxの出力が許容できる品質に最も近いと言えるでしょう。
次のチャレンジは、私たちのお気に入りである、はい、AIビデオモデルで大量のミーム作成の可能性を持つ挑戦的なバレーボールのプロンプトです。今回はビーチバレーではなく、2つのプロチームの間のバレーボールの試合です。苦戦は現実のものです。
Klingの出力から始めましょう。少なくとも選手の間にネットを置くことはできましたが、2つのボールがあり、1つは形が変わり、奇妙な物理現象があります。単純に機能していません。Soraの出力については、ここで付け加えることはあまりないでしょう。はい、再び時間が奇妙に動き、複数のボールがあり、実際に1つのネットが消え、別のネットがシーンに入ってきます。Runway Genryは完全にバレーボールの部分を無視するか、バスケットボールとバレーボールのフィールドを一緒にマージして新しいスポーツを作り出しました。
Minimaxの出力は、少なくともある種の世界理解があります。この選手は残念ながら非常に激しく変形しているので、このショットは本当に使用できません。変形が本当にクレイジーなのが分かります。このチャレンジでは、HuanYuanが私たちが許容できると言えるものに最も近いと思います。もちろん、ここでもいくつかの問題があります。再び奇妙なフレームジャンプがあり、ジャージは意味をなさず、ピッチにチームが混在していますが、HuanYuanがこのチャレンジで許容できる結果に最も近いと主張したいと思います。
このチャレンジでは、被写体が段階的に一連のアクションを追う、シネマティックなものを目指しました。フレームに探偵が歩いて入り、バッジを見せ、その後カメラがバッジにズームインするというものです。この特定のプロンプトでは、HuanYuanとRunway Gen3がかなり苦戦しました。これらのモデルから得られた結果にはあまり満足していないので、このプロンプトについては脇に置いておこうと思います。
Kling 1.6は良い仕事をしたと思います。ただし、バッジは少し変に見え、私たちが知っている探偵のバッジとはあまり似ていません。Kling 1.6がプロンプトを段階的に追うことができたのがとても気に入りました。フレームに歩いて入り、バッジを見せるという一連の流れがここにあります。Soraの出力も非常にシネマティックです。人物がフレームに歩いて入り、バッジを見せ、バッジへのズームがあります。Minimaxは興味深いアプローチを取り、創造的になり、このプロンプトでも素晴らしい仕事をしたと思います。KlingとSora両方が素晴らしい仕事をしましたが、プロンプトの遵守という面ではKling 1.6が少し先を行っています。しかし、Soraの出力も決して期待を裏切りませんでした。
しかし、最高のプロンプト遵守出力を選ぶとすれば、間違いなくKlingだと言えます。これでテキストからビデオの比較を終え、次は画像からビデオに移ります。ちなみに、この動画が今までのところ役立っているなら、ぜひグッドボタンを押してチャンネル登録をお願いします。
画像からビデオでも、再生成なしで最初の出力を取り、比較のためにHuanYuanは外します。なぜならHuanYuanにはまだ画像からビデオモードがないからです。
最初のチャレンジでは、列車が加速しています。モデルがどれだけ上手く画像の内容を理解し、そこから動きを生み出せるかを理解しようとしています。Soraを除いて、すべてのモデルがここで良い仕事をしたと思います。これらのすべてのモデルの中で、Soraの出力が圧倒的に最も悪く見えます。個人的にはここでKlingの出力が最も気に入りました。なぜならこれは私が想像したまさにそのものだからです。RunwayとMinimaxの出力も良いのですが、Minimaxの出力には少し変形があります。また、歴史的にRunwayはアクションと動きに関して、非常に遅いビデオ映像を作成します。ただ非常にゆっくりと動くので、Klingからしか得られなかったような強い自然な動きの感覚を本当に与えてくれません。
SoraというかおそらくこのモデルはSora Turboで、完全版ではないと思いますが、これは他の最先端のモデル、特にKling 1.6と比較すると本当に劣ったモデルのように感じます。
次の例では、2匹の犬と1人の女性が歩いているという複数の異なるサブオブジェクトがあります。Soraでもこれを実行したかったのですが、残念ながら人物の写った画像を使用できるのは有料オプションの背後にあるため、Soraでは実行できませんでした。
再び最悪のものから始めます。ここではMinimaxです。アクションや歩く動作は非常に自然で素晴らしく見えますが、顔に強い一貫性の問題が見られます。顔が本当にぼやけて見え、ここで一貫性を失っています。最高の出力は間違いなくKling 1.6です。Runwayの出力も素晴らしいですが、Klingの出力ほど良くはなく、また、この遅い動きの問題があります。単に流れていないのです。そしてRunwayの出力では、右側の犬に追加の足が出現するのが見えます。ここでの勝者はKlingです。
次のビデオでは、この画像から始めて、被写体の周りをカメラが周回するのをテストしたいと思います。再び、シーンの説明から少し始めました。高いアングルから街を見つめる女性の周りをカメラが周回します。ここではすべてのモデルが素晴らしい結果、使用可能な結果を提供したと思います。個人的に私はKlingの出力が最も良いと感じました。彼女の髪の中の風も気に入りましたが、RunwayとMinimaxの出力を見ても、それらすべてが素晴らしい仕事をしたと思います。視覚的にはKlingの出力が最も気に入りましたが、3つすべてを勝者として受け入れたいと思います。
このビデオは実際に面白いもので、正直に言うと、ここでは2回異なるプロンプトを試しました。実際には、男の顔から銃へ、またはその逆に、単純なシネマティックなフォーカスの変更を求めただけでした。しかし、すべてのモデルでそれに苦戦し、あのナイスでクールなシネマティックなフォーカスの変更を得ることができませんでした。そこで、その代わりに単純にカメラが右にパンするというテストを決めました。そして、カメラがパンしている間にフォーカスのオファーが変わることを期待しました。
奇妙なことに、Minimaxは私が求めていないライフルの発射を与えてくれました。Runway Genry Alphaは本当にスムーズなカメラパンを与えてくれましたが、残念ながら私のキャラクターのライフルの先端に木製のスナイパーという追加のバレルを追加してしまいました。そのため、これは本当に使用できません。ここでも、最高の仕事をしたのはKling 1.6だと主張したいと思います。最高のカメラパンではないとしても、他の結果と比較して相対的に見て、まだ受け入れられます。
しかし、Minimaxの出力では、ライフルが発射され、その後、キャラクターの顔にフォーカスを合わせる素晴らしいフォーカスの変更があります。非常に使用可能で、とてもシネマティックなショットです。このチャレンジはKlingとMinimaxの間で引き分けと言うのが公平だと思います。
次のビデオではシネマティックなアクションシーンがあり、ここでもMinimaxはまた、私たちがプロンプトで求めていないライフルの発射から始まりました。はい、銃撃戦は言及しましたが、ライフルを発射する必要があるとは特定しませんでした。Genry Alphaの出力は奇妙に見えます。足、動き、モーションが私の観点からは本当に変に見えます。そのため、私自身のAI映画ではこの出力は使用しないでしょう。ここでも、Kling 1.6が他のモデルと比較して最もシネマティックで最高のショットを明確な勝者として提供しました。
次のチャレンジでは、シーンで起こるイベントがあります。古代都市からシーンを始め、その後、洪水が街を襲います。残念ながらRunwayは洪水を理解できず、私たちが求めたものを反映できませんでした。人々の動きは自然に見えますが、これは私たちが求めたものではありません。
ここではMinimaxから素晴らしい結果を得ました。私の動画で何度か言及したように、Minimaxはこの種のことで優れています。画像からビデオを始める際に、シーンでイベントが起こる場合、Minimaxは一般的に常に良い結果を提供します。以前、Klingはこれに苦戦していましたが、今やKlingも追いついてきているのが分かります。大規模な洪水がここでレンダリングされているわけではありませんが、それでも私たちが求めたものを提供することができました。
ここではMinimaxとKlingの出力の間で本当に迷っていますが、個人的にはMinimaxの出力の方が良い仕事をしたと感じています。そのため、ここではKlingよりもMinimaxを選びたいと思います。
次のビデオではバイキングがいて、どのモデルがカメラが被写体を最もよく追跡するかを理解したいと思います。Minimaxはここで素晴らしい仕事をしたと思います。最初のフレームでだけ少し時間が凍結する問題があり、ほとんど監督が「アクション」と言って、その後俳優が歩き始めたように感じます。これは面白いですが、Minimaxではときどきこのようなことが起こります。最初のショットが約1秒間凍結し、その後再開します。
ここでRunwayの出力は本当にシネマティックに見えるのが好きです。水の物理現象は素晴らしく見えますが、再び、これは私たちが求めたものではありません。Klingの出力はここでも本当に良く見えますが、カメラは被写体を追跡せず、静的なままです。そのため、私たちが求めたものを完全に無視しています。このチャレンジでは、私にとってMinimaxが明確な勝者です。ただし、おそらくビデオの最初の1秒はカットする必要があるでしょう。
次のチャレンジでは、プロンプトを何も書かずに、初期画像だけを与えて何が起こるかを見て、どのモデルがプロンプトなしで最高の仕事をするかを決めることにしました。再びRunwayから始めますが、このビデオではなぜいつもスローモーションなのかわかりません。私は確実にダイナミズムが少し欠けていると感じています。Minimaxの出力は素晴らしいものになったと思いますが、最後に奇妙な赤いUFOが出現し、それは少し奇妙で、私にとってはショットを台無しにしています。
自分を繰り返すのが怖いですが、ダイナミズム、歩く人々、煙のレンダリングでKlingが最高の仕事をしました。異なる速度で歩くキャラクターがいて、ゆっくりとシーンを漂うUFOがあり、とても生き生きとしてダイナミックに見えます。ここではKlingが明確な勝者だと言えるでしょう。
次のチャレンジでは、人間のアクション、動き、解剖学、物理学をテストしています。「彼女は馬に乗る」という単純なプロンプトです。これはモデルをテストする単純かつ効果的な方法だと思います。Minimaxの出力は、2番目の馬がどこからともなく出現するため使用できません。Runwayの出力は可愛らしく、素敵なシネマティックなドリーアウトがあり、公平に言って、シーンとキャラクターの一貫性を保つことができましたが、これは私たちが求めたものではありません。
再びKlingは、兵士のように本当にプロンプトに忠実に、女性が馬に乗るという結果を提供しました。物理学と彼女が登る様子は少し奇妙で変ですが、Klingは比較的まともな物理学で私たちが求めたものを提供しました。
次のチャレンジも同様です。再び、私たちの僧侶がドラゴンに乗る、または翼がないのでここでは大きなトカゲと言えるかもしれませんが、それを見たいと思います。これも再び一連のアクションの連鎖なので、まず白いドラゴンまたは白いトカゲに向かって歩き、その後それに乗るのを見たいと思います。
Minimaxの出力は少し奇妙で、彼は一種の浮遊をします。Runwayの出力は再びとてもシネマティックに見えますが、トカゲは全く動きません。そのため、非常に静的に見えます。肩越しの素敵な一貫性のあるショットですが、再び、これは私たちが求めたものではありません。そしてKling、これを繰り返すのに疲れてきましたが、ここで最高の仕事をしました。私たちのキャラクターはトカゲに向かって歩き、物理学は大丈夫に見えます。最高ではありませんが、少なくとも登ります。
次のチャレンジでは、再びモデルの物理学理解をテストしています。「女性が車に乗る」というものです。Minimaxの出力から始めると、車のドアが同時に開き、彼女が車の前に歩くのは奇妙です。Runwayの出力も非常に奇妙で、彼女が車から逃げようとしているように見え、車が彼女の上を走っています。これはKlingの出力で、最初の試行です。再び、彼女はドアを開け、ショットの途中で10秒の制限のためにビデオが停止します。他の2つと比較すると、はるかに良く見えます。アクションの最後で少し苦戦したかもしれないと思います。彼女が本当に完全に車に乗り込めたかどうかは超確実ではありませんが、勝者として受け入れたいと思います。
次のビデオでは、再び動きとアクション、そして物理学をテストしたいと思います。Minimaxは一般的にこの種のビデオで優れています。もちろん、顔の一貫性の変化を無視すれば、これは彼らが修正する必要のあるものだと思います。なぜなら、モデルは物理学と動きで一般的に良好な仕事をしますが、顔の一貫性があまりにも変化しすぎるからです。おそらく彼らはそれを改善する必要があります。
Runwayの出力は良好なスタートを切りましたが、その後キャラクターが変化し、より小さくなったり大きくなったりし、その間にサングラスが出現します。そのため、ここでキャラクターの一貫性を完全に失います。残念ながら、これは使用できないショットです。
ここでも再びKlingが最高の仕事をしました。波やキャラクターのサーフボードとの動き、一貫性、すべてが良く見えます。もちろん、その波から何が出てくるのか見るのも良いでしょう。モデルが最後まで一貫性を保てたら、それは私にとって大きな驚きになるでしょうが、再びKlingがここで最高の仕事をしました。私は自分を繰り返しているような気がし始めています。
次のチャレンジでは、モデルが手のジェスチャーを理解するかどうかを理解したいと思います。ハートのハンドジェスチャーのような単純なものを試してみたいと思います。ほとんどの場合、AIビデオモデルはこれが得意です。Minimaxはこれを完璧にこなしました。まさに私たちが求めた完璧な出力です。Runwayは、私たちが求めていない完全に不必要なドリーインがここにあります。完全に私のプロンプトを無視しました。そしてKlingはここにハートを作りましたが、「残りはどこだ?」という感じです。このチャレンジではMinimaxが明確な勝者です。
次のチャレンジでは、このクローズアップポートレートから始めて、ドローンカメラを上に動かしたいと思います。Minimaxは実際に私が求めたことを理解しましたが、その後一貫性が完全に失敗し、私のキャラクターが飛び始めました。Genry Alphaはローアングルに切り替わり、これは私たちが求めたものではありません。残念ながら、3つのモデルすべてがこのプロンプトで失敗しました。
次のチャレンジでは、シーンで起こるイベントがあります。ジャングルを歩く私のキャラクターという単純なものから始め、シーンに虎が飛び込んでくるというものです。Minimaxの虎は本当に奇妙に見え、このショット全体が変です。Genry Alphaは素敵なトラッキングショットを提供しましたが、虎を完全に無視しました。「虎は必要ない、ここに素敵なシネマティックなトラッキングショットがある」というような感じです。
Klingは最後に、本当に最後に虎を提供してくれました。私たちが求めたものを提供したとは言えるかもしれませんが、たぶん最高で最も使用可能なショットではないでしょう。ここでもスケールに少し問題があることに気付くでしょう。女性がショットの中でどんどん小さくなり、ほとんど縮んでいくような感じで、虎が巨大すぎます。
次のチャレンジは、モデルが人間の感情をどのように反映し、レンダリングするかを理解することについてです。MinimaxとKling両方が素晴らしい仕事をしたと思います。ただし、Klingの出力はより劇的に見え、Minimaxの出力は少しより控えめです。そしてはい、Runwayはそれをレンダリングできませんでした。はい、彼女は悲しそうに見えますが、泣いてはいません。このチャレンジについては、KlingとMinimaxの間で迷っていますが、公平に言うと、Klingが再びこれを勝ち取ったと思います。
ご理解の通り、Kling 1.6は素晴らしいモデルです。これは間違いなく大きな改善です。これをGoogle V2でもテストしたいと思います。そして、はい、V2は公開されていないことは承知の上です。同意します。しかし、既にKlingがありますよね?それは公開されており、今日使用できます。そのため、既に素晴らしいことです。
ただ楽しみのために、Google V2と比較してテストできます。有名なトマトを切るシーンから始めたいと思います。これはKlingの出力です。ショットの始まりは残念ながら使用できません。そしてはい、V2のショットは本当に次世代のように見えます。もしかしたらKlingショットの始まりをカットすれば使用可能かもしれませんが、それでもV2ほど良くはありません。
次のプロンプトでは、「鏡を見ながら猫が吠え、自分の反射を見る代わりに吠えるライオンとして見る」というものです。これはAIビデオモデルをテストするのに本当に良い挑戦的なプロンプトだと思います。なぜなら、猫、ライオン、反射、吠える、多くのことが起こっているのをレンダリングする必要があるからです。Klingはここで本当に苦労し、猫をライオンに変形させ、とても大きな猫を作ったような感じです。一方、同じプロンプトでV2は非常に正確にレンダリングしました。このような難しいプロンプトに対するGoogle V2の出力は驚くほど良いと言えるでしょう。
最後に、キリンの体操です。これは別の素晴らしいプロンプトです。キリンの体操を想像するのは人間の私でさえ難しいです。しかし、AIビデオモデルにとってはそうです。ご覧の通り、両方のモデルがここで苦戦しました。これは難しいプロンプトで、私はそれがとても好きです。両方のモデルが正直に苦戦したのを見るのは良いことです。GoogleのV2にも限界があることが分かります。しかし、一貫性と一般的な写真のリアリズムを見ると、やはりV2は優れていると言えるでしょう。
多くの人々がコメントで私の個人的なAIビデオモデルの選択について尋ねています。そのため、このセクションが皆さんへの素晴らしい総合的な返答になることを願っています。現在の私のビデオモデルの個人的なランキングは次のようになっています。
もしあなたがこのビデオを、たとえば2025年3月に見ているなら、状況は大きく異なっているかもしれません。なぜならこの分野は非常に速く動いているからです。しかし、これは2024年12月のスナップショットです。
もちろん、明らかに今までに見てきたものに基づいて、Google V2が最高のモデルに見えますが、まだ一般に公開されていません。選ばれた人々だけが試すことができます。そのため、私はそれをグレーアウトしています。アクセスできるようになれば喜んで変更できますが、今のところ使用できないため、2024年の勝者だと明確に言うことはできません。たとえそれが超有望で次世代に見えたとしてもです。
2024年の総合的に利用可能な最高のモデル賞をKling 1.6に与えたいと思います。全体的に最高の品質を提供し、他のモデルとの比較でも見てきたように、decent(まともな)リップシンクも持っています。その機能で全体的に満足させてくれるでしょう。現金に対して最高の価値を提供してくれると思います。そして、これを何度も繰り返してきたので、これは有料のパートナーシップではないことを言わざるを得ません。単に私のコミュニティが現金で最高の決定を下すのを助けるために、客観的なテストを行おうとしているだけです。Klingチームとは何の有機的なつながりもありません。
3位には、MinimaxとRunway Genryを一緒に置きました。これらを一緒に置いたのは、あなたのニーズ次第だからです。つまり、Runwayは画像からビデオに最適化されているため、テキストからビデオでは本当に欠けています。そのため、クリエイターとしてテキストからビデオをより多く使用している場合は、Runwayに行くべきではないと思います。
Runwayプロンプトのクールな点は、画像からビデオモードでは画像を説明する必要がないことです。シネマトグラフィーを説明するだけでよく、これが私にとってRunwayを最高のシネマティックAIビデオツールの1つにしています。シネマティックカメラをコントロールする際には。しかし、被写体をコントロールし、アクションをコントロールし、シーンで起こるイベントをコントロールしたい場合は、Minimaxの方向に行くことをお勧めします。これは被写体とアクションをコントロールする際の素晴らしいツールです。シネマティックカメラをコントロールしたい場合はRunwayに行き、Runwayは非常にdecentなリップシンクツールも提供します。Act Oneについては既に動画を作っています。
Minimaxの問題は顔の一貫性の問題です。それはしばらくの間そこにあり、まだ解決されていません。つまり、特にカメラから遠い場合、顔が非常に変化します。彼らが顔の一貫性の問題を修正すれば、Klingの真剣な競争相手になるでしょう。
「シネマティックカメラとシーンの被写体の両方をコントロールしたい、そしてアクションとイベントもコントロールしたい」と言うなら、残念ながらまだそのようなツールはありません。すべてのツールには長所と短所があります。たぶんKling 1.6とV2が、すべてをコントロールするタイプのAIビデオツールに最も近いでしょう。
スピードについて少し話しましょう。これは人々が本当に気にかけることだからです。2024年12月現在、私にとってMinimaxが最速のツールです。Kling 1.6の生成は現在、5秒のビデオで約10分、10秒のビデオで14分かかります。1.5が最初にリリースされたとき、まさに同じ問題がありました。本当に遅かったのですが、時間とともにそれをずっと速くしました。私のKling 1.5のビデオに戻ると、コメントで多くの人々がスピードの問題について不満を言っていたのが分かりますが、後にこれらの不満は減少しました。1.6でも同じようになると思います。
一方、私のMinimaxの生成は約4分かかり、スピードに関してうまく最適化されていると思います。Runwayについては、無制限モードでは10分キューで待つ必要があります。もちろん、クレジットを使用したい場合は生成が非常に速くなりますが、明らかにクレジットはすぐに底をつきます。Runway Turboは速いですが、品質が大幅に低下します。これはより安価なオプションですが、Runwayからの良いオファーだと思います。安価で速いので、Runway Turboの使用を検討できます。
いくつかの特筆すべき言及があります。これらのツールについて言及しないのは不公平でしょう。リストには入れませんでしたが、Luma Dream Machineは、特に画像からビデオに関して、decentなビデオ品質を提供します。Lumaチームについて私が好きな1つのことは、クリエイターのフィードバックに耳を傾けることです。特に最新の変更で素晴らしいユーザーインターフェースを提供しており、このツールを使用するのは本当に楽しいです。このツールの使いやすさに大きな注意を払っています。この素晴らしい仕事に対してLumaに拍手を送りたいと思います。
もう1つの特筆すべき言及は中国のモデルHuanYuanです。テキストからビデオに関して本当に素晴らしいです。今日現在、まだ画像からビデオを提供していません。もちろん、将来的には画像からビデオモードもHuanYuanに来ると確信しています。そうなれば喜んで再テストしたいと思います。
このビデオが本当に役立ったことを願っています。グッドボタンを押し、より詳しいチュートリアルのためにチャンネル登録を忘れないでください。クリエイティブインテリジェンスについてもっと学びたい場合は、ここをクリックしてください。


コメント