
5,949 文字

噂は本当でした。Soraが登場しました。数ヶ月前に初めて発表されたOpenAIの素晴らしいテキストから動画を生成するプロダクトを、私たちは辛抱強く待っていましたが、ついに登場しました。しかもこれは単なるテキストから動画を生成するモデルではありません。完全なAI編集スイートであり、それは驚くべきものです。待つ価値がありました。私はアクセス権を得たので、すべてについてお話しし、実際に試してみて、作成したものをお見せしましょう。本題に入る前に、いくつかの素晴らしい生成例をお見せしましょう。
ここに踊る熱帯雨林のカエルの映像があります。こちらはルービックキューブを解くロボットです。こちらは庭に座る猫の映像で、完璧に見えます。これは魚眼レンズを使用して家の前にいるニワトリの映像ですが、一瞬見ただけではこれが完全にAIで生成されたものだとは判別できないほどです。
先ほど述べたように、これは単なるテキストから動画への変換以上のものです。既に作成したものをリミックスしたり、動画の最後にフレームを追加したりするなど、多くの機能がこのモデルに組み込まれています。
少し詳しく見ていきましょう。最初に紹介したい機能は「リミックス」です。リミックスを使用して、動画内の要素を置き換えたり、削除したり、再構想したりできます。例えば、「図書館への大きなドアを開く」という映像があり、そこで「ドアをフレンチドアに置き換え、図書館を宇宙船に変える」といったことができます。基本的に同じ動画を別のスキンに変更できるのです。
次に「リカット」があります。最適なフレームを見つけて分離し、シーンを完成させるために前後どちらかの方向に延長することができます。先ほど述べたように、まさに編集スタジオのような機能です。Soraの制作者たちは、ライブストリームの最後で「ここに入って単にプロンプトを入力すれば完全な長編映画が得られると期待するのは間違いです。これはクリエイター向けのツールです」と述べていました。
これがリカットです。オリジナルがあり、その前に映像を追加したり(前方に延長)、後ろに映像を追加したり(後方に延長)することができます。ここでライブストリームのリカット機能のデモ部分をお見せしましょう。
別の編集ツールであるリカットを使用してみましょう。これを使うと、動画をトリミングし、さらに多くの演出を加えてストーリーボードで延長することができます。リカットをクリックすると新しいストーリーボードに移動し、Soraはこの鶴の動画をインポートしました。タイムライン上で動画を確認でき、スクラブスルーして確認したり、トリミングすることもできます。
QuickTimeやDaVinci、Premiereに慣れている人なら、これらはすべて馴染みのあるものでしょう。興味深いのは、彼らが実際の動画編集部分を外部に委託せず、直接Soraに組み込んでいることです。なお、これはすべてsora.com(s-o-r-a.com)で利用可能で、ChatGPTとは完全に異なります。
頭が水に飛び込むシーンが気に入りました。他のストーリーボードの例と同様に、ここで空白にした部分は、既存のストーリーボードカードからシームレスに続いていきます。まったく新しいエンディングが欲しい場合は、最後を空白にしてクリエイトを押せばよいのです。
全く新しい始まりが欲しい場合、例えばこのシーンを最後に持ってきたければ、ここに置いて、最初の部分で鶴のカメラをもう少し長く映すこともできます。これが機能の仕組みです。基本的に動画の一部を削除し、それを再生成して元の動画に自然に流れ込むようにできます。また、中間に移動して、完全に新しい始まりと終わりを生成することもできます。
ストーリーボードの他の部分と同様に、常にカードをクリックして追加し、より多くの演出を加えることができます。
次に「ストーリーボード」という機能があります。これは各シーンごとに異なるプロンプトを設定でき、それに基づいてストーリー性のある動画を作成できます。これもまた編集スタジオのようですが、すべてがAIで生成される点が驚くべきものです。
例えば、0から114フレームまでは「広大な赤い風景」、114から324フレームまでは「宇宙船の内部からの眺め」、最後に324から440フレームまでは「編み物のマスクで縁取られた宇宙飛行士の目のクローズアップ」といった具合です。ストーリーボードが実際にどのように見えるか、今日のライブストリームからクリップをお見せしましょう。
今日、私たちは全く新しいクリエイティブツールを紹介できることを嬉しく思います。まだ非常に初期段階ですが、ストーリーボードと呼んでいるより高度なツールです。これを使用すると、馴染みのあるタイムラインを使用してシーケンス全体で複数のアクションを持つ動画を演出することができます。
画面上部にはストーリーボードカードがあり、ここで特定の時点での環境、キャラクター、アクションを描写します。その下にはタイムラインがあり、クリップ全体の概要を見ることができます。ここで動画内のアクションをシーケンス化します。さらにその下には、先ほどロハンが説明した作成設定があります。
ストーリーボードに戻って、シーンの最初のカードを設定してみましょう。「美しい白い鶴が小川に立っています。黄色い尾を持っています」と入力します。ここでは少なく書いても多く書いても構いません。少なく書けばSoraが詳細を補完し、多く書けばSoraはより忠実にその方向性に従おうとします。
この動画では、最初に鶴が立っていて、その後頭を水に入れて魚を捕まえるようにしたいと思います。タイムラインに移動し、クリップの概要内のどこでもクリックして追加のカードを追加し、Soraにそれらのアクションを指示できます。
上に移動して「鶴が頭を水に入れて魚を引き上げる」と入力します。タイムラインを見直すと、最初にシーンを設定し、5秒後に鶴が頭を水に入れることがわかります。この2つのカードの間にある空白のスペースは、最初のアクションセットと2番目のアクションセットを接続するためのものです。
これらのアクションがいつ発生するかを調整することは常に可能ですが、連続したショットを望む場合は、これらのアイデアを接続するためにSoraに十分な時間を与えることが重要です。また、シネマティックなカットを作成するために近づけたり、さらに離してSoraにより多くの詳細を補完させることもできます。
では5秒に戻して実行してみましょう。生成されたら、鶴が水から魚を引き上げる様子を見てみましょう。はい、途中で鶴が頭を水に入れているのが見えます。魚を捕まえたかどうか見てみましょう。あ、今回は失敗したようです。別のものも確認してみましょう。
Soraが私の指示を理解し、どこに行きたいのかをかなり正確に理解していることがわかります。どちらの鶴も失敗したようですが…あ、小さな魚を捕まえました。これも指摘したい点ですが、Soraの魅力の半分は、動画を編集してその上に構築できることです。
次は「ループ」という機能です。これは文字通り、動画をループさせることができますが、始まりと終わりが非常にうまく繋がるように作成されます。例をお見せしましょう。これは炎の映像で、きれいにループしています。このタイプの動画は、TikTokやInstagramなど、自動的にループする場所で非常に人気が出ると思います。
これは花が咲く映像で、動画の最後で見られるように萎れて戻り、また咲きます。これは階段で、非常にトリッピーでクールです。そしてこれは波で、基本的に無限の波です。
次に「ブレンド」があります。2つの異なる動画があり、それらのコンセプトを1つに混ぜ合わせることができます。左側には雪片、右側には落ちる花びらが見え、中央にはその2つのブレンドがあります。
次に「ストーリープリセット」があります。これはプロンプトライブラリのようなもので、再利用できます。特定のスタイルが気に入った場合、それをプリセットとして保存し、将来の動画で使用できます。これにより、動画全体で一貫したテーマを作成できます。
価格設定について話しましょう。実際に予想よりも寛容でした。残念ながら、まだ無料ユーザーは利用できませんし、ヨーロッパやその他いくつかの国でも利用できません。明確なタイムラインはありませんが、ChatGPTプラスユーザー(月額20ドル)向けに懸命に取り組んでいると述べています。多くの人が利用している月額20ドルのプランでは、1日50個の優先動画を生成でき、720p解像度で5秒間の動画を作成できます。これはかなり良いと思います。もちろん、無料ユーザーはすべての動画を見ることはできますが、それは同じではありません。
ChatGPT Pro(月額200ドル)プランは、今になって実際に意味を持ち始めています。最初に発表された時、彼らはo1 Pro(最上位モデル)を持っており、多くの思考を行い、無制限の生成が可能でした。今では、その月額200ドルの一部としてSoraでも無制限の生成が可能になります。この月額200ドルは本当に魅力的に見え始めています。
ここで一旦pause して言わせてください。OpenAIは12月に本当に素晴らしいものを届けてくれました。OpenAIの12日間の発表の3日目にすぎませんが、すでにo1 ProとSoraをリリースし、まだ9日分の発表が残っているというのは驚くべきことです。そうそう、新しいオフィスに移動したことにお気づきでしょう。新しいオフィスへようこそ。背景に何を追加すべきか、ご意見をお聞かせください。
ChatGPT Proユーザーは、無制限の生成と大量のワークロード向けの最高解像度を利用できます。500個の優先動画、無制限の「リラックス」動画(遅いや優先度が低いとは呼ばず)が利用可能です。つまり、少し待ち時間が長くなる可能性があるということです。1080p解像度で20秒の動画を作成でき、5つの同時生成が可能です。また、ウォーターマークなしでダウンロードできるのも良い点です。
では、実際に試してみましょう。これがインターフェースです。サインアップは非常に遅かったのですが、サーバーが完全に過負荷になっていると思います。インターフェースでは、基本的に他の人の生成物が無限スクロールで表示されます。これらの動画は絶対に gorgeous で、クオリティが素晴らしいです。この動画を見てください。クオリティの高さがわかります。
実は私の最初の生成は失敗しました。これは発表直後の数分の出来事なので、サーバーが完全に過負荷になっていると思います。しかし、どのように機能するかお見せしましょう。
「動画を説明してください」というところに「月面でコンピュータを使用して遊んでいる宇宙飛行士」と入力します。ここでアスペクト比をクリックして変更できます。16:9のままにしておきましょう。解像度も変更できます。8倍遅くなりますが、今は480pのままにしておきます。とりあえず様子を見たいだけなので。他の動画生成は私のTwitter(@Matthew Berman)でポストするので、フォローしていない方はぜひフォローしてください。
ここで動画の長さを変更できます。今は5秒のままにしておきます。同じプロンプトから複数のバリエーションを自動的に生成することもできます。ここでは1本、2本、または4本の動画を生成できます。
先ほど言及したプリセットがここにあります。「balloon world」「stop motion」があり、好きなプリセットを作成できます。そしてここにストーリーボードがあります。ストーリーボードを生成をクリックすると、私のプロンプトを自動的に拡張してくれました。
「白いスペースーツを着た宇宙飛行士が月の埃っぽい表面に快適に座っています。上の黒い空には地球が大きく浮かんでいます」、そして「宇宙飛行士は前かがみになり、キーボードを叩きながらコンピュータゲームに集中して没頭しています」。この2つのシーンで作成をクリックしてみましょう。
キューに追加されたと表示され、ここでキューの進行状況が確認できます。最初の生成は失敗しましたが、これがうまくいくか見てみましょう。クリックすると、まだ生成中であることがわかります。先ほど言及したSoraのすべての機能はここにありますが、動画が生成された後でそれらを使って遊べます。
今は生成を待っている間、ホームページに戻って他の人が作成した動画を見てみましょう。これが気に入りました。クリックしてみましょう。これらはすべて現在公開されているので、好きなことができます。ここに「リカット」「リミックス」「ブレンド」「ループ」があります。リミックスをクリックしてみましょう。
はい、これがトヨタ86のナイトドリフトのリミックスです。「すべての車をレゴにする」と入力します。リミックスの強さを選べます。「強い」「中程度」「微妙」「カスタム」があります。強いリミックスを選んでリミックスを開始します。
今、キューに2つの項目があります。待っている間に、ハリウッドでAIビデオが映像制作の創造性を劇的に変えないと思っていた人たちは、明らかに間違っていたことを指摘したいと思います。これは最も初期の段階であり、それでも驚くべきものです。無制限の計算能力があり、本当に長い動画を作成でき、ストーリーボード機能を使って異なるシーンを組み合わせて魅力的な動画を作り、そこにElevenLabsで音声を追加することを想像してみてください。すべてが本当にクールです。ついにこれで遊べることをとても嬉しく思います。
動画の1つは動作しませんでしたが、このレゴ動画が動作し始めました。見てみましょう。右側が元の動画で、こちらが私のレゴバージョンです。大きな変化ではありませんが、確かに少しよりレゴっぽく見えます。そうですね、すべての車が少し異なって見えます。強いリミックスを選んだにもかかわらず、それほど劇的な変化ではありませんでした。
残念ながら、他に試していた動画は失敗してしまいました。私が作成する動画は引き続きTwitterに投稿していくので、ぜひそちらをフォローしてください。
以上です。どう思われましたか?この動画が気に入っていただけたら、いいねと登録をお願いします。次回の動画でお会いしましょう。


コメント