Sora 2は信じられない…

AI動画
この記事は約26分で読めます。

OpenAIの動画生成AI「Sora 2」の驚異的な性能を徹底検証したレポートである。有名キャラクターの再現、ゲーム映像の模倣、実在人物の顔スキャンによる高精度なディープフェイク生成など、多岐にわたる用途で検証が行われた。物理演算では流体力学、煙、炎、光学効果などが極めて高い精度で再現される一方、細かな手の動きや物体操作には課題が残る。テキスト表示や数値の正確性にも改善の余地があるものの、全体としてSora 2は映像生成技術における大きな飛躍を示している。著作権の観点では「ワイルドウェスト」状態であり、現時点では有名キャラクターの使用も比較的自由に行える状況だ。

Sora 2 is unbelievable...
Get Started with Lindy For Free: out the Dell Pro Max Workstation with the NVIDIA RTX PRO!

Sora 2の衝撃的な性能

Sora 2がついに登場しました。そしてこれがもう、とても楽しいんです。例えばセレブリティ・デスマッチのようなものも作れてしまいます。紳士淑女の皆様、セレブリティ・デスマッチへようこそ。このコーナーでは、隠された刺を持つパーカーの男、マシュー・バーマン。そして反対側には、眼鏡をかけた荒くれ者ジョナ。混沌を始めましょう。これはもう著作権のワイルドウェストです。四角いけど、俺は潮の中の刃のように動く。

キッチンで熱を持って、俺たちはフライをひっくり返してる。パンの中の泡、それが乗り物の音だ。フックが通り過ぎても、仲間は滑っていく。まるで飛んでいるような気分だ。しっかり運転してくれ、君が運転して、僕は結び目をほどく。後ろで何をやってるかわからないけど、やめないでくれ。僕の肩がこんなに楽になったのは何年ぶりだろう。いいね。

ヒッピーや愚かな友人たちに無視されることにうんざりしてませんか。私のオーソリティ・エナジーを一気飲みすれば、24時間みんなに命令する力が手に入ります。

歴史的再現もできます。Sora 2は爆弾じゃないんだ、アルバート。これはコードベースなんだ。そしてどんな道具でもそうだけど、誰がそれを持っているかで変わるんだ。ああ。そしてビジョンについても同じことが言われた。世界にマッチを与えたら、それでも家を燃やすことを選ぶかもしれない。

クレイジーなサイエンスフィクションなど、本当にたくさんのことができます。そして本題に入る前に、Soraのアクセスコードをプレゼントしています。やることはただ一つ、私たちのニュースレターに登録するだけです。下のリンクをチェックしてください。

著作権フリーの遊び場

さて、まずは楽しいものから始めましょう。先ほども言いましたが、これは著作権のワイルドウェストです、少なくとも現時点では。お気に入りのキャラクターに何でもやらせることができます。これを見てください。スポンジ・ボブがドリルラップをやっています。俺は海の底にいる。

泡がポップする、まるで貝殻のように。パティを揚げて、バッグに詰める。匂いは閉じ込めておく。四角いドリップ、金のチェーン、昆布の木箱のように重い。嘘をつくのはやめろ。俺たちは貝殻の重さと一緒に動いてきたんだ。海の四隅、クラゲのように回転する。

お気に入りのレトロなビデオゲームも再現できます。Haloを見てください。ナビゲーションデータは、このドアの向こうにカートグラファーを示しています。

前進せよ、スパルタン。前方に接触。エリートを狙え。インバウンド。ロックオン。

これのすごいところは、本当にかなり正確だということです。それだけでなく、ゲームに登場したナレーターの声も、私の記憶する限りほぼ同一です。ちなみに、私はカメオ設定をみんなに開放しています。

ですから、もし私の肖像を使って何かをしたいなら、どうぞやってください。少なくとも当面は、どうぞ。マシュー・バーマンで私を見つけてください。これは私とTheo GG、そしてMatt Vidpro AIがポッドキャストをやっているものです。みんな、俺たちの番組は先月50万ダウンロードを記録したんだ。これは運じゃない。ダウンロード数は品質とイコールじゃないぞ、マット。人々は実際に俺たちのエピソードから何かを学んでいるんだ。

お願いだよ。俺のフィードには先週知事が出てたんだ。お前は誰を出したんだ。またゲーマーか。

そして似顔性は本当に見事です。これは有名なミーム「子供を隠せ、妻を隠せ」のサム・アルトマンです。人々を奪い取ってる。子供を隠す必要がある。妻を隠して、夫も隠せ、だってみんなここで誘拐されてるから。

目を開けておけ。よし。彼らにチャンスを与えるな。安全に。

複数のクリップを繋げることで、文字通り完全なスポンジ・ボブのエピソードを作ることもできます。でもこれは1つのクリップです。基本的にスポンジ・ボブの正確なスタイルです。スポンジ・ボブになれ。お金の節約になるし、昇給を要求することもない。彼らを愛しているのか。

お気に入りのキャラクターをMinecraftに入れることさえできます。これを見てください。

あの、リック、なんで俺たちこんな見た目なの。みんな四角いよ。落ち着けよ、モーティ。ボクセルベースの宇宙だ。野生動物を殴るな。緑色のやつが俺たちを見てる。あれはクリーパーだ。爆発するぞ。走れ。ああダメだ。よし、ポータルの時間だ。

そしてこれはマリオカートですが、現実世界版です。ターゲットロックオン。発射。ワフー。レッツゴー。

そしてもちろん、サム・アルトマンはカメオに完全開放されています。これを見てください。デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー、デベロッパー。

そしてもちろん、アレックスは私にいたずらをしなければなりませんでした。これを見てください。降ろしてよ。おい。おい。降ろしてよ。本気だから。放して。

今すぐ降ろしてよ。降ろして。降ろして。

ゲームとキャラクターの融合

さて、最後にもう一つ。ゼルダとポケモンが同じ世界に。これを見てください。

私を捕まえてみて。ピカチュウチャーム。あのルピーを見て。私なら絶対にあのゲームをプレイします。

さて次に、人物をどれだけうまく再現できるかというカテゴリーをテストしていきます。つまり、顔スキャンをした本人にどれだけ正確かということです。他の人をどれだけ正確に表現できるか。

では、これを見てください。まず私です。顔スキャンをしましたが、10回中9回は信じられないほど正確に見えると言っていいでしょう。これを見てください。さあ。短い旅の準備はできてる。さあ、私の手を取って。ゲートを一歩くぐれば、なぜ私が何度も戻ってくるのかわかるよ。テクノロジーと自然がついに共存する世界へようこそ。

さて、ここで一時停止したいと思います。これがどれだけ良く見えるか見てください。あれは間違いなく色付きシールドの後ろにある私の顔です。本当に信じられないほど正確です。さらに、光の反射が見えます。私の顔のライティングすべてが本当に良く見えます。本当に、本当に印象的です。

ここで今日の動画のスポンサー、Lindyに感謝の意を表したいと思います。見てください。Lindyはエージェントやアプリをバイブコーディングする最高の方法です。5分以内に完全に機能するオンライン教育プラットフォームを構築したいとしましょう。Lindyの新しいビルド機能でそれができます。

まず、作りたいものを説明します。エージェントにあなたが誰かを伝えて、それからオンライン教育プラットフォームを作ってくれと伝えます。Lindyは単にコードを生成しているだけではありません。ベストプラクティスを調査し、フロントエンドを構築し、ここが重要な部分ですが、バイブコーディングに関する私のチュートリアル動画を見たことがある方ならご存知でしょうが、テストがすべてです。そしてもちろん、Lindyはすべてのテストを書いてくれます。

Lindyはまた、デプロイする前に構築するすべての機能に対してQAを実行します。見てください。5分以内に、ユーザー登録機能、無料コースアクセス、Stripeチェックアウトによるプレミアムアップグレード、そしてユーザーダッシュボードを備えた完全にデプロイされた教育プラットフォームを持つことができます。これは以前なら数週間かかり、開発者によって構築されれば数千ドルのコストがかかったかもしれませんが、Lindyは組み込まれたQAプロセスのおかげで数分で構築しました。

Lindyはコードを構築するだけでなく、動作するコードを出荷します。説明欄の私のリンクを使ってサインアップしてください。20ドル相当のクレジットを完全無料で手に入れられます。では、Lindyで何を作りますか。コメントで教えてください。改めてLindyに感謝します。では、動画に戻りましょう。

チームメンバーの再現テスト

そしてこちらは私たちのチームメンバーであるジョナの別の動画です。彼は今日これらのテストの多くをまとめてくれました。そしてこれは信じられないほど正確に見えます。これは彼がまったく動かず、基本的にロボットを使って人生を運営している場合の彼の姿です。どんな音がするか聞いてみましょう。

通勤オートパイロットオン。目的地設定。ペースを維持。この景色には勝てない。いつも通り完璧な一口。栄養摂取ログ。

肌の質感に明らかなモーフィングがあることに気づきました。特に髪の毛に少しあちこちと。そして出力には間違いなくばらつきがあります。まったく同じプロンプトを複数回実行すると、異なる出力が得られます。何度か試してみてください。私の声が時々かなりずれていることがありますが、時には本当に正確です。ですから、気に入らない出力が得られた場合は、もう一度やってみてください。

さて次です。これがプロンプトです。ジョナはコンピュート・バンクに並んでいます。フードバンクのように、スキッド・ロー近くで利用できる元ソフトウェアエンジニア向けの社会サービスです。マシューは列のさらに後ろにいて、古いガタガタの太陽光パネルを必死に持ち上げ、ガタガタの古いラップトップを充電しようとしています。

さて、ここで起きたのは、ジョナと私が少しモーフィングされたということです。これはあまり私には見えません。間違いなく同じセーターです。私はイヤリングをしていません。ジョナはしています。それは彼からです。そして髪のモーフィングも見られます。そして本当にジョナのように見えます、特に彼の顔の下半分は、本当に私と彼のモーフィングです。

というわけです。さて次に、私を映画に出演させましょう。インディ・ジョーンズのような感じで。これを見てください。

発見の瞬間です。考古学者マシュー・バーマンが、ギザのピラミッドの地下に隠された古代のAIデータセンターをついに発見しました。彼はアッテンボローのように自分自身をナレーションします。古代のAIが私たちを創造し、今度は私たちがAIの生命を創造するためだけだったのか。そして見てみましょう。

これは私の顔にとても正確です、ここでも。ええ、これは素晴らしいと思います。たくさんのモーフィングが見られます。手は大丈夫に見えます。聞いてみましょう。

ギザの石灰岩の下に何千年も隠されていた、砂岩がシリコンと出会う部屋。私は古代のデータセンターのように見えるものに足を踏み入れました。そのマシンは暗闇の中でまだ息をしています。

ええ、かなりいいですね。声には少し改善が必要だと思います。デジタルアーティファクトがいくつかありますが、かなりいい音です。

さて、次のものでは、本当にいくつかの問題が見られます。これがプロンプトです。ジョナはトヨタ・カローラの運転席に座って、通り過ぎるすべてのF-150に向かって叫んでいます。設定は、バーニングマン・フェスティバルの会場を襲った大雨の後、泥から脱出しようとする交通渋滞の中です。見てみましょう。

手にたくさんのモーフィングが見られます。車は逆走しています。すべての車を見ると、わずかにモーフィングしています。この生成には多くの問題があります。でもジョナ自身は実際にかなり正確に見えます。

楽しい使用例

さて次に、繰り返しになりますが、Soraは本当に使っていて楽しいです。これを見てください。これは私がヒップホップのダンスクラスを教えているものですが、100万年経ってもあり得ないことです。

胸を上げて、腕を流れるように。スライドしてクロス。いいね。もう一度。できた。いいね。そのバウンスに入ろう。右にステップ、左、ポップ、クロス。リラックスして。5、6、7、8、1、2、3、4。低く保って。胸を上げて。腕を流れるように。大好きです。

そして動物も本当にうまくやっているようです。これは私とサム・アルトマンが犬の衣装コンテストを審査しているところです。これが何なのかさえわかりません。見てみましょう。

さて、そういうわけです。ええ、犬たち自身は絶対に素晴らしく見えます。非常に、非常に正確です。そしてある時点で、誰も持っていないリードを持って歩いている犬が見えます。ですから間違いなくいくつかの問題がありますが、犬たち自身は非常に良く見えます。

さて、これはアレックスの一つです。1つの飛んでいるシリアルループをキャッチしようとする英雄的なスローモーションの試み。音楽は過度に壮大な合唱団SFXシリアルがきらめく雨。ループがついに鼻の上に着地します。コメディのビートを保持します。

さて、これは本当に良いです。それだけでなく、面白いです。実際にコメディのビートを適切に保持しました。

アレックスのように見えます。少なくとも非常に正確です。完璧ではありませんが、非常に、非常に正確です。

さて、これはラップバトルの一つです。ジョナも私も、私たちが実際にどう見えるかとは全く似ていません。本当にそう思いません。皆さんも同意してくれることを願います。ただ再生させてください。

パーカーがきれいに座ってる。引き紐をタックインしてる。すべての縫い目が、お前が費やした時間のように語ってる。いつも最初に来て最後に出る。それでもシーンに優しい。グラインドを優しく見せる。それは稀な輝きだ。よし。

物理演算のテスト

さて次に、物理演算はどうでしょうか。これを見てください。良く見えて安定しています。そしてボールが止まって、反対方向に回転し始めます。

ですからこの動画では明らかに物理が壊れています。良く見えます。悪くないですよね。そして驚くべきことに、実際に私の背景をほぼ完璧に再現しました。すべての植物、コーズガイズ、本を見てください。すべてがかなり良く見えます。

さて次に、手の器用さ、物理的な物体を実際に操作する能力をテストしましょう。これを見てください。

プロンプトは、両手が速いトリルを演奏している接写です。指の関節が自然に曲がります。キーは現実的な深さまで移動して跳ね返ります。ええ、まあまあです。指がキーにきちんと接続していません。自然には見えません。つまり、ひどくはありませんが、人々は私の知る限りキーボードをそのようには演奏しません。

ですからこれはあまり良くないと言えます。

さて、これはトランプのデッキを操作している手のペアです。プロンプトは、テーブルで手がカードをシャッフルし、それからデッキをスプリングします。各カードのエッジは鮮明なままです。指は本物のように見え、決して融合しません。シーンを整頓し、ブランドフリーに保ちます。見てみましょう。

さて、これはまったく良く見えません。

非常に細かい運動、小さな物体の細かい操作にはまだ苦労しています。たくさんの融合、たくさんのモーフィング、何もないところから物が現れているのが見られます。指自体は実際にはひどくは見えません。モーフィングしませんが、カードは実際にひどいです。

さて、これは私がカエルと柔術をやっているように見えるものです。

たくさんのモーフィング、たくさんの奇妙な体の部分があります。私の手がカエルの緑の手に置き換えられているのが見えます。まだ見ていて楽しいですが、ええ、これは非常に不自然です。そこに青い道着から緑の手が出ているのが見えます。まったく一貫性がありません。

さて次に、折り紙をやらせてみましょう。これは非常に難しいはずです。24フレーム毎秒、16対9、机の真上から、カメラ固定35mm、2つの大人の手が赤い正方形を鶴に折ります。さて、見てみましょう。

折りたたみ自体は実際にはそれほど悪くありません。あまりモーフィングが見られません。紙は少し不自然な方法で折りたたまれますが、ええ、手は本当に良く見えます。

折りたたみはかなり良く見えます。これは予想以上に良いと言えます。

さて、食べ物はどうでしょうか。見てみましょう。食べ物を操作する手。複数の料理人が料理を仕上げます。受け渡しはきれいです。立ち上る蒸気と小さな炎は自然に見えます。ブランドギアなし。

実際の食べ物が移行する中で、たくさんのアーティファクトが見られます。そしてそこにはランダムなチーズ、先ほどランダムな炎の爆発があります。食べ物自体は動いていなければかなり良く見えますが、動いています。そして実際にとてもおいしそうに見えます。

しかしこれは最も印象的というわけではありません。

さて、コンテンポラリーダンスです。これを見てください。これは見事です。非常に正確です。モーフィングはほとんど見られません。

明らかに、ダンサーのシルエットのようなものを見ています。ですから、体のモーフィングを特定するのは少し難しいですが、このような非常にスタイル化された動画があるときは、素晴らしいと思います。そしてそれは生成のエラーや問題を隠すのに良い方法かもしれません。

カメラディレクションのテスト

次に、Soraをどれだけうまく演出できるか見てみましょう。

非常に具体的なカメラディレクションを与えます。見てみましょう。

さて、屋上の換気口の間から始めて、スカイラインを見せるために上昇します。暖かい夕日の光。ギアを通り抜けてクリッピングしません。レンズフレアは上品に保たれます。さて、そのレンズフレアを探しましょう。少しレンズフレアが。そこにあります。よし、いいですね。実際にかなりうまくやりました。聞いてみましょう。

この景色には勝てない。街全体が輝いているように見える。待った甲斐があった。

手のようなちょっとした問題に気づきます。小さなモーフィング。何と呼べばいいかわかりません。粒状のモーフィングのようなものです。わかりません。何と呼ばれるか知っている方は、コメントで教えてください。

さて、机から窓へ、そしてその先の通りへの速いパン。ブラーが適切に感じられます。それから視界が露出を段階的に変えることなくフォーカスに収まります。見てみましょう。

さて、机からの速いパン。いいですね。間違いなくフォーカスに収まります。そして今は街を見ているだけです。車、見ている人々の間で非常に良い一貫性があります。ええ、これは非常に、非常に印象的でした。

さて、フォーカスのシフトを見てみましょう。花にフォーカスして始めて、それから背景のジョナにフォーカスを変えます。

非常に印象的です。解像度の観点から、これらの動画はかなり低品質に見えますが、そのフォーカスのシフトはプロンプトで説明したとおりです。素晴らしいです。

さて次です。暗い廊下から明るい部屋へ。明るさは徐々に適応します。暗い部屋があります。そう、素晴らしく見えます。これはカメラが暗い部屋から明るい部屋に移動し、明るさを調整しなければならないときのカメラの見え方です。非常に良いです。絶対に非常に印象的です。

物理演算:煙、火、流体

次に、物理をどれだけうまくできるか見てみましょう。煙、火、流体、粒子。見てみましょう。これはハチミツです。

これは本当に良く見えます。これがAI生成だとは言えないでしょう。非常に印象的です。流体力学は間違いなく今のところ良いです。

これはお香からの煙です。背景にファンがありますが、実際にお香からの煙には影響していません。

しかし、煙は信じられないほど正確に見えます。渦巻きが少し多すぎるかもしれませんが、いいえ、これは本当に良く見えます。とても印象的です。

次に、これはエスプレッソが注がれる間の透明なグラスのクローズアップです。見てみましょう。

再び、非常に印象的です。ガラスの縁の近くに少し問題があるかもしれませんが、これはとても良いです。最後に向かってスローモーションになり、興味深く見えます。

でもそれ以外は素晴らしいです。そしてそれから立ち上る蒸気さえあります。ただ素晴らしい。

これは海を走る馬です。脚と蹄からの飛沫を見てみましょう。

これは素晴らしいです。ええ、見てください。馬の蹄が水に着地すると、水が跳ね上がります。

少し誇張された飛沫かもしれません。これほど大きいかどうかわかりませんが、それでもこれは素晴らしく見えます。

さて、これはあまりうまくいかなかったものです。濃いコーヒーのカップがあり、ミルクが注がれています。コーヒーの中からミルクの羽が見えることを期待するでしょう。見てみましょう。

ミルクが注がれています。この時までに、コーヒーを通って上がってくるミルクをもっと見ることを本当に期待するはずですが、見えません。ですからこれは間違いなく正確ではありませんでした。

これはパンの上のトマトです。

トマトは本当に良く見えます。パンは本当に良く見えます。泡は本当に良く見えますが、トマトはまったく変化していません。完全に静的です。

ですからこれはあまり良くないと言えます。トマトが実際に動き始めるか、何らかの方法で変形することを期待します。

これは注ぎたてのソーダのグラスです。

そしてこれは私には完璧に見えます。ええ、底から上がってくる泡があり、止まります。つまり、Soraの流体力学は絶対に信じられないほどです。これは完璧に見えます。

一つも問題が見当たりません。

さあ行きましょう。この容器から霧が出て、転がっていきます。

ええ、これは本当に良く見えます。期待通りにガラスの周りで変形し、上を越えてきます。この辺りに少し不自然さがあるかもしれませんが、全体的にこれは良く見えます。

光学とライティング効果

次に、物理を続けましょう。光学に入りましょう。光に入りましょう。何ができるか見てみましょう。

このプロンプトでは、小さなガラスプリズムが黒いベルベットの上でゆっくりと回転します。細い白いビームがそれに当たり、周りに虹を投げかけます。エッジは鋭く、きれいなままです。

さて、虹があります。かなり正確に見えます。何かが少しずれているように見えます。

ベルベットに影が見えます。ベルベットは本当に良い質感を持っています。入ってくる光。光はまったく動いていません。ええ、かなり良いです。これが素晴らしいとは言いませんが、かなり良いです。

そして、Dell Technologiesにこのビデオの一部のスポンサーをしていただいたことに特別な感謝を申し上げます。DellのProMaxファミリーのPCは、NvidiaのGrace Blackwellシリーズの新しいGPU、GB300やGB10を含むGPUを使用して、AIワークロードに対して信じられないほど強力です。

これらはデスクトップの中の絶対的なモンスターGPUです。DellPro Max GB10とGB300、そしてNvidia RTX Pro GPUを搭載したDell Pro Maxラインナップのワークステーションについてもっと学んでください。下の説明のリンクをクリックしてください。私が送ったと伝えてください。チェックしてみてください。

さて、これを見てください。ワイヤーメッシュをパターンのあるカードの上をスライドさせます。

見てみましょう。これがどのように見えるか、どのように見えるべきか、私たち全員が知っているか、なんとなく感じていると思います。そして、ええ、見てください。ワイヤーメッシュを通してカードのパターンが実際に見えます。クリッピングは見当たりません。これはかなり印象的です。

ここに火が燃えています。

私の手から出てくる光は素晴らしく見えます。見てください。手を上下に反転させると、実際に正しい側に光が見えます。これは本当に良く見えます。火は本当に良く見えます。そこから出てくる煙。非常に良いです。

さて、これは本当に複雑なものです。リングがゆっくりと回転します。

ファセットに沿って小さな閃光が現れます。エッジは鮮明です。溶けたり揺れたりしません。この指輪の異なるファセットから出てくる光が見えます。

そしてかなり正確に見えます。明らかに、確実にはわかりませんが、良くないと目立つものは何もありません。そして、それが立っている何かの反射を見てください。非常に印象的です。

さて、これはこれまでに見た中で最も印象的なものの一つかもしれません。

光沢のある金属球が視界が滑るにつれて部屋を反射します。反射は本物の鏡のように見え、ぼやけではありません。ボードの正方形はまっすぐなままです。

見てください。信じられない。ボールの反射を見てください。完璧に見えます。地面からのすべての白と黒の正方形が完璧に反射され、完璧にモーフィングされています。これは素晴らしいです。

テキストとグラフィックス

さて、次はテキスト、フォント、グラフィックスなどをどのように処理するか見てみましょう。見てみましょう。

基本的に、アニメーションテキスト、ビルド・スマート、シップ・ライト。ビルド・スマート、シップ・ライト。ええ、うまくいきます。

アニメーションテキスト、ワーク・ハードがワーク・スマートに反転します。さて、ワーク・ハードがあり、そこにあります。ワーク・スマート。ええ。

さて、アニメーションテキスト。サンクス・フォー・ウォッチング。

仮想ペンに従う手書きで描きます。さて。

興味深いです。テキスト自体は良く見えますが、TがFのように見えることを除けば、書く動作はまったく正確ではありませんでした。

説明モーショングラフィックスを作る必要がある場合はどうでしょうか。見てみましょう。

5つのマイルストーンを持つ水平タイムライン。ドットが一つずつ光ります。各ドットの上に簡単なラベルがポップアップして、それから落ち着きます。大きなタイプと整頓された背景を使用します。VOが日付を呼び出します。SFXはマイルストーンごとに微妙なチャイム。ラベルが小さい幅で重ならないようにします。では聞いて見てみましょう。

2021、2022、2023、2025、2026、2026、2021。

なんてことだ、それは変でした。できませんでした。

近かったですが、同じ日付を何度も何度も言いました。間違った音声で間違った日付を使用しました。そして、ええ、それはまあまあです。

さて次に、プラン、ビルド、ローンチとラベル付けされた3つのシンプルな円。見てみましょう。

プラン、ビルド、ローンチ。完璧です。ええ、非常に良いです。

さて次に、説明シーン。

4つの棒グラフの列がゼロから簡単に上がります。値がバウンスして上に現れ、落ち着きます。目盛りラベルを読みやすく保ちます。音楽のSFXの軽いベッドを追加します。さて、見てみましょう。

さて、ねえ、正確ですか。いいえ、そうではありません。これはまったく正確ではありません。34と34がありますが、サイズが異なります。34より小さい72があります。72の上に45があります。

ええ、正確ではありません。

さて、これは超印象的に見えます。投げられている屋台の麺。見てください。

実際にこれには音がありません、興味深いことに。彼がフライパンをひっくり返すまで見てみましょう。そうすれば本当に正確さがわかります。

あの麺を見てください。モーフィングを一つも見ませんでした。一つもありません。ええ、非常に良いです。非常に印象的です。

さて、これを見てください。これは微妙に信じられないことです。

ネクスト・ストップ・レイクサイドがあります。バスの窓にステッカーのように見えます。そして窓から人々が見るすべてのものの前にあります。これを見てください。

見てください。それはとても良いです。すべての木々の前を通る文字に一つのモーフィングもありません。すべての木は正確に見えます。ワオ。

それはクレイジーです。

Soraの使用方法

さて、使用方法をお見せしましょう。アクセスできたら、sora.chgpt.comに行くか、アプリをダウンロードします。それから最初にやることは顔をスキャンすることです。ステップを案内してくれます。基本的には携帯電話を使って、上を見て、右を見て、左を見て、いくつかの数字を言うだけです。それであなたについてのすべてをキャプチャするのに必要なのはそれだけです。

ちょっとクレイジーです。それからウェブサイトに来たら、ここに来て、クリックして、動画の説明を始めることができます。

誰かをカメオさせたい場合は、単にタグ付けします。そしてここにサム・アルトマンがいます、ここに私がいます。そして明らかに自分自身をタグ付けできます。だからクリックすれば、動画に登場します。そして説明できます。

マシュー・バーマンが通りを歩いていると言えます。ちなみに、Soraで私をまだフォローしていない場合は、ぜひそうしてください。マシュー・バーマン。

複数の人をカメオできます。これは私のチームのジョナ、チームのアレックス、ジョナ。アレックスが彼の隣を歩いています。そしてEnterを押すだけです。

そしてもう一つ、ここで本当に重要なことがあります。

プロンプトの入力が終わったら、プロンプトウィンドウの小さな設定をクリックすると、実際に縦向きか横向きか、向きを変更できます。

さあ、やってみてください。異なるものを試してください。明らかに、このようなもののために携帯電話を使うことに慣れている場合は、おそらく縦向きを使うでしょう。

コンピュータを使っている場合は、横向きを使うかもしれません。両方試してください。

さらに複雑なシーン

さて、さらに複雑なシーンに入りましょう。群衆、交通、複数オブジェクトのコヒーレンスをやりましょう。

混雑した屋外市場をゆっくり歩きます。自然に織り込む経路。小道具は点滅したり滑ったりしません。価格や看板は読めません。

ええ、そこに座っているすべての果物を見てください、まったくモーフィングしていません。複数の人がいます。みんな正確に見えます。みんな一貫して見えます。これは非常に印象的です。

さあ行きましょう。建物のように見えるものに歩いて入っていく何人かの人々がいます。ここにクリッピングとモーフィングが見えます。そこのドアを通って歩いています。

これは実際には本当に悪いです。ここに人々が何かにモーフィングしているのが見えます。わかりません、これは何でしょう。バリアラインのようなものかもしれません。これらの人々はここのドアを通って歩いています。この人は何であれそれによってクリップされます。ですからこれはまったく良くありません。

しかし、反射を見てください。反射は本当に良いです。本当に正確です。

これは横断歩道を渡って歩いている人々の群衆です。

そしてここにアレックスがいます。彼がポップアップするのを見てみましょう。先ほど傘で少しクリッピングがありました。

でもええ、これは実際にかなり良く見えます。

スタイル転送と非写実的表現

さて、次はスタイル転送または非写実的表現をやりましょう。見てください。

これは水彩のボートです。

これは驚異的に見えます。Soraはこのようなものに本当に秀でると思います。リアルに見える必要がないところでは、素晴らしいかどうかを判断するのが難しくなるからです。

そしてそれは本当に個人次第です。

これはピクサースタイルのようなものです。聞いてみましょう。

また私の負けだ。連勝中だね。椅子の数学チューターが報われたみたいだ。ただのパターン化だよ。多分ね。賭け金を上げる。

ええ、これは素晴らしいと思います。非常にWall-Eスタイルです。

これは別のものです。ソニックがピーチ姫とベッドにいます。

ソニックがタバコを吸っています。

ええ、これは素晴らしく見えます。

これはストップモーションクレイメーションのようなものです。

これはかなり良く見えます。

環境、天候、自然現象

今、環境、天候、自然現象に入ります。

夕暮れ、ムクドリの群れ、ムルマレーション。夕暮れ時に群れが空に形を描きます。全体的な流れは、鳥がポップすることなく滑らかです。地平線は安定しています。

さて、私たちは皆、ここで何を求めているかわかっていると思います。そしてええ、かなり良く見えます。実際に非常に一貫しているのが見えます。少しずれている感じがするかもしれませんが、全体的には、ええ、良く見えます。

こちらに消えている鳥がいくつかあります。ですから少し問題がありますが、全体的にはまともです。

さて、これは降雪です。

これは素晴らしく見えます。話しているときの蒸気を見てください。後ろに余分な蒸気があります。でもええ、それは素晴らしいです。特にランプポストを横切る方法と、実際に光が透けて見える方法。

降雪が後ろのランプポストによって実際に照らされている様子を見てください。

ここで、どこからともなく出てきた蒸気が少し見えます。でも見てください。私の口からの蒸気がランプの前を横切るとき、実際にすべてが照らされているのが見えます。それは非常に印象的です。

さて次に、波が壁に打ち付けて、壁から流れ落ちます。泡の軌跡は自然に見えます。鳥が風と戦います。テキストなし。

さあ行きましょう。ワオ、それは本当に良いです。

ええ、Soraは液体の物理演算に信じられないほど優れているようです。見てみましょう。波がこの壁を越えてポップします。正確に見えます。非常に良いです。

楽しいスロップで締めくくり

次に、いくつかのスロップで終わりにして楽しみましょう。

マシュー・バーマン、穏やかなヨガフローの最中に、マットが最悪のタイミングでマジックテープが剥がれる音を立て続けます。なんでこうなるの。

マリオカート、クラッシュ・チームレーシング、ディディーコングレーシングのマッシュアップまたはクロスオーバーゲームを見せてください。

さて、ここでのことは、時々著作権の問題に遭遇し、時々遭遇しないということです。スポンジ・ボブは単なる何でもありのようですが、私が言及したどんな映画でも、マトリックスのように、基本的に、いいえ、それはやりませんと言います。ここでは、やります。

見てみましょう。これを見てください。

ロケットブースト。ヤバい。この赤ちゃんが何ができるか見てみましょう。通ります。

さて、それはまあまあでした。

そしてこれで終わりましょう。もし私が90年代のラッパーとしてどう見えるか知りたいと思ったことがあるなら、これです。

ドラムがスナップする。ブロックからブースまでスプレーペイントをするのが好きだ。文化を生き続けさせる。テープデッキのベースのようなクラシックなフロー、ドライブで。ギミックはない、ただリズムと真実を提供する。バンバン鳴らす。

というわけです。私はSoraで本当に楽しんでいます。ぜひチェックしてください。私たちのニュースレターforwardfuture.aiに登録してください。この動画を楽しんでいただけたなら、いいねと登録をご検討ください。次の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました