
7,604 文字

ChatGPT の新しいネイティブ画像機能で人々が行っていることは信じられないほどすごいです。これはスタジオジブリバージョンの『ロード・オブ・ザ・リング』トレーラーです。ご覧ください。
実際のトレーラーの音声が重ねられていますが、動画が削除されないように再生はしません。火山が見えます。指輪があります。完全にスタジオジブリ風です。この人がどのように作ったのか説明します。作者自身が詳細を明かしており、簡単でした。あなたにも作れます。
本当に素晴らしく、すべてが良く見えます。私たちは画像と動画生成の転換点にいます。世界中のビジュアルアーティストはこれを見て、自分の作品にどう活用できるか考えるべきです。これは新世代のアーティストやクリエイターが、これまで不可能だと思われていたものを、とても短時間で創造することを可能にします。
「汝、通るべからず」のシーンもあります。素晴らしい、本当に見事です。
これは PJ Ace が作成した「もしスタジオジブリが『ロード・オブ・ザ・リング』を監督したら」というものです。「Cling のクレジットに250ドル使い、9時間かけてフェローシップのトレーラーを再編集してそのビジョンを実現しました。具体的な方法をお見せします」と言っています。
気になる方のために、2つのトレーラーの比較がこちらです。上が実際のもの、下がスタジオジブリのリメイクです。
彼のプロセスは、トレーラーの全102ショットをスクリーンショットで撮りました。いくつか例があります。1つずつすべてをスクリーンショットし、OpenAI の新しいネイティブ画像生成を使って変換しました。Sora で使ったと言っていますが、ChatGPT でも使えます。各スクリーンショットをスタジオジブリスタイルに変換しました。
面白いのは、現在のトレンドはスタジオジブリですが、何でも可能なことです。サウスパーク風やシンプソンズ風、レゴやマインクラフト、何でもできます。既存の IP に基づく必要もなく、完全にオリジナルなものを作れます。
それを Cling AI と Luma Labs AI でアニメーション化しました。Cling と Luma Labs はどちらも動画生成モデル企業です。Sora ではなくこれらを使ったのは興味深いですが、おそらく Sora は明らかに保護された IP だったため拒否したのでしょう。
その後、トレーラーに合わせて再編集しました。Sora の例では、「これをスタジオジブリ風に再現して。細部まで詳細に。構図、色、雰囲気が似ているようにしてください。写っているシーンは、黒いマントの人物が黒い馬に乗って、川床の巨大な水の波から逃げています」というようなプロンプトを使いました。
彼はスクリーンショットを提供するだけでなく、シーンの内容の説明も加えました。オリジナルのスクリーンショットがあり、先ほど読んだプロンプトがあります。背景にはスタジオジブリ風に変換されています。同様に、こちらも暗い馬たちと後ろから迫る激流があります。背景ではスタジオジブリ風に再現されています。
みんながこのスタジオジブリトレンドに乗っています。すぐにもっと例をお見せします。
彼は「リップシンクをする時間がなかった」と言っています。Cling と Luma では「男性が恐怖に叫び、女性が眉をひそめて心配そうに話す」などのプロンプトを使いましたが、簡単にリップシンクもできるそうです。実際には Cling と Luma を半々で使い、一方がうまくいかない時は他方に切り替えたとのことです。
この同じ人物が数ヶ月前にスタジオジブリ映画を実写に変換して話題になり、多くの脅迫を受けたようですが、それはちょっとおかしいですね。これは人々が楽しんでいるだけなのに、落ち着いてください。また、数ヶ月前には『ロード・オブ・リング』をアニメ風にもしています。本当にクールな作品を作っています。素晴らしい作品、PJ Ace です。
彼だけでなく、スタジオジブリのテーマを最大限に活かしている人がいます。こちらは『DUNE/デューン』のトレーラーです。
ここで一旦停止します。下の説明欄にすべてリンクを貼っておきます。ちなみに『DUNE/デューン』は史上最高のSF映画の一つです。『DUNE/デューン』と『DUNE/デューン PART2』です。
Alex は「アイデアから書き出しまで28分」と言っています。これだけの時間でこれができました。完璧ではないにしても、印象的です。彼も ChatGPT ではなく Sora を使っていますが、同じ製品です。そして Cling AI も使っています。
これはすべて ChatGPT の新しいネイティブ画像モデルと、前の動画で紹介した Cling や Luma Labs で作られています。このようなものを作りたい場合は、絶対に作れます。既存の IP に基づく必要もありません。オリジナルのものを考えてください。
もし作ったら Twitter で私にタグ付けしてください。リポストします。チェックしたいです。こういうのが大好きです。
これらの AI ツールがとても急速に増えているので、どれがどれだか追いつくのが大変なのはわかります。だからこそ HubSpot の AI 生産性スタックガイドをチェックすることをお勧めします。HubSpot は最高の AI ツール 50 個をリストアップし、具体的なユースケースと共に分解しています。
圧倒されていて、特にどの AI ツールがどのユースケースに適用されるのかわからない場合、これは素晴らしいガイドです。このガイドでは、最も人気のある AI ツールの使用例、長所と短所、主な機能、価格設定、使用方法などを解説しています。
Perplexity や Claude などの大きな名前もありますが、聞いたことがないようなものもたくさんあります。私が一番好きなのは、AI の作業をチェックせずに過度に依存するなど、避けるべき落とし穴を解説している終わりの部分です。私も時々それに罪悪感を感じます。
このリソースは HubSpot が完全無料で提供しています。今すぐダウンロードできます。リンクを説明欄に載せておきます。このセグメントのスポンサーである HubSpot に改めて感謝します。
では動画に戻りましょう。
おそらく驚くかもしれませんが、ChatGPT の新しい画像モデルはスタジオジブリだけでなく、こういうこともできます。これはアルバート・アインシュタインがジムで汗を流しているリアルな写真です。
超リアルな写真やインフォグラフィックもできます。これは本当に優れています。「ニューヨークでの暮らし方:速すぎるペースで動き、高すぎる金を払い、人々を押しのけ、絶えず文句を言う」というものです。すべてが非常に詳細で鮮明で、ミスがありません。
これが人々が最も注目していることだと思います。GPT-4o のネイティブ画像はほとんどミスをしません。私が生成したものの中で、文字に関するマイナーなミスを2、3回見ただけです。こちらは完璧です。
そしてそれを別の画像に入れることもできます。その同じものを、誰かがそれを持っている現実的な写真に入れています。これはワシントンスクエアパークだと思います。
こちらは別の例です。「猫をリードで散歩させる方法:適切なハーネスを選び、猫を慣れさせ、まず室内で練習し、外ではゆっくり始める」。そして先ほどと同様に、このような漫画的なインフォグラフィックを超リアルな写真に入れることができます。猫がインフォグラフィック自体を見ています。とても cool です。
これは Alli K Miller によるものです。こちらは絶対に素晴らしい世界地図です。ほぼすべて正確です。あ、ここに一つミスがあります。「Indian Ocean」ではなく「Inoan Ocean」と書いています。少しミスがありますが、全体的には悪くありません。
そして同じ地図を取り、2匹のペンギンがそれを見ているリアルな写真に入れました。もう少しよく見ると、他にもいくつか小さなテキストエラーが見えます。
アメリカにいる人にとっては、これはあまりにもリアルに感じるでしょう。これは DMV(運転免許センター)を訪れることがどのように感じるかを正確に表しています。
セレブもこれに参加しています。チャンプのマイク・タイソンは「私の幸せな場所」と言っています。これは彼の有名な写真を、もちろんスタジオジブリ風にしたものです。そして彼の最近有名になった、ジェイク・ポールとの試合前のインタビュー中に裸で歩き回っている写真もあります。
正直、私のタイムラインで見るのは ChatGPT 写真ばかりで、主にスタジオジブリですが、他にも多くあります。
サム・アルトマンも驚いています。「ChatGPT の画像は予想よりもはるかに人気があります。かなり高い期待を持っていたのに。無料ティアへのロールアウトは残念ながらしばらく遅れます。」彼も自分の Twitter プロフィールをスタジオジブリ風に変更しました。私もそうしました。
これが私の新しいプロフィール画像です。知っている人には分かります。先ほど言ったように、GPT-4o 画像がソーシャルメディアを完全に席巻しているように見えます。
Grant Slatten は「正直、OpenAI は非常に幸運です。彼らのモデルの最初のバイラル利用がジブリのポジティブなバイブであり、ひどいディープフェイクのナンセンスではなかったことは。」と言っています。サム・アルトマンは「信じられないかもしれませんが、新しいテクノロジーを紹介するときに最初に示す例について、私たちは多くの検討を重ねています。」と返信しています。
その通りです。それはライブストリームからの例の一つでした。おめでとうございます。本当にトレンドを完璧に捉えました。
Kitsay さん(発音が合っているか分かりませんが、申し訳ありません)は「グラフィックデザイナーにとって終わりだということが分かりますか?本当に終わりです。」と言っています。これはジョン・ウィック映画のポスターです。こちらはオリンピックの有名な2人の射手です。はい、簡単にここに入れられています。
私はグラフィックデザイナーにとって終わりだとは思いません。グラフィックデザイナーはより多くのツールを手に入れるだけだと思います。しかし、これによって、Photoshop や Illustrator、Premiere、Da Vinci などのツールに詳しくない人でも、誰でもできるようになったとも思います。
私たちは「バイブ」の時代にいます。バイブコーディングは現在非常に人気があり、私も深く取り組んでいます。コードの仕組みを実際に知る必要はなく、AI に指示するだけです。ここでも同じことが起きています。Photoshop を知る必要はありません。自然言語で欲しいものを説明するだけです。
私は常にこう言っています。最終的に重要になるのは、データと趣味(センス)の2つだけです。最終的とは、おそらく今から5年、8年、10年後のことを意味します。だからこそ、私のプロフィール画像はリック・ルービンなのです。
ネイティブ画像生成でできることの別の例があります。「猫の Wikipedia ページのスクリーンショット画像を作成し、猫の仕組みについての適切な説明と画像を含める」というものです。
これがそれです。完全な Wikipedia ページではないかもしれませんが、モバイルで見ているなら、正直素晴らしく見えます。テキストをすべて見ると、ほとんどのテキストは正確です。ここに小さなミスがありますが、それ以外は猫は素晴らしく見えます。猫の各部分の図は多かれ少なかれ正確に見えます。これらの2つのものが肝臓を指しているか、これが肝臓でこれが小腸で、同じものを指しているようです。しかし全体的には、ゼロショットとしては本当に良いです。
こちらは Shopify の CEO である Toby Lucky です。「OpenAI すごい。これが現実なんてどうして?」「息子のTシャツにあるこの生き物が何なのか分かりませんが、とにかくこの動物の清潔で学術的にもっともらしい解剖図を作ってください。」
ここにあります。これは脳、肺、心臓、胃と書いてあります。あ、胃(stomach)のスペルが間違っています。腸、短い尾、短い背、曲がった爪。はい、いくつかミスがありますが、全体的には素晴らしく見えます。
こちらは別の例です。「この画像を使って楽しい漫画広告を作成する」。これはオレンジの Ridge ウォレットです。どのように見えるか見てみましょう。
こちらです。The Ridge ウォレット、スリムでスタイリッシュ。本当にクールです。あなたのビジネス、個人的なもの、楽しいミーム、何でもほぼどんなタイプのメディア、どんなタイプの資産でも作成するための可能性が非常に多くあります。
こちらは別の例です。サムネイルから資産を抽出するのに 4o を使用できます。Mr Beast のサムネイルがあり、直接そこからサメを抽出しています。私も実際にそれをやりました。自分のサムネイルの一部を抽出し、それはかなりうまくいきました。
また、人々をミームに組み合わせることもできます。こちらはサム・アルトマンです。ミームがあります。「立っている人にサム・アルトマンの顔を追加する」。そしてほぼ完璧です。これには何も問題が見当たりません。本当にミーム画像のテーマに合っています。本当に良いです。
こちらは別の例です。製品があります。「この画像を使って Mad Men スタイルの印刷広告を作成する」。こちらがそれです。「ボードルームからビーチまで、美の新しい形。自信は身に着けるだけでなく、感じるものです。Obi コラーゲニック コレクションの紹介、美と調和の三位一体:デトックス、バーン、バーン PM」。見た目は本当に良く、Mad Men というショーにありそうな感じがします。ちなみに、そのショーを見ていなければ、私にとって間違いなくトップ5に入ります。
こちらは別の例です。Jordan Singer は「GPT-4o は実際に元の iOS のスタイルで画像を作成できます。スキューモーフィックデザインを簡単に作成できます」と言っています。これは iOS の元のデザイン言語です。
こちらは別の例です。素晴らしいです。すべてが完璧に見え、この新しい 4o モデルではほとんどミスが見られません。
こちらは別の例です。天気アプリがあります。Certino、73度、部分的に曇り。中央の持ち上げられたカードの上に素敵なシェーディングがあります。フォントは素晴らしく見え、すべての文字が素晴らしく見えます。
次に Ashish Singh からのものがあります。いくつかの漫画のような描かれた地図があります。こちらはフィリピンです。子供向けの地図のように見えますが、それが目的です。それがそのスタイルです。こちらは別のものです。もう一つ、クロアチアです。素晴らしい、本当に素晴らしいです。彼は「このスタイルでクロアチアの地図を作る」以外の情報を提供していないと思います。
このモデルはオムニモデルであることを覚えておいてください。テキスト、画像、音声をすべて一つで理解します。変換を行いません。テキストモデルのロジックをすべて持っていますが、画像で表現できます。「スネークゲームを書いて、コードを画像で出力する」と言えば、そのようなことができ、画像を理解できます。とてもクールです。
こちらは Twitter でフォローしている Daria からのものです。彼もフォローすることを強くお勧めします。彼は教授であり生物医学科学者です。「これは OpenAI の 4o 画像生成で作成した私のお気に入りの画像のいくつかです。私は私が人生のほとんどを研究してきた TE-C 細胞の生活を説明する子供向けのコミックシリーズを作りました。信じられないほど素晴らしく、コミックシリーズは続きます。」
こちらがそれです。これらすべてのものがどれほど美しいか、私は驚いています。「内なる守護者たち 胸腺の隠された部屋での誕生 入り組んだ経路と並外れた旅が始まります」そして続きます。
「穏やかな聖域(ここに小さなミスがあります)で、T細胞が目覚めます。重要な使命のための準備をする謙虚な存在(ここにも小さなミスがあります)」。長い道のりですが、テキストにはまだいくつかのエラーがあります。
「好奇心旺盛で、決意に満ち、その目的を発見する準備ができています。選択、挑戦、そして内なる宇宙全体を守るという約束に満ちた道が待っています。」これをすべて読むつもりはありませんが、粒状の効果が見えます。60年代の古い学校の漫画やコミックストリップのように見えます。はい、ここにあります。素晴らしいです。繰り返しますが、これらすべてを説明欄にリンクします。
「リック・アンド・モーティの漫画をリアルな写真にしてください」。こちらがそれです。怖いことこの上ないですが、少し不気味の谷があります。しかし全体的にはかなり良く見えます。
こちらは別の例です。「all-in ポッドキャストのファンならば、スタジオジブリスタイルでやるしかない。」
すべて完璧というわけではありません。まだいくつかの制限があります。この写真が大好きです。リック・ルービンがバイブしているスタジオジブリの写真です。彼は今私のスピリットアニマルです。
これを Twitter のヘッダー画像、あの横長の画像にしたいと思っていました。試してみて、「この写真を取り、Twitter のヘッダーに合うように、もっと横長の寸法にしてください」と言いました。2回目の試みでは decent にできましたが、それでも十分に広くありません。「もっと広くしてください。同じサイズで」と言い続けましたが、寸法に制限があります。
何度も行ったり来たりして試しましたが、これよりも広い寸法を作ることができませんでした。ぜひ試してみて、X で作ったものを見せてください。まだ X で私をフォローしていなければ、Matthew Berman でフォローして、あなたが作ったものをタグ付けしてください。見たいです。大好きです。
この動画を楽しんでいただけたなら、いいねと登録を検討してください。次の動画でお会いしましょう。


コメント