チャットGPT 4o画像生成の驚異的な15の活用法

9,658 文字

https://www.youtube.com/watch?v=aCulf5PgjFQ

チャットGPTは4o画像モードをリリースしました。このモードには多くの人がまだ気づいていない様々な活用法があります。この動画では、新しい画像生成機能を今日から活用できる15の異なる使い方を紹介します。時間を無駄にせず、早速始めましょう。
最初に紹介するのは、スタイルの組み合わせです。ここではユーザーが「これは私が普段使用する画像スタイルのムードボードです。これを参考にして、ローブを着たコンピューターマンの全く新しい画像を描いてくれますか」と言っています。基本的に、複数の異なるアートスタイルを一つに組み合わせることができ、これを使って新しいスタイルの画像を作成できます。
ユニークなブランドアイデンティティを作成しようとするとき、複数の画像を見ても苦労することがあります。しかしチャットGPTの知性を使えば、これらすべての素材を活用してスタイルを組み合わせることができます。これは非常に便利で、誰でも任意のスタイルをコピーできる時代には、新しいスタイルを見つけることがより困難になるでしょうから、将来的にはさらに有用になると思います。これは私が間違いなく活用するツールです。
2番目は、広告クリエイティブです。これは簡単なプロンプトを使用して、任意の主要ブランドのマーケティング素材を簡単に作成できるというものです。例えば、ユーザーが「このバドワイザー広告を再現して、添付のブームブーム製品画像を使用し、コピーをブームブームに合わせて変更し、サブヘッドを『あなたの鼻を解放しよう』に変更した画像を生成してください」と言っています。
広告クリエイティブでできることは、既存の広告テンプレートと既存の製品を取り、それらを組み合わせて全く新しいアートワークを作成することです。これは技術的に詳しくない人や、新しい広告デザインを考えるのが苦手な人に非常に役立ちます。これにより、製品を別の広告クリエイティブに素早くフォトショップで合成でき、特定の環境で製品がどのように見えるかを確認できます。何かを素早くテストしたい場合、これが方法となるでしょう。
広告クリエイティブをテストしたい場合、つまり製品配置のバリエーションをテストしたい場合、俳優を使ってそれを行うこともできます。これは以前は様々なアプリケーションを使って行っていましたが、今は製品の単純な画像を使って、同じ製品を着用した新しいキャラクターを生成することができます。
チャットGPT 4o画像の主な特徴の一つは、複数の異なる画像を通じて同じオブジェクトを一貫して維持できることです。一度画像をAIに入力すると、様々な状況で写真を一貫して撮ることができます。ユーザーが「添付されたキャリーV製品を使用して、パリを歩いて通るモデルのバッグを持ちシックに見える写真リアルな広告を制作してください。モデルは特定のスタイルで服を着ているべきです」と言うと、即座に製品と共にそれを複製できます。
これにより多くの時間を節約できます。特定の製品を長時間かつ広範囲に撮影し、適切な照明や角度を得るために多くの時間を費やす代わりに、これを活用できます。この作業をする際の最大の問題点は、背景に誰かがいるかもしれない、道路を渡らなければならないかもしれない、危険かもしれない、照明の違いがあるかもしれない、天候が効果的でないかもしれない、行きたい場所が危険かもしれない、あるいは今は旅行のお金がなくて会社を立ち上げようとしているかもしれないということです。これは広告クリエイティブにとって完全なゲームチェンジャーになるでしょう。特に製品を着用するモデルや個人を使用しようとする場合に。
もちろん、前述のように、異なるものを組み合わせて異なる広告クリエイティブを作成できます。これは誰かがリッジウォレットを組み合わせた例です。また別の広告クリエイティブは、ランダムな画像を取り、それを広告にするよう依頼するというものです。これは何度も繰り返し行えることです。
最も一般的なことの一つは、製品を取り、その製品を別の画像に配置することです。これはマーケティング分野の個人にとって非常に高いROIをもたらします。どんな画像とどんなスタイルでも取って組み合わせ、全く新しいものを作成できることがわかります。私は間違いなくこれを使用し、すぐに完全なチュートリアルを作成する予定です。知っておくべきコツやトリックがいくつかあります。
もう一つ非常に人気があるのは、スタジオジブリスタイルの転送です。スタジオジブリは現在非常に人気のある日本のアートスタイルで、世界的に注目を集めています。人々がこれを行う理由は、チャットGPTが正確にキャラクターを維持し、それを一貫して新しいスタイルに転送できるからです。これらの画像では、元の画像の一貫性を維持しながら、単にスタイルを変更しているのがわかります。
人々がこれを好む理由は、元の画像のアイデンティティを保持していることです。AIで全く新しいものを作るのではなく、実生活で既に撮影したものを強化するのです。オンラインでこのような画像が多く見られます。Twitterアカウントをお持ちなら、もう見たことがあるでしょうが、一部の方は見ていないかもしれないので紹介しました。
スタイル転送はスタジオジブリスタイルだけではありません。複数の異なるものの間でスタイルを転送できます。入力と出力で非常に創造的になれるということです。これらの入力と出力はかなり互換性があります。つまり、スケッチやスケッチブックに変換したい標準画像がある場合、それを転送できますし、画像に変換したいスケッチがある場合もできます。これは異なるスタイルを転送できる点で本当にクールです。
また、異なる視点も転送できます。これにより、標準的な画像を取り、それを低ポリアイソメトリックなゲームスクリーンショットに転送できます。これは非常に効果的に見えます。特定のゲームスタイルや特定のキャラクタースタイルに取り組んでいる場合、スタイル転送は非常に重要です。選択した作品内で一貫したスタイルを維持したい場合に非常に効果的です。
また、驚いたのはインフォグラフィックスも作成できることです。インフォグラフィックスは、基本的に良い画像で適切な量の情報を提供するものです。保存して印刷したり、PDFやポスターとして販売したりして、長年にわたって持っておけるものです。単にチャットGPTにその情報をプロンプトするだけで、通常はすべてを正確に取得できます。
テキストが密集している場合、いくつかのミスがあるかもしれませんので、最終的な画像をクリーンアップする必要があるかもしれませんが、多くの場合、約85％まで正確に作成できます。ここでは脳、肺は恐らく間違っていて、胃も恐らく間違っていますが、腸は正しく、いくつかは間違っていますが、全体的にはイメージの作り方としてはかなり良好です。
これは多くの人が使用するものになると思いますし、私は最近作成したPDFのカバーを作るためにこれを使用しましたが、非常にうまく機能しました。インフォグラフィックスや効果的な画像を作成でき、前述のように、これを行うのは本当に得意です。
もちろん、他のインフォグラフィックスを見るとき、Wikipediaページのスクリーンショットを作成するよう依頼でき、そこですべての情報を見ることができます。様々なことに対してこれを行えます。おそらく、配布したい情報量の小さなカードを持っている教師の場合、ここで本当に創造的になれます。
私のコミュニティを素早く宣伝しますが、実際にこれでお金を稼ぐ方法についての非常に興味深い動画を公開したばかりです。この動画に含めきれないほど多くの異なるユースケースがあり、これを使用して月に1万ドルを得る完全な計画を明らかにする予定です。これを始めてから既に月に500ドルの受動的収入があります。これは皆さんが注目したいものだと思います。
先ほど言ったように、インフォグラフィックスは簡単に作成でき、様々な方法で説明でき、TwitterやInstagramなどのソーシャルメディアに素早い投稿を作成するのに非常に役立ちます。本当に簡単で、これに取り組むことを強くお勧めします。
もちろん、私ができることの一つは、ブランドに合ったソーシャルメディアを持つことです。私が行ったのは、単に自分のTwitterプロフィールの写真を取り、チャットGPTに「私のTwitterバナーと同じスタイルのTwitter画像を作成できますか」と言うだけです。すると、「AIが置き換えられない6つの仕事」という画像を作成し、完璧なテキスト、完璧な背景、完璧な配色で仕上げました。
これが重要な理由は、ソーシャルメディアにいるとき、すべてのソーシャルメディアアカウントとブランド資産（ツイート、YouTube動画、イントロ、アウトロなど）で堅実なブランドイメージを維持したいからです。これは時々難しいことです。フォントを失ったり、配色を理解していなかったり、異なるプラットフォーム間で物事を転送する方法を理解していなかったりするかもしれません。チャットGPTは今、どんな種類のプラットフォームでもそれを簡単に行えるようにしました。
私は1つのプロンプトでこれを行うことができ、ソーシャルメディアに何かを投稿したいときはいつでもこれを使用できます。InstagramやYouTubeに投稿したい場合、あるいはスライドが必要な場合、これを参考にしてこのデザインを取得できます。これは素早くそれを行いたい人にとって非常に役立つでしょう。
もう一つできることは、ユーザーインターフェースのタイルを作ることです。ソーシャルメディアやBehanceなどのウェブサイトで気に入ったものを見つけたら、どんなプロンプトでもそれを簡単にコピーできます。最も良いのは、どんな種類の参照でも使用でき、それについて何が欲しいかを言えることです。
ここでは元の画像があり、その人は「このようなカードを作成してください、ただしイタリアに関するものにしてください」と言いました。彼らは参照のためにすべての資産を変更し、イタリアに関するものにしました。これについて本当にクールだと思うのは、背景でイタリアの国旗を実際に見ることができることです。これは何か必要なものに対してより多くの資産を生成しようとしている場合に非常に効果的です。
また、非常に効果的なのはテキストを非常に効果的にレンダリングできることです。テキストは長い間AIモデルが苦戦していたものですが、今ではこれらのAIモデルが大量のテキストに苦戦しなくなっていることがわかります。
どのようなプロンプトでも、あまりにも多くのテキストではなく、勝手に話し続けたり特定の事実を幻覚するほどではない程度のテキストを含めるようにしてください。ここで誰かがこれを作成したのが見え、実際に動画を一時停止してこれをすべて読むと、非常に効果的に見えます。初見では気づかないような非常に小さなミスが1つか2つだけあります。これは人間が見て気に入る画像を制作する際に信じられないほど効果的です。大量のテキストを含む画像を作成しようとしている場合、これはここでできます。
OpenAIチームが実際にテキストレンダリングの仕組みを説明しています。「人々は『一枚の絵は千の言葉の価値がある』と言う傾向がありますが、数語や記号をレンダリングする能力も持つことで、千の絵を運ぶことができます。例えば、『ニュートンのプリズム実験を詳細に説明するインフォグラフィックを、ワイドアスペクト比と暗い青色の背景で視覚化してください』というような比較的シンプルなプロンプトです。これは、有用な方法でテキストをレンダリングする能力に依存し、この実験についてのテキストが実際に意味することを根拠付ける視覚的要素と組み合わせることで、より視覚的な学生が言語による現象の説明だけでなく、実験が実際にどのように見えるかの視覚的想像を通じて学ぶのを助けることを望んでいます。これはもはや美的に見える想像上の場面を作るだけではなく、コミュニケーションと想像を同時に行うことです。」
また、キャラクターの一貫性もあります。これはおそらく最も過小評価されている機能の1つです。長い間、キャラクターの一貫性は従来のAI画像生成器が苦労していたものでした。これは基本的に、新しい画像を生成するたびに、正確に同じスタイルを参照するのが難しく、示されたものを再現しようとして何百万もの異なる画像から引っ張ってくるからです。
しかし、私はチャットGPTがどのような方法を使用しているのかわかりません。私はこの画像をインターネットで見つけただけですが、同じキャラクターの異なるポーズを作成できることがわかります。「このキャラクターに腕立て伏せをさせて」と言うと、それを行うことができました。キャラクターの一貫性を持つ例はさらに多くあり、おそらく最も過小評価されていることの1つだと思います。これを活用すべきです。
これで簡単に物語を生成したり、ビデオゲームのコンセプトを生成したりできます。複数の画像にわたって一貫したものを作成し、より有用にする様々なことができます。これを是非活用してください。
「キャラクターの一貫性を保つ能力に本当にワクワクしています。私はデイビッド・メディナ、またはDEDと言い、マルチモデルに取り組んでいます。私が示したいのは、私のお気に入りのプロンプトの一つで、『低ポリのペンギンの魔術師を作成してください、非常に低ポリにしてください』というものです。驚くべきことに、時々非常に良い低ポリ出力を得るのは難しいです。これは他の画像生成モデルのように、単にテキストに基づいて何かを生成しようとするのではなく、大規模言語モデルを使用して、ユーザーが何を望んでいるのか、意図は何かを理解します。
私はボードゲームやミニチュアのようなゲームも好きなので、次にこれからミニチュアを生成します。理想的には、同じ杖と帽子を持つこのようなペンギンが見られます。『プロが作って塗装したかのようなリアリスティックなミニチュアを作ってください』というプロンプトを使います。これが私をimenについて最もワクワクさせるものです。他の画像生成モデルは文字通りあなたが言ったことを作成しようとしますが、これの特別な点は、1つはこのキャラクターのコンテキストを保持し、2つ目は私が何を尋ねているのかを理解し、非常に似たモデルをミニチュアのリアリスティックなスタイルで生成することです。私が何を望んでいるかを推測し、すべての細かい詳細を伝える必要はありません。
もう一つ現実的なことができます。『光が反射した非常にリアリスティックなこのキャラクターのクリスタルバージョンを作成してください』と言えます。通常、これは他のモデルが非常に詳細なものを生成するには十分ではありませんが、モデルは私が何を尋ねているのかを理解し、どのようなスタイルを持つべきかを考えます。このキャラクターが何であるかを本当に理解し、編集を加え、ユーザーが何を望んでいるのかを理解する能力は、私にとって驚くべき能力です。」
新しい画像ジェネレーターで非常にクールなことの一つは、異なるものから画像アセットを取ることもできることです。しばしば非常に良いサムネイルを見て、それらのアセットをどのように使用できるのか、またはそれらのアセットがどこから来たのか疑問に思います。
これが今できることは、基本的に特定の画像からアセットを抽出することです。もちろん、これの合法性は不明であると言いたいです。異なる画像からアセットを取る前に、そうする権利があることを確認してください。しかし、画像があり、PNGがない場合、文字通りチャットGPTにサメを取り出すよう、画像を変更するよう、水を取り出すよう頼むことができ、最終的な画像を得ることができます。これは非常に効果的です。これはデザイナーにとって非常に役立つと思います。切り抜いたり削除したりするのではなく、文字通りAIにそれを依頼できるからです。
「私はジェン・エフと言います。OpenAIでマルチモデルに取り組む研究者です。透明な画像を生成する方法は直感的で簡単です。では、OpenAIがこれを使って透明なレイヤーを生成する方法を簡単に見てみましょう。」
透明なレイヤーは基本的に背景のない画像です。インポートすると、それらは独立してインポートされ、ステッカーとして配置したり、要素として配置したりできます。これは画像の合成をはるかに簡単にします。
「私はジェイPH1と言います。OpenAIでマルチモデルに取り組む研究者です。透明な画像を生成する方法は直感的で簡単です。試してみましょう。コンテンツは『かわいいC ST』、正方形サイズと言いましょう。これがプロンプトです。モデルは入力を取り、画像を生成しようとします。少し時間をかけてみましょう。では、何を生成したか見てみましょう。これが透明なものです。もう一つのアプリケーションはステッカーを作ることです。試してみましょう。
『ステッカーを作りたいです』と言えば、透明な画像を任意の種類の背景に簡単に重ねることができます。ステッカーをラップトップにコピーして、ここに貼り付け、背景に簡単に溶け込むように小さくすることができます。『メガネをかけた青いシャツを着た賢い研究者のステッカーを作ってください』と言えます。試してみましょう。メガネをかけた…はい、メガネで…できました！うまくいったと思います。人々がこれを気に入ってくれるといいですね。」
再度、これをサムネイル作成に使用できます。サムネイルや画像があり、それを入れ替えたい場合、前述のように広告クリエイティブでこれを使用できるように、同様にサムネイルでも行えます。誰かが人気のMr.Beastのサムネイルを取り、彼をイーロン・マスクに入れ替えたのが見え、非常に効果的に見えます。これはおそらくYouTubeのシーンを変えるだろうと思います。非常に効果的なサムネイルが多く見られるようになるかもしれません。
また、これらの画像から見られる超リアリズムも珍しい使用例です。私が何度も見たこの画像ですが、これがAIであることを示すものは生涯で何も指摘できません。この画像のすべてがリアリスティックに見え、これがAIかもしれないと示す単一のものは何もありません。
再三再四分析しましたが、本当に何もありません。色は正しく見え、粒子など、すべてが東ヨーロッパの国やヨーロッパの国、おそらくイギリスのように見えます。これがAIであることを示すものは何もありません。これは、この新しいアプリケーションからの超リアリズムのレベルが完全に際立っていることを信じさせます。そしてそれは本当です。これで本当に何ができるかは本当に驚異的です。超リアリズムについては、このような画像がAIであれば、今見るかもしれない多くの画像が本当にAI生成かどうか疑問に思わなければならないエリアに入ったと思います。私には見逃せることが本当にわかりません。
また、トランプのこの画像も見ました。超リアリスティックな画像を作成できる多くの異なるAIシステムがありましたが、チャットGPTは全く別のレベルにあります。作成する画像は超高精細だからです。ここで画像を直接読み込んでいないのでズームインする機能はありませんが、すべてのシワやすべての折り目にズームインする機能があります。これらの画像の現実的な詳細のレベルは非常に異なると言えます。
実際にSoraで画像を生成すると、見るクオリティのレベルは最高級で、おそらく現在存在するどれよりも優れています。OpenAIが機能面で他社を飛び越えることを決めたことを考えると、これはかなり驚くべきことです。
ここでも詳細を見ることができ、非常に印象的に見えます。私が見てきたことの一つは、それがAIの色合いを持っていないことです。言葉で表現するのは難しいですが、AI画像やAIの男性、AI女性を見たことがあれば、AI画像には特定の見た目があることがわかるでしょう。リアリスティックに見えますが、おそらく5％ほどの兆候があり、それがAIであることをかろうじて判断できます。これらの画像については、それがAIであることを本当に判断することができません。
私たちの中で最高の人でさえも現実と区別できなくなることは残念ですが、おそらく特定の画像のコンテキストについて知っている場合のみ、その写真が撮影される場所が現実的かどうかを判断できるでしょう。それは画像自体の実際の構成よりも大きな手がかりになるでしょう。
例えば、この画像を見てください。もしこの画像がAIではないと言われたら、俳優がこれを行うためにクマを一緒に連れてきたと思うかもしれませんが、これは実際に公式Soraウェブサイトでの生成でした。
再度、クレイジーなスナップチャットの写真があり、おそらく新しいスナップチャットの写真の洪水があるでしょう。個人が自分の環境に基づいて本当に面白いか面白いクレイジーなスナップチャットの写真を作成することで。実際、この写真をしばらく見ていました。粒子と小さなエラーではないですが、画像の見え方が少し不自然なのがリアリズムの要素を高めています。
また、非常に良い使用例はマテリアル転送です。あるものから別のものにマテリアルを転送したいと思ったことがあれば、これはできることです。「新しいタスク：女の子の画像を見て、大理石の材質の球を見て、大理石の材質をキャラクターに転送し、大理石の像を作ってください」と言えます。これをマテリアル転送と呼びます。
これが非常に効果的に行われているのがわかります。これは3Dモデラーに何時間もの時間を節約させるでしょう。以前にこれをしようとしたことがあれば、それは本当に大きな頭痛の種でした。これが何に使えるかわかりませんが、もちろん前述のように、創造的であれば、使用例を見つけるでしょう。
もう一つは、もちろんマペットピープルです。なぜかわかりませんが、これはかなり面白く、多くの人気を集めており、画像の品質という点で非常に効果的です。
もう一つは、スケッチをサムネイルに変換する能力です。何か作成したいものがあり、それを簡単なスケッチで視覚化したい場合、入力画像としてスケッチを使用することでそれができます。これは私が思うに、より多くの創造性を可能にするものです。
これをしようとするとき、しばしばこれらのスケッチをグラフィックデザイナーに渡し、「私はX、Z、Yが欲しい、そして来週までに完成させて欲しい」と言わなければなりませんでした。しかし、望むものの基本的な理解があれば、そのスケッチを数枚のラフな画像と一緒に入れるだけで、チャットGPTは非常に完璧な画像を出力し、おそらくあなたの好みに近いものになるでしょう。これがまさにあなたが得るものであり、これを活用することが非常に重要だと思います。
このツールについてどう思うか教えてください。良いと思いますか、悪いと思いますか、これらの使用例を使用する予定ですか？そしてもしこれで実際にお金を稼ぐ方法に興味があるなら、私のコミュニティで投稿したばかりのチュートリアルをぜひチェックしてください。そこでは、人々がこれでお金を稼いでいる5つの主要な方法を詳細に示し、毎月1万ドル以上を生み出すためにこれをどのように使用するつもりなのかという私の計画を明らかにしています。