
5,430 文字

皆さん、ご存知のようにOpenAIは素晴らしい画像ジェネレーターをリリースしました。Gibl Studioのトレンドやその他の話題がありましたが、最近画像生成のAPIを公開しました。APIを使って画像を生成する方法を見てみましょう。この画像生成は多くの人にとって非常に役立つものになるでしょうし、2030年までに1,740億ドルの価値になる計画があります。一緒に見ていきましょう。
もしあなたがこのOpenAIの画像生成アップデートについて知らないなら、それはとても素晴らしいものです。ユーザーがガラスのホワイトボードに書いている人の画像を描くようにプロンプトを送り、左側と右側に長いテキストを書くように指示すると、あたかもその女の子が書いたかのように、ホワイトボードに全てが書かれた画像が生成されます。実際にはプロンプトエンジニアリングの結果であり、この反射や橋の部分もプロンプトの一部です。
もしあなたがマーケティング担当者であったり、画像生成が必要なプロジェクトを持っていて、そのプロセスを自動化したいなら、このような高品質なツールがリモートで画像生成リクエストを行えるのは完璧で素晴らしいことです。
ドキュメントに行って、画像の生成方法を見てみましょう。モデルはGPT Image Oneで、もはやDALLではありません。DALL-Eは過去のものとなり、今はより真剣なものになっています。Images APIのセクションに行くと、画像生成に必要なすべての情報が表示されます。GPT Image Oneが既に設定されており、Node.JS、Python、さらにはCURLでの例も提供されているので、何もインストールしたくない場合でも使えます。
基本的に、OpenAIのライブラリをインポートして画像生成をリクエストするだけです。テストファイルを作成して、そのコードを貼り付けてみましょう。Pythonでの例では、環境変数を読み込むためのコードと、APIキーの設定が必要です。長い間使っていなかったので、ライブラリをアップデートしておきましょう。
テキストを「『Junim』と書かれたTシャツを着た男性と『IMG』と書かれたTシャツを着た犬」に変更します。サイズはデフォルトでは正方形ですが、私は正方形ではなく横長の1535×1024にしたいと思います。ただし、将来的に必要になるかもしれないので、この正方形のサイズ設定はコメントアウトしておきます。
プログラムは画像を受け取り、base64形式に変換して「minhafoto.png」として保存します。実行して、画像生成が機能するか確認してみましょう。
最初のエラーメッセージは「この組織はこのモデルを使用するために検証される必要があります」と表示されています。IDチェックプロセスを完了する必要があります。サイトに行って全プロセスを行い、IDを送信し、写真を撮って認証を完了しました。
認証が済んでも、変更が反映されるまで約15分かかると言われています。待っている間に、利用可能なパラメータを見てみましょう。
まず「prompt」があり、次に「model」として我々のケースでは「GPT Image One」を使用します。「background」パラメータでは背景の透明度を設定でき、「transparent」、「opaque」、「auto」から選べます。透明な背景を選ぶ場合は、PNGやWEBPフォーマットである必要があります(JPGは透明背景をサポートしていないため)。
「moderation」レベルも選べ、「n」パラメータでは1から10枚の画像を生成できます。「compression」はゼロから100の値で設定でき、「format」はPNG、JPG、WEBPから選べます。「quality」は「auto」、「hd」、「standard」、「low」から選べます。
サイズは「square」(1024×1024)、「landscape」(1536×1024)、「portrait」(1024×1536)から選べます。DALL-Eには他のオプションもありますが、今回は関係ありません。
また、製品を作成している場合はユーザーIDを設定するのが良いでしょう。
画像編集の機能もあります。元の画像から編集や拡張ができ、一連の画像とプロンプトを送信できます。マスクを使って画像の特定の部分だけを編集することも可能です。
許可が下りたかもう一度確認しましょう。まだ15分かかるようです。キーを更新してみましたが、まだダメです。画像生成は以前のバージョンよりもかなり時間がかかります。画質が非常に高いためです。
やっと成功しました!「minhafoto.png」が生成されました。初めて見る画像生成結果です。IMGと書かれたTシャツを着た犬と、Junimと書かれたTシャツを着た男性の画像が生成されました。(このチャンネルが初めての方のために、Junimはかつてのプロジェクトでのマスコットであり、個人アシスタントです)
画像の編集も試してみましょう。新しいファイルを作成して、Pythonコードを貼り付けます。プロンプトを「犬のTシャツのテキストを『cachorros』に、男性のを『manos』に変更」とします。元の「minhafoto.png」を使って、結果を「minha foto alterada」として保存します。
実行に時間がかかりますが、待ちましょう…できました!「cachorros」と「manos」と書かれたTシャツになっています。人物の特徴も少し変わっていますが、プロンプトで特に指定しなかったので、ある程度元の特徴は維持されています。元のIMGとJunimの画像と、変更後のcachorrosとmanosの画像を比較すると、わずかな違いが見られますが、基本的には同じ人物のように見えます。
これで完璧に機能しています。次に必要なのは、InstagramやWhatsApp、LinkedInなどとの統合です。投稿用の画像を生成したい場合などに活用できます。今回はPythonを使いましたが、必ずしもPythonである必要はありません。エンドポイントとCURLの設定に従えば、任意の言語で生成できます。OpenAIの専用ライブラリを使わなくても、一般的なリクエストライブラリを使用できます。
さて、このニュースに注目してください:OpenAIは2030年までに収益を40億ドルから1,740億ドルに増加させる計画です。これはわずかな期間で、パーセンテージで考えると想像もつかない成長率です。
OpenAIは2024年の約40億ドルから2030年には1,740億ドルへと年間収益の劇的な増加を予測しています。この成長の大部分は、まだ存在していない2つの製品からもたらされると予想されています。これは実現可能でしょうか?私はその可能性は十分にあると思います。
The Informationが分析した内部文書によると、同社は2029年までに年間売上高1,250億ドルを達成し、翌年もさらに成長を続ける見込みです。これが彼らが無料でサービスを提供している理由です。現在の収益源はChatGPTのサブスクリプションやAPIアクセスが中心ですが、将来の拡大はAIエージェントの導入と無料ユーザーベースの収益化によって主に牽引されると予測しています。
2024年のOpenAIの収益は37億ドルで、2023年の約10億ドルから増加しています。AIエージェントは将来の収益の約4分の1を生み出すと予想されています。私はもっと多いと思っていましたが、それでも重要な割合です。
ユーザーに代わって自律的にタスクを実行するようにデザインされたOpenAIのオペレーターなどのAIエージェントからの収益は、2025年の30億ドルから2029年には290億ドルに増加すると予測されています。個々のエージェントの価格は月額2,000ドルから20,000ドルと設定されています。かなり高額です。
OpenAIはまた、オペレーターをChatGPTにより深く統合する計画もあります。そして、ソフトバンクはOpenAIのエージェント製品に年間30億ドルを投資する計画で、両社は「Crystal Intelligence」という名前で日本でジョイントベンチャーを立ち上げる予定です。UberなどのパートナーはすでにOpenAIエージェントの使用に関する集計データを受け取っています。
無料ユーザーの収益化は2026年から始まる予定です。今年の残りの期間を活用してください。OpenAIは現在無料でChatGPTにアクセスしているユーザーからも収益を上げる計画です。2029年までに、このグループは250億ドル(会社の総収益の20%)の収益をもたらすと予測されています。
現時点では、OpenAIはまだ無料ユーザーをどのように収益化するかを決めていません。報告されているオプションには、eコマースプラットフォームへのユーザーのリダイレクトなどのアフィリエイトリンクや従来の広告が含まれています。しかし、アフィリエイトマーケティングはLLMベースの検索における特定の強みとは思われません。収益化の取り組みは2026年から始まる予定です。
おそらく何らかの広告やリンクが表示され、製品を紹介すると手数料を得るというシステムになるでしょう。購入エージェントを作れば、エージェントが何かを購入する際に手数料が入るでしょう。
新製品に加えて、OpenAIの既存のサービスも大幅に成長すると予想されています。現在月額20ドルから200ドルで提供されているChatGPTのサブスクリプションは、2025年の80億ドルから2029年には500億ドルの収益を生み出すと予測されています。ここでは利益ではなく、支払った人数について話していることに注意してください。企業向けAPIの売上も同期間に20億ドルから220億ドルに増加すると予測されています。
予測は次のとおりです:2023年10億ドル、2024年40億ドル、2025年(今年)130億ドル。最初の列はサブスクリプション、APIアクセス、エージェント、新製品です。2029年には、サブスクリプションが500億ドル、API220億ドル、エージェント280億ドル、新製品250億ドルとなり、合計1,250億ドルに達します。私はエージェントの数値が過小評価されていると思います。エージェントだけで1,000億ドルくらいになると思っていました。
2030年までに、OpenAIは月間アクティブユーザー30億人、週間アクティブユーザー20億人、日次アクティブユーザー9億人を達成すると予想しています。現在、ChatGPTは週間約5億人のユーザーを抱えていますが、The Informationによると、そのうち有料顧客は5%未満です。多くの人がOpenAIを使用していますが、ほとんど誰も支払っていないことがわかります。
OpenAIは現在の定額制から使用量ベースの課金に移行することも検討しています。これは必然的な変更です。使用量に応じて支払うべきで、ほとんど使用しない人と大量に使用する人がいるからです。これは、月額最大200ドルの最もプレミアムな料金プランでさえ、ヘビーユーザーにとっては赤字になっているためです。実際の使用量に基づく課金への移行は、より大きな収益増加につながる可能性があります。最近、ビデオ生成を試みた際に、リソース不足でサービスが提供できないというメッセージを何度も受け取りました。
The Informationによると、OpenAIは2028年までに累積460億ドルのマイナスのキャッシュフローで運営される見込みで、一部はモデルのトレーニングと実行の高コストが原因です。同社は2029年に約120億ドルのプラスのキャッシュフローで収支均衡点に達すると予測しています。120億ドルを稼ぐのにこれだけの時間がかかるのは、まさに億万長者の考え方、つまり将来を見据えた思考です。
粗利益率は2023年の40%から2029年までに70%に増加すると予想されています。2030年以降は、推論コストの増加率は年間約30%とより緩やかになると予測されています。これはすべて、現在の技術的変化を考慮しない場合の予測です。
言語モデルやチャットインターフェイスに加えて、OpenAIは画像、音声、ビデオの生成製品を開発中です。同社はまた、ロボット工学や独自のAIチップも探求しており、これらが将来の収益源となる可能性があります。
世界はまだ回り始めたばかりで、AIの可能性をほんの少し垣間見ているだけなのに、すでに40億ドルから174億ドルという驚異的な成長について話しています。この数字は予測の中には見られず、125億ドルという数字が見られました。
これについてどう思いますか?コメントしてください。私も大きな役割を期待していましたが、この予測には少し失望しました。このようなビデオを引き続き視聴するためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーはインテリジェントエージェントの独占ビデオや早期アクセスビデオを利用できます。


コメント