Sam Altman、Sora、ソーシャルメディア、AIの未来、その他について語る

OpenAI・サムアルトマン
この記事は約27分で読めます。

本動画は、OpenAIのCEOであるSam AltmanとSoraチームのBillが、動画生成AIモデル「Sora」の最新版について語ったインタビューである。Soraは物理演算能力が大幅に向上し、バク転や体操のような複雑な動作を正確に生成できるようになった。特に注目すべきは、ユーザーの70%がコンテンツを制作しているという点で、これは従来のソーシャルメディアの1%という創作率を大きく上回る。カメオ機能により、ユーザーは自分や友人の姿を動画に簡単に組み込むことができ、創作の敷居が劇的に下がった。AltmanはSoraを「GPT-3.5の動画版」と位置づけ、今後GPT-4相当の性能向上が見込まれると述べている。ハリウッドとの対話も進んでおり、肖像権管理の厳格さが評価されつつある。また、API経由での需要が爆発的に伸びており、新たなスタートアップの誕生を期待させる展開となっている。

Sam Altman on Sora, Social Media, The Future of AI, and More
TBPN.com is made possible by: Ramp - - - - Sleep -

Soraの進化と現在地

これは動画におけるGPT-3.5の瞬間のようなものです。私たちは動画モデルのGPT-4相当のものを作る方法を知っていますし、時間をかけてそれを実現していきます。これはほとんど小さなミニ代替現実のようなものになり得るんです。

Sam、Bill、調子はどうですか? 何か進展は?

やあ、みなさん。お会いできて嬉しいです。すべての進歩におめでとうございます。私は個人的にSoraをとても楽しんでいます。動画を作るのがすごく楽しくて、昨日のコラボ投稿を作るのもとても面白かったです。あなたのカメオ機能でプロンプトを試してみたんですが、Johnが設定を工夫して、誰かが彼をカメオに使うと常にボディビルダーとして登場するようにしたんです。だからあなたたちもその体験をして、かなり混沌とした結果になりましたよね。

これまでにお気に入りのSora投稿はありますか? 特に創造的な使い方として印象に残っているものはありますか?

そうですね、間違いなく私がGPUを盗んだり、GPUを手に入れるために奇妙なことをしたりしている動画は全部面白かったです。この数日間、少なくとも私のフィードでは、Soraのようなものがなければ存在し得なかったような、あるいは作るのが容易ではなかったような、非常に美しい幻想的なシーンが流れてきています。人々がそれらを作り上げ、トレンドが流れていく様子を見るのは本当に素晴らしいです。Billはどうですか? これまでのSoraのお気に入りの使い方はありますか?

ああ、そうですね。Mark Cubanが数日前にプラットフォームに来て、Shark Tankのミームがいくつか生まれて爆笑しました。それが私のお気に入りですね。

Soraの機能を売り込んでいて、さらにプロンプト機能を活用して常にCost Plus Drugsの広告を含めているのが特に面白いと思いました。彼はAIにおける広告の最も声高な反対者の一人だったことを考えるとね。彼はその機能を最大限に活用していますよ。

そうですね。今後、以前の種類の動画では不可能だった、奇妙で新しいダイナミクスがすべて出現するだろうと思います。これは楽しい時期です。数日ごとにすべてが大きく変わっていくでしょうから。

ああ、このPolymarketのティッカーが流れていくのを見ていると、これらすべてに何か言いたくなってしまいますね。

ええ、念のため言っておきますが、ティッカーのことは心配しないでください。それらの市場は表示されていないと思います。でもそうですね、これが私たちが今いる新しい世界です。TBPNでライブで市場を動かすこともできますが、今日、人々は喜んだり失望したりするでしょうが、もちろん私たちはSoraについて話すためにここにいます。

他のトピックについてではなくね。でも広告についても知りたいんです。なぜ初日にSoraに広告がないんですか? あなたはAndreessen Horowitzのポッドキャストで、広告についてどう考えているか、本当に素晴らしい思考モデルを示していました。私は納得しています。技術的な理由ですか? 規模が必要なんですか? もっと考える必要があるんですか? なぜ初日に広告がないんですか?

これは生まれて10日の製品のようなものですよね。何かを動かすだけでも大変なんです。私たちは成功を前提にしていません。懸命に成功を勝ち取らなければならず、それから収益化について考えることができます。でもこれまでのところ順調に進んでいます。まだ非常に初期段階で、多くの人に愛されるものを構築するにはまだ多くの作業が必要です。

驚くべき機能と物理演算能力

モデルの驚くべき機能についてはどうですか? 幻想的なシーンを見たと言っていましたね。具体的なブレークスルーについて興味があります。Soraモデルが特に得意なことに気づいたことはありますか? 反射表現が素晴らしいことに気づきました。明らかに人々はカメオを愛していますが、技術的にモデルが以前はできなかったけれど今はできることについて、何があなたを驚かせましたか?

このモデルは物理IQの面で大きな飛躍を遂げています。過去のほぼすべての動画生成モデルは、バク転や体操のルーティンなどを含むプロンプトに本当に苦労していました。そして現在存在するモデルの中で、このような本当に複雑なダイナミクスを確実に処理できる唯一のモデルがこれなんです。

アプリでこれまで人々が本当に気に入っている大きな機能の一つは、モデルの操縦可能性です。たとえば、数語しかないような本当にシンプルなテキストプロンプトを与えても、このモデルは始まり、中間、終わりのある一貫したストーリーを語ることが本当に得意なんです。そしてこれをユーザーからの直接的な誘導をあまり必要とせず、自動的に行います。もしプロンプトをどのように配置するか、ストーリーがどのように展開されるべきかについて細かく指定したい場合は、それもサポートしています。クリエイティブプロセスのどこにいても対応できるんです。でも本当に、このモデルは非常に高度に操縦可能で、物理IQが大幅に向上しているため、数ヶ月前には不可能だったことができるようになっているんです。

それはすべてモデル内で行われているんですか? それとも何らかの推論ステップがあって、私のプロンプトを膨らませたり展開したり、より大きなプロンプトを書いたり、問題を何らかの方法で分解したりしているんですか? それについて何か共有できますか?

いい質問ですね。このようなテキスト条件付き動画モデルの知能は、Soraのようなコアモデル自体と、テキストプロンプトを通じて入ってくる部分の両方にあります。ユーザーがプロンプトを開始する方法がどうであれ、下層で言語モデルが詳細を追加することができます。でも例えば、バク転や物理的な相互作用、水をグラスに注ぐときの屈折のモデル化など、これらの詳細はすべてコアの動画モデル自体によって捉えられなければなりません。つまり、それはSoraに本質的に備わっている知能であり、確かに言語モデルからの知能で補完することもできますが、これらから素晴らしい結果を得るための必須条件ではありません。

物理面でモデルが弱い部分や改善したい領域はありますか? 6本指の時代を経験しましたが、反射や水は解決されたようですが、誰かがドアが難しいと言っていました。私は個人的にはそれに気づいていませんが、多くのものは素晴らしいです。でも次のバージョンではこれがさらに良くなるだろうと気づいたことはありますか?

まだ非常に初期段階です。Billが言ったことで私が評価したのは、これは動画におけるGPT-3.5の瞬間のようなものだということです。私もそう思います。実際のGPT-3.5を使いに戻ったら、「なるほど、大きな可能性の兆しはあるし、時々印象的なことができる。でも本当にこれらのテキストモデルが人々に実際の価値を提供し始めたのはGPT-4になってからだった」と思うでしょう。

そして私たちは動画モデルのGPT-4相当のものを作る方法を知っており、それを実現していきます。そうすれば、現在煩わしいこと、例えばドアや、時々何かが本来通るべきでないものを通り抜けてしまうようなことの多くが改善されます。

世界が3.5の欠点について短期間不満を言い、決して役に立たない、決してこれはできない、あれもできないと言っていたのと同じように、私たちはそれをどんどん良くし続けることができました。モデルの物理IQは確かに私がこれまで見た中で最高ですが、将来のバージョンほど優れているわけでは決してありません。

そして私は、GPTテキストモデルで起こったのと同様のことを見ることができればと思っています。人々は常により多くを、より良いものを要求し、常にそれを使う新しくより良い方法を見つけ、世界はこれまで以上に素晴らしい動画を作り続けるでしょう。

どのくらい速く… あ、すみません。私たちはここで動画のカーブの初期段階にいます。

ええ。GPT-1が本当にこのモダリティのSora 1だったようなもので、この3.5の瞬間に至るまでの過去18ヶ月で私たちが達成した進歩は、GPT-1から3.5に至るまでの言語領域での時間と比べて本当に圧縮されています。だから近い将来、進歩は流星のように続くと本当に期待しています。

カメオ機能の革新性

カメオ機能がどのくらい速くクローンされると予想していますか? それはモデルが飛躍を遂げたのと同様に重要な部分のように感じます。製品、体験、これらの資産を作成する体験がワイルドに革新的です。ストーリーズがクローンされるのを見ました。アルゴリズム動画のショートフォームフィードがクローンされるのを見ました。多くの他のプラットフォームがこの機能を見て、これが未来かもしれないと気づくと予想しています。あなたたちは確かにそれが重要だと信じていますよね。どのくらい速く…

実際、私たちは製品イノベーションを行い、他のみんながコピーする世界で全く問題ありません。そして彼らが思っているほどうまくいかないと思います。多くの人がChatGPTをコピーしようとしてきました。私たちの競合他社のアプリを見ることができますが、彼らは間違いさえコピーし、私たちが本当にしなければよかったと思うデザイン決定さえコピーしています。彼らにとってうまくいっているのかもしれませんが、私たちにとっては問題ありませんでした。

これの鍵は一つのイノベーションではなく、それらを繰り返し繰り返し出し続け、最初に思いつき、それらをまとまったオファリングにすることだと思います。それが私たちが得意になりたいことで、他の人々がうまくいくものをクローンしたいなら、私たちも時々うまくいくものをクローンします。それでいいんです。でも主に私たちはイノベーションを推進できるようになりたいです。Billと彼のチームは、人々が実際にこれらの動画モデルをどのように使いたいか、モデルが何をする必要があるかを理解する素晴らしい仕事をしてきたと思います。彼らは動画モデルのトレーニング方法からユーザーにとって楽しいものにする方法まで、これをフルスタックの問題としてアプローチしてきました。カメオは彼らが持っている多くのアイデアの一つに過ぎず、最終的に構築したいと望む製品への旅の途中です。

だから人々が私たちからインスピレーションを得てコピーするなら、きっとそうするでしょう。それでいいんです。

AI検出が欲しい、AIコンテンツにラベルを付けてほしいという一般的な主張についてどう思いますか? それは表明された選好であって、明らかにされた選好ではないのでしょうか? 個人的には、悪いAIコンテンツは欲しくありませんが、悪い人間が作ったコンテンツも欲しくありません。

両方とも素晴らしいものが欲しいです。そして誰かが天才的なものを思いつき、それを動画モデルで具現化したとき、私は気にしません。どう思いますか?

本当の問題はスロップを望まないということだと思います。素晴らしいコンテンツが欲しいんです。人それぞれ、ある人のスロップは別の人の宝物です、確かに。

でもあなたが気にするのは、良い、オリジナルの、思慮深い、新しい、役立つ、何であれコンテンツです。そしてそれが完全に人間によって生成されたものか、完全にAIによって生成されたものか、あるいは私が将来ほとんど起こると予想している、ツール支援による人間主導の生成であるかは、コンテンツが素晴らしければそれほど気にしないと思います。

技術的には人間によって書かれたり描かれたり撮影されたりしたものの多くが、完全に派生的で、AIが生成したものよりはるかにオリジナリティがないものがたくさんあります。長期的に人々が本当に気にするのはそれだと思います。ただ素晴らしいコンテンツが欲しいだけです。

でも私はそれと同時に人間とのつながりも欲しいです。素晴らしい本を読むとき、最初にしたいことは、それを書いた著者について読むこと、どんな人生経験がそこに込められているかを知ることです。それはなくならないと思います。でも彼らがAIをツールとして使って文章をより良くしているなら、大歓迎です。それは素晴らしいことに聞こえます。同様に、私はランダムなAI生成キャラクターよりも、知っている人についての動画を見たいです。それがこれを提供することがクールだと思った理由の一部です。

チームが行ったデザイン決定で私が本当に素晴らしいと思い、実際に私は初期段階で彼らを別の方向に押していたのですが、その後彼らが完全に正しいと判断し、感謝して引き下がったのは、フィードがAIのみで、AIといくつかのアップロードされた動画の混合ではないという事実です。これは微妙ですが非常に重要なデザイン決定で、人々がこれにどう関わるかに影響しています。

ええ、それは私にとって非常に奇妙な体験でした。このインタビューを発表するコラボ投稿を作ろうとしていたとき、最初は「さて、台本を考えなければならないし、何を言うか考えなければならないし、この部分を録画してそれを使うべきだ」と思っていました。でも違ったんです。プロンプトを入力するだけで、正面を向いた動画が得られるのは驚くべきことです。

創作プラットフォームとしての成長

Soraが立ち上げの瞬間にはクリエイティブツールだったものから、より消費型プラットフォーム、伝統的なソーシャルメディアプラットフォームのようなものに移行するために、あなたたちはどのような指標を見ていますか? 明らかにあなたたちはツールでネットワークに種をまいていますが、人々が純粋にコンテンツを消費し、コンテンツを作成しないで1日に何時間も過ごすようなものに変えるのは確かにはるかに難しいです。それについてあなたたちが推進していることについて話してください。

私たちは本当にこれを最初から創作を中心に設計したかったんです。そして私たちがここで最適化に焦点を当ててきた指標の多くは、できるだけ多くの人々が実際にSoraモデル自体に手を触れ、友達とコンテンツを作成でき、世界の他の人々のためにコンテンツを作成できるようにすることに本当に合致しています。

このローンチでこれまでに本当に誇りに思っている一つの指標は、今日に至るまで、ローンチから1週間半経った今でも、ユーザーの70%が実際にコンテンツを作成しているということです。そしてこれは他のどのソーシャルメディアプラットフォームよりもはるかに高いです。そして私は、これが適切なツールセットを使った創作がいかに楽しいかを本当に物語っていると思います。

これらの従来のプラットフォームを見ると、フィードから離れてクリエイティブなフロー状態に入るまでに非常に多くの摩擦があります。電話を置いて、ビデオカメラを取りに行き、自分を録画し始め、友達を見つけ、ダンスをするなど、本当に大変な作業なんです。Soraでは、電話を手に取り、フィードで気に入った動画を見つけ、リミックスし、友達をカメオにすることができます。

そして最初は私たちにとって明らかではなかったけれど、この製品の新興行動として明確に見えてきた一つの洞察は、必ずしもインフルエンサーのようになりたいわけでも、大きなソーシャルメディアプレゼンスを持ちたいわけでもない人々がたくさんいるということです。でも友達全員が彼らのカメオにアクセスでき、あらゆる奇妙な状況に彼らを置くことができるという事実が、実際に以前は非常に摩擦が大きかった方法で彼らを競技場に引き入れているんです。今、私たちは週間アクティブユーザー数で200万人に近づいています。そのユーザーベースの非常に大きな割合が今日に至るまでSoraで創作を続けていることに本当に興奮していますし、今後もその方向を推し進め、人々がさらに強力なツールを持てるようにしていきます。

Soraユーザーの70%がコンテンツを作成しているんですね。一般的に引用される典型的なベンチマークは、1%が創作、99%が消費、そのようなものです。そして確かにそれはInstagramでの私の体験のように感じます。私は時々写真を投稿しますが、ほとんどの時間はただスクロールしているだけです。

その1%が、実際のアプリ内の時間、プロンプト作成時間対スクロール時間という点で、Soraではずっと高くなると思いますか? データがあればとても興味深いです。でもそれから、それがソファに寄りかかるのではなく、前のめりの体験だという点で、従来のソーシャルメディアよりもビデオゲームの競合相手のようなものになるのでしょうか? どう思いますか?

素晴らしい質問ですね。プラットフォーム上の人々の創作対消費習慣が時間とともにどのように変化するか、まだもっと詳しく研究する必要があります。まだかなり初期段階です。でもあなたの指摘には同意します。時間が経つにつれて、これはビデオゲームのような感じで、よりイマーシブになっていくと思います。プラットフォームを実際に使っているとき、より多くの主体性があります。毎日何時間も無心にフィードをスクロールするようなことではありません。

そしてこの製品の一つの解釈として、特に研究の観点から興味深いと思うのは、カメオはある意味で、自分自身をモデルに注入できる最もシンプルな方法だということです。今のところ非常に低帯域幅のコミュニケーションチャネルです。アプリに与えているのは、特定の個人の数秒間の動画映像だけです。

でも時間が経つにつれて、これらのモデルがあなたの人生についてますます多くを知り、あなたの友達、あなたが世界にどう現れたいかを深く理解し、時間が経つにつれてこれはほとんど小さなミニ代替現実のようになり得るんです。つまり、自分自身と友達の動画を生成するだけでなく、実際にSoraプラットフォーム上のモデルで動作している自分のデジタルコピーを持ち、他の人々と主体性を持って相互作用しているんです。だから時間が経つにつれて、このプラットフォームは今日親しみを感じるものから、Sora 2の完全な知能に本当に依存し、私たちが内部で取り組んでいるすべての世界シミュレーション能力を本当に活用するものへと進化していくと思います。

それに加えて、コンピューターの前で得られるエンターテインメントのスペクトラムのようなものを考えると、一方の端には2時間半の映画があり、再生を押してから後ろに寄りかかって何もしません。そして反対の端には、非常に激しいビデオゲームがあり、汗をかいて心臓がドキドキして、超超アクティブです。

AIはそれらの中間にものを押し進めていくでしょう。だからまだその映画を見ているかもしれませんが、今度はその過程で数回何かを言うことができ、映画が展開するにつれて何が起こるかが変わります。

あるいはSoraでは、この素晴らしい新しい現象を見ています。伝統的にはユーザーの1%だけが創作していた世界で、ほとんどのユーザーが創作しているんです。だからイエス、動画フィードを見ているけれど、もう少し何かをしているんです。そしてそれは、少なくとも私にとって、全体がどれほど楽しいか、それについてどう感じるかを本当に変えます。そしてBillが言ったことをするかもしれません。Soraフィードにはるかに積極的に参加することになるでしょう。

そして私は、そのコンティニュアムがもっとぼやけていくのを見ることになると思います。

ところでSam、Bandersnatchを見たことはありますか? これはNetflixの選択肢のある冒険もののようなもので、本当にクールなアイデアでしたが、最終的に人々が何度も何度も繰り返すようなものにはなりませんでした。十分にカスタマイズ可能ではなかったからか、あるいは人々はただ座ってディレクターのビジョンを見たいだけなのか。わかりません。とにかく、聞いたことがありませんでしたが、クールに聞こえますね。

コンピュート配分と技術的課題

Samへの質問です。Soraとビジネスの残りの部分へのコンピュートの配分についてどう考えていますか? Billは常にあなたの耳元で、数時間おきに何か言っているんじゃないかと想像しますが、どう考えていますか?

私の本当の答えは、コンピュート配分の決定をしなければならないのではなく、もっとコンピュートを手に入れることに私の日々の過ごし方の焦点を完全に変えたということです。短期的なコンピュート配分の決定をいくつかしなければならないことはまだあります。でも私たちは、私が代わりに人々に「もっとコンピュートを使う方法を見つけなければならない」と伝える世界に向かっていることを願っています。私たちはここで非常に積極的になるつもりです。

サプライチェーン内で物事をあなたのコントロール下に置くという素晴らしい仕事をしているように感じます。この時点であなたのコントロール外にあるものは何ですか?

ほとんどです。でもスタック全体で素晴らしいパートナーがいますし、チェーンのさまざまな部分に複数のパートナーがいます。Soraをスケールアップすることについて考えるとき、あなたに賭けないのはクレイジーだと感じます。チップを手に入れるでしょう。来年配達される10ギガワット時を買おうとするのはそう簡単ではありません。面白いですね。

ハリウッドとの会話はどうなっていますか?

ああ、そうですね。あなたどうぞ。

ええ、この1週間、実際にハリウッドの非常に著名な何人かの方々と話をしてきました。これに対する人々の最初の反応は、非常に理解できることですが、多くの不安や心配を伴うものになるでしょう。

でも実際にこれらの方々と部屋で座って、私たちが構築しているものを本当に説明すると、ハリウッドの人々がこれについてどれほど興奮しているかに実際にかなり驚かされました。最近ある女優と話していたのですが、1年ほど前にTwitterで、これらのオープンソースモデルの一つで生成された彼女のディープフェイクを見たと言っていました。それには本当に多くの不快なコンテンツが作られていました。

そして私たちが彼女に本当に私たちの安全対策のすべてを説明したとき、つまり私たちがどのようにこのプラットフォームで許可する行動を規定する非常に明確に定義されたモデル仕様を持っているか、そしてどのように肖像の完全なコントロールに本当に傾倒しているか、他のどのプラットフォームよりも。カメオプロセスを通じて入らなければなりません。

自分の画像をアップロードして、任意の人の動画を生成することはできません。カメオを通じて入らなければなりません。私たちが本当にここで正しい基準を設定していることが彼女に明らかになったと思います。ハリウッドの人々が肖像を完全にコントロールできるようにするという点で。

ハリウッドでの多くの不安はそこから来ていると思います。ランダムな人が自分の動画や画像を取って好きなようにでき、自分の管轄外のひどいコンテンツを作成できるという感覚です。でも私たちは本当にSoraを最初から設計して、アプリにサインインした瞬間から、友達の生成にアクセスするためにカメオの許可が必要なことまで、ユーザーが肖像を完全にコントロールできるようにしています。

だからもっとハリウッドと関わる必要があると思いますし、それを続けていくつもりです。でもSoraのストーリーを本当に説明すると、彼らは非常に受け入れてくれます。

それに何か付け加えますか? チームがローンチ前に私のカメオをオープンアクセスにしていいか尋ねてきたとき、私はもちろん一瞬考えて、絶対にイエスと言いました。

そしたら初日にハリウッドのセレブたちが私にメッセージを送ってきて、「あなたは絶対にクレイジーだ。これは狂気の沙汰だ。これは私がこれまで見た中で最も愚かなことだ」と言っていました。そして3日目頃までには「うーん、あれは本当に賢かった。あなたは多くの無料宣伝を得た。私たちもそれをする必要があるかもしれない」と言うようになりました。

そして今、実際のセレブたちが「オーケー、私はこれをやるつもりだ」と言うのを見ています。そしてもっと多くの人がそうすることを期待しています。他の種類のキャラクターやIPについても同様です。1年後、あるいは6ヶ月後、あるいはもしかしたらそれ以下で、私たちの問題が人々が自分のカメオやキャラクターを登場させたくないということではなく、私たちが彼らのキャラクターやカメオを十分に頻繁に登場させていないと考えることになる世界を完全に想像できます。

ええ、これはファンとのつながりにとって本当に大きなことになるかもしれません。もしかしたら以前の世代のセレブたちはこれをやりたくなくて、インフルエンサーのセレブたちは全員やるかもしれません。それがどうなるかわかりませんが、これはかなり深い新しい種類のつながりになると思います。

ええ、ミームではDiCaprioにとって良かったようです。彼はシャンパンのミームや、テレビを指差している彼を見せたときに直接収益化しているわけではありませんが、何らかの形で彼のオーラを構築しています。

私たちの友人が昨日何かを投稿しました。これはJeremy Gonです。彼は「私たちがスロップについてこんなに動揺している理由は、2、3年後には私たち全員がそれを消費するのを愛することになるのが明らかだからだ。それは長くスロップではないだろう」と言いました。同意しますか、Sam?

つまり、その一部は一部の人々にとってはスロップで、一部はそうではないでしょう。初期のGPT時代にこのような反応があったのを覚えています。人々が「誰がこれを読むなんて信じられない。完全なゴミだ。幻覚でいっぱいだ。誰にも役立たない」と言っていました。そしてそれは一部の人々にとってより役立つようになりましたが、彼らは「この物が美しい文章を書くなんて誰も信じられない。狂気の沙汰だ」と言いました。そしてGPT-5では、作家たちが「ワオ、これは便利なツールだ。時々美しい文章を書く」と言っています。

だから同様の軌跡をたどると思います。

人々が少なくとも感じている事実についてどう思いますか。実際にできるかどうかはわかりませんが、GPT-5の文章はまだ見分けがつくように感じます。「これ」「それ」、Mダッシュのような。3年後のSora 5でもこれらの人工物がまだ見られるでしょうか? 人々は「知っている人は知っているが、ほとんどの人はわからない」と言うでしょうか?

ええ。動画のMダッシュは何なのか、6本指のようなものではないと思います。

いいえ、いいえ、確かに違います。それはタイプミスで、もう起こりません。

ええ、今のMダッシュはSoraのこのわずかに奇妙な話し方のパターンだと思います。多くの言葉を非常に速く言うのが好きなんです。これらの生成物には確かにスタイルがあります。

GPTと同様に、私たちは本当にユーザーに動画がプラットフォームでどのように表示されるかについて多くのコントロールを与えたいと思っています。本当に非常に落ち着いた体験が欲しい、ショットチェンジがあまり起こらないという場合、ユーザーにそれを生成する能力を与えたいですし、今後もっと多くの選択肢を人々に提供し続けます。

だからSoraのデフォルトの動作や癖は確かにいくつかあるでしょうが、パワーユーザーが完全にコントロールできるように支援したいと思っています。

ランダムな質問ですが、Soraという名前はどこから来たんですか?

ええ、これは楽しい話です。2024年2月に出た元祖Soraですが、元のブログ投稿では、私たちはモデルを世界に公開する2日前まで名前がありませんでした。チームで何にすべきか合意できなかったんです。

少なくともコードワードか何かはありましたか? どのように…

ただビデオジェンと呼んでいました。

オーケー。そしてある非常識な時間に、私はChatGPTに大量のクレイジーなアイデアを投げ込み始めました。基本的に英語の単語を使い果たしたので、日本語の単語に切り替えました。

ワオ。そしてSoraが出てきました。そして「ワオ、本当にいい響きだ。空を意味する。想像力、創造のすべての可能性に傾倒している」と思いました。それで土壇場でSoraを出荷しました。

ええ、狂乱のダッシュでした。

オーケー、日本関連のことと言えば、Sam、あなたは少し前にAcura NSXを探していると言っていました。これは一種の懐かしい車です。とても、Waymoではありません。

誰もがWaymoの動画生成、Sora動画生成を使っている時代に愛され続けるコンテンツやフォーマットの一部は何だと思いますか?

まず第一に、私はそのNSXを手に入れました。そしてそれは子供時代の期待のすべてに応えました。あの車は素晴らしいです。そして私にはわかりません。

そのような人々のためのものがたくさんあると思います。生成されたものであろうとなかろうと、本物が欲しいんです。自分が持っていた子供時代のつながりのようなものが欲しいんです。今日の子供はNSXを欲しがらないでしょうが、それに似たかっこいい車があれば、彼らは欲しがるでしょう。そしてある時点で、クレイジーなVR体験ができるという事実があっても、彼らはまだ本物と、それへのつながり、持っているすべてのものが欲しいでしょう。だからそのような種類のものがたくさんあると思います。

実際、未来はそういった種類のものがはるかに多く見えると思います。ずっと少なくはありません。

Soraで経済をどのくらい早く創出したいですか? クリエイターが物を作るためのインセンティブ、IP保有者のためのインセンティブ、個人が自分の肖像を受動的に収益化するための多くの方法を創出できるように感じます。

確かに。Bill、そのタイミングについてどう思いますか?

これはチームにとって最優先事項です。ここには明らかに、セレブ、権利保有者全般にとって信じられないほどの価値提案があります。カメオは人々にとって素晴らしいエントリーポイントだと思います。

今は人々のためのカメオがありますが、自分のキャラクターやブランドなどのためのカメオを想像できます。だから私たちはチーム内で積極的に取り組んでいて、ここで適切な収益化モデルを考え出して展開しようとしています。でも私たちにとって本当に重要なことは、プラットフォーム上のクリエイターが報酬を得ること、そして彼らがすでに行っている素晴らしい仕事に対する明確な金銭的インセンティブがあることです。これは私たちにとって最優先事項で、今後数週間で更新情報があるでしょう。

これは私たちが積極的に取り組んでいるものです。

それは非常に重要で素晴らしいことだと思います。ただ、過去数週間でBillが平均何時間睡眠を取っているか知りたいですが、おそらく十分ではないと思います。だからチームには短期間でやらなければならないことがたくさんあり、少し時間がかかるでしょう。

オーケー、もう一つあなたのお皿に載せさせてください、Sam。つまり、以前、何年も前にLooptという位置情報ベースの製品を作っていましたね。AIと位置情報ベースのコンテンツがどのように組み合わさるか考えたことはありますか? これらのソーシャルアプリのほとんどでは、位置をタグ付けできます。現在のSoraアプリではそれは意味をなさないでしょう。でもAIマップ製品はどのように見えるでしょうか?

AIと位置情報についてはそれほど考えていませんが、AIが人々のソーシャル体験を本当に変えることができる方法については考えてきました。

まだ確実な答えはありませんが、引っ張る価値のある興味深いスレッドがたくさんあります。そしてそのスタートアップを運営していた頃をもっと振り返って考えるようになりました。私の直感は、あなたを人々とつなぎ、人々を見つけるのを助ける、非常に興味深い新しい種類のソーシャル体験を作ることが可能で、それが興味深い方法でAIによって仲介されるということです。

でもそこには多くの探索が必要でしょう。

最近スタートアップの創業者たちにどのようなアドバイスをしていますか? GPT-3.5とGPT-4の時代には、モデルの停滞を前提とした会社を作るなというようなことだったと記憶しています。Soraの時代にはどう考えていますか?

それは本当に素晴らしいアドバイスでした。実際にそうなりました。まさにそのように展開しました。そのように構築されていない素晴らしい会社がたくさんあり、彼らは素晴らしい成果を上げました。

でももし「ああ、GPT-4を調整する特別なプロンプトがある」というだけだったら、うん、悪い時期でした。でも今、動画とSoraの文脈でどう考えていますか? 明らかにAPIはあります。デベロッパーデイがあります。これの上に構築する人々がいるでしょう。

問題の形は違いますか?

完全に違います。APIへの反応は狂ったようにポジティブでした。少なくとも私がこれまで見た中で、新しいモデルのAPIで最速の収益増加です。もしかしたら覚えていないもっと速いものがあったかもしれませんが、おめでとうございます。

そこでの需要は信じられないほどで、人々はそれで素晴らしいことをしています。Billとローンチ以来1対1の時間を持つ機会がありませんでした。あまりにも混沌としていたので。今日後でやります。でも私が彼に提案しようと思っていたことの一つは、通常はやらないことをやることでした。どれだけこのものの上に構築することへの興奮があるかを考えると、私たちが優先しようとしているものの意図的なロードマップを出すことです。なぜなら、私たちが出荷するこれらの新しいものそれぞれで、単純に不可能だった本当にクールな新しいスタートアップが可能になることを想像できるからです。

あなたたちがAPI経由でSora 2をリリースしたときに質問がありました。もしSoraがInstagramやYouTubeスケールのビジネスになる可能性があるなら、なぜ世界中が他のクリエイティブツールに統合でき、ウォーターマークのない、あなたたちのフィードにない、Soraでやっているようなフィードバックループを得られないコンテンツを生成するために使えるモデルを、あなたたちのエッジの一部をリリースするのですか?

ChatGPTについても、私たちはAPIで素晴らしいモデルを出しました。人々は理論的にはChatGPTで私たちと競合できますし、試みる人もいますが、私たちはこの技術のすべての素晴らしい使い方を構築するつもりはありません。世界にそのすべてを手に入れてほしいんです。人々が私たちのAPIを使うことで報酬を得られることを嬉しく思いますが、私たちはただAIが世界で繁栄することを望んでいます。動画モデルでできることのすべての素晴らしい使い方を構築するつもりもありません。一つは構築しますし、それはかなり素晴らしいと思います。

でも人々はビジネスや製品を構築するための他の多くのアイデアを持っていますし、私たちはそれらを可能にしたいんです。

オーケー、最後の質問、車に戻ります。Porsche 911の何が問題なんですか? ええ、以前タイムラインが混乱していると言っていました。誰かが500万ドルの価値があったら911を買うかと言って、あなたはノーと言いました。

PGに同意していました。どういう意味でしたか?

ええ。つまり、もしかしたら趣味の悪いジョークだったかもしれません。夜遅くて、何というか、そうですね。でも私には不幸にも高価な車への傾向があります。

ええ。そして反応は「25万ドルを車に使うことはあるか?」というようなもので、私はそれを文字通りに受け取りました。

それは素晴らしい。文字通りに受け取ったことでサイズゴングを鳴らしてください。25万ドルの車のための時間はない。必ずしもそうではありませんが。でも私はおそらく… それは私の最高のツイートではありませんでした。

いいえ、いいえ、私は今楽しみました。私たち全員が楽しみました。文脈があって今は楽しんでいます。お二人ともすべての進歩におめでとうございます。番組に立ち寄る時間を作ってくれて本当にありがとうございます。

本当に感謝していますし、これがどこへ向かうのか見るのをとても楽しみにしています。

ありがとうございます。

乾杯。

コメント

タイトルとURLをコピーしました