OpenAIが新たに発表したChatGPT Imagesは、画像編集機能の向上と高いリアリズムを実現した最新の画像生成モデルである。本動画では、GoogleのNano Banana Proとの性能比較を中心に、顔の一貫性保持、テキスト生成能力、複雑なプロンプトへの対応力などを詳細に検証している。また、GPT-5.2 Codecの発表やコンピュートリソース不足に関するOpenAIの率直な告白、Gemini Flash 3.0の無料提供開始、YouTubeのAIゲーム機能など、AI業界の最新動向を網羅的に解説する。さらに、Larian Studiosがゲーム開発における生成AI使用を巡って炎上した事例を取り上げ、クリエイティブ産業におけるAI活用の是非という論争的なテーマについても深く掘り下げている。MetaのSAM Audioによる音声分離技術、モジュラー型ロボットTron 2、Appleのガウシアンスプラット技術など、多岐にわたるAI関連の技術進化も紹介される包括的な内容となっている。

OpenAIの新画像生成モデルとNano Banana Proの比較
OpenAIの新しいChatGPT Imagesが到着しました。より優れた編集機能と、はるかに高いリアリズムを実現しているんです。
より良い編集、よりリアルな表現、云々かんぬん。ここでの大きな質問は、Kevin、GoogleのNano Banana Proと比較してどうなのかということですよね。
私たちをバナナのスーツに入れたいんですか。
はい、バナナのスーツに入れたいです。
わかりました。いいでしょう。さあ、どうぞ。バナナです。
その通りです、Gavin。OpenAIはGPT-5.2 Codecも発表したばかりです。これは彼らのハイエンドコーディングモデルの新しいアップデートです。そしてOpenAIの社長からの動画では、基本的にもっとコンピュートが必要だと懇願しているんです。
私たちはコンピュートの需要に対して、それを供給する能力が完全に限界に達しています。
一方で、Gemini Flash 3.0が登場しました。小さく、速く、パワフルで、しかも無料です。そしてその流れで、YouTubeはAIゲーミングを展開しました。さあ、みなさん、熊手を持ってください。そうです。AIゲーミングの世界にまた大きな巨大な論争があるんです。なぜみんながLarian Studiosに対して怒っているのか、そしてお気に入りのゲーマーの友達とどう話すべきかを説明します。
ああ、クリスマスディナーでその会話をするのが待ちきれませんね。さらに、Metaからの新しいオーディオテクノロジーMicrosoftの新しいオープンソースのテキストから3Dモデル、そしてちょっと悪夢のようなレゴのようなロボット。そして、Soraがある女性を完全に髪でできた存在に変身させた様子をお見せします。
私たちを髪の中に入れたいんでしょう。
はい、髪の中に入れます。
これはAI for Hairmansです。さあ、行きましょう。Hair boy。みなさん、AI for humansへようこそ。AI世界への週刊ガイドです。時が来ました。私たちはここにいます。AIスペースでまた大きなリリースの週です。Kevin、今週はChatGPT Images、別名GPT Image 1.5、別名OpenAIのNano Banana Proへの回答を手に入れました。これは新しいモデルです。
ChatGPTとOpenAIからのアップデートされた画像モデルで、これまでのところかなり良好です。本当に興味深いですね。これに時間を費やしましたか。
はい、そうしました。Mary Shipmus、Gavin、リスナーのみなさん全員にMerry Shipmасを。これは彼らの新しい画像モデルで、ご存知のように、リーダーボードは企業が誇示したいものです。
この新しい画像モデルは、特定のアリーナのユーザーによってGoogleのモデルよりも優れていると評価されています。そして、それについての魔法的で素晴らしいことすべてが、私たちがこれらのツールを持っていて、どんどん良くなっているという理由だけで、とても面白いんです。
ああ、それは素晴らしいね、みたいな感じです。キャラクターの一貫性は大きな問題です。つまり、自分の写真をアップロードして「私を〇〇にして」と言えば、あなたの顔やプロポーションなど、あなたが求めているものをかなりうまく保持してくれます。
画像に描画してフォローアップを求める。私はその路線でいくつかのことをしました。とてもうまく機能しています。つまり、それが現実なんです。非常に堅実な画像モデルで、あなたが慣れ親しんだChatGPTの中にあります。
そうですね。私にとって興味深いのは、彼らがこれを披露する非常に重要なブログ投稿を公開したことです。彼らが本当に宣伝しているのは、自分自身や数人の画像を編集して顔の一貫性を保つ能力なんですよね。そして、私たちも自分たちでこれを試してみました。実際、OpenAIのブログ投稿を見ると、Mark Chenと名前を思い出せませんが、OpenAIのチーフサイエンスオフィサーが、子供のパーティーにいて退屈そうにしている状況に置かれ、その後ろに多くの子供たちを配置したというものがあります。
実際、私はあなたと私を撮って、基本的に先週のサムネイルに使った私たちの写真、元の写真に加えて、SoraビデオからのOlly、私の犬の画像をアップロードして、まったく同じプロンプトを言いました。これを見ていくと、まず私たちはこの種の子供のパーティーにいて、両方とも退屈そうに見え、かなり私たちに近く、同じ服を着ていて、他のすべても同じです。
それから背景に多くの子供たちを追加すると言われています。私はそれらの子供たちを追加しましたが、実際にそれは非常に優れています。Olly自身は実際にサングラスと襟マイクのようなものをつけた画像を持っていて、彼らは襟マイクのワイヤーを保持していて、それが面白いです。それから私は彼らがしたようにOllyをぬいぐるみにし、また私自身をアニメキャラクターにするよう頼みました。まだかなり良好です。
あなたの顔はかなり一貫性を保っています。3つすべてをクリックすると、ほぼ同じ顔です。最後のものは興味深かったです。私はAI for humansのスウェットシャツを着せるよう頼み、OpenAIでやったのと同じように私たちのロゴを提供しました。これはあまり良くありませんが、それでもかなり堅実です。
ただ、このケースではあなたの顔が変化しています。だから、実際にどれだけのレベルまで下がってこれができるのかを考えるのは興味深いです。しかし全体的には、本当に、顔の編集全般において本当に優れています。そして、あなたが指摘したように、これは段階的な変化ですよね。私たちは次の大きな巨大な世代のような巨大なセットアップを見ているわけではありませんが、これはある種OpenAIのNano Banana Proへの答えのようなものです。
私たちは、彼らがこの段階に追いつこうとしているような世界にいます。そうですね、つまり彼らにとっては大きなことです。なぜなら、ここ数週間、Soraやchatgptに行って画像を生成することを考えていませんでしたから。すべてが新しいNano Bananaでした。今、私はChatGPTウィンドウに戻っていて、彼らに毎月手渡している20ドルについて少しだけ良い気分になっています。
私も同様のテストをしました。ChatGPTの中に直接、あなたができるさまざまなことを提案するようなインターフェース全体があって、これらのツールのオンボーディングは本当に興味深く困難だと常に感じています。なぜなら、機能が非常に膨大だからです。ユーザーは選択のパラドックスに陥っていると感じます。どこから始めればいいのか。何をすればいいのか。提案の一つがホリデーカードを作るというものでした。
それで私は犬のWesleyの写真をアップロードして、ええ、ホリデーカードを作ってくださいと言いました。そして、モデルの多くは素晴らしいです。ちなみに、画像を作成する際のレンダリング時間が速くなりました。それは以前の問題点でした。しかし、モデルの多くは、Soraで見られるような舞台裏のプロンプト作業をしているのがわかります。
推論しているんですよね。プロンプトを理解するために推論しているんです。そうです。
ユーザーが何を求めているのか。もしあれば、彼らは私に何を出発材料として提供してくれたのか、そしてどうすれば魔法のような結果を作り出し、プロンプトを本当に強化できるのか。だから
ホリデーカードでは、明らかに提案の中には人間の写真がありましたが、私は犬のDr. Wesley Snipesを提供しました。それはセピア調のホリデーカードで、Wesleyが後ろにツリーがあって祝祭的に見える状態で戻ってきて、ハッピーホリデーのようなものでした。テキストを追加したりして、オーケーという感じでした。
良いモデルと組み合わせて堅実なカードを作るためのプロンプト作業を行ったんです。
それから私は「I think you should leave」のスケッチから中折れ帽と葉巻を取り出しました。運転手のやつで、私はそれが大好きなんですが、それをその物に追加してくださいと言いました。完璧にやってのけました。同様に、私の姪を入れたホリデーカードを作ろうとしたところ、2、3世代経つと、彼女は手に余分な指を生やし始めました。
本当ですか。わあ。
ええ。彼女の目の色が変わり始め、溶け始めたので、彼女の初期の画像を再アップロードして、これに合わせてくださいと言おうとしましたが、何度も失敗しました。だから、繰り返しますが
この結果に隠されています。
そうですね。つまり、私が見つけたことの一つで、これは皆さんへの良いメモですが、画像編集をしたい場合、一般的にこれらすべてにおいて、結果をダウンロードしてから再アップロードする方が良いです。なぜなら、ほとんど新しいスタートのようなものだからです。
だから私があなたの一貫性を少なくともこれら3つを通して保つことができたことに感銘を受けた理由です。それで、これについての他のいくつかの簡単なこと。Fabian Seltzerが本当に良い小さな投稿、非常に簡潔な見解を持っていて、顔のことについて話していました。画像編集は良好です。
彼はこれらの画像に時々少し粒子があることに言及しました。そして、黄色い色合いが元々ChatGPT 1.5の問題だったことは知っています。ズームインすると時々見える少し粒子があります。これについて私が本当にクールだと思った他の大きなことの一つは、彼らが本当に焦点を当てていることです。そしてこれはあなたの推論ポイントKevinに行きます。テキストをより良くすることです。つまり、かなり多くのテキストを生成できるということです。
そして私はこの経験をしました。Jeff Goldblumの履歴書を作りたかったんです。そしてこれについて興味深かったのは、このモデルが出てきた時期があって、私はそれを持っていると思ってこれを試してみようと思ったのですが、考えたとき明らかに、ああすごい、すべてこれらの問題があると思いました。
生成しようとしたときにこれらの問題があり、約1時間後に再度生成したところ、ゼロ問題になりました。ゼロ問題と言うとき、つまりこれはJeff Goldblumの演技の完全な履歴書で、テキストの問題はありません。わかりますか。途中でテキストの問題はありません。
Nano Banana Proにもこれを試してもらいましたが、まあまあの仕事をしましたが、OpenAIバージョンのこれは文字通り、私はATSコンプライアントであることを求めました。履歴書とATSが何を意味するかを知っていれば、これはそこにあるボットによってすべて検索されるこの奇妙な能力のようなものです。純粋な履歴書を作成しました。もう一方はNanobからの履歴書の絵のようなものでした。だから全体的に非常にクールなことです。あなたは今週Quenから新しいものが出てきて興味深いと言いました。そしてこれは将来のイメージングがどのようなものになるかという考えにつながるかもしれません。
新技術と画像生成の未来
そうですね。つまり、Quen、それは彼らがImage Layeredと呼んでいるものです。まだ出ていないと思いますが、ティーザーを出しています。基本的に、任意の平面画像を与えることができ、それは
私たちがしばらく話していたことですが
各要素を抽出してから、その周りの完全なシーンを透明にするという最良の推測を行います。
そしてそれは理にかなっています。なぜなら
Canvaのようなツールでさえ、オブジェクトなどをつかむことができるマジック編集モードを持っています。しかし、これが完全に自動化されていることで、すべてのレイヤーを自動的に生成します。
これは、このような作業の一部はすでにこれらのモデルで舞台裏で行われていますが、それらすべてをワンショットで生成するツールです。
そうすれば、入って、この部分だけを変更したい、またはこれを交換して新しい製品を入れようと言うことができます。そこには本当にパワフルなものがあります。この新しいImage 1.5モデルChatGPTイメージのテキスト機能であなたが言及したように、ラーメン店のメニューを生成するとか、海のすべてのクジラ、統計のあるチャートとしてそれらを見せてくださいみたいな例の一部では、コンテキストを取得してレイアウトをコンテキスト化する能力があるので、すべてがエレガントに行われ、本当に大きな詳細なテキストプロンプトに従います。過去にイメージジェネレーションを試したことがあるなら、今戻って試すべきです。なぜならこれらははるかに
はるかに優れています。つまり、疑いの余地がありません。はるかに優れています。だから、ここで多くの人々が行ったことの一つは、これをNano Banana Proと比較することです。なぜなら、Nano Proは画像でできることの新しいマークに本当に到達したからです。
私が見つけた興味深いことの一つは、最初に見つけたものの一つが、この男Peter Gostevで、実際に古典的なワイングラスのように完全なものと時計の数字のようなものを使いましたが、それから実際に7本の指で指を求め、ChatGPTは意図的に複数の指を持つ手を作成することができ、Gemini Nano Banana Proはできなかったようです。
これについては多くの賛否両論があります。Nano Banana Proが確実により良くやっていることがあると何人かの人々が言っています。Umi Doomiという名前の人からの本当に興味深いRedditスレッドがあります。UI duiまたはUmidi Doomiという名前の人物で、彼らはゲームキャラクターを取って実在の人物に変え、比較しています。
そして、異なるNano Banana ProとChatGPTプロンプトを見ているときに見つけた一つのことは、実際にNano Banana Proのリアリズムの見た目が少し良いと思います。Image 1.5はまだ少しプラスチックのようではないけれど、Nano Proが釘付けにしているほどリアルではないような感じがあります。
私が自分で試したかった一つのことと、Kevinが覚えているかどうかわかりませんが、Image Gen 1がローンチしたときだと思いますが、私は本当に奇妙なプロンプトを持っていました。それは1990年代のスーパーマーケットのCCTVのスクリーングラブでの夜についてで、騎士が2つのロティサリーチキンを盗んだというものでした。そうです。
スーパーマーケットで、そうです。カメラに捕らえられたんです。
元のものには本当に感銘を受けました。本当にクールでした。それで、それをRedditにアップロードしたところ、本当にうまくいきました。この特定の非常に複雑なプロンプトについて興味深かったのは、ChatGPTははるかに優れていたと思いますが、すべての画像ではありませんでした。私は4つやりました。4つすべてをお見せします。
両方の画像モデルで2つのテストをしました。ChatGPTのものでわかります。それらの一つは本当に良いと思います。トースタータートルズのように走っているものがあります。前回のあなたのポイントはCCTVカメラがどこから来るのかというもので、それは必ずしも修正されなかったかもしれません。Nano Banana Proのものは、タイムラインを正しく理解していないように感じられ、そのうちの一つは本当にずれています。ロティサリーチキンが滴り落ちていて、騎士とは異なる照明になっているように見えます。
しかし、私にとって面白かったのは、これら4つすべてについて、元のものの方が良かったと思うことです。だから、これが何になるかによって本当に依存します。つまり、これらが改善ではないという意味ではありませんが、興味深いのは、特定のユースケースのために改善しようとしている場所があるかもしれないということで、これはGPT 5でも見られることです。
2もそうですよね。特定のユースケースを改善するかもしれないが、全体として改善しないかもしれないというこの考えは、興味深い議論のポイントです。さて、これは私の新しいお気に入りのミームを思い出させます。もっとコンピュートが必要だというものです。
そうですね。
それで、何のために。癌を治すつもりですか。テレポーテーションを解決するつもりですか。もっとタンパク質を折りたたむつもりですか。いいえ、いいえ、いいえ。
もっとコンピュートが必要なのは
アニメの美女とロティサリーチキンを盗む騎士のためです。それが私たちが
つまり、聞いてください、私はもっとロティサリーチキンの騎士を人生に使えると確信しています。あなたの指摘通り、Greg Brockman、OpenAIの社長が、特にコンピュートについて尋ねるビデオをリリースしました。そして、彼らに信用を与えるためだけに言いますが、彼らが話していることは、そして私たちは彼らの新しいCodexモデルについて少し掘り下げるつもりですが、彼らはこれの端を押し進めようとしているのです。しかし、まずGregがここで何を言っているのか聞きましょう。
OpenAIは、コンピュートが進歩への道だという論文から出発したわけではありません。私たちが他のすべてを試し、うまくいったのがコンピュート、つまりスケールだったということです。私たちは、そのコンピュートを供給する能力に対するコンピュートの需要で完全に限界に達しています。私たちのローンチカレンダーを見ると、最大のブロッカーがしばしば、オーケー、でもそのコンピュートはどこから来るのか、となります。3月に画像生成のローンチがあり、それがバイラルになったとき、私たちはそれを継続するのに十分なコンピュートを持っていませんでした。
それで私たちは、研究から多くのコンピュートを取り出して、需要に応えようとするために展開に移すという非常に苦痛な決定をいくつか行いました。そこで彼らが基本的に言っていることの感覚が得られます。そして、非常に簡単な言葉で言えば、ねえ、この画像モデルのものを提供するためには、これもAIについて人々を興奮させ、AIで何かをすることに人々を本当に興奮させると思いますが、彼らはこのようなものの端を押し続けることができませんでした。そして、このショーで何度も話したすべてのこれらの会話は、AI バブルやデータセンターに入るすべてのお金やそういったことについてのものですが、それは皆が使用し、これらすべてのことをできるように十分なコンピュートを提供することについてです。
だから、これは前進し続ける興味深い会話だと思います。そして、ここから今週出てきた2つの大きなことがあります。今朝文字通り落とされたばかりのGPT-5.2 Codecと、彼らがFrontier Scienceと呼ぶ新しいベンチマークです。両方とも、OpenAIを研究トラックに戻そうとしていると思います。つまり、Kevin、これについての一般的な見解はどうですか。私は2026年に大量のコンピュートが登場するような気がします。それは起こる大きなことの一つです。
そして、オーケー、もっとコンピュートを手に入れた。それで何という感覚を得るでしょう。
それが出てきて人気があったので、研究から引っ張らなければならなかったというのは魅力的で、ある種大胆な告白だと思いました。なぜなら、基本的には短期的な利益のために、長期的な努力を妨害している可能性があるとも認めているからです。そして確かに
Googleがコンピュートを持っていることは知っています。彼らはたくさん持っていることを知っています。彼らは現在オンラインでモデルを提供している独自のカスタムチップを持っています。だから、彼らはこれらのトレードオフをしなければならないのでしょうか。
そうですね。それは良い質問ですよね。Nano Bananaのローンチ中でさえ、DemisとGoogleの人々の一人が彼らのサーバーが同様に燃えていると言いましたが、その答えは本当にわかりません。私たちはバックグラウンドで何が起こっているか本当にわからないんです。
だから、難しいです。彼らにとってどれだけ難しいか想像できません。それを聞くのは興味深いだけで、そのような決定を秤にかけなければならないのは難しいです。明らかに、彼らのフライホイールグラフィックを見れば、これはおそらく多くの投資家に見せたものですが、基本的にコンピュートが上がり、製品が上がり、収益が上がる、これは素晴らしいという感じでした。だから、みなさんはコンピュートのことで私たちを助けてくれれば、私たちは残りを持っています
そのトレンドが続けば、それは興味深いでしょう。私にとっては
難しいです。なぜなら、画像編集は本当に楽しくてかわいいし、Soraも最初にローンチしたときは大いに楽しみました。今は少し使用頻度が減りましたが、エージェンティックコーディング全体のようなもの。それが私が今本当に興味を持っているものです。それが私の日常生活と生産性に多くの価値を加えるものです。だから、どこでも譲歩をしなければならないことを望んでいませんが、譲歩をするなら、人々のためにここで1つ少ない画像レンダリングかもしれないので、より良いエージェントコード出力をそこに持つことができるという感じです。
それが私が望むトレードオフです。
そして、彼らはそれを理解しようとしていると思います。これはGPT-5.2 Codecに入ります。だから今日、彼らはこの新しいCodexモデルをリリースしたばかりで、これは彼らのコーディングプラットフォームであるCodexの最先端バージョンです。もう一つの簡単なことは、GPTのアプリストアが開発者の提出のために開かれたということです。
だから、その分野で何が起こるか見てみましょう。しかし、ええ、ここでの他の大きなことは、彼らが新しいベンチマークをリリースしたことです。そして、ベンチマークは世界で最もエキサイティングなものではないことは知っていますが、Frontier Scienceベンチマークです。だから、OpenAIは数週間前に起こったコードレッドで、部分的にシフトしようとしているようです。
彼らは再びそのエッジに戻ろうとしています。技術が定期的に改善されている場所の端に戻ろうとしています。そして、あなたの指摘通り、研究面でも大きな影響を与えようとしています。
コンピュートリソースと技術進化の展望
2026年にコンピュートのアンロックが見られると思いますか。確かに。2027年には、これらを動かすために小型の原子炉が今稼働しているかもしれません。これらのベンチマークを見て、GPT-4oか何かから5のようなものまでのバーを見ると、明らかに市場の飛躍があり、今はもう1パーセントまたは1.2のような別のリリースが見られ始めています。今から2026年のこの時期までの間に大きなギャップが見られると思いますか、それとも小さな小さなステップがまだあると思いますか。
さて、ここに問題があります。今、来年初めに出ると言われているGPTモデルについて多くの噂があります。私の直感は、コンピュートがオンラインになり、このコンピュート会話をレベルセットするだけで、皆が理解できるようにすべきだと言っています。コンピュートは、これらのモデル、特に思考モデルで回せるバックエンドパワーの量を意味します。なぜなら、彼らはこのプロセスを経るのに多くの時間がかかり、より多くのコンピュートを持っているほど、それをより良く提供できるからです。来年は本当に
興味深いスペースになると思います。あなたと私は今年の初めにGPT-5が本当の瞬間になるだろうと言い、私たちはそれを正しく言いました。そして、人々が思っていたほど大きくはなかったように、私たちは特異点にホッケースティックを上げませんでした。聞いてください、つまり、再び、Sam Altman、Dario Amodeiと、本当にDemisは、これがどこに向かっているかについて本当に良い感覚を持っている種類の人だと感じます。
彼は決して、これがどんどん良くなり続けるという感覚から後退していません。来年の半ばまでに別の大きな利益が見られなければ、しばらくはこれがすべてかもしれないと心配しなければならないと思います。画像のことで私を驚かせたことを言います。
KevinがGPT、全体的な、Studio Ghibliのことが起こったことを知っていますか。それは3月に起こりました。それは9ヶ月前に起こったんです
それは今のところ2年前のように感じます。だから、時々思い出さなければならないのは、あなたと私が毎週このことをカバーしていて、私たちのショーを聞いて見ている皆がこれが毎週起こっていることを知っていますが、これはすべてまだ非常に速く動いているということです。それは海の変化でした。V3、Soraビデオ、それらはすべて海の変化で、それはすべて過去18ヶ月以内のことです。とにかく、心に留めておくべきことです。そして、また心に留めておくべきことは、Gavin、私たちがこれを見て聞いているすべての人による終わりのない支援の波を得られなければ、来年これをカバーしていないかもしれないということです。それは非常にシンプルです。その通りです。まだ購読していない場合は、今すぐこのチャンネルに行って「いいね」して購読するか、または
このビデオまたはオーディオを他の誰かと共有することで、私たちを助けることができます。
そしてKevin、コメンテーターからずっとこれを聞き続けているので、声に出して言わなければなりません。YouTubeには、ハイプに基づく新しいシステムがあるそうで、これは世界で最も奇妙なことだと思います。
兄弟、私は私たちをハイプしました。80ハイプポイントか100何かのハイプポイントを使いました。それらが何であるかさえ知りませんでしたが、使え、ベイビー。やれと言いました。
そうですね。視聴者の皆さんがハイプポイントが何かを理解し、このビデオをハイプする時が来ました。ハイプは大きな違いを生むそうです。だから、YouTubeにいる場合は、少し調査してください。ChatGPT、Gemini 3に尋ねて、ハイプを理解してからビデオをハイプしてください。私の知る限り、無料のデジポイントを手に入れたので、本当に興奮しています。
それで、かなりハイプアップしました、Gavin。
良い。私はハイプアップしていないので、ハイプアップに時間を費やす必要があるかもしれません。ノーキャップ、友達。ハイプ、ハイプ、ハイプ。ボタンをクリックしてください。また、コメントを残してくれるのも常に嬉しいです。それは私たちを幸せにしてくれます。そこであなたと関わりたいです。
そして、ポッドキャストアプリを使っている場合、5つ星のレビューは確かに損にはなりません。しかし、アルゴは与えもするし奪いもします。だから、私たちが発見される唯一の方法は、実際に関わる時間を取るときです。だから、毎週それを懇願し嘆願する限り、本当に大きな違いがあります。さあ、皆さん、Gemini 3 Flashについて話しましょう。
これはGoogleの一種の応答で、彼らはバレーボールの試合を見ているように感じます。一方または他方からの新しいモデルごとに応答があります。だから、Gemini 3 FlashはFlashバージョンです。つまり、Gemini 3のより速く、より安く、より小さいバージョンです。そしてKevin、私は再びベンチマークに飛び込むのが嫌いですが、これを最初に見たときに私を驚かせたことは、これのいくつかのベンチマーク、特にマルチモーダル推論のものが実際にGemini 3 Proよりも優れているということでした。それは私にとって非常に衝撃的なことでした
少なくとも。そう、これは再び彼らの小さな安いモデルです。開発者で APIに接続したい場合は実際に使用するのが安いです。gemini.google.comに行けば無料で使用できます。デフォルトモデルとして得られるのは非常に速く、Gavinが言ったように、いくつかのケースでは彼らの大きな歌って踊るモデルよりも能力があり、他の多くのケースでは、OpenAIが価格で提供しているものと同等です。
私はとても驚きました。非常に驚きました。そして、私はそれを使い、出力の品質に非常に満足しました。
今、Googleは足を踏み下ろして、このシナリオをビッグボーイしようとしているように感じます。ねえ、私たちは世界最大のテクノロジー企業の一つで、あなたの以前の指摘通り、私たちはこれらすべてのTPUを持っています。私たちは独自のチップを持っています。今、私たちは非常に良く、非常に安い、または場合によっては無料のモデルを作ることができ、この分野で他の多くのプレーヤーを締め出すために何ができるか見ることができます。
Gemini 3 Flashはそのように感じます。開発者にとってあなたのポイントへのいくつかの本当に興味深いことだと思います。これらのプラットフォームで開発している場合。明らかに、より安くより速いのは良いことです。特にかなり近い結果を得ることができれば。また、Nano BananaがYouTubeコミュニティ投稿でNano Banana Proを使用できるようになると見ました。だから、明らかに彼らはこれらのものをGoogleのようなプロパティにも展開しています。
私もまだ使っていませんが、新しいAI実験か何か、先週話したタブのようなものがあります。Gmailの新しいものもあります。これも展開されています。そして、私はずっと言い続けています。Googleのこれをどうやって直接Loganに伝えることができるかわかりません。
しかし、私がGmailに本当に欲しいのは、Gmail クリーンアップツールになる何かです。私はGmailをクリーンアップしてもらいたいだけです。
100%そうです。私たちは12月にLoganをショーに迎えることになっていたことに気づきました。そして、私はフォローアップしませんでした。私たちはフォローアップしませんでした。
まあ、どうするつもりですか。どうするつもりですか。
ああ、それは、つまり、一方では、彼がポッドキャストに来ることに同意し、来たいと思ったという謙虚な自慢です。もう一方の半分では、私たちがフォローするのを忘れたのは本当に私たちにとって悪いことです。
まあ、それはそれでいいです。
Logan、2026年にフォローアップします。2026年にここにいれば、あなたもここにいるでしょう、Logan。また、Playable Builders、全然それをいじりましたか。
そうですね、私はこれをいじりませんでしたが、出てくるのを見ました。だから、Playable BuildersはYouTubeの新しいコミュニティで構築されています。YouTubeコミュニティの人々が、Gemini 3 Proをローンチしたときにこれらが物になると約束した小さなバイブコードゲームを構築しています。しかし、あなたはこれに時間を費やしました。それは非常にクールです。
私は快く驚きました。ゲーム、AI、怒り、悪い、すべて悪いについてより深く掘り下げるつもりです。私はゲームの品質に快く驚きました。
私の携帯電話でのパフォーマンスは驚異的でした。ゲームのようないくつかのゲームは、7〜8分間私の注意を引きました。これは実際にはゲームを考慮すると多いです。
それはバイブコードゲームで、すぐにロードされます。あなたは穴で、異なる都市レベルがあり、オブジェクトが落ちると穴が大きくなります。
それは新しい概念ではありません。ドーナツカウンティ、ドーナツカウンティです。穴としてプレイするゲームです。ここで異なるのは、マップを動き回る他のプレイヤーがいることです。だから、大きくなればなるほど、地面の他の穴に対する脅威が大きくなります。Agarのような側面の少しです。
見てください、それは本当にシンプルでしたが、グラフィックスは良かったです。本当にうまく機能しました。即座にダウンロードされました。他のゲームをいくつかプレイしました。ルービックキューブのようなテトリスゲームがありました。別のエンドレスランナーのようなものがありました。奇妙な、その迷路ランナーゲームがファッションゲームに出会ったようなものがあり、アバターの外観を変更する異なるゲートを通過して外見を完成させなければなりません。
ポイントは、Geminiを使ってバイブコードされたということです。これはYouTubeゲーミングがあろうとなかろうと、彼らはこれに大きく押し込むつもりです。新しいAIゲーミングのグラウンドシフィケーションについて話してきたように、これは物になるでしょう。モデルがより能力を持つようになるにつれて、ゲームがよりフラッシュアウトされるこれらのもののSteamのような市場があるでしょう。
そして、あなたは知っています
次のFlappy Birds、もちろん、それはすでに存在します。次のPlayer Unknowns Battlegroundsのようなものはバイブコードされ、おそらく1年以内だと思います。
そうですね。そして、これについてとてもクールなのは、YouTubeが特定のクリエイターと提携してこれらのものを作っているようなものです。だから、彼らは人々のアイデアを前進させようとしています。
それはとてもクールな一般的なアイデアだと思います。ちなみに、Player Unknowns Battlegroundsのようなものでさえ、もっと興味があるのは、ほとんどのようなものならば、Bolatroのようなタイプのゲームが一人でどのように見えるかということです。Bolatroについてとてもクールなことの一つは、1つまたは2つのアイデアがあり、それから非常にうまく肉付けされているようなものだからです。それはバイブコードされることが非常に明確に見える種類のものです。
それはBattlegroundsも起こり得ないという意味ではありません。しかし、Kevin、これは私たちを
非常に大きな会話に移行させるはずです。今、ゲーマーコミュニティの間で起こっています。そして、私は何かを考えています
会話
まあ、それは話すことがたくさんあると言いましょう。これは今週にわたってクロスする大きな大きな物語で、Larian Games、過去5年間の私のお気に入りのゲームの一つの最後のお気に入りのゲームの一つの作り手、Baldur’s Gate 3と彼らは、彼らのゲームプロセスで生成AIを使用したことで引用符でコールアウトされているようなものです。そして、私はみんなに理解してもらいたいのは、ここでヘッドラインを見たかもしれないし、ゲーマーまたはそれを理解している人でない場合、これは多くのクリエイティブ産業で起こっているトップラインの会話のようなものですが、ゲーマーは私たち両方が知っているように非常にうるさいです。
彼らは何かを取ってそれを実行するでしょう。そして、ゲーミングワールドの多くは非常にアンチAIです。だから、この物語が正確に何であるかを説明する必要があります。物語は基本的に、Larianがインタビューをしたというもので、Larianのスタジオヘッドが出てきて、私たちは生成AIを使ってアイデアを概念化し、非常に初期段階でプロセスをより速く機能させますが、私たちは人間第一のスタジオですすべて人間のライティングすべて人間の俳優私たちのために働く多くの人々がいますそしてKevinこれは爆発しましたなぜならKotakuや他の場所のようなものを横切るヘッドラインがLarian StudiosがジェネレーティブAIを使用するというものだったからですそして私はただ知りたいのですがこれらのものを見ましたか。しかし、それから、私がこの会話で得ようとしていることは、非常に一方的な人々とこれらの会話をどのように行うか、ということです。彼らの脳の中にこの考えを築き上げた人々、彼らがAIは彼らが何も関わりたくないこのものだと非常に明確に信じている
まだ彼らはそれがすでにそこにあり、すでに使われていることを理解していません。
ゲーム業界におけるAI論争
そうですね。つまり、それは試みるのが良い会話であり、私は確かに何度か試みましたが、最終的には、それは人々が持つ必要がある会話ではありません。それは自然に解決されるでしょう。100%農場から食卓へのピクセルでない限り、すべて人間によって手描きされていなければならないと言い続ける人々の一団がいるでしょう。そしてそれは良いことです。そのために存在する製品があるでしょう。私たちはこれを言ってきました。そのような映画があるでしょう。そのような音楽が存在するでしょう。それらのものが出てきてリリースされるのにはおそらくもっと時間がかかるでしょうし、それらをリミックスしたり何かする点では柔軟性がはるかに少ないでしょう。
しかし、それは良いことです。AIはすべてに忍び込んでいます。それはすでに、認めたいかどうかに関わらず、伝統的なアーティストが使用している多くのツールに入っています。ジェネレーティブフィルは、人々が使用するものですが、まあ、それはAIではありません。私はただ画像の欠けている部分を埋めているだけですいいえ、それは完全にAIです。
人々が前景から背景から画像を分離するために使用する自動ロトスコピングツールでさえ
それはAIツールです。だから、ええ、一部のAIがオーケーで、すべてのAIが悪いか、または中間にいようとするとき、またはグレーに入ろうとするとき、おそらく負けるでしょう。なぜなら、ここから真のAIと何がそうでないかを抽出するのは本当に難しいからです。
だから、私は言います
ここを見てください、あなたはアーティストを雇う伝統的なゲームを作る誰かがいます。基本的にこれは私たちがアイデアをより速く得るのを助けていると言っています。そして伝統的なアーティストは彼らがすることをします。私はそれでさえ少しヘッジだと思います。それでも伝統的なアーティストは彼らのビジョンを立ち上げて実行するためにAIを使用するつもりだと思います。
それから彼らはおそらくそのアートスタイルで何らかのモデルをトレーニングし、AIを使用してそれで実際のアセットを生成するでしょう。そして彼らはそれらのアセットをクリーンアップするために彼らのアートとAIと能力を使用するでしょう。今のところ。中間のビットでさえヘッジのようなものだと思います。
そうですね。つまり、明確にしたいのは、この男Sven VinkyはLarianのCEOです。私は彼のこれに対する反応を素早く読みたいと思います。彼は、神聖な人たち、私たちはコンセプトアーティストをAIに置き換えることを強く推し進めていませんと言いました。私たちには72人のアーティストのチームがいて、そのうち23人はコンセプトアーティストで、さらに雇用しています。彼らが作るアートはオリジナルで、彼らがすることを非常に誇りに思っています。私はコンセプトアートと私たちのGenAIの使用について明示的に尋ねられました。
私たちはそれを物事を探求するために使用すると答えました。そして、私たちがそれを使用してコンセプトアートを開発するとは言いませんでした。だから、彼は後で、私たちはGoogleやアートブックを使用するのと同じように、参考資料を探求するためにAIツールを使用すると言っています。非常に初期のアイデア出しの段階で。私たちはそれを大まかなアウトライン構成に使用し、オリジナルのコンセプトアートに置き換えます。だから、ヘッドラインが離陸して何かをする重要なことだと思います。
これで私を笑わせたもう一つのこと、Kevin、これはこれらのコミュニティの一部の人々にとって本当に興味深い目覚めの呼びかけかもしれないと思うのは、ビデオゲームアワードからのゲームオブザイヤーを文字通り勝ち取ったゲーム、Astro Bot 33、フランスの開発者からの素晴らしいゲームで、彼らが1000万ドルで作ったもので、AAAゲームのように見えます。彼らもプロセスの一部でGen AIを使用したことを認めています。
そして、これはこのようなものでした。これらすべてのゲーマーが出て来て、信じられない。信じられないという感じでした。この怒りのアイデアで少し立ち止まって、これらのものが何であるかを探求し、ねえ、Astro Bot 33のようなゲームをもっと見ることができる世界があるかもしれないと考えてみてください。この可能性のために、それはそれらのゲームが起こるのを止めるつもりはなく、ええ、悪い行為者がいつもものをしたい人がいるでしょうが、先週のあなたのポイントで、Steamで使っていた小さなアート作品のためにレビュー爆撃される人々について話しました
私たちはただ目を覚まし、この会話を本当の方法で持つために成長する必要があると思います。
ネバーエアーズの人々は小さな赤ちゃんだと言っているのですか、Gavin。それがあなたが言っていることですか。彼らは大きな男の子大きな女の子を着る必要があると。ほんの少しだけ。いいえ、それが終わりのすべてではないという意味ではありません。なぜなら、あなたが言ったように、オーガニックAIは物になるからです。しかし、これは変化する世界です。同じように、Photoshopのアンチフォトショップの人々のようなものに戻ります。最終的にそれらの人々は成長したか、彼らはビジネスから成長したんです。それは非常にトリッキーなことです。
そして、今エンターテインメントでもこれが起こっていると思います。AIは悪い、FAI、これらすべてのようなものの周りに多くの会話があります。人間の創造性と人間の役割が今後非常に多くの部分であるプロセスがあります。とにかく、これは私が本当に指摘したことの一つで、今起こっているアンチAI感情の高い上昇があります。
これはいくつかの方法で少しウォンキーワルラスっぽくなるでしょう。しかし、Bernie Sandersは、数週間前に話したように、おそらくショーで、データセンターにモラトリアムをかけたいと出てきました。彼はYouTubeでこれについて話すビデオをリリースしました。そして、これはねえ、私たちは速すぎるという会話です。
そして、これはJoseph Gordon Levoが話していることについての少しで、これをやっています。
私たちはアンチAIの会話が急速に上昇しているこの世界にいます。そして、人々は政治的な方法でこれを使い始めるだろうと信じています。そして、私は視聴者の皆さんに、私たちは聖歌隊に話していることを意味します。
これを聞いたり見たりしている皆さんは、おそらくねえ、これは多面的な会話で、一方通行ではないということについて非常に明確ですが、一度一つの道に固執し、一方向だけを考え始めると、世界は非常に速く非常に奇妙になるでしょう。なぜなら、私はあなたの顔の前にあると思うものを見ることから盲目になるからです。
さて、データセンターのモラトリアムについてどう思いますか、Gavin。それは物だと思いますか。それは雪玉のチャンスがあると思いますか。現在、高級AIチップを生産する方法を理解したようです。だから、初めて、彼らは中国内でそのようなチップを作ることができます。Nvidiaのようなチップに似た種類のチップを作ることができます。彼らは以前Nvidiaから購入しなければなりませんでした。だから、この会話すべて、仕事が続くことを望んでいますか。はい、もちろんです。クリエイティブが続くことを望んでいますか。はい、もちろんです。
しかし、データセンターのモラトリアムは進歩を止めます。私たちは文化とコミュニティとして、そして本当に国と世界として決定しなければならないというこの全体的な考えのようなものです。物事が前進するにつれて止めようとするつもりですか、それとも物事が動くことを認識し、できる限り最高のバージョンになるつもりですか。
そうですね。見てください、中国の物語についても明確にします。彼らは高級チップを作るために必要な紫外線を生成できる機械を持っているように見えます。それはまだ大部分大きなブレークスルーです。なぜなら、私たちは彼らにチップを与えることを拒否しているからです。そして、それはここにあります。だから、彼らはそこまで来ています。彼らはまだチップを生産していませんが、おそらく時間の問題です。
実際、このポッドキャストを公開するまでに、彼らはおそらくチップを持っているでしょう。だから、あなたのポイントで、オーケー、もし、このマラソンの最終結果が、私たちは現在スプリントしていますが、それはマラソンになるつもりです。最終結果が、芸術、科学、数学などについて私たちが知っているすべてを根本的に変えることができる技術である場合。
そこに到達するために競争すべきですか、それとも他の誰かに最初にそこに到着させて
そして
そして会話を支配させるか、彼らが権利を持っているのでゲームを作ることができないか、彼らがそのイメージを作ることはできないと言うことができないか、それは物です
ちなみに、Googleのアンチグラビティコーディングシステムは、Nano Bananaをネイティブに使用できるので、小さなゲームをバイブコードしたい場合は、そこに入って、小さなゲームを作りたい、ウェブページゲームにしたいと言うことができます。それから、グラフィックスに欲しいスタイルはこれですと言うことができます。
十分なクレジットがあれば、適切な解像度、適切なサイズ、適切なすべてであなたのためにグラフィックスを生成しに行きます。それは機能します。私は先週それを完全に使って迅速なプロジェクトを叩き出し、そのためのアセットを生成するのに驚異的な仕事をしました。
だから、繰り返しますが、個人のクリエイターにとって、そうです、BolatroまたはBellatroになるかどうかわかりませんが、誰かがBellatroとVampire Survivorsを混ぜるかもしれません。私はただ、伝統的にその会話に招待されなかった人々ができるようになったときに作られるつもりの奇妙なゲームに興奮しています。
そうですね。私は、それが全体的に最大の
ことだと思います。会話を開き、人々が使用するためのはるかに多くのツールを理解しようとするだけです。Metaを叫びたいです。なぜなら、彼らは一瞬Llamaが非常に非常にエキサイティングで興味深く、それから車輪が外れたように見え、それから彼らは雇用スプリーに行きましたが、本当に配当を支払っていませんが、彼らは何かをセグメント化するSAMファミリーのモデルを持っていて、彼らはSAM Audioをリリースしました。重みも出ていると思います。それはオープンソースだと思います。
そうだと思います
任意のソースからオーディオを抽出して変更するために基本的なテキストプロンプトを使用できます。たとえば、バックグラウンドでトラックを横切る列車がある騒がしいストリートインタビューがある場合。彼らの例の一つは、バックグラウンドでトラックを横切る列車があります。女性がカメラに向かって話しています。それから爆音を鳴らす音楽がある車が通り過ぎるようなものがあります。
そして、彼らは文字通り、ねえ、スピーカーの声をセグメント化してくださいと言っています。そしてそれを分離します。風は聞こえません。列車は聞こえません。車は聞こえません。オーケー、列車だけを取得しましょう。それを分離します。そして、メディアを作る人々にとってパワフルなことのようなものです。
ポッドキャストオーディオを編集しようとしたことがあり、それが時々どれほど難しいかを知っていれば、騒がしい環境でシュートをしたことがあれば、ライセンスされているので何かのバックグラウンドの音楽を変更したいです。しかし、拡張現実の未来について考え始めると、Gavin、私たちはバイオニック機能を持つつもりで、今私が話している人を聞かせてくださいと言うことができるだけでなく、ああ、バックグラウンドのあの歌は何ですか。それを増幅してください。
それを聞かせてください。ねえ、バックグラウンドの歌を録音するだけです。または何でも。後でShazamします。それは
彼らが持っているクリップを少し再生したいですか。なぜなら、実際にそれがどのようにあるビデオを別のビデオよりも強調するかを見るのは興味深いからです。
その日を信じられないでしょう。真剣に、とんでもない。すべて話すのが待ちきれません
だから、超騒がしい。車からサブウーファーが聞こえます。風があります。列車があります。それからスピーチだけに行きましょう。
オーケー、スピーチを分離しましょう。
ねえ、ちょっと待って。聞こえますか。超うるさい。何を知っていますか。実際にはどうですか。実際には、それをカットしましょう。
本当にうるさいです。一般的なサウンドに行きましょう。これはトラフィックのすべてのようなものです。聞くのに最もエキサイティングなことではありませんが、人が話しているのは聞こえません。そうですね。だから、基本的には、一つの録音に基づいてサウンドスケープにレイヤーごとに入ることができます。ビデオ録画をしたことがある場合は、信じられないようなことであり、持つべき信じられないツールです。
そして、私たちはこれについて話しました。つまり、永遠に前に、私たちはサウンドエンハンスメントのアイデアについて非常に興奮しました。これはおそらくビデオを撮影している誰かにとってこの方法でMetaから出てきたのを見た最も有用なことです。それはとてもクールなことです。だから、ええ、SAMモデルに叫びます。非常に素晴らしいこと。Kevin、あなたが私に見せたこの面白いものに移りたいです。それはロボットとしての脚のペアのようなものです。ショーで結構ロボットについて話しますが、歩く脚のペアがあります。なぜなら、本当に脚だけが必要な場合、頭や体が必要でしょうか。なぜでしょうか。Tron 2ロボットが何であるか教えてください。
そうですね、だから彼らは、つまり彼らはレゴロボットのようにそれを呼んでいます。本質的に、それはモジュラーシステムです。頭、胴体、腕、脚のようなものがありますが、それらはすべて必要に応じてボルトで固定して交換できます。だから、想像できるように、ただこれが私たちのロボットです。
これは私たちのフォームファクターですではなく、まあ、この特定のイテレーションでは、車輪が必要です、または3つまたは4つの腕が欲しいです、または何でも、欲しいバージョンのロボットを一緒にボルトで固定できます。胴体と腕と頭なしでロボットの脚を見ると、私にとって寒気を感じます。なぜなら、ああそうだ、未来のスカイネット戦争で私たちが持つつもりです、ロボットの半分を爆破すると、それはまだ脚だけであなたの後を行進してくるつもりです。209はただ脚だけで、それはあなたを忘却にサッカーキックするつもりです。
そして、それらの脚が、あなたが知っている、特定の方法でそれらをスタイライズできるようなものだと想像してください。それは非常に怖くなる可能性があります。ボスの脚のように見える可能性があります、またはいくつかの理由でオオカミの脚のようなものである可能性があります。一連のオオカミの脚が出てくることを想像してください。
シンブレード
膝に出てくる小さな小刀のような小さなカタナ。シンク。
それはうまく終わらないつもりです。
わかりません。さあ、みなさん。今週AIで何をするかを見るつもりです。それはAIの時間です。あなたがそこでしたことを見てください。
時々、気にせずに散歩しています。それから突然立ち止まって叫びます。
Appleは、単一の画像を取ってガウシアンスプラットを作ることができる新しいモデルをリリースしました。以前にこれらのスプラットについて話しましたが、それは本質的に
かなり高い忠実度で周りを見回したり世界をナビゲートしたりできる3Dの小さなピクセルの束のようなものです。そして、スプラットは、何かの小さな小さな断片のような小さなものである可能性があります、または高解像度の画像をつかんでドローンを飛ばしたような場合、都市全体のスプラットである可能性があります。だから、それは深さを抽出しています。
それは画像からデータを取得し、テクスチャのように深さをラップしています。だから、Appleは画像からこれらのスプラットを非常に迅速に処理するモデルをリリースしました。だから、人々はそのツールを取ってApple Vision Proのようなものに入れています。非常にクールです。そして、誰かがハイキング写真のようなもののこれのバージョンを持っています。
私は誰かが新生児の写真を持っていて、彼らはそれをスプラットに変えたのを見ました。そして、彼らが自分の新生児にズームインできるブラックミラーシーンのように感じます。そして、新生児は毛布のベッドのようなもので休んでいて、その周りに葉っぱがあります
あなたはブラックミラーと言います。私はこれがあなたの家族を見る魅力的な素敵な方法だと言います、Kevin。それは全然怖くありません。
それは素敵なことです。あなたが別の惑星にいて、あなたの妻がこれらのものをあなたに送ることができることを想像してください。それは素晴らしいでしょう。オーケー、それは公平です。それは別の見解です。私はそれが不気味で奇妙だと思います。そして、単一の画像を取ることができるツールがあることも想像できます、Gavin、そしてビデオでそれを生き生きとさせ、そのビデオにオーディオを追加するツールがあります。
実際、いくつかはワンショットでそれをします。この未来を想像するのは難しくありません。ああ、私たちは古い思い出を取るつもりです。戦争から戻ってきたおじいちゃんのこの白黒の台無しになった写真で、それを機械に入れるつもりです。それはそれをカラー化し、クリーンアップし、3Dスプラットにし、それからそれをモーションビデオにするつもりです。
そして、それを持ったら、インタラクティブにするかもしれません。そして今、私たちは単一の写真を取り、写真からの人々と歩き回ってチャットしています。それは
そうですね。つまり、ロールモデルのことです。世界モデルについてショーで以前に話しましたが、世界をシミュレートし始めることができるようになると、ガウシアンスプラットはあなたをそこに連れて行き始め、それから実際にこの本当に興味深いワークフローがCheddy ArtからQwen 2.1を使ってHomer Simpsonでマトリックスの動きを再現しました。だから、それについて興味深いのは、3D環境を行うように見えるものについて考えると、あなたが望むものに基づいてそれらの環境をスキンすることもできるので、本当に興味深い方法でその環境を変更できるということです。だから、これはおそらく超遠い未来とは言いませんが、2〜5年のようなもので、これらの種類の3D環境があり、その中を歩き回って、すべての外観を変更できます。
Homerクリップは、あなたがそこでただカジュアルに言及したように。それは驚異的です。
そうですね、それは素晴らしいですよね。本当にクールです。
屋上で象徴的なピンクドーナツをかわす3D Homerですが、非常にSpringfieldらしいバックグラウンドです。それは本当に良いものです。そして、それはまたMiss PiggyとMelaniaのトレーラーを思い出させます
これはCharlie B. Curranからのもので、Melaniaのトレーラーを再現しました。Melania Trumpについてのドキュメンタリーがありますが、すべてのショットにMissキャラクターを入れました。そして、これを見ていない場合は、AIビデオを使用した編集の本当に良い例として、チェックアウトする価値があります。それは素晴らしいと思いました。
そうですね、ミームへのスピードは信じられません。この最後のものはまだ見ていません。初めて今クリックしています。
オーケー、それで私はこれが何であるかを説明したいです。だから、私は以前にSoraのリミックス機能について話しました。そして、それについて本当に興味深いと思うもの、そしてSoraについて十分な人が知っているとは思いませんが、はい、ビデオを作ることができますが、ビデオをリミックスすることは、本当にSoraでのみ起こり、アプリでさらにそうであるような物の一つです。
そして、人々が互いに構築できる方法を見ます。だから、Kevin、これをクリックすると、それが何であったか、そしてちなみに、オーディオは名前についてばかげた幼稚なジョークのようなものを作っていますが、それは80年代からソープオペラに現れる女性で、彼女は歩いて入ります。彼女は一種の女優です。しかし、右にスワイプすると、人々が互いのSoraビデオから成長する方法について私が非常に魅力的だと思うのは、彼らが何かを変更し、次の人が別のものを変更し、次の人が別のものを変更するということです。
そして、私はそれが大好きです。私はこの女性がかなり普通に見えるソープの練習から信じられないほどの量の髪、異なる方法で成長した信じられないほどの量の髪を持つようになったのが大好きです。そして、最終的に私は彼女が完全に髪でできたバージョンを作成しました。そして、私にとって、これは奇妙な種類のものです、あなたは知っています、私たちは3Dモデルと3Dワールドモデルについて話します。
これはAIが創造性を変えている方法です。なぜなら、以前は、はい、他の人のもののリミックスのようなものをすることができました。しかし、誰か他の人のものから飛び降りて、それを共有し、その周りに共有された言語のようなものを持つ方法があるまで、これは新しいメディアのように感じます。
そして、これは私が指摘したいだけのものです。Soraはそれが変化しているように感じる理由です。そして、私はこれがSoraだけではありません。人々はAIビデオを使用しますが、Soraがすることはそれをすべて一箇所に置き、それを行うことができるようにすることです。だから、とにかく、これがAIビデオが何であるか、そしてそれを映画を再現するか何か他のものを再現するのとは異なるものにするものを見る非常にクールな方法だと思いました。
超楽しい。それは素晴らしい。
さあ、みなさん、来週またはいつでもお会いしましょう。おそらくホリデーに一週間休みを取るつもりで、すぐにまたお会いしましょう。さようなら、みなさん。
さようなら、友達。


コメント