Google AI Studioが大型アップデートを実施、私たち全員がバイブコーダーになった今

Google・DeepMind・Alphabet
この記事は約33分で読めます。

GoogleがAI Studioプラットフォームに大規模なアップデートを実施し、エージェントランタイムとFirebaseネイティブサポートを追加した。マルチプレイヤー体験、データベース、認証機能、Next.js対応などが含まれ、バイブコーディングのワークフローを大幅に向上させる内容である。一方でOpenAIは、Anthropicとの激しい企業顧客獲得競争の中でサイドプロジェクトを廃止し、ビジネスとコーディングに集中する方針を発表した。企業顧客の新規獲得率ではAnthropicが73%とOpenAIの26%を大きく引き離している。

Google AI Studio Got a Big Upgrade and We're All Vibecoders Now
Google AI Studio just got databases, multiplayer, and persistent sessions. Vibecoding just grew up. We break down what i...

Google AI Studioの大型アップデート発表

大きなAIニュースです。Googleが彼らのAI Studioプラットフォームに統合する一連のツールをリリースしました。新しいエージェントランタイムとネイティブFirebaseサポートによって、皆さんのバイブコーディングワークフローをレベルアップさせる内容となっています。

そうなんです。データベース、認証、マルチプレイヤーゲーム、永続的なセッション、バイブコーディングで作ったかわいい作品たち、全部について話していきます。本当に成長が早いですね。これが実際に何を意味するのか、そしてCloud CodeやCodexから乗り換えることになるのかどうか、詳しく見ていきましょう。

ケビン、彼らは私たちのバイブコーディングワークフローをレベルアップさせたいみたいだね。うわ、やだな。それに加えて、今日知っておくべき他の5つの大きなストーリーを5分でお届けします。

それから、私たちが貴重な時間をかけて作ったオープンソースプロジェクトをリリースします。何万ものトークンを使いました。絶対的な名作ゲームに何でも好きなものを追加できます。生成AIのDoomについて話しているんです。

何でもって、ケビン?ああ、もう入れちゃったよ、ギャビン。彼はその中にいるよ。ウープ、ウープ。これはAI for Humansです、皆さん。

それってジャガロのやつだよね。ウープ、ウープはジャガロなんだ。ああ、そうなんだ。よく知ってるね。狂ったピエロも入れられるんだ。おお、これはAI for Humansです、皆さん。

番組の紹介とGoogle AI Studioの詳細

ようこそ皆さん、AI for Humansへ。AI世界とAIニュースへの週2回のガイドです。先週コメント欄で学んだんですが、bi-weeklyは週2回という意味ではなく、月2回という意味なんですね。というわけで、私たちはここにいます。

ケビン、今日はGoogleから大きなニュースがあります。彼らはAI Studioプラットフォームをアップデートしました。これは、Googleが少し静観していたような状況の一つだと思います。11月にGemini 3がリリースされた時のことを覚えていますか。私たちは皆、Googleが勝った、彼らがやっているって感じでしたよね。それ以来、Claude CodeとClaude Opus 4.6を見てきました。GPT 5.4が台頭してきました。

これは、私たちが今やバイブコーディング戦争と呼びたくなるものへのGoogleの参入点なんです。このスイートについて、最初の感想はどうですか?

ええと、人々が想像を形にするのを助ける新しいツールには、いつもワクワクします。完全に。彼らがこれをやっているのが好きです。

ただ、DJ Khaledみたいに「もう一つ」って感じかなとも思いました。Anti-gravityっていうのがあったばかりじゃなかったですか。あれは従来のIDE、開発者インターフェースへの挑戦みたいなものでしたけど。それから、ミニゲームやスニペットを実行して共有できるウェブ版もありましたよね。

だから、彼らが求めているものを見つけられることを願っています。彼らが生み出すものは本当に好きですから。でも、Google AI Studioとは何なのか、なぜワクワクしているのか、このバイブコーディングの分野への混乱した参入者かもしれないけれど、一歩下がって話しましょう。

AI Studioの機能とアップデート内容

そうですね。AI Studioは、Googleのエコシステム内で作成できるツールのスイートみたいなものです。つまり、コーディングプロジェクトを作成したり、他のこともたくさんできるんですが、今日のアップデートは本当にバイブコーディングのゲームを上げることに関するものです。

ケビン、バイブコーディング全般について、すぐに新しい用語が必要になる世界があると思います。だって、今は誰もがバイブコーディングしているような感じですから。それについては後で話しましょう。でもまず第一に、このアップデートで実際に得られるものの詳細を説明します。

新しいマルチプレイヤー体験があります。これは本当にクールなアイデアで、あなたと他の人が同じプロジェクトで一緒に作業できるだけでなく、その中でマルチプレイヤーゲームやアプリを作成できるというものです。本当にクールなことです。

これに焦点を当てるのはとても賢いです。ほとんどのものは友達と一緒の方が良いですよね。あなたも同意すると思います。一緒にプロジェクトを構築できるという事実だけでなく、それはまともなリポジトリの中心ですよね。マルチプレイヤーゲームを箱から出してすぐに簡単に作れるという概念は、人々がバイラリティを作り出すのをずっと速くします。そうです。

そうですね。あなたのアイデアを存在させて、最適な技術スタックが何かについてCloud CodeやCodexと戦わなくていいんです。他の人のための共有体験が欲しいと言えば、何を構築すべきか分かってくれます。

その通りです。彼らが追加しているもう一つの大きなアップデートは、データベースと認証です。Cloud CodeやCodexを使っている人なら、もう知っているかもしれないと言うかもしれませんね。でもこれはAI Studioにとっては大きなことです。統合されているので、このプロジェクトにデータベースが必要かどうかを教えてくれて、特にFirebase、これはGoogleのデータベースソフトウェアプログラムですが、それをセットアップするのを手伝ってくれます。

私たちは二人とも、使っているさまざまなプロジェクトでSupabaseをたくさん使っていると思います。Supabaseは数年前に登場した別の会社で、ツールを開発している人々の世界ではとても大きな存在です。それでも一般的にはとてもクールなことです。これの何が大きいかというと、データベースを理解していることではありません。

大きいのは、あなたがデータベースを理解する必要がないということです。それが約束なんです。何かのアイデアがあって、Claude Codeや他の名前のCodexが「どんな種類のデータベースが欲しいですか?」と聞いてきて、それであなたの目がうつろになって、頭が後ろに転がって、口の横から泡が垂れ始めるとしても、あなただけじゃありません。

そうですね。ここではそれをあなたのために提案し、セットアップし、認証情報を手伝ってくれます。そして、実際のライブサービスに接続する準備ができたら、理論的にはあなたの手を引いて、そこに連れて行ってくれます。テストはしていませんが、それが約束です。

それについて話したいことがあります。それが次の大きなステップだからです。Googleのエコシステムにいるというアイデアです。Googleのエコシステムは広大で非常に大きいんです。ClaudeやOpenAIよりもずっと大きい。これらは新しいサービスです。Googleはたくさんのものを持っています。ここでのアイデアは、GoogleにはAPIがあるということです。Nano Bananaにも独自のAPIがあります。

一緒に機能できるこれらすべてのものは大きなことです。それらすべてを一か所にまとめられれば、それは大きなことです。いくつか他の簡単なことを、私がこれで遊ぶ時間を少し得たことについてもっと話す前に。中断したところから続けられるんです。これはデバイスのことで、つまり、これにさまざまな場所から承認してアクセスできるということです。

今週Cloudで起こったことの一つは、彼らがDispatchを統合したことです。これは携帯電話からCloud CodeとCloud Co-workと統合できるというものです。これはそれを非常に簡単にします。ああ、それから最後に、Next.jsでの構築が強調されていることがあります。

これは私にとって、Googleにとっての本当のキャッチアップの瞬間のように感じます。Next.jsが何か知らない人のために説明すると、これは現代のウェブの多くのフレームワークのようなものです。もともとVercelが作ったと思いますが、数週間前に少し話しましたね。現代のウェブの多くはNext.jsとそのソフトウェア上に構築されていて、これはそれにアクセスして構築できるようにするものです。

バイブコーディングの未来とマルチプレイヤー機能

そうですね、つまり、アップグレードの完全なスイートです。私はそれで遊ぶのをとても楽しみにしています。最近のGoogleの多くの製品について私が抱いている懸念は、実際のロードマップは何なのかということです。これの寿命は?彼らはこれを完全にサポートするつもりなのか?これが離陸して、彼らのバイブコーディングオープンのようなものになるのを待っているのか?彼らの意図が分かりません。

私はそれで遊ぶのが楽しみですし、あなたと私が試してバイブできるマルチプレイヤーの何かを思いつくのが楽しみです。そうすれば、視聴者と共有して、彼らに入って遊んでもらえるかもしれません。マルチプレイヤーのコンポーネントが、私を最もワクワクさせるものです。

そうですね、それについてもう少し話しましょう。バイブコーディングとは何か、バイブコーダーであるとはどういうことかを考えるとき、本当に興味深いことだと思います。バイブコーダーから離れるべきかどうかという会話もできますね。そうすべきだと思います。

そう、そうすべきです。私たちも独自のバージョンを考え出せると思います。視聴者の皆さんの中で違う名前についてアイデアがあれば、コメントで教えてください。

私がずっと考えているのは、今や誰もが開発者だということです。開発者がこの種の魔法のような人々で、数学を通じて成長し、科学を通じて成長し、コードの書き方を理解していたという時代ではなくなりました。今や誰もが開発者です。

つまり、ここでのアイデアは、あなたがそこにアイデアを持っているなら、それを魔法のように存在させるツールがあるということです。今、他の人よりも上手な人がいるでしょう。これをどう計画してプログラムするかを理解するのが上手な人がいるでしょう。でも、これはその世界への次のステップのように感じます。

その世界はワクワクします。興味深いです。クリエイターとは何かというアイデアが、単なるYouTuberやTikTokerから製品を作る人へと移行していきます。ケビン、その世界がどんな風になるか、あなたの考えを聞きたいです。その世界はどんな風だと思いますか?つまり、Captain Emmyの時代に遡って、とても若い頃から物をいじっていたあなたのような人にとって、ある意味でワクワクするに違いありません。でも、これが世界全体でどう受け入れられると思いますか?

開発者の役割とAIツールの進化

どんどん良くなっていきます。能力も成長していきますしね。つまり、そうなんですよ。あなたが今言ったことすべてを聞きながら考えたんですが、誰もがクリエイターで、誰でもコーディングできるようになったということ。ただし注意点があって、一部のアプリ、一部の体験、一部のあれこれ、みたいな感じです。開発者には大きなアドバンテージがあると思います。

彼らは一行一行コードを書いていないかもしれませんが、それを監査して、それが何を意味するかを知ることができます。これらのものを書き、展開し、スケーリングし、安全にするためのベストプラクティスを知っています。だから、いわゆる従来の開発者にとって、まだまだたくさんのギャップが残っていると思います。

とはいえ、どんどん良くなっているのは確かです。だから、これらのマシンにより複雑なことをささやくことができて、その反対側から製品が出てくるという概念。それは素晴らしいと思います。同様に、私もある意味であなたと一緒に最前線にいて、他の意味では完全に傍観者としてこれが起こるのを見ている感じです。

新しいアイデアが頭に浮かんだとき、残念ながら私はこうも思ってしまうんです。まあ、72時間でそれを作り出せるなら、他の誰かも同じことができるよね。でも、難しさや実際の実行、それがアイデアを特別にしていたのかどうか?

いや、いや、それはアイデアだったんです。やるべきだったんです。そして、私は常に葛藤しています。あなたが何か言いたそうな気がしますが。

AIツールがもたらす新しい課題

いや、私が言おうとしていたのは、これらのツールの周りに新しい麻痺のようなものが存在していて、みんながそれを乗り越えることが本当に重要だということです。だから、そこにいてこれらのことを試しているなら、つまり、あなたと私は両方ともこれについて話してきました。私は今週末に終わらせようとしている2つのことがあります。

この週末に終わらせると言っていた2つのアイデアがあって、それを進めたいんです。一方で昨日、あなたにこのリンクをランダムに送ったんですが、私の頭の中で、「ああ、やるべきことは、昔の4D BoxingのPCゲームをMMAにリメイクしようとすることだ」と思ったんです。ここで少しお見せしますが、主にCodexと行ったり来たりして、「これをもっと良くして。これをもっと良くして」と言って、たくさんの時間を費やしました。

そこまで到達しましたが、なぜそれをやったのか分かりません。つまり、それは必ずしも最終製品ではありません。だから、スーパーマーケットに行くときの話のようなものです。これが何と呼ばれるか分かりませんが、視聴者の誰かが知っているでしょう。スーパーマーケットに行って、ピーナッツバターが15種類あると、3種類しかない場合よりも決めるのがずっと難しいという話です。

そうです、選択のパラドックスです。それがまさにそうです。とにかく、これが今私たちがいる瞬間です。Googleが発表したもう一つの大きなことは、Stitchについて話さなければなりません。Stitchのアップデートです。Stitchは彼らのデザインプログラム、デザインAIツールで、非常に興味深い、ほとんどComfyUIのようなインターフェースを取って、ウェブサイトを投げ込んでデザインを良くすることができます。

ケビン、あなたと私は両方とも、Codexから出てくるウェブサイトで見栄えが良くないものがあることを知っています。Cloud Codeから出てくるウェブサイトでさえ、フロントエンドのスキルを使っても、すべて非常に似ているものがあります。Claude、私がやることにこれ以上絵文字を使わないでほしいです。だって今、AIがウェブサイトをデザインしたかどうかの見分け方は、絵文字がたくさんあることですから。でもこれはとてもクールです。

これを見ると、基本的にウェブサイトを取り込むことができます。実際に私のgavpurcell.comのウェブサイトを取り込ませて、「このウェブサイトを更新するために何ができるか、アイデアをください」と言いました。今は正直、そのデザインが結構気に入っています。

「フォントとか全部で更新して」と言いました。ここでクールなことの一つは、デザイナーでない人にとって、ウェブサイト全体を縦にレイアウトして見られるこの興味深いレイアウトが得られることです。すべてのページが見られます。フォントを選んだり、いろいろなことができます。

知っているかもしれませんし知らないかもしれませんが、Googleには実際にたくさんの素晴らしい無料フォントがあって、フォントは時々お金がかかるのでつらいんです。でもGoogleのフォント選択は実際にかなり良いです。カラーピッカーもあります。一般的に、これはコードではなくデザインに関する、同じような話のもう一つのバージョンです。

これらの話をまとめるかもしれません。バイブコーディング、バイブデザイニング、バイブ何でも。この何とかというものの言葉は何になるんでしょうね。

Stitchの音声機能とウェブの未来

そうですね、分かりません。でも、少なくともこれについてはもうコーディングしていないのは確かです。何をしているんでしょう。ああ、何を、私たちは。ほら、これ見て?ちなみに、コーヒーと水の両方を使っています。

これが、バイブコーディングの何とかの世界がもたらしたものです。ああ、それがあなたの新しいウェルネスルーチンですね。これが私の新しいスタックです。これが私のスタックです。これと、彼は誇りを持とうとしているんです、みんな。

そうですね。何て言えばいいんでしょう。Stitchを見たとき、本当に魅力的だと思ったことの一つは、音声、デュプレックスモードです。それはどういう意味かというと、音声を使って話しかけることができて、他の開発ツールにもそれはありますが、これは話し返してくれて、サウンディングボードになるんです。

だから、何かを反復するように頼んだり、これについてどう思うか聞いたり、アクセシビリティの問題を持っている人がこれで問題を抱えるかもしれないと思うか、ここの角について何ができるか、などと聞くことができます。そして、それが答えてくれて、プレビューモードのようになります。

でも、あなたと私は音声AIが推進力になることに強気だと思うんです。マシンに話しかけられるときはいつでも、私の生産性、反復できる速度が、とても速く、とても良くなります。だから、話し返してもらえるのも本当に興味深いです。そして、これはある意味でSquarespaceキラーのようになると思います。サイトを構築するという点で。

Squarespaceは、簡単にカスタマイズできる美しいテンプレートで、本当に最初に登場しました。ここでは、何でも好きなことをささやけば、それ用のテンプレートがあるという感じです。

でも、ギャビン、今から3〜5年後、ウェブサイトは誰のためにあるんでしょうか?そうですね。これは本当に興味深い会話で、後のショーで取り上げるかもしれません。これはもっと長い会話のように感じますが、

エージェント的なウェブ、過去数ヶ月間ショーで話してきたこれらすべてのことは、エージェントのためのものを作ることについてです。明確にしておくと、AI Studioは、Geminiの周りのもう一つのエージェント的なハーネスです。つまり、Geminiの周りにツールを配置して、物を引っ張ってきて、一緒に何かをできるようにするというアイデアです。

もし私たちのウェブベースのすべてのもの、もし私がウェブサイトを作って、あなたがウェブサイトを作っても、もし私たちがウェブに行くことがなくて、あなたはただMr. Tibus、あなたの小さなOpenClawアシスタントを扱っていて、私は私のアシスタントを扱っているだけなら。そうですね、どうぞ。

そうです。でも分かりません。あなたの言う通りです。なぜこのウェブサイトの見た目が必要なんでしょうか?そして、これは最近あなたと私がたくさん考えていることだと思います。もしあなたがエージェントで、私が自分のエージェントに「安いShureマイクが欲しくて、探す時間をかけたくない」と言ったら、今のエージェントはCraigslistやeBayに行って、これらすべてのものの写真をクリックしなければならないかもしれません。

でもある時点で、反対側に別のエージェントがいて、「Shureマイクを売りたい」と言った人がいるはずです。その2つのエージェントが接続したとき、どんな風になるんでしょうか?これはあなたが思っているようなものではないかもしれませんが、彼らはドッキングしていて、そのエージェントは巨大なエージェント的なトレンチコートを着ていて、サングラスをかけてそれを開いて、「何を探してるんだい?」と言います。ああ、両方開けてほしいの?そして、マイクが手に入ります。

良いニュースがあります。この世界全体で必要だったウェブサイトはあと1つだけで、それは非常によく作られました。それはAI for Humansです。ああ、これまでに存在する最後のウェブサイトです。

うわあ。これは、私たちは神です。これをあなたたちに届けました。そして、そうです、AIforhumans.showに行けば、私たちのショーのためのすべてのことができます。でも最も重要なのは、すべてのプラットフォームで私たちをフォローできることです。

このビデオを見ているなら、いいねとシェアをしてください。ここにいてくれて本当にありがとうございます。感謝しています。チップジャーにお金を入れてください。コーヒーを買ってくれてもいいですし、Patreonでお金を追加することもできます。

私たちはこれを本当にビジネスにしています。週2回お届けしています。もう冗談ではありません。過去3年間、これは冗談だと思っていました。もう違います。これは本物です、ケビン。本物です。AI for Humansはサイドプロジェクトでした、ギャビン。でも今は、そこにいるすべての競合他社を撃退するために、メインのことに本当に集中しています。

OpenAIのサイドプロジェクト廃止とAnthropicとの競争

ああ、本当に興味深いですね。そう、これは今週の大きなストーリーです。見逃した場合に備えて、OpenAIについて、Wall Street Journalの大きな記事があって、OpenAIは基本的に「もうサイドプロジェクトはなし。ビジネスとコーディングに集中しなければならない」と言いました。ケビン、これは今、Anthropicが彼らのランチを食べているからです。

でも、私のセクシーチャットロボットはどうなるの?スパイシーチャットに進出するんじゃなかったの?その方向に進むんじゃなかったの?そこには奇妙な注釈があって、スパイシーチャットはまだ来るらしいです。実際、別のストーリーが出て、スパイシーチャットはOpenAIで働いている人やOpenAIのアドバイザーを怖がらせていて、それが起こってほしいと思っているそうです。

でもとにかく、それは私たちのサイドプロジェクトです。ああ、それは何ですか?話を戻しましょう。ああ、ウィル、それをピーという音で消さないで。ショーには入れません。話を戻します。

あなたが見ることができる最も重要なチャートは、Axiosが共有したもので、初めての企業顧客のAIモデルシェアで、文字通り、夜にすれ違う2隻の船のように見えます。一方は正しい方向に、もう一方は間違った方向に進んでいます。

この数字は、12月初めにOpenAIが60%、Anthropicが40%でした。これらは初めての企業顧客です。今、2月下旬には、Anthropicが73%、OpenAIが26%でした。これは狂っています。

Anthropicが月間経常収益、MRRでOpenAIに追いついているという事実を考えると、これらの企業は、彼らが費やしている金額の多さと、正直に言って失っている金額の多さのために、存亡の危機に瀕しています。これはおそらく、何年もの間にAIに起こった最大のビジネスストーリーです。

OpenAIは基本的に、Fiji Simoという人が、彼女はOpenAIの製品とその他の何かのCEOです。本当のCEOではありません。なぜならSamが本当のCEOだからです。彼女は社内にメモを出して、私たちはビジネス消費者に完全に集中していると言いました。

ケビン、私の大きな質問は、彼らが脇に追いやっていると言っているものは何だと思うかということです。なぜなら、一部の人々は、それがSoraかもしれないと考えているからです。そうだと思いますか?彼らはAIビデオについてあまり気にしなくなると思いますか?

そう思います。そうですね、そう思います。彼らはAIビデオについてあまり気にしなくなると思います。彼らの画像モデルは長い間更新されていません。まだ何か作っているのは確かですが、様子を見ましょう。

私は彼らのリアルタイム音声製品で製品を構築しましたし、現在も構築中です。最近、音声製品の1.5アップグレードが少しありました。あまり盛大な発表はありませんでした。主に、少し良くなったけれど、それだけだったからです。でも、その製品への根本的な変更を1年以上待っています。

それもビジネス製品だと思います。だから、私には少し奇妙です。そして、それは私を少し警戒させます。消費者として、リリースされたときにこれらすべての新しいGoogleのものを採用することに警戒しているのと同じように、私の日中の仕事で、Open AIをすべてのものに統合しようとしているビジネス側では、今、どの製品が実際に加速され、焦点を当てられるのか、どれが打ち切りリストにあるのか心配しています。

そして、私はそれらが何であるかを積極的に知りません。彼らはそれらが何であるかを実際に伝えていません。そうですね、本当に興味深いです。この間誰かが、Googleは消費者AIの世界で勝つように設定されていると言いました。ちなみに、私は、ちょっと待って、ギャビン、申し訳ないです。これにもっと良い答えを得なければなりません。Atlasブラウザを使って尋ねます。

待って、それは起こらないのでは?ちなみに、今はマルト酒のボトルです。言っておきますが、私は今、ChromeへのCloud Code統合、またはChromeへのCloud統合を使っています。背中のコンピューターが見えるか分かりませんが、バックグラウンドで設定されていて、受信トレイをクリーンアップしています。だから、Claudeのプログラムを実際に使ってこれをやっているんです。

これについての興味深い洞察があります。私はいつもNano Bananaを使って私たちのサムネイルを作っています。自分たちの写真を撮りますが、時々背景とかを追加するために使います。先週、いくつか他のものを試してみようと思ったんです。GrokとImage Gen Open AIを試しました。

Nano Bananaは、編集、得られるものという点で、はるかに先を行っています。彼らが勝ったかもしれないと言えるほどです。そして、今AI業界で多くのことが起こっているのを見ていると思います。企業が「まあ、そこには到達しないだろう」と言っているような感じです。

昨日、Elonがこれをツイートしました。「Googleは西洋でAIレースに勝つだろう、中国は地球で、SpaceXは宇宙で」。Elonはいつもいろいろなことを言いますが、彼がGoogleが西洋でAIレースに勝つと言っているという事実は、xAIが彼が思っていたほどやっていないかもしれないという認識のように感じます。

だから、企業が離れていくのが見えます。これがその瞬間です。Anthropicは、OpenAIのすぐ後ろで勢いを増していて、バックミラーで見ていて、簡単に追い越すことができます。ちなみに、Cloud Codeはまだクレイジーにシップしています。

Dispatchが登場しました。前に述べたように、これは携帯電話からCloud CodeとCloud Co-workを使用する機能です。実際、最初はCloud Co-workだけでしたが、数日前にCloud Codeを追加しました。

Anthropicのスキル機能と競争優位性

スキルについて言わなければなりません。スキルは今のところ本当に重要です。長期的にはそうではないかもしれませんが、Claudeにスキルを追加することは、Codexにもスキルを追加できますが、本当に重要です。

今週ニュースレターで書いた、私がいつも使っているスキルの一つは、Superpowerスキルと呼ばれるものです。ショーノートにリンクがありますが、これが基本的にやることは、Cloud CodeやCodexを使用しているときに、ドアを開く方法についてたくさんの質問をすることです。私たちは以前に話しましたが、Superpowerはとても良い仕事をします。インストールは一つです。とてもシンプルです。

とにかく、Anthropicは、私の仕事でも、コーディングでも、実際に私に役立つものをシップし続けているように感じます。そういったすべてのものです。

そうですね、聞いてください。個人的な話ですが、最近、Pro購読でCodexに切り替えて、それがどんな感じか感じてみようとしました。Codexアプリは好きですが、Cloud Codeが本当に恋しいです。コマンドラインインターフェースが恋しいですし、おそらく来月には、大きな開発がない限り、戻るでしょう。

だから、ラインがそのように収束している理由は分かります。でも、これらのライン、ギャビン、とてもワイヤーフレーム的で2Dで、醜いです。AIビューティフィケーションフィルターをかけて、アーティストが意図した通りに30フレーム/秒で実行できたらいいのに。

DLSS5のフォローアップとゲーマーコミュニティの反応

そうです。今週初めのDLSS5ストーリーの簡単なフォローアップです。見逃した場合は、NvidiaのGTCから火曜日にリリースしたエピソードに戻って見てください。DLSS5は、AIがAIビデオゲームのビジュアルをより良くするために影響を与えるツールだという発表がありました。

ここで参照する最も重要なことは、ケビン、予想通り、ゲーマーコミュニティからこのアイデアに対する大規模な反発があるということです。これについて大量の時間を費やす必要はないと思いますが、Digital Foundryの人たちについて叫びたいと思います。

彼らは行って、「ねえ、これはちょっとクールだ」みたいな感じでした。これについて非常に多くの批判を受けたので、基本的にこれについて受けた嫌がらせについて話す2番目のビデオを作りました。

これは、AIについて大きな感情がたくさんあることを理解しなければならないという瞬間です。それは理解しています。でも、このショーや他のショーの視聴者であれば、彼らがあなたを個人的に傷つけようとしているわけではないことを知ってほしいんです。

ゲーマーについて知っています。私たちは両方ともゲーマーです。ゲーマーとして育ちました。これらは物事について情熱的に感じる人々で、それは理解します。でも、AI名が関係しているからといって、彼らがあなたの子供時代の喜びを奪おうとしているわけではありません。これについて言いたいのはそれだけです。結局のところ、それが問題なんだと思います。

これは、誰かがこれが組み込まれたエミュレーターをリリースして、トグルで古いWiiゲームやNintendo 64ゲームを強化できたら、人々は夢中になっていたでしょう。たとえそれがアーティストの意図に忠実でなくても、「Banjo-Kazooieがとても良く見える。なんてこった」と言うでしょう。

また、同じコミュニティが、これはアーティストの意図に対して無礼だ、クリエイティブなどに対して無礼だと言うでしょう。そして、彼らは行って、Macho Manの声をThomas the Tank Engineに入れて、Skyrimのドラゴンをそれで置き換えます。ちなみにそれは素晴らしいです。

聞いてください、アーティストの意図について情熱的な層がいる理由は分かりますし、それは大好きです。人々が趣味や芸術形式や技芸について情熱的であることが大好きです。でも、AIが出てくるたびに、不公平な量があると思います。

これまでに取り上げられたすべての企業は許可を与えました。彼らは自分たちのゲームをサポートしたいと言いました。そして、人々が気に入らないもう一つのことがあります。DLSSを始めると、これから入りますが、今、非常にクールなHugging Face modで何でもDLSSできます。

本当に古いゲームやベクターアートゲーム、さらにはAtariやテレビのものにそれを始めると、結果を見て、あなたの心は、そこにあったものの完全な改変である可能性で駆け巡り始めるでしょう。でも、それらはまだ本当に魅力的で楽しいバイブコードです。それに飛び込みましょう。

DLSS Anythingプラグインの紹介

これはHugging Faceで利用可能な新しいプラグインで、Hugging Faceの共同創設者の一人、Victor MustatまたはMustarからのもので、DLSS Anythingと呼ばれています。あなたと私は、これらのツールをしばらくフォローしてきました。写真をかなり簡単にDLSSできます。なぜなら、これにAIアップレスを実行しているだけだからです。

これを行うことができますが、ケビン、あなたは実際にこれを自分でやりました。これらの画像のスレッドをリリースしました。どれが最も驚いたか、そしてなぜか教えてください。

スレッドにはないものを一つテキストで送りました。でも見てください。Sega GenesisのPaper BoyをこのDLSS 5で実行しました。そして今、これは強化しようとするクリエイティブなプロンプトを使った画像モデルにすぎません。

とてもクールです。大好きです。そうです。今、ピンチズームして、芝刈り機を車に変えたとか、何でも見ることができます。もしこれが本当にAllaと一部のアートでカスタムトレーニングされたモデルだったら、Paper Boy用の。

これは、私がプレイしたい、全く新しい3Dだけれども美しく等角投影のPaper Boyゲームのように見えます。Qubertで何をしたか見ると、壊れた方法で完全に幻覚を見ていますが、ちょっとクールです。

私は、ほとんど知られていない古いPlayStation 1ゲームを実行しました。Vib Ribbonと呼ばれています。プレイする機会があれば、素晴らしいです。あなたはVib Ribbonをポップインしました。ゲームをRAMにロードします。それから好きなオーディオCDを入れると、ワイヤーフレームのウサギとしてスキップするレベルが生成されます。

でも、これをDLSS5に変えるだけで、他のプロンプトなしで得た結果を見ると、ウサギと彼らがいる世界、他のすべてのキャラクターを完全に想像しました。そして、それは本当に、心を吹き飛ばすようなものでした。

それはオリジナルのアーティストが意図したものではありません。いいえ、オリジナルのクリエイターが全く念頭に置いていたものではありません。でも、インディー開発者が「見てください、これが私の新しいゲームの骨組みです。そして、これがその上に乗るAIアートワークレイヤーの指示です。自分で作りたければ、どうぞ」と言える未来がすぐに見えました。

その考えを保留してください。というのも、少し後に、ケビンが実際に取り組んだものについて話すつもりで、それはこれを可能にするようなものだからです。でもまず、ケビン、番組に新しいセグメントがあります。カバーすべきAIニュースがとてもたくさんあって、これらのショーを少しタイトにしようとしています。だから、5分で5つの簡単なAIニュースストーリーの準備をしてください。

5つのAIニュース速報

さあ、ケビン、5と5のようなこともできたかもしれません。他の何かもできたかもしれませんが、いいえ、これは5分以内に提供される5つの簡単な人工知能ニュースストーリーです。それが私たちの約束です。

まず、MidJourney V8がアルファ版で、人々は期待外れです。これから出てくる画像があります。MidJourneyのサブスクライバーであれば試すことができます。ケビン、これは彼らが手で再び問題を抱えているシステムの一つです。あまりワクワクしないように見えるものがあります。擁護者もいます。

実際、MidJourneyのハンドルはこのモデルを積極的に擁護していますが、少し遅れているように感じます。あなたの考えは?拡散モデル対世界モデル。多くの企業が移行して、他の技術を統合しているようです。これは、大規模な資金を持たない小規模な企業にとっては、追いつくのが非常に困難かもしれません。

次は、何ですか?それは私の仕事でした。やれやれ、そこにグラフィックがあることを願います。別のタブでFruit Ninjaをプレイしていたのか、何が起こっていたのか分かりません。

Runwayと、ほぼリアルタイムの動画生成を行う新しいNvidiaチップであるVera Rubinチップ。1年半前に、これが未来になると話していました。今、それは少なくとも最先端の現実です。ボタンを押すと、100ミリ秒未満で高忠実度の動画がモデルからストリーミングされ始め、継続的に実行されます。

ギャビン、明日にはパーソナライズされたNetflixができるでしょうか?ボタンを押して無限のものをストリーミングできるようになるでしょうか?これについての私の最大の問題は、AI動画生成で私にとって最大の問題は、いくつかの結果を得るのにかかる時間です。

だから、即座に結果を得られる世界を見ることができて、とてもワクワクしています。さあ、次は、それはビンタです。次は、Val Kilmer、Real Geniusでの私のお気に入りの俳優の一人が、AIで蘇生されることに同意しました。同意しました。

そう、そうです。申し訳ありません、彼はまだ同意していません。As Deep as the Graveと呼ばれる新しい映画で蘇生されて主演することになります。これは、映画のクリエイターが常にValがそれに出演することを想像していた映画でした。

Valは悲しいことに、喉頭がんで亡くなったと思います。これはハリウッドでの大きな出来事です、ケビン。なぜなら、これは完全にAI生成される主役をやる実際の大きな俳優の最初の本当のテストだからです。この映画のために事前に撮影されたものは何もありません。あなたの考えは?

これからもっとたくさん出てきます。好きでも嫌いでも、DLSS5 Kilmerがどんな風になるのか気になります。それを画面に表示できますか?いや。次は何ですか?次は何ですか?なぜキーボードに唾を吐いているんですか?やれやれ。

最近、エージェント的なことをやっている人に影を撃ちたがる人が大好きで、バイブを確保していないとか何とか言いますが、数十億ドルのエンジニアの囲いを持つMetaが、ならず者AIエージェントの問題を抱えています。

スレッドへの投稿があり、内部AIエージェントがそれに応答し、会社の情報を漏らしました。それが雪玉になって雪崩を引き起こしました。実際に彼らはこれをSE1インシデントとしてフラグを立てました。これは、持つことができる2番目に高いセキュリティ重大度レベルです。

Metaのセーフティディレクターは最近、彼女のAIエージェントが受信トレイ全体を削除したと共有しました。それはそんなに前のことではありません。だから、MetaとGavinには1-2パンチが起こっているように感じます。彼らがそれを確保できないなら、私たちに何の希望がありますか?

まあ、私の大きな心配は、母がクリスマスレターを送るために自分自身のAIエージェントを作り始めたら、何をするかということです。でも、それはすべてそれについてです。いつかあの唾を吐く音を作るのをやめます。

最後に、5つのストーリーで、Kogiという興味深い種類のプラットフォームで、実際にはウェブブラウザと他のたくさんのものの一種ですが、ユニバーサル翻訳者デバイスを作成しました。これらの種類のLinkedIn翻訳者ソーシャル投稿を見たことがあるなら、基本的には、言語だけでなく、キャラクターにも翻訳できる生成AIの非常にクールな使い方です。

Ethan Malaは叫んでいる木を作成しました。実際、私はこの種のことを本当にやりたくないAIを作成するために使用しましたが、あなたが使える非常に楽しいツールです。そして、これの最良の部分、ケビンは、人々がLinkedInスピークを持っているというアイデアです。

LinkedInは、そこに行くとソーシャルネットワークの中で最悪だと思います。少しの間、LinkedInを成長させようとして時間を費やしましたが、もうやめました。なぜなら、そこに行くたびに、すでにAIボットに乗っ取られているように感じるからです。でも、それは単に営業ブラザーがそれがあなたが話すべき方法だと考えているだけかもしれません。

生成Doomプロジェクトの紹介

バイブコーディングと楽しいすべてに関して話したいとてもエキサイティングなことがあります。それは、ケビンが取り組んできたもので、これをプレイするのがとても楽しみです。クリンジするたびに何をやっているのか教えてください。それは愛の労働ではなかったからです。それは、ラップトップを胸に置いて、時々エージェントに叫ぶような1日のジャムのようなものでした。

先週、あなたと私は何かについて議論の最中で、「でも、新しいDoomの武器や敵、さらにはゲームプレイモードをプロンプトで存在させることができたらクールじゃないか」と言ったと思います。私たちは両方とも、それをカットすると言ったと思います。やるつもりだから。

そうですね。ピーという音で消しました。そうですね。それから、「ああ、くそ、実際にやってみなければならないと思う。やると言ったから」と感じました。そして、みんなが遊べるようにリリースするつもりです。

でも、基本的にClaude CodeとCodexと少し一緒に座って、「聞いてください、これが作りたいものです。最高のオープンソースを見つけたいです。なぜなら、Doomはオープンソースだからです。IDのCarmackの伝説、彼を信じています、彼は私たちをAGIに連れて行ってくれると思います。見ていてください、ギャビン。彼はまだ非常に」

私は確信しています、実際に。疑いません。彼らはDoomのすべてのソースコードをかなり前にリリースしました。だからこそ、トースターから家庭用妊娠検査薬まで、すべてで動作するDoomを見るんです。

コードは出回っています。しっかり確立されています。人々はウェブブラウザへの移植を含め、多くの方法でそれを改造してきました。だから、「それは良い入り口だ。ウェブブラウザで動作する最高のDoomポートを見つけてください。OpenAIやGeminiや11 Labsのような生成AIに接続するインターフェースをその上に取り付けられるように。

ピストルをTボーンステーキに置き換えて、撃ったときに動くようにしたければ、それを理解してやってくれます。今、それはワンショットからは程遠かったです。たくさん行ったり来たりしなければなりませんでした。

でも、クリーンアップしてリリースしようとしているのは、これも正直言って、最近リリースするものに誇りを持っています、キャリアの残りとは違って。これはそれらの一つではありません。これは、あなたが取って何かをしたいと思うかもしれない、だらしないバイブコードでした。

でも、今日存在する場所は、OpenAIまたは11 Labsに接続できるということです。お気に入りのプロバイダーを追加するのは非常に簡単です。Fluxをローカルで実行して、グラフィックスを生成することに対処したくない場合は、ローカルモードもあります。

問題は、私がMacで開発していて、最高のオーディオモデルとより良いビデオモデルが、残念ながら全くうまく動作しないことです。だから、デフォルトでクラウドを残しました。でも、ゲームをロードして、「私のピストルを何にでも置き換えて」と言えば、銃口のフラッシュを含め、撃たれるためのスプライトを開発してくれます。テーマに合わせて。

ピストルをターキーサンドイッチに置き換えると、マヨネーズが出てくるように見えます。ゴムチキンに置き換えると、それはかなり怖い見た目、かなり怖い想像力です。ゴムチキン、何でも好きなものに置き換えられます。グラフィックスを置き換えるだけです。

また、11 Labsに行って効果音を生成します。ゾンビガイを置き換えることもできます。これは、これらのレベルの多くで最初に直面するデフォルトのキャラクターのようなものです。OpenAIを使って、求めるものの2つのキャラクターシートを生成します。

すべてのビューを実行し、カットして、必要な場所に配置します。画面で見ることができますが、完璧には程遠いです。でも、1日でそれを出して、そこまで到達したという事実は、それを取って実行して、何でも交換できるようにしたい人にとって、かなりうまくいっています。

私が本当に気に入っているのは、ちなみに、ローカルモデルで実行すると、キャラクターシートを生成してから、Flux Schnelを使用しているので透明性をサポートしていないため、二次プロセスを通じてすべてのスプライトから背景を削除します。

だから、かなりエレガントです。かなりパフォーマンスが良いです。クラウドバージョンを使用している場合は、Chromebookでもかなりうまく動作します。クラウドですべてを実行して、それを吐き出すだけだからです。

スプライトと効果音をリアルタイムでエンジンに注入します。これは私にとって重要でした。なぜなら、プロンプトをして、それからゲームを実行してプレイするようなものにしたくなかったからです。プレイしながら、リアルタイムでプロンプトして、グラフィックスと音を変更できます。それが私にとって非常に非常に興味深いです。

そうですね。つまり、それは一種の魔法で、みんなに試す機会を得てほしいと思います。ショーが公開されるまでに利用できるようになることを願っています。そうでなければ、すぐ後です。

でも、クールなことは、このようなものをオープンソースで手放すというアイデアだと思います。狂った時間をかけたわけではありません。でも、ああ、誰か他の人がそれを取って何かをするとか、誰か他の人がそこに持って行くというマルチプレイヤーのバイブになります。

Doomが次の段階になるかもしれないというのは、みんなが自分自身のバージョンを作る製品の次の段階になるという、Carmackのポイントと他のすべてのことに非常にクールなことです。それは素晴らしいです。

面白いのは、初期の画像生成やビデオ生成、バイブコーディングされたゲームを振り返ると、AI dungeonのようなテキストでしたよね。それから、Atariグラフィックスのようなものになりました。「ああ、このこと」。ツールが良くなるにつれて、反復しているプラ​​ットフォームも卒業しています。

だから、Dreamcastバイブコードステージに到達するのが待ちきれません。それが私が終わるところです。ああ。さて、また来週お会いしましょう。参加してくれてありがとうございます。これはAI FOR HUMANSです。さよなら、みなさん。バイバイ。

コメント

タイトルとURLをコピーしました