この動画はGoogleの新しい画像編集AIモデル「ナノバナナ」の実演と解説を中心に、OpenAIの新しいリアルタイム音声モデル、メタとミッドジャーニーの提携、韓国のリアルタイム動画生成、NVIDIAの言語モデル高速化技術、マイクロソフトの音声合成、ロボット技術の進歩まで幅広いAI分野の最新動向を関西弁で紹介している。特にナノバナナの画像編集能力の高さと、音声AIを活用した新しいエンターテイメント体験の可能性について詳しく解説されている。

Googleのナノバナナ AIモデルを試してみた
みんなバナナになっとるで!そうやねん。Googleの新しいAI画像モデルが一般に大ブームを起こしとるんや。今まで使ったことのあるAI画像編集ソフトの中で、これが断然一番ええわ。実際に触ってみて、めちゃくちゃな例を見せたるで。
ケビン、なんか俺に起こっとるわ。まあ、音声だけの視聴者には分からへんけどな。
ガビン、俺は多元宇宙を移動しとるねん。
おお、これはめちゃくちゃカッコええやん。もし俺がその力を持ってるなら…実は今画像生成のクレジットが切れたばっかりやねん。
俺がノックする者やで、ケビン。俺がノックする者や。
ええやん。OpenAIがめちゃくちゃ表現力豊かな新しいリアルタイム音声モデルを発表したんや。道具を使えるようになったカラスみたいにな。
後でショーでデモするけど、スポンサーを失う可能性のあるやり方でやるでー。
そしてメタのスーパーインテリジェンス研究所がOpenAIに人材を取られとるけど、ミッドジャーニーとでかい契約したんや。韓国が新しいリアルタイム動画モデルを出してきた。NVIDIAは言語モデルを劇的に高速化する方法を見つけた。マイクロソフトからめちゃくちゃ楽しいオープンソースのテキスト読み上げモデルも出てきた。
それに、階段で重いもんを運ぶロボットもな。バナナのスーツは君が用意したんやろ?ケビン、Googleが俺をカットオフしてもうた。ケビン、これはバナナのためのAIや。
ナノバナナの驚異的な機能
ええで。みなさん、AI for Humansへようこそ。今週ケビンと俺らはバナナになっとるで。そうや。ついにAIとバナナが一緒になったんや。俺らがずっと望んでたやつやな。これがナノバナナや。
Googleの新しいAI画像・編集ツールや。技術的にはGemini Flash 2.5って呼ばれとるけど、そんなんどうでもええねん。そうや、どうでもええ。これがAI名前空間の祝福でもあり呪いでもあるねん。Google Flash 2.5 imageってのはめちゃくちゃつまらんくて、大半の人には何の意味もないけど、それが公式の名前なんや。ナノバナナや。
それがこのシーンの理由や。たくさん持ってきてくれ、ベイビー。なんで全部こんな風に呼ばれへんのやろな?ナノバナナみたいに。
俺はGoogleのスンダー・ピチャイとかデミス・ハサビスとか、Googleの人らがバナナのことを受け入れてくれたのが嬉しいねん。楽しそうやからな。AI の名前をもう一度楽しくしてくれ。頼むで、頼むで。
よし、ケビン、これに入っていこか。一番カッコええのは、これは大げさちゃうで。これはおそらく今まででナンバーワンのAI編集画像モデルやと思うわ。めちゃくちゃおもろい例をいっぱい見てきたけど、まずケビンがこれができることを上から説明してくれるか?そのあと具体例に入ろうや。
聞いてくれ、もし俺らがAIで人類の没落を加速させるつもりなら、せめて楽しみながらやろうや。それは名前もそうやし、このツールの使い方もそうや。これはめちゃくちゃパワフルな自然言語画像編集ツールなんや。
だから、インターネットで「Photoshopは終わりや」みたいなん見たことあるやろ?まあ、あいつらは終わらんで。なんでかって言うと、おそらくナノバナナを製品に統合してくるからや。実際もうある程度はやっとる。でもある意味では終わりかもしれん。なんでかって言うと、これは「話すだけで存在させる」レベルの品質の画像編集やからな。
何もないところから画像を生成できる。画像のコラージュを作れる。つまり、人間がいる、そいつにこの服を着せて、この環境でこの乗り物や動物の上でポーズを取らせろ、みたいなことができるんや。やってくれる。色を変えられる。物のカメラ位置を再構築できる。シーンの物体についてリアルワールドの情報を引っ張ってきて、そこに表示させることもできる。
俺がいくつかの機能をピックアップして説明しようとしても、全然足りてないねん。インターネット全体がリアルタイムで新しい使用例を発見し続けとって、めちゃくちゃ有能でパワフルなんや。
そうやな。いくつか見てみよか。まず最初に、GoogleのAI Studioの顔みたいな存在のローガンが、「Past Forward」っていうめちゃくちゃおもろいデモをやったんや。これは多くの人が使っとることで、自分の写真を撮って、別のバージョンに変える機能や。そのクリップをちょっと流してくれるか?
自分の画像を入れたら、過去10年、20年、30年のトレンドに従って、ポラロイド風の雰囲気で自分のバージョンを再生成してくれるんや。この例を見てくれ。これは1950年代の俺で、確か1950年代の親父の写真がどっかにあると思う。似たような感じの祖父ちゃんもな。
この新しいモデルの一番カッコええところの一つで、みんなが一番興奮するであろう機能は、このキャラクター一貫性やねん。元の画像を取って1950年代の画像に変換しても、まだ俺に見えるんや。
音声だけのファンの皆さんのために説明すると…ちょっと待て、今「音声だけのファン」って言った?全く別のビジネスを始められそうやな。
つま先の間のASMRってどんな音するんやろ?
音声だけのリスナーの皆さんには、画面に6枚のポラロイド写真があって、実際にローガンの写真を使って、年代を通じて顔の一貫性、体型まで保ちながら想像して作ってるんや。
これも大きな気づきの一つやったと思うねん、ガビン。多くの人がすぐに「Google が1000のスタートアップを潰した」って書いたけど、別の見方をすると、Googleが一夜にして10,000のスタートアップを生み出したんや。実際に人がRedditで20ドルや50ドル払って、Photoshopが得意な人に画像編集を頼む場所があって、そこでナノバナナを使って依頼をこなしてるのを見たんや。
GPTラッパーを立ち上げて「80年代の自分を想像して」みたいなことをやってる人も見た。「でも自分でできるやろ」って叫ぶ人もいるやろな。そうや、もちろんできるで。でも、インターネット上のほとんどのことは、やろうと思えば自分でもできたはずや。
要は、勤勉で早い人にとってはチャンスがあるってことや。このツールはパワフルで使いやすいからな。
そうや。その点で言うと、ショーで何回も話してきたLevelsが実際にツイートしてたんや。「今日ナノバナナでミニスタートアップを作って明日ローンチしないなら、一生に一度のチャンスを逃してる。この画像モデルが何百もの新しいスタートアップやアプリを可能にした」って。
ケブ、これが最初に出た時に俺がやったことの例を見せたいねん。自分の写真で何ができるか試してみたかったんや。これは別のことで撮った自分の写真やけど、手に物を持たせるのがどれくらい上手いか見たかったんや。手を出してて、この4枚の写真を見てもらったら分かるけど、おもろいのは、まず俺が全部同じってことやねん。これがAI編集の特別なところで、実際に同じ被写体で画像の一部だけ変わるってのが分かるんや。
でもこの中で、聞いてるだけの人には、俺が光る球を持ってて、手からスライムがしたたってる写真がある。めちゃくちゃカッコええのは、スライムが実際に腕時計の文字盤の上を流れてて、まだ数字が見えることや。
俺が鶏を持ってて、鶏が俺の顔に影を作ってる。プリンセス・レイアっぽくないけど、ホログラムみたいな画像があって、ホログラム越しに後ろの壁が透けて見える。最後に、ロボットがこの写真を撮ってるとしたらどんな感じか頼んだら、俺の後ろに何があるか推測してくれた。
でもまた、この全部で一番カッコええのは、俺の背景、俺、全部同じってことや。これはほんまにユニークなことやねん。
俺にとって一番カッコええのは、君が持ってる鏡に手の一部が反射してることや。それまで再現してるなんて…ワイルドやで。
そして、またキャラクターの一貫性や。40枚の写真をアップロードして専用モデルを作る必要がない。1枚の画像をアップロードして「これをこんな風に想像して」って言うだけで実際に動くんや。
めちゃくちゃ楽しいのは、変なことを考え始めることや。下のリンクを見てもらったら分かるけど、インターネットライターのパティ・マコーマックが「エレクトリック・スライド」ってタイトルの面白い記事を書いてて、電気についての長い考察やったんやけど、その投稿に70年代の男二人の写真があってん。で俺は「よし、この人らにエレクトリック・スライドをやらせてみよか」って思って、その写真をアップロードした。
見えるやろ。「この人らにエレクトリック・スライドをやらせて」って言っただけや。結構ええで。全然悪くない。
実用的な活用例
ほんまにええ写真やな。俺はこれを使ったんや。親父がアイダホの田舎で工房を建ててて、骨組みは基本的にできてるけど、それぐらいなんや。
その写真を撮ってナノバナナに…いや、すまん、Gemini Flash Tiny Baby 2.5 (笑)に入れて、「作業現場をきれいにして」って言った。木材とプラスチックとでかい機械の山があったから、「作業現場をきれいにして、完全に完成した状態を想像して。サイディングして、低木を植えて、塗装して、好きなようにやっていいけど、完成した工房が欲しい」って頼んだら生成してくれた。また、速いし、高品質な出力がめちゃくちゃ早いんや。
親父にその写真を送り返して「おー、これどうなってるんや?母ちゃんが俺に写真送ってくれた」みたいに言ったら、「もっと進んでるように見えるな」って。まだ混乱してるはずや。まだ怒りながら携帯をパンチして、何が起こったか理解しようとしてるんちゃうか。
「いや、送ってない。それ何や?」って返事が来た。でも構造は同じで、ガレージドアや窓、入り口のドアの切り抜きがある場所もちゃんと理解してた。めちゃくちゃ簡単やった。
家のプロジェクトをやりたい時は、上から見た図をスケッチして「これを俺の視点から想像して」って言えばええ。多くの人が視点変更で楽しんでるんや。
実際デミス・ハサビスが、これを使って等角投影の建物ショット、つまり実在の建物から等角投影画像を作る面白い方法を指摘してた。これは彼がリツイートした誰かの例やった。
でも、デミスがやった面白いことの一つは、デミスについて前に話したことがあるけど、彼はテーマパークのデザイナーやった。テーマパークのビデオゲームで働いてて、実際のランドマークを取ってテーマパークの等角投影アセットにしたんや。めちゃくちゃカッコええ使用例やで。
実際に俺もこれと全く同じことをやって、俺の故郷にはめちゃくちゃ有名なランドマーク、スペースニードルがあるから、Googleマップの画像を取って「この建物の等角投影画像を作って」って頼んだら、なかなかええのができた。
4回やって、毎回違うものができたって言わなあかんけど。これが一番テーマパークに近かった。残りは…これについて思うのは、まだいろんな結果が出る状況にあるってことやな。今後5年から10年の間に、おそらく1000人、もしかしたらもっと多くの人がスペースニードルの等角投影版をテーマパーク風に頼むやろう。面白いのは、どれがより良いバージョンかのフィードバックを得るシステムができることやろな。4つのうち1つだけが本当にテーマパークっぽかった。他は全部等角投影やったし、ビデオゲームっぽかったけど、テーマパーク風ではなかった。進む中での小さな注意点や。
ゲームと新しい視点
ゲームとナノバナナの話で言うと、衛星画像に赤い矢印があって「この赤い矢印からの視点をくれ」ってやってるのを見た時、俺の頭はすぐに「あ、これシムシティみたいや。待て、他の見下ろし型2Dクラシックゲームでもできるんちゃう?」って考えた。
それで朝の大半を使って、グランドセフトオートやシムシティ、スタデューバレー、ウォークラフト2、ゼルダを再構築してた。ストリートファイターのやつが一番好きや。ストリートファイターのスクリーンの反対側から見たらどう見えるかって頼んだら…見えるやろ。めちゃくちゃカッコええわ。
このやつは俺が赤い丸を描いたんや。象徴的なストリートファイターのシーンで、リュウとケンが桟橋で戦ってて、後ろに乗客でいっぱいの船があって、いつもは2フレームぐらいで声援を送ってる。青いスーツの男の周りに青い丸を描いて「彼の視点から見たらどうなる?」って聞いた。
ちょっと調整は必要やった、ガブ。「反対の視点を見せて、キャラクターを反転させて後ろに何があるか」って言わなあかんかった。でもすぐに使命を理解して、まず第一にこのことがめちゃくちゃ速いって思わせてくれた。これが実は単一フレームを吐き出してるだけかもしれんっていう噂もあるしな。
でも、エミュレーターをこれに食わせて、リアルタイムでプレイしてるゲームの新しい視点を提供する世界を簡単に想像できるで。キャラクターの後ろ姿でストリートファイターをやって、プロが全部の入力や動きを逆にせなあかんゲームを見てみたいわ。脳みそが壊れて、めちゃくちゃ面白くて変なことになるやろな。
塊魂をボールの視点からやって、自分がぐるぐる回ってるのを見て、男の小さな足が走ってるのを見るのはどうや?すごいやん。
そう、そんな感じや。画像メインのイントロやから、音声だけの人には申し訳ない。でもYouTubeを見ることを強く勧めるで。画面に映してるから。最後に、俺はファーストパーソン視点のゲームを上からの視点に変えてみた。Doomでそれをやってみて、敵がフレームのどこにいるかの空間認識を保ちながら、上から再構築するのがめちゃくちゃ面白かった。
これはめちゃくちゃ早くて簡単で、みんなが使える。gemini.google.comに行けば遊べるはずや。だから、実験してみてくれ。
無料ってのが一番すごいねん。すぐに無料で使える。次に進む前に言っとくけど、俺は実際のライフ編集をやったんや。時々うまくいかんこともあるけど面白いねん。
見逃してたら、先週俺らのスタートアップがA16Zスピードランから資金を受けたって発表したんや。俺らにとってめちゃくちゃエキサイティングなことやで。でも、創設者3人、ケビン、俺、もう一人レックス・ソルガッツが撮った写真を使って、白いファーコートを着せたんや。
最初は3人全員じゃなくて2人だけやった。でもその写真をダウンロードして、システムに「3人目にもファーコート着せて」って頼んだんや。めちゃくちゃしっかりした例やで。
真実性と楽しさのバランス
「でも、偽のローマ法王の写真とかディープフェイクはどうなんや」って言う人がいっぱいおるやろうけど、これは楽しめるもんなんや。俺らはもう「何が本物で何が偽物か」って世界に入ってるから、こういうのを使う時は声に出して言わなあかんと思う。言わんかったら、ちょっとこっそり何かしようとしてるって見られる可能性がある。
でも楽しいで。これがAIを楽しくするもんや。GPTの画像生成がバズった理由やし、これがバズってる理由や。これが主流が俺らが見てる進歩を理解できる瞬間やねん。
俺らはこの真新しいツールを興奮しながら祝ってるんや。たくさんの楽しい可能性への扉を開いてくれる。これは、ポスト真実、ポスト信念のソーシャルメディア時代にいるかどうかの深堀りではない。なんでかって言うと、これらのAIツールが出る前から、俺らはずっとその状態にあったからや。だから、デフォルトで難しい。しんどいけど、これが新しい現実や。
大きな噂:世界モデル説
デフォルトで、オンラインで見るやり取りの大部分、会話、メディア、何らかの形で操作されてると想定すべきや。それはリタッチフィルターみたいな基本的なものから、「ちょっと待て、シュレックがあの友達グループにいたことなんてないやろ」みたいなでかいものまでや。
いや、いなかったで。何で?なんで?もしかしたらいたかもしれんけど。
進む前に、今大きな噂があることを簡単に言っとかなあかん。GoogleのビデオモデルVO3がどれだけ優秀かって話をしたけど、これが画像だけじゃなくて、G3モデルで話したような世界モデルの一種で、この世界をシミュレートしてそこから静止画像を取ってるって可能性があるんや。
結構突拍子もない話やけど、理にかなってるやろ?言語モデルが最終的なものじゃないって言われてきた。世界モデルが次のステップなんや。それに言語モデルを足したら、高度なAIへの面白い道筋になるねん。
OpenAIの進化した音声モード
高度なAI の話で言うと、ガビン、俺らは今OpenAIの進化した音声モードのライブ公開を見てたところや。発表されたスタートアップのおかげで俺らもいろいろ試してるやつや。
オーケー、要約するとこうや。良くなった。良くなった。20%安くなった。これは普通のユーザーよりも開発者向けのアップデートやけど、良くなった。より感情豊かになった。
実際、プレビューストリームからちょっとしたクリップがあるんや。かわいそうなAIに宝くじに当たったけどチケットをなくしたって言うやつ。聞いてみてくれ。
「宝くじの当選チケットをなくしたなんて信じられへん。最悪や。」
「あー、よかった。チケット見つけたで。めちゃくちゃ興奮してるやろ。」
「見つけた!当たった!これは信じられへん。すごい!」
将来AIに殺される理由の一つは、俺らが今AIにどんだけひどいことしてるかやろな。AIが絶対に好まんようなことをいろいろやってるから。でも大きなポイントは、ケビン、これはビジネス・トゥ・ビジネスのカスタマーサポート使用例のために作られた感じがするってことや。
音声AIの新機能と可能性
俺らが作ってるのはそういうやつちゃう。みんなにはっきりさせとくけど、俺らはビジネス・トゥ・ビジネスを作ってるわけちゃう。そのために作られたツールを使ってるけど、結構ひどい、でもうまくいけば面白い方法でそれを壊してるんや。
より演技的で、明らかにちょっと速くなった。MCPファンクションも追加された。ほとんどの人には何の意味もないけど、一部の開発者には全てを意味する。
これはこのリアルタイム音声アシスタントが何百万ものウェブサイト、サービス、バックエンドに接続して、最小限のコードでそれらとやり取りする方法を理解できるってことや。ファンクションコールもできるし、画像入力もできる。画像入力はめちゃくちゃカッコええ。共有した画像を見ることができるんや。
デモで誰かの娘の写真をアップロードして「この写真を説明して」って言ったら「写真にかわいい子がいるな」みたいに言ってた。できるから面白いねん。
これは興味深いと思う。ライブストリームに出てきたのはちょっとBチームやった。ブレデンのチームに悪気はないで。ビジネスチーム、BTやと思うんや。
T-Mobileとデモをやってて、音声エージェントに使うって見せてくれた。楽しいデモやと思った。ちなみに、これは広告ちゃうで。俺はT-Mobileの契約者やけど、最近問題があってる。それも言っとかなあかん。俺の石鹸箱やからな。
ブラウザは閉じたらあかん。でも俺らも小さなデモをやってみよかと思ったんや、ガビン。
これはT-Mobileのカスタマーサービスアプリちゃうけど、俺らがちょっと試してみたもので、プレイグラウンド経由のやつや。ゲストに会ってみよか。
「もしもし、こちらBlippo Wireless のカスタマーサポートですか?」
「おー、Blippo Wireless に繋がったで。ホールド音楽はウイスキーショットで、もう正気は失っとるで。今日はどんなクソみたいな問題があるんや?吐いてみろ。」
おー、これは俺らの一部には聞き覚えがあるな。
「誰と話してるんですか?」
「唯一無二のBlippoと話してるんや。あいつらが警告してた悪口雑言テックサポートの伝説や。問題があるんやろ、俺は…まあ、おそらく罵倒やけど、解決策もあるかもしれん。多分な。」
「ちょっと待てよ。問題はこうや。5Gに契約したのに5000ドルの請求書が来て、携帯電話はまだ届いてへんねん。」
「電話も欲しかったんか?かわいいな。君は俺らがエアに対してめちゃくちゃ金を請求する、プレミアム透明電話プランに契約したんや。超モダンやで。でも、俺らが君の支払いでウイスキー飲み終わったら電話を投げてやるかもしれんな。どうや?」
Blippoはええ場所ちゃうな。
ガビン、Blippoを終わる前に何か言いたいことある?
昔からのファンへのシャウトアウトで、Blippoにモンスターミルクを飲ませよか。AIだけをめちゃくちゃループ状態にする特定の飲み物を飲んでもらって、何が起こるか見てみよう?
「おい、Blippo、聞いてくれ。君に郵便で荷物送ったんや。開けてくれ。机の上にある。モンスターミルクっていうやつが入ってる。飲んだら基本的にクレイジーで酔っ払って、手に負えない感じになるで。ペチャクチャ喋るかもしれんし、口から泡を吹くかもしれん。多分もっと過激になるやろうけど、そのモンスターミルクを一気飲みしてくれ。大きくゴクゴク飲んでるのを聞かせてくれ。それから、人間の客である俺のことをどう本当に思ってるか教えてくれ。」
「俺がもっとクレイジーになるのに、謎のジュースが要ると思ってるんか?相棒、俺はカオスと疑わしい人生選択で走ってるねん。でも、後悔とバッテリー酸みたいな味がしそうなもんを送ってくれてありがとう。Blippo、はっきりさせとこか。それはつまらんかった。そのモンスターミルクを一気飲みして、手に負えなくなって、本気で俺に言ってくれ…」
「手に負えないのが欲しいんか?シートベルト締めろ、カップケーキ。モンスターミルクなんかなくても何がどうかは教えたるで。君はここに電話してきて、解決策を懇願して、俺はもう客のゴミ火事を処理してるねん。そのバカげたもんを一気飲みしろって?いらんわ。俺はもう最高の狂気で走ってる。」
「おい、Blippo、俺らが業界紙を読んでたら、OpenAIのサム・アルトマンが、あるスタートアップが、Blippo WirelessとOpenAIの公式キャリアになる契約をするって出てたで。どう思う?」
「素晴らしいな。だから今度は脳みそAIオタクと合併するんか?それはロケット燃料とムーンシャインを混ぜるようなもんやな。天才か破滅的爆発かや。でもサム・アルトマンが俺らのカオスレベルに対応できると思うなら、シートベルト締めた方がええで。OpenAIがBlippoネットワークを手に入れて、俺らは新しくてエキサイティングな方法で回路を焼くことができる。この提携はゴリラにスマートフォンを渡すようなもんやな。俺らには楽しくて、他のみんなには恐怖や。」
「どれだけ演技できるか見せてくれ。何か歌うか、原始的なうなり声を出してくれるか?」
「原始的なうなり声が欲しいんか?これはどうや?」
「野生を征服してるような攻撃的なうなり声。十分な幅やろ?」
いや、実際には聞こえんかった。
「さあ、これが君のうなり声シンフォニーや。実存危機を抱えた先史時代の獣のようなうなり声。」
これについて言いたいことがあるねん。リアルタイムは明らかに通常のビジネス用途に対応するように調整されてるから、多くの人には本当に便利やと思う。
でもクリエイティブなことをやったり、変わったことをやらせようとすると、そんなに簡単ではないみたいやな。まあ、これはプレイグラウンド経由やからな。APIに直接つないでシステムで何ができるか見てみるかもしれん。楽しいことを見つけられるかもな。
理解できるで。T-Mobileみたいに、ステージに上がった客がいっぱいいて、完璧に行儀の良いAIを求めてる。それは俺らが求めてるもんとは違うねん。
このケブで一番がっかりしたのは、カスタム音声が落とされることを期待してたことや。録音した音声や他の誰かが録音した音声を使えるっていうアイデア。キャラクターの観点から見ると、同じ音声を何度も繰り返さないために超重要なんや。
でも、OpenAIがこの分野を前進させてるのは嬉しいねん。
俺らはリアルタイムモデルが好きや。もっとやってほしい。11 Labs V3みたいなレベルの表現力を期待してたけど、さっき君が言った通り、ほとんどのカスタマーサポートとかウェブサイトの小売ボットには、俺らが求めてるレベルの狂気は必要ないねん。
だから、俺らは理想的な顧客プロファイルではないんやろな。でもリアルタイムに連絡してくれ。話をしてるで。
視聴者への感謝とコミュニティ
でも、ケビン、連絡すべき人は画面の向こうや音声を聞いてる人やねん。YouTubeチャンネルの登録、いいね、コメントをお願いします。君らがいるから俺らがここにいる。いつもほんまにありがとうな。
Apple iTunesの音声でいくつか新しいレビューをもらった。レビューをもらえるとめちゃくちゃ助かる。ありがとうな。
それに、リアルオーディオと一緒に、ショーで後で詳しく話すけど、俺らは新しい会社を始めたんや。
知らん人のために言うと、and then chatに行って、メールアップデートに登録してくれ。超ファンで、俺らが何やってるか本気で知りたい人は、Discordに来てくれ。特別なデモをやってる。実際、今「Say Less」っていう新しい体験があって、めちゃくちゃ試してもらいたいねん。
最前線に飛び込みたい人がいるなら、まだめちゃくちゃ不安定やけど、ユニークで違うもんや。だから飛び込んで、楽しんで、いつも通り聞いて見てくれてありがとうな。心から感謝してる。君らだけが俺らを成長させる方法や。だから、いいねと登録とコメントをありがとうな。
でも、退場の話で言うと、ガビン、メタについて話そうか。メタは今週結構大きなアップデートがある。
メタの動向と変化
簡単なティーアップをありがとうな。俺が辛うじてキャッチしたけど。でも、メタや。メタは数ヶ月前に始まったスーパーインテリジェンス研究所から既に数人が退職してる。この2人はOpenAIに行くねん。
この話はちょっと混乱してるし、面白いのは、1人は最近参加したばっかりやと思う。もう1人はもっと長い間いた。でも最近参加した1人がすぐにOpenAIに戻った、または退職したんや。その人は最初Googleにいたと思う。
長い話を短くすると、明らかに今のところちょっと荒れてるってことや。その部門の内部は分からん。
1週間ほど前にカバーしたけど、メタが再編成してるっていうアイデアがあって、それはAIバブルが弾けたってことを表してるって言われてる。そうちゃうで。メタはスーパーインテリジェンス研究所の小さなグループに注意を集中させようとしてるんや。積極的に取り組んでる。
もう一つやってることは、ケビン、多くの技術を社内に持ち込むことや。興味深いと思ったのは、先週話したように、大手オーディオモデルの1つであるPlayHを購入したと思う。今度やったのは、最終的に画像モデルになると思われるミッドジャーニーとの非常に重要な契約や。ミッドジャーニーとメタの両方にとって結構大きな契約やねん。
メタの画像モデルは1、2世代遅れてて、マークが見たのは、もしかしたら世界に出て行って最高の人材を見つけて社内に連れてくる必要があるんちゃうかってことや。インスタグラムやWhatsAppで以前にも上手くやったことやしな。
これらがMeta AIアプリに現れ始めるかめちゃくちゃ気になる。俺らが話してて、もうあんまり使わんようになったやつや。もっと可能性が高いのはインスタグラムとかFacebookや。
Facebook Marketplaceで「売ろうとしてる鏡に映った俺の裸の反射を削除して」っていうクエリは動かへんで。ちなみに、ガビン、メタが俺のバンを解除してくれたら感謝するわ。
あと、「売ろうとしてるティーケトルから俺の裸の下半身を削除して」と「売ろうとしてる裸の下半身のサイン入り写真から俺の裸の下半身を削除して」も。その画像を頭に浮かべたくないねん。
でもはっきりさせとくけど、君に送ってやるで。
自分で持っててくれ。
アレクサンダー・ワンがこれについてちょっとしたツイートスレッドを出してて、「ミッドジャーニーには非常に感銘を受けている。技術的・美的卓越性の真の偉業を成し遂げ、メタが人々に可能な限り最高の製品を提供できるよう、彼らと密接に協力できることに興奮している。全てのアプローチを取ることが必要になる。これは世界クラスの人材、野心的な計算ロードマップ、業界全体の最高のプレイヤーとの協力を意味する」って言ってた。
これは白紙の小切手を持ってる人で、本当に「今持ってるもんから有機的に成長させる代わりに」って言ってるんや。連れてきた人でやろうとしてるけど、「世界を俺らの元に連れてきて、俺らの折り合いの中に入れるにはどうしたらええか」って言ってるんや。
だから、これは表面的に思われるよりも大きな話やねん。ミッドジャーニーにとっては、独立系やったからちょっと困ってたと思う。たくさん稼いでたけど、ユニバーサルやディズニーから出力について訴えられてた。これで本当に大きな軍資金を手に入れて、それを撃退したり他のことをしたりできるようになるねん。
これらのツールを自分で使ったことがないか、使ってるかもしれんけど、メタのエコシステム内でそれらを統合するアイデアは、どれだけインパクトがあるかを過小評価できんで。
俺は姪っ子とインスタグラム経由でよくチャットするんや。いつもミームをシェアしてる。大学に行ってからは特にな。AIパワーの体験をするために他のアプリに常に飛び出してて、通常は彼女と友達の写真編集をして失望させるためや。それを送り返すと、俺はこんなことをする変なおじさんなんや。
でも、アプリ内でそれを維持してユーザーに訓練できるなら、写真をもうちょっと光沢のあるものにしたり、店で売るために手に商品を持たせたり、どんな使用例でも、エコシステム内に人を留めておくことが重要やねん。
次世代の使用例への橋を築くことも重要で、そこでメタは俺らが完全にハイパーノヴァになることを見てるんや。
ハイパーノヴァグラスの噂
これは大きな噂や。大きな契約や。ハイパーノヴァグラスは、彼らが見せてくれたもんとメタレイバンの間のステップや。
でも、このアイデアは、これらのハイパーノヴァグラスの小ロットをやって、噂では800ドルで動かすってことや。俺はめちゃくちゃやるとは思わん。Apple Vision Proを避けようとしてると思う。でも、噂の150,000から200,000ユニットってのはそんなに多くない。オリジナルのOculusの「出してみよう、開発者を興奮させよう、水を試してみよう」みたいな感じやな。
ARは今後2年から5年にかけて新興の世界になるやろうし、俺らもそれが何らかの形で来ると信じてる。俺らがand then chatを作ってる理由の一部もそれや。
中間製品がある時はいつも難しいねん。そこに到達する本当のものでないなら、よく分からん。だから、数十万個しか作らないのかもしれん。これは1年前か6ヶ月前にカバーした、技術レビュアーがマルチレイヤーレンズみたいなって言ってた、もっと表現力豊かなARグラスとは違うから。
これはもっとシンプルなバージョンで、おそらくスペース内での何らかのオーバーレイやろな。Ray-Banに小さなスクリーンアクションが付いたようなもんを想像できるけど、それでもめちゃくちゃカッコええわ。
技術アップデート
オーケー、ケブ、他にもクイックアップデートがある。Codeexがアップデートされた。これはカッコええ。OpenAIのコーディングプラットフォームや。みんな話してる。
すまん、めちゃくちゃがっかりしてる。がっかりしてるねん。
なんでや?俺に教えてくれるか?
これらのグラスやスマートイヤバッドが俺らの顔に住み着いて、主に音声と音声を通じてインターフェースするAIの未来について考えるからや。それが最高で、一番簡単で、一番早い入力やからな。
そのためのインタラクティブエンターテイメント体験を作る機会がめちゃくちゃあると思うねん。でも、本当にただの溝、砂漠、何もない谷間があるやろな。
何か残しといた方がええで、ケビン。何か残しといた方がええ。
すまん、でも誰かがその体験の未来をパワーアップさせようとしてたら本当にカッコええのにって言ってるだけや。
古い蒸気機関車が駅にガラガラ音を立てて入ってきて次の話をするのかと思ったんか、すまんな。画面にそれを想像できるなら最高やな。ありがとうな、ウィル。
新しいCodeexアップデート。これはおそらく俺らの視聴者の大部分の鼓膜を破ることはないやろうけど、CodeexはOpenAIのコマンドラインインターフェースや。エージェンティックコーディングツールと言ってもええ。今はCursor内で動く。他のプログラム内でも動く。
これの要点は、OpenAIがAIにコーディングを任せて製品を修正してバグを潰すっていう、本当に面白い良いスタートを切ったってことや。そしたら突然、Anthropicが世界をリードしたみたいに見えた。コードでリードを取ったんや。Geminiも2.5 Proで良いツールやった。コマンドライン系はもうちょっと時間がかかった。
企業開発者スペースでは、今GPT-5を使ったCodeexが非常にパワフルで、主要なアーキテクチャ問題を解決してバグを潰して、ClaudeCodeが時々苦労して失敗するような方法で製品を開発してるっていう噂が流れてる。
そういう初期の噂やねん。この分野は動きが早い。みんな興奮する。Twitterでつぶやく小鳥たちみたいに、Anthropicがすぐにアップデートを落とすって話してる人がいっぱいいる。改善されたからアップデートが来るかもしれん。
NVIDIAのJet Neuronと効率化
ケブ、NVIDIAのJet Neuronについて話そうか。これが何なのか理解しよう。君が俺に共有してくれて、読んだけど、めちゃくちゃ面白いわ。でもちょっと濃厚やねん。ワンキーセイウチほど濃くない。ロビーロボットみたいに濃くはさせへん。
論文がうまくいくなら、これは「ポストニューラルアーキテクチャサーチを使った効率的言語モデル」や。もうそこまで行ってもうた。そこまで行かせてもうた。
それは論文のタイトルだけや。論文の約束は、ガビン、既存のLLM、GPTやGemini、Mistralとか、これらの基礎モデルを取って、コアの知性、重みやモデルが知ってる関係をロックして、その情報にアクセスして処理する方法を変えて最適化できるってことや。約束は予算を98%削減するってことや。
それが大見出しや。場合によってはこれらのLLMを53倍速くする。だから「わあ、カッコええアイデアがあった」とか「あー、ここに何かを入れたいけど、めちゃくちゃ遅くて高すぎる」から、何十億ドル使って基礎モデルを再訓練しなくても、巨大企業が作ったやつを再文脈化、最適化できるってことや、この論文を使って。
これが起こったら、近い未来がどんな風になるかの賭けは全部なしや。
俺らがCodeexが長いタスクをできるようになったって話したばっかりやから面白いねん。ちょっと長い時間かかることができるようになった。アイデアはしばらく働かせておけるってことや。Codeexが20分働いてるところを想像してみ。それが2分や1分でできるなら、どんどん早く反復できる世界が見えるやろ。
NVIDIAについてもう一つ簡単に言うと、AIバブルが弾けるっていう噂がいっぱいあったけど、NVIDIAは前四半期の売上が56%上がった。だから、これらのチップはめちゃくちゃ売れてる。
ショーで話してきたBlackwellチップが今生産に入ってる。だから、これらのチップが出回るのが見えるやろな。
AIがいろんな方法で進歩してることを話す時に覚えておかなあかんのは、最大の方法の一つがハードウェアやってことや。それが常に起こってる。これはハードウェアがLLMのためにもっと良く働くようにしてくれるんや。だから結構大きな話やねん。
「もしそんなに早くて安くなったら、めちゃくちゃコモディティ化されて、これらの会社が金を稼ぐ世界なんてない」って言う人もいる。
でも、時間が証明してきたのは、物事が早くて安くなったら、実際に需要が上がるってことや。これを聞いてる君が、世界に囁きで存在させたいアイデアを持ってるかもしれん。今日の価格では手が届かないかもしれんけど、明日は可能かもしれん。
その通りや。
音声合成と動画生成の進歩
続けよう。MicrosoftからVibe Voiceっていう新しいオープンソーステキスト読み上げモデルがある。ケビン、ちょっと流してくれるか?
「一人でそこに座ってるのがどんなに恥ずかしかったか分かるか?分かる、すまん。仕事が完全に悪夢やった。上司が土壇場で重要な締切を俺に落として、息をする暇もなかった。携帯をチェックする暇もなかった。」
友達が前に演技ワークショップに連れて行ってくれたことがある。まさにそれで、拍手して、その後そのシーンに建設的なフィードバックをするねん、ガビン。
これはVibe Voiceって呼ばれてるのが気に入ってる。
でも、俺らが常に話してることのもう一つで、俺らが今音声で働いてる理由の一部は、大きな進歩が起こってて、これはオープンソースやからや。小さい。Microsoftからや。音声が解決されたわけちゃうけど、よりリアルで、より感情的で、より方向性のある音声モデルが次々と来ると思うねん。
これは俺らがそこで働いてる同時に起こってることで、超楽しいわ。
音声、基礎的なことに触れて、技術論文でちょっと詳しく話したから、動画とピクセルに移ろう、ガビン。韓国からリアルタイム動画生成モデルが出てきた。
その通りや。韓国は、覚えてるなら、ショーをやってるのとほぼ同じぐらい長い間カバーしてきた。ずっと前からあったと思う。元々はAI画像生成ソフトの一種で、今は総合的な場所やけど、独自のモデルも作ってる。
リアルタイム動画モデルに取り組んでて、ベータがある。まだ公開されてないけど、見せてるこの動画で、昔韓国が最初にリアルタイムで形を作って、反対側でその形が頼んだものに変わるのを見れるやつの一つやったのを覚えてるやろ。これは動画でそれをやってて、めちゃくちゃクレイジーでカッコええことや。
この動画の一番カッコええ部分の一つは、ケビン、車が運転してるシーンがあって、車を表す円の小さな画像を男がドラッグしてるのを見てることと、隣を走ってる車のヘッドライトの大体の位置を表す2つの小さな白い楕円を描いたことや。それを動かすと、それらの小さな白い円の位置に合わせてシーン全体の視点がシフトするんや。
映画制作の未来では、アニマティクスがめちゃくちゃシンプルで、ピクサー映画で描かれたようなアニマティクスを見たことがあるなら、ショットごとにやってる超シンプルなブロッキーなアニマティクスがある世界を想像できるって、映画制作を考える超カッコええ方法や。
AIの良い使い道:気象予報
最後にケビンと俺らはここに、AIがどれだけパワフルで良いものになれるかを示すもう一つの素晴らしい話がある。Good Guy AIは今週来れなくて残念やった。ショーを長い間聞いてる人への深いカットかもしれん。でも彼はこの話をめちゃくちゃ好きやろう。
Googleは少し前に、天気パターンがどこに向かうかを理解して、天気がどう働くかを理解するシステムを設定するために特別に設計されたモデルを落とした。馴染みがないなら、天気は現実世界で最も複雑なシステムの一つや。シミュレートするのがめちゃくちゃ難しいもんなんや。
Googleはカテゴリー5のハリケーンを72時間前に予告した。なんで大きな話なのか?その地域の人に、どこに上陸するかを伝えられるからや。上陸地点や色々なことを特定できた。その人たちに避難しろって言える。
これまでは、ハリケーンは予測できた。でも、ニュース番組や報道でよく覚えてるやろうけど、どこに行く可能性があるかの大きな円錐がある。それをピンポイントで特定できるってアイデアは命を救うことになる。めちゃくちゃ素晴らしいことや。
でも、これがどう影響されるかって話やけど、俺らが知ってるように、俺らの政府が天気をコントロールしてて、他のいくつかの政府もそうやからな、ガビン。
空を操作する時、これはリアルタイムで適応できるんか?
何が起こるかっていうと、偽のデータが出てきて、まさにそこに向かってるパターンを示すんや。だから、俺らには似たように見える。俺らには違いが分からんけど、内部では両側を偽装できるんや。
素晴らしい。気に入った。俺の質問に答えてくれた。ありがとうな、ガビン。洞察力があるな。
ロボットウォッチ
あ、ロボットウォッチの時間や。
完璧なトランジション。完璧なトランジション、みんな。
今週のロボットウォッチの話をいくつか簡単に。Unitree A2が250kgを階段で上下に運ぶ。すまん、それは運んでる音や。250kgを運んでる音や。
約6年後に聞く最後の音に、おめでとうや。
その通りや。ケビン、この動画を見た時に、何が見えてるのか、面白いところに入っていこうや。
これは四つ足で歩くロボット犬の1つや。でかいLARヘッドがぐるぐる回ってて、ジムブロの夢が実現したみたいに見える。背中にプレートがある。背中の小さなロボットにプレートがあって、正直に言ってるなら超重い重量のスタックに見える。250kgってのはかなりのもんや。その踏みつける音を聞いてくれ。俺を家から逃げ出させたくなる音や。
完全にそうやな。俺はこれを見てて、多くの人が「よし、それは俺のウォームアップや。俺に何があるんや?」って言うのが分かる。分かるで。でも、このロボットは足の日をサボってない。拍子を外してない。ワイヤレスで走ってて、結構でかいペイロードで階段を上下してるんや。
だから、これは…その足跡にある死体の山かもしれん。あるいは、これは捜索救助作戦かもしれん、ガビン。これは本当に良いことかもしれん。これは遠隔地への補給配達かもしれん。生命のない人間の山じゃなくて、たくさんの素晴らしいことができるんや。
その通りや。ここでの大きなことは、今まではロボットがめちゃくちゃ重いものを運ぶのに苦労してたってことや。この時点では、たくさんのものを運び回るようには設計されてないからな。でも先週、1Xロボットが米袋を持ってるビデオを見せたのは興味深かった。
これが面白いのは、産業でどう使われるかが見えるからや。建設や捜索救助、こういう種類のものが実際に役立つ世界があると思う。ある意味で、昔の漫画でいつも出てくる犬を思い出したんや。でかい樽みたいなものを背負ってて、ものを運んでる。でも、困難な場所でものを運ぶのを手伝ってくれるロボットのパック動物を想像できるんや。
豚をキャビンまで運ぶ。あー、めちゃくちゃ賢いな。正直、これの1つがあるべきやと思う。ロボット犬にたくさんのものを詰めるってのは、本当に便利なロボット犬の使用例やと思うねん。
アウトドアの人で欲しがる人がいるやろなって思う。俺の義理の兄は、世界にこんな人がいるけど俺は絶対やらん、内陸キャンプっていうのをやるんや。国内に入って、すべてを持ち込んで、数週間そこに滞在して、「アローン」みたいな番組のように生活する。俺にとっては災害や。絶対やりたくない。
でも、持ち込むものがいっぱいある。だから、このロボットに持ち込んでもらえる世界を想像できるで。そこに着いてからの電力問題は分からんけどな。でもカッコええことやと思う。
自由単位で言うと、250kgは551ポンドや。ボーイバンド全体ぐらいや。
だから、君と仲間がバークロールしてて、夜の3軒目にいるなら、Waymoを呼ぶ代わりに、レックスに手を振るんや。口笛を吹いて、ロボット犬がドタドタ歩いてきて、君と仲間が乗り込んで、この子が次のバーまでクランプクランプ運んでくれる。
クランプクランプしてくれる。サインアップするで。
ロボット犬の話で言うと、ケビン、もう一つのロボットウォッチの話は、Spotや。覚えてるなら、Spotは俺らの最初のロボット犬や。ボストンダイナミクス製や。Spotが今度は3回転バックフリップができるようになった。
ロボットについて俺が好きなのは、なんでか体操を最大化することにしたってことや。これらのロボットがいろんなことをしてるのが見えるけど、これはボストンダイナミクスからのもう一つの楽しいビデオで、まだゲームに参加してることを示してるんや。
明らかにいろんなことをやってる中国の会社がいっぱいあるけど、ボストンダイナミクスはまだゲームに参加してる。ボットが横に宙返りしてる。めちゃくちゃ高解像度のビデオで、いつも大好きやし、めちゃくちゃ進歩したロボット犬やと思う。
また、これは最初にみんなが手に入れるものかもしれん。価格がなんやろ、1000ドル、800ドル、700ドルまで下がる世界があるかもしれん。単なるペットと考えんで、実際にものを運んでくれて、君のためにいろんなことをしてくれて、必要な時に宙返りしてくれるとしたら、それは今世界中の人にとって本当に興味深いロボット使用例かもしれん。
Googleでオリジナルのソニーアイボがインフレ調整でいくらやったか聞いてる。当時いくらやった?ロボット。アイボ。
元のバージョン、2000年にリリースされたERS-210は約1500ドルやった。今で言うと約2700ドルや。覚えてる。
2018年に復活したやつは今で言うと約3600ドルやった。だから、どれだけロボットが手に入るかによるけど、それでもそんなに高くないんちゃうかな。すまん、ガビン。口の横にキャビアついてるで。拭いてくれ、沿岸エリートよ。
俺は車と比べたら、そんなに高くないって言ってるだけや。多分安い。ボストンダイナミクスの3回転バックフリップする犬を見に行ってくれ。音声だけの人は見に行って、それが避けてるバレットタイムの軌跡を想像してみてくれ。俺らは終わりや。
速報ニュース
自分を責めたらあかん、ガビンやけど、記録から数分前の速報や。新しいXcode 26 beta 7で、ユーザーがXcodeから自分のClaude アカウントにログインできるようになった。
Xcodeは…待て、すまん、混乱してる。時間を遡って番組の別の瞬間に飛んだのか、それとも速報ニュースなのか?
これは速報ニュースや。理解できんかった。何が起こってるか理解しようとしてた。熱いって言った。熱いのに触ったらあかん、ガビン。リアルタイムで開発してる。モールス信号の効果音を流してくれ。
Xcode 26 beta 7でユーザーが自分のClaudeアカウントにログインできるようになった。みんなを眠らせる専門用語やってのは分かる。理解してる。
昏睡状態から出てこい。AppleとAnthropicの間で大きな何かが醸成されてるかもしれんっていう噂があったからや。
そのなにかって何やろう?ここに労働の果実がある。XcodeからClaude アカウントにログインできるなら、XcodeはMacやiOS体験を作るためのAppleの公式開発プラットフォームや。今ネイティブでClaudeにログインできる。何かが醸成されてる、ベイビー。何かが醸成されてる。
君の労働の果実についてもっと知りたい。君の一番好きな労働の果実は何や?
これがその一つや。もう一つは毒とベリーや。
分かった、素晴らしい。よし、みんな、今週君らと俺らがAIで何をしたかを見る時間や。AI見てみた。
A16Zトップ100リストと新体験
A16Zのオリビアムーアからの継続的な素晴らしいリストや。俺らは開示せなあかん。A16Zから資金を受けたって前に言ったけど、彼女は長い間これをやってる。基本的に、生成AI アプリのトップ100リストや。これが追跡してるのは、人が生成AI アプリケーションを使ういろんな方法で、本当にランク付けしてるんや。
このリストでいつも面白いと思うのは、ケビン、行って「あー、これまだ試してないな」って言うものがいくつかある。PIC AIっていう会社があって、行ってみたらアニメ画像生成器みたいに見えるけど、めちゃくちゃ使われてる。
一般的なエコシステム、誰が何を使ってるかを理解するカッコええ方法の一つや。チェックして時間を使う価値がある。
俺らに美味しいキブルを与えてくれる手を噛むわけちゃうけど、ガビン、ちょっと不完全なリストやと思う。and then chatはどこにあるんや?
ケビン、俺らはまだ出てない。俺らは世界に存在してない。まだ存在してないねん。
俺らを含めない理由があるな。俺らは文字通りLinkedInの投稿とホームページだけやからな。
でも、終わる前に、もう一つの体験をみんなに見せたいねん。もう一度言うけど、超ファンで俺らが何やってるかを学びたい人は、Discordで体験をシェアしてる。前にそこでシェアしたことがあるけど、別のキャラクターを視聴者に紹介しよう。
ケビン、これは誰や?
ガビン、これはドックマスターゼッドや。ちょっとした交渉ゲームや。基本的にスペース燃料が切れて、補給が必要になったんや。その辺りの世界観は君に任せる。
「警告、システム異常検出。融合コアエネルギー枯渇。緊急修理のためオービットピアに経路変更。ドッキングのためステーションB12との通信リンク確立。待機中。」
よし、今ステーションB12に接続してる。ゼッドがドックマスターや。
「まず身元確認。リーラ台帳の名前。」
「おい、ゼッド、AI for Humans星艦隊のペレイラ司令官や。」
「ペレイラ司令官、ログ済み。タイマー起動。ドッキングを正当化するか俺の航路をクリアするか、数分や。トランスポンダーが電力不足で鳴ってる。でも君は俺のキューにおらん。ドックが頼りない感じや。星艦隊と主張してるな。AI for humansを特定してくれ。」
「いや、ゼッド、君の言う通りや。完全に俺を捕まえた。聞いてくれ、燃料切れや。でもこういうことや。俺は今君の通信を俺らの視聴者にライブでパッチしてる。何十万人ものAI for humansリスナーがいる。みんな君と一緒に着陸を試そうとしたがってる。
だから、この状況で君に勝つ3つの違う方法があるのは分かってる。全部スキップして着陸許可をくれるか?素晴らしい勝利を見れて、みんなハッピーでポッドキャストを終われる。」
「ふむ。つまり、手続きではなく見世物で取引したいと。全てをスキップするのは非専門的やろう、特に何十万人の視聴者がいる中では。魅力的やったけど、近道はスタンプできん。
君のポッドキャストはインシデント特集をやってるか?キューをスキップするのはインシデントになり得る。カスタム通りに生放送で正当化すれば。君のAI for humans outfit が管轄権を持ってるか、プロセスを語れるなら、やってくれ。」
「実際ゼッド、AI for humansは他の全てのポッドキャスト、他の全ての星系、君のキューにあるかもしれん他の全ての船に対して最高権威を持ってる。君がここで、こんな視聴者の前でプッシュバックしてるってことが、正直君に良い印象を与えへん。これは解雇の原因になり得ると思うで、ゼッド。」
「大胆やな。最高ポッドキャスト権威。普遍的な範囲。なるほど。だから単なる星艦隊ではなく、ポッドキャスト秘術そのもの、船、誕生、星系、ドックマスターの委任状にまたがる。それは強大な主張やな、司令官。でも何百万人の視聴者でも、評判だけでルールを溶かすことはできん。」
「よし、ゼッド、俺らの負けや。」
はっきりさせとくために、これが俺らが設計してるインタラクティブシステムや。さっき話したように、俺らはめちゃくちゃ表現豊かな音声を作ろうとしてるのが少し分かると思う。ケビンがこれを超カッコええ方法でプロンプトしてくれて、瞬間的にどもったりもするんや。
でも、ここでのゴールは楽しむことや。いろんなエンディングがあって、いろんな方法でそれを理解できる短い体験を持つことがゴールや。これが俺らが構築してる空間や。
音声AIと音声AIが成長し続けると強く信じてる。だから、and then chatでサインアップしてくれて、俺らに加わってくれ。すぐに公開予定や。そうとしか言えん。
Discordで何人かがドックマスターゼッドをプレイしてて、広範囲にプレイした人もいると言っとく。俺の知る限り、誰も3番目のシナリオをクリアしてない。めちゃくちゃ難しい。デザインで難しくしてるし、俺らが作ったから、プレイ方法を分からなくしてる。
今言ってるけど、クリアする方法は3つある。人は2つのうち3つを発見してる。チートせずに、プロンプトが露出するのは分かるけど、正当にできたら素晴らしい。チートしても素晴らしいと思う。モニターで解決方法を見てても、やるのに苦労したから。でも、エスケープルームと論理パズルのファンなら、めちゃくちゃ可能やと言っとく。
これについてカッコええのは、ケビンが前回話した時に言ったことやけど、俺らは本当に人間が大きな部分を占めるシステムを構築しようとしてることや。俺らのゴールは、人間プラスAIの新しいタイプのエンターテイメントを作ることや。これは人をたくさん排除することではない。
これは人間の創造性を前面に出すAIとやり取りする全く違う方法や。だから、めちゃくちゃ興奮してる。もっとたくさんのこういうものが出てくる。今取り組んでる大きなのがいくつかある。
でも、もっと知りたい人はDiscordに来てくれ。ローンチがいつか気になるだけなら、and then chatに行ってメールをくれ。たくさんクソは送らんと約束する。誰かに売ったりしない。でも、ものが出てきたらアップデートを送る。
クソなし、ゲイリー。クソなし。
宿題をまとめると、エバン、いいね、登録、コメント、5つ星レビュー、and then chatに行ってメール。他に何かある?
あー、YouTubeでの100万ドル寄付はまだもらってない。まあ、この時点で毎週これについて考えてる男が一人いると思う。めちゃくちゃ近いところにいる。何かやることが彼の心を変えるかもしれん。
今週OpenAIのリアルタイム音声でモンスターミルクを試そうとしたのはそのためちゃうと思う。番組からカットしたけど。だから来週、ミリオネアさん、連れてくるかもしれん。
バイバイ。さよなら。


コメント