本動画では、AIが雇用に与える影響について詳細に分析している。Salesforceが4000人の雇用をAI自動化により削減したニュースを皮切りに、TeslaのOptimus 3ロボットのデモンストレーション、GoogleのNano Bananaによる画像生成技術の進歩、さらには新たなバイブコーディングプラットフォームやリアルタイムAI画像変換ツールMirage AIまで、AI技術の最新動向と実用化の現状を包括的に紹介している。特に、AI導入による職業への脅威と同時に、個人がAI技術を習得することで自身の価値を高める重要性について実践的なアドバイスを提供している。

AIが雇用に与える現実的影響
AIは単にあなたの仕事を奪おうとしているのではない。すでに奪い取ってしまったのかもしれない。Salesforce CEOのマーク・ベニオフは、AI自動化のおかげで何千もの雇用を削減したと発表したばかりだ。これは彼のエネルギーであって、必ずしも僕の考えではないけどね。
でもケビン、彼はまた、TeslaのOptimus 3のこの動画を「生産性を変えるゲームチェンジャー」と言っていたよ。
「やあOptimus、そこで何をしているんだい?」 「ただくつろいで、お手伝いする準備をしているところです。」
そう、それが未来なんだ。人間の仕事はないけれど、でも実際のところ何もうまく動かない。ありがたいことに、私たちには皆を忙しくさせるGoogleのNano Bananaがある。
GoogleのAI画像モデルで人々が作った驚くべき新しいことについて説明していこう。また、Googleはあなたのバイブコーディングのための新しいバイブコーディングプラットフォームをひっそりと立ち上げた。さらに、Mirage AIでは会議でリアルタイムAIフィルターができるし、退屈な現実のための新しいオープンソース画像モデルもある。ありがたいことに、ケビン、私たちにはそれは必要ない。私たちの現実はとても退屈だから。
なんて失礼な、ギャビン!「やあOptimus 3、オフィス・ワドルモードを起動しろ。」
わくわくするね。確かに。これがAI for Humansだ。
今週のAIニュース:雇用への影響
さて、AIにとってまた大きな一週間で、今週ケビン、AIが労働力、働き方全般に影響を与えているという事実について非常に興味深いニュースがある。
世界中で多くの人々を雇用してきた非常に大きな技術企業であるSalesforceが、AI自動化により4000人の雇用を削減したと発表したばかりだ。マーク・ベニオフがこの方法での成功を誇示している。これは確実に私たちが今住んでいる世界の前兆のように感じられる。
これについてあなたの最初の感想は?
ギャビン、僕はこのニュースにほとんど気づかなかった。Salesforceを検索していたら、サードパーティのAI搭載チャットボットによる大規模なデータ漏洩とハッキング事件の記事しか見えなかったからね。でも、それを隠すために費用削減について発表するなんて素晴らしい発表だね。
でも彼がこれについて話しているのを聞いてみようか?そう、彼が実際に何を言ったのか聞いてみよう。
「また、サポートの人員配置を調整することもできました。9000人から約5000人に削減しました。必要な人数が少なくなったからです。でも今はオムニチャンネル・スーパーバイザーもいて、エージェントと人間が協力して働けるよう支援しています。これが起こった最もエキサイティングなことです。」
そうだね。「必要な人数が少なくなった」か。まず最初に、彼らを人間ではなく「人数」として話すという考え方がちょっと恐ろしいが、これについて話す必要があるケビン。これは大きな問題だからだ。
これは世界全体に影響を与えるものになるだろう。明らかに、これらの大企業がこうした発表をする時を考えると、多くの場合、株価を上げようとしている、その他色々なことをしようとしているわけだ。でも世界中のAI嫌いの人々がAI自動化は多くの役職を狙っていると主張するかもしれないが、実際に一部のケースではこれがあなたにも起こるだろう。
では、まずこれが継続的なものだと感じるか?これが続くのを見続けることになるか?今これをどの程度真剣に受け止めているか?そして少し後で、あなたができることについても話そうか。でもケビン、君の頭の中で、この世界でこれを見たり感じたりしているか?君がやったことや働いた場所を通して。
100パーセントそうだ。明らかにより少ない人数でより多くのことができるという期待がある。あなたがAI第一でAI重視でなければ、そのポジションが何であれ、ツールが実際にそこにあって実証可能な質の変化があるかどうかに関係なく、失敗しているという期待がある。でも僕は個人的に、自分の仕事の一部を自動化する自動化戦略を実装したことがあり、もし部下がその仕事をしていたなら、そう、彼らも自動化されていただろう。だから否定できない。
ギャビン、これをAIウォッシングだと手を振って済ませたがる人たちがいる。企業は常にこれをやる。株の買い戻しを狙っている時には常に利益を抽出するし、CEOがより大きな退職金とより大きなボーナスを得られるよう人員削減をする、というわけだ。まあ、これが新しいスケープゴートだ。そしておそらく一定の割合でそういうことが起きている。
確かに。君と僕は毎日これらのツールを使っていて、毎日これらのツールでアンロックされる新しい能力に常に驚かされている。だからこれが新しい現実だ。新しい雇用が創出される場所に産業全体が追いつくまで、雇用は置き換えられていくだろう。
そして昨日Oracleでも多くのレイオフがあったという大きなニュースがあった。驚きのレイオフで、人々は知らなかった。これはまた、経済全体で起こっている雇用減速がAIによる部分もあるかもしれないというセントルイス連銀のニュースにも続いている。これはかなり大きな問題だ。
AIツールの習得と自己保護戦略
一般的に人々は、私たちが番組で何度も言ってきたように、これがAI関連を学び、自分自身を廃業させる人になるべき時だという認識を持つ必要がある。なぜなら、それを上司に示すことができれば、ある意味では実際に成功することになるからだ。ただし、ケビンの反対側には、自動化分野で他にも多くのことが起こっていて、その一つがロボティクスだ。
そして私がある意味でこれと組み合わせたいのは、4000人の雇用を削減したマーク・ベニオフが、Optimus 3ロボットの非常に早期のスニークピークも手に入れたということだ。生産性マシンが来るということで、エロンが後ろに立っていると思われる(エロンの声が後ろで聞こえるから)動画を見てみよう。
「やあOptimus、そこで何をしているんだい?」 「ただくつろいで、お手伝いする準備をしているところです。」
音声のみのリスナーのために一時停止する。これはマネキンの腕を持った金色っぽいOptimus 3ロボットだ。完全にマネキンの腕に見える。少なくとも確実にマネキンの手だ。マネキンの手と前腕だ。肘から下はマネキンっぽい。おそらく新しい手があるかもしれないから、見せたくないのかも。車をラッピングするようなものかもしれない。100パーセントそうだ。でもひざは基本的にカメラから遠ざかった方向を向いていて、ボットの胴体がカメラの方を向いている。金色だ。そこに立っている。マークが「何をしているの?」と聞き、ボットが「ただくつろいでお手伝いの準備をしています」と答える。
「やあOptimus、コカ・コーラはどこで手に入るか知ってる?」 「すみません、分かりません。それは録音ではありません。キッチンまでお連れすることはできます、コーラがあるかチェックしたければ。」 「ああ、そうですね。すみません、リアルタイム情報にはアクセスできません。ああ、キッチンまでお連れできます。」 「はい、そうしましょう。」
リアルタイムで展開させたい。行こう。 「素晴らしい。キッチンに向かいましょう。」 「オーケー、行こう。もう少しスペースを空けた方がいいと思う。」
それはおそらくエロンが横で、Optimusが移動するスペースについて非常に注意深いので、もう少しスペースを空けないといけないと言っている。もっと速く歩けるようにもなるだろう。そしてOptimusが歩き始める。これが朝の8時だったなら、これは彼がこのオフィスでやっている恥の行進のようなよろよろ歩きだ。でもOptimusは理論的にはキッチンのコカ・コーラまで連れて行くためによろよろ歩きを始める。
技術進歩と現実のギャップ
これについて興味深いのは、これは非常にクールで、Optimusロボットが大きな進歩を遂げていないという考えを否定したくないし、実際に進歩しているが、4000人の雇用を削減することについて話している人が、これを大きな新しい生産性のものとして投稿するのを見るのは本当に興味深い二分法だということだ。なぜならそれは、コーディングやマーケティングのような机上の白領世界で何ができるかと、これらのことの現実世界の体験との違いを示しているからだ。
このデモは意図的にこんなにひどかったのか?それは興味深い。本当に陰謀論的に考え始めているのか?
いや、聞いて。最近多くのロボットデモがあったよね?洗濯や皿洗いをするFigureロボットがある。中国からオリンピック競技レベルの競技も見てきた。そして繰り返すが、僕はOptimusについて楽観的だ。実際にアメリカのロボティクスが成功して機能することを望んでいる、誰がその背後にいるかに関係なく。でもこれはあまりにもひどく衝撃的だった。これはCybertruckの壊れた窓のようなものかと感じざるを得ない。「さあ、リリースしよう。」みたいな。
音声は最初ぎこちなかった。コマンドが失敗したように見えた。それから拾い上げたようだった。それから「オーケー、行こう」と言った。それから「ああ、実際に動作するよう後ろに下がろう」と言わなければならなかった。どうやってこれをリリースするんだ?
理論がある。僕の理論を聞きたい?僕の理論は、CEOたち、特に億万長者のCEOたちは、彼らの言葉や動画が実際に世界で何をするかについてしばしば曖昧だということだ。僕の直感では、マーク・ベニオフがTeslaのオフィスにいて、この動画を撮り、エロンがそこにいて、おそらく他に十億の事をやっていて、この動画を撮ってそれで良しとしてアップロードし、今私たち皆が見ているということだ。だから僕はこれが計画的なものではないと思う。明らかにプライムタイムの準備ができていないが、それはブランニューバージョンだ。君の言う通り、たぶん隠している側面もあるが、ここで理解すべき重要なことは、AIにより雇用が削減され得るし、私たちの視聴者全員がそれを聞いて立ち上がり、もしそうしたければその経験から自分を守るために何ができるか、または自分の事業を始めることを考えるべきだということと同時に、人々が思い描く未来からはまだ遠いかもしれないということの両方が真実であり得る世界にいるということだ。
僕がいつもこの分野について考えることの一つは、極端というものがあるということだ。一方の極端には、2年以内に完全に異なる惑星に住んでいて、すべてが異なるだろうと信じるテクノ楽観主義者たちがいる。もう一方の極端には、AIは何の役にも立たず、全く何の役にも立たず、決して何にもならないと信じる人々がいる。中間にいることを忘れてはいけない。物事がどこにあるかを認識する必要がある。なぜなら、それが今後5年間に私たちが住むであろう土地だと思うからだ。GPT-5は巨大な飛躍ではない。それでいい。考えることがたくさんある。
たぶんGemini 3が巨大な飛躍になるかもしれないが、私たちはこの移行のちょっと泥臭い中間にいる。そしてこれはその2つのことを見る本当に興味深い方法だった。
実践的な対策とアドバイス
君は先ほど何かを非常に素早く言ったが、もしこれを聞いて「でも私にはそれは無力だ、大きな産業の海に漂流していて巨大な波に吸収されないようにしようとしている」と思っているような人たちがいるなら、それに焦点を当てるべきだと思う。できることがいくつかある。
なので、一日単位の作業が排除されたり自動化されている。反復的なタスク、特にテキストベースなら、サポートや基本的なオペレーションをやっているなら、それは消えつつある。今、他の誰かがそれを自動化するのを待つか、ギャビンが先ほど言ったように、これらのツールを活用できることを示し、積極的になってそれらのやり方を学びに行くかだ。
奇妙に聞こえるかもしれないが、自分の仕事を自動化することを恐れてはいけない。僕には、理性的な監督がある理性的な企業であれば、それは「自分を自動化してくれてありがとう、さようなら」ではなく、「これは価値を置くべき従業員だ」ということを示すだろうと思える。その後、彼らはあなたを他のタスクに配置するだろう。自分のポジションを共食いするのは奇妙に思えるかもしれないが、それはあなたにできる非常に実行可能なことだ。これらのエージェントやツールのオーケストレーターになるよう努めれば、それが予見できる将来にわたってあなたのドアを開くだろう。
実際に本当に興味深い投稿があって、もしT-ROをご存じなければ、彼はAI分野のインサイダーだが、OpenAIが職場でAIを推進する方法についてのリーダーシップガイドを公開したと話していた。これは一部ではOpenAIからの「あなたはOpenAIを使って、このすべてをすることができる」ということだ。
でもこれの本当に興味深い他の部分は、実際にこれを読むと、職場でAIをどのように使うか、どのように企業を乗り気にさせ始めるかについて実際に話していることだ。そして覚えているなら、少し前、たぶん先週か先々週に、AIツールから価値を見つけていない企業の95%について話したが、それの一部はそれらが正しい方法で使用されることを確実にすることだ。
だからここで話しているすべてのことは、家にいるあなたのためのミッションの一種で、外に出て行って「オーケー、今やっているX、Y、Zを AIでどうやるかを理解できる」と言うことだ。まだ完璧ではないかもしれないが、ケビンの指摘通り、もしあなたがイニシアチブを示しているなら、あなたが雇用者なら、それはマネージャー、マネージャーのマネージャーにとって大きな問題になるだろう。
つい先日エンターテインメント業界の誰かと本当に興味深い会話をしたが、その人は何かでかなり大きな取引をまとめようとしていて、ある種のレガシーメディア組織を買おうとしていた。レガシーメディア組織が聞きたがっていたことの一つは、AI関連のことと、AI関連で何を計画するかもしれないかということだった。もしあなたがそのことを知っているなら、もしそれらのことについて方向性を持っているなら、もしあなたが組織のその人に「X、Y、Zはどうですか、これを取ってこうしたらどうですか」と言えるなら、あなたははるかに価値のある人になる。なぜならaそれはあなたがこれらのことを考え抜いて注意を払っていることを示すが、またケビン、重要なことは、後でこれに触れるが、人間の創造性はまだそれは、あなたが知っていることをどのように実践に移すか、どのように前に出すかということだ。
あなたが今なれない最大のことは賃金奴隷で、仕事をして立ち去るというような雰囲気だ。一部の人々はただそのように生きたいと思うので残念だと思う。でもあなたは自分を守ることができるよう、どこにいても身を乗り出す必要がある。これは非常に悲惨に聞こえるが、これらすべてが起こっている時期でもある。非常に速く感じる。
またグラインドセット(努力し続ける心構え)のXやLinkedIn側面の人々の大きな層があり、置き換えられるのに今ほど良い時期はないと言うだろう。なぜなら、もしあなたに少しでも願望があるなら、一人の人間が知識とこれらのツールへの情熱で、働いている企業を共食いして次の十億ドルビジネスを始められるツールがそこにあるからだ。
だからあなたはいつもその道を行き、企業に向かって拳を振って彼らを倒そうとするか、配管工になることもできる。そう、ケビン、配管工になることもできる。これはAIが引き継ぐであろう仕事の大きなリストがあるような物語の一つだ。そしてそれらの引き継がない仕事の一つが特に配管工だ。
熟練技能職は保護されるだろう。だからとても才能のある人々の多くが、たぶん電気技師や配管工やHVAC技術者になることを学ぼうと言っている。だからそれが非常に価値のあるスキルになる世界がある。そしてOptimusの点に関して言えば、そのOptimus 3が私のバスルームにやってきて、私がトイレにしたことを元に戻せるようになるまでには長い道のりがあると思う。そしておそらくあなたが期待するよりもずっと長いだろう。
GoogleのNano Bananaの革新的活用法
でもFigure O2は明らかに僕の妻から独占的データセットで訓練されたようで、食洗機を自律的に積み込むのを見て、ラックのスペースを全く最適化していなかった。これは動画だ。この話し合いをしたことがある。彼女の後ろで悪口を言っているわけではないが、食洗機を見ると、動画では基本的にランダムに皿を置いているだけで、実際に洗える皿の約3分の1しか洗えない。
僕の家族はいつも巨大な水切りやフライパンを入れる。いや、手で洗え。ラック全体のスペースを取る一つの物だ。そう、そう。ギャビンと僕、これは僕の人生最大の関心事で、それが僕がどれほど#特権的かということだ。時々ギャビン、スプーンを上にしたり、時々下にしたりするが、カトラリーにナイフを上にしたりする。確かに。誰がナイフを上に置くんだ?やめなさい。Figure O2来い。
これはFigure O2について明確にしたい。僕はFigure O2についてのみ怒っている。でも実際に見るのは、洗濯をしているFigureを見てきたよね?それについてのいくつかの異なるデモ。これは同じエンドツーエンドAIモデルの種類で、僕はそれに食洗機の積み込みでC評価を与えるが、それは繊細なガラスを扱っている。皿を操作している。それらを回転させている。食洗機に置いている。そして繰り返すが、これは同じモデルだ。だから理論的には、過去にこのようなデモを見た時は、それは非常に高度に制御された環境で、その特定のことを扱うよう設計された非常に限定的なオンレールコードだった。
これがどの程度オンレールかは分からないが、約束は彼らの一つのモデルがすべてを統治するというようなもののようだ。だからたぶんおそらく彼らはこの知識をロボットにダウンロードし、それができるようになった。確実には分からないが、彼らのツイートで言っているのは新しいアルゴリズムはなし、特別なケースエンジニアリングはなし、ただ新しいデータだけということだ。
だからこれはタオルを畳んだり荷物を仕分けたりしていた同じロボットだ。だから今これができる。それは大きな問題だ。これは明らかに最先端で、Optimus 2を見ると、これにもう少し近いが、配管工版のこれまでにはたぶん数年かかるだろう。とにかく、続けて皆さん。
もしそこにいるなら、これらのAIツールを試すことを確実にしてください。でもケビン、先に進む前に、私たちは人々にもう一つ確実にしてもらう必要があることを伝えなければならない。それはAI for Humansチャンネルをいいね、購読することだ。なぜなら、そこにいるあなた方、人々が私たちをサポートし、私たちをこれらすべての新しい人々のところに連れて行ってくれるからだ。
いいねや購読をすることで、より多くの人々がそれを見ることができる。また、もしオーディオに行って5つ星のレビューを残してくれれば、私たちはいつもそれを見る。実際、私たちのウェブサイトは自動的にそれをツイートする。だからそれは知っておくべきことだ。もし5つ星のレビューを残してくれれば、時には私たちが知らないうちに私たちから自動ツイートが来るだろう。
でもお願いだから全部やってください。そして最後に、andchat.comに行ってください。私たちは番組でこれについて話してきた。私たちはA16Z Speedrunから資金調達を受けた新しいスタートアップに非常に懸命に取り組んでいる。大体3〜4週間で、何があっても立ち上げる予定だ。私たちが取り組んでいることについて非常にワクワクしている。でもお願いだから、もっと学ぶためにそこに行ってください。
そして再び、もし何か興味深いことがあるなら私たちのDiscordに来てください。もうすぐいくつかのことをシェアするかもしれません。そしてもしあなたがそれらのYouTubeコメントにいるなら、アルゴジュースをいつもありがとう。甘いアルゴジュースのための小さなコメントをいつも感謝している。
そう。それが正しい。よし、ケビン、再びNano Bananaについて話そう。先週、Nano Bananaがインターネットを席巻し、私たちはそれでたくさん遊んでいる。僕がこれについて好きなこと、そして40 image genで起こったことは、これほど大きなものが出てきた時(これほど大きいというのは、Google AI studioのような検索が久しぶりに大幅に増加したようなもので、Googleがこれで料理して、ブランドが非常に強い)、とても多くの人々がそれをやっているのを見ることだ。
だから2つのことが起こる。一つは、より多くの興味深いクリエイティブな人々がそれで遊んでくれることだ。一方で、それについてのより多くのハイプ獣のような投稿も得られるが、それについては少し話そう。でもクリエイティブなものは本当にクールだ。なぜなら誰かがこれらのことの一つをアンロックするたびに、いつも「ああ、それは本当に楽しい。やってみたい」みたいに思うからだ。だからこれらのクールなことをいくつか話したい。そしてこれらはあなたが今すぐ無料で行ってできることだ。では、これらのうちどれがあなたが見た時に最も興味深かったか?
実際、基本的に画像をマークアップして、それを使って指示を送ることができるという最初の例は、V3という彼らのビデオモデルで見たことがあるので、ここで動作するのは理にかなっている。でもソース素材への密着性と一貫性が僕を驚かせる。
例えば、もしあなたが画面でここを見ているなら、プラシャントが投稿したX上の例、オリジナルの素材だったかどうか分からないので申し訳ないが、彼らはドレスを着た3人の女性の写真を持っていた。彼らは色のついた円で彼女たちを囲み、それからテーブルの周りにいくつかの椅子があるような空の居間兼食事室のシナリオの別の画像を追加し、基本的に椅子の上に空の色のついた円を置いて、モデルに「色のついた円を持つ人を椅子の上の色のついた円と一致させて」と伝えた。そしてモデルはそれを理解した。適切にポーズをとらせた。窓から入ってくる光を含め、モデルの一人が座っている場所に影を追加し、照明を含めたようだった。だから細かいディテールがそこにある。ドレス、イヤリング、すべてのニュアンスを本当に理解したようだった。それは本当にクリーンな例だ。
だから複雑な画像操作をしたい場合は、それができる。これは僕が見たことがなかったものだった。この色の円や色のアイデアで、異なる色を選んでその人をどこに配置したいかを表現するという。それはO3で以前に見たことがなかったものだった。
もう一つの本当にクールで非常にシンプルなものは、Martin Leblancが提案したもので、より良いグリーンスクリーンをするために、もしあなたが自分をグリーンスクリーンで背景に入れたい場合、どこかに置くよう求めるのではなく、実際にNano Bananaに最初に自分をグリーンスクリーンして、それからどこかに置くよう求めることができるということだ。そして実際にライティングがずっと良い。そして再び、これはAIビデオや写真モデルを単純なPhotoshopというよりも、より多くのことを考え抜くことができるものとして考えるすべての異なる方法だ。それがあなたが望むものを理解しようとしていると想像しなければならない。この多くは全体的により良い指示を与えることだ。
ああ、グリーンスクリーンにしてから変更するというハックは、あなたを落とし込む新しいシーンで、ずっと良いライティングを生成するようだ。だからそれは良いものだ。Hello Robへのシャウトアウト。彼らがcomfy UIトライオンワークフローを構築したX上の投稿を見た。ギャビン、これを見て。
本当にすごい。だからもう一度音声のみの人たちのために、彼らはモデルの異なる視点からの写真を撮り、それからフラットレイを撮った。基本的に、ルックにあるワードローブを並べる時だ。だからシャツの隣にショーツ、眼鏡の隣に何でも、彼らはそれをすべて一度にComfy UIに送り込み、ボタンを押すと、即座に複数アングルの、超正確なトライオンが得られる。とてもクール。多くの微調整なしに。
Robもそのことを彼の投稿で叫んでいる。彼は「これはもっと良くなり得る。これは最初のパスだった」と言っているが、例を見ると、素晴らしく見える。だから僕はこれのために作られるかもしれないアプリや、すでに作られていて人々がアプリをバイブコーディングすることに基づいて完全に共食いされるかもしれないアプリについて考え始める。これについてはすぐに触れる。
ここでの他のいくつかのこと、いつも愛しているFR AIは、プログレッシブスケッチングでいくつかのことをやった。これは非常にクールなことだ。もし遊んだことがなくて、描くことで育ったなら、フクロウの描き方や何かの描き方のような本にあったかもしれないし、円を見て、それから各ステップを見たかもしれないが、今はNano Bananaでほぼどんな画像でもそれができる。これは非常にクールなことだ。
4つの異なるルックを段階的に案内するのを非常に上手にやる。驚かされた使い方だった。実際、僕はプログレッシブプロンプティングに賛成だ。スケッチングは消えていくと思うし、最初のものはリンゴになると思う。それからリンゴの色を説明することを学ぶだろう。それからレンズの視点のような、私たちの子供たちの世界、それが彼らが住むことになる世界だ。または私たちの孫たち。なぜ私たちは紙の上に画像を作るために原始的なツールを使うために手を上げることがあるだろうか?邪魔をするな。邪魔をするな。
もう一つのこと、Tech Hollaは、もしフォローしていないなら、すべきだが、彼はいつも非常に興味深いデモをやっている。彼はNano Bananaを使って、たぶんFreepickを通じて(それは彼のスポンサーの一つかもしれない、だからそれを心に留めておいて)、基本的に自分を取り、ビデオゲームに入れ、作ったすべての異なるクールなもので、それをビデオにした方法をステップバイステップで示した。ビデオは非常に良い。もし音声だけを聞いているなら、見に行くことを本当に提案する。
それはキャラクターの一貫性とスタイルの一貫性を持っている今、画像ごとに本当にストーリーを語り始めることができ、それらの画像を持ったら、それらが非常に良いのでそれらのビデオを作ることができるということを示すクールな方法だ。
そして番組の友人だと思う。番組のファンと言うのは行き過ぎかもしれないが、Glyphを運営するFabian Steltzer、Glyphへのシャウトアウト。私たちは番組で何度か彼らを取り上げてきた。彼らはいつも興味深い拡張機能とワークフローと楽しい実験を持っている。Fabianは Nanoで本当に本当にすごいアートを作って夢中になっている。無限のビデオ生成やこの髪のトライオンのようなもの。このタイプのことをやっている多くの人を見た。つまりこれはバイラルになった。彼がそれを作ってバイラルになったようなものの一つで、もしただ聞いているだけならYouTubeでも見てほしいが、彼を見ると、普通はちょっと白髪交じりの短い髪だが、頭からカールが垂れ下がってくるのを見て、それから多くの異なるヘアスタイルを見る。そして再びこれはNano Bananaの写真に基づいて作られたビデオで、それからビデオツールを使ってそれをつなぎ合わせるが、再びNano Bananaを試しに行ってほしい。それは無料で使える。私たちが見た本当に最高の画像ツールの一つだ。40 image genほど良くないこともあるが、全体的にそれで新しいクリエイティブスペースに本当に足を踏み入れているような感じがする。だから試しに行って、gemini.google.comに行くなら。それがサイトだ。ハッシュタグ広告ではない。
でもお願いGoogle、私たちは聞いている。僕もまたギャビン、Googleが聞いているかもしれないと思う。なぜなら先週私たちはNano BananaがGemini 2.5 instant flash全く新しいものを使ってV2モデルと彼らが呼んだものの後ろにモデルを隠すよりもずっと強い名前だと言ったからだ。彼らは画像生成ボタンにバナナの絵文字を追加した。だからどういたしましてGoogle、そして私たちは買われることができる。雇われて相談を受けることを意味した。
Googleが実際に私たちに広告について連絡してきて、私たちがただ忙しすぎて実際にGoogleと広告することができなかったと言おう。だからGoogleのその側面もある。だから一部では私たちのせいだ。一部では私たちのせいだ。だから私たちは何が起こったかを認めたい。それについては後で触れよう。
GoogleのAI Studioでのバイブコーディング
よし。次に、Googleと言えば、Logan KilpatrickはGoogleの顔のような人だが、AI studioで新しいことをからかった。そしてケビン、これはstudio.google.com/appsの下でのバイブコーディングスイートだ。もし今そこに行くなら、ちなみに僕はこの経験をするが、それが通してくれない時があるが、一度それに入ると、バイブコーディングのための非常にクールなフロントエンドだ。
そして再び、これは私たちが知っている人々やバイブコーディングスタートアップが始まったようなもので、しかしGoogle自体が基本的に彼らのスタジオでバイブコーディングプラットフォームを構築している時、これは非常に大きな問題だと思う。なぜなら、オーケー、Repletは成功してきた、これらすべてのアプリが成功してきたということを示していると思うからだ。何だと思う?これはGoogleが食べることができるものだ。もしGemini 3のコーディングモデルが良いなら、彼らはそれを完全に食べることができる。これはあなたが注意しなければならない本当のことだ。
つまりこれは今2.5を使っている。彼らは私たちがちょうど話していたGemini 2.5 flash画像モデル、Nano Bananaを使うクックブック1のようなテンプレートさえ持っている。だからそれでアプリを構築するアイデアがあるなら、ネイティブサポートがそこにある。
僕は実際に今朝ワンショット、ワンプロンプトでアプリをバイブした。それはマイクを使った。Google LLMを音声からテキストと推論のために自動的に配線した。起こっていたもののいくつかに関連する音の再生があった。
そしてそれは僕が実際に見せびらかしたくないもののようなものだった。なぜなら友人とシェアしているからだ。それは彼らのアイデアだった。彼らはアプリのアイデアを持っていて、僕は基本的にワンショットでできるかどうか疑問に思ったが、もしコードの書き方を知らないなら、これはあなたが始めるべき一つだ。なぜならコードに触れる必要がないからだ。自然言語を使える。完全に有能なコーディングモデルであるGemini 2.5を使う。
それはブラウザでアプリの実行を編成し、それとチャットし続けることができ、基本的に各ターンが終わったらそれは更新される。ソースファイル、それらを正しいスポットに配置し、ブラウザでただ動作し、本当にエキサイティングな方法だった。だからGoogleは料理し続けている。
つまり僕は2.5が最初に出た時のことを覚えている。あの小さなクマのジャンプゲームをブラウザ内でやったのを覚えているかどうか分からないが、今はスペースでそれができるという考えは素晴らしい。
Mirage AIのリアルタイム映像変換
今朝出てきた別の本当に興味深いクールなAIツールがある、ケビン。君も同様に遊んだ。それはMirage AIと呼ばれる。Mirage AIはやっている多くのことがある。彼らは主にオープンソースビデオ関連で働いていると思うが、リアルタイムウェブカム変換を出してきた。そしてあなたはこれを試しに行くことができる。少し待つかもしれないが、基本的なアイデアは、ウェブカムで誰かと会話して、それからそれをどのように見えるようにしたいかプロンプトできるということだ。
V3のようには見えないだろうが、リアルタイムでそれを切り替えられるという事実は非常に信じられない。Every ShowのDan Shipperの注意を引いてくれたことへのシャウトアウトと彼がやったインタビュー。でもケビン、君は今朝これで遊んで、非常に興味深い結果を得た。
つまり、彼らのサイトに行ってデモを実行しようとすることができる。無料だ。キューで立ち往生するかもしれないし、数秒待つことを強制されるかもしれないが、ウェブカムが起動すると、自動的に彼らの事前生成されたワールドやスタイルのいくつかを循環している横にカルーセルのようなものがある。
だから僕はレゴキャラクターのように見ることから魔法使い、Minecraftタイプの人まで行った。そしてこれらのある時点で君は僕のように見える。何?どうやってこうなった?君は僕の年上バージョンのように見える。これに行くと、なぜ僕の写真をそれに入れたの?僕は何が起こったと思っていた?君は何を笑っているんだ?
僕は疲れたと書くつもりだった。ただ疲れたと書いた。何てことだ、これは最も奇妙なことだ。そして何らかの形で君と僕がショーを一緒にやっていることを知っていて、そこに保持があったのかと思う。僕はヘルスケープとタイプして、部屋全体が赤くなって、物を得たと仮定する?それはヤーンワールドの下だった。でも僕はあなたが送ったこのビデオをざっと見ていて、白髪または黄色い髪の僕の写真のように見えるよね?これを見て。黄色い髪や白髪の僕を想像して。君は自分がどれほど美しいかを軽視していると思う、ギャビン。
オーケー、僕たちはちょっと一般的に見えると思う。それが学んでいることだと思う。僕には何らかの奇妙なトレーニングデータのようなものがあるかもしれないと思うほど十分に僕のように見える。君のトレーニングデータは何だ?いや、聞いて、まず第一に、とてもクール。
人々は「でもSnapchatフィルターがあるし、Google hangoutやGoogle meetでこれができる、AIやARで自分を拡張できる」と言うが、ある程度はそれは真実だが、これは異なるアプローチだ。これは拡散モデルで、トラッキングして特徴を追加しようとするのではなく、全体の画像をピクセル単位で変更していると信じている。
彼らは、このモデルの新しいバージョンは14ミリ秒のレイテンシーを持ち、それはリアルタイムに非常に近いだろうと言っている。そして話していることについて、これはおそらくかなり大きくて計算集約的なモデルで、だからキューで待つことになる。でもこれを近い将来に外挿すると、顔にレンズがあって、リアルタイムで入ってくる画像を修正でき、突然2回手を叩くと世界が歩き回っている時に望む通りに見える。
すごい。コカ・コーラのコマーシャルのように見える。これは来るARの世界全体の約束だよね。ARの世界について話す時、ある時点でこれはあなたが見回してこのようなものを見るようなもので、もしピンクのうさぎの世界に住みたいならピンクのうさぎの世界に住むことができ、僕は紫のカバの世界に住むことができ、私たちは会話するが、僕にとって君は紫のカバで、君にとって僕はピンクのうさぎになる。それは確実に来る。
そう、それが正しい。私たちのどちらかに突っ込むWhimoはうさぎかカバのように見えるだろうし、ネオンの街を渡った後にうさぎやカバの天国に行くときにそれは素晴らしい現実ではないか。とにかく、非常にクールなこと。試しに行こう。
オープンソース画像モデルの進歩
オーケー、ケブ。次に、Haigsfield draw toedit。これはHaigsfieldがリリースしたもう一つのクールなツールで、Nano Bananaと非常に関係があるが、これについて話したい非常に具体的なことがある。だからまたHaigsfieldは非常にクールな会社だ。彼らは画像モデルで多くの本当に興味深いことをやっている。彼らは無料ピックとしてNano Bananaに懸命に寄りかかっている。
これらの他の会社すべてと私たちは取引がないことを明確にしておく。ケビン、話したいことは、昨日Twitterでdraw toeitという用語がトレンドになっているのを見て、draw toeitという奇妙なフレーズがTwitterでトレンドになっているのを見るのはかなりクレイジーだと思って、それをクリックした。ケビン、それをクリックした時に言わなければならないが、Haigsfieldについて少し前に言ったことがあるが、クリックしたすべての投稿が、AIボットによって書かれたか、ツールとして支払われたかのどちらかに見えた。
今、出かけようとしているのではない。これに対する答えは分からないか分からない。Haigsfieldは新しいものを世界に出すのが非常に上手だと言おう。そしてこれは一部draw toeitは彼らのサービスの1年間のサブスクリプションを獲得するために人々を得るための一種のコンテストだったと思う。
でもそれは僕に非常に考えさせた。なぜなら特定のアカウントのいくつかを見て回ったからで、それらのいくつかは大きなインフルエンサーで、私たちは特定のインフルエンサーについて話してきたことを知っている。彼らは行き過ぎて、Haigsfieldモデルはすべての終わりの終わりだと言うようなことがあり、それは存在する。でも他のいくつかを見て回り始めて、これは8000フォロワーがいる、これは4000フォロワーがいると思った。そして彼らのものを見下ろすと、再び私は何も非難していないことを明確にしたいが、たぶんこれは確実に私たちが成長している世界、ボットの世界だと感じた。これを見る時、そして再び確実に誰がこれをやることを計画したかは分からない。彼らかもしれないし、そうでないかもしれないし、たぶんこれらはボットではない。
これらはすべて本当のアカウントだが、何かがTwitterでトレンドになるのに十分に調整されていると感じた瞬間を本当に見たのは初めてだった。それから君がランダウンに入れたこのことを投稿したが、Sam Altmanが昨日これらのTwitterでのより多くのボットのアイデアについて話し始めたので興味深いと思った。
Sam Altmanは死んだインターネット理論を「そこには本当にひどい状況がある」と基本的に言った。彼は「死んだインターネット理論を真剣に受け取ったことはなかったが、今は本当にLLMで運営されたTwitterアカウントがたくさんあるようだ」と言う。だから彼はXまたはTwitterに特定の攻撃をしている。
僕はもちろんそう言うだろうし、それはRedditにも適用されると思う。Metaプロダクトにも適用されると思う。今はほぼすべてに適用されると思う?私たちが長い間言ってきたようなものだ。僕は今見ているもののほとんどがAIによって生成されたか、クラウドのどこかのクリックファームやサーバーファームによって生成されたと、デフォルトで仮定している。
そうそう。そしてこの一つについて興味深いこと、そして再びHelについて何も非難していない。4回目だが明確にしたい。でもこの一つについて興味深いことは、それは存在するものを人々が武器化するのを見るようなものの少しのようなことで、それが行き過ぎになり始めて、これらのような種類のことを見始めて、それがフィードを埋め尽くす時、そのツールから離れたと言わなければならない。なぜならああ、これはクレイジーすぎると思ったからだ。このことについて有機的なものが来ているようには感じられない。
そして再び、たぶん有機的なものを見なかっただけかもしれない。おそらくそれについての有機的な投稿があったが、まずソーシャルメディアについて、そして大まかに悪い気分にさせ始めるが、また僕にとってはもう機能しない。
そして数字が上がることの一部で機能すると思うが、長くは機能しないと思う期間に入っていると思う。人間の証明が人間の証明になる時点に達すると思うか?面白いことに、Altmanは昔彼のスキャニングオーブトークンやあらゆる種類のもので、それをやろうとしていた。
でも5億フォロワーを持つことは、50人の検証された人間のフォロワーを持つよりもずっと興味深くないような世界がそれになるのかと思う。
100パーセント。実際、僕は世界を見たいし、再びXでの同じことはElon に対する一撃かもしれない。Nikita Byerへのシャウトアウトを言おう。彼はボットを排除する作業をしようとしていると信じるXのプロダクトヘッドとして雇われた。だから確実には分からないが、検証されたフォロワー数のような世界を見たい。実際にそのようなものを得た世界。
とにかく、それは追いかける本当に興味深いことだ。もしこの多くを自分で見たなら、コメントで知らせて。価値がある。そしてもしボットなら、コメントも残して。ビープ。確実にボットがいる。YouTubeにコメントを残すボットが確実にいて、僕はいつもそれらに返事をしている。
よし、ケビン、これに飛び込もう。オープンソース画像の世界での非常にクールなストーリー。これはQuinnからのBoring Loraだ。Cudsyによって作られた。そして明確にするために、Loraとは、モデルをトレーニングしている画像のコレクションで、その画像のように見えるが同じ種類のスタイルを持つ画像を生成するためのものだ。そしてこれについて素晴らしいこと、ケブは、前に言ったが、時々AI画像やビデオをリアルに見せるには、それらを悪く見せなければならない。なぜなら時々AIは非常にファンシーに感じるようなものを出したがるからだ。
これは僕が見た中で断然最高に見えるリアリズムモデルだ。アニメのカットアウトを持った男の素晴らしい写真がいくつかある。ライオンの口で働く歯医者の驚くべきショットがある。自分で遊べる非常にクールなものだと思う。そして本当に興味深い例がたくさんある。そして再び、Hugging Faceに行って今すぐ自分で試すことができる。
Red Bullで洗礼を受けている赤ちゃんは心を打つほど良いか、ピアノのパグだ。それは、私たちのような古い頭なら、使い捨てまたはインスタントカメラを写真を撮るために回転させなければならなかった古いもののようなものだ。それはその厳しいフラッシュルックを与える。
最高の品質のレンズではない。でもそれは物を作る。照明は2012年からの写真としてフォークリフトを操作するロブスターを見ると、「ああ、そう、それは本当のように見える」と言うような方法で平らな部分がある。
これは再び、Robだ。だからHello Rob。君はこれで2つのシャウトアウトを得る。でも彼が見たモンスタードリンクを握って煙草を吸っているサルがいるのを見たか?これが僕がAIにやってほしいことだよね?だからこれはとても楽しいし、これらのことができる。そして再び、オープンソースモデルかもしれない、これが多くの方法で使用されるであろうもの、有用であろうもの。
より大きなモデルがあなたにやってほしくないかもしれないことや、それがそのような大きなツールなので、それからこれらの結果を得ることができないであろうことができるだろう。でもそれは超楽しい。遊びに行こう。そして再び、ショーノートにリンクを入れる。今すぐHugging Faceに行って自分のものを生成できる。
AI見つけたシリーズ
よし、ケビン。今週あなたがAIでインターネット周りでやったことを見る時間だ。
AI見つけたシリーズ
時々何の気なしにスクロールしている 突然立ち止まって叫ぶ
よし、ギャビン。これは昨夜遅くに出てきた。僕はまだそれを自分でインストールする機会がなかったが、それを見てすぐに君に送って、どれだけクールかと思った。
これはDamen Masonが投稿したビジュアルストーリーライティングで、基本的に物語を書きながらキャラクターや状況、それらのキャラクター間のアクションを紹介している間に、リアルタイムでキャラクター間の関係を見ることができる横にビジュアルマインドマップを得るワードプロセッサーだ。
あなたの物語のグラフィカルなタイムラインの並べ替えを得て、スクロールしてそれらの関係がどのように進化し変化するかを見ることができる。そしてそれは僕に考えさせた、わあ、これは興味深い新しいインターフェースだ。そこに人気のある物語をロードして関係を見たいが、また従来のテキスト叙述のためのワークフロー図で創造するのはどのようなものかも見たい。この時点で、僕はこれらの2つのキャラクターを引き離したい、そして彼らの間に起こることがこれで、それから他のすべてに視覚的にどう影響するかを見たい。それは超クールだ。僕はそれがオープンソースだと信じている。実行できるGitHubコードがいくつかあるが、デモページもある。でも僕に「やあ、君が何をやったか見たぞ」と言わせた興味深いことだった。
君はやった。君はやったんだ。オーケー。他に何を持っている?君はこれらのいくつかをここに入れた。今回君が僕に何を持っているか見たい。
ブリット…まあ、これは超オタクだが、2時間前に出てきたばかりで、Google がEmbedding Gemmaを発表した。だから待って、私たちは今、ICOのメイン企業ストーリーに戻っているのか?これらはAI見つけたの神聖さを汚したか?でも大丈夫、ブレイキングニュースのグラフィックを出すことができる。ブレイキングニュース、先週のようなブレイキングニュース、オーケー。
まだ残っている人たちのために、Googleがあなたの携帯電話での埋め込みをより効率的で興味深くするものを落としたことを知ってほしい。それはクールだ。携帯電話での埋め込みとはどういう意味か知っている。
メールやテキストメッセージや大きなPDFやファイルや画像でさえ持っている時、それらは埋め込みデータポイント、データ間の関係として保存される必要があり、LLMがそれを調べる必要がある時、それは超高速で効率的だ。
だから携帯電話、タブレット、将来のスマートグラスで動く小さなオンデバイスモデルのために、それは物事を正確に埋め込むことができる必要がある。これは正確に埋め込む必要があるべきでないもののざっとした概要で、AI見つけたであるべきではない。
申し訳ない。AI見つけたを見た。Google、世界第3位の大企業。良い仕事。次は何?次は何、ケビン?小さくて興味深いことをやった誰かがいる。クールで気に入っている。興味深いと思うし、申し訳ない。そして次のことは11 Labsからだった。今日3番目のリンクとして企業を取り上げたくない。AI見つけたの企業はいくつあるのか?
彼らが新しいものをリリースしたので一緒に遊べると思って楽しいと思った。そうしよう。だからこれは11 Labsのサウンドエフェクトツールのアップデートで、とてもクール。私たちは異なる方法でそれを使ってきた。私たちのスタートアップのために昨日か一昨日にケビンが何かを作って、僕が超興奮したもので、サウンドトラックの作り方の一部がこれを使ったと言ったよね?だから君がやったことについて少し教えて。
11 Labsの音楽アプリケーションは信じられないが、これは超高忠実度プロンプトができるようになったというサウンドエフェクトアプリケーションのアップデートだ。ループをオンにできる、これは大きな問題だ。
だからローファイ、チル、バックグラウンドでループするようなものが必要なら、今それができる。またはホワイトノイズアプリのようなものでも、手に入る。ギャビン、プロンプトを入れた。これらのどれもテストしていない。オーケー、聞こう。5秒を選択してループしてほしいと選択した。ダウンロードできることが見える。48 kHzウェーブファイルとしてダウンロードできる。それは非常に高品質のサンプルだ。
でも君がこれが何かを特定できるか見てみよう、ギャビン。
それは何?まあ、犬だ。Wesleyか?待って。何をここでやっているんだ?犬がいて、おならがあって、それらは異なる音だ。何らかの方法で繋がっているか?
そう、ギャビン。吠える犬が巨大なおならを放つ。
今、それは49%のプロンプト影響でのみ5秒ループサンプルだった。これがどれほど信じられないかギャビン、この気まぐれを生成するために起こっている森林破壊について?
この正確なためにショーの終わりまで残ったすべての人に感謝する。現実世界の使用例でこれを何に使うか?
それはかなり良い車のクラクションだ。確かに。巨大なおならを放つクラクションする車のはずだった。それはしなかった。
もしインディーゲームデザイナーなら、バイブコーディングアプリで作業していてサウンドエフェクトが必要なら、UIクリックから、キャラクターからの移行音や叫びまで、鎧に当たる剣の音が必要かもしれない、11 Labsでそのようなものを生成できる。もう一つ試して君がこれが何かを推測できるか見てみよう。確かに。
わあ、それはひどい。それは…それはオーケー。それは皆さん、すべてだ。来週皆さんにお会いしましょう。AI for Humansにご参加ありがとうございました。さよなら。メッセージにコメントを残して。コメントを残して。バイバイ。
ループするおならを試すべきか?継続的におならを続けよう。特に濃厚なおならであるべきだ。ギャビン、神よ、私たちは何をやっているんだ?
もしこれが動作して君がここまで来たなら、濃厚ループまで来たとアルゴで知らせて。私たちはそれを濃厚ループと呼ぼう。今それをループしよう。ループした。ループした。ループした。
よし、皆さん、来週お会いしましょう。申し訳ありません。申し訳ありません。お願いします、あなたの家族が聞いていないことを願っています。今この一部であることを恥ずかしく思っています。そして来週皆さんにお会いします。戻ってきます。バイバイ。
バイバイ。春だ。神よ。バイバイ。バイバイ。今私たちは出ている。今終わった。わあ。


コメント