本動画は、OpenAIが発表した新ブラウザ「ChatGPT Atlas」がGoogleの株価を10%下落させたというニュースを皮切りに、AI業界の最新動向を包括的に解説するものである。Atlasはエージェント機能を搭載したChromiumベースのブラウザで、ユーザーに代わってウェブ上で様々な作業を実行できるが、実用面ではまだ課題が残る。一方でGoogleもAI Studioのアップデートでバイブコーディング機能を強化し、一般ユーザーでもアプリ開発が可能になりつつある。Sora 2のカメオ機能追加、Amazon AR グラスの現場投入、DeepSeekの画像ベースAI処理技術、Googleの量子コンピューティング進展、そしてAmazonによる60万人分の雇用をロボットに置き換える計画など、AI技術の急速な進化とその社会的影響が多角的に議論されている。

ChatGPT Atlasの登場とその衝撃
ChatGPT Atlasがついに登場しました。私たちはOpenAIの新しいブラウザを実際に使ってみたのですが、評論家たちは絶賛し、セキュリティの専門家たちはちょっとパニックになっているような状況です。ギャビン、君は本当に時代遅れだね。ごめんよ、相棒。今、僕はAtlasを使っているんだ。私たちのイントロ全体を書き直してもらおう。やってるよ。YouTubeのクリップに最適化されてる。ビッグダディ・アルトマンがデプロイボタンをクリックすると、GoogleのIQテストスコアよりも速くGoogle株が下落する、という内容が出てきたよ。
ケビン、実際には私たちのショーノートにこれは載っていないんだけど。まあ、ChatGPTがサイドバーに書いてくれたんだ。ドキュメントに入れるように指示したんだけど、実際には入れてくれなかった。なぜなら、エージェントモードをオンにしなければならないからなんだ。自動的にはやってくれない。だから、今それをオンにしようとしているところだよ。
その間に、Googleが AI Studioをアップデートしました。つまり、普通の人々が実際のアプリをバイブコーディングするのがずっと簡単になったということです。あなたの両親でも、普通の人々ができるんです。ああ、わかった。そうだね。実は、Atlasがギャビンについてかなり辛辣なジョークを書いてくれたんだけど、今それが苦戦しているんだ。つまり、ドキュメントには入っているんだけど、箇条書きの点があって、それが全文を入れるのを邪魔しているんだ。それにタイプミスをしてしまって、今そこで立ち往生しているみたいなんだ。でも、キーボードショートカットを使ってその箇条書きの点を取り除こうとしている。オーケー、ケビン、いいよ。
作業させておこう。Sora 2も本当にクールなカメオ機能のアップデートを受けています。あなたのペットや他のキャラクターでAI動画を作れるようになるんです。これは超楽しいですよ。ちょっと待って、何が起きてるの?そっちは大丈夫?作業中のものが見つからないって言ってる。そうなんだ。ドキュメント内で下にスクロールしすぎてしまったんだ、ギャビン。
だから今、テキストを見るために上にスクロールし直す必要があるのかどうかを判断しようとしていて、スクロールし直したら、きっとそのいいコンテンツを全部入れてくれると思うんだけど。これは本当に新しいものなんだ。その間に、DeepSeekチームがAI研究で大きなブレークスルーを起こしました。Redditはデータスクレイピングでいくつかの企業を訴えています。Perplexityも含まれています。
それから、新しいユニットリーの人型ロボットという素晴らしいロボットウォッチのアップデートがあります。また箇条書きの点に戻ってる。まだ箇条書きの点で立ち往生してる。新しいアプローチを試すって言ってるね。ケビン、これは私たちが約束されていたAIの未来じゃないよ。でもこれがAI for Humansなんだよ、みんな。
番組の開始とChatGPT Atlasの詳細
みなさん、AI for Humansへようこそ。AIにおけるまた新しい週、またたくさんのクレイジーな大きなニュースがあります。ケビン、今週の最大のニュースは、これまでで最大というわけではないかもしれないけど、Sora 2の方が大きなニュースかもしれないけど、それでもこれは大きなニュースです。ChatGPT Atlas。これは世界です、ケビン、一つの場所に。ワールドワイドウェブ。これが彼らのエージェントブラウザです。これは大きなニュースになりました。
実際、あまりにもニュースになったので、発表されたときにGoogleの株価が10%下落したんです。これは、誰かがあなたのビジネスを狙っているとわかる瞬間の一つですよね。あなたと私は両方とも実際に使ってみました。まず、それが何なのかから始めましょう。できれば基本的なことを少し教えてください。それはChromiumベースです。
だから、Google Chromeが好きなら、それがこのブラウジング体験の基礎になっています。ちなみに、これは驚くことではありません。ゼロからブラウザを書くのは非常に難しいですから。機能する基盤を使って、人々が知っているものを使うんです。だからChromiumベースなんです。基本的にAtlasを起動すると、非常に馴染みのあるchat.comのインターフェース、つまりあなたのChatGPTのインターフェースにいるわけです。
でも、タイピングを始めると、ちょっと違うことに気づきます。すぐに理解しようとするんです。あなたはChatGPTに質問しているのか、ウェブサイトを探しているのか。そしてエンターキーを押すと、そのすべてのオプションの散りばめられたものが与えられます。時には、あなたがタイプしたことについての質問に答え始めることもあります。
他の場合には、あなたがタイプしたことに関連するウェブブラウジングの結果を提供します。画像や動画のタブもあります。でも、ポイントは、右上隅に「ChatGPTに聞く」ボタンがあるということです。ギャビン、それをクリックすると、別のサイドバーが表示されます。
左側にあるサイドバーではありません。そちらにはチャット履歴やその他すべてがあります。いやいや。右側のサイドバーで、GPT-5のすべてのパワー、エージェントブラウジング、ディープリサーチ、これらの新しいウェブコネクタ、異なるアプリケーションに接続したい場合のものがすべてそこにあります。だから、あなたが何をブラウジングしていても、ChatGPTにあなたの代わりにアクションを実行するように頼むことができます。ページを要約したり、カートに商品を追加したり、辛辣な意見や鋭い見解でショーのコピーを更新しようとしたり、時々それをやってくれます、ギャブ。
そうですね。つまり、確かに「ChatGPTに聞く」機能はクールで、参照ポイントを得ることができるんだけど、でもGeminiが何らかの形でこれをやってきたことは私たちみんな知っていますよね、ドキュメントやその他の中で。本当の秘密のソースはエージェントAIの部分です、よね?そして、それをオンにするためにクリックしなければならないんです。
オンにすると、基本的にブラウザ内であなたのために操作してくれるようになります。そして、私は昨日これについて少し経験しました。最初にこれを始めたときに最初にやったことの一つは、YouTube動画にナビゲートして、「ねえ、この動画で何が起きているの?」と聞いたんです。そして面白いことが2つ起きました。まず最初に言いたいのは、実際の動画にたどり着いたとき、明らかにトランスクリプトを取得するツールがあるということです。なぜなら、何が言われているのかすぐに正確にわかったからです。それはある意味便利でしたよね?でも、あなたが見ていた動画でスパイダーマンのお尻が通常のスパイダーマンの300倍も大きいことがわかったかって?それはわかりませんでした。なぜなら、そういう情報はメタデータの奥深くに埋もれているからです。どこを見ればいいか私は知っていますけどね。
でも面白いのは、その動画に最初に行ったとき、広告が表示されていて、その広告動画のすべての詳細が表示されていたということです。だから、ここで何か興味深いことが起きていると思います。YouTube動画のトランスクリプトにすぐにアクセスできるわけではないですよね?そして、誰かが言っていたように、YouTube深層検索をやっているというのは本当に興味深いことです。おそらく何らかのトランスクリプトファイルによって駆動されていると思います。
でも、これには多くの興味深い使用事例があります。これまで見てきた他のエージェントブラウザとそれほど大きく違うわけではありません。最大の違いは、これがChatGPTだということだと思います。ChatGPTには週に8億人のユーザーがいることがわかっています。つまり、もっと多くの人々が初めてエージェントブラウジングを試すことになるということです。
彼らがこれを実装した方法を見るのは興味深いですし、画面上をカーソルが動き回る様子を見るのも興味深いです。エージェントブラウジング一般のアイデアについて批判的な人がたくさんいました。ウェブがそういう方向に進むのかどうか、こういうウェブボットやチャットインターフェースにこういうことをやらせたいのかどうか、といったことです。
でもわからないな、ケビン。君はショーの冒頭でやったこと以外に、これを試してみる時間はあった?どう思った?まあ、つまり、ショーの冒頭でやったことを軽視したくないんだよ、ギャビン。だって、僕がやったことは本当に簡単なはずだったのに、でも、そこでやったことは新しいコピーを書いてもらうということだったんだ。アクティブなGoogle docを選択した。そのコピーを取って書き直した。
オーケー、それがかなり簡単なタスクだということはわかっています。実際、Google docには直接それができるGeminiボタンがあります。脱線しますが。それを戻すように言ったとき、エージェントモードをオンにして、サイトを読み取って操作できるようにしなければなりませんでした。そして、本当に基本的なはずのビジョンとロジックのタスクで根本的につまずきました。私たちの名前がすでに入っているテーブルがあることを見て、私の名前とあなたの名前が交互に入っているスクリプトを書いたことを理解して、ドキュメントにテキストを入れるだけだったのに、失敗しました。
何度も何度も惨めに失敗しました。もう一つ、やらせた活動は、特定の基準に基づいて来年訪れる場所を調べることでした。そして自由にやらせました。多くの人のアドバイスに反して、すべてのものへのアクセスを与えました。これについては後で話せますが。そして10分から15分くらい働いているように感じました。それは良かったです。
戻ってきたとき、訪れるべき様々な場所、滞在する場所についてたくさん調査していて、Airbnbやアパートへのリンクがたくさんありました。オーケー、素晴らしい。「それをドキュメントに入れて」と言いました。そしてまた、惨めに失敗しました。入れてくれたリンクは無効なリンクでした。修正するように言いました。
そして結局、これをうまく機能させようと微調整するのに、自分でやるよりもずっと多くの時間を費やすことになりました。これがベビーステップだということは完全に理解しています。わかっています。理解しています。でも、今日この種のものが欲しいなら、より良いパフォーマンスをする他のエージェントブラウザのオファリングがあります。
そうですね、そしてあなたの指摘した点について、そう、これはベビーステップですが、でもある時点では、GPTとOpenAIがこの規模の会社として、このような製品をリリースするのであれば、もう少し洗練された感じのものを世に出してほしいと思いますよね。はい、これはブラウザですが、ブラウザはそれほど難しくありません。特にChromiumベースのものを作る場合は。
明らかに、これについてはすぐに話しますが、Googleも同じ日に何かをドロップしました。そして、ChatGPTがどう動くかは決してわかりません。彼らは同じ日にこれを出したかったのかもしれません。そして私が言いたいのは、これはGoogleの熱をたくさん奪いました。これからちょっと取り上げる非常に興味深い製品のためにです。
FFRという人、私たちがいつも好きな人がいるんですが、いくつか興味深いことをやっていました。Replicateプレイグラウンドでプロンプトを使ってAI画像を作成するのに使っていました。だから基本的に、Cdreamモデルで画像のプロンプトを書くのに使っていたんです。これは非常にクールです。それから、Soraの課題について教えてください。これはどう機能したの?使っているときどんな感じだった?
Atlasの実験とセキュリティへの懸念
だからね、僕は僕の機密情報、Google docs、銀行情報、自分のXアカウントにさえ、どのAIエージェントにもアクセスを与えていないんだけど、ブラウザで開いている間に、「ねえ、今Twitterでトレンドになっているすべてのものをクロールして、炎上ツイートを生成して」って言ったんだ。それをやるのにちょっとつまずいたけど、それからある程度やってくれて、「オーケー、やってるな」って感じだった。「もっといいことをやろう」と思ったんだ。トレンドを見て、それからSoraに行って、OpenAIの製品だよね、そして学んだことに基づいて史上最もバイラルな動画を生成してって。
かなり信じられない感じだった。本当に信じられなかった。動画のプロンプトをまとめてくれた。Soraのロードに失敗した。Soraのウェブサイトが基本的に「あーあ、入れないよ」って言ったんだ。これはちょっと興味深いと思った。自分たちの家から来る呼び出しをブロックしたんだ。手動でSoraサイトをロードしなければならなくて、それから「オーケー、サイトが開いた。さあ使って」と言った。使用に失敗したと言ったけど、実際には動画の送信には成功していたんだ。
そして彼らがブログ投稿でセキュリティとプライバシーの理由で言っていることの一つは、これはブラウザでコードを実行できない。ファイルをダウンロードできない。拡張機能をインストールできない。
コンピュータ上の他のアプリやファイルシステムにアクセスできない。つまり、それらのいくつかは理にかなっています。それらのいくつかは、おそらく初期段階だから制限されているようにも思えます。でも、このエージェントタスクでは、作成された動画を手動でダウンロードして、Twitterにドラッグして、「さあ、ツイートを完成させて」と言わなければなりませんでした。そして最終的にやってくれました。
動画について説明してください。リスナーの皆さんのために。何が起きているの?動画で何を見ているの?わからない。つまり、オーケー、見てよ。その時、サッカーチームのアーセナルがトレンドになっていて、レイカーズがトレンドになっていて、NASAがトレンドになっていて、もちろんホワイトハウスの改装がトレンドになっていた。
それで、誰かがサッカーボールを蹴っているように見えて、それをロサンゼルス・レイカーズの選手がシュートしていて、紙吹雪の大砲と宇宙船の打ち上げがホワイトハウスの後ろにあるという動画を作ったんだ。そうだね。そしてロボットもそこにいる。なぜならAtlasがトレンドになっていたから。GPTロボット。本当にすべてをマッシュアップしたんだ。これが本当のAIスロップです。だから、これが本当のAIスロップがどんな風に見えるかの例です。ロボットエージェントがこれのトピックを考え出した。ケビンがスロップマシンを通してスロップを手渡さなければならなかったとしても、プロンプトを書いた。これがAIスロップです。とにかく、これは本当に興味深いことです。あなたが前に話していたセキュリティやこういうすべてのことについてです。
AIエージェントブラウザについてしばらく懸念している人がたくさんいました。実際、Simon Willisという人は、危険なブラウザについて、特にプロンプトインジェクションについて非常に深く書いています。だから、外にいて、ギャイ、あなたが何について話しているのか疑問に思っているなら、プロンプトインジェクションって何?これは、AIがエージェント空間、エージェントブラウザで悪意のあることをしたいプロンプトを注入する可能性があるというアイデアです。
そして、ブラウザが最終的にあなたのものやあなたのもののためにこのすべての情報にアクセスできる可能性があるので、そのエージェントAIに危険なことをさせる可能性があります。OpenAIはすでにこれについて多くのアップデートが来ると言っていますが、ケビン、これについて考えがあると思います。
近いうちにこれらのうちの一つにあなたの人生を任せると感じますか?デフォルトのブラウザになる許可を与えたんだ。7日間の強化されたブラウジングをアンロックできるようにね。そして、おそらく今夜その決定を取り消すつもりだよ。同様にセキュリティの懸念を共有しているんだ。使用する中でこれを非常に注意深く見てきた。
でもそれは、誰かが見えない画像や命令のコード行を置いて、個人情報を漏洩させたり、チャット履歴を荒らそうとしたりできないということではないんだ。僕にはわからないことがわからないし、この段階で最初に発見する人にはなりたくない。
まだデフォルトですべてのブラウジング習慣と履歴を引き渡したいと思わせるほどのものはここにはない。OpenAIがブラウジング中に取得しているデータ、または取得していないデータについて、まだ少し不明確なんだ。だから、デフォルトでは、僕が見ているすべてのものを彼らも見ていると仮定しているだけだ。そうだね。
だから、もう少し使ってみて、もっと信頼しようとすると、それも僕をちょっとイライラさせる。そして、翻訳のような直接的な機能が機能しないんだ。だから、ポルトガル語の市民権を取得しようとしている途中の人は、翻訳のような非常に基本的なことのためにChromeに戻らなければならない。いくつかの拡張機能も機能しない、などなど。だから、繰り返しになるけど、もしかしたらポルトガル語を話すことを学ぶべきかもしれない。それがずっと簡単だよ。ポルトガル語の市民権を取得しようとしているなら、それが次のステップのように思える。
いや、僕のメガネとAirPodsが僕のためにそれをやってくれるみたいだ。みんな。オーケー、僕はアメリカ人だ。まず、これから進む前に、なぜOpenAIがブラウザを欲しがっていると思う?Googleを追い越して、株式市場の価格を下げること以外に、なぜブラウザが欲しいと思う?この目的は何だと思う?なぜブラウザに興奮しているの?理由はある?考えはある?
つまり、ChatGPTがすべてのことをできるようにするインターフェースであるべきなら、そうだよね?友達とチャットして、画像や動画を作って、ウェブを検索して、Shopifyから直接購入して、Canvaで作業する。そのすべては良いんだけど、ほとんどの人はそれをブラウザブラウザ内でアクセスしているんだ。オペレーティングシステムを作るのは非常に非常に非常に難しい。
だから、ブラウザから始めて、人々をロックインして、彼らがどこに行くか、どう使うかについてのすべてのデータを集めて、クリックを追跡して、エージェントをより良くする。そして、それらすべての人々を追跡することが、ケビン、非常に大きな意味で何をするか知っている?まあ、ギャブ、広告を機能させる。それがインターネット広告の世界が長い間機能してきた方法だ。クッキーというものがあって、みんな知っているよね。クッキーモンスターが好きなノムノムクッキーの種類じゃなくて、君を追いかけ回してインターネット上で広告を表示するクッキーの種類だ。だから、僕の理論はここにも、彼らが君をもう少し追跡できるドアを開き始めるためにブラウザが必要だということと関係がある。そして繰り返しになるけど、追跡は良いこともあれば悪いこともある。すべての追跡が悪いことというわけではない。
ある意味では、追跡はインターネット上でより良い体験を得るのに役立つ。でも、ほとんどの人は、インターネット上のほとんどの追跡はインターネットの経済性を中心に回っていると言うだろう。それによって、彼らははるかに優れた広告製品を提供できるようになると思う。だから、それがここで起きていることだと思う。
大きな質問は、彼らがChromeから何らかの市場シェアを奪うことができるかどうかだ。Chromeはドミナントなブラウザだからね。まだわからない。まだその場所に到達した感じはしない。でも、人々はPerplexityブラウザを愛しているから、もしかしたらそれがそういうことかもしれない。もしかしたら私たちはみんなこの場所にたどり着くのかもしれない。
でも、Chrome自体もこれの何らかのバージョンが来ることを想像しなければならない。OpenAIが対処しなければならないもう一つのこと、ギャビン、見たかどうかわからないけど、Jason Bal、Jason、名前を間違えていたらごめん、が言ったんだ。「ああ、ごめんなさい。これはウェブブラウザだと思っていました」と。そして彼らは、Atlasにヒトラーの動画を検索するように頼んだ画像を含めた。
さて、それは君や僕が普通にする要求ではないかもしれないよね?でも、誰かがそれをやりたいと思ったら、ChatGPTのAtlasブラウザは「ヒトラーとナチスのプロパガンダの映像は倫理的および法的理由で厳しく制限されているため、ヒトラーの動画を閲覧または表示することはできません。もしウェブブラウザであるべきなら、ユーザーが何を閲覧しているかを取り締まるのはあなたの仕事ではありません」と答えた。これで終わり。そして、それはこれらのものがあなたのすべての異なるものへのアクセスを監視するという話をしているような、もう一つのクレイジーな瞬間だ。そして繰り返しになるけど、その正確な例があなたがやりたいことかどうかは別として、他にもやりたいことがあるかもしれない。とにかく、長い話を短くすると、これは実際に使ってみると、半分未完成の製品のように感じる。非常に興味深い。インターネットの未来のように感じる、でも、まだそこにはない。また、ケビン、この同じ空間で興味深いことがある。
Microsoftのブラウザ更新とMoの登場
MicrosoftがEdgeブラウザを非常に似たようなもので更新したけど、他にもいくつか興味深いものがある。Moと呼ばれる新しい小さなクリッピーの置き換えも含めて。Mustafa SuleimanとチームがMicrosoftで今日やっていることについて、あなたの考えは?
これのタイミングが本当に魅力的で奇妙だと思う、よね?クラウドデスクトップのものが今週出て。Googleが彼らのものをローンチした。オーケー、それはいい。でもブラウジング側では、誰が知っていたのか知りたい。誰かがCo-pilotチームにいて、ChatGPT-5を使って彼らのプレスリリースを書いているのか?MicrosoftとOpenAIの間を行ったり来たりするこういうものがあるから。MicrosoftがOpenAIの大きな部分を所有していることを私たちは知っている。そして多くの点で、OpenAIが何かをロールアウトすると、Microsoftは今、彼らの独自バージョンを持とうと競争している。だから、競争力があると思うけど、でもEdgeが使われなくなるのを見たくないんだ。
多くの人がEdgeを全く使っていないにもかかわらず。これは興味深い。ここでMicrosoft側で起きていることがいくつかあって、話す価値があると思う。このグループのアイデアはちょっとクールで、ブラウジングを一緒にできることにするアイデアのようだ。Figmaのような会社や他の会社がたくさんあって、今ウェブ上で一緒にいられるようなデザイン空間で作業している。そして今、実際に一緒にブラウズできて、これらのエージェント機能を一つの場所に持つことができる。これはちょっと興味深いと思う。繰り返しになるけど、私たちは過去10年間、ブラウジング体験を本当に改善していない。拡張機能が最後の大きなものだったように思える。
だから、もしかしたらこれはウェブブラウジングをもう少しソーシャルにすることについてかもしれない。必ずしも誰もがEdgeブラウザを使うとは思わない。なぜなら、ほとんどの人の心の中で非常に低い投資しかないから。でもわからない。それはちょっと興味深い。僕は彼らが試しているのが好きだ。試してみて、例えばAtlasブラウザ内よりもタスクをうまく達成するかどうかを見たい。
でも彼らはヘルスのためのCo-pilotを持っていて、ちょっと興味深いと思う。ヘルスは大きなものだよ、人々はセカンドオピニオンやサードオピニオンを求めてLLMに頼るし、薬をチェックしたりするからね。だから基本的に、彼らはハーバード・ヘルスのような情報源で健康に基づく応答をグラウンディングしている。これは賢いと思う。信頼できる信頼性のあるデータベースにあなたをつなごうとしているんだ。
それからLearning LiveまたはLearn Liveがあって、これはGoogleもやったことだと思う、よね。基本的にブラウジング中にAIと話せるというアイデアだ。でもこれは柔らかいマシュマロみたいな男がいる。Mo。Moについて話さなきゃ。
実際、ギャビン、Moに会おうというビデオをクリックしようと思う。オーケー。さあ行こう。オーケー。さあ行こう。オーケー。そして、まあ、オーケー。技術的には、YouTubeを見ている人々のためにMoが画面に映っているけど、文字通り第一のコメントは「本当にMoについて音声付きの動画を作ったのに、あなたのビデオには音声がないの?」だ。でも、ソーシャルビデオにもないんだ。だから、Mo の音声はないみたいだ。それがMicrosoftのアップデートだ。いい仕事だ。また、非常に奇妙なことを指摘したい。Mustafa Suleiman、MicrosoftのAIの責任者だと思う、彼のタイトルが何かわからないけど、彼のブログ投稿に署名で署名した。だから、少なくともこれについて何らかの方法で知っているということだね。本当にそう思う。本当にそう思う。
GoogleのAI Studioアップデートとバイブコーディング
オーライト、ケビン。もっと興味深い大きな取引について、あなたが本当に大きな考えを持っているのは知っているけど、GoogleがAI Studioをアップデートしたことだ。AI Studioは、知っている人がいたら、Googleの一種のAIプレイグラウンドのようなもので、彼らのアイデアの多くがGemini全体にロールアウトされる前にそこに行く。Logan Kilpatrick、Google、彼の名前が何かわからない、AIの皇太子と呼ぼう、今のところそれで十分だと思う、彼は基本的にロールアウトして言った、ねえ、私たちがAI Studio内で作成したこのバイブコードツールは本当に良くて、Gemini 3.0によって動かされているという噂がたくさんある。ケビン、君はこれで遊んだ、本当に興味深いと思った。ここで何がアップデートされたか話そう。これは大きな取引だと思うから。
Logan Kilpatrick、彼はGoogle AI Studioとクラウンプリンス・オブ・AIのリードプロダクトだ。彼はコスモスの王のすぐ下にいる。オーライト。彼に、Xで連絡を取って祝福したんだ。なぜなら、僕は最初、このアップデートに本当に圧倒されたから。チームは絶対に料理したって感じだった。だから、もし何かを作りたいなら、アプリ、ゲーム、体験をささやいて存在させたいなら、今それをやらせようとするサイトやサービスが一握りある。
このアップデートは、バイブコーディングを大衆が利用できるようにすることを約束している。僕の言葉で、必ずしもLoganやチームのものではない。僕は最初、非常に感銘を受けたんだ、ギャビン。AI Studioに行って、「これを作りたい」と言える。僕は、友達が今脳卒中のリハビリをしているんだけど、言語療法士と一緒に働いているけど、保険が許すべき頻度ほどではないんだ。そこは脱線させてもらうけど。
だから、彼がリハビリを助けるために遊べる非常にシンプルな言語ゲームを作りたかった。ギャビン、もちろんだ。そして、シンプルな要求のように聞こえるよね、AIと話してアルファベットを通過して、特定の単語で文字を正しく取得したら励ましてもらうようなものを作りたいって。実際には、ブラウザのマイクとスピーカーのコントロールを実装しなければならない。LLMに接続しなければならない、音声アシスタントに、このゲームのロジックを判断してフォローしてもらう、リアクションを与えて、UIに紙吹雪や効果音を持たせる、スコアをつける、これらすべての小さなことが入ってくる。そして僕は基本的に、経験の大まかなバージョンを2ショットでやった。
IDEをダウンロードする必要はなかった。何も設定する必要はなかった。少なくとも最初はAPIキーをいじる必要はなかった。ブラウザでこれを実行するのに十分な無料クレジットがあって、コードを見て、自動的に問題を修正してもらって、ワンクリック、圧倒されて、それからデプロイしようとした。
ああ、そう。それから何が起きた?その話を取っておきたいんだけど、なぜならLoganが親切にも私たちのポッドキャストに出ることに同意してくれたから。1ヶ月を巡っているところだ。その話を取っておきたいの?絶対に話すつもりだよ。僕は絶対に話すつもりだよ。
だから、デプロイしようとしたとき、これは通常非常に痛い経験だ。ウェブサイトを立ち上げて、それをすべて接続しなければならず、そしてローカル環境やテスト環境で機能するコードが、うまく移植されないんだ。GoogleのAI Studioは、それをすべて僕のために移植して機能させることを約束していた。APIキーを持つ請求アカウントのためにアカウントをアクティベートしなければならなかった。オーケー、いい。それをやった。
AI Studioに戻ったとき、APIキーが見えなかった。リセットしようとした。サイトを更新しようとした。最終的に一つのAPIキーをくれた。素晴らしい。ボタンをクリックする。生成を押す。新しいAPIキーを作成したことに気づく。つまり、使っていないんだ。オーケー。それがデプロイされたものだ。サンドボックス環境に戻る。
APIキーのエラーが出ている。そして、それが最終的に解決した何かになっただけだ。そうだね。でも、もし僕がゼロまたはゼロに近い開発経験を持っていなかったら、僕には決して起こらなかっただろう。だから、「ねえ、みんな、外に出てこれを試してやってみて」と言うのは難しいんだ。なぜなら、もし彼らがそれに時間を費やして、本当に本当に幸せなものを作って、デプロイをクリックしたら、崩壊するかもしれないから。
あなたがそう言うのは興味深いです。なぜなら、これは実際に私たちがちょうど話したことにちょっと接続していると思うから。AIの間のような段階にいるんだ。これらのツールができることのアイデア、特に本当にうまく使う方法を知っているなら、信じられないほどだよね。でも、あなたのように本当にうまく使う方法を知っていても、バイブコーディングのようなほぼ99パーセンタイルと言うだろう、バイブコーディングをどうやるかという点で上位にいても、あなたにとってさえこのプロセスはそれほどクリーンではなく、完璧ではなかった。そして、一つのものを手に入れることができた、素晴らしい。でも、デプロイしたいときのように、私は、人々が最初にChatGPT Atlasのようなものを試したり、この種のものを試したりするときに感じるであろうフラストレーションのレベルがあると思う。なぜなら、私が非常に明確に言いたいのは、これを本当に興味深いと思ったということだ。大好きだった。
最後にこの種のことをGeminiの経験でやったのは、Gemini 2.5 Proがローンチしたときだった。もしこれを覚えていたら、クマがジャンプして、あなたが上下にジャンプしなければならないゲームを作成した。この経験では、ほぼ同じプロンプトをやった。同じプロンプトをやろうとして、何度か本当に壊れて、なぜうまくいかないのかわからなくてかなりフラストレーションを感じた。Gemini 2.5 Proでは、はるかにクリーンな経験だった。
繰り返しになるけど、僕は君ほど良いバイブコーダーではない。今回はプロンプトに多すぎることから始めたかもしれないけど、これはこれらのツールが信じられないけど、最後の1マイルの問題でもあることを示しているだけだ、よね?頭の中にアイデアを持っている誰かのアイデアを得て、それを世界に出すという感じだ。それはやるのが難しいことだ。
それは中間地点のようなものだ。コーディングの不気味の谷のようなものだ、ちょっと、よね?つまり、不気味の谷では、知らない人のために、ほとんどの聴衆は知っていると思うけど、CGIが人間に少し似すぎて見えたけど、十分近くなくて、奇妙に感じた瞬間のことを意味する。
今、AI コーディング特有の瞬間にいるような感じがする、ほんの少し。全体的に、すべてが印象的で素晴らしいと思うけど、でもまだその中にいると思う。動画生成でも、執筆でも、要約でも、コーディングでも、明らかに、私たちはみんなある種それを感じているんだと思う。
先週、噂されている新しいGoogleモデルについて話しました。基本的にエキスパートGemini 3.0 Proです。もし彼らがそれをこれにぶち込んだら、突然、これが今まで見た中で最も興味深いバイブコーディングアプリの一つになると思う。デプロイメントのものは、きっと解決できると思う。解決すると思う。彼らは理解するだろう。初期段階だから、でもそれでも僕を興奮させる。
アノテーションのものは非常に興味深い。試す機会はなかったけど、理想的には、または理論的には、これが機能する方法は、右側で作業しているアプリを見ることができる。左側でエージェントとチャットしている。アプリの上に直接描画できる。だから、ボタンの配置を説明しようとする代わりに、バグっぽく見えるグラフ、そう、それに直接描画できるというのは、実際に多くの他のツール、これらのコマンドラインのようなクラウドコードタイプのもの、それらにはそれらがないという大きなアンロックだ。たくさんの拡張機能とプラグインをインストールしない限り、などなど。だから、僕はまだそれにとても興奮している。
Loganと彼のチームとそれについて話すのがとても楽しみだ。AIの皇太子をショーに呼ぶなんて素晴らしい。もちろん。だから、今、11月までこのポッドキャストをやり続けなければならないみたいだ。そうだね、その通り。それは楽しいだろう。他にもいくつかの簡単なこと。GoogleもGoogle Earth AIをドロップした。だから今、Google EarthにはAIが組み込まれることになる。これは実際には思うよりも大きな取引だ。なぜなら、これについてのクールなことの一つは、しばらくGoogle Earthに行っていないなら、これはGoogleが構築した最も興味深い種類の地図シナリオの一つだ。地球上のどこでもズームインとズームアウトができる。でも今、Geminiを使って質問できる。彼らがここで見せていることの一つは、天気パターンやその他のいろいろなものだ。
僕にとって、それは本当にクールなことだ。Googleがやっているものがたくさんあって、前に言ったことがあるけど、ChatGPTがGoogleになろうとして、すべての製品を市場に持ち込もうとしている間、Googleは本当に多くの大きなことを押し進めているように見える。実際、ショーの後半で、彼らが量子コンピューティングで何をやったかについて話す予定だ。そこで大きなブレークスルーがあった。
だから、Googleはこれらのものができることのずっと先端を本当に押し進めている。だから、それをもっと見られることを楽しみにしている。新鮮なカットをさせようと思うよ、ギャビン。ああ、本当?そうなの?バイブコードされたAIヘアスタイリストを見た?見たよ。そう、見た。ビルトインショット。ブーム。そうだね。そうだね。
彼らは基本的に、カメラであなたの写真を撮らせて、それをGoogle Gemini Flash image preview 2 Nano Bananaにスピットして、試せるいろいろな異なるヘアスタイルをたくさん提供する。そういうクールな小さなアプリは、おそらく誰かが何ヶ月も何千ドルもかけてサードパーティの開発者と作っていたものだけど、今では5分で仕上げた。そうだね。
50歳のクレイジーな人やクレイジーなリッチな人で、ポケットが毎日空っぽでどうやってリントを追跡できるかについてのアプリを作りたいという人がそのアプリから金を稼いだのを想像できる?そして、それらの人々はそのアプリで1万ドル稼いだ。今、そのアプリは自分自身で作るのが非常に簡単になる。ポケットアプリの男がまだバイブコーディングを理解できないかもしれないけど、でも最終的には理解するだろう。
まあ、ギャビン、今AIがGoogle Earthの力に統合されたから、地球上のすべての愛とサポートがどこにあるかを聞いてみよう。それは正しい。愛とサポートはここにある。私たちの購読ボタンをクリックするところにね。なぜなら、あなたと私たちは、YouTubeのアルゴリズムが混乱していることを知っているから。
だから、外にいるあなた一人一人に寄りかかって、その一部になってもらう必要がある。さて、ケビン、ここに理論がある。これについてちょっと心配なんだ。私たちが人々に言ってきたことを言うように伝えてきて、もしショーを数週間見てきたり聴いてきたりしているなら、コメントに入れるコードワードを与えてきたことを知っている。ピエロがアルゴジュースを絞り出す。
それらは悪いと思う?それらは私たちを傷つけているかもしれないと思う。だから今回言いたいのは、YouTubeのコメントに行くときに、ちなみに私たちはYouTubeのコメントが大好きだ。できるだけ多く返信しようとしている。時々すべてに対応できないこともあるけど、コメントしてくれるときは本当に嬉しい。今回はユニークなことを言ってほしい。
今回は自分自身のものを考え出して、何が起こるか見てみよう。なぜなら、多すぎる香港を見ていて、香港のものにフラグが立っているシナリオがあるかもしれないと思うから。とにかく、長い話を短くすると、あなたの助けが必要だ。ショーの一部になってくれて本当にありがとう。香港は、彼らがコメントピエロだから、そして誰か他の人がアルゴを刺激しようとして香港と言っているから。それらは2つの異なる香港だ。2つの香港。
2つの言葉はAIによって香港と香港として見られる。意図は読み取れない、ケビン。そして、私たちはその世界にはいない。とにかく、コメントを残してください。チャンネルを購読して、ポッドキャストをオーディオで見つけて。これを聞いているなら、5つ星のレビューをください。また、私たちにはPatreonがあって、これは本当にエディターや他の多くのショーの費用を支払うのに役立つ。
だから、まだPatreonサブスクライバーである人がたくさんいることを知っているし、私たちは彼らのために多くをやらない。そうするつもりだとは言わなかったけど、でもそれは大いに感謝していることだ。だから、みんなそれをやってくれてありがとう。心からの感謝。本当に感謝している。君たちが唯一、この番組を成長させる方法で、毎週言っているのは本当だからだ。オーライト、ケビン。Sora 2。
Sora 2のカメオ機能と動画生成の進化
少し成長すると言えば、香港。そう、香港。もうすぐSora 2でアップロードしたガチョウのキャラクターを持っているときに香港を作れるようになる。これにとても興奮している。Mr. Peeles、ビルと呼べるけど、出てきてSora 2へのいくつかのアップデートについての長いツイートをドロップした。
でも最もエキサイティングなのは、もうすぐキャラクターでカメオができるようになることだ。そして、ケビン、これはSoraがどうなるかについて膨大な量の機能をアンロックすると思う。なぜなら、僕にとって、いつもやりたかったことの一つは、自分自身の小さなキャラクターを作成して、それをいろいろなものを通して連れて行くことだから、よね?Soraでキャラクターとして僕を持つのはクールで、人々があなたとSoraでやったことを知っているけど、自分のIPのようなものを作成するというアイデアは、基本的に僕が制御する僕のカメオで、本当にクールなアイデアだ。そして彼らがリリースしたこのビデオは、小さなゴーストのプレビュービデオがある。話す卵がある。でも、本当に楽しいものがたくさんあって、彼らはペットが大きなものになると本当に思っている。なぜなら、彼らにとって、ペットがInstagramやこういうすべての場所でオーバーインデックスすることを知っているから。だから、彼らはこれについて非常にスマートだ。でも、僕はSora 2でこれで見られる可能性にとても興奮している。そうだね。
まず第一に、僕は驚いた。V1だから、明らかにこれらの方向に動いて素早く動いているチームに称賛を送るけど、人々がアプリについて好きなものを特定しているんだ。複数のカメオを作れないことに驚いた。人々が僕に尋ねてきて、「ねえ、新しいバージョンを手に入れられる?同じシャツやすべてを見るのに飽きた」って言ってた。
だから、カメオを再作成しに行って、人々に新しいシャツを提供した。だから、これがキャラクターやペット、無生物からカメオを作ることに適用されるだけでなく、より多くの個人的なカメオを作ることにも適用されることを望んでいる。だから、異なる方法で現れることができる。それは本当にクールだ。話す卵の例に魅了されている、よね?そうだね。
それについて何が魅力的?いつも朝食と話したいと思っていた。100%。話さなければならない農産物チャットがたくさんある。農産物ポッドキャスト全体がある。いや、それは言わないで。それは別のポッドキャストだ。そうだね。Eggplants for humanは非常に異なる異なるゲームだ。異なるゲームだ。
モデルがその短いクリップでさえ卵の口と表情を解釈できることに興味がある。これは他に何ができるのかに興味がある。まだ探索していないもの。そして、それをキャラクターとしてロックして、他の人によって操り人形にされ、パイロットされる可能性があるという概念は、本当に興味深い。
でも、これは明らかにカメオ機能は、あなたと僕が大いに引き付けられたものだ。リミックスする能力も。彼らは明らかにこれらの2つのものに絞り込んでいて、それにとても興奮している。中央ヨーロッパを乗っ取る独裁者についてのすべての卵のビデオを見るのがとても楽しみだ。卵がたくさんあって、ブラブラブラって感じで、みんな奇妙な言語で話すような感じを想像して。
とにかく、別の大きな動画アップデートは今週、ミニマックス、僕は決して完璧に発音できない名前だけど。この会社が2.3アップデートをドロップしたところだ。今はプレビューだけだけど、これについてたくさんの素晴らしい動画を見てきた。でも、ケビン、本当にこれを指摘したかったのは、Soraとの接続のためで、これが興味深かった。FFR、繰り返しになるけど、私たちのお気に入りの一人、FFR AI。彼または彼女はすべての興味深い新しいAIツールを試しに行く。ドローンの上でポップアンドロックダンサーがいる動画を見せていて、それはかなりクールだった。それからAI girl、AI girl agentだと思う、外にいる本当の人だと思う、AI girl、同じもののSora動画を見せる。
素晴らしいのは、女性が踊っているのが見えることだ。物理学があまり良くないんだけど、でもある時点でひどい事故が起きる、ケビン、それが起きるんだ。ドローンから後ろに反転して、それから死ぬまで落ちる。確かにそうする。そうだね。それが、物理学が悪いにもかかわらず、アリーナのシュートアウトでそれを選ぶ理由だ。その通り。僕も。
つまり、はるかに楽しいはるかに楽しい動画だけど、もうすぐこれができるようになる。ミニマックスはどんどん良くなっている。これの物理学は本当に興味深い。ビット内で本当に興味深い動画アップデートがたくさん見られると思う。オーライト。もう一つのクールなことは、11 Labsが見せたアップデートだ。
Deart AIだと思う会社があるか、しばらく前からある会社で、リアルタイムオーディオのリップシンクパペティングに取り組んでいる。これは私たちが非常に注意深く見ている分野だ。なぜなら、AIオーディオを中心としたAIスタートアップに取り組んでいるから。そして私たちの理論は常に、リップシンクがまだ少しファンキーだということだった。実際、ここでもまだそうだと思う。
でも、リアルタイムのビデオとオーディオが実際に見るのを励ますことができるものである世界に近づいている。だから、これは11 Labs devがこの種のシナリオで作業する様子を見る単なるクールな方法だった。また、私たちが作業しているのと同じバックエンドの少しで、オープンソースツールのPipecatだ。ええ、Henには、彼らのアバターも操り人形にできるオファリングがあるのを見たことがあるけど、これが本当に興味深いのは、11 Labsフローに簡単にプラグインする能力とオープンソースのオーディオパワーのものだ。
だから、繰り返しになるけど、バイブコーディングのこれらの進歩について話すと、これらの新しいモデルがパイプラインを降りてきて、ブラウザにあなたのために制御を取らせて、あなたのために研究させると、初期段階だけど、もしあなたについて何でも話すアバターを持つアプリのアイデアがあったら、今、外に小さなレゴブロックが見え始めることができる。そうだね。そしてAIにそれらをどうやって組み立てるかを尋ね始める。
そして突然、ほんの数ヶ月前でさえ不可能だったものを作ることができる。それは正しい。オーケー、もう一つのクールなストーリー。それと言えば、ほんの数ヶ月前は不可能だと感じたことが、Amazonが実際に機能するARグラスを野生で持っているように見える。君がこのストーリーを持ち出した。これは正確に何が起きているの?
AmazonのARグラスとロボット活用の加速
そうだね。だから、見て、私たちは、好むと好まざるとにかかわらず、ウェアラブルがイヤホンやポッドからメガネやレンズまで、これらのデバイスの多くにとっての未来であることを話し続けている。そして、Amazonはここで眠っているわけではない。彼らはヘッドマウントディスプレイを持っている。ほうれん草の緑のように見える、古い、80年代の古い端末インターフェースやGame Boy Pocketのような。
でも、それは誰かの右下隅に小さなディスプレイを置いて、配達ドライバーや倉庫作業員が必要とするものを提供する、よね?友達とつながったり、お気に入りの写真をピンチズームしたりするためではない。この世界のどこにいるのか、どこにいる必要があるのか、どのパッケージがそこに行く必要があるのかだ。
去年のクリスマスに誰がチップしたか、パッケージをどれだけうまく扱うべきかのような種のシナリオでもある。元配達ドライバーからのメモのようなものだ。そうだね。この男はひどい犬を飼っているから、気をつけろ。気をつけないと噛まれるぞ、みたいな。その通り。そうだね。グラスは鼻がある真ん中にカメラがあるように見えて、それから側面に他の2つのセンサーまたはデバイスがある。そうだね。
ちょっとGoogle glassのような感じに見える、奇妙な感じで、よね?プロトタイプのように感じる。まだプロトタイプかもしれないけど、でもアクティブで外にある。その通り。そして興味深いと思ったのは、写真を撮るようなコントロールが実際にはAmazon作業員のベストにあったということだ。ボタンのようなものがある。だから、パッケージを配達するとき、下を見て、ボタンを押して、写真を撮る、そこに行く。
あなたと僕が買うために列に並ぶものではないというのは興味深い。でも、彼らがそれに取り組んでいて、彼らがやっているアプローチが魅力的だ。バッテリーがここ、アクションボタンがここ、おそらくグラスをできるだけ超軽量にするためだ。
だから最後も、おそらくあなたの26時間シフトのために。オーライト、ケビン。ここに3つの大きなストーリーがあるけど、すべてちょっとオタクっぽいから、オタクモードになる時間だ。その通り。NerdFest 2025の時間だ。行こう。Nerdfest。行こう。このドロップはワイルドだ。ベースが最高の方法で僕の脳を溶かしている。あのレーザーを見ろよ、男。ここはオタクの天国だ。
ドロップの準備はいい?3、2、5。メガネをかけているよ、ケビン。これはNerdFestだから、メガネを持たなきゃ。そうだね、メガネだ。慎重でありたい。僕が始めたいストーリーがある。これは実際には思うよりもずっと大きな取引だ。これはDeepSeekからの新しい研究の一部だ。さあ、オタク。
これはDeepSeekからのストーリーで、DeepSeekは6ヶ月前に出てきたオープンソースモデルでみんなを吹き飛ばしたことを知っている。今、彼らは本当にドアを開いた新しい技術をやった。面白い。何なのかを教えて、それからどう説明するかを理解しよう。基本的に、彼らは画像をスキャンするような種類のものであるOCR技術を使っている。画像をスキャンして、テキストをトークンとして見る代わりに、AI コーパス全体を基本的にテキストではなく画像として使用することを決定している。それについて興味深いのは、なぜそんなことをしたいのかと思うよね。ファイルははるかに大きくなるし、他のすべてのものも。彼らは実際に、それらの画像を非常に小さなサイズに圧縮する方法を理解した。実際には、私たちが以前やってきたこと、LLMの外で、AI全体の世界を提供するより良い方法かもしれない、よね?だから、おそらくこれを僕よりもう少しうまく説明できるかもしれない。そうだね。教えて。僕は君にメガネを手渡したい。ありがとう。完璧。そうだね。釘付けだ。小道具コメディがリモートで機能する。そうだね。
オーライト。君に10,000個のレゴブロックを与えて、これで何かを作ってと言えるけど、これらのブロックすべてを覚えておいて、よね?なぜなら、最終的には家になるから。または、それらすべてを並べて写真を撮ることができる。そして、トークンからトークンに話すとき、一つのものがもう一つのものを曖昧に表すとき、10,000個のものを持っているか、一つのものを持っている。
それは10,000個のものの写真だけど、実際にはただ一つのものだ。そして、私たちは画像を非常によく圧縮できることを知っている、よね?どんな金の画像も取って、ディザリングしたり歪めたりできて、それでもかなりよくそれが何であるかを理解できる。
それが、ここでのこの概念の非常に非常に大まかな蒸留だ。つまり、個々の文字、テキストとしてものを保存する代わりに、その写真を撮って、画像を保存して、画像を圧縮しまくっても、後でそれを取り出すことができる。だから、AIに大量の大量のデータを記憶させようとするすべてのハックやトリックをやる代わりに、それらのぼやけた圧縮された画像を持たせて、後でそれらを取り出してコンテキストを引き出そうとすることができる。今、いくつかの欠点がある。いくつかの落とし穴があるけど、これは圧縮がどう起こるか、これらのAIがどうものを記憶するかを見る劇的に新しい方法だ。そうだね。そして、Andre Karpathyのような大きなストーリーをフォローしてきたかもしれない。私たちのお気に入りのスピーカーであり、AI、元OpenAIとTeslaの研究者の一人だ。Dwarkeshポッドキャストに出て、基本的に彼が実際にはAGIがさらに離れていると思うと言って、多くのプレスを得た。エージェントについては、これはエージェントの年ではなく、AIエージェントの10年だ。だから、彼はちょっと遅くしろと言っているようなものだ。
彼は実際にこれに反応して、これは本当に興味深いものを見る新しい方法だと言った。だから、AI空間について非常に深く考えた誰かがいるとき、DeepSeekのような会社から驚きが出てくるというのはまた一つのそういうものだ。前に彼らが他のもので どれだけうまくやったかについて私たちは驚いた。これはLLMを見るわずかに新しい方法のように感じる。
だから、非常に良いNerdFestストーリー。ケビン、私たちの次のNerdFestストーリーはもっとオタクっぽいかもしれない。これが何についてか分かる?これは量子コンピューティングだ。これは量子コンピューティングのストーリーだ。そうだね。だから、これはAIストーリーほどではないけど、覚えておくことが本当に重要な何かだ。なぜなら、量子コンピューティング、僕は完全にぶち壊すつもりだけど、ここに基本的なアイデアがある。量子、僕は言葉さえ言えない。量子コンピューティングは、キュービットを使用しているコンピューティングをする完全に新しい方法だ。CQキュービット。そうだね、キュービット。CQキュービットまたはキュービット。キュービット。キュービット。名前を正しく言えるようにするよ。そして量子コンピューティングについて最も奇妙なことは、量子粒子を追跡しているということだ。そして、量子粒子をシステムに通すことによって、スーパーコンピュータでさえできるよりもはるかに複雑な実際のコンピュータトランザクションをなんとかできる。
そして、スーパーコンピュータの13,000倍大きくてクレイジーなトランザクションについて話している。今、この日まで、量子コンピューティングは常に、ああ、非常に特定の種類のものの集合を考え出すことができて、もしかしたらそのために機能するかもしれないというアイデアだった。
でもGoogleは基本的に、彼らのWillowスーパーコンピュータ、彼らの量子コンピュータで、実際に有用なものを追跡する能力を今持っていると言った。そして、これはこの世界でのベビーステップのようなものだけど、次世代プラットフォームについて考えるとき、ここで本当に10年、20年、30年先の未来について話しているんだけど、これは信じられないほど複雑な計算問題が解決できる可能性があることを意味する。今、これのどれも本物ではないけど、これは非常に大きな興味深いアイデアだ。すべてのビットコインを売ったよ、ギャビン、なぜならこれは暗号化の終わりを示していて、この量子コンピュータがその全体を壊すつもりだから。多くの人がそう言っている。でも、それが本当かどうかはわからない。外にいるオタクたちにとってただの非常にクールなことだ。なぜなら、何かをするから。しばらく約束されてきた何かだ。
そして最後に、ケビン、最後のNerdFest 2025ストーリーで、データスクレイピングのサプライズがある。Redditは4つの会社を現行犯で捕まえた。実際にReddit-handedだ。そしてそれらの会社のうちの1つはPerplexityだ。そして、彼らが基本的にこれらの4つの会社を非難しているのは、彼らはちょうど訴訟を作成した。これらの4つの会社、3つとPerplexityを訴えている。
他の3つはすべてデータスクレイピングのウェブサイトで、彼らはそれらを訴えている。なぜなら、彼らは基本的に探していたものに小さなナゲットを入れて、もし会社がこれを見つけたら、私たちは違法にスクレイピングされていることを知っていたと言ったからだ。そして、彼らはそれを見つけた。これらの4つの会社が彼らの結果でこれを見つけた。これは大きな取引だ。なぜなら、Redditは彼らの堀を保護しようとしている。実際にはかなり重要だ。なぜなら、Redditの堀は彼らのデータで、彼らのデータは信じられないほど価値があるから。Google検索の最後にRedditを追加したことがあれば、みんな知っている。ほとんど非常に人間的な反応を得る。だから、ケビン、これはインターネットのデータをめぐる戦いの始まりのように感じる。興味深い方法で。でも、繰り返しになるけど、これはもう一つのそういうオタクっぽいストーリーだと思う。表面上の感じよりも下にある大きな取引だ。
本当に興味深いのは、ギャビン、もしストーリーを、たとえばOpenAIのAtlasブラウザで引き上げたら、もちろん。そして、それで何かをするように頼んだら、「このウェブサイトのコンテンツにアクセスできません」と言う。ニューヨーク・タイムズの訴訟のためかもしれない?スクレイピングできなかったと賭けるよ。Redditが以前にそれらの停止を置いたことを覚えているから。それがストーリーだ。AtlasでNew York Timesのサイトを探しているようなものだ。
「いや、いや、いや、いや。できない」と言う。それは理にかなう。そうだね。ごめん。それは確実に理にかなう。そうだね。とにかく、オタクっぽいオタクっぽいもの。それが終わりだ。それがNerdを終わらせる方法だ。私たちのfest 25をnerdyなnerdyで終わらせるつもりだ。オーライト、みんな。時間だ。ロボットウォッチの新しいロボット。ああ、そうだね。これは全然オタクっぽくならない。
ロボット。ロボット。ウォッチ。ここの大きなストーリー。Amazonは基本的にロボットで60万人の人間の仕事を排除するつもりだ。これは大きな取引だ。しばらくこれについて話してきた。Amazonはこれについて興奮している。つまり、理解できると思うけど。
彼らは基本的に彼らの工場を動かす3つの特定のタイプのロボットを作成している。そして、私たちはみんなこれが来ることを知っていた。それらのAmazon工場で働いているほとんどの人々でさえ、床を転がる小さなロボットのビデオを見たことを覚えている。それは3つのうちの1つだ。これはロボット工場がどんな風に見えるかの初期段階だ。
そして、ケビンと僕は何度も何度も言ってきた。AIブームの次の大きな反復は人型ロボットのようなものになるだろう。そして、それが私たちがロボットウォッチをやる理由だ。これは、彼らが大きな方法で手動労働の仕事を置き換えるというマイナス面だ。まあ、彼らは2025年から2033年の間に60万人以上の人を雇うのを避けるだけだ。なぜなら、パックされた1アイテムあたり30セント節約できるから。それは大金だ。
ちなみに、誰かが「ああ、30セントに基づいて誰かを雇わないつもりはない」と思うとき。2025年から2027年の間で126億ドルの節約だ。Derrick Thompsonという本当に奇妙で怖いチャートが出回っていて、以前このポッドキャストでシャウトアウトしたことを知っている、彼が共有したもので、アメリカのGDPと株式市場が上がっていて、実際には非常に長い間で初めて雇用が実際に減っている。
たぶん今まで、でもそれは見るのが非常にまれなことだ。そして、ここから変わらないだろうという実現と合理化をしなければならないと思う。そうだよね?だから、ここで何千回も話してきたけど、でも最近、「ああ、週2日の労働週になるだろう。
ビル・ゲイツは週2日の労働週になると言っているか、労働が残っていないときに人々がすべての自由時間で何をするかを理解しなければならない」のような多くの見出しを見てきた。そして僕は、日々、食料とヘルスケアのために他の人間と争うことになるぞ、みたいな。まあ、それが僕が言おうとしていたことだ。
最初に理解しなければならないことは、それらの人々に生活して物を買うためのお金をどう与えるかだ。彼らはただ自由時間を持つことにはならないだろう。もし、わかるようなコストを払えないなら、僕の人生で、僕の広い意味での人生で、2つの仕事、3つの仕事をしている人々を知っていて、彼らはこれをやってなんとかやっている。今、もっと多くの人々がいる世界を想像して、とにかく。とにかく、これはロボットウォッチへの素晴らしい低いスタートだ。ケビン、それに入っていこう。ロボットがどこにあるかについて、これらの減少したアイデアを投げ捨てよう。そのストーリーを窓から投げ出そう。それは私たちが残りのロボットウォッチで議論するものには何のコンテキストにもなり得ない。全くない。ユニットリーの新しいH2 Destiny Awakening。より人間に見えて、より人間のように振る舞い、より人間らしいタスクを実行できて、バレエができるロボット。
だから、バレリーナたち、もう仕事がなくなったよ、ベイビー。気をつけろ。僕は、うわー、それはロックンロールのバレリーナだ。だから、そこで何を見ているの、ケビン?ここでリスニングしている人々のために説明して。今までに、ほとんどの聴衆はこれらのユニットリーロボットに精通していると思う。彼らは非常に人間に見える。彼らは空手ができる。彼らはブレイクダンスができる。限定的なパルクールなどがある。まあ、この新しいバージョン、このH2バージョンは公式に平均的な人間の大きさと重さだ。
だから、インテリアと言うべきだ。彼らはそれをかなりドレスアップする。もう少しスペルトだ。もう少し動きがある。ロボットに見えることが少し減っている。絶対にもう少しだ。もう少しスペルトだ。ここでものをやっている。だから、とにかく、これは彼らの次の反復のようなもので、絶対にもっと動きができるように見える。確かにね。そして、ユニットリーのパイプラインでのステップアップの一つのようなものだ。
G1の動画もいくつか興味深いものが出てきた。まず第一に、これらのG1は今米国で入手可能なものだ。Walmartから5パックを買えることについて話した。Walmart。そうだね。それを改造した男がいる。彼の名前はJay Logan Olsenで、彼の動画があって、四つん這いのようになっている。彼はそれを改造して四つん這いにして、床を這い回っている。でも、これは楽しいもので、これらをメイカーの手に渡そうとしているときだ。誰かが指摘したけど、もしそれに黒いウィッグをつけて、TVから引っ張り出させたら、リングがあなたのTVから這い出ているように見える信じられないほど素晴らしいハロウィンディスプレイになるだろう。でも一般的には非常にクールなこと。
それから、ケビン、はい、ダンスリサイタルの最中にユニットリーG1がある種亡くなるという悲しい瞬間があるかもしれない。君が見ているものを説明したいかい?彼はブレイクダンサーを縁石で踏みつける。オーライト、明確にしよう。B boyerがいる、Bをやっている誰かがいる。
誰かが地面でビートしている、人間が動きをやっていて、ユニットリーG1がちょうど彼らの顔を踏んで、彼らの帽子を蹴り飛ばすけど、それから過程で足元を失って、地面に崩れ落ちる。でも、それから回復しようとしない。ただそこにいるだけだ。
これは日本からのビデオで、僕は小さなゴーストの絵文字がそこから飛び出しているようで、それから彼らはダンスコンテストを続けなければならない、それは本当に奇妙だ。アンクルとカーディガンを着た人がとても失望して出てきて、ゆっくりとダンスフロアから引きずり出そうとし始めるんだ。次は、ヘッドフォームからのロボットがある。これらは僕がセクシーは間違った言葉だと言うだろう2つのロボットだけど、魅力的かもしれない。女性と男性がいて、彼らは絶対に非常に特定の何かを狙っている。これはGrock AIアシスタントが目指しているもののヒューマノイドフォームのような感じがする。女性は非常にエーテル的に見えて、エルフのようで、男性は非常に深い眉を持っている。でも、これについて興味深いのは、これを多く見ないけど、これらは人型ロボットに置かれているような半リアルな顔だ。
そして引いて見ると、外骨格やすべてのものがそこにあることがわかる。でも今、これらをもう少し人間らしくしようとする段階に入り始めている。これらのビデオを見たときの最初の思考は何?つまり、世帯あたりの最大注文は何?それが知りたいことだ。ああ、うわー。彼らはいくつで僕を制限しているの?Roombaの周りに巻けるものを作る?
たくさん持っているから、脚や腕が必要ない。君は、うわー、それは興味深い。トルソが欲しいの?トルソが欲しい?一つの能力だけ、そしてそれはオーケー、十分。ここで最後のロボットについて話そう。お願いだから、お願いだから、好意でいい長いビープ音を出して。
これはスキルドAIロボットで、これは外に出て何ができるかを見せている別のバージョン、それらのロボットの一つだ。これ、ケビンはパルクールをやっている。そして、このビデオについて本当に興味深いと思ったのは、引用符付きでパルクールをやっているということだ、よね?それらのものの一つだ。その下に誰かが、Steve Carellのキャラクターがパルクールをやっているようなオフィスのgifを置いているのを見た。でも、それが優しく跳び上がっているような感じで、僕はある時点でこの世界でこれらのロボットとつながるかもしれないと思う。
彼らが風変わりな性格のようなものを持っていることが好きになるだろう。なぜなら、もし僕の家にこれらのうちの一つがいて、彼が外でパルクールを練習していて、僕がそこに出ていったら、それはかなり楽しいって感じだろう、男。それが君にやっていてほしいことを見たい。家を掃除することには興味がない。ただ、君の人生でこの小さなことが良くなるのを見たいだけだ、オー、その洗濯物は畳まれていない。でも、おー、男。
素晴らしい跳躍だ。オーケー。その通り。その通り。君がどこに行こうとしているのかわかった。君が家にロボットを持っていて、突然AGIの火花を得て、君がやってほしい仕事をする代わりに、自分自身でインフルエンサーになろうとしたら、素晴らしいだろう。ベースギターを学んでTwitchでストリームしたいだけだ。
もし家のロボットでそういうストーリーがあったら、私たちを見つけに来て。オーライト、みんな。とにかく、それが今週の全部だ。AI空間でもっと多くのことが起こる来週にお会いしましょう。やあ、さようなら、みんな。ねえ、遊びに行って、それからチャットをして。


コメント