OpenAIが新たな最先端モデルGPT-5.4をリリースし、コンピュータ使用能力において平均的な人間を上回る性能を達成した。一方、AnthropicのCEOダリオ・アモデイは、自律兵器使用と国民監視という2つのレッドラインを守るため国防総省との2億ドル契約を巡り激しい対立に直面している。さらにClingの新モーション制御、GrokのビデオExtend機能、NotebookLMの映像要約、そしてNetflixによるBen AffleckのAIスタートアップ買収など、AI業界は急速な進化と論争の渦中にある。

- GPT-5.4の登場とコンピュータ使用の飛躍的進化
- AI for Humansへようこそ、また新たな最先端モデルが到着
- コンピュータ使用とは何か
- OpenAIによる実世界デモンストレーション
- 進化は止まらない
- GPT-5.4の技術的詳細
- 国防総省契約を巡る論争へ
- 番組のサポートと国防総省問題への移行
- OpenAIの対応と現状
- ビデオ生成ツールの進化
- Grock Imagine Extendとその他のビデオツール
- NotebookLMの映像機能と今後の展望
- Ben AffleckのAI企業とNetflixの買収
- 音声妨害デバイスSpectre
- AI See What You Did There
- ウェブサイトのアップデートと音楽カバー生成
GPT-5.4の登場とコンピュータ使用の飛躍的進化
OpenAIの最新モデル、GPT-5.4が登場しました。これは誰にとっても大きな出来事です。
また新たな最先端AIモデルが登場しましたね。コーディング能力が大幅に向上していて、なんとコストはOpus 4.6の約半分です。そして驚くべきことに、5.4は平均的な人間がコンピュータを使う能力を上回っているんです。ああ、これは大変なことになりました。
モデルにKUA、つまりコンピュータ使用を依頼すると、5.3 Codexと比較して、新しい環境を立ち上げる必要がないんです。これはあなたや私がコンピュータと対話する方法に近いものになっています。
さらに驚くべきことに、ケビン、OpenAIは壁を感じておらず、今年も知能能力が向上し続けると予想しているんです。
ええ、劇的にね。ギャビン、大丈夫ですか。
ケビン、私はただ睡眠が必要なんです。
それは可愛らしいですね。でも今週は無理ですよ。なぜなら、その間にもAnthropicのCEOは国防総省と電話で2億ドルの軍事契約を守ろうとしていて、同時に神の複合体を持つ嘘つきと呼ばれているんですから。楽しいでしょう。
さらに、みんなにとって大きなアップデートがあります。ClingやGrok、さらには奇妙なことにNotebook LMからも新しいAIビデオアップデートが出ています。そう、Notebook LMのやつが正直一番エキサイティングなんです。これはクレイジーですよね。
それに加えて、番組の大切な友人であるBen Affleckが、秘密裏にAI企業を経営していて、それがNetflixに売却されたんです。なんという一週間でしょう。これら全てと、さらにもっと多くのことを、今週のAI for Humansでお届けします。
みなさん、始めましょう。
ギャビン、ちょっと待って。ティーザーをやり直さないといけないみたいです。どうやら…
いや、やめて。なんで。
OpenAIがまた新しいモデルをリリースしたみたいです。
やめてよ。本当に。嘘でしょう。
番組を始めましょう。
AI for Humansへようこそ、また新たな最先端モデルが到着
みなさん、AI for Humansへようこそ。これはAIの素晴らしい世界への週刊ガイドです。
そしてケビン、新しいのが来ましたよ。新しい最先端モデルがまたドロップされました。今年に入ってもう7つ目くらいじゃないですか。今どのあたりにいるんでしょう。
分からないけど、そろそろベンチマークボーイズを召喚する時ですか。早すぎますか。
ちょっと待って。ベンチマークボーイズは来ますよ。彼らはここに来ます。でも魔法の口笛をやらなきゃいけません。つまり、彼らを召喚する新しい方法があるんです。
そうですね。それはすぐやりましょう。さて、そうです、OpenAIには新しい最先端モデルがあります。これがGPT 5.4です。まったく新しいモデルで、ケビン、これは非常に優れています。
私たちが飛び込まなければならない最大のポイント、そしてこれから色々なことを話していきますが、コンピュータ使用において非常に優れているということです。そしてあなたが番組の冒頭で指摘したように、人間がやるような種類のことをやるのが非常に得意なんです。そして私たちは、AIが私たちがやることのほとんどをできるようになる能力に、じわじわと近づいているんです。
まず第一に、基本的なことに飛び込んで、それから確実にベンチマークボーイズについて話すことができますね。
まず最初に、これは5.4です。ほとんどの人が使っていた前回のモデルより2つ大きい音ですね。名前の付け方はさておき、実際にこの詳細を気にする人のために説明すると、5.3をCodexモデル、つまり彼らのコーディングモデル専用として残しておきたいからなんです。これは今5.4になっています。彼らは命名の状況が混乱していることを認めていますが、もしそうなら、それは私がスカイネットが明日起こらないことについてとても安心できる理由になります。もし彼らがまだ名前を正しく付けられないなら、おそらく心配する必要はないでしょう。
コンピュータ使用が今季の理由です。
コンピュータ使用とは何か
ねえ、なぜコンピュータ使用とは何かを説明しないんですか。視聴者に説明してください。私たちの視聴者の何人かはそれが何かを理解しているかもしれませんが、多くの人は理解していません。これは聞こえる通りのものです。派手なAI用語ではありません。
モデルのコンピュータを使用する能力をテストするために設計されたテストがあります。そして私たちは、画面に何があるかを見る、スピーカーから出てくる音を聞く、クリック、ドラッグ、あちこちをつつく、ボックスにテキストを入力する、ウィンドウを閉じる、それらを管理するなどのことについて話しています。
ベンチマークの1つはOS Worldと呼ばれています。人間は通常スコアを出します。それはあなたと私のことです。
もうやってますね。ベンチマークボーイングしてますが、それでいいです。どうぞ。
ベンチマーク、ベンチマークボーイズ。ベンチマークボーイズ。
また新しいグラフィックを作りましたね。ウィルに2つ目のグラフィックを作ってもらいます。
ベンチマークについて話しましょう。これは繰り返しになりますが、あなたがそこにいる場合、これらは他のものとどう違うかを即座に理解するのに役立つ数字です。
ケビン、あなたが言及していた具体的な数字について話してください。そして繰り返しますが、これらのモデルは、あなたと私が使おうとするときよりも、ベンチマークでより良いパフォーマンスを発揮するように調整できます。いわゆるバイブテストですね。でも、少なくとも紙の上ではこれを聞いてみましょう。
OS Worldベンチマークは、私が今言ったようなクリックやドラッグのために設計されています。この場合、ブラウザを見て、ウェブサイトのスクリーンショットを取得するんです。ケビン、私は最高のクリックとドラッグができます。
カレンダーイベントのスケジューリングはどうですか、ギャビン。
それは50%の範囲ですね。おそらく50%の範囲です。昨年、あなたのビジネスEINを私に送ることについてはどうですか、ギャビン。
それはかなり苦手でした。12ヶ月の期間タスクだったと思いますが、最終的にはやり遂げました。
ポイントは、人間は通常このテストで72%くらいのスコアを出すということです。それが平均的な人間です。このモデルは75%の精度に達したばかりです。つまり、広範なコンピュータ使用に関しては、平均的な人間よりも優れているんです。スプレッドシート操作やプレゼンテーション生成などでは、平均的な人間よりもはるかに優れています。
そして、本当に私を興奮させたいなら、ギャビン、タッセルが飛び出します。ツール使用について話すことができます。分かりません。
そのタッセルはちょっと控えておきたいですね。実際にツールのタッセルについて話しましょうか。あなたのトゥタッセルは問題ありません。私が身に着けている他のものです。それらは鞄の中に戻っています。
OpenAIによる実世界デモンストレーション
さて、ケビン、そのベンチマークボーイの話は良いんですが、実際にOpenAIは、これが実際の人にどのように関係するかを示すために時間を取りました。彼らはコーヒーショップのために作成していたウェブサイトがあって、コンピュータ使用がここでどのように違いを生むかを示しました。
今、画像生成ツールを呼び出していて、画像生成の賢い使い方もしています。なぜなら画像の生成には時間がかかるからです。だから実際にこれら4つの画像を全て同時に生成しているんです。これはかなり素晴らしいことです。
今、モデルはKUAを使って自分の作業をチェックすることができます。KUAがここでやったことは、画像を開いて検査し、ウェブサイトも開いて見て、それらを並べて比較し、作成されたウェブサイトがこのアップデートで配置された画像にできるだけ近いことを確認することです。
これにより、作業がはるかに安く、はるかに効率的になり、最終的により良い仕事をするのに役立ちます。
KUA、これはコンピュータ使用の短縮語ですよね。それが彼らが話していることです。KUAコンピュータ使用エージェント。
そうです。
この例では、実際にコンピュータを使用してこれらの種類のことをやっているコンピュータ使用エージェントがいて、この例では写真や様々なものを操作して、それが全てどのようにレイアウトされるかの感覚を得ようとしています。
これは、このエージェント的なアイデアの実世界のユースケースの非常に興味深い方法です。
そして、デモンストレーションされているワークフローは、非常に多くのツールから驚くほど欠けていたものです、ギャビン。あなたはとてもバイブしているのが分かります。あなたの目に見えますし、それについては番組の後半で取り上げます。
でも、もしそこにいる人々の誰かが、ウェブサイトをプロンプトで存在させようとしたり、ゲームを作ったり、その他何かをしようとしたことがあるなら、多くの場合、足場はあるけれど、ビジュアルが合わないことを知っているでしょう。そういったものが全て欠けているんです。
そしてこれは具体的な例です。このサイトがあって、これがレイアウトです。きれいにしてください。そしてそれはやり方を知っているんです。これらのツールの多くは画像を生成できますが、それらを生成してそこに配置することに失敗します。そしてこれは、非常にインパクトのあるシンプルなワークフローなんです。
そして、ここで指摘することが本当に重要だと思うのは、番組で以前に話したように、コーディングはこのAGI的なものへの扉を開く種類のものだということです。私たちはこれらのものが実世界のことをするために必要です。
その理由は、コードの書き方や読み方、コンピュータで何かをすることを理解するのが上手になればなるほど、私たちが実際に使いたいかもしれないものを作ることがより賢くなるからです。
これらの各モデルは、実際のコーディングに関して、かなり大きなステップチェンジでした。初期段階のOpus 4.5のようなものから始まって、それが本当にクリックし始めたと感じた時、それは昨年末の瞬間だったと思います。ああ、何かを作ればそれが機能する、ついに、という感じでした。
今、私たちはこれらのステップを得ていて、これらの各ステップで改善しています。そしてケビン、今は2026年3月5日ですよね。これはクレイジーです。
本当に完璧になるまでには長い道のりがあるように感じます。でも、実際に違いを生むものを見ているんです。
進化は止まらない
ラインは依然として非常に上昇しています。壁にぶつかっていません。私たちは皆が辛抱強く待っている、あるいは不安でいっぱいになっているAGI大規模超知能の未来を解き放つために、あと1つか2つか3つのアルゴリズム的なブレークスルーが必要かもしれませんが、減速していません。
そして、ギャビン、他の批判は、これらのものは信頼できないというものでした。なぜなら、ただ物事を作り上げるだけだからです。このモデルでは、OpenAIのベンチマークによると、幻覚は33%減少しています。
それは大きな問題です。それは大規模な減少です。そして法的文書レビューのように重要なものであっても、Harveyと呼ばれるAI企業があります。多くの弁護士が法的文書をレビューするために使用しています。
彼らのBig Lawベンチマークで91%のスコアを出したと言っています。
ああ、Big Law。
Big Law。Big Lawは大きなカウボーイハット、大きな六連発銃、そして巨大なガベルを持っています、ベイビー。
Big Lawの法廷にいなければならないのは誰か知っていますか。Wonky Walrusですよ。彼はたくさんの仕事を持っているに違いありません。おそらく常にそこで色々なことが起こっているでしょう。
実際、Wonky Walrusには前科があります、ギャビン。
ああ、だめ。彼は何をしたんですか。ああ、信じられない、ウィル。それは信じなければなりません。それは載せられません。
Wonky Walrusは7-Elevenの駐車場で捕まったんです。
いや、捕まってません。
3回。3回です。
GPT-5.4の技術的詳細
さて、これについていくつか他の簡単なことがあります。より速く、使用するトークンが少なくなっています。
これは、何かをバイブしているとき、または何かをしているときに大きなことです。トークンは、特にAPIを使用している場合ですが、Maxプランや大規模プランのいずれかを使用している場合でも、それはより少ないリソースでより多くのことができることを意味します。これは大きな問題です。
100万トークンのコンテキストウィンドウがあります。これはOpus 4.6が今持っているものと同等だと思います。つまり、これによりはるかに長いコードベースを持つことができます。ケビンが言ったように、私はたくさんのバイブコーディングをしてきました。
4.6で何をしてきたかについては後で話します。また、時々イライラすることは、コンテキストウィンドウをリセットしなければならないときです。この時点で、500万のコンテキストウィンドウをくれと言いたいです。
可能な限り最長のコンテキストウィンドウが欲しいだけです。
今タッセルを出してもいいですか、ツール検索のために。
タッセルを出して。タッセルを出して。
最もオタク的なことの1つですが、AIエージェントがツールを使いに行かなければならないときはいつでも、おそらく最もエキサイティングです。あらゆる種類の統合。メールをチェックする、何かを予約する、画像を作るなど。
通常、利用可能な全てのツールがそのコンテキストウィンドウにダンプされ、物事が遅くなります。プロンプトが肥大化します。より多くのお金がかかることになります。そして繰り返しますが、時間のことについて言うと、物事が遅くなると言うとき、ツールを使用する際に物事が本当に停止してしまうことがあります。
このモデルは精度を失うことなく、トークン使用量を47%削減しました。これも彼らが報告していることです。これは出たばかりです。あなたと私はおそらく次の72時間ほどでこれに本格的に取り組んで確認することになるでしょう。でも、それは大きな問題です。
そして安くはないことを言及すべきです。なぜなら、これはより高価だからです。入力トークンは100万あたり1.75ドルから2.50ドルに上がりました。出力は14から15です。つまり、少し高価になっています。
しかし、OpenAIは主張しています。これらの進歩を全て行いました。はるかに少ないトークンを使用するので、全体的にはどのように展開されるかで安くなるはずです。
そして、Everyの Dan Shipperはこれに少し早期アクセスを持っていて、Opus 4.6と比較していて、半分だと言っています。つまり、エッジケースのコーディング作業を考えると、それは大きな違いです。
これが全てどのように展開されるか見てみましょう。私が最近追跡している興味深いことの1つは、昨年11月のことを覚えていますか、ケビン、Geminiが AI世界のモデルで逃げ切りそうに感じた時、それが大きなことになりました。
まあ、多くの人がそれ以来、Geminiの新しいモデルはベンチマークに調整されすぎているように感じる、ベンチマークが実世界のユースケースほどには感じられないかもしれないと言っています。
そして、これから多くのことは、あなたが使っている人にとって違いを生んでいるかのように感じると思います。なぜなら、これらのベンチマークは、時間の経過とともにどのように見えるかを追跡する感覚以外は、それほど重要ではないと思うからです。
ここでベンチマークについて話してきたことの1つは、AGI AR2ベンチマークです。これも良い数字を持っていますが、飽和していると呼ばれるものかもしれません。つまり、質問が多くのこれらのモデルによって見られているということです。より大きな方法でそれらに答えるのが簡単です。
ARC AGI 3ベンチマークが間もなく登場します。実際、ちなみに、これは最も面白いことです。サンフランシスコでそのリリースのためのパーティーがあるんです。だから、サンフランシスコでこの世界で盛り上がっているなら、それは全く新しいことです。
もう1つ言及したい本当に重要なことがあります。ティーザーでこれに言及しましたが、Noam BrownはOpenAIの最高の研究者の1人です。彼はPolynomialでフォローするのに本当に賢い人です。
彼はツイートしました。GPT 5.4は、コンピュータ使用と経済的に価値のあるタスクにおいて大きな前進です。私たちは壁を見ておらず、AI能力が今年劇的に増加し続けることを期待しています。そして、それについて少し考えてみてください。
私たちは毎週これをフォローしています。そしてあなたは毎週入ってくるリスナーや視聴者かもしれません。新しいモデルが出てくるときだけ飛び込んでくる人かもしれません。
ここから持ち帰るべき重要なことは、物事がずっと速く動くようになるものを解き放ったということだと思います。そして、ケビン、9月にこれらの会社から見るモデルがはるかに良いことを想像できますよね。この種のことの多くではるかに優れています。
そして繰り返しますが、私はドゥームスクロールやドゥームポスティング、ドゥームトーキングをしているわけではありません。ごめんなさい、ウィル。それをピーッとできます。
でも、1年前にはできないと思っていたことをこれらのモデルができる世界に住んでいる空間の一部である世界に備えなければなりません。それはただ認識しておくべき重要なことです。
私は完全に同意しますが、ギャビン、私は夜安心して眠れます。最高クラスの、最も能力があり、最もトークン効率の良いツールが、私をドローン攻撃するかどうかの決定を下すものだと知っているからです。
国防総省契約を巡る論争へ
あるいは監視ですね。つまり、国防総省が勝者を選んだんです。それはOpenAIです。この議論から移行する準備はできていますか。いくつか話したいですか。
それに移行しましょう。それに移行しましょう。
先に進む前に非常に速く、これは非常に重要な会話なので話さなければなりません。今週初めにOpenAIからドロップされた別のモデルがありました。5.3 Instantです。彼らはもう1つのモデル、5.3 Instantを使うことにしました。これは基本的に彼らの無料モデルを駆動することになります。
このモデルでは絵文字が戻ってきています。これは興味深いことです。そして、執筆がより良くなっているとされています。私のパックマンテストではそれほど良くありませんでした。私は彼らがより良く書くようにしようとし続けています。パックマンは良くありません。
これをどうやってやるか分かりませんが、ある時点で、これらのモデルの1つ、新しい5.4でさえ、それほど得意ではありません。実際、私のお気に入りのパックマンが出てきました。
5.4が最初に思いついた私の史上最高のパックマンの駄洒落があって、これの前にテキストで送りました。見ましたか。私が思いついた駄洒落は、パックマンの自伝はEat, Pray, Wakaと呼ばれるというものでした。それが彼らが思いついた駄洒落です。だから、彼らは本当に面白いことを思いつくのがまだそれほど得意ではありません。
番組のサポートと国防総省問題への移行
さて、はい。戦争に移行しましょう。この怖い会話に移行しましょう。実際、移行する前に、地元のポッドキャストをサポートしてください。私たちは独立したプロダクションで、あなたのために物を作っています。このYouTubeチャンネルを好きになって購読すれば、それは多くのことをしています。
でも、私たちはあなたにお金を渡すためのドアを開く多くの異なる方法も提供しました。それが最も重要なことです。お金をくれることができます。
トートバッグはどうですか。
まだトートバッグはありませんが、たぶんすぐにある時点でグッズを約束しました。そして皆にグッズを届けます。たぶんそれにエージェントを送ることができます。Patreonがあって、ありがとうございます。多くの新しい人が参加しました。これはエキサイティングです。
そしてケビンは、AIforhumans.showのウェブサイトで、/podコマンドの下にbuy me a coffeeを開設しました。そこで見ることができる楽しい曲がたくさんあります。今週更新する予定です。そのウェブサイトについてはもう少し後で話しますが、そこで私たちのポッドキャストをサポートできます。皆さん一人一人に感謝します。
そして今、ケビン、おそらくこれまでで最も怖いAI会話の1つに移る時です。これは先週からずっと醸成されていて、洒落ではありませんが、週末にかけて爆発しました。
舞台設定をして、それから今起こっていることに少し入り込むことができます。
さて、聞いてください。Anthropicは、先週までは政府と多くの仕事をしていた数少ない企業の1つでした。彼らは政府機関がアクセスできる安全なクラウド上でモデルを実行していました。
そして、政府機関がやりたいと思うこと全てをやります。大量通信を分析する、衛星画像を見る、戦争計画を立てる、戦争ゲームをシミュレートするなど。分かりません。おそらく5Dチェスをプレイするでしょう。何が好きかは分かりません。たぶん彼らはスネークゲームをバイブコーディングしていただけかもしれません。政府が何をするかは分かりません。ふりはしません。
たぶん文書の墨塗りがリストの上位だったのかもしれません。ポイントは、Anthropicが頼りにされていたということですが、2つのレッドラインがありました。バイデン政権下で存在した2つのレッドラインで、トランプ政権も同意しました。
1つは、彼らのモデルが自律的に引き金を引くことは決してできないということです。基本的に、彼らのモデルの1つが標的を倒すことに関与する決定をする前に、ループ内に人間がいなければなりませんでした。人間であろうとなかろうと。それが1つです。
そして2つ目は、米国市民に対する大量監視でした。
そう、それらが2つのレッドラインでした。
かなり良いラインですね。私はそれらのラインにほぼ同意します。悪くないラインです。私は、兵器でAIを使用するよりも多くのレッドラインを持つタレント契約に出演したことがあります。だから、そう、それらは2つの良いラインだと思います。たぶん200あるべきかもしれませんが、それは私の専門外です。
政府、現政権は突然方向転換して、基本的にこれら2つのレッドラインを削除しろ、さもなくばと言いました。そして、少しのFA、少しのFOがあって、それが要約です。いいですか。
そうですね。それがそうです。つまり、それよりももう少しあります。大きな部分は、それよりももっとたくさんあるということです。ええ。でも、そして私は多くの人がおそらくよく知っているので、これをリハーサルしたくありません。
非常に簡単なTLDRは、Anthropicは私たちはそれを変更しないと言いました。それから彼らは国防長官Pete Hegsethと口論になりました。Pete Hegsethはそれから出て行って、彼らがサプライチェーンリスクだと言いました。今日更新されたばかりで、それを保留にするということです。
これはAnthropicにとって大きな問題です。なぜなら、それが意味することは、政府契約を持つことができないということで、それは他の多くの企業のユースケースにとっても安全でなくなるかもしれないからです。
ちょっと指摘すると、そのことの重大性について。これはこのような会社のために以前に行われたことはありません。
アメリカの会社のために。以前にアメリカの会社のために行われたことはありません。
そして、政府契約を持てないだけでなく、政府と仕事をするほとんど誰もがAnthropicの製品を使用できないということです。だから、これは大規模な妨害です。
その通りです。それからダリオはCBSに出演して、ちょっと爆発したインタビューをしました。実際、そのインタビューのほんの少しだけ再生できるかもしれません。なぜなら、まず第一に、これについて知っておくべきことが2つあります。
1つは、もしあなたがそれを見ていないなら、ダリオは奇妙に痩せて見えます。文字通りこれが彼から体重を引き出しているような感じです。でも2つ目は、彼はここでかなりラインを保持しています。
もし今夜大統領と一瞬を持てたら、彼に何を言いますか。
繰り返しますが、私たちは愛国的なアメリカ人だと言うでしょう。私たちがやってきたこと全ては、この国のため、米国の国家安全保障を支援するために行われてきました。
軍とモデルを展開することに前向きに傾倒したことは、私たちがこの国を信じているからです。独裁的な敵を打ち負かすことを信じています。アメリカを守ることを信じています。
私たちが引いたレッドラインは、それらのレッドラインを越えることがアメリカの価値観に反すると信じたから引いたのです。そして、アメリカの価値観のために立ち上がりたかったのです。
OpenAIの対応と現状
そこで、彼がかなり重要な立場を取っているという感覚が得られますね。さて、ケビン、先週カバーしなかったけれど、今では皆が見ているこの話のクレイジーな部分は、Sam AltmanとOpenAIが入ってきて、国防総省と取引をしたということです。
これは、Anthropicの立場に基づいて、彼らがどこで譲歩し、どこで譲歩しなかったかについて、非常に混乱した会話です。そして、Sam Altmanはこの合意について多くの内部および外部の闘争に対処してきました。
この時点では、彼らは種類のプッシュバックをしているように聞こえます。Samでさえこれにプッシュバックしています。さらに重要なことは、より大きなことは、米国政府がこのサプライチェーンリスクの状況を今再確認したということだと思います。
ダリオが国防総省と再交渉しているという話もあるにもかかわらずです。だから、今は非常に緩い状況で、それがどこに終わるのか正確には分かりません。
そして正直なところ、先週は実際にそれに入りませんでした。その一部は私のせいです。なぜなら、私はiPodにダムな曲をバイブコーディングするのに忙しすぎたからです。
でも、これの中の触手は、スーパーPACの寄付が一方によって行われ、片膝をついたりリングにキスしたりすることなど、ある会社から別の会社へと観察されるかもしれないように、非常に深く走っています。そして、それが全てここに織り込まれているのかもしれません。たぶん、これは全て大きな5Dチェスの動きです。そうでないかもしれません。
私たちは本当にこれについて詳しく掘り下げることができます。でも、これはどこで終わるのでしょうか。なぜなら、エンドユーザー、つまりこれらのツールが使用される可能性のあるエンドユーザーにとって、私は言います。エンドユーザーと言うのは、私たちのリスナー、私たちの視聴者ですよね。
でも、そこにいる皆、私自身とあなたを含めて、これらのツールはあなたを監視するために使われるかもしれません。これらのツールはいつか、あなたを抑圧するために使われるかもしれません。これらの会社の1つがそれを提供することになります。
その反対側で、これは米国でAI関連のことをしている会社、あるいはテクノロジー関連のことをしている会社に対して冷却効果を送るのでしょうか。まあ、本当にうまくやらなければならないというような感じです。
そして、これは何か新しいことなのでしょうか。それとも、これは公の場でそのように露骨に伝達され、議論されているだけなのでしょうか。これは新しいことですか。
これが前例のないと思うのは、最大の問題は、政府と公衆が同時にAIがどれほど重要になるかに目覚めているという事実です。
そして、ダリオが内部メモを公開したという事実を指摘したいです。そこで彼は一種OpenAIを新しいものと呼び、menacious、つまり真実を語らないようなものと呼びました。
また、以前のあなたの指摘に対して、彼らがトランプ政権と仲良くしている理由は、おそらくOpenAI内部に人々がいて、社長のGreg Brockmanがトランプ選挙キャンペーンに寄付したからかもしれないと言いました。
だから、これはこれら2つの会社間の多くの内部政治のようなものでもあります。さて、確かに、視聴者が理解すべき最も重要なことは、私たちはまた、1レベル上の戦争、戦争と呼ぶには多すぎるかもしれません、なぜなら、今中東で起こっている多くの人々が苦しんでいるひどい状況が明らかにあることを知っているからです。
でも、私たちは他の国々、特に中国とAIを巡る1レベル上の冷戦のようなものの中にいます。
そして、ここで議論することができます。そして、私はこの政権について話しているわけではありませんが、アメリカ政府全体として、おそらく政府がこれらのものが何であり、何をするかを正確に制御できるべきだという議論をすることができます。
今、私は自分でその議論をするつもりはありませんが、もし民間企業がテクノロジーに基づいてイエスかノーと言う能力を持っているなら、それはその民間企業を国有化するための非常に大きなレバーになります。つまり、政府が支配権を握るということです。
実際、今週、PalantirのCEO Alex Karpは、かなり分裂的なコメント、分裂的な言葉を使ったコメントをしました。彼らがこれを拒否し続けるなら国有化されるだろうというこの特定のアイデアに言及しています。
だから、ケビ、これもまた非常にSF的な奇妙さですよね。政府に与えることを恐れているほど重要な技術の一部を持っている会社があるという考えは。
これは核開発競争のエコーがあります。そして、私は今週それを見つけました。ダリオがAnthropicで始める全員に原子爆弾の作られ方の本を渡していることを知っていましたか。彼は自分が取り組んでいるこのことが同じレベルの重要性を持っていると信じているからです。
とにかく、この会話は続いていくでしょう。残念なのは、Claudeがまさに勝とうとしているかもしれないと本当に思っていることです。そして、それがOpenAIがこれらのアップデートを競って出している理由の一部です。
なぜなら、あなたが気づいていないなら、まず第一に、これが全て起こったとき、Claudeはアプリストアでナンバーワンアプリに急上昇しました。これは以前にはありませんでした。Katy PerryがClaudeMaxユーザーになりました。これも彼女がCloudの一部です。
聞いてください、個人的な話ですが、私が知っている3人がOpenAIのサブスクリプションをキャンセルして、すぐにCloudにサインアップしました。
それがOpenAIが政府契約から稼ぐお金の海の中のバケツの一滴の一層だとは思いませんが、それでも人々は目覚めてGPTをキャンセルしています。
まあ、あなたがそう言うなら、でも実際にこれらの会社が稼いでいる実際のお金がどこにあるかについて、いくつかの本当に興味深いチャートが出てきています。そして、Anthropicはかなり追いついています。
Anthropicは現在年間約190億ドルを稼いでいます。これは多額のお金です。そして、OpenAIは出て来て、私たちは年間250億ドルを稼いでいると言いました。
今、人々は、OpenAIがこれらすべての消費者ユーザーを持っていて、広告をオンにしていないという事実が、その棒をさらに上げるかもしれないと言っています。でも、それは大きな問題です。
そして、実際にこれは良いと思います。つまり、ここでこの飛行機を着陸させて、私たちが同じページにいることを確認すべきです。
これは、番組を始めた最初の頃から、AIについて実存的に心配していたような種類のものです。大きな質問をしなければならないというこの考えです。
そして、もし私が別の政府と戦っている政府の一部で、その戦いに同意しなくても、私の政府が私たちの政府を守っている人々を救うために可能な限り最高のツールを使いたいとき、どう対応するかです。
これは人々が自分自身に尋ねなければならない奇妙な大きな質問です。そして、もう1つの楽しいものがあります。マンハッタン計画が、それを追いかけている3つか4つ、12の異なる会社があると言いましょう、公の場で行われ、同時にTikTokが存在することを想像できますか。
同じ時にソーシャルメディアがどうなるか想像できますか。
ビデオ生成ツールの進化
あるいはこの政権下で、ですよね。これはもう1つのことです。このような公の場での戦いに巻き込まれ、政権の人々が公の場で汚い洗濯物を晒すようなことです。あなたの指摘のように、いいえ、それはひどいです。これが起こるのはひどい状況です。
そしてそれは私たちが作る必要があるチャンネルです。ちなみに、TikTokのインフルエンサーがマンハッタン計画がリアルタイムで構築されているかのように物事に反応するというものです。
それは大恐慌です。それは10年、20年間10になるでしょう。でもケビン、他にももっとたくさんエキサイティングなことが起こっています。ギャビン、あなたが投票したものを得ていて嬉しいです。
Claudの進歩について話しましょう。なぜなら、スタートアップのために1つ注ぎましょう。これのためのグラフィックが必要です。毎週、スタートアップの全員のために1つ注ぐ必要があります。
実際、その前でさえ。ええ。世界を席巻すると信じている、私が作った新しい用語について話したいです。それはClaud rottingです。
そして今週、ケビン、私は基本的に、bed rottingが何か知っていますか。その用語に精通していますか。
知っています。brain rotも知っていますが、Claude rottingは好きではありません。
Claude rottingは、私は自分自身のTikTokを撮りました。それを指摘するためだけに。それは、あなたが…
Claudemediaに感染したんだと思います。
いいえ、Claudemediaに感染していません。Cloudmediaはこれではありません。基本的に、これはClaudeコードをやることに時間を使いすぎて、自分の世話をしないことです。
だから今週たくさん時間を過ごしました。でもはい、大きなアップデートがあります。音声モードがCloudeコードに来ています。たくさんの新しいCloudeコードスキルが来ています。
だから、ケブ、今週の私のCloudeコードアップデートで、新しいウェブサイトAIforhumans.showにリンクブログを追加しました。主に20年前のことをやって、そのプロセスを楽しみたかったからです。
RSSフィードがあります。あなたとあなたのエージェントのために、行きたければ。でも、これは理解することが重要だと思います。Claudeについて、Claudeには何かがあって、私にとって、そして、あなたにとってどう思うか分かりませんが。何かは分かりませんが、文字通り私にどう話しかけているか、あるいは私が慣れているものかもしれませんが、Codexアプリを使うよりも良いと感じています。
その経験を全く持っていますか。Claudeには何かがあるように感じますか。分かりません。以前はこれを持ったことがなく、ターミナルウィンドウのものを使い始めたばかりかもしれませんが、Grokがアニメベイブアシスタントを立ち上げて以来、あなたがしていないような奇妙な接続性があります。
ギャビン、これは本当に素晴らしいです。あなたの目にまたきらめきが戻っています。これはクレイジーです。
Claudeは私のデイリードライバーです。完全に。Claudeコードを実行しているターミナルウィンドウを複数開いています。私のClaudeボットは全てCloudeコードによって駆動されています。
ええ、Claudeが行き詰まったときに互いに跳ね返すためにOpenAIモデルへのアクセスもあります。でもそれは私のデイリードライバーです。
これから来る旅行や旅行を計画するためにClaude co-workを使います。パワーポイントやスライドショーを作るために使います。それはまだ私のナンバーワンです。だから、彼らが新しい何かをリリースするときはいつでも、私は全面的に賛成です。
ちなみに、リンクブログが好きです。人々は眠らないでください。AF.showlinkblogです。
ええ、持っていると非常にクールです。そして興味深いのは、iPhoneショートカットを作成する方法として使ったので、何からでもリンクをリンクブログに簡単に送ることができるということです。自動的に投稿されます。
同じことを、ChromeまたはSafariにブックマークリストを持っていて、それに追加できます。それらはできる小さなクールなことです。
そして今、ケビン、今これを定期的にやっているので、本当に興味深いことの1つは、あなたと私が以前に話したことですが、あなたはこのプロセスを自分自身で始める6ヶ月前、あるいはそれより早くにいたかもしれません。
でも今、これをやるのが簡単なので、私はいつもターミナルウィンドウを開いていて、ウェブサイトの新機能が脳に浮かんだら、ああ、これを探求しようと思います。そのことをやってみよう。そして、それはただ行きます。そして、あなたはただこのやり取りをしているだけです。
だから繰り返しますが、Claudeについてのこの話全て、そしてうまくいけばClaudeが消えないことを願っています。政府とClaudeが何らかの合意に達することができ、Claudeと前進できることを願っています。
でも、これらのモデルを全て試すべきですが、特に今Cloudで起こっていることには何か特別なものがあります。そして今、彼らは音声モードを追加しています。
使用が増え続けると感じます。だから、友人や家族に見せるのに良いものです。試用版として。
Claudeだけでなく、いくつかの会社が今週、人々が手に入れることができるアップデートをリリースしています。いくつかの信じられない新機能、何ヶ月か前には私たちが何時間も何日も何週間もかけてやっていたことが、今では即座に単一のアプリ内でできるようなものです。
Cling Motion Control 3.0は本当に私の注目を集めたものです。
ええ。つまり、これは彼らの次のバージョンのモーションコントロールです。あなたと私は、Runwayのact oneとact twoからこの種のことについて話してきました。
これは基本的に、ビデオを操作したり、それが何であるかに基づいてビデオにルックを追加したりできます。一般的には非常に良いです。非常に良い仕事をします。
Clingのサイトにいくつかの例があります。ええ。つまり、自分自身を録画して、シーン内の任意のキャラクターにあなたのパフォーマンスを変換またはその上に配置する能力は大規模です。
そして、はい、それを可能にする他のツールがいくつかありました。これは信じられないほど正確に見えます。非常に微妙で、パフォーマーの顔の詳細を捉えています。
そしてそれを照明や影など全てを含めて、シーンに本当にうまく転送します。だから、これはAlex PetroscuまたはMaxescuがXに投稿したオーディションテープを入力として使用した例です。
基本的に、ビデオバージョンを見ている場合は理解できるでしょう。音声だけの人は、誰かがダイナミックなパフォーマンスを提供していて、それが素晴らしく出てきます。
Helenaはあなたを決して私のように愛さないでしょう。でもあなたはそれでも彼女を愛するでしょう。そして毎日彼女が美しいと言うでしょう。そして彼女はそれを信じるでしょう。なぜなら彼女は美しいからです。
さて、音声のみ。それが奇妙なASMRモーメントだったことは分かっています。ビデオの友達は、パフォーマーを見ましたね。顔が完全に異なるキャラクターに転送されるのを見ました。
キャラクターの耳にぶら下がっているイヤリングの物理学、ですよね。キャンドルライトの柔らかい影が顔に影を作り、シーン内で機能しています。
そして、クリップの残りを見ると、キャラクターを何度も変えているのが見えます。そして、それはただ機能します。
だから、ケビン、私はやりました。ほとんどただ機能します。私は決めました。なぜ試さないのですか。なぜ今週の最もバイラルなビデオの1つを取らないのですか。
見逃した場合、McDonald’sのCEOがBig Archバーガーを試して、それを食べるのに悲惨に失敗しました。見るのが非常に楽しいビデオです。彼は非常に硬直しています。
だから、ケビン、まず私はこのビデオを取ろうとして、彼をバーガーを食べる女性にしようとしました。そして、最初にこれをやったときに気づかなかったのは、私はそれを与えました。それは何らかの形で彼を使いました。
だから、これはバーガーを食べている彼のように見える女性を作りました。だから最初にこれを再生してください。
ここにもクリスピーオニオンが入っています。それらが出てくるのが見えます。
さて、真実の瞬間です。
さて、5秒で止めています。なぜなら、Instagramで舌が口から垂れ下がっている犬のように見えるからです。これまでのところ、赤い髪とスポーツブラを着たMcDonald’s CEOの別バージョンであるにもかかわらず、
本当に良い仕事をしたと思いました。ルックや他の全てを捉えたと思いました。今大きな一口の瞬間に行こうとしています。
ただ待って。待って。でも、噛む部分は見てください。見てください。
さて、モデルは食べることを理解していません。
とても良い。Big Archにとって大きな一口ですね。
さて、そこで分かります。だから、何が起こっているかというと、実際のビデオでは、男がバーガーをカメラに見せる時で、それで何をすべきか全く分かりませんでした。
だから、手はホラー映画のようなジャンプスケアです。さて。ホラー映画。それはリングスタイルのジャンプスケアでした。なぜなら、手がどこからともなく現れて、モデルが狂ったように暴れ始めたからです。
待って。次のに行きましょう。だから、私は後のビデオで使う予定の女性の画像を作ろうとしました。代わりにこれをやっているでしょう。
だから私はこれをやりました。そして、高級レストランで赤毛の女性を作りました。だから私はこれをやりました。これを再生してください。そして、似たような種類の問題ですが、最後も見るでしょう。
ここにもクリスピーオニオンが入っています。それらが出てくるのが見えます。さて、真実の瞬間です。
とても良いですね。Big Orangeにとって大きな一口です。いいえ、
最後にちょっとクレイジーなものになるのが見えますか。
だから、これについてとても面白いことは何ですか。Left for Deadの敵が動揺したときのようです。正確に。
だから、もしあなたがこれを見ていないなら、基本的にビデオで起こったことは、CEOがバーガーをカメラに掲げるようなものでした。ビデオモデルはそれで何をすべきか分かりません。だから、ちょっとパニックになっています。
でも、これらの両方の例で、話すことは実際に本当に良く見えたと思いました。うまくいかなかったことは、バーガーを噛むようなことでした。各回、CEOが一口取ったとき、別のCEOが奇妙な一口を取りました。それが有名になった理由は皆が知っています。でも一口を取って、何か間違ったことをしました。
だから、インタラクティブなものはそれほど良くありません。でも、話す方は本当にかなり良いです。一般的に、ええ、明らかにダイナミックなシーンとダイナミックな動き、たぶんそこにはありませんが、親密な、誰かの顔のニュアンスを捉えることが非常に重要な場合、それはただ良くなっていると思います。
繰り返しますが、数ヶ月前にスタートアップのローンチビデオを作りましたが、これらのタイプのパフォーマンス出力を得るために複数のサービスを組み合わせるのは少し骨の折れることでした。今ではオーケー、ええ、ここにあります。
だから、もし行きたいなら、そして私は知りません。あなたのOFとしてあなたのオルトを立ち上げたいなら、それらの言葉があなたにとって何か意味があるなら、ここにあなたのチャンスがあります。
あるいは、あなたのビジネスのための新しいスポークスパーソンが欲しいなら、あるいはUGCコンテンツを作りたいなら、はい、どうぞ。
Open Friesについて話しています。Open Friesは私のお気に入りの新しいスタートアップですよね。ロボットフライ製造スタートアップのようなものです。とにかく、OFといえば、Grock Imagine Extendについて話しましょう。
Grock Imagine Extendとその他のビデオツール
Grock Imagine Extendは、Grockビデオを拡張する方法です。今、Grock、番組で何度も話してきました。いくつかの興味深い入出力があります。昨日それを使おうとしたとき、私は確実にそれを経験しました。
もしあなたがスパイシーなものに興味があるなら、Grockはまだそれを持っています。私は時々、物事が出てくることを意図していませんでしたが、出てきて、ワオ、まあ、そこにありますという感じでした。
とにかく、Grock Extendは基本的にビデオを取って、その最後に拡張して物を追加することができます。さて、ケビン、正直に言うと、一般的に、これは他のビデオのもので以前に見たような種類のものに感じます。
でも、最後にどこにいたかを理解するのはかなり良い仕事をします。McDonald’sの1つで使った同じ女性のビデオを取って、レストランでデートに行くようにしました。
これを再生すれば、少しの劣化があるような感覚を得られます。約30秒です。30秒の長さにできます。
ちょっと、何から始めたか知っているように。正確に。
ダイニングルームテーブルの女性の画像から始めました。だから一番最初の画像、それはただの静止画像で、私はそれを画像からビデオにアップロードして、これをアニメートしてくださいと言いました。そして、進むにつれて方向を与えましたが、あまり多くはありません。
素晴らしい。さて、始めましょう。彼女はワインのグラスを飲んでいて、カメラに微笑んでいます。ウェイターが入ってきます。猫の缶の美味しいトレイです。
私はこのブランドが大好きです。とても美味しくて栄養があります。Fancy Feast Tuna Taco Time試してみたいですか、ジョン。
どうぞ、一口食べて。
誰に話しかけているか分かりません、キャロル。そこには誰もいません。
Fancy Feast Tuna Taco Timeを残して、去ってください。
それで、30秒です。私はFancy Feast Tuna Taco Timeを発明しませんでした。でも、興味深いのは、Grockの声はまだそれほど素晴らしくないということです。
一番上の音声、ピアノが演奏しているのを聞くだけの最初のアニメーションは、実際にかなり素敵だったと思います。
でも、正確に何のようなものかは分かりません。そして、拡張する方法がありますが、各世代にわたって顔が少し変化することにも気づくでしょう。
そして繰り返しますが、タイミング的には大丈夫です。いいです。ここでやるべきことがたくさんあると思います。そして、ちなみに、Grock Imagineに対してシェードを当てるつもりはありません。なぜなら、はるかに良くなっているからです。
実際、画像モデルとしては非常に速く、本当に良いです。ただ、Extend Videoが多くのことをするかどうかは確信が持てません。これからはショットごとの世界になると思います。
ワイングラス内のワインの物理学は本当に良いです。ウェイターの腕の周りにフォークで手を伸ばす、フォークする、それは奇妙な動きですが、シーンのフレーミング内で実際に意味をなすものです。
だから、ここには実際に非常に印象的なものがあり、それから生産準備ができているかどうか分からない他のものもあります。なぜなら、顔が少し変化するからです。
だから、Sora Danceがいくつかの点でどれだけ優れているかの例として、私は同じ画像の15秒クリップを取って、非常に具体的なプロンプトを与えました。でも繰り返しますが、これはextendについてではなく、これは15秒なので、これを見て再生できます。大きなバーガーの一口です。
待って、待って。これは何ですか。
なんてこった、レディ。
バーガーに小さなクマがいます。私にとって驚くべきことは、ケブ、バーガーを噛む音が聞こえることです。彼女の声は自然な声のように聞こえます。
これらは、最先端のビデオが今やっている種類のことです。そして、Grockは画像やビデオの単なる生成以外のすべてについて、まだそこにいないかもしれないと思います。
Grockだけではありません、Sora Danceだけではありません。Googleが今週新しいビデオの何かをリリースしました。でも、それは同じタイプの体験ではありません。これはNotebook LMへの拡張です。
リンクをたくさん落として、インタラクティブなチャットボット、フラッシュカードゲーム、あなたのコンテンツが何であれ、それを超えるオーディオポッドキャストを作成できるのと同じように。
今、Googleはこれらのビデオ概要をつなぎ合わせます。画像があり、アニメーションがあり、非常にキネティックで、サウンドトラックと良いボイスオーバーがあり、一種のワンショット説明者です。
もし私がYouTubeチャンネルだったら、特に顔なしのものなら、少し心配するかもしれません。
限界のアイデアは、私の全ての中で最も強力なツールの1つです。
さて、それで十分です。それで十分です。ここに問題があります、ケビン。心配しないでしょう。なぜなら、これはあまり良くないと思うからです。そして、悪い意味で言っているわけではありません。私は…
NotebookLMの映像機能と今後の展望
ここです。ええ。でも…
ここに問題があります。これらを見ると、AIがこれらのものを作ったように感じます。グラフィックスはAIが作ったように感じます。
私が見ているものに対してそれほど興味深くもダイナミックでもありません。そして、はい、V3ビデオを言葉に接続しているのですか。はい。でも、顔なしのYouTubeチャンネルは、舞台裏で起こっている興味深い会話や興味深いことがあれば機能できると信じています。
でも、この反復は、7年生の先生がまとめるような種類のものに非常に似ていると感じます。そして、それが私にとってどれほど説得力があるか分かりません。何を意味するか分かりますか。見たときに…
そこにいる素晴らしい先生たちには申し訳ありません。やめないでください。
私の7年生の先生と言いました。一般的に7年生の先生とは言っていません。
Mrs. Busatil、Patreonを取り下げないでください。ギャビンはそういう意味ではありませんでした。
彼女の名前は何でしたか。
関係ありません。
Busatilですか。それが彼女を呼んだものですか。
Busatil。名前です。
Justine Mooreのディズニーランドの例を見てください。彼女がまとめたもの。私は、強制遠近法について賢い選択をしていると思いました。ショットにカットするときなど、興味深い選択をしていました。
初期段階ですか。もちろんです。でも…
まあ、それが私が言っていることです。ええ。ええ。私は絶対にこれが素晴らしい出発点になるのを見ることができます。そして、最近大きなトピックを消化するためにNotebook LMに行ってポッドキャストを生成する回数は、ゼロではなく、毎週高くなっています。
同じくらい速くできるなら、これを選ぶでしょう。小さなビデオ概要を持っていて、それも再生されていても構いません。だから、これは非常に興味深い製品の始まりだと思います。
それは認識しておくべき重要なことだと思います。これの始まりの段階で、私たちが番組で話すすべてのように、6ヶ月後にははるかにはるかに良くなるかもしれない世界があります。
そして、それは説得力のあるものになるでしょう。でも今のところ、それを見ると、私にとってまだそこにいないように感じます。Notebook LMのポッドキャストで起こったのと同じように。私はそのポッドキャストに少し飽きてきます。
いつも同じように感じる方法が好きではありません。しばらくすると、いつもこれら2人の同じ人々がそれを全て消化するのを聞きたくないという感じになりました。
ただそのように感じました。
私たちの聴衆を理解しています。
でも少なくとも私たちは奇妙な選択をしていて、週ごとにお互いについて異なる感じを持つかもしれません。入ってくるコンテンツのすべての部分に対して同じ正確な感情を持っている2つのロボットのように感じるものよりも、1つのことについて異なる情熱を持つかもしれません。
だから、この種のものに対する私の心配は、人間の選択が背後にあるあまり興味深くないグラフィックを見たいと思うということです。たぶん。分かりません。これがどう機能するか見るのは興味深いでしょう。
Ben AffleckがそのようにするならGavin、彼が愛していると主張する業界を作る決定をするクリエイティブはいないでしょう。なぜなら、Ben Affleckは水と手つかずの土地を嫌っているので、AI会社に取り組んできたからです。
Ben AffleckのAI企業とNetflixの買収
今良いクリップを手に入れました。それだけでTikTokに上がるでしょう。魅力的でしょう。
だから、はい、VarietyやたくさんのOther placesがNetflixがInterposotiveと呼ばれる会社を買ったと報告しています。そして、これはBen Affleckの秘密のAIスタートアップで、AIモデルを作っているのではなく、特にBenがこの会社を作ったのは、デイリーなどを行う制作で、制作がより良く、より効率的に撮影する方法を見つけるためにAIツールを使用する方法があるようにするためです。
AIの仕事のアイデアについて話します。番組で議論しました。Ben Affleckが実際にAIについて議論した会議の1つだったと思います。彼はそれについてかなり興味深い見解を持っていました。
創造的プロセスを置き換えるとは思っていませんでしたが、実際のプロセスを改善するだろうと考えていました。だから、これはそれに傾いています。
ケブ、背景で誰かが言及しているのを見ました。NetflixとWarner Brothersの取引が成立していれば、この取引はおそらく成立しなかっただろう、なぜなら彼らはたくさんのお金を使ったからです。
だから、Netflixはこのようなものをいくつかつかむためにそこに出ているのかもしれません。でも全体的に、ハリウッドがAIで物事をやっていて、それについてあまり声を上げていないことを示していると思います。
いくつかのことを指摘します。彼らはカスタムデータセットを構築しました。実際に完全なプロダクションセットを構築し、大量の映像を撮影した16人の会社のようなものです。
だから、おそらくタグ付けできます。これがレンズです、これが私たちが選んだライト温度です、これが距離とフレーミングとブラブラブラです。そして、彼らは独自のモデルを作りました。
そして、アイデアは、作業していて、Netflixはこれをパートナーに無料で提供する予定です。だから、Netflixの番組で作業している場合、このツールにアクセスできるでしょう。
ショットの1つで照明が少しずれていたかもしれません。あるいは、ショットにVFXを入れようとしているけれど、選んだレンズのタイプでうまく機能していません。
このツールが約束するのは、それをより良くすることです。それができるのは、行って、主にポストプロダクションツールです。
ギャビン、ねえ、ギルド、リラックスしてと補強するために一生懸命やっています。ここで人間を置き換えているのではありません。人間を強化しているのです。これはもちろん正しいメッセージングであり、素晴らしいアプローチです。
でも、これが何らかのポストスーパーバイザーやカラリストやその他何かを置き換えるなら、彼らはその発表もするつもりですか。おっと、悪い。私たちのツールが誤ってこれをやってしまったというようなことを言うつもりですか。
いいえ、そうではありません。そして、これは彼らが走るのに苦労する闘争です。そして、ギルドや、ギルド内で働く人々、そして私が言ったように、私は今のところライターギルドやたくさんの場所のメンバーです。
AIを採用する人がもっと増えるにつれて、これは前進し続けるので、難しい時間を過ごすでしょう。ええ、これは私たちが数週間前に番組で言ったところだと思います。
クリエイティブは非常に長い間物を作る役割を持つだろうが、生産は非常に速く変わるかもしれないし、以前よりも生産の役割ははるかに少なくなるだろうというこのアイデアです。
それを言ったときにSpectreデバイスを起動すべきでした、ギャビン。AIが人間の仕事を奪うことについて悪いことを何か言う前に、まったく新しいサイバーパンク音声妨害デバイスを起動すべきでした。
音声妨害デバイスSpectre
その通りです。これはSpectre 1デバイスです。これは新しいスタートアップからのもので、これは今のところプロトタイプです。だから、これがどう機能するか確信がありませんが、基本的なアイデアは、AIデバイスがあなたを記録するのを止めるために。
FriendやIRL会話を記録しようとしているそこにある他のデバイスのようなものを見たことがあるでしょう。これらの会話をブロックできる世界に入ろうとしています。
そして基本的に、これは覆われた服を着ている人々のビデオを見たことがあるなら、写真を撮るとカメラが壊れるようなものと同じようなアイデアです。これは音声で同じアイデアです。録音しようとすると、時間の経過とともに実際にカバーします。
ええ。基本的に、私が見ることができるところから、Google NestまたはたぶんMiniのようなサイズです。テーブルに座る小さなものです。
そして、AIとwhimsyを使うとされています。SpecterがAIと新しい物理学を使って妨害を再発明すると言っています。だから、より的を絞った、賢く、ポータブルなものになるでしょう。
従来の音声妨害装置は、多くの電力を通じてマイクを圧倒することによって機能すると言っています。これは非効率的です。
見てください、私は…このデバイスが広告通りに機能するかどうか分かりませんが、100%このようなデバイスの未来を見ています。特に、皆がMeta Ray-Bバンドを持ち歩いていて、Appleがリリースする予定のものなど。
そして、常に記録されたくないなら、顔でも声でも、おそらく何らかの反記録デバイスを持ち歩かなければならないでしょう。
これは陰謀コーナーかもしれませんが、本当には分かりません。時々湖に行き着くことになるからです。湖に行き着くでしょう。でも、wifi が人々の家の中でビデオ信号を与えることができるかもしれないというあれを見ましたか。これを聞いたことがありますか。
本当です。本当です。
ええ。それは本当ですか。それはかなりクレイジーです。だから、たぶんあなたはそれが何かについてより良い感覚を持っているでしょうが、私はつい先日それを読んだばかりで、ワオ、それは狂気だと思いました。でも、それは私にとってクレイジーに感じます。
まあ、Wi-Fiはどこにでも跳ね返っています。すべてのWi-Fi信号のようなもの、2.4GHzネットワークから、コストコから押し出されている新しい標準が何であれ、すべてまでのスペクトル全体です。
それらすべてがこれらすべての波を生成しています。まあ、物事がこれらの波を通って移動すると、乱れを作ります。
だから、これらの波を読むことができるハードウェアまたはソフトウェア、時には両方を構築できれば、歪みと乱れを見ることができます。そして、彼らは基本的にそれにモデルを訓練します。
だから、あなたが家の中を移動すると、もし彼らがこれらの波を読むアクセスを得ることができれば、誰が動き回っているかを判断できます。
だから、それはただ本当です。
私たちの未来へようこそ。
私たちの未来へようこそ。だから、それのためのブロッカーも必要になるでしょう。ブロックする必要がない他のものを知っていますか、ケビン、今週AIであなたが何をしたかを見ることです。
その通りです。AI、それが見えます。あなたがしたことが。時々あなたは気にせずにスクロールしています。それから突然止まって叫びます。
AI See What You Did There
さて、ケビン、今週は本当に楽しいものがあります。最初に指摘したいことの1つは、TikTokでバイラルになったビデオがあって、それからTwitterにもあります。それはShape Storeと呼ばれています。これは大好きです。
これはBird Gameビデオを作ったチームからのものです。Bird Gameがこの偽のゲームが作られたようなビデオを覚えているなら。
家にいる人々のために何を見ているか説明してください。それを話している間に再生するかもしれません。
ええ。つまり、90年代後半から2000年代初頭のフィッシュアイカメラレンズのような、この地下運動を垣間見るような感じです。Shape Storeのようなもので、たくさんの人々がそこにいます。
彼らはたむろしています。彼らは大きなブロックが大好きです。彼らは大きなブロックでミニゲームをプレイしています。彼らは、あなたが若い頃に待合室で歯医者のオフィスでプレイしたかもしれない大きな原色の木製ブロックのようなものです。
ここで特定の層に話しかけていることは分かっていますが、磁石付きの古い列車、小さな車、ミニ城を建てたりするようなものです。
まあ、これはShape Storeで人々がこれらのブロックで遊んでいる地下世界です。彼らは滑り台を下っています。バンパーカーに乗っているようなものです。中間ゲームをプレイしています。
そして、これはすべてヒップホップ中心的な感じのような、この地下運動に対する感じです。
本当に、これはただ私が住みたい世界です。
今週出てきた大きな話がありました。最高裁がAIが著作権で保護できないという話を議論しないことを決定したようなものです。そして、純粋にAI出力が著作権で保護できないのはそのためだけであり、人間の入力がそれに触れると、オンラインでこの大きな戦いがありました。
これは、本当に興味深い声であることの意味の良い例です。これはAIツールを使った創造的な声で、このようにまとめられています。彼らはその音楽を取り、これらすべての画像を生成しましたが、このようなものに見えるようにしました。
これは本当にクールなものです。そして、TikTokとInstagramでai.solationに行きたいなら確認してください。それがこれを生成した人です。これは他のソーシャルでどこでも共有されているのを見ますが、彼らをフォローしに行ってください。彼らは非常に楽しいです。
素晴らしい。
さて、今週オンラインで出てきたもう1つの大きなビデオは、私たちが今戦争にいるという事実と関係があります。Bill Walidはすごいユーチューバーで、たくさんのことをしています。
実際にGoogleの地理位置情報、地理空間世界で働いていました。地理空間技術とAIについて多くのカバーをしています。Operation Furyのためにこの信じられないほどの可視化を作りました。
これは長いYouTubeビデオで見ることができますが、彼が行ったことは基本的に、UXとUIを取り、実際の戦争のロールアウトからのリアルタイムデータの上に配置し、その中を場所から場所へジャンプできるようにすることです。
これは魅力的です。彼はこれを製品化しています。製品を作る予定ですが、今のところ、これはただこのYouTubeビデオですが、もし時間があれば、これを見てください。
これは1人がやっていることです。さて、彼は地理位置情報と空間データのものに専門知識を持っていますが、このようなものをバイブコードで存在させる能力がどこまで来たかを示しています。
だから、これは素晴らしいものだと思いました。
ええ。そのようなものがどれだけ速くまとまるかを見るのは超魅力的です。リアルタイムで紛争を見るために、独自のダッシュボードをまとめようとしているPoly Marketボットブラザーズがたくさんいるのは確かです。
でも、無限のfaviconsをスクロールしたいです、ギャビン。
ええ、これはJoseph Jojoによって作成された本当にクールな小さなプロジェクトでした。これは素晴らしいハンドル名ですが、彼は基本的にたくさんのfaviconsを取りました。
それらはfaviconsですか、それともfaviconsですか。私はfaviconsだと思っていました。
まあ、あなたのJohn Favrosやお気に入りに何を入れますか。
分かりません、男。これは…私たちは理解しなければなりません。これは…
それはfaviconだと思います。かなり確信しています。
ええ、なぜならお気に入りだから。だから、あなたは私の…ええ、私のfabricフォルダに入れると言うでしょう。私のお気に入りが行く場所。
ええ。お気に入りが行く場所ですよね。
とにかく、これは何ですか…
あなたのお気に入りのアイスクリームの味は何ですか、ギャビン。お気に入りの味はありますか。
先に進みます。先に進みます。私にはたくさんのfabricsがあります。人生で愛するたくさんのfabricsがあります。
とにかく、無限のfaviconsは、世界に存在するすべてのfaviconsを本質的にスクロールできるものです。そして、favicon、またはKevinによるとfaviconは、あなたがその特定のもののように見えるようにする小さな種類の画像です…
Flavlavがどう思うか。
ヒップホップアーティストのFlav。さて、先に進みます。先に進みます。最後に、最後に、私たちの友人Blazainからのものがあります。彼について何度も話してきました。
彼は音楽ビデオメーカーをオープンソース化しました。彼はまだこれをリリースしていませんが、非常にクールです。彼はローカルのオープンソースビデオモデルで多くの仕事をしていて、基本的に任意の曲のための音楽ビデオを作成するフロントエンドを作成しました。
だから、音楽をアップロードし、音楽トラックをアップロードすれば、音楽ビデオを作成するでしょう。それは、BaneとBill Walの間のこれら2つの本当に異なる人々が特定の専門知識を持って今何かをバイブコーディングしているということを示しています。
だから繰り返しますが、これはあなたが今週何を作りたいか考えるために外に出るあなたの呼びかけです。
彼らが音楽ビデオ作成に接続すべきいくつかの楽しい曲を考えることができます。
ええ、私のflavor ValentineまたはFlabaと一緒の他の曲名のようなものを言うつもりだと思いましたが、ウェブサイトを更新したという事実について話したいです。それもいいです。それも好きです。
だから、flabberなもの。これらは私のお気に入りのflavorなものの一部です。
まあ、今…
John Favroはどうですか、ケビン。John FavroはFavです。
それが私がこれを始めた方法でした。もし…
恥ずかしがるのに忙しすぎました。もう遅すぎます。
ウェブサイトのアップデートと音楽カバー生成
だから、戻ってくるファンは知っているでしょう。先週、呪われたiPodをウェブサイトAIforhumans.show/podで立ち上げました。他の曲からアーティストカバーを作成するために、閉鎖されていないことにまだ驚いているオーディオモデルを使用しています。
ええ、Adeleがアメリカ合衆国大統領のLumpをカバーするようにしました。EaglesがAfricaをカバーしました。人々は本当にRage Against the MachineがBritney SpearsのToxicをやるのが好きでした。
私は私の側でプロンプトを繰り返し続けました。なぜなら、ウェブサイトに行って、これをそれのカバーにしてくださいと言っているだけではないからです。
私のClaudebotであるMr. Tibsのためのスキルを作成しました。それは、通常話すこと、彼らのリズム、通常文章で何語使うかなどを分析するために、アーティストのようなリサーチをして歌詞を引き出します。
そして、プロンプトを生成し、カバーしている曲の歌詞を修正してアーティストによりよくフィットさせようとします。そして、繰り返しますが、ここには実際のベンチマークはありませんが、名目上の改善、出力の10%の改善のようなものを得るでしょう。
時間外に曲の後に曲を生成し続けて、ABテストのようなものをしました。あれの方が良い、これの方が良いというような。まだ少しヒットアンドミスですが、今では、ギャビン、一日中特別なTelegramグループで、曲を私のために引き出しているボットがいます。
どのアーティストがどこに行くかを選んでいるだけで、どのように、そして私は奇妙さのパーソナライズされたプレイリストのようなものを持っています。
そのために何を払っていますか。30ドルくらいSonadoサイトに渡したかもしれません。
ワオ。さて、わかりました。それはクレイジーではありません。
クレイジーではありません。つまり、それは…たくさんです。そして、明確にしておきます。そのお金がアーティストに行くことを願っています。
ええ。
今はそうではありません。先週それについて話そうとしたところ、多くのAIヘイターが私に襲いかかってきました。特に音楽AIヘイターは特定の品種です。ゲーミングのものに似ています。
そして、理解できます。完全に理解できます。そのお金がクリエイティブに行くことを願っています。このウェブサイトはおそらく閉鎖されるでしょう。
ええ。
閉鎖されないことを願っています。レコード業界が彼らと取引をして解決することを願っています。
でもその間、楽しんでいます。だから私のyumをyuckしないでください。ウェブサイトに行って、新しい曲が見えるでしょう、そうですよね。
ここで見えるものです。はい、落ち着いたプロンプトと、ウィルがこれを全部カットできます。分かっています。私が恋に落ちたプロンプトの1つは、ロックとメタルバンドが童謡のカバーをやることです。
だから、System of a Downがthe wheels on the busをやります。Rage Against the MachineがHumpty Dumptyをやります。そこには、誰がその卵を壁に置いたのかのような歌詞があります。
アーティストになるようにモデルに指示し、パフォーマーであることを修正し、それから、マーケティングスローガンや広告から曲を生成するようにMr. Tibsに指示して、Mars VoltaやArcade FireやEmarosaのようなバンドのスタイルで、私が愛するこれらのバンドで交換しました。
それがあなたでないと言ってください。良くないと言ってもいいです。聞きません。でも良くないと言うことができます。またはbuy me a coffeeに数ドル投げ込んで、ケビンを正しくアフできます。
それはケビンを非常に特定の方法でくすぐります。それは素晴らしいことです。それは非常に素晴らしいことです。
そして、そこに存在するそのようなあらゆる種類のものがあります。聞いてください。AIforhumans.show/pod。今すぐそこで見ることができます。新しいトラックがそこにあります。そして、来週皆さんに会います。
サインアップしたら。戻ってくるとは知りませんでした。
来週。さようなら友達。
みんなさようなら。


コメント