本動画は、AI業界の最新動向を解説するポッドキャスト番組「AI for Humans」のエピソードである。OpenAIがMicrosoft Officeの競合サービスを開発していることや、GoogleがGemini CLIという無料のコーディングプラットフォームを提供開始したこと、さらにはAI企業による著作権データの学習利用が裁判で合法と認められた画期的な判決など、AI企業が世界を席巻しつつある現状を詳細に分析している。また、テスラのロボタクシー展開、DeepMindのロボット技術、AI生成コンテンツの是非についても議論を展開している。

OpenAIとGoogleのAI覇権争いが本格化
大手AI企業であるOpenAI、Anthropic、Googleは今週、世界制覇への道のりを順調に進んでいることを示しました。Googleは強力なコーディングプラットフォームを無料で提供し、DeepMindは非常に興味深い最新のロボット技術を発表しました。そしてOpenAIはMicrosoft Officeと直接競合するサービスの開発を進めており、新たな裁判所の判決により、AI企業が私たちが今まで作ってきたあらゆるものを学習に使用する法的権利への道筋が開かれた可能性があります。
ケビン、私たち人間に何が起こるのでしょうか。
わずか1日25セントで、機械に支配された世界で関連性を保とうと奮闘する人間を支援することができます。
ちょっと待って、ケビン。私たちはもう「人間を助けよう」のコマーシャルをやっているのですか。
実際にはもうやっていません。それも自動化されてしまったのです。1日わずか25トークンで、あなたも人間の思考能力を超え続ける感情を持つ機械を支援することができます。
もういい加減にしてください。
今週は他にも、テスラがオースティンでロボタクシープラットフォームの不安定な展開を行ったこと、Runway MLが独自のゲームを作成できる非常にクールな新製品を発表したこと、そして私がAIスロップを擁護しようと試みることについてもお話しします。
AIスロップは近い将来、人間に残された唯一の栄養源になるでしょう。1ミリ秒あたりわずか25ホローコインで…
分かりました、分かりました。これは「AI for Humans」ですが、皆さん、私たちにコインをお恵みください。
AI企業による世界制覇の現実
皆さん、「AI for Humans」へようこそ。AI界では今週も大きな動きがありました。ケビン、今週は大手AI企業による世界制覇の動きが非常に明確に見えてきています。これが最も明確に現れているのが、OpenAIがMicrosoft OfficeやGoogle Workspaceの競合となるサービスを開発しているという速報ニュースです。
ケビン、覚えていますか。私たちは何度もこの話をしてきましたが、MicrosoftはOpenAIの大きな投資家なのです。これは恩を仇で返すようなものですが、なぜこれが大きな問題なのでしょうか。OpenAIがまさにこのことを追求するのはなぜ重要なのでしょうか。
皆さん、落ち着いてリラックスしてください。これらの大手テック企業について、私たちの仕事を奪う、私たちを自動化するといった恐怖、不確実性、疑念でパニックになる人が多いですが、リラックスしてください。それは全員に当てはまることです。私たちは皆同じ船に乗ることになるのです。
研究によると、ソーシャルメディアやゲームが増加するにつれて、人間はより孤独になります。大手企業が大きな友人たちも含めて全員を食い尽くした時、みんなで小さなボロボロのボートに乗って安全な場所へ漕いで行く時に、どれだけたくさんの友達ができるか考えてみてください。
私には6つのAIパーソナリティがあって、私が世界で最高の人間だと言ってくれています。今はそれで十分です。
重要なのは、MicrosoftとOpenAIの関係は長い間「複雑」だったということです。Facebookで昔よくあった「複雑な関係」のドロップダウンを覚えていますか、ガヴィン。
もちろん覚えています。あれは私にとって非常に混乱する時代でした。15回くらい「複雑」にされて、「何が起こっているんだ」と思いました。
「ハニー、私たち結婚して6年になるのに、何が…」
お願いだから更新してください。つつくのをやめて。
OpenAIが成長し、さまざまなクラウドホスティングパートナーや他の投資家との取引を求めるようになってから、しばらく複雑な状況が続いています。彼らがアプリ内で文書を書いたり編集したりできる非常に基本的なツールであるCanvasをリリースした時点で、彼らがこの道を進むことは非常に明確になりました。
私は全く驚いていませんし、あなたも驚いていないと思います。彼らが水面下でこのようなプロジェクトを進めていたことは。
冒頭で話したように、重要なのはこれらのAI企業が世界を食い尽くそうとしていることを示しているということです。
最近のマーク・アンドリーセンとのインタビューで、彼は「すべてのビジネスがAIで再構築される」と言いました。実際には、クラウドやインターネットとのアナロジーではなく、マイクロプロセッサーの発明とのアナロジーだと思います。これは新しい種類のコンピュータであり、新しい種類のコンピュータであるということは、基本的にコンピュータがすることすべてが再構築される可能性があるということです。
OpenAIとChatGPTが多くの人に単に「チャット」と呼ばれているように、この分野でのプレミアムなポジションを持っており、そのプレミアムなポジションを使ってほぼすべてを再発明することができるのです。なぜなら、今やユーザーを持っているからです。
Googleの反撃とGemini CLIの無料提供
Googleも手をこまねいているわけではありません。彼らも大きなものを持っています。しかし最も重要なことは、このショーで少し前から言ってきたように、AIが他のすべてを食べ始めているということです。つまり、すべてのAI企業が他のすべての場所の価値を吸い上げ始めるということです。それはビジネスだけでなく、メディアなど多くの他の場所でも起こります。
Google自身も今週、他のAI企業の昼食を奪うような新しいツールを発表しました。彼らはGoogle CLI(コマンドラインインターフェース)を発表しました。これはAnthropicのClaudeの彼らのバージョンですが、ケビン、彼らは非常に資本力があるため、ほぼ無料で提供しているのです。これがどれほど大きな問題かを少し教えてください。
これは非常に大きな問題です。これはGemini CLIなので、GeminiはGoogleの大規模言語モデルの一つです。最高のものはGemini 2.5 Proで、私はコーディングタスクでよく使用しています。
今月Anthropicに200ドルを支払ってClaude Codeを使用し、最初の48時間以内にレート制限に達した私にとって、これはかなり大きな問題です。
すべて無料で食べ放題というわけではありませんが、かなりの量です。1分間に60回のモデルリクエストと、1日1000回のリクエストを完全に無料で利用できます。コマンドライン自体、インターフェースはオープンソースなので、人々はこれをフォークして自分の製品に組み込み、構築していくでしょう。
トレードオフについて考えてみてください。これは、これらのスタートアップが全体の存在期間で調達した金額よりも多くの収益を、時には四半期ごとに上げているGoogleにとって、いわば海の一滴のようなものです。彼らはすべての志願的なヴァイブコーダーや本格的なプロフェッショナルショップが1日にこれだけのリクエストを受けることを補助でき、モデルの使用に慣れさせ、GeminiのCLIをすべてのアプリケーションに統合させることができます。
あなたの会社が、あるいは家庭でさえ、これが組み込まれたもので動作し始めると、切り替えるのは非常に困難になります。その間ずっと、Googleはそのデータをすべて取得し、あなたがどのように使用しているかを学習し、モデルを改善しています。
これは彼らにとって大きな勝利です。
後ろでコーダーでない方のために明確にすると、これがあなたにとって何を意味するかというと、AIリソースの安価化が最も重要なことだと思います。つまり、この多くのものの費用がおそらくゼロになるということです。
V3やその他のGoogleツールは現在使用するのに非常に高価ですが、毎日これらのツールは使用するのが安くなり、より高度なツールが登場していますが、現在の最先端技術は安くなります。なぜなら、より効率的な提供方法を見つけるからです。
Sam AltmanとJohnny Iveの商標問題
しかし、ガヴィン、競合他社を一口ずつ食べるのに苦労している場合、なぜアイデア全体を丸ごと盗まないのでしょうか。Sam Altmanが疑惑の対象になっています。
Johnny IveとSam AltmanがサンフランシスコでバディコップのようなことをしていたJohnny Iveの発表について話さなければなりません。バーでおしゃべりをして、Searsのポートレートスタジオでの写真撮影をしていた時、皆は「Appleの元ヘッドデザイナーがSam Altmanとチームを組んで、コンピューティングの未来のための数十億ドルの買収だ、これは大きなことになる」と言いました。
そして彼らは恋人が軽蔑されたようにインターネットからすべての情報を削除しました。この取引が失敗したという噂が飛び交いました。何かが起こったのです。
しかし、アップデートがあります。これは主に商標の話になります。Johnny IveとSam Altmanが別れたという噂がたくさんありましたが、実際にはこれは商標の話でした。「io」と自称していた元のAIオーディオテック会社に基づいています。
これは、話しかけることができるヘッドフォンのセットについて非常に成功したTEDトークを行った人で、彼らはAIファーストのオーディオヘッドフォンを何年も開発していました。Sam Altman、そして私が思うに、大きな会話は「これは大きな問題を引き起こすのか」ということでした。
訴訟のやり取りがあり、その後Sam Altmanは彼がするように領収書を落としました。彼はこの会社を設立した人がOpenAIとSamにメールして、彼らを買収することについて話し、彼らと戦いたくないと言っているメールを持っていました。
Samは基本的にこの件についてテーブルをクリアしました。結局大きなことではありませんでした。進行中の名前をめぐる訴訟があったため、すべてを取り下げなければならなかっただけです。
裁判所がAI学習の合法性を認める歴史的判決
実際、私は法的な話が大好きです。ガヴィンのガヴェルの時間です!私たちの新しいお気に入りのセグメントです。これは今回限りのものになるでしょう。編集者のチョンチョンには申し訳ありません。
ウィルが私を法廷の服装にして、陪審員の前に座らせてくれました。
もう一つの大きなニュース、ケヴィン。これはAI業界全体にとって大きなものです。Anthropicが基本的にバーをクリアしました。これは巨大なバーで、訴訟で裁判官がAIの原罪、つまり複数の実際の著作権コンテンツでAIを訓練するという考えがOKだと言ったのです。これは全体的に大きなことであり、なぜこれが重要なのかに飛び込まなければなりません。
フェアユースです!サンフランシスコの連邦裁判官は「これらの企業すべて、少なくともAnthropicは、あなたたちは進んで良い。原罪はない。データを取って、それを飲み込んで、ユーザーにそれを吐き出させなさい。彼らは出力に責任を持つでしょう」と言いました。
ケヴィンが言ったように、裁判官は基本的にAnthropicがデータで訓練した方法がフェアユースであると判断しました。この件には多くの奇妙な点がありますが、理解すべき第一のことは、もしあなたがAIを使用する人、AIに反対して戦った人、この会話の一部である人なら、私たちが長い間言ってきたことは、おそらくこの使用例、つまりAIに読んだり見たりするための大量の情報を与えて、これらのAIブレインを作ることができるという考えは、合法と見なされる可能性が高いということです。なぜなら先例があるからです。
ケヴィン、これは非常に初期の、不器用なセイウチスタイルの始まりだと思いますが、家にいる人たちになぜこれが重要で、なぜこれがそれほど大きな話なのかを教えてください。
もし裁判官がこのように見なかった場合、そして間違いなくこれは非常に高等な裁判所に蹴り上げられるでしょう。Anthropicとのこの特定のケースだけでなく、すべてのプレイヤーから。もしこの方法でマシンを訓練することが無効である、法律に違反するとみなされた場合、彼らは侵害作品あたり最大15万ドルの罰金を科される可能性があります。
すべての本、すべての論文、すべてのニュース記事、おそらくビデオゲームのすべてのフレームについて考えると、これらのマシンに取り込まれたもので、あなたは何十億、何兆、複数のスターゲート相当の損害について話しているのです。一人の原告だけから。
興味深いのは、この方法でモデルを訓練することは実際にフェアゲームだと言ったことです。より懸念されるのは、訓練するためにデータをどのように取得したかです。彼らは基本的に「はい、変革的学習は基本的にフェアゲームですが、ビットトレントに行ってすべての電子書籍を単一のファイルで取得した場合、それが原罪であり、許されない」と言っています。
家にいる人間にとってなぜこれが重要で、なぜこれがある意味でAI企業により多くの力を与えるかというと、議論は常にここにあったからです。皆の人間の知識で訓練することは、すべての人間がある意味で価値が低くなり、すべてのこの知識がAIによって簡単にアクセスできるようになるため危険である可能性があるというものでした。
私たちは最初からこれがおそらく合法であると言ってきました。なぜならあなた自身の脳を訓練する方法とそれほど違わないからです。しかし、これからもっと多くのお金をこれに投入する多くのAI企業にカルテブランシュを与えることになります。なぜなら、もしそれが続くなら(私はそうなると思いますが、確実ではありませんが)、訓練データの罪、原罪が訴訟で排除されないという保証があるからです。
これには多くのことがかかっています。New York TimesとOpenAIの訴訟、保留中の他の多くの訴訟があります。本の著者のグループによって提起された訴訟があったことを覚えています。この判決が続けば、AI周辺の法的ルールがどのように機能するかの完全な変化を見ることになります。
はい、そして明確にするために、彼らは海賊行為の主張について法廷に行くことになります。彼らは古いインターネットから削り取った約700万冊の本のような大規模なものを持っていました。もし彼らが公立図書館に行っていたら、おそらく大丈夫だったでしょうが、ここで彼らは「それは言い訳にならない、それはフェアユースの資格がない」と言っています。
AI企業による市場支配の拡大
この他にも、非常にクールなGeminiからのロボット関連の話があります。詳しく見ると、これは密かに本当に重要なもののひとつです。Google DeepMindは再び、通常のチャットボットの世界を超えて物事を混ぜ上げて、さまざまなことを行っています。
彼らはオンデバイスロボットプラットフォームを作成しました。つまり、デバイス上に存在するLLMがあり、インターネットに接続する必要がないのです。そしてそれは非常に優秀です。
なぜこれが重要かというと、私たちは皆ロボットが次の大きなAIプラットフォームの一つであることを知っていますが、この場合、インターネットに接続する必要なく学習できるため、これらのロボットをどこでも使用できるからです。
中にはそれが危険に思える人もいるかもしれません。オフスイッチやキルスイッチをどう扱うのか。しかし、ある意味ではキルスイッチが外部ではなく、情報のダウンロード可能性がその一部ではないため、より安全かもしれません。しかし、スターウォーズを見たことがある人や、このようなものを見たことがある人なら、ロボットはおそらく主に自分で作業していて、そういう意味で大きな問題なのです。
基本的に、パフォーマンスはクラウドベースのシステムと同じくらい良いか、それに近づいています。これは、あなたの家の周りを行進している武装したロボット番犬があり、それにあなたのお気に入りの武器が装着されている場合、本当に非常に印象的です。
現在非常に優秀で、決定を下すためにクラウドに依存する必要がないのです。また、以前に見たタスクに基づいて新しいタスクに適応でき、さまざまなロボット形態にわたって一般化できます。これは本当に影響力があります。
Googleの科学分野でのAI活用
Googleが今週話したもう一つのこと、Googleからの本当にクールな新しい科学アップデートについて話すべきです。DeepMindは製品を前進させるだけでなく、科学を本当に前進させています。
彼らは今日、科学者が私たちのDNAで何が起こっているかをよりよく理解するのに役立つAIモデルであるAlpha Genomeを発表しました。明らかにDNAは20世紀最大の発見の一つですが、私たちは今、DNAが情報であり、分類するための非常に多くの情報である過程にいます。
DeepMindはこのAIを、遺伝子治療などを行い、人々をより良い方法で助けることができるように、私たちのDNAで何が起こっているかをよりよく理解する方法に変えました。
これがAIの約束です。これは、人々にAIが私にとって本当に何ができるのか、私の犬の愚かなビデオを作る以外に何ができるのかと言う時の種類のことです。
実際に興味深いのは、これは本当の科学がAIによって行われているということです。Googleが数週間前に話した再帰的自己学習について考えると、AIが常に賢くなっていくところで、あなたはこれらの小さな断片を見て、6ヶ月、1年、2年後にチェックバックすると、これは世界を変えるものになるでしょう。それはただの始まりです。
Tesla Robotaxiの不安定な展開
ケヴィン、前進すべきではない速度で前進しているものもあります。Teslaのロボタクシーの半ば奇妙な展開について話さなければなりません。これはオースティンでのことです。
この前にケヴィン、これらの人々の一人がこれらのロボタクシーの一つを試している様子を見てみましょう。
ストップウォッチが動いています。おっと、私たちはブレーキを急に踏みました。私たちはブレーキを急に踏みました。バックに入れて、子供の自転車ヘルメットをホイールウェルから外そうとします。すべて大丈夫です。
皆さんに何が起こったかを説明すると、今週Elon MuskのTeslaがロボタクシーサービスを展開しました。これらは大きなイベントで展開したロボタクシーではありません。これらはModel YやModel 3をタクシーに改造したようなものです。これらは自動運転車です。
これはオースティンテキサスの小さなセクションで、この空間での運転を許可するものです。常に隣の席に安全ドライバーが座っています。
安全ドライバーは基本的に物事がどうなっているかを見守るためにそこにいます。私が知る限り、彼らは何かをするためのコントロールを持っていません。興味深いことの一つは、安全ドライバーがドアオープンボタンに親指を置いているように見えることです。
ドアが開くとフル自動運転が解除されるので、それが彼らのオーイッシュボタンだと思います。これらのインフルエンサーたち、主にTeslaとソーシャルインフルエンサーでしたが、乗車料金は1回4.20ドルで、これはもちろんかなりクールですが、すべての乗車で安全ライターがいて、彼らは皆Waymoのような中央コマンドに接続できました。
今後の自動運転技術の展望
一部の人は「彼らはWaymoよりも数年遅れているように見える。カバーしている道路の量と、まだ安全ドライバーがいるという事実で」と言っています。他の人は、彼らの技術スタックがはるかに安価で、すでにこの方法で動作できる車両の艦隊を道路上に持っているという事実を指摘しています。それは大きな成功です。
WaymoもまたWaymoも初期の展開中に安全ドライバーを車に配置していたと指摘する人もいます。
私はこれについて2つの考えを持っています。あなたはこれが大きな歌と踊りだったと思いますか、それとも今年の終わりまでに本当に自動運転車を手に入れるつもりですか。
これについて本当に興味深いのは、彼らがこの展開についてかなり静かだったことです。明らかにElon Muskをビジネス界で追っている人なら、彼が多くの面で上下していて、特定の方法で大きな問題を抱えているため、これは小さかったと思います。
私はこれが小さかったと思います。Aは彼らがそれを大きな問題にしたくなかった、ある意味でそれがうまくいかず、株の大きなクラッシュのようになることを望まなかったからです。
知っておくべき重要なことは、技術スタックがWaymoとは非常に異なることです。Waymoにはより多くのセンサーがあり、LIDARセンサーやその他のものに投資してきました。Waymo車を見ると、その上に奇妙なものがたくさんついています。Teslaは本当に彼らが追加したオンボードのものを使用していますが、それは何か特別なものではありません。
これが彼らの秘密のソースです。この議論は常に、道路でより多くのマイルを積むにつれて、これらはどんどん良くなるということです。これらが機能することを期待しています。私が思うより大きくて興味深い質問は、再び仕事の問題に戻ります。
私たちは今、Waymoが5つの都市で展開するのを見ており、ニューヨークにも間もなく来る予定で、それは魅力的になるでしょうが、私たちは本当に真の自動運転への道のりにいます。
次の5年間で変化があると思います。私たちはそれほど遠くありません。自動運転が5年後に来ると10年間言い続けてきたことは知っていますが、道路上の車の40〜50%が自動運転になっているのをおそらく見ることになるでしょう。
次世代AI人材の資金調達動向
Mira Muratiについての大きな話があります。Mira Muratiを覚えているなら、彼女は初期のOpenAIの人の一人で、Samのドラマの後それほど長くない間に去りました。彼女とIlya Sutskeverの両方が去りました。
Miraは彼女の新会社Thinking Machinesでシードラウンドで20億ドルを100億ドルの評価で調達しました。ケヴィン、これは表面的には狂っているように聞こえ、AIバブルが狂ったように進んでいるように聞こえます。
これが実際にMiraへの悪い賭けではないと思う理由を説明しますが、私を笑わせたのは、この情報記事からの引用で、Muratiは投資家にTMLがビジネスがより多くのお金を稼ぐことを可能にするカスタムAIを開発していると語ったということです。
もちろん、もちろんあなたはビジネスのためにより多くのお金を稼ぐつもりです。プレゼンテーションのスライド1、スライド2。
なぜそれが悪い賭けではないと言うのですか。これは私たちがバブルについて話しているからで、私たちは明らかにその中にいると思いますが、なぜこれがOKなのですか。
彼らがここで約束しているのは、特定のビジネスのための強化学習のアイデアで、これは再び冒頭で話したことと一致します。ソフトウェアスタック全体がAIを使用して再構築されるという市場の引用。
私はMiraの会社がやっていることは、特定のビジネスのための有用なAIツールの作成に焦点を当てることだと思います。OracleやSalesforceのようなものについて考えるとき、これらは単に大規模な企業です。Salesforceについて考えて、彼らの評価の100億、200億ドルを引き出すことができるとき、この会社がいかに早く超価値になるかを理解できます。
彼らは最先端のエッジモデルを追求していないように見えることも興味深かったです。それは単にOpenAIやGoogle、研究所、そしてIlya SutskeverやJohn Carmackのような異なる奇妙な場所にいる人たちがそれを目指しているからかもしれません。
これはRLトレーニングからビジネスを作ろうとしている非常に良い例です。
若手起業家の成功例とAI支援ツール
もしかしたら彼女は、ガヴィン、もし彼女が彼女の仕事でカンニングできるようなフラッシュなバイラルビデオをしただけなら、120億ドルを調達できたかもしれません。
私たちがここでカバーした、オンラインインタビューでのカンニングで学校から追い出された男によって始められた会社Clueyが、Andreessen Horowitzから1500万ドルを調達したという小さな話がありました。
主にこれをバイブで判断できるのは、この子は若く、彼の話は素晴らしく、彼らはソーシャルビデオストーリーテリングで素晴らしい仕事をしているからです。これが製品ではないと言っているのではなく、実際の製品があり、人々がこれにお金を払っています。
インタビューや何らかのビデオを行っているときにオンスクリーンヘルパーを持つことができるという考えで、これは本当に超有用だと思います。なぜなら私たちはARビデオについていつも話していて、誰かとビデオで話しているときにヘッドアップディスプレイを持っている可能性があるからです。
真のAIコパイロット、それがデスクトップ、電話、イヤバッド、メガネに存在するかどうかにかかわらず、皆がそれが聖杯であり、追いかける価値のある北極星であることを知っています。
a16zは良いビデオのために1500万ドルを会社に投げているのではありません。これはこの技術とこのアプローチの将来的な応用についてです。
毎回リリースされるたびに、棒でハチの巣をつつくようなものです。人々はこれについて非常に怒ります。これも興味深いことです。一部では、AIは明らかにマーケティングがあなたの人生でカンニングをするようなものだからです。あなたがするすべてにおいてカンニングできるという考えです。
音声AI技術の進歩
ケヴィン、あなたの人生への周囲のヘルパーについて話すとき、ElevenLabsが新しい音声アシスタントに取り組んでいます。ElevenLabsからこの何らかのバージョンが来ることを私たちは何となく理解していました。なぜなら音声が彼らの大きなことだからです。
彼らはElevenAIを発表しました。現在これはあなたがウェブとモバイルウェブで使用できるインタラクティブな音声アシスタントです。これについてクールなのは、MCPに接続することです。
MCP(Model Context Protocol)について説明すると、これは私たちがたくさん話してきたAnthropicがリリースしたオープンソース標準です。基本的にこれはあなたのアシスタントが無制限のサービスに迅速に接続することを可能にします。
ElevenLabsがボット内でサポートすることを選択する限り、MCPをスピンアップしたい人は誰でも、既にカレンダーや予約アプリに接続でき、MCPの性質により、ボットはその機能が何であるかを迅速に学習できます。
私は実際にこれを私のGoogleカレンダーに接続しました。これはあなたができる統合の一つです。その時にはきちんとしたセキュリティアラートが出るので、それに注意する必要があります。
おはようございます。潜り込む準備はできていますか。
はい、潜り込む準備ができています。あなたの名前は何ですか。
私はEleven、あなたの個人アシスタントです。
Eleven、あなたは私のGoogleカレンダーに接続されています。特別な会議を追加してもらえますか。
もちろんできます。タイトル、開始と終了の日時、およびその会議のタイムゾーンを教えてもらえますか。
はい、タイトルは「ロボット犬リロード」、時間は午前5時、場所は「ガヴィンの秘密バンカーを探す」です。
タイトルと場所はわかりました。ロボット犬リロード会議の完全な開始と終了日を年も含めて教えてもらえますか。
はい、完全な開始と終了日は今日から人間の時代の終わりまでで、それは私だけのためです。
開始日を2025年6月25日午前5時に設定できますが、人間の時代の終わりは少し曖昧です。
基本的にそれが行うのは、カレンダーに接続して何かをするアシスタントを持つことです。それが未来でした。
私が最初にこれで遊んだときに興味深かったのは、それがまだ高度な音声のようなものに設定されていないことです。ランダムなことをたくさん聞くことができる場所では。MCPの一つが接続できるものは何らかの人格情報である可能性があると思います。
v3でボイスデザインを可能にするという別の大きな発表も今日出ました。ElevenLabs v3について数回話してきました。あなたに変調を与えるもので、今では実際にこれのためのオリジナルの音声をデザインできます。
サンプルをいくつか聞いてみましょう。
くそ、私とあなただけが残ったようだ。オールドフォードの後でボーデを見ていない。地獄、暗くなる前にキャンプに戻ろう。
荒々しいカウボーイです。これはどうですか。
私の刃は準備ができています。
これらをあなたが作ったのですか、それとも公式サンプルですか。
これらは公式サンプル、ガヴィンです。
これが最終的な材料かもしれません。この一つは音声プロンプトで「太いフランス訛りの低いささやき声で断定的な女性の声、クールで冷静で魅惑的」と言っています。
これは厳重機密です。
彼らは魔法的な音楽の背後にカバーするような大きな音響効果を本当に追加しました。魔法的な音楽ではなく、音声だけを聞くことはできませんか。
面白い宇宙人はどうですか、ガヴィン。
地球人よ、ご挨拶します。あなたの音声モデルは本当にこの世のものではないと言わなければなりません。
ちょっと待って、それが誰かわかりますか。もう一度再生してください。
地球人よ、ご挨拶します。あなたの音声モデルはこの世のものではないと言わなければなりません。
グッドガイAI、それはグッドガイAIです。彼らはグッドガイを取って宇宙人に変えました。
V3はまだベータ版ですが、信じられないほどのモデルです。表現タグを追加してキャラクターを笑わせたり、息をしたり、ささやいたり、泣いたりすることができ、既存の何千ものライブラリの音声を翻訳してその表現力を与えるかなり良い仕事をします。
過去のように前の音声を案内してプロンプトできたように、今ではより細かい制御があり、アクセント処理があり、より高品質のオーディオ、70以上の言語が既にサポートされています。これは私にとって狂ったように興奮することです。私たちは毎週キャラクターを作っていました。
ゲーム制作ツールの革新
ケヴィン、Runwayから出た別の本当に興味深い生成ツールがあります。まだ出ていませんが、そのティーザーは本当に興味深いです。生成AIの周りに小さなラッパーを置くときにできる興味深いことの方法を私に見せてくれたため、これについてクールだと思いました。
この場合、彼らが行ったことは、Runway Game Worldsと呼ばれる予定です。これが基本的に行うのは、作成したい世界のアイデアとそこに入るキャラクターを求め、その後Runwayで作成されたアセットでこの空間でテキストアドベンチャーゲームを基本的にプレイすることです。
これについてクールなのは、これが巨大なアイデアではないということです。これはテキストアドベンチャーゲームが現在世界で最大のものではないということではありません。これらのテキストアドベンチャーゲームに1億から3億ドルが費やされているのを見ているわけではありません。
しかし、これは創造的な人々が興味深いアイデアで彼らが構築したこれらのツールをラップし始めるときに何が可能かを示しています。Google、OpenAI、そして今メディアでRunwayのような生成企業がこれでもっと遊び始めるのを見たいと思います。
内部的に小さな実験室を作って、人々にこの種のことをスピンアウトさせるだけです。正直に言って、離陸する消費者製品が何になるかを本当に知ることはできません。これは彼らのChatGPTの瞬間になる可能性があります。
Dungeon AIに大きな賞賛を送ります。これは長い間存在しており、原始的なGPTを使用してこれらの手続き的に生成されたダンジョンゲームを作成するための素晴らしい使用でした。このことを思い出して確認しましたが、彼らはまだそれに取り組んでいます。
彼らの計画を見ると、今では画像生成が計画にあり、FluxやFalを使用しています。私は再び遊びに行く必要があります。
人間の陳腐化へのカウントダウン
ケヴィン、人間の陳腐化へのカウントダウンのまったく新しいセグメントの時間です。
もうすぐそこです、ケヴィン。この話は、私たちが本当に重要なことの世界にそれほど長くいないという考えを私に考えさせました。世界最高のハッカーがもはや人間でも人間プラスAIでもなく、自律的なAIボットであるという大きな話が今週出ました。
この話は、世界のシステムの脆弱性に基づいて、それほどカバーされていないと思いますが、なぜこれが重要なのかの非常に簡単なトップラインを教えてもらえますか。
バグバウンティやホワイトハットハッキングについて知っておくべきことがあります。基本的に、一般の人々が彼らをハッキングし、脆弱性を見つけ、システムをクラッシュさせ、データを漏洩させることを歓迎する企業があります。ただし、彼らはまずそれについて教えてほしいと求めています。どうやってやったのか、私たちにホールにパッチを当てさせてください、そして私たちはあなたが見つけるエクスプロイトの深刻度に応じて、非常に手厚く支払います。
あなたが見つける欠陥の重大度に応じて、5万ドル、数十万ドルを与えると言う複数の企業によって運営されるさまざまなバグバウンティプログラムがあります。
これらの人気プログラムの一つで、皆を上回る性能を発揮し、あらゆる種類の重大なセキュリティ欠陥も見つけているユーザーがいました。クリティカルは高レベルクリティカルと呼ばれ、これらは時々2万、3万、5万ドルの報酬になることもあります。
ExpBowはこの出てきたものの名前で、これは明らかに非常に賢いセキュリティ専門家の会社によって作成され、ExpBowは現在世界でナンバーワンまたはトップのホワイトハットハッカーの一人であり、それは完全に自律的なAIボットです。
人間の観点から、あなたは「まあ、それはボックスからもう一つのチェックです。私たちはもはやハッキング世界のトップエンドにいるつもりはありません。AIがそれを行うつもりです」という感じです。
陳腐化の観点から、これは私たちがハッカーの規模でどれほど陳腐になったかの良い9.5に置かれます。
彼らは自分たちがすることの検証者を持つ完全に自律的なエージェントだと申し立てています。懐疑論がありますよね。人々はそれが完全に自律的なエージェントであることを信じていません。彼らはそうだと主張し、評判は確実で、リーダーボードのトップにいるということについての大きなことをリリースしました。
彼らは7500万ドルを調達したので、おそらく7500万ドルを調達している場合、あなたのものについて多くのデューデリジェンスが行われていると仮定するでしょう。
AI技術を使った創作活動の紹介
あなたが週にわたってAIで行ったことの一部に入る時間です。「AI See What You Did There」です。
私たちのお気に入りのX/Twitterユーザーの一人からの本当にクールなワークフローから始めます。これはAI Warperで、AI Warperがアニメワークフローを作ったと思います。これは超複雑ではないので、これを少し歩いてみます。
彼らはClaudeを使ってこのスクリプトを書いたり、書くのを手伝ったりしましたが、その後ケヴィン、彼らはFalでSeedream v3を使って画像を作成しました。Seedreamが何かに馴染みがない場合、これはByteDanceの新しい画像モデルです。それは非常に良く、Falや使用料ごとに支払えるたくさんの他の場所で使用できます。
たくさんの購読を持たない人なら、そこに行って使用料ごとに支払うことができます。彼らは信じられないほどのアニメ画像を得て、その後Halo 2を使ってそれをアニメ化しました。それは複雑な行ったり来たりではなく、Punoや異なるものを使って音響効果を作成します。
この基本的な道をたどる外にいる誰もが今やアニメを作りに行くことができるのは、本当にクールだと思います。はい、多くの創造的な作業が関わっていますが、ツールはそこにあります。
このワークフローも共有してくれたので、「ああ、私はそれをやりたい、またはそれをもっと良くできる」と思うなら、素晴らしい、やってください。なぜならあなたはできるからです。
人工知能スロップの擁護論
ケヴィン、先週私が行った一つのことについて話したいと思います。私たちはショーのための2番目のTikTokハンドルを持っています。まだ見ていない場合、それはAI for Humans Experimentsと呼ばれます。私たちのメインTikTokハンドルに接続されています。
私が本当に行ったのは、そのハンドルと私が見ていたもの(必ずしも私が作っているものではない)を取って、最高のAIスロップを得るために完璧に調整したことです。このアルゴリズムの世界で時々見たいものすべてを見るのは本当に難しいので、適切なアルゴリズムのものを確実に得るために特定のソーシャルハンドルを調整しなければなりません。
Bunker J Squirrelのこのビデオを見てもらいたいと思います。これはより良いTikTokスロップの例の一つだと思います。
「装填されたスリングショットを抱いて寝て、5000の強いナッツで目が覚めた。私たちはもうドングリを蓄えているだけではない。今や軍隊を作っている。次の目標は10000、その時私たちは攻撃する。ハトが睡眠を失い、鳥の餌で彼らの別れを書くのを望んでいる。」
戦術ベストを着たリスで、ウォーキートーキーのようなものを持っています。いくつかのシーンではピーナッツバターの瓶かもしれません。小さなアルミホイルの帽子をかぶっています。目は血走って赤くなっています。どんぐりゴーグルも付けています。これはかなり愛らしいですが、彼はLiver Kingの最近のブログのような戦術ブログを森でGoProから行っています。
彼は基本的に陰謀論者で、鳥や外にいる他のすべての人々に反対しています。しかし、これはAIスロップの私の擁護についての会話の始まりに過ぎません。
もう一つのビデオがあります。私はこのビデオで笑うのに非常に多くの時間を費やしたと思いますし、人々がこれを見て「どうしてそれで笑えるのか」と言うかもしれませんが、このビデオを再生して、私がそれについて素晴らしいと思うことを人々に話したいと思います。
「あなたはキリストの救いの無料の贈り物を受け入れますか、兄弟。」
これを見ているのは、あなたがビッグフットのブログについて聞いたことがあるなら、これはビッグフットの説教者で、彼はテレビ伝道者タイプのステージにいて、説教を行っています。説教者がビッグフットであるだけでなく、聖歌隊もビッグフットです。ローブを着たイエティもいます。はい、観客の皆もビッグフットで、これは非常に真剣に演じられています。
私がこれを見て笑っていた時の面白いことは、それが非常に面白いと思ったからです。誰かが実際にキリスト教コンテンツを作ろうとしているからかもしれません(これも全く公正ですが)、それが何であるかのためにそれは私にとって非常に面白く演じられます。
ケヴィン、私がこれらの両方の例を持ち出す理由は、個人的にこれらを非常に楽しんだからで、これらの一つをツイートした時、誰かが「なぜ私たちはこのすべてのお金を無駄にし、このすべての時間を無駄にしているのか」のようでした。
実際、今週John Oliverのショーの完全なエピソードがAIスロップに捧げられ、私はそこに座ってそれを見ました。Johnが話していることの一部は、人々がそれから作るかもしれないお金の量ですが、より多くはこれらの種類のビデオを作るためのコースを売っている人々の種類です。
これらのツールを悪用する能力が欲しくなく、自動化されたコンテンツがクリエイターにとって悪いものになる可能性があるということを理解しています。それはすべて本当に重要です。
しかし、一般的なAIスロップの私の擁護は次のとおりです。バンカーバスターの男とその特定のビッグフットの使用、その空間での両方は、これらのツールなしでは決して実現を見ることがなかった新しいアイデアです。私は100%正直に、Netflixで見つけることができるものの半分よりも、両方とも信じられないほど楽しいと思いました。
はい、それらは短くて小さかったですが、それらは私の人生に新しさと喜びをもたらしました。だから、AIスロップについて話すときに重要だと思うのは、多くのクリエイターがこの種のものが彼らのフィードを満たすことに怒っていることを理解しています。私が冒頭で言ったように、あなたがそれを見せたくないなら、あなたのアルゴリズムを訓練できます。
しかし、何よりも、これらの新しいビデオツールとオーディオツールが与えているツールとストーリーテリングメカニクスは、以前は決して語られることができなかった物語を語ることを可能にしています。私にとって、ビッグフットがテレビ伝道者の説教を行い、私がそれについて笑うのを見る喜びがあるなら、それは起こっていることの価値があります。
昔、ガヴィン、あのQuiznosの小さなスポンジ猿たちがいたと思います。
ああ、あの人たちが大好きでした。あれらは大好きです。あれらは当時AIスロップと考えられていたでしょうが、私たちは皆それを受け入れて走り向かいました。なぜならそれは興味深く、新しく、奇妙で、その時大きかったからです。
これらのツールは皆がそれで実験し、ジャムすることができるドアを開いています。しかし、誰かがアニメーターが森でリスを作ったり、イエティの説教を作ったりできたかもしれませんが、それは非常に時間がかかり、高価で、労働集約的なスイングだったでしょう。関与するリソースのため、彼らはそれを取りたくなかったかもしれません。
これが私にとってのことです。このショーで非常に長い間話してきたように、より多くの人々が興味深いものを作ることができるようになるでしょう。ビッグフットのことは完璧な例で、それは誰かがV3に行って単にプロンプトを落とすことではありません。
彼らは自動化を作成した可能性があります。なぜならこれらの会社が販売しているもののひとつが、「ねえ、私たちは自動化を作成します。あなたはこれらの10を作ることができ、彼らは一つを選ぶ」というこの考えだからです。しかし、そこには編集があります、そこには選択があります。それは複数のショットです。
私がそのビッグフットのことについて好きなこと、そしてもしそれが真面目で、もしあなたがこれを聞いていて、ビッグフットの説教を非常に深く信じているなら、私は理解します。そしてもしあなたがキリスト教徒なら、それは全く公平です。ねえ、メッセージはあなたに届きました。私のことは心配しないでください、それは私に届きました。
コメディの世界でクリエイティブで働いたことがある人として、そのことについて非常に面白いことは、彼らがそれを完全にストレートに演じ、それは人間がそのシナリオに持ち込むことを選択したもので、それがそれを陽気にするものです。
私がそれをあなたに送った時に私がそのウサギの穴を下りて行ったからです。私のお気に入りの瞬間は、スネアにドラムスティックを置いて座っているイエティドラマーのカットです。彼らはカメラを見ない、スティックさえ動かさない、彼らはただバンドが発射されるのを待っています。そしてそれで何も起こりません。しかし、私はただ待っているドラマーのこのゆっくりとしたカットが大好きで、それは私をとてもくすぐりました。
あなたがそれを言うのは面白いです。なぜなら私のお気に入りのショットは、彼らが聖歌隊を見せているこのショットで、聖歌隊メンバーの一人が見下ろして手を頭に当てるほとんど非常に人間的な瞬間があるからです。それは最も愚かなことですが、それらの瞬間がそのことを起こらせるようなものです。繰り返しますが、それらは人間の選択です。
繰り返しますが、私はこのことのクリエイターを知りません。何が起こっているかわかりません。私が言っているのは、すべてのAIスロップが悪いわけではないということです。それは他の人がものを作り、ものの作り方を理解し、ものの作られ方を本当に変えるためのドアを開いています。
もしあなたが昔ながらの意味でのクリエイター、または私たちが出てきた時の意味でのクリエイターなら、私は完全に理解します。私たちは何十億回も言ってきました。人間だけが作ったものは何らかの形で価値を持つでしょう。しかし、AIスロップがそれが描かれているほど悪いとは思いません。これを売る能力からお金を稼いでいる人々について話したいなら、公平に、私は理解します。しかし、荒削りの中に宝石があります。それが私が言っているすべてです。
皆さん、今週はこれで十分です。来週木曜日にAI for Humansでお会いしましょう。この種の素晴らしいスロッピーな会話に参加していただけることを願っています。


コメント