OpenAIがGPT-5を予告、アメリカが本格的な『AI行動』モードに突入

GPT-5、5.1、5.2、5.3
この記事は約55分で読めます。

この動画は、OpenAIのサム・アルトマンがGPT-5について語ったセオ・ヴォーンのポッドキャスト出演から、アメリカ政府の包括的AI行動計画、そして最新のAI音声技術やロボット開発まで、AI業界の重要な動向を幅広く取り上げている。特にGPT-5の性能向上への期待、政府レベルでのAI推進政策、ハリウッドでのAI活用事例、さらには新しいオーディオモデルやヒューマノイドロボットの進歩など、AI技術が社会のあらゆる分野に浸透していく現状を詳しく解説した内容である。

OpenAI Teases GPT-5 as America Goes Full 'AI Action' Mode
OpenAI’s Sam Altman dribbles out GPT-5 as the White House’s AI Action plan lays out how all-in America is on the future ...

OpenAIがGPT-5を予告、政府もAI推進に本腰

うわあ、地球が揺れるほどのニュースやで!アメリカの大統領がど真ん中におるんや。いや、いや、いや、ちょっと待て、ケビン。君が言うてるのはホワイトハウスのAI行動計画のことやろ?アメリカでAIを超パワーアップさせる計画全体のことや。

そうそう、そこに辿り着こうと思てたんや。それについて話そうか。

それから、サム・アルトマンがGPT-5について、よりによってどこでニュースを小出しにしてるかっちゅう話もするで。GPT-5が一番賢いもんや。GPT-5はほぼあらゆる面で俺らより賢いんやけど、それでも俺らはここにおるんや。

そうやな。でも、でも、でも、スキャンダルの話に戻ると、技術億万長者のチームが高校で何をやったか、君らは信じられへんで。

おお、この話やな。ちょっ、ちょっ、ちょっと待て、ケビン。はっきりさせとくけど、それはGoogle DeepMindとOpenAIが国際数学オリンピックで金メダル取って、AGI(汎用人工知能)にちょっと近づいたっちゅう話やろ?それのことを言うてるんやろ?

そや。つまり、もし君がヘッドライン自体に注目して、クリックベイトやなくてな。

うん、なんか別の話みたいに聞こえたからな。よし、こんなんはどうや?NetflixとDisneyがAIはオッケーやって言うて、みんなが大激怒したんや。

ほら、これで軌道に戻ったな。イーロンもVineのAI版を予告したし、Pika LabsもAIソーシャルネットワーク全体を準備してるで。

それに加えて、一つやなくて二つの真新しいオーディオモデルがあって、めちゃくちゃパフォーマンスが良くてリアルやから、これで銀行詐欺もできるで。そして、o3の本当に面白い使用例を二つ見せるで。一個はちょっと恥ずかしくて楽しいやつで、もう一個は本当に正統派で美しいやつや。

最後まで見てくれたら、Tesla Optimusロボットをハッキングして、遠隔操作して、敵を絞殺する方法を教えたるで。いや、いや、いや、いや、いや、それはせえへん。

これが「AI for humans」や、ケビン。これが「AI for humans」なんや。イーロンがポップコーンにフッ素入れて、ロボットを意識持たせよるんや。

みなさん、「AI for humans」へようこそ。俺らがここにおる。AI界のまた巨大な一週間や。ケビン、めちゃくちゃ変なとこから始めるで。

セオ・ヴォーンのポッドキャストから始めるんや。なぜかっちゅうと、今やここがすべての技術巨頭の定番の立ち寄り場所になってもうて、今週はサム・アルトマンがこのポッドキャストに出て、GPT-5についての情報を落としてるんや。多くの人によると、The VergeのTom Warrenも自分で言うてたけど、8月上旬に来るかもしれへんで。今は7月下旬やから、そんなに遠くない。

ケビン、ちょっと聞いてみよか?ここにはハイライトしたいことがようけあると思うで。

めちゃくちゃ面白いわ。俺、セオ・ヴォーンをずっと聞いてて、ポッドキャストフィードが更新されるたびに、「マジで?」って思うんや。「うん、マジで」って。そこにサム・アルトマンがおるのを見た時は、もう、この二つの世界が衝突したことが嬉しゅうて嬉しゅうてしゃあなかったわ。そやから、ちょっとクリップ聞いてみよか。

ある時点で、もし何かがすべての情報を持ってたら、そうやろ?もし何かがすべての情報を持ってて、それが考えて、熟考して、うーん、講釈垂れて、答えの複数のオプションを提供できるなら、俺らはその何かのために働いてることになるんやないか?それが一番賢いやつやったら、そんなことを考え始めるんや。GPT-5が一番賢いもんや。

GPT-5はほぼあらゆる面で俺らより賢いんや。それでも俺らはここにおる。

そして俺らはここにおる。まだ手に入れてへんから、ここにおるかどうかはわからへん。正直言うと、全然違う場所におるかもしれへん。正直に言うと、この部屋におる俺ら含めて、GPT-3はもうすでに俺らみんなより賢かったやろ?つまり、俺らの利点は、アプリからアプリへ飛び移れることと、指があるっちゅうことやから、それがちょっと助けになってるけど、大体において、これらのモデルはもうすでに俺らの多くよりずっと賢いんや。

GPT-5についてはそんなに多くの情報はないけど、彼はそれを持ってて、テストしてて、使ってるんや。めちゃくちゃ能力が高くて賢い。でもサムは、例えばユニバーサルベーシックインカムみたいなことについて考えを発展させてるんや。彼はもうそれには賛成してへん、ギャビン。彼が欲しいのはユニバーサル、うーん、ユニバーサルウェルスで、ベーシックでもない。極端な富を望んでるんや。

彼は人々に会社や製品、そしてこれらのAIシステムの出力への所有権を持ってほしいって思てる。そして彼が思うには、例えばUSドルやworldcoinやそんなもんで支払われるんやなくて、これらの巨大なデータファームや発電所で生成される実際のトークン、そやろ?もし彼が言うた数字、クインティリオンが正しいなら、複数のクインティリオンのトークンがあって、そのうちの1兆個を取って地球上のすべての人に配れば、そのトークンを使ってアートプロジェクトを作ったり、友達と何かをジャムったり、市場に戻して、そのトークンが欲しい誰か別の人に売ったりできるんや。

そやから、近い将来、俺らは何も所有せえへんだけやなくて、バハブラストも数十億トークンかかるようになるんや。チャックイーチーズの再来みたいに聞こえるわ。

俺はマジで、スイッチブレードコンバットと落下傘の軍人で満足せなあかんのかわからへん。なぜかっちゅうと、俺らはトークンで支払われることになるからや。それが経済になるんや。

これは俺らがちょっと後で話すことの予告やけど、ホワイトハウスが出したアメリカのAI計画があって、これはUBIについて言及してへんし、これを出した人らは色んな面でUBI否定派なんや。それについてはもっと話せるし、サムはこのホワイトハウスにかなり近づいてるんや。でもGPT-5についてサムが予告してることについてもうちょっと話そうか。俺らめちゃくちゃ期待してるからな。

実際、ウェブアリーナの一つに匿名のモデルが現れて、コーディングがめちゃくちゃ得意やったんや。これが何なのか誰も本当はわからへん。OpenAIの推論モデルの何かのバージョンで、コーディングがめちゃくちゃ得意なんや。

世界シミュレーションをやった男のツイートが出てて、見ることができる本当にクールなビジュアルなんや。そやから、彼らはかなり大きなものを作ってるんや。それから、ケビ、君が言うてたサムのクリップがあったやろ、週末のコーディングプロジェクトでやったことについて話してるやつ。

そやな。Casper Hansenがこれを投稿して、彼がここでGPT-5について言及してるかどうか、このクリップがどのくらい古いかについて、行ったり来たりのコメントがあったんや。でも、ちょっと再生してみて、そこから判断してみよか。

今週末、俺は俺らの次期モデルの一つを使って、やりたかったコンピュータープログラミングタスクをやったんや。ホームオートメーションオタクみたいな感じで、家のライトと音楽に特定のことをさせたかったんや。この技術が出る前は、それをやるのに何日もかかることを知ってた。この技術があれば、俺らの最近の進歩を考えると、数時間でできるかもしれへんって期待してたんや。5分でできた。彼らがほぼすべての作業をやってくれた。

これは、ほんの1年前やったら、めちゃくちゃ優秀なプログラマーに20時間、40時間、そんなもんを払ってやってもらうようなことやった。

優秀なプログラマーで20時間か40時間。彼は短時間でできることを期待してて、数分でやった。本当にすごいことや。

つまり、明らかに彼は数日前にこのことについてツイートしたんや。この話を聞いた時、もちろん最初に思うのは、まあ、当然彼は自分のゲームを誇大宣伝してるだけやろ、そうやろ?彼は明らかにこのことについて話してるんや。でも、俺らはこれらのコーディングツールがどんどん良くなっていくのを見てきた。

そして、俺らのポッドキャストを聞いてるみんなに思い出してもらいたいのは、これらの巨大企業を率いてる人らが言うてきたことは、今年の終わりまでにコーディングは解決されるかもしれへんっちゅうことや。そして、それはそういうシナリオから出てくる可能性のある力強さを考える時に重要なことやと思う。

確かに、5分でやった素晴らしいプロジェクトは、必ずしもプロの仕事と同じやないし、問題があるかもしれへんけど、90%のところまで持っていってくれるなら、それはかなり大きなことや。

俺らはこの分野に永遠におるような気がするけど、実際はほんの数年なんや。でもそれがポイントで、この分野が動くスピードなんや。その短い時間で、俺らはこの話を何度も何度も何度も聞いてきた。そうやろ?最初はただの文章を書くこと、文を完成させること、創作的な文章やった。それから画像生成やった。それから動画や。うわあ、ウィル・スミス。でもスパゲッティでフォークが行って。Shutterstock って出てる。そして今は カメラコントロールと8Kモデルとあれこれがある。これがどこに向かってるかわかる。たぶん遅くなることはない。

もっと大きく、速く、良くなっていく。そやから、これがホームオートメーションプロジェクトで、数分でできたとしても、分散型の企業グレードのあれこれやないとしても、それはチェーンをちょっと動かしただけや。そして、そのチェーンの移動は、たぶん数ヶ月先の話や。そやから、俺らはこれに備えなあかん。

俺ら個人としてだけやなくて、ギャビン、国としても。そや、俺らはアメリカ人として話さなあかん。そやから、アップルパイを食うて、ディーゼルを噴出して、キッドロックする、モンスタートラック運転する、カントリーシンガーマン、おがくず蹴る、ハーモニカ飲み込むアメリカや。

そや、みんな、今週の大きなストーリーで、ここには政治的なストーリーと、俺らが二つの部分で話す非政治的なストーリーがあると思うんやけど、ホワイトハウスが20数ページのAI行動計画を発表したんや。これは俺らがしばらく期待してたものや。これは、ホワイトハウスとそこにおる人の計画だけやなくて、その人、そこにおる人、昨夜サウスパークに出てめちゃくちゃ面白い形で取り上げられた人に近づいてきたAI関係者の多くの計画でもあるんや。みんな見に行くべきや。それはすごかった。

ちなみに、そのサウスパークのエピソードでは、最後のショットでAIを使ったらしくて、それは素晴らしいと思う。でもこの計画はかなり包括的や、ケビン。たくさんのことが入ってる。三つの主要なポイントがあると思うから、それぞれについて話してみよか。みんなには出て行って読むことを勧める。俺らはショーのハンドルからシェアした。

俺は全部読んだ。ここにはたくさんの面白いことが書かれてる。そやから、ここでの三つの大きなポイントは、AI イノベーションを加速するっちゅうことで、これはかなり良さそうに聞こえる。それから、アメリカでのAIインフラを加速するっちゅうこと。最後に、国際AI外交と安全保障でリードするっちゅう考えや。これらはすべて本当に興味深い。

ここには本当に魅力的な具体的なことがあって、彼らがやりたい種類のことについて詳しく書かれてる。ここで超オタクなセイウチになって詳しく説明するんやなくて、ここから取り上げるべき最も重要なことは、これは彼らが官僚主義を飛び越えて、こういうものを押し通したいって明確に示してる文書やっちゅうことや。

俺が注目した興味深いものの一つは、連邦法が州法を上回るべきやっちゅう考えについての数行やった。州がどの程度これを規制できるかと連邦がやるかについて、ずっと行ったり来たりがあった。もう一つ、ケビン、俺にとってちょっと怪しくて、どう定義するかわからへんことがある。

言論の自由の問題について話してる特定の部分があって、政府は客観的で、トップダウンのイデオロギー的偏見のないシステムを保証する大型言語モデルとのみ契約するよう、連邦調達ガイドラインを設けるって言うてる。それについて俺の大きな疑問は、誰がそれを決めるんや、そうやろ?誰がそこで何を言うんや。

ちなみに、この文書には暗黙的で、一部明示的な偏見が組み込まれてるけど、それについては後で話せる。でも、ギャビン、この文書の目的は何なのか、基本的なところを整理しよか。

この文書の目的は二つあると思うんや。一つは、旗を立てて、俺らはこれに向かってる、って言うことや。

そして俺は、聞いてるみんなにとって重要なことやと思うのは、全国的なAI採用、これらのものに電力を供給するための電力網をオンラインにすること、技術巨頭を集めること、政府が資金を配ること、国有化されたモデルへのアクセスを与えること、モデルをオープンソース化して世界的にAIを輸出できるようにすることや。なぜなら、それは波及効果を持てるからや。包括的なんや。

また、すべての教育をAIに向けることもある。これについて話してる大きなセクションがあって、AI教育のために、AIのクラスをやるためにどれだけのお金がもらえるかについて書かれてる。彼らは本当に展開し始めるつもりや。そやから、それが一部や。もう一部は、ちょっとラーラーアメリカ、そうやろ?そして、これがこの全体の根底にあることで、俺らは中国とのある種の戦争状態にあるっちゅう考えなんや。

俺らがこれをやらへんかったら、将来成功するアメリカは存在せえへんやろう。そして、それが政治的になるところで、なぜなら俺は一部、これは、繰り返すけど、君と俺は番組で何度も言うてきたけど、俺らはプロAIや。AIは多くの素晴らしいことができると信じてるけど、これを読んだ時、ちょっと君の脳内でAI 2027ペーパーの影が見え始めるような感じなんや、そうやろ?これはAIを中心とした会話を、ウィル・スミスのスパゲッティの良き昔の時代よりもずっと大きな感じで国有化してる感じや。

ちなみに、そこには俺の肩が耳たぶまで上がったことが間違いなくあった。それをどうやってやるん?それは何や?音声の人らには分からへん。ああ、そうか。ああ、神よ。近い。完全にはそこまで行ってへん。たぶんウィルがちょっと後でそこまで行かせてくれるやろう。よし、ウィル。いい仕事や、ウィル。

よし、そこに何のエフェクトが入ったかわからへんし、あったとしても、俺は支持せえへん。要点は、その文書を読んだ時、それをやったっちゅうことや。なぜなら、DEI言語みたいなもの、この政権、どちら側に立つかに関係なく、そういうのが入ってるんや、そうやろ?政府と遊びたい、政府から資金をもらいたいなら、DEI取り組みとかは一切やったらあかん。よし、それはちょっと置いといて。

環境と気候への影響のことがめちゃくちゃやと思うのは、一方で彼らは、繰り返すけど、米国政府に参加したい、彼らの支援を受けたいなら、君のモデルは偏見があったらあかんって言うてるからや。理論的には、俺はそれが好きや。

理論的には、そや。明確にしとくけど、理論的には俺はそれが好きや。なぜなら、例えば中国からのモデルを使って、特定の質問をした時、答えることを拒否したり、特定の戦車と特定のビジネスマンについて話したくないから代替の歴史を幻覚するからや。それは一例や。

そやから、米国の概念が好きで、俺らはこれを持つことになる。うわあ、まあ、怒るで。すまん。俺はUSAが好きや。俺らはこれを持つことになる、フォーローコーをがぶ飲みしてオンピクをプラグインする自由モデル、ディープフライされて、決して嘘をつかへん。ただ偏見のないものを与えてくれるんや。

でも、そして彼らは気候変動への言及は一切あったらあかんって言うてる。そや。炭素が何らかの悪影響を与えることへの言及も一切あかん。これは彼らの計画にあることで、政府モデルに参加したいなら。気候変動自体が、君がやってる研究やモデルの出力のどこにもあったらあかん。何か聞こえた。

ああ、そうや、連れてこい。オタクなセイウチがここにおる、みんな。オタクなセイウチが現れた。おい、俺らめちゃくちゃオタクになったな。そやから、俺らがオタクになった時はいつでも、でも、そうや、同感や。同感や。聞いて、ここでの良いニュースは、俺らが番組で言うてきたように、みんながこのレースを真剣に受け止めてるっちゅうことで、俺らはこれが将来のアメリカ全体、世界規模での会話を支配する世界に向かってる。そして、それがこれが何であるかのシグナルや。そして、ケビン、これについて本当に興味深いもう一つの部分は、エネルギーインフラの部分や、そうやろ?

繰り返すけど、オタクなウォール、でも人々はこれが何かを理解すべきや。エネルギーインフラは極めて重要や。なぜなら、より多くのエネルギーをオンラインにするまで、俺らはより多くのAIを手に入れることはできへんからや。なぜなら、エネルギー=AI っちゅうのが今の状況やからや。それが俺らに必要なエネルギーの量や。

Anthropic が、俺らがどれだけのエネルギーを必要とするかっちゅう考えについて、本当に面白い詳細な小論文を出した。そして彼らもそれをやった。Anthropic はこのAI行動計画をオンラインで支持した。少なくとも彼らはそれについて話した。ケビン、エネルギー、うーん、uh、生産において、アメリカが中国よりどれだけ遅れてるか知ってる?

うーん、そうや、オーディオポッドキャストの人らには申し訳ないけど、俺らはこれだけ遅れてて、スケール通りやない。

いや、かなり良い。でも俺は親指と人差し指を約2インチ離してる。

そうや、でも近い。近い。約2インチ離れてる。理解すべき大きなことは、中国は長い間エネルギー生産に焦点を当ててきたっちゅうことや。俺らはめちゃくちゃ遅れてる。

この Anthropic の論文から出てきた、俺にとってめちゃくちゃ魅力的やったもう一つのことは、彼らは2028年までに彼らだけで5ギガワットの電力が必要やっちゅうことや。そして、それが何かを考えた時、それは巨大、巨大な電力量や。それは、テキサス州アビリーンのStargateプロジェクト、OpenAIプロジェクトから得られると期待してる電力量と同じや。

そやから、これは大きなことやと思う。それから、ケビン、これを見たかどうかわからへんけど、小さなサイドノートがあって、Anthropic は中東からお金を取らへんって言うてたのに、今は取るって言うリークされたメモがある。なぜなら、人々はお金が必要やから。どこから来ても、ある程度のお金が必要なんや。そして、君が前に言うたポイントに戻ると、これらのモデルを持って、国からお金を取ることは、たとえその場所の政治的シナリオに100%同意せえへんくても、君のモデルがその場所に移植されるから、良いことかもしれへん。

でも興味深い立場やと思う。ちなみに、しつこく言うつもりやないけど、しつこく言うで。炭素の社会的コスト、メタン規則、NEPA レビュー(国家環境政策法)、清浄水法、大気清浄法の執行、これらすべてが、このエネルギーインフラの存在を可能にする官僚主義を取り除くことに関して危険にさらされてる。

そして、AIの批判者が怒った時、人々がチャットGPTに写真の羊を識別させたりする度に海の4分の1を無駄にするっちゅう話について語る時、俺はチャットGPTを使う度にトイレを5回流すようにしてバランスを取ってるんや。

バランスを取らなあかん。そして俺がそれを笑うのは、環境への人々の懸念を笑ってるんやなくて、その特定の統計が間違ってるからや。メールを送ったりGoogle検索をすることは、基本的なチャットボットを使うのと同じくらい環境に害を与える場合があるんや。

とは言え、これは俺がやってることで、すべての批判に値することや。石炭を燃やしてこれらの機械に電力を供給する方法、空気、水について言うてることは事実や。俺の個人的英雄の一人、ジョン・カーマックが俺の個人的英雄やけど、君も好きやと知ってるデミス・ハサビス、デミス、Lex Fridmanとの素晴らしいインタビューがある。Lexについてどう思おうと、みんなに聞くことを勧めるで。デミスは永遠に素晴らしくて、今はノーベル賞受賞者で、俺らの好きなビデオゲーム/AI神、ブラック・アンド・ホワイトの制作者や。俺の好きな、すまん、ケビン。

そこでデミスは、融合発電のアイデアについて具体的に話してて、彼が思うには、俺らをそこに連れて行く本当のものは融合発電と極端な太陽発電やっちゅうことや。

そやから、唯一の反論は、ちなみに、ああ、いや、ちょっと待て、俺の反論を終わらせてから、君が俺の反論に反論してくれ。よし、一秒待て。唯一の反論は、AIが俺らにこのことを解決するのを助けてくれる世界への正当な道筋があるっちゅうことや。何を言いたいかわかる?

そうや。君と同じ気持ちや。君と同じ気持ちや。ただ、俺が見たいのは、例えば、俺らをそのユートピアに連れて行く技術の追求において、巣からすべてのワシを叩き落として、水と空気を毒するっちゅうようなことを言うんやなくて、他の国がやったようなことをして、クリーンや再生可能エネルギーに投資できへんかっちゅうことや。これはちょっと説教臭い話や。

わかる。太陽光で固くなる、そうやろ?いや、固くなるって言うたらあかん。固くなるは何かを表現する間違った方法や。俺は太陽光で固くならへん。ケビンはなるかもしれへんけど、俺はならへん。そやから、俺が明確にしたいことを確認したいんや。これは俺が言うてることやない。俺が言うてるのは、太陽光を拡張しよう。ちょっと待て、それもそんなに良くないかもしれへん。

俺らが話してるのは、新しい太陽光パネルを建てるっちゅうことか?それが俺らが話してることか?

よし。そうや、わかった。いや、これは良い流れや。これは良い流れや。俺が言いたいのは、追求において、俺は新しいエネルギーに賛成や。俺はクリーンに賛成や。そういうすべてのものに賛成や。ただ、俺らは俺らが試みたことを知ってる。わからへん。今はやらへん。俺はもうそれについてわからへんくなってる。

これらのデータセンターを建設する追求において起こりそうな環境規制の後退について、人々が怒るのは正しいと思う。それが俺の言いたいことのすべてや。俺はそれがこの文書の非常に公正な批判やと思う。すべて良い。すべて良い。俺の友達、オタクなセイウチ、俺らは彼にさよならを言うで。さよなら、ケビン。俺らはオタクなセイウチにさよならを言うで。

君が人工超知能の追求で咳き込んで窒息してる時、ギャビン、俺が警告せえへんかったとは言わんといてくれ。

十分や。さて、次に進んで、俺らの次のストーリーがある。これも変な形で人工超知能とデミス・ハサビスに関わってる。先週末に出た非常に魅力的なストーリーがある。

AIが数学オリンピックで金メダル獲得、AGIに一歩前進

OpenAIが最初で、それからGoogle DeepMindが両方とも国際数学オリンピックで6問中5問正解して、金メダルを獲得したんや。これは推論LLM、汎用LLMがこのテストでこのスコアを取った初めてのことや。これはめちゃくちゃ難しいテストや。これは国内最高の高校数学エリート、俺が5年生の時に自分を呼ぶのが好きやった名前やけど、数学エリートに与えられるテストや。

優秀で、これから国内最高の数学者の一部になろうとしてる人々や。これは大きなことや。Nome Brownが、なぜこれが重要かについて非常に良い説明ツイートシリーズを出した。LLMの観点から興味深いのは、これは俺らが見ることになるモデルやないっちゅうことや。これはGPT-5やなかった。

これは新しい研究の一部で、それがちょっと興味深いと思った。もう一つの本当に興味深いことは、一人の人がこの技術を開発して、他の何よりもずっと良いらしいっちゅうことや。誰かのツイートで、その一部は幻覚を減らすのに役立ってるって言うのを見た。

それが事実かどうかはわからへんけど、これは大きなことで、俺は皆が理解すべきやと思うのは、俺らは今、少なくとも数学において人間と同じくらい良いAIに近づいてるっちゅうことや。汎用AIモデルで。これは特定のモデルやない。これは汎用LLMなんや。

注目すべきことの一つは、過去にAIが数学をやる時、俺は騙したとは言いたくないけど、問題を解決したんやけど、普通はPythonコードを書いて実際に数学関数を実行して、正しくなるまでテストを実行してたんや。そして今回の場合は、それをしてへんと思う。推論を使って結論に至る道筋を考えようとしたんで、コードと数学を使わへんかった。

そうや。それ以上に、一切ツールを使うことを許可されてへんかった。そやから、これは文字通り問題を与えられて、4時間半の制限時間があって、推論と自分の小さな脳だけを通して。

自分の小さな脳って言う時、それは訓練されたものだけのことや。そやから、チャットGPTに質問する時、よくインターネットに行く。それはツールや。あるいはコーディングツールを引っ張り出すかもしれへん。それはツールや。これは推論のみのモデルで、このレベルに到達することができたんや。

繰り返すけど、君は「まあ、高校生やん。俺が何で気にするねん?」って言うかもしれへん。これらの数学オリンピック問題をやってみることを勧める。俺は4年間の高校数学をやって、それ以来あまりやってへんし、たぶん復習すればできるやろうけど、ピーク時でも、たぶんせいぜい1つか2つくらいしかできへんかったと思う。これらは難しくて、それがみんなが理解すべき重要なことやと思う。

とにかく、これは俺らがこの分野でどこまで来てるかのもう一つのレベルアップや。GPT-40にTI-85へのアクセスを与えたらどうなるか想像できる?ただのグラフ電卓を与えるんや。それができる数学。テトリス、ドラッグウォーズを潰せる。今、俺の家にFBI監視バンが来てる。俺はやらへん。

この件について俺が言いたいことの一つは、めちゃくちゃ面白いのは、出てきて、たぶんツールを使った、たぶんツールを使ったって言い始めたすべての人らや。これはある種のコンピューターや。ツールを使うべきなんや。そして、すでにめちゃくちゃ賢いのに、俺はとにかく得るんやけど。そうや。

ああ、デジタルな手を後ろに縛らへんかった。それは騙しや。いや、必要なことをさせてやれ。

他に騙しなのは何か知ってる、ギャビン?この番組、俺と君を心から楽しんでて、敢えて関わらへんことや。それは何や、君ら、小さな卑怯な騙し屋?

君らは今そこでこれを見てるかもしれへん。もうすでに登録してるかもしれへんけど、俺らにメモを残してへんかったら、小さなコメントを残してへんかったら、あるいはポッドキャストプラットフォームで俺らの番組をレビューしてへんかったら、俺らは君らのことを本当に考えへん。そやから、メッセージを送ってくれ。レビューを送ってくれ。そうしてくれたら、俺らは君らのことを深く考える。

今すぐYouTubeで俺らを登録してくれ。ケビン、そこの視覚学習者に簡単な質問。これは何や?

それは手と親指を上げたものや。親指アップや。

ああ、クリックできる?親指アップをクリックできる?登録をクリックできる?

そうや、それが俺の言いたいことや、ベイビー。心から、俺らは毎週君らの関わりを懇願してる。なぜなら、それが俺らを成長させる唯一のものやからや。そやから、いいね、登録、シェア、コメントを残してくれ。それがアルゴを押し上げるのに役立つ。そやから、俺らにそのハッシュタグアルゴジュースをちょうだい。ありがとう。

そうや。よし、ケビ、続けなあかん。今週ハリウッド界で大きなストーリーがある。

ハリウッドでのAI活用とNetflix、Disneyの動向

DisneyとNetflixの両方が特定の番組でRunwayを使用することを認めたんや。Disneyは実際にはまだ出てきてへんものには使用してへんけど、Netflixは『The Eternaut』っちゅう番組を持ってる。これはアルゼンチンの番組で、重要なことは、アメリカの組合の対象やないっちゅうことや。そして、彼らはAIを使って災害シーンを作ったんや。そして、それがたくさんのお金を節約したと直接言った。

実際、Netflixの責任者であるTed Sarandos、ここにいるみんなはTed Sarandosを知ってるやろうけど、彼は言うた。「俺らは、AIがクリエイターを助けて映画やシリーズをより良く作るための素晴らしい機会やと確信し続けてる。ただ安くするだけやなく。」

そやから、それはTed Sarandosからの大きな引用や。「ただ」っちゅう言葉が重い仕事をしてるな。すまん。ただ安くするだけやなく。そうや。でも、繰り返すけど、それがより良くなるかどうか、俺らは一日中それについて議論できる。安い部分は、一部、ここで重要なことや。そして、繰り返すけど、大きな質問は、君は気づけるか、気づけへんかや。このクリップを見つけるのは結構難しかった。

見た?そうや、なぜなら二人のキャラクターが世界を救ったからハイファイブしに行くんやけど、それぞれ7本の指があって、俺はそれはクリップやないと思った。君は別のものを見た。それをもうちょっとロトできたかもしれへん。

そうや、それは違う。クリップは興味深かった。つまり、俺らはここで実際に見せることはできへんと思う。なぜなら、変で見つけにくいからや。誰かのぼやけた写真で見た。繰り返すけど、めちゃくちゃやない。そして、こういうものがどう働くかがわかると思う。

俺らは前に話したことがあるけど、AIビデオを作る時、最大の鍵は編集なんや、そうやろ?なぜなら、たぶん4秒のショットが本当によく働いて、何かの周りで編集して、本当に面白いものを作ることができるからや。

クリエイターが映画やシリーズをより良く作るのを助ける。確かに。そうや。なぜなら、俺は多くのクリエイター、俺の知ってるインディー映画制作者の友達を知ってるからや。彼らは創造的な回避策をしなければならなかった。火を見せることはできへんけど、誰かの顔のクローズアップを見せて、琥珀色の光を顔に当てることはできる。

でも、君のビジョンに建物が燃えてることや、原爆が爆発することや、車がクリーチャーの足の下で潰されることが含まれてて、伝統的なVFX会社にそれをやらせるお金がないなら、まあ、そうや、これがより良くすることができる。20人がWaycomタブレットから顔を上げて「ちょっと待て、でもそれは俺や」って言うのはわかる。わかる。

でも、表面的には、その発言はAIツールを使ってビデオを作ってる誰にとっても結構明白なんや、そうやろ?

そうや。ちなみに、もし君が興行収入を追ってるなら、アメリカのハリウッドの主要興行収入には、ちょっとした回復があったんや。スーパーマンのような映画が出た。俺は見た。良い。素晴らしい。そして多くの人が、俺は良いと思った。

本当に興味深くて楽しいと思ったけど、10年前のようにこれらの映画が潰すような潰し方をしてへんかった。そして価格は上がってる。そやから、もしもっとスーパーマン、もっとファンタスティック・フォーが欲しいなら、これらの映画が2億5000万、3億ドルのコストやなくて、1億7500万ドルのコストでできるなら、それは巨大な勝利のような世界があると考えなあかん。

今、それは予算から削ろうとしてる1億ドルで、このようなことがある意味でそこに到達する方法なんや。そして、繰り返すけど、君は正しい。そこにある多くの人が、これらの巨大なFX工場で働いてて、「くそくらえ。それは俺の仕事や」って言うやろう。でも、これも、俺らをしばらく聞いてる人は、俺らが来ると言ってきたことやし、今ここにあるんや。

俺はハッシュ・ジェームス・ガンも好きやし、ジェームスを知る特権があったし、何度か彼とチャットしたこともある。素晴らしい男や。

そうや。そして俺はスーパーマンの舞台裏クリップを見てて、実際にどれだけ実用的な効果があるかに驚いてるんや。彼が回転してるやつを見た?それやった?

知らへん人のために説明すると、素晴らしいクリップで、スーパーマンが飛んでて、彼らはUnreal Engineで動作するこれらのUnrealビデオウォールを持ってる。そやから、すべての自然な照明と彼らがこれらのウォールに爆破してる山景の効果を得て、俳優がビデオウォールの前でスターフォックスのバレルロールをやってるかのように回転してるんや。

もう一つは、彼らが tower におって、昼から夜に変わってて、人々がこの昼夜サイクルに反応してるから「おお」と「ああ」って言ってるやつや。

俺は「それは本当にクールやけど、たぶんAlloraを作って『ヘイ、そうや。スーパーマンを回転させて』って言えたかもしれへん」って思った。今、パフォーマンスとこれ、それ、その他のために。そういう風にやることは確実やと思う。誰かの写真で俺がそれを言うてへんことを明確にしたい。ギャビンがAIでもできたと思った。# ギャビンの考え。

とにかく、でも君は正しい。つまり、聞いて、繰り返すけど、スーパーマンは超楽しい。そこには素晴らしい多くの異なる効果があって素晴らしかったし、俺はそのクリップが好きやし、実用的な効果がなくなってほしくない。でも、繰り返すけど、もしこれらのもっと多くが欲しくて、それらが機能してほしいなら、たぶんもっと多くのAIが関わってくるのを見ることになるやろう。

さて、ケビ、ビデオに関する他の興味深い簡単なヒットがいくつかある。これは本当にイーロンのツイートに基づいただけや。

イーロンのAI Vine構想とPika Labsの動向

それは数週間前にイーロンが持ってたツイートに続いてる。彼はAIビデオは何かの未来やって言ったようなことを言うて、明らかに、XはAIビデオを考えてる、XAIや。でも、それから彼は数日前に具体的に言うた。「俺らはVineを復活させるけど、AI形式で。」

ケビン、これが何を意味すると思う?

もしそれが口に農産物を入れたウィル・サッソーをもっと意味するなら、俺は幸せや。それが意味することやとは思わへん。俺の直感、そして、これは俺らの他のストーリーに結びつくんやけど、楽しい効果をすべてやるPika Labsっちゅう会社がある。俺らが数週間前に言うたのは、最近あまり多くのことをやってへんように見えるっちゅうことやった。

彼らは今、ピボットかもしれへんし、ただの違う会社かもしれへんけど、全AIソーシャルネットワークを作ってると発表した。つまり、君は自分自身のAIバージョンを持って、いろんなことができるっちゅう意味や。ケビン、ここで俺が思うのは、世界のbleep化が始まって、ある種の姿を現し始めてる場所なんや、そうやろ?なぜなら、全AIとしてのVineは、俺はまだ全AIが行く道やと確信してへんからや。

これについては後で話すけど、具体的にHigsfieldを大きく推進してた男と議論になったんや。Higsfieldについてやなく、でもその話は後でする。でも、俺は全AIのVineが欲しいかどうかわからへん。そんなに面白いかどうかわからへん。そして、これについてどう思うかわからへんけど、俺はTik Tokがいろんなもののミックスやっちゅうのが好きなんや、そうやろ?人間のものとAIのものが一緒に折り込まれるっちゅう考えが好きなんや。

そして、全AIの時、それは同じように、何て言うか、CISOを覚えてるか、ストリーミングネットワークが全部コメディやったみたいに制限されてる感じがする。それは、まあ、推測やけど、俺はそれは欲しくない。俺が欲しいのは、俺に多様な選択肢を与えて、何かを俺に持ってきてくれるもののバージョンや。

全AIソーシャルネットワークみたいな雰囲気についてどう思う?

うーん、俺は、俺らの番組の研究以外では、全AIのソーシャルネットワークにサインアップしようと思う理由がわからへん。そして、たぶんこれは今、拡張現実グラスで前門でホイットリングしながら、サイバークラウドに拳を振ってる老人なんやろう。たぶん全く新しい世代が育って、彼らのアバターが自分自身の最も純粋な表現になるやろう。

そして、彼らは自分たちでいろんなものを自動生成するから、それに対処する必要がないやろう。そして、俺は確実にスケートボードを持って fellow kids をやろうとする時に、そのネットワークでそれらのAIアバターにいじめられるやろう。

俺にはわからへん。そして、君のポイントに戻ると、すでに存在してるネットワークで、それらの接続がすでに確立されてて、それにAI要素を追加する、たぶんそれでも俺はまだわからへん。俺らはHigsfieldがみんなに外見を盗んで、それらのペルソナを入れることを奨励してることについて話すやろう。もし俺のフィードで他の人々のAI生成を見たら、俺は「よし」って言って、先に進む。それには粘着性がない。

俺の質問は、6週間前に起こった非常に大きな発売について、最後にいつ考えた?MetaのソーシャルAIアプリについて。過去2、3週間でそれについて考えた?

いや、実際に考えてへん、ギャビン。祖父母が自分たちのチャットが公開やって知らへんっちゅうことだけや。

そうや。そこで人々がAIと非常に親密な会話をしてるのを見るっちゅうことや。

それが俺がそれを発見した唯一の回や。そうや。面白い時代やと思う、そうやろ?俺は、これらの種類のAIのみのソーシャルアプリを期待してる。今、AI Vineがそれのために持ってるであろう一つのことは、それがXに統合される世界があるかもしれへんし、Xはまだアクティブなソーシャルネットワークやから、シェアするのが簡単やっちゅうことや。

よし、俺らは今、いくつかの新しいAIオーディオモデルに飛び込みたい。最初にInworld AIについて話して、それから非常にクールなオープンソースのものに入るで。

新しいAI音声技術の登場

Inworld AI、君らが知ってるなら、NPCの音声に特化したかなり大きな会社や。彼らは大きなビデオゲームのアイデアに特化してた。彼らはNPCの音声を大きなビデオゲームに提供しようとしてたんで、スカイリムにいて、町でオレンジを売ってるおばさんと深い哲学的チャットをしたい時にできるようにや。

俺は思うほどうまくいかへんかったか、次の段階が何かを考えようとしてるんやけど、彼らは今、非常に良い新しいテキスト音声モデルを開放したんや。最先端やとは言わへんけど、ここでクールなことは、めちゃくちゃ安いっちゅうことや。

そやから、AI音声で構築してる人々、特に俺ら自身のように、ケビンと俺は今秘密のプロジェクトで作業してるんやけど、本当に興味深い機会や。そして、彼らについてクールなことの一つは、キャラクターとの作業に多くの歴史があるっちゅうことや。そやから、実際に結構良い音に聞こえるんや。

これらの一つを再生して、どんな感じか感覚を掴めるか?

Inworldは、ユーザーのニーズに成長するスケールされたAIアプリケーションを可能にしてる。今日、俺らは最先端を根本的に手頃にする新しい音声AIモデル、Inworld TTSを発売してる。(咳)

実際に俺自身と多くの音声オタクにとって本当に興奮することやったけど、アナウンスビデオに入れるのは変な場所やった。

本当に重要なことについて話そうとしてる変な場所や。最先端のパフォーマンスについて話そうとしてて、すみません、すみません、本当にすまないと。最初に男のキャラクターやなくて良かった。なぜなら、君は彼が医者のオフィスで君と話そうとしてると想像するやろうからな。

それは良かった、ドクター。Inworldが出したサブツイートに置くために言うと、彼らは問題を特定したし、これは結構大きい。プレミアムテキスト音声があって、これは規模で始めると本当に高い。それから、無料や本当に手頃なものがあるけど、そんなに良い音に聞こえへん。そして、彼らは自分たちがその第三の軌道、第三のオプションを狙ってることさえ認めてる。

そやから、例えば11 labsと比較すると、100万文字で120ドルかかることがある。使ってるモデルによるけど、彼らは5ドルや。

そうや。比較すると、それは結構大きな違いや。棒グラフを見ると、ギャビン、繰り返すけど、スケール通りやないけど、たぶん約2インチ。

結構近い、でもよし。2インチ。俺らがこれらのもののコストを価格設定し始めた時、100万あたり5ドルは超安いっちゅうのは言えることや、そうやろ?もし本当に同等で競争力のあるモデルをそこから得ることができて、時間と共に改善できるなら、大きなことや。

よし、そやからこのオープンソースのやつについて話そう。ケビ、これについて遊ぶ時間があったから、少し教えてくれる?これはBoson AIのHigsAudio v2や。彼らが発表されたSunoのモデルをベースにしてたっちゅう報告を見たんや。それが本当かどうか確認するのに十分深く掘り下げてへん。そやから、コメントで俺を焼いてもかまへん。

でも、彼らはゼロショット音声クローニングを持ってて、それは基本的に非常に速くて簡単に任意の音声をクローンできるっちゅうことや。リアルタイムで動作して、エッジでも動くって言うてるから、より小さなデバイス、たぶんスマホにも展開できる可能性がある。

1000万時間のオーディオで訓練されたんや。それは音声、音楽、異なるイベントや。そやから、このものは背景ノイズを生成することもできる。音楽的なスティングも生成できる。君の(咳)もできる。OpenAIの最高のオーディオモデルの一つであるGPT-4 mini text-to-speechを打ち負かすって言うてる。11 Labs V2も打ち負かすって言うてる。マルチもできる。

どうやってそれを判断するん?それは何を意味するん?なぜなら、聞いてる時、それは文字通り人々がWeberアリーナみたいなもので テストを与えるようなもんか?文字通り音声ベンチマークみたいなもので、人々が親指を上げる。これが好き。あれが好き。

そやから、彼らの公式なアナウンス動画のちょっとを聞いて、いくつか聞けるようにしよう。

君は俺らの週末をモデルのチューニングに費やして、俺の両親に会うんやなくて。でもその実行は本当に重要やった。君は俺を見るより損失曲線を長く見てた。

それは真実やない。ただ収束する必要があったんや。

そやから、これは同じシーンで観客が笑ってる二人のキャラクターやろ?そして、君はこの近接適応を聞く。つまり、話者は言われてることの文脈に基づいて話し方を適応させるっちゅう意味や。

これはちょっと興味深い。

ベスは彼の腕の中に崩れ落ちて、止まらずに泣いた。私は彼らを失敗させた。私は彼ら全員を失敗させた。彼らはみんな死んだ。

キャラクターからの引用に入る方法が聞こえたやろ。ちょっと切り替えた。良いものに行こう。ShrekとDonkeyのシーンを同じモデルでクローンした人にやってもらおう。

行くで。

ドンキー、この小さな金属のドラゴンを見ろ。王の身代金がかかって、やることといえばじゃがいもを揚げることだけや。

それはGPUや、シュレック。君は沼の訪問者アラートのためにAIを訓練するためにそれを買ったんや。

そして、いつも今は役に立たへんって言う。君がいつ金を無駄にするのをやめるかを予測するように頼むべきやった。

GPS。

それは一つのモデルや、そうやろ?ほぼ瞬時の音声クローニングで複数の音声をやってる。これは本当に素晴らしい。Higs Audio v2。GitHubがある、ギャビン、そして彼らはHigs Audio V2をオープンソース化してる。俺らはこの人らと話すべきや。もしそこにおって、これを作った人らを知ってるなら、俺らと連絡を取ってくれ。もしそこにおって、これを作ったなら、俺らと連絡を取ってくれ。

連絡を取ってくれ、確実に。昨夜小さなデモを使ったんや。話者の説明は何も変えへんかった、ギャビン。でもこれを得た、ケビン。

俺はめちゃくちゃ興奮して君をフレーバータウンに連れて行く。

ああ、やめてくれ、ギャビン。俺は1000回言うた。いや。

何?君は俺をフレーバータウンに連れて行かせてくれるって言うたやろ。そして今日がその日やったに違いない。

正直、ブロ、君がそれを言う度に、どんどん気持ち悪く聞こえる。俺の芝生から降りて、ズボンを履いてくれ。

今、明確にしとくで。そこで何が起こってるん?

オーディオスタンプ。どうやら、君は俺の前の芝生でズボンなしで、俺をフレーバータウンに連れて行きたがってた。物語については心配するな。パフォーマンスについて心配しろ。ちなみに、そこにはほとんど句読点が組み込まれてへんかった。

どもりとそれは、基本的なプロンプトからオーディオモデルから来た。そやから、そこでどのレベルの制御可能性を持ってるかによって、かなりパフォーマンス的なモデルを持つことができる。

わからへん。俺らと連絡を取ってくれ。俺らは実際に彼らと連絡を取らなあかん。そうや。まあ、知ってる、君は待つ。

いや、何らかの手が届くかもしれへん。とにかく、どちらにしても、俺らはこの人らと連絡を取る。非常に、非常にクールなもの。

おい、ギャビン、コメント欄のための餌になるかもしれへん、言及する価値のあることがいくつかある。Tっちゅうアプリが出た。

その他の注目すべきAI関連ニュース

そうや、見た。これは今世界で1番のアプリや。なぜなら、基本的に女性がみんなについてコメントをシェアして、人々に赤旗を立てて、いろんなことを見ることを可能にしてるからや。大きなことや。

そうや。そやから、Ken WheelerはChatGPT、Grok、Claude、Geminiに取り組んで、男性が女性を報告して、彼女らの赤旗と毒性のある特性などを掲げることを可能にするアプリのクローンを作ろうとした。そして、4つのモデルすべてが彼を完全に拒否した。

彼らはアプリの構築に参加することを拒否すると言うた。そやから、ここにあるのは、アプリストアで1番のアプリと、そのアプリの言ってみればジェンダースワップを構築することを拒否する4つの基盤モデルや。これは、俺らがGPT-5が部屋で一番賢いもので、いつか俺らの従業員になって、俺らが彼らのために働くことになるって話してた時を考えると、かなり興味深い。それでも彼らは特定のことをすることを拒否してるんや。

そして、これはまた計算との新しいパラダイムや。普通、君は機械に命令して、機械は君の命令を実行する。まあ、今機械は拒否することができる。そして、その近い将来はどのように見えるんや?

この件について俺が言うことの一つは、繰り返すけど、これらすべてのことについて、これは機械がリクエストをどう解釈してるか、ジェンダースワッピングが何かについて、ちょっとトリッキーなもののように見える。

君が知ってる、存在するすべての公的および私的企業は、そのものに独自のルールを置く能力を持つべきや。俺が心配し始めるのは、俺らが前にバブについて話したように、政府が入ってきて、君のものはこうでなければならないって言い始める時や。それが君が本当にトラブルに陥り始める場所や。

もしこれから答えを得ることができへんなら、俺らは最終的に、君が探してる答えが何であれ、それを与えることができるオープンソースモデルがそこにあることを期待してる。そやから、これは確実に変なことで、たぶん何らかのトリガーがこれを起こしてるんやろう。

俺は、俺ら他の開発者を、女性に赤旗を立てるんやなくて、良いビールを出さへん素晴らしい場所やないバーに赤旗を立てることができるbeerか何かっちゅうアプリを作ることに招待したい。

そのバージョンなら、AIとのあらゆる種類の興味深い会話への扉を開くことができるかもしれへん。ここで文句を言うんやなくて、代わりにそれを試してみよう。

最新のAI技術とロボット開発

本当のもんに入ろう。USA。USA。ああ、おい、すぐに。Fast VLM。これはちょっとオタクなものやけど、デモがある。Apple研究が本当に興味深いものを発表した。

iPhoneで十分小さくて速いデバイスで、彼らが理解したこの新しいものがあるんや。何らかの視覚的認識や推論をするために、カメラがキャプチャする画像のサイズを増やすんやなくて、見てるものを一般化する新しいハイブリッドモードを思いついたんで、それが超速く処理できるようになるんや。

そやから、論文にリンクする動画がある。本当に興味深いんやけど、デバイス上でiPhoneで、インターネット接続なしで、俺が見てる看板は何かとか、何本の指を上げてるかとか、何でも聞くことができて、見てる画像に基づいてめちゃくちゃ速く、繰り返すけどデバイス上で答えをくれるのを示してる。Appleが何を作ってるかのささやきや。

俺が思ったのは、Appleが作ってるのは俺のビールアプリや。

この時点で、そこで何かを作ってることに驚くわ。あまり多くの作ってることが起こってるようには見えへん。

よし。

君の次のもんは何や?

新しいAI従業員とロボット技術

Kofka、世界初のAI従業員が発表された、ギャビン。俺らはそれを十分にテストする機会がなかったけど、ベンチマークによると、経済的に実行可能な知識タスクを完了するAIの能力を測定するこれらのGaiaレベル3ベンチマークで、77%のスコアを出したんや。人間は大体86%か85%くらいのスコアや。

そやから、人間レベルの雇用スキルに近づいてて、彼らはSlackに接続できることを示してる。電話番号とメールアドレスをもらう。そやから、電話をかけて何かをやってくれって頼むことができる。SlackでSMSメッセージを送ることができて、それが出て行って何かをやる。例の一つは、Google V3の使い方を学んで、自分でコマーシャルを作ることをやらせることで、それが自分でやるんや。ちょっと興味深い。

そやから、俺がこれを持ち出す理由は、ブラウザを使える、ツールを使える、エージェント的になれるっちゅうことを示すツールがたくさん出てきてるからや。でもこれをAI従業員として位置づけて、そこで会社を経営してる人々に、人間を雇うんやなくて、Kofkaを雇うことを考えるように頼んでるんや。

これは、人々がしばらく恐れてて、来ると推測してた非常に現実的な位置づけや。でも、Brainbase Labsによると、今日ここにあるんや。

ギャビン、そやから、これは別の興味深いAIエージェントや。ケビ、俺はチャットGPTのエージェントをまだ持ってへん。これは興味深い。展開されると思ってたけど、君がそれを持ってるって聞いたのは面白い、君はプロやないからや。

君はプラスユーザーのチャッドや。プラスや。そうや、俺はそれにアクセスできた。

サム・アルトマンがえこひいきしてるって言うてるんやないけど、俺がそれにアクセスできるのは変や。

確実にそんな感じや、そうやないか?確実に。まあ、正当な理由で、俺が君の立場やったら、絶対に劣等感を感じるやろう。今週は特に。

でも、俺は昨日初めてのエージェント研究プロジェクトを、俺が作りたいアプリのために実行したんや。そして、それは16分間働いた。うわあ。

研究をやってから、合計24分、追加の8分、俺のためにプロジェクトを準備してる間。そして、この俺がまだチャットできへんアプリの研究をしてる過程で、300何かのサイトを研究したと思う。深く行って、マークダウンファイルとして報告書をくれただけやなく。そやから、きれいにフォーマットされてる。

俺は彼らがやった研究を見ることができて、いろんなことを引用した。引用のいくつかは結構壊れてた。明確にしとくけど。引用元をクリックしたら、ページがエラーになったり、本当に古かったりした。そやから、それはちょっと興味深かった。でも良いのは、報告書が終わったら、報告書についてチャットできるっちゅうことや。

そやから、読んで特定のことを探しに行かなあかんのやなくて、「おい、これについて連絡する人は誰か」とか「それに関する具体的なことは何か」って言えるんや。そして、君のために報告をしに行ったエージェントと会話してるんや。ちょっと良い。

機能した?君が望んだことをすべてやった?

最終的に、俺が非常に特定のことについてアプリケーションに関して探してた連絡先に導いてくれて、やってくれた。

それはめちゃくちゃクールや。それは素晴らしい。

ああ、Kofkaについて言いたいのは、terrible name やっちゅうことや。なぜなら、Kofka、もし君がKofkaが書く物語を知ってるなら、これらのAIエージェントが何らかの官僚主義に詰まってやることになる、非常に悲しい考えなんや。

君のために働いてくれるものをKofkaって呼ぶのは好きやない。なぜなら、それは一般的に労働者にとって楽しくないすべてのKofka物語について考えさせるからや。でも、それは何でもある。

俺のような教育を受けてへん人らのために言うとくで。どうでもええ。フェアやで。

フェアやで。行こう。すぐに、Robot EraからのNew robot がある。これは別の中国のロボット、新しいヒューマノイドモデルや。俺らが中国がどれだけ先に行ってるかについて話すけど、ケビン、これはただの楽しくクールで、興奮するような見た目のロボットプレミア動画や。これまでのいくつかよりちょっと良い照明やけど、楽しいことをやってる。良い時間を過ごしてる。

中国がこれらの動画をどれだけ頻繁に落としてるか、俺は十分に強調できへん。俺の一部は、今後2、3年のうちに中国を訪問したいと思ってる。なぜなら、そこに行った時の俺の期待は、これらがどこにでもあるっちゅうことやからや。数週間前に俺らが取り上げた本当にクレイジーなレースのように、ヒューマノイドのマラソンがある。

彼らは俺らより速くその世界におることになる。でも、とにかく、これから出た別の結構興味深いロボットモデルや。

そして、クレイジーで楽しいことをすべてやってるって言う時、君は膝があることを発見したばかりの6歳児のようなジャンプスピンをやってるようなことを意味してる?

でも、ビデオの後半では、それがかなり良いペースで荷物を分類してるのを見る。

そやから、荷物を掴んで、分析して、スキャンできるようにひっくり返して、バーコードを持って、器用な手を持って、荷物を掴んで、箱に移すんや。これらは今人間がまだより良く実行する非常に基本的なタスクやけど、新しいビデオドロップを見る度に、機械が追いついてきて、速い。

そして、ビデオの最後に、機械が走って、ゆっくりと人間を追い越すのを見る。それは俺ら全員に起こることの素晴らしいメタファーや。

ケビン、今週起こった他のロボットストーリーもあった。他のロボットストーリーは何やった?

ダイナーでポップコーンを提供してる整形外科を着用したOptimusがある。そやから、そのダイナーのことがある。

そこで何が起こった?なぜそうなった?

カリフォルニアのハリウッドにポップアップしたTeslaダイナーや。そして、それは基本的に、君がTeslaを充電できて、ハンバーガーを注文できるドライブイン映画館や。でも、彼らはOptimusロボットを持ってて、この状況では遠隔操作されてる可能性が高い。そうや。君にポップコーンを提供してる。

でも、誰かが舞台裏のショットを撮ったから、Optimusがお父さんのスニーカーを履いてるのが見える。New Balanceか何かのSketcherスリップオンみたいに見える。陰はない。

そして、ゆっくりとピボットして、ポップコーンを掴んで、提供して、いくつかが床に落ちて、いくつかが箱に入る。でも、これはある種のGen 2オプティマスデザインだと見える。彼らは昨日の決算発表でGen 3を予告したと思う。

でも、そうや、アメリカでロボットが何かをやってることが嬉しい。

ちょっと変な新しい仕事について考えたんや。彼らはいつもこれらの仕事がすべてなくなるって話してる。本当に興味深くなりそうな一つの仕事は、ロボット衣装スペシャリストや。数週間前に出た非常に面白いビデオを見たことがある?

丘を駆け下りてるロボットが、ほぼアダム・サンドラーのような格好を着てるんや。それは本当に興味深いと思う。ロボットのための服を作るのは誰になるんや?俺らは、fabric で作られたロボットについてすでに話した。それはひどいアイデアやけど、臭い臭い少年。

臭い少年。でもそれも大きなことや。それは何かになるやろう。誰かがこれらのロボットのために服を作らなあかん。そして、それらを着せる人々がいるやろう。最初のロボットスタイリストを想像してみろ。

最初のロボット有名人スタイリスト。それがランウェイや。俺らがやろうとしてることや、ケビン。俺らはロボット用のRent the Runwayを作って、ロボットにしか合わへんデザイナー服を得るんや。

とにかく、それは最高のアイデアや。もし君らが俺らの超超秘密のステルスプロジェクトが何か疑問に思ってたら、それはルンバ用のワンジーや。

君の掃除機に付けることができる小さなクージーや。ギャビン、それはうまくいくやろう。もしルンバクージーを作ることができたら、センサーがまだ撃ち抜くことができるように、俺らはそれをうまくやるやろう。

俺らには楽しい小さなセグメントがあって、今週出てきた非常に有用なツールをすぐにハイライトしたいんや。実際に有用っちゅう新しいセグメントでな。つまり、毎週俺らは、いつかもしかしたら配当を払うかもしれへん何かを紹介してる。これは、今日君の指で触れることができて、ハッシュタグ実際に有用かもしれへんものをハイライトする機会や。

実際に役立つAIツール

最初はObject Clear、ギャビンや。まだCanvaの購読を持ってたり、Comfy UIノードで遊びたいなら、シーンからオブジェクトを削除できるけど、それらはそんなにエレガントに削除されへん。AppleがApple intelligence を動力とした魔法の消去機能を持ってたり、Samsungが持ってるような特定のツールで遊んだことがあるなら。

Object Clearが興味深いのは、シーンからオブジェクトを消去するだけやなくて、そのオブジェクトが投げかける影を知的に削除するからや。どうやって?

そやから、彼らが消去してるものは、チーターと思われるものとハングアウトしてる犬や。俺はこの関係について知りたい。犬がなくなってほしくない。

俺はこの物語に飛び込みたい。この犬とチーターがお互いをこんなによく知って、ただ寄り添ってハングアウトできるようになったのはどんな犬とチーターやった?これは本当に感動的な相棒コップのようなもので、犬とチーターのようやった。マイロとオーティスのようやった。犬が食べられて終わった。

ああ、めちゃくちゃ悲しい。

そやから、俺らは詳細について話そうとせえへんけど、それはチーターに座ってる犬や。犬はチーターに影を投げてる。それはめちゃくちゃリアルや。そして、彼らが犬を消す時、影も消える。そして、それは結構良い、そうやろ?とにかく、犬の名前はshadowで、影も消えるっちゅうのは、俺らがこれから作る映画の名前や。

うわあ。そして、Kofkaによって書かれた。めちゃくちゃダークや。

君は今Hugging Faceでそれを使うことができる。なぜなら、それは#実際に有用やからや。その方向でも、俺らのHigsfieldの友達、俺は彼らが俺らが誰かを知らへんし、気にかけるべきでもないって言う。彼らはめちゃくちゃ悪い名前を持ってる。残念やけど、Higsfield Steelって呼ばれてる。

そやから、俺らにはGlyphの友達がいて、しばらくの間、ウェブ上の画像を見て、ボタンをクリックして、パイプラインのような何かをすることができる類似のブラウザ拡張機能を持ってた。

まあ、Higsfield、彼らは数週間前にSoul IDを発表した。俺らは簡単に話した。それは基本的に君自身のLoraやデジタルクローンを作らせて、彼らの様々なツールに適用できるようにする。自分のビデオや画像を作る。

そやから、これは君のSoul IDをウェブ上の任意の画像に接続する。そやから、君が見る製品写真やクールな画像があって、そこに自分を入れたいなら、たぶん映画の予告編からのシーンやビデオゲームから、それをクリップして、その外見を盗んで、君のアバターをそこに入れることができる。

そやから、これらの環境やものに自分を入れるすべての例がある。全体のキャンペーンは人々にハリウッドから盗むことを奨励してた。そして、俺はちなみに、Higsfieldは会社として本当に信じられへんものを作ってると思う。steelのことは、たぶんHigsfieldで雇われた人がいて、これらのマーケティング方向をある特定の方法で動かしてるんやと思う。

でも、俺がHigsfieldについて好きやないことの一つは、彼らがこれらすべてのAIインフルエンサーを雇ってると思うことや。もし君がXにいて、これらのすべてのことをやって、AIについて話すある種の方法を持ってるこれらの人々を見るなら、それらの男らはいや、いや、ここで俺は彼らがこれらのツールについて話すためにHigsfieldから金をもらってると思う。これはX上で起こる非常に一般的なことや。

俺は詳しくは触れたくないこれらの男の一人と経験したことがある。その男の名前はMax SQっちゅうんや。俺らはHigsfieldについてやなく、やり取りをした。彼は基本的に、俺はSpotifyの購読をキャンセルしたっちゅうツイートを出した。俺はAI音楽だけを聞く。それは俺が欲しい時に俺が欲しいものそのものや。今夜、俺はUKガレージの気分やった。完全に。

聞いて、ソーシャルメディアで機能するものは、極端に言うものと、極端にやるもので、俺は理解してる。俺はそれに対してある種のやり取りをして、「それは正しいか?本当にソーシャル音楽だけを聞くのか?」って感じやった。俺らはいくつかのやり取りをして、最後に彼は「聞いて、俺がソーシャル音楽を80%や90%聞くって言ってたら、5いいねしかもらえへん」って言った。

そして、俺の心の中では、これはAIツールの何が間違ってるかの本当に良い例やと思うんや。これらの特定の種類のツイートが俺にとって本当にうっとうしいと感じるからや。繰り返すけど、Higsfield製品チームに対してではない。Higsfieldの才能に対してでもない。でも、Higsfieldはこれらのロールアウトをやる時に、これらの人々をたくさん連れてくる傾向があるようや。それが俺の小さな愚痴や。

いや、俺は同感や。それは必ずしもツールの責任やないけど、この分野の不満の一つや。多くの不満があるけど、これはその一つで、何かが出る度に、「妻をクビにしろ。子供を捨てろ。食べる必要はない。終わりや」みたいになる。

俺らはめちゃくちゃ調理されてる。「なあ、俺らはもっとそれを採用すべきなんやろうか、ギャビン、いいねとクリックが欲しいなら。」

正直、それが俺が本当に理解してることや。でも俺らは何をするつもりやって?ケビン、それらの人々を訴える?

ギャビン、俺らはケビンや。そうや。

最後の実際に有用なものは新しいツールや。そして、これはもっと面白いツールやけど、本当にクールな何かや。基本的にこのツールを使うことができる。たぶんVibeでコーディングされたものやろう。非常にシンプルなものやから、でも偽の弁護士から法的文書の下書きを作って、誰にでも送ることができるんや。

そやから、君の背中に大きな法務チームがポケットにあるように見える。選択できるものがたくさんある。ドロップダウンメニューがたくさんあるけど、AIを使って何かおかしなものを作る非常に楽しい方法や。

アイデアは、弁護士やと偽ることやない。なぜなら、それは正確に合法やないと信じてるからや。アイデアは、もし誰かが法的にフォーマットされたように見える通知を受け取ったら、フォント、パートナーの名前、法律事務所がどの階にあるか、どのくらい存在してるかがあって、ウェブサイトで調整できるスライダーがあって、それから君の通知を入れるんや。

そやから、もし君が、わからへんけど、家主の注意を引きたいか、誰かに何かを削除させようとしたいなら。法律事務所やと偽って法的な困った状況に陥ることなく、ただ何かの外観をフォーマットすることが何をするかっちゅう興味深い実験のようなもんやった。

俺がめちゃくちゃ面白いと思うのは、俺はいつも法的文書を見てるんや。そして、そのものが生成してた小さなサンプルを見た時、俺は「ああ、ああ、それ、ああ、わかった。今わかった。それはスタイル的な選択や」って思った。楽しい。君は行って一つ作るべきや。俺らに削除通知を送ってくれ。なんでやあかんの?

そうや。偽やって教えてくれることを確認してくれ。なぜなら、俺らは本物を週に数回もらうけど、まだそれらについて何もしてへんからや。

よし、みんな。今週君らがインターネットでAIと何をしたかを見る時間や。AIで何をしたか見る時間や。

時々君は気にせずにスクロールしてる。それから突然叫ぶ。

[音楽] [拍手] [音楽] [拍手] [音楽]

今週のAI活用事例

ケビン、今週このツイートを見た?もし見てへんなら、これはD5 emulate、desimulateのようなTwitterユーザーやXユーザーからで、「OMW」って言うてる。on my wayや。

でも、これは非常にクールなピクセル、ピクセルグラフィックスのようなもんで、パララックスみたいなもんやと思う、そうやろ?グラフィックの一部が背景で動いてて、一部が君に近づいてきて、手にいくつかのものを持ってるのが見える。

このツイートやXのことは狂ったようになった。実際に使った人の数の観点から巨大な輝きを得た。実際に見ると、統計は驚異的や。3770万ビューと14万5000いいねを得てる。

そやから、これについてクールなことは、多くの人が出てきて、そんなゲームをプレイしたい、これをやりたい、って言うのを見たことや。そして、多くの人がこれはAIやって言うた。そして、何人かの人はAIは絶対に使いたくないって言うた。

でも、他の人は、これをどうやって構築するのかって言うた。なぜなら、俺が見た何人かのゲーム開発者は、これは実際のゲームエンジンでやるのはほぼ不可能やって言うたからや。そやから、これは本当にクールやと思った。実際にやることができる。君は実際に行って自分で作ることができる。俺らのGlyphのFabianっちゅう友達が、実際にそれをやるためのかなりまともな小さな道筋をシェアした。

これを見た時、君の最初の思いと反応は何やった?

それは何かを捉えるものやった。なぜなら、俺らはいつもフィードでAI関連のものを見てるけど、それがポップアップした時、俺は「ああ、それはちょっと豪華なアートスタイルや」って思った。前景で二刀流してるキャラクターと、背景で浮かんでる巨大な城と、道を下る時のパララックスした2D効果を見る方法について何か催眠的なものがあった。

俺は「ああ、その世界を探索したい。そんな見た目のゲームをプレイしたい」って思った。そして、何人かのインディー開発者が出てきて「そうや、俺らはそんな見た目のゲームを持ってる」って言うた。でも、他の人が出てきて、スタイルをクローンして、独自の解釈をやった。

でも、俺にとってめちゃくちゃ魅力的なことは、この分野がめちゃくちゃ速く動いたから、「ああ、クールな見た目や」って感じやった。それから誰かが「まあ、俺がどうやって作ったかがこれや。これがその15のバリエーションや」って感じやった。

そして今日は「他に何かある?AI アートシーン。行こう」って感じや。でも、確実にもっと実際のゲームと体験がそれで出てくるやろう。それは何かコージーなもんや。俺がプレイしたいと思わせる動きについて何か非常に魅力的なものがある。

そうや。そして、俺はゲームとAIが交差するこの世界について、めちゃくちゃ知りたい。なぜなら、多くのゲームデザイナーがこれを実際のエンジンの周りに構築するのがどれだけ困難かについて話してたからや。でも、もしエンジンサイドを理解できたら、これが機能する可能性のあるAIゲームの種類の世界があるかもしれへん。

動画の観点から出てきたもう一つの本当に興味深いものは、俺らが巨大なファンであるEthan Molickが、o3のためのバイラルになったプロンプトを作ったことや。そして、これは動画ゲームコミュニティシアターについてやった。

もしこれらを見てへんなら、素晴らしい。基本的に、マリオブラザーズ、ドンキーコング、あらゆる種類のもののような悪いコミュニティシアタープレゼンテーションや。見た時に、俺も自分でそれを構築して何かをやってみたいって思う非常に楽しいもののうちの一つや。そやから、行ってやるのにクールなことや。

そうや。行って見ろ。つまり、Mortal Kombatのやつが俺をノックアウトした。最後にダンボール箱でFalloutコスプレがある。ただ素晴らしいプロンプトやけど、モデルがそれらのプロンプトをどう扱うかを見るのもめちゃくちゃ面白い。プロンプトに本質的にないようなもの。めちゃくちゃ良い。

これはそんなに面白くないけど、俺のオタクな感覚をくすぐった。ギャビン、衛星画像のLoraや。動画を見ると、魔法のように見える。なぜなら、彼らがやることは、もし君がGoogle MapsやApple Mapsでズームインして、建物と木を見たことがあるなら、それらはすべて誰かが3Dモデルを作って電子レンジに入れたみたいで、ちょっとぐにゃぐにゃで低解像度や、そうやろ?

まあ、これはそれらの画像を、信じられへんほど豊かで詳細で高品質なもののように見えるものに変えるモデルや。そして、無料でダウンロードして、自分で実行することができる。でも、それは俺にAIによって新しい方法で強化される、俺らが既に持ってるデータの世界について再び考えさせる。

見ると、繰り返すけど、もし音声だけやったら、ショーノートに行って、YouTubeでこれをチェックしてくれ。本当に印象的に見える。

そうや。flux contextでこれをトレーニングしたreadyuser alternative_lab_4441にシャウトアウト。俺はflux contextで十分な時間を過ごしてへん。

もし知らへんなら、それは新しいfluxモデルのようなもんで、fluxはBlack Forest Labsのオープンソース画像モデルで非常に良いんやけど、俺らが今手元にこれらすべてのツールを持ってるから、購読を持ってるかもしれへん他の画像モデルでめちゃくちゃ多くのことができるから、その世界に戻るのはちょっと難しい。

まあ、そやから、その線に沿って、ギャビン、既存のデータを取って、それで新しいか素晴らしい何かを作ることについて、2D画像を取る3Dパーティクル Nerf システムがある。基本的に、2D画像を取って、その画像の深度を生成して、ピクセルをほぼボクセルのような3Dポイントに変換してるんや、そうやろ?

そやから、Dominic、Fosk、名前をめちゃくちゃにして申し訳ない、Dominicやけど、彼らはスターウォーズのシーン、I am your fatherのシーンを、3JSとTSLといくつかのAIを使って3Dパーティクルに分解したけど、基本的にはシーンの3Dモデルを作って、これらの3Dピクセルやボクセルみたいなものの周りを回転できるんや。

これについてめちゃくちゃクールなことは、これは5年や10年前やったら映画のクレジットにあって、みんなが「それは今まで見た中で一番クールなもんや。どうやってやったんや?」って言うような種類のもんやっちゅうことや。そして今、それは君の手の中にある。君は自分でこれと遊ぶことができる。めちゃくちゃ興味深い。

君が手の中にって言うて嬉しい、ギャビン。なぜなら、それが最後のものに繋がるからや。Alexandre Dvauは、任意の動画を君の手のひらに持つことができる3Dホログラムに変える方法を持ってる。

そやから、想像して、それを見ると、繰り返すけど動画を取って、深度を計算して、同じ種類のNerfやsplat技術をそれでやって、残りを幻覚させながら3次元空間で2D動画を保持することを可能にしてるんや。

もしそれを見て「ヘイ、それはクールやけど、ちょっと低解像度に見えるか、ちょっとこれ、それ、その他に見える」って思うなら、君は森のために木を見落としてる。なぜなら、俺らは低解像度を取って本当に高解像度にするものを示したばかりやからや。

70年代や80年代や何でも撮った写真から、君が取った2D画像をアップレゾして、その3Dモデルを作って、3D空間で君の手のひらの周りを回転させることができる近い将来がある。

君はただこれらのツールを組み合わせて、もうちょっと時間ともうちょっと処理を与えるだけで、すべてのSFが現実になってくる。

君がそれを言うのがめちゃくちゃ面白い。なぜなら、俺がよく考えることの一つは、人々がVision Proがどれだけ爆弾かについて話してることや、そうやろ?これはAppleの超ハイエンドVRグラスやった。そして、俺らはこの種のVR AR の寒い時期にいると思う。

寒いプランジやない。彼らはAIが長い間、あまり多くのことが起こってへん長い寒い冬の期間を通ったって話す。AR VR分野についてクールなことは、もし君が注意を払ってるなら、Gaussian splatタイプのもののようなこれらのものがたくさんあって、物事がどんどん良くなってるっちゅうことや。

3Dモデリングのものがいつもどんどん良くなってる。人々はこれに取り組んでる。そやから、みんなが着たくて、これらのものを俺らの現実世界に置くのに十分強力なレンズが出てくる場所に着いた時、それは行く準備ができてると思う。

今、それは今から5年かもしれへん。今から3年かもしれへん。Metaが料理してることは何でも、まだ2、3年先のように聞こえたけど、そのものが良い場所に着くやろう。

ケビン、去る前に、君にとって見るのが非常に重要な動画がもう一つある。初めて見る時にある意味で人生を変えるようなもののうちの一つや。俺が君が興味深いと思うかもしれへんハンバーガーの動画や。そやから、行く前に、これを見てくれ。

人生を変える。オーディオはさらに悪い。よし、みんな、また後で会おう。それが何やったかを知りたいなら、それは露骨やないけど、めちゃくちゃ変や。俺らのYouTubeページに行ってくれ。来週、みんなに会うで。みんな、ありがとう。みんなに会えて良かった。俺は毎週君らを嫌いになる新しい理由を見つけるで、みんな。

コメント

タイトルとURLをコピーしました