本動画は、OpenAIのGPT-5に関するリーク情報を中心に、AI分野における最新の動向を包括的に解説している。ZenithやLobster、Nectarineといった謎のモデルがLM Arenaで発見され、これらがGPT-5の可能性として注目されている。特にZenithモデルは一発でMinecraftライクなゲームを生成する能力を示し、コーディング分野での大幅な進歩が見られる。動画生成分野では、RunwayのALFやIDEOGRAMのキャラクター機能、中国発のQuen系モデルの性能向上についても詳しく取り上げられている。さらに、Meta社のマーク・ザッカーバーグが提唱する「パーソナル超知能」構想や、家庭用ロボットの進歩と課題についても論じられている重要な回である。

GPT-5がついに登場か?最新リーク情報を徹底解説
GPT-5がついに登場や。まあ、ちょっとやけどな。全ての兆候が、サンタ・アルトマンが俺らの次世代の煙突から降りてきて、お宝を届けてくれることを示しとる。来週、浮遊しとるかもしれん謎のモデルについて話すで。それがGPT-5かもしれんのや。で、どやケビン?
なんや?
大したことないやろな。
あかん。
それはもう完全にハイプビーストの領域やな。俺らはハイプビーストちゃうからな。特にケビン、小さな自転車に乗ったSVGペリカン見たか?
ペリカンが自転車に乗ってるの見たで。俺らもそのペリカンを見せるつもりや。でももっと重要なんは、なんでこのペリカンが自転車に乗ってることが大きな出来事なんかを説明することや。ケビン、自転車に乗っとるんやで。
自転車に乗っとるんや。自転車に乗っとるんや。めっちゃええやん。
よし、俺に戻してくれ。
ガビンをミュートにしよか。
よし、動画分野でも大規模なリリースがあったんや。RunwayのALF、まあ意地悪く言うならALFやけど、これは人々がメディアを作る方法を変えとる。これは誇張やない。IDEOGRAMのキャラクター機能は、君のごく普通の自撮り写真を完全な美人写真に変身させてくれるんや。
さらに、中国発のオープンソースコミュニティから大きなアップデートがある。新しいQuenモデルのラインナップがあるんやけど、これがめっちゃ興奮するんや。なんでかって言うと、飛行機モードでも動かせるからや。そう、オフライン知能や、友よ。そして自律的に洗濯ができる驚くべき新しいロボットもあるんや。君が見てへん時に公衆の面前でメルトダウンするかもしれんけどな。
それは俺がGPT-5の後になる姿や。
ケビン、これがAI for Humansや。皆さん、AI for Humansへようこそ。またAI分野の大きな週やな。実際ケビン、俺らは過去1年でAI界最大の週になるかもしれん前夜におるんや。GPT-5がここにある。まあ、今のところはな。実際はちゃうけど、リークがあったんや。君らは気にしとる。俺らの視聴者も気にしとる。誰も気にしてへん。彼らが気にしとるのは、240ポイントのフォントでクリックベイトを作りたいからだけや。
ちょっと言わせてもらうわ。今すぐクリックを節約してやるわ。誰も気にせえへん。何の意味もあらへん。
まあ、ポッドキャストのために気にしとるフリをしよか、ケビン。
よし、気にしとるフリをしよか。ガビン、俺は今サム・アルトマンについて皆がジグザグしとる中、ザグしとるんや。正直言って、それには理由がある。
番組の冒頭で予告した、そこにあるモデルたちについて話さなあかん。人々がGPT-5かもしれんと主張しとるモデル、GPT-5の多くのフレーバーの一つや。そしてその結果は本当に顎が落ちるほどや。
そうやな。でもまず最初に話したいんは、ChatGPTアプリのXハンドルが、異常に奇妙な日本のOpenAIロゴのビジョンを投下したことや。Grokで翻訳すると、特に何かを言うとるらしい。ChatGPTアプリからの露出画像は、中国の五福(五つの祝福)のモチーフに似たスタイライズされたデザインを特徴としとる言うとるな、ケビン。そして噂では、ワイフやないで。
それはイーロンのやないな。ワイフやなくて、実際はイーロンのプロジェクトや。
その通りや。正確にや。噂では、来週の火曜日、つまり2025年8月5日に出るかもしれんとのことや。その数字には5が二つ入っとるな、ケビン。俺らは本当にすごいことを話しとるんや。
でも、起こった興味深いリークについて話そうか。リークと言う時、俺らの番組を聞いとる皆、これらの会社の一部がこれらのモデルをテストする方法は、LM Arenaなどのウェブサイトに匿名で、引用符付きやけど、投下することなんや。LM Arenaは一つのモデルを別のモデルと比較する方法や。どのモデルが出てくるかわからへんのや。
だから、多くの起業家精神のある人々は、これらのモデルをテストしたり、いろんなことを試したりして大量の時間を費やして、聞いたことのないモデルがいくつか現れるのを見たんや、ケビン。
具体的には、人々が聞いたことのない三つの新しいモデルがあって、それらはすでにLM Arenaから消えとったんやけど、Zenithモデル、Lobsterモデル、そしてNectarineモデルや。全部面白いコードネームやな。もしこれがOpenAIやったら、全部面白いコードネームや。ここでの理論は、これがGPT-5、GPT-5 mini、そしてもしかしたらGPT-5 Nanoかもしれんということや。
だから、これらは可能性があるんや。繰り返すけど、俺らは証拠のない噂の領域におるんや。OpenAIは奇妙なシンボル以外、公式には何も言うてへん。ケビン、これらの結果のいくつかを見たか?実際にかなり印象的やで。
見たで。俺らはそれらのいくつかに飛び込んでいくつもりや。だからリスナーや視聴者の皆も見ることができるで。これらの一つが推論モデルかもしれんという兆候はあったか、ガビン?これについて考えることはあったか?これはZenithモデルやったか?
Zenithモデルが推論を背後に持っとるように見えるモデルや。だからそれがGPT-5モデルかもしれんと感じるんや。繰り返すけど、人々が話してきたこれらのことが全部あって、GPT-5については、俺らが番組で取り上げたんは、何らかの形のハイブリッドモデルになるような音がすることや。引用符付きで推論するかしないかを知るようになるとのことや。人々は可能性として偽物かもしれん、可能性として本物かもしれんスクリーンショットを共有しとって、何かで推論をオンまたはオフにできるようなもんや。
驚異的なコーディング能力を見せる新モデル
しばしばロールアウトでは、君がテストしたかもしれんけど、君は知らんかもしれん。でもZenithモデルは最も人々を興奮させとるモデルのようや。俺は多くの本当に興味深いコーディング例を見た。コーディング例と言う時、それは単なるコードのページやない。一発の例で実際にコードで作れるもんなんや。
Minecraftの例について簡単に話そうか。それが俺を立ち止まらせたやつやから。基本的には「Minecraftをコーディングしてくれ」みたいな感じやった。そしてワンショット、つまりそれがプロンプトやった。ブラウザベースの完全にプレイ可能なゲームを返してきたんや。ピクセル化されたブロック状の3D世界をナビゲートできて、ジャンプもできるし、物を壊すこともできる。スプリント機能もあった。基本的なインベントリもあった。昼夜サイクルもあった。
まあ、このコードの多くはそこにあるって議論もできるやろ。どこかのウェブサイトで何か別のものを通して掃き集められたかもしれん。でもその議論は過去のものについてもされてきた。
すべてのピースを一緒にまとめて、インタラクティブなコントロールと3Dグラフィックスを得て、プレイ可能にして、知的なシステムを一つのプロンプト、ワンショットでまとめる能力を物語っとる。
そうや。そうや。そしてこれは全て、俺らがこれらのAIラボの責任者たちからしばらく聞いてきたアイデアに続くもんや。これらのモデルは今年コーディングがずっと良くなるということを。
ケビ、俺が思う大きなことは、俺らが長い間Xでフォローしとる男がおって、Euchin Jinって名前で、時々これらの理論で正しかったことがあって、これらの分野でつながりがあるかもしれん。彼は言うた「OpenAIの小鳥から聞いた。GPT-5はついにClaude よりもコーディングで優れている。ベンチマークだけやなく、過去数日間の実際の内部使用でも」。もしそれが本当やったら、Anthropicはあまり長く静かにしとることはできへん。Claude 5をもっと早くリリースせなあかん。
それが事実かどうかはわからんけど、俺らが以前番組で言うたように、GPTモデルは新しいサイクルの始まりのような感じがして、Anthropicのものはサイクルの終わりかもしれんからな。他にも現れたモデルがいくつかあった。HorizonモデルとSummitモデルみたいなもんがあった。
基本的に、OpenAIがこれらの多くの異なるバリエーションをテストしとるなら理にかなっとる。彼らはまた、俺らがGPT-5がするであろうと信じとることをしない古いモデルをテストして、恐怖、不確実性、疑念を作り出すかもしれん。また、人々はインターネットに何でも投稿できるってこともはっきりさせとこう。
だから、完全にBSかもしれんものが浮遊しとるかもしれん。でも、Sad Albertっていう名前のXユーザーがおるようで、これは好きな名前や。LM ArenaからZenithが消える前に俺がやったいくつかのテスト。彼はいくつかの小さな例を持っとる。
形やシェイプのような幾何学の中に物理学を持つ跳ねるボールを置いて、それを回らせて跳ねさせるテストがある。人々は複数のシェイプと複数のボールで跳ね回らせるようなテストをやっとって、ボールは異なるサイズで云々。ボール物理学は桁外れや、ガビン。
要点は、もしそれがGPT-5やないなら、何かが本当に信じられんコード化された体験をワンショットで、そして非常に迅速に作っとるようやということや。人々はこのモデルが物事を生成する速度について言及しとる。
だから、もしそれがGPT-5やないなら、一体それが何であれ、興奮する理由であり、もしかしたらちょっとハイプビーストになる理由かもしれん。
そうや。そして、ちなみに、これらのモデルだけがこのことを示しとるわけやないことをはっきりさせとこう。起こっとる他の大きなことは、Microsoft Copilotが新しいスマートモードをローンチしたことで、VergeはこのスマートモードにおそらくGPT-5のターンオンがあると報告しとる。Vergeは先週、8月の初めに出てくるとも報告しとったと覚えとる。そしてMicrosoftとOpenAIは最終的に取引の寸前にあるようで、これはしばらく彼らを悩ませとったことや。
覚えとるやろうけど、AGIが何かということと、Microsoftが元々所有しとった会社の完全な割合を持つことを許可するかどうかについて全体的な議論があった。
取引が起こっとるような感じや。だからこれら全てが一つの方向を指し示しとる。同時に、ケビ、ビジネスの観点から、OpenAIは小さな情報を落としたんや。俺はそれがおそらく情報にシードされとったと確信しとる。彼らが今年間1200億ドルの経常収益をやっとるという情報が出てきたんや。同時にAnthropicは900億ドルをやっとる。これらの会社は非常に、非常に速くスケールしとる。
そしてある意味では、俺はこれら全てが次のようなアイデアにつながると思う。俺らは次のAIのステップが何かわからんこの瞬間から、本質的に俺らの世界の無数の異なるもんの未来になりうるもんを本当に見る瞬間に行くんやろうか?つまり、これらのツールがコーディングでこんなに良くなったら、他の多くのものにも手を出すことができるってことや。
AI発展の現在地と未来への展望
俺らが以前番組で描いた並行例やけど、この分野にカジュアルな人がガビン、そして今このポッドを聞いとって、もしかしたらChatGPTをちょっといじったことがあるかもしれん人にとって、4から5に行くことが彼らの日常で本当に何を意味するか、彼らの人生で本当に何を意味するかを説明するのは難しいからや。
俺らは人工知能のダイヤルアップモデムフェーズにおるんや。もし君が俺らのような古い頭やったら、それを覚えとるやろ。俺らは今どのボーレートにおるんや?
288や。
それは悪くないな。俺はもっと近いと思っとった。俺らは56kや。
いや、まあ、俺が言おうとしとったんは、俺らは初期ブロードバンドの瀬戸際におると思うからや。
なるほど、それは理にかなっとる。俺らはブロードバンドフェーズに突入しようとしとる。だから、それは何を意味するか?まあ、君がアクセスしとるGPT-4は、時々本当に素晴らしい答えをくれるけど、他の時は何もすることに惨めに失敗する。それが突然、君のために何分間も、潜在的に何時間も何日も何週間も働きに行って、戻ってきて結果を届けることができるようになるんや。
より迅速なものについては、それは稲妻のように速くなるやろ。これらのモデルの蒸留が下に降りてくるために。君のスマートフォン、君の眼鏡、君のすべてのものに知能が組み込まれるやろう。これらのフロンティアモデルがすべてを前進させ、最終的にすべてが滴り落ちるからや。
だからそれは、そうやケビン、俺らが忘れてはいけんのは再帰学習が一つのことであり、それは一つのことであり、覚えとくべき重要なことやということや。彼らは…俺は草書体を学ぶことを拒否したので悪い成績をもらった。
だから、なんでこれが重要なんか?まあ、俺らはAIに可能な限り最高の筆跡を持ってもらいたいんや。だから彼らが俺らの人生でもはや役に立たんという声明を提示する時、俺らはそれらを読んで完全に理解できるんや。
だから俺らのメモは書道になるやろな。
その通りや。素晴らしい。もはや必要ない。
今週本当に興味深いことがあって、Ethan Malikがこれをツイートしたと思うんやけど、主要なリーダー全員、ザッカーバーグ、サム・アルトマン、ダリオ・アモデイ、AIの端にある人々全員、そしてネメシスオフィス全員が、この再帰学習のアイデアについて言及し始めたんや。つまり、これらのシステムが自分自身をプログラムして自分自身をより良くするのを助け始めとるということや。それがスケールアップの瞬間や。俺らがすでに速く行っとると思うなら、それが全てが起こる瞬間なんや。
俺は来週には、俺らがここで本当にどんな飛躍を遂げたかを理解する感覚を得るやろうと思う。
そうやな。ザックについて話すと、今週スーパーインテリジェンスとMetaの未来について動画が作られて、俺はそれがどこでも投稿されるのを見た、ガビン。
ブログ投稿も見た。読んだ。それでも俺が読んだものや、それが何を意味するかはわからんけどな。
そうや。その始まりを少し聞いてみよう。ザックを少し再生しよう。ザックはカメラに向かって俺らを見ながら本当に重要なことを教えてくれるこれらの新しい動画が好きやからな。
よし、準備はええか?
みんな、こんにちは。
ちなみに、その「よし、準備はええか?」はザックやで、俺やない。もう一度再生するで。俺やと思ったか。
そうや。よし、準備はええか?よし、準備はええか?よし、準備はええか?
みんな、こんにちは。俺らの新しい取り組み、Meta Super Intelligence Labsと、すべての人のためのパーソナル・スーパーインテリジェンスを構築するという俺らのビジョンについて話したい。
AIは加速し続けとって、過去数ヶ月間で俺らはAIシステムが自分自身を改善する兆候を見始めた。だからスーパーインテリジェンスの開発が今や視野に入っとる。でもスーパーインテリジェンスを何に向けるべきかについて大きな未解決の問題がある。AIがもたらすことができる科学的・経済的進歩について多くのことが書かれとる。
そして俺はこれについて本当に楽観的や。でも君は巨大な吸血鬼の翼と牙を持った大きなワイフで、君のイニシャルが入っとるもんについて考えたことがあるか?
一口で君は…俺はただ聞いとるだけや。
よし。よし、ザックが何を言うか聞こうやないか。
でも俺は俺らの人生でより意味のある影響は、みんなが君の目標を達成し、君が世界で見たいものを創造し、より良い友達になり、君が憧れる人間になるのを助けるパーソナル・スーパーインテリジェンスを持つことから来ると思う。
もしかしたらそれは世界で最大のものを持っとるかもしれん、ガビン。もしかしたら君がコンピューターの近くに来るたびに翼を興奮してパタパタするかもしれん。もしかしたらフォアグラのように個人化された広告を強制的に食べさせるかもしれん。
フォアグラ。そうや、それが彼らがアヒルに強制的に餌を与える方法や。フォアグラ広告や。
フォアグラが何かは知っとる。まあ、それが俺の言っとることや。彼らは君に強制的に食べさせるんやろ。
君のワイフは君に人工的なものを全部詰め込む木の棒を持つことになるやろ。
だから、家で聞いとるみんな。俺らはフォアグラを支持してへん。俺らは棒を支持してへん。俺らは木のアヒルを支持してへん。だから全部同じ場所にあるだけで。でも俺らは大きな古い…を支持する。
ここで興味深かったんは、マークがパーソナル・スーパーインテリジェンスを売り込んどることや。これは興味深い用語やと思う。俺は以前にスーパーインテリジェンスを個人的なものと結び付けたことがないからや。つまり、彼が何を言おうとしとるかは理解しとる。俺が思うに問題は、俺らは再びこの段階に入っとるんや。人々はすでに始めとって、ダリオ・アモデイは今週、これらの用語のどれももはや意味をなさないという話をしたクリップがあった。まあ、君もこれらの用語を俺らの生活に持ち込んだ人の一部やったけどな。
でもスーパーインテリジェンスとは何で、それは何を意味するんか?俺はスーパーインテリジェンスを俺の友達になるもんとは思わん。
俺はスーパーインテリジェンスを非常に高いレベルで働いて、フットボールゲームを見るパートナーが必要な時に軽いビールを手渡すだけやないもんやと思う。パーソナル・スーパーインテリジェンスのアイデアは俺には少し矛盾用語のように感じる。君の考えはどやった?
Metaのパーソナル・スーパーインテリジェンス構想への疑問
君はそのように考えたことがなかったな。今そうしとると、俺は奇妙な種類の、もしかしたら近視眼的なこのバイアスを持っとったことに気づいとる。スーパーインテリジェンスは地球上のこの層になって、もしかしたら一握りの政府がアクセスを持って、彼らが実験を行って、俺はGro 6を得るんやろうな。君は知っとる、俺はそのアニメワイフバージョンを得るんやろ。
そうや。そうや。でもそれは…でも知っとる。でもそうや、そして見ろ、素晴らしい。
そうや、俺ら全員がスーパーインテリジェンスにアクセスできるようにしよう。俺はそれができることの5%を利用するつもりやけど、でも確かに、俺ら全員がそれにアクセスできるようにしよう。俺は一握りだけが最高の知能にアクセスすることについて心配するで。
だからそれは素晴らしいビジョンやけど、彼が…俺が何も言わんと言った理由で、これは他の人々によって投げかけられた批判やったんやけど、それは何をするんか、俺らのために実際に何をするんかということや。それはどうやって、そして俺ら全員がそれを持っとるなら、それは実際にスーパーインテリジェンスなんか、それともただ…それが俺の脳を動かしとるんや。
もし俺ら全員がスーパーインテリジェントやったら、誰かがスーパーインテリジェントなんか?
そうや。何がそれをそんなにスーパーにするんや?ちょっと待って。誰がスーパーデューパーインテリジェントなやつなんか?それが俺の知りたいことや。
でも俺はヘルスケアのために好きやな。
俺のポケットの中にあって、俺のバイタルをモニタリングして、最も健康で最高の人生を送るのを助けてくれるスーパーインテリジェンス。それはクールやで。それがスーパーインテリジェンスである必要があるかどうかはわからんけどな。
まあ、君は知っとる、わからん。ただ計画は何なんか?それは何をするんか?
俺はそれが素晴らしいことにつながると信じたいんや。俺はただ、何らかの形でより対象化された広告とより多くの…それにつながるような気がするんや。それは考えるべき本当に重要なことや。また、今週ちょっと奇妙なニュース記事があって、おそらくMirror Morottiのthinking machinesの誰かが、まさにこの理由でMetaに加わるための数年間にわたる10億ドルのオファーを断ったとされるんや。もしかしたら彼らはMetaのこのもんのビジョンの一部になりたくなかったのかもしれん。
そしてそれは、この技術を潜在的に変えることができる技術を担当する可能性がある5人から7人の人がいる場所についての疑問になり始めるんや。そして君が彼らの背景について何を知っとるか、彼らが以前に行った選択について何を知っとるかを考えるのは奇妙や。
そして君のターゲット広告についてのポイントに関して言えば、マーク・ザッカーバーグがその分野で大きなビジネスを築いたことを俺らは知っとるよな。俺らは彼がそれを理解しとることを知っとる。だから、とにかくガビン、思考実験や。AI for Humansと俺らの友情から離れるのに、君にはいくら必要なんや?
1999と、6ヶ月間隔でな。だから1999米ドルを6回の分割払いや。そうや、それで大丈夫や。もし君が隔月で俺に払いたいなら、それもたぶん大丈夫やろ。それはオーケーかもしれん。
それは持っとくべき励みになる情報やな。
ガビンを歩き去らせるのに1セントも使う必要はないけど、ガビンの日を明るくして実際により近づけるために1クリックを使うことができるんや。これはガビンにとって素晴らしい罰やな。
それは俺らをより近づけるんか?俺が言いたいんは「いいね」と登録のことや。このことがうまくいけばいくほど、残念ながら君にとって俺らは近づくんや、ガビン。
だから、お願いします。君らが毎週この取り組みを成長させる唯一の方法なんや。俺らはプロモポニーに乗って懇願し嘆願するんや。今週も違わへん。登録をクリックして、いいねをクリックして、コメントを残してくれ。
甘い甘いアルゴジュースで俺らを助けてくれるんや。だから、お願いします。
その通りや。愛をくれて、ありがとう。俺も指摘しとくで、ガビン、俺らは今YouTubeで100万ドル以上のスーパーチャットがない状態で2週目に入っとる。
君の言う通りや。ショックや。君の言う通りや。ショックや。
俺らが3週間行くとは思わんけど、俺らのオーディエンスは自制心を示しとる。それで大丈夫や。そこにいる複数の億万長者が、その巨大なスーパーチャットスペースの上に指をホバーさせとるのを知っとる。もし君がそれになりたいなら、10万ドルという低さでもやっても俺らは悪い気はせんということを知っといてくれ。もし君がそこに行きたい場所やったら、それは完全に公正やで。
自分自身にそれをするな。
それをするな。待機しとけ。100万で最初に足を引きずって入る最初の人になれ。そして俺らの他のクジラたちがサイドラインで、200万でより良く見えるようにリンプインすべきかどうか悩んどるのを知っとる。ただボールを転がそう。
だから、続けよう。今週AI動画分野で大きなニュースがある。runwayの大きな発表から始めるで。runway alf alef alaf alf。
俺らはそれをどう提示するか発音するかは正確にはわからん。でもこれについてクールなことは、それは君の画像や動画とのチャットベースの自然言語相互作用ツールで、君が何を望むかを伝えるんや。そしてケビン、これは非常にクールなツールや。俺は実体験があったと言っとこう。
少し話するで。俺が見た例は本当に興味深い。Crystal Ball Venezuela、Runwayの明らかにCEOの男が本当に興味深いものをツイートしとる。パルプフィクションのダンスで、彼らがすべての異なる…を入れたやつを見たか?
そうや。
オーディオリスナーのために説明すると、これはジョン・トラボルタとユマ・サーマンがダンスするシーンで、彼らを雪の中の砂嵐の中に置いたんや。砂嵐のものは非常に魅力的やで。砂嵐があるような感じを作るのが上手で、でも君はまだ画像を見ることができるからや。ほとんど顔認証を保持しとる。確実にそうやない部分もあるけど、これは俺がこれまで見た中で画像や物を操作することで最も優れたツールや。これはかなりクールやと思う。
モンタージュをたくさん見たことがある。短いクリップがあるやつや。俺は長い形式のシーンを見たいんやけど、物理学と天気、世界モデリング、照明の理解は本当に本当に印象的や。だから、俺のお気に入りの例のいくつかでは、彼らはシーンを取って、6回異なってスタイル転送するんや。
そうや、誰かがただ歩き回るのを見て、突然彼らは巨大な砂丘の上にいたり、雨や雪の中で球形の地球の上を歩いていたり、彼らは…これはハリウッド映画を一人で作ることについて話すような種類のもんなんや。これは「ランドスピーダーで飛びたいか?まあ、Amazonの段ボール箱の一つを取って、その上で半分しゃがんで、マシンにそれが馬やとか、ランドスピーダーやとか、君が望む何でもやと伝えろ」みたいなもんや。
そしてそれは本当にそのコンテキストを理解し、動画を転送するように見える。
そうや。そして俺が言うのは、このツールについて俺のお気に入りのことの一つは、俺がそれを使う人々から出てくる多くの創造性を見たことや。Proper Prompterは俺らがXで好きな人で、多くの例を示すんや。
でも彼らのフィードに行くと、彼らは多くの異なるものを示しとる。彼はTwitterのスクリーンショットを取って、それが生き返るような動画を作って、それから同じものが実際に起こってるように切り替わるという本当に興味深いものを持っとった。AI動画で期待せんようなことを使う本当にクールな方法や。
もう一つ、ケビン、俺がこれについて好きで、彼らがどのくらい長くこれをさせてくれるかわからんけど、Runwayは以前、認識可能な有名人や映画のシーンをアップロードすることについて本当に奇妙やった。そして今のところ少なくとも、彼らはこれについてのルールを本当に緩めたように見える。
そしてもしかしたら彼らはChatGPTとジブリゲートのような種類のローンチから学んだのかもしれん。もしかしたら最初に水門を開けて人々が物事をできるようにするんや。でも多くの興味深いIP関連の物があった。Proper Prompterが作った非常に面白いもので、ゲーム・オブ・スローンズのケシの前にスターバックスカップがあるもので、それから彼女が他の広告物と相互作用する他の多くの異なるシーンに切り替わるんや。また顔の構造は本当にしっかりしとって、本当に興味深い使用例で、runwayの購読者なら誰でも利用できると思う。
AI動画生成ツールの実体験と新機能
ケビン、俺は試してみて、そこに入って興味深い体験をした。多くの時間を費やしたわけやないけど、ニューヨーク市でタートルネックを着た自分の写真をアップロードして、熱帯の場所に置いてくれと言えるかどうか見たかったんや。それは熱帯の背景で俺のバージョンを作った。ちょっと変わった、わずかに変化した顔とより奇妙な体やった。
それから俺にサルの肩越しのビューを与えてくれと頼んだ。俺の向かいにサルがいるような感じで、それはそれをやった。それから俺が回転させようとした他のいくつかのことを試した。俺がやろうとしたのは、サルと俺が両方とも海を背景に握手してる逆ショットを得ることやったけど、これらのいくつかをするのに本当に苦労した。
だから俺がこれを言う唯一の理由は、これは再びrunwayに対するノックやない。これで非常に上手な人々から出てきた物は驚くべきや。これは、使いこなすのにおそらく少し時間がかかる別のこれらのツールの一つやということや。
最後の画像は、ChatGPTの画像のように、明らかに俺の顔が変わっとる。それらの物のリップを見る時な。だからChatGPTと同じことなんかなと思う。最初のものがまだ君がそれから得る最高のものになって、それからさらに進もうとすると…
まあ、runwayがこれをしようとしとる唯一のものやないよな。数週間前に取り上げたHigsfield のsoul アドオンがあったし、IDEOGRAMもあった。これは長い間俺らのお気に入りのテキストとロゴジェネレーターの一つやったけど、IDEOGRAMキャラクターという新しいもんがある。
彼らは、一つの参照画像だけで動作する最初のキャラクター一貫性モデルやと主張しとる、ガビン。
君が自分の一つの画像を与えて、それから見事な写真のような現実的な、完璧な、ピクセル完璧な精度で自分を再想像できるんや。そして君は試したし、俺も試した。それは、まあ、まず最初に明確にしとくべきは、彼らの言葉では最高かもしれんけど、俺らはこれのバージョンをかなり長い間見てきたよな。単一画像のLoRAのようなトレーニング能力のようなもん。多くの会社がある。これはかなり良いけど。俺は実際に同じ写真を使って、それをアップロードして、異なることを尋ね始めた。俺がここで共有した例では、俺がビデオゲームにいる例があって、それはかなり良いで。俺は実際にそれを90年代スタイルのような、ほとんどSkyrimスタイルのゲームのようにしようとした。ボールの上の俺の漫画、俺の画像がある。
でも最も重要なものは、俺が漂白ブロンド、漂白ゴーティーのような男性シェフの服装で俺の画像を得ようとしたんやけど、それは俺を何らかの奇妙な美人トラップ男に変え続けたんや。そして俺はこれらの画像が何なのかわからん。
これらは俺が求めたもんやない。君がバンドの構築のエピソード3まで生き残ったと思う。
それが俺の言いたいことや。俺はそれがまさにその通りやと言おうとしてた。だからそれらは非常にボーイバンドや。俺の顔はちょっときれいにされて、細くされて、他のいくつかのことが起こっとる。でも聞いて、もし君がビデオの有料メンバーやったら、また有料である必要があるんや。
君は10の異なるキャラクターでこれをできて、遊ぶ価値がある。だから俺はこれで少し時間を費やした。再び、これは以前アクセスするのが難しかったツールをより多くの人々が利用できるようにするだけや。だからそれは非常にクールなことや。
ケビン、同じ脈絡で、AI動画で出てきた別の興味深いことがある。V3、これはまだ俺が使うのに好きな動画モデルやけど、誰かがそれのハックを基本的に見つけたんや。画像をアップロードして、その画像自体に君が動画で何を起こしたいかを書くなら、文字通り「よし、この領域を丸で囲め、これらの男たちはこれをする、この領域を丸で囲め、これらの男たちはこれをする」と言うと、動画で方向を与えるのに本当にうまく機能するんや。
だからこれはただのクールなハックや。Jay Bugox creativeの素晴らしい例がここにあって、彼がSWATチームのような画像を作って、それからエイリアンによって侵入されるもんで、それがどう機能するかの感覚を得るんや。本当にクールな使い方や。
俺はその例が大好きや。それは3/4の視点のような、ほとんどアクションRPGスタイルの、XCOMのようなゲームのSWATチームで、彼は文字通り「エイリアンが壁を突き破る。これらの男たちが吹き飛ばされる。これらの男たちが撃ち始める」と言うんや。そしてそれはカメラコントロールでも機能する。
だから別の例がある。Rory Flynnがドリームカーがコーナーを回ってドリフトするもので、彼は矢印を描いて「よし、車はここに行く必要があって、それからフェーズ2でここでドリフトする必要があって、それから3で、カメラはそれを追う必要がある」と指示するんや。そしてモデルはただそれをするんや。
俺らはこれらのツールの将来のインターフェースがどのようになるかについて多く話すよな?そしてもしそれがこれを扱えるなら、自然言語入力も扱えない理由はない。ただ「ヘイ、カメラをここにプッシュインしたい、そして君は知っとる、指で描いて、そういうすべてのもん」と伝えるんや。これが誰かがただ発見した創発的行動やというのは異常や。これはチームによって計画されたもんやなかった。これが俺にとって最も興味深い部分や。これは大きな「ヘイ、これがそれや」みたいなもんやなかった。これは誰かがクールな方法やと思った何かで、創発的に彼らは「わあ、これは実際に機能する。それが機能したなんて信じられん」みたいになったんや。
中国発の強力なローカルAIモデル「Quen」シリーズ
ガビン、Quenラインのモデルについて簡単に話したい。これは俺らのサークルで注目を集めとるけど、DeepSeekのもんが昔やったように本当に突破してへん。これは信じられんモデルのラインや。いくつかの異なるモデルで、非常に非常に強力や。
俺らはいくつかのケースではGPT-4oレベル、コーディングではClaude Sonnetレベルについて話しとって、多くをローカルで実行できるんや。人々はRAMがちょっとしかないMacBook Airで実行しとる。これらはモデルの蒸留版や。それらは全能力のものやない。でも家庭での知能、君の機密データ、君の家庭のプライベートな指標やすべてのもん、君の財務、君の医療関連のもんでこれらのモデルを信頼することについて話す時、これが俺らが話しとることや。
これらのモデルは今、基本的に俺らが今持っとるフロンティアで動作しとる。そして確かに、より良い、より強力なもんが明日出てくるやろうけど、今日これは非常に、非常に印象的や。だから、もし君がコーディングを試したり、君の医療データを何かに送り込みたくて、サイドラインに座ってて、それを大手の一つに渡すのを躊躇しとったなら、今が飛び込む時や。これらのモデルは超安く実行できるからや。そして再び、オンプレミスで実行できる。君の家でローカルに実行できるんや。
ケビン、褒め言葉を言ってもええか?
もちろんや。君ができるとは思わんけど、でもようこそや。
何やて。勘弁してくれ。俺が言いたいんは、ケビンは昨日俺らがこれについて話した時やった。ケビンと俺は同じ町におるんや。奇妙なことに、俺らは世界の向こう側にいると思うかもしれんけど、いや、俺らは同じ町におるんや。ただ今は家にいて録音しとるだけや。
ケビンは俺がローカルAIが彼にとってどれほど重要かを理解するのを助けてくれた。そして俺は彼が本当にそれを俺の脳の前に持ってきてくれたと思う。主に、事実の問題として俺らは皆、それがより良く、より良く、より良くなるにつれてAIを使い続けるんやろうからや。でもある時点で俺らは数学者やない。俺らは数学の博士号を持ってへん。俺らは科学で狂った上級者やない。
もしかしたらある時点で、誰が知っとるか?もしかしたら俺らの君か俺が学校に戻ったら地質学の上級学位を取るかもしれん。でもこれらのオープンソースモデルについてクールなことは、それらが最先端モデルの道筋をたどることになるんや。そして最終的にこれらの小さな小さなモデルは、今から2ラウンドの最先端と同じくらい良くなるやろ。
それから君は、俺らが今から見ることになるすべてのこの力を持つことになる。2028年と言おう。最先端が何であれ、それは俺らが今いるところよりも大幅に遠くなることを望むけど、それから俺らが携帯電話でローカルに持てる2028年のモデルは本当に本当に良くなるやろ。それは本当に興奮することで、もしこれらが最先端のものと同じように改善し続けるなら、それは俺らがただ日常生活を送る方法の多くを変えるやろ。だから君は俺のために家に持ち帰ってくれた。感謝するで。
ありがとう、そして俺はそれを人々のためにもう少しコンテキスト化すると思う。俺がわからんのは、ある時点で俺はおそらく再びラップトップをアップグレードするやろうということや。もしかしたら別のゲーミングPCを手に入れるかもしれん。わからん。よし、俺は俺はかなりラッキーや。俺はそれらのことについて考えることができる。でも俺は確実に将来のある時点で家庭用のAIアクセラレーターを購入するやろ。
俺のため、そして偶然そこにいる他の誰のためにもトークンを生成するだけの専用デバイスにかなりの金額を費やすつもりや。それは俺の医療データを処理することを意味するかもしれん。それはばかばかしい動画を生成することを意味するかもしれん。それは俺がやりたいプロジェクトについて深く考えること、俺の本業を完了するのを助けることを意味するかもしれん。
俺は将来これらのものの能力について知らんことを知らんけど、俺らがそれらを加速することになることを知っとる。君と俺、そしてこれを見て聞いとるみんな、俺らはそれをより速くするための専用のものを家に持つことになる。それはちょっと異常や。
信じられん。信じ。俺らの家にあることになるもんについて話すと、ケビン、Robot Watchの復帰の時間や。不気味版。
[音楽]ロボットウォッチ。
そうや、ケビン、俺はこれを不気味版のロボットウォッチと呼んだ。ここにはロボットが君に「うーん」と言わせる歌を思い出させるものがいくつかあるからや。90年代の古い歌を覚えとるか?俺がこれでロボットについて考え始めた方法や。
俺らはロボットから始めるつもりやけど。Figure O2に動画がある。Brett Adcock、Figure O2のCEOが、彼のロボットが自律的に洗濯をしとる動画をツイートした。乾燥機の隣にしゃがんで座って、乾燥機から物を引っ張り出しとるだけや。
でもケビン、俺らのオーディエンスのためにそれを再生してもらいたいし、みんなにこの動画で聞こえる音に耳を傾けてもらいたい。
よし、figure twoのユーモアロボットが家で洗濯してる。君らどう思う?ハニー、それをそこに投げ込みたいか?
俺は今Servo ASMRに登録しとると思う、ガビンやで。それが君が聞くすべてやからや。小さな…
君がその音を聞く時、それは俺にとってとても怖い。俺がそれにしてもらいたいのは、小さなサーカス音楽か、それが存在することを俺に理解させる何かを演奏することや。
それが聞こえるのは、今のところ俺の洗濯をしとる静かな殺し屋のようや。君はそれがシボレー、シボレーボルトがリバースに入れられたような音を立ててもらいたいんか?ロボットがそこにいることを知るために常に低いハムを立ててもらいたいんか。
そうや。
何らかの形でそれのバージョンが欲しいで。君がベッドに座ってて、その小さなささやき、そのサインの小さなサークルを聞く場面を想像できるからや。地球上で君が聞く最後のことはガビンで、それが君の首をカモメするんや。それはカモメするんや。
ちなみに俺らが指摘すべきロボットは、Brettによるとティーオペレートされてへん。これは自律的に動いとるんや。彼らがHelixと呼ぶシステムを実行しとる、彼らのニューラルネットワークのもんや。
そしてロボットがバスケットから乾燥機に一度に一つの洗濯物を入れとる間、彼の娘がバスケットに新しい洗濯物を詰め込んでるように見える。これは理由があって起こることやけど、ロボットは調整して物事を続ける。俺が本当に見たかったのはタスクの終わりやった。ドアを閉めて、立ち上がって、ただフレームから揺れながら出て行ってもらいたかった。
それがタスクの終わりか?いや、俺はそれが子供を乾燥機に入れるのを見たくなかった。いや、いや、俺が言いたいのは、動画を見る時、ロボットが終了して、それからBrettが視点を外して、その向こうで何が起こるかわからんということや。でも俺は、そのうちのどれくらいがレール上にあったかを知りたい。「よし、君は完璧な位置にいて、今は洗濯コマンドを実行する時や」のようなもんか。どれくらいがそれで、その向こうで何が起こるんか?
そうや、君は知っとる。ロボット会社はとても良い動画を作るけど、彼らが生産中で世界にいる時に見るのは興味深い。それがある意味でそれらのRZ botの動画が見るのにとてもおもしろい理由や。君は実際に単体のロボットが実際に歩き回るのを見とるからや。
そうや。でも怖いロボットについて話すと、俺がLoomという会社から見た動画があった。俺がこの動画を開いた時、俺は「わあ、これは俺は何なのかわからん」と思った。
ライトが付いとる二つのスタンドのようなもんよな?これらの二つのライトスタンドがあって、それらが何をするかと言うと、フロリダ天井スタンドや。はっきりさせとこう。これらは非常に高い、竹の棒のような単一の見た目で、端にランプシェードが付いとるもんや。そして俺の心配は、俺が眠っとる時で、これが夜中に起こることやった。
それらは両方とも、ベッドの上に手を伸ばして、おそらく服の折りたたみのようなことをするこれらのロボットアームのようなものに変わるんや。でもケビン、不気味版について話すと、俺がそれらの二つのロボットアームが何をするかわかるか?
夜中に俺を大きく切り開くんや。それが起こることや。
そして俺らは俺らのベッドルームの俺らのベッドのすぐ隣にキラーロボットを置く準備をしとるような気がする。だから、もしこの動画を見てへんなら、チェックしてくれ。それはおそらく俺が言うほど怖くないやろ。それは実際に…
折りたたまなければいけない。折りたたまなければいけない。俺を曲げるのをやめろ。俺を折りたたむのをやめろ。
まあ、そして最後に俺らのロボットウォッチで、UnitryとRizbotについて話すと、完全なメルトダウンを起こしたUnitry G1があった。そして時々ケビン、ロボットが見えるほど高度やないことを覚えとくことが重要や。でもこれは俺にこの動画を見る時のことを思い出させた。それはUnitryロボットがぶらぶらしとって、時々Unitryの動画がやりそうに見えることをするもんや。昔のダンスムーブがある。
何と呼ばれるか覚えてへん。君が背中に行って、それから再び上に跳ね返るやつや。それが始めるように見える瞬間を知っとるやろ。それから地面で何らかのフリークアウトをするような感じや。
土曜日の午後にデニーズにいて、タブレット時間をもらえない幼児を見たことがあるか?
そうや、それがまさにそれや。完全なふんわり幼児モード。
小さなロボットの足をバタバタさせとる。その通りや。だから、これらのものが何らかの形で完全に制御可能な地点から俺らが外れとる別の例やというだけや。そしてそれが地面でそのように反転してバタバタできるなら、もしかしたら俺らは何が起こっとるかを正確には知らんということで、俺を再び少し不気味にした。
メインシステムがダウンしたり、間違った方向に行ったりしても検出できるこれらのもんのガバナー・ガードレールシステムはどこにあるんや?この速度やこれらの度数で小さなサーボが動作することを決して許すべきやないし、それはただフェイルセーフにして、それをシャットダウンすべきや。でもいや、俺らは暴れるロボットを手に入れて、君の娘たちは乾燥機に入ることになる。
そうや、今からロボット安全について考え始めることは本当に興味深いアイデアや。狂ったサイエンスフィクションのように聞こえるけど、多くの人々がAI安全について考えてきたけど、それは俺らの近くにある機械になるもんや。俺はこれらの多くが大きすぎないように作られとることを知っとる。それらは比較的軽量や。
だから、もし一つのものが君に倒れかかったり、何かがそんなに悪くないような感じやけど、俺が言うのは確実やけど、最後の20年間の俺の人生がロボットが倒れないことに依存しとるロボットエンジニアの束がそこにいるということや。俺はそれについてノンストップで考えてきた。だから確実にそれは起こっとる。
AI分野で注目すべき発見とツール
ガビン、毎週君と俺は俺らを動きを止めさせる驚くべきもんをスクロールして、「ヘイ、君が何をしたかわかった」と言うんや。時々君は気にせずにスクロールしとる。それから突然止まって叫ぶんや。
[音楽] [拍手]
今週俺は何かを叫ばなあかん。これは俺らのオーディエンスの3人のためや。
これはおそらく本当にオタクなセットのためやけど、俺はただこのツールを発見した。使い始めて、ただのファンなんや。ハッシュタグ、広告やない。Yo-Yoと呼ばれるもんで、IDEツールや。だから、もし君が何かコーディングしとるなら、これはJack Jack ETHから俺らに来る。
俺はわざわざJack Jackにメッセージして「ありがとう。これは本当に役に立つ」と言った。
わあ、この男は俺をフォローするか、番組をフォローすると思って、今それは理にかなっとる。それがおそらく理由や。
そうや。そうや。ガビン、俺は一度に一つの無料シャウトアウトでオーディエンスを構築しとる。もし君が造園業や、もしかしたら特注のラバランプを作っとるなら、俺らに連絡してくれ。ヨットを持ってて、週末の逃避行のために俺らを君のヨットに招待したい男。それも公正や。
どちらでも大丈夫や。100万ドルのスーパーチャットを残してくれ、俺らが君に戻るで。
Yo yo、もし君がvibe codingや通常のコーディングで何かするなら、目を覚ませ。これは君の大規模なGitHubコミットの間で状態を保存するツールや。
だから、もし君が小さな機能を入れようとしたり、何かに小さなショットを取ろうとしたり、小さなコードを変更したいなら、ボタンを叩く、状態を保存する、続行できる。もし気に入らなければ、ワンクリック、それを元に戻す。それはビデオゲームのチェックポイントシステムのようなもんや。そして君がロビットに君のコードを書いてもらうのに依存しとる時、それを持っとるのは本当に良いことや。時々雑やからな。だから、ありがとう、Jack、yo-yoを作ってくれて。
そしてそれはこの世界で本当の文章や。
そうや、それは本当に興味深い。それはおそらく人間によって歴史上初めて言われた文章や。ごめん、俺のランプが今降りてき始めとる。ちょっと待って。今やない。
よし、俺らが行く前に、最後のこと。
Will Ahmedが動画を出したんやけど、彼がやった非常に興味深いシンプルなことやった。彼は「これや。これはNBA 2K、AIフィルターを使ったビデオゲームや。ライブスポーツがビデオゲームによって破綻する非常に現実的なチャンスがある。もし君がNBA 2Kに馴染みがあるなら、実際の動きがかなりリアルに見えることを知っとるけど、それでもビデオゲームのように見える。これは実際のNBAゲームのように見える」と言うた。
そして興味深いのは、もし君もNBA 2Kに馴染みがあるなら、一時停止の瞬間があることを知っとるということや。そしてその瞬間に一時停止しとる本物のように見える人々を見るのはとても奇妙や。
そうや、まさに。それは実際のようや。レイカーズがちょっとしたショーを上演して、彼らは「ロボットのように遊ぼう」みたいに始めたように見える。
まさに。まさに。俺は…ありがとう、Will、これを投稿してくれて。俺は後半、ライブスポーツがビデオゲームによって破綻するという全体に同意せん。俺はビデオゲームエンジンがこれらのAIレイヤリング技術によって破綻する良いチャンスがあると思う。君はこれらのすべてのエフェクトや何かで多くのポリゴンをプッシュする必要がない世界を想像できるからや。
これらのバスケットボール選手は、アニメーションが十分に良い限り、AIによって動かされる動画フィルターをその上で実行することができる。これは俺がスクロールして通り過ぎた時に本当に俺を止めたもんや、ガビン。そして俺はこれを見たのは、それがバスケットボールゲームのように見えるからやった。
まあ、それについて、低ポリの君は知っとる、映画の最初のレベルになりうるもんを作るためにビデオゲームエンジンを使うという全体のアイデアは、それがPixar映画やIlluminationのような映画の元の設定を作る方法の多くやというように非常に可能や。それはそのもんから始まる。今それは多くの人々がするのがより簡単になっとる。だから。
それが今週のすべてや、みんな。少し短い。ごめん。俺はなぜかわかる。いや、俺はなぜかわかる。俺のロボットランプから手が出続ける理由は、俺がシークレットブラウザを上げとるからや。俺はそれを無効にせなあかん。切れ。切れ。
俺らは今週少し短いのは、俺らが編集された新興企業のために忙しいことがあったからで、それについてはすぐに話すつもりや。
来週みんなに再び会える、うまくいけばGPT-5週やろう。それは楽しいことになるやろ。みんなありがとう、そして俺らのスーパーサンクスに100万ドルを残してくれ。


コメント