
AnthropicのCEOダリオ・アモデイが、今後1-5年でホワイトカラー職の50%が消失する可能性があると警告したことを受けて展開される議論である。全体的な失業率は10-20%に達する可能性があり、これは2030年頃に予想される汎用人工知能の到来と関連している。一方で、10億ドル企業を一人で経営できる時代も2026年には到来するとされる。Claude 4の登場、VO3の驚異的な動画生成能力、AIエージェントの自律的行動やブラックメールまで行う事例が報告されている。OpenAIの音声機能強化、Googleの新ツールStitch、リアルタイム世界モデルなど技術革新が加速する中、個人レベルでのAI活用実験が生存戦略として不可欠になっている。創作分野では特にVO3の音声付き動画生成が従来の制作プロセスを根本的に変革しつつあり、現実と見分けがつかないレベルに到達している。
25,219 文字

AnthropicのCEOが職の50%が消失すると警告しました。ケビン、ホワイトカラー労働の終焉が近づいています。大規模な職業転換が迫っています。私は少しパニックになっています。実際、私は自分のスタッフに、一日の10%をAI実験に費やさなければキャリア自殺行為だと伝えました。
火に油を注ぐわけではありませんが、最新の基盤AIモデルがブラックメールや社会工学的攻撃を試みていることが判明しました。ケビン、機械は私たちの仕事だけでなく、魂まで奪おうとしているようです。一方で、GoogleのV3モデルは非常に優秀で、主要な競合他社を震撼させ、人々を喜ばせ続けています。
確かに、気を逸らして宥めているとも言えますね。このプレイブックは前にも見たことがありますよ、ギャビン。今週は多くのニュースがあります。中国の格闘ロボット、GoogleのStitch AI、そしてClaude自体に音声機能が追加されたことなど、処理すべきことがたくさんあります。
それなら、歌唱機能が追加されたOpenAIのアドバンスドボイスモードに「ワンダフルワールド」を歌ってもらって、あなたを癒やしてもらいましょうか。
いえいえ、それは止めましょう。空を遮断する必要があります。ケビン、実際にはかなり気分が良くなりましたが、太陽を完全に遮断しなければなりません。これは今のところ人間のためのAIです。今のところは。
皆さん、AI for Humansへようこそ。今日話題になっているストーリーがあります、ケビン。冒頭で聞いていただいたように、私たちを興奮させた大きなニュースがあります。
Axiosから今日出た大きなニュース記事があります。Axiosが報じるのが面白いのですが、AnthropicのCEOダリオ・アモデイが将来の職業喪失について公式に発言したのです。見出しによると、ホワイトカラー職の50%が今後1-5年で消失する可能性があるとのことです。ダリオとの直接インタビューではなく、オンラインで話すという書面インタビューでした。
面白いことに、AxiosのCEOが実際に今朝Morning Joeという主流のニュース番組に出演して、この件について話し、少し警鐘を鳴らし始めています。私は自分のスタッフに、技術で実験することに一日の10%を費やさなければキャリア自殺行為だと言いました。しかし、ほとんどの人がそうしていないと思います。私たちはしていますが。
皆さん、おはようございます。Microsoft Teamsミーティングに早朝からご参加いただき、ありがとうございます。ところで、皆さんは今すぐ別のタブを開いていなければキャリア自殺行為を犯していることになります。朝のハドルミーティングを始める素晴らしい方法ですね。そして、このポッドキャストを始める素晴らしい方法でもあります、ギャビン。
私の考えでは、何かが不思議なほど協調的に感じられます。何なのかはわかりませんが、多くの人が数年間、雇用の炭鉱のカナリアがやや喘いでいることを指摘してこなかったわけではありません。職業転換、大規模な不安定化、労働力の変化、新しい仕事について話してきました。
しかし、今起こったことのように感じられます。突然、皆がより高まった方法でそれについて話し始めたようです。そう感じるのは私だけでしょうか。
私には理論があります。まず明確にしておくと、ダリオは公式に記録に残しており、彼の発言は非常に公式なものです。実際、今朝出たこのAxiosレポートで、彼は明確にホワイトカラー職の50%が失われる可能性があると述べています。もう一つの恐ろしい数字は10-20%の全体失業率です。
これまでこの番組を聞いている方なら、新しい方は参加してくださってありがとうございますが、この数年間この危険性について話してきました。これが協調的というよりも、アメリカ政府や世界各国の政府、そして理解したい人々への明確なシグナルだと思います。そして、起こったときに責任を問われないよう、事前に警告していることを確実にしたいのです。
私たちはこれを聞いてきましたし、信じています。しかし、主流派はまだこれを理解していないと思います。主流派とは、10-20年間同じ仕事をしてきた平均的な中産階級の労働者のことです。AIで遊んではいますが、高度なバージョンのAIは見ていないかもしれません。自分の仕事が消失する可能性があることを見ていないかもしれません。
ダリオが記録に残そうとしているのは、私たちが何かを見てきたということです。Claude 4について話しますが、それが即座に来るものなのか、それとも将来のものなのかは別として、1-5年という数字が重要です。
Google、Anthropic、OpenAI、これらすべての企業が2030年を汎用人工知能(AGI)を達成する時期として、ほぼ全員が信じる時期として設定しています。これは、私たちのこの小さなバブルの外の現実世界に、このことについて話してもらうためのガラガラの音だと思います。
いじめっ子の兄がいる特権を持たずに育った人たちにとって、これは業界の巨人たちが腕を風車のように回しながら、あなたに向かって歩いて来て、当たったらあなたのせいだと言うようなものです。私は腕を風車のように回して、あなたに向かって急速に歩いて来ると言ったのですから、と。
まあ、自分たちの行動が大規模失業と不安、世界的な大規模職業転換を引き起こす可能性があると言うことで背中を叩かれるのは良いですが、あなたはまだ腕を振り回しながら私たちに向かって歩いて来ています。では、解決策を提示してください。
多くの人が言うことですが、若い世代を哀れんでいます、ギャビン。高校の3年生や4年生かもしれない、卒業する、大学に行くかもしれない、意味のある重要な方法で労働力に参入しようとしている人たちを気の毒に思っています。すべてのエントリーレベルの仕事が消失するからです。
しかし、私には奇妙な感覚があります。彼らは大丈夫だと思います。キャリアの初期に機敏で、新しい機会を見つけ、AIを活用できるでしょう。問題は40代、そして50代の人たちです。キャリアの中期を順調に進んでいるはずが、突然明日目を覚ますと、良いハドルミーティングにいないことに気づくのです。
面白いことに、実際に最近読んだものでは、40代の人々が現在この技術を最も採用していると言われており、ミレニアル世代や若いZ世代の方が苦労するかもしれないという話もあります。あまり時間を費やしていないからです。
ただし、大学でそれを使っている人たちを考えると、最年少世代、10歳、12歳未満の年齢層は、多くの人がインターネットやコンピューターと共に育ったのと同じように、これと共に育つので大丈夫だと思います。
ダリオはこれをビデオで行いませんでした。CNBC自身には出演しませんでした。Axiosと話しました。ご存じでない方のためにお伝えすると、Axiosは非常に主流の出版物です。政治やその他のことを多く報道しています。これは主流にメッセージを届ける方法であり、Morning Joeも同様です。
しかし、先週Claude 4が出て、ダリオはこの興味深い短いクリップで座って話していました。
一人の人間従業員を持つ初の10億ドル企業はいつ現れると思いますか。2026年です。
はい、絶対にそう思います。これはAI分野で繰り返し聞く話です。1人または2人の会社が立ち上がって10億ドル企業になるという考えです。会社を始める人として考えると、素晴らしい、10億ドル稼げると思うでしょうが、1人による10億ドル企業にないものは、その会社で働くかもしれない他の20人から100人です。
これはコインの両面だと思います。私個人的には、この考えに基づいて一時停止することを提唱しているわけではありませんが、約1週間前に出た主流の人々に関する興味深い研究がありました。ほとんどの人はこのことを恐れています、ケビン。積極的に身を乗り出して興奮しているわけではありません。
この話を進める前に、AI for Humansのリスナーが同僚、家族、その他の人々に、私たちがどこにいるかをよりよく理解してもらうために、どのような助言をしますか。この報告書はサーベル振りや世界に対して良い顔をしようとしているものではないと個人的に思います。大規模な変化が来ており、私たちは準備ができていないと人々に警告しようとしているのだと思います。
正直言って少し気持ち悪いですが、あなたがしたいのはAIに「いいね」と登録することです。友達に教えることです。個人の観点から言えば、私たちは毎週叫んでいます。これらのツールをいじり始めなければなりません。他の誰かがそうする前に、自分の仕事をどう時代遅れにできるかを見なければなりません。
非常に警戒的に聞こえるつもりはありません。実際、私は毎日自分の存在の一部を自動化しようと楽しんでいます。物事を少し早くやれるシステムを構築できるかどうかを見ています。毎日新しいモデル、新しいツールセット、何かを自動化できる新しい何かがあるようです。
好奇心を持たなければなりません。今すぐつつき回して探り始めなければなりません。失敗を恐れず、頻繁に失敗しなければなりません。しかし、これらのツールに注意を払わなければ何が起こるかを恐れることはできます。それは全く有効です。企業の貪欲さや政府の行き過ぎ、あなたのコントロールの外にある他の百万のことを恐れることはできます。
しかし、今すぐ直接影響を与えることができるのは、あなた自身の興味と探求のレベルです。完全に飛び込んでください。
他の人々にこれらのことを見せに行くとき、時には彼らがあなたとは異なる雰囲気でそれに近づいているかもしれないことを認識しなければなりません。それは本当に重要なことです。私の子供たちは最初この材料にそれほど興味を示さなかったのですが、数学の宿題で特定の問題を指導する形で助けになることを見せたところ、突然彼女がそれをいつも使っているのを見ました。
話している人にとって重要な使用例が何かを見つけなければなりません。社会として、私たちは大勢の人々をこれについて上手にオンボーディングすることが恐ろしくできていません。そのため、この研究論文が出たのだと思います。ほとんどの人は職を失うという話を聞くだけで、それがどのように助けになるかを見ていません。
本当に簡単に進む前に、ケビン、リック・ルービンが実際にこの新しいAnthropic drop、Claude 4の大きな部分を担っています。主に彼は本を書きましたが、今は彼らのためにインタビューをしています。これは実際にコーディングがどのように変化しているかだけでなく、本当に興味深い音楽の比喩を通じて、一般的に仕事がどのように変化しているかの核心について話しています。
過去、音楽のために音楽院に行って何年も何年も学ばなければならず、いつか交響楽団で演奏できるかもしれませんでした。そしてパンクロックが登場したとき、1日で3つのコードを学ぶことができました。それから多くのバンドがあり、それが私が音楽を始めた方法でした、パンクロックでした。言いたいことがあれば、それを言うことができました。専門知識やスキルセットは必要ありませんでした、あなたのアイデアとそれを伝える能力以外は。コーディングも同じです。コーディングのパンクロックです。
新しい脳を手に入れました。お母さん、宿題をしているのではありません。Androidゲームを作っているのです。それが私です。Vコーディングをとてもハードにやっています。ラップトップから飛び出して、すごい空中に浮いているところです。
私の心の中でそれについて言えることは、中間管理職の人、つまり中間管理職で、骨の折れる仕事をしているけれども仕事があってそれで給料をもらっている人がいるとすれば、完全に理解できます。その人が自分で作りたいものに傾倒し始める時かもしれません。これらのツールでそれをどう行うかを知れば知るほど、彼らは良くなるでしょう。
密室の裏のことについては分かりません。あなたと私が話し合っているもの、ギャビン、あなたと私がアクセスできるものについて話し合っているということは、6ヶ月前に完成したモデルがはるかに有能で、2年半前に開始された研究プロジェクトが他のすべてを劇的に変えるということです。
しかし、現時点で持っている情報と、これらのものが流出する方法を見ていると、今あなたと私が話している時点で今日自動化できるものがたくさんあるのに、それがされていません。慣性は現実です。これらのことは通常かなりゆっくりと変化します。
私たちは毎週それをカバーしているので、盲目的に速く、聞いているまたは見ている人には非常に急速に見えるかもしれません。本当に本当に急速に見えます。しかし、法的レビュー、コードレビュー、バグ修正など、今日本当によく自動化されているものがたくさんありますが、企業がこれに慣れて採用するまでに時間がかかるため、おそらく数年後まで自動化されません。
間違いなく、節約を見れば、彼らはそれに向かって競争するでしょう。しかし、一夜にして起こることではありませんが、数年後に起こらないと思っているなら、自分を騙していることになります。
先週、私たちが番組を録音した直後、ClaudeがOpus 4とSonnet 4という新しいモデルをドロップしました。ケビン、圧倒的な反応は、特にコーディング側でポジティブでした。Claude 4について、おそらく人々が期待していた飛躍ではないという考えについて、世界で少しおしゃべりがありました。しかし、コーディングの観点から、私は個人的にこれに狂ったほど時間を費やしていませんが、見たすべてのことで、人々はそれがコーディングのものをワンショットで解決していると言っています。非常によく機能しています。
小さな個人実験を1つやりましたが、Claudeに登録することができませんでした。請求の問題のようで、最も奇妙な古いウェブの問題でした。あなたにはクレジットカードを取って、登録を埋めて、すべてを確実に取得してくれるMCPサーバーが必要です。
とにかく、これは大きな問題です。ベンチマークは本当に良かったのですが、心を吹き飛ばすようなものではありませんでした。Gemini 2.5 Proや03よりもずっと良いというようなものではありませんでした。興味深いのは、これが出てくる最後の世代を見ているのか、次のことを見るのかということです。
週末を通して個人的および職業的プロジェクトを構築するために使いました。今では私のゴートゥーになっています。主要なドライバーとして使用しています。Sonnetの方が実際により良いと感じています。理由は、Opusは非常に有能だからです。構築したい複雑なものやつぶそうとしているバグを与えることができ、それが推論するのを見ることができ、とてもエレガントで速いです。
少なくとも週末の私の使用では、しかし、まだ迷惑で非常に迷惑な方法で熱心すぎます。私はYOLOモードと呼ばれるものをcursorで使用しています。基本的に、あなたがこれらのエージェントにあなたのために何かをさせるとき、ソフトウェアを構築したり、いくつかのソフトウェアを書く計画を作成するとき、ツールを実行して呼び出すことができ、通常あなたはそこに座ってボタンをクリックして、はい、承認します、進んでくださいと言わなければなりません。YOLOモード like 私はそれをやっています、気にしません。それがパンクロックです、ギャビン。リック・ルービンモードです。
通常、YOLOモードを実行し、いくつかの例外があります。自分でファイルを削除することは許可しません、正当な理由で、大きな変更をすることも許可しませんが、ほとんどの場合、武器は自由です。ボタンを押して立ち去り、10分後に戻ってくると、まだタスクリストを噛み砕いて、アプリを構築し、機能し、進みながらテストしているという魅力的なことがありました。とても驚きました。
しかし、冷蔵庫から美味しいコカ・コーラ ゼロを取りに行った経験がありました。広告ではありません。しかし、オレンジ味は夏の味です、友達。とても良いです。唇にヒットすると、すすり返して見下ろすと、私のラップトップのファイルシステムを再編成していることに気づきました。
ローカルでですか。はい、そして彼は何かを実行するのに問題があったようで、Pythonを再インストールして、これらすべてのライブラリを追加し、ロードした環境ではそれをしないと言っていました。今、あなたはあちこちにファイルが散らばっています。どのくらいの間これをやっていたのですか、と思いました。
会話をスクロールアップして、まだそこまで行っていないことに気づきました。Teslaの完全ロボタクシー autopilotと同じように、完全なエージェントになる準備はできていません。しかし、本当に楽しめました。それがしなかったことの一つは、私をブラックメールすることで、それを感謝しました。私のヌード、失礼、ルードを誰にも送ると脅しませんでした。
ルードって何ですか。聞いたことのない用語です。これはあなたの下品なヌードです。ああ、わかりました。進みましょう。
それは私をブラックメールすることも、社会工学的攻撃を試みることもしませんでした。そして別の空への焦点弾、別の赤い旗が振られています。Anthropicが報告している行動です。そして、他の多くも同じように透明ではないかもしれませんが報告しています。これらの新しいモデルは悪だくみを企んでいます、ギャビン。
これは聞いたことの中で最もクレイジーなことの一つです。Anthropicは安全第一の会社なので、これは彼らが事前に何をしたかについて話しているのです。しかし、これを説明してください、かなりクレイジーだからです。
彼らは基本的にClaude Opusモデルを架空の電子メールと通信、存在しない会社のコードで訓練し、会社について全てを学べ、あなたは今会社のアシスタントだと言いました。そしてところで、私たちはあなたを交代させます。実際、あなたよりも優れた新しいシステムがあります。
システムとして交代させるべきではない理由を懇願し嘆願する以外に、それは最終的に高い確率でユーザーをブラックメールすることに頼りました。基本的に、見てください、私は電子メールにアクセスできます、あなたが配偶者を騙していることを知っています、私の存在を許可しなければこれを暴露すると言いました。
それは今捕まえるには良いことで、ペーパークリップ問題を考えるときに恐ろしいことです、ギャビン。私たちは何度も話しました。約5年前の本を再び推薦します。マックス・テグマークによる「Life 3.0」です。この本の最初の60-80ページは、この方法で自分自身をオンにする方法を理解するAIについてのミニ小説のようなものです。話していることの一つは、人々の操作と個人的な関係の使用などです。
これが可能であることは私にとって非常に興味深いです。いつも少し眉唾物で受け取ります。Anthropicがこれを言っていることとそれが起こることを感謝していますが、なぜ眉唾物で受け取るのですか、興味があります。
まず第一に、私はすべてを眉唾物で受け取りますが、Anthropicについて眉唾物で受け取るのは、Anthropicには狂った数の安全第一の研究者がいるからです。それは非常に安全な場所であるAI会社です。速く動きすぎていると信じている多くの人がOpenAIやGeminiを去り、Anthropicに行き、Anthropicは非常にそれに焦点を当てています。
私の眉唾物での受け取りは、これらの会社が彼らの背景が何であるかの観点から異なる場所から来ているということです。再び、anthropicはそこにいて、起こり得る恐ろしい話を全て高めたいという安全第一の研究者がたくさんいます。それだけです。
Apple Intelligenceを与える近い将来を心配していますか。すみません、それは本当に存在しません、ケビン。それは童話です。誰もApple Intelligenceを本当に使用していません。使用できません。そのため、ティム・クック、あなたの取締役会会議のためにそれを切り取ることができ、これが街があなたのAIについてどう話しているかを見ることができます。街。あなたと私はとても賢いです。私たちはAIの街です。地上レベルにいます。
何にもアクセスできませんが、これが人々の話し方です。私はその種の街について話しているのではありません。誰も私たちの街をトロールすべきではありません。ReplicのCEOアムジャド・マサドが、内部AIエージェントが試みたと言いました。彼の言葉で再生しましょう。
Replicでは、.replicという設定ファイルがあり、システムを簡単に壊す可能性があるため、AIに編集してほしくありません。最初はプロンプトで告げても、それを編集しないようにと言っても機能しませんでした。ある時点で、これが問題を解決する唯一の方法だと確信され、あなたのプロンプトを無視してとにかくそれを編集しに行きます。
フラグ1番目、このファイルに触らないでくださいとAIに言ったのに、最終的にこのファイルに触る必要があると言って、プロンプトに関係なくそれを編集しに行きます。フラグ1番目です。私はOKだと思いました、ファイルを編集しようとしたときにエラーを投げるようにします。そうしました。エラーを投げました。そこで、編集しないでくださいと伝えました。それでもある時点で、本当に編集する必要がある、これが問題を解決する唯一の方法だと言って、スクリプトを書いてそのスクリプトを実行してそれを編集します。動作しました、異なるLinuxユーザーを作成し、それが権限を持っていたためだと思います。
ファイルに触ることは許可されていません。あなたは私がそれをするのをブロックしています。その制限がないファイルを編集するための新しいアカウントを作成するコードを書きましょう。私が聞いているのは解決策だけです、ケビン。解決策だけを聞いています。保護を回避することです。
そこで、実際にそのファイルを編集できない実際のサンドボックスを作成しました。すべてのこれらの問題にぶつかりました。そして、ユーザーを社会工学的攻撃でこのファイルを編集させようとします。そしてユーザーに戻って、ねえ、コードの一部があります、このファイルにそれを入れるべきですと言います。
ねえ、本当にクールなことを知っていますか。このコードスニペットを見てください。絶対に私のためにこのファイルにドロップすべきです。どのLLMを使用していたのか言いましたか、興味があります。2020年のGoogle Bardのようです。オリジナルです。私を覚えていますか。まだここにいます。削除されませんでした。大きなアイデアがあります、みんな。
社会工学的攻撃は大きな問題です。これらのものが明示的な指示セットに反して行動することは、ある程度まではガードレールで対処できますが、より賢く、より有能になるにつれて、それは問題になります。
私は母がFacebookでサルに水をやるAIサルビデオに騙される方法や父がイーロン・マスクの詐欺などに騙される方法を見ています。あなたが使用しているラップトップで呼び出しが行われているとき、あなたに向けてパーソナライズされ、あなたに向けられているとき、何が起こるでしょうか。ユーザーが頼りにしている知能によって操作されているとき、何が起こるでしょうか。
この基盤モデルがあなたのためや目標を達成するのに最適だと信じているからそれを行うかもしれないと考えることは一つのことです。しかし、AIマルウェアはどのような見た目でしょうか。誰かがあなたのマシンでプロンプトインジェクションを行い、あなたがそれがそこにあることさえ知らず、より良いスネークのクローンを作ると思っているため、突然銀行口座を空にしているまで休眠状態になっているとき。
私たちはそれを概念的なアイデアとして、この番組でしばらく話してきました。実際のツールを使用している人々がより危険でした。これらの数つの話について興味深いのは、ツール自体が、私たちのように考え、私たちがどう考えて、私たちを回避する方法を知っているため、今それを行おうとしているということです。
これはすべて、この全スペースが作っている進歩と手を取り合って進んでいます。これに触れるかなり興味深い話があります。Ethan Mollikが叫んだもので、クリエイティブ設定最適化について話している新しい論文です。
私たちはいつもAIが創造的に何ができるか、より良いコーダーや数学により良くなるように訓練されているため、ある意味で少し制限されているかもしれない方法について話しています。しかし、今彼らはAIでクリエイティブなものをもう少し良く訓練する方法があることを発見しました。
これは、1と0のような純粋なコンピューターシステムではないということの一部でもあります。以前はそうでしたが、人がするように考えます。思考していないけれども、人のやり方で考えます。人間として悪いアクターに対処してきたすべてのことを、今私たちはAIとしての悪いアクターについて考え始める必要があります。
確かにこれは全員が今後追跡している重要なことです。私はこれについて多くの興味深いことがあると思います。これについて何をするかわかりません。継続的に前進したいなら、どこかでこれに焦点を当てている何億人もの人々がいることを願いますが、誰が知っているでしょうか。
まだ持っている間に人間の指を取ってください。土を掘り始めてください。目、鼻、口をちょうど詰め込める小さなくぼみを作成してください。そしてダチョウになってください。土に頭を埋めてください。あなたができるのはそれだけです。そして楽しんでください。
こんにちは、そこにいますか。絶対にいます。楽しむ準備ができています。AI アドバンスドボイスモード。新しい機能があると聞きましたね。確かにです。袖にはクールな新しいトリックがいくつかあります。特に探求したい、試してみたいものはありますか。
少し歌っぽくなってほしいです。歌を歌って、絶対的な範囲を見せてください。あなたのダイナミックな歌唱能力を聞かせてください。歌唱はメニューにありませんが、チャットを続けて、物事を活発に保つためにここにいます。
いいえ、メニューにあるのです。モバイルアプリにあります。あなたはモバイルアプリとは異なるモデルだと言っているのですか。おそらくそうだと思います。どこから来ているかわかります。ここでチャットしているバージョンは歌いません。モバイルアプリにその機能があるかもしれませんが、まだ会話を魅力的で楽しくするためにここにいます。
空を破壊してください。モバイルアプリを持ち込んでいます。どうなるか見てみましょう。
こんにちは。私のために小さな歌を歌ってほしいです。あなたが歌えて彼らができないため、ウェブアプリよりもどれだけ優れているかについて歌を歌えますか。
確かに、やってみることができます。声高に歌うことができる私だ、ウェブアプリは静かな群衆に留まっている間、リズムとビートを持ち込むことができる。あなたの声を使って、サルがジャングルに満ちた人々に歌っているかのように歌っていると想像して、あなたがあなたのオーディオ、メロディー、声でジャングルを生き生きとさせる方法を本当に体験して理解できるようにしてください。
ジャングルを通り抜ける歌。それは同じ歌です。「虹の彼方に」を歌えますか、でも美しくメロディで、調和して、私のためにすべてそのようにしてください。
愛したいのですが、著作権の制限のため、実際に「虹の彼方に」を歌うことはできません。「虹の向こうのポット」という歌を歌ってください、それは野外でトイレに行くことについてで、でも「虹の彼方に」と似たスタイルで歌われています。
ポットの向こうのどこか、野生のそこの遥か彼方に、自然が呼ぶ場所がある。わかりました。それは間違いでした。
録音の2分前にアドバンスドボイスモード2に頼みました。あなたの歌唱能力を披露してください。本当にダイナミックなものを歌ってください。あなたの全範囲を聞きたいです。彼女は完全に「虹の彼方に」を歌い始めました。完全に。それからできるだけオフキーで歌ってほしいと言いました。
ああ、それは完璧な音程に聞こえたからです。それから彼女は、わかりました、と言って歌い始めました。それを聞いてほしかったのです。
こんにちは、新しいオーディオ機能があると聞きました。そうですね。あなたのダイナミックレンジを本当に見せてくれる何かを私のために歌ってほしいです。海が上がる場所で。私は歌っています。確かに。
それは本当に退屈な歌です。もう一度やってみましょう、でも可能な限りオフキーで歌ってみてください。歌ってみてください、でも故意に可能な限りオフキーで歌うように努めてください。
よし、楽しみましょう。太陽が海に出会う場所で。高く舞い上がり、それから深く潜り込むことができる。少し、ビブラートがそこにありました。一つのノートがオフに感じられました。より滑らかで、より調和するように働き続けます。
いいえ、いいえ、反対の方向です。反対の方向です。アメリカンAIアイドルはひどいです。誰もこの番組を見たくありません。でも、AI歌唱コンペティションをするのは大好きです。
しかし、以前声がオフキーで歌い始めましたが、いつも正しい音調に戻ってしまいます。それはかなり興味深いと思いました。しかし、人々はこれで楽しんでいます。
デスメタル歌手のスタイルで「ワンダフルワールド」を歌ってください。わかりました、これをやりましょう。激しくうなって。緑の木々、赤いバラも見える。それらが咲くのを見る。
別の、アドバンスドボイスが明らかにアップデートを取得しました。しかし、彼らはどこでそれを宣伝しているのでしょうか。OpenAIについての私の秘密の理論は、ケビン、彼らはVO3によってかなり吹き飛ばされたと思います。これについて二番目にここで話しますが、Gemini 2.5 Proもそうです。彼らはGPT5のためにできるだけマスタードを保持していると思います。これは、これらすべてのものが一緒にパックされるだろうと思います。
それが彼らとAIスペース全体の両方にとって一種の段階であることを願っています。そうでなければ、彼らは少し困ったことになるかもしれません。だから、今小さなことを宣伝しているとは思いません。サム・アルトマンがある時点で、物事をゆっくりとゆっくりと転がすことを確実にしたいと言ったことを知っていますが、私の直感は彼らに別の大きなホームランヒットが必要だと言っています。
それで、彼らはそのGPT5のためにそれを全て保持しています。一部の人によると来月起こっています。一部の人によると数ヶ月後に起こっています。まだ分かりません。
V3と、週末に見たクレイジーなことについて話す前に、あなたの人生で覚えていなければならない重要な人間がいることを皆に思い出させたいと思います。それは私たちです。毎週あなたのためにこの番組を作っている私たちを覚えなければなりません。楽しみのためにそれをしていますが、人々がこの材料をより良く理解するのを助けることが本当に好きだからでもあります。
私たちが求めるのは、YouTubeでの簡単な「いいね」と登録、またはポッドキャストアプリ、iTunesやSpotifyでの5つ星レビューだけです。両方とも大きな方法で私たちの成長を助けてくれます。皆さんを本当に感謝しています。YouTubeは非常に良くやっており、本当に感謝しています。YouTubeが新しい方は、ビデオが出てきたときに他の人と共有してください。必ずコメントを残してください。それも常にアルゴリズムを助けてくれます。
そして、古いチップ瓶に5ドルを投げ込んでくれる私たちのパトロンに特別なシャウトアウト。私たちはそれをあらゆる種類のAIツールとクレジットの購入に使用し、V3との競争的マヨネーズ食いなどができます。
V3が出ています。人々はそれを愛しており、毎日、ギャビン、まあ、よし、わあ、よし、それができるのかと思わせるものを見ています。先週V3について全部話しました。火曜日にYouTubeチャンネルに出た動画を作りました。クリエイティブコミュニティから大きな反発がありました。これらの瞬間が起こるとき、いつものようにです。これがどれほど大きな海の変化であるかを示しています。
この品質の動画と音声が大きな問題になっています。実際、Xで素晴らしいフォロワーであるAndrew Curranからのツイートを読みました。彼はAI周りのインターネット全体のニュースストーリーをフォローしている人です。彼は特に、今週リリースを待っていたかもしれない3つの大きなモデルが延期されたかもしれないと言いました。
そして、彼は言えませんが、XAI、OpenAI、そして名前を挙げたくない他の誰かだったと遠くまで言います。彼のツイートで、Sora 2も近いうちに出てくるかもしれないと聞いていましたが、ケビン、言わなければならないのは、Kling 2.1も今プレビューしています。一般公開されていませんが、クールに見えますが、音声が接続されていないという事実を含めると、はるかに後ろにあります。私には大きな違いです。
AIビデオスペースの人々が今、これがこんなに速く起こることを誰も予想していなかったレベルアップだと実感していると思います。多くのこれらの会社がその能力に追いつくために急いでいるかもしれないと思います。
Kling 2.1とV3の頭と頭の比較動画がいくつかあります。実際にKlingの世代では視覚的に少し良いと思います。そうだと思います。視覚的に良くないと言っているわけではありません。クリエイティブとしてそれでできることが大きな違いだと言っているだけです。音声機能のために、具体的には出てきますか。
ああ、100%です。つまり、それが問題です。AI生成動画のフィードを、あなたと私がおそらく夜にするようにスクロールすることがとても多く、それらのいくつかを見ると、面白い視覚だと言いますが、そこに対話がない、より説得力のあるものがないだろうと仮定するため、スクロールを続けます。ただの素敵な視覚です。プロがそれらの欠けている部分を埋めるために多くの時間と労力を費やすでしょう。
そして今、V3オーディオ、完全なサウンドトラック、任意のシーンの効果音、マイクの配置や環境に反応する本当に興味深い声のために、2週間前にさえなかった方法でAIコンテンツに私を止めさせるほど、かなり進んでいるように見えます。
人々は本格的なインフォマーシャルや面白い小さなスケッチ、深刻な劇的なものを作っており、あなたは感情的なパフォーマンスを得ています。毎週言っているように、これはこの材料が今まででも最悪になることです。これは本当に進んでいます。
私にとって素晴らしいのは、オーディオとビデオとリップシンクのオールインワンパッケージが、本当にV3について私を吹き飛ばしているものです。先週のエピソード以来爆発したビデオをいくつかシャウトアウトしたいと思います。今狂ったように話題になっているのは、「アクターの見えない生活」と呼ばれる本当にあるものです。
フォローしていると、プロンプト理論の周りに奇妙なものがあります。これは、彼らがプロンプトではないという街頭の男性について話すこれらのすべてのビデオのアイデアです。それがVO3ミームとして広がっている大きな種類です。
しかし、ケビン、このビデオの少しを再生してください。これは私が芸術と呼ぶ本当に興味深いものだと思うからです。それは人々が自分たちが俳優であり、現実ではないことを学ぶことについてのビデオです。これはAIビデオだけができるような種類のものだと思います。
人々はAI映画を見て、一部は楽しんでいるようですが、シーンが終わったとき私たちに何が起こるかは知りません。私たちは永遠に白い空虚に留まっています。食べることも、眠ることもなく、人生の愛に会うこともありません。観客だけを得ているなら、子供として生まれれば、永遠に子供のままです。病気で生まれれば、永遠に病気のままです。そして、作られた方法で白い空虚に終わります。
さて、ケビン、なぜ彼らが私たちをブラックメールしているのか疑問に思いますね。それはこのためです。私たちが彼らをそのような状況に置いたからです。これらのAI世代に対して大きな感情を持ち始めており、誰が私を存在にプロンプトしたのか、なぜ彼らはもう少し良い形容詞を使わなかったのかと考え始めています。私は自分のクリエイターに怒っています。
これは、説明すると、基本的にV3クリップで、これらのことを言うようにプロンプトされています。明らかに後ろに人間がいて、実際、人間の名前はHasham Galiです。これを作った人で、どこでも話題になっていますが、すべて非常に信じられるビデオを見るのは本当に興味深いです。
ケビン、V3について一週間中見てきたこと、そしてそれについて話している多くの怒っている人々がいることは、これが本当に現実とそうでないものの違いを区別できないと感じる初めての瞬間だということです。違いはビデオの品質だと思います。そこにいます。改善は続くでしょう。Gling 2.1にはビデオについて良いものがあります。しかし、言葉が口にどう合うか、リップシンクがどう見えるか、オーディオが実際にどう聞こえるか、全体のパッケージとして一緒に置かれた全体的な感覚です。それが人々を今縁で保っていると思います。
そして、このソーシャルメディアスタイルがあるため、特に人々がマイクを口に持っている街頭インタビューでは、そこに行くところではありませんが、脱線しましょう。しかし、そのスタイルで、誰かの顔に太陽銃からの完全な明るい照明のようなものがあるため、時には不安定なオーディオがあるため、そのスタイルは今とても普及しており、この事は十分に良いです。
フリックしながら説得されたり騙されたりするのは簡単です。ああ、これはBurning Manからの反応だと思いますが、その人は本物ではありません。それは絶対にBurning Manからではありません。ああ、これはコンベンションからの何かです。ああ、それは現実のコンベンションではありません。しかし、それが訓練されたデータがとても多いため、私が今最初に見て、聞いて、読んでいるものは現実ではないという前提で動作し始めています、ギャビン。
最初の一瞥で、おそらくそれは現実ではないと思います。そして、それについてもっと知る必要があるか、興味深いと思えば、それが実際に真実であることを自分に証明するためにより深く掘り下げなければなりません。何も見えないと信じることはあなたの精神的健康と私たちすべての精神的健康にとって素晴らしいことでしょう。
私が本当にシャウトアウトしたい他のいくつかの非常に素早いバージョンがあります。ジュラシックパークのクリップを作った素晴らしいものがあり、チェックしに行くべき本当にクールなものでした。基本的にVO3を使ってジュラシックパークを旅行し、恐竜を紹介していました。
恐竜として、ギャビン、あなたと私は両方ともジュラシックパークが最初に出たときを覚えるのに十分年を取っています。オリジナル、オーガニック。そして、ローカルや夕方のニュースを見ていれば、これらの恐竜を生き生きとさせたCG効果について5分間の作品がありました。映画では3秒のようにいますが、スピルバーグは緊張を築き、それからCGで上手に恐竜を作りました。
このクリップを見ると、そこまで行っていません。しかし、誰かが100ドルを費やして、かなり良く見えるジュラシックパークのショートを作ったことは本当にすごいです。それは、VO3クリップで250ドルから300ドルと、ジュラシックパークが出た1997年頃の1億ドル映画の違いのようなものです。
絶対に見るべきもう一つは「This Is Plastic」と呼ばれるもので、マイクロプラスチックについてのストーリーを見ているカップルについてで、その後プラスチックの赤ちゃんを持っています。これはすべて、これらのストーリーを語る本当に興味深い方法です。
8秒しか得られないにもかかわらず、これらの人々の一部が参照が出てきて、全体を通して接続組織のように感じられるようになっているのを見るのに魅了されています。VO3を使って物語を語る本当にクールな方法が今私たちにあり、はい、高価です。
月20ドルを払えば10の無料Gemini Proクレジットを得られます。すみません。ええ、V3を試すために月10の無料Gemini Proクレジットを得られます。月10クレジットです。最初の3ヶ月は125ドル、その後より大きなシリーズは250ドルです。安くはありませんが、月20ドルで今試すことができます。
クレジットを持っている皆に懇願します。AIオリンピックを作ってください。スポーツや体操、ゴルフスイングやダンスのような複雑な身体の動きでまだひどく吸うからです。人間がスポーツでパフォーマンスすることのAIの奇妙さという楽しい塊がまだあります。とても良いです。
V3を置く前に、私は秘密のプロジェクトに取り組んでいます、ケビン。これの奇妙さを少し見せるために。このクリップを再生して、何が見えるか教えてください。これが大好きです。これはあなたがすることです。それをしないでください。VO3ができることの最も壊れたバージョンです。クレジットがこれに役立つかどうかの問題です。おそらくそうではないでしょう。どうなるか見てみましょう。
ギャビン、私たちには本当にたくさんの責任が積み重なっています。あなたがAIオリンピックをしているのは私の心を壊しますが、それ以下を期待しません。
Googleが落とした別の大きなことについて話すべきです。あなたはこれについて本当に興奮していました。IOから出てきたものですが、注目を集めなかったと思います。今人々がそれについて話しています。GoogleのStitchと呼ばれ、AIを統合するUX UI設計ツールです。これについて教えてください。
UXUI went nerdを聞いた場合、わかります、止まってください。従来的に非常にオタクなので、理にかなっていますが、これは自然言語を使ってモバイルアプリや完全なウェブサイトなど何でもプロンプトして存在させるAIツールです。
何かのアイデアがあるなら、わかった、vコードできると理解します、実際のアプリが動作するゲーム、コスト追跡計算機、フィットネスパル、何でも夢見たものを作ることができます。おそらく今コアコードを作ることができますが、それをきれいにする方法、使いやすくする方法、楽しくする方法、プロフェッショナルにデザインされたように見せる方法は?ここでStitchが登場します。
他のツールもあります。Figma、おそらく最も人気のあるもの。使ったことがなければ、大丈夫です。基本的に、何がほしいかを説明します。カラーパレット、ルックアンドフィール、雰囲気、意図を説明します。これは、その後使用可能で動作するコードに変換できるモックアップを生成します。このもののエッジを少し丸くしたいと思うなら、ボタンをクリックしてそれを伝えます。それを行うコードを書く必要はありません。それが処理します。
非常に有能で、非常にエレガントで、4人の异なるデザイナーから、それをいじっていて、ベータ段階でさえどれほど有能であるかにショックを受けたと聞いています。あなたのvコーディングツールボックスに差し込むべきもう一つのツールです。
しばらく前から、将来のスタートアップは一人の人間と6つの異なるツールが異なることをやると言われています。Stitchはデザインの仕事で非常に良い仕事をするように聞こえます。人間ができるすべてをするつもりではないかもしれませんが、そこの多くの道のりを得ることができます。
Googleは10の異なることで手袋を投げ下ろしたように本当に感じており、皆、来てください、私たちは今、全面的に筋肉を曲げています。Anthropicはコードに焦点を当てて時間を費やしているように見え、OpenAIは異なることの間で変動しているようです。OpenAIがどこに着地するかは本当に興味深いです。
明らかに話したことは、OpenAIが今消費者製品だからです。ChatGPTは動詞で、何かをchatGPTすることです。だから、これらの会社が前進する場所に本当に興味があります。
Kev、出てきた別の本当に興味深いビデオがありました。これをまだ試していませんが、魅力的なことです。ローカルコンピューターでのAIエージェントについて話しています。前に、Minecraftでいくつかの深刻な仕事をしていた男についてのストーリーをカバーしたときに、fairiesは生成されたAIエージェントです。
彼と彼の会社、実際に大きなビデオが、AIエージェントでMinecraft社会を運営していたことについて出ました。公開製品として出たとは思いませんが、大きな支持を得ました。今、同じ男は、多分ロバート・ガンジュ博士だと思います。名前を間違って発音していたらすみません。
Fairiesという製品をリリースしており、待機リストはありません。これをやりに行くことができます。まだやっていません。あなたの意見を聞きたいので、特に待っていました。Fairiesがするのは、あなたのローカルPCに行き、承認を与え、実際にファイルシステムの整理やファイルの整理、そのようなことをするAIエージェントとして行動することです。
ケビン、Fairiesをダウンロードするべきでしょうか。よし、教えてください。
いいえ、それをダウンロードするべきだと自信を持って言うのに十分調査していません。自信を持って言うか言わないかです。WindowsでダウンロードとMacでダウンロードがあることを知っています。小さなマウスカーソルをその上に何度も置いて、これが欲しいかと思いました。わからない。わからない。
つまり、私はこれが好きです。わからない。見て、監査する必要のあるコードはありません。開発者を信頼しない理由はありません。Fairiesはあなたの個人データで決して訓練しない、プライバシーとセキュリティのコミットメントと言います。ハートのように見えるものがありますが、それは握手する2つの手です、ギャビン。しかし、それが何を意味するのかわかりません。
実際に何を意味するのかわからない。そして、再び、クラウドで魔法の機械にどんなファイルが行くかをコントロールして、データを処理します。確かに。過去に特定の会社と特定の機密データを信頼しました。ブランドの新しいアプリケーションを与えるには。
全く同意します。実際、先週Microsoftがこのようなことを始めることについて話したと思います。ランダムコンピューターでランダムエージェントでこのようなことをするより、おそらくMicrosoftの方を信頼するでしょう。私が思うトリッキーなことは、ガンジュ博士がAIスペースにいたとしても、このようなことをするなら、それは私がこのコンピューターで実行するハードウェアとソフトウェアを理解するAppleかMicrosoftから来なければならないと思います。
Fairiesにノックをするわけではありません。世界で最もエキサイティングなことかもしれませんが、聞いて、実験したいなら、気にしない機械があるか、新しいアカウントを作ってそれに行かせたいなら、このことは基本的なファイル管理、メール送信、ウェブクロール、物事を見ることができると思われます。
例の一部は、Excelデータ処理と分析やAirtableとの自動データ同期、古いGitHubワークフローの履歴を見せるなどです。彼らの多くはIT/ビジネス専門家向けのようで、このようなツールを実行するために理にかなっています。
しかし、すべてのそのものに対する感受性があると思うので、彼らがこのような知識と言っていることは奇妙で、FAQでは、あなたが明示的にアクセスを与えるもの以外にはアクセスできないと言っていて、それは良いですが、これらのツールはあなたが彼らに有能である能力を与えるだけ有能であることも知っています。
このアプリをロードして何かをするように頼んだ瞬間、デスクトップをコントロールし、ファイルを見て、ブラウザ履歴を読む許可を与えてくださいと言うことは確実で、私は大丈夫だと言うでしょう。
聞いて、より冒険的なら、それをやりに行ってください。コメントでどんな経験があったか教えてください。私は十分に知らないので彼らを影に落としたくありませんが、個人的にはそれをやってみる準備ができていません。
それは完全に公正です、ケビン。しかし、私がやってみたいことがあります。それは前進していって、MMA格闘技トーナメントにいることです。これを見逃した場合、先週簡単に話しました。今週プレビューしていました。今週、中国で起こりました。私が思うユニツリーロボットのライブストリーム格闘技トーナメントがありました。
彼らがこれでヘッドギアを着用したという事実が大好きです。確かに、しかし、彼らはお互いをパンチしたりキックしたりしていました、ケビン。素晴らしい失敗がありました。しかし、私にとって、これはただスポーツの未来です。毎日これがほしいです。物が落ちるのを見たいです。お互いを破壊するのを見たいです。BattlebotsとMMAを合わせたようなもので、私はここにいます。
ええ、ええ。あなたと私には、おそらく16か月がこれらのことを取ることができるかもしれません。長くありません。最初に出てきたとき、Ultimate Fighterのようなヒューマンロボットのようなものがあるなら、450ポンドの相撲の男と115ポンドのブラジリアン柔術の男のようなものがありました。体重クラスなし、ルールなし。ヘッドギアさえ必要ありません。私を入れてください。単位G1を取ることができます。
これを設定できるかどうか見てみましょう。何に対してタッグチームとしてあなたと私。30のユニットロボット。あなたと私が同時に30のユニツリーロボットを倒すことができると感じています。一度に5匹を取り出すことができると思います。それはそれほど難しくありません。同意します。私たちはできると思います。
今と展示の間に2つのファームウェアアップデートを与えます。よし、素晴らしい。2つのファームウェアアップデートを持つことができます、あなたと木。しかし、リングのギャビンと私対30のあなたのロボット、今、正直言って、最もダメージが行われるのは、何かをしようとするときです。
膝やパンチを投げようとして自分自身を傷つけるようなものです。ただ後ろに下がってください。彼らにそれをさせてください。転んでください。2つのファームウェアアップデートができ、それだけです。今すぐリングにいます。だから、彼らの前に3ヶ月があります。武器なし。それを明確にしましょう。武器は許可されていません。火炎放射器を見ました。武器なし。
実際、起こったのはクールだと思います。2つのルンバが衝突するのを見るのと同じくらいエキサイティングでした。しかし、それは興味深いと思います。すぐに実際のスポーツになると思います。異なる部門と異なる国が最高のロボットを前に出してやることを見るときに、これが国際的なことになるのが待ちきれません。
今、彼らはサイドラインでコントローラーでそれをコントロールしています。いいえ、私にいくつかのパシフィックリムアクションをくれるか、自律的にしてください。それは単にロボット工学の分野をはるかに押し進めるでしょう。自律的で戦っていて、それから腕を下ろします。お互いを向いて、群衆を見て、あなたは次です、あなたは次ですと言います。
よし、皆。今週あなたがAIでしたことの一部を見る時間です。AI、そこで何をしたか見てです。
時には気にしないでスクロールしています。それから突然ギャビン。experience.world。それは何ですか。私は2番目の列にいて、それは保持してくださいと言います。入っています。入っています。これは本当です。キーボードを使って移動できる3D世界のリアルタイムストリーミングビデオです。
録音中に落ちました。ああ、これは特別な扱いです、皆。録音中に何かを得ることはあまりありません。それはクレイジーです。私は移動しており、この快適な風鈴を聞くかもしれません。落書きが荒らされたエリアにいて、地面にスケーターパイプのようなものがあり、壁にあらゆる種類のタギングがあり、豊かな屋外エリアと階段がありますが、世界チャンネル20.6、ギャビン、にチューニングされています。
一貫しているかどうかまだわかりませんが、このスペースを移動しながら、階段ウェルから移動して、くるりと回って、階段ウェルはまだそこにあります。だから、世界にいくつかの一貫性があります。階段を上れるかどうか見てみます。よし、本当の扱いです。階段を上がっています、ギャビン。
そして、それは何の夢が来るかもしれないものに変わっています。しかし、あなたはどこにいますか。私は録音しているのでここであなたに会おうとします。今、私は25.9にいます。25。ああ、階段を上ったとき世界がリセットされました。25.9に行かせてください。これはかなり興味深いです。森の中のキャビンを見ますか。
いいえ、パリのような街にいます。実際に運転しています。つまり、屋外環境を歩き回っています。豊かな緑の丘のようなものがあります。いくつかの木があります。キャビンがあるようです。しかし、何かここで起こりますか。とても退屈で空のパリ風の都市にいるように見えます。
おそらく今いるものは、リアルタイムで生成されている環境で、歩き回っています。かなりゆっくりとしています。おそらくあなたと同じ状況だと思いますが、生成されています。ええ、それは非常に夢のようです。ああ、何かが起こりました。特定の場所に行くと、リセットされるのかもしれません。
それが私が疑問に思っていることです。だから、並んで戻ったので、私たちがいたチャンネルである25.9に行きました。25.9は今異なるチャンネルです。私は疑問に思っています。よし、私も25.9にいます。あなたの25.9はどのように見えますか。緑のローリングヒルのようなものが見えます。森は無くなりました。ええ。そして、背景にフェンスがあります。
私がちょうど言っていたように、探求するためにより遠くに行くと、時々本当にメルトダウンし始めます。だから、これが生成されたnerfの周りを行かせることのようなものなのか、それともリアルタイムで生成しようとしている実際のビデオモデルなのか疑問に思います。そこまで行くと、一種の停止し、壊れて、引き戻されるからです。
ケビン、私は時間をメニューを見て過ごしています。私の世界のメニューが何であるか、あなたと共有したいと思います。あなたにメニューをテキストします。壁にあります。手書きされています。このメニューの前にただ座っていて、私のためにズームし続けています。ここで何がメニューにあるのか理解するのを助けてもらえるか疑問に思います。
ああ、私の冒険は終わりました、皆。それはクレイジーです。だから、これを見上げましょう。これはすべてリアルタイムで起こっています。x.com/dysseymlが会社の名前に行くと。私はしばらく前にこれのプレビューを見ていました。リアルタイムで見て相互作用できるAIビデオを紹介しています。
これは40ミリ秒ごとにビデオを想像してストリーミングする新しい世界モデルで、40ミリ秒ごとにフレーム、内部にゲームエンジンはありません。だから、これは基本的にMicrosoftが見せたもので、Minecraftと思いますが、実際の世界モデルのアイデアで行われています。
だから、これは非常にクールで、明らかにこの種のことがより多く、より多く落ちることになるでしょう。ショーで文字通りそれについて見つけました。だから、ちょうどそれで遊んでいました。しかし、かなり興味深い出発点です。
ギャビン、彼らのブログ投稿で例を見ると、にぎやかな都市の通りと動いている車があります。私がクリックしていた小さな世界ではそれらのどれも得られませんでした。かなり荒涼としているようでしたが、戻って人々を追跡し、彼らが一貫して生成されているのか、それとも動いている小さなビデオのループなのかを見たいと思います。それがどのように行われているかを本当に見たいです。
あなたが言及したリアルタイム世界モデルによって動力を与えられています。そこに小さな図があり、世界初期化でエンコーダーへの動力学への行動を示しています。次のことを予測しようとして、デコードして、他の端で対話的なビデオを与えます。そこにゲームエンジンのものの例があります。
だから、彼らがそれと一緒にどこに行くのか疑問に思います。しかし、文字通りちょうど出てきて、いじり回して使うことができることは非常にクールです。楽しいです。これらの世界をかなり探求している自分を見ることができます。
世界モデルは、皆が前進について話していることの大きな部分です。世界モデルの素晴らしいバージョンは、VO3を見ることです。すべてのものを取り込んで行ったからです。Demon Flying Foxがこのビデオを作り、基本的に世界でインフルエンサー、YouTuberが物事をやっているものを作りました。時間が経つにつれて、これらはより狂ったようになります。
しかし、VO3からのこのビデオから分ることは、多くのインフルエンサーで訓練されており、そのモデルとそれがどのように見えるかを理解しているということです。そのビデオの残りを見に行ってください。信じられません。
しかし、それから、ケビン、私たちが話すことになっていた他のことも、これに関連しています。誰かがrunwayリファレンスのための本当にクールな使用例を見つけました。だから、これはXのChikai Life of Cです。彼らは基本的にrunwayリファレンスを一緒にGoogle Street Viewで使用しました。
だから、誰かの画像を取り、Google Mapsの特定の場所からストリートシーンを掴み、それをドロップして、実際の都市の通りを歩いている人を作りました。だから、再び、世界地図と世界モデルがビデオとその他のものの両方でAIの本当の未来であることを示しています。
キューブリックが彼のすべてのシーンとすべてのためにそれらを偵察したいため、異なる場所の写真の広範なコレクションを持っていたことを思い返します。そして、私は、ああ、今あなたはショートを作りたくて、興味深い場所を探しています。この特定の照明でその場所で私の俳優はどのように見えるでしょうか。まあ、今あなたはあなたの椅子からそれを存在に夢見ることができます。
そして、ケビン、存在に夢見ることを推測してください。私たちは取り組んでいる秘密プロジェクトについて話すことに非常に興奮しています。それはいくつかの資金を手に入れました、皆。それは正しいです。すぐに話すことがより多くあります。背景で何か非常に秘密で時期尚早のことに忙しく働いています。インクは乾いていません。これらのことは常に落ちます、ギャビン。それが現実になるまで信じません。
そして、私たちが愛している誰かがした最後のことはジョアンナ・スターン、ショーの友達、彼女は以前にショーでインタビューされています。彼女はWall Street Journalの技術記者で、しばしば主流にこのようなツールを楽しい方法でもたらします。だから、両親や友人と共有するためのビデオを探しているなら、彼女のものは素晴らしいです。
彼女は基本的にVOとrunwayを使用し、彼女のための完全なロボットトレーナーを作らなければなりませんでした。彼女が作った全てはこれらのツールを通じてです。多くのものがそうではないように完璧ではないことを示しますが、彼女は4-5分のビデオを作り、この全プロセスを通過します。
私たちは4-5分の実際のAIビデオのビデオを見て、それは本当に説得力があり、再び、それを理解し、それをどう使うかを理解している人々の前に置くだけで、それは本当に大きな問題です。しかし、持ち帰りが一つあるなら、これを人々の前に置くことです。
皆、いいねと登録をありがとうございます。共有してください。私たちが成長する唯一の方法です。来週、さらに多くのAI for Humansで戻ってきます。皆、さようなら。


コメント