OpenAIがスーパーインテリジェンス(ASI)への準備を開始、その他のAIニュース

18,512 文字

OpenAI Starts Prepping For Super Intelligence (ASI) & More AI News

OpenAI preps for Artificial Super Intelligence, Sam Altman says fast takeoff is likely, Luma Labs’ Ray 2 AI video model ...

OpenAIが新たな経済設計図を掲げ、スーパーインテリジェンスへの地固めを始めました。国防から国際的な資金調達まで、そしてOpenAIによる次世代知能への電力供給計画まで。そう、より多くのスーパーAIがより多くの電力を使用するという、AIのサイクルについて語っていきます。また、Luma Labsの新しいAIビデオモデルや、RedditのGPT、そして、ある女性がフランス版ブラッド・ピットが病院のベッドからメッセージを送っていると思い込んでしまった話題についても触れていきましょう。
ケビン、今週の大きなニュースはOpenAIが発表した「経済設計図」についてです。そう、またOpenAIのブログ投稿ですね。私たちはSam Altmanがキーボードを叩くたびにワクワクしてしまいます。今回彼らが示したのは、とても興味深い内容でした。
指を動かして…私は、あなたが指なし手袋をホルスターのように腰に下げていて、そこに指を収納しているような姿を想像してしまいます。Sam Altmanがそうしているわけではありませんが、そう想像すると彼の方がずっとクールに見えますよね。
このドキュメントは基本的に、スーパーインテリジェントAIへの基盤を築くものです。ちょっと説明させてください。アミカ、これは非常にアメリカ的な文書で、アメリカの人工知能支配のための設計図といえます。
このドキュメントが出てきた理由ですが、ここ数週間番組でも話してきたように、AIの進歩が加速しているという話題が、それが事実かどうかは別として、非常に注目を集めています。OpenAIが公開はしていないものの披露したGPT-3.5に関して、多くの人々がAIの進歩が非常に速くなる可能性があると考え始めました。なぜなら、GPT-3.5からGPT-4への進歩は6ヶ月ほどで達成されたわけですが、その進歩は大きなものだったからです。そして今年中にGPT-4.5や5.0が登場する可能性も十分にあります。
この文書について、何が書かれているのか、なぜ公開されたのかを説明していきましょう。まず、なぜ公開されたのかというと、かなり明白です。彼らは自分たちを地球のAIの偉大な管理者として位置付けようとしています。これはSam Altmanが望んでいた立場です。
聞いてください、私たちは単なるパターンを認識する機械、つまり儚い肉の塊に過ぎませんが、すぐにこう言いました。「スパイダーセンスが働いている。以前にも似たような場面があった」と。それは約20年前、Dean Kamenらが「都市計画者の皆さん、準備してください。道路を掘り返して、既存のインフラを全て取り払う必要が出てきます。なぜなら、まもなく何かが発表されるからです」と言っていた時のことです。それはセグウェイでした。
この製品は世界中の観光地で素晴らしい体験を提供していますし、確かに世界を変えました。北極圏でも人々を移動させることができるようになりました。ただし、利用者が誤って縁石から落ちたり、自己バランス機能を信じすぎて全速力で進んでしまったりすることもありました。
この文書は少し大げさかもしれませんが、彼らは来たるスーパーインテリジェンスの波を、私たちが自動車のために全国的なインフラを整備したのと同じように、国として準備し、結集する必要があると説いています。規制を緩和し、OpenAIのために道を切り開く必要があるということです。
この文書で述べられている5つの主要なポイントを見ていきましょう。
1つ目は、AIインフラへの戦略的投資です。これは、データセンター、チップ製造施設、電力施設などへの大規模な投資を意味します。
2つ目は、常識的な規制の確立です。OpenAIは、革新を促進しながら公共の安全を守る方法を見出す必要があると主張しています。これらの主張は以前にも聞いたことがありますね。
3つ目は国家安全保障の強化です。政府内の多くの人々がこれについて考えており、番組でも話してきたように、OpenAIは政府との関係をますます深めています。実際、今週新たに発表された取締役会メンバーはBlackRockの人物です。陰謀論的なTikTokを見ている人なら誰でも知っているように、BlackRockは政府関連を含む、あらゆるところに手を伸ばしています。
4つ目は、AIへの公平なアクセスの促進です。彼らは、スーパーインテリジェンスが実現した場合、誰もが平等にアクセスできるようにしたいと考えています。
最後に、これはOpenAIにとって最も重要かもしれませんが、グローバルなAI投資の誘致です。文書の中でOpenAIは、世界中でAIプロジェクトに1,750億ドルの資金が用意されており、アメリカがその資金を他国ではなく引き寄せる必要があると具体的に述べています。
つまり、これは一種の宣伝文書です。AIがどこまで発展する可能性があるかについての宣伝です。結局のところ、この文書は、現在リーダーの立場にある企業が、その分野でのリーダーシップを主張しようとしているように見えます。ケビン、もし数年以内にスーパーインテリジェンスが実現した場合、このような要素を全て結集できれば、GoogleやMetaなどの企業に対して大きなアドバンテージになると思いますか？
私たちは毎週このスペースをカバーしていますが、この国には不利な点もあります。例えば、誰に聞くかによりますが、現在のニーズにも十分対応できていない電力網があります。では、突然それが指数関数的に必要になったらどうなるでしょうか？
チップ製造についても、確かにこの国でも生産を増やしています。それは素晴らしいことですが、スーパーインテリジェンスには新しいチップが必要になるでしょう。あなたが挙げた柱を見ると、国家安全保障を含め、全ての面で、今持っているとされるリードを維持したいのなら、国として本当に大きな決断をしなければならないでしょう。
興味深い点を付け加えると、多くの人が知っているように、今週末にアメリカでTikTokが使えなくなる可能性があります。その理由は、子供たちがskibbyのトイレ系コンテンツを見ることを防ぐだけではありません。それも理由の一つですが、より大きな理由は、TikTokが中国企業によって所有されているということです。
これは、アルゴリズムとテクノロジーを巡る冷戦の始まりといえます。あなたもチップの話を挙げましたが、世界のチップの大部分は台湾で生産されており、台湾は中国と非常に近く、また論争の的となる関係にあります。これは大きな問題であり、最高レベルの人々が真剣に考えている問題です。
ケビン、バイデン大統領は任期終了に向けて、いくつかの大統領令を出しました。その一つは、ギガワット級の発電所の建設を容易にするもので、このような施設に電力を供給できるようにするためです。また、新しいチップ法も興味深いものです。これは特定の国へのチップ販売を制限するもので、実際、特定の国に対する3つの異なる指定があり、中国とロシアは最低ランクに位置付けられています。ティア3、最高級のチップは手に入れられませんね。
私たちは以前から、これが国家安全保障の議論になるだろうと警告してきましたが、その時が来たのです。これはOpenAIが先頭に立とうとしている動きの始まりです。
Sam Altmanの興味深い発言がありました。この週、Adam Grantのポッドキャストで話していたので、その短いクリップを再生してみましょう。
「AIについて最近考え直したこと、または意見を変えたことは何ですか？」
「数年前に比べて、急速な進展の可能性が高いと考えるようになりました。どのくらい速いかは判断が難しいですが、10年ではなく、数年単位で起こり得ると考えています」
「AIへの適応について、人々が受ける最悪のアドバイスは何だと思いますか？」
「AIは壁にぶつかっているという考えです。これは考えることを避け、目を背けるための最も怠惰な方法だと思います」
まさにSamがF-wordを使うほど、明らかにストレスを感じているようです。
ケビン、この「急速な進展」について、番組を初めて見る人のために簡単に説明しましょう。「緩やかな進展」と「急速な進展」という考え方があります。緩やかな進展とは、徐々に進歩が積み重なり、おそらく10年から20年でスーパーAIに到達するというものです。一方、急速な進展は、スーパーインテリジェンスへのホッケースティック型の上昇を意味します。
長い間、人々は急速な進展の考えを懸念してきました。なぜなら、突然何が起こっているのか理解できなくなる可能性があるからです。Samがここで言及しているのは、彼自身の立場からの発言であることを忘れてはいけませんが、GPT-4の推論モデルで彼らが見たものと、それがどれほど急速にスケールアップしているかを考えると、数年以内に急速な進展が起こる可能性があるということです。
彼がそう言う時、本当の意味でのスーパーインテリジェンスについて話しているのです。なぜなら、多くの人が考えるAGI（汎用人工知能）はそれよりも早く実現するという議論があるからです。
ケビン、これは奇妙な世界です。Sam Altmanが、電力網が整っていない、チップの生産も世界的に不足している、という状況の中で、急速な進展の可能性が高まったと言っているのは、考えるのが難しい状況です。これらの問題が適切に解決されない限り、どうやって急速な進展が起こるのでしょうか？
もしかしたら、私がアメリカの視点からだけ見ているのかもしれません。他の国々はこれらの問題を解決し、必要なリソースを整えているかもしれません。これらの話を同時に聞くのは難しいですね。バイデン政権が「みなさん、協力して電力使用の問題を解決する必要があります。なぜなら、この技術は明日にも爆発的に発展する可能性があるからです」と言っているのを聞くと…
そして政府は機能不全ですよね。ほとんどの人が同意できる点の一つは、政府が理想的には機能していないということです。つまり、もう一つの側面として、技術は進歩するかもしれませんが、人類の進歩が追いつかず、それに対応する力を持てない可能性があるという現実的な議論があります。
速度という点について、全ての人が理解しておくべき重要なことがあります。これが一般の人々に影響を与えるまでには、まだかなりの時間がかかるかもしれません。この影響を過度に強調したくはありません。私たちの世界が変化するまでに、5年、10年、20年かかるかもしれません。しかし、その変化が訪れる可能性は確実にあり、それが重要なポイントだと思います。
ケビンが言及したように、OpenAIはこれを自動車の登場になぞらえました。自動車は私たちの移動方法を変えましたが、これはそれ以上のものになる可能性があります。なぜなら、自動車は単なる私たちが使用するツールでしたが、これは必ずしも私たちの新しいバージョンではないからです。
ケビン、速度という観点から、最近の動きで示されたいくつかの事例を挙げたいと思います。まず最も重要なのは、オープンソースモデルが登場し、GPT-4と同等の性能を持つモデルが450ドルで作れるようになったことです。あなたが指摘してくれたことですが、これは驚くべきことです。
Sky-T1をUCバークレーが公開しましたが、これは既存のモデルを使用して訓練するのに450ドルしかかからなかったとあなたは言っていました。これは推論、つまりモデルが考え、計画を立てるために必要な計算能力をスケールアップした結果です。明らかにOpenAIもこれが機能することを確認し、他社も追随しています。今ではオープンソースコミュニティも同様のことを行っており、そのベンチマークは驚くべき結果を示しています。
数百ドルで強力な独自のモデルをトレーニングできるようになり、トレーニングデータ、コード、モデルの重みなど、必要なものすべてにアクセスできるようになったことを考えると…開発や独自のモデル作成に興味がある人にとって、これは大きな進歩です。
また、MiniMaxが「Lightning Attention」という新しいモデルを発表しました。これは視覚的なマルチモーダルモデルで、様々なことができます。これは中国企業の例ですが、新しいモデルとインフラが登場しているということです。この週だけでも、トランスフォーマーの使用に関する様々なブログ投稿を見ました。
最後にケビン、私たちの視聴者に指摘したい点があります。YouTubeをご覧でない方は、YouTubeをチェックするか、ショーノートでクリップをご覧ください。Runwayで働いている人が、短時間で彼らのツールを使用してAIバージョンの自分を作成しました。これは、この技術がいかに急速に進歩しているかを示す創造的な例です。1年前にこのクリップを見ていたら、私たちは完全に驚いていたでしょう。クリップを再生してみましょう。
「このキャラクターは完全にテキストから生成し、スマートフォンでパフォーマンスを録画し、Runway内で10分以内にリップシンクとアップスケールのアニメーションを行うことができました」
Timmyに大きな感謝を。彼はRunwayのコミュニティマネージャーで、私たちAI for humansの両方にとても親切にしてくれています。音声だけを聞いている方のために説明すると、これはTimmyがピクサーのようなクオリティでフルレンダリングされたキャラクターとして話している様子です。手を動かし、目や顔が話している内容に合わせてアニメーションしています。後ろにはふわふわしたラマかアルパカ（どちらかはわかりませんが）がいます。
ギャビンが言ったように、これは1年前なら「これはどんな魔法なんだ？」と驚いていたでしょう。しかし実際には、Runwayのツールを使用してわずか10分の作業で実現できるのです。
スピード、つまり物事を成し遂げるスピードと改善のスピードです。これが私たちが視聴者の皆さんに強調したいポイントです。この技術は加速度的に進化しています。壁にぶつかっていると言う人もいますが、壁にぶつかっていない分野は多くあり、実際にはまったく壁にぶつかっていない可能性が高いのです。
F-wordを使いましたね。ええ、Sam Altmanの言葉を引用しただけです。罵り言葉といえば、ケビン、AI for humansにまだ登録していない方は今すぐ登録すべきですね。このビデオにまだ登録していない方は、今すぐ登録してください。さもないと私がF-wordを連発し始めるかもしれません。
YouTubeチャンネルをご覧の皆さん、いいねと登録をありがとうございます。他の人とも共有してください。オーディオ版を聴いてくださっている方々、毎週オーディオ版の視聴者が大幅に増えていることに感謝しています。私たちと一緒に時間を過ごしてくれてありがとうございます。他の人とも共有し、Apple iTunesで5つ星のレビューを残してください。
正直に言うと、私の脳は今7.5%くらいの状態です。先週の1%よりはましですが、まだインフルエンザと戦っています。世の中にはもっと大きな問題に直面している人がいることは知っていますが、これは主に今週のポッドキャストでの私のパフォーマンスを言い訳するためです。
また、それが、ChatGPTのタスク機能について私がこれほど怒っている理由かもしれません。LinkedInのプロフィールにAIと書いている人たちが「すごい！エージェント型AIが来た！これが未来だ！」と言っているのを見て。ChatGPTの新機能は2025年まで続くと…私たちはこれから話すつもりですが、私はこれがまったく違うと思っていて、なぜかすごく怒っています。それが単に体調が悪いからなのか、それとも正当な怒りなのかわかりませんが。
あなたは間違っていないと思います。ChatGPTが今日新しいものを発表しました。12月のリリースは終わっていませんでした。「GPT Tasks」という製品を発表しました。これは基本的に、ChatGPTにリマインダーを設定する機能です。オンラインの人々、あなたが言うAIインフルエンサーやハイプビーストたちは、これをエージェント型AIのように話していますが、私の考えではそうではありません。
これは単にタスクを指示するだけのものです。昔のWindows PowerToysのようなものです。PowerShellのおもちゃを覚えていますか？基本的にGPTに何かをスケジュールできるようになっただけです。「私の世界を破壊し、子供たちを解雇して妻と別れたくなるような12の例を見せてください」と言いたくなりますが、実際の例は「朝7時にChatGPTから気持ちを整えるリマインドをもらう」とか…
はい、運動のアドバイスとか…これは他の何でもできることですよね。基本的にはカレンダーです。特定の事項に対するカレンダーの招待状のようなものです。
問題は、人々がOpenAIのオペレーターを待っていたということです。これは、Anthropicのコンピュータ使用版で、コンピュータが実際に外に出て何かをすることができるものですが、これはそうではありません。おそらく彼らにとってもそれほど大きな出来事ではなかったのに、人々がそれを大げさに取り上げたのかもしれません。
とはいえ、ChatGPTでリマインダーが欲しい人にとっては悪くない機能です。ChatGPTのロードマップの中では小さな一歩だと感じますが、これはOpenAIが何かをすると、それを大きなことに変えようとする人々の良い例でもあります。ただし、この場合は問題ありません。
使ってみたい方は、設定から見つけることができます。右上の名前をクリックします。時々見つけにくい小さな円で、あなたのイニシャルが入っているものですが、そこをクリックするとタスクを設定できます。
ついでに、ChatGPTがあなたについて何を記憶しているか確認してください。記憶してほしくないことがあるかもしれません。実は先日これをやってみたので、ケビン、今すぐ確認してみましょう。
ちなみにモデル選択で、ウェブアップを使用している場合、ドロップダウンメニューでGPT-4を選び、「GPT-4 with scheduled tasks beta」が表示されます。この録音時点での新機能です。
ChatGPTのメモリーが私について覚えていることをいくつか紹介します。まず、「ギャビンは4人でAcquiredというボードゲームをプレイしており、そのうち2人は初心者です」と記憶しています。これは正しいです。クリスマスにAcquiredというゲームをもらいました。素晴らしいボードゲームです。
「Harperは3歳です」というのは間違いです。私のHarperは実際には17歳です。
「ギャビンは若い頃と比べて、睡眠が取りにくくなっていることに気付いています」とも覚えています。
また、「ギャビンはセリアック病のためグルテンを避けなければならず、グルテンフリー料理のコミュニティに所属しています」とも記憶しています。これは興味深いことに、私ではなく私の家族全員がセリアック病なのです。
設定タブのメモリーに入って、記憶されていることを見るのは本当に興味深いです。必要に応じて削除することもできます。時々そこにある情報を見るのが面白いですね。
個人のAIのメモリーを探るのも一つですが、Reddit全ユーザーの集合的メモリーについてはどうでしょうか？これはとてもクールです。ご存じの通り、RedditはOpenAIと契約を結びました。Redditは一般的にこれらのモデルのデータの大きなソースです。なぜなら彼らはRedditをスクレイピングしたからです。
RedditとOpenAIが契約を結び、Redditのホームページの左上に新しい「Answers」というタブが表示されるようになりました。彼らはRedditの回答の巨大なデータセットに基づいて回答を提供するカスタムGPTを作成しました。何でも質問できます。
これはクールだと思います。なぜなら、GPTの興味深い使用例だからです。私たちはカスタムGPTがOpenAIにとって副次的な製品で、それほど大きな意味を持たないかもしれないと考えていましたが、これは大企業がその製品を取り入れて自社のものにした例です。
ケビン、何か質問してみましょうか？どんな質問がいいでしょう？ゲーム中の最高のスナックについてランク付けしてもらうのはどうですか？いや、もっと具体的に、お母さんが上階から叫んでいて、20人のWorld of Warcraftのハードコアレイドに参加しようとしている14歳の少年にとっての最高のスナックについて聞いてみましょう。
「質問の意図が理解できません。言い換えてください」
いやいや、Reddit GPTにとってはよくないスタートですね。
推奨される質問の例を見てみましょう。「妊娠中の吐き気対策」「最悪のストリートファッションのトレンド」「最高のコーヒーメーカー」「ラマに与える最高の5つの食品ブランド」…これを試してみましょう。
考え中…「ラマに与える特定の食品ブランドは見つかりませんでしたが、r/Llama、r/farming、r/Homesteadで役立つ情報が見つかるかもしれません」
ちなみに、ChatGPTに「ラマに与える最高の5つの食べ物は何ですか？」と聞いてみましょう。すぐに5つの食べ物を挙げてくれました。ブランドではありませんが、1番は干し草、草、アルファルファと言っています。
これは、Reddit GPTが答えられるはずの質問の興味深い例です。しかし、私たちは広すぎる質問をしているのかもしれません。もっとビデオゲームに特化した質問の方がいいかもしれません。
Gavin Purcellについて何を知っているか聞いてみましょう…テレビ、エンターテイメント、AskRedditを推薦してきましたが、それだけです。マシンの中の幽霊のようですね。
でも、あなたは確実にRedditに存在していますよね。なんだか変な具合に機能していないようです。
これについては後で試してみましょう。私たちは期待していましたが、実用的な質問をしてみましょう。Redditで実際に聞きそうな質問、例えば「PFOAを含まない空気圧フライヤーはありますか？」といった質問です。
永久毒性化学物質についての新しい議論ですね。有毒化学物質を含まない空気圧フライヤーはありますか？
ガラス製の空気圧フライヤー、Big Boss、Aroma、Transonic…Beautiful Lineなど。
検索すると、答えがクリック可能なスレッドとして表示され、ソースの代わりに通常のハイパーリンクのように青いテキストでハイライトされています。「これらのブランドは有害な化学物質を含む可能性のある非粘着コーティングを使用していないガラス製エアフライヤーを提供しています」という引用があり、それをクリックすると3番目のタブにr/airfryer「ノンスティック・PFAS フリー・安全なエアフライヤー」というポストが表示されます。
NOC_whizzyまたはno_finがポストを作成し、NOC_whizzyが返信していました。「Amazonでガラス製のものをいくつか見ました。一つはBig Boss、もう一つはAromaからのものでした」など。明らかにこれはr/cookwareとr/airfryerからのコメントをソースにしていることがわかります。
それならそれなりに役立つかもしれませんね。質問が広すぎたのかもしれませんが、これは非常に有用な可能性があります。心配なのは、多くのユーザーが望む回答を得られないとフラストレーションがたまる可能性があることです。ある意味では、単にRedditの検索を使う方が良いかもしれません。でもこれは少しはガイドしてくれるでしょう。
少なくとも試してみる価値はあると思います。なぜなら、巨大なインターネット企業が巨大なデータを持ち、OpenAIと直接提携してホームページに掲載しているというのは大きな出来事だからです。
「お母さんがレイドの邪魔をするのをやめてくれません。スナックが欲しいだけなのに、どうすればいいですか？」というスレッドは絶対にあるはずです。そういうスレッドは山ほどありますよ。
次に進みましょう。Luma LabsがRay 2を発表しました。これは彼らの新しいAIビデオモデルで、今日トレーラーが公開され、Dream Machineで今すぐ利用可能です。ケビン、私たちはいつもAIビデオの次世代を見るのが楽しみです。先週の番組で話したV2をたくさん使っていましたが、これは本当に良さそうです。
とても興味深い説明的なビデオがたくさん出てきています。非常にリアルな顔、物理的な動きなど。そして他のものと違って、これは一般に公開されています。面白いビデオがありましたね。重量挙げをする鶏の動画があったとか？
そう、鶏が頭の上にバーベルを上げているんです。重量は完璧にバランスがとれているわけではありませんが…それはホルモン不使用の鶏ですよ、ギャビン。よくもそんなことを！完全にナチュラルですよ。
私たちはこの番組で肉の物理学も大好きです。まな板の上でステーキが切られているシーンがありますが、ステーキが切られるにつれて何故か熱くなって蒸気が出てくるのを忘れなければ…ビデオで気付きましたか？切るたびに…面白いですね、熱で活性化されますが、実際の物理的な動きや見た目は完全に信じられるものになっています。
ステーキが発火しなければ、100%これは誰かが肉を切っている普通のストック映像だと思うでしょう。これらが速くなり、より速くなるにつれて、より現実的なものを見ることになるでしょう。ケビン、これは何度も言ってきましたが、プロンプトからハリウッドへの道はより早く来ています。
これはOpenAIでもGoogle、Metaでもない企業から来ているものです。1年前に見せられていたら、頭が爆発していたでしょう。今では小さな細かいところを探しています。
今、サックスを演奏している男性のビデオを見ています。興味深いのは、サックスを演奏している男性がいて、彼の服装はショットごとに変わりますが、背後の観客は全員かなり上手くレンダリングされています。変な手拍子をしていますが…
そのフレームを止めてください。一目見ただけで、観客の一人がバイオリンを持っているのが分かります。なぜかただ持っているだけで、腕を上げてバイオリンを軽く叩こうとすると腕が外れてしまいます。
まだ少し悪夢的な要素はありますが、一時停止して詳しく見なければ、あなたの言う通りです。これらの例のいくつかは本当に素晴らしく、信じられないものです。
人間のような姿をしたバナナが税金の申告をしているシュールレアリスティックなものもすごく良かったですね。Rick Rubinがカール・ユングのハンバーガーを食べているのもありましたね。
蝶の咲く野原にいる3人のひげを生やした男性を見ましたか？あれはAI or Dieの人たちの一人です。後で番組で話すAI for Dを作っている人の一人です。「機能していることを確認しました」と彼らは言っています。
映画のようなカメラレンズ、信じられるような人間の動き、AIで生成された動画の大きな批判の一つは、なぜかすべてがスローモーションだったことですが、今では環境の中をキャラクターがどれだけ速く動き回れるかを見せることが多くのツールにとってのアピールポイントになっています。Ray 2は本当に印象的に見えます。
これに興味があります。おそらくDream Machine のLuma Labsのサブスクライバーである必要がありますが、お金を使う価値がありそうな理由の一つですね。ケビン、言いたくありませんが、少なくとも1ヶ月は契約してみる必要があるかもしれません。
次に進みましょう。A.S.はかなりクールなものを発表しました。あなたはこれに興味を持っていましたね。説明してください。
このポッドキャストの30分ほど前で、「これらすべてのために十分な電力がなく、チップもなく、なぜこれらのことを心配する必要があるのか」と言っていたことを覚えていますか？そしたら、トレーニングに450ドルしかかからない最高クラスのモデルが発表され、NVIDIAが「効率的な高解像度画像合成のための線形拡散トランスフォーマー」を発表しました。
これはどういう意味ですか、ケビン？私の頭が…あなたが説明してください。
わかりました。基本的に、以前なら必要だった電力の一部分だけで、非常に美しい画像生成ができるということです。画面上の例を見ると（音声版の方は後でショーノートにリンクを載せます）、このSonaテキスト画像生成フレームワークは、4Kのような巨大な高解像度画像を効率的に生成します。
サーバーファーム全体を必要とせず、基本的にラップトップで実行できます。チップの一級地域にいる必要もありません。しかも速いです。巨大な4Kアートワークの生成にわずか数秒しかかかりません。
最もクールなのは、最先端の技術が拡大するにつれて、オープンソースで言及したように、小規模なものも拡大するということです。今の最先端のモデルと同じくらい強力な小規模モデルの世界が来るのを待ちきれません。それはそれほど遠くないでしょう。
ローカルで実行することで、もう少し実験できるようになります。明らかに、コンテント（画像やビデオ）を作成する際の最も frustrating な点の一つは、企業が何を許可し、何を許可しないかについて非常に厳しいガードレールを設けていることです。
V2で楽しんでいますが、実際に80年代のポイント＆クリックゲームのようなピクセル化されたゲームを作るというプロンプトで遊びました。弁護士ゲームを作りました。後で見せますが、frustrating なことの一つは、マスコットが大きな頭を被って立ち上がり、隣に座っている子供を倒すようなプロンプトを作りたかったのですが、それは通りませんでした。子供への暴力に関係があると判断されたのでしょう。面白いものにしたかっただけなのに。
ローカルモデルなら遊びが可能で、自分でガードレールを設定できますが、明らかにそれには欠点もあります。ガードレールで防ぐべきことも許可してしまうからです。バランスが必要です。いずれにせよ、小規模モデルも良くなっているのは super exciting です。
ギャビン、「ガードレールを設けるべきか否か」はアメリカで最も急成長しているゲームショーですが、もし私が「燃えている建物や山火事から動物を救助する英雄的な救助隊員の画像生成を許可すべきか」と言ったら、あなたはそのような画像を作ることに問題はないと言うかもしれません。
しかし、その画像が感動的なモンタージュで素晴らしいストーリーを伝えるのに使える一方で、純粋な誤情報や偽情報となり、正確な情報を求めているコミュニティ全体を混乱させる可能性もあります。
これは今まさにパリセイズ火災、アルタデナ、プアー LAの背景で起きています。この街は今、休む暇もありません。ソーシャルメディアでは、正確なリアルタイム情報を探している人々のフィードにAIのスラップ（低品質なコンテンツ）が混入し、さらに怒りを募らせています。
その件について、私の個人的な経験を話しましょう。私はLAに住んでいて、避難区域の端から約3マイルの場所にいます。西側に住んでいて、LAを知らない人のために説明すると、サンタモニカの避難区域はモンタナ通りで止まっていたので、おそらくモンタナ通りの南2マイルほどの場所です。
私はこの情報を探すのに必死でした。興味深いのは、人々が共有していたものについてです。神よ、LAにとって本当に大変な週でした。ここにいる人、影響を受けた人、気の毒に思います。特にパリセイズ、そしてアラデナでも、家を完全に失った人々の被害は、まるでAIのようです。それほど信じられないものです。
現実がどのように見えるのかとAIがどのように見えるのかの境界が曖昧になると、その間に奇妙な状況が生まれます。巨大な火災の前にランボルギーニが駐車している写真が拡散されましたが、正直なところ、その写真や映像が偽物だったのかどうか、今でもわかりません。そう見えますが、本物かもしれません。
これが私たちが今いる奇妙な世界です。長い間、選挙について心配していました。選挙でそのような事態が起きるのではないかと。しかし、より興味深いのは（興味深いという言葉は適切ではないかもしれませんが）、実際に起きた出来事へのリアルタイムの影響についてです。
トランプへの暗殺未遂があった時も同じでした。最初の2〜6時間程度で広がる可能性のあるものは、より大きなものとは違う形で広がります。これは、何が本物で何が本物でないのかを意識し、見るものすべてにほぼ疑問を持つ必要があることの再確認です。全体的な現実にとってはあまり良いことではありませんが。
新年前後にラスベガスで起きたトランプタワー前のサイバートラックの爆発についても同じような経験をしました。その映像を見て「ああ、これはAIだな」と思って流そうとしたら…「いや、違う」と。
両方の側面で破壊的です。一方では誤情報や偽情報を配置するのが非常に簡単で、他方では文字通りすべてのメディアへの信頼を損なうからです。これらのプラットフォームはラベル付けに完全に失敗しているように見えます。
コミュニティノーツ（いわゆるコミュニティによる注釈）が表示されるまでに何時間も、何日も、何週間も、何年もかかることがあり、その時には既に被害は出ています。これらのプラットフォームは本気で取り組む必要があります。
Instagramもその一つです。future.writer.usというユーザーが、英雄的な救助隊員のモンタージュを投稿しました。一見すると、誰かがロサンゼルス周辺の火災から動物を救助しているように見えます。しかしよく見ると、まるでアライグマを炎の中に置いているかのように見えます。何が起きているのでしょう？
徐々に、これがAIのスラップだと気付きます。もちろん今見ると、絶対にAIだとわかります。投稿者は、この時期に多くの動物が避難を余儀なくされ、人々の助けが必要だという非常に現実的な認識を高めるためにこのビデオを作ったと主張しています。
人々を誤解させるつもりはなく、awareness（認識）を高めたかっただけだと。一方で、人々は「ちょっと待って、実際の映像が非常にダメージを与えている時に、偽の映像を出して何を達成しようとしているんだ？」と言っています。
非常に複雑な問題です。以前話したように、これらのツールが速くなり、より良くなるにつれて、現実を曖昧にしていくということです。これは次の話題にもつながります。少し面白い話ですが、誰かに被害を与えたケースです。
フランス人女性が、AI生成のブラッド・ピットに83万ユーロ（85万ドル）をだまし取られたという記事があります。なぜこうなったのか理解できますが、この女性に送られた写真のいくつかを見ると、いつもあるような詐欺の話とそれほど変わりません。この女性はブラッド・ピットと話していると信じ込まされ、これは基本的に番組で見てきたような単純な顔のスワップ写真です。
私にとって最も驚くべき写真は、彼が病院にいる写真です。多くの写真が病院からのもので、「I Love You」と書かれた紙を持っています。まず第一に、これは明らかに基本的な詐欺トレーニングで、詐欺に遭わないようにする必要がありますが、人々は時々、有名人がこのような愛を持っていると信じたがります。これは非常に単純な基本的なツールで、本物の詐欺師がこの女性から多額のお金を騙し取るために使用したものです。これが今私たちが住んでいる世界です。
[フランス版ブラッド・ピットの声をまねて会話するコメディスケッチが続きます…]
さて、今週他の人々が行ったことについて話しましょう。
まず最初に、ACHAY BOCというXユーザーのことを紹介したいと思います。彼女はスタートアップを持っていて、しばらく彼女のスタートアップをフォローしていました。スタートアップの名前はFashion FNで、ウェブアプリです。
以前見たことのあるAIの試着機能を取り入れ、明らかに服を販売するために使用していますが、彼女が加えた要素が本当にクールだと思ったのは、基本的にAI試着機能を持っているだけでなく、少し動きを加えたことです。つまり、ビデオモデルにプラグインしたのです。
これらのツールを知らない人のために説明すると、自分の写真をアップロードし、Tシャツの写真を見て、一般的にそのTシャツを着用した姿を見ることができます。AIモデルがそれを可能にしています。これは単にそれを動きの中で見ることができるようにしただけで、次のステップだと思います。とてもクールなことです。
ウェブサイトのプラグインとして見ることができますね。ブラウジング中に「これは私にどう見えるだろう」と思った時にクリックして見ることができます。シンプルですが、エレガントな実装に見えます。以前番組で紹介したツールですが、これが新しいことです。新しいツール、新しいホワイトペーパー、コードが出てきて、誰かが「これをどうやって製品化できるか、誰もが1クリックで使えるようにするにはどうすればいいか」と考えるのです。
次に、AI or Dieの新しいエピソードが公開されました。以前番組で少し話したと思いますが、AI or Dieは Adult Swim長さの非常に面白い番組です。通常10〜15分で、3人の男性が集まってAIを使って小さなスケッチを作っています。
この回には良いものがたくさんあります。ロバート・ダウニー・Jr.が他の作品のキャラクターとして出演していたり、奇妙なものもあります。AI or Dieの好きなところは、現在のAIビデオの奇妙さを活かしていることです。
これらのビデオは全て素晴らしく見えます。明らかに最新のAIビデオツールを使用してアップグレードしており、すべてがそうですが、AIで面白いと思われることをよく行います。下着姿で地面を這い回る男性の動画があり、まるで車のように動き回っています。とても面白いものです。AIの本当に良い使用例で、私たちは常に良いAIクリエイターを紹介するのが好きです。
これは「This is my swamp」につながります。今週は私が担当するわけではありませんが、ギャビン、あなたはこれを送ってくれて、私も実際に素晴らしいと思います。
これは、Andre（andr3w.core.ai）という人物で、大きなロード・オブ・ザ・リングの野外レイブを作成した動画を覚えていますか？彼はInstagramのAIクリエイターです。これはシュレックとフィオナのトラップヒップホップで、かなりのものです。
ケビン、クリップを再生して人々に聞かせましょう。ビデオも見せましょう。これを見ていない人のために説明すると、基本的にヒップホップなシュレックで、フィオナはケーキアップ（メイクアップ）して踊っています。
ドラゴンのキャラクターの名前は何でしたっけ？ああ、覚えていません。最後にドラゴンが出てきて…そう、ジューシーなドラゴンがいて、シュレックはランボの上に座ってポンプアクションショットガンを持っています。ただ手を…これは、このトラックとビデオに求められるすべての意味でダンクです。
明らかにシュレックなので個人的に共感します。それは何らかの形で私のハートアニマルまたはスピリットアニマルなのですが、これはAIツールを使って何か超奇妙なものを作り、世界に発信する良い例です。「my swamp」というタイトルで、ショーノートにリンクを載せます。
ケビン、今週私たちが行ったことについて少し話しましょう。あなたは非常に忙しく、また病気でもあったので、多くのことはできなかったと思います。私はV2をもっと使ってみました。V2は本当に良いです。すぐに皆が使えるようになることを願っています。新しいマヨネーズのコマーシャルのようなものを作ろうとしていて、それは軌道に乗り、人々は本当に気に入ってくれました。
ケビン、私が常に考えていることがあります。もし私たちの視聴者の中で、これについて考えることに興味がある人がいたら…YouTubeでAI Explainedという人がいて、私は彼が大好きです。AI Explainedは非常に良いYouTubeチャンネルで、彼は私たちよりもずっと賢いです。
これらのAIモデルがどこに向かっているのか、ハードコアな技術面について知りたい場合、彼は素晴らしいフォローです。ほとんどの人にとって比較的理解しやすく説明してくれます。私たちの視聴者の中には少し難しすぎる人もいるかもしれませんが、それは問題ありません。試してみる価値はあります。
彼は自分のベンチマークを作成しました。AIにおけるベンチマークとは、AIがどのように機能するかをテストするためのものです。Simple benchと呼ばれるベンチマークを作成し、その考え方は、人間にとって簡単でAIにとって難しいことの一連のテストを作成し、新しいモデルが登場するたびに時間とともにベンチマークを取っていくというものです。
ベンチマークは全てのAIにとって非常に重要なポイントです。なぜなら、時間とともにどのように改善されているかを確認できるからです。誰のツイートだったか覚えていませんが、コメディのベンチマーク、またはこのAIが面白いかどうかを測るベンチマークのアイデアについて考えています。
あなたも私も、AIは一般的に面白いものではないことを知っています。ある形で面白くなるよう強制しない限り。一般的にコメディは本当に難しいものです。コメディと言っても、もちろんコメディ自体は非常に広いものですが、ジョークを言うこと、コメディで人々を驚かせること、陳腐に感じない類推を作ること、そのようなことについてコメントすることです。
創造的なことのベンチマーク、特にコメディのベンチマークを作ることがどのようなものになるのか考えています。あなたは詩のベンチマークについても言及しましたが、これもこの会話の興味深い部分だと思います。
ほとんどのベンチマーク（全てとは言えませんが、ほとんどと言えると思います）には、正解か不正解かがあります。コーディングや数学、物理学に基づく科学的な質問で、できるかできないかです。
しかし、ここでは結果が完全に曖昧になる可能性があります。創造的な追求を扱う場合、そうですね、お父さんジョークやダジャレのセクションがこのベンチマークにあるはずです。このLLMが皆のお父さんに対してどのようにパフォーマンスを発揮するか見てみたいですね。
フィードバックを得て、これがどのようなものになるのか考えてみたいと思います。興味深いことに、Redditのジョークのデータベースがあります。誰かがすべてのジョークをスクレイピングしました。Redditのユーザーならご存知の通り、それは基本的にお父さんジョークか、セットアップとオチがあるような種類のジョークです。
それが始める方法になると思います。今、フランスの友人にジョークを言ってもらう前に、これは私が今真剣に考えていることだということを言及したいと思います。もし私たちの視聴者の中でこのアイデアに興味がある人がいたら、私たちのDiscordに参加して、そこで時間を過ごし、私たちと関わってください。私たちはかなり頻繁にそこにいます。
ケビンがジョークを準備している間に、もう一つ。皆さん、ニュースレターがあります。ai4humans.showにあります。リンクはそこで見つけることができます。登録してください。毎週火曜日の朝に配信され、本当に気に入ってもらえると思います。多くの人が気に入っています。
フランスの友人にジョークを考えてもらいましたか？もちろんです。ギャビン、生成ボタンを押したら戻れないことを知っておいてください。AI版ブラッド・ピットに最高のジョークを求めました。ポッドキャストを終えるためです。一度ボタンを押したら戻れないことを知っておいてください。言うべきことは全て言いましたか？
はい、全て言いました。では、これが現在のAIのユーモアの良い例で、なぜベンチマークを作る必要があるのかを示しています。
「ジョークが聞きたいですか？なぜフランス人は朝食に卵を1つしか食べないのでしょうか？1つで十分だからです！ハハ！素晴らしい、コメディは高級ボルドーのように流れます」
正直なところ、少なくとも意味は通っていました。
ありがとうございました。来週また会いましょう。