マーティン・スコセッシがAI映画監督に

Google・DeepMind・Alphabet
この記事は約27分で読めます。

巨匠マーティン・スコセッシ監督がAIモデル「Flux」のCMに出演し、カメラマンに指示を出すようにAIを演出する姿が話題を呼んでいる。ハリウッドのトップ監督たちが相次いでAIをツールとして容認する一方、ネット上の批判によってプロジェクトを断念するアニメーターも現れるなど、業界内での葛藤が浮き彫りになっている。さらに、人気ユーチューバーのPewDiePieが開発したローカルAIツール「Odysius」や、Nvidiaの最新ハードウェアの動向、そしてOpenAIの「goal」機能を使った自動ゲーム開発の実験まで、AI技術が個人のクリエイティビティをどう拡張しているかを解説する。

Martin Scorsese Is Now An AI Filmmaker.
Martin Scorsese is advising AI image and video company Black Forest Labs, and he is just one of a wave of major filmmake...

巨匠マーティン・スコセッシがAI映画制作の世界へ

マーティン・スコセッシがAI映画監督になりました。あ、今流れているこのクリップはAIではありませんよ。近代的な感じのしない場所が必要だ、村でも都市でもない町、まるで中世のような、通りはさらに狭くて、といった具合です。マーティン・スコセッシは、アンチがカートゥーンの作者に殺害予告を送り続けている一方で、突如としてAIをツールとして受け入れ始めた多くの大物映画監督の一人に過ぎません。しかし、YouTube発で成功を収めた映画「バックルーム」が示すように、時に世界は急速に変化します。今日はAI映画制作について深く掘り下げ、私たちのお気に入りのクリエイターをいくつか紹介し、さらに素晴らしい作品を作るためのヒントもお届けします。

NvidiaとMicrosoftは約3年間じっくり準備を進め、ついにパーソナルコンピューティングの未来を焼き上げ、ステージへと引っ張り出してきました。もちろん、最も素晴らしい部分であるビデオゲームもお見せしなければなりません。そして、Codexのツールに約45時間ほど処理を任せた結果、昔紹介した私のクマのジャンプゲームの、とても楽しいバージョンが出来上がりました。当時を覚えている方がどれくらいいるか分かりませんが、これらの言葉の意味はなんとなく理解できますし、これが人間のためのAIであることは間違いありません。

AI for Humansへようこそ。この番組は、素晴らしいAIの世界を週に2回お届けするガイドです。ケビン、今日はAIビデオ業界からとんでもないニュースが入ってきました。マーティン・スコセッシです。友達からはマーティと呼ばれる、あのマーティン・スコセッシです。私も彼の友人の一人ですよ。知っていますよ。私のWhatsAppのチャット一覧では「マーティ・スワズ」となっています。そのマーティ・スワズがAI映画監督になったのです。さて、ここで何が起きているのか状況を整理しましょう。最近あまり噂を聞かなかった、FluxモデルのメーカーであるBlack Forest Labsが、マーティン・スコセッシを起用した新しいCMのようなものを公開しました。はっきりさせておきたいのですが、これは高額な契約である可能性も、株式を伴う契約である可能性もあります。しかし、マーティン・スコセッシがこのCMの中でAIを演出しているというのは、予想以上に大きな意味を持つことだと思います。Black Forest Labs、通称BFLの言葉を借りれば、彼は6十年にわたり世界が物語を見る方法を形作ってきました。そして今、人間の感性と職人技を核とした視覚的インテリジェンスを私たちが形作るのを、彼が手助けしてくれているのです。

それで、Fluxが本当に絵コンテを描いてくれると思うかね。では、試してみて君がどう思うか見てみよう。近代的な感じのしない場所が必要だ。村でも都市でもない町、まるで中世のような、通りはさらに狭く、石畳だ。町を通る幹線道路は曲がりくねっている。カメラを高くして見下ろすように。突然、郵便配達員が現れる。彼のタピオカが巨大化する。巨大なタピオカだ。そんな話ではありません。

それはマーティン・スコセッシではありませんね。突然、誰かが銃を持って現れてみんなを撃ち始める、みたいな展開でもないでしょう。ちなみに、今のところAIビデオでは規制が厳しすぎて、そういう表現はあまりうまくできません。スカーフェイスのようなシーンが作れる、規制なしのマーティン・スコセッシ版AIを見てみたいものですが、まだそこには至っていません。しかし、この件については話し合う必要があります。私たちはしばらくこれを追跡してきましたからね。ハリウッドの間でこうした動きが湧き上がっており、後ほど詳しく説明しますが、彼は基本形としてAIを使うと公言した、現役で最も偉大な映画監督と言えるでしょう。私にとって興味深かったのは、スコセッシがカメラマンに対するのと同じようにAIを演出している姿でした。これは多くの人々の既存の価値観を揺るがすことになると思います。なぜなら、スコセッシは今生きている映画監督のトップ5に入る人物と見なされているからです。ケビン、これを最初に見た時、率直にどう反応しましたか。

信じられませんでした。遺族がよく許可したなと思ったんです。でも、さっき言ったように彼はまだ存命で、元気に素晴らしい映画を作っていますよね。彼は現役で、最高の映画を作っていますよ。マーティン・スコセッシは私の生涯お気に入りの監督の一人です。昔の家にはグッドフェローズやカジノのポスターを貼っていました。だから100%大ファンです。

グッドフェローズのポスターを貼るタイプの人だったんですね。ケビンの新しい豆知識を知りました。ポスターを貼るタイプだっただけでなく、当時の親友のルイス・ハルタドに頼んで、グッドフェローズのポスターの3人の顔を、自分と彼と私の弟の顔にフォトショップで合成してもらい、それを長い間家に飾っていました。

ここにその画像を出せますか。そのビジュアルはありますか。どこかのファイルに保存していませんか。

実物のポスターは倉庫にあると思いますが、デジタルデータは探せばあるかもしれません。まあ、話が逸れましたね。私は大のマーティン・スコセッシファンです。そして、AIを使って何かをしている人なら誰にでも毒を吐きたがる人々が世の中にはいますが、ジェームズ・キャメロンを攻撃したのと同じように、マーティを攻撃することに躊躇はしないでしょう。彼らがアイコンであり、レジェンドであるにもかかわらず、です。本当にそうですね。彼らは依然として激しい批判を浴びる運命にあります。

実は、この点について私は少し違う意見を持っています。彼らはそこまで叩かれないと思うのです。キャメロンが発言した時も、彼に対する批判はそれほど多くありませんでした。ただ、この件の語り方には少し慎重になる必要があります。というのも、現在一種の権力構造のようなものが働いているからです。先週のニュースの続編としてすぐにお話ししますが、Prime Video向けのAIアニメシリーズのクリエイターであるホルヘ・グティエレスが、ネット上で浴びせられた批判を理由に、今週プロジェクトから降板しました。私が言いたいのは、人々はスコセッシのことは叩かないだろうということです。みんなスコセッシが大好きですからね。ある意味、キャリアで十分な実績を残していれば、何をやっても許されるというレベルに達するのかもしれません。だからこそ、スピルバーグやキャメロン、スコセッシのような人たちはこうしたことを許されるのでしょう。許されるという言い方は変ですね、私は良いことだと思っていますから。

ハリウッドの圧力とAIツールの現実

ガビン、あなたが建設作業員だと想像してください。小さな工具ベルトにハンマーが入っています。それは何でできていますか。ただの金属と木、運が良ければ何か高級なポリマーでしょうね。いいですね。ではドライバーはどうですか、ガビン。それは何でできていますか。金属とポリマー、そしておそらく少しの人間の血ですね。ではAIツールはどうでしょう。マーティン・スコセッシが言うところの、それです。それが何でできているか分かりますか、ガビン。人間の労働力。そして盗まれた夢です。

そうです、その通りです。盗まれた夢。AIが存在できる唯一の方法は、マーティン・スコセッシがアーティストコミュニティ全員から魂を奪い取ることです。だから、あなたの魂は私のもの、というわけです。要するに、マーティン・スコセッシがそれをツールとして使うことに対して、人々は彼がレジェンドでありアイコンだから許すのだろうと思います。そうですね。しかし、彼が使っているツールは、その過程で何百万人もの人々の労働や創造的な成果を盗んだからこそ存在しているのだという、良くも悪くも押し寄せるフィードバックの嵐から、彼が完全に逃れられるとは思いません。

ええ、その通りだと思います。つまり、ここでいつも前提を整理しておく必要がありますね。しばらくこれをやっていなかったので、私たちのスタンスを開示しておきましょう。私たちは、すべてのAIが人類の歴史における創造的な著作物で学習されたことを理解しています。初期の段階で多くのアーティストがデータセットに巻き込まれました。しかし、私たちは今、ツールを使って人々が何かを作ることができる段階にきており、これから紹介するように、驚くべき素晴らしい成果を目にしています。そして、マーティン・スコセッシのような人物が登場して「これらはかなり興味深いツールだ」と言う。これは先週、スティーヴン・スピルバーグが同じようなことを言ったのに続く動きです。彼はAIに脚本を書いてほしくはないが、さまざまな方法でツールとして使うことには賛成しています。ピーター・ジャクソンもこれを口にしていますし、クリストファー・ノーランでさえAIに対してそれほど否定的ではないようでした。つまり、こうした非常にハイレベルな映画監督たちが、このような感覚を持ち始めているのです。

しかしその一方で、ホルヘ・グティエレスの降板についても話さなければなりません。先週もお伝えした通り、彼は驚くほどの批判を浴びていました。彼は映画『ブック・オブ・ライフ 〜マノロの数奇な冒険〜』などでかなりよく知られたアニメーターです。実際、映画界でAIに猛烈に反対している人物であるギレルモ・デル・トロが、このプロセスの間、ホルヘに対して暗に批判的なツイートをしており、それがホルヘが最終的に降板した要因の一つだったのかもしれません。どうでしょうか、ケビン。今のハリウッドには、こうしたツールを使わせないようにする、ほぼ圧力キャンペーンのような空気が確実に存在しているように感じられます。

そうですね、明らかに存在しているからこそ、そう見えるのでしょう。そして、創造的な作品の背後にいるアーティストを脅迫したり、彼らの作品のボイコットを呼びかけたりすることで、確かに何らかの変化をもたらすことはできるのかもしれません。今回は明らかにホルヘ・グティエレス個人に向けて、より鋭い矛先が向けられていました。難しい問題です。前回の配信でも少し話しましたが、ホルヘは当初、AIについてかなり否定的なことを言っていました。「機械とセックスをして、その機械が子供をプレゼントしてくれるようなものだ」なんて言っていたくらいです。ですから、彼のファン層にとってどれほどの裏切りに映ったのかは分かりませんが、彼の「従来のシステムの中で何かを作ることは、ほぼ不可能とは言えないまでも、ますます難しくなっている」という発言には同意します。

アニメーション業界はその打撃を最も大きく受けています。彼は、アイデアが浮かんでからピッチを行い、承認されてシリーズ化の青信号が出るまでのスピードがこれほど速くなることに興奮したのだと思います。素晴らしいテクノロジーのおかげで、それほどのスピードを得られたことに感謝し、祝福するのは簡単なことです。彼はまた、多くの新人や経験豊富な才能あるアーティストたちと一緒に、フル機能の素晴らしいアニメシリーズを作ろうとしていたはずです。ですから、一方で彼が身を引いたときは気の毒に思いました。そうなるだろうとは予想していましたが、すでに多くのダメージが残ってしまいました。ファンの中には、彼の次の作品がどんなものであろうと、たとえ彼が1コマ1コマに血を流すような努力をしてアニメーションを描いたとしても、二度と彼を応援しないという人たちもいます。結果として、一方ではファンを怒らせ、もう一方では本当に作りたかったものを作れず、アニメーターたちに雇用を提供する機会も失われてしまったわけです。

YouTubeクリエイターの台頭と注目作の紹介

ええ、この現在の状況について少し背景を説明させてください。今週末、ハリウッドで非常に興味深いことが起こりました。あまり詳しく追っていない方のために説明すると、『The Backrooms』と『Obsession』という2つの映画が、ユーチューバーによって制作されました。一人は、Garry's Modで育ち、Portal 2がお気に入りだと語る20歳のケイン・パーセル(ケイン・ピクセルズ)で、『The Backrooms』を作りました。もう一人は26歳のカリー・パーカーで、『Obsession』を作りました。

メインストリームにおいて非常に興味深いのは、誰もが「信じられない、ユーチューバーが映画を作っている」と驚いていることです。ちなみに、この2作品はどちらもスターウォーズの映画『マンダロリアン&グローグー』を圧倒しました。あの小さな赤ちゃんの名前は何でしたっけ。グローグーです。ほら、私はスターウォーズオタクなのに、ベビーヨーダの正しい名前すら言えません。しかし、公開2週目の週末に『マンダロリアン&グローグー』は興行収入が69%も落ち込みました。これは凄まじい下落です。一方で『Obsession』は、最初の3週間の週末ごとに数字を伸ばしています。私がここで言いたいのは、人々がようやくこうしたクリエイターの世界や、YouTubeで育った人たちに気づき始め、次の世代の誕生を目撃しているということです。

あなたと私はこれについて長い間話し合ってきました。物事はサイクルで回っているという講演もしてきましたね。現在のAI映画制作で非常に興味深いのは、これがまだ始まったばかりだということです。YouTubeでこれを始めたケイン・パーセルたちにも、おそらく「ふざけるな、お前は最悪だ」などと言う大量のアンチがいたはずですが、彼らはそれを乗り越えて進んできました。これもプロセスの一部なのだと認識することが重要だと思います。

私たちのスタンスもそれほど変わっていません。どちらかの側を選び、それがどうなるかを見守るというスタンスです。もちろん、考えを変える権利は常に留保しています。しかし、「私は絶対にAIは使わない、欲しくない」と言う人たちの意見も尊重します。ただ、クリエイターやその家族を個人的に脅迫するような人たちは当然尊重できませんし、サポートもできません。

しかし、今後「何が一体AIなのか」を定義しようとする時、その線を維持するのはますます難しくなると思います。それが生成AIなのか、それともグリーンバックをロトスコープしてくれるツールを使っただけなのか。かつては誰かがクリックして手作業で行っていた仕事です。絵コンテを作るために生成AIを使ったけれど、撮影はすべて実写で行った場合はどうでしょう。境界線は曖昧になっています。それについてあなたの感性や意見はアップデートされましたか。

そう思います。つまり、人間が働ける場所を確保することには常に非常に意識的です。ただ、ここで一つ指摘しておきたいことがあります。ケビン、私がなぜ笑ったかというと、あなたはさっき「境界線がどうなる」と言いましたか。境界線に対して何をする、と言いましたか。

曖昧になる(blurs)、ですか。

いや、もう少し前です。境界線の上にいる時、あなたは何をしていますか。境界線に近づいて、その上を歩いている時、何と言いますか。

一歩エッジに近づいて、壊れそうになっている、リンキン・パーク状態ですか。

違いますよケビン、「線を引く」とか「一線を画す」とか、英語の表現で言う「tow the line(足並みを揃える、ルールに従う)」の話です。次に話したいのは、私たちのお気に入りのクリエイターについてです。

AI映画の最前線:国内外の注目クリエイター

なぜその表現にこだわったかというと、現在AIの領域で実際に素晴らしい仕事をしている、いくつかの非常に興味深く大きな映画監督たちを紹介したいからです。最初のクリエイターは「Gossip Goblin」です。以前もこの番組で紹介しましたが、彼がYouTubeショートやInstagramショートで公開した『the toe brigade』という3分間の作品があります。これが「つま先(toe)」に関係していると想像するのは間違いではありませんが、Gossip Goblinの作品なので、彼が創り出した世界観が丸ごと表現されています。彼が少しリアルな世界を描きつつ、中盤に大きなひねりを加えてくるのが大好きです。ぜひ見てみてください。アーティストの本気の仕事が詰まった2分半の映像です。これは本当にクールな作品です。

もう一人紹介したいのは、日本のクリエイターの「Furu Fufu」です。覚えているでしょうか、有名な映画の数々に自分を合成していた日本の男性です。2037年のアカデミー賞で、封筒が開けられてこれらの名前が発表される日が待ちきれませんね。「ゴブリン、オスカー獲得」みたいに。まさにその通りです。

彼が新しい動画を公開したのですが、かかった費用は1万年、いや1万円だそうです。日本円で1万円というのは、当然それほど大きな金額ではありません。ドルにすれば70ドルかそこらでしょう。彼とゴリラが登場するだけの、非常にチャーミングな作品です。いくつかの要素が入っていますが、彼がこれを素早く作ったことが伝わりますし、ストーリーテリングが素晴らしいです。

そして最後にケビン、これは私たちが大昔に話題にした作品を作った人物です。初期のダークナイトのAI映画、バットマンの映画を覚えているでしょうか。「Caven the Kid」というクリエイターで、彼は職人技をどんどん磨き続けており、『Chronicle of Bone』という新しい作品を公開しました。彼は「Magnific」からスポンサーシップを受けています。Magnificさん、ぜひ私たちにもスポンサーマネーをください。事前に感謝しておきます。これは20分に及ぶ、第1章のような位置づけの映像です。私は全編見ましたが、本当に素晴らしい出来栄えです。制限のないキャンバスを持ち、これらのツールをどう扱うべきかを知っている時、どれほど壮大なストーリーテリングが可能になるかを証明しています。

そうですね、公開から約3週間で320万回再生されています。YouTubeの中にはAIが称賛されるコミュニティの領域があります。それから私たちのチャンネルもありますが、私たちはAIの「バックルーム(裏部屋)」に存在していますね。コメント欄を少しスクロールしてみると、「これがAIかどうかなんてどうでもいい、素晴らしい作品だ」という書き込みがありました。AIであることは関係なく、久しぶりに見た最高のストーリーテリングだ、と。これはあなたと私が長い間指摘してきたことです。モデルがこれ以上進化しなかったとしても、十分に魅力的なビジュアルを作ることができます。もし超フォトリアルを目指すのではなく、ある時点でスタイライズ(様式化)する手法をとるのであれば、そこから先は職人技や感性の勝負になります。ストーリーを語れるか、興味深い方法で表現できるか、最高のサウンドデザインができるか、編集はどうか、そうしたすべての要素が関わってきます。もちろん、絶対にAIを認めない層は残るでしょうが、一部の人々は「AIなのは良くないが、作品自体は本当に素晴らしい」と言うようになるでしょう。

AIを使ったミームと開発ツールの進化

ミームのクオリティもどんどん上がっています。あなたがシェアしてくれた、素晴らしい『ソプラノズ』のAI動画がありますね。どんな感じか少し再生してみましょう。

音声のピー音の合間に、トニー・ソプラノがChatGPTとやり取りしているのが聞こえます。そしてアヒルの画像が表示されます。アヒルの話から始めるな、と言っています。

画像が生成されました。トニー、今の気分はどうですか。

勘弁してくれ。俺は精神科医を求めたんであって、ディスカバリーチャンネルを求めたんじゃない。

わかりました。画像はなしにします。ですが、画像に対するあなたの反応は依然として有用なデータです。

忘れてくれ。一つだけ聞かせてくれ。俺は悪い人間か。

トニーがChatGPTからセラピーを受けている内容です。声の再現度が素晴らしく、ジェネティブAIに対して「演技」という言葉を使うのはまだ奇妙な感覚ですが、演技が非常に良いです。トニー・ソプラノ特有の仕草や癖が再現されています。思わず笑ってしまいました。

そうですね。この動画で非常に興味深いのは、すでに亡くなっている実在の俳優の、本物の声を使っているという点です。ミームとして楽しむ分には面白いですが、俳優の権利をどう扱うかという点では非常に複雑な議論が存在します。それでも、彼らがやっていることは超一級品です。

次へ進む前に、最後にもう一つ紹介させてください。約1週間前、「J Box Creative」の動画を見ました。彼はしばらくの間、ネット上で素晴らしい動画を投稿しています。少しピリッとした尖った動画を作ることもあります。以前、殻が割れていく漫画の卵の動画を作っていました。これ以上はその内容に踏み込みませんが、彼がInstagramで公開し始めたアニメーションが非常に伸びています。そして、彼はYouTubeで6時間に及ぶライブ配信を行い、自身の制作プロセスを公開しました。

私はじっと座ってその大半を見ていたのですが、彼はPriceline、いやPatreonを運営しており、そこに参加すると、Claudeなどの様々なモデル向けに彼が作成した非常に特殊なプロンプトシステムや、異なるプロンプトの方法を利用できます。世の中には、こうしたことを非常に高いレベルで行い、そのノウハウを共有している人々がいて、彼らから学ぶことができます。彼のPatreonにアクセスするにはお金を払う必要がありますが、私は登録するつもりです。彼は素晴らしいスキルセットを開発しましたし、自分が学んだことを共有して、他の人々も学び、共に引き上げられるようにすることも、このゲームの一部だと思うからです。これはYouTubeの世界全体にも通じる、非常にクールな文化です。人々の周りにコミュニティがあり、そこから映画監督たちが生まれました。AIビデオでも同じことが起きており、とても素晴らしいことです。

私はAIもコミュニティも大好きです。それらが融合するのは素晴らしいことです。ただ、私たちにも自分たちの小さなミニコミュニティがありますよね、ガビン。

その通りです。少数精鋭の、誇り高き「AI for Humans」のファンたちです。

でも、彼らが私たちに連絡を取る方法が全くありませんよね。私たちと話す方法も、私たちを助ける方法もありません。

ええ、私たちに感謝を伝えたり、サポートしたりする方法は何一つありません。

ちょっと待ってください、私のAirPodに連絡が入りました。ちょっと失礼。お母さん、今ポッドキャストの録音中だから切るよ。……あ、プロデューサーからの連絡でした。皆さんに「いいね」と「チャンネル登録」をお願いするようにと言われました。お近くにベルのマークがあれば、それをクリックしてください。ゴングを鳴らして、通知をオンにしてください。YouTubeで動画を盛り上げてください。音声のみのプラットフォームで聴いている方は、5つ星のレビューが凄まじい助けになります。Apple PodcastでもSpotifyでも、あるいは皆さんまだStitcherって使っていますか。

iHeartRadioならStitcherを知っているでしょうが、私の脳内からは消去されていました。

どのプラットフォームを使っていても、埃を払って私たちをサポートしてください。アルゴリズムを刺激するためにコメントを残してください。

その通りです。私たちのPatreonに行って支援していただければ、番組の制作費に充てることができます。色々な特典もあります。本当に感謝しています。

オープンソースAIの躍進とNvidiaの戦略

さて、ケビン。今週起きたもう一つのクールな出来事は、オープンソースに関する大きなニュースがたくさんあったことです。特に、Nvidiaが台湾で開催した「Computex」というイベントからのニュースです。私はなぜか変な発音をしてしまいましたが、Computexです。これは非常に大きな展示会です。ケビン、ハードウェア面でも素晴らしい発表がありましたが、興味深いモデルの発表もありました。

ええ、誰もがなぜNvidiaがこんなことをしているのか疑問に思っています。ここで言う「こんなこと」とは、オープンソースの、あるいはオープンウェイトのモデルをリリースしたことです。これらはオープンウェイトでもあるのですね。

intelligenceのNeotron 3 ultraが、Artificial Analysisのインテリジェンスインデックスで48点を獲得し、新しいリーダーになりました。これは、Googleが最近リリースした次の強力な米国製オープンウェイトモデルであるGemma 4 31Bを大きく引き離しています。中国が主導するKimmy K2にはまだ少し及んでいません。

中国のモデルに関してはベンチマークの数値が盛られている、実際には言われているほど機能しないという指摘もあります。米国製のモデルについても同様の指摘をする人はいますが、ガビン、なぜNvidiaはこんなことをしているのでしょう。なぜ彼らは、提携しているはずの他社のモデルと同等に機能するモデルを無料でリリースしているのですか。

おっと、それをやるんですね。ジェンセンに降り注ぐ現金の雨です。NvidiaのCEOであるジェンスン・フアンにとっては、このAIの世界がすべての人に普及することだけが望みだからです。そして、それを実現する最も簡単で最善の方法は、誰もがモデルにアクセスできるようにすることです。そうすれば、ローカル環境で何かを生成するために、より多くのハードウェアが必要になりますからね。後ほど、非常に有名なユーチューバーであるPewDiePieが取り組んでいる、非常に興味深いローカルAIシステムについて話しますが、ケビン、Nvidiaが自ら手綱を握り、アメリカにおけるオープンソースを前進させようとしているのは素晴らしいことだと思います。

OpenAIやAnthropic、Googleは現在、クローズドソースを強力に推進しています。かつてそのリーダーになると思われていたMetaでさえ、そこから利益を得る必要があると考えているようです。一方でジェンセンは、誰もがAIを掘り起こすために使わなければならない「シャベル」を売ることで儲けているため、モデルをどんどん無料で投入しています。私はこれに非常に興奮しています。

私はいつか、最近リリースされた非常に優れた性能を持つKimmy K 2.5やMini Max M3をローカル環境で動かし、普段やっている作業を試してみて、現在どのレベルにあるのか確かめたいと思っています。ケビンはこれらをたくさん触っていると思いますが、実用レベルに十分近づいていると感じますか。

最先端の極限のコーディングなどを行わないのであれば、90%の用途において、すでにそのレベルに達しています。達していないのは、コンピューティングパワー、つまりこれらのモデルを高度に間引いたり性能を落としたりせずに動かすために必要な、実際の処理能力の面です。動かすことはできても、出力が非常に遅いため、クラウドのターボスピードなら45秒で済む生成に5分かかってしまうこともあります。しかし、それに対するNvidiaの答えも用意されています。驚くことではありませんが、彼らの製品をさらに購入することです。

PewDiePieのローカルAIプロジェクトと次世代ハードウェア

先ほどPewDiePieの名前が出ましたので、この話を締めくくるために少し触れておきましょう。彼は有名ですが、約2万ドルをかけて独自のローカルコンピューティング環境を構築しました。しかしその過程で、自分にとって使いやすいインターフェースを見つけるのに苦労していました。チャットができ、ファイルをドロップでき、自律的なエージェントのワークフローを実行してくれ、カレンダーを管理し、画像編集などができるUIです。そのため、彼は自分でバイブコーディング(感覚的なコーディング)を行い、解決策を自作していました。

そして、「これは実際に強力だし、製品化すべきだ。オープンソースとして公開しよう」という段階に達し、実際に公開されました。ユーチューバーのPewDiePieが、「Odysius」というオープンソースのエージェントシステムをリリースしたのです。

ケビン、あなたが彼の話をするのは非常に面白いですね。私はあなたとPewDiePieの間に多くの共通点を見ています。金銭的な面での共通点ではないのが残念ですが、それは今後の楽しみに取っておきましょう。あなたたちは二人とも非常に早い時期からものづくりを始め、技術的な進歩に興味を持つという、この興味深い世界に行き着きました。PewDiePieもあなたと同様、純粋なプログラマーとして育ったわけではありませんが、彼がこの領域に飛び込んでいく姿を見るのは非常にエキサイティングです。これが人々に使われるかどうかは別として、現時点でGitHubのスターが1万個ほど集まっており、多くの人に好まれているようです。これほど大きなオーディエンスを持つ人物が、オープンソースAIに真剣に取り組み、他人のために興味深いものを作ろうとしていること自体が本当にクールです。

特に、ソフトウェアの「クックブック(レシピ集)」の部分に注目したいです。ここは大きな不満点だった場所です。ハードウェアに応じたモデルの推奨機能が含まれています。オープンソースの世界に入り、自分のパソコンで試そうとすると、最悪の泥沼にハマることになります。「このRAM容量のMacBook、あるいはこのグラフィックボードとこのCPUの組み合わせで、動かせる最適なモデルは何か」を突き止めるのは非常に困難だからです。最適解は決して単純ではありません。クックブックは、ユーザーのハードウェアを分析し、それに基づいて最適なモデルを推奨することで、この問題を解決しようとしています。

銀行口座の桁数やコンマの数で彼と競争しているわけではありませんし、彼がどんな資産を持っていようと、私と比較すべきではありませんよ。私の背景にはグリーンバックはありません。これは本物の窓です。向かいにある隣人の家の窓が丸見えです。要するに、私は彼を応援していますし、リリースしてくれたことを嬉しく思っています。

多くの人々にとってのボトルネックは、現在自宅にあるハードウェアです。そのため、多くの人が「ローカルAIはまだ実用的ではない」と考えてしまいます。モデルのダウンロードに果てしない時間がかかり、グラフィックボードがないため実際に動かすことができないからです。Nvidiaは長い間、それを変えようとしてきました。小型の専用ワークステーションをリリースしてきましたが、一般消費者向け、あるいは自宅のオンプレミス環境でのAI時代が本格的に到来しつつあります。Nvidiaは「RTX Spark」シリーズを発表しました。基本的にはシステム・オン・チップ(SoC)の時代であり、すべてのメモリや、エージェントのワークフロー、LLMの処理に特に適した専用プロセッサを統合しています。これらが、MacBookほどのサイズでありながら、Nvidiaが今週リリースしたような非常に巨大なオープンソースモデルを動かすのに十分なパワーを持つノートPCに搭載されます。

これに関しては、マシンが従来とは異なる処理を行うため、新しいドライバーをはじめとする様々な組み込みソフトウェアが必要になるという、少し厄介な側面もあります。すべてを1箇所に統合しており、現在は特にARMベースのコンピューター向けとなっているため、誰がこれに向けて開発を行うのかが課題になります。しかし、オープンソースソフトウェア全般の興味深い点として、最終的には自分でドライバーを構築することも、AIにドライバーを構築させることも、あるいはAIに接続部分を担当させることも可能です。シリコン(ハードウェア)とAIが出会い、それらが相互に作用し合うというのは、大局的に見て非常に魅力的な現象です。

この秋には、複数のプロバイダーから発売される予定ですが、現在は特にMicrosoftとの提携が強調されています。この新しいSparkハードウェアが組み込まれた新しいノートPCを購入すれば、コンピューター上でローカルにエージェントのワークフローを実行できるようになります。これは、プライバシーを懸念する場合や、大手のクラウドプロバイダーが値上げを始めて高額な請求が発生することを心配する場合に、極めて重要になります。自分のマシン上でエージェントが動作し、会話をしたり、画像を見せたり、外出先からスマートフォンでアクセスしたりできるようになり、すべての計算処理をローカルで行ってくれます。ポケットの中に自分だけのジャーヴィスを持てるようになるのです。

OpenAIの「goal」機能を使った自動ゲーム開発

さて、次の話題として、OpenAIの「goal」ツールについてお話しします。これはCodex内で利用できるもので、プロンプトに「/goal」と入力すると、プロンプトに目標を設定できます。つまり、達成すべき特定のゴールに向けてAIが自律的に試行錯誤を繰り返す機能です。Cloud Codeにも同様のバージョンが存在し、以前番組で紹介した古い「ラルフ・ウィガム・ループ」に基づいたものですが、基本的には「素晴らしいものを完成させるまで戻ってくるな」とAIに命じる機能です。

この番組を長く聴いてくれているリスナーなら覚えているかもしれませんが、私は約1年前にGoogle GeminiのAI Studioでクマのジャンプゲームを作りました。スペースキーを押して、クマのジャンプのパーセンテージを当てるという、非常にシンプルなものでした。今回、私はそのクマのジャンプゲームの新しいバージョンを作りました。42時間以上の開発期間の中で、私が手動で介入したのは5回から7回程度です。ケビン、私は非常にシンプルな指示を出しました。「このゲームをより良くしてくれ。数時間は没頭して遊べるようなものにしてくれ。画像生成ツールを使って様々なアセットを作成してくれ」と。42時間経った結果、完全に製品版として完成したとは言いませんが、非常に堅牢なバージョンのゲームが出来上がりました。今画面で見ていると思いますが、ケビン、前作との違いを具体的に説明してもらえますか。

クリックして長押しすると、クマがジャンプする軌道が表示されます。そして、昔のモータルコンバットのミニゲームにあったような、小さなパワーバーが表示されています。適切なタイミングで指を離してクマをジャンプさせ、コインやパワーアップアイテムを獲得し、安全な着地パッドに着地させます。そうするとハチミツやトークンがもらえ、ちょっとしたアップグレードを購入できます。私はこのハイスコアを塗り替えるつもりです。

面白いのは、私の古いゲームは非常にシンプルでしたが、今回のものにはアニメーションが組み込まれています。レベルアップのグラフィックもあります。これらはすべて自動で構築されました。私は一切手をつけていません。すべてCodexに任せました。私はCodexに対して、数回「舵取り」をしただけです。舵取りというのは、1行か2行の指示を入れて「そのまま続けて」とボタンを押すだけのことです。これがどれほど優れているかという話ではなく、ショーノートにリンクを貼っておきます。現在はVercel上にあります。一般向けに公開する予定はまだありませんが、さらに改良を加えたら公開するかもしれません。

何が素晴らしいかというと、この「goal」ツールを使えば、長期的な目標を与えて、あとはコンピューターを起動したまま自動で作業を進めさせることができる点です。この42時間の開発作業で、私のChatGPT Proアカウントの週間利用制限の約15%を消費しました。それなりの量ですが、生成された成果物の膨大さを考えれば、決して悪くはないですよね。並列で大量に処理を走らせたわけではありませんが、この「goal」機能を使ってみて、私たちはエージェントAIが人間のために働いてくれる未来に本当に近づいていると実感しました。ケビン、ゲームに完全に集中していますね。

完全にロックオンしています。ガビン、あなたの言う通りです。最後に「飛び込んで意見を言わなければ」と思った瞬間に、文字通りゲーム内でジャンプしてしまい、クマがプラットフォームを踏み外しました。フィーバーコンボが途切れ、今はひどく落胆しています。

皆さんもぜひこれを試して、楽しんでみてください。これも、現在のAIを使って実行できるもう一つの実験に過ぎません。文字通り、それほど難しいことではありません。「goal」ツールを使って遊んでみてください。それでは、また金曜日にお会いしましょう。バイバイ。

バイバイ。

バイバイ。これが私の新しい締めくくり方です。番組の最後に、できるだけ奇妙な方法で「バイバイ」と言う。視聴者維持率のグラフがどうなるか楽しみですね。

バイ。

コメント

タイトルとURLをコピーしました