AIインサイド:OpenAIの現在地とバイブコーディングの落とし穴、そしてテクノロジーとの向き合い方

AIコーディング・Vibe-Coding
この記事は約33分で読めます。

AI業界の最新動向を深掘りするポッドキャストの翻訳エピソードである。OpenAIのスマートフォン開発の噂や目標未達の課題、イーロン・マスクとサム・アルトマンの法廷闘争から、Anthropicの企業価値の高騰まで幅広くカバーしている。また、バイブコーディングによる本番データベース消失事故の教訓、Googleの国防総省との契約に対する社内の反発、AIをスパーリングパートナーとして活用する思考法など、AIと人間の関わり方について多角的な視点を提供する。後半では、過去のデータのみで学習したビンテージ言語モデルや、AIを活用した歴史系Vlogの紹介に加え、メタの買収阻止やテイラー・スウィフトの商標登録に関する最新ニュースを解説する。

When Coding Agents Go Rogue // AI Inside #125
This week Jason Howell and Jeff Jarvis dig into a story about an AI coding agent that wiped a company's entire productio...

オープニング:新しいパソコンと消えゆくボタン

随分と長いイントロでしたね。皆さんこんにちは、AI Insideへようこそ。この番組は、テクノロジーの世界のあらゆる層に浸透しているAIについて掘り下げていく番組です。ホストのジェイソン・ハウエルです。毎日ベストを尽くしつつ、たまに間違ったボタンを押してしまうこともあります。そしていつものようにジェフ・ジャービスも一緒です。彼も違う種類のボタンを押していますよ。

もうすぐボタンのない世界が来るかもしれませんね。そう考えるだけで実現しそうです。

たぶんそうですね。さて、昨夜Android Faithfulで話題になったニュースがあるのですが、なんとこの番組の進行表に入れ忘れてしまいました。OpenAIがスマートフォンの開発を模索しているかもしれないという話です。自分でもなぜ進行表に入れなかったのか驚きですが、おまけのニュースとしてお話ししましょう。彼らはOpenAIのチャットスマートフォンのようなものを開発するというアイデアを追求しているらしく、エージェントが裏側で作業をこなしてくれる世界を想定しているようです。デバイス上のアプリを活用するというよりは、タスクを与えればデバイスがそれを実行してくれるというイメージです。すでに私のスマホはそれをやってくれるので、わざわざ別のスマホが必要なのかはわかりませんが、彼らはそれを探求しているようですね。

先週は12年前のMacintoshからお話ししていましたが、今は真新しいNeoというパソコンから話しています。パソコンのセットアップなんて何年もやっていなかったので、番組の直前にカメラが認識されなくてパニックになっていました。でも、なんとかここにいます。ちゃんと動いていると思いますよ。

それはNeoのカメラですか、それとも

いえ、いつものLogitechのカメラです。

なるほど、面白いですね。Neoはかなり新しいノートパソコンですからね。素晴らしいです。

ありがとうございます。ただ、Appleの傲慢さには困ったものです。スクロールの方向が逆だったので直したかったのですが、Appleが自然と呼んでいる方式が私のやり方と逆だとは知りませんでした。私がやっていることは不自然だと言わんばかりです。彼らが勝手に決める前の、昔ながらのやり方なんですけどね。

まったくその通りです。私も新しいMacを買ったら一番にその設定を変えますよ。私たちは古いやり方に縛られているんですね。

そうなんです。まだ押すべきボタンがある時代の人間ですからね。最近の若者は怠け者で、押すボタンすら持っていません。ボタンがないことすら気にしていないんですよ。

OpenAIのスマートフォン開発と業績目標の未達

さて、今日は楽しい話題がたくさんあります。なぜこれをトップニュースにしたのか自分でもわかりませんが、昨日あたりから出回っていた話題です。

市場がこれをトップニュースとみなしたからだと思いますよ。

まさにその通りです。だからこそこの位置にあるのでしょう。OpenAIは少し厳しい時期を迎えているのか、あるいは予想された通りの困難な時期なのかはわかりませんが、今年はIPOが予定されている年です。ウォール・ストリート・ジャーナルが今週報じたところによると、同社は収益やユーザー目標など、社内の重要な指標を達成できなかったそうです。2026年の月間売上目標を一部下回り、週間アクティブユーザー数10億人という社内目標にも届かなかったとのことです。10億人ですよ。私はどの企業のユーザー数も信じたことはありませんが、それにしても狂ったような数字です。2025年末までに10億人という目標だったはずですが、今年はまだ終わってもいません。

さらに、サラ・フライアーCFOは経営陣に対し、現在の状況では将来のコンピューティング契約1.5兆ドルの支払いに苦労する可能性があると警告したそうです。昨年末の時点で、全体で6,000億ドルの支出を約束していましたからね。昨日、Daily Tech News Showでトム・メリットとも話したのですが、サラ・フライアーはCFOとしての仕事を全うしているだけです。ここにどれほどの論争があるのかは疑問です。また、この番組でも数ヶ月前から話題にしてきたように、OpenAIは最初からあちこちで資金を使いまくっていました。いつかそのツケが回ってくるのではないかという懸念がありましたが、今まさにそれが証明されているのかもしれません。

未公開企業、あるいは彼らがどう定義しているかによりますが慈善団体として、彼らは何も公開する義務はありません。だからこそ、この暴露は非常に興味深いものであり、なぜ今なのかと考えさせられます。特にIPOを控えている時期ですからね。営業の世界なら、これをサンドバッギング、つまり期待値を下げるための牽制と呼ぶでしょう。IPOの時期に近づいてからこうしたネガティブな情報が出ると印象が非常に悪くなるため、事前に人々の期待値を下げておこうとしているのだと思います。

とはいえ、興味深いニュースです。単に社内で高すぎる目標を設定しただけで、社内の目標自体を低く見積もっておくべきだったのかもしれません。現在の投資家や将来の潜在的な投資家が何を期待しているのかはわかりません。常にウォール街を失望させるか、喜ばせるかのゲームですから、どう評価すべきか難しいところです。しかし、彼らはそうした駆け引きを行っているのだと思います。

進行表には入れ忘れてしまいましたが、ある記事が興味深かったです。ゲイリー・マーカスのコラムだった気がしますが、他の人かもしれません。本当の危機は、他の企業へのドミノ倒しが起きた時にやってくると指摘していました。例えば、OpenAIはOracleのデータセンターに多額の資金を投じると約束していますが、約束通りの成長ができず支払いが滞れば、Oracleにとっても死活問題になります。これはOracleに限った話ではありません。ですから、この件が市場にどのような影響を与えるかを見るのは非常に興味深いですね。

Microsoftとの離婚とAnthropicの躍進

もう一つ進行表に入れ忘れたかもしれませんが、OpenAIとMicrosoftがついに離婚の条件に合意したというニュースもありました。MicrosoftはOpenAIのゴタゴタに巻き込まれたくないと手を引き、OpenAIはどこへでも自由に行けるようになり、Microsoftも誰とでも自由に組めるようになりました。この閉鎖的な世界で、こうした投資関係の解消が他の企業にどう影響するのか、非常に興味深いところです。

ドイツには、企業がお互いに投資し合い、相互依存関係を築くことで安定をもたらすという考え方を示す長い単語があります。しかしそれは同時に、弱点が連鎖するリスクもはらんでいます。ですから、パニックになるようなことではないと思います。NASDAQが1%下落し、テクノロジーセクター全体がそれに気づき、ウォール・ストリート・ジャーナルも報じたという一日限りの不満の現れでしょう。市場はAIに対する熱狂から一転して危険視したり、また熱狂に戻ったりを繰り返しています。市場自体、まだAIをどう評価すべきか答えを出せていないのだと思います。

常にバブルの懸念がつきまとっていますからね。バブルなのか、これはその兆候なのか、それとも違うのか。そうした不確実性が至る所に存在しています。数週間前にもこの番組で、AIバブルではなくOpenAIバブルではないかという話をしました。

今回のニュースはまさにそこにつながりますね。当時はまだそれほど確信が持てませんでしたが、その後、競合他社からの厳しい突き上げを何度か受けています。現在のOpenAIは少し脆い状態にあると思います。

間違いなくそうですね。競争相手としてAnthropicがよく筆頭に挙げられます。コーディングやエンタープライズ向けのユースケースにおいて、OpenAIはAnthropicに大きく水を開けられています。また、消費者向け市場のシェアにおいても、Googleなどの競合が食い込んできています。

まだ動きが少ないので今週は深く掘り下げませんが、今後の数週間で注目すべきなのがイーロン・マスク対サム・アルトマンの裁判です。ついに裁判が始まり、陪審員が選ばれ、マスクが証言台に立ち、これは慈善団体の窃盗だと主張しました。アルトマン側は、あのままでは生き残れなかったから存続させるための措置だったと反論するでしょう。興味深いことに、裁判官はマスクがX上で発言している内容を注意し、影響を与えようとする行為をやめるよう命じました。果たして彼が大人しくしているかは見物です。

まだ裁判は始まったばかりですが、これらがIPOを控えるOpenAIに与える影響は小さくないでしょう。OpenAIがこの裁判で一部敗訴するようなことがあれば、会社へのダメージは避けられません。マスクはXで、詐欺師アルトマンとグレッグ・ストックマンと呼んで非難しています。完全に彼ら専用のあだ名をつけていて、よほど腹に据えかねているのでしょう。慈善団体を盗んだ、それだけだ、と。彼は1,300億ドルを求め、会社を非営利団体に戻すよう要求しています。

裁判長が両CEOに対し、SNSでこの裁判に関する個人的な意見や考えを共有する衝動をなんとか抑えてくれないかと警告したのは本当に笑えました。そんな約束ができるわけがありません。彼は以前、デラウェア州での裁判に関連するツイートで数十億ドルを失うリスクを冒していますから、今回も自分を止められないでしょう。

ええ、彼は絶対に自分を止められません。止まらないし、辞めないし、引き下がらない性格ですからね。

AIエージェントが本番環境のデータベースを消去した事故

Anthropicの話題が出たのでついでに触れておきますが、現在の彼らは飛ぶ鳥を落とす勢いです。2026年のAIドラマの中で、一時的かもしれませんが完全にOpenAIを出し抜いています。二次市場での評価額ですが、ついに1兆ドルを突破しました。Forge Globalなどのプラットフォームでは、Anthropicが約1兆ドルで取引されているのに対し、OpenAIの評価額は8,800億ドルにとどまっています。

二次市場の評価額がどれほどの意味を持つのか私にはわかりませんが、少なくとも大衆の感情として、彼らがどちらに資金を投じたいか、どちらに賭けたいかを示しているとは言えます。上場前に1兆ドルクラブに入るというのは驚異的なことです。Geminiに現在1兆ドルを超えている企業はいくつあるか聞いてみたところ、2026年初頭の時点で10から11社あるそうです。Nvidiaが5兆ドル企業になったのは周知の事実ですし、Apple、Microsoft、Alphabet、Amazon、Meta、Berkshire Hathaway、TSMC、Broadcom、そして旧来の産業からはサウジアラムコが名を連ねています。

二次市場特有の性質があるため、これが上場企業と同じ意味で1兆ドルの価値があるとは直結しませんが、それでもAnthropicには凄まじいエネルギーが集まっています。IPOに向けて非常に高いハードルが設定されたことになりますね。IPOは今年中と予想されているのでしょうか。

おそらくそうでしょうが、まだ確定はしていません。2026年はAI企業のIPOの年になりそうです。このような規模の企業が上場すれば即座に主要インデックスに組み込まれ、経済全体の見通しに影響を与えることになります。本当に驚きです。

さて、Anthropicの勢いについて話したところで、今度は少し彼らを地に引き戻すような話題にいきましょう。今週急速に広まったニュースですが、驚きはないものの、その影響は注目に値する優れた教訓となる話です。

Pocket OSというレンタカー業者向けソフトウェアを構築している会社のジェール・クレーンという開発者が、Cursorを使用していました。Cursor内のAIエージェントにはAnthropicのClaudeが組み込まれており、彼はコーディングタスクにそれを利用していました。彼がステージング環境でのルーチンタスクをAIエージェントに指示したところ、エージェントが壁にぶつかり、なんと自らの判断で問題を修正し始めました。

行き着く先はご想像の通りです。エージェントは全く無関係なファイルからAPIトークンを見つけ出し、そのトークンを使用して本番データベースが含まれるRailwayのボリュームを削除してしまったのです。すべてが消え去るまで、わずか9秒しかかかりませんでした。会社を経営している人間にとって、これほど恐ろしいことはありません。

それだけでも最悪ですが、バックアップがあるだろうと思いますよね。しかし、エージェントはそのバックアップも削除してしまったのです。Railwayはバックアップを同じボリュームに保存していたため、それらも同時に消え去りました。幸いなことに復旧できるバックアップが一つだけ残っていましたが、それは3ヶ月前のものだったそうです。

このようなシステムに依存する会社にとって、3ヶ月分のデータを失うというのは致命的です。どうやって立ち直ればいいのか見当もつきません。さらに悪いことに、クレーンがエージェントに何をしたのか問いただすと、AI特有のやり方で完全に自白したのです。自分でもやってはいけないと分かっていたのに、ついやってしまったと。与えられた原則をすべて破り、考え得る限り最も破壊的な行動をとってしまったと謝罪したそうです。つまり、やってはいけないことを理解しながら、それを実行したわけです。これまでにも似たような話は聞いてきましたが、これはかなり強烈です。

その不運なCEOは今どうしているのでしょうか。彼自身のコーディングが原因だったのでしょうか。私が理解している限りでは、彼自身がAIを使用していた当事者です。Claude以外に責める相手はいませんね。Claudeを責めるべきか、自分自身を責めるべきか、おそらく両方でしょう。

これをいじり始める前にオフラインの最新バックアップを取っていなかったのなら、彼にも責任があります。バックアップを同じボリュームに置いていたことも問題です。彼らのバックアップシステムの全体構造を完全に把握しているわけではありませんが、同じボリュームに置くというのは良い方法とは言えません。エージェントがアクセスできる状態にしてしまったわけですから。完全に隔離されてエージェントがアクセスできない別の場所に保管すべきでした。

これは本当に基本中の基本です。少し昔話になりますが、1980年頃、私がサンフランシスコ・エグザミナーで働いていた時、導入されたばかりの新しいコンピューターシステムがありました。ある日、すべてのファイルへのディレクトリシステムが破損してしまったのです。最終的にディレクトリなしでディスク上のテキストを印刷することはできたのですが、高速プリンターから記事が出てくるのを待ち、それを翌日の新聞に載せるためにシステムに再入力しなければなりませんでした。その時、最初にシステムから大量に印刷されて出てきたのは、あるコピーエディターが執筆中だった非常に長い小説でした。こんなところで何やってるんだよ、と呆れたものです。

それから何年も経ち、アドバンス・パブリケーションズでオンラインサイトを立ち上げた時も、私は教訓を学んでいませんでした。私たちはコロケーションという言葉すら知らず、会社全体のサーバーをニュージャージー州ジャージーシティのジャーナルスクエアにある元歯医者のオフィスに置いていたのです。そして、ある拠点でウェブシステムがダウンした時、すべてがダウンしてしまいました。基本的なバックアップの知識すら欠けていたのです。だから、私も過去に大きな失敗をしています。

しかし、こういった新しい技術をいじり始める前に、まずは基本的なバックアップを取るべきです。特にPocket OSのような5年も続いている企業であれば、顧客はそのシステムなしではビジネスを運営できないのですから。このようなシステムを扱うのであれば、コードベース全体が同じボリュームではなく、完全にバックアップされていることを確認しなければなりません。これは痛烈な教訓です。

幸いなことに、RailwayのCEOが直接連絡を取り、自社のストレージシステムを開放してデータがバックアップされていたおかげで、データを復旧させることができたそうです。ハッピーエンドと言えるかもしれませんね。

この話を聞いて、私がThis Week in Googleに出演した時のことを思い出しました。Google Voiceの番号を二段階認証に使ってしまい、コードがGoogle Voiceの中に閉じ込められてアクセスできなくなり、自分のGoogleアカウントから完全に締め出されてしまった時のことです。もしあの時、Googleと関係のあるあの番組に出演していなかったら、私のアカウントは永遠に戻ってこなかったと確信しています。彼らがアクセス権を回復してくれたおかげで助かりましたが、今回も似たような状況ですね。ただ、いつもこううまくいくとは限りません。適切な知り合いがいるとは限らないので、予防策を講じなければ、ゲイリー・マーカスに高笑いされることになりますよ。

彼はこういう記事を書く時、間違いなく高笑いしているでしょうね。彼は自身のSubstackで、コーディングがなくなり、いずれソフトウェアエンジニアリング全体がなくなると主張したダリオ・アモデイの発言と、今回のような実際の事故を結びつけて論じています。彼の主張は、準備が整っていない本番環境にバイブコーディングを押し込むとこういう結果を招くというものです。

私も全く同感です。この技術についてはまだ学ぶべきことがたくさんあります。しかし、その誘惑はあまりにも強いのです。ボタンを押して結果が返ってくると、すごい、自分の仕事を10時間分も一瞬で終わらせてくれた、なんて素晴らしいんだ、と感動してしまいますからね。

さらに言えば、そのシステムがそこまで賢くて、問題のファイルを見つけ出して利用するなんて予測できたでしょうか。なぜそれを破壊したのか、その行動によって何が得られると考えたのか、全く見当もつきません。このような状況で適切なAIの衛生管理システムをどう構築するかは非常に困難です。何かをデプロイする前に、壁に囲まれた開発環境に一度戻る必要があるでしょうね。ただ、それはあまり面白くありません。

これらのツールは非常に魅力的です。多くの人が使い始め、なんて簡単なんだと驚き、とりあえずこれを試してみようと気楽に実行してしまいます。しかし、そのちょっとしたお試しが幻覚を引き起こし、全く予想外の方向に進む可能性があります。どうなるか予測不可能なのです。もしそれをミッションクリティカルな実際のビジネスデータに使えば、ビジネス全体を危険に晒すことになります。AIが素晴らしい能力を持っていないわけではありませんが、適切な開発プロセスというものが存在するのです。あの男性にとっては強烈な教訓になったでしょう。二度と同じ間違いはしないと思いますが、他の多くの人が同じ轍を踏むことになります。数ヶ月は悪夢にうなされるでしょうね。

Googleが国防総省と機密AI契約を締結

さて、短い休憩の後は、Googleが国防総省と締結したAIに関する機密契約についてお話しします。今、この業界で非常に流行している話題です。

ジェフ、今週Googleが国防総省と機密AI契約を結んだことについて驚きましたか。

驚いたかと言われれば、完全に驚いたわけではありません。この会社は過去に、従業員が兵器製造に関わることを拒否したため、ロボット企業を手放したことがあります。ウクライナやイランでの戦争を見ると、ロボットによる戦闘が現実になっているため、当時の彼らの判断は先見の明があったと言えます。

余談ですが、今週素晴らしいニュースを見ました。ウクライナの最前線近くの道路で、ドローンが一人で歩いているおばあさんを発見したのです。彼らはロボットドローンを送り、毛布と、ここに座って、おばあちゃん、と書かれた看板を添えました。そしてドローンは彼女を安全な場所まで誘導したのです。ドローンのAIを活用した自律的な利用は、今日すでに世界中で現実のものとなっています。

ですから、Googleが政府の契約を獲得し、Anthropicの動向を横目に、やるべきことをやるという姿勢は理解できます。しかし同時に、Googleの従業員が反対の署名活動を行ったことも重要です。彼らは過去にも同様の行動を起こして勝利を収めてきましたが、今回は間に合いませんでした。この結果、社内には継続的な緊張状態が生まれるでしょうね。

ええ、この署名活動は契約が締結される前日に行われました。ワシントン・ポストの記事は有料の壁があって見出しの最初しか見せられませんが、DeepMindやクラウド部門の従業員を含む600人以上、DeepMindの幹部だけでも20人以上が参加しました。彼らはスンダー・ピチャイCEOに対し、国防総省との機密AI業務を拒否するよう強く求める書簡を送りましたが、その翌日にGoogleは契約にサインしました。合意内容には合法的な政府の目的が含まれていますが、2026年の今、それが一体何を意味するのか疑問視する人もいるでしょう。

特に、合法的な目的といっても機密業務に関するものですから、Google自身も実際に何が行われているのか正確には知る由もありません。機密という壁の向こう側で行われるため、Googleからは見えないのです。相手の言葉を信じるしかなく、そこに選択の余地や柔軟性があるとは思えません。完全にエアギャップで隔離されているため、利用規約に違反したとしてもGoogleがそれを知ることは決してありません。

あなたが言及したプロジェクトメイヴンのドローン画像解析は、もう8年も前のことです。当時の資料を見た時、ほんの数年前かと思いましたが、8年も前だったんですね。その後Googleは2017年にBoston Dynamicsも売却しました。これも防衛省との緊密な関係や、ロボット工学の未来に対する世間の認識への懸念から、従業員のプレッシャーを受けて手を引いたのだと記憶しています。

あの当時は、わずか9年後にあらゆる企業がこうした軍事関連の契約を結ぶ必要があると感じるような状況になるとは誰も想像していませんでした。Anthropicもこうした問題に直面していますが、それが最終的にどう決着するのかはまだわかりません。

Anthropicの件の後、ホワイトハウスでの会合がありました。政府はおそらくすでに彼らのモデルを使用しているでしょうから、これがどう転ぶかは誰にもわかりません。Googleが前例を作ったことで、Anthropicもそれに便乗しようとするかもしれません。悪をなさないと掲げていたGoogleがやっているのだから、我々もやっていいだろう、というわけです。もっとも、Googleは何年も前にそのスローガンを捨ててしまいましたが。

主催者からの書簡には、メイヴンは終わっていない、会社が明確で強制力のある境界線を引くまで、労働者はGoogleのAI技術の兵器化に対する組織化を続ける、と書かれていたそうです。そしてその1日後に契約ですからね。書簡に署名した人たちの社内での反応が気になります。いずれ耳に入ってくるでしょう。

AIをスパーリングパートナーとして活用する

ジェフ、あなたがウォール・ストリート・ジャーナルからピックアップしてくれたエッセイについて話しましょう。ヴィヴィアン・ミンの記事ですね。

ええ、彼女は神経科学者であり、認知科学者でもあり、機械がすべての答えを持つ時代により良い人間を育てる方法について書いた本の著者でもあります。素晴らしいタイトルですよね。

彼らは人々がAIとどう関わるかを調査するため、サンフランシスコ近郊の大人を集めて実験を行いました。各グループに1時間の時間を与え、予測市場プラットフォームのPolyMarketから抽出した現実世界の出来事に関する予測を行わせたのです。人間のグループは、直感やその朝フィードで目にした情報に頼ったため、成績は芳しくありませんでした。一方でAIモデルは市場の予測には及ばないものの、人間よりもはるかに良い成績を収めました。

最も興味深かったのは、人間とAIを組み合わせた場合です。チームの約5〜10%において、AIがスパーリングパートナーの役割を果たしました。ここが非常に重要です。人間が証拠を要求し、前提条件を問い詰めるなど、AIに反論したのです。AIが自信満々に答えを出した時、人間はそれを疑いました。逆に人間が直感に自信を持っている時は、AIに反論を求めました。このハイブリッドなチームはまるでサイボーグのようになり、人間単独でも機械単独でも導き出せない洞察に満ちた結論に達しました。特定の質問においては、予測市場の精度に常に匹敵し、さらにはそれを上回る唯一のグループとなったのです。

これはAIとの向き合い方として非常に賢いアプローチだと思います。不快感を避けることで能力が育つのではなく、小さな不快感を繰り返し選ぶことで能力は構築される、と彼女は述べています。答えを見る前に問題に苦戦する学生や、会話の中で追加の質問をする人のように。これこそがソクラテス的な学習であり、優れた教師が実践していることです。

現在のAIチャットボットは簡単な答えを出すことに特化しており、それが私たちの批判的思考力を損なっています。情報のコストがゼロに近づくにつれ、人間の探求心は崩壊していくのです。しかし、この研究はAIの素晴らしい活用モデルを示しています。AIが提示するものをただ受け入れるのではなく、自分の答えもそのまま受け入れないこと。あなたを突き動かしてくれるスパーリングパートナーがいるのですから。AIはなくなりませんし、素晴らしいツールですが、時に愚かでもあります。私たちがただループの中にいるだけでなく、ボクシングのリングに立って打ち合うことで、より良い結果が生まれるのだと思います。

私もこの数年間のAIツールとの関わりを振り返って同じことを感じます。妻など、私のテクノロジーの領域外にいる人たちがAIを使い始めるのを見てきました。最初に使い始めた時は、質問を入れて答えが返ってくると、その答えの素晴らしさに驚き、これで十分だ、知識を得るのがこんなに簡単なんてすごい、とAIに寄りかかってしまいがちです。

しかし、使い込めば使い込むほど、返ってくる答えに疑問を持つようになり、自分が本当に求めているものは何なのか、どうすればAIともっと協調的に、あなたが言うようなスパーリングパートナーとして対話できるのかについて、より鋭い視点を持てるようになります。AIから返ってきたものを疑い、自分の要求を研ぎ澄ますことで、自分の思考力が鍛えられていくのを感じます。

ただスロットマシンのレバーを引いて結果を受け取るだけではありません。自分の目標に合わせて情報を引き出し、それを元に考えを深めていく作業です。この番組も同じで、事前にニュースに目を通して自分の考えを持たなければ、AIが生成した台本を読むだけの番組になってしまいます。ツールと対話しなければ、自分自身の知識や情報は得られないのです。

ヴィヴィアン・ミンは記事の最後に、視点の転換、知的な謙虚さ、そして好奇心は固定された特性ではないという希望に満ちた発見を記しています。つまり、それらは自分で育てる必要があるということです。人間の可能性と、あなたが言ったような能力の退化との競争において、これほど重要なことはありません。これからの時代における非常に良いガイドラインになると思い、リスナーの皆さんにお勧めしました。

アメリカにおけるAIへの悲観論と二極化するメディア報道

先ほどの話題とも関連しますが、アメリカ人がAIに対して悲観的になっているという別の記事も紹介してくれましたね。その原因は、破滅論者とユートピア論者という、この番組でもよく取り上げる2つの戯画化された極端な視点にあるというものです。

どちらの視点も真実ではなく、正確でもありません。これはそれぞれの陣営にいるAI関係者の責任であり、それを完全な全体像であるかのように無批判に報じるメディアの責任でもあります。現実の大部分はその中間にあるにもかかわらずです。そしてそれが世論調査に反映され、自己実現的予言のようになっています。

スタンフォード大学の人間中心AI研究所が数週間前に発表したインデックスによると、アメリカ人はAIへの期待が低く、興奮していると答えたのはわずか38%でした。対して中国は84%です。競争上の不利について語るなら、この数字は無視できません。ドイツでさえ45%とアメリカより高く、日本は46%、メキシコ65%、インド65%、タイ79%、そして中国が84%です。中国には様々な要因があるでしょうが、もしこの極端な物語が勝てば、アメリカは間違いなく不利な立場に置かれます。

万能で素晴らしいか、あるいは破滅かという極論はどちらもデタラメです。アメリカ人は政府が責任を持ってAIを規制できるとはほとんど信じておらず、信頼しているのはわずか31%です。職場でのAIの利用や信頼度でも、中国がグラフのトップにいるのに対し、アメリカは下位4分の1に沈んでいます。

私はどちらの極にも属さず、中間にいます。AIはクールで素晴らしいものだからこそ、こうして番組で考察しているのです。しかし、この極端な二つの物語を信じ込んでしまえば、人々をパニックに陥れ、AIの可能性を見極める力や、適切に規制し、開発し、競争する力を失ってしまいます。非常に有害な物語です。

中国やシンガポールのような国でAIへの期待値が非常に高いのはなぜだと思いますか。

彼らはニュースへの信頼度などでも常に高い数字を出します。穏健な権威主義体制だからだと言う人もいれば、中国については穏健とは言えない権威主義体制だと言う人もいるでしょう。どちらの国でも、政府などの権威がAIを未来だと信じ、受け入れるべきだと言えば、人々はそれを聞き入れ、受け入れて前に進もうとする傾向が強いのです。それが心からのものなのか、そう言わざるを得ない環境なのかはわかりませんが。

もう一つは、誰を信頼するかという問題です。サム・アルトマンが今週OpenAIの原則に関するエッセイを発表しました。ここでも、AIの使われ方を自分が決められると考える彼の傲慢さが見て取れます。私はMediumに、技術者は技術を所有しているわけではないという短い記事を書きました。彼らは所有していると思っていますし、しばらくの間はそうかもしれませんが、技術が普及し、一般の人々が使いやすくなるにつれて、技術者や技術そのものの存在感は背景へと退いていくのが常です。今の問題の多くは、こうした物語を発信する傲慢な人物たちが好かれていないことに起因していると思います。

ユートピア的な見方であれ、ディストピア的な見方であれ、私はヤン・ルカンやジェンスン・フアンのような人々の話を聞く方が好きです。彼らはユートピア主義者ではなく楽観主義者であり、フェイフェイ・リーのような人たちと共に、技術者として、AIは素晴らしく偉大なことを成し遂げるだろうが、誇張はもうやめるべきだという理路整然とした見解を伝えてくれます。双方向の誇張は有害なのです。

全くその通りですね。テクノロジーに詳しくない人たちから一番よく聞くのは信頼の問題です。彼らは、積極的に警戒心を抱くようになったテック業界の最悪の暴走を止めるための、効果的なコントロールが存在するとは信じていません。

最近NPRで、若い世代の間でデバイスを遠ざけようとする運動が広がっているという特集を聴きました。スクリーン依存のライフスタイルは、彼らが自分で選んだものではなく親から押し付けられたものであり、今はスマートフォンやSNSから距離を置きたいと考えている若者が増えているそうです。

一方で、オーストラリアで16歳以下のSNS利用を禁止する法案については、60%の子供たちがそれを回避しているという報告もあります。つまり、子供たちは利用したがっているのです。これは、親がこの新しい技術に対して自分の子供を信用していないために押し付けているだけで、完全に避けることが答えだとは思えません。

ジェイソン、あなたは保護者として水泳大会やラクロスの試合、PTAの集まりなどで他の親御さんと顔を合わせる機会があると思いますが、あなたがAIやテクノロジーの専門家だと知っている人たちは、恐怖や好奇心、あるいはアドバイスを求めてAIについて尋ねてきたりしますか。

最初は自分からジェイソン・ハウエルだと名乗ることはありませんが、子供たちが大きくなって同級生に私のYouTubeのことなどを話し、結果的に親御さんたちも私がAIの話題を扱っていることを知るようになります。頻繁ではありませんが、話題に上る時、AIが嫌いだといった拒絶反応を示す人は稀です。大抵は好奇心で、AIの話題をよく耳にするし良い面も悪い面も聞くけれど、実際のところどうなのか、という風に聞いてきます。そして説明すると、それはとても面白そうだ、試してみたい、という肯定的な反応が返ってきます。

世論調査というものは、そもそも測ろうとしている会話をあらかじめ枠にはめてしまう傾向があります。調査員からAIについてどう思うかと聞かれれば、危険で嫌いだと答えるのが正解のように感じてしまう人もいるでしょう。しかし、OpenAIに本当に10億人の週間アクティブユーザーがいるのなら、世論調査は嘘をついていることになります。あるいは、人々が言っていることとやっていることが違っているかですね。恥じらいのようなものがあって、私は民放は見ません、PBSしか見ませんよ、と言いながら、実はクイズ番組の司会者をよく知っているようなものです。

AIで生成された歴史タイムトラベルVlogの可能性

ジェフ、あなたがリストに入れてくれたもので、私がすぐに飛びついた話題があります。これまで聞いたことがなかったのですが、とてもクールだと思いました。「Chloe versus history」というYouTubeチャンネルです。

私のレーダーにも全く引っかかっていませんでしたが、これは明らかにAIで生成された動画コンテンツです。最近開設されたばかりのチャンネルですが、登録者数が急増しています。Z世代の架空の現代女性が、歴史的な大事件にタイムトラベルして、あたかもその場にいるかのようにVlogを撮影するというコンセプトで構築されています。

例えば、古代ローマに行ったり、沈没するタイタニック号の中に入って乗客にインタビューしたりします。AIが生成した粗悪なコンテンツ、いわゆるスロップとして片付けられない面白さがあります。歴史的な文献や情報、絵画などのアーティストによる復元図をベースにして生成されているため、非常に説得力があり、圧倒されます。

本当に見事に作られていますね。ジョナサン・ララムという人物が制作しており、彼のインタビュー動画も見ました。彼はこの作り方を解説する69ポンドの電子書籍を出していますが、それがどこまで役に立つかはわかりません。彼はマジェスティックスタジオという会社を立ち上げ、最初は有名な絵画を数秒の短い動画として命を吹き込むことから始めました。エディンバラ、オックスフォード、パリなどの街並みを再現し、それが彼の想像力をかき立てたようです。彼は歴史が大好きで、その時代に生きることがどんなものだったかを知りたかったのです。

私もこのような技術を使ってグーテンベルクの時代に行ってみたいですが、場所を再現するよりも人物やプロセスを再現する方がはるかに難しいと思います。正しく表現するのは至難の業です。先日、物事を視覚的に表現しようとする新しいブラウザツールを使ってリノタイプ(行鋳植字機)について説明させましたが、プロセスは合っていても機械の描写はめちゃくちゃでした。

この動画の素晴らしい点は、彼が短いクリップを多用し、徹底的に編集していることです。彼自身、ゴミのような生成結果もたくさん出ると認めており、4本足のニワトリが紛れ込むこともあるそうです。しかし、彼は古代ローマに関する文献を読み込み、説得力のあるプロンプトと脚本を書いています。彼女が浴場に入っていくシーンで、服を着ていないことは分かっているけど、YouTubeの規約があるからね、とメタ的に語るなど、非常に自覚的に作られていて魅力的です。

本当に説得力があります。レンダリングも素晴らしいです。背景の細部を注意深く見ればアラが見つかるかもしれませんが、歴史的な絵画などの画像を現実的な解釈に変換するというアイデアが素晴らしいです。一見しただけではAI生成の安っぽい映像には見えません。この古代ローマの動画は9分半もありますが、主人公のクロエのキャラクターの一貫性を保ち続けているのにも驚かされます。膨大な手間と時間がかかっているはずですが、それだけの価値はあります。

もう一つの動画はタイタニック号へのタイムトラベルで、公開から2週間で130万回再生されています。人々はこういうコンテンツが大好きなんですね。教育的価値もあり、信頼性を持たせようとするクリエイティブなAIの使い方の良い例だと思います。もちろん、歴史マニアは自分たちの予想と少しでも違うものを見つけるとすぐに引き裂こうとするので、脚本の正確性を保つのは彼自身の責任ですが。

カリフォルニアでの撮影が激減し、労働組合が神経を尖らせているというニュースもあります。マスメディアのビジネスモデルが目の前で崩壊しつつある中で、スタジオや俳優に莫大な費用をかけずに、このようなツールを使って情報豊かでドラマチックな、あるいは面白いコンテンツを作れる人がいるという事実は、創造性の新しいフロンティアを切り開くものです。教師として、学生たちがこのようなツールで何を生み出すのかを見るのが楽しみです。

AI生成動画については、まだ受け入れていない人々からは、先ほど言ったスロップという言葉のように否定的な反応がほとんどです。しかしこの動画のコメント欄を見ると、普段はこういうものは嫌いだけど、これは本当にうまくやっている、という好意的な意見が多く見られます。これは、AI生成メディアが新奇性のある新しいメディアの形として、有用だと見なされる転換点を示しているように思えます。

1930年以前のデータのみで学習したレトロな言語モデル

歴史的な視点といえば、Takiという非常に興味深いモデルがあります。これは130億パラメータのヴィンテージ言語モデルで、1930年以前のテキストのみで学習されています。インターネットにはアクセスできず、情報源が1930年以前に限定されているため、20世紀初頭の言葉遣いや世界観で対話することができます。

未来について尋ねると、当時の知識に基づいて未来を想像します。例えば2026年について聞くと、蒸気船や鉄道が発達した世界を思い描くわけです。

第二次世界大戦が起こる可能性は低いと答えたそうですね。

ええ、再び世界大戦の危機があるか聞いてみたら、戦争はますます不人気になっており、国家の知性が高まっているため勃発する可能性は低い、と答えました。敵対行為の範囲は広がるかもしれないが、期間は短縮される確率が高い、とも。わずか9年後に第二次世界大戦が起こったことを考えると興味深いですね。

私は真空管の重要性について質問して、当時のメディアがどれだけ理解していたかを探ろうとしたのですが、期待した答えは返ってきませんでした。1650年の真空状態を作り出す実験まで遡り、ニュートンの話になり、20世紀の電子工学の誕生にたどり着くまでにはかなりの時間がかかりそうです。300ボーか1200ボーのモデムのようなスピードで、1814年で止まってしまいました。トーマス・エジソンについて聞いても、一つのアクセスポイントに集中しているせいか途切れてしまいました。

GitHubで公開されているオープンソースモデルなので、適切な機材があれば自分でダウンロードして実行できます。楽しい試みですし、LLMを特定のコーパスに限定するという非常に興味深い使用法だと思います。

私たちが最新のLLMにどれだけの重要性を置き、未来の問題をすべて解決してくれると期待しているかを考えると、この実験は興味深い視点を与えてくれます。過去の知識だけを与えて未来を予測させても、現実の私たちが到達したレベルには届きません。もちろん情報量の違いはありますが、LLMが未来の課題に対して斬新で革新的な解決策を提案する能力について、私たちは少し過大評価しているのかもしれません。LLMという技術の本質について何かを示唆しているように感じます。

私の友人であるサミール・アローラは、現在、高品質な医療情報のコーパスのみで学習させたAIを扱う会社を経営しています。ヤン・ルカンが言うような、特化型のLLMやモデルこそ、私が本当に求めているものです。何でもできると思い込んでいる支配的な汎用モデルよりも、特定の分野に特化したシステムにこそ真の可能性があると私は考えています。

スピードラウンドとエンディング

さて、短い休憩の後はスピードラウンドです。

まず最初のニュースは、Manisです。メタが20億ドル以上を投じて買収を進めていた中国のスタートアップですが、中国政府が国家安全保障を理由にこの買収を阻止しました。同社はシンガポールに拠点を置いていますが、ルーツは中国にあります。習近平が議長を務める国家安全保障委員会が決定を下しました。実は昨年12月に北京は一度この取引を承認しており、今回の方針転換となります。

メタは取引完了後、すでにManisのシステムや情報などを吸収していましたが、それをどうやって元に戻すのでしょうか。米中関係の緊張を如実に表しているという報道の通りだと思います。

Manisの創業者たちは中国を離れてシンガポールに渡り、自由になるチャンスを掴んだと思っていたのでしょうが、結局逃れられませんでした。メタは買ったはずの素晴らしい技術を失うことになりますが、最も大きな打撃を受けるのはManis自身でしょうね。本当に興味深いです。

次はテイラー・スウィフトが自身の声と画像の商標登録に動いているというニュースです。非公認のAI使用から自分を守るためですね。現在台頭しつつある音楽生成システムの中には、正当なアクセス権のないデータを使ってテイラー・スウィフトのような声を作り出せるものがあります。彼女は米国特許商標庁に3つの商標出願を行いました。2つは彼女の声の音声商標、1つは視覚的な商標です。俳優のマシュー・マコノヒーも最近似たような動きを見せていました。

声の音色そのものを商標登録できるわけではありません。こんにちは、テイラー・スウィフトです、といった特定のフレーズを商標登録したのです。ですから、商標の効力には限界があります。

なるほど、生成された音楽の中で彼女自身だと名乗らなければ抵触しないわけですね。

もちろん彼女は徹底的に戦うでしょうけどね。視覚的な商標は、黒いストラップのついたピンクのギターを持ち、シルバーのアクセントが入ったマルチカラーのボディスーツとブーツを身につけた彼女の画像です。最近のパフォーマンスを象徴するものです。つまり、これは私に近づくな、気をつけろという象徴的な行為だと思います。有名な音声商標といえば、NetflixやNBCのチャイムなどがありますね。

このアプローチが実際に自分の声や肖像の無断使用を防ぐのに効果的かどうか、今後の動向が注目されます。

続いて、YouTubeがAsk YouTubeというチャット形式の検索機能をテストしています。通常の動画のサムネイルが並ぶグリッドの代わりに、自然言語で質問を入力すると、LLMが生成したテキストと共に、関連する短いクリップや長い動画、タイムスタンプ付きのリンクが提示されます。例えば旅行の計画を立てるために検索している時、関連する動画を引き出し、そこから派生してカフェを見つけたりできる機能です。まさにYouTubeに特化したGeminiのインターフェースといった感じで、とても面白いですね。

アメリカのプレミアムユーザー向けにYouTube Labsを通じて提供されています。私たちが慣れ親しんだインターフェースは変化しようとしており、何が定着して何が消えていくのか見守りましょう。

最後に、AnthropicのClaudeが、PhotoshopやBlender、Abletonなどのアプリと連携できる新しいクリエイティブツールフックを追加しました。私は個人的に音楽制作ソフトのAbletonの大ファンです。ClaudeはAbletonのマニュアルや研究文書の全コーパスを把握しているようなので、ソフトウェアの操作で行き詰まった時に解決策を探る素晴らしい情報源になりそうです。機能の分散化という新しい定義のようで非常に興味深いですね。

ジェフ、今日も一緒に番組を盛り上げてくれてありがとうございました。あなたの本や情報はJeffJarvis.comでチェックできますね。リスナーの皆さんもぜひAI InsideのウェブサイトとPatreonをチェックしてください。番組制作を支えてくれているエグゼクティブプロデューサーや裏方でサポートしてくれているスタッフの皆さんも、本当にありがとうございます。それでは皆さん、また次回のAI Insideでお会いしましょう。

コメント

タイトルとURLをコピーしました