本動画は「Wading Through AI」の第3エピソードであり、AIを利用する際の人々の体験がなぜこれほどまでに不均一であるかを探求している。AIを使って生産性を劇的に向上させる人がいる一方で、全く役に立たないと感じる人がいる理由について、技術自体の特性、タスクの適合性、利用者のスキル、そして心理的要因などの多様な観点からAI専門家のディミトリ・スパノスが解説する。さらに、現在の企業におけるAI導入の現状や、真の生産性向上を得るための現実的なアプローチについても議論が交わされている。

Wading Through AI エピソード3へようこそ
Wading Through AIの第3エピソードへようこそ。このエピソードでは、ディミトリと私が、一見同じようなタスクにAIを使用しているのに、人によってまったく異なる体験をしているという非常によくある現象について話し合います。
AIが非常に得意とされているタスクをこなすために、推奨されているプロンプトのテクニックを駆使してAIを利用している方もいるでしょう。耳にしたアドバイスをすべて試してみても、結局仕事が片付かず、自分でやった方が早かったのではないかと思うほど、AIの世話や後始末に時間を費やしてしまうことがあります。
あるいは、まったく逆の経験をしているかもしれません。仕事の特定の作業をAIに任せるのがとても簡単で、順調に進んでいるという方もいるでしょう。しかし、ネット上で他の人たちの意見を見てみると、同じようなことにAIを使おうとしたけれど全く上手くいかなかった、品質が低かった、などという声がたくさん溢れています。
AIに対して肯定的であれ否定的であれ、どちらの場合でも、自分がおかしいのだろうか、それとも世界がおかしいのだろうかという気持ちになるものです。AIを使ってやろうとしていることに対して、自分だけが特別に下手、あるいは上手いのだろうか。他の人はスキル不足なのか、それとも自分よりスキルがあるからなのか、と考えてしまいますよね。
そこでこのエピソードでは、テクノロジーとしてのAIに、他の新興技術と比べてこうした極端な結果を生み出しやすい根本的な特徴があるのかどうかを探っていきたいと思います。
さて、今回で3回目のエピソードとなりますので、初めてこの番組をご覧になる方のために改めてお伝えしておきます。ディミトリはAIの専門家ですが、私はそうではありません。私はAIを職業にしているわけではないのです。ですから、私たちが話しているときは、専門家であるディミトリの視点に注目して聞いてください。
彼は本当にこの分野に精通しています。私は単に会話を進め、議論のポイントを提示しているだけです。彼の発言に焦点を当て、私の発言は常にAIの部外者としての視点であるということを覚えておいてください。
ディミトリ、前回は企業がどのように情報を発信しているか、つまり企業のPR部門が実際のエンジニアとは全く違う誇大広告や宣伝を行っている可能性があることについて話しましたね。そしてそれがソーシャルメディアに波及すると、また別のものへと変化していくというお話でした。
そこから、AIに関するさまざまな主張をどのように評価すべきかという分析をしていただきました。そして今回は、それに関連しつつも全く異なる視点からのトピックについて話したいとのことでしたね。つまり、企業やAIを売り込もうとしている側からではなく、実際にAIを使用しているさまざまな人々の体験談をどのように捉えるべきか、ということです。
事前にも少し話しましたが、あなたが指摘した非常に興味深いポイントがありました。それは、同じ業界内、あるいはほぼ同じユースケースであっても、AIが役に立つかどうか、仕事で使うよう強制されているかどうかなどについて、人によって全く異なる意見を聞くことがあるという点です。このように、ほぼ同じことをしているのに様々な人から信じられないほど多様な主張が飛び交っている状況を、私たちはどのように理解すればいいのでしょうか。
AIに対する懐疑論者と楽観論者の視点の違い
はい、まさにその通りです。私がこのことについて考えるとき、AIに懐疑的な人たちとAIに楽観的な人たちの両方と話をしていて、ある時点で皆が、私がおかしいのか、それとも周りの人がおかしいのかと感じていることに気づくんです。
AIに懐疑的な人たちの場合、自分で試してみたけれど使い物にならない、絶対に本番環境では使わない、AIの脅威も感じないし、無理に使う必要性も感じないと考えています。しかし、真面目に仕事をしている知人がAIを多用しており、生産性が劇的に変わったとか、プログラマーの仕事が奪われるなどと言っているのを耳にします。最初のエピソードでもその主張については少し触れましたが、特定の主張がどうこうというより、それが懐疑論者にとっての狂気のひとつの形なのです。
一方で、楽観論の側にいる人たちもいます。このような人たちは懐疑論者ほど多くはないかもしれませんが、私はたくさん知っています。彼らは、なぜこの可能性に気づかないのか、友人のことが理解できないと言います。もし今AIの波に乗っていないなら、あなたはおかしい、時代に取り残されてしまうぞ、と。これは決して批判的な意味で言っているわけではなく、彼らはこれを未来にとって当たり前のことだと捉えているんです。すでにAIから多くの恩恵を受けていると感じているからです。
正確に言うと、彼らはAIから多くのものを得ていると感じており、プログラミングだけでなく、アートやマーケティング、金融などの分野でAIを導入していない友人たちがなぜそうしないのか不思議に思っているのです。最近ではAIを活用してExcelの処理ばかりしている人たちからもこういう話を聞きますから、これはプログラマーに限った話ではありません。これほど明らかに革新的なものを採用しないなんて、あの人たちはどうしてしまったんだ、という感覚ですね。
ええ、よくわかります。ここで私自身のちょっとしたエピソードを紹介すると、状況を上手く要約できるかもしれません。私自身は、AIに対して懐疑的というよりも、どちらかというと無関心な部類に入ると自分では思っています。
ですから、その意味では私はAI懐疑論者ではないと思うのですが、もし私がそうだとしたらどうなるかを考えてみましょう。先日、X(旧Twitter)にこんな投稿をしました。高校時代の友人が読んだ本に、ずっと心に残っている言葉があったと言うんです。それは、一インチ与えれば一マイル奪われる。その一インチを取り上げれば、彼らはただその一インチを取り戻すことだけを望む、というものです。
これは私が考えたものではありません。本当に素晴らしい言葉なので、自分の手柄にできればいいのですが、違います。友人が読んだ本に書いてあったもので、友人が考えたわけでもありません。
それで私は、この言葉を知っている人、この本を読んだことがある人はいないかと尋ねたんです。すると、実際に返信がありました。数ある返信の中に、AIに尋ねてみたという4人の異なる人からの返信がありました。彼らはそれぞれ異なるAIに質問し、それぞれが全く違う本からの引用だと私に教えてくれました。そして、そのどれもが実際の本ではありませんでした。AIがただ適当に作り上げただけだったのです。
ですから、この技術に懐疑的な人がそのような経験を持つのも無理はないと容易に理解できます。それが彼らにとってのAIとの最初の接点だとしたらどうでしょう。こんなの最悪だ、適当なことをでっち上げるようなものを、一体何に使えっていうんだ、と思うはずです。ですから、最初からこのような混乱が生じる理由はよくわかります。私の言っていることは理解できますか。
過去の技術(Wi-Fi)とAIの体験の大きな違い
はい、完全に同意します。そしてそれは、私たちがこれから深く掘り下げることができるいくつかの関連する方向性につながっています。つまり、過去のテクノロジーと比較して、AIの体験は非常に不均一であるということです。
これを、例えばワイヤレスインターネット(Wi-Fi)への移行の体験と対比させてみましょう。Wi-Fiの時の体験は、私たち全員が非常に似通ったものでした。最初は有線インターネットでケーブルを繋ぐ必要がありましたが、ある時点でワイヤレスルーターが登場し、ケーブルを繋ぐ必要がなくなりました。そして、誰もが基本的に同じ体験をしました。つまり、机にいなくてもノートパソコンを持ち歩けるようになり、後にはスマートフォンでネットに繋がるようになったわけです。
Wi-Fiが何をしているのかについて混乱する人はおらず、誰もがWi-Fiに関して非常に似た体験をしました。ですから、Wi-Fiが普及していく過程で、社会的な混乱はなかったと思います。もちろん大きな変化をもたらし、誰もがそれを気に入りましたが、なぜWi-Fiを使っているのか、何の意味があるのかと混乱する人はいませんでした。
ただ、Wi-Fiに関しても今のAIと同じように、特に初期のWi-Fiはあまりうまく機能しなかったという点には触れておきたいと思います。初期のWi-Fiは確かにそうでしたね。
しかし、上手く機能しない場合の理由が、人々にとって非常に直感的だったんです。ラジオやテレビに親しんでいたからでしょう。信号という概念や、信号までの距離、自分と信号の間にある障害物、そして電波の強さといったことを理解していました。これらはすべてかなり直感的なものです。
一方で、AIにはそのような性質が全くないと言ってもいいのではないでしょうか。人々には、なぜここでうまく機能しないのか、あるいはなぜうまく機能しているのかを比較して理解するための拠り所がないんです。
その通りです。また、AIとは異なり、Wi-Fiの失敗のほとんどは、あなたが言うようにラジオの失敗と似ていました。つまり、距離が遠すぎるから繋がらない、あるいは障害物があるから繋がらないといった具合です。繋がらないという概念がすでにありましたからね。
信号が弱いために通信速度が遅いというのも、人々が理解できることでした。まずは、それが自分自身の操作のせいではないとわかっていたのです。間違った入力をしたから悪い結果が出たわけではありません。スティーブ・ジョブズがiPhoneの持ち方が悪いと人々に言ったというエピソードを覚えているかもしれませんが。
ええ、ありましたね。ケースの持ち方を変えろ、みたいな。
しかし、魔法の言葉を言わなかったから悪い結果になったわけではありません。それに、Wi-Fiの悪い結果は、ある意味で退屈な悪い結果でした。例えば、接続が悪くてデータを十分に受信できなかったとき、足りないバイト数を偽のデータで埋めて、架空のウェブページを作り出したりはしませんでしたよね。ウェブページを要求して、データを早く取得できなかったからといって、Wi-Fiがウェブページを幻覚として見せるようなことはありませんでした。
さらに付け加えるなら、Wi-Fiの場合はそれを嫌うインセンティブもありませんでした。Wi-Fiのせいで仕事を失うと言われた人は誰もいませんでしたからね。モバイルインターネットが実際にいくつかの仕事を奪うことになったとしても、当時はそんなことは問題視されていませんでした。ですから、失敗したからといってそれを批判する動機は誰にもなかったのです。単に、ここはWi-Fiの繋がりが悪いな、で済む話でした。
はい。ですからWi-Fiとは異なり、AIは基本的にあらゆる層にわたって非常に不均一な体験をもたらします。AIを使ったことがない二人の人が実際に使ってみると、全く違う体験をすることがあります。私のように20年間この分野に携わっている二人の人間が使ってみても、依然として全く異なる体験をし、その体験に対して全く異なる意見を持つことがあるのです。
同様に、もしあなたが直接AIを使用していなくても、市場においてそれにさらされている状況があります。一部の企業では、従業員に対してAIの使用を禁じています。特に機密データを扱う場合は絶対にダメだと。一方の極端な例では、AIを使用してはいけない、信頼できない、法的に不明確だと教えられています。
しかしもう一方の極端な例では、AIを使用しなければならないと指示されている人たちもいます。ただ使うだけでなく、どれだけ使ったかを追跡し、それを業績評価の指標に含めるとまで言われています。評価面談の際にもそのことについて話し合われるのです。
少し話を止めますが、もしあなたが変化の激しいAIビジネスの周辺にいないなら、これがコメディのように聞こえたり、カフカの小説のような不条理な話に聞こえるかもしれません。しかし、これは本当に起こっていることだと約束します。多くの人が実際にトークンの使用量を追跡され、AIファーストでなければならないと言われているのです。AIができたはずの作業をなぜ手動で行ったのか、なぜAIに十分な投資をしていないのか、と問われます。
そしてこの十分な量についても、ある種のべき乗則のようなものがあります。ある職場では、少なくとも週に1回はAIを使う必要があるとか、月に1回はAIを使用したというタグを付けてプルリクエスト(PR)を出さなければならない、といった最低限のレベルです。とりあえず試してみろ、という段階ですね。
さらに上のレベルになると、会社がクラウドの最上位プランを用意するから、月に約200ドル分のトークンを消費しなければならないと言われます。さらには、月に5000ドルから1万ドルを費やす必要があると言う人たちもいます。
NvidiaのCEOであるジェンスン・フアンが、エンジニア一人当たりAIに少なくとも年間25万ドルを費やさなければ深く懸念する、と語ったリンクをあなたに送りましたよね。これがいかに誇大広告と結びついているか、少し考えてみましょう。
ええ、ちょっと待ってください。少し補足させてください。現時点において、ジェンスン・フアンは現実から完全にかけ離れているとしか思えない、かなり常軌を逸した発言を繰り返しています。GitHubのスター数の話など、本当に疑わしいものがありました。だから彼の言うことがどこまで本当かはわかりません。
ただ一つ指摘しておきたいのは、彼は50万ドルの給与を得ているエンジニアについて言及していたということです。ですから、給与の50%と表現する方がより適切かもしれません。つまり、年収5万ドルの人に対して25万ドル分の使用を期待しているわけではないということです。給与の50%という言い方が、この件を表現する上でより公平かもしれません。それでもトークン使用量の最適値としてはかけ離れているかもしれませんが、この点は明確にしておいた方が公平ですよね。
はい、良い指摘です。給与の50%というのはより良い考え方ですね。とにかく、私は彼が言ったことに基づいて話しています。私が読んだとき、彼が給与の50%をトークンとして使ってほしいと考えているように受け取りました。
職場でのAI利用の強制と生産性の主張
そして、これに続く話は皆さんも聞いたことがあるでしょうし、純粋に信じている人もいるかもしれませんが、それだけの金額を費やす理由は、それによって生産性が10倍になるからです。これは私が話したかったもう一つのテーマにつながるのですが、人々は真面目な情報源から、生産性について全く異なる主張を聞かされているということです。
ジェンスン・フアンの発言はNvidiaの株価を吊り上げるための誇大広告だと言えるかもしれませんが、そうした意図を持たずに同じ主張をしている人たちもいます。つまり彼は、給与の50%を費やす必要があるのは、そうすることで生産性が10倍になるからだと言っているわけです。
そうですね。彼がそこで誇大広告を打っていたとはいえ、そう言っているのは彼だけではありません。自分が10倍生産的になったと客観的に主張している人たちが実際にいるのです。本当にそうなのかどうかは非常に複雑な話です。
そこで、私があなたに送ったもう一つのリンクである、全米経済研究所(NBER)のレポートについて触れたいと思います。彼らは世界中の大企業の数千人のCEOを対象に調査を行いました。
そこを少し掘り下げていいですか。付け加えたいことがあるんです。
どうぞ。
ジェンスン・フアンが生産性の向上について実際に言及したかどうかはわかりませんが、私には推測することができます。その理由を説明しましょう。例えば、ある人の仕事の価値が50万ドルの給与に見合うと企業が評価したとします。ちなみに、Nvidiaで働いているエンジニアなら、株価が好調なのでストックオプションなどを含めるともっと手厚い報酬を得ているでしょう。ですから、ジェンスン・フアンが話しているこの架空のエンジニアにとっては50万ドルですが、それが給与だけなのか総報酬なのかはわかりませんし、もっと高い可能性もあります。
もし彼が、トークンに費やすべき金額は25万ドルだけでいいと考えているなら、それは2つのうちのどちらかを意味します。AIが彼らの生産性を10倍にする可能性を持っていると信じていないか、です。なぜなら、もし本当に10倍の生産性が得られると信じているなら、500万ドルでも妥当だと言うはずだからです。社員から10倍の生産性を引き出せると思うなら、給与の10倍、あるいは同じ労働コストだと考えれば9倍の額まで喜んで支払うはずです。私の言っている意味は伝わっていますか?
はい、小さな詳細が1つありますが。その詳細というのは、彼がそれが絶対的な最低限だと言ったことです。その額を下回るということは……視聴者のために、この主張がいかに極端であるかをはっきりさせておきましょう。トークンに費やす額が給与の50%未満なら、例えば40%しか費やしていないとしたら、彼は深く懸念するということです。
もう少し頑張れるだろう、第2四半期は改善しよう、というレベルではありません。「深く懸念する」のです。もし上司から、従業員の行動について深く懸念していると言われたら、それは彼らを解雇することを検討しているという意味だと私は解釈します。
ええ、その通りですね。非常に良い指摘です。ですから、私の疑問をより明確にするなら、そのすべてを考慮に入れた上で、上限額がいくらなのかを聞きたいですね。
もし本当に10倍になると信じているなら、上限は総報酬の10倍、いや元の報酬を引いた9倍になるはずです。ジェンスン・フアンは基本的に、もし彼らが望むなら、50万ドルの従業員に対して450万ドル程度のトークンを使わせるべきだと言うはずです。もちろん、より少ないコストで10倍のスピード向上が得られるならそれに越したことはありません。
なぜ彼がそう思わないのか、おそらくグラフィックカードを売りたいからでしょうが、わずか5万トークンで10倍のスピード向上を得られる人がいるかもしれないとなぜ考えないのか、私にはわかりません。彼はそこまで言及していませんから。
でも私は上限を聞きたいのです。そうすれば口先だけではないことが証明されます。もし「我々は10倍の生産性向上が得られると信じているから、10万ドルの従業員全員に、希望すれば90万ドル分のトークンを割り当てる」と言うなら、私はあなたの言葉を信じ始めます。私の言っていることは理にかなっていますよね?
はい。ただ、企業が給与のROI(投資利益率)をどのように考えるかという、退屈で細々とした話があります。細かい企業会計の話に深入りせず、手短にお伝えしますと、例えばGoogleのような企業では、総報酬が50万ドルのエンジニアは、少なくとも年間200万ドルから300万ドルの収益を生み出しているとモデル化されています。
その理由は、総報酬に加えて、いわゆるオーバーヘッド係数というものがあり、通常それはコストを約2倍にするからです。この人が使用するすべてのインフラ、オフィス、福利厚生などが含まれます。つまり、オーバーヘッドによって総コストは50万ドルから100万ドルになります。そして企業は、従業員への投資に対して2倍から3倍のリターンを求めているのです。
この話はすぐに退屈になってしまいますが、ここにはある種の機微があります。企業はすでに、50万ドルのエンジニアが年間200万ドルの価値を生み出していると前提しているのです。では仮に、10倍の主張を信じるなら、彼らは年間2000万ドルの価値を生み出すはずです。
ですからあなたの観察に従えば、論理的には、彼らが現在優良だと考えているのと同じようなROIでその追加の2000万ドルを得るために、トークンコストに500万ドルから1000万ドルを支払う用意があるはずだということになります。退屈な会計の話で申し訳ありませんが、これが彼らの考え方なのです。
いえ、それこそが私の質問の核心です。もしリーダーの立場にある人が10倍の生産性を主張したいのなら、それが彼らのポリシーであるべきであり、もしそうでないなら、彼らが私に語っていることを本当に信じているのかどうか疑い始めるでしょう。
先週か先々週か忘れましたが、OpenAIかAnthropicのどちらかが、1日に20万ドルを費やしたエンジニアがいると言っていましたね。
ええ、それなら論理的に一貫しています。もしそのチームが「ほら、生産性を10倍にできる」と言っていて、しかもそれがAnthropicなら当然そう言うでしょうが、私はそういうお金の使い方を見たいのです。そうでなければ、本当に信じられるかどうかわかりません。単なるごまかしのように聞こえます。「従業員に莫大な数のトークンを使わせているのは、彼らの生産性が10倍になると考えているからだ」というのなら、論理的に一貫した立場だと感じます。
AIによるソフトウェア開発の実際の生産性向上とは
本題から外れてしまってすみません。ゴールドマン・サックスが最近発表したニュースレポートの話に移ろうとしていましたね。彼らが観察しているセクターでは、生産性の向上はほとんど見られなかったという内容でした。続きをお願いします。これについては私も少し調べたので言いたいことがありますが、まずはあなたからどうぞ。
はい、ゴールドマン・サックスからのレポートがあり、それが全米経済研究所(NBER)のさらに詳細なレポートに相互リンクされていました。彼らは5000人か6000人のCEOを対象に、生産性とAIの導入に関する社内指標について調査しました。結論の要約はオンラインで無料で読めますが、2025年における生産性への影響は基本的にゼロだったというものでした。
そこで皆さんはこう考えるかもしれません。「2025年は影響がゼロだったのは、皆が2026年に向けて本気で準備を進めていたからだ」と。これからは素晴らしいことになるはずだと。準備は整ったのだから、と。導火線に火はつけたけれど、まだロケットエンジンに火がついていないだけだと。
では、今後数年間で彼らが予想する生産性向上のコンセンサス予測はどうだったと思いますか? その部分に気づきましたか?
いえ、気づきませんでした。続けてください。
1%から3%の間です。
ああ、なるほど。はい、その部分は見落としていました。
つまり、コンセンサス予測では、今後数年間でAIによる全体の生産性向上は1%から3%程度になると予想されていたのです。ただし、桁外れな生産性向上を示す「ポケット(局所的な領域)」の存在も指摘されています。
そのポケットの一つがソフトウェアエンジニアリングでした。この領域では、コンセンサス予測として約20%から30%の生産性向上が見込まれていました。注目すべきは、将来の話であっても、高い生産性が見込まれるポケットにおいてすら、コンセンサス予測は20%から30%の向上であり、他の主張と整合するような1000%の向上ではないということです。
そうですね。この件については非常に多くの要因が絡み合っているため、すべてを整理するのは本当に困難です。結局のところ、自己申告による生産性向上のデータがどれほど価値があるのかもわかりません。
私が少し興味深いと思ったのは、これもゴールドマン・サックスの資料なのですが、ニュースで報じられていた調査ノートそのものを見つけるのに苦労したことです。ハイパーテキストの可能性がもてはやされたにもかかわらず、誰もが自サイトにユーザーを留めておきたがる世界になってしまいました。だから誰も引用元のリンクを貼らないんです。「ゴールドマン・サックスが調査ノートでこう言っている」と書くだけで、リンクは貼りません。だから自分で探さなければならないんです。そしてもちろん、AIに尋ねても適当なことをでっち上げるだけです。
話題になっていた特定の調査ノートを見つけるのは苦労しましたが、ゴールドマン・サックスはこの件に関して、労働市場とAIに関するその後のニュースレポートを含め、いくつか資料を出しています。ソフトウェアについて彼らが述べていたことで的を射ていると思ったのは、「市場においてソフトウェア開発の生産性向上の証拠を見たいが、それは皆無だった」という部分です。
自己申告ではなく、実際にこれが要因でソフトウェア産業が成長しているのかどうかを確認できれば面白いと思います。もしこれが事実なら、ソフトウェアが以前よりはるかに多くの利益を生み出し始めているのが見えるはずですから。
この点について、私がずっと考えていたことをいくつかお話ししたいと思います。非常に混乱を招く問題だと思うからです。包括的なアプローチをとって、「結果だけを見よう」と言ったとしても、これを評価するには多くの問題があります。だからこそ、ソフトウェアの生産性や収益性といった面で、AIがどのような結果をもたらすのか確信が持てないのです。
AIが生産性をある程度、例えば10倍というのは短期的には楽観的すぎるかもしれませんが、意味のある割合、例えば30%向上させるというシナリオは十分にあり得ると思いませんか? 30%の生産性向上というのは非常に大きなものです。組織全体の生産性が30%上がって不満に思う人はいないでしょう。ですから、客観的に見れば、少なくとも生産性の観点からは有益なテクノロジーであると誰もが認めるはずです。
市場の限界とAIがもたらす真の価値
完全に同意します。かつてフレッド・ブルックスが『銀の弾などない』で書いたことと一致します。プログラミングの生産性が永続的かつ広範に30%向上すれば、それは高水準言語、あるいはコンパイラの登場以来の最大の生産性向上になるでしょう。
ええ、そうですね。では、それが30%の向上を達成したとしましょう。私たちは皆、それを喜ぶべきです。
ここでAIに関するジレンマ(キャッチ22)のようなものを付け加えたいと思います。次の話題に進む前に、これについてのあなたの考えを聞きたいのです。
仮に生産性が上がったとしても、実際に起こるのは、現在の市場シェアを持つすべての企業がソフトウェアの開発作業を30%余分にこなさなければならなくなるだけで、状況は何も変わらないということです。例えばMicrosoft Wordを思い浮かべてみてください。Microsoft Wordの開発を30%早く進められたとして、それがMicrosoftという企業にとってより多くの利益をもたらすでしょうか? おそらくそうではないでしょう。
他社の競合も同じAIツールにアクセスでき、同じように30%の向上が見込めるため、彼らもまたWordの競合製品を作ってビジネスを奪いに来るでしょう。ですから、私たちはAIを使って30%多くの仕事をすることを強いられるだけで、外から見てソフトウェアが良くなったこと以外、目に見える実際の利益はないのです。ソフトウェアが良くなったといっても、非常に曖昧なものですが。
AIが機能していないように見えて、実は機能していたという結果になる可能性があることに同意しますか?
はい。経済学の細かい話に入るのは避けたかったのですが、少し触れておく価値はあるかもしれません。というのも、これは私が送らなかったいくつかの記事に関連しているからです。それほど重要だとは思わなかったので送りませんでしたが、「AIは機能しているが、あなたの仕事を悪化させているだけだ」というような記事がありました。
それはあり得ますね。
その背景にある重要な経済学の概念は、生産性というのは多次元的なものであるということです。データを取得して測定できるかどうかは別として、原理的には少なくとも2つの重要な指標があります。1つは、1人当たり、時間当たりにどれだけの仕事が完了するか。もう1つは、給与単位当たりにどれだけの仕事が完了するかです。
さらに、1人当たり、時間当たりにどれだけの売上を生み出すか、そして給与単位当たりにどれだけの売上を生み出すか、という指標もあります。これらはすべて異なるものであり、測定するのは厄介です。正確に測定されているかどうか、私には判断する資格はありませんが、すでに考慮すべき項目が4つあります。
しかも、まだ製品が良くなったかどうかについては一切触れていません。ただモノを作り、売り、お金を得たという最も低いレベルの話をしているだけです。Microsoft Wordが良くなったとか、ゲームが面白くなったとか、財務分析が向上したといった話は抜きにしています。
つまり、Microsoft Wordの現状も売上も変わらないまま、AIのおかげで生産性が上がった分、Microsoftがプログラマーの30%を解雇するというのも、考えられる多くの可能性のうちの1つです。そうすれば、底辺の数字として30%のAI生産性向上を実際に確認できる未来にたどり着くかもしれません。「以前の70%のスタッフしかいないが、同じ額の利益を上げている」となるわけです。
製品もユーザー体験も何も良くならず、ただ労働力の一部を削減するだけ。それでも30%のAI生産性向上としてカウントされるでしょう。もちろん、30%削減することと30%増加することは違うとわかっています。非公式な言い方をしているだけです。これが多くの可能性のうちの1つです。
もう1つの可能性は、プログラマーが現在の給与を維持したまま、AIによってよりハードに働かされるようになることです。これが、一部の人々が報告していること、あるいは仕事をより不愉快なものにしている原因です。これについては後で戻ります。
限界的な機能や製品が出荷され、それによって売上が少し伸びるかもしれません。しかし、30%多くの仕事をして30%多くの売上を生み出したとしても、それが生産性の向上として現れるかどうかはわかりません。労働当たりの売上は変わっていないからです。
それを何と呼ぶべきか、はっきりしませんね。私が最近目にしたこの現象を表す新しい用語があります。私が考えたわけではありませんが、他の議論でも目にするでしょう。それは「労働強化(work intensification)」です。
AIはただ人々をよりハードに働かせ、より多くのコードレビューを行い、より多くのPRを作成させるだけになるでしょう。労働強化理論の観点から言えば、誰も仕事を失うことはありません。全員が残り、誰もがAIによるPRやコードレビューに追われながらよりハードに働き、より多くの機能を出荷することになります。それが起こり得る可能性の1つであり、私たちが最終的に行き着く場所かもしれないと否定することはできません。
私が言いたいことを非常に明確にしておきましょう。次のような仮説を考えてみてください。UberとLyftのような配車サービスの市場を例にとります。配車サービスでお金を稼ぐ余地がもうないと仮定します。つまり、市場が飽和状態に達している状態です。
他の外的要因がない限り、人々がこれに年間いくら費やすかはすでにわかっています。唯一の問題は、彼らがUberのボタンをクリックするか、Lyftのボタンをクリックするか、それだけです。私が頭の中で想像しているのはそういう状況です。このような市場になる可能性は十分にあります。
配車サービス全体の総収益を見てみると、X十億ドルだとします。翌年見ても、インフレ分だけ上がったか、一人当たりではほぼ同じです。数年間見ても全く変わりません。
私が言いたいのは、AIがUberやLyftのプログラマーの生産性を実際に向上させたとしても、彼らが互いに争っているだけなので意味がないというシナリオが想像できるということです。アプリをどれだけ良くしても、そこから引き出せるお金はもう増えないのです。
多くのソフトウェア分野において、少しそんな風に感じられます。すでに完全に獲得され、家賃のように固定化された市場において、これ以上の大きな成長の可能性があるとは感じられないのです。
大雑把な例えをすると、これまではそうではなかったかもしれないけれど、今では街のすべての家主が各アパートにストーブを備え付けなければならなくなったようなものです。ストーブは多くの価値を提供していますが、それが利益に結びつくわけではありません。それは単に、今やらなければならないことになっただけなのです。
従業員にAIを使わせることはやらなければならないことになりますが、それが今や標準になってしまったため、その分家賃を高く設定することはできません。私の言っていることは理にかなっていますか?
はい。それを、私たちが録音外で話した「このAIというものがどれくらい大きくなる可能性があるか」というテーマに結びつけさせてください。私がAIがすべてを支配すると考えるマキシマリスト(最大化主義者)ではない理由の1つが、まさにあなたのUberとLyftの完璧な例えにあるからです。
私がそのようにしつこく説明しているのは、私たちが現在置かれている市場がまさにそのような状況に感じられるからです。
新しい機会を見つけることには、物理的および社会的な制約があります。たとえAIが考え得る限り最もインテリジェントなものであったとしても、新しい機会の発見には物理的・社会的な限界があるのです。
仮にUberでテレンス・タオ級の知性を持つ人が5000人働いていたとして、Uberのビジネスの枠内でどれだけ多くの収益を生み出せるでしょうか? おそらく彼らができる最も生産的なことは、Uberとは全く関係のない別のビジネスをスピンオフさせることでしょう。ええ、そしてそこで利益を上げるのです。
市場でできることには物理的・社会的な限界があります。だからこそ、AIがすべてを支配するというシナリオの根底には、私たちがまだ手をつけていない、無限に広がる巨大な機会の供給が存在するという仮定が組み込まれているのだと私は考えています。
彼らが正しくて、まだ超知能を持っていないからそこに到達していないだけだという可能性は理論的にはあります。しかし、AIが支配するというシナリオはすべて、私たちが十分に賢くないから、あるいは賢い人が十分にいないから全く手をつけていない巨大な機会のセットが存在するという仮定を内包していることを指摘しておく価値はあると思います。
私が付け加えた大きな注意事項は脇に置いておきましょう。私が言いたかったのは基本的に、AIを推進する側を助け舟を出す意味で、何も見えないからといって何も起きていないとは限らない、何を測定するかによるということです。
さて、ゴールドマン・サックスのレポートに戻りましょう。これは自己申告に基づくものであり、基本的に人々が推測しているだけですよね? 私がこの手のデータに対して抱く問題の1つは、彼らが何を測定しているのかわからない、ということです。具体的なデータがあまり提示されていませんでしたから。
はい、完全に同意します。私は様々な理由から、こうした経済的生産性の推計に対して懐疑的です。なぜなら、私自身が「アトリビューション・モデリング(貢献度評価)」と呼ばれる技術的な作業を手伝うよう頼まれたことがあるからです。
非常にシンプルな例を挙げましょう。これはビジネスのどこにでも当てはまりますが、広告キャンペーンを実施しているとします。素晴らしいウェブサイトとモバイルアプリを作るのに100万ドル、スーパーボウルのCMに100万ドル、Google広告に100万ドル、TikTok広告に100万ドルを投じました。
ある人がスーパーボウルのCMを見て、TikTokで検索し、TikTokのリンクからモバイルアプリに飛び、そこからウェブサイトにアクセスして商品を購入したとします。
はい。
どの広告活動がその収益にどれだけ貢献したのでしょうか? 統計学を用いた因果モデル(コーザルモデル)というものがあり、これらの要素のどれが、最終的な結果にどれだけ貢献したかを統計的に明らかにしようとする試みがあります。
非常に難しい問題ですよね。たとえ「このウェブアドレスに行ってください」というような広告ごとのコードを渡したとしても、以前の広告を見た経験がなければ行動を起こしていなかったかもしれませんからね。
広告業界で定量分析に関わっている人なら誰でも、それが重要であることを知っています。これらは「多重接触効果」や「プライミング効果」と呼ばれています。ですから、それが可能であるだけでなく、実際に重要であることがわかっているのです。私たちが知らないのは「どれくらい重要なのか」ということです。
このようなアトリビューション・モデリングを行うAIモデルの構築に携わってきた経験から言わせてもらうと、それは風向きを指で測るようなものです。経営陣は「顧客はTikTok広告なんて気にしていないだろうから、たまたま見たとしても、それはラップ動画をスクロールしていたからだろう」といった直感を持っています。
はい、はい。
関わった経験から言えますが、私個人としてはあれを全く真に受けていません。方向性が合っていればラッキーというレベルです。
10倍の生産性を発揮する特定のタスク(ポケット)
それを念頭に置いた上で、AIの生産性への影響を少なくとも局所的に測定できる具体的な方法について、私はよく考えようとしています。ここで、体験の不均一性の話に戻りますが、AIを使うことで間違いなく少なくとも10倍早くこなせる特定のタスクが存在するのです。
具体的な例を挙げましょう。特定の分野に限った話ではないことを明確にするため、プログラミングとマーケティングの両方から例を出します。
プログラミングにおいて、ある言語のライブラリを別の言語で使うための「バインディング」を書いたこと、あるいは知人が書いたことがあるでしょう。C言語で書かれているものをPythonやJavaで使いたい、あるいはJavaで書かれたものをClojureで使いたいといった場合です。
その場合、長いリストに目を通し、ソースコードに対して非常に機械的な作業を行わなければなりません。「このシグネチャは何か」「これはどのモジュールに属するか」などをソースコードから読み取るのです。
そしてそれは既知の機械的なプロセスです。パースを行い、バインディングを出力するバイナリを自分で書くこともできます。つまり、曖昧さがない作業だと言えますよね。
その通りです。現在のハイエンドモデルは、それをほぼ完全にこなしてくれます。ライブラリを渡して「PythonやLuaのバインディングを生成してくれ」と頼むだけでいいのです。数時間かかる退屈な作業が、わずか30秒で終わります。
これは間違いなく、価値があり、少なくとも10倍生産的になる実際のタスクの例です。
マーケティングの分野でも、同じようなレベルのタスクがあります。クライアントごとにカスタマイズされたセールスページを作成する場合です。OracleやIBMなど、それぞれのクライアントに向けたカスタマイズされたセールスページを用意し、リードに対して「このウェブサイトを見て、営業チームに連絡してください」と促すような、それぞれにカスタマイズされた体験やピッチデック(プレゼン資料)を作成します。専門用語で言えば「マーケティング・コラテラル(販促ツール)」のカスタマイズです。
ベースとなる資料を与えられれば、AIはカスタマイズを非常に得意としています。ベースとなるプレゼン資料やセールスページを作っておき、「これをOracle向けにカスタマイズしてくれ」「IBM向けにカスタマイズしてくれ」と指示するのです。これは失敗してもリスクの低い作業であり、マーケティングのジュニア・アソシエイトに任せるような仕事です。
どうせ後で確認するわけですし、基本的にはOracleについて知っている情報を組み込むだけの、少し高度な差し込み印刷のようなものですからね。単にIBMという名前をOracleに置き換えるだけでなく、IBMが気にすることではなくOracleが気にするであろうことに合わせて、残りの言葉遣いや順序などを整えるわけですね。
はい。それに彼らのロゴを取り込んで、私たちが彼らのことを本当に大切に思っていると感じさせるようにします。これは単なるお金の話ではないのだと。
ええ、ええ。
マーケティングの分野でこれをやっている人たちを知っていますが、これも以前なら数時間かかっていたものが、数分で終わる作業です。これも客観的に存在する、少なくとも価値があり、少なくとも10倍早く完了する実際のタスクです。
少なくとも今後数年間のAIによる生産性向上に対する私の見解は、企業がこのような機会をいくつ積み重ねて、創発的な全体的利益(おそらく10%から20%程度)を得ることができるか、ということにかかっていると思います。
私は様々な業界の企業と仕事をしてきました。現在、本当に努力し、何をしているかを理解し、このような機会を積極的に探しているなら可能です。ただプログラマーが現在行っていることを見て「同じことをAIを使ってやれ」と指示するような素朴な方法では、生産性の向上は全く見込めません。これは私の個人的な経験ですが。
しかし、AIを使って生産的かつ確実に切り出せる作業を見つける方法を人々に教えれば、上手く真剣に取り組めば、おそらく20%の改善に達することができると思います。ですが、そのためにはこうしたタスクをいくつも積み重ねる必要があります。そうやって節約した時間を、エンジンの最適化など他の作業に充てるわけです。
そこで一つ質問があります。あなたの話を聞いていると、会社全体で単にトークンを大量に消費させればAIが生産的になるだろうという現在のアプローチは、おそらく賢明ではないと示唆しているように思えます。
より賢明なアプローチとは、例えばAIの仕事をたくさんこなしてきた新しい人材を雇うなどしてAIの専門家を見つけ出し、社内の特定の人物にAIを使った作業を熱心に行わせることではないでしょうか。彼らが各部門を回り、現場の人々と協力しながら、あなたが先ほど話したような「AIと本当に相性の良い日々の作業」を特定していくのです。
現場の人たちにそれを見つけさせるのは必ずしも得策ではありません。AIに精通していなければ、どの作業が適しているか推測するのは難しいでしょうし、作業を正しくこなすためのAIの設定も難しいからです。「AIは使い物にならない」と思っても、実は単に使い方がわかっていなかっただけかもしれません。ですから、そうした「ポケット」を特定することに重点を置いたアプローチの方がより生産的だということでしょうか。私が説明したアプローチが最善ではないかもしれませんが、「ポケットを見つける」というアイデアについてです。
はい。プログラマー以外の職業で、私が実際にこれを行っている人を知っており、確実に生産性が解き放たれていると思う分野をお教えしましょう。それはUX(ユーザーエクスペリエンス)、特にワークフローと人間工学(エルゴノミクス)に携わる人々です。
これは一般的に消費者向けのUXではなくエンタープライズ側の話ですが、例えば投資銀行に1000人の財務アナリストがいて、彼らが毎日「リサーチ」をしているとします。ここで言う「リサーチ」は、彼らが実際にリサーチをしていないという皮肉ではなく、その言葉が意味する内容が多様で不明確だということです。
彼らはUXコンサルタントを雇い、「あなたたちのチームは一体何をしているのか?」を調査させます。デジタルの世界では人間工学とUXが融合しつつありますからね。彼らはチームの行動を研究し、こう言うのです。「ユーザビリティ調査の結果、あなたたちはこの作業に時間の20%を費やしていますが、実は誰もこの作業をやりたがっていません。AIに任せることもできますし、自動化することもできますよ」と。彼らは10年前なら「Pythonスクリプトで自動化しましょう」と提案していたような自動化コンサルタントたちです。
これが、意味のある、測定可能な生産性向上を得るための、現実的かつ具体的な道筋だと思います。これをやっている人はあまり多くありませんし、これは1兆ドルの企業評価額を正当化するようなストーリーにはなりません。だからジェンスン・フアンがこれを言いたがらないのも当然です。エキサイティングに聞こえませんからね。
それでもゼロではありません。数兆ドルの評価額を正当化する必要がなければ、非常に役立つものですから大満足するはずです。
AI体験の不均一性と上位モデルを利用する重要性
これを先ほどの話に結びつけさせてください。もしよろしければ、最初の話題に戻ることになります。
10倍の向上を得られる方法はいくつかあるものの、全体の生産性が10倍になるわけではなく、特定の作業が10倍になるというモデルを想定しましょう。それによって節約できた時間は、他の生産的なことに使うか、あるいは家に帰って寝るかに使えばいいのです。
もしそうなら、全く違う人から全く違う意見を聞く理由も簡単に理解できます。誰かがAIを試しに使ってみて、最初に試した作業がたまたまAIの得意な「ポケット」に当てはまれば、非常に良い第一印象を抱くでしょう。
逆に、Twitterでの私のように、非常に簡単なことを尋ねたのに4つの異なるAIが4つの完全に間違った結果を出してきたような、馬鹿げた状況に遭遇したら、最悪の印象を抱くはずです。
それはAIに10倍の生産性向上の能力があるかないかという問題ではありません。生産性が集中している「ポケット」があり、その間には何もない空間、あるいはマイナスの生産性すら存在する空間が広がっているからです。トークンにお金を払い、AIとのやり取りに時間を費やしたのに悪い結果しか得られないのですから。
楽観論者か悲観論者かという要素を排除したとしても、中立的な立場で始めた人が、そのまだら模様の風景のどこにダーツを当てたかによって、その後語る内容が全く異なるものになる可能性がありますよね。
はい。この「体験の不均一性」というテーマに戻りますが、何をしようとしているかというタスクのポケットの問題があります。また、AIに物事をうまくこなさせるための習熟度の問題もあります。
これはAnthropicのCコンパイラの話に繋がります。「Cコンパイラを作ってくれ」とだけ指示すれば、良い結果が得られることはわかっています。これらのツールを使い込んできた私は、良い結果に近づくための実践的な方法を教えることができます。しかし、経験の浅い人は何をすべきかわからないでしょう。
つまり、何をしようとしているかという不均一性と、ツールの使い方を知っているかという不均一性があるのです。その一部は単なる学習曲線です。だからこそ私は、特に若い人たちには、たとえ懐疑的であっても、AI市場の向かう先が好きになれなくても、少なくともこれらのツールを使えるだけのリテラシーを身につけることをお勧めします。
そうすれば、「バインディングの生成やピッチデックのカスタマイズなら安全にAIを使えるし、意味のある結果が得られる」と判断できるようになります。少なくともそのツールに十分に精通して、そうした「ポケット」を見つけられるようになってほしいのです。他の作業はポケットに当てはまらないと判断できるようになるためだけでも構いません。「これは良いポケットの作業だけど、レイトレーサーの最適化はそうではない」と判断できるように。
あなたがすでにおっしゃったことですが、繰り返させてください。そのポケットの中で物事を成し遂げるためにもスキルが必要だということですよね。このポケットの作業はできるかもしれないが、誰もが思いつくような単純な英語のプロンプトではダメで、別のアプローチを取らなければならない。だからスキルを身につけなければ、単純な英語の指示で正しい結果が出るほど簡単な作業でない限り、ポケットの恩恵にすら預かれないということですね。
はい。そこにもう一つ付け加えさせてください。些細なことのように思えるかもしれませんが、私がよく目にする混乱の原因です。それは、最上位の有料モデルを使っていなければ、AIに何が可能なのかについて誤解を招く認識を持ってしまうということです。
Claude Opus 4.6、GPT-4、Grokの「エキスパートモード」など、呼び方は何でも構いません。特に初心者の方には、最上位の有料モデルでタスクを試してみることを強くお勧めします。そうしないと、さらなるフラストレーションを抱え込むことになります。
フラストレーションが完全になくなるとは保証しません。それでもイライラすることはあるでしょう。しかし、最上位モデルを試した方がフラストレーションは少なくなります。そこには本当に重要な違いがあります。使い慣れてきたら、コスト削減のために安いモデルに戻せばいいのです。しかし、「AIにこれができるのかどうか」を確かめようとしている段階では、最も強力なモデルを試すことが本当に重要です。
なるほど。下位モデルではできないけれど、上位モデルならできることがあるはずだからですね。実験している段階で下位モデルを使うと、AIが合理的に達成できることについて誤解してしまうと。
はい、その通りです。繰り返しますが、うまくいくと保証しているわけではありません。AIに何ができるかをまだ理解していない段階で上位モデルを使わないのは、混乱の元だということです。
言い換えれば、探索段階では全体像を知るために最上位モデルを使わざるを得ないということですね。最も高価なバージョンのAIで特定のポケットの作業をこなせることがわかったら、コスト削減のために安価なモデルでもできるか試してみる。しかし、できるかどうかの判断を下位モデルで行うべきではない、代表的な結果ではないから、ということですね。
はい、まさにその通りです。多くの人が上位モデルから始めて、「Claude Opusの代わりにClaude Sonnetが使えるな」と気づいていくわけです。詳細は重要ではありませんが、「これが自分にとって役立つかどうか」を理解しようとしているなら、現在利用可能な最高レベルのモデルを使用することが重要です。
AI利用における心理的要因(スロットマシン効果)
さて、この点について他に何か言いたいことはありますか? 私からももう一つ話題を投げかけたいのですが、まだ話していないことがあればどうぞ。
いえ、大丈夫です。
ここまで話してきたことは、なぜ10倍生産的になったと言う人と、全く役に立たないと言う人がいるのかという、非常に客観的で正当な理由だと思います。
では、これが起こる主観的な理由について話しましょう。過去にも、実際には生産的でないのに生産的だと信じ込んでいるケースはたくさんありました。おそらくその逆の状況もあって、生産的になったと思っていないのに実は生産性が上がっていたというケースもあるでしょう。
私たちが目撃している現象のうち、どの程度が単なる人々の思い込みに過ぎないとお考えですか? 実際には生産的になっていないのにそう思っている人や、生産的になっているのにそう感じていない人はどのくらいいるのでしょうか。
かなりの割合を占めると思います。もし推測するなら、大体25%くらいでしょうか。
なるほど。
ここで、あなたが暗黙の前提としていたかもしれない心理的要素を明確にさせてください。AIを使って仕事をする際、「スキナー箱」や「ルートボックス(ガチャ)」のような要素があるんです。
テキストを入力するとき、頭の中に期待する結果がありますよね。「これをやってほしい」と。そして実行ボタンを押し、数分待って結果を受け取ります。「これは良かったか? 悪かったか? レビューしなければ。ああ、ダメだ。惜しかったけど、次こそはいけるはずだ」。そしてプロンプトを更新し、再び入力して待つ。「ああ! 惜しい。でも今は背景にサルが写っている。サルなんて頼んでいないのに」。
ええ、ええ。
「ポケモンのパックを開けたけどレアカード出た? 出ない。よし、もう一つ開けよう」というのと同じですね。
まさにその通りです。私自身もそう感じます。誰かを批判しているわけではなく、動物の脳がそういう風にできているんです。何かアイデアを思いついて、特に詳細な指示を出すわけでもなく数文入力して実行する。AIが数分間処理し、「120秒考えました」と言ってまさに求めていたものを出力してくる。
こういうことは私の場合、せいぜい週に1回程度しかありません。しかしそれが起きたとき、動物の脳は本当に興奮するんです。「ほとんど何もしていないのに、こんな素晴らしいものが手に入った!」と。
それは同時に、待ち時間があることでドラマチックな緊張感を生み出します。入力してすぐにコンパイルエラーが出るのとは違います。「今どうやって処理しているか」という思考のプロセスを教えてくれるんです。「サルのいない画像の背景調査をしています」というように。
ええ、ええ。
待ちながら短いストーリーを聞かされているわけです。そして時には最初からうまくいくこともあります。こんな現象が自分に起きているとわかっていながらも、その瞬間、サルの脳は興奮しているんです。「すごい! ほとんど何もしていないのに、このクールなストーリーを読めて、結果も完璧に近いぞ!」と。こんなことは週に1回、いや月に1回くらいしか起こりません。
現実は、生成された画像からサルを消すためにスロットマシンのレバーを引き続けるようなものです。
そしていつかは消えるかもしれない。
そう、いつかは消えるかもしれません。ここには心理的な側面があり、人は10回レバーを引いたことは忘れて、最終的にうまくいったことだけを記憶するのです。
この心理的要因は非常に大きく、25%程度の効果があると考えています。なぜこの数字が重要なのか説明しましょう。心理的な変動は、実際に得られる生産性向上と同じくらい大きい可能性があります。つまり、実際には生産性が上がっていなくても、サルのような興奮のおかげで25%生産性が上がったように感じるかもしれないのです。
あるいは、その逆かもしれませんね。
まさにその通りです。25%生産的になっていても、それを嫌悪しているために実感できないかもしれません。AIが良い仕事をしたとしても、それを嫌う正当な理由があります。というのも、非常に強引な方法で人々に押し付けられているからです。うまく機能しないときでさえ、これを使わされることで、仕事の体験がただの「作業」になってしまっている人をたくさん知っています。
強制的に何かをやらされ、普段はうまくいかないのに最終的にうまくいったとして、それをどう感じるでしょうか? 報われた場合でも、やはり不快感は残るでしょう。
ですから、心理的な変動によって生じる部分は、うまくやった場合に得られる全体的な生産性の向上に匹敵すると思います。10倍になるポケットの話ではなく、全体的な生産性の向上についてです。ポケットは局所的であるため、生活全体が改善されるのはごくわずかだからです。
結論:誰もがおかしいと感じる理由
まだまだ話せることはたくさんありますが、他のトピックについてはまた別の機会に取っておくのがよさそうですね。あなたが最初に言った「私がおかしいのか、それとも他の人がおかしいのか」という核心部分について、他に話したいことや派生する話題はありますか?
では、「不均一性の軸」について振り返ってみましょう。視聴者の皆さんへのメッセージですが、AI導入のスペクトルや、悲観論と楽観論のスペクトルのどの位置にいようとも、誰もがある時点で「私がおかしいのか、それとも周りの人がおかしいのか」と感じるということです。自分の立ち位置によって方向は変わりますが、誰もがそう感じています。
その理由の大半は、このテクノロジーが人々に極めて不均一な体験をもたらし、極めて不均一な導入パターンを生み出していることに起因していると考えてみてください。
例えば、サンフランシスコのダウンタウンに住む25歳の若きAIエンジニアだとしましょう。すべての基礎となるものと共に育ち、ChatGPTの登場と同時に社会に出た。自分自身がAIエンジニアであり、常にWaymoで移動しているような人です。多くのトレンドの最先端にいます。
一方で、バージニア州の造園業者で、これらのものとは特に接点がない人もいるでしょう。経済の中で自分がどこにいるか、つまりAIについてどれだけ考えさせられているか、あるいはどれだけ考えたいかという点も、不均一性の原因です。
これらのツールを生産的に使う方法を知っているかどうかの不均一性もあります。使ってみて無価値だと感じたとしても、彼らを全く責めるつもりはありません。良い結果を引き出す方法を学んでいなければ、悪い結果になるのは非常に簡単だからです。
適用できるかどうかの不均一性もあります。バインディングの生成には非常に優れていても、レンダリングエンジンのアートスタイルを作るのには全く向いていません。今日のニューヨークタイムズの見出しを要約するのは得意ですが、あなたが言ったような引用元を見つけるのは非常に苦手です。これなら従来の検索エンジンの方がはるかに優れています。「私のインデックスにはそのような言葉を含む文書は一つもありません」と決定論的に教えてくれますから。
まさにその通りです。同じような誤検知(偽陽性)を出すことは絶対にありません。「はい、この本にありました」なんて言うことは絶対にありません。
はい。検索エンジンからの答えは最終的に「文書へのリンク」であり、「この文書にその言葉が含まれている」と主張しているだけですから。
それについては「信頼性の欠如」という独自のポッドキャストのテーマとして将来話したいですね。続けてください。
いえ、これで締めくくりです。AIに関する不均一な体験には、本当に様々な要因があるということです。職場環境がどれだけAIを強制しているか、そもそもAIに関心があるか。サンフランシスコのAI企業の隣にいるか、バージニアの造園業者か。中小企業向けの標準的なウェブサイトを作ろうとしているのか、レンダリングエンジンのアートパイプラインを作ろうとしているのか。
皮肉なことに残念な例ですが、裁判官の前でAIがでっち上げた判例を引用して弁論を行い、譴責されたり資格を剥奪されたりするのか。それとも、あるトピックに関する最高裁の決定をレビューするように頼むだけなのか(これは完全に信頼できるわけではありませんが、はるかに信頼性は高いです)。
テクノロジーとして、そして人々の生活に入り込んでくるものとして、AIは非常に多くの方向で不均一なのです。だからこそ、「私がおかしいのか? あなたがおかしいのか? それとも世界がおかしいのか?」という感覚は、主にここから来ているのだと思います。
もちろん、誇大広告も原因です。彼らはあなたをさらにおかしくさせようとしています。彼らがそうするのはイライラしますが、彼らをそうさせる経済的なインセンティブは理解できます。
それについては前回の録音で十分に取り上げましたね。「Cコンパイラを作って」と入力するだけで本当に良いCコンパイラができると思わせるような試みが確かにありましたから。
私もそのポッドキャストでそのまま言ったと思いますが、もし誇大広告しか見ていなかったら、つまり自分で調べもせずに「ClaudeでCコンパイラを作ってと言ったらできた」という話だけを聞いていたら、Claudeを開いて同じように入力するでしょう。そして出てきた結果があまりにもひどくて、ひどく失望するはずです。それは実際に何が起こるかについての正確な報告がなかったからではなく、誇大広告が現実を覆い隠してしまっているからです。
「この英語の文章を入力するだけで求めているものが全て出てくる」と思っていたのに、そうならなかったら裏切られたように感じるのも無理はありません。それは純粋に誇大広告のせいです。
ええ。この議論から皆さんに理解してもらいたいのは、誇大広告を取り除き、実際に起きていることだけを見たとしても、それは非常に変動が大きいため、私たちが同じ世界に住んでいないように感じるのはごく自然なことだということです。
これで締めくくれますね。もし自分がおかしいと感じているなら、約束します。AIにどっぷり浸かっている人たちでさえ、さまざまな理由から自分たちが違う世界に住んでいるように感じることがあるのです。
自分が置かれている状況もありますが、テクノロジー自体が有用性においても信頼性においても非常に不均一であるため、他の点ではよく似ている二人の人が全く違う体験をし、「私がおかしいのか、あなたがおかしいのか、それとも第三の何かが起きているのか」と疑問に思うのは普通のことなのです。
そしてその答えは、基本的には第三の何か、つまり「不均一性」がそれを説明しているということですね。
さて、この特定のトピックについてのWading Through AIはこれくらいで十分でしょう。さらに掘り下げたい点がいくつかあったので、将来のポッドキャストのトピックリストに入れておきたいと思います。
ええ、いいですね。
ディミトリ、今回もご参加いただきありがとうございました。それではまた次回。
ありがとうございました。
Wading Through AIのこのエピソードをご覧いただきありがとうございます。いつものように、AIの研究開発という多忙なスケジュールの合間を縫って、インサイダーの視点を共有してくれたディミトリ・スパノスに感謝します。
彼はこの分野のコンサルタントでもあります。彼へのビジネスのお問い合わせは、demetrianos.com でいつでも受け付けています。このシリーズに関するご質問や、私が制作している他のシリーズをチェックしたい場合は、computerenhanced.com をご覧ください。皆さんとそこでお会いできるのを楽しみにしています。
今週はここまでです。次回まで、皆さん自身でAIの中を進んでいく体験(Wading Through AI)を楽しんでください。それでは、ディミトリと私はまたインターネットのどこかでお会いしましょう。


コメント