AI専門家が語る業界の真実とエンジニアの未来

ソフトウェア開発・プログラミング
この記事は約26分で読めます。

AI業界で20年以上の経験を持つ専門家Dmitriを迎え、AI技術の実際の影響と現状について率直な議論が展開される。トークンコストの将来性、軌道データセンター構想の実現可能性、AIによるコード生成がもたらすレビュー業務の増大、そしてジュニアからシニアまでのエンジニアが直面する不安など、技術的側面とビジネス的側面の両面から掘り下げる。Sam Altmanの「100倍安くなる」という予測の妥当性、GoogleのTPU優位性、SpaceXの宇宙データセンター計画、そして企業がトークン使用量をKPIとして管理する現状の問題点まで、AIブームの裏側にある現実を冷静に分析している。

What's really going on with AI, Expert weighs in | TheStandup
ssh terminal.shop AI researcher Dimitri joins the show to talk about the real impact of AI on software engineering. We d...

AI専門家Dmitriの登場

スタンドアップポッドキャストへようこそ。今日は特別なエピソードをお届けします。実はCaseyが独自のポッドキャストを始めたんです。競合ポッドキャストとでも言いましょうか。どうしてそんなことができるのか、まあとにかく、彼とDmitriがAIの実際の影響について本格的な議論を交わしているんです。

なぜ彼らがそんなことをしているのかって?実はDmitriがAIに関する伝説的な人物だからなんです。この分野で非常に長い間働いていて、多くのことを知っている。そしてCaseyと同様に、TJと私を合わせたよりもはるかに有能なんです。だから彼らの会話は実際に役立つし、聞く価値があるわけです。

というわけで、彼らをお招きして、私たち自身の質問をいくつか投げかけてみようと思います。ポッドキャスト同士の融合とでも言いましょうか。

実はこのポッドキャストはDmitriのアイデアだったんです。私のアイデアではありません。まあ、私のアイデアであるべきだったとは思いますけどね。だって明らかに、君たちを捨ててもっと質の高い共同ホストと組むべきですから。でも実際は違いました。Dmitriが「AIについて話したい」と言い出したんです。基本的に彼は満足していなかった。気に入らないことがあって、語られている内容に不満があったんです。

まさかTwitterを間違えて開いちゃったとか?Twitterを見てしまって、「すぐにポッドキャストが必要だ」ってなったんですか?

Caseyの話に少し補足させてください。実はポッドキャストを始めようと思って始めたわけではないんです。私はこの分野で20年以上働いていて、プログラマーではない友人がたくさんいます。弁護士、会計士、医者など様々な人たちです。彼らは頻繁に私に尋ねてくるんです。まず第一に「これを自分の仕事で使えるか」、そして「これが自分にどう影響するのか」といったことです。例えば「大学に通っている子供がいるんだけど、大学に行かせるのをやめるべきか」みたいな質問ですね。

ある時点で、こうした内容をまとめるべきだと思ったんです。最初は文章を書き始めましたが、しっくりきませんでした。それで録音してみようかと思ったんですが、私は録音向きの性格ではないんです。

CaseyとはAIについて何年も話し合ってきました。それで、1回セッションを録音してみたらどうかと提案したんです。話せることのリストがあって。するとCaseyが「ここにはたくさんのトピックがあるから、これをポッドキャストにできるよ」と言ったんです。そうやって始まったわけです。

もう一つ付け加えたいのは、世の中にはCaseyのような個性を持った人がたくさんいることは知っています。私もそういうタイプなんです。だから私がここでやりたいことの一部は、Caseyがもっと活躍できる場を提供することなんです。私がサポート役になれる分野でね。

Caseyについて私が高く評価していることの一つは、何かを言う前にそれについて理解したいと思っていることです。これだけで少なくともポッドキャスターの上位20%には入りますよね。

少なくとも上位50%には入るでしょう。このポッドキャストの中では。

ちょっと待って。HTTPでコーヒーを注文するって?それは違います。私たちはSSHターミナル経由でコーヒーを注文するんです。本当の体験が欲しいなら、本物のコーヒーが欲しいなら、素晴らしいサブスクリプションで二度と忘れることがないようにしたいなら、独占ブレンドと独占コンテンツが欲しいなら、CRONをチェックしてください。

AIに対するCasey文化的視点

SSHって何か分からない?じゃあそのコーヒーは君向きじゃないかもね。

私がここから生まれることを期待しているのは、AIについてのCasey文化的な視点に沿った解説が得られることです。Caseyに言葉を代弁するつもりはありませんが、私たちはソフトウェアを非常に似た方法で見ているんです。最近のビッグテックから出てくるものの品質については同様に懐疑的ですし、疑わしい倫理的ビジネス慣行などについても同じです。

一般的なソフトウェアについて、AIソフトウェアではなく、Caseyとはほとんどのことで意見が一致しています。だから私が期待しているのは、サポート役になって、Casey文化的な解説のためのプラットフォームを提供することです。特にみんなの生活を乗っ取っているこのクレイジーなAIについて、私自身の生活も含めてですね。

最初のエピソードで触れましたが、以前は私の生活はもっと静かで、誰もAIが機能するとは信じていませんでした。私たちは静かに楽しいことをやっていました。ある意味、物事はもっと良かったんです。もちろん今機能しているのは良いことですが、まあ一応機能しているというべきでしょうか。この「一応機能している」という部分が、私が気にかけていることの大きな部分なんです。一応ではなく、本当に機能するようにしたいんです。

あまり長く話しすぎたので、Caseyに締めくくってもらいましょうか。

私に対して寛大すぎると思います。私は私たちのポッドキャストではサポート役なんです。だって私はAI関連の仕事をしていないので。だから信頼できる人にAIについてしっかりした視点を提供してもらう良い機会だと思ったんです。AIについて解説するには、本当にたくさんの時間を費やさなければならないでしょう。でも私はそれをやりたくなかったんです。

だからすごく良かったです。明らかにDmitriと私はまだ投稿していないものも含めていくつか録音しました。本当に楽しんでいます。それでPrimeとTJに話を戻したいと思います。君たちにはAIについて聞きたい質問があるんだろう?

好きなように進めてください。私たちはここにいます。あなた方のために。

Dmitriの経歴と専門性

まず最初に、Dmitri、本当に適切な紹介をしていませんでした。伝説的だということ以外は。

優しい言葉には感謝しますが、私は自分を比較的有能だと考えていますけど、業界には大物がいます。友人だったり友人の友人だったりする人たちです。少なくとも公的に有名な人たちと比較して、自分を適切に評価しておくことは役立ちます。

紹介としては、私は広義のAI関連研究を20年以上やってきました。2005年にGoogleで多くの人に向けて最初のカスタム設計AIを出荷しました。彼らの最初の一つでした。

2025年って言いました?

ああ、すみません、2005年です。

20年前ってことですね。それってバナナナノバナナみたいな感じですか。

まさにその通りです。とにかく、長い間これをやってきて、ビジネスの浮き沈みをたくさん見てきました。この業界の歴史も研究しています。だから60年代まで遡る過去50年間の浮き沈みについても知っています。

私が本当に興味を持っていることの一つは、これが他の人々にどう影響するかです。例えば私が一緒に働いている人たちです。最初のエピソードではジュニアエンジニアへの影響について話しましたが、シニアエンジニアへの影響についても話すべきでしょう。彼らは別の問題に直面しているからです。

例えば今45歳だとして、長い間これをやってきて、良い安定したキャリアがあって良い収入を得ている。そして今、もし彼らが問題を解決して5年後に自分が役立たずになったらどうなるのかと考えているわけです。私はそう悩んでいる人たちを知っています。

特にキャリアの後半で役立たずになるのは最悪のタイミングですよね。50歳で、次に何をすればいいのか分からない。ジュニアエンジニアが直面する問題とは違います。ジュニアにとっても大きな問題ですが、彼らには人生全体が先にあって、何か別のことを試す時間があります。でも50歳で新しいキャリアを15年かけて築く時間がなかったらどうするのか。これは多くの人が心配していることです。

自分について話しすぎることはできませんよ。私たちはCaseyと付き合うのに慣れていますから。大丈夫です。

私たちは賢いゲストに話してもらうのが好きなんです。そのために呼んでいるんですから。

もう一つ付け加えたいことがあります。これは業界に対してCaseyスタイルの視点を持つことに繋がるんですが、私はソーセージがどう作られるかをたくさん見てきました。技術的な側面だけでなくビジネス的な側面も含めて。これについては後のエピソードで話しています。どの主張を額面通り受け取れるか、どう評価するかといったことです。

Microsoftが主張するWindowsのパフォーマンス向上を額面通り受け取れないのと同じです。これまでで最高のWindowsになる、完璧で欠陥がなく安全になるって言いますけどね。

これが史上最後のWindowsになるはずでしたよね。

まあ、彼らは今でもそれを最後のWindowsにしようと取り組んでいますが。

つまりLinuxデスクトップのことですね、TJが言いたいのは。

彼らはそれをAIに入れて、どうやって最後のWindowsにするかの計画を受け取ったんです。それを完璧に実行しています。

彼らは「Windows 11というものがあって、これでWindows 10が本当に最後のバージョンになることを保証します」って言ってるんです。

それでうまくいかなかったら、Windows 12がありますからね。

トークンコストの経済性

私にはいくつかトピックがあって、楽しめると思ったんです。どこに繋がるか、何が起こるか見てみましょう。

少なくとも私が聞いたエピソードでは、一つのトピックから始まって95の異なる枝に分かれていくような感じでした。だから全部カバーできなくても構いません。楽しければいいと思います。

私が興味を持っていることの一つは、現在のトークンコストの状況と今後の見通しについて、誰かの偏りのない、まあ誰もが何かしらの偏りを持っているでしょうけど、より合理的な見解を得るのが難しいということです。Dmitri、これについて何か考えはありますか?Sam Altmanが正しくて、毎年10倍安くなるとか、そういうことになるんでしょうか。Twitchチャットはいつもそう言ってますけど。

Samは記録に残してます。2回言っています。GPT-5.2は2年後には100倍安くなると予測しています。

その多くはインフラ開発とアルゴリズム開発で、企業秘密です。私には評価できませんし、OpenAIの内部の人間でも公に評価することは違法でしょう。彼らが何を準備しているのか分かりません。

つまり彼らには非常に優秀なチームがいます。100倍安くなるというのは信じがたいですが、まあ様子を見ましょう。この業界での主張を評価する際の問題の一つは、内容と同じくらいタイミングが重要だということです。

例えばMuskを例に取りましょう。Samから離れて。Muskは2005年頃に再利用可能なロケットができると言っていたと思います。それが実際に機能するまでには何年もかかりました。Teslaの完全自動運転の最初の約束はいつでしたか?2016年だったと思います。

そしてその後6か月ごとに繰り返されました。

だから主張の内容とタイミングを分けて考えるのが有効だと思います。

最終的に100倍安いトークンコストを実現できても驚きません。今それができるかどうかは、私の知識を超えています。それは部分的にインフラであり、カスタムハードウェアであり、より安い電気を得られるかどうかであり、ビジネスに関わる多くの要素があるからです。一方か他方を主張するのは難しいんです。

言えることは、見てきたように、これはゴールドラッシュのメンタリティーだということです。みんなができる限り速く、できるものを何でも作っています。出してみる。機能する?かろうじて機能する?よし、次に進もう。

その一部は無謀さかもしれませんが、一部は市場の力です。今は複数の本当に大きなプレーヤーがいますが、おそらく10年後にはそれほど多くの大きなプレーヤーはいないでしょう。彼らはすでにこれに多額の資金を投入しているので、取り残されたくないんです。だから軍拡競争はビジネスの観点からは合理的です。完全に合理的なエンジニアリング成果物を生み出しているかどうかは別として。

つまり、現在のシステムの効率を改善する大きな機会があることは確かです。私の最大の疑問は、内部のシステムが今それを最適化できるほど安定しているかということです。例えば1年かけてトークンコストを下げるために最適化して、次のアーキテクチャ上のイノベーションが来たら、その最適化が無効になるのかどうか。分からないんです。

だから「分からない」と言うことが、AIについて話している他の多くの人よりも多いかもしれません。これらの企業の深部にいる人々にとってさえ、2、3年後に何が起こるかについては多くのことが未知なのです。

Googleのインフラ優位性

それに一つ付け加えたいことがあります。情報を追加するというより、考えるべきことの追加なんですが、コストが本当にそんなに速く下がるなら、Googleのコストはすでに非常に低いと予想したと思うんです。

変なことを言っているように聞こえるかもしれませんが、100倍全てがソフトウェアから来ると仮定するなら、それは起こり得るかもしれません。でも100倍のかなりの部分がインフラ構築から来ることを期待しているなら、GoogleはかなりAI中心のものを長い間構築してきたように感じます。TPUはまさにこの仕事をするためだけに構築したマシンです。一方Nvidiaのようなところはそうではありません。Nvidiaのカードは、最新のものだけが本当にAIに焦点を当てていると言えますが、それでも少しハイブリッドな感じがします。

だから誰かが「Nvidiaしか見られないなら、ハードウェアのリードタイムは非常に長いと信じられるかもしれない。だから彼らが4、5年前に『AIが最大のものになる。全てを完全に再設計してそれだけに集中する必要がある』と方向転換したとき、そのパイプラインの終わりは今頃やっと見えてくるだろう」と言えば分かります。でもGoogleは長い間これをやってきたように感じます。もし単にAIハードウェアをやることで得られる大きな利益があるなら、彼らはすでに持っていると思ったんですが。私は間違っていますか?

彼らが持っていないとは限りません。TPUについて初めて聞いたのは2014年頃だったと思います。それは私が聞いた時期です。私はGoogleの内部の人間ではないので、Googleの仕組みを知っていると、私が公に聞く3年前から彼らはそれについて話していたはずです。

私はGoogleが出す内部経済レポートのようなものを研究していません。彼らはすでに運用コストでOpenAIよりかなり安いかもしれません。

業界では一般的な通説があって、Googleはこのビジネスで静かなモンスターだということです。例えばOpenAIと比較すると、彼らは永遠にインフラのリーダーでした。永遠にAIのリーダーでした。OpenAIと違って、インターネット全体に対する、監視と言わないようにしていますが、監視を持っています。だから訓練可能な情報の絶え間ない流れがあります。XAIは独自のデータフローを持っています。

多くの人が、Googleは製品面では少し遅れていたという感覚を持っています。製品面を強調します。チャットLLM製品において。でも多くの人が、Googleは他の誰も持っていない全ての利点を静かに活用していくだけかもしれないという感覚を持っています。

XAIだけがそれに近い能力を持っています。興味深いことに、私が公に見た限りでは、XAIはStarlinkではなくSpaceXと合併しようとしています。そして今、軌道データセンターについて話しています。

軌道データセンターの可能性

私が興味深いと思ったのは、彼らが話しているデザインがTPUベースではなくGPUベースだということです。彼らがGoogleほどうまく構築できないと思っているのか、ライセンスできないと思っているのか分かりません。でも私が見たデザインは、NvidiaスタイルのGPUに基づく推定値でした。TPUではありません。彼らは何か知っているはずです。彼らがやっていることはこういうことですから。

Musk系列の企業の最大の能力優位は、物理的なものの構築、最適化、合理化における徹底的な実行です。これは長い間本当にうまくやってきたことです。だから私が見たデザインがTPUではなくGPUベースだったことが目を引きました。

彼らが独自のAIチップに取り組んでいることは知っていますが、どこまで進んでいるかは分かりません。でも軌道データセンターのデザインについて話していたとき、私たちが理解している従来のGPUについて話していたのは興味深いことです。

軌道データセンターって、構築するものとして最高にクールな響きですよね。

実用的ではないように思えます。ロボットがやるとか、宇宙だから本当にクールだとか言うのは分かります。でも軌道データセンターで働いていると言えるのは、ソフトウェア開発で最高にクールなことだと誰もが認めるべきです。

軌道データセンターについて見てきたことに基づくと、あなたが考えていることよりもはるかにクールか、はるかにクールじゃないかのどちらかだと思います。

宇宙の巨大な建物のようなものを想像しているなら、より実現可能な主要なデザインはStarlinkに近いです。光リンクで高速通信のために互いに通信する小さなものがたくさんあるような衛星クラスターに近いです。

そして巨大なラジエーターですよね。

そうです。ほとんど全てがラジエーターです。そして中心に小さな突起があってGPUが入っています。

私が頭の中で想像していた宇宙の大きな超高層ビル、GPUのラックがあって歩き回れるような、本当にクールなものほどではないですね。

でも大丈夫です。親に軌道データセンターで働いていると言えば、彼らは知らないから。

彼らが想像するのはそういうものです。

まさにスターウォーズみたいだよ、お母さんお父さん。信じて。

残念ながら、熱は宇宙では問題です。子供たちが言うように問題なんです。宇宙で熱を逃がすのは非常に難しいです。だからこれが問題なんです。Dmitriが言ったように、チップごと、熱を発生するNvidiaのような、GB200のようなものごとに、多くの表面積が必要になってしまいます。

これらが打ち上げられる頃にはGB200ではないでしょうけど。

私が理解できなかったのは、じゃあ利点は何なのかということです。普通の人に宇宙に置くことについて話すと、「宇宙は冷たいからGPUにすごく良さそうだ」と言いますよね。でも逆だと思います。

宇宙が冷たくないわけではありません。冷たいとはエネルギーがないことです。密度がないので、何もないんです。

普通の人が言うのは、冷却が超簡単だってことだと思います。巨大な冷蔵庫みたいだって。でもそれは熱の仕組みではありません。だから私はその部分は理解しています。じゃあ利点は何なのか?これについてあまり深入りする必要はないんですが、私自身も疑問に思っていたので。なぜ宇宙に置きたいんですか?

信じられないほどの投資です、TJ。どれだけの投資が入ってくるか。宇宙に置けるデータセンターのTAMを考えてください。

無料の電力と難しいけど無料の冷却です。物理を機能させられるかどうかは分かりません。SpaceXには本当に優秀な熱の専門家がいるはずです。だから彼らはこれが実現可能だと示唆するシミュレーションを行ったと思います。

無料の電力と、同じパネルを地球に置くよりも多くの無料電力が得られます。大気がないからです。

大気も天候もありません。

雲もありません。だから無料の電力と難しいけど無料の冷却です。

つまり本当に複雑なものを作るけど、それがビデオゲームでパッシブになるってことですね。この仕組みは理解できます。

ビジネス戦略としての宇宙データセンター

もう一つ付け加えたいのは、これは完全にビジネス戦略の推測です。大きく受け止めてください。

金融アドバイスですね。分かりました。

まさに。もしこれが機能して、あなたがMuskのAIチームで、AIを宇宙に打ち上げられるなら、他のみんなは地方自治体と戦って、ここに水力発電所を建てられるか、どれだけ払わなければならないか、みたいなことをやっている間に、あなたは「俺たちは宇宙に行くぜ。負け組は地球に残ってろ。宇宙に行くんだ。ところで宇宙に行きたいなら、俺を通さなきゃならないぜ」って言えるわけです。

彼は宇宙への通路をほぼ独占しています。

彼らはKaty Perryに頼めないですからね。彼女はノーチラスだし。

また、こういうもののプロジェクションを見ると、全てが打ち上げコストについてです。いわゆるデータセンターを宇宙に置くことが意味をなすかどうかは、打ち上げコストがこれだけだということに基づいています。それは故障率、どれだけの期間そこにいられると予想されるか、そういったことに基づいています。

結局のところ、SpaceXのようなところを見て、彼らが「まあ俺たちは打ち上げコストを1キログラム50ドルまで下げられる」とか、魔法の数字が何であれ、「他のみんなには1キログラム75ドル請求する。そうすれば彼らにとっては宇宙に置く価値がない。あるいは彼らのものは常に俺たちのより悪くなる」となるわけです。非常に有利な立場です。そしてもしこれらが実際に将来役立つことが判明すれば、SpaceXにとって驚くほど利益の出る賭けになります。

エンジニアの将来とコードレビュー

もう少し実用的なAIのアプローチに戻ろうと思います。軌道データセンターは素晴らしいと思いますけど。

このビデオのタイトルを「軌道データセンター、宇宙にAI」にしたらどれだけクリックされるか。

それが私が書いているロックオペラです。どうして知ってたんですか?

私も「宇宙のAI」っていうロックオペラを書いていることが分かりました。

コラボできますね。

それは起こらないでしょう。彼はあなたから全部奪うだけです。

多くの人から懸念を聞いていて、最近よく受ける質問の一つが「自分の将来はコードをレビューするだけになるのか」というものです。

十分あり得ます。どれだけ可能性が高いか慎重に言おうと思います。私が自分の仕事で発見し、しばらく公に言ってきたことの一つは、繰り返し可能で再現可能なAI結果に取り組もうとしているということです。私が使ってきた総括的な用語は「リライアブルAI」ですが、Reliable AIという会社があることが分かったので、とにかく私が今完全にハンズオフでできると思うこと、何もレビューしなくていいことは、例えばこのHTTPエンドポイントからこれをダウンロードして、データベースに保存して、何かの平均を計算するダッシュボードを作ってくれと頼めば、結果が出て機能して、もう話す必要がないということです。それが私の言う完全にハンズオフスタイルです。

今のところ、その限界はおそらく比較的標準的なジュニアレベルのコード数千行程度だと思います。

強調したいのは、監視を持ち、複数回試行し、アルゴリズム的なテストスイートを持つことでもっとできないと言っているわけではありません。もっとできないとは言っていません。私が話しているのは、ハンズオフでできることの限界、ほぼ信頼できることの限界です。

少なくとも、レビューが重いフェーズを通過することになると思います。企業は好むと好まざるとにかかわらず、これをみんなのワークフローに押し込もうとしているからです。ご存知のように、これを使うよう押し付けられることを嫌がっているAI業界の人もたくさんいます。

私はただ自分の仕事がしたいだけなのに、彼らは私のトークン使用量を監視しているんです。

これは逸話でもあり、文字通りでもあります。友人がいて、「このツールを使わなければならない、Claude Codeだけを使わなければならない」と。それがKPIの一部で、マネージャーは月のトークン数のダッシュボードを持っていて、それについてレビューで話すんです。

好きなものを何でも使えるわけではなく、実験しているのを見たいだけというのではありません。Claude Codeを使わなければならない。これをやらなければならない。クレイジーです。

Amazon Curoについて考えてください。多くの人が今それについて話しています。Amazonが偶然いくつかのSEV 1を起こしたことについて。

彼らは「自分たちのものを使ってサイトを落とさなければならない。誰かがサイトを落とすなら、それは俺たちだ」って。

サイトがダウンして、AIの見栄えも同時に悪くなるようにしたいんです。他の誰かのAIの見栄えが悪くなるのは嫌ですから。

それは意地悪です。もしAIのせいでダウンするなら、それは俺たちのAIだ。

AIのIに目を入れてるんです。

その通り。素晴らしい。

Primeのその点について、レビューが重いフェーズを通過する可能性は非常に高いと思います。ある時点で、労働者がこれに十分反対して、もっと受け入れられるものを見つけなければならなくなると思います。試したことがあるか分かりませんが、5分ごとにClaudeが何かを投げつけてきて、「さあこれをレビューして承認してマージして」とか、あるいはYOLOできますけど、YOLOするとどうなるか見てきました。

少なくともレビューが主なフェーズを通過すると思います。人々はそれを好まないだろうというのが私の予想です。今のところ代替案が見えません。

今見える2つの可能性は、トークン数を監視されるので、トークンを消費して生成する必要がある、そしてそれがPRに紐付けられる必要がある。実際に一部の場所ではトークンをPRに紐付けています。

だから多くのPRを生成し、多くのトークンを消費する必要がある。AIで多くのPRを生成してレビューして、レビューで何かを見逃してProudを落とさないように願う以外にどうやってそれができるでしょうか。

ビジネス側がある時点で「分かった、落ち着こう。トークン使用量の監視をやめよう」と言う以外に、どうやってそこから抜け出せるか分かりません。個人的には、それはデスクトップモニターやキーボードモニターと大して変わらないように感じます。非常に侵襲的に感じます。

ツールを使ってもらえますか、より良い仕事をしてもらえますかと尋ねるのは公平だと思います。それは公平だと思います。結局、何かをするために給料をもらっているわけですから。ビジネスが「これらのツールを使いたい。これを使えば20%多くの仕事ができると思う」と尋ねるのは公平だと思います。

でもマイクロトラッキングは過去より悪く感じます。

すごく簡単にゲームできますよね。全てのファイルを順番に見ていくだけで、トークンを粉砕できます。

ビッグテックで何かに取り組んでいる友人がいて、まさにあなたが言っていることをしなければならなくて、「これはAI使用のために外見を保つためにやっているだけで、最終的な成果物は10%くらいしか変わらない」と言っています。

文字通りお金を燃やしているだけで、彼らは「これで速く見えるから」って。

軌道データセンターで気を取られる前に、実は、史上最高にクールな名前ですけど、トークン経済学についてあなたの考えを聞きたかったんです。今はみんながお金を燃やして物事を試していて、「ああ、今月5000ドル使ったんですね。でも以前は45ドルのオンラインコースの承認も得られなかったのに、今は何もないのに月5000ドルのトークン、はい、完全にOKです。毎月やってください」って感じです。

生成量を減らすとか、生成されているものをチェックするツールをもっと使うとかの大きな動きが見られるかどうか興味があります。ある時点で、Claudeが最近リリースしたコードレビューのようなもので、通常1レビューあたり15ドルから25ドルって言っていますが、人々が「今日1万行のコードを出荷した」とか「ブログ用に30万行のRuby on Railsアプリケーションを作った」と言っている速度ではかなり速く積み上がります。ところで、それはGary Tanですよ、Casey、あのツイート見ませんでしたか。

彼は湖を沸騰させてから海を沸騰させると言いました。

ちなみに、彼が史上最高の煽り屋なのか判断できませんが、別のエピソードでそれに戻れます。

ビジネスにおけるKPI管理とAI

興味があるのは、そういう角度です。なぜなら、タスクによってはエージェントに作業させることで本当に速くできるものもあるし、エージェントが永遠に回り続けるものもあります。明確な結果があって、すでにコードベースにたくさんのパターンがある場合は回させます。

でもビジネスは、私が一晩で500ドルのトークンを使うことに永遠にOKでいるんでしょうか?この機能から500ドルの価値が戻ってくるとは思えません。だから何かその方向で考えはありますか?

これは推測です。多くは企業にとってのプリンシパル・エージェント問題です。

確実に、CEOとかその一段下のレベルで、AIで多くのことをやったと主張することに個人的な利益が結びついている人がいます。

そうですね。

ご存知のように、大きな組織では、何かが良いか悪いかだけで評価することはありません。KPIを通して評価しなければなりません。

はい。

私が直接見たわけではありませんが、確実にこれに近いものが存在すると思います。数百万ドル相当のボーナスが「今年トークン使用量を2倍にできるか」と「そのトークン増加に起因してPRを20%増やせるか」に結びついている人がいます。この新技術を使うことについて非常に官僚的な考え方です。そういう人がたくさんいるのは確かです。

だから彼らにとっては、自分のお金を使っているわけではありません。会社のお金を使っているんです。ボーナスをもらえるメトリックを上げるために会社のお金を使うよう指示しているんです。

これがどれくらい続くか分かりませんが、現在確実に、ビジネススタックの複数のレベルで非常に大きなプレミアムがあって、人々が「なぜトークン使用量が2倍になっていないんだ」と言っています。

冗談に聞こえるかもしれませんが、友人がいて、「上司が来て『なぜトークン使用量が2倍になっていないんだ』と聞かれた。先月たった300ドルしかClaudeを使っていない」と言っています。

先月ハニー、Claudeをほとんど触ってないじゃないか。どうしたの?

何か問題でもあるの、スイートハート。

AmazonのAI導入問題

実際にそれについてフォローアップしたいんですが、これはずっと話題になっていることの一つで、AmazonのCuroの問題で全てがダウンして、今彼らは「ジュニアとミッドレベルの人がGenerative AIを使うときは、シニアがサインオフしなければならない」と言っています。

それについて簡単な質問をしてもいいですか、Prime?以前はシニアがジュニアのコードをレビューする必要がないという方針だったんですか?

私の想定では、多くの企業と同じで、ジュニアがミッドレベルの人にコードをレビューしてもらって「これはあまり良くない」と言ってもらえるということです。全ての変更が同じである必要はないので。シニアがあらゆるPRをレビューしなければならないとしたら、事実上シニアを消耗させて失うことになります。

それは理にかなっています。だから人事問題を除外すれば、Amazonで発生するであろう問題を除外すれば、これはトークン測定が必ずしも最良のメトリックではないことに人々が気づく最初の兆候ですか?Amazonを傷つけているのは、トークンメトリックを史上最高のものとして本当に強く推進していて、この一つのことだけを推進しなければならないと。そして今、速く動きすぎたことの影響を感じているからだと思います。

トークン2倍にする代わりに、何か別のものを2倍にすべきという世界が存在するんでしょうか。例えばアップタイムとか。アップタイムを評価するものにして、それが重視するものになる。それが可能なのか。

これは実際に前進する道なのか、それともあなたの視点から、トークン使用量を2倍に、2倍にし続けるのを見続けるだけなのか?両方とも純粋に理論的な観点からは魅力的に聞こえます。ああ、もっと機能を得られる、全ての機能を得られる、いや安定しよう、みたいな。

これについてCaseyと話したように、Caseyも飛び込んでください、これまで見てきたサイクルがあります。25年前は全てがオンラインでなければならなかった。それから全てがWeb 2.0でなければならなかった。それから全てがソーシャル・ローカル・モバイルアプリでなければならなかった。それから全てが暗号でなければならなかった。

技術が提供する実用性とは別に、今まさにそのフェーズにいます。全てが今これでなければならないという社会的マニアです。

その熱がいつ冷めるか分かりません。確実にAmazonのような出来事がそれを助けるでしょう。ある時点で誰かが「分かった、こんなにお金を燃やし続けて、インフラを燃やして、エンジニアを狂わせることはできない。ある時点で、実際にこれから恩恵を得るべきだ。自分たちを傷つけるのではなく」と言うと思います。

これは何年も続く可能性があります。何年も続く可能性があると言う理由は、人々は気に入らないでしょうけど、これが何年も続く可能性がある理由は、あなたたちやこれを見ている人々が、どれだけアーリーアダプターのパワーロー曲線の上にいるかを過小評価しやすいからです。

私はいつもたくさんの人に会いますが、AIをより良い検索エンジンのように概念化している人がまだいます。実際、大多数の人はこれについてあまり知らず、使おうともしていません。だからそういう人々全員が何とか熱病の沼地を通過しなければなりません。

何年もかかる可能性があると思います。

それに同意します。そして追加したいのは、最初のエピソードで話したことですが、Proudを常にダウンさせるかどうかは問題にならないと思います。少なくとも私の過去20年の経験では、実践がどれほど悪くても関係ありません。それが時代精神の中にあるだけなら、人々はそれをやります。明らかに示すことができます。「この方法でやっていたら、これだけ良くなっていた」と文字通り実証できます。彼らは気にしません。ベストプラクティスはこの別の方法でやることだからです。ベストプラクティスはPythonを使うことだから、Pythonを使っている、みたいな。

「この方法で書いていたら100倍速かった」と言っても、「気にしない」って。この業界はそう動いてきました。だからAIの特別なケースで誰かが良いかどうか気にするだろうと考えるのは非常に奇妙です。実際にコードを生成する際にどれだけ良いかについての推測さえ脇に置けます。

これだけ勢いがあるという事実だけで、これが長い間ここにあることが分かります。現在のやり方が。今と同じくらい良いままだったとしても、全く改善がなかったとしても、結果は変わらないと思います。正直に言って、本当にそう思います。

それに1兆ドルが投資されています。だからたとえそうだとしても、本当に必要なんです。これが機能しないと本当に困るんです。サンクコスト誤謬ではなく、文字通りサンクコスト真実です。

だからこれがワークフローになると思います。それは避けられないと思います。

私としては、AIが大幅に改善しなければ人々が再考すると言えればいいんですが、そうは思いません。品質を押し上げられるかどうかに関わらず。みんなAIの品質を押し上げるために多くのお金を投入しているので、うまくいくといいですけど。でもたとえそうならなくても、関係ないと個人的には思います。

このエピソードが気に入ったら、残りはSpotifyで見られます。「いいね」と登録を忘れずに!またね!

今日起動。画面に5つのエラー。ターミナルコーヒーで夢を生きる。

コメント

タイトルとURLをコピーしました