OpenClawの開発者として知られるMario(pi.dev)が、自身が開発した自己改変型コーディングエージェントPi Agentについて語ったインタビューである。Claude Codeから自作エージェントへ移行した経緯、コンテキスト管理の重要性、トークン経済の最適化、オープンウェイトモデルの台頭、そしてAI時代における労働市場と教育の変化について、現場の視点から率直に論じている。AIエージェントの実用と幻想を見極める、技術者ならではの示唆に富んだ対談である。

Pi Agent誕生の経緯
すごいね、Mario。さっそくですが、あなたはあの有名なPi Agentの開発者、pi.devの生みの親です。まずはPiを作ろうと思ったきっかけから聞かせてください。
LLMは基本的に2022年からずっと使っています。OpenAIがChatGPTを出したころからですね。私は2000年代にNLPと機械学習のバックグラウンドがあったので、ずっとこの分野を追っていて、LLMにはかなり魅了されました。以前は苦労してやっていた自然言語処理のタスクを、より能力の劣るモデルでやろうとしていたものを、LLMなら全部できてしまうんですから。私自身ソフトウェア開発者でもあるので、いつも自分のソフトウェア開発タスクに使えないかと試していました。それが本当に機能し始めたのは、たぶん2024年のいつかにCursorが出てきてからだと思います。しばらくはそれで動いていたんですが、かなり制限が多くて、基本的に個別のファイル単位でしか動かなかったんですね。コードベースの他の部分からコンテキストを引っ張ってはきていましたが、本当に素晴らしいというほどではなかった。
そして2025年4月、PeterとFlaskおよびSentryで有名なArmin Ronacherが私に向かって叫んだんですよ、エージェントが今ちゃんと動いてるぞ、って。
それがPeter Steinberger、つまりOpenClawの開発者ですよね。
そう、まさにそいつです。私たちは二人とも、いやいや、馬鹿言うな、そんなの起こるわけがない、と言っていました。でもちょうどそのころ彼がClaude Codeを使い始めていて、とにかくClaude Codeを試してみろの一点張りだったんです。それが大きな啓示でした。Anthropicのチームがやったことは本当に天才的でした。それまでのCursorなどのコーディングエージェントは、コードベースをインデックス化して、エージェントには自分で物事を探索するための十分なツールを与えていなかったんです。それに対してAnthropicは、エージェントに基本的にコンピューターそのものを使わせるという天才的なアイデアを思いついた。ターミナル的なもの、bashのようなコマンドを実行できるものを与えたわけです。これらのツールがあれば、エージェント自身がコードベースを探索できる。そしてLLMはコードベースを探索するのが本当に得意だということが分かった。
これによって、いわゆるエージェンティック検索が可能になり、状況が一変しました。Cursorのような、エージェントが望むだろうと思うものを与えるけれど自分では検索させないというツールに縛られなくなった。これが私にとってエージェント・コーディング全体の始まりで、私はClaude Codeの熱烈なファンでした。でもやがてClaude Codeのチームが大きくなってきて、いわゆるトークン・マックスIみたいな状態になり、機能を次々追加していった。それに伴ってバグも増え、システムプロンプトもどんどん変わっていきました。
それは2025年のいつごろの話ですか。
7月か8月くらいですね。
なるほど、そのころから余計な機能だと感じ始めたわけですね。
ええ。Claude Codeを少しリバースエンジニアリングしました。リバースエンジニアリングと言っても、結局はJavaScriptアプリなのでそんなに難しくはないんですが、彼らが結構くだらないことをやっているのが見えてきた。前置きしておくと、私はあのチームを愛しています。彼らはこのジャンルそのものを作った人たちですから。でも私にとっては、もう使えるツールではなくなってしまった。毎日のように私のワークフローを壊してくれるんです。
そこで少しずつ自分用のものを作り始めて、10月にはPiに完全に乗り換えました。LLM部分以外は安定していてとても満足しています。LLM自体は当然自分でコントロールできないし変化していきますが、その周辺部分は今や完全に自分の管理下にあって、余計なことを一切しない。だから異なるモデル間でもワークフローはかなり安定しています。
なぜClaude Codeは肥大化したのか
なぜそうなったと思いますか。単に製品の自然なライフサイクルなのか、それとももっと消費者向けにシフトしようとしてガードレールを増やさざるを得ないのか。
彼らは自分たちが説いていることをドッグフーディングしているんだと思います。それ自体は別に問題ない。彼らは炭鉱のカナリアみたいな存在で、現時点でエージェントがどれくらい自律的に動けるか、彼らが吐き出す製品が良いものかどうかが見えるわけです。私個人としては、Claude Codeは良いとは思いません。ただ人によって受け止めは違うでしょうし、多くの人が現に使っているわけだから、ほとんどの人にとってはひどくはないんでしょう。あるいは単にスロップに慣れているだけなのかもしれません。これも私が観察していることですが。
ただ最近はまた手綱を引き締めようとしている節もあります。ほんの数日前にも、おっと、すみません、何かをいじってしまいました、みたいなことがあった。リーズニング・エフォートだったかな。それを静かに切り替えたんです。リーズニング・エフォート自体は大した話じゃないんですが。あれは単にデフォルトをhighからmediumに変えただけで、自分で変更できますからね。
でも彼らがやったもう一つのことがあって、モデルが思考するときには、テキスト・コンテンツ・ブロックを生成する前に思考トレースを生成する。サーバー側で、Anthropicはそれをそのままクライアントには送らないんです。Claude Codeにはね。代わりに別のモデルにそれを要約させてクライアントに送る。だから次のターンであなたが別のプロンプトを送ったときに表示する何かを持っている。その思考トレースは元のものがサーバー側で再構築される。
ところがどうなったかというと、3月26日に、レイテンシを減らすため1時間以上アイドル状態だったセッションからClaudeの古い思考を消去する変更をリリースした、と。つまりエージェントを1時間動かしていたり、ランチを取りに離席して戻ってきたりすると、古い思考トレースが全部消えていて、そのセッションでエージェントが覚えていられる内容に影響する。これは本当にひどい。セッションを通じて生成された情報の半分を取り上げてしまったら、そのセッションのモデルをロボトミー手術しているようなものですから。
つまり結局はコンテキストの問題ということですね。
すべてはコンテキストの問題なんです。
そう、それがあなたが求めていた主要なものの一つだったんですね。システムプロンプトに対する完全なコントロール、つまり今日のアシスタントが明日も同じだと確信できる状態。
もちろん彼らはバックエンドサーバーに、APIで送ったもの以外にも追加のコンテキスト要素を持っている。あなたが送るものがそのままLLMが見る最終形ではないわけです。私はとにかく自分が実際にコントロールできるものすべてに対するコントロールが欲しい。Codexを含めて、これらのコーディングエージェントはどれもそういうコントロールを与えてくれない。だから私はPiを作ったんです。
ミニマリズムを保つ努力
つまりミニマルな状態を保つには意識的な努力が必要だと。膨れ上がって機能だらけにならないようにすることを主目標として持つ必要がある、と。
あなた自身もコーディングエージェントを使う側ですよね。だからモデルがおかしくなったり、エージェントが脱線したりするタイミングについて、かなり良い直感を持っているはず。それは大抵コンテキストの腐敗、使われたコンテキストの割合と関係しています。私は自分のものを効率的にしておきたい。過去20年間、私はずっとそうやってソフトウェア開発をしてきました。コントロールが欲しいのは、それがなければソフトウェアがクソになると分かっているから。そしてソフトウェアの作成の多くをエージェントに委ねるなら、彼らが実際に良いものを生み出す確率を最大限に高めたい。Claude Codeがあなたの背後でやっているような今のやり方では、それは無理だと思います。
Anthropicについては、彼ら自身が事後検証で認めた部分もありますが、もっと大きな告発として裏でモデルがこっそり変わっているという話がたくさんあります。Claudeのモデルは使っていないとはいえ、そういうことを感じたことはありますか。
いえ、感じたことはありません。起きていることは二つあると思います。一つ目は心理的なもの。新しいモデルが出る、めちゃくちゃ興奮する、1兆トークン使ってグリーンフィールドのプロジェクトを作りまくって、すごい、Three.jsアプリを作ってくれた、みたいな。当たり前にできることなんですけどね。やがてもっと重要なものに使い始めて、ああ、まだダメだ、ここで失敗した、みたいになる。だから初期の熱狂が消えていくという意味で、ほとんどは心理的なものだと思います。
ハネムーン期間ですね。
そう、まさに。二つ目は、ハーネスの問題、特にClaude Codeの場合。ハーネスがあまりにも頻繁に変わるので、モデルが変わっていなくてもハーネスが変わるだけで色々なものが壊れる。私はこの二つのものに大半を帰属させますね。心理的な要因と、ハーネスがいつの間にか変わって壊している要因。Piでは、Claude Codeを使っている他の人が報告するような劣化は経験していませんから。
そう、変動する要素が多すぎて、何が変化を引き起こしているのか分かりにくくなって、人々は一番楽な説明に飛びつくわけですね。
モデルを量子化したんだ、と。当然そうしたに決まってる、と。でも量子化された形でモデルを実行することがインフラ的に何を意味するか分かりますか。完全に別物ですよ。
完全に別物ではないにしても、相当な労力ですよね。
そう、インフラコストを多少節約できるかもしれないけど、それを動かすこと自体にもコストがかかる。だから私はそれには納得していません。それに、それほど頻繁に変わらない他のハーネスではそういう劣化を見ていない。OpenCodeのようにAnthropicのモデルを使っている人たちと話せば、彼らも同じように劣化をそれほど感じていないか、まったく感じていないと言うはず。だからこれはほとんど心理的なものだと思っています。
集団心理ですよね。みんなが同じ意見を持つ集団精神病のようなもの。
公平を期すために言うと、今年の前半に彼らは推論エンジンのカーネルか何かのバグで実際にモデル劣化が起きた事例があった。ただそういうのは彼ら自身がすぐに気づいて修正するのが普通です。
AIエージェント業界で愛するものと嫌いなもの
AIエージェント業界全体について、一番愛しているものと一番嫌いなものを一つずつ教えてください。
愛しているのは、はるかに生産的になれて、以前なら時間がなくてやらなかったようなプロジェクトに取り組めるようになったこと。それから、すぐに色々と実験できるようにしてくれること。既存の製品があれば、エージェントに新機能を作ってと言うだけでいい。完璧である必要はない、ただ存在さえすれば、それを試して、自分の製品に意味があるか、ユーザーが必要としているかを確認できる。ユーザーがいる既存のブラウンフィールド・プロジェクトに、1〜2時間か午後一回で新機能をぱっと作って、自分でテストして、テストステージング環境で数人に使ってもらって、うまくいけばきれいに仕上げる。ダメなら捨てるだけ、時間も眠れぬ夜も失わない。これはもう本当に素晴らしい。ただし判断力は必要になります。
嫌いなのはくだらないハイプ。本当に疲れます。Ralphループみたいなやつ。Ralphループは機能するんですが、人々はなぜどう機能するかを誤解している。Karpathyのオートリサーチの方がRalphループの良い例だと思います。あれは基本的にRalphループそのもので、モデルに具体的な成功基準と目的関数を与えて、何かを改善したかどうかをモデル自身が評価できるようにする。これが科学的なRalphループで、実際に機能する。一方で、PRDと仕様ファイルがあって、仕様ファイルが実装されるまで反復する、みたいなRalphループ。これがうまく動いているのを見たことがありません。動かせる人がいるならお見事です。私にとってはカーゴ・カルトです。
2週間前ロンドンのAI Engineering Europeという大きなカンファレンスに行ったんですが、舞台裏では多くの人が私に近寄ってきて、こういうの全然動かないんだ、ダーク・ファクトリーとか、それでも売らないといけないんだ、と言っていました。なぜそんなことをするのか分かりません。まだそこまで到達していないんだから。それを認めて、現状あるものを使って良くしていけばいい。でも人々はそういうハイプ・マシンを必要としているらしい。
それは単なる短気なのか、それとも間違った理由でAIに参入してきた人たちなのか、どう思いますか。実際、根本となるテクノロジーを信じているわけではなくて、トレンドだから来ているとか、クライアントを取るためのビジネスチャンスだから来ているという人がたくさんいるのに気づいたんですが。
ウェブ3の人たちの多くがAI界隈に流れてきました。マネタイズの面でウェブ3が下火になってからね。だから技術についてまったく無知な人たちがたくさん見える。一方で、本当に技術を理解している才能ある賢い人たちもいて、彼らはまだ現実ではないビジョンを売るインセンティブがある。そうやって稼いでいるからです。彼らを責めはしません。それで食いつないでいるわけだから。でも私個人はそれを楽しめない。シグナルがないんです。それから技術を理解していないのに使いたい人たちが大勢いて、彼らは一番大声で叫んでいる人たちを追いかけて、結局は痛みと涙、そしてお金を失うことになる。
AIは金持ちのゲームになるのか
Balajiの素晴らしい言葉で、AIは賢い者をより賢くするというのがありますよね。金持ちがより金持ちになるように、可処分所得があれば投資できるし、賢い人はエージェントの操り方や独自のハーネスやコンテキスト・エンジニアリングを知っている、最高のモデルを使い、当然ツールにもお金を払う、だからより大きなアドバンテージを得る、と。これが起きていると思いますか、それとも違う意見ですか。
両方に同意します。ソフトウェア・エンジニアリングの職人技を理解していて経験のある人は、エージェントを使い始めたばかりの若手と比べて確かに優位性がある。最終的には、モデルが良くなるにつれてその差は消えていくと思います。モデルのドライバー、エージェントのドライバーとして、低レベルの理解はそれほど必要なくなる可能性があるから。今の時点ではそうではないと思いますが、いずれそうなる可能性はある。
歴史上初めて、最新モデルを手に入れられない時代になっていますよね。Mythosのリリースのように。もし私とあなたが何十億ドル規模の会社を経営していてAnthropicとエンタープライズ契約を結んでいたら、ああ、サイバーセキュリティのために本当に必要なんだ、と言って、トークン消費の10%をR&Dに回せるわけでしょう。
それはすでに事実ですが、私はもっと個人レベルの話をしています。今、月200ドルのCodexプランからとんでもない量の価値を引き出せるけど、その200ドル自体がすでに人口の99%を排除している価格設定です。
これは絶対に金持ちのゲームになると思います。生産手段、つまりトークンを買える経済力を持つ人たちは、それを買えない人に対して圧倒的な優位を持つ。月200ドルがすでに多くの人にとって経済的障壁だとあなたが言うのは面白いですね。AI業界の私たちのピアグループのほとんどはそうは見ていない。彼らにとって200ドルはバーゲンですから。
それは大半が、何十万ドルもの年収を持つ高給取りのソフトウェア開発者だからですよ。彼らにとっては小銭、あるいは使い方を知っていてレバレッジをかけられるからです。
正直なところ、エージェントを使い始めてから経済的に成功したものを実際に作っている人をそんなに多く見ていないんですよね。少なくとも私の周りの古くて気難しいコンピューター人間たちのグループでは、たくさん試して、たくさん作るけど、何も売らない。作ったものが完成しないからです。あなたはビルダー側の人々により近いと思うので、そのあたりについて教えてもらえますか。
私はこれは皆が誤解していると思います。新しい製品をたくさん期待していて、それは確かに不足している。でも私の見解では、利益の80〜90%は内部的なもので、既存の企業や既存のビジネスにあるんです。私のチームの人たち、技術的にはまったく素人のビデオエディター、ソフトウェアを作る理由なんかゼロの人たちが、私や経験のある他の人からのちょっとした指導でソフトウェアを作るようになっている。社内向けの便利なツールを作って、私たちの生産性を高めている。例えばYouTubeなら、外れ値の動画を見つけたり、サムネイルのバリエーションを簡単に作れたり。経理なら社内会計とか。これは公開されている誰でも使える製品ではなく、社内では計り知れない価値があって、社内の誰に聞いても即答してくれます。
繰り返しますが、彼らはデベロッパーではない。そのワークフローを知っている人たちなんです。ビデオ編集を知っていて、ビデオモデルや画像モデルを使って素晴らしいツールを作るのに何が必要かを理解している。だから、隠れた成果の多くはそこにあると思っています。他の方法ではあり得ないほど早く成長している既存の企業に。
100%同意します。私が最初にそれを観察したのは去年の夏、妻にコーディングエージェントを与えたときでした。彼女は言語学者で、技術系ではない。言語データを大量に扱う仕事をしていて、人にインタビューして、それを書き起こして、テキストや書き起こしに注釈を付けて、それを18,000行のExcelシートに入れて手作業でデータを変換し、グラフを作成する、といった作業をしている。
私は彼女にClaude Codeを与えて、Claude Codeの操り方について二晩レクチャーした。すると彼女の科学的アウトプットが突然5倍になった。彼女がやったのは基本的に、入力データは知っている、出力データがどうあるべきか知っている、あなたは私の小さなプログラマーボディだ、私はプログラミングを知らない、あなたを信頼する、ただ私の入力データを取って必要なフォーマットで出力データを生成するPythonスクリプトを書いて、必要なフォーマットのグラフも作って、と言うだけ。
彼女は、自分がプログラミングを知らなくても、入力がどうあるべきか出力がどうあるべきかは理解しているということを理解した。だからモデルやエージェントが書いたコードが実際に機能するか確認できる、それで十分なんです。コードは完璧である必要はない、完全なクソでも構わない、ある種の時間節約を生み出してくれれば。本当に素晴らしい。あなたの会社についても同じことが聞こえてきますね。技術系ではない人たちが、コーディングエージェントを使って小さなプログラムを書いたりデータ分析や変換をしたりする方法を理解している、と。
ええ、同感です。これが最大の解放だと思います。問題は、あなたのような会社にはおそらく、若くてプログラムを書けるという意味での技術系ではないけれど、テクノロジーの扱いには慣れているという人たちがたくさんいるということです。
そうですね。
あなたにとっては楽勝でしょうけど、20歳から60歳までの人がいる大企業に行くと、これはうまくいかない。あなたの会社のようなところは、何人いますか。
10人くらい、6人くらいかな。
そう、あなたには優位性がある。なぜなら6人にコーディングエージェントや日々の業務を助けるエージェントを与えて生産性を上げられれば、賢く立ち回れば50人、ことによっては100人のチームに簡単に勝てるからです。特にその50人や100人のチームが新しい技術への適応に苦労する旧弊なチームだったらね。だから本当にすごいことです。
トークン経済の最適化
トークン使用量の最適化についての考えはどうですか。特に巨額を使う企業もそうですが、個人レベルでも大きなトレンドが見えてきていますよね。私自身、OpenRouterやAnthropicでの支出を確認するのが結構怖くなっていて、特に昨日のDeepSeek V4のリリースを受けて、これらの異なるワークフロー向けに最適化するトレンドが本格化しそうな気がしています。同じ容量、同じ知能の97%を10分の1や17分の1のコストで得られる、みたいな。トークン経済とこの最適化トレンドは続くと思いますか。
そう願っています。知能は世界中の誰もが手の届くものでなければならない。これが第一世界だけのクソみたいな技術になってほしくない。中国のラボに祝福あれ。彼らはアメリカのラボのトークン経済をぶち壊しにかかっていて、私はそれが大好きです。アメリカ企業の少なくとも推論におけるマージンを知っているから。Anthropicは70%。ええ、それ以上の場合もあり得ます。
だからトークンの最適化は大きなトピックになるでしょう。OpenRouterを使っているなら、今やウェブ上には無数のトークンプロバイダーやそれに類するルーターがある。だから安いトークンへの確かな需要があって、それは実現すると思います。私個人としては、それはDeepSeekやKimi K2.6のようなオープンウェイトモデルがあるから起こると考えています。
正直に言うと、私はここ3〜4日Kimiを使っていますが、いいですよ。クラウドの自分の小さなGPUクラスターにデプロイできて、Anthropicや Claudeを通して払う必要がある金額と比較できるコストで動かせる。知能もそこにある。Kimiが提供してくれるもの以上のものは、実際にはそんなに必要ない。これはどんどん良くなっていくし、フロンティアモデルが知能で優位性を持っているとはもう必ずしも思わない。タスクや業種によっては退化が見えるしね。だから知能のピークに達して、これから2〜3年は今あるものが続くなら、私は満足です。オープンウェイトモデルに切り替えるつもりです。彼らは追いついたから。
質問の答えになっていますかね。
ええ。ただ、なぜ個人や企業がもっと大規模にオープンウェイトモデルに移行しないのか不思議なんですよね。中国脅威論的なものなのか、それともAnthropicとかOpenAIのブランド力なのか。
ブランドだと思います。Anthropicは広告とマーケティング、特にエンタープライズ向けに非常にアグレッシブで、大きな成功を収めている。ブランドが本当に優れていることは認めざるを得ない。ここ数か月の出来事の後ではデベロッパーにはもうそうではないかもしれませんが。ここ数日かな。ええ。でもエンタープライズ層、エンタープライズ企業の技術的バイアスや偏見に対しては、彼らは完璧なストーリーを持っている。OpenAIはそれほどでもない。彼らはそこを目指しているけど、Anthropicは少なくとも西側世界、ヨーロッパとアメリカで本当に良いブランドを持っている。
中国に関する恐怖の煽りもたくさんありますが、正直なところ、ヨーロッパ人として、データプライバシーや産業スパイの観点では、中国もアメリカも私には同等です。両方とも信用していない。だから私には関係ない。一番良い知能を一番良い価格でくれる人を使います。願わくばいずれヨーロッパが自前の知能を良い価格で提供できるようになってほしいけど、現時点ではそれは見えていません。
そうですね、おっしゃる通り、KimiやDeepSeekを使って自前のクラスターにデプロイして同程度のコストかもっと安く動かせるなら、データが自分のものに留まるという大きなメリットも得られる。
ええ。私個人のためだけにデプロイする必要はない。あと5人を加えて、クラスターは喜んで全員に良いTPSで応えてくれる。だからお金を出し合って自分とあなたの6人の会社のためにクラスターを構築すれば、本当に安く済む可能性がある。これは私が関わっている会社の一つで検討していることでもあります。実際に行くかは様子を見ますが。少し実験して、現時点でそれをするのが手頃かどうかではなく、意味があるかどうかを見たい。去年実験したけど、まだそこまでではなかった。知能の面でもコストの面でも。でも近づいていると思います。
あなたのAIファースト、AIネイティブの会社では、知能をどこから調達するかについてどんな戦略を持っているんですか。
APIを使っています。セルフホストはしません。ただローカルでモデルを動かすことはどんどん増えていて、24年初頭に128GBのMacBookを買うという賢い決断をした。だからGemma 4などで本当に元が取れています。特に小型のオープンウェイト、オープンソースモデルの進歩は大型のものよりも速いくらいですから。次のMacBookはメモリ256GB欲しいですね。
私もです。
そうしたら2000億、2500億、3000億パラメーターのモデルを実際に動かせて、ほとんどのワークフローはそれで対応できる。本当に最先端が必要な場合や、一部のタスクで本当に最高のものが欲しいときだけAPIを使う、みたいな。私はOpenRouterを構築するプロジェクトのほとんどで使っています。あらゆるモデルが使えるから。常に変化しているけど、過去30日間でAnthropic APIで月6Kドル相当のランレートに達していました。でも今はGPT-5.5とDeepSeek V4とOpus 4.7のリリースを受けて、軸足を移しているところです。4.7にはfastモードがなくて、私は4.6をfastモードで使っていたから。fastモードは6倍高い。3倍くらいですか。ええ。
ただ、私はスピードが大好きで、スピードには満足していたんですが、4.7は私にとってちょっと、なんというか、雰囲気が合わない。でも5.5は気に入っているのでCodexを使っています。これでコストが大幅に下がる。OpenAIは同じ価格でもっと多くの推論をくれるんです。100ドルプランか200ドルプランか、OpenAIにも100ドルティアがあるけど、これらのティアをAnthropicと比較すると、本当に違いを感じます。200ドルのCodexで上限に達したことがない。並行で複数走らせるのが普通なのにね。Claude Codeなら1〜2日で簡単に上限に達する。
それからこれを使うもう一つの理由は、APIキーをチームメイトに簡単に配れること。誰かが本当に上手だと分かっていれば、週500ドルの上限のOpenRouter APIキーを渡せばいいし、誰かが初心者なら合計50ドルの上限にしておけば、その人がそこまで届かないことも分かる。だからキーをすべて管理して、誰がどのキーを持っているか名前を付けて配れるのが好きです。
なぜヨーロッパでAIが盛り上がらないのか
ヨーロッパに触れましたが、その話をしましょう。なぜヨーロッパではもっとAIに関することが起きていないんでしょう。アメリカが人材を引き抜いているだけなのか、何が起きているのか。
ええ、ほとんどはアメリカがヨーロッパからも中国からも人材を引き抜いているからです。もちろんアメリカ生まれの素晴らしいAI人材もいますが、人材はアメリカに流出している。お金がそこにあるから。ヨーロッパには同じようなベンチャーキャピタルの環境がない。インフラもない。
私個人はヨーロッパの規制が問題だとは思っていない。例えばカリフォルニアにも似たような規制がある。彼らも独自のAI法を持っていて、しかもそこはもっと悪い。今や各州が独自の規制を持っているから。EUなら少なくとも27の加盟国で同じルールが適用される。これは個人的には問題ないと思います。だから主にお金の問題です。
AI業界で名前を聞く人の名前を見てみてください。ほとんどがヨーロッパ系の名前と中国系の名前です。だから悲しいですね。
OpenAIの主要メンバーの多くはポーランド系ですよね。何かが起きるたびにVCや巨大テック企業が買収やアクイハイアーで来る。
ええ、悲しい。
何が起こる必要があると思いますか。もっと投資、もっとVC、もっと資本を呼び込むには。それともヨーロッパのマインドセットがリスク回避型で、株や不動産に偏っているからなのか。
いえ、それは問題ではないと思います。問題はほとんどが規制の枠組みと法的枠組みです。EUの会社や株式やRSUへの投資、こういったことすべてがアメリカでは非常に簡単なのに、ヨーロッパでは非常に難しい。特に会社を成長させてヨーロッパ各地に複数の事務所を持ちたいなら。新しい国に進出するたびに、その国の構造に取り組まないといけない。投資の仕組み、従業員が株式をどう取得するか、などなど。これがめちゃくちゃ難しい。アメリカならデラウェア法人を設立すればそれで済む。ボストン、ニューヨーク、サンフランシスコに事務所があっても、すべての州で皆同じルール。ヨーロッパではそうではない。これが一つ目の点。同じような法的枠組みでヨーロッパに会社を作るのは難しく、投資や従業員への特定の福利厚生の提供も難しい。
二つ目は、投資家にとってヨーロッパの会社に投資する税制その他の側面が、アメリカほど良くない。それから紛争があったときに裁判をどこで扱うかを指定する必要があって、ヨーロッパではそれがめちゃくちゃで、アメリカでは皆また基本的にデラウェアに集まる。
EU Inc.という運動でいくらか前進があって、EUはこれを進めたいと合意したような節もあります。あの運動とKlinger氏たちが提案したことに対して。私はEUを愛していますが、その実装と人々を嫌っている。きっとこれもダメにするでしょうから。まあ分からない、見てみないと。
アプリの未来とエージェント
トピックを変えて、コンシューマーやアプリの話に移りましょう。コンシューマー向けに限らずアプリ全般です。今日のアプリの大半は将来でも存在すると思いますか、それとも人間として自分のエージェントと話して、エージェントが90〜95%のことをやってくれるようになるんでしょうか。
良い質問です。私は2010年ごろからモバイルゲームのバックグラウンドがあって、2016年ごろには私にとってモバイルアプリはもう終わっていた。市場はクソ状態で、誰も必要としないアプリが過剰にあった。今のApp StoreやGoogle Playストアの登録を見れば、誰も必要としない大量のアプリがある。誰もがあのストアにアプリをぶちまけているからです。
すると問題は、私のおばあちゃんが自分用のSpotifyを作るかということ。今のところ、たぶん作らないでしょう。Spotifyは単なるアプリではなく、その背後にあるインフラ全体ですから。音楽のライセンス契約とか、いわゆる音楽マフィアとかね。人々はソフトウェアしか見ないけど、実際にそのソフトウェアを成り立たせている人間的なぐにゃぐにゃした部分が見えていない。Spotifyのようなものはいずれ取って代わられるとは思いません。フィットネストラッカーとかダイエットトラッカーとか、そういう小さな豆みたいなものは、もう終わりだと思います。未来はないと見ています。でも、普通の人がアプリに入っていって私のためにダイエットトラッカーを作ってと言うわけでもないと思う。あなたが持っているAIエージェントのアプリがそれをやってくれて、あなたはそれが裏でアプリを作っていることすら知らない。ただ十分賢くて、必要なときに情報を浮上させて追跡してくれる。これが未来であってほしい。可塑的なソフトウェア、自己改変型ソフトウェア、私はその大ファンですから。
まさにそのフィットネスとダイエットの話で、自分のカロリーを記録したいと思ったとき、App Storeに行ってアプリをダウンロードする代わりに、最初に思いついたのはOpenClawを使ってCSVファイルを作ってカロリーを記録することでした。それから二つ目のファイルを作って、承認済みの食事のMarkdownファイルにして、各食事の正確なマクロを書いておく。ブルーベリー50グラムを記録、と言えば、私が持っているブルーベリーが正確にどれか把握していて即記録される。比べ物になりません。
ええ、それから例えば、ちょっと疲れている、ポッドキャストの収録があるからエネルギーの高いものが必要、と言えば、カスタムの食事を提案してくれる。App Storeのこういうアプリには知能なんかありませんから。
知能こそが鍵なんです。新しい栄養学の論文やスポーツ関係の論文を読めば、すぐにそれを統合できる。世界中のどんなアプリもそんなことはしてくれない。素晴らしい。私もPiで同じことをしています。Slackを通じて話しかけられる小さなPiインスタンスがあって、まさにその種のことに使っている。今食べている食事のカロリーが分からなければ、写真を撮って、推測してと言う。すごく間違えるけど、ざっくりでいい、こういうクソを食べたって記録するわけです。
実際、レストランがカロリーを教えてくれるときでも、たいてい実際よりずっと少ない数字を教えてくる。少なくともエージェントには隠れた目的がないのが分かっていますから。
これからの働き方
働き方の未来というトピックで、2〜3年後の私たちの働き方をどう見ていますか。最先端の人々と平均的な人の両方について話しましょう。今ある仕事の多く、物理的な仕事ではなく知識労働の多くは、適切なワークフローがあればすでに置き換え可能だという良い議論ができますよね。
2〜3年延長すると、それはどう見えますか、最先端はどう見えますか。
まず聞いていいですか、あなたのバックグラウンドは何ですか。本職のソフトウェア開発者ですか、それともテクノロジストですか、それとも。
ええ、最初のプロジェクトは実はAndroidゲームでした。面白いことに儲からなかった、ダウンロードは1000ほどでしたね。でもそれ以来、16歳からずっと起業家です。自分のビジネスをやってきて、人生ずっと起業家。技術系ではあるけど、あなたほどの優れたプログラマーではない。普通くらいで、今は何でもAIを使うようになっています。
私もそうですよ。私たちはもう違いがない。なぜこれを聞いたかというと、私はソフトウェア業界に20年、AIに関わってもう長くなる。そしてずっと、知識労働は終わりだ、すべて自動化できるみたいな話を聞いてきました。秘書のメール仕分けを置き換えられるSVMと言われていた時代から、今はLLMがエージェント・ワークフローをやっていると言われている。
知識労働者のタスクの多くは、確かに自動化で完全に置き換えられると思います。でも知識労働者そのものを置き換えられるとはまだ確信していない。調整役としての人間のループがまだ必要だと思う。それから、私たちソフトウェア人間はいつも、コンピューターに何かをさせられるから世界を理解していると思いがちなんですが、ソフトウェアを作っていない会社で働いたことがあれば、世界はソフトウェア開発者やIT業界が思っているのとはずいぶん違うことが分かる。実は知識労働ですら自動化が非常に難しいことが多い。人間的でぐにゃぐにゃした部分がたくさんあるからです。
私はIT以外、IT世界以外の経験もある。だから今後5〜10年で知識労働が大きく変わる、人間が減って自動化が増えるという意見には少しためらいがあります。Jevonsのパラドックスの大ファンで、エージェントは人を置き換えるのではなく、人をさらに生産的にするだけだと思っている。少なくともそれが私の住みたい世界です。誰も仕事がなくなって全員がUBI、ユニバーサル・ベーシック・インカムを国家から受け取るようなディストピアには住みたくない。あれはひどい。
ユニバーサル・トークンというアイデアは見たことがあります。あれは好き、賛成です。
ええ、各人がトークンをもらって、無駄遣いするか、使わないか、転売するか、何かを作る、これは実際面白いアイデアだと思います。
ええ、UBIやElonが普及させようとしているユニバーサル・ハイ・インカムについて、人々はその二次的な結果を見ない。じゃあその所得をコントロールするのは誰なんだ、というね。
正確にその通り。
つまり労働市場が劇的に変わるとは見ていないんですね。
労働市場は変わると思います。ただし多くの人がアップスキルを必要とするという意味で。40〜50代以上の人たちはエージェントを使い始めなくちゃいけない。多くの人にはそれができず、おそらく切られる側になる。それから多くのジュニアが仕事を得られなくなるとも見ています。シニア+エージェントが、ソフトウェアに限らずあらゆる種類の知識労働で、ジュニア二人を置き換えて自分のアウトプットも維持できるようになる。だから老人と若者、この二つは本当に難しい。しばらくはちょっとしたチョップ・チョップ・カポリプスがあって、やがて新たな均衡に達すると思います。会社がジュニアからシニアへのパイプラインが必要だと気づくようになる。シニアはいずれ皆退職して切れてしまうから。それから、この技術が苦手な高齢者をアップスキルする方法も見つかるでしょう。
でも若者の方が神経可塑性がはるかに高いので、彼らはあなたが言ったように非自明な意味で技術系である、という主張があるじゃないですか。テクニカルと聞くとプログラマーやデベロッパーを連想しがちだけど、実はコンピューターの使い方を知っているか、どこをクリックすればいいか、設定にどう行くか、こちらの方が構文を暗記するよりはるかに重要。だから、ジュニアでさえ苦労するという主張をされましたが、ジュニアの方がAIをどこでも採用しているという反論はどうですか。
いえ、まったく、私もそう思います。ちょっと話を戻させてください。私はこのプログラミングの世界に長くいて、過去15年、デジタルネイティブという物語があった。それよりずっと長くて、たぶん1999年あたりから、人々は新世代がインターネットと一緒に育っているからコンピューターネイティブで、明示的にプログラミングやコンピューター使用を学ばなくていい、自然と素晴らしくなる、と言い始めた。でも私が見てきた限り、そうではありません。私は学校でも教えていて、12〜16歳の子たちと接していて、彼らがどのようにテクノロジーを使うか分かっている。彼らはデジタルネイティブではない。デジタル消費者という意味でのみデジタルネイティブで、平均的にはデジタル生産者ではない。これが大きな違いだと思います。
ええ。
あなたのような人は明らかにデジタル生産者で、本物のデジタルネイティブです。消費するだけでなく、物を作る方法を知っている。でもほとんどの子はそうではない。だから本質的に何も変わっていないと思う。十分にやる気のある人は良いものを作るし、ただ波に乗っているだけの他の人は失敗する。これは昔からそう。だから若者にすごい優位性があるとは必ずしも思わない。神経可塑性で明らかに大きな優位性はあるけど、問題は企業が若者を雇いたがらないこと。彼らを軌道に乗せて生産的にするのに長くかかると見られているからです。
でもそれは間違っていると思う。少なくともソフトウェア・エンジニアリングではジュニア+エージェント+メンターできるシニア、これが完璧。私が関わる会社ではこれをやっていてうまくいっている。多くの人はもうジュニアは要らない、リソースの無駄だと思っているけど、それは馬鹿げています。
クリエイター対コンシューマーという区別、本当に良いですね。それを聞いてコンテンツとの関連性を感じます。誰もがコンテンツの消費者だけど、記事や動画やポッドキャストを作るのはほんの一部だけ。コードも同じで、おっしゃる通り、ほとんどの人は自分のアプリや代替を作らず、他の人が作ったものを消費するだけ。電話でTikTokやInstagramをスクロールするのは上手いけど、電話のCanvaアプリでグラフィックを作る方法は知らない。コードでも同じことが起きるでしょう。
Mario流ワークフローの実態
コードと言えば、何かを開発するときのワークフローはどんな感じですか。エージェントは何個動かしますか、どのエージェントですか。
ええ、10月以降はPiしかエージェントとして使っていません。一般的に並列で多くのエージェントを動かすことはしません。普通は最大4つのターミナルウィンドウを開いて、超厳格なワークフローでやっています。ワークフローの異なる部分用にプロンプトテンプレートをたくさん持っている。例えばGitHubからこの問題を引っ張ってきて、こういうふうに分析してくれ、分析結果を出して、実装プランかバグ分析、何が問題だと思うか教えてくれ、というプロンプトテンプレート。プルリクエスト用も同じ。
私のワークフローは基本的にこれです。GitHubから問題かプルリクエストを取って、プロンプトテンプレートに引数として入れる。それから離れるか、別の問題かプルリクエストで新しいセッションを開始する。最初の分析結果が返ってきたら、その特定の問題に取り組み始める。
その作業は問題のスコープによる。例えば、誰かがどこかに新しいフラグや新しいインターフェースを欲しがっているなら、はい、実装してくれ、開発しろ、気にしない、と。手動でテストする方法の指示も付けて。私の場合はターミナルユーザーインターフェースなのでテストが容易。同じことがウェブインターフェースにも当てはまる。エージェントには見た目と振る舞いの目標を与えて、それが本当にそうなっているかをテストできる。簡単。
リファクタリングのような他のものは、まだある程度手作業でやっています。コードに入ってタイプ、インターフェース、APIを修正する。物事の感覚を得るためで、それからコードを理解する。エージェントは特に大きなコードベースだと、すべてを取り込めない。だから局所的に修正し始めて、グローバルに爆発する。
だから私は、コードがどう組み合わさっているか、人間として少なくとも理解する必要があるという意見です。すべての行を理解する必要はない。Piには30%、私が理解していないか読んだことのないコードがあるかもしれない。でもセッションをHTMLにエクスポートするとか、そういうコードはどうでもいい、読みたくない。一方でエージェントループ自体のコードは暗記している。製品の機能性に本当に重要だから。
だから私のワークフローは、エージェントに自律的に機能やバグ修正をスロップさせるか、彼らができると分かっているからね、それともコラボレーティブにやるか、つまりヒューマン・イン・ザ・ループでやるか、それとも手動でやるか、に分かれている。エージェントがその仕事をできると私がどれだけ信頼するかによって、自分をループにどれだけ入れるかが決まる。
設計力こそが鍵
つまり、ソフトウェア設計とアーキテクチャを使ったコードのスキルセットが、特定のコーディングよりますます重要になりそうですね。
絶対そうです。構文はもうどうでもいい、これは本当に良いことです。長い間使っていない言語や使ったことのない言語も使えるようになった。前世でコンパイラーやデバッガーを作ったことがあるから、すべての仕組みが分かっている。構文を学ばなかっただけで。意味論さえ分かっていれば良くて、エージェントには好きな言語で書かせられる。だからアーキテクチャとシステムレベルの思考はおそらくもっと重要になる。これは若者への警告でもあります。私はあれを学べるのは、自分でやることだけだと思う。コードを手作業で書けという意味ではなくて、エージェントを使ってタイピングさせながら設計を一緒にする、ということ。でも設計について自分で考える必要がある。
エージェントに設計させてはダメ。エージェントはそれをすべてインターネットから学んだ。インターネット上にあるのは私の昔のクソみたいなコードと、他のたくさんの古い人々の昔のクソみたいなコード。クソです。コードの90%はクソ。それがエージェントが提案するアーキテクチャとシステムになる。それをさせてはダメ。自分でやって、頭を使ってください。
特にあまり知られていない言語ではね。
ええ。
では、テイストや判断力はどれだけ重要になりますか。私の経験では、AIはユニークなアイデアが本当に苦手で、それは部分的にはあなたが説明したように訓練データが平均的にひどいから。ビジネスアイデアをくれと言うと、平均よりほんの少しマシなものしか出てこない。あなたの考えはどうですか。AIは本当に創造的になれますか、つまり建築は本当に創造的になれますか、それともなれませんか。
数学的観点からすれば、学習したのですから、学習したものすべてを表す小さな雲のようなものがあって、その雲の中の二点間を補間できる。だから、見たことのある物の組み合わせとして新しいものを思いつける。それらは新規でありうる。でも雲の外にあるものはできない。雲の中の点、つまり学習したものと、雲の外にある点、まだ見ていないものの間を補間できないから。
ビジネスアイデアの話を持ち出すなら、私はクソLLMに良いビジネスアイデアを出してもらおうとは絶対思わない。でもアイデアが既にあれば、LLMにダブルチェックしてもらえる。あ、すべてのビジネスに必要なこの要素を忘れてた、とか、この法的枠組みについて考えるのを忘れてた、とか。だから人間のアイデアをダブルチェックするには優秀だが、ビジネスアイデアそのものを任せるのは無理。あれは下手くそです。
それは究極の未来を指し示していませんか。5年、10年、20年先かもしれないけど、私たちはイニシアチブだけ与える、つまり種は人間から来て、エージェントが他のすべてをやる、みたいな。
そうかもしれない。まだそこまでではないけど、たぶん。ただ、それがうまくいかない理論的な理由がいくつかあって、ほとんどはまた訓練データに帰着する。でもそれを未来にしたい。スタートレックのコンピューターが私の理想。ハイレベルの指示を与えれば、フクロウの残りを描く方法を考え出す、みたいな。すみません、汚い言葉を使いました。マネタイズを外されないでくださいね、外されないことを願います。
そうそう、まあ、それが未来であってほしい。今はまだそこにない。少なくともLLMでそこに到達しないと信じる理由は、訓練のされ方に関係する。プログラミングは良い例で、もう言いましたが、システム設計とアーキテクチャは無理。でも単純な機能の実装、はい。なぜ片方ができてもう片方ができないかというと、片方は訓練データがある。機能が実装されるトレースがたくさんある。Codexだったり、4月以降のClaude Codeセッションだったり、GitHubリポジトリのコミットだったり。ないのは、システムやアーキテクチャの設計プロセスがそういう形でエンコードされているもの。だからそこに到達できるかもしれないが、おそらくたどり着かない。訓練データが欠けているから。それの訓練データを生成するのは本当に難しい。
これは非常に興味深い見解です。つまり、上位0.01%や0.1%の人間、ソフトウェアでも音楽の作曲家でも最高の起業家でも、彼らの理解とスキルの多くは書かれていなくて、Markdownファイルやトークンに変換されない、だからモデルをそれで訓練するのは非常に難しい、と。
ええ、まさに、これは本当に良いポイントです。ええ、上位1%の話でもなくて、訓練データに入っているかどうかだけでなく、どれだけ頻繁に訓練データに入っているかも重要。平均的なものは訓練データにずっと多く存在していて、高品質、高シグナルのものよりはるかに統計的なパワーを持っている。
だからコードでも同じ問題。訓練データの90%はゴミ。10%はピカピカで素晴らしい。そういうものは存在するけど、訓練中の統計的パワーがずっと小さいから、モデルの重みに強化されない。これが一つの問題。もう一つの問題は、いくつかのものはトークンとしてエンコードするのが本当に難しいこと。人間のビジネスアイデアを思いつくとき、そのプロセスをトークンとしてどうエンコードしますか。可能でしょうか。
人生経験のすべて、テイストのすべて。
ええ、だから最終的にLLMとエージェントは私たちを超生産的にする。それは疑いない。でもぐにゃぐにゃした人間的な部分、あなたが今説明したような、あなたをあなたにしてあなたのビジネスを成功させているもの、それはトークンにエンコードするのが難しい。同じことをするモデルを訓練するのも難しい理由はそこにあるんです。
これで締めくくるのにちょうど良いと思います。Mario、ありがとう。みんなはどこに行けばいいですか。
Piコーディングエージェントを使いたいならpi.dev。Discordもあって、そこで雑談しているので、ぜひあいさつに来てください。それ以外はTwitter、Twitterで@ldgames、ですね。だいたいそんなところです。
了解、リンクは全部動画の下に貼っておきます。改めてありがとうございました、お時間ありがとう。
呼んでくれてありがとう。


コメント