AIの能力は「ジャギー(凹凸がある)」であるという常識が覆りつつある。これまでAIは特定のタスクでは優れているが他では劣るという不均一な性質を持つとされてきたが、実際にはそれはAIの本質的な限界ではなく、私たちの使い方の問題であった。2025年初頭、CursorやAnthropic、OpenAI、Google DeepMindが独立してマルチエージェントシステムを構築し、コーディングだけでなく高度な数学問題まで解決する能力を示した。これは、タスクを分解し、並列化し、検証し、反復するという組織的構造をAIに与えることで、実務レベルの問題領域においてAIの能力が平坦化したことを意味する。今後、重要なスキルは作業の実行ではなく、AIの出力を評価する「スニフチェック」能力であり、私たちの働き方は根本から変わろうとしている。

AIのジャギーな能力という前提が崩れ始めている
もしAIがもはやジャギー(凹凸がある)ではなくなったとしたらどうでしょうか。それが私の頭から離れないんです。夜も眠れないほどに。誰もがAIの能力にはジャギーなパターンがあると考えてきました。つまり、あるものには信じられないほど優れているけれど、他のものには全くダメだと。専門家たちはこれについて語りますし、私たちも日常生活でそれを目にしています。
真実のように思えますよね。なぜ私がそれに異議を唱えるのでしょうか。このジャギーさは、ほぼすべてを整理するためのフレームワークになってきました。AIをどのように導入するかについてもそう考えますし、AIをどう教えるかについてもそう考えています。しかし、ジャギーさについて私たちが間違って理解していたことがあるんです。ジャギーなフロンティアは、AI知能の本質的な特性では決してなかったんです。
私が言いたいのは、それは私たちがAIに仕事を求める方法のアーティファクト(人工物)だったということです。そして、AIが良くなるにつれて、私たちはそのことを理解し始めているんです。どういうことか詳しく説明しますので、私が正しいのか、それとも的外れなのか、あなた自身で判断してください。
シングルターンでの質問がジャギーさを生み出していた
モデルに典型的な質問をすると何が起こるか見てみましょう。基本的なものから始めます。チャットで私たち全員が見てきたように、そのジャギーさが見えますよね。私も見てきました。モデルに1回のターンで1つの答えを求めるとき、つまり「ここに質問があります、答えが欲しいです」という形式では、タスクの難易度のすべてのバリエーションが結果のジャギーさとして現れます。
それは必ずしも知能がジャギーだからではありません。その作業に組織的な構造が適用されていなかったからなんです。私たちは、有能なアナリストに対して、メモも同僚も何かを試す能力もやり直す能力もなしに、すべての問題を30秒で解決するよう求めてきたのです。
さて、そのメンタルモデルはもう完全に正しくはありません。それは2022年当初は確かに真実でしたが、前に進めていきましょう。今では推論コンピューティングがあり、AIが決定するのに時間をかけ、処理できるトークンがあります。これはChatGPT 5.2 thinkingや5.2 Proで得られるものです。考えることができ、うまくいかないトークンを試すこともできます。間違いを修正して戻ってくることもできるんです。
これによってより高品質な結果が生まれます。より良いパフォーマンスが見られます。しかし、私たちの会話のほとんどは、より良いパフォーマンスが見られるという事実について語ってきました。そして、ジャギーさが滑らかになり始めていることに気づいていなかったかもしれません。もうStrawberryの中のRを数える問題はありませんよね。
3年間のAI戦略を形作ってきたメンタルモデルは変わる必要があります。過去30日間で、ジャギーさはもはや職場でのAIの働き方の正しい指導パラダイムではないと確信したからです。確かにAIには並外れた能力がある領域もあれば、非常に優れているだけの能力もあります。
これも一種のジャギーさではあります。でもそれは超関連性の高いジャギーさではありません。なぜなら、あなたはどうか知りませんが、私が仕事で国際オリンピック数学問題を解いた最後の時は、「ああ、一度もない。仕事では起こらないんです」。だから私は実用的なものに興味があるんです。
PRDの世界、コードの世界、カスタマーサービスチケットの世界では、AIはもうジャギーではありません。そしてそれがそうであるふりをするのをやめる必要があります。そして私はその理由を知っています。理由を知ることは、あなたの仕事を違った方法で行う方法を理解するのに役立つでしょう。
シングルエージェント、シングルターンの限界
では戻って、シングルターン、シングルエージェントのインタラクションが実際に何を意味するのか考えてみましょう。問題を提示します。モデルが応答を生成します。途中でエラーが含まれていれば、そのエラーはその後のすべてに伝播していきます。
最初のアプローチが間違っていれば、それを検出して他のことを試すメカニズムがありません。タスクがコンテキストウィンドウに収まる以上の情報を必要とする場合、その情報を段階的にうまく蓄積できません。すべての問題をワンショットで解決する必要があるんです。
これはチャットボットの最も原始的なバージョンです。ChatGPTが最初にローンチされたときに私たちが体験したものに近いです。そしてこれは、有能な人間の専門家が働く方法ではありません。私たちはそれを知っていますよね。弁護士が事例を調査する方法ではありません。エンジニアがシステムを設計する方法ではありません。科学者が実験を行う方法ではありません。
これらすべてには、何かを試し、うまくいっていないことを認識し、調整し、時間をかけて情報を蓄積し、中間段階でフィードバックを得て、修正することが含まれます。それなのに、専門的な作業の周りに構築したこれらすべての組織構造、レビュープロセス、スプリントサイクル、ピアフィードバックループ、ドラフト、修正、公開のパイプライン、これらはすべて、私たちもワンショット認知問題を解決するのに苦労しているから存在しているんです。
そして私たちは、AIもその助けを使えるかもしれないということを忘れているようです。だから私たちは当初、これらの思考を助ける構造の多くを取り除いたパラダイムにAIを展開し、その結果生じた制限をAIの特性として説明してきたんです。
推論、ツール、プロンプティング、そして学習曲線
さて、私が話を単純化しすぎていることは十分承知しています。だからあなたが何が起こっているのか理解できるように前に進めていきます。それが2022年でした。私たちは多くを学びました。このビデオの前半で説明した推論を手に入れました。それはAIがミスをしないようにするのに役立ちます。AIのためのツールも手に入れました。それもAIを大いに助けます。また、タスクをより良く説明する必要があることに気づきました。それもAIを助けますし、それを私たちはプロンプティングと呼んでいます。
だから私たちは、ツールを提供するために自分たちの側で取り組んできました。同時に、AIが賢くなってきたことも十分承知しています。なぜなら、私たちは知能をスケールさせてきたからです。私が説明した推論を通じて、そして強化学習という、LLMの始まりから使ってきた古典的な方法を通じても、部分的にスケールさせてきました。
そして私たちが見ているのは、知能が上昇してきたトレンドラインですが、ツールを使う私たちの流暢さも良くなってきているんです。そして私たちはその曲線を追跡してきませんでした。知能曲線について語ってきました。でも、このツールを実際に使う能力を可能にする曲線、エージェントをハーネスに入れることを学ぶ能力、実用的な作業を行うためにツールをループで使うことを学ぶ能力については語ってきませんでした。
そして私たちが本当に認識していないのは、少なくとも実用的な作業においては、知能曲線よりも重要な学習トレンドラインの中にいるということです。なぜなら、私たちが今、知能を操作できるスケールを見つけ出すことは、エージェントでツールを使う能力、エージェントでハーネスを使う能力の関数だからです。
ハーネスとはエージェントの周りの状態、エージェントの周りの足場、エージェントが仕事をするために操作するものです。タスクのためのマークダウンファイルかもしれません。メモリを置く場所かもしれません。すべてが一緒になっています。それがハーネスです。それによって意味のある仕事ができるんです。
私たちはその部分を価値あるものとして忘れてきました。それをうまくやれば、ジャギーさに対処できるかもしれないということを忘れてきたんです。だから年の最初の数ヶ月が到来したとき、ジャギーさが消え始めたときに驚いているわけです。一気にです。
あらゆる能力が同時に向上し始めた
一気にです。ビデオが良くなり始めます。技術が良くなり始め、数学が良くなり、科学が良くなります。私は過去60日間に起こっている具体的な進歩について話しています。もはやジャギーな改善は見られません。すべてが一度に良くなっているという改善のパターンが見られるんです。
AIのフロンティアは滑らかになっています。そして、仕事というより小さなバブルを見れば、はるかに多くの滑らかさが見られます。なぜなら仕事はこの時点でフロンティアの内側にあるからです。さっき言ったように、国際オリンピックのアスリートのような数学問題を解いた最後の時は一度もありませんでした。仕事ではやらないんです。私たちの中で仕事で複雑な科学をやっている人はほんの数人です。
実際に仕事で超複雑なエンジニアリング問題をやっている人はごくわずかです。一度はその努力を投入するかもしれませんが、その後は製品を構築するためにそれに対して実行しています。私たちにとって、私たちの仕事のほとんどにとって、これは滑らかな製品なんです。ジャギーではないんです。そしてそれがどれほど大きな問題なのか認識する必要があります。なぜなら、それはAIがどこで機能すると期待すべきか、どこに展開すべきかについての私たちのすべての前提を変えるからです。
Cursorが数学問題を解いた衝撃
あなたは言っているでしょう、Nate、証拠はどこにあるんだ。漠然とした一般論を述べただけじゃないか。さあ来い。証拠は3月3日に到着しました。Cursor CEOのMichael Trueleが、CursorがFirst Proofの問題6の新しい解決策を発見したと発表したときです。そう、また数学に戻りますが、長くはありません。
スタンフォード、MIT、バークレーの学者の未発表の研究から引用された研究グレードの数学問題です。言い換えれば、それに対して強化学習はできません。未発表なんです。ただ解いただけではありません。公式の人間が書いた解決策を改善したんです。より強い境界、より良いカバレッジ。そして彼らがそれをやったんです。
Cursorはこれを、6週間前にゼロからウェブブラウザを構築したのとまったく同じコーディングハーネスを使ってやりました。ハーネスはこの数学問題に対して4日間実行されました。ヒントゼロ、人間の誘導ゼロ、途中のガイダンスゼロで。そして解いたんです。
だからスムージング(平坦化)が重要だと私が言っている理由はこうです。Cursorは数学問題を解くために構築されたものではありません。Googleが「私たちは特別な数学モデルを作りました。超特別で特別な数学をやりました」と言うのとは違います。あるいはOpenAIが同じことを言うのとも違います。特別な数学モデルを作って特別な数学をやったと。素晴らしい。よくやりました。
でもこの場合、もっと重要なんです。なぜならCursorは数学解決会社ではないからです。Cursorはコーディング会社なんです。コードを書くために設計されたシステムが、スペクトルグラフ理論の問題を見たんです。それが何か教えてください。私には全く分かりません。そして問題の著者自身が見つけていなかった数学を生み出したんです。
これは大きな問題です。そしてMichael Trueleがうまく言ったと思います。彼が言ったのは、これは私たちのエージェント調整をスケールする技術がコーディングを超えて一般化するかもしれないことを示唆しているということでした。私はもっと先に行きます。私は、長時間実行される仕事をするためにエージェンシーをハーネスに入れる方法が、合理的に検証可能などんな領域でも機能するように見えると言います。
言い換えれば、合理的に正しい答えを決定できる領域です。それは多くの可能性を開きます。数学だけではありません。コードだけでもありません。法律も開きます。実際、多くのカスタマーサービスのユースケースも開きます。なぜなら検証可能な正しい答えがあるからです。
ビジネスの世界には、答えが基本的に「いいえ」である検証可能または準検証可能な問題が驚くほど多くあります。私たちは何が正しくて何が正しくないかを知っています。これは、エージェントのアーキテクチャが進んで問題セットを食べてしまった状況です。そしてその過程で、AIとジャギーさと私たちの日常業務について考える方法を変えたんです。
Cursorエージェントのアーキテクチャとブレークスルー
それで、このCursorエージェントの箱の中には何があるのか気になっているかもしれません。何か特別なものでしょうか。彼らが共有しない秘伝のソースでしょうか。いいえ、共有します。実際、もう共有しました。
1月に、Wilson LynnがCursorのブログ投稿で長時間実行される自律的コーディングのスケーリングについて公開しました。最初の試みはフラットな調整でした。エージェントは単一のファイルを共有しました。衝突を避けるためにロックを使い、ひどく失敗しました。エージェントはリスク回避的になりました。難しいタスクを避け、小さくて安全な変更を最適化しました。多くの活動はありましたが、あまり進歩はありませんでした。
ブレークスルーは階層と専門化から来ました。プランナーがコードベースを探索してタスクを作成し、サブプランナーを再帰的に生成します。だからここには2つの層があります。ワーカーが個々のタスクを拾い上げて完了するまで粉砕し、他のすべてを無視します。
ジャッジ、つまりLLMがジャッジとなって、続行するかどうかを決定し、次の反復が新たに始まります。ジャッジがクリーンに再起動できる能力、新しいコンテキストを持つ新しいエージェントを導入することが、システムの最も重要な特性の1つであることが判明しました。なぜなら、コンテキストウィンドウの問題を回避できたからです。
そして、先ほど述べたように、テストケースはRustでゼロからウェブブラウザを構築することでした。エージェントは1週間実行され、100万行のコードを書きました。Cursorは同じハーネスを実行し、SolidからReactへの移行を実現しました。Javaランゲージサーバーでも実行しました。これらはすべてコーディング問題です。Windows 7エミュレーター、120万行、Excelクローン、160万行でも実行しました。Cursorチームは楽しんでいると思います。
2つの教訓が現れました。第一に、長期タスクにはモデルの選択が非常に重要です。彼らは、GPT 5.2がClaude Opusを一貫して上回ることを発見しました。Claude Opusは早めに停止してショートカットを取る傾向があります。第二に、より直感に反することですが、彼らが行った改善の多くは、エージェントシステムの複雑さを追加するのではなく、取り除くことから来ました。
実際の改善は、複雑な調整機構の多くを取り除き、階層を追加し、エージェントを非常にクリーンな隔離状態で作業させることから来ました。そのハーネスがCodexアプリをダウンロードして使用する際にセットアップできるCodexハーネスと非常に似ているのは、おそらく偶然ではありません。サンドボックス内で隔離状態で実行されるエージェントがあるんです。
そして最も深い観察はこれです。システムの動作は、プロンプトの設計によって不釣り合いに決定されます。そう、プロンプティングは将来も重要であり続けるんです。私は長い間それを言ってきました。すべての情報、完全な解決策、正しくあるためにモデルが必要とするものでプロンプトできれば、そしてモデルハーネスを正しくセットアップすれば、それは長時間実行されます。
それでCursorは興奮しました。実験的になり、この数学問題を指し示しました。CursorシステムはMarcus SpielmanのSVA Interlacing Polynomial法という、私がほとんど発音できないアプローチを見つけました。それを聞かないでください。5回早口で言おうとしないでください。でも重要なのは、それを解決し、人間がやったことを超えたということです。
これはあなたを目覚めさせるはずです。コーディングエージェントはコードをやると考えているなら、LLMは狭いものだと考えているなら、これはあなたを目覚めさせるはずです。狭いものではないんです。これらのLLM、特にエージェントでは、広く一般化しているんです。
ジャギーさは知能の問題ではなくハーネスの問題だった
そしてこれは、このビデオの前半で私が言っていたことに戻ります。私たちは、LLMからのジャギーな応答が知能の関数であると仮定してきました。しかし、過去数年間で明らかになった教訓は、それが実際には少なくとも同じくらい、エージェントを入れるハーネスの関数だったということです。
この時点で、4つの組織、Anthropic、Google DeepMind、OpenAI、Cursorが、独立して非常に大規模なマルチエージェント調整システムを構築しました。長期実行作業を行うために設計されたものです。誰も調整していません。4つすべてが類似した構造的パターンを示しています。そして私の考えでは、これは明確に表現されていません。
だから今聞いてください。これは聞こえるほど異なっていません。使用するモデルに関連したパターンにいくつかの違いはありますが、似ている基礎的なアーキテクチャがあります。
作業を分解する。1つ目。実行を並列化する。2つ目。出力を検証する。3つ目。そして完了に向けて反復する。4つ目。Anthropicのアプローチは、環境状態と進捗ファイルをセットアップする初期化エージェントです。コーディングエージェントが段階的に進歩を遂げ、次のセッションが読み取れる構造化されたアーティファクトを残します。
この構造がなければ、失敗モードは超鮮明ですよね。エージェントは実装全体をワンショットで試みるかもしれません。途中でコンテキストを使い果たすかもしれません。始めたときよりも悪い状態にするかもしれませんし、テストせずに機能を完成させるかもしれません。
Google DeepMindのアプローチ、特にAltheaの数学モデルでは、生成、検証、修正を非常に異なる役割に分離しています。コードレビュー、法的対抗手続き、科学的ピアレビューの基礎となる同じ原則です。これが多くの分野に現れることがわかりますか。
OpenAIのCodexは、並列サンドボックス環境でタスクを実行します。私が言っていたように。Cursorのプランナー・ワーカー・ジャッジアプローチは、エンジニアとPMを持つソフトウェアチームが実際に運営する方法と構造的に似ています。
そう、これもまた人々がどう働くかということに気づいてほしいんです。この収束は偶然ではありません。それは本当の問題に対する解決策なんです。有限のコンテキスト、有限のステップごとの信頼性、持続的なメモリを持たない知能の単位から、どうやって有用な仕事を得るか。
私たちは笑いますが、私たちの一部にも比較があります。私たちもまた知能の単位です。有限のコンテキストを持っています。有限の信頼性を持っています。間違いを犯しますし、ある日は他の日ほど良い記憶を持っていません。
人間組織とエージェントの両方にとっての答えは、組織的であることが判明しました。役割を作り、引き継ぎを作り、検証を作り、再起動手順を作ります。これらはAI特有の洞察ではありません。
それらは、自律エージェントに対しても人間チームに対しても自然に一般化する管理の洞察です。言い換えれば、私たちは集団的に働くことによって知能を一般化する方法を見つけ出しました。そしてそれらの教訓を忘れ、気づかずに複製してしまったようです。
なぜなら、人間の仕事を組織化するためにやってきたのとまったく同じことをやって、それをエージェントと一緒にハーネスに入れると、それもまた、個別にはできなかった意味のある仕事をエージェントがするための良い方法であることが判明するからです。これは大きな、大きな問題です。
言い換えれば、私たち人間は組織的知性の一形態を見つけ出しました。そして今、それをエージェントに与えています。そしてそれがスケールすることが判明しています。私たちはこれにもっと注意を払うべきです。
マルチエージェントシステムのコストと価値
さて、この時点で明白な批判があります。そして私は後ろで咳をしている人々が聞こえます。マルチエージェントハーネスは非常に高価です。そして私はこれに正直に取り組みたいと思います。なぜなら、それは完全に間違っているわけではないからです。
最も基本的なレベルで、マルチエージェントシステムは、シングルターンインタラクションでは生成されないであろう大量のトークンを生成します。だからコストは現実です。この種のシステムを使うなら、トークンを燃やすことができるよう準備しておく必要があります。
しかし、マルチエージェントシステムは、最も難しい問題に対して他の方法では得られない組織的な強さを与えてくれます。構造的多様性を与えてくれます。並列ワーカーは問題の異なる分解を探索できます。行き止まりの結果は、他のワーカーのコンテキストを汚染することなく、次の計画サイクルに情報を提供できます。
プランナーは特定の問題を深く掘り下げるためにサブプランナーを生成できます。部分的な進歩は、リセットするのではなく、コンテキストウィンドウを越えて蓄積できます。これは組織設計についてなんです。
無制限の時間を持つ優秀な個人は、原則的にほぼ何でも解決できます。しかし特定の問題クラスは、シリアル認知には構造的にアクセスできません。個人に能力が欠けているからではなく、問題が同時にワーキングメモリに保持するには探索的パスが多すぎる必要があるからです。
だから私たちは、1人の非常に賢い人があらゆることをしようとする組織として構造化しません。役割と引き継ぎと検証で構造化します。なぜなら、そうしないと個人の才能に関係なく一貫した進歩が得られないからです。
さて、ここで私はあなたに言いたいのですが、以前にも言いましたが、私はチーム・オブ・ワンが世界で特別な役割を持っていると思います。なぜなら、チーム・オブ・ワンは実際には1人以上のチームだからです。もしあなたがチーム・オブ・ワンで、この種のマルチエージェントシステムを管理できるなら、あなたは100人のチームになれます。そしてそれはただのあなたです。
でも、人間の用語での意味のある進歩は、ほとんど常にチームを含んできたということを心に留めておいてほしいんです。アインシュタインのブレークスルーのような、科学で祝われるこれらの瞬間でさえ、個人の天才とその個人の周りの科学コミュニティの両方の関数でした。アイザック・ニュートンが言ったように、私たちは巨人の肩の上に立っているのです。
検証可能性の2つのティアと仕事への影響
でも、あなたが私を信じているとしましょう。オーケー、わかった、Nate。私たちは、物事が見た目よりも滑らかな世界を見ているんだね。ハーネスに注意を払ってこなかった。約束するよ。ツールに注意を払ってこなかった。ここで重要な仕事で何を探せばいいの。
私はあなたに、ドメインの検証可能性の2つのティアについて考え始める必要があると提案したいと思います。最初が最も単純です。掴みやすいものです。最近AIで考える傾向があるものです。機械チェック可能です。コードがコンパイルされるかされないか。テストがパスするか失敗するか。
第2のティアは、明確な基準を持つ専門家チェック可能です。数学的証明、エンジニアリング設計、法的ブリーフ。知識ベース経済内の仕事の多くのカテゴリーが実際にこのように実行されると思います。なぜなら、ほとんどすべての分野で、専門家は何かを見て、これは正しいか間違っているかを言い、ほぼコンセンサスに達するからです。
私は、伝統的にティア2の問題とは考えないであろうものについても、それが真実だと言います。例を挙げましょう。特定の会社のプロダクト戦略を構築していて、そのプロダクト戦略を、それぞれ15年から20年の経験を持つ3人か4人の異なるプロダクトリーダーに持っていくとします。
私は昼食を賭けてもいいですが、そのプロダクト戦略に対する彼らの評価は驚くほど一貫しているでしょう。彼らが内面化し、その特定の状況で適用できるパターンのセットがあるんです。言い換えれば、伝統的にソフトワーク、検証が非常に難しいと言ってきたこの種の仕事は、思っているよりも検証可能だと思うんです。
そしてそれが思っているよりも検証可能なら、私たちの仕事のはるかに多くを、AIがアクセスして役立つことができるものとして考えるべきです。では、これは仕事にとって何を意味するのでしょうか。Anthropicの2026年エージェント型コーディングトレンドレポートは、エンジニアが正しさを簡単にスニフチェックできるタスクを委任していると説明しています。
私がこれを気に入っているのは、エンジニアだけではないと思うからです。Cursorの物語、Cursorのコーディング特化ハーネスが一般化できたこの瞬間の物語は、正しさを簡単にスニフチェックできる限り、組織内の多くの仕事をエージェント型ワークフローに割り当てられる寸前にいることを示唆しています。
正しさをスニフチェックできる仕事はどれくらいあるでしょうか。すべての部門にそのカテゴリーの多くの仕事があります。マーケティングには、キャンペーンデザインの正しさをスニフチェックできる仕事があります。カスタマーサクセスには、メールテンプレートスキーマの正しさをスニフチェックできる仕事があります。
そしてこれを見て言いたくなります、まあ、エンジニアがすべての仕事を委任している。それでエンジニアは何をするの。まず、正直にならなければなりません。スムージングは、難しい仕事を委任することも意味します。簡単なものだけを委任するのではありません。
2025年や2024年に、簡単なもの、シンプルなものだけを委任すると言う組織をたくさん見かけます。最高の組織は、実際にスニフチェックできる限り、難しいものを委任しています。
だから、この移行を生き延びるスキルは、「私は仕事ができる」ではないんです。違います。「私はスニフチェックできる」なんです。仕事が正しいかどうかを判断できる。これが私たちがすべきことかどうかを判断できる。言い換えれば、仕事のすべてがメタスキルに移行しているんです。
私はメタスキルという言葉をよく使います。ここでペンで下線を引く必要があります。アーキテクチャが保守可能かどうかを知ること、脆弱な解決策を認識すること、テストが重要なすべてのケースをカバーしていて、これ以上必要ないことを理解することのようなメタスキル。
この種のメタスキルは、ハーネスが改善するにつれて、より価値が低くなるのではなく、より高くなります。だからエンジニアリング以外の質問は非常にシンプルです。金融モデラー、法的研究者、臨床試験設計者、プロダクトマネージャー、カスタマーサクセスの人々にとって、スニフチェックはどのようなものでしょうか。
それぞれのケースで、評価能力が実行能力の上に位置し、価値があり、エージェントで実行が安くなるにつれてさらに価値が高くなります。だから、これらのスニフチェックを行う能力を開発する人々は、ハーネスが彼らのドメインに来るにつれて、本当に、本当に良い位置に立つことになる人々です。そして私はあなたに伝えます、それは速く来ています。
4社が独立して同じ構造を構築した意味
だから、独立して同じ構造を構築した4社に戻りましょう。Anthropic、Google、Cursor、OpenAI、彼らは全員、問題を分解し、エージェントのために問題を並列化し、その問題を検証し、完了するまで反復し続けるという何らかのバージョンを構築しました。
それが意味するのは、仕事で問題を解決する方法の基礎となる構造があり、それが今や解決されているということです。エージェントによって解決されています。ただ完了しています。彼らはそれを見つけ出しました。適切なエージェント型ハーネスをセットアップできれば、原則的に、分解、並列化、検証、反復できる仕事のどんな問題にも取り組むことができるはずです。どんな問題でも。制限されていません。
表面は滑らかなんです。この時点で非常に明確にしたいと思います。今、知識労働をしているあなたと私と誰にとっても、関連する質問は非常に速く、「AIは私の職種の特定のタスクができるか」から、これはいつも聞きますが、「私の仕事は検証可能なサブプロブレムに分解できるか」という言い回しですが、はるかに関連性が高いものへと移行しています。
そして私はあなたに伝えます、答えは、私たちのほとんどが快適に感じるよりもはるかに頻繁にイエスです。そして私たちが不快だと思うのは、それが私たちにレベルアップを要求するからだと思います。評価方法について考えることを要求します。スニフチェックをすることを要求します。
これを生産的なシフトにする方法を見つけ出す組織、エージェントへの委任について考え、委任できるタスクを知り、そのためのサポートを持つようにチームを構造化する方法を見つけ出す組織は、非常に異なる働き方をしなければなりません。
エージェントインフラストラクチャについて考え、それを構築する才能がはるかに多く必要になります。味覚について、何かが正しいかどうかを理解すること、問題を分解することについての訓練とトレーニングの周りに、はるかに多くの才能が必要になります。やらなければならない大規模な移行があります。
それには多くの人が必要です。私が多くの人と言ったことに気づきましたか。これを実際にインストールするのは簡単ではありません。難しいんです。そして私は、簡単にできることは、「ワオ、知ってる、Cursorはブラウザを構築した。私たちは何をするつもりなんだ」と言うことだと知っています。
これらのエージェントが提供するレバレッジは、私たちが影響力を拡張できるレバレッジです。それはまた、私たちが日常業務をどのように行うかへの挑戦でもあります。そして後者が、人々にとって最も恐ろしいと感じることです。現在の習慣を続けることはできないということです。
そして私はあなたに約束できません。今日の職場のどこでも、あなたの仕事は変わらなければなりません。そしてあなたがコントロールできる唯一のことは、それを理解して先回りするかどうかです。積極的になることによって、自分のドメインをマッピングし始めて、何を委任できるか言うことによって。
スニフチェッカー、テイストメーカー、エージェントインフラストラクチャビルダーになれるか。私の条件でエージェントを空間に持ち込んで私のレバレッジを拡張するモードにシフトできるか。それとも、そこに受動的に座っているだけで、とにかく起こるだけで、それははるかに悪い場所です。
ここで強調したい教訓は、AIは仕事に対して滑らかだということです。能力は仕事ではジャギーではありません。それは誤解です。理由は本当にクールです。理由は、私たちが基本的に、人々のためのすべての組織的知性学習ツールを、過去2、3年間でAIにスケールさせたからです。
そしてついに臨界点に達しました。そして今では、分解でき、並列化でき、検証でき、反復できる仕事のあらゆるものを基本的に解決しています。そしてそれは大量の仕事であることが判明しています。それは物語の巨大な部分です。
私は、明日どんなスコアボードのスコアが落ちるかよりもはるかに重要だと思います。それについて考えてください。世界は見た目ほどジャギーではないことを覚えておいてください。そして、オリンピアード数学問題を解けなくても心配しないでください。私たちの未来はそれに依存していません。


コメント