GitHub CEOトーマス・デームケとの対話

AGIに仕事を奪われたい
この記事は約36分で読めます。

21,132 文字

No Priors Ep 106 | With GitHub CEO Thomas Dohmke
This week on No Priors, Sarah and Elad talk with GitHub CEO Thomas Dohmke about the rise of AI-powered software developm...

こんにちは、リスナーの皆さん。今回のNo Priorsでは、GitHubのCEOであるトーマス・デームケをお迎えしています。GitHubは世界中の1億5000万人以上の開発者がソフトウェアの共同開発に利用しているプラットフォームです。CEOとしてトーマスはGitHub Copilotなどのツール開発を監督してきました。CEOになる前は、GitHubの製品戦略とグローバル展開を形作り、それ以前はMicrosoftで働いていました。このエピソードでは、ソフトウェア開発の未来、AIのコーディングにおける役割、オープンソース、そしてCopilotの製品計画について話し合います。
トーマス、No Priorsへようこそ。まずは本題から入りましょう。最近のGitHubにおけるCopilotと新リリースについて、何が起きているのでしょうか?
本題に入るんですね。Copilotをよりエージェント的にする取り組みにとても興奮しています。数日前、VS CodeでのCopilotのエージェントモードを発表しました。単にCopilotとチャットして返答を得て、それをエディタにコピー&ペーストしたり、元のCopilot機能を使用したりするだけでなく、エージェントと協力して機能を実装できるようになりました。パッケージをインストールする必要がある場合、ターミナルのコマンドを表示し、「これを実行して」と言うことができます。
あなたはまだ管理者です。それが今日利用可能なエージェントの重要な部分です。人間の開発者として、あなたはまだループの中にいる必要があります。また、2025年に登場予定のものについてもティーザーを公開しました。それを「Project Pavan」と呼んでいます。「忍耐」と「フォースの使い方」が必要だからです。
2025年には、よく定義されたGitHubイシューをCopilotに割り当て、それがドラフトプルリクエストを作成し、計画を概説し、その計画に沿って作業を進めるところまで来ると考えています。共同作業者を観察するように、Copilotがプルリクエストに変更をコミットするのを見て、レビューしてフィードバックを提供できます。つまり、Copilotはプログラマーからチームの一員となるピアプログラマーへと進化するのです。
それを実現する上での障害は何でしょうか?新しいモデルの進歩でしょうか?それとも他のコア技術の構築?UIでしょうか?今すぐそれが実現しない理由は何ですか?
最初のポイントはモデルです。OpenAIが休暇前に発表したO3フルモデルはまだ利用できません。推論能力の向上が見られるでしょう。モデルが推論で良くなるにつれて、ベンチマークのSBench(プリンストン大学のチームが特定した約2200のオープンソースPythonリポジトリのイシューとプルリクエストのペア)での100%に近づいていきます。すべてのモデルとエージェントがこれで測定されています。それが一つ目です。モデルとエージェントの組み合わせです。
二つ目は、適切なユーザーインターフェースフローを見つけることです。開発者のワークフローを考えると、誰かが提出したイシューや自分で提出したイシューがあります。このイシューをエージェントに割り当てるべきかどうか、どうやって判断しますか?より具体的にイシューを改善する必要があるでしょうか?エージェントが予測可能であることが重要です。これはエージェントが解決できるタスクだとわかっていることが必要です。そうでなければ、指示する必要があります。
操作性が次のポイントです。定義を拡張するか、エージェントが戻ってきて追加の質問をする必要があります。そして最後にプロセスの結果を検証したいのです。デモでは、エージェントが人間の開発者と同様に複数のコミットを持つプルリクエストで作業し、それらのコミットをロールバックしたり、VS Codeでチェックアウトしたりできるという流れが適切だと考えています。
利用可能なエージェントの一部で見たのは、私が開発者としてエージェントを許容するか、実際に時間を節約しているのか、それとも時間を無駄にしているのかということです。コンピューティングサイクルを無駄に消費しているのを頻繁に見るほど、再び使用する可能性は低くなります。予測可能で安定し、検証可能で許容できるものであれば、これら4つの基準をある程度満たせば、エージェントの採用が進むでしょう。
中位のプログラマーと同等のレベルにエージェントが到達するまでどれくらいかかると思いますか?そして超人的なレベルに達するまでどれくらいかかるでしょうか?
今朝考えていたのですが、旅行エージェントやコーディングエージェント、家をデザインするエージェントなど、どんなエージェントを考えていても、根本的な課題は人間の開発者と同じです。頭の中で大きなアイデアを持ち、ホワイトボードにスケッチできますが、コーディングを始めると、その大きなアイデアを小さな作業の塊に分解する必要があります。
エージェントが非常に大まかなアイデアを取り、開発者やアーキテクト、旅行計画を立てる際に、どのような決定を下したいかについて絶えず質問を受けることなく、小さな部分に分解するには、まだ遠い道のりがあると思います。どのデータベースを使うか、どのクラウドを使うか、「GitHubを構築して」や「モバイルアプリを構築して」などとエージェントに言っても、具体的すぎません。これがシステム思考であり、中位の開発者はエージェントに置き換えられないと思います。
一方で、開発者が行うことの多くは、イシューを拾って修正することや、バグを見つけて修正すること、顧客からの機能を追加することです。そしてコードベースを調査し、どのファイルを変更する必要があるかを見つけます。ここでは今年中に劇的な進歩が見られるでしょう。Pavanプロジェクトのデモを記録した際、実際に製品マネージャーの一人がイシューを使用し、エージェントがプルリクエストを作成しました。通常コードを書かないPMがエージェントを使って実際のプルリクエストを作成し、それが開発者によってレビューされ、コードベースにマージされました。
ある意味では、すでにそこにいるのですが、別の意味では、日常的に使用できるほど十分に信頼するまでには至っていません。
エージェントモードとPavanをリリースする前に、社内でのドッグフーディングを行っていたと思います。そこから少し視点を広げて、今日のCopilotの全体的な開発サイクルはどのようなものですか?どのように計画を立て、何を試すかを決定し、どのように改善しているのでしょうか?
業界では今、AIエンジニアリングと呼ばれているものです。バックエンドとフロントエンド、AIを使った開発のフルスタックを拡張したものです。新しいバージョンのモデルをどのように使用するか、Copilotのモデルピッカーのように今持っている新しいモデルをどう扱うか、常に複数のベンダーからの複数のモデルを扱っています。
応用科学チームがあり、評価を実行しています。これらのベンチマークを構築するチームがあり、応用科学チームがモデル同士を比較するために使用しています。また、コードレビューエージェントやエージェントモードなどの機能を構築するチームも、テストスピードの一部としてこれらを使用して作業を検証しています。もはやデータサイエンティストとエンジニアだけではなく、それらの役割はますます重なり合い、日々協力しています。
ABテストによる実験を多く行っています。オフラインテスト後に、新しいバージョンや微調整されたモデルのバージョンをオンラインテストでフライトさせます。まずGitHubとMicrosoftの従業員と、次に人口の一部、そして全体にテストします。もちろん、Copilotだけでなく、GitHub全体の機能のロードマップを持っています。
GitHubは今年で18歳になります。創設者が2007年後半に作業を始め、2008年初めに立ち上げられてから18年です。そしてMicrosoftは実際に4月4日で50歳になります。私たちには顧客からのフィードバックの長いバックログがあり、Copilotを使ってそれらの機能を構築し、エージェントモードを使って機能の提供を加速しています。
同時に、市場は非常に速く動いています。OpenAIやAnthropic、Googleと会うたびに、新しいモデルのバージョンについて学び、ロードマップが一日で変わることもあります。市場が非常に速く動いているのを見ているでしょう。私たちは文字通り、追いつくのが難しいイノベーションの指数曲線に乗っており、一ヶ月か二ヶ月先までしか計画を立てられません。
その指数曲線上にあるCopilotについてどう思いますか?エージェントというものが一年前にはアイデアとして存在しなかったと考えるのは驚くべきことです。今では、これらの製品を試す人々で満ちた市場があります。GitHubは明らかに全体として非常に優勢ですが、Copilotも同様です。しかし、変化し競争の激しい市場で、開発者の心を掴み、彼らが気にすることについてどのように考えていますか?
勝つことについて考える方法は、私たちが開発者を深く気にかけているということです。それが常にGitHubの中心であり、開発者を第一に考え、開発者のために製品を構築する開発者であるということです。GitHubでは「GitHubをGitHubで、GitHubを使って、GitHubを構築している」と言っています。会社での法的条件やHRポリシー、製品管理、営業、営業支援、これらすべての機能をGitHub IssuesやGitHub Discussions、GitHubで行っています。私たち自身の製品を深く気にかけ、日々すべてに使用していることが一つ目のポイントです。朝の最初にすることは、モバイルフォンでGitHubアプリを開き、次にSlackを開くことです。多くの会社のチャットがSlackを通じて行われています。
二つ目は、競争を挙げましたね。開発者の分野ではこのようなものを見たことがありません。開発者ツールにとって最も刺激的な時代だと思います。私は30年以上開発者をしていますが、毎日出てくるイノベーションやニュースを見るのは素晴らしいことです。そのエネルギーは、オープンソース側とクローズドソース側の両方でイノベーションによって推進されています。独自のモデルとソフトウェアにあるイノベーションと同じくらい、オープンソースとGitHubにもイノベーションがあることを忘れないでください。そのエネルギーは明らかに私たちに向かって引力をもっています。
私はF1の大ファンで、競争があると良いと思います。なぜなら、複数のチームが選手権を勝ち取ることができると、レースを見るのがより楽しくなるからです。競争についても同じように感じています。それは私たちが毎朝目覚めたとき、より良く、より速く動き、最終的に市場で最高の製品で勝つためのモチベーションを与えてくれます。
人々が実際にCopilotをどのように使用しているかについての豊富なデータをお持ちですね。エージェントモードがリリースされてから、例えば先週から何が驚きですか?
初期の頃から常に驚いていたのは、Copilotがどれだけのコードを書いているかということです。Microsoftと GitHubの一部の人々が過去にあなたのポッドキャストに参加しました。Copilotプレビューを開始した初期の頃、すでにコードの25%を書いていました。製品レビューでこれを見た会議を覚えています。テレメトリーの間違いに違いない、コードの25%を書いているということはありえないと言いました。その時はただの自動補完だったからです。これがどれほど素晴らしかったとしても、初期の頃はまだ多くのミスをしていました。
しかし、すぐに数字が真実であること、そしてそれがソフトウェア開発者の学習した行動であることが明らかになりました。何かを入力していると、常に何かを調べる必要がある点に達し、ブラウザを開いてStack OverflowやReddit、ブログ、GitHubでコードを見つけ、それをコピー&ペーストして後で修正します。内部ループは常にこのようなもので、何かを書き、コンパイラやデバッガでそれを試し、動作するまで修正し続けます。
その数字はすぐにプログラミング言語に応じて約50%まで上昇しました。今、これらのエージェントを見ると、それを測定するのは難しいです。エージェントモードに入って「Pythonでスネークゲームを作りたい」と言うと、すべてのコードを書いてくれます。複数のファイルを書くので、分母はゼロになります。唯一書いたのはプロンプトだけなので、パーセンテージは無限大です。2年前の15分のデモが今では1分のデモになっています。
それは多くの点で驚くべきことであり、すでにその曲線の先にいることです。そして反対も真実です。同じファイルを何度も書き換えたり、ロジックのどこかで行き詰まって全ファイルを削除したりする場所に陥ることもあります。それは私たちを現実に引き戻し、エージェントが自律的に私のGitHubイシューをすべて通過し、バックログをすべて修正するにはまだ遠いことを示しています。私がしているのは検証とソフトウェア開発エージェントのためのコードレビュー担当者になることだけです。それで、すでにどれだけのことができるかという興奮と、非常に単純なシナリオで行き詰まってしまう現実の間を揺れ動いています。ただ一つのことをするようにプロンプトを試みたり、結局自分でエディタに入って背景色を変更したりする場合もあります。
それは理解できます。エージェント関連の取り組み以外にも、明らかに現在最も興味深いことの一つですが、今後数四半期でGitHubを発展させたい他の大きな分野は何ですか?他に大きな推進力はありますか、それともすべてAIに集中すべきでしょうか?
これまで、イシューを割り当ててプルリクエストを生成する汎用スピードエージェントについてだけ話してきました。しかし、開発者の日常生活を見ると、ほとんどの企業では一日のうち2〜3時間しか実際にコードを書いていません。その後、同じくらいの時間を同僚のコードレビューに費やします。
セキュリティと信頼の観点から、コードを本番環境にマージする前に常に別の人間がループの中にいることを望むため、それがなくなるとは思いません。同時に、コードレビューエージェントやコードレビューが大きなトピックだと考えています。特に異なるタイムゾーンで分散チームと仕事をする場合、西海岸の人々が起きるのを待たずに初期のフィードバックループを得たい場合に役立ちます。
コードレビューは私たちにとって大きなトピックであり、AIの部分はその一つですが、ユーザーインターフェースも同様に重要です。理想的には、フィードバックを受け取り、そのフィードバックについてコードレビューエージェントと協力できます。常に正確なフィードバックを得て「承認、承認、承認」をクリックするだけではないからです。ユーザーインターフェース、クラウド環境が必要です。ローカルマシンにリポジトリをクローンし、すべての依存関係をインストールし、別のブランチに切り替えるといった定型作業が多すぎます。
クラウド環境に移行すれば、コードレビューからの変更を試して修正し、そのアウターループを高速化できます。セキュリティの脆弱性もあります。コードスキャンで脆弱性を見つけるだけでなく、修正することも望まれます。もっと単純なバージョンはlinterエラーで、コードの書式設定などがあります。希望的には、AIがすべてを修正し、どこに括弧内のスペースを置くかを教える100の警告を通過する必要がなくなります。
また、任意のサイズのソフトウェアプロジェクトには外部の依存関係があり、多くの既知のソフトウェアの脆弱性があります。コードに到達できないか、他の優先事項があるため、今すぐ修正する必要がないと誰かが決定した低リスクのものが多くあります。AIがそのセキュリティバックログを削減することで、オープンソースエコシステムと多くの商用ソフトウェアプロジェクトを良くするでしょう。
すべてのエンジニアリングマネージャーが技術負債、レガシーコード、セキュリティ、アクセシビリティ、欧州の規制とイノベーションバックログの間で揺れ動いている努力を減らします。この二つの間に本当のバランスはなく、最も緊急な問題、最大の火事は何かということだけです。セールスチームが「この機能がなければ製品を売れない」と言っているのか、セキュリティチームが「この問題を修正しないと管理チェーンにフラグを立てる」と言っているのかということです。
それがAI側のことですが、同様にGitHubはプラットフォームとして、エージェントとAIが人間と連携して動作するためのプリミティブをサポートし、持つように発展する必要があります。
ソフトウェア開発のやり方がこのように変わることで生じる問題で、まだ対処されていないものがあると思いますか?例えば、コードの大部分が今年生成され、場合によっては全てのコードが生成されるというティッピングポイントを越えようとしていると感じますか?それによってテストや技術負債の見方などはどう変わりますか?
すべてのコードがAIによって書かれるとは思いません。これがどのように機能するかというと、2つの層があると思います。機械言語層があり、これはPythonやRuby、Rustなどです。これらは効果的にチップセット、機械命令セットの抽象化です。これが最後の決定論的な層です。プログラミング言語は本質的に私が望む通りに正確に動作します。
そして人間の言語は本質的に非決定論的です。私たち3人が同じ文を言っても、異なることを意味する可能性があります。構築しようとする機能や動作の多くを人間の言語で記述することになりますが、その下にはまだプログラミング言語層があり、エンジニアとしてAIによって書かれたコードが実際に正しいものか、コストプロファイルに合ったものかを確認します。
エンジニアとして、これらの両方の層を持つことになり、より多くの人間の言語へと向かい、プログラミング言語は少なくなっていくでしょう。しかし同時に、多くの金融サービス機関が依然としてメインフレーム上でCOBOLコードを実行しており、30〜40年前のコードを取り、魔法のようにクラウドアプリケーションに変換するエージェントを与えることからはまだ遠いです。
それは自動運転車のようなものです。自動運転車も来ていますが、ハンドルのない車を持ち、住んでいる国のどこでも運転してくれるという転換点がいつ来るのかはわかりません。ウェイモはサンフランシスコでは機能しますが、SFOからサンノゼまでは機能しません。範囲は拡大しますが、すべての技術負債とレガシーコードを解決するにはまだ遠いです。
少なくとも10年程度は、多くの古いPHPコードやCOBOLコードなどで作業するソフトウェア開発者がいるでしょう。一方で、スペクトルの反対側の極端な端では、10歳の子供にCopilotやRepet Bolなどのツールを与え、いくつかのプロンプトを入力させ、それがどのように機能するかを探求させ、Stable DiffusionやMidJourneyのように自分でソフトウェアをレンダリングし、それを反復する方法を探求させることができます。
あなた自身が言ったように、ソフトウェアエンジニアの大規模なチームをリードしていますが、人間の言語と指示がより多くプログラミング言語が少なくなると、あなたが見ているもの、自分のチームで発展させたいものは変わりますか?
今見ているのは、エージェントが取り上げることができるように問題を十分に具体的に記述する方法です。基本的にソフトウェア開発の計画と追跡側、イシューです。それがチームサイズが適切な場合、最大の課題になります。10人のスタートアップには問題がなく、ほとんどの10人のスタートアップにはプロダクトマネージャーがいません。創業者がプロダクトマネージャーで、残りはただものを構築しています。解決すべき問題があれば、非常に短いコミュニケーションパスがあります。1000人のエンジニアがいる場合、最大の問題は何を構築したいのか、どう構築するのか、これを書いたときに実際に何を意味したのかということです。
そのスペースを見ると、まだAIがあまり役に立っていません。私たち自身がCopilot workspaceで初期段階にあり、仕様とブレインストーミングエージェントがあります。これはGitHub issueに書かれたものをコードベースと比較し、人間の言語で前後を記述します。そしてNotionのように修正し、仕様に追加することができます。
これはプロダクトマネジメントのスペースに持ち込むエージェント的行動の一連になるでしょう。デザイナーにも同様です。今日、多くのデザインはFigmaで手書きされていますが、明日、デザイナーはプロダクトマネージャーと同じ仕様を効果的に入力し、AIツールがワイヤーフレームのコードをレンダリングし、製品のように見せるためにデザインシステムからグラウンディングを適用するでしょう。
これらの分野はお互いに近づき、プロダクトマネージャーは仕様が優れていれば変更セット全体を作成できるようになり、デザイナーはプロダクトマネジメントの役割の一部を引き継ぐことができるようになります。エンジニアもこれらの他の役割に近づき、機能を記述することが得意であれば、その部分も引き継ぐことができます。今後数年間、これらのエージェントがより多く利用可能になり、実際に優れたパフォーマンスを発揮するようになるにつれて、従来のソフトウェアエンジニアリングチームにおける規律がどのように進化するかを再考するイノベーションが多く起こるでしょう。
これらの異なるエージェントと異なるユースケースについて考えるとき、すべての3つを提供する同じ会社や製品になると思いますか?それは一つのインターフェースになるでしょうか、それとも異なるインターフェースでしょうか?実際のフロー、ある意味で非常に異なるユーザーについて、いくつかの重複する責任や目標を持つものとして、彼らが対話するツールのセットについてどのように考えていますか?それは単一のツールですか、それとも多くのツールですか?一つの会社ですか、それとも多くの会社ですか?どこから始まるのでしょうか?
GitHubでの私たちの最も強い信念の一つは開発者です。GitHubをプラットフォームとして想像してみてください。そこではJavaScriptライブラリだけ、またはReactだけが利用可能で、それがアプリケーションを構築するために必要な唯一のオープンソースライブラリだと言われるとしたら?Reactを愛しているためにReactを使用するユーザーのセットがGitHubを使用し、残りは他のプラットフォームが他のすべてのオープンソースコンポーネントを提供するため、どこか他の場所に行くでしょう。
AIでも同じことが起こると思います。ソフトウェア開発ライフサイクルの異なる部分を提供する会社のスタックまたはユニバースが見られ、開発者は最も好きな、経験があり、未来を知っていると確信しているものを選ぶでしょう。プログラミング言語は多くの点で非常に似ていますが、開発者間の議論を見ると、互いに非常に異なっているように感じます。結局のところ、すべてはApple M4チップやIntel CPU、AMD、Nvidiaなどで実行される命令セットに変換されるのです。
異なるツールのスタックがあり、すべてのツールを提供する会社があると思います。すべてではありません。なぜなら、一つの手からすべての開発者ツールを得ることは決してないからです。GitHubを考えてみてください。大きなプラットフォームを持っていますが、それでもエディタやオペレーティングシステム、コンテナソリューション、クラウドはGitHubから来ていません。HashiCorpのTerraformやAWSの例、またはVercelのNext.jsなど、ベイエリアのランダムな企業に行けば、彼らは皆、この時点で最適だと信じている異なるツールスタックを組み合わせています。
このAIの世界でも同じことが見られると思います。異なるエージェントの選択肢があり、すでに異なるモデルの選択肢があります。クラウドモデルが優れていると信じる人もいれば、OpenAIのモデルが優れていると信じる人もいます。現実はその中間にあり、異なるシナリオは異なるモデルでより良く機能します。私たちが向かっているこのエージェントの未来でも同じことが言えるでしょう。
一般化可能性を考えると、それは本当ですか?言及したモデルのx%を取り除いて、一つだけに限定されたとしても、4、5年前に比べて相対的な能力が与えられたとすれば、それでも非常に満足するでしょう。言い換えれば、多くの素晴らしい選択肢があり、いくつかのものは他のものより優れていますが、基本的にはいずれのものもベースラインの指標で見れば素晴らしいものでしょう。
それは話している最終状態によります。シンギュラリティが来るなら、5年後には何も重要ではありません。約5年前の2020年6月にCopilotを始めました。当時はGPT-3で、GPT-3は本当に初期の実験でした。そして、最終的にCodexになったモデルを手に入れました。これはモデルのコード特化バージョンでしたが、今日ではもう存在しません。今日では誰もがこれらのより強力なベースモデルの上に構築しています。
はい、それが私のポイントです。ある程度、一般化可能性が優位を占め始めました。エージェントの5年間の時間軸での一般化可能性と特殊化についてどう考えるのか、少し興味があります。
それがモデル層で起こる可能性があると思いますが、それはまた自動運転車が本当にいつ実現するかを予測するようなものです。10年間Teslaを自動運転とオートパイロットで何らかの形で持っていましたが、まだ私の近所への左折ができません。その未来が来ることは見えますが、それがいつなのか、モデルが基本的にすべて同等になるのはいつなのかはわかりません。
しかし、ソフトウェア開発者にとって、最低レベルは、スタックの高いレベルでの差別化がある限りしか重要ではありません。プログラミング言語やオープンソースライブラリはその良い例だと思います。十分にズームアウトすれば、それらはすべて同じです。結局のところ、SwiftやKotlin、React Nativeでアプリを構築しているかどうかは何の違いがあるでしょうか。これはソフトウェア開発の内在性と私たちが持つ信念システムです。
差別化は、開発者が最高の経験を得る場所、日々の業務を行う場所から来ると思います。朝、作業したいものを選び、創造性を探求し、最小限のフラストレーションと最大のROIで仕事を完了できる場所はどこでしょうか。ソフトウェア開発は過去30年間、実際には過去50年間、マイクロコンピュータが登場し、他の人とメインフレームを共有する必要がなくなった1970年代まで遡れば、個人として達成できる範囲を超えた大きなアイデアをすべて取り、それをより速く実現する方法についてでした。私たちはその指数曲線の頂点にはいないと思います。まだ多くのことが来るでしょう。
あなたが尋ねることができる別の質問は、GitHubのCEOとして、私のバックログが空になるポイントにいつ到達するかです。そのポイントが来ることはないと思います。
あなたが言っていることに関連する非常に興味深い質問があります。それは、人間がどのエージェントを使用するかについて、どれくらいの期間決定を下すかということです。開発者やデザイナーなど、あなたが言及した役割の多くは、伝統的に少しトレンドベースになる傾向がありました。時には何を使用するかがミーム的なことがあります。明らかに劇的に優れた製品や特定のツールに関する明確な選択肢がありますが、時にはただ「クール」だからという理由で人々がそれを使用しているように感じることもあります。プログラミング言語も同様です。
決定がラディカルに異なるのは、人間の決定要素がなくなり、トレンド性がなくなったときです。Goを使わず、単にPythonを使用するだけになるかもしれません。
私のチームを見ると、CEOとして、彼らが構築しているものが実際に私がタスクを与えたときに構築してほしいと思ったものであるかどうかを確認するためにどれくらいの頻度でチェックインする必要があるでしょうか。まず、タスク、機能、エピックなどを引き継ぐ人間は、彼らが構築しているものが実際に正しいものであることを確認するために、他のチームメンバーとのループを持っています。
エージェントに作業を与えるとき、作業単位が非常に小さくない限り、エージェントが完全に自分自身でそれを行うことができるほど具体的になれる世界は見えません。
その質問のもう一つの側面は、すべてのソフトウェアが個人用ソフトウェアになるポイントにいつ到達するかということです。実際、もはやApp Storeからアプリをインストールするのではなく、自然言語インターフェースを使用してすべてのアプリを自分で構築します。そのため、既製のすべての人に同じソフトウェアの代わりに、個人のコンピュータ、スマートフォンに完全に個人用のソフトウェアを持つことになります。ユーザーインターフェースは効果的に完全にパーソナライズされます。
「アイアンマン」のようなSF映画やアクションムービーがあります。そこではJARVISはトニー・スタークに完全にパーソナライズされています。その未来は確実に今後5年間で起こると思います。ただ問題は、JARVISがどれだけ優れたものになるか、そして「春が来る、同じホテル、同じ家族」と言うだけで旅行を予約してくれるようになるかどうかです。確認する必要がある唯一の質問は、5000ドルの旅行をするかどうかということです。
GitHubとCopilot、そして他のすべてについて印象的なことの一つは、そのすべての実際のビジネス上の成功です。最近行われた収益発表のコールでは、非常に印象的だったと思います。Copilotと、より一般的にはGitHubがMicrosoftに与えているビジネスと財務指標、その影響について何か共有できることはありますか?
収益発表以上のことは多くありません。記憶を辿ると、私たちが共有した最後の数字は、数四半期前の77,000組織がCopilotを使用していて、当時の有料ユーザー数は180万人でした。それ以降、更新された数字は共有していないので、その最新の数字を共有できます。
これらの収益発表で本当に興味深いのは、サティアが言及したロゴの数がスペクトル全体にわたっていることです。単に「クールなスタートアップ」や「金融サービス機関」だけではなく、本当にすべての業界がCopilotを採用しています。あらゆる企業規模、あらゆる業界のソフトウェア開発の全スペクトルでこのような速度で採用された開発者ツールはなかったと思います。
考えてみると、20ドルは米国の平均的なソフトウェア開発者の給与と比較すると、せいぜい0.1%程度です。そして、エンドツーエンドで25〜28%の生産性向上、コーディングタスクでは55%以上の向上が見られます。しかし、先ほど言ったように、開発者はコーディング以上のことをします。これは支出されたドルに対する信じられないようなリターンであり、それがこの採用曲線を駆動しているものだと思います。
そして今や、どの企業もソフトウェア企業であり、彼らはみな同じ問題を抱えています。長いバックログと多すぎる作業があります。マネージャーの一人がチームに行って機能の実装にどれくらい時間がかかるか尋ねるたびに、ジム・カーク船長とスコッティのジョークになります。ワープドライブの修理にどれくらい時間がかかるかと尋ねると、途方もなく長い見積もりが返ってきて、エンジニアが実際に可能なことを見積もるのではなく、船長が期限を設定する交渉になります。これが、Copilotのビジネス上の成功の多くが来ている場所だと思います。ソフトウェアを書いているすべての人は、エンジニアが優れていないと思っているわけではなく、ソフトウェア構築の複雑さから、それがどれくらい時間がかかるかにフラストレーションを感じています。
この価格設定がどのように変わると思いますか?これは現時点での推測に過ぎないと思いますが、実際に人々を置き換える場合はどうでしょうか?多くの業界では、法律、会計、コーディングなど、人々はこう言います:「最終的には、これは価値ベースの価格設定に移行するでしょう。なぜなら、最終的には月に20ドル支払って人をより生産的にするだけでなく、実際に年間50,000ドルから100,000ドル、または200,000ドルかかる人を置き換えることになるからです。」役割に応じて様々です。これは最終的に、プログラマーをレンタルしてプログラマーのように価格設定されるのでしょうか?すべてがコモディティ化され、最終的に通常100,000ドルから200,000ドル、300,000ドルかかるものが年間1,000ドルのコストになるのでしょうか?このマーケットがどこに向かうと思いますか?
それはコンピュート料金ベース、または指標としてのコンピュートの派生物になると思います。それは安くなるでしょう。キッチンの食器洗い機があなたのために毎日皿を洗う人のコストの派生物ではないのと同じように安くなるでしょう。
買い手のペルソナは、機械、食器洗い機であれ、エージェントであれ、人間の開発者と同等の価格を支払う意志を持たないと思います。そして、それは実際に正しい考え方だと思います。なぜなら、エージェントが実際に開発者を置き換えるとは思わないからです。創造的な部分はまだソフトウェア開発者からきています。システム思考、未来の予測、それが常に楽しい部分です。
1年か2年後にポッドキャストに戻ってきて、私の予測がどれだけ間違っていたかを教えてくれるでしょう。しかし、ソフトウェア開発には人間が行わなければならない多くの決定があると思います。どのデータベース、どのクラウドを使うかなど、多くはビジネスとその運営方法の関数です。
使用するクラウドは必ずしもクラウドのコストの問題ではなく、CTOやエンジニアリングリーダーシップチームの戦略的決定の問題です。そして、ますます多くの企業が1つのサプライヤーへの依存を持ちたくないため、複数のクラウドを使用しているのを見ています。これは、任意の自動車メーカーがエアバッグが1つのサプライヤーから配送できない場合に工場ラインが止まらないように、複数のサプライヤーからエアバッグを調達しているのと同じです。
エージェントの価格ポイントは、これらのエージェントがより強力になるにつれて確実に上昇すると思います。OpenAIでは、最高のものが今Deep Researchで01モデルの場合、200ドルかかるようになっています。明らかに人々はそれに価値を見出しています。2年前にこれを予測していたら、チャットエージェントに月額200ドルを支払う意思があると信じていなかったでしょう。その反面、ソフトウェアではモバイルアプリの5ドルのサブスクリプションが多額のお金だと感じることが多いです。一度の支払いからサブスクリプションモデルに移行したアプリのレビューを見ると、多くの人がそのモデルを好まないことがわかります。彼らはソフトウェアをCDのような一度購入して所有するものだと感じているからです。
価値に基づいた価格の上昇が間違いなく起こるでしょう。なぜなら、人間の開発者が高価なのは供給が限られているからです。エージェントは無限の供給を持ち、データセンターで利用可能なコンピュート容量、GPUの量によってのみ制限されます。
その供給のロックを解除する話をしていましたが、コード生成の価格設定について考えています。また、ソフトウェア全体の価値に何が起こるかという質問もあります。皆がしばらくジェヴォンズのパラドックスについて話していますが、それについては尋ねたくありません。もっと具体的なことかもしれません。
あなたは東ドイツ出身で、トラバント車を覚えていますね。
実際に持っていました。私の両親が持っていました。
良かったですね。それは大丈夫な車でしたが、供給制約のために結局10年の待機リストを持つデフォルトの車になりました。壁が崩れるとすぐに、需要は完全に崩壊しました。なぜなら、世界中の車へのアクセスと価格設定を手に入れたからです。
一つの質問があります。私はソフトウェアの需要が非常に弾力的であることについて一般的に楽観的ですが、それはボリュームと品質と変化だと考えています。AIがエンジニアリングの希少性を取り除いたときに、価値が崩壊するソフトウェアのタイプがあると思いますか?
トラバントの待ち時間は実際、80年代後半には17年だったと思います。17年ではなく10年でした。そのロードはまだ存在します。今日、それはスーパーカーに存在します。しかし、最高級のポルシェ911 RS3などを購入できますが、ディーラーに行くことができないため、再販価格は新品価格よりも高くなることがよくあります。ディーラーでは、その限定トップラインのポルシェやフェラーリの枠を得るために、まず100台のポルシェを購入する必要があります。
実際、私の父が所有していたトラバントは、1984年か1985年に近所の人に購入価格よりも高い価格で売りました。なぜなら、17年の待機リストを短縮できたからです。親は子供がまだ若いうちに車のための「サブスクリプション」を持っていたので、子供が成人に達し、運転免許を取得する頃には実際に車を手に入れることができました。
ソフトウェアの質問に戻りますが、両方の方向に進むと思います。Copilotを考えてみてください。Copilotはビジネスに対してユーザーあたり月額20ドルのコストがかかります。これは、GitHub Enterpriseに支払う価格とほぼ同じで、月額21ドルです。すべてのリポジトリを保存し、すべてのイシューを管理し、ソフトウェア開発ライフサイクル全体が月額21ドルでした。多くの人はDevOpsに多額のお金を支払っていると認識していました。
そして、Copilotの自動補完が登場し、それは月額20ドルでした。突然、ソフトウェア開発ライフサイクルのサブ機能である自動補完が20ドルのコストになりました。これはエラドの質問に戻ります。価値があり、25%の生産性向上を得られるなら、5年前に「自動補完がGitHub全体の平均販売価格よりもコストがかかるスタンドアロン機能になる」と言われていたら、それはありそうにないと思っていたでしょう。
ソフトウェア価格のデフレが見られると思います。いくつかのものには支払わなくなり、誰もオペレーティングシステムに支払わなくなります。一方で、Netflixサブスクリプションやオフィスサブスクリプションなどに今までよりもはるかに多く支払っています。これらの両方のことが同時に起こり、それはすべてあなたのビジネスに対してその解決策から得る価値についてです。それを自分で行うか、自分で管理するか、自分のサーバーにインストールするかにかかわらずです。
GitHubはオープンソースの基盤となるインフラストラクチャなので、今日のオープンソースエコシステムで起きていることについて一般的な意見をお持ちだと思います。CopilotではClaude、OpenAI、Geminiを使用できますが、現時点ではオープンソースモデルは必ずしも使用できないということですね?
Copilotでは、Claude、Gemini、そしてOpenAIがあります。OpenAIには異なるモデルがあります。私の頭の中で考えていましたが、3つ以上のモデルがあります。O4モデル、O1モデル、O3 Miniモデルです。
GitHub Modelsでは、これは私たちのモデルカタログですが、Llamaのようなオープンソースまたはオープンウェイトモデルがあります。そして、MistralやCohereなど、MicrosoftのPhi-4モデルなど、他のあらゆる種類のモデルがあります。
モデルカタログはGitHub内の別の機能であるため、Copilotにモデルを追加できません。しかし、Copilotには拡張機能があり、実際にCopilotからモデルカタログにアクセスできるため、Phi-4に対して推論を実行したい場合は、Add Modelsの拡張機能を使用してそれを行うことができます。そのため、Copilotにパッケージされているものよりも多くのモデルがあります。
将来的に開発者にとって、オープンソースと独自のモデルAPIの関連性についてどう思いますか?
最大のことは、オープンソースがイノベーションを推進することだと思います。それを今年の初め、数週間前のDeepSeekで見ました。もう半年が経過したように感じますが、実際には1ヶ月半しか経っていません。
オープンソースがイノベーションを推進すると思います。Stable Diffusionのような画像モデルでそれを見ました。今では、実際に私のドイツの拠点の近く、黒い森のフライブルクからそれほど遠くないスタートアップであるBlack Forest Labsが開発したFluxモデルがあります。
オープンソースモデルでイノベーションが見られ、それが他のベンダーを促進すると思います。オープンソースエコシステムと独自のクローズドソースの企業との間のこの行き来は、全体的な領域を加速すると思います。
DeepSeekは現在最も著名な例です。論文はオープンで、モデルはオープンです。一部は完全にオープンソースでMITライセンスのもとにあり、他はオープンウェイトで、ウェイトを見ることができ、それを実行するコードはオープンソースですが、ウェイトそのものはいくつかの独自ライセンスの下にあり、中国の法律によって管理されています。
これがイノベーションを推進し、その領域を開き、アクセスを民主化すると思います。なぜなら、モデルを試してみたいだけなら、商用APIに対して推論を実行する必要はなく、自分のローカルマシンで試すことができるからです。子供や学生、研究を考えると、それは巨大な領域を開き、それが最終的に常にGitHubのDNAの一部であったことです。
それは満足のいく答えでしたか、サラ?
はい、最も満足のいく答えは、誰かが勝つということですが、それは現時点では予測するのが非常に難しいことだと思います。iPhoneとAndroid、WindowsとLinux、あるいはmacOSのどちらが勝ったでしょうか?テック業界のこのような二項対立について考えたがりますが、現実はそうではありません。
特に開発者の領域ではそうではありません。Reactが勝ったわけではなく、常に次のものがあります。Reactの前にはjQueryや他の好みのライブラリがありました。PythonやTypeScript、Rustの後に次のプログラミング言語があるでしょう。Rust自体は5年前には本当にものではありませんでした。より人間の言語に近い、より自然言語のAI層とそれをCPUやGPUに変換するプログラミング言語層に近いより多くの言語があるでしょう。
勝利はありません。常に無限のゲームをプレイしています。それはMinecraftのようなものです。ソフトウェアはMinecraftのようで、Minecraftでは勝利はありません。小さな戦いに勝つことはできますが、それは特定のサブチャレンジやクエストに限定されています。しかし最終的には、私たちはより大きなソフトウェアの世界を構築しており、常に次の大きなことがあるでしょう。
それは面白い類似性です。個々の開発者について考えると、人々が私に言っていることがあります。特定のタイプの開発者、本当に強い技術的な人々、より経験豊富な一部のシステム開発者、特にRustに非常に愛着を持つ人々がいます。彼らは基本的に、次世代の開発者が、実際の実装の経験に基づいて、特定の実装が特定の形のデータに対して失敗する可能性がある方法のアーキテクチャの選択と trade-offs とコーナーケースの理解を構築することを心配しています。
彼らは2025年の「Minecraft」の次のレベルで勝つために正しいことが、AIを積極的に使用し、それを使うことを学ぶことだと知っています。しかしこのセグメントからの懸念、あなたも聞いたことがあると思いますが、それはあなたに共感しますか?コードを書いていないときに、抽象的なレベルでのエンジニアリングの必要な深さの理解を促進できますか、それともそれは愚かな懸念ですか?
それは愚かなものだと言いましょう。明らかに、その中には真実があります。プログラミング演習やAdvent of Codeなどでズルをするのは簡単です。これらのAIモデルが良くなるにつれて、最高のハッカーやコーダーのこれらの競争は全く異なるレベルに移行する必要があります。開発者がAIを使用して課題を解決することを前提とします。そうでなければ、あまりにも簡単になるでしょう。
次世代の開発者、2025年ではなく2035年のことを考えてみてください。あなたは東ドイツで育ち、壁が崩れてCommodore 64を買ったと言いましたが、インターネットはありませんでした。そこで本や雑誌を買いました。質問を尋ねることができるフォーラムはありませんでした。コンピュータークラブに毎週水曜日に行きましたが、誰も私がすでに知っていなかったことを言わなくなるまでそうしました。
それを今日と比較してみてください。今日の子供たちや、コーディングを学びたい人たちは無限の知識を利用できます。また、無限の忍耐力も持っています。Copilotは忍耐が尽きることはありませんが、親は尽きます。私は親の一人です。AIが利用できることは、コーディングを学びたい場合、信じられないほど民主化されています。親は技術的なバックグラウンドを持つ必要はありません。本当に必要なのは、モバイルフォンでのインターネット接続と、これらのCopilotやChatGPTなど、お好みのものの一つです。
コーディングの質問を始め、ブール論理やシステム思考について尋ね、それらの質問について無限に深く掘り下げることができます。他のトピックに移行することもできます。新しい世代の人間が、技術とともに成長し、それが彼らにとって自然であり、個人アシスタント、個人エージェントのセットを活用することを知っている世界を見ることになると思います。
最近、私はそれをエージェントのオーケストラと呼び、あなたはそのオーケストラの指揮者です。彼らはそれを知っており、同じ時間内にはるかに多くのことを達成できます。これは非常に刺激的なことです。なぜなら、常に構築したかったコンピュータゲームやソフトウェアシステム、機能の大きなアイデアを持っているが、時間がない開発者を見つけてください。私のエンジニアたちは、過剰に約束し、燃え尽き、私や顧客、セキュリティチームが求めるすべてのことに十分な時間がないことについてよく話します。
これが私たちが向かっている方向であり、これがどのように超興奮的になるかということです。オープンソースにおいても同様です。オープンソースの持続可能性は別の大きなトピックであり、おそらく別の1時間を費やすことができるでしょう。そして、人々が構築したいあらゆる種類のソフトウェアにおいても同様です。
その興奮と楽観主義に確かに同意します。3人の子供たちと、AIのリソースで彼らが何をどのようなペースで学ぶことができるかを考えると、非常に嫉妬しています。あなたが言ったように、今日のモデルの無限の忍耐と理解があれば、エンジニアとしてずっと早く、もっと優れた存在になれるでしょう。ちなみに、私は非常に幸運でした。両親は二人ともエンジニアでしたから。でも、「論理よ、サラ」と父が言うと、「ああ、やだ」となる非常に人間的なダイナミクスがあります。
もう少し個人的な質問で締めくくってもいいですか?東ベルリン、統一後の急速な技術変化のユニークな経験を持っていますが、それは現在のAIの移行の速度と、ユーザーや人間がそれにどのように反応するかについての考え方に影響していますか?
私の人生の多くが1989年のその変化の瞬間によって定義されていると常に信じたいと思っていました。壁が崩れたとき、あるいは壁が開かれると発表された夜を覚えています。それは木曜日の夜で、金曜日は普通に学校があり、土曜日も半日学校がありました。私のクラスに現れたのは4人の子供のうちの1人だったと思います。そして彼らは私たちを家に帰しました。それから実際に西ベルリンへ渡りました。
その変化を経験した世代の子供たちにとって重要なことは、もはや彼らの子供時代の家に戻ることができないということです。家はなくなったのです。角にあるその店が40年前と同じであることや、学校はすべてなくなり、システムもなくなり、伝統もすべてがその新しい世界に溶け込んでしまったのです。
それは、一つの国から別の国へ移動するようなものです。私も10年前にMicrosoftが私の会社を買収したときにそうしました。人生でそのステップを一度踏むと、物事に対して全く新しい視点を得ることができます。1990年の統一、そして私の人生のステップを通して、GitHub CEOになるまでの当時はランダムに感じた決断を通して、私はここに来て、過去を認識しながら前向きに未来を楽観的に見ています。
90年代にCommodore 64でプログラミングすること、インターネットの前と後、オープンソースの前と後、クラウドの前と後、モバイルの前と後、そして今はAIの前と後があります。振り返ることはできません。未来は、もし望むなら私たちの生活のほぼすべてにAIを持つことになるでしょう。もちろん、いつでも携帯電話を隅に投げてインターネットなしの一日を楽しむこともできます。
これは素晴らしかったですトーマス、会話をしてくれてありがとう。
時間をとっていただき、すべてに感謝します。本当にありがとうございました、つながることができて良かったです。
TwitterでNo Prior Podをフォローし、YouTubeチャンネルをサブスクライブして私たちの顔を見てください。AppleポッドキャストやSpotify、またはお好きな場所で番組をフォローしてください。そうすれば毎週新しいエピソードを入手できます。メールにサインアップするか、すべてのエピソードのトランスクリプトをno-pri.comで見つけてください。

コメント

タイトルとURLをコピーしました