Replit CEO Amjad Masad：コーディングエージェント、自律性、そして仕事の未来

ReplitのCEOであるAmjad Masadが、コーディングエージェント、自律性、そして仕事の未来について語ったインタビューである。同社は当初プログラミング学習を支援するツールとして始まったが、現在はAI支援コーディングに重点を移している。Masadは、AIが仕事を奪うという悲観的な見方は正しくないと主張し、むしろ仕事の未来はより人間的で、よりインタラクティブで、よりマルチモーダルになると予測している。技術が進歩してものづくりが簡単になるにつれ、ボトルネックはアイデアの創出能力に戻ると述べている。

Replit CEO Amjad Masad: Coding Agents, Autonomy, and the Future of Work

Amjad Massad started Replit to make programming accessible to anyone, anywhere. What began as a tool for learning to cod...

ReplitのAI革命：プログラミングの民主化から自律的開発へ
自律性レベルの劇的な進歩
Replitエージェントの利用状況と企業への影響
本番展開への課題と解決策
ユーザーインターフェースの進化と課題
仕事の未来：より人間的で協調的なもの
基盤技術の詳細とエンジニアリングの課題
子供たちへのアドバイス：ものづくりの重要性
SaaSの未来とReplitの影響
創設者へのアドバイス

ReplitのAI革命：プログラミングの民主化から自律的開発へ

私は、AIについての悲観的な見方や、AIが私たちの仕事をすべて奪うといった考え方は正しくないと思います。そして、仕事の未来はより人間的で、よりインタラクティブで、よりマルチモーダルなものになると考えています。ものづくりが簡単になると、ボトルネックは再びアイデアをどれだけ持てるかという点に戻るのです。私はコーディングを学ぶことを最優先事項にはしません。ものづくりを学ぶことを優先します。コードでものを作ることを学ぶ。動画でものを作ることを学ぶ。AIでなんでもものを作ることを学ぶのです。

ブレイクダウンへようこそ。私はデイブです。こちらはトムです。そして今日はAmjad Masadさんをお迎えしています。AmjadさんはReplitの創設者兼CEOで、2018年のY Combinator参加企業です。番組へようこそ。

ありがとうございます。

今日は、あなたが人々にコーディングを学ぶ手助けをしてきた始まりから、現在その作業の多くを置き換えていること、そして人々がものを作る方法の未来をどう見ているかについてお話ししたいと思います。Replitは2016年に始まり、2018年にY Combinatorに参加されました。プログラミングを学ぶ人々が開発環境をウェブ上で簡単にセットアップできるツールとしてスタートしましたが、現在はAI支援コーディングで本当に注目を集めています。最新の状況を教えてください。

はい。ミッションは常にプログラミングをより身近なものにすることでした。Y Combinator後、私たちはそれをもう少し野心的にアップデートしました。10億人のソフトウェア開発者について話し始めましたが、当時はとても馬鹿げて聞こえました。これはすべてプレLLM時代のことです。

プレLLMの時代ですね。覚えているかどうかわかりませんが、2015年頃のAIハイプの瞬間がありました。自然言語処理のハイプもありました。最終的に裏で人間が作業しているだけのAI企業がたくさんあって、それらはすべて破綻しましたが、コードに対してNLPを行う可能性の兆しがありました。

そこで、おそらくそれが来るだろうというアイデアがありました。シードデッキにも、いつかは十分なデータを収集してモデルを訓練するだろうと書いていました。2020年のGPT-2まで、それが可能になると感じることはありませんでした。

そこで私たちは、開発環境やホスティング環境など、その周辺のプリミティブをすべて構築していました。そして、AIエージェントを追加すれば、それらすべてを調整できて、本当に素晴らしいものになると感じました。エージェントは試すたびにうまくいきませんでした。2021年に初めて試したときはうまくいかず、2022年もうまくいかず、そして2024年の年初に近づいていると感じました。

GPT-4oでさえ、なぜか2分間は一貫していられました。ただ、大きな賭けに出ることになりました。会社はあまりうまくいっていませんでした。

賭けの瞬間があったかお聞きしようと思っていました。以前はコーディングを教えていたのに、もうそれはやめて、今度はみんながアプリを作れるようにするという感じでしたか。

はい、そうです。会社をかなり大きくしていましたが、資金を燃やしすぎていました。それでレイオフをすることにしました。約50人を削減し、さらに15〜20人が辞めていきました。会社の半分以下になってしまいました。それで私はすべてをReplitエージェントに賭けました。これがその技術だと感じていました。うまくいかなければならないと。近づいていると感じていました。

船を燃やすような瞬間でした。これをやらなければならないという感じでした。これが会社をうまくいかせる技術だと感じていました。正直に言うと、エージェントを構築している最中にClaude 3.5が出てこなかったら、おそらく失敗していたでしょう。

なぜなら、さっき言ったように、GPT-4oは2〜3分間一貫していられましたが、Claude 3.5は初めて5〜10分間作動し続けることができて、実際に機能し、コード生成もできた最初のモデルだったからです。

これは、技術がまだ完全にはそこに到達していないミッションから始めて、構築を開始し、パックの向かう方向に向かって滑るような、スタートアップが可能性の最先端で構築する最も成功したアプローチだと思います。技術があなたに追いついてくるのです。

そうですね、それを続けていきたいと思っています。

まったくその通りです。6ヶ月前にY Combinatorで講演された時のことを覚えています。それを立ち上げた直後で、その時あなたは「完全に自動化されたソフトウェア開発からはまだ程遠い」とおっしゃっていました。今でもそう感じていますか。

いえ、全くそうは思いません。私は何かしらの予測をするたびに、それが大胆で大げさに感じるのですが、一貫して間違っていました。物事の動きははるかに速いのです。

自律性レベルの劇的な進歩

自律性のレベルがそうです。さっき言ったように、Claude 3.5は5〜10分でした。Claude 3.7はおそらく4〜5分から1時間まで行けるでしょう。Claude 4.0については、システムカードとOpusで7時間作動させたと書いてありました。

すごいですね。7時間。それは信じられません。

エージェントを作る上での制限要因は常に、一貫していられるか、コンテキスト長が実際に推論に役立つかということでした。LLMが7時間作動できるなら、それは基本的に人間の労働者と同じです。そして、おそらく人間よりもはるかに速いスピードで作業しているので、その7時間でおそらく1週間分の作業を完了していることになります。

実際に多くの作業を自動化するために欠けている唯一の大きな制限要因は、コンピューター使用だと思います。コンピューター使用はかなりひどいものです。あなたも試したことがあると思いますが、これがReplitエージェントが本当に1つのプロンプトですべてのアプリを作ることと、少し面倒を見て一緒にテストすることの違いです。

前回のバッチで、ブラウザ自動化に取り組んでいるBrowser Useという会社がありました。Browser Useは素晴らしいです。そして、Windowsデスクトップで同じことをしているPigという会社もあります。

今日の創設者へのアドバイスとしては、Browser UseやPigによるWindows自動化を使って、それを企業や垂直産業に適用することを試すことです。この技術が機能した瞬間、これら2つの会社は完全に普及するでしょう。そして、それが本当にうまく機能するまで数週間、または一桁の月数だと思います。ですから、今がこれらの技術を使い始める時です。

絶対に100パーセントその通りです。これが私たちが集中していることです。Replitエージェントv1からv2への自律性の大幅な向上がありました。v3は最も自律的なものになります。すでに取り組んでおり、興味深いことに、基盤技術と自律性を可能にする方法があります。

いくつかの重要なことがあります。1つはトランザクション性です。ロールバックできる能力は非常に重要です。gitが人間のプログラマーが実験したりブランチを作ったりするのを安全にしたのと同じように、エージェントにとっても安全にしたいのです。エージェントがDBマイグレーションを台無しにしてしまった場合、ロールバックできるべきですし、異なるパスをサンプリングできるべきです。

これは自律性にとって非常に重要だと思います。例えば、AnthropicがSWE-benchスコアを公開する際、サンプリングありとサンプリングなしを公開しており、70％から80％に上がります。

これは、複数のエージェントを生成し、それぞれが挑戦し、どれが機能するかを判断してそのブランチを選択するという考え方です。私たちは完全にトランザクショナルで同期して動作するインフラストラクチャを構築しました。つまり、ファイルシステムはスナップショット失敗ベースのファイルシステムで、DBはスナップショットベースのDBです。

進行中に仮想マシンを含むシステム全体にコミットを行っており、フォークして分岐させることもできます。コンピューター使用がうまく機能すれば、現在サンプリングで行っていることは、ランキングを行う何らかのジャッジがありますが、これは真の検証者ではありません。真の検証者はテストですよね、そしてコンピューター使用テストです。サンプリングして、実際に機能している最良のブランチを本当に選ぶことができます。

それは信じられないことで、それを何度も繰り返すことで、信頼性が本当に高くなります。6ヶ月または12ヶ月後を想像すると、1つのエージェントを生成するのではなく、5つ、10つ、それとも100万つを生成するのでしょうか。

これが面白くなるところだと思います。ユーザーに計算予算を設定できる機能を提供したいでしょう。Oスタイルのモデルでそれを見始めています。「これだけの予算があります」という感じです。でも、1,000ドルくれるなら、私たちはそれを使いますよ。

それは本当にクールです。前に考えたことがありませんでした。複数のブランチを生成してから最良のものを選び、それを並行して行えるという考え方。人間の脳は自然にはそのように機能しません。私たちは順次的に考えます。

これはAppleでスティーブが経営していた時の伝説を思い出させます。わからないが本当かどうかわかりませんが、彼は意図的に基本的に同じことをしているチームを持ち、どちらが最良の仕事をするかを見たと聞いています。

OpenAIも今それをやっていると聞いています。興味深いです。Codexプロジェクトでは複数の異なるチームがあったと聞いています。文献では、サンプリングされた小さなモデルがより大きなモデルを打ち負かすことがわかります。サンプリングされたSonnetはおそらくOpusよりも良いでしょう。

企業は、1人のシニアエンジニアを雇う代わりに10人のジュニアエンジニアを雇って同じタスクを与えることを試したことがありません。人間では非常に高価ですが、LLMでは比較的安価で、100人やって毎回最良のものを選ぶことができます。

Replitエージェントの利用状況と企業への影響

人々はReplitエージェントをどのように使っているのでしょうか。そして、それを使っているのはどのような人たちですか。

これは私たちの初期のビジョンに戻るのですが、プログラミングを簡単にすれば、より多くの人がそれをやりたがるようになるということです。実際、これはPGと私が最初につながった点の一つです。Y Combinatorに入る前に、実際にPGがHacker Newsで私たちを見つけて、メールでの関係が始まりました。

彼は、プログラミングがどれだけ簡単になるかと、どれだけの人がそれをやりたがるかには超線形の関係があると言いました。Replitの最適化関数は常に参入障壁を下げ続けることで、それがユーザーと顧客の成長方法です。

現在、基本的にあらゆる職歩の人々からユーザーを見ています。プロダクトマネージャーは私たちにとって非常に素晴らしいユースケースでありユーザーです。エンジニアと全く話すことなく、ビジネスに大きな影響を与えることができるプロダクトマネージャーの顧客がいます。A/Bテストや最適化などを実行できるのです。

力を与えているのです。プロダクトマネージャー、デザイナー、エンジニアなどの役割間の境界について本当に考えさせられます。実際に新しいプロダクトグループを作ったばかりで、通常はプロダクト責任者に多くのプロダクトマネージャーが報告していますが、実際にはこのグループにはデザイナー、エンジニア、PMがいて、彼らは皆、常にAIを使ってプロトタイピングを行い、場合によっては本番まで進めています。

これらの異なるチーム間の多くの非効率性、コミュニケーションの問題があるウォーターフォールモデルのようなものはありません。彼らは信じられないほど速く動くことができ、これがテック企業の働き方を変え始めると思います。

私の経験では、スタートアップで働いているときは、アイデアのリストとバックログは基本的に無限に長く、ボトルネックは常にエンジニアリング時間でした。今、自分のプロジェクトをやっているときは、ToDoリストやアイデアリストを書いて、そして作業に取り掛かると、アイデアが実現されます。突然、ボトルネックは私のアイデアを持つ能力になり、ToDoリストを見て空になっているのはとても奇妙な体験です。「次に何をすればいいんだろう？」という感じです。

企業で本当に大きなRepletの展開をしているチームから、創設者がReplitを使っていて、それがエンジニアたちをストレスにさせているという話を聞きました。「これを週末にやったんだ。君たちはなぜできないんだ？自分自身を証明してくれ」という感じです。

これらは以前技術的だった人々ですか、それとも非技術的な人々ですか？彼らは最初のバージョンを構築して、それを本番に展開しているのですか、それともエンジニアに渡して「これを構築してくれ」と言っているのですか？通常何を見ますか？

通常、エンジニアリングと協力することをアドバイスしていますが、それが常に起こるわけではありません。多くのPMやデザイナーがユーザーに直接行きたがるのは理解できます。彼らはベータユーザーやテストユーザーに行っているのを見ており、これは本当にうまく機能していると思いますが、場合によっては本番にそのまま入れてしまいます。

現在、これらすべての企業、特にエンジニアリングリーダーがこのことで不満を持っているとの議論をしています。これらのサービスのオンコールは誰がするのか？バグに対する責任者は誰か？それに対する責任者は誰か？多くの質問が出てきています。これらすべての質問に対する明白な答えは、エージェントが責任を持つということです。

今日の制限要因は何ですか？私が何かをコーディングして、本番にそのまま入れるとき、エンジニアたちは通常何に反対するのでしょうか？何が問題になっているのでしょうか？

セキュリティが大きな問題です。LLMは人間と同じように間違いやすいのです。彼らがひどく苦手なコンポーネントがあります。例えば認証などです。みんな古いソルトやハッシュの方法を使ったりします。

これが大きな問題点になっており、現在そこでたくさんの例を見ています。幸い、大きな災害はまだありませんが、来ると思います。しかし、APIキーを漏洩したり、ログインセキュリティ保護を回避するのを本当に簡単にしたりするソロ創設者たちがいました。

そして、そのことに責任を取ろうとせず、「それはユーザーの問題だ、ユーザーの過ちだ」と言っているツールがたくさんあります。私たちにとって、非開発者向けにマーケティングしているプラットフォームとして、実際に責任があると思います。

LLMが今日すべきでないと思うことのいくつかを取り除こうとしています。例えば認証について、Replitに行って「認証を追加して」と言うだけで、私たちがゼロから構築した認証コンポーネントを引っ張ってきます。キャプチャも付いており、セキュリティのあらゆる機能も付いています。そのすべてを心配する必要はありません。データベースと統合され、サイトにユーザー管理ポータルもあります。可能な限り、扱いにくいこれらのコンポーネントを構築しています。

支払いも同じだと思います。LLMに支払いをやらせたくないでしょう。そして、それらはそれほど違いはありませんよね。チェックアウトの種類などです。一回限りのチェックアウト、サブスクリプション、従量課金制があるかもしれませんが、支払いの無限のバージョンはありません。2つ、3つ、4つぐらいです。

これは今日の人間が独自の支払いバージョンや独自の認証を書かないのと同じ類推です。すでにこれらのコンポーネントを構築したプロバイダーを使います。同じことが起こっているようで、それが最良の方法だと思います。

100パーセントその通りです。そして、私たちが追加したもう一つのことは、Secripという素晴らしいセキュリティ会社との提携です。現在、Replitアプリをデプロイする際に、セキュリティスキャンを実行します。コードセキュリティスキャンを実行し、警告やエラーなどのレポートを提供し、エージェントがそれらを修正してくれます。

本番展開への課題と解決策

セキュリティが本番への完全展開の大きなボトルネックの一つですね。スケーラビリティ、N+1データベースクエリの検索、パフォーマンスのボトルネックなど、他にも来るものがあると想像できます。これが真にワンクリックでデプロイできるようになる前に克服する必要がある明確な阻害要因のセットを心に描いていますか？

最大のものは人間、つまり社会的なものになるでしょう。不信感があり、それは展開されなければなりません。それを置いておいて、企業はそのすべてに適応しなければなりません。スケーラビリティをスキャンする何らかの方法を持つこと、ファジングなどを行うこと、またはアプリを壊そうとする何らかの敵対的エージェントを持つことなどです。

大きなことの一つは、会社のエコシステムとの統合だと思います。私たちが追加しているものの一つは、デザインシステムを持ち込む機能です。これはクールです。私たちがこれらのコンポーネントを提供することに加えて、どの会社に行っても、多くのこれらのコンポーネントが構築されています。Replitがこれらの大企業に展開されるにつれ、どのように彼らの内部システムにフックできるでしょうか。

これにより、これらの異なるコーディングツールのスペクトラムについて考えさせられます。スペクトラムの一端には、開発者がこれを自分の努力を増幅する方法として使うCursorやWindsurfのようなパワーツールがあります。

完全に反対の端には、もしアプリを作りたいなら、今はアプリを作ることができるという、より消費者向けのものがあります。あなたたちは真ん中のあたりにいるようです。従来の開発者のようには見えない人々のために、企業が物事を成し遂げる手助けをしています。この世界がどのように展開されると見ていますか？n個の異なるツールがあるのか、それともスペクトラムの一つの場所に収束するのでしょうか？

AGIは明らかに収束ですが、それを置いておいて、その世界を計画するのは本当に難しいです。プロダクトエンジニアをどのように段階的により生産的にするかという戦いは、明白なものです。そこの市場は明白です。多くの企業がそれを追いかけています。Cursorのようなアプリケーション企業と、基盤となるモデル企業の両方がそこに向かおうとしています。

Claude Codeはcursorと競合しています。CursorはClaudeを使用しています。そこは少し血みどろの戦いだと思いますが、市場は明白で、本当に大きいです。そこでの統合がもっと進むと推測します。1つではないかもしれませんが、おそらく2つか3つが最良でしょう。

私たちがいる市場ははるかに大きいと思います。対象となる人間ははるかに多いのです。10億について話していますが、それ以上かもしれません。実際にどんな知識労働者でもソフトウェアで問題を解決できるべきです。

現在のReplitに対する私の考えは、私たちがそれを汎用問題解決ツールにしたいということです。個人的な生活の問題を解決したり、仕事の問題を解決したりできるでしょう。その市場はおそらくもう少し多様になると思いますし、企業はどこに位置するかを見つけ出すでしょう。

非エンジニアに焦点を当てた自律的プログラミングを解決しようとしています。セキュリティ、システム、そのようなことを心配したくありません。本当にアイデアを持ってReplitに来て、エージェントマネージャーになってほしいのです。可能な限り人間らしく、ワークフローに適合する方法でそれを行おうとしています。

エンジニアと非エンジニア、例えば経営陣やプロダクトマネージャーとの大きな違いの一つは、デスクに1日8時間座っていないことです。モバイルがその大きな部分です。本当に素晴らしいモバイルアプリがあります。

私たちはアンビエント構築のような方法を考えています。デスクトップでアプリを始めて、電話を持って離れ、退屈な会議にいる。エージェントから「これを終えました。他に何か欲しいですか？」という通知が来て、テキストメッセージが来る。そのようなものを構築しようとしています。

ユーザーインターフェースの進化と課題

それに関連して質問があります。ユーザーインターフェースについてです。CursorやWindsurfのようなものでは、非常に明白です。主要なUI要素はコードのようなものです。コードを見て、小さなチャットウィンドウがありますが、主にdiffについて、コードの変更についてです。

Replitのようなツールでは、主要なインターフェースはグラフィカルユーザーインターフェースです。ボタンやWYSIWYGのようなもので、構築しているものを見ることができます。

その通りです。そして、それはユーザーインターフェースを構築するのに素晴らしいですが、より複雑な論理フローを構築しようとするとき、コードを見る方法がないので少し難しいと感じました。裏で何が起こっているかを可視化できません。ほとんどブラックボックスのようなものです。

ここを早送りして、大企業でより複雑な内部ワークフローを構築しようとしている場合、プロダクトマネージャーや運用マネージャーは、そのワークフローと起こる論理的分岐をどのように可視化するのでしょうか？

コンピューティングの歴史を振り返ると、常にビジュアルプログラミングのビジョンがありましたが、それはあまりうまく機能しませんでした。最終的にはチューリング完全性についてだからです。これらのシステムは汎用コンピューティングデバイスではありません。

今度はコード生成に移ります。明らかにコード生成はチューリング完全です。しかし、主に自然言語を介してそれとインターフェースしています。自然言語は曖昧です。正しいことをしているかどうかを知るのは本当に難しいです。

これら2つのものの統合がおそらく来ると思います。自然言語でインターフェースしているが、コードをただ見つめるのではなく、コードの上にインターフェースや異なるビューがあるかもしれません。スモールトークのようなことができると想像できます。

スモールトークは最初のオブジェクト指向プログラミングシステムで、Alan Kayは実際にOOPであり、その後に来るものはそうではないと言うでしょう。興味深いことに、スモールトークでは実際にコードとやり取りする方法がファイル経由ではなく、オブジェクト、論理的オブジェクト経由です。

そこには何らかの先行技術があり、人々がそれを理解できるようにするコード上の何らかの抽象化がある世界に向かっていると思います。

それは本当に興味深いです。英語のように見えるが少しより構造化された疑似コードや、ビジュアルなドラッグアンドドロップなど、そこにはオープンなスペースがあると思います。

エンジニア、デザイナー、その他の人々のチームと製品を構築することを振り返ると、製品リードとして私がそれらのチームと持つやり取りは口頭でした。抽象化されたアイデアが書かれたものでした。一緒にホワイトボードで絵を描きました。システム図を作りました。アプリの結果を見て、テストして、「ああ、これは壊れている、それは遅すぎる」と指摘しました。

製品の作者がそのようなことをしているが、話しているチームが他の人間ではなく、これらのことをしているエージェントである、非常にマルチモーダルで非常に柔軟なインターフェースのようなものに到達すると感じます。

PM分野でコミュニケーションの周りにもう少しフォーマリズムを持とうとする試みはありましたか？

はい。そして、私の意見では良くありませんでした。主なものはPRD、プロダクト仕様ですよね？そして、私の意見では、大企業にいる場合、昇進のために持つものを持つためだけに作成するパフォーマンス的な作業成果物になることが多いです。しかし、実際にはそれほど有用ではありません。

私にとって最も有用なやり取りは、これらのホワイトボードでの会話です。ここで何をしたいのか？ああ、それについて考えなければならない。ああ、これを考慮しなかった。よし、この全体を再考しよう。そのような会話です。

AIもその中で役割を果たすことができます。スタートアップのGranolaは会議を録音できて、すべての会議が転写されてそこに行き、テーブルに置くことができるモバイルアプリを持つチームバージョンをリリースしました。

私は、企業が書面ではなく口頭でますます進化しているトレンドと戦うべきではないGranola至上主義を行くべきかもしれないと考えていました。人々はSlackで話し、会議にいて、プロンプトでエージェントとコミュニケーションしているからです。しかし、実際にその記録を作成し、バックグラウンドで検索可能で整理可能なAIツールのセットが欲しいでしょう。

口頭の会議で最初のAIがいつ現れるか疑問です。デザイナーと議論していて、AIが「このアイデアはどうですか？」と言って参加するような。

仕事の未来：より人間的で協調的なもの

そして、これがAIについての悲観的な見方や、AIが私たちの仕事をすべて奪うといったことが正しくないと思う理由です。仕事の未来はより人間的で、よりインタラクティブで、よりマルチモーダルで、私の意見ではより楽しいものになると思います。

Y Combinatorの次のバッチが現在応募を受け付けています。あなたの中にスタートアップがありますか？ycombinator.com/applyで応募してください。早すぎるということはありませんし、アプリを記入することであなたのアイデアがレベルアップします。では、動画に戻りましょう。

前回お話したときは、Replitエージェントを立ち上げて、物事が本当にクレイジーに成長していました。それが続いていると想像します。何かシェアできることはありますか？

もうすぐいくつかの数字をシェアするかもしれませんが、Replitエージェントの立ち上げ以来、月平均45％の複合成長をしています。これらは、ユーザーベースがほとんどない場合に達成しようとするバッチ中にY Combinator企業に伝えるメトリクスで、あなたはより大きな規模でこれを行っています。

しかし、会社とシステムにかなりの負担をかけており、まだ比較的小規模でした。頭に上って、間違ったことを最適化し始める可能性があると感じます。AIではARRを増やすことは非常に簡単ですが、ユーザーは満足していません。なぜなら、はるかに多く支出しているが結果を得ておらず、場合によってはそんなに速く成長すべきではないからです。なぜなら、ユーザーにより少ないお金でより良い体験を得てもらいたいからです。

実際にReplitではARRの目標はありません。より多くの製品目標、リテンション目標、他の手法があります。一部のAI企業の悪いパターンは、トップライン収益を非常に速く成長させるが、チャーンは100％に近づき、最終的にそれが追いつき、粗利益も恐ろしいものになることです。成長すればするほど、会社の財務状況が悪化するのです。

投資家はこの分野をどう見ているのでしょうか。多くの人と話したでしょうから、彼らは違いを見分けられますか？

投資家が分野を見始めるとき、すべてを3分間使って、3分間のすべてが同じに見えるので、彼らにとってはすべてぼやけています。私は一般化していますが。

これらの製品が議論している異なる焦点と分野でより分岐し始めると思います。来年にはもう少し明確になると思いますが、多くの投資家は非常に混乱しています。彼らと話すとき、彼らはこれらのシステムを理解せず、どこに向かっているかも理解していません。

基盤技術の詳細とエンジニアリングの課題

これらのツールの基盤となる技術について少し深く掘り下げるのに良いセグエです。CursorやWindsurfからは、ClaudeやGemini、またはOpenAIモデルを重ねて、その上に独自のレイヤー、Fast Applyなどを重ねているという発表を見ました。Replitではどのように機能しているか概要を教えていただけますか？

多くの場合、基盤フロンティアモデルの問題にパッチを当てているのです。Fast Applyが重要だった理由は、どのモデルもdiffでうまく機能していなかったからです。

Applyとは何か説明できますか？

LLMとしてファイルを編集しようとするとき、最良の方法はdiffを作成することです。しかし、これらのモデルは実際にdiffを作成するのがあまり得意ではありません。ソースコードの行数を数えるのも実際にはあまり得意ではありません。これらのことで混乱してしまいます。

しばらくの間、多くの企業がファイル全体を書き直していました。

非技術的なユーザー向けのdiffは、これら3行を削除してこれら他の3行を代わりに注入するようなものです。ほとんど検索と置換のようなものです。

その通りです。モデルに何らかのdiffを生成させる方法が必要でしたが、実際にはマージするのに十分ではありません。そして、実際にマージを行う別のモデルが必要です。

千行のファイルを書き直すのではなく、千行全体を出力するのではなく、できるだけ怠惰になるようモデルにプロンプトします。しかし、その場合、適用するのが本当に難しいのです。適用を行う別のモデルが必要です。

モデルを訓練するか、Gemini Flashやこれらの小さなモデルを使うことができます。場合によっては、より良い仕事をするためにモデルを訓練または微調整する必要があります。他の場合には、他の多くのモデルにパッチを当ててそれを行います。研究というよりもエンジニアリングです。

CursorやWindsurfなどの他のツールでは、基盤モデルをユーザーに公開していることに気づきました。ドロップダウンがあって、「この問題についてGeminiの考えを見てみよう」という感じです。あなたたちはそれをしていません。なぜですか？

私たちの研究努力の大きな部分は評価にあり、これはAIコーディングの過小評価されている部分だと思います。新しいモデルを評価し、評価を書き、評価を生成し、ユーザーが何を得ているか、何を感じているかを理解しようとするデータクランチングに多くの時間を費やしています。

これらのシステムがどのように機能しているかを理解しようとする多くのシステムを構築しました。新しいフロンティアモデルが登場した瞬間、ほぼ即座に評価しています。

例えば、Geminiは数ヶ月前に本当に素晴らしいモデルでした。ワンショットでは場合によってはClaudeよりも優れていましたが、エージェンティックな作業、ツール呼び出しなどはうまくありませんでした。しかし、ユーザーはハイプを見て、「Geminiをくれ」と言います。

どのぐらい前に通知がありますか？モデルをドロップして、スクランブルをかけているのですか、それとも数日や数週間前にテストする時間がありますか？

これらの企業と良いパートナーシップがあります。Googleと素晴らしいパートナーシップがあります。Anthropicとも素晴らしいパートナーシップがあり、OpenAIとさえも密接な関係があります。多くの企業が事前に教えてくれて、いくつかの早期チェックポイントをくれて、すべてを試します。

Anthropicの場合、私たちは常に初日に立ち上げています。なぜなら、私たちは構築することになるからです。多くの場合、彼らがどこに向かっているかを予測しています。3.5、3.7には何らかの方向性があり、4.0がどこに着地するかがわかります。システムの設計を始めますが、最終的に私たちのエンジニアリング努力の多くはまだインフラストラクチャです。

スナップショットベースのネットワークファイルシステムである分散ネットワークファイルシステムの構築に2年かかりました。それを行うための既製のものはありません。セキュリティの多くは本当に難しいです。Replitは、アカウントを作成するだけでクラウドで仮想マシンを取得できる世界でも数少ない場所の一つで、それを実行し、これから保護するのは本当に難しいです。暗号マイナーやあらゆる種類のものがあります。

ReplitはフードでNixOSも使用しています。NixOSは完全に宣言的で、トランザクショナルなオペレーティングシステムジェネレーターです。コンピュートがあるすべての異なる地域で、世界のすべてのパッケージをキャッシュするマルチテラバイトのハードドライブがあり、それがすべてのコンテナに接続されます。

トランザクション性の考えに戻り続けます。システムが完全に機能することを望み、エージェントで何かを実験して戻ったり、サンプリングをしたりするために安全であることを望みます。

多くの作業は、このインフラストラクチャのエンジニアリングです。これはここでモデルを訓練したほどセクシーではありませんが、リードを構築できる場所だと思います。

VCが護城河について話すとき、私が頭の中で翻訳するのは、達成できる可能性のある複合優位性は何かということです。本当に防御的な護城河ではありません。何らかのベクトルで先行しており、先行していることで継続して速く動くことができるということです。

その通りです。これは素晴らしい例のように聞こえます。真の護城河は、おそらく何十年、多くの何十年も会社に入るまで明白でないことが多いです。Netflixの護城河が何かはわからないでしょう。しかし、明らかに彼らは持っています。Disneyが彼らと競争しようとし、みんながNetflixを見下していましたが、結果的に彼らが構築したコンテンツ制作システムという護城河があることがわかりました。

子供たちへのアドバイス：ものづくりの重要性

Amjadさん、あなたは人々がコードを学びやすくするというミッションから始めました。その多くを達成しました。今はコードすることが何を意味するかの境界を押し広げています。私には幼い子供がいます。彼らが世界で生産的な創造者になることを望んでいます。彼らに何を伝えるべきでしょうか？コードを学ぶべきでしょうか？それは何を意味するのでしょうか？

プロのソフトウェア開発者の道に行きたいなら、コンピュータサイエンスの学位を取って基礎を学ぶのは理にかなっていると思います。しかし、この世界でクリエイターになりたい、ジェネラリストになりたいなら、もはや従来の方法でコードを学ぶ必要はないと思います。

ほとんど浸透によって習得できると思います。Replitに行って使い始めて、いつかコードを見たり、ログを見たりしなければならない問題に遭遇します。機知に富んで、Googleで調べたりすることで、習得し始めるでしょう。

ちなみに、これは私たちの世代がコードを学んだ方法ですよね。あなたが話しているとき、私は「それが私のやったことだ」と思いました。

そして、何らかの理由で年月が経つにつれて非常に産業的で正式になりました。私たちがウェブアプリを作る方法は、HTMLファイルでメモ帳を始めるだけでしたが、今はwebpackなどを学ばなければなりません。

仕事の未来は本当に明確ではありません。世界がどこに向かっているかについて何らかのアイデアを持つことができますし、私の子供たちには可能な限り幅広いベースの知識を持ってもらいたいです。可能な限りジェネラリストになってもらいたいです。可能な限り生成的になってもらいたいです。多くのアイデアを作り出すことができるようになってもらいたいです。ものづくりが簡単になると、ボトルネックは再びどれだけのアイデアを持てるかに戻るからです。

コードを学ぶことを最優先にはしません。ものづくりを学ぶことを優先します。コードでものを作ることを学ぶ。動画でものを作ることを学ぶ。AIでなんでもものを作ることを学ぶのです。