Cursor CEO: コーディングを超えて、超知能AIエージェント、そして今も重要な味覚について

シンギュラリティ・知能爆発・レイカーツワイル
この記事は約29分で読めます。

この動画は、AI支援プログラミングプラットフォームCursorを開発するAnyphere社のCEOマイケル・トゥルエル氏へのインタビューである。彼は従来のコーディングを「何かもっと良いもの」に置き換えるという同社のビジョンについて語り、プログラミングが将来的にどのように進化していくか、そして味覚やデザイン思考が依然として重要である理由について詳しく説明している。

Cursorのビジョン:コーディングの革命

私たちの最終目標は、コーディングを何かもっと良いものに置き換えることです。この10年は、あなたの構築能力が大幅に向上する時代になると思います。他の人よりも早く最前線を押し進め続けることができれば、本当に大きな利益を得ることができるでしょう。

会社を築くのは困難ですから、本当にワクワクすることに取り組む方が良いのです。そして私たちは、コーディングの未来に取り組むことに着手しました。

「未来の構築方法」の新しいエピソードへようこそ。今日は、Cursorという私たちが皆知り愛用しているAIコーディングプラットフォームを手がけるAnyphere社の共同創設者兼CEOのマイケル・トゥルエル氏をお迎えしています。同社は最近90億ドルの評価額を達成し、ローンチからわずか20か月で1億ドルのARRに到達した史上最も急成長したスタートアップの一つです。マイケル、参加していただきありがとうございます。

お招きいただきありがとうございます。ここにいられて嬉しいです。

あなたはCursorの目標は実際に新しいタイプのプログラミングを発明することで、欲しいものを説明するだけでそれが構築されるようになると言われていますね。そのことについて話してください。

新しいプログラミングパラダイムの創造

会社の目標は、コーディングをもっと優れた何かに置き換えることです。私と3人の共同創設者は長い間プログラマーをやってきました。何よりもそれが私たちの本質です。

コーディングに魅力を感じたのは、本当に素早く物事を構築できるからです。しかし、説明するのは簡単なことでも、コーディングでは数百万行の難解で形式的なプログラミング言語を編集する必要があります。画面に表示させるために、説明するのは簡単なことでも大量の労働が必要になります。

今後5年から10年の間に、より高水準で生産的な新しいソフトウェア構築方法を発明することが可能になると考えています。それは、ソフトウェアがどのように動作し、どのように見えるべきかを定義することに集約されるでしょう。

Cursorでの私たちの目標はそこに到達することです。そしてそこに到達するための道筋は、常にAIでコーディングする最良の方法であり続け、そのプロセスを進化させ、通常のプログラミングから見た目が大きく異なる何かへと発展させることです。

一部の人は、今日私たちが持っているものがまさにそれだと言うでしょう。欲しいものを説明すればそれが出てくるという。それについてどう思いますか?まだそこに到達していないとしたら、本当に行きたい場所への段階は何でしょうか?

現在の限界と将来への道筋

物事が本当に変わり始める最初の兆候が見え始めています。YCでは最前線にいると思います。より小さなコードベース、より少人数のグループがソフトウェアに取り組んでいる場合、そこで最も変化を感じることができるからです。

そこでは既に、人々がコードより高い抽象化レベルに立ち上がり、基本的にエージェントとAIにすべての変更を依頼している様子を見ています。

しかし、プロフェッショナルな世界では、まだ道のりがあると思います。コードを実際に見て理解することなく「ノリでコーディング」するという考え方は、実際にはうまく機能しません。数百万行のコードと、何年にもわたって何十人、何百人もの人々が取り組んでいる場合、多くのn次効果があります。現在のところ、コードについて考えることを避けることは本当にできません。

私たちの主要な焦点は、プロフェッショナルなプログラマー、生計を立てるためにソフトウェアを構築する人々を支援することです。そうした環境では、人々はますますAIを使ってコーディングしています。平均して、Cursor内でAIが生成するコード行の40%から50%を人々が使用しているのを見ています。

しかし、それでもAIから出てくるものをすべて読むプロセスです。製品として私たちが越えるべき重要な溝は、コードを見て読み書き理解するのを助ける生産性ツールから脱却し、アーティファクト自体が変わる場所に到達することでしょう。プロフェッショナルな開発者にとって、まだそこには道のりがあると思います。

スタートアップ vs 大規模開発の違い

頭の中では異なる段階として考えていますか?明らかにスタートアップはゼロ行のコードから始めるので非常に簡単です。「ノリでコーディング」が機能しなくなり、物事が現実的になる点を今追跡していますか?

「ノリでコーディング」スタイルは、コードが本当に長期間存在する場合には推奨していません。2人、3人、4人のスタートアップで、動き回って何をしているかを理解しようとしている時のソフトウェア開発を特徴づけることの一つは、多くの場合、コードは数週間しか存在しないということです。

現在私たちは、AIがあなたのヘルパーとして動作する段階にいます。人々がAIを使ってコーディングする主な方法は、AIにタスクを委任するか(「これをやって」「この質問に答えて」)、AIに肩越しに見てもらって時々キーボードを引き継いでもらうかです。これがタブ機能の形態です。

今後6か月から1年のゲームは、これら両方を桁違いに有用にすることです。コーディングは時々非常に予測可能で、誰かの肩越しに見ているだけで、次の10分、15分、20分の作業がわかることがあります。そのため、タブ機能は非常に遠くまで行くことができ、他の人間に委任するエージェント機能も非常に遠くまで行くことができます。

AIとプログラミングの未来

それらが成熟し始め、プロフェッショナル開発の25%から30%で、実際に物事を見ることなく完全にそれらに頼ることができるようになったら、実世界でそれを機能させる方法について考えるべき他のすべてのことが出てきるでしょう。

LLMを見る一つの方法は、人間のようなヘルパーとしてインターフェースすることです。もう一つの見方は、それらが一種の高度なコンパイラーまたはインタープリター技術だということです。

頭の中のアイデアから画面上の何かに行くのを助けるツールとして私たちが常に有用である場合、人々に最細部の制御を与えることは常に有用でしょう。それが私たちの目の前にある製品課題の一つです。常に何かを数ピクセル動かすことができ、ロジックについて非常に具体的な何かを編集することができるべきです。

そのために常に有用なUIの一つは、ソフトウェアのロジックを書き留めておくことです。ロジックのさまざまな部分を指差して実際に編集することができます。しかし、コードにそれほど注意を払う必要がない場所に到達した場合、ソフトウェアのロジックの書き留められたバージョンは、より高水準になる必要があるでしょう。

コンテキストウィンドウとスケーリングの課題

コンテキストウィンドウの問題ですか?約100万から200万トークンを超えると、AIでも使用可能な200万トークンの長さを得たのは過去100日間だけのような気がします。コードベースが特定のサイズに達すると、RAGを使用する必要があり、不完全なコンテキストしか持てず、人間のコーダーができることができなくなるのでしょうか?

エージェントが人間レベルになるまでにはいくつかのボトルネックがあると思います。一つはコンテキストウィンドウの側面で、確実に問題です。1000万行のコードがある場合、それは約1億トークンになります。それを実際に取り込むことができ、コスト効率的で、物理的に重みに取り込むことができるだけでなく、そのコンテキストウィンドウに効果的に注意を向けるモデルを持つことは困難です。

それは分野が取り組む必要があることだと思います。それはコードベースの問題だけでなく、組織のコンテキストを知り、過去に試されたこと、同僚が誰であるかを知る継続的学習の問題でもあります。モデルが実際に何かを継続的に学習するという問題は、この分野がまだ本当に良い解決策を持っていないことだと思います。

コンテキストウィンドウを無限にすればうまくいくと常に疑われてきましたが、これらのモデルを訓練している機関が利用できる本当に良い長コンテキストデータが不足していると思います。そのため、それは困難になるでしょう。しかし、継続的学習と長コンテキストは、超人的になるための明確なボトルネックです。

長期的なタスク実行と新しいUI

関連していますが、非常に長い時間軸でタスクを実行し、前進し続けることができることも重要です。インターネット上には、過去1年か2年でAIがタスクで前進し続けることができる最大時間の長さの進歩を示す素晴らしいチャートがあります。数秒から、最新のモデルでは1時間と主張する人もいます。

ソフトウェアエンジニアになるには、コードを実行してから出力で遊ぶ必要があります。そうしなければ、それは狂気の沙汰で超人的でしょう。そのため、コンピューター使用がコーディングの未来にとって重要になるでしょう。コードを実行し、Data Dogログを見て、人間が使用するそれらのツールとインターフェースできることです。

コーディングエージェントを超人的にするタスクにおいて、私たちが直面しなければならない多くの既知の悪魔と、直面しなければならない多くの未知の悪魔があります。

人間レベルでコーディングする人や、人間より速くて優れた人と話すことができるもの、つまりエンジニアリング部門全体のスキルを持つものがあったとしても、ソフトウェアの変更をテキストボックスで要求するUIは不正確だと思います。人間が画面に表示されるものを制御することを気にする場合、彼らがインターフェースする別の方法が必要でしょう。

そこでの一つの潜在的なUIは、より高水準のプログラミング言語の進化です。もう一つは、UIの直接操作かもしれません。画面上の物事を指差して「ああ、これを変更して」と言ったり、実際に自分で値をいじったりできることです。

美学と継続的学習の課題

モデルは美学に対して本当に明確なセンスを持っていないようで、そのため人間レベルのデザイナーが実際に見ることができる必要があるというアイデアがウィングで待機しているようです。

美学の側面で改善するのを見るのは興味深く、これらの継続的学習問題を私たちがどのようにハックしてきたかの興味深い具体例だと思います。私たちの理解では、これらのモデルに美学のようなことでより良くなるよう教える方法は、人間にそれを教える方法ではありません。基本的にデータを大量に収集し、それらにRLを行うことによってです。

それが、そのタスクで教えた方法であり、それは十分な人々が気にするタスクで、そのすべてのコストを支払うことができ、訓練してベースモデルに焼き込むことができます。それは継続的学習問題の一種のハックです。

ソフトウェアエンジニアリングで不可欠なもの

皆が構築に向かっているこの種の未来と、あなたが確実に最前線のリーダーであることを考えると、将来のソフトウェアエンジニアとして不可欠または本質的な部分は何だと思いますか?

不可欠なものの一つは味覚だと思います。実際に何を構築したいかを定義することです。人々は通常、ソフトウェアの視覚的側面について考える時にこれを考えますが、ソフトウェアの非視覚的側面にも味覚の要素があると思います。ロジックがどのように動作するかについてです。

現在、プログラミングの行為は、実際にどのように物事を動作させたいか、書いているロジックで実際に定義している製品は何かを理解することと、物理的なコンピューターにそれをマッピングする実装の詳細の高水準な味覚をまとめています。

しかし現在、プログラミングの多くは、あなたが行っている一種の人間コンパイルです。あなたは何が欲しいかを知っており、それを他の人間に話すことができますが、コンピューターに使用できる言語は、通常のプログラミングではforループとif文と変数とメソッドだけなので、本当にコンピューターに詳しく説明する必要があります。

その人間コンパイルステップの多くがなくなり、コンピューターがギャップを埋め、詳細を埋めることができるようになると思います。しかし、物事を実現させるのに役立つツールとして、実際に何が有用で、何を構築したいかの味覚は決してなくならないと思います。

ロジックデザイナーとしての未来

人々は「ロジックデザイナー」になる必要があると言われましたね。プログラミングがますます自動化され、ソフトウェア構築のより良い方法に置き換えられる世界に近づくにつれ、意図駆動プログラミングという観点で、それは何を意味するのでしょうか?

プログラミングが自動化され、ソフトウェア構築のより良い方法に置き換えられる世界に近づくにつれ、いくつかの影響があると思います。一つは、プロの開発者がはるかに生産的になることです。1000人のソフトウェアプロジェクトや100人のソフトウェアプロジェクト、実際のプロフェッショナルなソフトウェアプロジェクトがどれほど遅く動くかは本当にクレイジーです。

その多くは、既存のロジックの重みがあなたを圧倒することから来ています。新しいコードベースでは、ゼロから始めて、非常に迅速に物事を行うことができます。何かを変更する時、他の多くのものが壊れて修正する必要がないからです。

その影響の一つは、次の分散訓練フレームワークや次のデータベース、次の視覚的デザインツールが構築するのがずっと速くなることでしょう。研究所と話せば、彼らは主にエンジニアリング能力でボトルネックになっていると言います。そのすべてが大幅に改善されると思います。

二次効果として、はるかに多くのニッチなソフトウェアが存在するようになると思います。私の最初の仕事の一つは、実際にバイオテック企業で働くことでした。それは湿式実験室の科学者によって運営されており、病気を治すための薬物を開発していました。

私は雇われた最初のソフトウェアエンジニアで、彼らは大量の化学物質を生成し、それらを生物学的実験にかけ、どの化学物質をさらに追求するかを理解するための読み出しが必要でした。そのために大量の内部ソフトウェア開発が必要でした。

既存の棚上げツールがどれほど悪いかを見るのは驚くべきことで、ソフトウェアが彼らの中核能力ではない企業が、実際のソフトウェアエンジニアリングチームを雇って訓練し、内部製品開発をさせるという狂気の労力の多い作業を行わなければならないと考えるのはクレイジーでした。

そのような企業には、はるかに多くの選択肢が利用可能になるでしょう。デジタル空間の物理学は既に素晴らしいですが、それが将来に向けて多くのノッチ上がると思います。コンピューター上で起こりたいことは、実際に起こることができるようになるでしょう。

Cursorの初期の日々

話題を変えて、Cursorの初期の日々について聞きたいと思います。あなたは共同創設者のスワレ、アルビッド、アマンとMITで出会い、この会社は2022年に始まりました。何があなたたちを結びつけ、いつこれが本当に野心的なものを構築できるチームだと気づいたのですか?

私たちには多くの若い素朴さがあったと思います。おそらく当時は正当化されていませんでした。最初から、私たちはかなり野心的でした。Cursorは実際に4人のための野心的なアイデア演習から生まれました。

私たちは皆、かなり若い時にプログラミングを見つけ、最初のエンジニアリングプロジェクトの一部は実際にAIに関係していました。私たちの一人は、ロボット強化学習のデータ効率を改善する作業をしていました。ロボットに新しいタスクを非常に迅速に学習させることです。それが私たちの初期のAIプロジェクトの一つでした。

別の一人は、ニューラルネットワークを使用してGoogleの競合を構築する作業をしていました。ウェブ用の素晴らしい検索エンジンを構築することをスピードランしようとしていました。他の人たちはAIでの学術的な作業をしていました。

2021年に2つの瞬間があり、それが私たちをAIに焦点を当てた会社を構築することに本当に興奮させました。一つは、AIが本当に中心にある最初の有用なAI製品を使用することでした。GitHub Copilotは正直なところ、AIで本当に有用なものを作ることが可能だと内臓的に本当に感じた瞬間でした。

学術研究所でこれらのことに取り組むのではなく、実世界に出てくる時が来たのです。もう一つの興奮させたことは、OpenAIや他の場所から出てきた研究を見ることで、これらのモデルに入るデータと計算をスケールアップすれば、それらがより良くなる非常に予測可能な自然法則があることを示していました。

つまり、AIをより良くする方法のアイデアが尽きても、まだ数桁の実行余地があるということでした。最初から、知識作業の分野を選び、AIがより成熟するにつれてその知識作業がどうなるかに取り組みたかったのです。

機械工学からコーディングへのピボット

その知識作業分野の製品を構築する企業の形に非常に興味がありました。なぜなら、それによっていくつかのことができるからです。一つは、基盤技術がより成熟するにつれて、そのことを行うことの外観を進化させることができることです。二つ目は、当時から、言語モデルのサイズをGPT-Nまでスケールアップする以上のことが必要になることは明らかでした。

基盤機械学習で進歩を続ける一つの方法は、人々が好む提案、嫌いな提案、AIがまだ本当にアクセスできない人間の作業の困難な部分についての製品データを取得することです。知識作業が行われるガラス窓の後ろでそれを取得できます。

最初に私たちが設定したのは、実際にはよく知らない知識作業分野、つまり機械工学のための作業でした。コンピューター支援設計のためのコパイロットに取り組みました。3D自動補完モデルを訓練していました。Solid WorksやFusion 360のような何かで構築したい部品の3Dモデリングを行う人々を支援し、彼らが行う次のジオメトリの変更を予測しようとしていました。

それは興味深い問題で、学者が取り組んできたものであり、実際にDeepMindも少し取り組んできたものです。これらは必ずしも大規模言語モデルではありませんでした。完全に3Dで行うこともできますし、私たちがしばらく取り組んだ一つのスレッドは、それを言語問題に変えることです。

CADシステムで誰かが行っているステップを取り、それを一種のメソッド呼び出しに変えます。円を作っている場合、それをメソッド呼び出しにし、それは本当にプログラミングではありませんが、一種のメソッド呼び出しのリストのように見えます。

完全にテキストベースで行う場合、モデルに本当にトリッキーなことを要求しているのです。ユーザーが次に何をするかを予測するだけでなく、心の目でジオメトリをシミュレートする必要があります。なぜなら、これらのCADアプリケーションの基盤となるCADカーネルのようなソフトウェアはかなり複雑で、ユーザーが取った一連のアクションを見るだけでは、最終的にどのように見えるかを幻覚するのはかなり困難だからです。

しばらくそれに取り組み、大量のデータ作業がありました。オープンインターネット上に存在するCATデータを取得して、モデルをより良くする必要がある大量のデータスクレイピングでした。それから、それを脇に置きました。

ピボットの理由

それにはいくつかの理由がありました。一つは、私たちは機械工学よりもコーディングに本当に興奮していませんでした。私たちは皆コーダーでした。もう一つは、当時の科学が3Dにはまだ準備ができていなかったと思います。事前訓練されたモデルはそれほど良くありませんでした。データがあまりありませんでした。インターネット上のCADモデルのデータはコードよりも桁違いに少ないです。そのため、そのドメインに有用なモデルを作ることは困難でした。

CADやマシニスト、そのような人々と実際に座って話をしましたか?

たくさんのユーザーインタビューを行いました。それをもっとうまくやれたと思います。若い素朴さで運営していて、日々、週々、時間でタスクを数えて運営していました。その時間を振り返ると、実際に機械エンジニアを雇用している会社で3週間だけ働きに行く方が良かったと思います。身分を隠して、製図工として就職して、それから塩辛さのより良い感覚を得ることです。

それは非常に価値があったでしょう。数百のユーザーインタビューの一部をそれに置き換えることです。

モデル訓練の経験

それと並行して、これを行うために独自のモデルを訓練することにも取り組んでいました。それは非常に有用で、RLを使用し、大規模なクラスターを立ち上げて実際にこれらのモデルを訓練する方法を学ぶことでした。

その種の偽のスタートの期間で、当時は知りませんでしたが、そこで行ったことの一部は最終的に私たちにとって有用でした。多くの行動クローニングを行っていました。RLは少なかったですが、人間が何をしたかの良い例を見て、AIにそれらのことを行うよう訓練していました

しかし、数百億パラメーター規模の大規模言語モデルを訓練することは、当時多くの人がやっていることではありませんでした。その時に取り組んでいた製品とモデルの最終的な成果物はそれほど有用ではありませんでしたが、スケールでモデルを訓練することの素晴らしい予行演習でした。そして推論もスケールで行うことです。

当時も今も、100億以上のパラメータ規模の大規模言語モデル機械学習モデルを訓練している人はそれほど多くありませんでした。そのため、インフラストラクチャの状態は非常に非常に初期でした。Megatron LMやMicrosoft DeepSpeedをフォークして内部を引き裂き、それから訓練のためにそれを展開するようなことをしていました。

推論側でも、その期間中にスケールで実行したものがいくつかありました。現在Cursorでは1日に5億以上のモデル呼び出しを独自の推論で行っており、当時推論を行い訓練を行った経験の一部は、Cursor体験にとって間違いなく非常に有用でした。

コーディングへの転換

つまり、非常に勇敢でありながら先見の明もあることの一つは、実際にはCADについて十分に知らないので何か他のことをする必要があると言う瞬間を取ったことでした。CAD訓練、CADモデルから、スケーリング法則が持続していることを認識し、これが私たちが下って行くことができるドメインであることを認識することから、実際に何か他のことをする必要があると気づくまで、今日のものへの直線的な道のりでしたか?

直線的ではありませんでした。私たちがプログラマー自身であり、CopilotやCodexの初期論文のような製品にインスパイアされていたことを意味します。当時覚えているのは、投資家に私たちのクレイジーなCADアイデアに投資すべきだと正当化するために行ったことの一つは、最初のコーディングモデルであるCodexの訓練コストの概算計算を行ったことです。

私の記憶では、私たちの計算では約9万ドルか10万ドルしかかかりませんでした。それは当時投資家を本当に驚かせ、CADアイデアを追求するのに十分なお金を得るのに役立ちました。すぐに訓練を開始しなければならなかった場所です。

私たちは常にコーディングについて知っていました。常にそれに興奮していました。AIがコーディングをどのように変えるかについて常に興奮していました。その空間で作業することについて少し躊躇していたのは、既にそれを行っている人が非常に多くいたからです。Copilotは素晴らしいと思っていましたし、他にも数十の会社がその時点で取り組んでいました。

CADを脇に置くことにした時、それは科学が本当にうまくいかなかったこと、そのドメインに本当に興奮していなかったことの少し独立したアイデアでしたが、コーディングに戻って私たちを引きつけたのは、私たちの個人的な興味でした。

それを続ける自信を与えてくれたのは、一つは他の人が9か月かそこらの過程で行った進歩を見ることで、それがもう少し遅くなり得ると感じたことでした。また、5年後にすべてのコーディングがこれらのモデルを通じて流れ、アクティブプログラミングが完全に変わると私たちの信念に本当に一貫している場合に座って考えることでした。

そこに到達するには、製品レベルとモデルレベルの両方で、これらすべてのジャンプが必要でした。天井は本当に本当に高く、既存の空間のプレイヤーが完全に異なるタイプのコーディングを目指しているようには本当に見えませんでした。その野心があるようには見えませんでしたし、それを実行するように設定されているようにも見えませんでした。

最初の経験は、会社を構築することは困難であり、本当に興奮することに取り組む方が良いということを教えてくれました。そして、私たちはコーディングの未来に取り組むことに着手しました。

成長への賭けと製品決定

サム・アルトマンが1年ほど前にこの椅子に座って、モデルがより賢くなることに賭けないのは悪いことで、モデルがずっと賢くなることに常に賭けるべきだと話していたのが、さらに先見の明があるように聞こえます。12、18、24か月後、それはますます真実になっています。そしてそれより12か月前にその賭けをしていたように聞こえます。

私たちには当時「線に従う」という言葉がありました。常に線に従い、線がどこにあるかを計画したかったのです。スケーリング則のようなもので、これらのものはより良く、より良く、より良くなり続けるということです。

古典的なピーター・ティール主義は、他の誰も信じていないことで何を信じているかということです。あなたはこれを信じていて、パックがどこに向かうかに正しく到達することを可能にしたので正しかったのです。

それが役立ったことの一つだったと思います。現在では明らかにもっと流行になっていますが、当時2022年はこの狂気の重要な年でした。年の初めには誰もAIについて本当に話していませんでした。GPT-3は前年に起こっていました。Copilotは2021年にベータでした。そして2022年にGAかもしれません。

そしてそれは拾い上げられ始め、私たちはまだインストラクトGBTのすべてのローンチを覚えています。GPT-3を少し良くした命令の微調整でした。それから夏にDallyがありました。それがそのスペースに焦点を当てていなかった多くの人々を説得して少し注意を払わせた内臓的な瞬間だったことを覚えています。

しかし、それからPaLMと安定拡散があり、RHFを取得し始め、3.5を取得し、訓練コストの大幅な増加なしにこれらのモデルがずっと良くなるという興味深い発展がありました。

GPT-3から存在していて一部の人々を感動させなかったが、確実にChатGPTのブレイクアウトの瞬間ではなかったGPT-3からChatGPTまでは、訓練コストの1%の増加のようなものだったと噂で聞きました。

それは命令の微調整、RHF、他の詳細からも来ました。モデルがより少し賢くなるだけでなく、大幅に賢くなると知っていたので、特定の機能や製品の選択を行ったことを覚えていますか?

初期に行った製品決定の一つで、よりラディカルな未来に興奮していることから来た明白でないものは、拡張機能を構築せず、エディターを構築することでした。それは当時人々には明白ではありませんでした。

それは、すべてのプログラミングがこれらのモデルを通じて流れ、将来非常に異なって見える、制御UIが必要になると考える場所から来ました。また、私たちが知っていた興味深い逸話からも来ました。GitHub Copilotを構築する内部の内幕について少し知っていました

私の理解から、最初のバージョンの全GitHub Copilotストーリーは、直接の知識を持っていないので、これらの詳細の一部は間違っているかもしれませんが、非常に興味深いです。それはソリューションから非常に問題の検索場所から始まりました。GPT-3を取ってコーダーにとって有用にすることに興味があったのです。

私の理解では、当時のGitHubのCEOから来ました。マット・フリードマンでしたか?それは、それをやる必要があると彼が言ったマットから来たと理解しています。彼は一種のタイガーチームを送り出して、さまざまな製品アイデアを実験して何年もの間砂漠をさまよったと思います。

もちろん、これらはAIの未来に本当に興奮している人々でした。彼らはすぐにPRを自動化できるかと考えましたが、その時より少し前でした。しばらくそれに取り組み、それが不可能だと決定し、他のこれらすべての奇抜な製品アイデアを試し、単純な自動補完のことにヒットするまででした。

自動補完が機能するようになった後でも、エディターレベルで変更を行う必要がありました。拡張機能として完全に行うことはできませんでした。そのゴーストテキストを表示するためだけでも、メインラインのVS Codeに行って変更を行い、異なるエディターAPIを公開する必要がありました。

私の理解では、それは組織的に行うのがかなり困難でした。ゴーストテキスト自動補完のような単純なもののためにエディターを変更する必要があるとすると、私たちはそれをたくさん行う必要があることを知っていました

それは明白ではありませんでしたし、私たちは実際にそれに対してたくさんの批判を受けました。私たちは最初に独自のエディターをゼロから構築することから始めました。明らかに多くのオープンソース技術を使用していましたが、VS Codeに基づいていませんでした。ブラウザーがChromiumに基づいているような種類ではありませんでした。

それはブラウザーのすべての内部レンダリングをゼロから構築するのに少し似ていました。私たちはそれでローンチし、それからVS Codeをベースにすることに切り替えましたが、エディターのことは明白ではありませんでした。

成功の認識

Cursorが出て、正しいことがわかったいくつかの決定を行った時、それが機能することをいつ知りましたか?

少し時間がかかりました。覚えているように、機械工学の側面に取り組んでいたCursorの前身に取り組んでいた最初の荒野の年が約1年ありました。それから最初のバージョンを一般に公開する前に、Cursorの初期開発期間がかなり小さくありました。

コード行から最初のパブリックベータリリースまで3か月だったと思いますが、それから非常に小規模で公に反復するこの1年間がありました。私たちは瓶の中に稲妻を持っていませんでした。成長していましたが、数字は小さかったです。

その時点で製品をダイヤルインするのに約1年かかりました。それから、すべての詳細を正しく得て、チームを構築することだけでなく、製品側だけでなく、Cursorの下でCursorに電力を供給するカスタムモデルの最初のバージョンを取得することを開始する最初の期間でした。

物事がクリックし始めたのはその後でした。それから成長が拾い始め、それ以来私たちは一種の尻尾で虎を持っている状況です。成功するためには、将来実行し続ける必要がある多くのことがあります。

私たちと並列空間の他の多くの会社が持っている課題の一つは、会社を構築する必要がある速度だと思います。本当に速いと思います。年間50%以上成長させてはいけないという経験則、鉄の法則を破る必要があります。

成功指標と製品開発

真北の指標や、これが機能しているかどうかを理解するためにあなたと共同創設者が監視していたものはありましたか?それは週次の継続率や開始率でしたか?それが特定の週に取り組んでいることにどのように影響しましたか?

私たちは通常のもの、継続率のようなすべてを見ました。私たちにとって、見ていた主要な活動指標、主要なトップライン指標は、収益を見て、有料パワーユーザーを7日間のうち4日や5日にAIを使用しているかで測定しました。それが私たちが上げようとしていた数字でした。

なぜ有料だったのですか?私たちはプロフェッショナルにサービスするツールだと思いますし、ツールを提供するのに実際のコストがかかるとも思います。そのため、その有料層に卒業し、そこが物事が持続可能な場所であることを気にします。

有料パワーユーザー、それが毎日仕事に使用しているかどうか、それが私たちが上げようとしていたことで、DAUやMAUのようなものではありませんでした。

では、その指標から逆算しましたか?成長したいセグメントの人々を知っていて、それから彼らが何を望んでいるか、または人々がそれになることを妨げるものは何かということでしたか?

自分のために構築することは多くの空間では機能しませんが、私たちにとっては機能しました。実際に明確化されたと思います。AI製品の構築に関わるサイレンソングの一つは、デモのために最適化することです。

AIでは、いくつかの例を取って、革命的な製品を持っているように見えるビデオをまとめることが簡単だからです。そして、その素晴らしく見えるデモを結果として得ることができるバージョンと、有用なAI製品の間には長い線があると思います

それは、速度側、信頼性側、知能側、製品体験側をダイヤルインすることを意味します。私たちにとって、実際に行動した主なことは、エディター私たちの製品開発プロセスを再読み込みすることでした。

初期には、非常に実験的でした。Appleのように理解していることに非常に焦点を当てていました。ドッグフーディングと使用可能なデモに非常に焦点を当てており、エディター内で内部的にすぐに使用を開始できるものです。それから、これらの指標を見て、週に週に月に月に正しい道にいることを確認します。

急成長と採用戦略

以前に言ったように、時には雇用に関するこれらの鉄の法則を破る必要がある時があります。それを破ることをいつ決めましたか?ある収益目標に達するまで共同創設者と数人だけでしたか?ガスペダルについてどう思いましたか?それを軽く踏んで、数字をクリアしたら一気に踏み込みましたか?

長い間共同創設者だけで、それから物事が本当にダイヤルインされて離陸するポイントまで共同創設者と数人でした。最初の雇用は誰でしたか?エンジニアを増やすと思いますが。

最初の雇用に苦悩し、実際に年の単位で速く行きたい場合、6か月の単位でゆっくり行くことが非常に役立つと思います。会社に来る最初の10人を本当に釘付けにすれば、彼らは将来あなたを加速させるでしょう。n番目の人があなたと働くことを考えて来て、チームと付き合う時、彼らは才能の密度にショックを受け、そこで働くことに本当に興奮するでしょう。

将来速く行くのに役立つもう一つの理由は、誰かが来て彼らが素晴らしいフィットではない場合、これらの人々がそれに対する免疫システムとして機能するからです。彼らはバーを本当に高く保つキーパーになるでしょう。

最初は非常に非常に非常にゆっくりと雇用しました。創設チームが非常に大きく、すべての共同創設者が技術的だったので、それを行うことができました。しかし、私たちが得た人々は素晴らしく、今日の会社にとって本当に中核的です。

基盤モデル研究所と通常のソフトウェア会社の間の何かである必要があるこの会社で、分野を越えて出血する人々で、モデルと製品は一つの屋根の下で一緒に働く必要があります。製品志向で商業的な考えを持っているが、実際にスケールでモデルを訓練した素晴らしい人々がいました。

最初の10人段階では、ゼネラリストのポリマスは本当に本当に素晴らしいです。そして、物事を迅速に構築し、本番コードを迅速に出荷することです。

AI時代の採用

最近では、AIツールが非常に優れているため、優秀なエンジニアをどのように評価するかを理解するのが時々困難になっています。時間の経過とともに、文字通りあなた自身の製品がますます一般的になるにつれて、それは変わりましたか?AIツールを使うのが本当に得意な人を選ぶのか、それとも古典的なものに固執して、誰でもAIツールの使い方を学ぶことができるのでしょうか?

面接では、実際にオートコンプリート以外でAIを使用することを許可せずに人々を面接しています。最初の技術スクリーンプログラミングでAIなしでのプログラミングは、スキルと知能と、チームにいてほしいもののための本当に素晴らしい時間制限テストです。

しかし、もう一つの理由は、AIツールの経験がない素晴らしいプログラマーをたくさん雇ったからです。これらのツールは非常に有用なので、彼らを不公平に不利にしたくありません。そのような人々を雇って、仕事でそれらを使うことを教える方がはるかに良いです。また、ツールを初めて使用する初心者の心から製品洞察をマイニングすることもできます。

価値の維持と将来の差別化

Cursorは現在90億ドルの価値があります。チームがスケールするにつれて、ハッカーエネルギーをどのように生き続けるか、まだコードを書いていますか?

はい。Cursorが今日のCursorとは大きく異なって見える必要があるため、それについて多く考えます。適切な人々を雇うことでそれを行うことができると思います。

私たちの雇用プロセスの最後のステップは、来て私たちと一緒にプロジェクトに取り組む2日間のオンサイトです。これは最初の技術スクリーンセットの後で、オフィスにいて、チームの一員のようなもので、私たちと一緒に食事に来て、何かに取り組み、最後にデモして、質問をします。

それはエネルギーと興奮と問題空間への情熱を得ます。通常、それをやることをおそらく本当に喜んでやらないでしょう。もしかしたら単なる仕事として見ていて、同時に多くの技術会社に応募している場合です。

雇用プロセスを通じて情熱的な人々を得ることが、それを行う大きな方法だと思います。多くの人々の間で多くの調整を必要とする大きなプロジェクトがあり、そこではトップダウンの調整が必要です。私たちは常にかなりの程度のボトムアップ実験を行う場所でありたいと思います。

そのため、人々が脇でそれを行う時間を取ることと、エンジニアのチームを明示的に取って、会社の残りから区切って、彼らが好きなことを実験するカルテの起動を与えることの両方を本当に奨励しようとします。

持続可能な競争優位性

すべてのスタートアップ、おそらくすべてのビジネスが今直面しようとしている世界で最も印象的で信じられないモデルの顔で、実際に耐久性があり使用可能な堀は何か、どのように考えますか?

私たちがいる市場と他の人がいる市場は、実際には企業ソフトウェア市場ではない過去に見た市場に似ていると思います。多くの企業ソフトウェア市場は、製品で提供できる良いコア価値にある種の低い天井があり、多くのロックインがあることで特徴づけられます。

私たちがいる市場は、90年代末の検索をミラーリングしているようなもので、製品の天井は本当に高いです。検索は長い長い期間にわたって多くの改善ができました。私たちにとって最終目標は、コーディングを何かもっと良いものに置き換え、コーディングを自動化することです。それには長い長い長い道のりがあると思います。

検索を特徴づけ、私たちの市場も特徴づけると思うことの一つは、配布が製品をより良くするのに本当に役立つということです。たくさんの人があなたのものを使用している場合、規模でのビジネスを持っている場合、製品がどこで崩れているか、どこでうまくいっているかの感覚を得ることができます。

検索では、人々が何をクリックしているか、何から跳ね返っているか、良い検索結果は何か、悪い検索結果は何かを見ることで、それがR&Dに供給され、より良い検索エンジンを作るのに役立ちます。私たちにとって、人々がどこで物事を受け入れているか、どこで拒否しているかを見ることです。

彼らが物事を受け入れて後で修正する場所では、何が起こっているのか、私たちはどのようにより良くなり得たのか。それが将来製品をより良くし、基盤モデルをより良くする本当に本当に重要なドライバーになると思います。

インスピレーションを得るもう一つの市場は、2000年代初頭の消費者電子機器です。そこでのことは、iPodの瞬間を正しく得ること、それからiPhoneの瞬間を正しく得ることでした。ChatGPTの瞬間は、私たちの時代のiPodやiPhoneの瞬間のようなものだと思います。

他の人よりも速く最前線を押し進め続けることができれば、あなたに起こる本当に大きな利益を得ることができます。私たちの空間にはそれらのうちいくつかが存在すると思います。それを行うのは困難ですが、私たちはそれらに向かって最速で競争することに本当に焦点を当てています

知能の時代への展望

2025年です。私たちは実際にこの知能の時代の開幕段階にいるような気がします。何という革命でしょう。今個人的に最も興奮していることは何ですか?

これは、あなたの構築能力が大幅に拡大される10年になると思います。既にそれを生業としている人々だけでなく、はるかに多くの人々にとってアクセス可能になると思います。

生きるのに何という時代でしょう。今日参加していただきありがとうございます。

ありがとうございます。お招きいただきありがとうございます。

コメント

タイトルとURLをコピーしました