スライドのCursorを年間売上高5000万ドルまでスケールさせた話 ft Gamma創設者ジョン・ノロンハ

この動画は、AIを活用したプレゼンテーション作成ツール「Gamma」の創設者ジョン・ノロンハとのインタビューである。Gammaは「スライドのCursor」と呼ばれ、年間売上高5000万ドル、5000万人以上のユーザーを抱える成功例として紹介されている。2020年の創業時はコロナ禍でのリモートワークの課題から始まり、当初はAIではなく従来のアプローチで開発を進めていたが、2022年頃の画像生成AIの台頭をきっかけにAI機能を本格導入し、ブレイクスルーを果たした。同社は複数のAIモデルを使い分け、大規模なABテストによってプロンプトエンジニアリングを最適化している点が特徴的で、特にClaude、Gemini、GPTを使い分けながら、コスト効率を重視した運営を行っている。

Scaling the 'Cursor for Slides' to M ARR ft Gamma founder Jon Noronha

Before ChatGPT made AI mainstream, John Noronha was building Gamma with a simple insight: everyone hates making slides b...

Gammaの誕生背景と初期の苦悩
Gammaの誕生：パンデミックが生んだ新しいビジョン
成功への長い道のり：AIが救世主となるまで
画像生成AIとの出会いが転機に
コールドスタート問題の解決
プロダクトの裏側：複雑な技術的挑戦
ユーザー行動データからの洞察
プロンプトエンジニアリング vs ファインチューニング
競合との闘い：800ポンドのゴリラたち
競合を勝ち抜いた理由
アプリケーション層の創業者へのアドバイス
Gammaの未来と新機能

Gammaの誕生背景と初期の苦悩

僕らはみんな新しいプロジェクト始める時に、この真っ白なページに「プレゼンテーションのタイトルを入力してください」って出てきて、もう「うわぁ、どこから始めたらええねん？」ってなるやん。スライド全部の構成考えなあかんし、ストーリーも考えなあかん。どんなフックにするか、キーポイントはなんや、どんな見た目にするか、フォントはどうする、色は何にする、どんな画像が必要や、とかもう考えることだらけでぐるぐるしてまうねん。

ほんまそうやな。

それで僕らがAIでこの白紙問題を解決したら、なんと他のみんなの白紙問題も解決してしもたんや。急に曖昧なアイデアから完全に練られた下書きまで一気に行けるようになって、突然みんなの仕事が一から作ることやなくて編集することになったんや。

今日はGammaの創設者ジョン・ノロンハさんに来てもらった。Gammaは「スライドのCursor」や。

GammaはAIアプリケーション層での成功の典型例やな。画像生成モデルが最初の製品ブレイクスルーやったんやけど、このAIの追い風でGammaは年間売上高5000万ドル以上、5000万人以上のユーザー、そしてキャッシュフローも黒字になった。ジョンは開発者向けに実用的な教訓をシェアしてくれる。マルチモデルのオーケストレーション、大規模なABテスト、ファインチューニング対プロンプトエンジニアリング、コスト効率なんかについてな。

それからGammaがコールドスタート問題をどう解決してるかとか、より自律的な編集体験に向けた今後のロードマップについても話してくれる。それでは番組をお楽しみください。

ジョン、今日はTraining Dataに来てくれてありがとうな。

こちらこそ、呼んでくれてありがとう。

まずはGammaって何なん？なんで会社を始めたん？

Gammaの誕生：パンデミックが生んだ新しいビジョン

僕らは2020年に会社を始めたんやけど、元々のビジョンは今でも変わってない。プレゼンテーションを再発明したかったんや。

共同創設者のグラントが2020年に僕のところにアイデアを持ってきた時の話なんやけど、彼はずっと公園のベンチに座って電話会議に参加してたんや。奥さんが家で唯一机のあるスペースを使ってたからな。コロナの真っ最中で、みんな家に閉じ込められてた時やった。彼はZoomでの電話会議に全部参加して、小さなスマホの画面でみんながやってるPowerPointを見ようと必死やったんや。彼がこの話を持ち出した瞬間、僕も「あ、俺もや」って思った。俺もずっとZoom会議に座って一日中Google Slidesのデッキを見てるか、Google Slidesのデッキを作ってるかのどっちかや。どっちも全然楽しくない。

彼がそれを口にした瞬間、「うわ、これはめっちゃ面白い機会やな、このものを再発明するって」って思った。一方で、スライドってビジネスの言語やねん。僕らが仕事で使うコミュニケーション手段や、特に重要なアイデアについては。君にピッチする時も絶対スライドデッキやろ？

それなのに、ほぼどんな業界の人に「スライド作るのは好き？これが君の望むコミュニケーション方法？」って聞いたら、たいてい嫌な顔されるねん。「そんなんやりたくない」「スライドのせいで自分がダサく見える」「時間の90%を体裁整えることに使って、内容には10%しか使えない」「みんな僕が言ってることやなくて見た目で判断してくる」とかな。

それでGammaのビジョンはこのほぼ普遍的な問題から生まれた。みんなビジュアルコミュニケーションをする必要があって、格好良く見せたいんやけど、今のツールでは全然足りない。それで僕らはそれを再発明したかった。ただ単にPowerPoint作るための新しいエディターを作るんやなくて、フォーマット自体を根本から考え直すことでな。

それめっちゃ面白いな。ちなみに僕はスライド作るのが実は好きな恥ずかしい人間の一人なんや。だから今気づいたけど、僕は変わり者やったんやな。

そうや、君は1%の人やな。おめでとう。

成功への長い道のり：AIが救世主となるまで

今のGammaはAIアプリケーション層でのすごい成功事例やな。年間売上高5000万ドル以上、キャッシュフロー黒字、30人のチーム規模って発表してたよな。おめでとう。でも最初からこんな感じやった？

絶対そんなことない。ここまで来るのは長い道のりやった。一夜にして成功したもんなんてないで。

さっき言った通り、2020年に会社を始めた時はまだこのAIブームが起こる前やった。

会社始める時、AIのことが起こるって分かってた？

全然や。実は最初のGPT-3を試したのを覚えてるんやけど、それも2020年に出たんや。僕は最初にアクセスできた人の一人やったと思う。

それを試して、スライドが作れるかどうか見たかったんや。僕らはもう既にそれに取り組んでたからな。文書を渡したら要点をまとめられるか？逆に要点から段落のテキストにできるか？って試したんや。でもその時は答えはノーやった。まだそこまでじゃなかった。

それで「わあ、これは面白いな」って思ったけど、結局却下してしまった。それから数年間、僕らは全然違う道を歩んだ。

働き方の未来っていうテーゼにめっちゃ集中してたんや。リモート非同期ワークについて考えて、もっとインタラクティブで、ウェブページみたいで、レスポンシブなスライドの代替案を作ろうとしてた。結果的に中程度のトラクション、ある程度のプロダクトマーケットフィットは得られたけど、VCスケールのビジネスになるほどではなかった。指数関数的成長で本当にテイクオフするほどではなかったんや。

会社始めて2年くらいの時点でかなり厳しい状況になった。中途半端なプロダクトマーケットフィットで、ランウェイもどんどん減って、たぶん持たなかっただろう。特に周りの経済が狂ってた時期やったからな。インフレが上がって、金利が上がって、銀行がクラッシュして、僕らのメインバンクのシリコンバレー銀行も含めてな。

だからかなり厳しい時期があったんや。正直言うと、僕らを救ったのは生成AIがちょうどいいタイミングで良くなったことやった。

画像生成AIとの出会いが転機に

僕らは既に会社として存続できるかどうかの実存的な不安に直面してたんやけど、2年間かけてこのAI関連のものを再チェックし始めた。僕にとって本当に目を引いたのは実は言語モデルじゃなくて画像モデルやった。

Stable Diffusionがその夏に出て、Twitterでみんながそれで作った馬鹿げた小さなものを投稿してるのを見てたんや。まだ真面目な仕事には使えなかったけど、AIができることを見る魔法的でバイラルな要素があった。Dalleも同時に盛り上がってたと思う。それで気づいたんや、「これがプレゼンテーションを本当に変えられるものやな」って。

だってプレゼンテーションでアイデアを表現する時、僕らは多くのビジュアルデザインをやってるし、空間を埋めるためにしょうもない装飾をよくやってるやん。たぶんPowerPointの画期的イノベーションは30年前のクリップアートやったと思うんやけど、でも誰も「次のクリップアートは何か」を考え出してない。Stable DiffusionとDalleを見て、「これは今まで見た中で断然最も説得力のあるものや」って思った。

それはめっちゃ面白い洞察やな。だからビジネスにとってのwhy nowを作ったのは言語モデル側やなくて画像モデル側やったんやな。

その通りや。めっちゃ魅力的で魔法的やねん。

でも皮肉なことに、画像モデルが盛り上がったおかげで、僕らはテキストモデルを見直して「このGPT-3って、しばらく前に聞いたやつはどうなってるんや？」って言うようになった。試してみたら、2年前に試した同じ初期プロンプトを使ったら、突然うまくいったんや。

それもかなりよくうまくいった。みんなはChatGPTも一夜にして成功したって見てるけど、実はOpenAIはずっとその間もモデルを改善してたんや。特に彼らが取り組んでたのは指示チューニングやった。人間が「これを書いて」とか「これをフォーマットして」みたいにプロンプトを与えた通りに聞いてくれるようにすることや。

ChatGPTのテイクオフ全体を支えたとても単純なイノベーションやと思う。それで突然気づいた。プレゼンテーションを作るツールだけやなくて、実際にプレゼンテーションを作ってくれる全ての材料が揃ったんやって。

コールドスタート問題の解決

それはめっちゃクールやな。君らが言ってたAI前のコールドスタート問題について一言いえる？AIがその問題をどう変えてるか教えて。

面白いことに、そうや、僕らはコールドスタート問題があった。中途半端なトラクションでベータ版にプロダクトをローンチしたけど、テイクオフしなかった理由は最初のアクティベーション率やった。

100人がサインアップしたら95人くらいが最初の数分で離脱してしまう。彼らは新しい革新的なツールに放り込まれるんやけど、実際にはただの白紙ページやった。僕らは「見て、めっちゃクールな機能がいっぱいあるで」って言うんやけど、彼らは「うん、でも何が作れるん？何ができるん？」って言う。白紙を乗り越えられる少数の根性のある人以外は、みんなその過程で離脱していった。

だから僕らが早い段階でAIに注目したのは、AIが僕らの白紙問題を解決してくれると思ったからや。ユーザーにとって魔法的なものを見せることで活用できるようになると思った。僕らが実際にローンチするまで理解できなかったのは、解決されたのは僕らの白紙問題やなくて、ユーザーの白紙問題やったということや。

プレゼンテーションがなぜこんなに威圧的でイライラするかを考えてみたら、僕らはみんな新しいプロジェクトを「プレゼンテーションのタイトルを入力してください」っていう白紙ページから始めるからや。「うわぁ、どこから始めたらええねん？スライド全部をアウトラインせなあかん。ストーリーを考えなあかん。フックはなんや？キーポイントは？どんな見た目にする？どんなフォント使う？何色にする？どんな画像が必要？」って、こういうことを全部考えることでグルグル回ってしまうねん。

ほんまそうやな。

それで僕らの白紙問題を解決するAIを実際に作ったら、みんなの白紙問題も解決してしまったんやということが分かった。突然、曖昧なアイデアから完全に練られた下書きまで一気に行けるようになった。突然、彼らの仕事は一から始めることやなくて編集することになった。

プロダクトの裏側：複雑な技術的挑戦

うん。僕もそれは気に入ってる。実際にGammaをよく使ってるねん。AIについてプレゼンテーションをよく頼まれるんやけど、Gammaに文書を渡して「これをスライドデッキにして」って言えるのはめっちゃ新鮮や。白紙ページの前に座って何を話すか考える必要がないからな。

試してくれてありがとう。いつもありがたく思ってる。うん、それが魔法でもあるねん。僕らも社内で毎日使ってる。ドッグフーディングできる製品を持ってることが成功の一部やと思う。毎日使える製品やからな。

完全にそうやな。基盤モデルと君らのユーザーの間でやってる大変な作業について教えて。これはアプリケーション層にどれだけ価値があるかっていう議論全体にも関わってくるねん。

ほんまにええ質問やな。僕らがここ数年の作業のほとんどを費やしてきたところやと思う。いくつか違うカテゴリーがあると思う。

まず一つ目は実際にメディア自体や。さっき言ったように、僕らが始めた時はただのプレゼンテーションクローン、PowerPointクローンじゃなくて、僕ら独自のユニークなフォーマットにしたかったんや。

それで僕らのユーザーが「NotionとCanvaが赤ちゃんを作ったら」って表現するようなものを作り上げた。どういう意味かって言うと、Notion部分はブロックベースで文章ベースやということや。つまり実際にはGoogle Slidesでやるようにボックスをドラッグして動かすんやなくて、実際にただタイピングするだけなんや。僕らはタイピングしたものを何でも生き生きとビジュアルに感じられるようにしようとしてる。

でもCanva側は、僕らにはビジュアルな幅がある。図表やチャート、ビジュアル、クレイジーなテーマ設定やテンプレートがあって、全部がちょっと魔法的に感じられるようになってる。でも重要なのは、僕らがその部分を君のためにやるってことや。実際に何が正しく見えるかを知る必要がない。ただタイピングするだけで、うまく作られたものが手に入る。

実際に僕らが会社としてやってることの大きな部分は、プロンプトやファインチューニングとは何の関係もない。ただ実際にそのコアな構成要素をチューニングすることや。どうやったら最高の図表、最高のレイアウト、最高のビジュアルテーマが作れるか？そしてそれらがAIが解き放たれる僕らの武器になるんや。AIが作業する構成要素になる。

それにはなにが必要なん？最高のビジュアルテーマや最高の図表を作れるようにするものは何？

一つはテイストや。これはたぶん、同じことをChatGPTに打ち込んだらどうなるかを考える人たちとの大きな違いやと思う。僕らには実際にかなり大きなデザイナーチームがある。実際、しばらくの間、僕らの会社は3分の1がデザイナーやった。

12人中4人がデザイナーって、シリコンバレー、特に初期段階では非常に珍しいと思う。でも僕らは素晴らしいアウトプットがどんな風に見えるかにめっちゃこだわってる。僕らの全体的な哲学は、君がデザインしなくていいように僕らが素晴らしいデザインをするってことや。

でも同時にかなりデータドリブンでもある。ユーザーが僕らの製品で何をやろうとしてるか、どこで迷うかをよく見てるし、世の中のプレゼンテーションが何を持ってるかの分析もたくさんやってる。

ちなみにAIはこれにめっちゃ役に立つねん。例えば何千もの外部スライドデッキを回して、どんな一般的なレイアウトやデザインやものがあるかを教えてくれるからな。

ユーザー行動データからの洞察

プレゼンテーションを作るプロセスを考えてみたら、実際には途中でやってくる一連のハードルがある。ストーリーテリングと構造のフェーズがあって「どうやってこれを言いたいか？」みたいなやつや。それからフォーマットとデザインのフェーズがある。僕らは確実に両方を改善しようとしてるけど、特にフォーマットとデザインのフェーズでは、AIにとってはめっちゃ簡単やけど人間にとってはめっちゃ面倒な一般的なトリックがある。

一つの簡単なトリックは、一つのことだけを試すんやなくて、10個の違うデザインを試して一番いいのを選ぶことや。3秒くらいで全部できるAIにとっては簡単に言えることやけど、人間にとってはめちゃくちゃ時間がかかる。

もう一つの簡単なトリックは画像についてで、プレゼンテーションの全ての画像を同じカラーパレットにすることや。一から画像を生成できるAIにとっては簡単に言えることやけど、Googleの画像検索や自分のライブラリから引っ張ってきて、全てを完璧にチューニングする人間にとっては難しい。

だから僕らは人間には実際にできないようなたくさんのトリックを積み重ねようとしてるねん。

10個の違うオプションを生成する時、どれが一番いいかはどうやって判断するん？

めっちゃいい質問や。僕のバックグラウンドは、Gammaの前にOptimizelyで製品の仕事をしてたんや。知らない人のためにOptimizelyの説明をすると、実際に使うABテストサービスやった。マーケティング担当者がアイデアをチューニングし、製品がローンチされる方法として、ABテストを普遍的な実践として開拓したんや。

それが僕のプロダクトマネジメントのキャリア全体を通じての一貫したテーマになってる。その前のMicrosoftでもABテストをめっちゃやってたし、今もGammaでもめっちゃやってる。

新しいモデルが出てくるたびに、例えば今日僕らが録画してる間に、サム・アルトマンがステージでGPT-5を発表してる。文字通り今、僕らのチームの誰かがGPT-5を実装してテストできるように僕らの側でコードアップデートをしてる。

新しいモデルが出てきた時、僕らはいくつかの違う段階のテストを行う。評価もやるから、このものが以前のモデルより良いかどうかを自動的に測定しようとする。でも僕らはクリエイティブな領域にいて、多くの場合正解がないから、評価を実行して「GPT-5はClaude Sonnetより2.7%良い」って言うのは実際には難しい。そのためのメトリクスがないんや。

でも僕らには実際のユーザーがたくさんいて、今は何百万人ものユーザーで実際にこれらの実験を実行できるのはラッキーやと思う。だから今日の午後のどこかで、GPT-5対Claude対GeminiのABテストを開始する予定で、プレゼンテーションを生成した時の一連のユーザー行動を実際に測定する予定や。

ユーザーに評価を通じて何を思うかを実際に聞くけど、最終アウトプットをどれくらい編集したかも測定する。他のツールにどれくらいエクスポートしたか？シェアしたか？そして最後に、無料顧客から有料顧客に転換したか？も測定する。

僕らはたぶん何百ものこういう実験を実行した。そしてどのモデルがどのタスクによく働くかを非常に注意深く学んだし、それに加えて僕らのプロンプトのどの側面がよく働くかも学んだ。だから僕らはプロンプトエンジニアリングのアイデアにかなり重きを置いてると言える。僕らの製品にはかなり複雑なプロンプトがあって、プロンプトのかなり複雑なオーケストレーションがある。そしてその全ての部分が、実際に共鳴するものを見つけ出すための何らかのABテストと実験の産物や。

データフライホイールの実践やな。Optimizelyの人ほどデータフライホイールを作るのに適した人はいないやろうな。

その通りや。

プロンプトエンジニアリング vs ファインチューニング

プロンプト側についてやけど、主にファインチューニングと対比してプロンプトエンジニアリングなん？それには理由があるん？

正直、ファインチューニングがそんなにうまくいくのを見つけられてない。ファインチューニングは業界でめっちゃハイプされてるものの一つやと思うけど、率直に言うと主にファインチューニングをやってくれる会社から来てる。でも僕らの経験では、ファインチューニングはモデルの実際の知能を損なうように見えるし、率直に言ってファインチューニングはオープンソースモデルの間では人気があるように見つけたけど、僕らはオープンソースモデルがクローズドソース基盤モデルに近づいてるのを見たことがない。

面白いな。だから僕らにとって、日常的に使うのはClaude、Gemini、GPTみたいなもので、たくさんハイプされるこれらのオープンソースモデルではない。

オーケー。だから好きな子を名前で呼んで。Claude、Gemini、GPT。それぞれが何が一番得意？

選ぶとしたら、僕はClaudeファンや。僕らはめっちゃめっちゃヘビーなClaudeユーザーやと言える。

特に僕らがClaudeについて見つけたのは、実際に何が良く見えるかについてある種のテイストを持ってることや。このクリエイティビティがあって、それは驚くべきことに、どのベンチマークにも出てこない。これらの会社がモデルについて話す時、まず第一に、彼らはいつもソフトウェアエンジニアリングについて話してる。

この時点で、コーディングはAIの支配的なユースケースや。キラーアプリや。だからこれらの会社は皆、推論、ツール使用、コーディングについて最適化してる。僕らはコーディングプラットフォームじゃない。僕らはビジュアル表現プラットフォームや。だからベンチマークは全部役に立たない。捨てて僕ら自身の実験をやらなあかん。Claudeが最高やった。

面白いことに、以前のバージョンのClaudeの方が新しいバージョンより良い時があった。彼らがこのコーディング最適化パスを進む中でな。

一番過小評価されてるのはたぶんGeminiやと思う。Geminiはダントツでめっちゃヘビーに使ってるモデルや。

コスト効率で彼らが断然勝ってるからや。知能対ドルで言えば、Gemini Flashに勝るものはない。これがたぶん僕らの日常的な働き馬や。これは僕らの会社のもう一つのことにも関連するかもしれんけど、僕らは実際にこの分野の他の多くのAI会社と違って、マージンをめっちゃ気にしてる。僕らはAIを持つようになってからずっとキャッシュフロー黒字で運営しようとしてきたし、これらのことを持続可能に提供する方法について考えてる。

推論モデルはどう？君らにとってアンロックになった？

意外にも、ノーや。実際にこれらの実験を実行したんやけど、分かったのはモデルが長く考えるほどクリエイティビティが少なくなるってことや。推論は数学の証明を作ったりコーディング問題を解いたりする正解がある問題にはめっちゃうまくいくと思う。

でもクリエイティブライティング分野では全然うまくいかないように見える。

それはめっちゃ面白いな。特にDeepSeekは僕らのユースケースにとって完全にダメやった。「うわあ、これらのオープンソースモデルは推論できる」っていうハイプ全体にもかかわらずな。

うーん。そうやな。

画像生成側ではどう？好きなモデルはある？

画像生成には好きな子がたくさんある。僕らの製品では20個くらいの違う画像モデルをサポートしてて、全部に対して同じようなABテストアプローチを取ってる。画像モデルでは一つの正解っていうのはそんなにないと思う。僕らが一番ヘビーに使ってるモデルはIdeogramとFluxから来てる。

彼らはめっちゃいいモデルを持ってて、すごい進歩をしてる。でも僕らはOpenAIのGPTイメージができることにもめっちゃ驚いた。テキストとインフォグラフィック系コンテンツにはめっちゃパワフルや。だから可能な限り混ぜ込もうとしてるけど、コスト効率的に提供する方法も見つけ出そうとしてる。

完全にそうやな。このデータフライホイールとプロンプトチューニングのコンセプトに戻りたいんやけど、DSPYって知ってる？

うん。

君ら使ってる？それとも他の方法でプロンプトを自動的にエンジニアリングしてる？

実際には使ってない。DSPYは少し試したけど、僕らには役に立たなかった。理由はいくつかあると思う。僕らは実際に僕ら自身のプロンプトの理解しやすさと読みやすさをめっちゃ重視してる。

僕らはプロンプトをほぼユーザーエクスペリエンスとして見てる。デザイナーが作業できるもの、PMが作業できるもので、エンジニアだけが書いて最適化するものじゃない。もう一つは、僕らはクロスモデルの再利用性をめっちゃ気にしてるってことや。さっき言ったように、例えばClaudeとGeminiとGPTはそれぞれ独自の強みを持ってる。僕らはこれらのモデル全部をコンサートで使う。常にお互いにテストしてる。

それに、いつでもこれらのモデルの一つは壊れてて、違うのを使わなあかん。だから僕らはその移植性をめっちゃ気にしてる。DSPYみたいなツールは一つの非常に特定の敏感な組み合わせをマイクロ最適化するのはめっちゃいいと思ったけど、僕らは汎用性をめっちゃ気にしてる。

じゃあプロンプトは手作りしてるん？

まあ、Claudeが僕らのためにハンドクラフトしてくれてるって言えるかな。僕らはClaudeを使ってプロンプトをたくさんイテレートしてるけど、何をするかの人間のレビューとイテレーションガイダンスをたくさんやってる。

めっちゃ面白いな。

競合との闘い：800ポンドのゴリラたち

それじゃあ部屋の中の象について話そうか。つまり競合や。つまりスライド、僕も君と同意見やけど、ビジュアルコミュニケーション。特にビジネス世界で最も浸透してるコミュニケーション形態の一つや。だから君には800ポンドのゴリラがたくさん部屋にいる。

その通りや。

競合してる相手がたくさんいる。誰が怖い？

一番怖いのはやっぱりPowerPointで、それより少ないけどGoogle Slidesや。彼らがやっぱり支配的な既存勢力やから。

僕らは何百万人もの月間アクティブユーザーを持ってることを誇りに思ってるけど、聞いた統計ではPowerPointとGoogle Slidesはそれぞれ5億人の月間アクティブユーザーを持ってる。だから世界には10億人くらいのSlidesユーザーがいて、僕らはまだその本当に小さな部分でしかない。

だから僕らはやっぱり自分たちをこれらの非常に大きな既存勢力に立ち向かおうとしている反乱軍として見てる。ラッキーなことに、これらの会社はAIでかなり動きが遅い。みんなの注意が自律的コーディングに向けられてるおかげで、実際にこれらの生産性ユースケースが大手プレイヤーの一部に無視されてるから、僕らは実際にラッキーやと思う。

僕らにとってのもう一つの大きな競合源は基盤モデル自体や。数週間前にChatGPTエージェントが出てきた。PowerPointを作ってくれる。ありがたいことに僕らにとって、あんまりいいのは作らないけど、それは変わるって分かってるし、これらはより良くなるって分かってる。

だから僕らにとっては、やっぱり差別化に頼ろうとしてる。PowerPointから、ChatGPTからどれだけ違えるか？ただモデルができることの上に僕らだけのテイストをめっちゃ持ち込めるか？

でもそれは微妙なダンスなんや。一方で、僕らは違うことをめっちゃ気にしてる。結局のところただのPowerPointビルダーになりたくない。PowerPointは最終的に素晴らしいPowerPointビルダーになるやろうから。僕らは素晴らしいGammaビルダーになりたい。

僕らは僕ら独自のビジュアルストーリーテリングプラットフォームになって、本当に僕ら独自のメディアになりたい。でも同時に親しみやすくもなければならない。なぜなら僕らは最初の5000万ユーザーは新しいものを試したいアーリーアダプターやったこの段階を越えようとしてるから。僕らの次の1億人くらいのユーザーは、便利なもの、親しみやすいもの、既存のワークフローに合うものが必要なアーリーマジョリティになると思う。特に僕らも純粋なB2CからB2Bもやり始めるこの移行をする中でな。だから僕らは親しみやすくて革新的でもあるっていう綱渡りをしてる。

完全にそうやな。Canvaはどう？彼らはテイストとデザインで愛されてきた人やと僕は見てる。明らかに彼らの使用法の一部はスライド駆動や。彼らについてはどう思う？

まず第一に、僕らは彼らをインスピレーションとして見てる。彼らが達成したことに関して、めっちゃインスピレーションを与える会社やと思う。

彼らはどうやって会社を作るかについて、めっちゃ面白いことをいくつか証明してくれた。PLGが巨大なスケールで機能することを証明してくれた。Canvaについて聞いた統計では、年間売上高5億ドルになるまでセールスパーソンを一人も雇わなかったらしい。

それはクレイジーや。なぜなら大抵の会社はどんな戦略を使ってでも5億ドルに到達することを目指してるからな。確実に僕らもそうや。でも彼らはこの種のSMBにフォーカスした戦略と巨大なテンプレートライブラリでそれを成し遂げた。だから僕らは彼らが切り開いた道を辿りたいと思ってる。

でも僕らは彼らとは少し違う道を取ってると思う。Canvaはまず第一にデザインツールで、物をドラッグアンドドロップして配置して、テンプレートを使ってやる。僕らはパンデミックで始めた時から常に違うDNAを持ってて、実際にライティングベースのツールなんや。それが僕らがNotionとも比較する理由や。デザインスキルを全く持たなくても本当に美しくて魔法的なものを作れる会社のもう一つの指標として。

Notionは彼らのプラットフォームにAIを統合することでもインスピレーションやと思う。

だから、うん、時間が経てばCanvaともっと正面から競合することになると思うけど、ただのコピーキャットになろうとするのではなく、僕ら自身の道を切り開けることを望んでる。

競合を勝ち抜いた理由

完全にそうやな。数年前のある時点で、これらのAIスライド作成ツール、適切な言葉がないけど、3つか4つがあって、君らは本当に勝ち抜いて、他のいくつかはピボットしたり横に行ったりした。なぜそうなったと思う？

それは本当や。過去にはめっちゃ競合の激しい分野やったけど、少なくとも今のところは少し競合が少なくなるように持っていけた。いくつかの差別化要因を指摘できると思う。

一つ目は、僕らがいつもかなりリーンで警戒心の強いマインドセットを持ってたことや。君が言及してる他の会社の一部はかなりたくさんの資金を調達して、かなり大きなチームを作ったと思う。

僕らはいつもAI世界はめっちゃめっちゃ速く変わってるっていうマインドセットを持ってた。そして僕らの成功を決定する最も重要な特性は、ピボットして適応する能力やってことや。だからそれで僕らのトラクションに対して言えばかなり小さなチームを持つことになった。

そのリーンなメカニックをめっちゃ大事にしてきた。それは推論にどれだけドルを使うかっていうめっちゃ戦術的な方法でも僕らの支出に影響してる。今、たくさんのAI会社が赤字で運営してる。僕らの競合の多くも含めて、出てきた時にめっちゃ高かったGPT-4やDalleのようなツールを動かしてたと思う。75セントでドルを売るっていう古典的なメカニックやと思う。

たくさん成長はできるけど、持続可能じゃない。そしてたくさんの会社が持続できないことをやるっていうクランチに本当に直面したと思う。だからそれも僕らのDNAの一部になった。僕らがやること全てにおいてコスト効率をめっちゃ気にしてる。キャッシュフロー黒字を維持することをめっちゃ気にしてる。なぜならそれがみんなより速く動き続けることを可能にする基盤やと思うからや。

アプリケーション層の創業者へのアドバイス

アプリケーション層で構築してる他の創業者へのアドバイスは？

まず第一に、取り組んでる市場に対する君のユニークな視点は何かを考えることや。僕らGammaにとって、僕らのユニークな視点はメディア自体を差別化することや。だから僕らは自分たちに対していつもめっちゃ明確やった。僕らはただのPowerPointビルダーを作ろうとしてるんやない。

僕らはスライドデッキを置き換える新しいフォーマットを作ろうとしてる。それが僕らのめっちゃたくさんの製品選択を導いてきた。時々ユーザーを怒らせることもある。万能薬じゃないけど、めっちゃ競合の激しい市場をナビゲートするのに役立ったと思う。だから僕は間違いなくこの分野の他の創業者に彼らのユニークなレンズについて考えることを勧めたい。

例えば、僕はまた別のバイブコーディングのスタートアップを作ることには注意すると思う。この分野でほぼ同じことをやってる会社がめっちゃたくさんある。僕は人々がAIを適用してない見過ごされた分野は何かを考えると思う。そして基盤モデルが訓練してることに対して逆張りしたいと思うかもしれん。

だからこれらのバイブコーディングツールがテイクオフしてる理由は、基盤モデル自体がコーディングにめっちゃ優秀で、基盤モデルがそれを最適化してるのがめっちゃ明確やからや。彼らがそんなに最適化してないけど、まだ隣接してることに取り組んだら、そこにいる巨大な恐竜にスモッシュされることなく進歩を遂げるのに少しいい運があると思う。

また、何らかの実験の形を本当に取り入れて、複数の違うモデルを試すことを本当に勧めたい。人々は一つのモデルプロバイダーにロックインして、それがそこにある最高のものだと思い込む傾向があると思う。でもそこにあるイノベーションはめっちゃ急速で不均一で予測不可能やから、週のどの日でもそこには違う最高のモデルがある世界を計画しなければならないと思う。

うん、Optimizely DNAが出てきてるな。

Gammaの未来と新機能

最後にGammaの未来について少し話すことで締めくくりたいな。今君らのプラットフォームで2億5000万のGammaが作られてるような状況やと思うけど、これまでの使用状況について何を見てる？みんな君らを何に使ってるん？そして基盤モデルが良くなって、君らのプラットフォームが良くなるにつれて、それが時間とともにどう進化してきた？

うん、僕らが始めて、本当にプロダクトマーケットフィットに到達したのはプレゼンテーションっていうユースケースやった。プレゼンテーションでも実はめっちゃ広い世界が判明してる。めっちゃビジュアルなTEDトーク式のプレゼンテーションから、めっちゃ文字の多いコンサルティングや投資銀行のスライドまで全部や。だから実際にプレゼンテーション内だけでも、ただ改善し続けて、より良くやり続ける余地がめっちゃあることが分かった。

でも僕らは最初から必ずしも計画してなかった面白い隣接分野も発見した。最初の一つは単純にドキュメントやった。ドキュメントって言う時、プレーンテキストのGoogle Docsみたいなのを意味してるんやない。

PDF提案書やパンフレット、顧客に渡すピカピカなレポートやホワイトペーパーのようなものを意味してる。実際にこういうものがめっちゃたくさんある。PowerPointの市場シェアが5億人くらいやとしたら、PDFは10億人くらいやと思う。

スライドデッキの分類にはまり合わないこれらのビジュアルアウトプットを人々が作ってるのがめっちゃたくさんあって、僕らは実際にそこでめっちゃプルがあることを見たし、そのためのプロダクトもたくさん作った。

本当に僕らを驚かせた次のものはウェブサイトやった。多くの人がGammaでこれらのものを作り始めて、作ったGammaが個人のウェブサイトや小さな会社やエージェンシーのウェブサイトとしてうまく機能することに気づいたんや。

Notionのドキュメントがこれらの小さなミニウェブサイトとして実際に使われるようになるのと似てるな。

うん、うん。彼らは僕らにとって大きなインスピレーションで、僕らはこれが競合するのにめっちゃ素晴らしい市場やって気づいた。ウェブサイトはめっちゃスティッキーやし、世界への公の顔であるという点で人々にとってめっちゃ意味があるからや。だから僕らは去年サイト製品もローンチした。

だから僕らはこれらの隣接分野とプルを見つけ続けてて、僕らはAIプレゼンテーションツール以上のものやってことを実感させられてる。まだどう定式化するかを考えてるけど、僕らの最新のマインドセットは僕らがビジュアルストーリーテリングプラットフォームやってことやと思う。それが意味するのは、いつでも君が重要で伝えたいハイステークスなものがあって、特に表紙で本を判断されるような感じで人々が本当にそれがどう見えるかを気にする時、Gammaはめっちゃ素晴らしい場所やってことで、僕らはそれをめっちゃたくさんの違うユースケースを通して提供したいと思ってる。

それは気に入ったな。近中期的にユーザーは君らから何を期待すべき？プロダクトはどう進化するん？

来月、9月にめっちゃ大きなものが出てくる予定や。ちょっとだけ予告すると、僕らはコアな編集体験を改善するためにめっちゃたくさんやってる。

僕らのビジュアルレンジと多様性を本当に拡大してる。だから僕らにはすべてのGammaがワイルドに違って見えるようにして、それで達成したいと想像することは何でも、簡単なプロンプティングを通して手に入れられるようにするっていう目標がある。それが僕らにとって大きな一つや。

僕らはもっとエージェント的な編集をめっちゃ構築してる。だからAIに委任して「この5スライドのプレゼンテーションは本当は20になるべきで、セクション3をもっと拡張してくれる？それからこの他の部分のビジュアルをやり直してくれる？」って話しかけるだけでできるようになる。

それから僕がめっちゃ楽しみにしてる大きなものは、僕らがAPIをローンチすることや。これには本当に驚くほどたくさんの関心があった。

仕事の一部として何らかのワークフローに基づいて何らかのビジュアルアウトプットを作る必要があるめっちゃたくさんの会社があると思う。簡単な例は、新しい見込み客が来て、その見込み客にピッチをセットアップしたい営業チームや。だからCRMを取って、彼らからの全てのノートをパイプして、君のテンプレートで事前に設定されたピッチデッキを手に入れて、営業パーソンの1時間の時間やら、まあ言ってしまえばごちゃ混ぜになってたかもしれないものなしに、その見込み客のところに持って行けるようになったらどうやろうか。

実際に僕は投資家から聞いて驚いてるんやけど、「実際に、僕のポートフォリオには10のスタートアップがあって、こういうものが必要や」って言うんや。人々のために本当に価値ある仕事をやってるけど、それを見せびらかす方法が必要なスタートアップがめっちゃたくさんあるからやって。だから僕らはそれのローンチもめっちゃ楽しみにしてる。

めっちゃワクワクするな。カルパシーが「スライドのCursorは何？」ってツイートしたの覚えてるで。

そうや。

みんながコメントで現れて「Gamma」って言ってた。君らがここまで来た話を聞くのはめっちゃクールや。ビジョンのコンビネーション、恐れを知らないこと、モデルオーケストレーションと実験レイヤーでやってることすべて、そしてエージェント的編集やこれから来るものについてどう見てるかも含めて。

だから今日Gammaの話をシェアしてくれてめっちゃありがとう。君らがビジュアルコミュニケーションの未来を変え続けるのを見るのが待ちきれない。

呼んでくれてめっちゃありがとう。ここに来れてめっちゃ良かった。