CodexがClaude Codeを打ち負かす、1兆ドルの賭け SpaceX対OpenAI対Anthropic、そしてAI銀行Stripe | GMP EP11

GPT-5
この記事は約63分で読めます。

最新のAIコーディング環境においてCursorがAnthropicやOpenAIの公式ツールを凌駕している現状や、AIエージェントの未来について解説する。さらに、SpaceXの1兆ドル規模の評価額とイーロン・マスクの報酬パッケージ、Stripeの金融サービス参入、Grok 4.3の台頭、そして米国防総省のAI活用に至るまで、テクノロジーとAI業界の最新動向を網羅的に分析する内容である。

Codex beats Claude Code, the T bet SpaceX vs OpenAI vs Anthropic & Stripe the AI bank | GMP EP11
This was the week Cursor beat Anthropic at running Anthropic's own model.The third-party harness extracted more performa...

AIハーネスの台頭とCursorの躍進

イーロンは、それらのモデルをより良く動かす場所を所有することになるのでしょうか。そしておそらくイーロン自身が言っているように、最も面白い結果が実際に起こることになるのでしょう。AnthropicはOpus 4.7をトレーニングしているので、モデルがどのように考えるかを正確に把握しています。彼らは独自のハーネスであるClaude Codeを出荷します。そして特権アクセスのないサードパーティであるCursorが、AnthropicよりもOpusからより多くのパフォーマンスを引き出すことができるのです。これは本当に面白いと思いました。その2時間後、ClaudeやAnthropicがそれを発表します。Cursorも基本的には似たような機能を発表します。ビデオでさえ同じように見えます。アプリのコーディングは新しいポッドキャストの立ち上げのようなものです。私たちは3人の男で、ポッドキャストを始めたばかりです。この世界でAIを学ばないのは信じられないほど無謀なことです。すべてがコードです。最近、すべてがコードだと気づきました。皆さんこんにちは、god mode podのエピソード11へようこそ。毎週同じことを言っている気がしますが、今週も盛りだくさんで、これまで見てきた中でAI界隈のニュースが最も多い週になったと思います。まずは、現在AI業界で静かに最大の話題になりつつある、ハーネスについてから始めましょう。具体的には、今週はCursorが話題の中心でした。CursorがClaudeを追い越したという話です。おそらく、GPT 5.5はOpenAI自身のCodexよりもCursorの方がパフォーマンスが高いという話題がタイムラインを飛び交っていたのでしょう。Opus 4.7がClaude CodeよりもCursorで高いパフォーマンスを発揮するのと同じですね。サードパーティのハーネスが主流になりつつあり、これらのベースモデルを使用するためのより良い方法になりつつあるのでしょうか。この点については間違いなく深掘りしていきます。しかしここで面白いのは、イーロン・マスクがCursorに賭けたということです。つまり、イーロンはそれらのモデルをより良く動かす場所を所有することになるのでしょうか。そしておそらくイーロン自身が言っているように、最も面白い結果が実際に起こることになるのでしょう。まあ、どうなるか見てみましょう。ベン、あなたはCursorから離れつつあると言っていましたね。これについてどう考えていますか、何が見えていますか。

ええ、私はClaude Codeを動かすためにCursorから離れようとしています。そして今はClaudeアプリでClaude Codeを動かしていますが、これが定着するかどうかは様子見です。でも、こういうことなのです。AnthropicはOpus 4.7をトレーニングしているので、モデルがどのように考えるかを正確に把握しています。何が得意で、どのようなコンテキストウィンドウのトリックを使えばモデルが最大限に機能するかを知っています。彼らは独自のハーネスであるClaude Codeを出荷し、特権アクセスのないサードパーティであるCursorが、AnthropicよりもOpusからより多くのパフォーマンスを引き出せるのです。これはOpenAIのGPT 5.5とCodexでも同じ話です。つまり、研究所がプロダクト作りやモデルの機能を引き出すのが単に下手なのか、あるいはハーネスがモデルのトレーニングとは純粋に異なる専門分野なのかのどちらかです。

私は主に後者だと思います。Cursorは2022年の設立以来、何年もこの戦いに挑んできましたからね。彼らは開発者体験のあらゆる細かい部分を解明しようとしていますが、AnthropicやOpenAIは本当に最高のモデルを構築することに集中しています。ですから、彼らはすべてのモデルとそれらがどのように機能するかについて組織的な知識を持っており、おそらくすべてのモデルがこの開発者のコーディングという方法でどのように相互作用できるかという全体的な理解を持っていることで、より良いハーネスを構築できるのでしょう。先週、イーロンが600億ドルの評価額でCursorを買収した、あるいは買収する選択肢を持っているという話がありましたが、今週になって誰もが、開発に関してはCursorがモデルの能力を引き出す最高の方法だと言っているのは非常に皮肉なことです。本当に興味深いですね。

ええ、確かに、Cursorが何年にもわたって生み出してきた、ユーザーがこれらすべてのモデルとどのように相互作用し、そしてこれらのユーザーがこれらのモデルを使用してどのように最高の結果を得るかというすべてのユーザーインサイトのたまものであり、それを自社のハーネスに実装しているのだと思います。一方、巨大な研究所がモデルをトレーニングする場合、彼らはこれを一般的な知識でトレーニングしており、特にコーディングのユースケース向けにトレーニングしているわけではありません。Anthropicはそれに近いかもしれませんが、それでもCursorにはいくつか独自のインサイトがあると思います。そしておそらくそれが、このツイートが言っているように、彼らがベースモデルやAnthropicやOpenAIが提供するIDEを単に上回っている理由なのでしょう。ここでReplitがどの位置にいるのか気になります。Replitもハーネスとして見ることができるのでしょうか。

ええ、独自のものを持っています。CursorとReplitの唯一の違いは、一方がクラウドベースのIDEであり、Cursorはその意味でデバイス上のローカルにあるということです。しかし結局のところハーネスとは、これらのアプリケーションがどのようにマークダウンファイル、つまり作業中のプロジェクトに関するより多くのコンテキストを持つための長期記憶を持つシステムプロンプトを作成しているかということにすぎません。だからこそ、誰でも独自のハーネスを構築でき、それはそれほど独占的なものではないのです。その意味ではハーネスをリバースエンジニアリングすることも可能です。Cursorで新機能がリリースされたら、それをClaude Codeに取り入れることができます。ですから、これはどちらかというとユーザー体験の問題であり、さまざまな種類のハーネスに目を向けると、OpenClaudeでさえ独自の種類のハーネスを持っていると考えることができます。IDEの中にこれらのハーネスがあるとき、それらが一緒に機能して、人々がコードやGPT 5.5で作業できるようにするこれらの新しいツールを作成するのです。ですからこれは、IDEは将来価値を持つのかという、数週間前の私たちの意見の相違と大きく矛盾していると思います。そして私は個人的に、IDEは1つのモデルだけでなく、異なるモデルと連携できるという理由だけで、将来も間違いなく価値を持つと信じています。つまり、Claude Codeに対するCursorの利点は、Cursorがタスクの一部を行うためにGPT 5.5を使用し、他のタスクを行うためにClaude Codeを使用できるということです。そして今、私たちはそれらが以前よりもずっと接近していることを知っています。ですから、もし計画に焦点を当てているものと、実際にコーディングを行っているものがあるなら、おそらくそこにCursorの場合の強みがあるのでしょう。

ええ、それは非常にうまく言及されています。私は実際にハーネスはコンテキストプロンプトだと思います。Lovableが特定のコンテキストプロンプトを持つのと同じくらい簡単なコンテキストプロンプトとしてそれを見ることができます。Replitには特定のコンテキストプロンプトがあります。Cursorには、ユーザーが実行できる特定のアクションに対する特定のコンテキストプロンプトがあり、彼らはそれを微調整して、どれがより良い結果になるかを確認することができます。その通りです。ルカ、私たちはIDEの終わりについて話していましたが、今は勝者のアプリケーションかもしれないと言っているのは正しいですね。これがAIの世界がいかに早く変化するかということです。

Cursorについてもう一つだけ言わせてください。考えてみれば、Cursorは有利な立場にあります。なぜなら、私たちはハーネスについて話していて、ただClaudeを使っているだけならClaudeを使っているだけだと考えているかもしれませんが、彼らは裏でハーネスとして機能する他のモデルや、その上にある別のレイヤーを使っているかもしれないからです。ですから彼らはそこで優位に立っているかもしれず、さまざまなソースから情報を引き出し、プロンプトを書くためにGPT 5.5を使用し、そのコマンドを実際に実行するためにClaude Opus 4.7を使用するというように判断できるのです。ですから、彼らは実際に異なるモデルをバッチ処理しているかもしれず、異なるもののプロバイダーであることは有利かもしれません。Perplexityは、望ましい結果に到達するための最良の方法だと彼らが感じるものに基づいて物事を効率的にルーティングできるため、有利な立場にあると感じているとよく話しているのを知っています。

ええ、その点で、多くの人が、例えば計画にはGeminiを使用し、オーケストレーションにはOpusを使用し、実行にはCodexまたはGPT 5.5を使用し、その後コードが正しく書かれているかを実際にチェックするために別のモデルを使用すると言っているのも聞きました。私が2日前に聞いたNavalのポッドキャストのバイブコーディングに関するエピソードでも同じでした。彼は、GitHubに何かをプッシュするたびに、エージェントがGitHubにプッシュされたものをチェックし、例えばOpusによって書かれたコードを他の3つのモデルにチェックさせると言っていました。ですから多くのオーケストレーションが行われているのがわかりますし、それはCursorの内部でも起こっている可能性があります。異なるモデルが互いに対話し始めたり、互いにチェックし合ったりしているのを今見ているのは非常に興味深いです。人々はもはや特定の1つのモデルを本当に信用してはいません。モデルはとても優秀になっていますが、あまりにも優秀で説得力があるため、私たちは時々チェックするのを忘れてしまいます。ですから、私たちは常に何らかのチェック体制を整えておく必要があると思います。そしておそらくそれがCursorや特にハーネスの強みでもあります。

Cursor SDKの発表とエコシステムの競争

Cursorが発表したもう一つの重要なことは、Cursor SDKです。Cursorは、Cursor SDKを導入するので、Cursorを動かしているのと同じランタイムハーネスとモデルを使ってエージェントを構築できるようになったとツイートしました。CI/CDパイプラインからエージェントを実行したり、エンドツーエンドのワークフローから自律的な自動化を作成したり、製品内に直接エージェントを埋め込んだりできます。これはつまり、誰でも基本的にバイブコーディングツールを立ち上げてCursorをプラグインでき、ユーザーは基本的にあなたの製品でCursorのハーネスを使用できるということでしょうか。ベン、これがアプリ開発にとって何を意味するのか何か考えはありますか。

最初はAnthropicとOpenAIは単なるモデルのプロバイダーでしたよね。そして彼らはCodexとClaude Codeを出し、IDEスペースに参入しました。そしてCursorのこれは、彼らなりのその方向への進出の形です。ですからすべての企業がソフトウェアエンジニアリングのこの風景全体に触れている表面積を広げようと、それぞれ独自の方法で取り組んでいます。つまり今やCursorは自社のモデルサプライヤーと直接競合しているわけです。OpenAIは文字通り彼らのエージェントSDKがあるエージェンティックなレイヤーを所有したいと考えており、Anthropicはコンピューターの使用でそれを行いたいと考えており、MCP標準というこのエコシステム全体を立ち上げました。さて、今度はCursorもそれを所有したいと考えています。そして、互いに深く商業的に絡み合っているこれら3つの企業が基本的に存在します。Cursorはこれらすべての推論のためにOpenAIとAnthropicに莫大な金額を支払っていますが、今や彼らはそれらの研究所が支配したかったレイヤーをめぐって競争しています。ですから、これは最先端の研究所対アプリケーションレイヤーの衝突が近づいているという興味深い状況です。そしてCursor SDKは、Cursorがその方向に向かうための最大の飛躍です。

ええ、それについては他に付け加えることはありません。ベン、あなたはCursorがロールモデルと競争するのはある意味で悪いことだと考えていたのですか。

ええ、まあ、今のところOpenAIとAnthropicは、APIクレジットや支出額という点でおそらくCursorが彼らの最大の顧客の1つであることを考慮すると、Cursorの試みを容認していると思います。しかし実際には双方とも、最初の脅威はAnthropicから来たと思います。彼らはClaude Codeを立ち上げ、CLIに参入しました。彼らはCursorがコーディングレイヤーであることで得ていた収益分配の多くを奪いました。そしてこれはCursorからの反撃であり、もしあなたたちがそちら側も所有するつもりなら、私たちもそれを狙いに行くというわけです。そしてこれは初期のAWSとAzureのようなものです。製品をこれらのクラウドプロバイダーのいずれかでホストしていたところに、Snowflakeと呼ばれるものが出てきました。そしてSnowflakeは、今日はもうAWSにいたくないからAzureに移行しようと言うのを非常に簡単にしました。Snowflakeはすべてのものを簡単に移植できるようにしました。Cursorはその小さなトグルボタンをクリックして、よし、もうGPT 5.5は好きじゃないな、AnthropicのClaudeのモデルに直行しようと言えるようにしています。ええ、彼らは今や下流でさえ、このCLIのようにエージェンティックなレイヤーに特別に埋め込まれてそれを行っています。なぜならCursorは人間がコーディングするのには素晴らしいですが、私たちが製品を構築するエージェントの世界に入るとき、彼らはこのインターフェースには行かないからです。彼らはClaudeターミナルの右側にあるクラウドコンポーザーに行って、これを作ってとは言いません。彼らはすべてターミナルを通じてこれを行っており、それが本当にCursorが参入しようとしている領域です。

これは素晴らしいですね。なぜなら、先週かなりバズった私たちのショート動画についたコメントの1つに、私が研究所が私たちにスプーンで餌を与え、トークンを与え、私たちを囲い込んでいると感じると言ったことへの反応があったからです。しかしある時点で彼らはサブスクリプションを停止するかもしれず、そうすれば従量課金制になります。そして多くのコメントで、移動できるようにしなければならない、1つのエコシステムに自分を縛り付ける必要はない、なぜなら実際にそうすれば彼らはあなたをひどい目に遭わせる可能性があるからだとありました。そしてCursorがこれを今行っていることで、Snowflakeについてあなたが挙げた例のように、実際にある特定のスタックの上に構築された製品でさえ、あるプロバイダーから別のプロバイダーへより簡単に移行する機会を人々に与えていると思います。これは正しいですか、それともここで完全に間違った仮説を立てていますか。

いいえ、正しいです。私にとって完璧な例はOpenClaudeです。私はここ数ヶ月でこれによってすでに痛い目を見ました。私は財務から法務による契約書の作成、運用面でのレポートの確認、すべてが機能しているかどうかの確認まで、すべてを行う12人の異なる従業員の私のエージェンティックなワークフロー全体を構築するのに何週間も費やしました。そしてある日Anthropicが、みんな、もうOpenClaudeでOAuthサブスクリプションを使用することはできないと言ってきたのです。私はここ3、4週間、その絡み合ったクモの糸を解きほぐしています。少しずつCursorを使ったClaude Codeに移行させています。今、私が本当にどのプロバイダーに縛り付けられているのかに依存しないようにすべきかどうかを言う二度目のチャンスのようなものがあります。今のところ私は、不運にもあるいは幸運にもAnthropicに固執しており、彼らは計算リソースに制約があるが解決するだろう、そして彼らは依然として最高のモデルを作り、私のような個人起業家にとって素晴らしい体験を提供していると言っています。でも私が、よしみんな、もう十分だと言うまであと一歩のところにいるかどうかは見てみましょう。もし彼らがレート制限を下げ始めたり、モデルがさらに退化し始めたりしたら、おそらく最終的にはCursorに移行するでしょう。そして本当に、依存しないコーディングプロバイダーということに関して言えば、Cursorはこのゲームにおける唯一のプレイヤーです。OpenCodeもあるかもしれませんが、ほぼ全員がCursorを使っていると思います。

ええ、Cursorは非常に強力なコミュニティも持っています。彼らは世界中のさまざまな都市のカフェやイベントで草の根の活動を構築しており、それが開発者から信頼されるツールであり続けるための粘着性を彼らに与えていると思います。ほんの数年前、開発者はコーディングのワークフローにAIを使い始めることに非常に警戒していたことを思い出してください。そしてCursorは、その種の恐怖を打ち破り、開発コミュニティが望んでいたであろう適切な方法でそれを導入することができた実際の企業です。もしイーロンが600億ドルを入札してバックアップを持っていなかったら、CursorはこのSDKを発表していたと思いますか。なぜならこれは明らかに他のプロバイダーに対する一種の牽制だからです。素晴らしいAnthropic、デスクトップアプリとClaude Codeをありがとう、素晴らしいOpenAI、Codexをありがとう、でも私たちはあなたたちを追撃しており、人々が実際にコーディングし、人々が実際にやりたいことを何でもする場所に私たちがなりたいのですと言っているようなものです。正直な私の見解では、もしイーロンからのバックアップがなかったら、彼らはこれをしなかったと思います。

おそらくそうでしょう。イーロンがこれらのことに関してかなりオープンマインドでオープンソース推進派であるにもかかわらず、Cursorは現在Grokによって買収される可能性があるのは興味深いことです。ですから、将来Cursorがどれくらいオープンになるのか、それともGrokのモデルなどに向けてより調整されるのかという疑問は生じます。でも私はむしろ、Cursorがこれらすべてに倍賭けしたのは、彼らが強力な計算リソースを持っていると言ったからだと思います。彼らの背後には今、多くの計算リソースがあります。もしあなたたちが望むなら、私たちはこの戦いをする準備ができています。私たちはそれに取り組むことができ、20万個のBlackwell GPUを投入し、数ヶ月で独自のOpus 5なり何なりをトレーニングすることができますと。ええ、おそらく彼らは今、資源を持っているからこそより大胆になっているのでしょう。これは本当にお金の問題ではありませんでした。これは本当に、GPUに関する今日の経済学で機能する通常の需要と供給が窓から投げ捨てられているという状況です。なぜならこれらすべてのGPUは、手に入れたいと思っても将来にわたってロックされているからです。1年から2年先の将来の契約を基本的に結ぶ必要があるというのが私の理解です。

Codexの多機能化とモデルの進化

物事の進むスピードがいかに早いかは面白いですね。なぜなら週の初めには、タイムライン全体がCodexが今や実際にClaude Codeよりも優れているということ、そしてここ3ヶ月間Claudeが話題の中心であったにもかかわらず、人々がClaudeのサブスクリプションをキャンセルしつつあることについて話していたからです。そして今突然、Codexが何でもアプリになりました。それが私がこのエピソードにこのような名前を付けた理由でもあります。私たちはCodexについてたくさん話すことになると思っていましたが、今はCursorが主要なトピックになっています。しかしCodexについて言えば、Codexは何でもアプリになりつつあり、Codexの体験はClaudeの体験よりも優れており、人々は実際にCodexに移行していると言われています。ある人たちが、彼らのエンジニアが全員Codexにいるから、Claudeは素晴らしい体験だったにもかかわらずCodexに移行したと言っているのを聞きました。もしエンジニアがCodexを好むなら、Codexに行きましょう。彼らはすべてを1つのアプリに持っています。ClaudeにはClaude Co-workとClaude Codeが別々にありますが、Codexにはそれがすべて1つにまとめられています。ブラウザも統合されました。約1年前のAtlasを覚えているなら、あれが今やCodexに統合されているのです。ですからすべてが1つになっています。1つのフレーム内ですべてを行うことができます。ビデオ生成も同様です。HeyGenがあります。これは私が引き上げたいツイートですが、HeyGenはCodexに統合されています。これがどのように機能するか、ここのビデオで見ることができます。特定のツールを検索して、ねえ、ビデオを作成してと言うだけです。Codex内でビデオが作成されます。これらすべてのことが1つのデスクトップアプリ内で行えます。一方、Claude Codeではこれが目の前で起こるのを見ることは本当にできず、ユーザー体験がまったく異なります。ですから、これは個人的には誰もが実際にコーディングを始め、コードを実際にクリエイティブなものに変えることができる方法だと思います。一方、Claude Codeには、音楽など実際にそれを使用できるようになるために何かを学ばなければならないステップアップがまだありました。

さて皆さん、どう思いますか。ルカ、あなたがOpenAIのエコシステムに戻るか、それをOpenClaudeとリンクさせることを検討していたのは知っています。Codexを試してみましたか、あるいはここの未来をどのように見ていますか。

繰り返しますが、私はまだ単にReplitを使用していますし、裏では常にモデルを入れ替えていると確信しています。ここ数週間で費用対効果が少し高くなったと感じています。変化しており、過去1年間にわたって私がそれを使用し始めて以来、月によっては物事のコストが上がったり下がったりしているように感じます。ですから彼らは裏側を積極的に入れ替えていると感じます。しかしええ、私は特定のモデルに直接関連付けられていないプラットフォームにとどまるつもりだと思います。Cursorに関する私の最大の懸念は、彼らがGrokを押し付けすぎることです。しかし私がそこで言える唯一の慰めは、もし彼らがGrokに何かをうまくやらせることができ、同時に適切な目的に最適なモデルを使用できるようにしてコストを削減できるなら、それは他のどの企業も行っていないことだということです。もし競合他社のモデルをそれぞれの得意なことに使用し続けながら、商品のコストを削減できるなら、それは私の意見では良いビジネスケースです。

Replitなどで特に物事の費用対効果が高まっていると感じているとおっしゃるのは理にかなっています。先週GPT 5.5が最も高価なモデルになったのを見たと思います。つまり価格の面でOpus 4.7を実際に追い越したのです。しかし最近、GPT 5.5がOpusと同じ問題を解決するために消費するトークンが実際に少ないというツイートを見ました。ですから問題解決に消費されるトークンに関して言えば、100万トークンあたりの価格が高くても、GPT 5.5の方が実際には安かったのです。ですからこれらの価格設定がどうなっているかは非常に興味深いです。私が起こっていると信じているのは、これらのプラットフォームが正しいタスクを実行するための適切なモデルを推奨することに優れてきているということです。そして私は自分のためにその決定を下すよう彼らを信頼します。

自分が最善だと思うものに基づいてどのモデルを使用するかを切り替える力があるのは素晴らしいことです。でも私にとっては、リクエストを入れ、私のシステムにそのリクエストをどこに送るのが最もコストが低いかを決めさせたいだけです。そしてそれはプラットフォームでさえなく、実際にはモデルなのです。なぜなら、例えば5.4から5.5への移行における最大の飛躍は記憶と推論だからです。5.5は100万コンテキストウィンドウを持ち、5.4ができなかったコンテキストウィンドウの始まりを実際に覚えているからです。だからこそはるかに効率的であり、戻って物事を修正したり、誤って覚えていることやハルシネーションを起こしていることを修正したりする必要がないのです。コンテキストウィンドウを持っていて、ウィンドウの始まりから終わりまでをすべて覚えているからです。そしてそれがはるかに効率的になる理由だと思います。ですからモデルは問題解決や物事の解決において本当にずっと良くなっています。ベン、あなたは何かに気づいていますか。

ええと、私はまだCodexで遊んでいません。昨日Indie Hackerのミートアップに行き、B2BのSaaS製品を構築している人に会ったのですが、彼は月額20ドルのCodex製品でそれを実行するのに十分だと言っていました。彼は一度も制限に達したことがありません。彼はRust、いや失礼、Rubyで構築していると言っていました。これは非常に効率的なバックエンドタイプのシステムです。彼が制限に達しないのはおそらくそれが非常にシンプルで、その過程であまり多くのトークンを消費しないからだと彼は考えています。

今のところ基本的に私たちがこれについて話せば話すほど、そして特定のプロバイダーに依存しないようになるべきかどうかを考えれば考えるほど、おそらくその答えは再び、イーロンがCursorという最高の依存しないコーディング製品を購入して良い決定を下したということだと思います。なぜなら長期的にはAIモデルを使用する際のこれらすべての補助金はなくなるからです。企業は利益を上げる必要があるからです。これは常に起こります。UberやDoorDashなどで見ました。VCの支援を受けた企業を挙げればきりがありませんが、彼らは常に最初は安価になり、そして時間が経つにつれて株主に利益を還元する必要があるため高価になります。ですから今のところ、私は依然としてClaudeやCodexを直接使用する場合はお買い得だと思っていますが、時間が経てばそれはなくなり、その時がCursorやOpenCode、あるいはいずれかのより依存しないコーディングプラットフォームに移行するタイミングなのです。

Grok 4.3とオープンソースモデルの脅威

おそらくGrokについての速報のようになりますが、昨日か12時間前にGrok 4.3がリリースされました。価格を比較すると、Claude OpusやGPT 5.5よりも100万コンテキストあたりはるかに安くなっています。Anthropicの価格は入力5ドル、出力25ドルです。OpenAIは入力5ドル、出力30ドルです。xAIのGrok 4.3は入力1.25ドル、出力2.5ドルです。そしてつい1分前、このツイートが出ました。Grok 4.3がBridgebenchで1位を獲得しました。この分野で最も低いハルシネーション率、単なるリーダーボードのスクリーンショットではなく、実際のバイブコーディングに十分な速さです。AIレースはシフトしています。もしGrokがこのペースで成長し続ければ、xAIは単に競争しているだけでなく、勝利の大本命になりつつあります。

ここのスコアカードを見ると、Grokは多くの良い数字を出して1位になっており、一方Claude Opusはかなり下、あるいは少し下に見えます。これらのベンチマークが具体的に何なのかはわかりませんが、イーロンがまたしても良い賭けをしており、ええ、特定のプロバイダーに依存しないことがおそらく正しい道だという方向に向かっています。しかしこれはエキサイティングで、より安く、より速くなる一方であり、それは私たちにとって素晴らしいことだと思います。そしてここで2つの陣営があることも興味深いです。最高の結果を得るために可能な限り大きなパラメーターを構築しようという陣営と、ここでは5000億のパラメーターが見られますが、どんどん小さくしていき、エージェントを有用にするのは実際にツールの使用とツールの呼び出しだという別の陣営があります。モデルのアーキテクチャやモデルのトレーニングの面で私たちがどの方向に向かうのかを見るのは、それ自体が興味深い展開です。ルカ、何か言及することはありますか。

私の心をよぎった興味深い考えがあります。モデルが実際にいつより良くなったとどうやってわかるのでしょうか。ベンチマークでしょうか、それとも感情でしょうか。そしてそれは、人々が今何を使用しているか、そして何が採用されているかというような感情に大きく左右されているように感じます。それが何かが良いかどうかを測る方法です。もちろんそれを使用するあなた自身の経験もありますが、それはあなたの周りの人々が言っていることに偏っているかもしれません。

AI企業に対する感情を追跡するウェブサイトをコーディングしてみるのは面白いと思います。Twitterなどで人々が言っていることや、出ているニュースの見出しに基づいて行われる、ビットコインの恐怖と強欲の測定のようなものに似ています。ビットコインの強欲と恐怖の感情はこのウェブサイト上で変化します。AnthropicやOpenAI、そして彼らのモデルの強欲と恐怖の感情を調べるようなものがあればクールだと思います。

ええ、それは実際に良いアイデアです。私たちはそれを立ち上げることができます。ええ、ここでArtificial Analysisのインテリジェンスに関するコーディングインデックスをチェックすると、Grok 4.3のスコアはGPT 5.5のスコアのおそらく60から65%にすぎません。しかし繰り返しますが、価格は10分の1です。ですからGPT 5.5を実行するために支払うのと同じ価格で、10回実行させることができるのです。それが正しい見方かどうかはわかりません。しかしええ、ルカの指摘に戻ると、感情ですよね。感情はどれほど重要でしょうか。なぜならOpus 4.7はGemini 3.1より下にあるのを見ますが、ウェブサイトをコーディングするための1つのモデルを選ぶとしたら、Opus 4.7とGemini 3.1の間で選ばなければならない場合、ほぼ全員がGeminiよりOpusを選ぶことに同意すると思います。Gemini 3.1を選ぶ人を私は誰も知りません。

ここでの違いは、繰り返しますが、これはコーディングインデックスであり、次にエージェンティックインデックスです。私がコーディングしている場合、あるいは私がバイブコーディングしている場合、基本的にそれは仕事をしているエージェントです。エージェントがツールを呼び出し、エージェントが別のエージェントを派遣して調査を行い、戻ってくるのです。そしてそこがGPT 5.5とOpusが実際に最も良いスコアを出すところです。ですから私たちはコーディングを比較している、コーディングについて話していると思っていますが、実際に話しているのはAIモデルのエージェンティックな使用です。そしてそこがGPT 5.5とOpusが依然としてはるかに優れているところです。しかしDeepSeekなどが接近してきており、GLMやKIもそれほど遅れをとっていません。これらがどのようにはるかに少ない資本で、まったく異なる方法でトレーニングされ、これほど良いスコアを出しているかを考えると、ええ、モデルの能力の点で中国はもはやそれほど遅れをとっていません。

ええ、しかもそれらはオープンソースなので、誰でもそれを採用して改善し、10倍安くしようと試みることができます。これはタイムラインでたくさん議論されているもう1つのことです。DeepSeek、新しいDeepSeekのモデルがリリースされ、GPT 5.5やClaudeのモデルよりも90から95%安いと思います。ですから繰り返しますが、Claudeをオーケストレーターとして使用し、タスクの90%をDeepSeekに任せれば、請求額は大幅に下がるでしょう。UberがClaudeを使用して3ヶ月で2026年のAI予算をすでに使い果たしたというミームを見ました。もし彼らがDeepSeekを使用していたら、同じ予算で3年間はいけたでしょう。これは一種の面白いことですが、最高財務責任者たちはAIが会社の経費を節約してくれると考えていたのに、今彼らはAIからのクレジット請求書を見て、くそっ、もっとお金を使っているぞと言っているのです。

OpenAI製スマートフォンの噂とハードウェアの未来

抽象化の話にとどまりましょう。AIモデルを抽象化して取り除くことについて話し続けましょう。OpenAIがiPhoneに代わるように設計された電話を構築していると報じられており、それは誰もが気づいていたよりも進んでいます。さて、私たちが以前電話をどのように使っていたかというと、アプリがあり、ホーム画面に行ってアプリをタップし、私たちがやりたい特定のユースケースのために使っていました。それは完全に変わるかもしれません。あなたの電話は実際にタスクを実行しているエージェントのリストになり、あなたが電話を開くとエージェントが来て、ねえ、たった今あなたのためにこれをしたよ、ねえ、あのマクドナルドの注文をしたい、ねえ、これしたい、ねえ、あれしたい、と言うようになるのです。ですからこれを見るのはとてもエキサイティングです。つまり、OpenAIが電話を作っているのを見るのが非常にエキサイティングというわけではありませんが、エージェンティックな電話が実際に発売されれば、ユーザーに完全に新しいユーザー体験を開くかもしれないのを見るのはエキサイティングです。そして噂では2028年を目標にしているとのことです。

そしてええ、これはまったく新しいオペレーティングシステムももたらすでしょう。さて、私たちはやり方を変えることになるのでしょうか。アイデアやアプリを開発するやり方を変えなければならないのでしょうか。それともアプリは実際に過去のものなのでしょうか。そしてこれらのエージェンティックなループが未来の新しいアプリになるのでしょうか。ベン、OpenAIの電話開発についてどう思いますか。

OpenAIの電話の成功はOpenAIにはあまり関係なく、Appleに大きく関係していると思います。ティム・クックが辞任しました。ジョン・ターナスが新しいCEOです。今年の9月に発効すると思います。Apple Intelligenceは2026年になっても私たちが持っているAIの最も哀れなバージョンの1つです。そしてOpenAIが彼らの最初のAI電話を出すまでに、彼らには約1年、2年と呼びましょうか、猶予があります。もしCodexが2026年にこのエージェンティックな仕事を実行できるなら、2年後には間違いなくはるかに印象的なものになっているでしょう。AppleはAIに関して自分たちの体制を立て直し、本当にそれを理解するために1年の猶予があります。ティム・クックが辞任したのは彼がAIが何なのか全くわからなかったからで、これはAppleを次の進化の段階へと進めるための方法だったと思います。スティーブ・ジョブズは革命的な創業者でした。ティム・クックは彼らを収益性に導き、株価を上げました。そして今、ジョン・ターナスはハードウェアとソフトウェア、そしてAIを組み合わせています。これが今年素晴らしい製品を作るための第3の柱です。ですからええ、興味深いものになるはずです。彼らはいくつかの異なる角度からアプローチしています。OpenAIはこれらのサイドクエストのいくつかを取り除こうとしているのを知っていますが、サム・アルトマンは電話に関して本当に執着を持っていると思います。彼はAppleに執着しています。彼は数え切れないほどのインタビューでそれについて話しています。本当にスティーブ・ジョブズとまさにiPhoneを尊敬しているのだと思います。彼がiPhoneの発表について話すのを聞くと、彼はほとんどそれを郷愁の念を込めて考えています。ですから彼らは同時に2つの賭けをしています。OpenAIはジョニー・アイブと一緒に仕事をしており、同時にこの電話にも取り組んでいるようです。

Appleの歴史について非常によく言及されていますね。スティーブ・ジョブズは世界が本当に知らなかった新しいデバイスを創造する先見の明のある人物であり、ティム・クックはサプライチェーンを修正し、実際にそれを収益性の高いものにして時価総額を10倍にするために連れてこられました。そして今、プロダクトの人間がそこでの船の指揮を執ることは良いことだと思います。そしてこの人もAIに深く関わっていくことになるでしょう。関連性を保つためにはそうしなければならず、そうでなければこれがAppleの終わりになります。アプリストアも同じです。オペレーティングシステム、アプリストア、すべてがエージェンティックになれば、それはアプリの終わり、アプリストアの終わりであり、彼らが開発者に請求するこの30%の手数料を通じて多くの収益を上げる時代の終わりかもしれません。ですからこれはもう一つの興味深い競争になるでしょう。OpenAI対全員です。今、彼らはAppleも狙っています。私たちのモバイルデバイスがこれからどのようにコンピューティングリソースになるのか、非常に興味深いと思います。つまり、インターネットに接続するスマートフォンを持ち歩くだけでなく、計算を行い、機能し操作するための独自の頭脳を持つものを誰もが持ち歩くようになるのです。それはかなり興味深い未来がやってきていると言えます。そしてAppleの人々がこの変化のスピードについていくためにリーダーシップを変えなければならないほど十分に早く反応しなかったと考えるのは狂気の沙汰です。おそらく彼らはモバイルデバイスを作成するためのQualcommとOpenAIのこのチップのコラボレーションについて噂を聞いたに違いありません。そして株主や取締役会は、私たちの携帯電話に新しいチップを搭載することを考えているといいのだけど、みたいな感じだったのでしょう。そしてその時点で部屋は静まり返り、ええ、でももしかしたらそれらのアイデアはティム・クックの後に次に引き継ぐ予定だった人物から出たもので、将来への確実な賭けとしてのような形では採用されなかったのだと気づいたのでしょう。それはティム・クックの弱点のようです。

そしてこれはすべて、実際に消費者に触れられているデバイスとアプリが、収益を生み出したり、最も多くのマージンや利益を生み出したりするものに要約されるのでしょうか。私たちがCursorのハーネスなどを例に挙げて話してきたように、彼らがユーザーベースを持っていれば、モデルはバックエンドでプラグインされていますが、モデルプロバイダーは高価で限られた計算リソースを実行する必要があります。価値はどこに流れるのでしょうか。最終的に誰がここで勝つのでしょうか。結局のところハードウェアであるため、デバイスはかなり大きな要因だと思います。私は消費者市場で成功しているオープンソースのハードウェア企業をその意味で知りません。そして今日あなたをAppleに縛り付けているのは、あなたの異なるデバイスがすべて接続されていることです。そして私たちが未来に望むのは、私たちのAIがデバイス間でコンテキストを持てるようになることです。ですからデバイスレイヤーを攻略できることは重要な部分になるでしょう。そしてOpenAIにとって、もし彼らがモバイルで成功したら、ラップトップにも進出するかもしれません。なぜならエコシステムに両方のデバイスがあることは理にかなっているからです。それからAirPodsもあります。

2年後にこの電話が出たとき、私たちはまだラップトップを必要とする、または使用したいと思うでしょうか。なぜなら私たちは皆、どうやって自分の電話でClaudeデスクトップアプリを制御できるのかと言っているからです。誰ももう実際にラップトップを使いたがっていません。私たちは皆、移動中にデバイスに話しかけながら物事をこなしたいのです。毎日机に向かっていたくはありません。ですからラップトップに未来はあるのでしょうか。それが問題です。それについてはもう少し長く考えなければなりません。何らかのラップトップを持たないことを想像するのは少し難しいです。あるいはおそらくタブレットだけで、キーボードは必要ないのかもしれませんが。あるいはどこかのVPSですね。私はベッドで横になっていて、ああ、このメモを私のVPSに保存したいけれど、私のOpenClaudeはもう動いていない、私のメモをVPSに入れるために、本当にClaudeデスクトップアプリを立ち上げる必要があるのだろうかと考えています。でももしTelegramにチャットするだけでできたらどうでしょう。

もうすでに2回も言及しているのでまたこの男に言及するのは嫌ですが、彼には常に答えがあるようです。Neuralinkがありますよね。それは直接的なコミュニケーションです。そしてあなたの脳で、あなたがIPO前の株式を買うことができるそれらの暗号資産プラットフォームの1つで、430億ドルの評価額でNeuralinkに投資できるのを見ました。これも悪い賭けではないと思います。投資のアドバイスではありませんが、他の評価額と比較して430億ドルです。

ええ。もしOpenAIがこのNeuralinkが独占しているような新しいコンピューティングシステムに参加できなかったら、とても皮肉なことです。イーロンはサムに対して恨みを持っているので、彼は彼らを完全に切り捨てるようなものです。いや、お前たちはお前たちは俺たちとは一緒にやれない、悪いな、電話を売り続けな、そう、お前たちの電話で頑張ってなと。おそらく最も面白い結果になるでしょう。

抽象化レイヤーの価値:AIと暗号資産の類似性

ええ。私には抽象化に関する少しの仮説がありました。私たちが話してきた抽象化レイヤー、例えばユーザーがやり取りしているCursorです。それはあなたがやり取りしているモデルを抽象化して取り除いています。ここでちょっと引き出させてください。暗号資産の領域でこれを以前に見たことがあるので、ちょっとした比較ページを作りました。基本的にはモデルプロバイダーと暗号資産のブロックチェーンを比較しています。

さらに具体的にSolanaの例を取り上げます。Solanaをご存知かもしれませんが、Solanaがブロックチェーンです。それをベースモデルを実行しているOpenAIやAnthropicと比較してください。そしてブロックチェーンの上に新しいパラダイム、基本的にDeFi、分散型金融がありました。そこには分散型金融を行うことができる第2のレイヤーがあり、トークンをスワップでき、LPが必要です。私はそれをAI時代において、モデルとユーザーが実際にやり取りするレイヤーを接続するMCPとして見ています。MCP、API、何と呼びたいものでもデータベースでも。しかしその上に価値を獲得する実際のアプリがあります。そしてこれらの研究所が今、これらの抽象化レイヤーを提供することに賭けているのがわかります。OpenAIにはCodexがあり、ClaudeやAnthropicにはClaude CodeやClaudeデスクトップアプリがありますが、Cursorもあります。そしてここで興味深いのは、ブロックチェーンや暗号資産では、最上位レイヤーのウォレット、例えば最も使用されているウォレットの1つであるPhantomがありましたが、彼らは実際にこのスタック全体から最も多くのお金を稼いだということです。Solanaは手数料でわずかなお金を稼いだだけでした。そしてJupiterもスワップ手数料で少しのお金を稼ぎますが、彼らはインフラを提供し、その後ユーザーが実際にやり取りするすべてを抽象化するレイヤーが最も多くのお金を稼ぎます。なぜなら彼らは手数料やマージンの1から2%を取り、数百万を稼ぐからです。

どういうわけか私はここに相関関係を見出しました。このAI開発は、抽象化レイヤーが実際にこのスタック全体で最も多くのお金を稼いでいる暗号資産開発と似たような方向に進んでいます。そこで価値の流れを見てみると、ビルダーやナレッジワーカーはCursorとやり取りします。暗号資産ではユーザーがウォレットであるPhantomとやり取りし、バックエンドですべての物事が起こります。しかしAnthropicとOpenAIはそれらのモデルを実行し続けなければならず、計算リソースに投資する必要があります。私たちは計算リソースの制約についてたくさん話してきましたが、それはブロックチェーンでも同じでした。これは正しいでしょうか。私はここで正しい考え方をしていますか。私たちがアプリレイヤーについて、アプリレイヤーはAIで実際にお金を稼げるのだろうかと疑問に思ってきたので、これは少し逆張りの意見かもしれません。しかし私がこのように見ると、アプリレイヤーこそがお金のある場所だと本当に思います。

ええ、それは本当に興味深いです。このポッドキャストのエピソードも11回目になり、ますます進んでいます。どこに価値が蓄積されているのかについての私たちの仮説を固め続けているだけです。もし私たちがこれら11週間の間にCursorが言及された回数、Perplexityが言及された回数を見るなら、AIがいかに早く動いているかを考えれば11週間は長い時間です。私たちは一貫して、抽象化レイヤーが価値の蓄積する場所であるという結論に達しているのかもしれません。私はそれを、ブランディングはどこにあるか、ブランドはどこに存在するかに要約します。そしてPhantomはJupiterよりもブランドです。おそらくSolanaは、明らかにすべての中で最もよく知られていると言えるでしょう。なぜならそれは通貨ですが、このエコシステム全体を流れるコモディティのようなものだからです。しかしPhantomは、非常に多くの異なる種類の消費者がその製品に触れるものです。

Phantom製品のユーザーの中には、使いやすさだけを求めて、ウォレット内で直接通貨をスワップしたいだけの人がいると思います。そしてそれらの消費者、そしてその幅広い種類の消費者へのアクセスは、おそらく顧客から価値を引き出すという点で最も良い場所です。なぜなら、おそらく非常にけちで、最高の価格を得るためにこれらすべてのルートを通る人もいれば、Solanaで彼らのミームコインを買いたいだけの人もいるからです。そして彼らは5から10%のマークアップを支払うでしょう。彼らは価格にまったく敏感ではありません。ですから、ええ、これは面白い比較ですね、リック。そしてそれは私に考えさせます。私たちがこのAIの世界をナビゲートする上で、どうやって抽象化レイヤーの製品を構築するのか。私の一部は、このエージェンティックな最初の製品セットがどこに存在するのかと考えています。私たちはClaudeとCodexアプリ内にコネクタを構築すべきなのでしょうか。それは抽象化レイヤーなのでしょうか。そもそも抽象化レイヤーとは何なのでしょうか。しかしそれはおそらく、私たちや聞いている他のみんなにとって、ポッドキャストを超えた話題であり、どのように抽象化レイヤーを定義し、暗号資産で価値が蓄積された場所から教訓を引き出して、AI内で価値がどこに蓄積されるかを考えるということでしょう。

ええ、考えてみれば、最も多くのお金を稼いだプロジェクトは、ある意味でトランザクションを含むものであり、発生する各トランザクションに対して、プロジェクトや企業の利益となる少額の手数料が発生しますよね。それは価値のトランザクションです。そして今考えてみると、彼らはデータが新しい石油だと言います。そしてもしあなたがデータを収集し、さらにデータを接続できるなら、そこに真の価値が発生するのだと思います。ですから、エージェントの頭脳にポップアップ表示させて、エージェントと話している人に、ねえ、このツールを使って、と提案し、エージェントとあなたのデータソースの間で発生するすべてのトランザクションが、あなたが収益を得ることができるトランザクションになります。そしてそれは基本的に抽象化することですが、ユーザーが見ていなくても常に価値が行き来していることだと思います。すべてのツールの呼び出しが、その意味で収益イベントになり得るのです。ええ。理にかなっていますか。

理にかなっています。これはポッドキャストを超えた話ですが、ポッドキャストでブレインストーミングするのは面白いですね。間違いなく。

私はGoogleトレンドを見るのが大好きです。Googleトレンドを見るのに多くの時間を費やしています。私たち全員がそうだと思います。ビジネスを構築しているとき、どうすればエージェントのためのGoogleトレンドを見ることができるか、ツールの呼び出しについて。なぜならそれは私にとって、エージェントがどこを見ているか、そしてそれをどのように活用するかを知るための機会の宝庫だからです。私がAPIレイヤーでかなりの金額を費やして使用している製品に、Apifyと呼ばれるものがあります。私はすべてのソーシャルメディアをスクレイピングするためにそれを使用しています。Apifyに投資する方法があるかどうかはわかりませんが、これらすべてのデータソースにアクセスでき、ほぼ制限されていて、エージェントがアクセスするのがはるかに難しいそのようなタイプの製品は、Apifyのような企業がこのエージェンティックな世界で驚くほどうまくいくと私は100%確信しています。そしてそれはまるで、エージェントが使用できると私たちが考える独自仕様のデータソースをどのように構築できるかを探求すべきだと言っているようなものです。私にとって、それはこの5年の期間内にどこに価値が蓄積されるかをナビゲートするための最も確実な方法だと感じます。

ええ、Apifyは素晴らしい例です。最近私はクライアントワークを行い、クリエイターがブリーフィングやレポーティングなどにAIをどのように使用できるかについてのワークショップを開きました。数日前に彼らとチャットしたとき、彼らはApifyが彼らにとそのデータをスクレイピングして抽出できるようにするための最大のアンロックだったと言っていました。元々彼らは自分たちでそれらのコメントをチェックしに行かなければならず、これらすべてを手動で行わなければなりませんでした。今や彼らは適用し、抽出し、GeminiやClaudeに入れて分析し、そしてドーンとレポーティングができるのです。そしてそれは確かに完璧なユースケースです。かなり制限されたプラットフォームがまだあります。Facebookは非常に制限されています。TikTokはスクレイピングが簡単ではありません。Redditはスクレイピングが難しいです。そしてこれを実際に行うことを可能にするレイヤーとしてのApifyがあります。そのようなものをどうやって構築するかはわかりませんが、そのようなツールに多くの価値があることには本当に同意します。そしてそれは、自分の特定のデータをスクレイピングしたいユーザーのレイヤーがある場所を考える正しい方向です。

しかし第2のレイヤーは、ベストプラクティスを見るためにスクレイピングされたすべてのデータの一般的な分析になるかもしれません。例えば、ソーシャルメディアマネージャーは自分自身の投稿が分析されるのを望んでいないかもしれません。彼らは他人のために何がうまくいくかを知りたいのです。そしてそれはそれ自体がレポートになり得ます。突然それがサブスクリプションビジネスになるのです。それから、スクレイピングされたデータをレポートや調査、基本的にさまざまなAIツールを比較する大量のデータがある私たちの compare ページのように使用します。それ自体におそらくかなりの価値があると思いますが、私たちはそれを十分に活用していません。それはまた別の日の話ですね。このブレインストーミングは最高でした。とても良かったです。

サブスクリプションモデルの終焉と従量課金制

ええ、クールでしたね。GitHub Copilotが6月1日から従量課金制に移行すると発表し、サブスクリプション時代の終わりについての話がいくつかあります。人々はタイムラインで、これが多くのうちの最初のものになるのではないかと疑問に思っています。そして巨大な研究所もサブスクリプションを停止するのでしょうか、それとも制限を下げるのでしょうか。私たちはそれを恐れていましたが、それが先週うまくいったクリップの1つでした。みんなどう思いますか。これが多くのうちの最初のものになるのでしょうか。

ええ。Claudeはそれをオフにするつもりでしょうか。ええ。基本的に過去3年間、現実には定額のAIサブスクリプションコストがありましたが、秘密裏に起こっていたのは、ライトユーザーからパワーユーザーへの富の移転でした。基本的にVCの投資家から私たち全員への移転ですが、月額20ドルを支払っていたカジュアルなコーダーは、Cursorを開きっぱなしにして、9時から9時まで作業していた熱狂的な開発者に補助金を出していたのです。その計算は、誰か、通常はVCがその差額を喜んで支払う限りはうまくいきますが、その後GitHub Copilotは、人々が以前の10倍、20倍も費やしていたこと、それらの人々がパワーユーザーであったことに気づきました。私は今日のポッドキャストでさえ何度かこれを取り上げましたが、私はこの時間枠の中でできるだけパワーユーザーになろうとしているだけです。

ディラン・パテルが今週のポッドキャストで話しているのを聞いたのですが、彼はこう言っていました。今日、一部の人々、エンジニアの半数は、1日1時間働き、基本的にその1時間で8時間分のタスクを完了しています。ディランは人々に挑戦しています。いや、外に出て8時間働きなさい。しかしその8時間で通常得られるものの5から6倍のリターンを得て、アウトプットの観点から毎日40時間働くようなことをしなさいと。この時間枠の中で。ええ。基本的に、GitHub、Copilot、これらすべての企業は、これらのより高いコストを強制していると思います。なぜならついに2026年5月、私たちは壊滅的な計算リソースの制約にぶつかったからです。これはすべて計算リソースと私たちがそれを十分に持っていないということに帰着します。

ええ、あなたがそこで言及したことは面白いですね。昨日私は自分のClaudeアプリを開いて、私の週間制限が6時間後にリセットされるのを見ました。私は、え、何、週間制限の66%しか使ってない、最悪だ、全然使い切ってないと思いました。そして私の時間ごとの制限は37分でリセットされようとしていました。だから私はこれを使い切ろうと思いました。そして時間ごとの制限を使い切りました。私は実際にはやらなくてもいいタスクをやっていました。自分の脳全体を要約したり、タスクを要約したり、大きなタスクをやりました。SEO記事の執筆をやりました。その時間、つまり37分で私は時間枠の最大値に達し、ドーン、私は10分待たなければならず、そして次のコーホートが始まりました。ドーン、私は同じことをやり、1時間以内に再び最大値に達し、週間制限の66%から週間消費量の82%になりました。なぜなら私は最大にしたい、私はパワーユーザーになりたい、テーブルの上に34%のトークンを残したままにはできない、私はこれにお金を払っているのだからという理由だけで。だから今私はテーブルの上に18%のトークンしか残さず、ベッドに行くことができました。ええ、寝るべきだった夜の1時間を費やしたけれど、まあ、それだけの価値はあります。お金を払っているんですから。

ええ。それは休日に家に帰って、両親がお皿の上の食べ物は全部食べなさいよと言うようなものです。無駄にしたくはないですからね。

ええ。でもそれはClaudeのクレジットのことです。ええ。私もちょうど自分のも見ました。私はその週で30%で、14時間後にリセットされます。だから、ええ、わかっています。でも、でも、でも、そこがポイントなんです。25%の制限が、100ドルのプランと200ドルのプランで異なるところです。だから私は100ドルのプランを超えていますが、200ドルのプランには戻っていません。

本当に。
ええ。私は水曜日に戻りました。なぜなら機能停止というかバグがあって、人々が私にメールをしてきていて、私は中毒者なんです。私は200ドルプランの中毒者です。まさに。ええ。

ClaudeとCursorのセキュリティ機能競争

さて戻りましょう。私たちは今Claudeについて話してきましたので、すでに移行を済ませました。Claude関連の発表に戻ります。もちろん、AnthropicはClaudeのさらなるニュースを発表しました。彼らはClaude Securityがクラウドのエンタープライズ顧客向けにパブリックベータになったと発表しました。ここで私の頭に最初に浮かんだのは、これは基本的にパッチを当てたMythosをClaude Securityに入れたものなのではないかということでした。そして今、企業は実際にこの製品を使用して、そこにあるあらゆる脆弱性にパッチを当てることができるようになったのではないかと。Claudeは、というかAnthropicはMythosをリリースしていませんが、そのセキュリティ機能だけをリリースするかもしれません。私の推測ですが。でもみんな、どう思いますか。Claude Security。つまり、これは新しいものなのでしょうか、それともすでに可能だったもので、彼らは単に新しいコンテキストプロンプトを発表しているだけなのでしょうか。私が疑問に思っているのはそこです。これは本当に飛躍なのでしょうか。彼らがこのようなものを立ち上げてくれて嬉しいです。

私はこれまでのところ信頼できるツールを試したことがありません。ですから、もしすでにこのアプリケーションレイヤーを構築した人がいたとしたら、私は良いものを知りませんでした。すでに存在していたものを何か聞いたことがありますか。

CodeRabbitなど、コードをチェックするものがいくつかあると思います。でもええ、私の推測では彼らはMythos製品の範囲を制限しているのだと思います。サイバーセキュリティは非常に大きな産業であり、背後には多くのお金があります。Anthropicはこのモデル、Mythosモデルをリリースするリソースを持っていません。しかし彼らは、オーケー、これがMythosモデルの最良のユースケースなので、これを人々に提供しようと言っているのです。これに関連するコストがあるかどうかはわかりません。なぜなら、これがOpus 4.7のコストと同等なのか、それとも高いのか気になるところですが、本当に、本当にスマートです。

ええ、もしこれの目的が、あなたのシステムをハッキングできるMythosをリリースする前に、全員のシステムを保護するためにMythosをリリースすることだとしたら、これは他の企業が見習うべき非常に良いベストプラクティスです。なぜなら同じ技術がハッキングに使用される前に保護するためのサービスを提供しているからです。多くの人が恐れている問題を解決する非常に良い慣行だと思います。

ええ、間違いなく。Project GlasswingでMythosを10、15、20の企業に提供し、彼らがコードを強化できるようにしたことは、間違いなく戦略的な展開です。そして今、次のモデルが公開されるときに備えてコードを強化できるように、彼らはこれをエンタープライズ顧客に提供しています。そして、次に表示するツイートの1つですでにお分かりのように、GPT 5.5はMythosの能力に近いパフォーマンスを示しています。ですから私たちは、AIが脆弱性を見つけるという点で実際に非常に良くなってきているこの時点に到達しつつあると思います。そしてええ、ClaudeやAnthropicがこれを発表したのは良いことです。

面白いのは、その2時間後にCursorがCursor Security Reviewsを発表したことです。私たちはハーネスと抽象化レイヤーについて話していました。私はこれがとても面白いと思いました。ClaudeやAnthropicがそれを発表した2時間後、ええと、Cursorが基本的に同様の機能を発表しました。これはAnthropicのモデルに基づいているのではないかと私は推測しています。ですから、これらの機能はすでにモデルにあるのだろうかと考えているのです。

ええ。その通りです。私が言ったように、ビデオでさえ同じように見えますからね。本当にその通りです。ええ。

なんてことだ。面白くて、少し大人げない感じもします。しかし、Cursorが多くのエンタープライズクライアントを抱えているという側面から考えてみてください。もし突然エンタープライズクライアントの全員が電話をかけてきて、Claude Codeに切り替えようと思っているのだけど、セキュリティチェックは提供していると言い始めたら、当然あなたは、ああ、ええ、それも明日リリースしますよ、心配しないでと言うでしょう。ええ。いや、その通りです。ええ。文字通り2時間の間隔でした。

MythosとGPT 5.5:サイバーセキュリティの脅威

その後、All-Inポッドキャストのデビッド・サックスがMythosの謎を解き明かし、Mythosは魔法ではない、終末の兵器でもない、サイバータスクを自動化できる多くのモデルの最初のものであると書き、この画像を共有しました。GPT 5.5とMythosを比較すると、彼らはこのグラフで実際に非常に似たスコアを出しています。ですから、人々はAnthropicがMythosをリリースしないのは計算リソースの制約のためだと言っていますが、実際にはGPT 5.5も同様の機能を持っています。そして私たちはポッドキャストでもこのことを言ってきましたよね。Mythosは、何が可能かを全員に恐れさせる単なるマーケティングのスタントであった可能性も十分にあります。しかし、それは本当にそれほど大きな飛躍なのでしょうか。私たちにはわかりません。モデルの能力が非常に急速に向上しており、彼らは今や異なるものを連鎖させることができ、より大きなコンテキストウィンドウとより大きな推論能力により、以前は単に不可能だった特定の結果に実際に到達できるようになったというだけのことです。皆さんここでどう思いますか。これは驚きでしょうか。Mythosは本当にそれほど恐ろしいのでしょうか。

いや、彼らの側からの良いマーケティングだったという意味で、まさにその通りだったと思います。彼らは、おそらく先週も言及したように、Googleからその投資を受けており、Googleを通じてより多くの計算リソースを得るルートがあるようです。ですから彼らがMythosの展開を始めるのも時間の問題だと思います。しかし私は実際にGPT 5.5がどれほど競争力があるかを見て驚いています。少なくともあのチャート上では。

ええ。サックスはここ数週間、Anthropicに対して驚くほど声を大にして反対しています。皆さんがAll-Inポッドキャストでそれに気づいたかどうかはわかりませんが、彼がトランプ政権を離れ、公式なAI皇帝を辞任して以来、彼は本当にAnthropicを攻撃しています。彼は彼らの嘘と思われるものを指摘しています。彼は、彼らが恐怖を煽り、これらすべての種類の脅威の戦術を行っていると言っています。そしてそれは、サックスとジェイソン・カラカニスの感情の違いを見るのは興味深いです。一方には、おそらくサム・アルトマンを嫌っているためによりAnthropic寄りのジェイソン・カラカニスがいます。もう一方には、OpenAI寄りのデビッド・サックスがいます。ええ、わかりません。私にとって、ダリオが政治的にどう感じているか対サム・アルトマンに基づいて、彼らの両方の感情がどれほど政治的に動機付けられているのかは疑問です。サム・アルトマンはおそらくリバタリアンです。サム・アルトマンは資本主義以外のことは気にしていないと思います。一方、ダリオはおそらく同じ意味での資本主義者ではありません。Anthropicが非常に利益を上げていることを考えると皮肉だと思います。つまり彼らはその意味で利益を上げていますが、彼がアプローチしているレンズは、還元したり何かしたりできるようにできるだけ多くのお金を稼ぎたいというものだと思います。そこにはこの利他的な、あるいは少なくとも効果的利他主義的な収益性へのアプローチの仕方があるように感じます。ええ、とにかく、それがこの件に関する私の最大の観察でした。ええ、GPT 5.5はサイバーセキュリティに関してはMythosと同等のようです。しかし同時に、サックスとジェイソン・カラカニスがこのAIボット全体でどのように味方を選んでいるかを行間から読み取るのも魅力的です。彼らは常にGrokのこともかなり信じているようですが、その意味ではイーロンのファンです。ええ、彼らは親友ですから。ええ、彼らはそうです。ええ。

面白いですね。これらのモデルに事前にアクセスできる人々の言っていることさえ、あなたは本当に信用することはできません。なぜならブラッド・ガースナーは、ああ、Mythosは、私はそれを見た、あと1週間かそこらで出るよと言っていました。それは3、4週間前のことでした。ですから私は、これらの企業の誰も、これらのものがいつ出るのか実際には知らないのだと心から思います。このウェブ全体の感情を追跡するというアイデアは興味深いと思います。なぜなら、それ以外にどうやって偏りのない意見を得ることができるでしょうか。誰もが自分自身のバイアスを持っているので、1人の人間からそれを得ることはできませんが、群衆を追跡すれば、トレンドがどこに向かっているか、あるいは変化しているかを見ることができるかもしれません。

SpaceXの1兆ドル評価とイーロンの報酬

歴史上最大のIPOへの動きが来ています。評価額1兆ドル以上です。SpaceX、OpenAI、Anthropicの3社が現在すべて1兆ドル以上と評価されており、これはかなり印象的です。しかし考えてみると、私の頭に最初に浮かぶのは、Anthropicは純粋なAI。OpenAIも純粋なAI。SpaceXのAIは純粋なAIではありません。しかしそれを比較してみると、SpaceXのAI側の価値とSpaceXの宇宙側の価値は実際にはどうなるのでしょうか。なぜなら、SpaceXの宇宙側こそが真の価値が生まれる場所であり、AI側は少しのオマケのようなものだと思うからです。しかし、AI側でさえOpenAIやAnthropicの評価額に近づくかもしれないと感じています。SpaceXはここでは過小評価されているのでしょうか。次に、イーロンの報酬パッケージとそこでの目標についても話すつもりです。しかしここで私たちは何を考えているのでしょうか。そして誰が最初に行くべきで、これはしばらくの間市場の頂点になるのでしょうか。なぜなら多くの人がこれについて話しているのを見たからです。ああ、これらの企業が上場すれば、これは間違いなく頂点のピークかバブルになるだろうと。しかし、もし多くの人が同じことを言っているのを聞けば、私はむしろ反対のことに同意する傾向があるかもしれません。ここで私たちはどう思いますか。これは公正な価値でしょうか、それともはるかに過大評価されているのでしょうか。ルカ、おそらくあなたから始められますか。

ええ、収益だけを見れば、SpaceXは収益が少ないにもかかわらず高く評価されています。ですからその評価は将来の可能性に基づいています。OpenAIとAnthropicの評価額はSpaceXの隣では少し高く見えると言えるでしょう。しかしSpaceXの収益のほとんどすべてがStarlinkからのものであることを考慮すると、残りの事業が投資可能または安全な投資と見なされるまでには、成熟するためにはるかに多くの時間がかかることに気づきます。ええ、彼らはすでに宇宙へのロケットの打ち上げにおいて非常に確立されており、AI製品を持っていますが、どれくらいの時間が経過したかを考慮すると、それらのビジネスモデルはまだ利益を上げていないか、十分に早く成長していません。

ベン。
ええ。では同時にゲームをしましょう。私たち全員が3つのうちどの企業に投資するかを叫ばなければなりません。みんなやりたいですか。では3からカウントダウンします。オーケー。ええ。ええ。ええ。3、2、1。SpaceX。SpaceX。ええ。オーケー。よし。よし。これで決まりですね。これで決まりです。

ええ。なぜですか。なぜですか。なぜなら、今のところ、私が先ほど言ったように、私たちは現在の価値ではなく彼らの将来の可能性に基づいているからです。それは性格的なものでしょうか。なぜならもしあなたが伝統的な投資家なら、OpenAIとAnthropicの数字の方がより面白く見えるかもしれませんが、もしあなたが未来に賭けることを厭わないビジョンの人なら、SpaceXは明確な賭けですよね。

ええ、そしてまた確かに私はそれに完全に同意します。そしてOpenAIやAnthropicを見ると、彼らのTAMは基本的には制限されています。計算リソースが制限されており、もし彼らがここからさらに10倍になるつもりなら、彼らは文字通り全世界のすべてのエネルギーを使っていることになります。一方SpaceXはまったく新しい市場を開拓しています。彼らは地球を離れようとしています。火星に行くかもしれません。新しいエネルギー源を見つけるかもしれません。宇宙に物を輸送しようとしています。新しい電気通信を創造しています。彼らが進むことができる多くの新しい方向性があります。一方、他の2社は収益を正当化し成長させ続けるために、彼らがしていることに非常に集中しなければなりません。ですから、ええ。

ええ。完全に理にかなっています。そしてOpenAIとAnthropicには競争相手がいますよね。そしてSpaceXはNが1です。彼らはこれらの異なる種類のすべてのことができるこの分野の唯一の企業です。イーロンに何か恐ろしいことが起こらない限り。そこにははるかに多くのアップサイドがあると感じます。企業は20兆ドルになる可能性があります。非常に多くの価値を蓄積するでしょうし、過去にも継続してそうしてきました。ですから、ええ、これは報酬パッケージ全体の話への良い移行ですね。リック、そこを始めてもらえませんか。

ええ。ええ。SpaceXについて言えば、イーロン、つまりSpaceXの取締役会はイーロンの新しい報酬パッケージを承認したばかりです。そして私たちはイーロンがいくつかのクレイジーな報酬パッケージの取引を設定し、Teslaでそれを実現したことを知っています。彼の前の報酬パッケージは時価総額の10倍のようで、彼はそれをやりのけました。さて、このパッケージには、SpaceXが7.5兆ドルの評価額に達した場合にのみ、彼に株式(2億株のスーパー議決権株)が支払われるという内容が含まれています。そして、これがクレイジーな部分ですが、少なくとも100万人の恒久的な火星コロニーを設立すること。今私は考えているのですが、彼は本当にこれが自分の生きている間に起こると期待しているのでしょうか。それとも、彼は自分の寿命をさらに数年、何年も延ばすことができると信じているのでしょうか。なぜなら今後30年間で火星に100万人が住むことになるとはこれまで考えたこともなかったからです。皆さんはこれを予想していますか。そしてこの報酬パッケージあるいはこの取引についてどう思いますか。

あなたが彼の寿命を延ばすという最後の部分を言うまで、私はそれを笑い話だと思っていました。なぜなら今後50年というのは現実離れしているように思えたからです。それは非常に長く、おそらく通常の寿命の上限でさえあるからです。だからあなたが考えるに、もし彼がNeuralinkを入れて、彼の脳をNeuralinkに入れ、そしてイーロン・Grokになり、彼らが実際にそれを成し遂げた場合、Grokが実際にそれらすべての株式を所有できるということでしょうか。おそらくそれが彼が自分の命を延ばしたい方法なのでしょう。彼の体はここにはないかもしれませんが、彼の脳は生き続けるかもしれません。誰がわかるでしょう。ある意味で考えるべき奇妙なことです。つまり。

ああ、彼はそうします。ええ。一体この人は何を考えているのでしょうか。つまり、Teslaのときやあの前の報酬パッケージが何だったかに至ったときにも、人々は同じことを言っていました。おそらくそれを引き出すことができるでしょう。正確に何だったかは覚えていませんが、クレイジーでした。人々はそれを笑いました。CNBCのアンドリュー・ロス・ソーキンが、イーロンがTeslaが1兆ドルの評価額に達したらこの額を支払われるという2015年か2016年の報酬パッケージを文字通り笑っているビデオがあるのを覚えています。そして彼らはそれをやりました。私にとって、もう一つのクレイジーな部分は100テラワットの計算リソースです。なぜなら私はClaudeに、すべてのデータセンターの現在のグローバルなデータセンター容量はどれくらいかと尋ねたのですが、それは0.1テラワットでした。ですからイーロンは、SpaceXが現在のテラワットの計算リソースの1000倍以上のものを宇宙に打ち上げることができるようになることに賭けているのです。驚くべきことです。信じられません。今日私たちが見ているものの1000倍です。

そしてもう一方では、イーロンはお金のことなど気にしていないと思います。本当にそう思います。彼はただ、彼の会社や地球、そして人類の目標を推進することにだけ関心があるのだと思います。そして私にとって、これは極めて一致しています。人々を火星に送り、AIデータセンターを宇宙に送ること。これらは両方とも、イーロンが現在自社のすべての企業に対して持っているこの包括的な目標を解き放つでしょう。それは私たちが以前には聞いたこともなかった新しい言葉です。豊かさです。豊かさが今のイーロンの人生の目標なのです。もし彼がデータセンターを宇宙に解放し、人々を火星に送ることでそれを達成できるなら、彼は私たちがより豊かな世界に住むことになると感じているのです。

Stripeの金融参入とDNA解析の未来

StripeはStripe Treasuryを発表したばかりで、私のタイムラインの多くのインディーハッカーがこれはゲームを変えるだろうと言っていました。人々はこれが来年私の収益を倍増させるだろうと言っています。もう銀行口座は必要ありません。資金を複数の通貨で保持できます。Stripe上の米国のビジネスに即座に無料で送金できます。メールアドレスだけで160カ国の誰にでも支払いができ、クレジットや残高があります。これは基本的に、キャッシュバックされるあなたが持っているStripeの銀行口座です。これは大きなことだと思います。ベン、あなたは製品でStripeを使っていますよね。Stripe Treasuryを使い始めるつもりですか。そしてこれはあなたにどのような違いをもたらすでしょうか。

ええ、2%のキャッシュバックは面白いですね。私は支払いにStripeを使っていますが、銀行取引にはMercuryを使っています。ご存知のように、スタートアップは銀行取引に関しては苦労することで有名です。有利な金利を提供してくれる素晴らしい製品は実際にはなく、Mercuryでさえ、私が使っているお金に利子はついていないと思います。本当に。そして数年前に遡ると、あのSilicon Valley Bankの問題全体が起こり、銀行の取り付け騒ぎがあり、Silicon Valley Bankは破産しました。他も救済されませんでした。しかし基本的には、これのクールなところは、Stripeが購買に関する私のすべてのデータにアクセスできることだと思います。私のビジネスがどれほど利益を上げているかについて、おそらく他の何よりもStripeが最もよく把握しています。彼らはすべての収益を理解しています。彼らはおそらく私自身よりも上手く、2、3、4ヶ月先の私の収益をかなり正確に予測できるでしょう。ですからその部分はクールです。彼らはおそらくより多くのお金を貸し出し始めることもできるでしょう。彼らがいくつかのクレジットを提供しているのは知っていますが。でもどうでしょう。私はStripeが大好きです。彼らは素晴らしい仕事をしていると思います。彼らは3%を取りますが、それは私が希望するよりも多いですが、それがそれに関しては単にゴールドスタンダードのようです。2%のキャッシュバックは私がこれについて最も興奮するところです。しかし、誰もが以前に銀行取引をしていた場所からシステムを移行させるほど、これが本当にそれほど多くの価値を付加しているのかどうかは様子を見る必要があります。ええ。

いいえ、それはクールです。そしてこれはエージェンティックなワークフローとも間違いなく一致していると思います。これも関連していると思われる別の発表の一部です。ええ。ええ。ここの最後の文は、Stripe MCPを使用して任意のAIアプリからTreasuryを使用すると言っています。つまり、今やエージェントをStripeに接続して、例えばClaudeアプリから銀行取引を行うことさえできるのです。ええ。

つい1ヶ月前くらいにLevelsから来たこのフィードバックを見ました。Stripeにとって論理的なステップは単なる決済サービスではなく実際のフィンテックになることだ。彼らがなぜそれをやらないのか全くわからないと。そして1ヶ月後、彼らは実際にそれをリリースしました。ですからそれはかなり面白いですね。ええ。それから彼は私が言った通りになったとリツイートしていました。私もそれを見ました。ええ。

次に、クイックファイアラウンドをやりましょう。Caliの作成者である若い子、おそらく21歳だと思いますが、少し前にCaliを売却し、新しいステルススタートアップを始め、ローンチ後1ヶ月でMRR17万7000ドルを達成しています。これはかなり信じられないことです。ビジネスの内容はわかりません。それが何なのかわかりませんが、ええ、彼は間違いなくペプチドに進出していると言っているのを見たことがあります。ああ、彼は実は19歳だと思います。ルカ、あなたもそれはおそらく興味のある分野ですよね。あなたはゲノムやペプチドについていくつか情報を送ってくれていましたね。これについてどう思いますか。

今週私は最初のDNAキットを受け取りました。全ゲノムシーケンスを行う予定で、自分の全DNAデータが含まれたファイルを受け取ることになります。その後、このデータを好きなモデルに入力し始め、DNAについて質問することができます。今やコードに精通しているので、好きなだけ具体的に、あるいは一般的に質問することができます。そして質問が具体的であればあるほど、おそらく答えも良くなると思います。なぜならあなたのゲノムは巨大だからです。ですから単に、全部見て何が悪いか教えてと言うのは、これらの特定の状態をチェックしてと言うよりもおそらく難しいでしょう。

そしてこれに対する私の目標は、私はそれを生涯持ち続けるということです。そして、これは少なくとも私が持っているこの新しいビジョンですが、サービスを提供して、人々が直接来て唾液の拭き取りを行い、外部のラボを通じて実際の分析、全ゲノムシーケンスを処理するためのローカルクリニックを開くつもりです。もしそれが地元市場で十分に軌道に乗れば、自分のラボに投資できるかもしれません。ええ、それは素晴らしいアイデアです。

それは今の私の思考の多くを占めていますし、それほどうまくいってまだ成長しているオークション事業があるので、あまり急いではいません。私はそれを維持し、今後数ヶ月間にわたって少しずつこれに取り組み続け、まずは自分自身のためにプロセスについて学び、それから他の人々に提供するつもりです。全ゲノムシーケンスを行う場合、あなたは100%行っており、すべてのDNAがマッピングされます。ですからこれは大きな違いです。しかしええ、似ているのはテストの解像度が異なるというだけです。

私はヒトゲノム計画を調べました。15時間前、ヒトゲノムのシーケンスを行う最初の人物になる競争に勝ったクレイグ・ベンターがちょうど亡くなったという記事があります。彼が文字通りちょうど亡くなったというタイミングは少しクレイジーですね。でもええ、その通りです。イルミナティですね。でもええ、そのシーケンス全体を通過するのに13年かかったのですよね。しかもそれは彼のゲノムの92%しか取得できませんでした。ですからええ、彼がその一部だったというのは興味深いです。ええ。私はまた、これが進む方向だと心から思います。まずゲノムをマッピングし、それからAIを使って本質的にパーソナライズされた医療を作成するのです。

ええ。ええ。私は数ヶ月前に初めて血液検査を行い、それだけでも私にかなり良い洞察を与えてくれました。それらの血液検査の結果をWhoopのデータに入れ、Whoopがそれを分析し、またChatGPTやClaudeにも入れて、自分自身について知らなかった洞察を得ました。しかしそれは、このゲノムよりもはるかに詳細ではないと思います。ゲノムが一体何なのかさえ私は知りません。私はその世界に全くいません。そしてええ、間違いなくフォローアップするのに興味深いことです。そしてそれは異なるデータです。血液検査などを受け、それをAIにかけることも非常に興味深いです。

私が信じているのは、もしサービスとして提供するなら、常に医療専門家を間に置くべきだということです。ハルシネーションを見つけたり、これから何を取り除き、あるいは取り除かないべきかを知っている誰かがいるように。ええ、間違いなく。継続し、フォローアップすべきことです。これがどのように進展するのか、またあなたがそれをどうするのかを見るのが楽しみです。

国防総省のAI導入と業界トレンドの行方

ルカ、今週の最後のトピックになると思いますが、いくつか速報があります。5月1日、今日ですが、金曜日の5月1日、国防総省は主要なAI企業と機密ネットワークに機能を展開する契約を発表しました。数週間前、ニュースで国防総省、Anthropic、OpenAIの件が話題になっていたと思います。これがその続きなのかどうかはわかりませんが、ベン、この話題を主導してくれませんか。

ええ。プレスリリースを読みますが、少し下にスクロールすると、複雑な作戦環境における状況理解を高め、戦闘員の意思決定を強化することを目指していると書かれています。7つの企業はSpaceX、OpenAI、Google、Nvidia、Reflection、Microsoft、AWSです。特にAnthropicはそのリストから外れていますね。しかしSpaceXが今やそのリストに載っているのも注目に値します。ですからSpaceXのGrok、OpenAIのGPT、そしてGoogleのGeminiがあります。NvidiaのNemoやその他のものを使ったオープンソース的なプレイとともに、4つの大きなモデルのうち3つが揃っています。ええ、Anthropicが国防総省との間に起こったこととうまく和解できなかったのを見るのは興味深いです。そして、130万人以上の省の職員がこのプラットフォームを使用し、数千万のプロンプトを生成し、わずか5ヶ月で数十万のエージェントを展開したと書かれています。

ええ、これがどこにつながるかは様子を見る必要がありますが、私は正直、Anthropicの件は終わって、国防総省はすべてのモデルを使用することにオープンになると思っていました。私は依然としてClaudeが最高のモデルだと思いますが、OpenAIも間違いなく僅差で2位です。そして私はここではわかりません。当時、国防総省はAnthropicの下請け業者も国防総省と仕事をしてはならないと言っていたのを覚えています。しかしここには、文字通りAnthropicの主要な投資家であり、Anthropicのユーザーであり、Anthropicが彼らのチップでモデルをトレーニングするのを支援し、その他すべてのことを行っているAWSがいます。最終的には、おそらく彼らが当時恐れていたよりも事態は収束したのだと思います。

その通りです。そしてGoogle、GoogleもAnthropicに400億ドル投資しましたよね。ですから彼らはまだGoogleや他の企業と協力しています。私はそれについて嬉しく思いました。

最後にもう1つゲームをしましょう。オーケー。別のゲームです。ここにGoogleトレンドがあり、OpenClaudeは明らかに青い線で下降傾向にあります。OpenAIもどういうわけか下降傾向にあります。このトレンドを見ると、もしかしたらAI時代はトレンドの面でピークに達したのではないかと思えます。しかし1つ足りません。ChatGPTが足りません。ChatGPTはこのトレンドラインでどこに落ち着くと思いますか。現時点でClaudeの上でしょうか、それとも下でしょうか。

依然としてClaudeのずっと上だと思います。ええ。これは世界規模ですね。
ええ。オーケー。ルカ、どう思いますか。
同じくらいだと思います。
オーケー。あなたは非常に正しいです。依然としてずっと上にあり、正直言って他のすべてを小人のように見せます。だから、わあ。

そしてこれは使用量も反映していると思います。私たちが比較ページに行くと、ちょっとそこに行ってこれを引き上げてみます。OpenAnthropicのユーザーです。これは少し古いデータですが、ええ、ユーザー数という点では、ユーザー数に対する収益は実際の使用量を反映していません。ええ、現時点でおそらくOpenAIあるいはChatGPTは依然としてClaudeの10倍以上のユーザーを抱えていると思います。ですからええ、ChatGPTをあまりGoogle検索しないので追加するのを忘れていましたが、待てよ、OpenAIの代わりにChatGPTを追加すべきだと思って、面白いし見るのも非常に興味深いと思いました。

この勢いを維持しましょう。今回は素晴らしかったです。私たちの最後のエピソードは、他のすべてのエピソードを合わせたよりも多く見られました。ですから今回も同じようにスコアを伸ばすことを願っています。私は世界最高のモデレーターであり、世界最高の2人の共同ホストもいます。ええと、では皆さん、また来週お会いしましょう。貢献をどうもありがとうございました、さようなら。さようなら。さようなら。さようなら。アディオス。さようなら。

アプリのコーディングは新しいポッドキャストの立ち上げです。私たちは3人の男です。ポッドキャストを始めたばかりです。この世界でAIを学ばないのは信じられないほど無謀なことです。すべてがコードです。最近、すべてがコードだと気づきました。ルカ、あなたは何を予測していますか。エコーが運営する水中ドローンです。オーケー。わあ。爆弾発言ですね。詩を書くのにAIを使ってくださいよ、ブラザー。勘弁して。私は世界最高のモデレーターです。ではまた来週お会いしましょう。親友のみんな、愛しています。

コメント

タイトルとURLをコピーしました