本動画では、Semi AnalysisのCEOであるDylan Patelが、OpenAIとOracleの3000億ドル規模の歴史的契約について詳細に解析している。また、AnthropicがOpenAIを2027年には収益面で追い抜く可能性があること、Claude CodeとCodexの比較、そしてGPT-5の高推論モードがOpus 4.1よりも「10IQポイント」優秀である理由について語られている。さらに、AI業界における各企業の戦略的ポジション、特にコード生成市場での競争激化、そして2026年のAIスタートアップ運営戦略についても論じられている。

- OpenAIとOracleの歴史的契約について
- MicrosoftとOpenAIの関係への影響
- 2030年のAI業界リーダー予測
- Anthropicの急成長について
- Anthropicの企業文化と技術的焦点
- コーディング市場への参入戦略
- Codexの最近の改善について
- モデルの応答速度とユーザビリティ
- 両モデルの比較使用
- 開発時間と効率性のトレードオフ
- AI開発ツールの競争状況
- AI生産性向上の将来性
- 長期記憶とコンテキストの課題
- モデルの特殊化と差別化
- コードと数学以外の分野でのAI進歩
- AIによる研究能力の拡張
- 一般化への道筋
- プロンプティングスキルの重要性
- コンテキストの重要性と課題
- スクリーンレコーディングとコンテキスト理解
- 人間とAIの注意メカニズムの違い
- プラットフォーム制約とモバイルでの課題
- MCPソリューションと制約
- 企業効率性とコンピューター使用
- AppleとGoogleのモバイル戦略
- Gemini 3の期待とGoogle の立ち位置
- YouTubeデータの優位性
- コア入力要素の重要性
- xAIとElonの位置づけ
- CEO達の誇大宣伝について
- 現実対誇大宣伝のスペクトラム
- AIスタートアップへのアドバイス
OpenAIとOracleの歴史的契約について
私はAnthropicについて、彼らは少しカルト的だと思います。Anthropicは理由があってOpenAIを去ったのです。現在の彼らの収益成長率を見ると、2027年頃にはOpenAIを収益面で上回ることを示唆しており、これは本当に大きな出来事だと思います。Microsoftは自分たちがしくじったことに気づくでしょう。OpenAIが「この期間内にこれだけの計算資源が必要です」と言った時、Microsoftからの明らかな答えは「君たちは300億ドルどころか30億ドルすら持っていないじゃないか。どうやってこれを支払うつもりなんだ?」というものでした。
GPT-5の高推論モードは、Opus 4.1よりも少なくとも10IQポイント賢いと思います。すごいですね。その多くは推論能力によるもので、GPT-5は非常に長時間推論を行います。一方、Opusには制限があります。非公式のMCPが存在することはないでしょう。それは単に起こり得ないことです。
こちらはDylan Patel、Semi AnalysisのファウンダーでCEOです。このポッドキャストでは、OpenAIとAnthropicの戦い、CodexがClaude Codeより優れているかどうか、そして2026年にスタートアップがどのように運営すべきかについて話し合います。Dylanは主要なAI企業すべてにインサイダーを持っています。
もしあなたがAIについて真剣で、未来がどこに向かっているかを知りたいなら、最後まで必ず視聴してください。これはDavid Andreポッドキャストです。どうぞお楽しみください。
それでは、Dylan。ポッドキャストへようこそ。OpenAIとOracleの最近の契約についてどう思いますか。Larry Ellisonは一日で個人純資産が1000億ドル以上増えました。今や世界一の富豪です。この契約についてどう思いますか?
この契約の進め方は、おそらく株式史上最も前例のないことです。これまでに発表された2社間の契約としては最大規模かもしれません。実際、これは途方もない量の計算資源です。文字通り数ギガワットです。
そしてOpenAIに途方もない量の計算資源を確保することだけでなく、本当に興味深いのは、Oracleが4年間のガイダンスを発表したことです。彼らは今後4年間の収益がどうなるかを皆に伝えました。これまでこれをした企業はありません。多くの企業は四半期しかガイドしません。「十分な可視性がない」として、年単位のガイドすらしません。
ところがOracleは「いえいえ、私たちは今後4年間のすべてが見えています。これが私たちの収益です」と言ったのです。これはちょっと異常ですよね。当然、Oracle株は40%ほど急騰し、Larryは世界一の富豪になりました。面白いのは、彼の純資産がOpenAI契約の規模より少し大きいということです。これは面白い見方ですね。
つまり、これによりOpenAIは世界でも有数の計算資源を持つことになり、既存のハイパースケーラーには縛られません。競合しない企業との契約ですからね。AnthropicはAmazonやGoogleと提携していますが、これらは競合しようとしています(下手ながらも)。MicrosoftもOpenAIと競合しようとしています(これも下手ですが)。しかしOpenAIは完全に独立した立場にあります。Oracleは実際にはAIを構築しようとしていないからです。
MicrosoftとOpenAIの関係への影響
この関係からMicrosoftとOpenAIの関係にどのような影響があると思いますか?
Microsoftは関係から手を引いたことで失敗したと気づくと思います。それが主な要因です。Microsoftにはこの契約全体を実行する能力がありました。しかし、OpenAIが「この期間内にこれだけの計算資源が必要です」と言った時、彼らは心配になりました。金融ブローカーで技術を完全に信じていない人たちからの明らかな答えは「君たちは300億ドルどころか30億ドルすら持っていない。どうやってこれを支払うつもりなんだ?」でした。現在のARRベースで140億ドル、300億ドルを調達したもののすでに多くを支出し、多くをコミットしています。どうやって私とさらに300億ドル、ましてやさらに300億ドルを使うつもりなのか?契約の規模は300億ドルなのです。これが彼らがやらなかった理由です。彼らは後悔し始めていると思います。
2030年のAI業界リーダー予測
2030年になって、どの会社がARSを主導していると思いますか?
OpenAIが業界をリードするのは明らかだと思います。
Anthropicにも可能性があると思いますし、インフラストラクチャ面ではOpenAIがより多くのことをしていますが、モデル面や成長面ではAnthropicが潜在的に先行しており、OpenAIを追い抜く可能性があります。しかし、他に参入できる余地はありません。
Anthropicの急成長について
Anthropicは急成長していますね。過去2年間はARRが10倍ずつ増加し、評価額の成長率ではOpenAIより速いペースです。この成長は続くと思いますか?また、なぜこれほど多くの研究者やエリートAI人材がAnthropicに留まったり移ったりするのでしょうか?
Anthropicについて考える際、現在の収益成長率は、両社の成長率を比較し、どちらも成長率が鈍化すると仮定しても、2027年頃にはOpenAIを収益面で上回ることを示唆しています。これは収益面で本当に大きな出来事です。OpenAIが大きなヘッドスタートを切っているにもかかわらず、Anthropicが肉薄しています。これは、多くのユースケースで彼らのモデルが本当に優秀だからです。
日常的なチャット使用や検索、そのような問い合わせについては、ChatGPTがまだ優秀です。しかし、AIコーディング、AIコンピューター使用、生産的なタスクという重要な分野では、Anthropicが先行しています。これが彼らの賭けです。
OpenAIはこれらの分野で追いつこうとしていますが、まだかなり遅れています。Anthropicが全般的により優秀な理由については、これは少しカルト的だからです。彼らは他のどのラボよりもミッションを信じています。
Anthropicの企業文化と技術的焦点
OpenAIの人々もカルト的ではありますが、AGIに対する集中度と専念度、AGIのビジョンと構築に必要なことを考えると、非常に統一されています。彼らは純粋に「まずソフトウェア工学を解決し、それを使って他のすべてのピースを構築する必要がある」「まずコンピューター使用を解決して、AGI構築を加速させる必要がある」と考えています。必要なのはAIが常にAI構築を加速できるようにすることで、これがAnthropicの焦点です。
一方、OpenAIには多くの他の目標があります。社内の全員がそれに取り組んでいるわけではありません。多くの人が検索に取り組み、多くの人が消費者マネタイゼーションや他のさまざまなことに取り組んでいます。つまり、彼らには焦点がありません。
なぜそうなのかというと、Anthropicには7人の共同創設者がいて、すべて同等の株式を持ち、この共同創設者たちは正確にこのミッションに集中していました。彼らには理由があってOpenAIを去りました。彼らは集中し、OpenAIの指導陣よりも強く明確なビジョンを持っていることを見ていました。OpenAIの指導陣もAGIなどを完全に信じていますが、そこに到達する方法、到達するために何をするかのビジョンは大きく異なります。
彼らには極めて技術的な共同創設者がいます。一方OpenAIでは、Samはあまり技術的ではありません。もちろんGregは共同創設者で極めて技術的です、私も完全に同意します。しかし、Gregは皆が言うところでは「我が道か、さもなくば出て行け」的な人物です。一方Anthropicは7人なので、彼らの複数が技術的で、そこにはより多くのダイナミズムがあります。
明確なビジョンがありながら、異なるタイプの技術リーダーシップもあります。Darioの特質とTomの特質は異なり、リストを下っていくと、異なる種類のリーダーシップがあり、これが大いに役立っています。一方、Samは彼の個性があり、Gregは彼の個性があります。両者の厳格さが異なる人々を遠ざけてきました。Samに腹を立てて去った人もいれば、Gregのせいで去った人もいます。これが異なる文化を生み出しています。
コーディング市場への参入戦略
あなたがコーディング市場に参入しようとしているという点に同意します。これはGPT-5プレゼンテーションからの私の最大の収穫の一つでした。彼らは7億人の週間アクティブユーザーがいますが、その多くは無料アプリを使用しているだけです。一方、Anthropicはユーザー数は少ないかもしれませんが、人々がClaude Codeに月200ドルを支払っています。
OpenAIは実際にお金を持っているソフトウェアエンジニア(私の意見では実際にお金を持っている消費者タイプの一つ)からの素晴らしい収益を得ようとしていると思いますか?
はい、そうです。GPT-5の大きな焦点は対抗することでした。だからローンチ時に、すでにCursorがデフォルトを切り替えていました。これは重要でした。彼らがコードに焦点を当て、コードをより良くすることに焦点を当て、そこでの成果を向上させることに焦点を当てていたからです。
もう一つはOpenAIのCodexでしょう。彼らはWindsurfを買収しようとしました。明らかにこの市場を見ています。OpenAIが同じようにそれを定着させるのに苦労しているだけです。他にも多くの焦点があります。
Codexの最近の改善について
Codexについて言えば、特に先月、Codexは大幅に改善され、あまり宣伝されていません。文字通り3ヶ月前とは認識できないほどで、多くの人がClaude Codeから離れています。彼らは文字通り毎日アップデートを提供しています。ソフトウェア開発者市場とその収益を認識していると思います。
人々がClaude Codeから離れていると思いますか?
絶対にそうです。CodexのCLIと拡張機能に向かっています。興味深いですね。Claude Codeはまだ私の好みです。私たちの会社の皆もそうです。人々がCodexを試してみていますが、まあまあです。しかし、多くの人がCLIの方がずっと良いと言います。
Codex agentがクラウドにあり、非同期作業により適しています。10個の異なるタスクを与えることができ、クラウドで実行されます。しかし、VS Codeなどで使用できるCodex CLIやCodex拡張機能は、Claude Codeの競合というよりも優れています。
クラウドは実際には生産性の実践をサポートしていません。コーディング中は単一のタスクに取り組んでいます。10個の異なることを同時に管理したくありません。
理にかなっています。複数のClaude Codeエージェントを動作させる拡張機能もありますよね。しかし、りんごとりんごの比較をすると、高推論努力を伴うGPT-5は、Opus 4.1よりも少なくとも10IQポイント賢いと思います。
しかし、その多くは推論によるものです。GPT-5 highは非常に長時間推論します。Opusには制限があります。Anthropicが同じ量の推論を与えれば、明らかにそれほど単純ではありませんが、彼らがそれを理解すればOpusの方がずっと強いと思います。
モデルの応答速度とユーザビリティ
ウェブで素早い回答が欲しい場合、実際にはClaudeに行ってOpusに質問する方を好みます。GPT-5は即座(劣悪なモデルを使用)か、思考(応答に1分かかる)のどちらかです。
ChatGPTが5秒以内に応答できる単一の大型モデルを持たない状況にどうして陥ったのかわかりません。
確かに中間地点があるべきです。基本的に思考短縮版が必要で、これはAnthropicの思考モデルがやっていることです。5分間思考するのではなく、短い思考をします。
おそらく、2分間ではなく30秒で最良の応答を、即座ではなく15秒で最良の応答を求められる市場の一部が無視されているのかもしれません。ユーザーがノブとして調整できるものかもしれませんね。
そうですね、確実にそれが明らかなUIです。しかし、平均的に言うと、Anthropicモデルは結論に飛びつきやすいと思います。「ああ、問題がわかりました」「あなたは絶対に正しいです」といった具合に。一方、GPT-5 highを使ったCodexは、少なくとも私のテスト(毎日4時間使用)からは、より不確実です。明確な結論を与えるのに苦労していて、一方Claudeモデルははるかに確実です。
ソフトウェアエンジニアリングの観点でそれがどこに向かうかは興味深いですが、正直なところ、両方を使用するのが正解だと思います。
両モデルの比較使用
私は単純なユーザーで、あなたの方がパワーユーザーだと思うので、あなたに譲ります。私は単純に、Claude Codeを押すことからドーパミンを得ています。「はい、はい、はい。ああ、これは間違っています。はい、はい、はい。」
私は単純なユーザーです。あなたの方がこれについてずっと多くの洞察を持っていると思います。
Claude Codeの方がずっと使いやすいです。興味深いことに、OpenAIモデル、特にGPT-5は物事を簡単に説明することができません。彼らは常に可能な限り複雑な言語を使用します。Claude Codeの方がずっと作業しやすく、バグが何か、問題が何かを説明するのを好みます。
Codexがいつ競争力を持つようになったかの変化はいつ起きたのですか?
文字通り先月、日々起きています。Codex CLIは日々アップデートを受けており、時には1日に2回もあります。ターミナルで文字通りアップデートしなければなりません。彼らはそれを発表せず、宣伝もしません。静かに改善されています。
Codex CLIとIDEでのCodex拡張機能は、現在Claude Codeより強力です。使いにくく、洗練されていません。Claude Codeの方が長い間存在しているため、UIが優れています。しかし、複雑で深いバグがある場合、確実にClaude CodeよりもCodexでGPT-5 highを信頼します。
それでも、通常はClaude Codeを使用し、Claudeができないことについてはモデル対実際の製品のどちらが要因なのでしょうか?
実際、両方を使用し、比較しています。新機能の追加やバグ修正など、やりたいことを説明する際、両方にコードベースを分析してもらい、すべてのファイルを読んで計画を提案してもらいます。そして、それを別のモデル(第二のモデル)に与えて評価してもらいます。「代替案があります。どう思いますか?あなたの計画と比較してどうですか?」90%のケースで、両方ともCodex(GPT-5 high)の方が優れていることに同意します。
開発時間と効率性のトレードオフ
構築したいものを作るのに時間がかかりますか?
はい、時間がかかります。確実に5〜7分間推論することもあります。何をすべきかわかっている場合、例えばフロントエンドで、素早いUI変更をしたい場合は、Claude Codeを使う方が良いです。5秒、10秒でボタンを変更できます。
私が話しているのは、バグがあって行き詰まった場合のことです。
これは彼らのモデルの弱点がどこにあるかを示していて興味深いですね。この範囲全体でAnthropicの方がずっと優秀です。OpenAIでは、GPT-5は一般的にずっと速いです。しかし、それはちょっとダメで、GPT-5思考Highは本当に遅いですが、全般的により良いです。
この連続体があって、Anthropicは両端で作業する必要があり、OpenAIはその中間部分で作業する必要があります。少なくともAnthropicは新しいClaudeをすぐにリリースすると言いました。これはおそらくこの面で役立つでしょう。
AI開発ツールの競争状況
数週間以内、もしかするとそれより早いかもしれませんが、4.1よりもかなり優れた新しいClaude、おそらく4.5のようなものが出ます。それが希望です。
コーディング戦争で誰が勝つかはわかりません。あなたが言うほど接戦だとは思いませんでした。認知DevonやWindsurfのような全体的な面についてはどうですか?その方面は近づいていますか?
共有できない情報がありますが、基本的に彼らは競争しようとしていますが、独自のモデルをトレーニングしていません。Cursorがオートコンプリートモデルをトレーニングするような小さなモデルは別として、基盤となる大型モデルはトレーニングしていません。
より統合面に重点を置いています。Devonは企業があり、全員がSlackで作業し、小さなタスクをDevonに委託してエンドツーエンドで完了させる場合により良いです。これらのモデルのツールと活用についてです。
AI生産性向上の将来性
これを質問に置き換えると、AI生産性向上のゲインはどこにあると思いますか?すべてのツール、コアモデルの改善、MCPなどのコネクターや環境で、日常的な使用での最大のゲインはどこにあると見ていますか?
OpenAIとAnthropicの違いが見られる分野はツール使用です。OpenAIはツール使用でAnthropicよりもはるかに優秀ですが、私たちはツール使用において非常に優秀です。OpenAI対Anthropicの推論トレースを見ることができます。
OpenAIは常に、数学問題や論理パズルを尋ねると、Pythonコードを引き出して何かを作成し、それを使って答えます。これはAnthropicのやり方とは大きく異なります。これらのものの代理性が本当に重要だと思います。どれだけのツールを使用できるか、そしてコンテキストを拡張することです。
長期記憶とコンテキストの課題
この思考の課題の多くは、コンテキスト長が非常に低いことです。どうやってタスクの範囲を通じて記憶を維持するのでしょうか?ツール使用(ツールは常に現実に戻し、幻覚を大幅に防ぎます。言語モデルではなく、プログラム的なものだからです)とコンテキストの拡張、そしてこの2つを積み重ねることができることが重要だと思います。
それをトレーニングする方法は本当に困難ですが、彼らすべてが取り組んでいることで、これらの企業が購入している多くの環境があります。ソフトウェア開発環境、ウェブ開発環境などのすべての種類のもので、タスクの範囲を拡張し続けることができます。それが起こるにつれて、それが人々のモデル使用方法を本当に変えると思います。
AnthropicとOpenAIが本当に取り組む必要があるこのもう一つの側面は、OpenAIが推論超高速に全力投球したことです。しかし、彼らの推論環境の多くは最高ではありませんでした。競技コードやCode Forcesなどに多く焦点を当てましたが、それは必ずしもフロントエンドではありません。
GPT-5は実際にフロントエンドが苦手です。Anthropicモデルと比較してですが、私は同意します。なぜそうなのでしょうか?両方とも世界中のすべてのフロントエンドデータをスクレイピングしているので、データが原因ではありません。コード環境と関係があるはずです。
モデルの特殊化と差別化
環境面で人々が実際に大幅に高いモデル性能を得るためにはさまざまな作業が必要だと思いますが、これはモデルでより高い分岐が見られることも意味します。以前は、誰もが同じウェブスケールの事前トレーニングデータを使用し、少し微調整していました。指示微調整やSFTなどです。
RLになるにつれて、モデルはますます分岐します。行動やトーンだけでなく、能力においても、行動とトーンはすでに気づいている違いですが、能力が本当に顕著になるでしょう。これらのモデルがトレーニングされる異なる環境が完全に異なるからです。
OpenAIが競技コードなどに焦点を当てている一方で、AnthropicがSalesforce開発環境での作業に焦点を当てているなら、プログラミングについて話していても完全に異なる能力を持つことになります。これは私が挙げたお粗末な例ですが、実際には良い例だと思います。
競技コードでは5〜10分間考えますが、実際の企業での実際の小さな修正では、Claude Codeの方が準備ができています。より速いやり取りが欲しく、5分かかってからTwitterをスクロールするようなことは望みません。それは開発者の働き方ではありません。実際に良い例だと思います。
しかし、両方とも両方に焦点を当てているので、少し誤解を招くと思います。どれだけの焦点、どれだけの環境、どれだけの環境に焦点を当てるか、各環境でどれだけのトレーニング時間を費やすかの問題です。
コードと数学以外の分野でのAI進歩
AIでの最大のゲインはまだコードと数学にあると見ていますか?明らかにこれらの分野では出力を検証でき、合成データを大量に生成できます。10,000個のうち1個が機能すれば、何が起きたかを調査し、そのデータを使用できます。一方、詩や創造的な文章、コピーライティングではそれができません。
この傾向は続くと思いますか?それとも、SamやDarioなどのCEOが「AIは今後2年間ですべてを変える」と宣伝するようなこれらの分野では、大幅な改善の余地があまりないのでしょうか?ルーブリック、評点などがありますが、モデルは実際にほとんどの人間よりも文章が優秀です。これは事実です。モデルはほとんどのライターよりも優秀だと思います。
しかし、文章分野で実際に作業を行う課題は、異なるコンテキスト間を切り替えることができることです。彼らが不足している分野です。確かによく書けますが、すべての研究、すべてのやり取りはできません。
主なことは、コードと数学だけでなく、コンピューター使用も優秀になり、長いコンテキストを持てるようになることです。そうすれば、優秀な文章のスキル、つまり技術文章、文法ミス、語彙の理解、複雑なトピックを深く簡潔に説明する能力などのスキルセットが実際に活用できるようになります。これらはモデルがすでに学んだスキルで、whatever(何であれ)新しいことが起きている分野で、必要なコンテキストを収集できるようになります。研究ができるようになります。
AIによる研究能力の拡張
Deep Researchは素晴らしく、よく使用していますが、コンテキストを劇的に拡張し、コンテキストスイッチやコンピューター使用ができるようになれば、もっと多くのことができます。「これらすべてのことがなぜ間違っているのか、問題は何なのかについて設計文書を作成できますか?」と聞くと、「わかりました、コードベースを掘り下げて、アーキテクチャ計画を掘り下げて、これらすべてのことを掘り下げる必要があります」となります。これは今日のモデルができないことです。
書くことと伝えることの能力、コードの能力、これらすべての分野を組み合わせることができる分野だと思います。現在は、コーディングの開発と文章の開発のようになっています。最初にすべての文章開発を得て、それが停滞したり、ゆっくりと増加しているように感じられる一方で、コードのものは急上昇しています。
コンピューター使用やこれらすべてのことも急上昇しますが、時間をかけて、現在はレーダープロットのようです。ここ、ここ、ここ、ここで優秀ですが、実際にギャップを埋めることができません。それが一般化した時、それが焦点だと思います。
一般化への道筋
より長いコンテキスト、コンピューター使用、さまざまなタスクのための非常に長く複雑な長期環境があれば、たとえそれらが検証可能であっても、「それは検証不可能な分野でも使用する同じ技術だ」と教え始めるでしょう。研究を行い、これを取得し、これらの文書を参照します。
コードは検証可能ですが医学はそうではありませんが、これらすべての異なる場所を検索し、情報をコンパイルし、すべての長いコンテキストを使用し、回答をチェックし、検索などの方法を知っているからです。そして最終的に、それが間違っているか正しいかを検証できましたが、異なる分野でも同じことを学びます。コードの文書の代わりに医学ジャーナルを調べるでしょう。
しかし同時に、それは書くことや医学など、他のタスクでもずっと良くなる点まで一般化するでしょう。
今後数年間での多くのゲインは、モデルの向上よりもツールから来ると聞こえます。より多くの実世界の人々が仕事でAIを使用するという結果につながるのは、コンピューター使用、より多くのツール、MCPなどの欠けているギャップを埋めることでしょうか、それともモデルが良くなることでしょうか?
プロンプティングスキルの重要性
ほとんどの人は実際にプロンプティングが下手です。他の人のChatGPTを取って、彼らのプロンプトを見たことがありますか?
悲惨です。「何をしているんだ?」という感じです。彼らはそれをGoogleのように使用します。私もGoogleのように使用することもありますが、Googleではない使い方もします。
人々がモデルを適切にプロンプトする方法を学ぶ、または逆に、彼らがこれを言う時、実際にはそれを意味するということをモデルにどう教え込むか、人間を無視して実行するかということの一部だと思います。
人々はますます使用しますが、モデルが問題をずっと深く理解するレベルが必要です。現在、人々は「これが私のコンポーネントです。このコンポーネントについて愚かな質問をします」と言って、ここにある答えをもらいます。「まだやらなければならない作業がたくさんある」となります。
しかし、モデルがコンピューター使用を持ち、この質問をすると「ああ、あなたのメール、TeamsやSlackで受け取ったDM、この文書を参照させてください。ああ、彼らが実際に私に求めているのはこれです。やってみます。はい、どうぞ」となります。
コンテキストの重要性と課題
モデルがあなたの質問の完全なコンテキストを持てるようになれば、人々はそれを大いに使用すると思います。モデルはあなたの質問のコンテキストを持っていないからです。Googleのように使用して、2文か1文かでたらめなプロンプトを与えても、何が欲しいかわかりません。
GPT-3からGPT-5やOpus 4.1のように良くなっても、同じ答えのクエリがたくさんあります。もちろん改善を見ることはありません。もちろん、ずっと良くなったことがたくさんありますが、そこに到達するために何を言うべきか、何をすべきかがわからないだけです。そのコンテキストが必要です。
人々は、ローンチしたGPT-3.5が4Kシーケンス長しかなかったことを忘れています。ChatGPTローンチ以来何も改善されていないと正当に言う人たちがいます。「まあいいや」という感じです。
今では数十万で、Deep Researchやこれらすべてのことができます。モデルが行って作業をし、ユーザーがコンテキストを提供しないので、完全な情報を得る能力を持つ必要があります。
スクリーンレコーディングとコンテキスト理解
答えは、ユーザーがそのタスクのために何をしているかをスクリーンレコーディングして、AIが「この人は実際にはこれらのクリック、訪問したブラウザタブに基づいてあれを意味している」と理解することかもしれません。
モデルが人間のコンピューター使用データでトレーニングされ、人間がタスクを実行するのを見てからタスクを進める未来だと思いますか?あなたが言ったように、一部の人々は赤ちゃんの頃からどれだけのコンテキストを持っているかに気づいていません。基本的に視覚トークン、音声トークンでトレーニングされているので、人々は物理世界やインターネットの仕組みについてどれだけ理解しているかを実感していません。これは必ずしもトレーニングデータに書き出されているわけではないので、彼らはそれをモデルに説明せず、結果を得ています。
解決策は、スクリーンのスクリーンショット、最後のブラウジング履歴など、より多くの種類のコンテキストでしょうか?質問をする前の5分間にコンピューターで何をしたかを知っていれば、何が欲しいかを推測するのがずっと簡単です。
それは可能です。少し異なることだと思います。常にスクリーンを見ているなら一つのことですが、コンテキストを自分で検索することの方が重要です。コンピュータースクリーンを見るのではなく。
コンピュータースクリーンを見るのは良く、素晴らしく、大丈夫ですが、それは適切なコンテキストをすべて与えるものではありません。この他の側面は、私たち人間がなぜか同時にクレイジーなコンテキストと注意能力を持っているということです。
人間とAIの注意メカニズムの違い
しかし同時に、私たちはひどいです。非常に低いです。何も覚えられません。10個の数字を教えてください。2番目に言ったものさえ覚えられません。それほど悪くはないかもしれませんが、重要なものを覚えています。
スパースアテンションが興味深い側面です。モデルにはローカルとグローバルアテンション、その他すべてがありますが、スパースアテンションを行うメカニズムがありません。人間はそのスパースアテンションが本当に得意です。実際、インコンテキストでは本当に下手です。needle in haystackでは恐ろしいです。これは、皆が気にかけた最初の長いコンテキストベンチマークでした。
それは超興味深いですが、「コンピュータースクリーンショットを提供する」ということではないと思います。ちなみに、スクリーンショットをいくつか投げて「コンピューターの何が悪いですか?」と聞くと、実際にモデルは本当に優秀です。「携帯電話の何が悪いですか?」でも答えます。それはかなり得意です。
しかし、ファイルをクロールする能力、メールをクロールする能力、これらの異なる情報源を組み合わせる能力を与える必要があります。コンピューターでどのようにそれが行われるかを見るのは興味深いです。誰でもそれができるからです。オープンウィンドウです。
プラットフォーム制約とモバイルでの課題
コンピューターに好きなソフトウェアをインストールでき、それが掘り下げることができます。Microsoftがすべてのファイルが OneDriveにあるから、またはGoogleがすべてのファイルがGoogle Driveにあるからという特別な利点はありません。コネクターを追加できます。自分のコンピューターにやらせることができます。VMを立ち上げてやることができます。
挑戦的な分野で、もっと興味深いと思うのはモバイル、つまり電話です。GoogleやAppleは、すべてのアプリを掘り下げることをさせません。それは許されません。しかし、電話でメールを受け取って「この他のものを開いて、Slackを開いて、これを開いて、このテキストメッセージを参照するか、数週間前からのこのテキストを参照して、戻って何かをする」時のようです。それはモバイルでは不可能です。コンピューターでは可能ですが、モバイルでは不可能です。
どうやってそこに到達し、誰がそれを実行できるでしょうか?Appleにまだ希望を持っている唯一の理由は、彼らだけがそれをできるからです、彼らとGoogleが。
Googleが実行できるかどうかはわかりますし、Appleは異なる理由で実行できないでしょう。しかし、すべての情報を参照する能力です。そしてどうでしょう?ラップトップにない多くのものがありますよね?テキストが共有されているなどはありますが、それでもすべてがラップトップにあるわけではありません。ラップトップにだけあって電話にないものもあります。両方向に裏返ります。
MCPソリューションと制約
MCPで解決されませんか?すべてにMCPがあれば、どこでもコンタクトを持参できます。
しかし、企業が独自のプロプライエタリデータを提供するインセンティブは何でしょうか?なぜFacebookやWhatsAppが?
サードパーティのMCPが存在するでしょう。
しかし、なぜAnthropicがWhatsApp MCPにアクセスできるでしょうか?
WhatsAppには公式のものがないかもしれませんが、数百の非公式のものがあるでしょう。
誰がすべてのテキストを非公式MCPに信頼するでしょうか?
パワーユーザーです。平均的なiPhoneユーザーについて話しているなら分かりませんが、AIの最先端にいたい人なら、十分な星のあるオープンソースプロジェクトなら信頼します。コードさえ見ません。
しかし、MCPとコンピューター使用は非常に異なると思います。テキスト、メール、社内企業コミュニケーションのためのMCPサーバーを持つことは困難です。そこに決して載せられないものがあります。私のSlack、あなたのSlackはMCPを持たないでしょう。
非公式MCPが存在することはないでしょう。「くそくらえ」です。そんなことは起こりません。だからコンピューター使用がとても重要です。企業のSAPも決してそこにはないでしょう。
企業効率性とコンピューター使用
しかし実際には、効率性の向上が最大なのはそこです。すべてのこれらの企業には、CRMやSAPで何もしていない人たちがたくさんいます。コンピューター使用があれば、突然ずっと簡単になり、生産性が最も加速されるのはそこです。
明らかに、コード開発者は今日最も生産性が加速されています。しかし、仕事を置き換える、活動を置き換えることについて話すとき、開発者は引き続き自動化され、コード開発がすべて引き続きそこにあります。
人々が組織の効率を効率的に改善するために持つであろう多くのユースケースは、コンピューター使用としてのみ可能だと感じます。これはコンピューターでは簡単です。ラップトップでどうやってコンピューター使用をしますか?
AppleとGoogleのモバイル戦略
AppleのAppleの全体は、基本的にあなたの仮想iPhoneを実行していることです。彼らはサーバーで同じアーキテクチャのMacチップ(電話チップと同じアーキテクチャ)を取り、多くの異なるユーザーを実行し、すべてのアプリをサンドボックス化します。すべてをサンドボックス化します。
その時点で、実際にコンピューターのようにすべてのアプリをステップスルーし始めることができます。モバイルでは電池寿命が大打撃を受けるし、ほとんどの人がそうしないので、それはできません。Appleの囲い込みは皆に彼らのサンドボックスをクラウドで実行することを強制できますが、Googleはおそらくそれをできません。
実際にはGoogleの方が有利だと思います。Androidがよりカスタマイズ可能で、人々が独自のバージョンを構築し、通常動きが遅いAppleより速く革新できるからです。
完全に同意します。私はGoogleの方に強気です。Appleについて積極的に議論しようと自分に言い聞かせただけです。
いくつかの利点があります。私はAndroid電話を使っています、信じてください。私はAndroidが大好きです。
Gemini 3の期待とGoogle の立ち位置
Googleについて言えば、Gemini 3はどれくらい良いと思いますか?
うまくいっていると聞いています。時計の針のような感じです。xAIリリース、Anthropicリリース、OpenAIリリース、Googleリリースと、円を描くように。
明らかに、常に同じケイデンスや円でリリースするわけではありませんが、Google の番です。数ヶ月前を振り返ると「すごい、Gemini 2.5はとても安い」でした。Anthropicとほぼ同じくらい良くて、まだとても安いです。特にCLIなどすべて、それから落ちていますね。より良くなり、開いたものがより良くなり、Claude CodeとCodexがより良くなり、Grok 3が出ました。今では2.5が最悪のモデルです、束の中では。
本当に良いですが、束の中では最悪です。しかし、Googleには途方もないマルチモーダル人材があり、人々は驚くと思います。それが他の分野です。
事前トレーニングをスケールできないという議論があります。だからこれらすべてをしなければなりません。実際には、事前トレーニングで大きなゲインを得ることができますが、すべてのデータを取得するのが困難です。非テキストデータの計算要件は、テキストデータよりもはるかに大きいです。
テキストデータよりもはるかに大きいです。マルチモーダルからゲインを得るには、今日Googleだけが持っているような計算の大きなジャンプが必要です。
OpenAIもStargateなどで間もなく持つでしょうが、マルチモーダル入力と出力を適切に活用するため、また大量の-どんな神をも知らない割合のビデオがYouTubeでのみ利用可能です。確かにYouTubeをスクレイピングできます、どうのこうのです。利用規約違反です。
YouTubeデータの優位性
AI企業が気にするかどうかわかりませんが、重要なのは、すべてのYouTubeをスクレイピングし、すべてのYouTubeをインデックス化し、どのビデオが実際に良くて悪くないかを把握する方法です。それが困難な部分で、非常に多くのデータがあるため、すべてのデータをフィルタリングすることです。すべてでトレーニングすることはできません。
すべてのYouTubeをスクレイピングすることはできません。個別のものをスクレイピングできます。外部者ならカテゴリをスクレイピングできます。Googleはそこで巨大な利点を持っています。YouTubeを通じた動画、GoogleのクローラーからのGoogle の画像、そしてマルチモダリティを機能させるためです。
GoogleはRLでは遅れていますが、事前トレーニング面では、Nano BananaやV3、間もなくGemini 3全体で、巨大な利点が見えてくると思います。
つまり、それらは最高のモデルです。V3は最高の動画モデルです。Nano Bananaは最高の画像編集モデルです。画像生成ではないかもしれません。
おそらくMidjourneyの方が良いと言うでしょうが、画像編集では前例のないほど良いです。Googleはデータゲームで勝つだけかもしれません。
コア入力要素の重要性
人材、計算、データなど、これらのコア入力要素のうち、どれが最も重要で、どれが重要度を失っているかをどう見ていますか?コア入力が何かわからないと思います。何だと思いますか?
全部だと思いますが、計算でのゲインは低下していると感じます。10倍にして3倍の改善を得るような簡単な日々は終わったと思います。おそらく2倍の改善になるでしょうが、10倍の計算で動画で3倍のゲインを得るかもしれません、それは完全にありえることです。
動画生成は急速に改善しています。画像編集も急速に改善しているように感じます。
テキストデータが不足したからです。10倍の計算とRLで何が起こるかは誰にもわかりません。まだ大きな進歩を遂げるでしょう。
xAIとElonの位置づけ
このAIゲームで、xAIとElonの位置をどう見ていますか?明らかに非常に遅れていたところから、かなり速く追いついています。彼らの立場をどう分析しますか?
xAIは非常に速く追いついています。しかし、まだどこでも指導的立場を取っていません。何をすれば指導的立場を取れるかわかります。実際には共感と感情的AIで指導的立場を取っています。
それを正しい呼び方かどうかわかりません。しかし、他の課題は、OpenAI Anthropicが大規模ラウンドを調達したことです。Googleは明らかに十分な資金があります。Metaも十分な資金があり、使うことを決めています。xAIは今、もっと多くの資金が必要です。
Colossusは素晴らしかったですが、Colossus 2を構築しなければなりません。Colossus 2には大量の資金が必要です。一部を支払えますが、まだ多くが残っています。その面で何が起こるかわかります。
この時点でElonはかなり良い実績があり、資金調達に問題はないと思います。
そうですね、私もそう思いません。しかし、投資家に「私はすべての人より優秀になります」と言うのは困難です。ストーリーは「私は皆に追いついたが、まだ遅れています。もっと資金が必要です」です。一方、Anthropicは「私が最高です。収益が急上昇しているのを見てください」です。OpenAIは「私が最高です。収益が急上昇しているのを見てください」です。非常に異なるピッチです。
CEO達の誇大宣伝について
最大のAI誇大宣伝がラボのCEO達から来ているのがわかります。彼らが最も危険にさらされているからです。6ヶ月前のほぼその日に、Darioは「6ヶ月後にコードの90%がAIによって書かれる」と言いました。近くにも及びません。Samも誇大宣伝された多くの予測をしました。
Anthropicが発表したのは70%だったと思います、70~80%のような。興味深いですね。
この例は置いておいて、CEO達が誇大宣伝していると言っていますか?
彼らが最も危険にさらされているからです。自分たちの企業が世界を変えるように見せたいし、投資家や世界のリーダーに緊急性を与えたいからです。そして二番目のカテゴリはVCです。
現実対誇大宣伝のスペクトラム
現実はどこにあると思いますか?Samの話だけを聞いていると、GPT-5はすでに神だと思うでしょう。しかし実際に平均的な人に伝えると、あなたが言ったように、ひどいプロンプトを送って平凡な結果を得ます。この誇大宣伝対現実のスペクトラムでどこに立っていますか?
AGIなどの定義が非常に曖昧なので、言うのは困難です。しかし、私は大信者です。私はカルトにいます。大信者ですが、何らかのAGI ASIタイプのものについては2030年以降だと思います。
しかし定義がとても困難ですね。もちろんです。AGIなしに社会に変革的変化をもたらすことができると思います。人々があまり理解していないのはそこです。
AGIなしに、ほとんどではありませんが、仕事のかなりの部分を自動化できます。すべてが超誇大宣伝されたAGIの発生、ASIの発生に必要というわけではありません。それは起こると思いますが。それが私の視点です。
SamやDarioほど誇大宣伝野郎ではありませんが、彼らは言葉遣いを和らげ始めています。Darioは今「2030年までにAGI」のようなことを言っています。これは以前言っていたことと比べてかなり穏やかです。
皆Anthropic でAGIという言葉の使用が禁止され、transformational AIを使用していると感じます。
Anthropicの他の共同創設者やClaude Codeの作成者であるBorisなどの他の人々のポッドキャストを聞くと、AGIを使用すべきでなく、むしろtransformational AIを使用すべきというメモを受け取ったように感じます。あなたが言ったように、AIはAGIでなくても社会を変革できるからです。
AIスタートアップへのアドバイス
時間が少し残っているので、少し自己中心的な質問をさせてください。アプリケーション層でAIスタートアップを構築している人々へのアドバイスは何ですか?これらの多くがラボに食べられてしまうと思いますか?ニッチに行くのが答えでしょうか?あなたのビジネスが消失し、明日独自のAIスタートアップを始める決断をしなければならないとしたら、ハイパースケールする計画は何でしょうか?
資金調達はしないでしょう。現在の生産性の可能性を考えると、キャップなしのsafeまたは企業の本当に小さな割合の小さなsafeを調達するでしょう。アプリケーション層企業には本当に資金調達する必要がないからです。
もう一つ言えるのは、セールスが本当に得意でなければならないということです。セールスを雇うだけではいけません。go to marketやセールスを雇えると思う創設者は間違っています。そのセールス能力、ビジョンを持っていなければなりません。それが実行するために本当に重要です。
そこには多くの低い果実があります。資金調達をしなかったので、最もクレイジーなことをする必要がありません。低い果実を取り、収益を生み出し、もっと行い、そのようにスケールアウトできます。
「保険のためのAI、引き継ぎます、AIをやります」のようなことをするよりも、それはとても困難です。規制業界です。巨大な業界です。確かにそこには多くの低い果実があります。だから低い果実のいくつかを攻撃してください。最大のものに直接行かないでください。
失敗しやすい方法があるからです。失敗したら、学習を速くするために速く失敗したいです。速く失敗しない問題に取り組んでいる場合、失敗したことがいつわからないでしょう。失敗するかどうかを見るのに時間がかかります。
それはAIがすることと正反対です。物事を速く試し、速く失敗し、どんどん速く動くことについてです。物事を速く試し、お金を稼ぎ、雇用し、失敗しても大したことではないという方法でやってください。
時間を取ってくれて感謝します、Dylan。あなたはいつも物事の最前線にいます。6ヶ月後にまたやりましょう。
ありがとう、David。またね、相棒。良い一日を。さようなら。


コメント